标签
models
相关的文章:本列表汇集了关于深度学习和语言模型的最新研究成果,涵盖模型训练、优化及应用等多个方面,助力研究者深入了解该领域的前沿动态。
Workflow, Opportunities, and Challenges in Developing Foundation Models for Geophysics
Evaluating the Capabilities of Large Language Models in Domain-Specific Ontology Generation
Can Large Language Models Assist Multimodal Language Analysis? MMLA: A Comprehensive Benchmark Test
本研究针对多模态语言分析领域的一个重要空白,即现有多模态大型语言模型(MLLMs)在理解认知级语义方面的能力不足。我们提出了MMLA基准测试,以评估和提升多模态语义理解,通过分析超过61,000条多模态发言,发现即使经过优化的模型准确率仅在60%~70%之间,这表明当前模型在理解复杂人类语言方面仍存在局限性。此研究为进一步探索大型语言模型在多模态语言分析中的潜力奠定了基础,并提供了有价值的资源。
本研究提出MMLA基准测试,针对多模态大型语言模型在认知级语义理解方面的不足。分析结果显示,模型的准确率仅为60%~70%,表明其在复杂语言理解上仍存在局限,为未来研究提供了基础。
Tracing Thought: Identifying the Language Models Behind AI-Generated Text Using Chain of Thought Reasoning
AIMO-2 Winning Solution: Building State-of-the-Art Mathematical Reasoning Models with the OpenMathReasoning Dataset
Dynamic Early Exit in Inference Models
The Impact of Noise on the Performance of Large Language Models in Abstract and Reasoning Tasks and Considerations of Model Temperature
Fine-tuning Large Language Models for Educational Guidance in Resource-Constrained Environments Using LoRA
本研究提出了一种经济有效的方法,将大型语言模型(LLMs)用于以留学为背景的学术咨询,并适用于低资源环境中的文化适应。通过采用Low-Rank Adaptation (LoRA) 方法和4位量化,经过两阶段训练,该模型在领域特异性和计算效率上均取得显著提升,最终实现92%的领域推荐准确率。这项研究为教育顾问在低资源环境中的有效应用提供了有力支持。
本研究提出了一种经济有效的方法,将大型语言模型(LLMs)应用于留学背景的学术咨询,特别适用于低资源环境中的文化适应。通过低秩适应和4位量化,模型在领域特异性和计算效率上显著提升,最终实现92%的推荐准确率。