标签

 推理模型 

相关的文章:

本列表汇集了最新的推理模型研究成果,涵盖开源技术、强化学习方法及其在各领域的应用,展示了人工智能领域的前沿进展。

思维的幻觉:通过问题复杂性视角理解推理模型的优势与局限性

Recent generations of frontier language models have introduced Large Reasoning Models (LRMs) that generate detailed thinking processes before providing answers. While these models demonstrate...

近期的前沿语言模型引入了大型推理模型(LRMs),这些模型在回答前生成详细的思考过程。尽管在推理基准上有所提升,但其基本能力和局限性仍不明确。现有评估主要关注最终答案的准确性,忽视了推理过程的结构和质量。通过可控的难题环境研究发现,当复杂性超出一定范围时,LRMs的准确性会完全崩溃,且在高复杂性任务中表现不佳。

思维的幻觉:通过问题复杂性视角理解推理模型的优势与局限性
原文英文,约300词,阅读约需2分钟。发表于:
阅读原文

苹果的《思维的幻觉》论文探讨大型推理模型的局限性

Apple Machine Learning Research published a paper titled "The Illusion of Thinking," which investigates the abilities of Large Reasoning Models (LRMs) on a set of puzzles. As the complexity of the...

苹果机器学习研究发布论文《思维的幻觉》,探讨大型推理模型(LRMs)在解谜中的能力。研究发现,随着难度增加,LRMs在高复杂度下表现不佳,显示出模型的局限性。尽管LRMs在某些任务上优于标准LLMs,但在复杂问题上仍存在推理能力的根本限制。

苹果的《思维的幻觉》论文探讨大型推理模型的局限性
原文英文,约600词,阅读约需3分钟。发表于:
阅读原文
发表于:
阅读原文

腾讯混元推出首款开源混合推理模型,擅长Agent工具调用和长文理解

激活参数仅13B

腾讯推出首款开源混合推理模型Hunyuan-A13B,参数80B,激活参数13B,推理速度快且性价比高。该模型在长文理解和Agent工具调用方面表现优异,支持256K上下文窗口,适合个人开发者使用。同时,腾讯还开源了两个新数据集,以提升大语言模型的能力。

原文中文,约2100字,阅读约需5分钟。发表于:
阅读原文
原文中文,约4400字,阅读约需11分钟。发表于:
阅读原文
发表于:
阅读原文

PPIO上线MiniMax-M1-80k:全球首个开源大规模混合架构推理模型

今天,PPIO 首发上线 MiniMax-M1,这是全球首个开源大规模混合架构的推理模型。 MiniMax-M1 采用混合专家 (MoE) 架构,并结合闪电注意力机制。该模型总共包...

PPIO推出全球首个开源大规模混合架构推理模型MiniMax-M1,拥有4560亿参数和100万令牌上下文长度,性能卓越,支持高效API服务。

PPIO上线MiniMax-M1-80k:全球首个开源大规模混合架构推理模型
原文中文,约700字,阅读约需2分钟。发表于:
阅读原文
发表于:
阅读原文
原文中文,约1900字,阅读约需5分钟。发表于:
阅读原文
发表于:
阅读原文