标签

推理模型

相关的文章：

本列表汇集了最新的推理模型研究，涵盖开源技术、性能评估及应用案例，助您深入了解推理模型的现状与未来发展。

思维的幻觉：通过问题复杂性视角理解推理模型的优势与局限性

Recent generations of frontier language models have introduced Large Reasoning Models (LRMs) that generate detailed thinking processes before providing answers. While these models demonstrate...

近期的前沿语言模型引入了大型推理模型（LRMs），这些模型在回答前生成详细的思考过程。尽管在推理基准上有所提升，但其基本能力和局限性仍不明确。现有评估主要关注最终答案的准确性，忽视了推理过程的结构和质量。通过可控的难题环境研究发现，当复杂性超出一定范围时，LRMs的准确性会完全崩溃，且在高复杂性任务中表现不佳。

准确性复杂性大型推理模型推理模型推理过程评估

思维的幻觉：通过问题复杂性视角理解推理模型的优势与局限性

原文英文，约300词，阅读约需2分钟。发表于：。

分享给好友

苹果的《思维的幻觉》论文探讨大型推理模型的局限性

Apple Machine Learning Research published a paper titled "The Illusion of Thinking," which investigates the abilities of Large Reasoning Models (LRMs) on a set of puzzles. As the complexity of the...

苹果机器学习研究发布论文《思维的幻觉》，探讨大型推理模型（LRMs）在解谜中的能力。研究发现，随着难度增加，LRMs在高复杂度下表现不佳，显示出模型的局限性。尽管LRMs在某些任务上优于标准LLMs，但在复杂问题上仍存在推理能力的根本限制。

复杂问题大型推理模型局限性推理模型推理能力苹果解谜

苹果的《思维的幻觉》论文探讨大型推理模型的局限性

原文英文，约600词，阅读约需3分钟。发表于：。

分享给好友

只用2700万参数，这个推理模型超越了DeepSeek和Claude

claude deepseek 推理模型

发表于：。

分享给好友

腾讯混元推出首款开源混合推理模型，擅长Agent工具调用和长文理解

激活参数仅13B

腾讯推出首款开源混合推理模型Hunyuan-A13B，参数80B，激活参数13B，推理速度快且性价比高。该模型在长文理解和Agent工具调用方面表现优异，支持256K上下文窗口，适合个人开发者使用。同时，腾讯还开源了两个新数据集，以提升大语言模型的能力。

Hunyuan-A13B agent 开源推理模型数据集混元混合推理模型腾讯长文理解

原文中文，约2100字，阅读约需5分钟。发表于：。

分享给好友

蚂蚁开源轻量级推理模型Ring-lite，多项Benchmark达到SOTA

首创 C3PO 强化学习训练方法

蚂蚁团队推出的轻量级推理模型Ring-lite，采用C3PO强化学习方法，在多个推理榜单上取得了SOTA效果，显著提升了训练稳定性和token效率。该模型在数学、编程和科学推理任务中表现优异，展示了MoE架构的潜力。

C3PO MoE架构 Ring-lite SOTA 开源推理模型

原文中文，约4400字，阅读约需11分钟。发表于：。

分享给好友

从RLHF、PPO到GRPO再训练推理模型，这是你需要的强化学习入门指南

入门强化学习推理模型

发表于：。

分享给好友

PPIO上线MiniMax-M1-80k：全球首个开源大规模混合架构推理模型

今天，PPIO 首发上线 MiniMax-M1，这是全球首个开源大规模混合架构的推理模型。 MiniMax-M1 采用混合专家（MoE）架构，并结合闪电注意力机制。该模型总共包...

PPIO推出全球首个开源大规模混合架构推理模型MiniMax-M1，拥有4560亿参数和100万令牌上下文长度，性能卓越，支持高效API服务。

API服务 PPIO m1 minimax 开源推理模型混合架构

PPIO上线MiniMax-M1-80k：全球首个开源大规模混合架构推理模型

原文中文，约700字，阅读约需2分钟。发表于：。

分享给好友

准确率是DeepSeek-R1两倍以上，前谷歌CEO押注的初创公司开源240亿参数科学推理模型

ceo deepseek-r1 开源推理模型谷歌

发表于：。

分享给好友

新“SOTA”推理模型避战Qwen和R1？欧版OpenAI被喷麻了

Mistral AI推出了新推理模型Magistral，支持多语言推理。该模型采用纯强化学习训练，提升了准确率，实现高效实时推理，但未与Qwen和DeepSeek R1进行对比，引发质疑。

Magistral Mistral AI openai qwen 多语言推理实时推理强化学习推理模型

原文中文，约1900字，阅读约需5分钟。发表于：。

分享给好友

Mistral的首个强推理模型：开源开源，推理速度快10倍

mistral 推理模型

发表于：。

分享给好友