机器之心 ·

科研领域新成果：九章云极DataCanvas联合团队发布R1复现以及改进技术

💡 原文中文，约1400字，阅读约需4分钟。

📝

内容提要

中国人民大学与北京智源研究院联合开发的类R1推理模型STILL-3-Tool-32B在AIME 2024基准测试中取得81.70%准确率，超越DeepSeek-R1。研究表明外部工具能增强模型推理能力，并成功应用于Alaya NeW系统，推动AI技术发展。

🎯

🔎

STILL-3-Tool-32B模型在AIME 2024基准测试中取得的81.70%准确率，表明外部工具的引入对模型推理能力的增强至关重要。这一创新方法不仅提升了模型的表现，也为未来的AI研究提供了新的思路，尤其是在复杂推理任务中。

九章云极DataCanvas团队的开源方案为开发者提供了完整的工程代码和训练技巧，降低了大模型训练的门槛。这种全链路的开源方式，不仅促进了技术的传播，也为工业界的应用提供了实用的参考，推动了AI技术的工业化进程。

研究表明，通过强化学习训练方法可以显著提升模型的推理准确率。这一发现为AI模型的进一步优化提供了新的方向，尤其是在处理语言推理等复杂任务时，强化学习的应用可能成为提升性能的关键。

❓

STILL-3-Tool-32B模型在AIME 2024基准测试中取得了81.70%的准确率。

STILL-3-Tool-32B模型是中国人民大学与北京智源研究院联合开发的。

研究表明，使用外部工具可以显著增强模型的推理能力，解决语言推理中的精准性问题。

开源方案提供了从模型训练到推理部署的全链路工程代码，支持工业化级大模型训练框架。

Alaya NeW系统在复杂任务框架方面表现出明显优势，推动了AI技术的发展。

STILL-3-Tool-32B模型采用了强化学习训练方法，以提升推理准确率。

🏷️