量子位 ·

DeepSeek版o1炸场，数学代码超越OpenAI，每天免费玩50次，后续将开源

💡 原文中文，约2000字，阅读约需5分钟。

📝

内容提要

DeepSeek-R1-Lite模型在数学推理任务中表现优异，超越了OpenAI的o1-preview，但在编码和复杂知识理解方面存在不足。该模型采用强化学习，遵循新的Scaling Laws，推理时间越长，表现越好。期待未来的开源版本和API。

🎯

🔎

DeepSeek-R1-Lite在数学推理任务中表现优异，超越了OpenAI的o1-preview，显示出其在特定领域的强大能力。然而，在编码和复杂知识理解方面的不足，提醒用户在选择使用时需考虑其适用范围。

该模型遵循新的Scaling Laws，推理时间越长，表现越好。这意味着在实际应用中，用户可能需要耐心等待更长的计算时间，以获得更准确的结果。

DeepSeek团队计划将正式版模型开源，并提供API，这将为开发者和研究者提供更多的实验和应用机会。开源后，用户可以更深入地了解模型的架构和训练数据，促进技术的进一步发展。

❓

DeepSeek-R1-Lite模型在数学推理任务中表现优异，超越了OpenAI的o1-preview。

该模型使用强化学习训练，遵循新的Scaling Laws，推理时间越长，表现越好。

在编码任务上，DeepSeek-R1-Lite表现不足，未能成功解决简单的编程问题。

模型在推理步骤上有改进空间，某些情况下表现出自我反思的能力。

用户可以登录官方网页，打开深度思考按钮，每天有默认50次的免费使用。

未来的正式版DeepSeek-R1模型将完全开源，并提供API。

🏷️