量子位 ·

DeepSeek新模型霸榜，代码能力与OpenAI o1相当且确认开源，网友：今年编程只剩Tab键

💡 原文中文，约1900字，阅读约需5分钟。

📝

内容提要

DeepSeek新模型DeepSeek-R1-Preview在代码基准测试中表现优异，性能与OpenAI o1相当，并确认将开源。该模型在代码生成和自我修复方面展现出强大能力，受到开发者关注。

🎯

🔎

DeepSeek-R1-Preview的开源将为开发者提供更多的自由和灵活性，可能推动编程工具和技术的创新。开源模型的普及可能使得编程变得更加普及，降低入门门槛，吸引更多新手加入编程领域。

DeepSeek-R1-Preview在代码生成和自我修复方面的表现与OpenAI o1相当，甚至在某些高难度任务上超越o1。这表明DeepSeek在技术上取得了显著进步，可能会对OpenAI的市场地位构成挑战，促使其加快技术更新。

LiveCodeBench的基准测试为DeepSeek-R1-Preview的能力提供了客观评估，确保了测试的公平性和可靠性。这种实时更新的测试方法能够有效避免数据泄露，增强开发者对模型性能的信任，促进更广泛的应用。

❓

DeepSeek-R1-Preview在代码基准测试中表现优异，性能与OpenAI o1相当。

是的，DeepSeek-R1-Preview确认将开源。

DeepSeek-R1-Preview是更大的基础模型，而DeepSeek-R1-Lite-Preview是轻量版，使用强化学习训练。

LiveCodeBench团队与DeepSeek合作评估新模型的能力，并解决评分系统的bug。

DeepSeek-R1-Preview在难度较高的数学和代码任务上超越了o1-preview。

OpenAI计划在未来几周推出o3-mini，并合并GPT系列和o系列。

🏷️