国产新模型 DeepSeek-R1 发布,MIT 授权,性能对标 OpenAI o1 正式版

国产新模型 DeepSeek-R1 发布,MIT 授权,性能对标 OpenAI o1 正式版

💡 原文中文,约800字,阅读约需2分钟。
📝

内容提要

DeepSeek发布了DeepSeek-R1模型,性能与OpenAI o1相当,采用MIT授权,支持商业使用和模型蒸馏。该模型在数学、代码和自然语言推理等任务上表现优异,API服务定价合理。模型文件可在GitHub和HuggingFace下载,但本地运行需高配置硬件。

🎯

关键要点

  • DeepSeek发布了DeepSeek-R1模型,性能与OpenAI o1相当。
  • DeepSeek-R1采用MIT授权,支持商业使用和模型蒸馏。
  • 该模型在数学、代码和自然语言推理等任务上表现优异。
  • DeepSeek-R1 API服务定价为每百万输入tokens 1元(缓存命中)/ 4元(缓存未命中),每百万输出tokens 16元。
  • 模型蒸馏是一种将大型模型的知识转移到较小模型中的技术。
  • DeepSeek-R1模型文件可在GitHub和HuggingFace下载。
  • 本地运行DeepSeek-R1需要高配置硬件。
➡️

继续阅读