啊?微博7800美元训的大模型,数学能力超了DeepSeek-R1

💡 原文中文,约2900字,阅读约需7分钟。
📝

内容提要

微博推出自研大模型VibeThinker,参数仅15亿,却在数学竞赛中超越6710亿参数的DeepSeek-R1,训练成本仅7800美元,显著降低AI技术普及门槛,推动行业效率革命。

🎯

关键要点

  • 微博推出自研大模型VibeThinker,参数仅15亿,训练成本7800美元。
  • VibeThinker在数学竞赛中超越了6710亿参数的DeepSeek-R1,重新定义了大模型的技术评价标准。
  • 小模型VibeThinker通过优化模型结构和训练策略,展现出强大的推理能力。
  • VibeThinker的训练成本显著低于行业平均水平,推动AI技术普及。
  • 微博积极推动AI技术在多项业务场景的落地,推出了微博智搜和评论罗伯特等产品。
  • 未来,VibeThinker将深度融入微博的AI应用生态,提升用户体验和服务能力。
➡️

继续阅读