量子位 ·

啊？微博7800美元训的大模型，数学能力超了DeepSeek-R1

💡 原文中文，约2900字，阅读约需7分钟。

📝

内容提要

微博推出自研大模型VibeThinker，参数仅15亿，却在数学竞赛中超越6710亿参数的DeepSeek-R1，训练成本仅7800美元，显著降低AI技术普及门槛，推动行业效率革命。

🎯

🔎

VibeThinker的成功挑战了传统对大模型的认知，表明小模型也能在复杂推理任务中表现出色。这一发现可能促使更多研究者关注模型结构和训练策略的优化，而非单纯追求参数数量的增加。

VibeThinker的训练成本仅7800美元，显著低于行业平均水平。这一成本优势将使得更多中小企业和研究机构能够参与AI技术的开发，推动整个行业的普及和创新，打破大模型的垄断局面。

尽管VibeThinker在数学和编程任务中表现优异，但其在日常聊天等领域尚未经过优化。因此，用户在选择使用时需注意其适用场景，以免影响使用体验。未来的优化将是其广泛应用的关键。

❓

VibeThinker模型拥有15亿参数，训练成本为7800美元。

VibeThinker在数学竞赛中超越了参数量为6710亿的DeepSeek-R1，表现出色。

VibeThinker的成功表明小模型也能具备强大的推理能力，重新定义了大模型的技术评价标准。

VibeThinker采用了优化的模型结构和训练策略，创新提出了“频谱到信号原理”（SSP）方法。

VibeThinker的低训练成本使得AI技术普及门槛降低，促进了中小型公司和研究机构的参与。

微博计划将VibeThinker深度融入AI应用生态，提升用户体验和服务能力。

🏷️