小红花·文摘

LLaMA版o1项目由上海AI Lab发布，结合蒙特卡洛树搜索与强化学习，开源代码引发关注。该模型在数学奥赛测试中表现优异，优化后正确率显著提升。团队还推出了包含长思维链的预训练数据集，支持进一步训练。同时，上交大团队的O1-Journey项目也在推进中。