小红花·文摘 - 小红花技术领袖俱乐部

AI 论文周报丨DeepSeekMath-V2/医学视频图像分割/3D 重建/Qwen3-VL……一文速览 AI 前沿

AI 论文周报丨DeepSeekMath-V2/医学视频图像分割/3D 重建/Qwen3-VL……一文速览 AI 前沿

HyperAI超神经 ·

RL 后训练进化论：从PPO被动奖励、GRPO组内奖励到DeepSeekMath-V2自验证奖励

RL 后训练进化论：从PPO被动奖励、GRPO组内奖励到DeepSeekMath-V2自验证奖励

逐水寻源 ·

首届AI奥数竞赛方案公布：4支获奖队伍，竟都选择国产模型DeepSeekMath

首届AI奥数竞赛方案公布：4支获奖队伍，竟都选择国产模型DeepSeekMath

机器之心 ·

该研究介绍了一种通过微调开源语言模型来增强数学推理能力的方法。作者提出了MathCodeInstruct数据集，用于生成数学问题和基于代码的解决方案。通过定制的有监督微调和推理方法，开发了MathCoder模型，该模型在数学问题数据集上表现出色。研究结果将于2023年10月发布。

DeepSeekMath：推动开放语言模型中数学推理的极限

BriefGPT - AI 论文速递 ·