大模型的发展凸显了推理数据的重要性,优质推理数据集支持复杂推理任务。HyperAI整理了多领域推理数据集,降低了使用门槛,促进科研与模型训练。
Open R1项目旨在完全复现DeepSeek-R1,已发布OpenR1-Math-220k数据集,生成22万条高质量推理数据,支持小模型达到与DeepSeek相当的性能,推动开源社区发展。
本研究提出了Insight-V,旨在生成长且稳健的推理数据,优化训练流程,以提升多模态大语言模型的推理能力。通过多代理系统和迭代DPO算法,显著提高了视觉推理性能。
完成下面两步后,将自动完成登录并继续当前操作。