💡
原文中文,约4500字,阅读约需11分钟。
📝
内容提要
美团技术团队在AAAI会议上发表了8篇论文,涉及大模型推理、退火策略和强化学习等领域,提出了多种优化模型推理效率和性能的方法,为研究者提供理论和实践参考。
🎯
关键要点
- 美团技术团队在AAAI会议上发表了8篇论文,涵盖多个技术领域。
- 论文探讨了大模型推理、退火策略、过程奖励模型、强化学习等主题。
- 提出可验证的过程奖励机制(VSRM),优化模型推理效率。
- 研究退火策略对大型语言模型训练性能的影响,提出新的缩放法则公式。
- 过程奖励模型(PRMs)在数学推理到代码生成任务中的跨域泛化能力。
- 提出CDAS动态采样方法,提升强化学习中的问题采样效率。
- ViType框架解决视觉文本渲染中的字符准确性问题,提升生成质量。
- 双源反事实融合模型(DSCF)提高高维组合干预场景下的预测准确性。
- 压缩后排序(C2R)框架提升列表重排序的效率和性能。
- MACRec框架通过跨模态量化与对齐机制提升生成式推荐性能。
➡️