小红花·文摘

MiniMax推出的V-Triune框架实现了视觉推理与感知任务的统一学习，显著提升了性能。该框架通过动态奖励机制和样本级数据格式化，克服了传统强化学习方法的局限性。Orsta模型在基准测试中表现优异，验证了该方法的有效性。