无限多模态:利用大规模高质量指令数据提升多模态性能
本研究提出了Infinity-MM数据集,包含4000万个样本,解决了开放源代码指令数据的规模和质量问题。训练的Aquila-VL-2B模型在同类模型中表现优异,验证了扩展指令数据和生成合成数据的有效性。
原文中文,约300字,阅读约需1分钟。
本研究提出了Infinity-MM数据集,包含4000万个样本,解决了开放源代码指令数据的规模和质量问题。训练的Aquila-VL-2B模型在同类模型中表现优异,验证了扩展指令数据和生成合成数据的有效性。