Virgo:关于复制o1类多模态大语言模型的初步探索

📝

内容提要

本研究解决了在多模态大语言模型中实现慢思维推理系统的挑战。通过微调一个有能力的多模态大语言模型,利用少量长篇文本推理数据,我们构建了一个名为Virgo的慢思维系统。研究发现,文本推理数据在激发多模态大语言模型的慢思维能力方面可能比视觉推理数据更为有效,这一发现为未来更强大推理系统的开发提供了指导。

🏷️

标签

➡️

继续阅读