小红花·文摘

本研究提出了混合模态适应方法（MMA），通过轻量级适配器模块搭建图像和语言模型之间的桥梁，实现联合优化。该方法应用于LaBIn视觉语言指导模型，实验证明其训练效率和性能竞争力优于现有多模LLMs，有潜力成为通用聊天机器人。