通过辩论促进更好的推理:一种无监督的多模态方法 本研究针对大型语言模型在监督上的挑战,提出了一种多模态辩论框架,使得较弱的模型能够监督并提升较强模型的表现。重点聚焦视觉问答任务,结果表明该辩论框架在多个多模态任务中表现优于个体专家模型,且从较弱的语言模型中获得的判断能够有效地提升视觉-语言模型的推理能力。 本研究提出了一种多模态辩论框架,旨在解决大型语言模型的监督问题。该框架在视觉问答任务中优于单一专家模型,提升了视觉-语言模型的推理能力。 多模态 推理能力 无监督 视觉问答 语言模型 辩论框架