本文介绍了一种新方法II-MMR,用于视觉和语言中的多模多跳推理。该方法通过两种语言提示改进视觉问答(VQA)问题的推理路径,发现大多数问题只需“单跳”推理。II-MMR在零-shot和微调设置中表现出色,提升了模型的推理能力,并在多个基准测试中取得了优异成绩。
完成下面两步后,将自动完成登录并继续当前操作。