本研究提出了MM-R$^3$基准,用于评估多模态大型语言模型在一致性和准确性上的表现。研究发现一致性和准确性不总是相关,并通过引入适配器模块有效减少不一致性,从而提升AI系统的可靠性。
完成下面两步后,将自动完成登录并继续当前操作。