本研究提出了MM-R$^3$基准,用于评估多模态大型语言模型在一致性和准确性上的表现。研究发现一致性和准确性不总是相关,并通过引入适配器模块有效减少不一致性,从而提升AI系统的可靠性。
正在访问的资源需要验证您是否真人。
或在微信中搜索公众号“小红花技术领袖”并关注
第二步:在公众号对话中发送验证码: