小红花·文摘

本研究提出了一种新评估方法，解决视觉大语言模型在视觉空间推理（VSR）数据集不足的问题。改进后的模型VSRE在VSR测试集上的准确率提高超过27%，为该领域研究提供了新思路。