研究发现普通的多模态大型语言模型在处理实体信息方面能力有限。为了解决这个问题,研究者设计了两个多模态实体感知对齐任务和一个对齐框架,取得了比先前最先进模型更好的结果。
完成下面两步后,将自动完成登录并继续当前操作。