该研究提出了一种新颖的视觉与语言对齐集成知识图谱(VaLiK)方法,旨在解决大型语言模型(LLMs)在多模态推理中的知识不完整和幻觉问题。VaLiK通过跨模态信息补充,显著提升了LLMs的推理能力和存储效率。实验结果表明,使用VaLiK的LLMs在多模态推理任务上表现优于以往模型。
完成下面两步后,将自动完成登录并继续当前操作。