小红花·文摘

该研究提出了一种新颖的视觉与语言对齐集成知识图谱（VaLiK）方法，旨在解决大型语言模型（LLMs）在多模态推理中的知识不完整和幻觉问题。VaLiK通过跨模态信息补充，显著提升了LLMs的推理能力和存储效率。实验结果表明，使用VaLiK的LLMs在多模态推理任务上表现优于以往模型。