ArtRAG:基于结构化上下文的检索增强生成用于视觉艺术理解

📝

内容提要

本研究针对当前多模态大语言模型在艺术作品分析中未能有效捕捉细腻解读的问题,提出了一种新颖的框架ArtRAG。该框架通过构建艺术上下文知识图谱,从多角度提供文化和历史背景,使模型能够生成更具语境和文化涵养的艺术描述,并在多个基准测试中超越传统的方法。

🏷️

标签

➡️

继续阅读