小红花·文摘

该研究提出了SemArt多模态数据集，旨在实现语义艺术理解和Text2Art挑战。通过计算机视觉技术，优化了艺术作品的分类和检测，并探讨了知识图谱在图像字幕生成中的应用。研究还提出了多模态知识图谱和机器学习系统，以量化分析艺术作品。最新的LVLMs在艺术品解释生成任务中展现了潜力，但仍面临知识整合的挑战。