Context-Infused Visual Grounding for Art

💡 原文英文,约100词,阅读约需1分钟。
📝

内容提要

本研究提出了一种新方法CIGAr,旨在解决现有视觉定位方法在艺术作品中的不足。CIGAr通过利用艺术描述作为上下文,实现了对艺术作品的有效视觉定位。此外,研究还提供了新数据集Ukiyo-eVG,包含人工标注的短语定位注释,并在两个艺术作品数据集上设定了新的物体检测标准。

🎯

关键要点

  • 本研究提出了一种新方法CIGAr,旨在解决现有视觉定位方法在艺术作品中的不足。
  • CIGAr通过利用艺术描述作为上下文,实现了对艺术作品的有效视觉定位。
  • 研究提供了新数据集Ukiyo-eVG,包含人工标注的短语定位注释。
  • 在两个艺术作品数据集上设定了新的物体检测标准。
➡️

继续阅读