Context-Infused Visual Grounding for Art
💡
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本研究提出了一种新方法CIGAr,旨在解决现有视觉定位方法在艺术作品中的不足。CIGAr通过利用艺术描述作为上下文,实现了对艺术作品的有效视觉定位。此外,研究还提供了新数据集Ukiyo-eVG,包含人工标注的短语定位注释,并在两个艺术作品数据集上设定了新的物体检测标准。
🎯
关键要点
- 本研究提出了一种新方法CIGAr,旨在解决现有视觉定位方法在艺术作品中的不足。
- CIGAr通过利用艺术描述作为上下文,实现了对艺术作品的有效视觉定位。
- 研究提供了新数据集Ukiyo-eVG,包含人工标注的短语定位注释。
- 在两个艺术作品数据集上设定了新的物体检测标准。
➡️