融入上下文的艺术视觉定位
💡
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本研究提出了一种新方法CIGAr,利用艺术描述提升艺术作品的视觉定位效果。研究还提供了一个新数据集Ukiyo-eVG,包含人工标注的短语定位注释,并在两个艺术作品数据集上设定了新的物体检测标准。
🎯
关键要点
- 本研究提出了一种新方法CIGAr,旨在提升艺术作品的视觉定位效果。
- CIGAr方法通过利用艺术描述作为上下文,在训练过程中改善视觉定位。
- 研究提供了一个新数据集Ukiyo-eVG,包含人工标注的短语定位注释。
- 在两个艺术作品数据集上设定了新的物体检测标准。
➡️