DIS-CO: Discovering Copyrighted Content in Visual Language Model Training Data
💡
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本研究提出DIS-CO方法,以解决在无法直接访问训练数据的情况下验证视觉语言模型(VLM)是否使用了版权内容的问题。通过反复查询具体画面,DIS-CO显著提高了检测性能,揭示了模型接触版权内容的广泛问题。
🎯
关键要点
- 本研究提出DIS-CO方法,以解决在无法直接访问训练数据的情况下验证视觉语言模型(VLM)是否使用了版权内容的问题。
- DIS-CO通过反复查询具体画面来推断版权内容的包含情况。
- 研究结果显示,DIS-CO显著提高了检测性能,几乎将最佳前方法的平均AUC提高了一倍。
- 该研究揭示了所测试模型在一定程度上接触到了版权内容的更广泛问题。
➡️