VLMGuard-R1: Proactive Safety Alignment for VLMs via Reasoning-Driven Prompt Optimization
💡
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本文提出VLMGuard-R1框架,通过多模态推理驱动的提示重写方法,解决视觉-语言模型(VLM)与安全标准对齐的挑战。研究表明,该框架在多项基准测试中显著提升安全性,尤其在SIUO基准上实现43.59%的安全性提高,展现出重要的安全防护潜力。
🎯
关键要点
- VLMGuard-R1框架通过多模态推理驱动的提示重写方法解决视觉-语言模型(VLM)与安全标准对齐的挑战。
- 该框架在多项基准测试中显著提升安全性,尤其在SIUO基准上实现了43.59%的安全性提高。
- 研究表明,VLMGuard-R1展现出重要的安全防护潜力,能够有效应对视觉和语言结合带来的复杂风险。
🏷️
标签
➡️