BriefGPT - AI 论文速递 ·

T2VSafetyBench 评估文本到视频生成模型的安全性

💡 原文中文，约2200字，阅读约需6分钟。

📝

内容提要

为降低大规模视觉模型（LVMs）带来的有害输出风险，研究者推出了SafeSora数据集，以促进文本到视频生成与人类价值观的对齐。该数据集支持文本-视频审查模型和对齐算法的开发。同时，研究还探讨了文本到图像生成系统的安全性，发现现有防御措施不足，呼吁加强隐性提示的研究与防范。

🎯

❓

SafeSora数据集旨在促进文本到视频生成与人类价值观的对齐，降低大规模视觉模型的有害输出风险。

SafeSora数据集包括帮助性和无害性两个主要维度，细分为4个子维度和12个子类别。

研究发现现有的文本到图像生成系统的安全性防御措施不足，呼吁加强对隐性提示的研究与防范。

T2VScore评估方法综合考虑文本-视频对齐和视频质量两个关键要素。

隐性提示可能绕过安全约束，对文本到图像模型构成潜在威胁，可能导致隐私泄露和不当内容生成。

研究者呼吁T2I社区更加关注隐性提示的潜力和风险，并倡导平衡的方法来发挥其益处。

🏷️