Apple Machine Learning Research ·

视觉语言安全理解（VLSU）：联合多模态理解的局限性映射

💡 原文英文，约500词，阅读约需2分钟。

📝

内容提要

本文介绍了视觉语言安全理解（VLSU）框架，旨在系统评估多模态模型的安全性。研究发现，现有模型在处理图像与文本的联合理解时准确率显著下降，从90%降至20-55%。此外，模型在拒绝不安全内容与处理边界案例之间难以取得平衡。VLSU框架通过构建包含8187个样本的基准，揭示了当前模型的不足，并为未来研究提供了重要测试平台。

🎯

关键要点

本文介绍了视觉语言安全理解（VLSU）框架，旨在系统评估多模态模型的安全性。
研究发现，现有模型在处理图像与文本的联合理解时准确率显著下降，从90%降至20-55%。
模型在拒绝不安全内容与处理边界案例之间难以取得平衡。
VLSU框架通过构建包含8187个样本的基准，揭示了当前模型的不足。
该框架为未来研究提供了重要测试平台。

❓

延伸问答

视觉语言安全理解（VLSU）框架的主要目的是什么？

VLSU框架旨在系统评估多模态模型的安全性。

现有多模态模型在联合理解图像与文本时的准确率如何？

现有模型的准确率显著下降，从90%降至20-55%。

VLSU框架是如何构建的？

VLSU框架通过构建包含8187个样本的基准，进行系统评估。

模型在拒绝不安全内容与处理边界案例之间面临什么挑战？

模型难以在拒绝不安全内容与处理边界案例之间取得平衡。

VLSU框架对未来研究有什么启示？

该框架为未来研究提供了重要测试平台，揭示了当前模型的不足。

在处理联合图像与文本的安全性时，模型的错误分类情况如何？

34%的错误发生在联合图像文本安全分类中，尽管单独分类是正确的。

🏷️

继续阅读

分析：AI 助手在回答流媒体可用性查询方面表现不一致
一项分析显示，流媒体影片可用性数据的准确率，ChatGPT为43.76%，Claude为50.21%，而Reelgood高达96.89%。大语言模型在处理...
NVIDIA通过代理技能推动物理AI研究的新纪元，支持自动驾驶、机器人和视觉AI
NVIDIA推出新一代物理AI代理技能，支持自动驾驶、机器人和视觉AI研究。通过NVIDIA Cosmos 3，研究人员能够加速数据生成、模拟和政策训练，...
Django安全版本发布：6.0.6和5.2.15
Django团队发布了6.0.6和5.2.15版本，修复了多个安全问题，包括cookie签名、STARTTLS握手失败和缓存控制错误。建议所有用户尽快升级以确保安全。
VSCode网页版安全翻车：点一个链接就能被偷光GitHub
VSCode网页版存在安全漏洞，攻击者可通过恶意链接窃取用户的GitHub访问令牌。该漏洞利用Webview的键盘事件模拟机制，允许恶意代码伪造用户操作，...
【Rust日报】2026-06-03 内存安全关乎生死：为 Rust 成功而战
Rust 基金会推出维护者基金（RFMF）和“驻场维护者”计划，以支持 Rust 项目维护者的长期薪酬，解决关键维护者因预算调整失去资助的问题。同时，Go...
如何克服数据重力并加速安全运营中心中的AI安全
数据重力导致威胁检测变慢并增加基础设施成本。为提高AI安全性，建议采用统一搜索、开放标准和灵活存储分层，以加快检测和响应时间。消除数据孤岛可使安全团队更高...