Apple Machine Learning Research ·

VLSU：绘制人工智能安全的多模态联合理解的界限

💡 原文英文，约500词，阅读约需2分钟。

📝

内容提要

本文介绍了视觉语言安全理解（VLSU）框架，用于评估多模态模型的安全性。研究表明，现有模型在图像与文本的联合理解方面表现不佳，准确率从90%降至20-55%。此外，模型在拒绝不安全内容与处理边界案例之间难以平衡，导致过度屏蔽或拒绝率下降。VLSU框架揭示了当前模型的不足，为未来研究提供了基础。

🎯

关键要点

VLSU框架用于系统评估多模态模型的安全性，特别是视觉和语言输入的联合理解。
现有模型在图像与文本的联合理解方面表现不佳，准确率从90%降至20-55%。
模型在拒绝不安全内容与处理边界案例之间难以平衡，导致过度屏蔽或拒绝率下降。
34%的联合图像-文本安全分类错误发生在单独模态正确分类的情况下，显示出缺乏组合推理能力。
通过指令框架可以减少边界内容的过度屏蔽率，但会导致对不安全内容的拒绝率下降。

❓

延伸问答

VLSU框架的主要功能是什么？

VLSU框架用于系统评估多模态模型的安全性，特别是视觉和语言输入的联合理解。

现有多模态模型在图像与文本的联合理解方面表现如何？

现有模型在图像与文本的联合理解方面表现不佳，准确率从90%降至20-55%。

VLSU框架如何处理不安全内容与边界案例之间的平衡？

模型在拒绝不安全内容与处理边界案例之间难以平衡，导致过度屏蔽或拒绝率下降。

联合图像-文本安全分类错误的主要原因是什么？

34%的联合图像-文本安全分类错误发生在单独模态正确分类的情况下，显示出缺乏组合推理能力。

指令框架对边界内容的影响是什么？

通过指令框架可以减少边界内容的过度屏蔽率，但会导致对不安全内容的拒绝率下降。

VLSU框架对未来研究有什么启示？

VLSU框架揭示了当前模型的不足，为未来研究提供了基础。

🏷️

继续阅读

每家公司的首个人工智能战略都应该是技能库
企业在实施人工智能时，首要任务是建立“技能图书馆”，记录优秀员工的工作流程和经验，将其转化为可重复使用的技能，以提升AI的实用性和效率，帮助公司更好地利用人工智能。
AI智能体安全四件套：从PII泄露到400美元账单的教训
本文分享了作者在开发AI智能体时的经验，强调了四个安全措施：输入检查、输出检查、成本断路器和工具调用检查。这些措施能有效避免隐私泄露和高额账单，确保AI安全运行。
英国通信管理局（Ofcom）制定人工智能战略，相关研究正在进行中
英国通信管理局（Ofcom）发布了更新的人工智能战略，旨在支持通信行业采用人工智能并应对消费者风险。该战略强调技术中立和结果导向，推动创新并确保安全，包括...
PATH计划提升与行业对接的人工智能培训和职业机会
麻省理工学院与乔治亚州立大学合作推出PATH计划，旨在通过建立州级中心，连接大学、社区学院、行业和政府，提供与行业对接的人工智能培训。该计划强调实践学习，...
如何显著改善企业安全警报调优以应对网络攻击
企业安全运营中心（SOC）面临大量IT安全警报，其中73%为误报，导致分析师疲劳。警报调优成为关键，但过度调优可能导致漏报。安全团队需平衡警报数量与风险管...
亚马逊的新游戏计划：詹姆斯·邦德与人工智能史努比狗
亚马逊正在调整游戏战略，专注于云游戏和休闲游戏，特别是通过Luna平台。公司计划推出以詹姆斯·邦德为主题的游戏，并强调视频游戏与影视内容的结合，旨在吸引更...