机器之心 ·

视觉语言模型易受攻击？西安交大等提出基于扩散模型的对抗样本生成新方法

💡 原文中文，约4500字，阅读约需11分钟。

📝

内容提要

本文提出了AdvDiffVLM，一种高效生成视觉语言模型对抗样本的方法。通过扩散模型和自适应集成梯度估计，生成自然且针对性的对抗样本，显著提升了迁移性和质量。实验结果表明，该方法速度提高5至10倍，效果优于现有技术。

🎯

关键要点

AdvDiffVLM是一种高效生成视觉语言模型对抗样本的方法。
该方法通过扩散模型和自适应集成梯度估计生成自然且针对性的对抗样本。
AdvDiffVLM显著提升了对抗样本的迁移性和质量。
实验结果显示，该方法速度提高5至10倍，效果优于现有技术。
对抗攻击用于评估大型视觉语言模型的对抗鲁棒性，现有方法存在高成本和低迁移性的问题。
AdvDiffVLM利用得分匹配生成自然、无约束的对抗样本，提升了对抗样本的质量。
引入GradCAM引导的掩模生成模块，分散对抗语义，提高整体图像质量。
AdvDiffVLM在黑箱环境中成功攻击多种商用视觉语言模型，包括GPT-4V。
与传统方法相比，AdvDiffVLM在攻击能力、迁移能力和生成速度方面表现更佳。
防御实验表明，AdvDiffVLM在抵抗数据预处理攻击方面优于基准方法。
对抗样本的图像质量评估显示，AdvDiffVLM生成的对抗样本在多个指标上优于基准方法。

🏷️

继续阅读

苹果50年：视觉历史
在苹果成立50周年之际，回顾其历史：1984年，史蒂夫·乔布斯身穿蝴蝶结，女性用大锤挑战IBM；iMac以其美观和丰富色彩著称；消费者热衷于排队购买最新产品。
橙狮体育推出AI办赛助手，集成最新千问模型
橙狮体育推出AI办赛助手“Smartshot”，集成千问模型，能够理解自然语言指令并自动完成赛事配置。该系统实现全流程管控，实时捕捉数据，消除人工误差，并...
富士胶片商业创新五色生产型数字印刷系统获2026 iF设计奖
德国汉诺威工业设计论坛公布2026年“iF设计奖”获奖名单，富士胶片集团的23款产品获奖，其中Revoria Press EC2100和SC285数字印刷...
香港应科院与纳米及先进材料研发院完成合并
香港应用科技研究院与纳米及先进材料研发院于4月1日合并，成为香港最大的政府资助研发中心，汇聚800名科研人员，拓展至人工智能、通讯技术及多种材料领域。
华为2025年全球销售收入8809亿元；360智能体发现OpenClaw高危漏洞；OpenAI完成1220亿美元融资
华为预计2025年全球销售收入达到8809.41亿元；字节跳动启动大模型人才招聘；360发现OpenClaw高危漏洞；巴菲特表示苹果股票卖得太早；Open...
Intercom 的 Fin Apex 提高了 AI CX 供应商的标准
Intercom发布的Fin Apex公告显示其新AI客服模型解决率提升至75%，成本降低。公司强调未来竞争将依赖于专有数据和持续优化的技术，而成功的供应...

视觉语言模型易受攻击？西安交大等提出基于扩散模型的对抗样本生成新方法

内容提要

关键要点

标签

继续阅读