BriefGPT - AI 论文速递 ·

用于防御预训练医学视觉语言模型中对抗噪声的轻量级微调方法

💡 原文中文，约2000字，阅读约需5分钟。

📝

内容提要

本文研究了视觉-语言预训练模型的对抗攻击，提出了多种新方法以提高模型的鲁棒性。实验结果表明，这些方法在攻击成功率和防御能力上表现优异，揭示了模型部署中的重要盲点，强调了确保实际应用安全的必要性。

🎯

❓

VLAttack框架通过融合单模态和多模态层次的图像和文本扰动生成对抗样本，旨在提高视觉-语言预训练模型的鲁棒性。

Co-Attack是一种新型攻击方法，旨在提高视觉-语言模型在不同下游任务中的攻击性能。

AdvDiffVLM通过生成自然的对抗样本，利用扩散模型和自适应集成梯度估计，显著提高了攻击速度和样本质量。

RoAST通过在微调期间引入对抗性扰动，选择性地更新模型参数，从而提升语言模型的多角度鲁棒性。

VDA技术通过构建混合多项式增加虚拟数据嵌入，从而提高预训练语言模型的鲁棒性。

LLMs在医疗应用中易受敌对攻击，可能导致不良结果，强调了确保其安全有效部署的必要性。

🏷️

OpenClaw v2026.5.20：Discord语音跟随和doctor拦截明文密钥
OpenClaw 2026.5.20版本更新了Discord语音功能，机器人可以跟随用户换频道，并新增doctor插件以自动检测明文密码。修复了Windo...
维基: Vibe 编程
“Vibe coding”是一种无需编程知识即可通过提示大型语言模型（LLM）构建软件的方法。尽管便捷，但生成的软件常存在可维护性、正确性和安全性问题，适...
KotlinConf’26 主题演讲亮点：语言设计、工具、AI驱动工作流程和多平台开发的进展
KotlinConf’26展示了Kotlin语言在设计、工具、AI驱动工作流程和多平台开发方面的进展。Kotlin 2.4.0引入了更安全的代码特性，如上...
微软发布用于缓解BitLocker加密绕过的脚本该漏洞目前已经被公开
微软发布了缓解脚本以应对BitLocker加密绕过漏洞CVE-2026-45585，该漏洞允许在WinRE环境中直接访问加密文件。脚本通过移除高权限程序a...
Nginx 结合 GeolP 模块限制访问区域
GeoIP2模块是MaxMind提供的IP地址地理位置查询工具，能够在Nginx上根据客户端IP进行访问限制。该模块的数据库包含国家、城市和互联网服务提供...
iProov推出企业视频通话深度伪造检测系统
iProov推出了Verified Meetings生物识别身份验证系统，旨在验证企业视频通话中的参与者身份，以应对深度伪造和合成身份的风险。该系统通过分...