BriefGPT - AI 论文速递 ·

AdPO: Enhancing the Adversarial Robustness of Large Vision-Language Models through Preference Optimization

💡 原文英文，约100词，阅读约需1分钟。

📝

内容提要

本研究提出AdPO方法，旨在提高大规模视觉语言模型（LVLMs）在对抗攻击下的鲁棒性。通过将对抗训练重新定义为偏好优化，AdPO增强了模型生成正常输出的能力，实验结果表明其在多个任务中优于现有防御方法。

🎯

关键要点

本研究提出AdPO方法，旨在提高大规模视觉语言模型（LVLMs）在对抗攻击下的鲁棒性。
AdPO方法将对抗训练重新定义为偏好优化，增强模型生成正常输出的能力。
实验结果表明，AdPO在多个任务中优于现有的对抗防御方法。
AdPO为未来的对抗防御研究提供了新的视角。

🏷️

标签

AdPO models 偏好优化对抗攻击视觉语言模型鲁棒性

➡️

继续阅读

5 Must-Read Resources for Mastering Small Language Models
Five resources covering SLM architecture, fine-tuning, agentic workflows, and...
Gemini for macOS adds new natural language capabilities
Gemini for macOS language capabilities
How to Build AI Applications That Switch Models Automatically
Large Language Models (LLMs) have fundamentally changed how we build modern s...
【Triton 教程】triton_language.exp
Triton 是一种用于并行编程的语言和编译器。它旨在提供一个基于 Python 的编程环境，以高效编写自定义 DNN 计算内核，并能够在现代 GPU 硬...
Lee Cronin's The Mummy
2026 年的木乃伊电影
别再守着 Claude Code 了——学会指挥它自主干活
回到开头那句：别再一句一句地喂它、然后守着屏幕。真正的用法是——把一件事想清楚、划好边界、给它一个能自我验证的目标，然后交出去。你会发现，省下来的时间不是...