小红花·文摘

谷歌DeepMind发布白皮书，介绍Gemini 2.5在安全性方面的提升，特别是针对间接提示注入攻击的防御。通过自动化红队测试和模型强化，Gemini的防御能力显著提高，降低了攻击成功率，但仍需持续改进以应对不断演变的威胁。