BriefGPT - AI 论文速递 ·

SafeDecoding：通过安全感知解码防御越狱攻击

💡 原文中文，约400字，阅读约需1分钟。

📝

内容提要

本文研究了日常语言交互与AI安全之间的交叉点，探讨了如何说服大型语言模型进行越狱，并通过社会科学研究的说服分类应用，发现说服显著提高了越狱性能。同时指出现有的防御手段存在差距，呼吁减轻高交互性大型语言模型的风险。

🎯

🏷️

7-Zip 的 XZ 解码漏洞，真正该紧张的是自动解压链路
7-Zip 被披露一个与 XZ 解码相关的堆缓冲区溢出漏洞，摘要称可能被用于远程执行代码。比起单机用户手动解压，我更关心服务端、CI、网关和文件处理任务里...
阿里Qoder上线全新安全能力，为每位用户配备一位专属安全工程师
挖洞需谨慎！小米安全中心发布违规通报谴责以漏洞测试为借口进行黑客行为
#安全资讯挖洞需谨慎！小米安全中心发布违规事件处置公告，谴责以漏洞测试为借口进行黑客行为。小米在 6 月 26 日下午检测到一起影响广泛的入侵安全事件，...
Firefox 153 版本发布，支持 Vulkan 视频解码，并实验性支持 JPEG-XL 格式
2026年7月20日，Mozilla 发布了 Firefox 153.0 的正式版二进制文件，这是这款跨平台网络浏览器的最新月度更新。Firefox 15...
在AI帮助下黑客在漏洞公布数小时后就针对WordPress发起远程代码执行攻击
#安全资讯在漏洞公布数小时后，黑客就利用 AI 成功发掘 WordPress 高危安全漏洞并发起攻击，部分网站可能会被黑客添加管理员账号或在服务器上部署...
161k星标OpenCode被曝安全黑洞：实测远程代码执行漏洞全家桶
OpenCode爆出161k星标却让开发者连夜跑路，你的终端还敢让它裸奔吗？ OpenCode这个号称最火的开源AI编程助手，GitHub星标161k，但...