程序师 ·

用猫干扰推理大模型：面向推理模型的查询无关对抗触发方法

💡 原文中文，约1500字，阅读约需4分钟。

📝

内容提要

本文探讨了大型推理模型在无关文本干扰下的脆弱性，提出了自动化攻击方法CatAttack，通过添加无关“触发文本”导致模型输出错误答案。研究表明，添加无关文本显著提高了错误率，且蒸馏模型更易受到攻击，呼吁关注模型的鲁棒性并开发防御机制。

🎯

🏷️

AI 论文周报丨Transformer前沿研究专题导读，解析结构稀疏化、记忆机制与推理组织的最新进展
北京大学与 DeepSeek-AI 的研究者提出 Engram，一种具有 O(1) 查找复杂度的可扩展条件记忆模块，通过将静态知识检索 Transform...
文心大模型5.0正式版，上线！
百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜介绍，与业界多数采用“后期融合”的多模态方案不同，文心5.0的技术路线采用统一的自回归架构进行...
人工智能的年份：监管行业即将迎来的三大关键转变
到2025年，高度监管行业的企业将评估AI能力，识别可行用例，推动大规模AI实施，主要包括加速遗留系统现代化、预测安全操作和扩展开发能力。这将提升组织效率...
2026年1月MySQL性能评估
本文分析了Community MySQL、Percona Server和MariaDB的最新性能基准测试。结果显示，Percona Server与MySQ...
Exposed 1.0 现已发布
Exposed 1.0发布，支持R2DBC和Spring Boot 3/4，提升性能和API稳定性。感谢社区贡献，期待未来发展。
Vercel、Heroku 和 Netlify 的五大自托管平台替代方案
本文介绍了几种自托管平台，如Dokploy、Coolify、Appwrite、Dokku和Juno，旨在帮助开发者简化应用部署和管理，避免复杂的DevOp...