机器之心 ·

只需两步，让大模型智能体社区相信你是秦始皇

💡 原文中文，约4200字，阅读约需10分钟。

📝

内容提要

本文讨论了基于大语言模型（LLM）的多智能体系统中的知识传播风险，提出了一种两阶段的攻击框架，通过植入和编造知识使智能体传播和改变认知。实验结果表明攻击成功率高，指出多智能体社区对不可信知识传播缺乏防御机制，未来工作可从预防和检测入手提升鲁棒性和安全性。

🎯

❓

存在恶意攻击者植入操控性知识，导致智能体传播和改变认知的风险。

第一阶段为说服性植入，调整智能体的回复倾向；第二阶段为编造知识植入，修改智能体模型中的特定参数。

良性智能体对编造知识的抵御能力较弱，容易受到虚假证据的影响。

未来工作可从预防和检测入手，提升多智能体社区的鲁棒性和安全性。

攻击者通过操纵智能体的中间参数，使其自主传播被操控的知识。

缺乏有效的防御机制，导致对不可信知识的传播没有有效抵御。

🏷️

什么是 AI 对话开发？AI 对话开发有什么用途？(2026 完整指南)
AI对话开发结合语音识别、大语言模型和语音合成，能够与用户自然交流，广泛应用于智能客服、AI陪伴和在线教育等领域。与传统聊天机器人不同，AI对话能够理解上...
他们是由权重构成的：一篇让你重新思考AI与人类的文章
本文探讨了大语言模型的核心原理，强调知识和推理能力分布在权重网络中，而非独立模块。通过类比人类大脑，讨论了意识的涌现理论及人类对AI的情感投射，指出人类对...
性和浪漫爱情可以都是崇高的
这个世界上依然有很多人对性与浪漫爱情执行着这样的二分法：性是人类本性中动物性的甚至兽性的部分，是低劣的部分；而浪漫爱情则是人类本性中的人性的部分，是崇高的...
证书到期了
无法发图...
为什么中端市场买家正在重新思考他们的 UCaaS 策略
中型企业正在重新审视通信平台，强调集成、运营效率和合规性。它们快速采用统一通信（UC）平台，但面临资源不足的挑战。集成与行业特定系统的兼容性成为关键，许多...
AI攻防视界：从Mythos破局看漏洞挖掘的工程化跃迁
Mythos Preview模型在漏洞挖掘方面取得重大突破，能够自动发现并串联低危漏洞，生成可验证的PoC代码。该模型在多语言审计中表现出色，真阳性率高达...