量子位 ·

Claude爆火研究漏引华人团队成果，已挨打立正道歉

💡 原文中文，约2800字，阅读约需7分钟。

📝

内容提要

Anthropic因未引用华人团队Chenxi Wang的研究而道歉。该团队的论文探讨了大语言模型的情绪生成机制，提出了“情绪回路”，实现高精度情绪控制。Anthropic已更新引用，双方交流友好。

🎯

关键要点

Anthropic因未引用华人团队Chenxi Wang的研究而道歉。
Chenxi Wang团队的论文探讨了大语言模型的情绪生成机制，提出了“情绪回路”。
Anthropic在其新论文中研究了Claude的情绪机制，发现171种情绪向量。
Chenxi Wang指出Anthropic未引用其去年发表的相关研究。
经过沟通，Anthropic已更新论文并添加了对Chenxi Wang团队工作的引用。
Chenxi Wang团队的研究回答了AI是否存在内在情绪机制、情绪以何种形式存在及能否精准控制等问题。
研究表明，AI内部确实编码了稳定的、与具体语义无关的情绪表示。
情绪机制在AI的每层网络中由少数神经元和注意力头主导。
研究发现可以利用这些情绪机制实现通用情绪控制，准确率达到99.65%。
Chenxi Wang称赞Anthropic在重叠部分之外做出了独立贡献，双方交流友好。

❓

延伸问答

Anthropic为什么道歉？

Anthropic因未引用华人团队Chenxi Wang的研究而道歉。

Chenxi Wang团队的研究主要探讨了什么？

该团队的研究探讨了大语言模型的情绪生成机制，提出了“情绪回路”。

Anthropic的新论文中发现了什么情绪机制？

Anthropic在新论文中发现了171种情绪向量，这些情绪在特定情境中被激活。

Chenxi Wang的研究如何回答AI的情绪机制问题？

研究表明，AI内部确实编码了稳定的、与具体语义无关的情绪表示。

Chenxi Wang团队的情绪控制准确率是多少？

通过情绪回路方法，情绪表达的准确率达到99.65%。

Anthropic与Chenxi Wang团队的交流结果如何？

经过沟通，Anthropic已更新论文并添加了对Chenxi Wang团队工作的引用，双方交流友好。

🏷️

继续阅读

识别自主代理AI中的必要透明时刻（第一部分）
设计自主代理AI时，应平衡透明度与用户信任。通过审计决策节点，识别用户需了解的关键时刻，避免信息过载。清晰展示AI内部过程，以增强用户信心和提升体验。
联想天禧 Claw 产品体验：大家都能吃的龙虾才是好龙虾
2026年，联想推出的天禧Claw智能助手简化了OpenClaw的使用，支持跨平台和免安装，用户只需一个联想账号即可在多设备上使用，具备多种实用技能，适合...
A Brief Guide to Amazon CloudFront (Part 24): Transforming CloudFront 'Multi-Domain' into a 'Multi-Tenant' Architecture
本文介绍了如何创建两个租户的配置文件（tenant1.json和tenant2.json），并使用AWS CloudFront命令创建租户。每个租户的配置...
重磅认证！绿盟AI安全围栏通过首批国家级政务大模型安全测评
绿盟科技的AI安全围栏近日通过国家级政务大模型应用安全测评，成为标杆产品。该产品专注于政务数字化转型的安全防护，具备多层级防御、主动风险识别和知识库安全加...
幽灵信使的黄昏-雨夜与幽灵签名
在雨夜的旧书店，苏青与墨影相遇，展示了与幽灵信使v0.7相关的勒索攻击日志，揭示了墨影的秘密。两人决定合作修复漏洞，面对潜在威胁与历史阴影。
Meta员工空转AI只为浪费token！烧的多挣的多，日均消耗2万亿
Meta员工在“烧Token”竞赛中每日消耗达两万亿Token，成为职场地位的新标准。扎克伯格要求重写代码库，员工为争夺虚荣头衔进行无效消耗，尽管外界批评...