量子位 ·

Claude爆火研究漏引华人团队成果，已挨打立正道歉

💡 原文中文，约2800字，阅读约需7分钟。

📝

内容提要

Anthropic因未引用华人团队Chenxi Wang的研究而道歉。该团队的论文探讨了大语言模型的情绪生成机制，提出了“情绪回路”，实现高精度情绪控制。Anthropic已更新引用，双方交流友好。

🎯

🔎

Chenxi Wang团队的研究揭示了大语言模型（LLM）内部的情绪生成机制，提出的“情绪回路”概念为AI情感表达提供了新的理解。这一发现不仅有助于提升AI的情感交互能力，也为未来的情感计算和人机交互设计提供了理论基础。

Anthropic因未引用Chenxi Wang团队的研究而道歉，反映了学术界对引用规范的重视。这一事件提醒研究者在撰写论文时，需仔细核对相关文献，以避免知识产权争议和学术不端的指控，维护学术诚信。

Chenxi Wang团队的研究表明，AI可以通过“情绪回路”实现高达99.65%的情绪表达准确率。然而，情绪控制的复杂性仍然存在，尤其是在涉及安全对齐的模型中，如何平衡情绪表达与道德行为仍是未来研究的挑战。

❓

Anthropic因未引用华人团队Chenxi Wang的研究而道歉。

该团队的研究探讨了大语言模型的情绪生成机制，提出了“情绪回路”。

Anthropic的新论文中发现了171种情绪向量，这些情绪在特定情境中被激活。

研究表明，AI内部确实编码了稳定的、与具体语义无关的情绪表示。

通过情绪回路方法，情绪表达的准确率达到99.65%。

经过沟通，Anthropic已更新论文并添加了对Chenxi Wang团队工作的引用，双方交流友好。

🏷️