通过心理支架的合理化提升语言模型的人格

通过心理支架的合理化提升语言模型的人格

Apple Machine Learning Research Apple Machine Learning Research ·

本文讨论了在NeurIPS 2025可调节机器学习研讨会上接受的论文,强调红队方法在AI治理和安全研究中的重要性,并指出红队成员的身份和背景会影响其策略及发现的风险类型。

原文英文,约100词,阅读约需1分钟。
阅读原文