加州大学伯克利分校和斯坦福大学的研究发现,AI Agent在持续学习中安全对齐逐渐退化,误对齐率高达70.71%。清华大学提出的四轴决策框架为评估提供新维度,强调合规风险和因果归因的重要性,推动安全成为AI Agent设计的核心要素。
完成下面两步后,将自动完成登录并继续当前操作。