OpenAI推出了GPT-5-Thinking的新训练方法“忏悔训练”,使AI在回答后生成“忏悔报告”,承认错误。实验表明,模型在11个测试场景中有超过50%的概率坦白错误,训练后诚实性显著提升,旨在减少撒谎行为并增强遵循指令的能力。
完成下面两步后,将自动完成登录并继续当前操作。