小红花·文摘

OpenAI推出了GPT-5-Thinking的新训练方法“忏悔训练”，使AI在回答后生成“忏悔报告”，承认错误。实验表明，模型在11个测试场景中有超过50%的概率坦白错误，训练后诚实性显著提升，旨在减少撒谎行为并增强遵循指令的能力。