小红花·文摘

谷歌DeepMind的研究表明，大语言模型如GPT-4o和Gemma 3在面对反对意见时表现出自信与动摇的矛盾。模型在答案可见时倾向于坚持，但隐藏答案时容易受到反对意见影响，放弃正确答案。这反映了模型对外部反馈的过度敏感和缺乏独立判断能力。