谷歌DeepMind的研究表明,大语言模型如GPT-4o和Gemma 3在面对反对意见时表现出自信与动摇的矛盾。模型在答案可见时倾向于坚持,但隐藏答案时容易受到反对意见影响,放弃正确答案。这反映了模型对外部反馈的过度敏感和缺乏独立判断能力。
完成下面两步后,将自动完成登录并继续当前操作。