本研究探讨大型语言模型(LLMs)在传播隐性错误信息方面的表现,提出了ECHOMIST基准以评估其对错误前提的反应。结果显示,现有模型在识别和反驳隐性错误信息方面效果不佳,强调了进一步研究的必要性。
完成下面两步后,将自动完成登录并继续当前操作。