小红花·文摘

本研究探讨大型语言模型（LLMs）在传播隐性错误信息方面的表现，提出了ECHOMIST基准以评估其对错误前提的反应。结果显示，现有模型在识别和反驳隐性错误信息方面效果不佳，强调了进一步研究的必要性。