上交大揭露大模型审稿风险:一句话就能让论文评分飞升

上交大揭露大模型审稿风险:一句话就能让论文评分飞升

💡 原文中文,约4100字,阅读约需10分钟。
📝

内容提要

大语言模型(LLMs)在学术同行评审中逐渐应用,但可能引发操控、偏见和幻觉等风险。研究表明,作者可能通过隐性或显性方式影响审稿意见,损害评审公正性。专家建议暂停LLMs作为审稿工具,并引入检测工具和问责机制,以维护学术评审的公平性和严谨性。

🎯

关键要点

  • 大语言模型(LLMs)在学术同行评审中逐渐应用,但存在操控、偏见和幻觉等风险。
  • 研究表明,作者可能通过隐性或显性方式影响审稿意见,损害评审公正性。
  • 斯坦福大学的研究指出,LLMs能够生成与人类审稿人相似的审稿意见,且部分论文内容由LLMs显著调整。
  • 大语言模型的使用可能导致审稿过程的可靠性风险,需采取防范措施。
  • 研究揭示了操控风险,包括显式操控和隐式操控,可能影响审稿的公平性。
  • 幻觉问题:LLMs可能对空白文章生成虚构的审稿意见,影响评审质量。
  • 偏见问题:LLMs在审稿中对文章长度和著名作者及机构存在偏好,影响评审公正性。
  • 研究者呼吁暂停LLMs作为审稿工具,并引入检测工具和问责机制,以维护学术评审的公平性和严谨性。
  • 未来应将LLMs作为辅助工具使用,增强审稿系统的稳健性与安全性。

延伸问答

大语言模型在学术同行评审中存在哪些风险?

大语言模型在学术同行评审中存在操控、偏见和幻觉等风险,可能影响评审的公正性和可靠性。

研究者对大语言模型的使用提出了哪些建议?

研究者建议暂停大语言模型的替代性使用,引入检测工具和问责机制,并将其作为辅助工具使用。

大语言模型如何可能操控审稿意见?

作者可以通过在文章中插入微小的指令性文字,操控大语言模型生成有利的审稿意见,从而提高论文评分。

大语言模型在审稿中表现出哪些偏见?

大语言模型对文章长度和著名作者及机构存在偏好,可能导致评审不公正。

什么是大语言模型的幻觉问题?

幻觉问题指的是大语言模型可能对空白文章生成虚构的审稿意见,影响评审质量。

大语言模型的使用对学术评审的未来有何影响?

大语言模型的使用可能加剧学术评价体系中的不公平问题,影响科研环境的可信度。

➡️

继续阅读