又遇到「GPT写的review」了?看看北大&密歇根的这个研究工作
原文中文,约4000字,阅读约需10分钟。发表于: 。本文介绍了使用大语言模型(LLMs)提高审稿意见质量的两种机制:Generative Peer Prediction Mechanism (GPPM) 和 Generative Synopsis Peer Prediction Mechanism (GSPPM)。实验结果表明,这两种机制能够有效区分人类审稿意见和LLM生成的审稿意见,并且能够检测低质量的评论意见。未来工作包括验证机制评分与人类评分的相关性,降低评分噪声,以及在其他领域测试机制的能力。