机器之心 ·

上交大揭露大模型审稿风险：一句话就能让论文评分飞升

💡 原文中文，约4100字，阅读约需10分钟。

📝

内容提要

大语言模型（LLMs）在学术同行评审中逐渐应用，但可能引发操控、偏见和幻觉等风险。研究表明，作者可能通过隐性或显性方式影响审稿意见，损害评审公正性。专家建议暂停LLMs作为审稿工具，并引入检测工具和问责机制，以维护学术评审的公平性和严谨性。

🎯

❓

大语言模型在学术同行评审中存在操控、偏见和幻觉等风险，可能影响评审的公正性和可靠性。

研究者建议暂停大语言模型的替代性使用，引入检测工具和问责机制，并将其作为辅助工具使用。

作者可以通过在文章中插入微小的指令性文字，操控大语言模型生成有利的审稿意见，从而提高论文评分。

大语言模型对文章长度和著名作者及机构存在偏好，可能导致评审不公正。

幻觉问题指的是大语言模型可能对空白文章生成虚构的审稿意见，影响评审质量。

大语言模型的使用可能加剧学术评价体系中的不公平问题，影响科研环境的可信度。

🏷️

什么是 AI 对话开发？AI 对话开发有什么用途？(2026 完整指南)
AI对话开发结合语音识别、大语言模型和语音合成，能够与用户自然交流，广泛应用于智能客服、AI陪伴和在线教育等领域。与传统聊天机器人不同，AI对话能够理解上...
“一句话做游戏”的AI时代，怎么才能搓出「漂亮」的游戏？
打开电梯，到达muShanghai现场的时候，我首先注意到的是一块贴满了便笺的展板。上面有用多国语言写下的留言，其中有一条写着“Stop making u...
在Vibe编码时代使OWASP前十名更具影响力
2025年OWASP前十名更新将重点从“过时组件”转向软件供应链安全，新增内存安全和“vibe编码”意识项，反映了开发者和网络应用安全领域对关键安全风险的共识。
Mavrix在劳德代尔堡设立美国新总部
Mavrix在佛罗里达州劳德代尔堡设立美国总部，标志着其拓展北美市场的重要一步。该公司专注于数据采集和调研，预计2026年同比增长超过25%。新总部将推动...
与TorchRec KeyedJaggedTensor的同步
推荐系统中的稀疏特征用于建模用户偏好和物品特性，但存在输入数据长度不一和内存浪费的问题。TorchRec的KeyedJaggedTensor通过合并稀疏特...
SuperX首个美国AI推理云中心在丹佛投入运营
(全球TMT 2026年06月05日讯)全栈式AI基础设施解决方案提供商SuperX AI Technolog […]