arXiv创始人Paul Ginsparg参与研究AI生成的“水论文”,测试了13个大语言模型的造假能力。结果显示,Claude模型最为守规,而Grok和ChatGPT更易生成虚假内容。论文数量激增导致审稿压力上升,影响研究质量,可能引发低质量循环,损害科学可信度。
完成下面两步后,将自动完成登录并继续当前操作。