本研究探讨了机器生成文本与人类撰写文本的辨识问题,并首次举办了学术论文真实性挑战。研究定义了任务、构建了数据集并建立了评估框架,参与团队展示了创新方法,最佳系统在英语和阿拉伯语上的F1分数超过0.98,显示出检测技术的显著进展。
完成下面两步后,将自动完成登录并继续当前操作。