Detecting Document-Level Paraphrased Machine-Generated Content: Mimicking Human Writing Style and Incorporating Discourse Features

💡 原文英文,约100词,阅读约需1分钟。
📝

内容提要

该研究提出了一种新方法和数据集,以解决现有机器生成内容检测器在同义改写文本处理中的不足。通过使用MhBART和DTransformer模型,结合人类写作风格和语篇分析,显著提高了检测性能。

🎯

关键要点

  • 该研究旨在解决现有机器生成内容检测器在处理同义改写文本时的不足。
  • 提出了新的方法和数据集,包括MhBART模型和DTransformer模型。
  • 研究重点在于模仿人类写作风格并结合语篇分析。
  • 检测性能显著提高,在paraLFQA和paraWP数据集上分别实现了15.5%和4%的绝对提高。
➡️

继续阅读