An Annotated Dataset of Errors in Ancient Greek Texts and Baselines for Detection

💡 原文英文,约100词,阅读约需1分钟。
📝

内容提要

本研究创建了首个古代希腊文本错误的数据集,填补了错误检测的空白。通过BERT生成数据集并提出新检测方法,准确率提高了5%。该数据集为学者开发更高效的错误检测算法提供了基准。

🎯

关键要点

  • 本研究创建了首个古代希腊文本错误的数据集,填补了错误检测的空白。
  • 研究采用BERT条件采样生成数据集,并提出了一种基于判别器的新检测方法。
  • 新检测方法在识别真实错误时的准确率提高了5%。
  • 该数据集为学者开发更高效的错误检测算法提供了基准。
➡️

继续阅读