DriveThru:印尼地方语言档案的文档提取平台和基准数据集

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

本研究提出DriveThru平台,利用光学字符识别技术数字化印尼地方语言文档,提升字符和词汇的准确率,解决自然语言处理中的代表性不足问题,具有广泛的应用潜力。

🎯

关键要点

  • 本研究提出DriveThru平台,旨在解决印尼地方语言在自然语言处理中的代表性不足问题。
  • DriveThru平台利用光学字符识别技术对印刷文档进行数字化。
  • 该平台能够减少人工成本,提高数据集构建的规模化能力。
  • 研究表明DriveThru平台显著提高了字符和词汇的准确率。
  • DriveThru平台具有广泛的应用潜力。
➡️

继续阅读