DriveThru:印尼地方语言档案的文档提取平台和基准数据集
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
本研究提出DriveThru平台,利用光学字符识别技术数字化印尼地方语言文档,提升字符和词汇的准确率,解决自然语言处理中的代表性不足问题,具有广泛的应用潜力。
🎯
关键要点
- 本研究提出DriveThru平台,旨在解决印尼地方语言在自然语言处理中的代表性不足问题。
- DriveThru平台利用光学字符识别技术对印刷文档进行数字化。
- 该平台能够减少人工成本,提高数据集构建的规模化能力。
- 研究表明DriveThru平台显著提高了字符和词汇的准确率。
- DriveThru平台具有广泛的应用潜力。
➡️