基于深度学习的孟加拉标牌地址信息的检测、识别和解析
💡
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本研究使用BaDLAD数据集和Mask R-CNN模型,通过文档布局分析(DLA)解决了理解孟加拉语文档的问题。调整超参数后,模型的Dice分数达到了0.889。然而,对英文文档训练的模型不适用于孟加拉语。DL Sprint 2.0方案的解决方案公开可用,链接位于https URL。
🎯
关键要点
- 本研究使用BaDLAD数据集和Mask R-CNN模型解决理解孟加拉语文档的问题。
- 通过调整超参数,模型的Dice分数达到了0.889。
- 对英文文档训练的模型不适用于孟加拉语,显示每种语言的挑战。
- DL Sprint 2.0方案的解决方案公开可用,包含笔记本、权重和推断笔记本。
➡️