基于深度学习的孟加拉标牌地址信息的检测、识别和解析
原文中文,约400字,阅读约需1分钟。发表于: 。通过深度学习模型,我们提出了一个端到端系统来高效地检测、识别、校正和解析孟加拉语标牌上的地址信息,并设计了一种新颖的地址文本校正模型和孟加拉语地址文本解析器。
本研究使用BaDLAD数据集和Mask R-CNN模型,通过文档布局分析(DLA)解决了理解孟加拉语文档的问题。调整超参数后,模型的Dice分数达到了0.889。然而,对英文文档训练的模型不适用于孟加拉语。DL Sprint 2.0方案的解决方案公开可用,链接位于https URL。