C# OpenCvSharp DNN 实现百度网盘AI大赛-表格检测第2名方案第三部分-表格方向识别...
💡
原文中文,约5100字,阅读约需13分钟。
📝
内容提要
该方案为百度网盘AI大赛表格检测的第二名方案,采用ppyoloe-plus-x进行边界框检测,使用DBNet进行语义分割,并通过PP-LCNet预测表格方向,实现高效的表格检测与识别。
🎯
关键要点
- 该方案为百度网盘AI大赛表格检测的第二名方案。
- 算法包含表格边界框检测、表格分割和表格方向识别三个部分。
- ppyoloe-plus-x用于边界框预测,裁剪高置信度的表格边界框。
- 裁剪后的表格实例送入DBNet进行语义分割,获得表格关键点。
- 根据DBNet计算的关键点绘制表格边界。
- PP-LCNet结合表格边界先验和实例图像预测表格方向。
- 使用C# OpenCvSharp DNN实现表格方向识别、边界框检测和表格分割。
- 模型输入为Float[-1, 3, 624, 624],输出为Float[-1, 4]。
- 推理过程中记录推理耗时并输出语义左上角与几何左上角的对应关系。
❓
延伸问答
该方案在百度网盘AI大赛中获得了什么名次?
该方案获得了第二名。
该方案使用了哪些算法进行表格检测?
该方案使用了ppyoloe-plus-x进行边界框检测,DBNet进行语义分割,以及PP-LCNet进行表格方向预测。
如何实现表格的方向识别?
通过PP-LCNet结合表格边界先验和实例图像来预测表格方向。
模型的输入和输出格式是什么?
模型输入为Float[-1, 3, 624, 624],输出为Float[-1, 4]。
DBNet在该方案中起到了什么作用?
DBNet用于对裁剪后的表格实例进行语义分割,获得表格的关键点。
推理过程中如何记录推理耗时?
推理过程中通过记录开始和结束时间来计算推理耗时。
➡️