小红花·文摘

该研究提出了一种新的框架，可以同时处理文字检测和识别，通过联合培训，在两个数据集上实现了最先进的检测性能和表现提高。

SwinTextSpotter v2：场景文字识别的协同优化

BriefGPT - AI 论文速递 ·

本文介绍了如何利用视频字幕识别中的文字检测与识别模型，增加预训练Bert进行纠错，提高OCR的准确性。同时介绍了如何使用ModelBox Windows SDK进行开发，包括下载模板、创建工程、查看流程图、核心逻辑和三方依赖库等。最后，介绍了如何在项目目录下执行main.bat运行应用，并在data目录下运行test_http.py脚本进行测试。

基于OCR进行Bert独立语义纠错实践

华为云官方博客 ·