本文提出了一种以数据为中心的方法,改进了数学表达式识别技术。主要贡献包括增强LaTeX规范化、开发新数据集im2latex-100k和realFormula,以及基于卷积视觉变换器的模型MathNet,其识别性能优于现有技术。此外,还介绍了其他创新方法和数据集,推动了手写数学表达式识别的研究。
完成下面两步后,将自动完成登录并继续当前操作。