MathWriting: 数学手写表达识别数据集
💡
原文中文,约200字,阅读约需1分钟。
📝
内容提要
本文提出了一种基于编码器-解码器网络的数学公式识别方法,通过加入语法规则和树遍历过程,减轻了结构预测误差。实验结果表明,该方法在三个基准数据集上取得了更好的识别性能。作者还创建了一个包含10万个手写数学表达式图像的大规模数据集,并公开了源代码、新数据集和预训练模型。
🎯
关键要点
- 提出了一种基于编码器-解码器网络的数学公式识别方法。
- 通过加入语法规则和树遍历过程,减轻了结构预测误差。
- 实验结果显示该方法在三个基准数据集上取得了更好的识别性能。
- 创建了一个包含10万个手写数学表达式图像的大规模数据集。
- 公开了源代码、新数据集和预训练模型。
➡️