MathWriting: 数学手写表达识别数据集

💡 原文中文,约200字,阅读约需1分钟。
📝

内容提要

本文提出了一种基于编码器-解码器网络的数学公式识别方法,通过加入语法规则和树遍历过程,减轻了结构预测误差。实验结果表明,该方法在三个基准数据集上取得了更好的识别性能。作者还创建了一个包含10万个手写数学表达式图像的大规模数据集,并公开了源代码、新数据集和预训练模型。

🎯

关键要点

  • 提出了一种基于编码器-解码器网络的数学公式识别方法。

  • 通过加入语法规则和树遍历过程,减轻了结构预测误差。

  • 实验结果显示该方法在三个基准数据集上取得了更好的识别性能。

  • 创建了一个包含10万个手写数学表达式图像的大规模数据集。

  • 公开了源代码、新数据集和预训练模型。

➡️

继续阅读