MathWriting: 数学手写表达识别数据集

💡 原文中文,约200字,阅读约需1分钟。
📝

内容提要

本文提出了一种基于编码器-解码器网络的数学公式识别方法,通过加入语法规则和树遍历过程,减轻了结构预测误差。实验结果表明,该方法在三个基准数据集上取得了更好的识别性能。作者还创建了一个包含10万个手写数学表达式图像的大规模数据集,并公开了源代码、新数据集和预训练模型。

🎯

关键要点

  • 提出了一种基于编码器-解码器网络的数学公式识别方法。
  • 通过加入语法规则和树遍历过程,减轻了结构预测误差。
  • 实验结果显示该方法在三个基准数据集上取得了更好的识别性能。
  • 创建了一个包含10万个手写数学表达式图像的大规模数据集。
  • 公开了源代码、新数据集和预训练模型。
➡️

继续阅读