增强复杂公式识别的层次细节聚焦网络
原文中文,约400字,阅读约需1分钟。发表于: 。该研究针对层次和复杂数学表达式识别中存在的多种可能解释问题,提出了层次细节聚焦识别数据集(HDR),这是第一个专门设计用于解决这些问题的数据集。研究者引入的层次细节聚焦识别网络(HDNet)通过精准处理公式细节,显著提升了数学表达式识别的性能,实验结果表明其在各类数据集上均优于现有模型。
本文介绍了一种数据为中心的方法来克服印刷数学表达式识别中的问题,并通过实验结果证明了其有效性。主要贡献是增强LaTeX规范化,将任何LaTeX数学表达式映射到规范形式。还介绍了改进版的基准数据集im2latex-100k和实际论文中提取的数学表达式数据集realFormula。开发的数学表达式识别模型MathNet在四个测试集上表现出优越结果,比之前的技术高出88.3%。