BriefGPT - AI 论文速递 ·

NAMER：手写数学表达识别的非自回归建模

💡 原文中文，约1500字，阅读约需4分钟。

📝

内容提要

本文提出了一种基于编码器-解码器网络的手写数学表达式识别方法，结合语法规则和双向上下文信息，显著提高了识别性能。实验结果表明，该方法在多个数据集上优于现有技术，并创建了包含10万个手写表达式的公开数据集。

🎯

提出了一种基于编码器-解码器网络的手写数学表达式识别方法，结合语法规则和双向上下文信息。
该方法通过将标记序列预测建模为树遍历过程，有效描述表达式的语法上下文，减轻结构预测误差。
实验结果显示，该方法在多个数据集上优于现有技术，特别是在CROHME 2014、2016、2019和HME100K数据集上取得了最新的最优结果。
创建了一个包含10万个手写数学表达式的公开数据集，并将源代码、新数据集和预训练模型公开。
提出了Mirror-Flipped Symbol Layout Tree和Bidirectional Asynchronous Training结构，扩展了双向训练策略以更有效地利用双向信息。
引入了Shared Language Modeling机制，提高模型的鲁棒性和泛化能力。
智能检测网络利用物体检测技术，能够精确检测符号和数字，优于传统编码器-解码器方法。
语义交互学习方法通过构建基于统计符号共现概率的语义图，优化模型对符号关系的理解，提升识别性能。

❓

NAMER方法基于编码器-解码器网络，结合语法规则和双向上下文信息来提高手写数学表达式的识别性能。

NAMER在CROHME 2014、2016、2019和HME100K数据集上取得了最新的最优结果，优于现有技术。

研究创建了一个包含10万个手写数学表达式的公开数据集，并公开了源代码和预训练模型。

NAMER通过将标记序列预测建模为树遍历过程，有效描述表达式的语法上下文，从而减轻结构预测误差。

Mirror-Flipped Symbol Layout Tree用于扩展双向训练策略，以更有效地利用双向信息，提升模型性能。

智能检测网络利用物体检测技术，能够精确检测符号和数字，优于传统编码器-解码器方法。

🏷️