字符查询:基于 Transformer 的在线手写字符分割方法

原文约400字,阅读约需1分钟。发表于:

在线手写字符分割与手写识别紧密关联,但仅通过识别模型定位相关位置通常无法产生精确的分割。我们将分割与识别解耦,使得分割结果能进一步被利用。我们专注于已知转录的情况,此时字符分割变成了笔迹轨迹的采样点与文本中字符的匹配问题。受 $k$-means 聚类算法启发,我们从簇分配的角度看待它,并提出了一种基于 Transformer 的架构,在 Transformer 解码器块中使用学得的字符查询形成每个簇。为了评估我们方法的质量,我们为两个流行的在线手写数据集 IAM-OnDB 和 HANDS-VNOnDB 创建了字符分割的真值,并对它们进行了多种方法的评估,证明我们的方法达到了最佳的整体效果。

在线手写字符分割与识别紧密关联,但仅通过识别模型定位相关位置通常无法产生精确的分割。该研究通过基于Transformer的架构,使用学得的字符查询形成每个簇,实现字符分割。通过对两个在线手写数据集的评估,证明该方法达到了最佳效果。

相关推荐 去reddit讨论