字符查询:基于 Transformer 的在线手写字符分割方法

💡 原文中文,约400字,阅读约需1分钟。
📝

内容提要

在线手写字符分割与识别紧密关联,但仅通过识别模型定位相关位置通常无法产生精确的分割。该研究通过基于Transformer的架构,使用学得的字符查询形成每个簇,实现字符分割。通过对两个在线手写数据集的评估,证明该方法达到了最佳效果。

🎯

关键要点

  • 在线手写字符分割与手写识别紧密关联。
  • 仅通过识别模型定位相关位置通常无法产生精确的分割。
  • 研究将分割与识别解耦,使得分割结果能进一步被利用。
  • 专注于已知转录的情况,将字符分割视为笔迹轨迹的采样点与文本中字符的匹配问题。
  • 受 $k$-means 聚类算法启发,从簇分配的角度提出了一种基于 Transformer 的架构。
  • 在 Transformer 解码器块中使用学得的字符查询形成每个簇。
  • 为评估方法质量,创建了两个在线手写数据集的字符分割真值。
  • 对多个方法进行了评估,证明该方法达到了最佳的整体效果。
➡️

继续阅读