字符查询:基于 Transformer 的在线手写字符分割方法
💡
原文中文,约400字,阅读约需1分钟。
📝
内容提要
在线手写字符分割与识别紧密关联,但仅通过识别模型定位相关位置通常无法产生精确的分割。该研究通过基于Transformer的架构,使用学得的字符查询形成每个簇,实现字符分割。通过对两个在线手写数据集的评估,证明该方法达到了最佳效果。
🎯
关键要点
- 在线手写字符分割与手写识别紧密关联。
- 仅通过识别模型定位相关位置通常无法产生精确的分割。
- 研究将分割与识别解耦,使得分割结果能进一步被利用。
- 专注于已知转录的情况,将字符分割视为笔迹轨迹的采样点与文本中字符的匹配问题。
- 受 $k$-means 聚类算法启发,从簇分配的角度提出了一种基于 Transformer 的架构。
- 在 Transformer 解码器块中使用学得的字符查询形成每个簇。
- 为评估方法质量,创建了两个在线手写数据集的字符分割真值。
- 对多个方法进行了评估,证明该方法达到了最佳的整体效果。
➡️