本研究针对非英语语言中的隐喻理解问题,开发了中文多模态隐喻广告数据集(CM3D),并提出了基于链式思维提示的隐喻映射识别模型(CPMMIM),显著提高了识别准确性,推动了隐喻理解的研究进展。
最近使用paddleocr框架训练识别模型,尝试添加center loss以提升形近字识别效果。为此,修改了配置文件,调整了ctc head和数据集设置,并在代码中添加了out_channels_list。最终成功导出center,但发现paddleocr在兼容性上存在问题,对新手不太友好。
在线手写字符分割与识别紧密关联,但仅通过识别模型定位相关位置通常无法产生精确的分割。该研究通过基于Transformer的架构,使用学得的字符查询形成每个簇,实现字符分割。通过对两个在线手写数据集的评估,证明该方法达到了最佳效果。
完成下面两步后,将自动完成登录并继续当前操作。