CMFN: 跨模态融合网络用于不规则场景文字识别
原文中文,约300字,阅读约需1分钟。发表于: 。提出了一种新颖的交叉模态融合网络(CMFN),用于不规则场景文本识别,将视觉线索融入语义挖掘过程中,实验证明该算法在性能上与最先进的算法相当,验证了其有效性。
本文介绍了一种新的跨模态突出片段增强对齐网络,通过降低非重要图片和文本片段的参与度,提高对重要片段的对齐相似性,从而实现改进的检索准确性。实验结果显示,该方法在 rSum 度量上的表现超过了现有方法约 5% 至 10%。
提出了一种新颖的交叉模态融合网络(CMFN),用于不规则场景文本识别,将视觉线索融入语义挖掘过程中,实验证明该算法在性能上与最先进的算法相当,验证了其有效性。
本文介绍了一种新的跨模态突出片段增强对齐网络,通过降低非重要图片和文本片段的参与度,提高对重要片段的对齐相似性,从而实现改进的检索准确性。实验结果显示,该方法在 rSum 度量上的表现超过了现有方法约 5% 至 10%。