本文介绍了一种新的跨模态融合技术,用于自动语音识别中的错误校正。该方法利用声学信息和外部语言表示生成准确的语音转录上下文,并通过多样的ASR数据集评估,相对提高了37.66%的错误率性能。作者还开源了代码和预训练模型。
完成下面两步后,将自动完成登录并继续当前操作。