小红花·文摘

本文介绍了一种新的跨模态融合技术，用于自动语音识别中的错误校正。该方法利用声学信息和外部语言表示生成准确的语音转录上下文，并通过多样的ASR数据集评估，相对提高了37.66%的错误率性能。作者还开源了代码和预训练模型。