小红花·文摘

本研究提出了一种统一的语音识别模型，解决了以往听觉、视觉和视听语音识别研究独立进行的问题。通过贪婪伪标签方法，利用未标记样本提升模型性能，最终在多个数据集上达到了最新技术水平。