本研究提出了一种统一的语音识别模型,解决了以往听觉、视觉和视听语音识别研究独立进行的问题。通过贪婪伪标签方法,利用未标记样本提升模型性能,最终在多个数据集上达到了最新技术水平。
完成下面两步后,将自动完成登录并继续当前操作。