本研究探讨了掩盖生成模型与非自回归模型的关系,提出了“离散插值”框架,展示了其在视觉领域的可扩展性,并在多个基准测试中表现出竞争力。
通过预训练、知识蒸馏和非自回归训练技术,基于CTC的非自回归模型在直接语音到语音翻译中实现了与自回归模型相当的翻译质量,并提升了26.81倍的解码速度。
完成下面两步后,将自动完成登录并继续当前操作。