文章介绍了一种新扩散模型,通过在连续语音表示空间进行前向扩散和在离散语音单位空间进行后向扩散,保留语义结构并结合两种模型。在无文本直接语音翻译任务中,该方法将解码步骤从500减少到50,并取得了相当的效果。
完成下面两步后,将自动完成登录并继续当前操作。