本研究提出了一种语音表示净化与监督增强框架(SRPSE),有效消除音色和节奏等无关因素对语音转文本翻译的负面影响,显著提升翻译效果,尤其在无文本转录条件下表现优异。
完成下面两步后,将自动完成登录并继续当前操作。