本研究提出了一种端到端的语音语义编码器方法,用于解决广播新闻领域中传统话题切分方法的局限性。通过建立一个包含约1000小时多语言录音的新基准数据集,研究展示了改进的模型在不同语言环境中的有效性,其端到端模型在精确度上超越了传统方法,具有更好的跨域性能。
完成下面两步后,将自动完成登录并继续当前操作。