小红花·文摘

本研究提出了一种端到端的语音语义编码器方法，用于解决广播新闻领域中传统话题切分方法的局限性。通过建立一个包含约1000小时多语言录音的新基准数据集，研究展示了改进的模型在不同语言环境中的有效性，其端到端模型在精确度上超越了传统方法，具有更好的跨域性能。