Sortformer:通过时间戳与标记的桥接实现说话人分离与自动语音识别的无缝整合

BriefGPT - AI 论文速递 BriefGPT - AI 论文速递 ·

本研究提出了Sortformer神经模型,用于解决说话人分离中的排列问题。该模型采用了不同的训练目标,并引入了Sort Loss方法来改善排列解决能力。实验证明Sortformer在多说话人自动语音识别架构中表现出显著的性能提升。

原文中文,约2400字,阅读约需6分钟。
阅读原文