LLM-ForcedAligner是一种基于大语言模型的强制对齐方法,能够准确预测多语言语音的时间戳。该方法通过非自回归推理,解决了传统方法的时间偏移和计算速度慢的问题,支持最长5分钟的语音输入,并具备灵活的时间戳定义能力。实验结果表明,其在多语言场景下的表现优于其他方法。
完成下面两步后,将自动完成登录并继续当前操作。