本研究分析自发语音与脚本语音的分类,评估多种模型,发现基于变换器的模型在不同语言中优于传统特征模型,从而推动媒体推荐系统的改进。
该研究提出了解决自动语音识别模型在对话和自发语音中不流畅问题的方法,通过改进的连接时序分类算法,准确预测词级时间戳并分类对齐间隙,实现了81.62%的准确率和80.07%的F1分数。该方法在文本转录中具有潜力。
完成下面两步后,将自动完成登录并继续当前操作。