长不一定更强:用于增强语音识别和翻译的断续长序列训练
原文中文,约300字,阅读约需1分钟。发表于: 。本文解决了传统语音识别和翻译任务中短句训练的局限,提出了利用完整标点和大小写的长句训练新方法。通过使用FastConformer架构,我们在提高标点和大小写准确率方面取得了显著进展,并在Earnings-21和Earnings-22基准上实现了25%相对词错误率的改善。这一方法的潜在影响在于提升了语音识别和翻译的整体准确性。
本文介绍了一种使用完整标点和大小写的长句训练新方法,通过FastConformer架构在标点和大小写准确率方面取得了显著进展,并在Earnings-21和Earnings-22基准上实现了25%相对词错误率的改善。该方法有望提高语音识别和翻译的准确性。