本研究探讨了土耳其文本的自动标点和大小写纠正,比较了五种BERT模型的有效性,揭示了模型规模与文本可读性和准确性之间的关系,为选择合适模型提供了指导。
该研究使用LLM将长ASR转录分割成可独立翻译的片段,以提高翻译质量。LLM可适应包含ASR错误的转录,最佳的LLM在9个测试集中将平均BLEU提高了2.9个点。
完成下面两步后,将自动完成登录并继续当前操作。