本研究提出了一种新方法,通过反向翻译自然语言代码切换句子并微调大语言模型,提升生成能力。结果显示文本流畅性良好,但评估指标与人类判断存在不一致。
本研究建立了EuskañolDS语料库,解决了巴斯克语与西班牙语之间代码切换的数据不足问题,为理解和生成代码切换语言奠定基础。
本研究提出了BreezyVoice,一个针对台湾普通话多音字消歧的文本转语音系统,结合先进语言模型,优化语音生成,尤其在代码切换环境中表现突出。
本研究探讨了阿拉伯地区的多语言和代码切换现象对自然语言处理技术的影响,分析了当前研究进展、面临的挑战及未来方向,强调了发展针对代码切换的阿拉伯语自然语言处理技术的重要性。
本研究探讨了自动语音识别中的代码切换挑战,指出现有评估指标的局限性,提出了“兴趣点错误率(PIER)”作为新指标,以更准确地评估代码切换性能,显示出改进潜力。
本文介绍了CAFE,这是首个阿尔及利亚方言、法语和英语之间的代码切换数据集。该数据集通过捕捉自发对话中的代码切换,展示了高效数据处理技术对自动语音识别模型性能的显著提升。
本研究提出了EZSwitch框架,解决自然语言处理中的代码切换问题。该框架结合等效约束理论与大型语言模型,生成高质量的代码切换文本,优于基准模型,并创建了CSPref数据集以验证模型性能。
本研究提出了一种新的代码切换翻译方法,以提高医疗术语翻译的准确性。尽管流利度有所下降,但医疗专业人士更倾向于这种方法,显示其提升医疗翻译质量的潜力。
本研究提出了一种创新方法,解决阿拉伯语和英语代码切换中的命名实体识别问题。通过创建首个相关注释语料库并应用先进技术,显著提升了处理代码切换数据的性能,推动了阿拉伯语自然语言处理的发展。
该研究使用机器翻译和自动语音识别系统,探索了埃及阿拉伯语和英语的代码切换现象,并提供了开发这些系统的方法学。研究实验了Whisper模型在埃及阿拉伯语识别中的应用,并取得了显著提高。自动语音识别系统对于处理代码切换现象至关重要,对于实现无缝交流也很重要。
该文介绍了一个新的零资源代码切换语音基准,用于评估自我监督语音编码器的代码切换能力。实验包括多种知名的语音编码器,研究了预训练语言和模型大小对基准性能的影响。结果表明,多语言预训练的语音编码器优于单语变体,但仍有改进空间。
完成下面两步后,将自动完成登录并继续当前操作。