本研究探讨了多语言后期培训中跨语言转移的动态性,发现其表现受多种因素的综合影响,而非单一变量。主要发现是有效跨语言转移的实际条件。
本研究探讨古典汉语在处理韩国和日本历史文档时的跨语言转移效用,质疑其有效性,发现支持作用有限,强调需进行实证验证。
本文研究了多语言神经语言模型的跨语言转移能力,发现词嵌入对齐和语言特征显著影响翻译效果。通过调整语言特征和对齐方式,提出了一种统一输出空间的预训练方法,以提升模型在不同语言间的迁移性能。
本文探讨了新闻推荐中的少样本问题,提出了一种跨语言转移模型,通过共享词汇表和多语言句子表示架构,提升了不同语言间的用户-新闻偏好转移效果。研究显示,该模型在无监督领域自适应和跨语言句子嵌入方面的应用,性能显著优于基线方法。
本文分析了多语言转换在零射击跨语言场景中的局限性,指出在资源匮乏情况下跨语言转移效果不佳。实验确认源语言与目标语言的相似度及预训练语料库大小与转移性能相关。研究表明,细调源语言后再微调目标语言的few-shot transfer方法有效,并探讨了多语言神经机器翻译模型的零样本翻译问题,提出改进方法并取得显著效果。
本文提出了一种名为WikiTransfer的通用方法,通过微调预训练模型实现摘要生成,并利用数据扩增和正则化提高性能。研究解决了零样本跨语言转移中中文输出质量低的问题,实验表明该方法显著提升了ROUGE-L分数并减少了翻译错误。
本文介绍了一种多任务学习的神经检索模型M3-Embedding,支持100多种语言,能够有效处理多种检索任务。该模型在多个基准测试中表现优异,采用自知识蒸馏方法提升训练质量,并提出的多跳密集检索方法在开放域问题上取得了先进性能,展示了强大的跨语言转移能力。
本文介绍了IndicXNLI数据集,分析了11种印度语言的跨语言转移技术,研究了预训练模型、语言和输入类型对模型表现的影响。同时,介绍了IndicIRSuite和Indic-ColBERT等资源,以提升印度语言的神经信息检索性能。通过机器翻译和多语言模型的研究,探讨了大型语言模型在印度语言翻译中的能力,推动了相关研究的发展。
通过机器翻译和多语言模型进行跨语言转移,特别是对低资源语言的翻译,往返翻译和添加高资源语言的翻译可提高效果。针对不受机器翻译系统支持的语言,提出了有效的基于翻译的跨语言转移策略。使用目标语言校验数据进行模型选择更好。希望促进可靠的基准线方法在跨语言转移研究中的应用。
本研究通过比较英语作为第二语言文本的结构特征和母语语言的类型学特征,证明了语言相似性可以跨语言转移。研究发现,可以直接从ESL文本中恢复母语类型学相似性结构,并预测目标语言的类型学特征。该方法在类型学预测任务上取得了72.2%的准确度,与依赖类型学资源的方法相当。
本文研究了阅读文本时眼动的影响和多语言模型对跨语言转移的使用。作者使用眼动模式和多语言模型成功预测了13种语言的模式,并量化了模型对结构复杂性的敏感性。结果表明,模型整合了跨语言之间的差异,并捕捉到了更复杂的结构信息。
该研究比较了不同文本表示模式的语言模型,发现基于图像的模型在跨语言转移中表现出色,基于分词的模型在偏向于词义的任务中表现优越,具有字符级别关注的模型在依赖解析任务中胜过其他模型。提出了一个建议方案,以指导根据任务和语言要求进行模型选择。
本研究提出了一种以模型为导向的跨语言转移方法,通过使用两种语言之间的子网络相似性作为预测语言兼容性的代理方法,进一步提高了效能。实验证明该方法在多样性任务上优于其他基准模型,并能有效对零样本 XLT 进行排名。同时,研究还对子网络在 XLT 预测中的实用性进行了广泛的分析。
该文提出了一种利用对比学习进行多语言语音和声音表示学习的新框架,旨在实现多语言共享表示,以促进跨语言转移。该方法在情感识别、音频分类和检索基准测试中展示了最先进的性能,为获得跨语言和声学条件下的共享和泛化语音表示提供了一种有效的方法。
该研究比较了不同文本表示模式的语言模型在跨语言转移中的表现,提出了一个建议方案,以指导根据任务和语言要求进行模型选择。
本文研究了机器翻译中适配器的组成方法,提出了新的组合方式以解决缺失语言问题,实现跨语言转移,提高翻译效果。
本研究比较了ByT5和mT5序列模型在多语种语义分析数据集上的表现。实验结果显示,通过使用最新的标签投影方法,机器翻译示例的精确度显著提高。ByT5在跨语言转移和参数大小方面相对于mT5有优势。
完成下面两步后,将自动完成登录并继续当前操作。