预训练的多语言编码器在无监督文档级和句子级交叉语言信息检索方面性能不如基于跨语言单词嵌入的模型。经过监督学习优化后,在句子检索中取得最高准确率,并通过局部相关性匹配和对特定领域对比微调等方法提升排名质量。基于单语数据训练的检索模型存在“单语过度拟合”的现象,与针对特定目标语言的单语信息检索的交叉语言转移存在差异。
正在访问的资源需要验证您是否真人。
或在微信中搜索公众号“小红花技术领袖”并关注
第二步:在公众号对话中发送验证码: