爪哇语依存分析的跨语言迁移学习

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

本文提出了一种生成模型,通过结构化的正则先验利用标记源数据和未标记目标数据联合学习源模型和目标模型的参数来解决跨语言迁移的问题。该方法在10种语言中相较于使用最先进的判别模型的直接转移方法,在词性标注和依赖分析方面分别获得了平均5.2%和8.3%的绝对改善。

🎯

关键要点

  • 提出了一种生成模型,通过结构化的正则先验解决跨语言迁移问题。
  • 利用标记源数据和未标记目标数据联合学习源模型和目标模型的参数。
  • 使用可逆投影学习新的公共嵌入空间,以补偿不完美的跨语言词嵌入输入。
  • 在10种语言中进行评估,使用英语作为唯一源语料库。
  • 相较于最先进的判别模型的直接转移方法,在词性标注和依赖分析方面分别获得了平均5.2%和8.3%的绝对改善。
➡️

继续阅读