Ngambay - 法语神经机器翻译 (sba-Fr)

💡 原文中文,约200字,阅读约需1分钟。
📝

内容提要

该研究构建了第一个sba-Fr数据集,优化了三个预训练模型,结果显示M2M100模型在原始和合成数据上都取得了较高BLEU分数。该数据集可用于研究目的。

🎯

关键要点

  • 该研究聚焦于低资源语言,特别是尼日尔的低资源语言。
  • 制定了有效的数据收集方法。
  • 构建了第一个 sba-Fr 数据集。
  • 对三个预训练模型进行了优化。
  • M2M100 模型在原始数据和原始 + 合成数据上取得了较高的 BLEU 分数。
  • 该公开数据集可用于研究目的。
➡️

继续阅读