Ngambay - 法语神经机器翻译 (sba-Fr)
💡
原文中文,约200字,阅读约需1分钟。
📝
内容提要
该研究构建了第一个sba-Fr数据集,优化了三个预训练模型,结果显示M2M100模型在原始和合成数据上都取得了较高BLEU分数。该数据集可用于研究目的。
🎯
关键要点
- 该研究聚焦于低资源语言,特别是尼日尔的低资源语言。
- 制定了有效的数据收集方法。
- 构建了第一个 sba-Fr 数据集。
- 对三个预训练模型进行了优化。
- M2M100 模型在原始数据和原始 + 合成数据上取得了较高的 BLEU 分数。
- 该公开数据集可用于研究目的。
➡️