IrokoBench:大型语言模型时代的非洲语言新基准
💡
原文中文,约500字,阅读约需2分钟。
📝
内容提要
最新研究发现,大型语言模型在非洲语言上的性能较差,与英语等高资源语言相比存在较大差距。GPT-4在分类任务上表现平均,但在机器翻译等生成任务上表现糟糕。mT0在非洲语言上的跨语言问答表现最佳。研究呼吁确保非洲语言在大型语言模型中得到很好的代表。
🎯
关键要点
- 大型语言模型在非洲语言上的性能较差,与高资源语言如英语相比存在显著差距。
- 研究分析了mT0、LLaMa 2和GPT-4在30种非洲语言上的表现。
- 所有大型语言模型在非洲语言的表现均低于预期,尤其是在生成任务上表现糟糕。
- GPT-4在分类任务上表现平均,但在机器翻译等生成任务上表现不佳。
- mT0在非洲语言的跨语言问答任务中表现最佳,超越了微调的mT5和GPT-4。
- LLaMa 2由于多语言能力有限和以英语为中心的预训练,表现最差。
- 研究呼吁确保非洲语言在大型语言模型中得到良好代表,以适应其日益增长的应用。
➡️