多语言非事实类问答与银答案
原文中文,约400字,阅读约需1分钟。发表于: 。本研究解决了低资源语言在非事实类问答数据集方面的不足,提出了MuNfQuAD,一个拥有38种语言的多语言非事实类问答数据集。través de对790个问答对的手动标注,发现98%问题可以用对应的银答案进行回答,且我们改良的答案段落选择模型在测试集中表现优异,达到80%的准确率与72%的宏F1值,显示出该工作对多语言问答的潜在影响。
为了评估大型语言模型在非英语语言上的问题回答能力,研究人员引入了Indic-QA数据集,包括11种主要印度语言的问题回答任务。他们发现多语言模型的性能相对较低,特别是对于低资源语言。该数据集的发布将促进对大型语言模型在低资源语言上的进一步研究。