俄文语言最小对的评估基准:RuBLiMP
💡
原文中文,约400字,阅读约需1分钟。
📝
内容提要
该论文介绍了俄语语言最小对对比基准(RuBLiMP),包含45k对句子,利用开放文本语料库的自动注释句子筛选测试数据。对25种语言模型进行评估,发现俄语广泛使用的语言模型在形态和一致性方面较为敏感,但与人类相比存在差距。RuBLiMP、代码和其他材料可公开获取。
🎯
关键要点
- 论文介绍了俄语语言最小对对比基准(RuBLiMP),包含45k对句子。
- RuBLiMP利用开放文本语料库的自动注释句子筛选测试数据。
- 作者描述了数据收集协议,并展示了对25种语言模型的评估结果。
- 研究发现俄语语言模型在形态和一致性方面较为敏感,但与人类相比存在差距。
- RuBLiMP、代码和其他材料可公开获取。
➡️