该论文介绍了俄语语言最小对对比基准(RuBLiMP),包含45k对句子,利用开放文本语料库的自动注释句子筛选测试数据。对25种语言模型进行评估,发现俄语广泛使用的语言模型在形态和一致性方面较为敏感,但与人类相比存在差距。RuBLiMP、代码和其他材料可公开获取。
完成下面两步后,将自动完成登录并继续当前操作。