研究发现多语言预训练语言模型一致性存在差异,提出了基于排名的一致性评估指标,并分析了一致性决定因素。结果显示增加模型规模可以提高大多数语言的事实检测准确性,但无法改善跨语言一致性。案例研究表明,新的知识仅传递给与英语具有较高排名一致性得分的语言。
完成下面两步后,将自动完成登录并继续当前操作。