小红花·文摘

研究发现多语言预训练语言模型一致性存在差异，提出了基于排名的一致性评估指标，并分析了一致性决定因素。结果显示增加模型规模可以提高大多数语言的事实检测准确性，但无法改善跨语言一致性。案例研究表明，新的知识仅传递给与英语具有较高排名一致性得分的语言。