小红花·文摘

研究发现，预训练语言模型具有学习词汇和子词令牌内部字符构成的能力，能正确拼写三分之一的词汇，并在所有令牌类型上具有高重叠度。额外的字符信息对子词模型的训练没有提高语言建模性能。研究表明，语言建模目标能激励模型隐式学习拼写知识，而显式教授拼写知识不能提高性能。