语言建模的社会语言学基础
📝
内容提要
本文介绍了语言建模的社会语言学视角,论述了大规模语言模型本质上是语言的各种变体,并探讨了该视角如何在语言建模的开发和应用中发挥作用。我们首先提出了社会语言学中对语言变体的概念的技术定义,然后讨论了这一视角如何帮助解决语言建模中的五个基本挑战:社会偏见、领域适应、对齐、语言变化和规模。最终,我们认为为了最大程度地提高大规模语言模型的性能和社会价值,需要精确定义和编制能够准确代表正在建模的特定语...
🏷️
标签
➡️