语言建模的社会语言学基础

📝

内容提要

本文介绍了语言建模的社会语言学视角,论述了大规模语言模型本质上是语言的各种变体,并探讨了该视角如何在语言建模的开发和应用中发挥作用。我们首先提出了社会语言学中对语言变体的概念的技术定义,然后讨论了这一视角如何帮助解决语言建模中的五个基本挑战:社会偏见、领域适应、对齐、语言变化和规模。最终,我们认为为了最大程度地提高大规模语言模型的性能和社会价值,需要精确定义和编制能够准确代表正在建模的特定语...

🏷️

标签

➡️

继续阅读