从小语料库测量语法多样性:派生熵率、发话平均长度与注释不变性

💡 原文英文,约100词,阅读约需1分钟。
📝

内容提要

本研究提出派生熵率,解决小语料库中语法结构多样性估计的问题,揭示发话平均长度与语法复杂性之间的关系,对自然语言处理和人类语言处理具有重要意义。

🎯

关键要点

  • 本研究提出派生熵率,解决小语料库中语法结构多样性估计的问题。
  • 派生熵率是一种新测量指标,揭示发话平均长度与语法复杂性之间的基本联系。
  • 研究表明,发话平均长度(MLU)不仅是代理指标,还能帮助更好地理解语法多样性。
  • 研究结果对自然语言处理和人类语言处理具有重要影响。
➡️

继续阅读