从小语料库测量语法多样性:派生熵率、发话平均长度与注释不变性
💡
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本研究提出派生熵率,解决小语料库中语法结构多样性估计的问题,揭示发话平均长度与语法复杂性之间的关系,对自然语言处理和人类语言处理具有重要意义。
🎯
关键要点
- 本研究提出派生熵率,解决小语料库中语法结构多样性估计的问题。
- 派生熵率是一种新测量指标,揭示发话平均长度与语法复杂性之间的基本联系。
- 研究表明,发话平均长度(MLU)不仅是代理指标,还能帮助更好地理解语法多样性。
- 研究结果对自然语言处理和人类语言处理具有重要影响。
➡️