儿童保育者对话中的语法准确性自动标注
原文中文,约300字,阅读约需1分钟。发表于: 。通过自动标注工具对上千个关于儿童和照顾者对话的语料进行了上下文相关语法的编码和标注,并通过训练和评估一系列基于 Transformer 的 NLP 模型表明,在儿童语法中,细调的 Transformer 模型表现最佳,达到了人类间标注一致性水平,从而在研究儿童语言习得方面应用了现有最先进的 NLP 方法。
本论文使用动态句法语法和CHILDES语料库开发了一个概率模型,用于增量生成纯语义生成目标概念。模型输出与黄金候选项准确匹配率为78%,ROUGE-l评分为0.86。模型在85%的情况下能够正确生成自我修复。结果显示基于语法的模型具有泛化能力,为更可控和自然交互的对话型人工智能系统奠定了基础。