当哪些话语标记影响计算语义理解?
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
本文介绍了一个包含445篇文档的语料库,其中包含约27,000个从句。该语料库注释了语义从句类型和相关关系,以便对人工和自然语篇模式进行比较。通过初步证据,展示了该语料库对于生成文本的详细话语分析的有用性。较少数量、更短和更不连贯的从句关系与计算机生成的叙述和论述的较低感知质量相关。
🎯
关键要点
- 本文介绍了一个包含445篇文档的语料库,包含约27,000个从句。
- 该语料库注释了语义从句类型和相关关系,以便比较人工和自然语篇模式。
- 语料库涵盖正式和非正式的话语,包括使用Fine-tuned GPT-2和GPT-3生成的文档。
- 初步证据表明,该语料库对生成文本的详细话语分析具有实用性。
- 较少数量、更短和更不连贯的从句关系与计算机生成的叙述和论述的较低感知质量相关。
➡️