多语言非重复依赖树库:理解 LLMs 如何表示和处理句法结构

我们介绍了 SPUD(语义扰动通用依赖语法)框架,用于创建多语言通用依赖语料库的一次性树库。我们创建了阿拉伯语、英语、法语、德语和俄语的一次性数据,并展示了 SPUD 树库的两个用例。

本文介绍了分析推特的问题,提出扩展UD指南覆盖特殊结构,使用Tweet Treebank v2解决标注歧义,并构建解析为UD的系统。还验证了精简解析器集合的新方法。

原文中文,约200字,阅读约需1分钟。发表于:
阅读原文