本研究针对吉尔吉斯语句法语料库开发的难题,提出了一种简化方法,开发了基于树库翻译的句法注释迁移工具。研究结果表明,该工具的准确性优于单语训练模型,为优化注释过程提供了新的评估方法。
本文探讨了意大利KIParla语料库树库的初步设计,填补了口语意大利语树库的研究空白,提出了创新设计方法,对后续语言分析和应用具有重要意义。
本研究推出了LuxBank,这是首个卢森堡语通用依赖树库,填补了该语言在句法标注方面的空白,并提供了标注指南和句法分析资源,支持拼写和语法检查工具的开发。
本研究通过为KIParla语料库构建普遍依赖树库,填补了意大利语资源的空白,丰富了口语意大利语的语言资源,为语言学研究提供了新视角。
LEMMING是一个模块化的对数线性模型,用于词形还原和标注,并支持任意全局特征的整合。它在六种语言的词形还原中表现出色,特别是捷克语,错误率降低了60%。联合建模词法标记和词元对彼此有益。
本文介绍了用 Universal Dependencies 分析 Tweets 的问题,提出了扩展 UD 指南来覆盖 Tweets 中的特殊结构以及使用新的 Tweet Treebank v2 来解决标注中的歧义,并构建了一个可以将原始 Tweets 解析为 UD 的流水线系统。作者还提出了一种新的方法来精简基于转换的解析器的集合,并在真实情况下验证了该方法的有效性。
本文介绍了分析推特的问题,提出扩展UD指南覆盖特殊结构,使用Tweet Treebank v2解决标注歧义,并构建解析为UD的系统。还验证了精简解析器集合的新方法。
该文介绍了一种利用AMR树库进行研究的抽象摘要框架,具有数据驱动、可训练性和不特定于特定领域的特点,并在实验中取得了有希望的结果。
完成下面两步后,将自动完成登录并继续当前操作。