本文探讨了意大利KIParla语料库树库的初步设计,填补了口语意大利语树库的研究空白,提出了创新设计方法,对后续语言分析和应用具有重要意义。
本研究通过为KIParla语料库构建普遍依赖树库,填补了意大利语资源的空白,丰富了口语意大利语的语言资源,为语言学研究提供了新视角。
本文介绍了IMPACT-es西班牙语语料库及其词汇表,包含800万个单词和多种变体。研究探讨了低资源语言的形态标记器模型、神经网络在标注中的应用,以及Latin BERT模型在拉丁语言处理中的表现。此外,提出了动态嵌入式主题模型和LEMMING模块化模型,展示了在多种语言中的标注准确性和性能改进。
本文探讨了使用通用依赖(UD)分析推文的挑战,提出了扩展UD指南以适应推文结构的方案,并构建了相应的解析系统。研究还介绍了多个语言的树库和依存解析器的开发,展示了迁移学习在低资源语言中的应用效果,提升了模型的准确性。
本文介绍了分析推特的问题,提出扩展UD指南覆盖特殊结构,使用Tweet Treebank v2解决标注歧义,并构建解析为UD的系统。还验证了精简解析器集合的新方法。
该文介绍了一种利用AMR树库进行研究的抽象摘要框架,具有数据驱动、可训练性和不特定于特定领域的特点,并在实验中取得了有希望的结果。
完成下面两步后,将自动完成登录并继续当前操作。