小红花·文摘

本文介绍了针对濒危语言Kakataibo建立Universal Dependencies treebank的方法，探讨了词性标记和句法依存分析的实现。同时，研究了东南亚语言的NLP评估工具BHASA及其在文化表达方面的不足。此外，提出了“MiChao-HuaFen 1.0”数据集，以支持中文领域的深度学习研究，并介绍了SEACrowd项目，旨在提升东南亚语言的AI模型质量。

从LIMA到DeepLIMA：开启互操作性的新路径

BriefGPT - AI 论文速递 ·

本文探讨了使用Universal Dependencies分析推文的问题，提出扩展UD指南以适应推文特有结构，并构建了解析流水线系统。研究还提出了无监督解析方法和双重分解学习策略，提升了多语言解析效果，展示了在不同条件下的有效性和鲁棒性。

无监督通用依存树聚合的实证分析

BriefGPT - AI 论文速递 ·