小红花·文摘

本文介绍了针对濒危语言Kakataibo建立Universal Dependencies treebank的方法，探讨了词性标记和句法依存分析的实现。同时，研究了东南亚语言的NLP评估工具BHASA及其在文化表达方面的不足。此外，提出了“MiChao-HuaFen 1.0”数据集，以支持中文领域的深度学习研究，并介绍了SEACrowd项目，旨在提升东南亚语言的AI模型质量。

从LIMA到DeepLIMA：开启互操作性的新路径

BriefGPT - AI 论文速递 ·

SeaEval是一个多语种基础模型的评估基准，研究了模型对自然语言的理解、推理能力以及对文化实践、细微差别和价值观的理解。研究发现模型在给予释义指令时表现出不同的行为，需要更具有泛化能力的语义表示和增强的多语种上下文化能力。

BHASA: 东南亚语言文化综合评估系统

BriefGPT - AI 论文速递 ·