小红花·文摘 - 小红花技术领袖俱乐部

IberBench：西班牙语、葡萄牙语、加泰罗尼亚语、巴斯克语和加利西亚语大型语言模型评估基准

IberBench：西班牙语、葡萄牙语、加泰罗尼亚语、巴斯克语和加利西亚语大型语言模型评估基准

DEV Community ·

本研究探讨了单语言模型在加泰罗尼亚语中的优越性，证明其在数据充足时效果优于多语言模型。介绍了多语言模型的能力与局限性，并提出了针对低资源语言的新模型“金鱼”，在多种语言任务中表现出色，为自然语言处理研究提供了基准。

LOLA——一个开源的大规模多语言大型语言模型

BriefGPT - AI 论文速递 ·

本文探讨了多语言词汇简化系统的研究进展，介绍了基于Transformer的模型在英语、葡萄牙语和西班牙语中的表现。研究表明，深度学习和大型语言模型在词汇简化任务中具有显著优势，并提出了未来的发展方向。

MultiLS-SP/CA：加泰罗尼亚语和西班牙语的词汇复杂性预测和词汇简化资源

BriefGPT - AI 论文速递 ·