IberBench是一个新基准,旨在评估西班牙、葡萄牙及其地区语言的大型语言模型(LLMs)。它整合了101个数据集,涵盖22个任务,关注语言多样性和行业相关性。评估结果显示,LLMs在行业相关任务上表现不佳,尤其是加利西亚和巴斯克语言的模型面临更大挑战。
本研究探讨了单语言模型在加泰罗尼亚语中的优越性,证明其在数据充足时效果优于多语言模型。介绍了多语言模型的能力与局限性,并提出了针对低资源语言的新模型“金鱼”,在多种语言任务中表现出色,为自然语言处理研究提供了基准。
本文探讨了多语言词汇简化系统的研究进展,介绍了基于Transformer的模型在英语、葡萄牙语和西班牙语中的表现。研究表明,深度学习和大型语言模型在词汇简化任务中具有显著优势,并提出了未来的发展方向。
完成下面两步后,将自动完成登录并继续当前操作。