20分钟-XD:瑞士新闻文章的可比较语料库

📝

内容提要

本研究解决了缺乏高质量跨语言新闻文章语料库的问题,提出了20min-XD语料库,涵盖2015至2024年的约15000篇法德文新闻文章对。研究展示了新颖的数据收集与对齐方法,结果表明该语料库在跨语言相似性方面具有广泛的应用潜力,适用于多种自然语言处理任务和语言学研究。

🏷️

标签

➡️

继续阅读