小红花·文摘

本研究提出了SLIDE数据集和多标签语言识别模型，旨在解决斯堪的纳维亚语言的多标签识别问题，强调同时识别多种语言对提高识别准确性的重要性。

BriefGPT - AI 论文速递 ·

本研究通过SWEb数据集解决了斯堪的纳维亚语言预训练数据不足的问题。使用新型文本提取器简化处理，并推出新的填空式基准评估方法，结果与FineWeb数据集上的模型表现相当。

BriefGPT - AI 论文速递 ·