小红花·文摘

该论文首次将BERTopic主题建模技术应用于塞尔维亚语短文本，结果表明在某些预处理情况下，其主题丰富性优于LDA和NMF。这项研究对低资源语言和短文本的处理具有重要意义。

BriefGPT - AI 论文速递 ·

本文介绍了基于Transformer的塞尔维亚语语言模型的发展，比较了十个矢量化模型在自然语言处理任务中的表现，分析了模型大小和训练集对性能的影响，并确定了最佳训练设置。同时，研究了斯拉夫南部语言的网络语料库及其体裁分布，探讨了经济因素对语料库内容的影响。

BriefGPT - AI 论文速递 ·

使用改进的翻译 - 对齐 - 检索方法生成了最大的塞尔维亚问答数据集 SQuAD-sr，并使用该数据集对几个预训练的问答模型进行了微调，最佳结果表明我们的模型超过了零 - shot 基线但未超越人类表现。

BriefGPT - AI 论文速递 ·