该论文首次将BERTopic主题建模技术应用于塞尔维亚语短文本,结果表明在某些预处理情况下,其主题丰富性优于LDA和NMF。这项研究对低资源语言和短文本的处理具有重要意义。
使用改进的翻译 - 对齐 - 检索方法生成了最大的塞尔维亚问答数据集 SQuAD-sr,并使用该数据集对几个预训练的问答模型进行了微调,最佳结果表明我们的模型超过了零 - shot 基线但未超越人类表现。
完成下面两步后,将自动完成登录并继续当前操作。