危机相关社交媒体文本的语义丰富跨语言句子嵌入
原文中文,约400字,阅读约需1分钟。发表于: 。通过使用多语言句子编码器,我们提出了一种能够为 50 多种语言中的相关社交媒体文本进行嵌入的模型,以使具有相似含义的文本在相同的向量空间中靠近,无论语言多样性如何。研究结果对句子编码和匹配任务表现出良好的性能,表明这些模型可以作为嵌入多语言危机相关社交媒体文本时的强大基准模型。
社交媒体在危机传播中起重要作用。研究引入了CrisisTransformers,一个预训练语言模型和句子编码器的集合,通过广泛训练提高了分类和句子编码任务的性能。模型已公开发布,可用于分析危机相关社交媒体文本。