危机相关社交媒体文本的语义丰富跨语言句子嵌入

💡 原文中文,约400字,阅读约需1分钟。
📝

内容提要

社交媒体在危机传播中起重要作用。研究引入了CrisisTransformers,一个预训练语言模型和句子编码器的集合,通过广泛训练提高了分类和句子编码任务的性能。模型已公开发布,可用于分析危机相关社交媒体文本。

🎯

关键要点

  • 社交媒体在危机传播中起着重要作用。
  • 分析危机相关的社交媒体文本具有挑战性。
  • 本研究引入了CrisisTransformers,一个预训练语言模型和句子编码器的集合。
  • CrisisTransformers经过广泛的语料库训练,包含超过150亿词元的推文,涉及30多个危机事件。
  • 评估显示CrisisTransformers在分类任务中优于现有模型。
  • 最佳句子编码器在句子编码任务中提高了17.43%的技术水平。
  • 研究了模型初始化对收敛性的影响。
  • 所有模型已公开发布,旨在成为分析危机相关社交媒体文本的强大基准。
➡️

继续阅读