危机相关社交媒体文本的语义丰富跨语言句子嵌入
💡
原文中文,约400字,阅读约需1分钟。
📝
内容提要
社交媒体在危机传播中起重要作用。研究引入了CrisisTransformers,一个预训练语言模型和句子编码器的集合,通过广泛训练提高了分类和句子编码任务的性能。模型已公开发布,可用于分析危机相关社交媒体文本。
🎯
关键要点
- 社交媒体在危机传播中起着重要作用。
- 分析危机相关的社交媒体文本具有挑战性。
- 本研究引入了CrisisTransformers,一个预训练语言模型和句子编码器的集合。
- CrisisTransformers经过广泛的语料库训练,包含超过150亿词元的推文,涉及30多个危机事件。
- 评估显示CrisisTransformers在分类任务中优于现有模型。
- 最佳句子编码器在句子编码任务中提高了17.43%的技术水平。
- 研究了模型初始化对收敛性的影响。
- 所有模型已公开发布,旨在成为分析危机相关社交媒体文本的强大基准。
🏷️
标签
➡️