利用大型语言模型进行 COVID-Tweets 的多标签分类

原文中文,约300字,阅读约需1分钟。发表于:

构建一个有效的多标签分类器,根据社交媒体帖子(尤其是推文)作者表达的特定疫苗相关担忧,对其进行标签化,比较三种不同的模型,其中 Supervised BERT-large-uncased 模型效果最佳。

该论文介绍了基于transformer的COVID-Twitter-BERT模型,通过对大量Twitter上有关COVID-19的消息进行预训练,提高了BERT-Large基础模型在五个不同分类数据集上的性能,尤其在COVID-19内容分类中表现突出。该模型可用于文本分类、问答和聊天机器人等自然语言处理任务。

相关推荐 去reddit讨论