利用预训练语言模型进行短文本主题建模

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

本论文提出了一种利用预训练语言模型扩展短文本序列的方法,通过扩展神经主题模型减少噪声文本的影响,显著改善短文本主题建模的性能。

🎯

关键要点

  • 本论文提出了一种利用预训练语言模型扩展短文本序列的方法。
  • 该方法旨在解决短文本主题建模中的数据稀疏问题。
  • 通过扩展神经主题模型,减少预训练语言模型生成的噪声文本影响。
  • 模型显著改善短文本主题建模的性能。
  • 在极度数据稀疏的情况下,模型在多个真实数据集上表现优异,胜过现有最先进的模型。
➡️

继续阅读