迭代改进的加性正则化主题模型

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

本论文提出了一种解决短文本主题建模中数据稀疏问题的新方法,通过利用预训练语言模型扩展短文本为更长的序列,并通过扩展神经主题模型减少与主题无关的噪声文本的影响。实验证明该模型能够显著改善短文本主题建模性能,超过现有最先进的模型。

🎯

关键要点

  • 提出了一种新方法解决短文本主题建模中的数据稀疏问题。
  • 利用预训练语言模型将短文本扩展为更长的序列。
  • 通过扩展神经主题模型减少与主题无关的噪声文本的影响。
  • 模型显著改善短文本主题建模性能。
  • 在极度数据稀疏情况下,模型在多个真实数据集上表现优异,超过现有最先进的模型。
➡️

继续阅读