Combining Embedded Topics with Optimal Transport for Online Topic Modeling of Data Streams

💡 原文英文,约100词,阅读约需1分钟。
📝

内容提要

该研究提出了StreamETM方法,结合嵌入式主题模型与不平衡最优传输,以应对在线主题建模中快速增长的文本数据流挑战。实验结果表明,StreamETM在模拟和实际数据上均优于现有方法。

🎯

关键要点

  • 该研究提出了StreamETM方法,结合嵌入式主题模型与不平衡最优传输。
  • StreamETM旨在应对在线主题建模中快速增长的文本数据流的挑战。
  • 该方法能够有效合并连续部分文档批次的模型。
  • 应用在线变更点检测算法以识别文本流动态的重大变化。
  • 实验结果表明,StreamETM在模拟和实际数据上均优于现有方法。
➡️

继续阅读