本文介绍了神经主题模型的最新进展,包括利用语言模型和嵌入技术提升主题模型的可解释性和适用性。研究了BERTopic和LI-NTM等模型的性能,并提出了图向话题(G2T)框架,展示了其在主题建模中的优势。此外,探讨了生成模型在零样本情况下的文本生成能力及其局限性。
本文介绍了标签索引神经主题模型(LI-NTM),这是首个有效的上游半监督神经主题模型,表现优于现有模型。同时,研究提出了基于主题引导的变分自编码器(TGVAE)和嵌入式主题模型(ETM),在文本生成和主题发现方面取得了显著成果。
完成下面两步后,将自动完成登录并继续当前操作。