本研究探讨了负采样在无监督主题建模中的应用,比较了多种神经主题模型的负采样策略,并验证了其在多个数据集上的有效性。结果表明,负采样显著提高了主题的一致性、多样性和文档分类的准确性。
本研究提出了ContraTopic框架,以解决神经主题模型的可解释性问题。通过对比学习和主题对比正则化,增强了主题的一致性和区分性。实验结果表明,该框架在多个数据集上优于现有模型。
本研究解决了反事实检测中依赖线索短语预测的不稳定性。提出结合神经主题模型与CFD模型的方法,通过因果干预平衡类别标签影响。实验结果显示,该方法在CFD及其他偏差任务中表现优于现有模型。
本文介绍了神经主题模型的最新进展,包括利用语言模型和嵌入技术提升主题模型的可解释性和适用性。研究了BERTopic和LI-NTM等模型的性能,并提出了图向话题(G2T)框架,展示了其在主题建模中的优势。此外,探讨了生成模型在零样本情况下的文本生成能力及其局限性。
本论文提出了一种利用预训练语言模型扩展短文本序列的方法,通过扩展神经主题模型减少噪声文本的影响,显著改善短文本主题建模的性能。
完成下面两步后,将自动完成登录并继续当前操作。