本研究探讨了负采样在无监督主题建模中的应用,比较了多种神经主题模型的负采样策略,并验证了其在多个数据集上的有效性。结果表明,负采样显著提高了主题的一致性、多样性和文档分类的准确性。
本研究提出了ContraTopic框架,以解决神经主题模型的可解释性问题。通过对比学习和主题对比正则化,增强了主题的一致性和区分性。实验结果表明,该框架在多个数据集上优于现有模型。
本研究提出了一种新方法,将维基百科知识融入神经主题模型,解决同形异义词问题。该方法能识别命名实体,提高模型泛化能力,并有效捕捉主题时间序列发展。实验结果验证了其有效性。
本研究解决了反事实检测中依赖线索短语预测的不稳定性。提出结合神经主题模型与CFD模型的方法,通过因果干预平衡类别标签影响。实验结果显示,该方法在CFD及其他偏差任务中表现优于现有模型。
本论文提出了一种解决短文本主题建模中数据稀疏问题的新方法,通过利用预训练语言模型扩展短文本为更长的序列,并通过扩展神经主题模型减少与主题无关的噪声文本的影响。实验证明该模型能够显著改善短文本主题建模性能,超过现有最先进的模型。
本论文提出了一种解决短文本主题建模中数据稀疏问题的新方法,通过利用预训练语言模型扩展短文本为更长序列,并通过扩展神经主题模型减少与主题无关的噪声文本的影响。实验证明该模型在短文本主题建模中性能显著优于现有最先进的模型。
本论文提出了一种解决短文本主题建模中数据稀疏问题的新方法,通过利用预训练语言模型扩展短文本为更长序列,并通过扩展神经主题模型减少与主题无关的噪声文本的影响。实验证明该模型显著改善了短文本主题建模的性能,超过了现有最先进的模型。
本论文提出了一种利用预训练语言模型扩展短文本序列的方法,通过扩展神经主题模型减少噪声文本的影响,显著改善短文本主题建模的性能。
完成下面两步后,将自动完成登录并继续当前操作。