使用细调 LLMs 和句袋模型进行主题建模
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
我们提出了PromptTopic,一种利用大型语言模型的先进语言理解能力从句子级别提取主题并将其汇总和压缩为预定数量的主题。与基线模型相比,PromptTopic在发现有意义的主题方面表现出色,并在多个数据集中发现相关主题的能力。
🎯
关键要点
- 提出了PromptTopic,利用大型语言模型的语言理解能力从句子级别提取主题。
- PromptTopic能够将主题汇总和压缩为预定数量,消除手动参数调整的需求。
- 在三个不同的数据集上与最先进的基线模型比较,展示了PromptTopic的主题发现能力。
- 定性分析表明PromptTopic在多个数据集中发现相关主题的能力。
➡️