小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
词袋模型

词袋模型(BoW)是一种将文本转换为基于词频的数值向量的技术,广泛应用于文本分类、文档相似度和主题建模。其优点在于易于理解和高效处理小数据集,但缺乏上下文和语义理解。

词袋模型

DEV Community
DEV Community · 2025-05-17T09:54:03Z

本研究提出了一种新方法,将大型语言模型的摘要生成与主题建模相结合,以解决源代码理解中的主题建模问题。实验结果表明,该方法生成的摘要能够提供更具可解释性的代码结构表示,具有广泛的应用潜力。

利用大型语言模型摘要进行源代码主题建模

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-24T00:00:00Z

本研究提出双向主题匹配(BTM),一种新颖的跨语料库主题建模方法,用于量化语料库之间的主题重叠与差异。BTM能够有效识别气候新闻文章中共享和独特的主题,展示气候变化与气候行动之间的关系。

Bidirectional Topic Matching: Quantifying Thematic Overlap Between Corpora Through Topic Modelling

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-24T00:00:00Z

本研究提出LLM-ITL框架,解决传统主题建模在大型语言模型应用中的主题覆盖不足、对齐和效率问题,显著提升主题的解释性和一致性。

循环中的大型语言模型神经主题建模

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-13T00:00:00Z

本研究提出了一种新的“语义成分分析”(SCA)技术,有效克服了短文本分析中的主题建模局限性。SCA在多个Twitter数据集上表现优异,发现的语义成分数量是BERTopic的两倍,噪声率接近零,适用于多种语言。

语义成分分析:超越主题的短文本模式发现

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-28T00:00:00Z

本研究探讨中国通过华侨媒体影响欧洲选举,提出KeyNMF主题建模方法,证明其在分析华人媒体信息动态方面的有效性。

Context is Key (NMF): Modeling Thematic Information Dynamics in Chinese Diaspora Media

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-16T00:00:00Z
如何使用R进行文本挖掘

本文讲解了如何用R进行文本挖掘,包括数据准备、分析和可视化。使用的R包有tm、textclean、wordcloud等。步骤包括数据收集、预处理(如转换小写、去除标点和停用词)、创建文档-词项矩阵(DTM),并通过词云和柱状图进行可视化。最后,利用LDA进行主题建模,揭示隐藏主题。

如何使用R进行文本挖掘

KDnuggets
KDnuggets · 2024-10-02T13:54:45Z

本文介绍了多种主题建模方法,如Topic2Vec、嵌入式主题模型(ETM)和TaxoCom。这些方法结合了语义向量、层次结构和聚类技术,提高了主题检测的有效性和可解释性。实验结果表明,这些新方法在主题提取和文档表达方面优于传统模型。

基于盒嵌入空间的自监督主题分类发现

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-27T00:00:00Z

本文探讨了贝叶斯非参数主题建模在视频数据异常检测中的应用,展示了其在动态环境下的有效性。研究表明,综合检测方法优于简单检测,适用于搜索救援和野生动物观察等领域。此外,提出了新特征选择方法和鲁棒异常检测模型,提升了高光谱影像的异常检测性能。

ERX:一种快速的实时高光谱线扫描异常检测算法

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-27T00:00:00Z

本文探讨了高维稀疏计数数据的主题建模,比较了多种算法,强调超参数优化对性能的影响。提出了一种新型主题模型和推理方法,利用预训练语言模型改善短文本建模,显著提升了主题质量和聚类效果。

迭代改进的加性正则化主题模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-11T00:00:00Z

本文提出了一种结合句子嵌入和生成过程模型的主题建模算法,利用大型语言模型(LLMs)解决短文本主题推断的挑战。研究表明,该方法在多个数据集上表现优异,能够识别更连贯的主题,减少虚构主题的产生,并提高主题提取质量,消除手动调整的需求。

使用细调 LLMs 和句袋模型进行主题建模

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-06T00:00:00Z
GitHub如何利用AI将客户反馈转化为行动

GitHub使用数据挖掘技术和机器学习算法分析客户反馈,结合BERTopic和GPT-4模型进行主题建模和摘要生成。他们通过AI驱动的分析能力改进产品,自动识别趋势、解决问题、改进功能优先级和做出数据驱动决策。他们将继续改进以满足用户需求。

GitHub如何利用AI将客户反馈转化为行动

The GitHub Blog
The GitHub Blog · 2024-07-30T17:00:12Z

本文介绍了一种基于序列到序列神经网络的主题建模方法,结合BERT模型、UMAP降维和K-Means聚类,从未分类文本中提取主题。研究表明,该方法在多个数据集上表现优异,并开发了交互式主题建模系统,具有显著应用价值。

主题建模的迭代方法

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-25T00:00:00Z

该论文首次将BERTopic主题建模技术应用于塞尔维亚语短文本,结果表明在某些预处理情况下,其主题丰富性优于LDA和NMF。这项研究对低资源语言和短文本的处理具有重要意义。

揭示 BERTopic 在多语种假新闻分析中的潜力 -- 应用案例:Covid-19

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-11T00:00:00Z

本文介绍了基于向量量化(VQ)和生成模型的技术,旨在解决图像与文本信息对齐、主题建模及图像压缩等问题。研究表明,通过新颖的编码簿和训练框架,这些方法在多个数据集上优于现有技术,提升了生成性能和压缩效率。

LG-VQ:语言导向的代码本学习

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-05-23T00:00:00Z

本文介绍了一种基于云的机器学习系统,能够从客户评论中提取洞察力,利用变压器神经网络和关键字提取技术,显著提升信息提取和主题建模的效果。该系统经过基准测试,表现优于现有方法,显示出更高的排序精度。

InsightNet:从客户反馈中挖掘结构化洞见

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-05-12T00:00:00Z

本文介绍了PromptTopic,一种利用大型语言模型提取和汇总短文本主题的方法,显著提高了主题建模的质量。通过扩展短文本和减少噪声,PromptTopic在多个数据集上表现优于现有模型,有效解决了数据稀疏问题,展示了其在主题提取中的潜力和优势。

增强短文本建模:利用大型语言模型进行主题细化

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-03-26T00:00:00Z

本文提出了一种结合题意注意力机制和主题建模的鲁棒模型,用于预测文章特征分数。实验证明该模型在自动评分任务中的先进性,并探讨了自动评分模型的准确性、公平性和泛化能力,为教育中有效模型的开发提供了见解。

多特征作文打分的自回归得分生成

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-03-13T00:00:00Z

该论文提出了一种新框架,用于评估概率主题建模算法并量化主题结构一致性。研究揭示了主题模型在不同语料库特征下的表现,并首次证明了“不可检测阶段”。提出的“协调主题建模”模型通过监督机制提升可解释性,实验结果显示其优于其他基线。

基于语料库主题分类的专题应用检索改进

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-03-07T00:00:00Z

本文讨论了多种主题建模方法,包括基于聚类的主题建模、随机块模型、术语稳定性分析和高斯混合神经主题模型。这些方法在文本空间化、主题数自动检测和语义提取方面表现优越,显著提升了分类和预测任务的性能。

主题模型的几何结构

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-03-06T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码