小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
词袋模型

词袋模型(BoW)是一种将文本转换为基于词频的数值向量的技术,广泛应用于文本分类、文档相似度和主题建模。其优点在于易于理解和高效处理小数据集,但缺乏上下文和语义理解。

词袋模型

DEV Community
DEV Community · 2025-05-17T09:54:03Z

本研究提出了一种新方法,将大型语言模型的摘要生成与主题建模相结合,以解决源代码理解中的主题建模问题。实验结果表明,该方法生成的摘要能够提供更具可解释性的代码结构表示,具有广泛的应用潜力。

利用大型语言模型摘要进行源代码主题建模

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-24T00:00:00Z

本研究提出了一种新颖的双向主题匹配(BTM)方法,用于跨语料库的主题建模,量化不同语料库间的主题重叠与差异,特别是在气候新闻中有效识别气候变化与气候行动的主题。

双向主题匹配:通过主题建模量化语料库之间的主题重叠

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-24T00:00:00Z

本研究提出LLM-ITL框架,解决传统主题建模在大型语言模型应用中的主题覆盖不足、对齐和效率问题,显著提升主题的解释性和一致性。

循环中的大型语言模型神经主题建模

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-13T00:00:00Z

在线社交网络的迅速发展导致大量用户生成文本内容。研究比较了五种主题建模方法,结果显示BERTopic在提取重要主题方面表现最佳。

主题建模的可靠性

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-30T00:00:00Z

本研究提出了一种新的“语义成分分析”(SCA)技术,有效克服了短文本分析中的主题建模局限性。SCA在多个Twitter数据集上表现优异,发现的语义成分数量是BERTopic的两倍,噪声率接近零,适用于多种语言。

语义成分分析:超越主题的短文本模式发现

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-28T00:00:00Z

本研究探讨中国通过华侨媒体影响欧洲选举,提出KeyNMF主题建模方法,证明其在分析华人媒体信息动态方面的有效性。

Context is Key (NMF): Modeling Thematic Information Dynamics in Chinese Diaspora Media

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-16T00:00:00Z
如何使用R进行文本挖掘

本文讲解了如何用R进行文本挖掘,包括数据准备、分析和可视化。使用的R包有tm、textclean、wordcloud等。步骤包括数据收集、预处理(如转换小写、去除标点和停用词)、创建文档-词项矩阵(DTM),并通过词云和柱状图进行可视化。最后,利用LDA进行主题建模,揭示隐藏主题。

如何使用R进行文本挖掘

KDnuggets
KDnuggets · 2024-10-02T13:54:45Z
GitHub如何利用AI将客户反馈转化为行动

GitHub使用数据挖掘技术和机器学习算法分析客户反馈,结合BERTopic和GPT-4模型进行主题建模和摘要生成。他们通过AI驱动的分析能力改进产品,自动识别趋势、解决问题、改进功能优先级和做出数据驱动决策。他们将继续改进以满足用户需求。

GitHub如何利用AI将客户反馈转化为行动

The GitHub Blog
The GitHub Blog · 2024-07-30T17:00:12Z

本项目利用AI的知识发现医学语料库假设生成,通过深度学习与主题建模为景观和城市规划师提供新的研究角度,并应用该方法识别新兴传染病与森林砍伐之间的概念关系,为景观规划师提供指导性的研究方向。

调研森林图:对特定研究主题获得不同的洞察视角

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-24T00:00:00Z

该论文介绍了神经方法在主题建模中的应用,提出了一种递归网络,能够类似于贝叶斯非参数主题模型发现数量概念上无限的主题。实验证明了该方法在不同数据集上的有效性。

基于 Transformer 表示的概率主题建模

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-03-06T00:00:00Z

本研究利用社交媒体对2020年10月伊兹密尔地震的Twitter帖子进行情感分析和主题建模。研究发现用户在地震后分享善意愿望并表达对机构和组织的声音。该研究方法有效且具有未来研究价值。

利用土耳其地震数据进行关联规则挖掘

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-12-26T00:00:00Z

TopMost是一个主题建模系统工具包,具有高度协调和解耦的模块化设计,能够涵盖更广泛的主题建模场景,有助于主题模型的研究和应用。

走近顶峰:主题建模系统工具匠

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-09-13T00:00:00Z

本文介绍了一种基于云的系统,使用机器学习方法从客户评论中提取洞察力。该系统使用复合模型,包括基于 transformer 的神经网络、关键字提取和聚类。它能够高效提取信息、进行主题建模,并满足用户需求。通过基准测试和与其他方法的比较,该方法取得了更好的结果。

酒店评论中评估客人国籍构成

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-08-11T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码