小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
网络挖掘及其应用初学者指南

网络挖掘类似于在互联网上淘金,通过分析网页、链接和用户行为提取有用信息。它包括内容挖掘、结构挖掘和使用挖掘三类,旨在识别网页布局、链接结构和多媒体数据,自动分类文档并分析用户行为,实现分布式数据挖掘。

网络挖掘及其应用初学者指南

DEV Community
DEV Community · 2025-05-29T06:51:00Z
我厌倦了有毒的社交媒体——所以我正在建立一个专注于归属感的平台

KindredCircl是一个旨在促进真实连接与安全的社交平台,拒绝广告和数据挖掘,希望找到志同道合的支持者,共同建设更人性化的社交环境。

我厌倦了有毒的社交媒体——所以我正在建立一个专注于归属感的平台

DEV Community
DEV Community · 2025-05-08T18:14:14Z
评估阶段 (Evaluation)

Fase 5是CRISP-DM周期的倒数第二阶段,旨在根据业务目标评估构建的模型。此阶段比较数据挖掘结果与成功标准,以确定后续步骤,如部署或返回前期阶段。关键任务包括评估结果、审查过程和确定下一步行动。

评估阶段 (Evaluation)

DEV Community
DEV Community · 2025-04-25T22:04:40Z
云计算中安全数据挖掘的混合解决方案

云环境中的数据挖掘是组织获取有价值见解的基础。隐私保护数据挖掘(PPDM)在分析过程中保护敏感信息。混合解决方案结合多种技术,提升数据安全性,解决机密性、完整性和合规性等问题。通过实施这些策略,企业可以在保护隐私的同时,充分利用云数据挖掘的潜力。

云计算中安全数据挖掘的混合解决方案

DEV Community
DEV Community · 2025-04-08T11:38:02Z

本研究解决了复杂数据挖掘中无标签数据特征提取和分类的有效性问题,提出了一种基于自监督学习的算法,并通过实验验证其效果。研究表明,AdamW优化器结合学习率0.002可以显著提高模型性能,同时对比学习、变分模块和数据增强策略对模型的泛化能力和鲁棒性至关重要。

自监督学习在复杂数据挖掘中的对比和变分方法

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-05T00:00:00Z
定制化客户关系管理系统听起来不错,但阿什坎·拉贾伊(Ashkan Rajaee)表示,真正的优势在于你的数据。数据挖掘仍然是胜者。#阿什坎·拉贾伊 #数据战略 #客户关系管理 #初创企业增长

抱歉,我无法访问链接内容。请提供文章的具体内容,我将为您进行总结。

定制化客户关系管理系统听起来不错,但阿什坎·拉贾伊(Ashkan Rajaee)表示,真正的优势在于你的数据。数据挖掘仍然是胜者。#阿什坎·拉贾伊 #数据战略 #客户关系管理 #初创企业增长

DEV Community
DEV Community · 2025-03-31T19:21:04Z
利用数据挖掘技术分析SMS垃圾信息数据集中的模式

垃圾信息在现代通信中持续存在。本文利用SMS垃圾信息数据集,通过数据挖掘技术分析和预测垃圾信息模式。采用逻辑回归进行分类,K均值聚类探索数据结构。结果显示,逻辑回归的准确率为89%,但召回率较低,表明模型在识别垃圾信息时存在漏检。未来可通过集成方法和深度学习提高召回率。

利用数据挖掘技术分析SMS垃圾信息数据集中的模式

DEV Community
DEV Community · 2025-03-15T12:18:55Z

本文介绍了泰坦尼克号生存预测的数据预处理过程,强调数据处理的重要性。通过分析特征与生存率的关系,提取新特征并进行数据清洗,最终构建预测模型。

数据挖掘-利用多个机器学习模型实现泰坦尼克号生存预测

FreeBuf网络安全行业门户
FreeBuf网络安全行业门户 · 2025-03-02T11:03:50Z

在泰坦尼克号生存预测中,数据预处理至关重要。通过分析乘客特征(如舱位、性别和家庭大小),提取新特征并处理缺失值,最终构建预测模型。多种模型中,随机森林的表现最佳。

数据挖掘-利用多个机器学习模型实现泰坦尼克号生存预测

FreeBuf网络安全行业门户
FreeBuf网络安全行业门户 · 2025-03-02T11:03:50Z

本研究针对传统频繁模式挖掘算法在高维和稀疏数据环境下的性能瓶颈,提出了一种基于支持向量机(SVM)的频繁模式数据挖掘算法。通过将频繁模式挖掘转换为分类问题,该算法在模式提取的准确性和鲁棒性上有显著提升,并且在实际应用中提供了对复杂模式挖掘任务的有效解决方案。

高维数据挖掘中的模式识别机器学习技术

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-20T00:00:00Z
大规模数据集挖掘:数据科学爱好者的终极指南

《大规模数据集挖掘》是斯坦福大学专家撰写的书籍,深入探讨数据挖掘与机器学习,结合理论与实践,适合计算机科学学生和数据专业人士。书中涵盖分布式计算、相似性搜索等技术,帮助读者理解和处理海量数据。

大规模数据集挖掘:数据科学爱好者的终极指南

DEV Community
DEV Community · 2024-11-23T10:51:06Z

本研究提出了一种新颖的自然语言处理方法,成功提取了1008条与伦理关注相关的应用评论,显著提升了数据挖掘效率。

Beyond Keywords: A Context-Based Hybrid Approach for Mining Application Reviews Related to Ethical Concerns

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-11T00:00:00Z

本研究解决了肽自组装行为研究中缺乏系统性分析的问题。通过手动处理和大语言模型的文献挖掘,我们建立了一个包含超过1000条实验数据的肽组装数据库,并训练出高效的机器学习模型,实现了对肽自组装相的高准确率分类。这一工作有助于提高肽候选体的探索效率,为新结构的开发提供了支持,使其在传感、催化及生物材料等应用中具有潜在影响。

通过大语言模型的数据挖掘学习肽自组装的规则

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-08T00:00:00Z

本研究针对多尺度生物系统动态建模中的数据挖掘和特征选择问题,提出了一种基于组学的数据建模管道,有效捕捉酵母菌株的动态行为,并为生物过程工程提供不确定性估计框架。

基于组学的混合动态建模与不确定性估计

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-24T00:00:00Z

在Lux学院的最后一课中,我学习了如何撰写技术文章,并完成了一个项目:从weatherapi或openweathermap获取肯尼亚的天气数据,存储在MongoDB中,用Python分析,并在Tableau中可视化。尽管可视化耗时,但我在三周的数据分析课程中收获颇丰,感谢导师的指导。

数据挖掘与可视化

DEV Community
DEV Community · 2024-10-16T17:22:22Z

本研究结合元启发式算法、传统分类器和神经网络,解决机器学习中的数据不足问题。实验表明,仅依赖标记数据集的验证准确率无法纠正未见数据的标签,这对未来数据挖掘技术有重要影响。

Automated Data Mining Approaching the Combination of Metaheuristic and Deep Learning

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-16T00:00:00Z

本文研究了自监督对比学习在高光谱图像分类中的应用,特别是在标注数据有限时的优势。提出了一种两阶段分类方法,即使减少50%训练数据,仍能保持优异表现。该方法通过挖掘数据的隐含空间信息,提高了单标签和多标签分类的性能,展示了其在高光谱数据处理中的潜力。

通过对比学习提高低标注领域的高光谱图像预测

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-10T00:00:00Z

本研究解决了大型语言模型在特定或低资源行业领域表现不足的问题。我们提出了一种自动化且可扩展的框架DoPAMine,通过挖掘特定领域的训练数据,增强了模型的适应能力。实验结果表明,该方法在医疗和金融领域的零-shot和5-shot场景中显著提高了预训练模型的性能,展现了其潜在的行业应用价值。

DoPAMine:从种子引导数据挖掘的领域特定预训练适应

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-30T00:00:00Z

AI在软件测试中的应用正在改变我们确保质量的方式,加快了流程,提高了准确性。它自动化了繁琐的任务,减少了上市时间,同时确保可靠性。AI深入挖掘数据,发现错误并预测风险区域,实现更智能的测试和更快的修复。AI优势包括精确性、可扩展性、更快的发布和持续集成。但需要注意的挑战包括适应老系统、高成本、技能差距和数据质量。AI驱动的软件测试已经来临,准备好发挥其全部潜力了吗?

在软件测试中整合AI:未来已来

DEV Community
DEV Community · 2024-09-17T17:51:28Z
孟瑜获杰出博士论文奖,中科大获最佳学生论文,KDD 2024全部奖项放出

ACM SIGKDD(国际数据挖掘与知识发现大会,KDD)是数据挖掘领域最大的国际学术会议之一。今年的KDD大会在西班牙巴塞罗那举行,多位华人研究者获奖,包括孟瑜获得杰出博士论文奖和华人学者参与的《CAT: Interpretable Concept-based Taylor Additive Models》获得最佳论文奖。此外,中国科学技术大学和华为合作的《Dataset Regeneration for Sequential Recommendation》获得最佳学生论文奖。

孟瑜获杰出博士论文奖,中科大获最佳学生论文,KDD 2024全部奖项放出

机器之心
机器之心 · 2024-08-28T06:46:24Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码