小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
沉浸式翻译 immersive translate

之前较少涉及的,但对于一个成熟的应用,其推荐系统,用户画像乃至金融、智慧城市、医疗等等领域都离不开大数据。大数据不再仅仅指代“巨大的数据量”,而是一套通过采集、存储、处理和分析,从海量的、复杂的、非结构化的数据中获取洞察力和价值的技术体系。通常用 5V 特征来描述它:大量(Volume)、高速(Velocity)、多样(Variety)、低价值密度(Value)和真实性(Veracity)。

从零开始大数据

Sekyoro的博客小屋
Sekyoro的博客小屋 · 2026-01-10T07:44:55Z
大数据成矿预测系列(九) | 数据的“自我画像”:自编码器如何实现非监督下的“特征学习”

自编码器在地质勘查中广泛应用,尤其在异常识别方面。深度自编码器(DAE)通过无监督学习和非线性特征提取,有效处理复杂地质数据,识别潜在成矿模式,推动成矿预测的发展。

大数据成矿预测系列(九) | 数据的“自我画像”:自编码器如何实现非监督下的“特征学习”

Seraphineの小窝
Seraphineの小窝 · 2025-11-11T11:12:45Z
大数据成矿预测系列(八) | 从定性到概率:逻辑回归——地质统计学派的“集大成者”

证据权重法(WofE)在成矿预测中应用广泛,但常违反独立性假设。逻辑回归(LR)作为一种强大的统计方法,克服了这一局限,允许变量间相关性,提供更稳健的预测。LR模型通过logit变换建模成矿概率,具备良好的可解释性和处理复杂关系的能力,适应现代地质数据分析需求。

大数据成矿预测系列(八) | 从定性到概率:逻辑回归——地质统计学派的“集大成者”

Seraphineの小窝
Seraphineの小窝 · 2025-11-08T12:48:22Z
大数据成矿预测系列(七) | 经典模型的“孪生兄弟”:信息量法 (IVM) 深度解析

信息量法(IVM)是矿产资源定量预测的经典方法,最早由前苏联学者提出,后在中国应用。IVM通过计算地质因素对成矿事件的信息量来评估矿产潜力,其核心公式基于条件概率,强调地质因素的影响。尽管IVM透明且数据需求较低,但存在条件独立性假设和因素选择的主观性等局限性。

大数据成矿预测系列(七) | 经典模型的“孪生兄弟”:信息量法 (IVM) 深度解析

Seraphineの小窝
Seraphineの小窝 · 2025-11-05T11:56:40Z

大数据成矿预测系列(七) | 经典模型的“孪生兄弟”:信息量法 (IVM) 深度解析

Seraphineの小窝
Seraphineの小窝 · 2025-11-05T11:56:40Z
大数据成矿预测系列(六) | 从“看图像”到“读结构”:GCN如何赋能地质“图谱”推理

卷积神经网络(CNN)在成矿预测中表现优异,但无法处理非欧几里得数据。图卷积神经网络(GCN)通过图结构捕捉复杂空间关系,克服了CNN的局限性,使地质学家能够利用先验知识构建地质知识图谱,从而提高3D成矿预测的准确性。

大数据成矿预测系列(六) | 从“看图像”到“读结构”:GCN如何赋能地质“图谱”推理

Seraphineの小窝
Seraphineの小窝 · 2025-11-03T12:45:19Z
大数据成矿预测系列(五) | 告别特征工程:卷积神经网络(CNN)如何实现“端到端”成矿预测

机器学习为地质学家寻找矿产资源提供了新方法,卷积神经网络(CNN)能够直接处理原始地质数据并自动提取特征,克服了传统方法的局限性。然而,CNN仍需大量高质量数据,且决策过程不透明,存在“黑箱”问题。

大数据成矿预测系列(五) | 告别特征工程:卷积神经网络(CNN)如何实现“端到端”成矿预测

Seraphineの小窝
Seraphineの小窝 · 2025-10-21T07:21:45Z

通过实际操作,让大家深入了解如何方便快捷的使用Flink。在这个过程中,大家将学习到Docker的安装、Flink的安装部署以及简单的Flink代码开发,从而掌握 Flink 的基本使用方法,体验其在应用开发中的优势。

基于华为开发者空间-云开发环境Docker+Flink实现大数据实时统计系统

华为云官方博客
华为云官方博客 · 2025-10-20T01:54:01Z
大数据成矿预测系列(四) | 成矿预测的“主力军”:随机森林与支持向量机深度解析

大数据时代,矿产勘查方法正发生变革。机器学习,特别是随机森林和支持向量机,成为成矿预测的关键工具。随机森林通过集成多个决策树,具备抗过拟合和处理小样本的优势;支持向量机则利用核技巧解决复杂非线性问题。两者各有优劣,随机森林在数据稀缺时表现更佳。

大数据成矿预测系列(四) | 成矿预测的“主力军”:随机森林与支持向量机深度解析

Seraphineの小窝
Seraphineの小窝 · 2025-10-11T11:10:26Z
大数据成矿预测系列(三) | 从统计模型到机器学习:为何机器学习是成矿预测的新前沿?

矿产勘查正从证据权重法(WofE)转向机器学习,后者能更有效处理复杂地质系统。WofE依赖条件独立性假设,在大数据环境中存在局限。机器学习通过识别多变量间的非线性关系,提供更精准的成矿预测,满足现代地学大数据的需求。

大数据成矿预测系列(三) | 从统计模型到机器学习:为何机器学习是成矿预测的新前沿?

Seraphineの小窝
Seraphineの小窝 · 2025-10-06T06:39:20Z
大数据成矿预测系列(二) | 证据权重法如何克服自身局限?

证据权重法(WofE)在成矿预测中存在理论缺陷,特别是证据层之间的条件独立性假设不成立,导致系统性偏倚和虚假精确感。为解决这些问题,研究者提出了模糊证据权重法、序列证据权重法和混合模型等改进方法,以提高预测的准确性和适用性。然而,WofE仍面临对已知矿床样本依赖等挑战。

大数据成矿预测系列(二) | 证据权重法如何克服自身局限?

Seraphineの小窝
Seraphineの小窝 · 2025-10-01T10:01:16Z

Apache软件基金会发布公告,开源OLAP引擎Apache Kylin在4.0.0至5.0.2版本中存在三处安全漏洞,已在5.0.3版本中修复。高危漏洞CVE-2025-61733允许攻击者绕过认证,低危漏洞CVE-2025-61734和CVE-2025-61735涉及文件读取和服务端请求伪造。建议用户升级至5.0.3版本。

Apache Kylin大数据平台曝认证绕过与SSRF漏洞

FreeBuf网络安全行业门户
FreeBuf网络安全行业门户 · 2025-09-30T19:11:04Z
大数据成矿预测系列(一) | 经典模型“证据权重法”的前世今生

本文介绍了数据驱动的成矿预测方法,重点讨论证据权重法(WofE),该方法通过统计分析评估矿床存在的概率,结合地质信息,克服主观判断的局限性。文章还阐述了WofE的起源、实现过程及其在地学中的应用,旨在帮助读者理解和应用这些技术。

大数据成矿预测系列(一) | 经典模型“证据权重法”的前世今生

Seraphineの小窝
Seraphineの小窝 · 2025-09-26T03:18:01Z

本文作为“大数据成矿预测”系列的首篇,系统回顾了数据驱动方法中的经典模型——证据权重法(Weights of...

大数据成矿预测系列(一) | 经典模型“证据权重法”的前世今生

Seraphineの小窝
Seraphineの小窝 · 2025-09-26T03:18:01Z

在大数据时代,传统监控模式面临成本失控、信噪比低和人力透支等问题。OpenResty XRay通过智能动态调整数据采集精度,降低成本、提升性能,帮助工程师快速定位问题,提供精准洞察,改变运维与研发理念。

别让“大数据”淹没你:OpenResty XRay 如何用最少数据,定位最棘手问题

OpenResty 官方博客
OpenResty 官方博客 · 2025-09-24T00:00:00Z

随着电商的发展,商家需要分析用户行为数据,以优化库存和营销策略。本文介绍了如何通过代码统计电商平台的十大热门品类,包括用户的搜索、点击、下单和支付行为,并展示结果。

基于华为开发者空间,用大数据带你挖掘电商Top10热门品类

华为云官方博客
华为云官方博客 · 2025-09-11T07:20:32Z

本文探讨了大数据时代流式数据处理与AI原生Agent工作流的异同,分析了Dataiku、StreamSets和n8n等平台的演变,强调了技术融合与智能决策的提升。AI Agent平台通过大型语言模型实现了从规则驱动到智能决策的转变,展现了未来数据流与智能决策的结合趋势。

从大数据到 AI Agent 的技术演进

dotNET跨平台
dotNET跨平台 · 2025-08-19T00:02:16Z

2020年,中国团结抗疫,百度AI积极贡献科技力量,助力复工复产,推动创新与高质量发展,深刻影响人们的生活与工作。

直播预告|2025IKCEST国际大数据竞赛: 高手带你使用PaddleMIX玩转大模型数学解题!

百度大脑
百度大脑 · 2025-08-06T12:20:19Z
推动人工智能与大数据增长的隐秘悖论

杰文斯悖论指资源使用效率提高时,资源消耗反而增加。随着AI技术的进步,企业对数据的需求和价值不断上升。现代数据解决方案使长期数据保留变得经济可行,企业可利用这些数据训练AI模型,增强竞争力。旧的数据处理方式导致浪费,而新方法强调保留高质量数据以支持AI发展。

推动人工智能与大数据增长的隐秘悖论

The New Stack
The New Stack · 2025-07-30T18:00:06Z

在工业4.0背景下,传统运维模式正在转变。推荐一款基于WPF的开源工业大数据平台,支持设备监控、故障诊断和运维管理,具备多协议数据采集和可视化报表功能,助力制造业实现智能化运维。

WPF 工业大数据采集维保平台:工业4.0时代的智能运维中枢

dotNET跨平台
dotNET跨平台 · 2025-07-15T00:01:20Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码