小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
加一人物系列:让-巴蒂斯特·奥诺弗雷

让-巴蒂斯特·奥诺弗雷(JB)是Apache软件基金会的董事会成员,专注于大数据和分布式系统的架构挑战。他认为AI的崛起为开源带来了机遇,但也面临低质量贡献的挑战。他强调社区优先于代码,并建议新贡献者寻找合适的项目和导师。

加一人物系列:让-巴蒂斯特·奥诺弗雷

The Apache Software Foundation Blog
The Apache Software Foundation Blog · 2026-03-31T19:46:16Z
游戏版大数据杀熟?索尼PS游戏商店面向不同用户会提供不同的折扣价格

索尼在PS游戏商店实施动态定价策略,针对不同国家和用户提供5%至17.5%的折扣,导致同款游戏价格差异。这一举措旨在刺激购买,但可能影响用户满意度和品牌声誉。

游戏版大数据杀熟?索尼PS游戏商店面向不同用户会提供不同的折扣价格

蓝点网
蓝点网 · 2026-03-08T08:36:19Z

PL/Python扩展使DWS数据库能够直接使用Python,简化复杂运算和数据处理。通过Fenced模式确保安全性和资源控制,支持Pandas、Numpy等库,提高开发效率,适合AI和大数据应用,为数据仓库提供强大的算法处理能力。

进阶指南:在 DWS 中利用 PL/Python 解锁数据库无限可能

华为云官方博客
华为云官方博客 · 2026-02-10T07:06:58Z
如何优化PySpark作业:理解逻辑计划的实际场景

在大数据时代,性能不仅依赖于集群规模,更在于代码的智能优化。Spark代码易写但难以优化,因其执行与编写的代码存在差异。本文手册指导如何阅读和控制Spark的逻辑计划,以编写高效的PySpark代码,提升数据处理效率,避免不必要的配置调整。

如何优化PySpark作业:理解逻辑计划的实际场景

freeCodeCamp.org
freeCodeCamp.org · 2026-02-05T22:45:15Z
在Python中处理十亿行数据集(使用Vaex)

Vaex是一个高性能的Python库,专为处理超大数据集而设计。它通过外存处理和延迟计算,避免将整个数据集加载到内存中,实现快速分析,特别适合处理超过1GB的大数据。

在Python中处理十亿行数据集(使用Vaex)

KDnuggets
KDnuggets · 2026-02-02T17:00:24Z
自主大数据优化:多智能体强化学习实现自调节Apache Spark

一款Q学习强化学习代理通过观察数据集特征和实验不同设置,自动优化Spark配置。结合自适应查询执行(AQE)和RL代理,性能优于单独使用。该代理能够处理动态工作负载,优化资源分配,降低云成本,提高查询性能。

自主大数据优化:多智能体强化学习实现自调节Apache Spark

InfoQ
InfoQ · 2026-01-30T09:00:00Z
如何在Python中使用ORC文件格式 - 带示例的指南

ORC文件是一种为Hadoop设计的列式存储格式,适合大数据分析。使用Python的PyArrow库,可以高效读取、写入和处理ORC文件,支持压缩和索引,优化查询性能。

如何在Python中使用ORC文件格式 - 带示例的指南

freeCodeCamp.org
freeCodeCamp.org · 2026-01-14T01:24:44Z
2026年社区优于代码欧洲大会将在苏格兰格拉斯哥举行

阿帕奇软件基金会将于2026年10月11日至14日在苏格兰格拉斯哥举办“社区优于代码”大会,展示大数据、物联网等多个项目,并提供互动和社区交流机会。

2026年社区优于代码欧洲大会将在苏格兰格拉斯哥举行

The Apache Software Foundation Blog
The Apache Software Foundation Blog · 2026-01-13T13:12:43Z
从零开始大数据

大数据技术通过采集、存储和分析海量数据,广泛应用于推荐系统、金融和医疗等领域。其特点包括数据量大、处理速度快、多样性、低价值密度和真实性。大数据技术起源于Google的GFS、MapReduce和BigTable,随后Hadoop和Spark等框架的出现推动了大数据生态的发展。

从零开始大数据

Sekyoro的博客小屋
Sekyoro的博客小屋 · 2026-01-10T07:44:55Z
科幻终端模拟器:黑客风格炫酷狂拽! | 开源日报 No.845

LLMCompiler 是一个支持多种模型的并行函数调用编译器框架,旨在提高效率和降低成本,适合用于创建互动课程,特别适合组织和学校。BigDataView 提供多行业的大数据可视化模板,而 eDEX-UI 是一个可定制的终端模拟器,支持监控和触摸屏功能。

科幻终端模拟器:黑客风格炫酷狂拽! | 开源日报 No.845

开源服务指南
开源服务指南 · 2026-01-09T07:35:55Z
强大的数据分析工具:轻松处理、转换、可视化 | 开源日报 No.833

Blaze 是一个扩展 NumPy 和 Pandas 接口的大数据工具,支持多种后端,便于数据查询和转换。WebGPT 在浏览器中运行 GPT 模型,支持高达 500M 参数的模型。ai-exploits 收集机器学习工具的漏洞,帮助安全专家识别脆弱性。Pandas 是强大的数据分析库,支持灵活的数据处理和统计功能。

强大的数据分析工具:轻松处理、转换、可视化 | 开源日报 No.833

开源服务指南
开源服务指南 · 2025-12-26T07:35:39Z
即使是初学者也能在Python中处理大数据集的方法

使用Python处理大数据集不需要高级技能。通过分块读取、选择特定列和优化数据类型等技术,可以有效管理超出内存限制的数据集,适合初学者,提高数据处理效率。

即使是初学者也能在Python中处理大数据集的方法

KDnuggets
KDnuggets · 2025-12-17T15:23:55Z
谷歌云的Elastic Cloud Serverless全球扩展

谷歌云的Elastic Cloud Serverless在新加坡、伦敦、法兰克福和荷兰四个新地区上线,全球总计10个地区。该服务具备自动扩展的无状态架构,支持最新AI和搜索功能,简化管理并提升性能,适合处理大数据和复杂查询。

谷歌云的Elastic Cloud Serverless全球扩展

Elastic Blog - Elasticsearch, Kibana, and ELK Stack
Elastic Blog - Elasticsearch, Kibana, and ELK Stack · 2025-12-16T08:00:00Z
Fluid - 一个开源的Kubernetes原生分布式数据集调度器和…

Fluid是一个开源项目,提供Kubernetes原生的数据抽象和加速,适用于大数据和AI应用。它整合异构存储为统一的数据集,提升I/O性能和延迟,支持分布式缓存和自动化数据操作,适合大规模训练和数据分析。

Fluid - 一个开源的Kubernetes原生分布式数据集调度器和…

云原生
云原生 · 2025-12-08T07:37:09Z

在大数据课上,作者尝试部署Hue可视化工具,遇到Docker镜像编译和DNS问题。尽管官方支持ARM,但未提供相应镜像。作者通过调整DNS和网络设置解决了问题,最终成功运行Hue,体验到技术的乐趣。

放弃吧?不!Hue 在 Linux ARM64 上的绝境求生指南

九仞之行
九仞之行 · 2025-11-30T12:05:45Z
大数据成矿预测系列(九) | 数据的“自我画像”:自编码器如何实现非监督下的“特征学习”

自编码器在地质勘查中广泛应用,尤其在异常识别方面。深度自编码器(DAE)通过无监督学习和非线性特征提取,有效处理复杂地质数据,识别潜在成矿模式,推动成矿预测的发展。

大数据成矿预测系列(九) | 数据的“自我画像”:自编码器如何实现非监督下的“特征学习”

Seraphineの小窝
Seraphineの小窝 · 2025-11-11T11:12:45Z
大数据成矿预测系列(八) | 从定性到概率:逻辑回归——地质统计学派的“集大成者”

证据权重法(WofE)在成矿预测中应用广泛,但常违反独立性假设。逻辑回归(LR)作为一种强大的统计方法,克服了这一局限,允许变量间相关性,提供更稳健的预测。LR模型通过logit变换建模成矿概率,具备良好的可解释性和处理复杂关系的能力,适应现代地质数据分析需求。

大数据成矿预测系列(八) | 从定性到概率:逻辑回归——地质统计学派的“集大成者”

Seraphineの小窝
Seraphineの小窝 · 2025-11-08T12:48:22Z

在C#编程中,`yield return`与`return`不同,前者支持惰性生成数据,适合处理大数据集和实时数据流。使用`yield return`时,方法逐个返回值,降低内存占用和延迟,适合无限序列或逐行读取文件。

深入解析C#中的yield return:为什么它比return更高效?

dotNET跨平台
dotNET跨平台 · 2025-11-07T23:57:26Z
大数据成矿预测系列(七) | 经典模型的“孪生兄弟”:信息量法 (IVM) 深度解析

信息量法(IVM)是矿产资源定量预测的经典方法,最早由前苏联学者提出,后在中国应用。IVM通过计算地质因素对成矿事件的信息量来评估矿产潜力,其核心公式基于条件概率,强调地质因素的影响。尽管IVM透明且数据需求较低,但存在条件独立性假设和因素选择的主观性等局限性。

大数据成矿预测系列(七) | 经典模型的“孪生兄弟”:信息量法 (IVM) 深度解析

Seraphineの小窝
Seraphineの小窝 · 2025-11-05T11:56:40Z

信息量法(IVM)是一种经典的矿产资源定量预测方法,源于前苏联,广泛用于地质灾害评估。其核心基于贝叶斯理论,通过计算地质因素对成矿事件的信息量,识别高潜力勘探区。IVM具有透明性和较低的数据需求,但受限于条件独立性假设和主观因素选择。

大数据成矿预测系列(七) | 经典模型的“孪生兄弟”:信息量法 (IVM) 深度解析

Seraphineの小窝
Seraphineの小窝 · 2025-11-05T11:56:40Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码