小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
沉浸式翻译 immersive translate
Nvidia DGX Spark:新一代开发者指南

Nvidia DGX Spark是一款紧凑型AI工作站,支持高达200亿参数的模型开发,提供本地AI计算,消除云计算的延迟和成本。其统一内存架构和完整软件栈使开发者能够快速迭代和测试模型,适合AI研究、数据科学和教育。

Nvidia DGX Spark:新一代开发者指南

The New Stack
The New Stack · 2026-01-16T14:00:00Z

Declarative pipelines give teams an intent driven way to build batch and streaming workflows...

From Chaos to Scale: Templatizing Spark Declarative Pipelines with DLT-META

Databricks
Databricks · 2026-01-07T22:45:00Z
NVIDIA DGX Spark和DGX Station助力最新开源和前沿模型在桌面上运行

NVIDIA推出DGX Spark和DGX Station,支持开发者在桌面上运行最新开源AI模型,具备强大的AI性能,适用于医疗、机器人等行业,推动本地AI开发与创新。

NVIDIA DGX Spark和DGX Station助力最新开源和前沿模型在桌面上运行

NVIDIA Blog
NVIDIA Blog · 2026-01-05T22:49:06Z

Apache Spark 4.1 continues the Spark 4.x momentum with a release focused on higher-level...

Introducing Apache Spark® 4.1

Databricks
Databricks · 2025-12-22T20:48:26Z
播客:如何使用Apache Spark构建多年度数据回归测试与模拟框架

Vivek Yadav分享了他在Stripe构建基于多年数据的测试系统的经验,强调使用Apache Spark进行回归测试,以确保系统迁移的安全性和准确性。他指出,通过将服务逻辑组织为库,并利用Spark的并行处理能力,可以高效处理大量数据,确保代码更改的正确性。

播客:如何使用Apache Spark构建多年度数据回归测试与模拟框架

InfoQ
InfoQ · 2025-11-26T11:00:00Z
【Agentic AI for Data系列】Kiro实战:DuckDB vs Spark技术选型全流程

本文比较了DuckDB与Spark的技术选型,发现DuckDB在处理小文件时速度比Spark快90.4%。通过Agentic AI的Kiro助手,利用自然语言交互自动生成测试方案和代码,显著提高了选型效率,缩短了传统选型周期。

【Agentic AI for Data系列】Kiro实战:DuckDB vs Spark技术选型全流程

亚马逊AWS官方博客
亚马逊AWS官方博客 · 2025-10-31T06:02:47Z
英伟达个人AI超级计算机DGX Spark将在10月15日开售 零售价高达3999美元

英伟达将于10月15日发售DGX Spark个人AI超级计算机,售价从3000美元调整为3999美元。该设备配备GB10芯片、128GB内存和4TB SSD,支持处理2000亿参数的AI模型,适合开发者和数据科学家使用。

英伟达个人AI超级计算机DGX Spark将在10月15日开售 零售价高达3999美元

蓝点网
蓝点网 · 2025-10-14T03:37:43Z
埃隆·马斯克获得刚刚发布的NVIDIA DGX Spark:百亿次运算的AI超级计算机落户SpaceX

NVIDIA首席执行官黄仁勋在德克萨斯州Starbase向埃隆·马斯克展示了全球最小的AI超级计算机DGX Spark,该设备每秒可进行千万亿次运算,适合开发者和研究人员,推动AI革命。DGX Spark将于10月15日上市。

埃隆·马斯克获得刚刚发布的NVIDIA DGX Spark:百亿次运算的AI超级计算机落户SpaceX

NVIDIA Blog
NVIDIA Blog · 2025-10-14T00:31:39Z
无版本Apache Spark™的探讨:AI驱动的升级与20亿个工作负载的无缝稳定性

Databricks推出无版本Spark,简化了Apache Spark的升级过程,实现持续升级、零代码更改和卓越稳定性。过去18个月,该系统自动升级了超过20亿个Spark工作负载,用户无需干预。通过稳定的公共API和AI驱动的回滚机制,确保了安全性和性能更新。

无版本Apache Spark™的探讨:AI驱动的升级与20亿个工作负载的无缝稳定性

Databricks
Databricks · 2025-10-07T16:00:00Z

本实验使用Apache Spark进行商品推荐,结合用户行为数据,运用协同过滤和矩阵分解算法,完成数据预处理、模型训练和系统优化。面向开发者和学生,预计90分钟完成,资源免费。通过安装Java、Hadoop和Spark,开发者可掌握推荐算法的实现与应用。

基于华为开发者空间,使用Apache Spark实现商品推荐算法

华为云官方博客
华为云官方博客 · 2025-09-04T02:55:29Z
如何使用Apache Spark读取和写入深层分区文件

本文介绍了如何使用Apache Spark高效导出深层嵌套数据文件,保留分区文件夹。通过input_file_name()、regexp_extract()和partitionBy() API,可以提取并分区保存年份、月份、日期和小时等辅助列。

如何使用Apache Spark读取和写入深层分区文件

freeCodeCamp.org
freeCodeCamp.org · 2025-08-31T21:23:23Z
在Apache Spark™结构化流处理中引入实时模式

Apache Spark的实时模式支持毫秒级超低延迟处理,适用于欺诈检测和个性化推荐等应用。用户只需简单配置,无需重写代码。该模式已在Databricks公开预览,提升了业务响应速度。

在Apache Spark™结构化流处理中引入实时模式

Databricks
Databricks · 2025-08-19T20:15:00Z
Lightcraft Technology 宣布推出其 Spark AI 驱动平台,开启前后期协作

Lightcraft Technology推出的Spark AI驱动平台,包含Spark Shot、Spark Live、Spark Atlas和Spark Forge四个部分,旨在简化电影制作流程并支持实时协作,预计明年发布。

Lightcraft Technology 宣布推出其 Spark AI 驱动平台,开启前后期协作

实时互动网
实时互动网 · 2025-08-12T02:32:12Z
LWiAI播客第218期 - GitHub Spark、MegaScience、美国AI行动计划

本期节目讨论了上周的AI新闻,包括GitHub推出的Vibe Coding、Gemini CLI及RepliIt用户数据问题,以及美国发布的AI行动计划和新数据集评估AI能力。

LWiAI播客第218期 - GitHub Spark、MegaScience、美国AI行动计划

Last Week in AI
Last Week in AI · 2025-07-31T16:14:30Z
从Hadoop到Kubernetes:Pinterest在AWS EKS上的可扩展Spark架构

Pinterest将Hadoop数据平台替换为基于Kubernetes的Moka系统,运行Spark于AWS EKS。Moka支持容器化作业隔离和ARM实例,提升调度效率并降低基础设施成本。Pinterest还开发了新服务,使用Apache YuniKorn进行调度,迁移存储至S3,并整合Apache Celeborn以维持性能。Moka通过资源管理和动态优先级调度优化数据处理工作负载。

从Hadoop到Kubernetes:Pinterest在AWS EKS上的可扩展Spark架构

InfoQ
InfoQ · 2025-07-28T11:30:00Z
在Google Cloud上使用Apache Iceberg和Apache Spark构建现代数据湖屋

Apache Iceberg与Apache Spark结合,构建现代数据湖,提供事务一致性、模式演变和高性能。Iceberg解决传统数据湖的缺陷,支持ACID特性和智能分区管理,而Spark则优化查询性能,适合大数据分析。两者结合提升数据管理与分析效率。

在Google Cloud上使用Apache Iceberg和Apache Spark构建现代数据湖屋

KDnuggets
KDnuggets · 2025-07-08T17:00:12Z
从Spark SQL到Databricks的声明式管道

2013年,迈克尔·阿姆布鲁斯在Databricks开始开发Spark SQL。2023年,他宣布将两个平台技术开源至Apache Spark,显示Databricks对Spark的持续关注。Spark自2009年由Matei Zaharia创建,成为分布式机器学习平台。Databricks还开源了Declarative Pipeline和实时模式技术,以提升数据流处理能力,致力于保持开源基础并发展专有平台,增强市场竞争力。

从Spark SQL到Databricks的声明式管道

The New Stack
The New Stack · 2025-07-07T20:08:15Z
Databricks将Spark声明式管道贡献给Apache Spark

在旧金山的Databricks Data+AI峰会上,Databricks宣布将Delta Live Tables技术贡献给Apache Spark,命名为Spark Declarative Pipelines。这一新特性将简化流式管道的开发与维护,支持使用SQL或Python SDK定义数据流,预计将在2026年1月的Spark 4.10版本中发布。

Databricks将Spark声明式管道贡献给Apache Spark

InfoQ
InfoQ · 2025-07-03T13:00:00Z
基于大模型和Spark的B站数据分析

本文介绍了基于Spark和Python的B站数据处理与分析实验,包括环境搭建、Hadoop和Spark安装、数据采集及代码组织,强调了AI工具在编程中的应用。

基于大模型和Spark的B站数据分析

厦大数据库实验室博客
厦大数据库实验室博客 · 2025-06-28T05:58:06Z
将声明式管道引入Apache Spark™开源项目

Apache Spark已成为大数据处理的核心引擎,4.0版本在流处理、Python和SQL方面取得重大进展。新增的声明式管道功能简化了数据管道构建,用户只需定义最终状态,Spark自动处理依赖关系和增量处理,从而提升生产力和可维护性。

将声明式管道引入Apache Spark™开源项目

Databricks
Databricks · 2025-06-12T08:48:42Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码