小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
沉浸式翻译 immersive translate

本文探讨了数据角色的演变、支持训练和推理的关键流程,以及新架构(如RAG)在应用程序构建中的定义,适合初学者数据科学家理解其在新范式中的定位。

大语言模型时代的数据工程

KDnuggets
KDnuggets · 2026-03-02T15:00:37Z
以AI为首的数据工程方法:Lakeflow与Agent Bricks

巴西银行Banco Bradesco的数据工程团队通过使用Databricks Assistant,将编码时间减少了50%,使技术和非技术用户能够通过自然语言生成和调试代码,从而提升了生产力、降低了成本,并加快了数据驱动决策的速度。

以AI为首的数据工程方法:Lakeflow与Agent Bricks

Databricks
Databricks · 2026-02-24T20:14:45Z
Spark 声明式管道:数据工程为何需要实现端到端的声明式

数据工程团队面临快速交付高质量数据的压力,但构建和操作数据管道变得更加困难。数据工程师大多时间用于处理工具的操作负担,而非编写代码。现有框架需要手动处理数据处理、质量和回填等任务,导致数据工程成为瓶颈。Spark声明式管道(SDP)通过声明整个管道,简化数据处理,提高生产力和成本效益,降低操作负担。

Spark 声明式管道:数据工程为何需要实现端到端的声明式

Databricks
Databricks · 2026-02-23T21:40:00Z
在Azure Databricks上使用Lakeflow现代化您的数据工程平台

数据工程师在构建生产就绪管道时面临挑战。Lakeflow在Azure Databricks上提供统一的数据工程解决方案,集成数据摄取、转换和编排,简化开发流程,提高数据质量和安全性,帮助团队更高效地工作。

在Azure Databricks上使用Lakeflow现代化您的数据工程平台

Databricks
Databricks · 2026-02-10T19:54:19Z
什么是数据工程?

数据工程是将原始数据转化为可用信息的过程,涵盖数据管道、存储和处理。数据管道自动化数据的移动与转换,确保数据的可靠性。数据类型包括结构化、非结构化和半结构化。数据工程生命周期包括数据生成、摄取、存储、处理和服务。ETL和ELT是常见的数据集成方法,现代数据工程依赖云平台和大数据工具,以支持实时分析和机器学习。

什么是数据工程?

Databricks
Databricks · 2026-02-03T18:40:00Z
2026年数据工程的五大新兴趋势

到2026年,数据工程将重心转向数据管道的设计与管理,关键趋势包括平台化数据基础设施、事件驱动架构、AI辅助工程、数据合同治理及成本意识。这些变化将促进数据团队在所有权、合同和经济学方面的成熟,提高数据质量与效率。

2026年数据工程的五大新兴趋势

KDnuggets
KDnuggets · 2025-12-23T13:00:52Z
从ETL到自主性:2026年的数据工程

数据工程正在转型,工程师角色从构建者转向战略家,承担更高层次的责任。AI的成熟和数据复杂性推动了这一变化。到2026年,数据工程师将与AI协作,专注于业务决策,采用开放数据格式以提升灵活性,并在元数据层面建立领导地位。成功企业将视数据工程师为关键合作伙伴,以推动竞争优势。

从ETL到自主性:2026年的数据工程

The New Stack
The New Stack · 2025-12-19T20:00:19Z
推出Databricks GenAI合作伙伴加速器,助力数据工程与迁移

企业面临现代化数据架构的压力,需摆脱传统ETL系统,采用更简单、可扩展的架构。许多组织仍依赖手动代码转换和复杂的数据管道,导致迁移缓慢,影响AI采用。Databricks通过GenAI加速器,利用智能代理生成SQL和Python代码,优化数据管道,简化数据工程和迁移,提高效率,助力企业快速现代化数据操作。

推出Databricks GenAI合作伙伴加速器,助力数据工程与迁移

Databricks
Databricks · 2025-12-09T22:00:00Z
Nexla推出Express:一个用于AI数据工程的对话式平台

Nexla推出了Express,一个对话式数据工程平台,用户可通过自然语言描述数据需求,系统自动发现和转换数据源,无需手动编码。该平台适合开发者、分析师和业务用户,旨在加速AI数据准备,提高企业效率。

Nexla推出Express:一个用于AI数据工程的对话式平台

InfoQ
InfoQ · 2025-11-22T12:00:00Z
数据工程如何推动制造业转型

制造业正经历变革,智能技术使工厂数据激增。数据工程服务通过整合和分析数据,帮助制造商优化运营、降低成本、提升竞争力。尽管许多企业仍依赖传统维护策略,数据驱动的决策能提高效率,减少设备故障和停机时间。

数据工程如何推动制造业转型

KDnuggets
KDnuggets · 2025-11-20T18:00:45Z
在Databricks上构建数据管道的新方式:推出数据工程IDE

在今年的Data + AI峰会上,我们推出了数据工程IDE,旨在简化数据管道开发。该IDE集成了声明式编程、模块化结构和AI辅助功能,支持快速构建、调试数据管道,提升开发效率。

在Databricks上构建数据管道的新方式:推出数据工程IDE

Databricks
Databricks · 2025-11-19T20:00:00Z

对于PaddleOCR-VL-0.9B这样支持109种语言、涵盖四大元素识别的多模态模型,其背后必然有一套强大而精密的数据生产体系。正是这座高效运转的“数据工厂”,为PaddleOCR-VL的卓越性能提供了源源不断的“优质食粮”,使其真正具备了解决现实世界复杂问题的能力。:利用丰富的字体库、CSS样式库和语料库,结合渲染引擎(如XeLaTeX、浏览器),低成本、大批量地生成所需数据和对应的标...

如何构建3000万+高质量训练数据?PaddleOCR-VL数据工程全解析

百度大脑
百度大脑 · 2025-10-19T09:01:58Z
10个实用的Python一行代码用于数据工程

本文介绍了如何通过一行Python代码简化数据工程任务,包括事件数据处理、系统日志分析、API响应处理和数据质量检查。示例代码展示了提取JSON字段、识别性能异常和计算API响应时间的滚动平均等实用技巧,帮助数据工程师高效解决实际问题。

10个实用的Python一行代码用于数据工程

KDnuggets
KDnuggets · 2025-09-25T12:00:12Z
InfoQ 人工智能、机器学习与数据工程趋势报告 - 2025

物理人工智能将成为AI技术的新前沿,AI正从助手转变为软件的共同创造者,推动开发、测试和部署的新阶段。人机交互需关注真实需求,设计符合生活的技术。新协议如模型上下文协议将促进AI应用的互操作性,AI代理和多模态语言模型的创新不断涌现,物理AI在机器人领域取得显著进展。

InfoQ 人工智能、机器学习与数据工程趋势报告 - 2025

InfoQ
InfoQ · 2025-09-24T11:05:00Z
播客:InfoQ 2025年AI、机器学习与数据工程趋势报告

InfoQ的AI、机器学习和数据工程团队讨论了未来12个月的AI和ML趋势,专家们分享了生成式AI和大型语言模型的最新进展,强调了人机交互的变化及AI在设计中的应用。随着技术进步,AI将更好地融入日常生活,提升用户体验。

播客:InfoQ 2025年AI、机器学习与数据工程趋势报告

InfoQ
InfoQ · 2025-09-24T11:00:00Z
Netflix如何重新构想视频、音频和文本的数据工程

Netflix推出媒体机器学习数据工程专业,建立媒体数据湖以处理视频、音频、文本和图像资产。此方法支持在媒体内容上直接进行机器学习,提升模型质量和工作流程洞察。数据工程团队与领域专家合作,确保技术满足创意需求,推动新创意和流程发展。

Netflix如何重新构想视频、音频和文本的数据工程

InfoQ
InfoQ · 2025-08-25T14:00:00Z
人工智能时代的数据工程:现在需要掌握的技能

代理人工智能已成为现实,预计到2025年将增长48%。数据工程师需掌握事件驱动架构、精确检索和反馈循环等关键技能,以适应实时数据流和自主决策的需求,支持高效的AI系统。

人工智能时代的数据工程:现在需要掌握的技能

The New Stack
The New Stack · 2025-07-25T17:00:12Z
Rust在数据工程中超越Python和Java

Rust编程语言在企业数据管道中表现突出,提供高达17倍的性能提升和70%的成本降低。与Python和Java相比,Rust在内存安全和效率方面具有明显优势,能够处理敏感数据并降低漏洞风险。尽管生态系统尚不成熟,但其开发速度和代码质量的提升使其在数据工程中越来越受欢迎。

Rust在数据工程中超越Python和Java

The New Stack
The New Stack · 2025-06-19T20:00:18Z
什么是Vibe数据工程?定义、特点与应用案例(2025指南)

Vibe数据工程是一种新兴的数据工程模式,利用大型语言模型(LLMs)通过自然语言自动化数据生命周期,降低非技术用户的使用门槛,提升数据探索与分析的效率。它结合AI自动化与人类指导,适用于各行业,增强团队协作与创新能力。

什么是Vibe数据工程?定义、特点与应用案例(2025指南)

DEV Community
DEV Community · 2025-05-28T06:48:05Z
数据工程职位面试中需避免的常见错误(以及如何成功应对)

成功获得数据工程职位面试后,避免常见错误至关重要。掌握SQL基础、清晰描述ETL流程、理解数据仓库与数据湖的区别、设计系统、准备行为问题答案,并将技术与业务结合。通过模拟面试提升沟通与解决问题的能力,以确保在面试中脱颖而出。

数据工程职位面试中需避免的常见错误(以及如何成功应对)

DEV Community
DEV Community · 2025-05-16T06:38:24Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码