小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
主机数据迁移中选择ETL的五个错误理由

ELT是一种数据集成过程,将原始数据从源服务器传输到目标服务器上的数据系统,然后准备信息以供下游使用。相比之下,ETL过于复杂、劳动密集、成本高,不适合处理非结构化数据,也容易成为功能和计算瓶颈。ELT更加灵活,适合处理大量数据,特别是在云端和数据湖中进行分析,正在成为IT组织实现现代化和最大化现有投资价值的关键工具。

主机数据迁移中选择ETL的五个错误理由

BMC Software | Blogs
BMC Software | Blogs · 2026-03-30T13:51:33Z
为什么数据系统的“圣经”将在2026年进行大规模重写

《设计数据密集型应用》第二版即将出版,作者Martin Kleppmann与Chris Riccomini探讨了云原生架构和AI对数据库架构的影响。书中将更新存储引擎和查询优化等内容,以适应现代数据系统的变化,强调未来数据库需具备灵活性,能够在不同环境中扩展。

为什么数据系统的“圣经”将在2026年进行大规模重写

The New Stack
The New Stack · 2026-03-04T13:00:20Z
播客:Somtochi Onyekwere谈分布式数据系统、最终一致性与无冲突复制数据类型

在本期播客中,Srini与Fly.io的软件工程师Somtochi讨论了分布式数据系统的最新进展,重点介绍了最终一致性和快速复制的实现。Somtochi介绍了Corrosion框架,强调了速度与一致性之间的权衡,以及如何利用无冲突复制数据类型(CRDT)解决数据冲突并确保数据质量。

播客:Somtochi Onyekwere谈分布式数据系统、最终一致性与无冲突复制数据类型

InfoQ
InfoQ · 2026-01-12T11:00:00Z
特朗普正在招募科技巨头的员工为政府服务

特朗普政府计划招募约1000名来自科技巨头的技术专家,成立美国科技力量(US Tech Force),以现代化联邦政府,专注于加速人工智能应用、提升政府效率及开发现代化数据系统。

特朗普正在招募科技巨头的员工为政府服务

The Verge
The Verge · 2025-12-15T19:18:48Z

谷歌承诺投资225万美元,与联合国经济委员会合作,推动非洲公共数据系统现代化,建立区域数据共享平台,并为国家统计局提供AI培训和技术支持,以促进粮食安全和经济发展。

谷歌承诺投资225万美元,支持非洲的AI准备数据

The Keyword
The Keyword · 2025-11-17T08:30:00Z
为什么你的“快速行动与破坏事物”数据摄取管道在资助AWS,而不是你的业务

文章指出,使用Python等解释型语言构建高吞吐量数据系统可能导致性能瓶颈和高成本,开发者常推迟优化,最终导致系统崩溃。相比之下,使用Rust、Go等编译型语言的团队能更高效地处理数据,减少错误和资源消耗。建议开发者审计现有系统,逐步用更可靠的语言重写关键部分。

为什么你的“快速行动与破坏事物”数据摄取管道在资助AWS,而不是你的业务

DEV Community
DEV Community · 2025-04-23T18:12:14Z
《设计数据密集型应用》:第一章 - 数据系统的基础

本文总结了《设计数据密集型应用》第一章,指出可靠性、可扩展性和可维护性是数据系统的三大支柱。现代应用面临数据处理挑战,作者探讨了构建稳健系统的方法,并强调技术与用户体验的紧密关系。

《设计数据密集型应用》:第一章 - 数据系统的基础

DEV Community
DEV Community · 2025-04-18T08:31:57Z
理解数据管道:现代数据系统的支柱

数据管道自动化了数据的移动和转换,涵盖数据源、摄取、转换、存储和目标等核心阶段。它提高了效率、可扩展性和数据质量,但也面临复杂性、成本和安全等挑战。低代码平台和AI增强管道的新趋势正在改变数据工程,使其成为组织的重要资产。

理解数据管道:现代数据系统的支柱

DEV Community
DEV Community · 2025-04-06T21:13:37Z

本研究提出了一个统一的工业人工智能基础框架,解决了算法、模型与领域知识、数据系统集成不足的问题。框架包括知识模块、数据模块和模型模块,旨在提升工业应用的有效性,并通过旋转机械诊断案例验证其有效性。

Rethinking Industrial Artificial Intelligence: A Unified Foundation Framework

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-02T00:00:00Z

本文探讨了当前数据系统被动使用大型语言模型的局限,建议通过主动理解用户输入和数据特征来提升效率与有效性,并展示了实际应用案例及未来研究方向。

基于大型语言模型的主动数据系统

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-18T00:00:00Z
Cisco 使用 Apache DolphinScheduler 在 AWS 构建大数据系统实践

Apache DolphinScheduler是一个分布式可视化任务调度开源系统,解决大数据任务依赖和数据研发ETL依赖复杂的问题。Cisco数据团队基于DolphinScheduler进行二次开发,与AWS云上的资源特性深度融合,增加了资源依赖和存储管理、Docker镜像管理、安全访问和权限管理、自动化云上资源管理等新功能。未来计划优化镜像推送、一键同步功能、自动映射至Auth系统和权限控制。

Cisco 使用 Apache DolphinScheduler 在 AWS 构建大数据系统实践

亚马逊AWS官方博客
亚马逊AWS官方博客 · 2024-08-06T10:33:54Z
2. DDIA-分布式数据系统-笔记

本文讨论了分布式数据系统中的关键概念和挑战,包括数据复制、复制滞后、多主节点复制/无主节点复制、数据分区、分区与二级索引、分区再平衡、请求路由、事务、分布式系统的挑战、一致性与共识。文章提到了主从复制、两阶段提交和Raft等常见技术方案和算法。

2. DDIA-分布式数据系统-笔记

Ying’s Blog
Ying’s Blog · 2024-08-03T12:16:21Z
1. DDIA-数据系统基础-笔记

本文讨论了数据系统基础的可靠性、可扩展性、可维护性、数据模型与查询语言、数据存储与检索、数据编码与演化等方面。介绍了经典的数据结构和索引结构,以及不同的数据存储和查询方式。同时还涉及了数据编码和数据交流的相关概念。

1. DDIA-数据系统基础-笔记

Ying’s Blog
Ying’s Blog · 2024-07-20T12:16:21Z
结合数据管理与数据叙事以创造价值

本文讨论了从数据叙事的角度重新审视数据管理的问题,强调了数据管理系统和元数据的重要性,提出了将数据管理和数据叙事相结合的方法,以及人的角色在数据管理和数据叙事中的重要性。

结合数据管理与数据叙事以创造价值

KDnuggets
KDnuggets · 2024-05-23T16:00:52Z

人工智能的进步由深度神经网络推动,但存在计算轨迹、鲁棒性和解释性问题。神经符号人工智能 (NSAI) 结合神经、符号和概率方法,提高可解释性、鲁棒性和可信度,并能从少量数据中学习。最近的NSAI系统在协作人工智能场景中展示了潜力。本文综述了NSAI的最新进展,分析了其性能特征和计算操作符,并讨论了面临的挑战和未来方向。

NeurDB: 一款基于人工智能的自主数据系统

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-05-07T00:00:00Z
可组合数据系统之路:对过去 15 年和未来的思考

2024年3月11日,一篇关于可组合数据管理系统VLDB的论文已发布,探讨了数据科学的发展和数据分析工具的演变,以及当前面临的挑战。文章介绍了一些与数据管理和分析相关的开源项目,如Apache Arrow、RAPIDS、DuckDB和Ibis等,致力于提高数据交换、查询执行和编程接口的模块化和互操作性。作者对未来的发展持乐观态度,并预测将出现新一轮的用户界面生产力投资浪潮。

可组合数据系统之路:对过去 15 年和未来的思考

姬涛
姬涛 · 2024-03-11T00:00:00Z

【翻译】文章出自 pandas 库兼《Python数据分析》一书的作者 Wes McKinney,回顾了他从 2008 年以来在数据科学领域所做的事情和转变,同时分析和思考了模块化、互操作性和可组合性的未来趋势。

可组合数据系统之路:对过去 15 年和未来的思考

姬涛
姬涛 · 2024-03-11T00:00:00Z

NASA发现旅行者1号探测器的飞行数据系统(FDS)故障,无法传送数据。怀疑是内存损坏,但缺乏工程资料和模拟器。旅行者1号仍能接收指令,未来或有转机。

旅行者1号仍然没有恢复工作 初步检查疑似是飞行数据系统内存损坏

蓝点网
蓝点网 · 2024-02-07T23:30:52Z

本文探讨了知识驱动的自动驾驶技术,强调了数据偏差敏感性、处理长尾场景的困难和缺乏可解释性等限制。知识驱动方法被视为克服这些挑战的有希望途径。通过利用大型语言模型、世界模型、神经渲染和其他人工智能技术,梳理了该领域的先前研究工作,并为未来自动驾驶的研究和实际应用提供了洞见和指导。

数据中心化的自动驾驶进化:大数据系统、数据挖掘和闭环技术的综合调查

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-01-23T00:00:00Z

本文从数据的角度思考了软件研发效能(DevOps)的提升过程,认为DevOps是一个基于广义流水线的系统性结构,通过迭代式的构建和持续交付体现数据价值。文章还讨论了研发过程中的设计、问题域与方案域的交互、产品设计、测试用例设计、微服务拆分、团队协作、实施过程中的自动化和协作化、沟通机制、敏捷测试、数据安全等内容。最后,作者认识到在数据时代,DevOps将得到更广泛的应用。

从数据系统的角度思考研发效能(DevOps)的提升丨IDCF

dotNET跨平台
dotNET跨平台 · 2023-12-16T01:13:35Z
  • <<
  • <
  • 1 (current)
  • 2
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码