小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
沉浸式翻译 immersive translate
Pinterest通过内部调度系统实现Hadoop集群的自动扩展和迁移

Pinterest推出了Hadoop控制中心(HCC),旨在自动化管理Hadoop集群的扩展和迁移,简化操作复杂性。HCC通过统一命令行接口实现实时调整,确保数据完整性和服务连续性,并计划增加自动修复和生命周期管理功能,以提升基础设施的自主性和弹性。

Pinterest通过内部调度系统实现Hadoop集群的自动扩展和迁移

InfoQ
InfoQ · 2025-07-31T10:00:00Z
从Hadoop到Kubernetes:Pinterest在AWS EKS上的可扩展Spark架构

Pinterest将Hadoop数据平台替换为基于Kubernetes的Moka系统,运行Spark于AWS EKS。Moka支持容器化作业隔离和ARM实例,提升调度效率并降低基础设施成本。Pinterest还开发了新服务,使用Apache YuniKorn进行调度,迁移存储至S3,并整合Apache Celeborn以维持性能。Moka通过资源管理和动态优先级调度优化数据处理工作负载。

从Hadoop到Kubernetes:Pinterest在AWS EKS上的可扩展Spark架构

InfoQ
InfoQ · 2025-07-28T11:30:00Z
Big Data Processing - Case Study 4 (Hadoop)

Big Data Processing - Case Study 4 (Hadoop)

DEV Community
DEV Community · 2025-05-01T11:04:47Z
【Hadoop仿真】如何在仿真NodeManager中实现心跳

Hadoop项目通过构建大量虚假NodeManager节点,模拟ResourceManager的压力场景。NodeManager的主要功能包括向ResourceManager注册、初始化RPC和HTTP服务、发送心跳信息等。心跳是NodeManager与ResourceManager之间的核心功能,包含节点状态和资源信息。

【Hadoop仿真】如何在仿真NodeManager中实现心跳

小令童鞋
小令童鞋 · 2025-04-24T15:31:32Z
Hadoop Yarn的ResourceManager压测指南

Hadoop项目通过构建大量虚假节点(Fake NM)来模拟ResourceManager的压力,以优化性能。主要模块包括Fake NM和SLSRunner,分别负责容器管理和压力测试作业。配置文件需根据实际情况调整,运行后可进行性能测试。

Hadoop Yarn的ResourceManager压测指南

小令童鞋
小令童鞋 · 2025-04-13T10:35:50Z
将Hadoop工作负载迁移到AWS:从本地HDFS、Spark、Kafka和Airflow迁移到AWS S3、Iceberg和EMR

许多企业仍在使用本地Hadoop进行大数据处理,但面临高运营成本和可扩展性问题。本文提供了迁移到AWS S3、Apache Iceberg和EMR的六步指南,包括架构图、代码示例和最佳实践,以降低成本并提升性能。

将Hadoop工作负载迁移到AWS:从本地HDFS、Spark、Kafka和Airflow迁移到AWS S3、Iceberg和EMR

DEV Community
DEV Community · 2025-04-11T11:05:59Z
Hadoop的核心组件HDFS和MapReduce是如何运作的?

Hadoop是一个开源框架,专门用于处理大数据。其核心组件HDFS负责数据存储,MapReduce负责数据处理,二者通过主从架构和并行计算实现高可用性和容错性。Hadoop还可与Cassandra等数据库集成,增强数据处理能力。

Hadoop的核心组件HDFS和MapReduce是如何运作的?

DEV Community
DEV Community · 2025-03-11T21:31:15Z
Hadoop的核心组件HDFS和MapReduce是如何运作的?

Hadoop是一个开源框架,专为分布式存储和处理大数据设计。其核心组件HDFS用于存储大文件,MapReduce用于并行处理数据。HDFS通过主从架构确保数据可靠性,MapReduce通过并行计算提高处理速度,二者结合使Hadoop在大数据处理上高效灵活。

Hadoop的核心组件HDFS和MapReduce是如何运作的?

DEV Community
DEV Community · 2025-03-11T21:01:25Z
什么是Hadoop,它是如何高效处理大数据的?

在数字数据迅速增长的时代,管理大数据成为挑战。Apache Hadoop是一个开源框架,能够高效存储和处理大数据,具备分布式计算、可扩展性、容错性和数据本地化等优势,支持多种数据源和格式,是企业数据分析的重要工具。

什么是Hadoop,它是如何高效处理大数据的?

DEV Community
DEV Community · 2025-03-11T00:28:06Z
Apache Hadoop:大数据领域的开源创新先锋

Apache Hadoop是一个开源框架,改变了企业大数据管理和分析的方式。它通过分布式文件系统和MapReduce模型实现可扩展计算。Hadoop的成功依赖于多样化的资金模式、灵活的Apache许可证和活跃的社区支持,促进了创新和透明治理。

Apache Hadoop:大数据领域的开源创新先锋

DEV Community
DEV Community · 2025-03-07T04:00:39Z

Idea Hadoop 源码YarnServiceProtos无法补全问题

小令童鞋
小令童鞋 · 2024-12-01T11:57:17Z

Idea Hadoop 源码YarnServiceProtos无法补全问题

小令童鞋
小令童鞋 · 2024-12-01T11:57:17Z
如何在Hadoop MapReduce中处理多种数据类型?

Hadoop是一个处理大规模数据的平台,支持多种数据类型,包括基本数据类型和复杂数据类型。通过有效管理这些数据,用户可以设计高效的MapReduce应用,处理各种数据格式,提取有价值的洞察。

如何在Hadoop MapReduce中处理多种数据类型?

DEV Community
DEV Community · 2024-11-28T23:32:27Z

本文介绍了使用Hadoop框架进行分布式计算的WordCounter案例,重点讲解了通过MapReduce编程统计文本文件中单词频率的过程,强调了分布式计算和存储的重要性,以及环境配置和代码实现的细节。

零基础入门Hadoop:IntelliJ IDEA远程连接服务器中Hadoop运行WordCount - 努力的小雨

努力的小雨
努力的小雨 · 2024-11-16T01:06:00Z
Databricks与Hadoop:哪个平台更适合预测分析?

随着数据驱动决策的需求增加,预测分析成为企业竞争的重要工具。Databricks和Hadoop是常用的数据处理平台,各有优缺点。Databricks适合实时分析和机器学习,支持协作和云扩展;而Hadoop擅长大规模数据存储和批处理,适合历史分析。选择平台应根据需求:实时分析和机器学习选择Databricks,数据存储和批处理选择Hadoop。

Databricks与Hadoop:哪个平台更适合预测分析?

DEV Community
DEV Community · 2024-11-13T09:02:15Z
揭开Hadoop中分布式缓存的秘密

现代探险者在古代遗址发现了一座献给知识与智慧之神的隐藏神庙,并利用Hadoop技术重建古代数据处理系统,通过分布式缓存高效处理数据,进行古代文本分析,提升大数据处理能力。

揭开Hadoop中分布式缓存的秘密

DEV Community
DEV Community · 2024-10-31T20:59:11Z
hadoop 主备倒换控制器:ZKFailoverController详解

HDFS的NameNode和Yarn的ResourceManager依靠ZK实现主备倒换。核心类为ZKFailoverController和ActiveStandbyElector。初始化时需要创建zk连接和文件,并有回调事件处理函数。

hadoop 主备倒换控制器:ZKFailoverController详解

小令童鞋
小令童鞋 · 2024-09-22T15:51:02Z

hadoop 主备倒换控制器:ZKFailoverController详解

小令童鞋
小令童鞋 · 2024-09-22T15:51:02Z
Hadoop 认证模块详解

该文章介绍了客户端认证的过程。首先需要登录KDC服务端,然后进行SPNEGO认证。认证的核心代码在doSpnegoSequence函数中。认证的逻辑流程包括设置服务端的域名、创建获取token的上下文信息、发送和接收token等。认证完成后,需要解析Token。如果服务端返回的是HTTP_OK,则认为服务端不需要认证或已经认证完成。如果需要自定义其他认证方式,可以通过指定Authenticator实现。

Hadoop 认证模块详解

小令童鞋
小令童鞋 · 2024-09-20T16:18:59Z

Hadoop 认证模块详解

小令童鞋
小令童鞋 · 2024-09-20T16:18:59Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码