小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
沉浸式翻译 immersive translate
Dify.AI
Pinterest通过内部调度系统实现Hadoop集群的自动扩展和迁移

Pinterest推出了Hadoop控制中心(HCC),旨在自动化管理Hadoop集群的扩展和迁移,简化操作复杂性。HCC通过统一命令行接口实现实时调整,确保数据完整性和服务连续性,并计划增加自动修复和生命周期管理功能,以提升基础设施的自主性和弹性。

Pinterest通过内部调度系统实现Hadoop集群的自动扩展和迁移

InfoQ
InfoQ · 2025-07-31T10:00:00Z
从Hadoop到Kubernetes:Pinterest在AWS EKS上的可扩展Spark架构

Pinterest将Hadoop数据平台替换为基于Kubernetes的Moka系统,运行Spark于AWS EKS。Moka支持容器化作业隔离和ARM实例,提升调度效率并降低基础设施成本。Pinterest还开发了新服务,使用Apache YuniKorn进行调度,迁移存储至S3,并整合Apache Celeborn以维持性能。Moka通过资源管理和动态优先级调度优化数据处理工作负载。

从Hadoop到Kubernetes:Pinterest在AWS EKS上的可扩展Spark架构

InfoQ
InfoQ · 2025-07-28T11:30:00Z
Big Data Processing - Case Study 4 (Hadoop)

Big Data Processing - Case Study 4 (Hadoop)

DEV Community
DEV Community · 2025-05-01T11:04:47Z
【Hadoop仿真】如何在仿真NodeManager中实现心跳

Hadoop项目通过构建大量虚假NodeManager节点,模拟ResourceManager的压力场景。NodeManager的主要功能包括向ResourceManager注册、初始化RPC和HTTP服务、发送心跳信息等。心跳是NodeManager与ResourceManager之间的核心功能,包含节点状态和资源信息。

【Hadoop仿真】如何在仿真NodeManager中实现心跳

小令童鞋
小令童鞋 · 2025-04-24T15:31:32Z
Hadoop Yarn的ResourceManager压测指南

Hadoop项目通过构建大量虚假节点(Fake NM)来模拟ResourceManager的压力,以优化性能。主要模块包括Fake NM和SLSRunner,分别负责容器管理和压力测试作业。配置文件需根据实际情况调整,运行后可进行性能测试。

Hadoop Yarn的ResourceManager压测指南

小令童鞋
小令童鞋 · 2025-04-13T10:35:50Z
将Hadoop工作负载迁移到AWS:从本地HDFS、Spark、Kafka和Airflow迁移到AWS S3、Iceberg和EMR

许多企业仍在使用本地Hadoop进行大数据处理,但面临高运营成本和可扩展性问题。本文提供了迁移到AWS S3、Apache Iceberg和EMR的六步指南,包括架构图、代码示例和最佳实践,以降低成本并提升性能。

将Hadoop工作负载迁移到AWS:从本地HDFS、Spark、Kafka和Airflow迁移到AWS S3、Iceberg和EMR

DEV Community
DEV Community · 2025-04-11T11:05:59Z
Hadoop的核心组件HDFS和MapReduce是如何运作的?

Hadoop是一个开源框架,专门用于处理大数据。其核心组件HDFS负责数据存储,MapReduce负责数据处理,二者通过主从架构和并行计算实现高可用性和容错性。Hadoop还可与Cassandra等数据库集成,增强数据处理能力。

Hadoop的核心组件HDFS和MapReduce是如何运作的?

DEV Community
DEV Community · 2025-03-11T21:31:15Z
Hadoop的核心组件HDFS和MapReduce是如何运作的?

Hadoop是一个开源框架,专为分布式存储和处理大数据设计。其核心组件HDFS用于存储大文件,MapReduce用于并行处理数据。HDFS通过主从架构确保数据可靠性,MapReduce通过并行计算提高处理速度,二者结合使Hadoop在大数据处理上高效灵活。

Hadoop的核心组件HDFS和MapReduce是如何运作的?

DEV Community
DEV Community · 2025-03-11T21:01:25Z
什么是Hadoop,它是如何高效处理大数据的?

在数字数据迅速增长的时代,管理大数据成为挑战。Apache Hadoop是一个开源框架,能够高效存储和处理大数据,具备分布式计算、可扩展性、容错性和数据本地化等优势,支持多种数据源和格式,是企业数据分析的重要工具。

什么是Hadoop,它是如何高效处理大数据的?

DEV Community
DEV Community · 2025-03-11T00:28:06Z
Apache Hadoop:大数据领域的开源创新先锋

Apache Hadoop是一个开源框架,改变了企业大数据管理和分析的方式。它通过分布式文件系统和MapReduce模型实现可扩展计算。Hadoop的成功依赖于多样化的资金模式、灵活的Apache许可证和活跃的社区支持,促进了创新和透明治理。

Apache Hadoop:大数据领域的开源创新先锋

DEV Community
DEV Community · 2025-03-07T04:00:39Z

Idea Hadoop 源码YarnServiceProtos无法补全问题

小令童鞋
小令童鞋 · 2024-12-01T11:57:17Z

Idea Hadoop 源码YarnServiceProtos无法补全问题

小令童鞋
小令童鞋 · 2024-12-01T11:57:17Z
如何在Hadoop MapReduce中处理多种数据类型?

Hadoop是一个处理大规模数据的平台,支持多种数据类型,包括基本数据类型和复杂数据类型。通过有效管理这些数据,用户可以设计高效的MapReduce应用,处理各种数据格式,提取有价值的洞察。

如何在Hadoop MapReduce中处理多种数据类型?

DEV Community
DEV Community · 2024-11-28T23:32:27Z

本文介绍了使用Hadoop框架进行分布式计算的WordCounter案例,重点讲解了通过MapReduce编程统计文本文件中单词频率的过程,强调了分布式计算和存储的重要性,以及环境配置和代码实现的细节。

零基础入门Hadoop:IntelliJ IDEA远程连接服务器中Hadoop运行WordCount - 努力的小雨

努力的小雨
努力的小雨 · 2024-11-16T01:06:00Z
Databricks与Hadoop:哪个平台更适合预测分析?

随着数据驱动决策的需求增加,预测分析成为企业竞争的重要工具。Databricks和Hadoop是常用的数据处理平台,各有优缺点。Databricks适合实时分析和机器学习,支持协作和云扩展;而Hadoop擅长大规模数据存储和批处理,适合历史分析。选择平台应根据需求:实时分析和机器学习选择Databricks,数据存储和批处理选择Hadoop。

Databricks与Hadoop:哪个平台更适合预测分析?

DEV Community
DEV Community · 2024-11-13T09:02:15Z
揭开Hadoop中分布式缓存的秘密

现代探险者在古代遗址发现了一座献给知识与智慧之神的隐藏神庙,并利用Hadoop技术重建古代数据处理系统,通过分布式缓存高效处理数据,进行古代文本分析,提升大数据处理能力。

揭开Hadoop中分布式缓存的秘密

DEV Community
DEV Community · 2024-10-31T20:59:11Z
hadoop 主备倒换控制器:ZKFailoverController详解

HDFS的NameNode和Yarn的ResourceManager依靠ZK实现主备倒换。核心类为ZKFailoverController和ActiveStandbyElector。初始化时需要创建zk连接和文件,并有回调事件处理函数。

hadoop 主备倒换控制器:ZKFailoverController详解

小令童鞋
小令童鞋 · 2024-09-22T15:51:02Z

hadoop 主备倒换控制器:ZKFailoverController详解

小令童鞋
小令童鞋 · 2024-09-22T15:51:02Z
Hadoop 认证模块详解

该文章介绍了客户端认证的过程。首先需要登录KDC服务端,然后进行SPNEGO认证。认证的核心代码在doSpnegoSequence函数中。认证的逻辑流程包括设置服务端的域名、创建获取token的上下文信息、发送和接收token等。认证完成后,需要解析Token。如果服务端返回的是HTTP_OK,则认为服务端不需要认证或已经认证完成。如果需要自定义其他认证方式,可以通过指定Authenticator实现。

Hadoop 认证模块详解

小令童鞋
小令童鞋 · 2024-09-20T16:18:59Z

Hadoop 认证模块详解

小令童鞋
小令童鞋 · 2024-09-20T16:18:59Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码