小令童鞋 ·

【Hadoop】HDFS 详解

💡 原文中文，约1700字，阅读约需4分钟。

📝

内容提要

HDFS采用master/slave架构，由Namenode和Datanodes组成。文件一次性写入，副本系数为3，存放策略为本地机架、同一机架、不同机架。Secondary NameNode用于处理Namenode的元数据备份。

🎯

关键要点

HDFS采用master/slave架构，由Namenode和Datanodes组成。
Namenode负责管理文件系统的名字空间和客户端对文件的访问。
Datanode负责管理其所在节点上的存储，并处理文件系统客户端的读写请求。
HDFS中的文件一次性写入，且只能有一个写入者。
Namenode使用EditLog记录对文件系统元数据的修改，并在内存中保存文件系统的名字空间和数据块映射。
Datanode将HDFS数据以文件形式存储在本地文件系统中，并生成块状态报告。
HDFS的副本系数通常为3，副本存放策略为本地机架、同一机架和不同机架。
这种副本存放策略提高了写操作的效率，并不影响数据的可靠性和可用性。
HDFS尽量让读取程序读取离其最近的副本，以降低带宽消耗和读取延时。

🏷️

继续阅读

Radim Marek：页面级别的VACUUM
本文讨论了PostgreSQL中的VACUUM过程，包括堆扫描、索引清理和堆清理三个阶段。VACUUM通过清理死元组和更新可见性图来回收空间，提高数据库性...
令人愤怒的谷歌广告设想开国元勋们拥抱人工智能
谷歌推出了一则广告，设想美国开国元祖们使用其协作工具和AI撰写《独立宣言》。广告中，富兰克林和杰斐逊的合作场景显得尴尬且不切实际，历史学家批评这种幻想，认...
2026年上半年人工智能的十个关键时刻
2026年上半年，人工智能在软件开发领域引发重大变化。特朗普签署行政命令加强AI安全，AI实验室与芯片制造商紧密合作。Anthropic与OpenAI争夺...
酸面团助手自动化了烘焙中的繁琐环节
Sourdough Sidekick是一款自动化管理酸面团的厨房设备，旨在简化喂养过程。它可以定时添加面粉和水，适合每周烘焙两次以上的人使用。设备噪音较大...
Keurig是如何拯救——又毁掉——你的咖啡的
Keurig改变了咖啡饮用方式，推出了便捷的单杯咖啡机，迅速在办公室和家庭中普及。但这种便利也带来了环境问题和咖啡品质下降，Keurig正在努力应对这些挑战。
Vizio意外推出了市场上最好的傻瓜电视
Vizio推出的65英寸Mini LED Quantum电视售价398美元，是市场上最便宜的量子点电视。虽然需要Walmart账户并收集用户数据，但用户可...

内容提要

关键要点

标签

继续阅读