Update Hadoop-HDFS.md

This commit is contained in:
heibaiying 2019-03-13 11:27:24 +08:00 committed by GitHub
parent 3b04f8c9b1
commit da391e2492
No known key found for this signature in database
GPG Key ID: 4AEE18F83AFDEB23

View File

@ -8,7 +8,7 @@
## 二 、HDFS 设计原理
<div align="center"> <img src="https://github.com/heibaiying/BigData-Notes/blob/master/pictures/hdfsarchitecture.png"/> </div>
<div align="center"> <img width="600px" src="https://github.com/heibaiying/BigData-Notes/blob/master/pictures/hdfsarchitecture.png"/> </div>
### 2.1 HDFS 架构
@ -33,7 +33,7 @@ NameNode 负责维护文件系统名称空间,记录对名称空间或其属性
HDFS 它将每一个文件存储为一系列**块**复制文件的块以实现容错块大小和复制因子可根据文件进行配置默认块大小是128M,默认复制因子是3
<div align="center"> <img src="https://github.com/heibaiying/BigData-Notes/blob/master/pictures/hdfsdatanodes.png"/> </div>
<div align="center"> <img width="600px" src="https://github.com/heibaiying/BigData-Notes/blob/master/pictures/hdfsdatanodes.png"/> </div>
### 2.4 数据复制的实现原理
@ -43,7 +43,7 @@ HDFS 它将每一个文件存储为一系列**块**,复制文件的块以实
在编写器位于datanode上时将一个副本放在本地计算机上否则放在随机datanode上在另一个远程机架上的节点上放置另一个副本最后一个在同一个远程机架中的另一个节点上。此策略可以减少机架间写入流量从而提高写入性能。
<div align="center"> <img src="https://github.com/heibaiying/BigData-Notes/blob/master/pictures/hdfs-机架.png"/> </div>
<div align="center"> <img width="600px" src="https://github.com/heibaiying/BigData-Notes/blob/master/pictures/hdfs-机架.png"/> </div>
如果复制因子大于3则随机确定第4个和以下副本的放置同时保持每个机架的副本数量低于上限上限值通常为`(复制系数 - 1/机架数量 + 2`但是不允许同一个dataNode具有同一块的多个副本。