Update Hadoop-HDFS.md
This commit is contained in:
parent
3b04f8c9b1
commit
da391e2492
@ -8,7 +8,7 @@
|
||||
|
||||
## 二 、HDFS 设计原理
|
||||
|
||||
<div align="center"> <img src="https://github.com/heibaiying/BigData-Notes/blob/master/pictures/hdfsarchitecture.png"/> </div>
|
||||
<div align="center"> <img width="600px" src="https://github.com/heibaiying/BigData-Notes/blob/master/pictures/hdfsarchitecture.png"/> </div>
|
||||
|
||||
### 2.1 HDFS 架构
|
||||
|
||||
@ -33,7 +33,7 @@ NameNode 负责维护文件系统名称空间,记录对名称空间或其属性
|
||||
|
||||
HDFS 它将每一个文件存储为一系列**块**,复制文件的块以实现容错,块大小和复制因子可根据文件进行配置(默认块大小是128M,默认复制因子是3)。
|
||||
|
||||
<div align="center"> <img src="https://github.com/heibaiying/BigData-Notes/blob/master/pictures/hdfsdatanodes.png"/> </div>
|
||||
<div align="center"> <img width="600px" src="https://github.com/heibaiying/BigData-Notes/blob/master/pictures/hdfsdatanodes.png"/> </div>
|
||||
|
||||
### 2.4 数据复制的实现原理
|
||||
|
||||
@ -43,7 +43,7 @@ HDFS 它将每一个文件存储为一系列**块**,复制文件的块以实
|
||||
|
||||
在编写器位于datanode上时,将一个副本放在本地计算机上,否则放在随机datanode上;在另一个(远程)机架上的节点上放置另一个副本,最后一个在同一个远程机架中的另一个节点上。此策略可以减少机架间写入流量,从而提高写入性能。
|
||||
|
||||
<div align="center"> <img src="https://github.com/heibaiying/BigData-Notes/blob/master/pictures/hdfs-机架.png"/> </div>
|
||||
<div align="center"> <img width="600px" src="https://github.com/heibaiying/BigData-Notes/blob/master/pictures/hdfs-机架.png"/> </div>
|
||||
|
||||
如果复制因子大于3,则随机确定第4个和以下副本的放置,同时保持每个机架的副本数量低于上限,上限值通常为`(复制系数 - 1)/机架数量 + 2`,但是不允许同一个dataNode具有同一块的多个副本。
|
||||
|
||||
|
Loading…
x
Reference in New Issue
Block a user