From da391e2492c14fa71c2fb8c7e0c8e62d4e5a1662 Mon Sep 17 00:00:00 2001 From: heibaiying <31504331+heibaiying@users.noreply.github.com> Date: Wed, 13 Mar 2019 11:27:24 +0800 Subject: [PATCH] Update Hadoop-HDFS.md --- notes/Hadoop-HDFS.md | 6 +++--- 1 file changed, 3 insertions(+), 3 deletions(-) diff --git a/notes/Hadoop-HDFS.md b/notes/Hadoop-HDFS.md index b8f007e..574d46c 100644 --- a/notes/Hadoop-HDFS.md +++ b/notes/Hadoop-HDFS.md @@ -8,7 +8,7 @@ ## 二 、HDFS 设计原理 -
+
### 2.1 HDFS 架构 @@ -33,7 +33,7 @@ NameNode 负责维护文件系统名称空间,记录对名称空间或其属性 HDFS 它将每一个文件存储为一系列**块**,复制文件的块以实现容错,块大小和复制因子可根据文件进行配置(默认块大小是128M,默认复制因子是3)。 -
+
### 2.4 数据复制的实现原理 @@ -43,7 +43,7 @@ HDFS 它将每一个文件存储为一系列**块**,复制文件的块以实 在编写器位于datanode上时,将一个副本放在本地计算机上,否则放在随机datanode上;在另一个(远程)机架上的节点上放置另一个副本,最后一个在同一个远程机架中的另一个节点上。此策略可以减少机架间写入流量,从而提高写入性能。 -
+
如果复制因子大于3,则随机确定第4个和以下副本的放置,同时保持每个机架的副本数量低于上限,上限值通常为`(复制系数 - 1)/机架数量 + 2`,但是不允许同一个dataNode具有同一块的多个副本。