Hadoop-HDFS

This commit is contained in:
罗祥 2019-05-31 16:15:21 +08:00
parent adbe260747
commit 57697c7899

View File

@ -29,7 +29,7 @@
## 一、介绍
**HDFS** **Hadoop Distributed File System**是Hadoop下的分布式文件系统具有**高容错****高吞吐量**等特性,可以部署在**低成本**的硬件上。
**HDFS** **Hadoop Distributed File System**是Hadoop下的分布式文件系统具有高容错、高吞吐量等特性可以部署在低成本的硬件上。
@ -41,14 +41,14 @@
HDFS 遵循主/从架构由单个NameNode(NN)和多个DataNode(DN)组成:
- **NameNode** : 负责执行有关**文件系统命名空间**的操作,例如打开,关闭、重命名文件和目录等。它同时还负责集群元数据的存储,记录着文件中各个数据块的位置信息。
- **NameNode** : 负责执行有关`文件系统命名空间`的操作,例如打开,关闭、重命名文件和目录等。它同时还负责集群元数据的存储,记录着文件中各个数据块的位置信息。
- **DataNode**:负责提供来自文件系统客户端的读写请求,执行块的创建,删除等操作。
### 2.2 文件系统命名空间
`HDFS`系统命名空间的层次结构与大多数文件系统类似如Linux, 支持目录和文件的创建、移动、删除和重命名等操作,支持配置用户和访问权限,但不支持硬链接和软连接。`NameNode`负责维护文件系统名称空间,记录对名称空间或其属性的任何更改。
HDFS的`文件系统命名空间`的层次结构与大多数文件系统类似(如Linux) 支持目录和文件的创建、移动、删除和重命名等操作,支持配置用户和访问权限,但不支持硬链接和软连接。`NameNode`负责维护文件系统名称空间,记录对名称空间或其属性的任何更改。
@ -102,7 +102,7 @@ HDFS 遵循主/从架构由单个NameNode(NN)和多个DataNode(DN)组成:
### 3.1 高容错
由于HDFS 采用数据的多副本方案所以部分硬件的损坏不会导致全部数据的丢失。
由于HDFS 采用数据的多副本方案所以部分硬件的损坏不会导致全部数据的丢失。
### 3.2 高吞吐量
@ -110,7 +110,7 @@ HDFS设计的重点是支持高吞吐量的数据访问而不是低延迟的
### 3.3 大文件支持
HDFS适合于大文件的存储文档的大小应该是是GB到TB级别的。
HDFS适合于大文件的存储文档的大小应该是是GB到TB级别的。
### 3.3 简单一致性模型