Update Hive数据类型和文件格式.md
This commit is contained in:
parent
ed37ae1e22
commit
7351aec66d
@ -103,7 +103,7 @@ Hive会在HDFS为每个数据库上创建一个目录,数据库中的表是该
|
||||
| **Avro Files** | Avro是一个数据序列化系统,设计用于支持大批量数据交换的应用。它的主要特点有:支持二进制序列化方式,可以便捷,快速地处理大量数据;动态语言友好,Avro提供的机制使动态语言可以方便地处理Avro数据。 |
|
||||
| **Parquet** | Parquet就是基于Dremel的数据模型和算法实现的,面向分析型业务的列式存储格式。辅以按列的高效压缩和编码技术,实现降低存储空间,提高IO效率,降低上层应用延迟。 |
|
||||
|
||||
> 综合各方面性能考虑,以上压缩格式中ORC和parquet格式的使用较为广泛。
|
||||
> 以上压缩格式中ORC和parquet的综合性能突出,使用较为广泛,推荐使用这两种格式。
|
||||
|
||||
### 3.2 指定存储格式
|
||||
|
||||
|
Loading…
x
Reference in New Issue
Block a user