Update Hive核心概念讲解.md
This commit is contained in:
parent
4aaa0a6b6e
commit
852738219e
@ -103,7 +103,7 @@ Hive会在HDFS为每个数据库上创建一个目录,数据库中的表是该
|
||||
| **Avro Files** | Avro是一个数据序列化系统,设计用于支持大批量数据交换的应用。它的主要特点有:支持二进制序列化方式,可以便捷,快速地处理大量数据;动态语言友好,Avro提供的机制使动态语言可以方便地处理Avro数据。 |
|
||||
| **Parquet** | Parquet是基于Dremel的数据模型和算法实现的,面向分析型业务的列式存储格式。它通过按列进行高效压缩和特殊的编码技术,从而在降低存储空间的同时提高了IO效率。 |
|
||||
|
||||
> 以上压缩格式中ORC和parquet的综合性能突出,使用较为广泛,推荐使用这两种格式。
|
||||
> 以上压缩格式中ORC和Parquet的综合性能突出,使用较为广泛,推荐使用这两种格式。
|
||||
|
||||
### 3.2 指定存储格式
|
||||
|
||||
|
Loading…
x
Reference in New Issue
Block a user