Update Hive核心概念讲解.md

This commit is contained in:
heibaiying 2019-05-30 15:11:29 +08:00 committed by GitHub
parent 4aaa0a6b6e
commit 852738219e
No known key found for this signature in database
GPG Key ID: 4AEE18F83AFDEB23

View File

@ -103,7 +103,7 @@ Hive会在HDFS为每个数据库上创建一个目录数据库中的表是该
| **Avro Files** | Avro是一个数据序列化系统设计用于支持大批量数据交换的应用。它的主要特点有支持二进制序列化方式可以便捷快速地处理大量数据动态语言友好Avro提供的机制使动态语言可以方便地处理Avro数据。 |
| **Parquet** | Parquet是基于Dremel的数据模型和算法实现的面向分析型业务的列式存储格式。它通过按列进行高效压缩和特殊的编码技术从而在降低存储空间的同时提高了IO效率。 |
> 以上压缩格式中ORC和parquet的综合性能突出使用较为广泛推荐使用这两种格式。
> 以上压缩格式中ORC和Parquet的综合性能突出使用较为广泛推荐使用这两种格式。
### 3.2 指定存储格式