Update Hive数据类型和文件格式.md

This commit is contained in:
heibaiying 2019-04-23 22:19:24 +08:00 committed by GitHub
parent ed37ae1e22
commit 7351aec66d
No known key found for this signature in database
GPG Key ID: 4AEE18F83AFDEB23

View File

@ -103,7 +103,7 @@ Hive会在HDFS为每个数据库上创建一个目录数据库中的表是该
| **Avro Files** | Avro是一个数据序列化系统设计用于支持大批量数据交换的应用。它的主要特点有支持二进制序列化方式可以便捷快速地处理大量数据动态语言友好Avro提供的机制使动态语言可以方便地处理Avro数据。 |
| **Parquet** | Parquet就是基于Dremel的数据模型和算法实现的面向分析型业务的列式存储格式。辅以按列的高效压缩和编码技术实现降低存储空间提高IO效率降低上层应用延迟。 |
> 综合各方面性能考虑,以上压缩格式中ORC和parquet格式的使用较为广泛。
> 以上压缩格式中ORC和parquet的综合性能突出,使用较为广泛,推荐使用这两种格式
### 3.2 指定存储格式