From 7351aec66d68fca96fb8a9c2cd97f32ba40aa117 Mon Sep 17 00:00:00 2001 From: heibaiying <31504331+heibaiying@users.noreply.github.com> Date: Tue, 23 Apr 2019 22:19:24 +0800 Subject: [PATCH] =?UTF-8?q?Update=20Hive=E6=95=B0=E6=8D=AE=E7=B1=BB?= =?UTF-8?q?=E5=9E=8B=E5=92=8C=E6=96=87=E4=BB=B6=E6=A0=BC=E5=BC=8F.md?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- notes/Hive数据类型和文件格式.md | 2 +- 1 file changed, 1 insertion(+), 1 deletion(-) diff --git a/notes/Hive数据类型和文件格式.md b/notes/Hive数据类型和文件格式.md index dcaec65..a866179 100644 --- a/notes/Hive数据类型和文件格式.md +++ b/notes/Hive数据类型和文件格式.md @@ -103,7 +103,7 @@ Hive会在HDFS为每个数据库上创建一个目录,数据库中的表是该 | **Avro Files** | Avro是一个数据序列化系统,设计用于支持大批量数据交换的应用。它的主要特点有:支持二进制序列化方式,可以便捷,快速地处理大量数据;动态语言友好,Avro提供的机制使动态语言可以方便地处理Avro数据。 | | **Parquet** | Parquet就是基于Dremel的数据模型和算法实现的,面向分析型业务的列式存储格式。辅以按列的高效压缩和编码技术,实现降低存储空间,提高IO效率,降低上层应用延迟。 | -> 综合各方面性能考虑,以上压缩格式中ORC和parquet格式的使用较为广泛。 +> 以上压缩格式中ORC和parquet的综合性能突出,使用较为广泛,推荐使用这两种格式。 ### 3.2 指定存储格式