From 89ad4cc4acb9e84e96b8fc42aa4ddc4ab443dc2e Mon Sep 17 00:00:00 2001
From: heibaiying <2806718453@qq.com>
Date: Wed, 4 Mar 2020 16:14:14 +0800
Subject: [PATCH] =?UTF-8?q?Update=20Hive=E6=95=B0=E6=8D=AE=E6=9F=A5?=
 =?UTF-8?q?=E8=AF=A2=E8=AF=A6=E8=A7=A3.md?=
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

---
 notes/Hive数据查询详解.md | 8 +++-----
 1 file changed, 3 insertions(+), 5 deletions(-)

diff --git a/notes/Hive数据查询详解.md b/notes/Hive数据查询详解.md
index b8c7750..f0e56fe 100644
--- a/notes/Hive数据查询详解.md
+++ b/notes/Hive数据查询详解.md
@@ -194,9 +194,7 @@ SELECT deptno,SUM(sal) FROM emp GROUP BY deptno HAVING SUM(sal)>9000;
 
 ### 2.9 DISTRIBUTE BY
 
-默认情况下，MapReduce 程序会对 Map 输出结果的 Key 值进行散列，并均匀分发到所有 Reducer 上。如果想要把具有相同 Key 值的数据分发到同一个 Reducer 进行处理，这就需要使用 DISTRIBUTE BY 字句。
-
-需要注意的是，DISTRIBUTE BY 虽然能保证具有相同 Key 值的数据分发到同一个 Reducer，但是不能保证数据在 Reducer 上是有序的。情况如下：
+如果想要把具有相同 Key 值的数据分发到同一个 Reducer 进行处理，这就需要使用 DISTRIBUTE BY 字句。需要注意的是，DISTRIBUTE BY 虽然能保证具有相同 Key 值的数据分发到同一个 Reducer，但是不能保证数据在 Reducer 上是有序的。情况如下：
 
 把以下 5 个数据发送到两个 Reducer 上进行处理：
 
@@ -224,7 +222,7 @@ k4
 k3
 ```
 
-如果想让 Reducer 上的数据时有序的，可以结合 `SORT BY` 使用 (示例如下)，或者使用下面我们将要介绍的 CLUSTER BY。
+如果想让 Reducer 上的数据是有序的，可以结合 `SORT BY` 使用 (示例如下)，或者使用下面我们将要介绍的 CLUSTER BY。
 
 ```sql
 -- 将数据按照部门分发到对应的 Reducer 上处理
@@ -393,4 +391,4 @@ SET hive.exec.mode.local.auto=true;
 1. [LanguageManual Select](https://cwiki.apache.org/confluence/display/Hive/LanguageManual+Select)
 2. [LanguageManual Joins](https://cwiki.apache.org/confluence/display/Hive/LanguageManual+Joins)
 3. [LanguageManual GroupBy](https://cwiki.apache.org/confluence/display/Hive/LanguageManual+GroupBy)
-4. [LanguageManual SortBy](https://cwiki.apache.org/confluence/display/Hive/LanguageManual+SortBy)
\ No newline at end of file
+4. [LanguageManual SortBy](https://cwiki.apache.org/confluence/display/Hive/LanguageManual+SortBy)