phoenix简单使用

2019-04-04 16:06:10 +08:00
parent 7e4605f82d da465bca9b
commit 381df6e91d
5 changed files with 246 additions and 268 deletions
--- a/README.md
+++ b/README.md
@@ -85,7 +85,6 @@
 5. HBase 协处理器
 6. HBase 备份与恢复
 7. HBase的SQL中间层——Phoenix
 ## 十一、Kafka
 ## 十二、Zookeeper
 ## 十三、Scala
--- a/notes/Hbase
+++ b/notes/Hbase
@@ -1,5 +1,5 @@
-# Hbase 常用 Shell 命令
+# Hbase 常用 Shell 命令
-
+<nav>
 <a href="#一基本命令">一、基本命令</a><br/>
 &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;<a href="#11-获取帮助">1.1 获取帮助</a><br/>
 &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;<a href="#12-查看服务器状态">1.2 查看服务器状态</a><br/>
@@ -27,248 +27,247 @@
 </nav>
 ## 一、基本命令
 #### 1.1 获取帮助
 ```shell
 # 获取帮助
 help
 # 获取命令的详细信息
 help 'status'
 ```
 #### 1.2 查看服务器状态
 ```shell
 status
 ```
 #### 1.3 查看版本信息
 ```shell
 version
 ```
 ## 二、关于表的操作
 #### 2.1 查看所有表
 ```shell
 list
 ```
 #### 2.2 创建表
 **命令格式**： create '表名称', '列族名称1','列族名称2','列名称N'
 ```shell
 # 创建一张名为Student的表,包含基本信息（baseInfo）、学校信息（schoolInfo）两个列族
 create 'Student','baseInfo','schoolInfo'
 ```
 #### 2.3 查看表的基本信息
 **命令格式**：desc '表名'
 ```shell
 describe 'Student'
 ```
 #### 2.4 表的启用/禁用
 enable和disable可以启用/禁用这个表,is_enabled和is_disabled来检查表是否被禁用
 ```shell
 # 禁用表
 disable 'Student'
 # 检查表是否被禁用
 is_disabled 'Student'
 # 启用表
 enable 'Student'
 # 检查表是否被启用
 is_enabled 'Student'
 ```
 #### 2.5 检查表是否存在
 ```shell
 exists 'Student'
 ```
 #### 2.6 删除表
 ```shell
 # 删除表前需要先禁用表
 disable 'Student'
 # 删除表
 drop 'Student'
 ```
 ## 三、增删改
 #### 3.1 添加列族
 **命令格式**： alter '表名', '列族名'
 ```shell
 alter 'Student', 'teacherInfo'
 ```
 #### 3.2 删除列族
 **命令格式**：alter '表名', {NAME => '列族名', METHOD => 'delete'}
 ```shell
 alter 'Student', {NAME => 'teacherInfo', METHOD => 'delete'}
 ```
 #### 3.3 更改列族存储版本的限制
 默认情况下，列族只存储一个版本的数据，如果需要存储多个版本的数据，则需要修改列族的属性。修改后可通过`desc`命令查看
 ```shell
 alter 'Student',{NAME=>'baseInfo',VERSIONS=>3}
 ```
 #### 3.3 插入数据
 **命令格式**：put '表名', '行键','列族:列','值'
 **注意：如果新增数据的行键值、列族名、列名与原有数据完全相同，则相当于更新操作**
 ```shell
 put 'Student', 'rowkey1','baseInfo:name','tom'
 put 'Student', 'rowkey1','baseInfo:birthday','1990-01-09'
 put 'Student', 'rowkey1','baseInfo:age','29'
 put 'Student', 'rowkey1','schoolInfo:name','Havard'
 put 'Student', 'rowkey1','schoolInfo:localtion','Boston'
 put 'Student', 'rowkey2','baseInfo:name','jack'
 put 'Student', 'rowkey2','baseInfo:birthday','1998-08-22'
 put 'Student', 'rowkey2','baseInfo:age','21'
 put 'Student', 'rowkey2','schoolInfo:name','yale'
 put 'Student', 'rowkey2','schoolInfo:localtion','New Haven'
 put 'Student', 'rowkey3','baseInfo:name','maike'
 put 'Student', 'rowkey3','baseInfo:birthday','1995-01-22'
 put 'Student', 'rowkey3','baseInfo:age','24'
 put 'Student', 'rowkey3','schoolInfo:name','yale'
 put 'Student', 'rowkey3','schoolInfo:localtion','New Haven'
 put 'Student', 'wrowkey4','baseInfo:name','maike-jack'
 ```
 #### 3.4 获取指定行、指定行中的列族、列的信息
 ```shell
 # 获取指定行中所有列的数据信息
 get 'Student','rowkey3'
 # 获取指定行中指定列族下所有列的数据信息
 get 'Student','rowkey3','baseInfo'
 # 获取指定行中指定列的数据信息
 get 'Student','rowkey3','baseInfo:name'
 ```
 #### 3.5 删除指定行、指定行中的列
 ```shell
 # 删除指定行
 delete 'Student','rowkey3'
 # 删除指定行中指定列的数据
 delete 'Student','rowkey3','baseInfo:name'
 ```
 ## 四、查询
 hbase中访问数据有两种基本的方式
 + 按指定rowkey获取唯一一条数据：get方法
 + 按指定条件获取数据：scan方法
 get访问指定key的数据，而scan可以设置begin和end来访问一个范围内所有的数据。get本质上就是begin和end相同的一种特殊的scan。
 #### 4.1Get查询
 ```shell
 # 获取指定行中所有列的数据信息
 get 'Student','rowkey3'
 # 获取指定行中指定列族下所有列的数据信息
 get 'Student','rowkey3','baseInfo'
 # 获取指定行中指定列的数据信息
 get 'Student','rowkey3','baseInfo:name'
 ```
 #### 4.2 查询整表数据
 ```shell
 scan 'Student'
 ```
 #### 4.3 查询指定列簇的数据
 ```shell
 scan 'Student', {COLUMN=>'baseInfo'}
 ```
 #### 4.4  条件查询
 ```shell
 # 查询指定列的数据
 scan 'Student', {COLUMNS=> 'baseInfo:birthday'}
 ```
 除了列`（COLUMNS）`修饰词外，HBase还支持`Limit`（限制查询结果行数），`STARTROW`（`ROWKEY`起始行，会先根据这个`key`定位到`region`，再向后扫描）、`STOPROW`(结束行)、`TIMERANGE`（限定时间戳范围）、`VERSIONS`（版本数）、和`FILTER`（按条件过滤行）等。
 如下代表从`rowkey2`这个`rowkey`开始，查找下两个行的最新3个版本的name列的数据：
 ```shell
 scan 'Student', {COLUMNS=> 'baseInfo:name',STARTROW => 'rowkey2',STOPROW => 'wrowkey4',LIMIT=>2, VERSIONS=>3}
 ```
 #### 4.5  条件过滤
 Filter可以设定一系列条件来进行过滤。如我们要限制某个列的值大于等于24：
 ```shell
 scan 'Student', FILTER=>"ValueFilter(=,'binary:24')"
 ```
 值包含yale这个值：
 ```shell
 scan 'Student', FILTER=>"ValueFilter(=,'substring:yale')"
 ```
 列名中的前缀为birth的：
 ```shell
 scan 'Student', FILTER=>"ColumnPrefixFilter('birth')"
 ```
 FILTER中支持多个过滤条件通过括号、AND和OR的条件组合：
 ```shell
 # 列名中的前缀为birth且列值中包含1998的数据
 scan 'Student', FILTER=>"ColumnPrefixFilter('birth') AND ValueFilter ValueFilter(=,'substring:1998')"
 ```
 `PrefixFilter`是对Rowkey的前缀进行判断：
 ```shell
 scan 'Student', FILTER=>"PrefixFilter('wr')"
 ```
 ## 一、基本命令
 #### 1.1 获取帮助
 ```shell
 # 获取帮助
 help
 # 获取命令的详细信息
 help 'status'
 ```
 #### 1.2 查看服务器状态
 ```shell
 status
 ```
 #### 1.3 查看版本信息
 ```shell
 version
 ```
 ## 二、关于表的操作
 #### 2.1 查看所有表
 ```shell
 list
 ```
 #### 2.2 创建表
 **命令格式**： create '表名称', '列族名称1','列族名称2','列名称N'
 ```shell
 # 创建一张名为Student的表,包含基本信息（baseInfo）、学校信息（schoolInfo）两个列族
 create 'Student','baseInfo','schoolInfo'
 ```
 #### 2.3 查看表的基本信息
 **命令格式**：desc '表名'
 ```shell
 describe 'Student'
 ```
 #### 2.4 表的启用/禁用
 enable和disable可以启用/禁用这个表,is_enabled和is_disabled来检查表是否被禁用
 ```shell
 # 禁用表
 disable 'Student'
 # 检查表是否被禁用
 is_disabled 'Student'
 # 启用表
 enable 'Student'
 # 检查表是否被启用
 is_enabled 'Student'
 ```
 #### 2.5 检查表是否存在
 ```shell
 exists 'Student'
 ```
 #### 2.6 删除表
 ```shell
 # 删除表前需要先禁用表
 disable 'Student'
 # 删除表
 drop 'Student'
 ```
 ## 三、增删改
 #### 3.1 添加列族
 **命令格式**： alter '表名', '列族名'
 ```shell
 alter 'Student', 'teacherInfo'
 ```
 #### 3.2 删除列族
 **命令格式**：alter '表名', {NAME => '列族名', METHOD => 'delete'}
 ```shell
 alter 'Student', {NAME => 'teacherInfo', METHOD => 'delete'}
 ```
 #### 3.3 更改列族存储版本的限制
 默认情况下，列族只存储一个版本的数据，如果需要存储多个版本的数据，则需要修改列族的属性。修改后可通过`desc`命令查看
 ```shell
 alter 'Student',{NAME=>'baseInfo',VERSIONS=>3}
 ```
 #### 3.3 插入数据
 **命令格式**：put '表名', '行键','列族:列','值'
 **注意：如果新增数据的行键值、列族名、列名与原有数据完全相同，则相当于更新操作**
 ```shell
 put 'Student', 'rowkey1','baseInfo:name','tom'
 put 'Student', 'rowkey1','baseInfo:birthday','1990-01-09'
 put 'Student', 'rowkey1','baseInfo:age','29'
 put 'Student', 'rowkey1','schoolInfo:name','Havard'
 put 'Student', 'rowkey1','schoolInfo:localtion','Boston'
 put 'Student', 'rowkey2','baseInfo:name','jack'
 put 'Student', 'rowkey2','baseInfo:birthday','1998-08-22'
 put 'Student', 'rowkey2','baseInfo:age','21'
 put 'Student', 'rowkey2','schoolInfo:name','yale'
 put 'Student', 'rowkey2','schoolInfo:localtion','New Haven'
 put 'Student', 'rowkey3','baseInfo:name','maike'
 put 'Student', 'rowkey3','baseInfo:birthday','1995-01-22'
 put 'Student', 'rowkey3','baseInfo:age','24'
 put 'Student', 'rowkey3','schoolInfo:name','yale'
 put 'Student', 'rowkey3','schoolInfo:localtion','New Haven'
 put 'Student', 'wrowkey4','baseInfo:name','maike-jack'
 ```
 #### 3.4 获取指定行、指定行中的列族、列的信息
 ```shell
 # 获取指定行中所有列的数据信息
 get 'Student','rowkey3'
 # 获取指定行中指定列族下所有列的数据信息
 get 'Student','rowkey3','baseInfo'
 # 获取指定行中指定列的数据信息
 get 'Student','rowkey3','baseInfo:name'
 ```
 #### 3.5 删除指定行、指定行中的列
 ```shell
 # 删除指定行
 delete 'Student','rowkey3'
 # 删除指定行中指定列的数据
 delete 'Student','rowkey3','baseInfo:name'
 ```
 ## 四、查询
 hbase中访问数据有两种基本的方式
 + 按指定rowkey获取唯一一条数据：get方法
 + 按指定条件获取数据：scan方法
 get访问指定key的数据，而scan可以设置begin和end来访问一个范围内所有的数据。get本质上就是begin和end相同的一种特殊的scan。
 ### 4.1Get查询
 ```shell
 # 获取指定行中所有列的数据信息
 get 'Student','rowkey3'
 # 获取指定行中指定列族下所有列的数据信息
 get 'Student','rowkey3','baseInfo'
 # 获取指定行中指定列的数据信息
 get 'Student','rowkey3','baseInfo:name'
 ```
 #### 4.2 查询整表数据
 ```shell
 scan 'Student'
 ```
 #### 4.3 查询指定列簇的数据
 ```shell
 scan 'Student', {COLUMN=>'baseInfo'}
 ```
 #### 4.4  条件查询
 ```shell
 # 查询指定列的数据
 scan 'Student', {COLUMNS=> 'baseInfo:birthday'}
 ```
 除了列`（COLUMNS）`修饰词外，HBase还支持`Limit`（限制查询结果行数），`STARTROW`（`ROWKEY`起始行，会先根据这个`key`定位到`region`，再向后扫描）、`STOPROW`(结束行)、`TIMERANGE`（限定时间戳范围）、`VERSIONS`（版本数）、和`FILTER`（按条件过滤行）等。
 如下代表从`rowkey2`这个`rowkey`开始，查找下两个行的最新3个版本的name列的数据：
 ```shell
 scan 'Student', {COLUMNS=> 'baseInfo:name',STARTROW => 'rowkey2',STOPROW => 'wrowkey4',LIMIT=>2, VERSIONS=>3}
 ```
 #### 4.5  条件过滤
 Filter可以设定一系列条件来进行过滤。如我们要限制某个列的值大于等于24：
 ```shell
 scan 'Student', FILTER=>"ValueFilter(=,'binary:24')"
 ```
 值包含yale这个值：
 ```shell
 scan 'Student', FILTER=>"ValueFilter(=,'substring:yale')"
 ```
 列名中的前缀为birth的：
 ```shell
 scan 'Student', FILTER=>"ColumnPrefixFilter('birth')"
 ```
 FILTER中支持多个过滤条件通过括号、AND和OR的条件组合：
 ```shell
 # 列名中的前缀为birth且列值中包含1998的数据
 scan 'Student', FILTER=>"ColumnPrefixFilter('birth') AND ValueFilter ValueFilter(=,'substring:1998')"
 ```
 `PrefixFilter`是对Rowkey的前缀进行判断：
 ```shell
 scan 'Student', FILTER=>"PrefixFilter('wr')"
 ```
--- a/notes/Hive.md
+++ b/notes/Hive.md
@@ -8,7 +8,6 @@
 &nbsp;&nbsp;&nbsp;&nbsp;<a href="#21-command-line-shell--thriftjdbc">2.1 command-line shell & thrift/jdbc</a><br/>
 &nbsp;&nbsp;&nbsp;&nbsp;<a href="#22-Metastore">2.2 Metastore</a><br/>
 &nbsp;&nbsp;&nbsp;&nbsp;<a href="#23-执行流程">2.3 执行流程</a><br/>
 <a href="#三Hive环境搭建">三、Hive环境搭建</a><br/>
 </nav>
@@ -51,12 +50,6 @@ hive里的表名、表结构、字段名、字段类型、表的分隔符等信
 ## 三、Hive环境搭建
 ## 参考资料
 1. [Hive Getting Started](https://cwiki.apache.org/confluence/display/Hive/GettingStarted)
--- a/notes/Linux中大数据常用软件安装指南.md
+++ b/notes/Linux中大数据常用软件安装指南.md
@@ -9,7 +9,7 @@
 ### 二、Hadoop
-1. [Hadoop单机版本环境搭建](https://github.com/heibaiying/BigData-Notes/blob/master/notes/installation/Hadoop单机版本环境搭建.md)
+1. [Hadoop单机版本环境搭建](https://github.com/heibaiying/BigData-Notes/blob/master/notes/installation/hadoop%E5%8D%95%E6%9C%BA%E7%89%88%E6%9C%AC%E7%8E%AF%E5%A2%83%E6%90%AD%E5%BB%BA.md)
--- a/notes/Storm核心概念详解.md
+++ b/notes/Storm核心概念详解.md
@@ -14,8 +14,6 @@
 &nbsp;&nbsp;&nbsp;&nbsp;<a href="#24-worker进程">2.4 worker进程</a><br/>
 &nbsp;&nbsp;&nbsp;&nbsp;<a href="#25-executor线程">2.5 executor线程</a><br/>
 &nbsp;&nbsp;&nbsp;&nbsp;<a href="#26-并行度">2.6 并行度</a><br/>
 <a href="#三Linux下Storm单机版本环境搭建">三、Linux下Storm单机版本环境搭建</a><br/>
 <a href="#四storm词频统计案例">四、Storm词频统计案例</a><br/>
 </nav>
 ## 一、Storm核心概念
@@ -248,17 +246,6 @@ task是最终运行spout或bolt中代码的单元。topology启动后，1个comp
 + 每个executor默认启动一个task线程
 ## 三、Linux下Storm单机版本环境搭建
 ## 四、Storm词频统计案例
 ## 参考资料
 1. [storm documentation -> Concepts](http://storm.apache.org/releases/1.2.2/Concepts.html)
`@@ -9,7 +9,7 @@`

	`### 二、Hadoop`	`### 二、Hadoop`

	`1. [Hadoop单机版本环境搭建](https://github.com/heibaiying/BigData-Notes/blob/master/notes/installation/Hadoop单机版本环境搭建.md)`	`1. [Hadoop单机版本环境搭建](https://github.com/heibaiying/BigData-Notes/blob/master/notes/installation/hadoop%E5%8D%95%E6%9C%BA%E7%89%88%E6%9C%AC%E7%8E%AF%E5%A2%83%E6%90%AD%E5%BB%BA.md)`