phoenix简单使用

This commit is contained in:
罗祥 2019-04-04 16:06:10 +08:00
commit 381df6e91d
5 changed files with 246 additions and 268 deletions

View File

@ -85,7 +85,6 @@
5. HBase 协处理器 5. HBase 协处理器
6. HBase 备份与恢复 6. HBase 备份与恢复
7. HBase的SQL中间层——Phoenix 7. HBase的SQL中间层——Phoenix
## 十一、Kafka ## 十一、Kafka
## 十二、Zookeeper ## 十二、Zookeeper
## 十三、Scala ## 十三、Scala

View File

@ -1,5 +1,5 @@
# Hbase 常用 Shell 命令 # Hbase 常用 Shell 命令
<nav> <nav>
<a href="#一基本命令">一、基本命令</a><br/> <a href="#一基本命令">一、基本命令</a><br/>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;<a href="#11-获取帮助">1.1 获取帮助</a><br/> &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;<a href="#11-获取帮助">1.1 获取帮助</a><br/>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;<a href="#12-查看服务器状态">1.2 查看服务器状态</a><br/> &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;<a href="#12-查看服务器状态">1.2 查看服务器状态</a><br/>
@ -27,248 +27,247 @@
</nav> </nav>
## 一、基本命令
#### 1.1 获取帮助
```shell
# 获取帮助
help
# 获取命令的详细信息
help 'status'
```
#### 1.2 查看服务器状态
```shell
status
```
#### 1.3 查看版本信息
```shell
version
```
## 二、关于表的操作
#### 2.1 查看所有表
```shell
list
```
#### 2.2 创建表
**命令格式** create '表名称', '列族名称1','列族名称2','列名称N'
```shell
# 创建一张名为Student的表,包含基本信息baseInfo、学校信息schoolInfo两个列族
create 'Student','baseInfo','schoolInfo'
```
#### 2.3 查看表的基本信息
**命令格式**desc '表名'
```shell
describe 'Student'
```
#### 2.4 表的启用/禁用
enable和disable可以启用/禁用这个表,is_enabled和is_disabled来检查表是否被禁用
```shell
# 禁用表
disable 'Student'
# 检查表是否被禁用
is_disabled 'Student'
# 启用表
enable 'Student'
# 检查表是否被启用
is_enabled 'Student'
```
#### 2.5 检查表是否存在
```shell
exists 'Student'
```
#### 2.6 删除表
```shell
# 删除表前需要先禁用表
disable 'Student'
# 删除表
drop 'Student'
```
## 三、增删改
#### 3.1 添加列族
**命令格式** alter '表名', '列族名'
```shell
alter 'Student', 'teacherInfo'
```
#### 3.2 删除列族
**命令格式**alter '表名', {NAME => '列族名', METHOD => 'delete'}
```shell
alter 'Student', {NAME => 'teacherInfo', METHOD => 'delete'}
```
#### 3.3 更改列族存储版本的限制
默认情况下,列族只存储一个版本的数据,如果需要存储多个版本的数据,则需要修改列族的属性。修改后可通过`desc`命令查看
```shell
alter 'Student',{NAME=>'baseInfo',VERSIONS=>3}
```
#### 3.3 插入数据
**命令格式**put '表名', '行键','列族:列','值'
**注意:如果新增数据的行键值、列族名、列名与原有数据完全相同,则相当于更新操作**
```shell
put 'Student', 'rowkey1','baseInfo:name','tom'
put 'Student', 'rowkey1','baseInfo:birthday','1990-01-09'
put 'Student', 'rowkey1','baseInfo:age','29'
put 'Student', 'rowkey1','schoolInfo:name','Havard'
put 'Student', 'rowkey1','schoolInfo:localtion','Boston'
put 'Student', 'rowkey2','baseInfo:name','jack'
put 'Student', 'rowkey2','baseInfo:birthday','1998-08-22'
put 'Student', 'rowkey2','baseInfo:age','21'
put 'Student', 'rowkey2','schoolInfo:name','yale'
put 'Student', 'rowkey2','schoolInfo:localtion','New Haven'
put 'Student', 'rowkey3','baseInfo:name','maike'
put 'Student', 'rowkey3','baseInfo:birthday','1995-01-22'
put 'Student', 'rowkey3','baseInfo:age','24'
put 'Student', 'rowkey3','schoolInfo:name','yale'
put 'Student', 'rowkey3','schoolInfo:localtion','New Haven'
put 'Student', 'wrowkey4','baseInfo:name','maike-jack'
```
#### 3.4 获取指定行、指定行中的列族、列的信息
```shell
# 获取指定行中所有列的数据信息
get 'Student','rowkey3'
# 获取指定行中指定列族下所有列的数据信息
get 'Student','rowkey3','baseInfo'
# 获取指定行中指定列的数据信息
get 'Student','rowkey3','baseInfo:name'
```
#### 3.5 删除指定行、指定行中的列
```shell
# 删除指定行
delete 'Student','rowkey3'
# 删除指定行中指定列的数据
delete 'Student','rowkey3','baseInfo:name'
```
## 四、查询
hbase中访问数据有两种基本的方式
+ 按指定rowkey获取唯一一条数据get方法
+ 按指定条件获取数据scan方法
get访问指定key的数据而scan可以设置begin和end来访问一个范围内所有的数据。get本质上就是begin和end相同的一种特殊的scan。
#### 4.1Get查询
```shell
# 获取指定行中所有列的数据信息
get 'Student','rowkey3'
# 获取指定行中指定列族下所有列的数据信息
get 'Student','rowkey3','baseInfo'
# 获取指定行中指定列的数据信息
get 'Student','rowkey3','baseInfo:name'
```
#### 4.2 查询整表数据
```shell
scan 'Student'
```
#### 4.3 查询指定列簇的数据
```shell
scan 'Student', {COLUMN=>'baseInfo'}
```
#### 4.4 条件查询
```shell
# 查询指定列的数据
scan 'Student', {COLUMNS=> 'baseInfo:birthday'}
```
除了列`COLUMNS`修饰词外HBase还支持`Limit`(限制查询结果行数),`STARTROW``ROWKEY`起始行,会先根据这个`key`定位到`region`,再向后扫描)、`STOPROW`(结束行)、`TIMERANGE`(限定时间戳范围)、`VERSIONS`(版本数)、和`FILTER`(按条件过滤行)等。
如下代表从`rowkey2`这个`rowkey`开始查找下两个行的最新3个版本的name列的数据
```shell
scan 'Student', {COLUMNS=> 'baseInfo:name',STARTROW => 'rowkey2',STOPROW => 'wrowkey4',LIMIT=>2, VERSIONS=>3}
```
#### 4.5 条件过滤
Filter可以设定一系列条件来进行过滤。如我们要限制某个列的值大于等于24
```shell
scan 'Student', FILTER=>"ValueFilter(=,'binary:24')"
```
值包含yale这个值
```shell
scan 'Student', FILTER=>"ValueFilter(=,'substring:yale')"
```
列名中的前缀为birth的
```shell
scan 'Student', FILTER=>"ColumnPrefixFilter('birth')"
```
FILTER中支持多个过滤条件通过括号、AND和OR的条件组合
```shell
# 列名中的前缀为birth且列值中包含1998的数据
scan 'Student', FILTER=>"ColumnPrefixFilter('birth') AND ValueFilter ValueFilter(=,'substring:1998')"
```
`PrefixFilter`是对Rowkey的前缀进行判断
```shell
scan 'Student', FILTER=>"PrefixFilter('wr')"
```
## 一、基本命令
#### 1.1 获取帮助
```shell
# 获取帮助
help
# 获取命令的详细信息
help 'status'
```
#### 1.2 查看服务器状态
```shell
status
```
#### 1.3 查看版本信息
```shell
version
```
## 二、关于表的操作
#### 2.1 查看所有表
```shell
list
```
#### 2.2 创建表
**命令格式** create '表名称', '列族名称1','列族名称2','列名称N'
```shell
# 创建一张名为Student的表,包含基本信息baseInfo、学校信息schoolInfo两个列族
create 'Student','baseInfo','schoolInfo'
```
#### 2.3 查看表的基本信息
**命令格式**desc '表名'
```shell
describe 'Student'
```
#### 2.4 表的启用/禁用
enable和disable可以启用/禁用这个表,is_enabled和is_disabled来检查表是否被禁用
```shell
# 禁用表
disable 'Student'
# 检查表是否被禁用
is_disabled 'Student'
# 启用表
enable 'Student'
# 检查表是否被启用
is_enabled 'Student'
```
#### 2.5 检查表是否存在
```shell
exists 'Student'
```
#### 2.6 删除表
```shell
# 删除表前需要先禁用表
disable 'Student'
# 删除表
drop 'Student'
```
## 三、增删改
#### 3.1 添加列族
**命令格式** alter '表名', '列族名'
```shell
alter 'Student', 'teacherInfo'
```
#### 3.2 删除列族
**命令格式**alter '表名', {NAME => '列族名', METHOD => 'delete'}
```shell
alter 'Student', {NAME => 'teacherInfo', METHOD => 'delete'}
```
#### 3.3 更改列族存储版本的限制
默认情况下,列族只存储一个版本的数据,如果需要存储多个版本的数据,则需要修改列族的属性。修改后可通过`desc`命令查看
```shell
alter 'Student',{NAME=>'baseInfo',VERSIONS=>3}
```
#### 3.3 插入数据
**命令格式**put '表名', '行键','列族:列','值'
**注意:如果新增数据的行键值、列族名、列名与原有数据完全相同,则相当于更新操作**
```shell
put 'Student', 'rowkey1','baseInfo:name','tom'
put 'Student', 'rowkey1','baseInfo:birthday','1990-01-09'
put 'Student', 'rowkey1','baseInfo:age','29'
put 'Student', 'rowkey1','schoolInfo:name','Havard'
put 'Student', 'rowkey1','schoolInfo:localtion','Boston'
put 'Student', 'rowkey2','baseInfo:name','jack'
put 'Student', 'rowkey2','baseInfo:birthday','1998-08-22'
put 'Student', 'rowkey2','baseInfo:age','21'
put 'Student', 'rowkey2','schoolInfo:name','yale'
put 'Student', 'rowkey2','schoolInfo:localtion','New Haven'
put 'Student', 'rowkey3','baseInfo:name','maike'
put 'Student', 'rowkey3','baseInfo:birthday','1995-01-22'
put 'Student', 'rowkey3','baseInfo:age','24'
put 'Student', 'rowkey3','schoolInfo:name','yale'
put 'Student', 'rowkey3','schoolInfo:localtion','New Haven'
put 'Student', 'wrowkey4','baseInfo:name','maike-jack'
```
#### 3.4 获取指定行、指定行中的列族、列的信息
```shell
# 获取指定行中所有列的数据信息
get 'Student','rowkey3'
# 获取指定行中指定列族下所有列的数据信息
get 'Student','rowkey3','baseInfo'
# 获取指定行中指定列的数据信息
get 'Student','rowkey3','baseInfo:name'
```
#### 3.5 删除指定行、指定行中的列
```shell
# 删除指定行
delete 'Student','rowkey3'
# 删除指定行中指定列的数据
delete 'Student','rowkey3','baseInfo:name'
```
## 四、查询
hbase中访问数据有两种基本的方式
+ 按指定rowkey获取唯一一条数据get方法
+ 按指定条件获取数据scan方法
get访问指定key的数据而scan可以设置begin和end来访问一个范围内所有的数据。get本质上就是begin和end相同的一种特殊的scan。
### 4.1Get查询
```shell
# 获取指定行中所有列的数据信息
get 'Student','rowkey3'
# 获取指定行中指定列族下所有列的数据信息
get 'Student','rowkey3','baseInfo'
# 获取指定行中指定列的数据信息
get 'Student','rowkey3','baseInfo:name'
```
#### 4.2 查询整表数据
```shell
scan 'Student'
```
#### 4.3 查询指定列簇的数据
```shell
scan 'Student', {COLUMN=>'baseInfo'}
```
#### 4.4 条件查询
```shell
# 查询指定列的数据
scan 'Student', {COLUMNS=> 'baseInfo:birthday'}
```
除了列`COLUMNS`修饰词外HBase还支持`Limit`(限制查询结果行数),`STARTROW``ROWKEY`起始行,会先根据这个`key`定位到`region`,再向后扫描)、`STOPROW`(结束行)、`TIMERANGE`(限定时间戳范围)、`VERSIONS`(版本数)、和`FILTER`(按条件过滤行)等。
如下代表从`rowkey2`这个`rowkey`开始查找下两个行的最新3个版本的name列的数据
```shell
scan 'Student', {COLUMNS=> 'baseInfo:name',STARTROW => 'rowkey2',STOPROW => 'wrowkey4',LIMIT=>2, VERSIONS=>3}
```
#### 4.5 条件过滤
Filter可以设定一系列条件来进行过滤。如我们要限制某个列的值大于等于24
```shell
scan 'Student', FILTER=>"ValueFilter(=,'binary:24')"
```
值包含yale这个值
```shell
scan 'Student', FILTER=>"ValueFilter(=,'substring:yale')"
```
列名中的前缀为birth的
```shell
scan 'Student', FILTER=>"ColumnPrefixFilter('birth')"
```
FILTER中支持多个过滤条件通过括号、AND和OR的条件组合
```shell
# 列名中的前缀为birth且列值中包含1998的数据
scan 'Student', FILTER=>"ColumnPrefixFilter('birth') AND ValueFilter ValueFilter(=,'substring:1998')"
```
`PrefixFilter`是对Rowkey的前缀进行判断
```shell
scan 'Student', FILTER=>"PrefixFilter('wr')"
```

View File

@ -8,7 +8,6 @@
&nbsp;&nbsp;&nbsp;&nbsp;<a href="#21-command-line-shell--thriftjdbc">2.1 command-line shell & thrift/jdbc</a><br/> &nbsp;&nbsp;&nbsp;&nbsp;<a href="#21-command-line-shell--thriftjdbc">2.1 command-line shell & thrift/jdbc</a><br/>
&nbsp;&nbsp;&nbsp;&nbsp;<a href="#22-Metastore">2.2 Metastore</a><br/> &nbsp;&nbsp;&nbsp;&nbsp;<a href="#22-Metastore">2.2 Metastore</a><br/>
&nbsp;&nbsp;&nbsp;&nbsp;<a href="#23-执行流程">2.3 执行流程</a><br/> &nbsp;&nbsp;&nbsp;&nbsp;<a href="#23-执行流程">2.3 执行流程</a><br/>
<a href="#三Hive环境搭建">三、Hive环境搭建</a><br/>
</nav> </nav>
@ -51,12 +50,6 @@ hive里的表名、表结构、字段名、字段类型、表的分隔符等信
## 三、Hive环境搭建
## 参考资料 ## 参考资料
1. [Hive Getting Started](https://cwiki.apache.org/confluence/display/Hive/GettingStarted) 1. [Hive Getting Started](https://cwiki.apache.org/confluence/display/Hive/GettingStarted)

View File

@ -9,7 +9,7 @@
### 二、Hadoop ### 二、Hadoop
1. [Hadoop单机版本环境搭建](https://github.com/heibaiying/BigData-Notes/blob/master/notes/installation/Hadoop单机版本环境搭建.md) 1. [Hadoop单机版本环境搭建](https://github.com/heibaiying/BigData-Notes/blob/master/notes/installation/hadoop%E5%8D%95%E6%9C%BA%E7%89%88%E6%9C%AC%E7%8E%AF%E5%A2%83%E6%90%AD%E5%BB%BA.md)

View File

@ -14,8 +14,6 @@
&nbsp;&nbsp;&nbsp;&nbsp;<a href="#24-worker进程">2.4 worker进程</a><br/> &nbsp;&nbsp;&nbsp;&nbsp;<a href="#24-worker进程">2.4 worker进程</a><br/>
&nbsp;&nbsp;&nbsp;&nbsp;<a href="#25-executor线程">2.5 executor线程</a><br/> &nbsp;&nbsp;&nbsp;&nbsp;<a href="#25-executor线程">2.5 executor线程</a><br/>
&nbsp;&nbsp;&nbsp;&nbsp;<a href="#26-并行度">2.6 并行度</a><br/> &nbsp;&nbsp;&nbsp;&nbsp;<a href="#26-并行度">2.6 并行度</a><br/>
<a href="#三Linux下Storm单机版本环境搭建">三、Linux下Storm单机版本环境搭建</a><br/>
<a href="#四storm词频统计案例">四、Storm词频统计案例</a><br/>
</nav> </nav>
## 一、Storm核心概念 ## 一、Storm核心概念
@ -248,17 +246,6 @@ task是最终运行spout或bolt中代码的单元。topology启动后1个comp
+ 每个executor默认启动一个task线程 + 每个executor默认启动一个task线程
## 三、Linux下Storm单机版本环境搭建
## 四、Storm词频统计案例
## 参考资料 ## 参考资料
1. [storm documentation -> Concepts](http://storm.apache.org/releases/1.2.2/Concepts.html) 1. [storm documentation -> Concepts](http://storm.apache.org/releases/1.2.2/Concepts.html)