BigData-Notes/notes/Hbase的SQL层——Phoenix.md
2019-04-04 16:07:58 +08:00

9.6 KiB
Raw Blame History

Hbase的SQL中间层——Phoenix

一、Phoenix简介
二、Phoenix安装
    2.1 下载并解压
    2.2 拷贝Jar包
    2.3 重启 Region Servers
    2.4 启动Phoenix
    2.5 启动结果
三、Phoenix 简单使用
    3.1 创建表
    3.2 插入数据
    3.3 修改数据
    3.4 删除数据
    3.5 查询数据
    3.6 退出命令
    3.7 扩展
四、Phoenix Java API
    4.1 引入Phoenix core JAR包
    4.2 简单的Java API实例

一、Phoenix简介

Phoenix是HBase的开源SQL层。使得您可以使用标准JDBC API而不是常规HBase客户端API来操作Hbases上的数据。

Phoenix完全使用Java编写作为HBase内嵌的JDBC驱动。Phoenix查询引擎会将SQL查询转换为一个或多个HBase scan并编排并行执行以生成标准的JDBC结果集同时Phoenix还拥有二级索引等Hbase不具备的特性这使得Phoenix具有极好的性能表现。

二、Phoenix安装

我们可以按照官方安装说明进行安装,官方说明如下:

  • download and expand our installation tar
  • copy the phoenix server jar that is compatible with your HBase installation into the lib directory of every region server
  • restart the region servers
  • add the phoenix client jar to the classpath of your HBase client
  • download and setup SQuirrel as your SQL client so you can issue adhoc SQL against your HBase cluster

2.1 下载并解压

官方下载地址: http://phoenix.apache.org/download.html

官方针对Apache版本和CDH版本的HBase均提供了安装包按需下载即可。这里我们下载的版本为4.14.0-cdh5.14.2

# 下载
wget http://mirror.bit.edu.cn/apache/phoenix/apache-phoenix-4.14.0-cdh5.14.2/bin/apache-phoenix-4.14.0-cdh5.14.2-bin.tar.gz
# 解压
tar tar apache-phoenix-4.14.0-cdh5.14.2-bin.tar.gz

2.2 拷贝Jar包

按照官方文档的说明需要将phoenix server jar 添加到所有 Region Servers上 Hbase 安装目录的 lib目录下。

这里由于我搭建的是Hbase伪集群所以只需要拷贝到当前机器的HBase的lib目录下。如果是真实集群则使用scp命令分发到所有Region Servers机器上。

cp /usr/app/apache-phoenix-4.14.0-cdh5.14.2-bin/phoenix-4.14.0-cdh5.14.2-server.jar /usr/app/hbase-1.2.0-cdh5.15.2/lib

2.3 重启 Region Servers

# 停止Hbase
stop-hbase.sh
# 启动Hbase
start-hbase.sh

2.4 启动Phoenix

在Phoenix解压目录下的bin目录下执行如下命令需要指定Zookeeper的地址:

  • 如果HBase采用Standalone模式或者伪集群模式搭建则采用内置的 Zookeeper默认端口为2181
  • 如果是HBase是集群模式并采用自己搭建的Zookeeper集群则按照自己的实际情况指定端口
# ./sqlline.py hadoop001:2181

2.5 启动结果

启动后则进入了Phoenix交互式SQL命令行可以使用!table!tables查看当前所有表的信息

三、Phoenix 简单使用

3.1 创建表

CREATE TABLE IF NOT EXISTS us_population (
      state CHAR(2) NOT NULL,
      city VARCHAR NOT NULL,
      population BIGINT
      CONSTRAINT my_pk PRIMARY KEY (state, city));

新建的表会按照特定的规则转换为Hbase上的表关于表的信息可以通过Hbase Web UI 进行查看:

3.2 插入数据

Phoenix 中插入数据采用的是UPSERT而不是INSERT,因为Phoenix并没有更新操作插入相同主键的数据就视为更新所以UPSERT就相当于UPDATE+INSERT

UPSERT INTO us_population VALUES('NY','New York',8143197);
UPSERT INTO us_population VALUES('CA','Los Angeles',3844829);
UPSERT INTO us_population VALUES('IL','Chicago',2842518);
UPSERT INTO us_population VALUES('TX','Houston',2016582);
UPSERT INTO us_population VALUES('PA','Philadelphia',1463281);
UPSERT INTO us_population VALUES('AZ','Phoenix',1461575);
UPSERT INTO us_population VALUES('TX','San Antonio',1256509);
UPSERT INTO us_population VALUES('CA','San Diego',1255540);
UPSERT INTO us_population VALUES('TX','Dallas',1213825);
UPSERT INTO us_population VALUES('CA','San Jose',912332);

3.3 修改数据

-- 插入主键相同的数据就视为更新
UPSERT INTO us_population VALUES('NY','New York',999999);

3.4 删除数据

DELETE FROM us_population WHERE city='Dallas';

3.5 查询数据

SELECT state as "州",count(city) as "市",sum(population) as "热度"
FROM us_population
GROUP BY state
ORDER BY sum(population) DESC;

3.6 退出命令

!quit

3.7 扩展

从上面的简单操作中我们可以看出Phoenix 查询语句与我们正常使用的SQL是基本相同的关于Phoenix 支持的语句、数据类型、函数、序列和Oracle中序列类似因为涵盖内容很广可以参考其官方文档官方上有详尽的配图说明的

四、Phoenix Java API

因为Phoenix遵循JDBC规范并提供了对应的数据库驱动PhoenixDriver这使采用Java对其进行操作的时候就如同对其他关系型数据库例如 MySQL操作一样。

因为在实际的开发中我们通常都是采用第三方框架比如mybatis,Hibernate,Spring Data 等很少使用原生Java API操作关系型数据库所以这里只给出一个简单的查询作为示例并在下一篇文章中给出Spring boot + mybatis + Phoenix 的整合用例。

4.1 引入Phoenix core JAR包

如果是maven项目直接在maven中央仓库找到对应的版本导入依赖即可

 <!-- https://mvnrepository.com/artifact/org.apache.phoenix/phoenix-core -->
    <dependency>
      <groupId>org.apache.phoenix</groupId>
      <artifactId>phoenix-core</artifactId>
      <version>4.14.0-cdh5.14.2</version>
    </dependency>

如果是普通项目则可以从Phoenix 解压目录下找到对应的JAR包然后手动引入

4.2 简单的Java API实例

import java.sql.Connection;
import java.sql.DriverManager;
import java.sql.PreparedStatement;
import java.sql.ResultSet;


public class PhoenixJavaApi {

    public static void main(String[] args) throws Exception {

        // 加载数据库驱动
        Class.forName("org.apache.phoenix.jdbc.PhoenixDriver");

        /*
         * 指定数据库地址,格式为 jdbc:phoenix:Zookeeper地址
         * 如果HBase采用Standalone模式或者伪集群模式搭建则HBase默认使用内置的Zookeeper默认端口为2181
         */
        Connection connection = DriverManager.getConnection("jdbc:phoenix:192.168.200.226:2181");

        PreparedStatement statement = connection.prepareStatement("SELECT * FROM us_population");

        ResultSet resultSet = statement.executeQuery();

        while (resultSet.next()) {
            System.out.println(resultSet.getString("city") + " "
                    + resultSet.getInt("population"));
        }

        statement.close();
        connection.close();
    }
}

结果如下:

参考资料

  1. http://phoenix.apache.org/