2019-04-28 17:50:26 +08:00
2019-04-21 19:23:13 +08:00
2019-04-28 17:50:26 +08:00
2019-04-28 17:50:26 +08:00
2019-04-25 17:18:30 +08:00
2019-04-16 17:13:27 +08:00
2019-04-27 10:26:39 +08:00

BigData-Notes

Java 程序员的大数据学习之路2019 — — 持续更新中

Hadoop Hive Spark Flink Storm Flume Sqoop Azkaban HBase Kafka Zookeeper Scala

为方便查阅,所有软件的安装步骤统一整理至:Linux下大数据常用软件安装指南

一、Hadoop

  1. 分布式文件存储系统——HDFS
  2. 分布式计算框架——MapReduce
  3. 集群资源管理器——YARN
  4. Hadoop单机伪集群环境搭建
  5. HDFS常用Shell命令
  6. HDFS Java API详解

二、Hive

  1. 数据仓库Hive简介
  2. Linux环境下Hive的安装部署
  3. Hive Shell基本使用
  4. Hive 核心概念讲解
  5. Hive 分区表和分桶表
  6. Hive 常用DDL操作
  7. Hive 数据查询
  8. Hive 视图和索引
  9. Hive 模式设计

三、Spark

  1. Spark简介
  2. Spark单机版本环境搭建
  3. RDD详解
  4. Spark Transformation 和 Action

TODO

五、Storm

  1. Storm和流处理简介
  2. Storm核心概念详解
  3. Storm单机版本环境搭建
  4. Storm编程模型详解
  5. Storm项目三种打包方式对比分析
  6. Storm集成Redis详解
  7. Storm集成HDFS/HBase
  8. Storm集成Kafka

六、Flume

  1. Flume简介及基本使用
  2. Linux环境下Flume的安装部署
  3. Flume整合Kafka

七、Sqoop

  1. Sqoop简介与安装

  2. Sqoop的基本使用

八、Azkaban

  1. Azkaban简介
  2. Azkaban3.x 编译及部署
  3. Azkaban Flow 1.0 的使用
  4. Azkaban Flow 2.0 的使用

九、HBase

  1. Hbase 简介
  2. HBase系统架构及数据结构
  3. HBase基本环境搭建Standalone /pseudo-distributed mode
  4. HBase常用Shell命令
  5. HBase Java API
  6. Hbase 过滤器详解
  7. HBase 协处理器详解
  8. HBase 容灾与备份
  9. HBase的SQL中间层——Phoenix
  10. Spring/Spring Boot 整合 Mybatis + Phoenix

十、Kafka

  1. Kafka 核心概念介绍
  2. 基于Zookeeper搭建Kafka高可用集群
  3. Kafka生产者详解
  4. Kafka消费者详解
  5. Kafka 副本机制以及选举原理剖析
  6. Kafka的数据可靠性

十一、Zookeeper

  1. Zookeeper 简介及核心概念
  2. Zookeeper集群搭建Zookeeper
  3. Zookeeper分布式锁实现方案
  4. 集群升级、迁移深入分析 Zookeeper
  5. Zab协议及选举机制

十二、Scala

Description
No description provided
Readme 24 MiB
Languages
Java 94.4%
Scala 5.2%
Csound 0.4%