BigData-Notes

Java 程序员的大数据学习之路(2019) — — 持续更新中
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
---|---|---|---|---|---|---|---|---|---|---|---|
Hadoop | Hive | Spark | Flink | Storm | Flume | Sqoop | Azkaban | HBase | Kafka | Zookeeper | Scala |
为方便查阅,所有软件的安装步骤统一整理至:Linux下大数据常用软件安装指南
一、Hadoop
- 分布式文件存储系统——HDFS
- 分布式计算框架——MapReduce
- 集群资源管理器——YARN
- Hadoop单机伪集群环境搭建
- HDFS常用Shell命令
- HDFS Java API详解
二、Hive
- 数据仓库Hive简介
- Linux环境下Hive的安装部署
- Hive Shell基本使用
- Hive 核心概念讲解
- Hive 分区表和分桶表
- Hive 常用DDL操作
- Hive 数据查询
- Hive 视图和索引
- Hive 模式设计
三、Spark
- Spark简介
- Spark单机版本环境搭建
- RDD详解
- Spark Transformation 和 Action
四、Flink
TODO
五、Storm
- Storm和流处理简介
- Storm核心概念详解
- Storm单机版本环境搭建
- Storm编程模型详解
- Storm项目三种打包方式对比分析
- Storm集成Redis详解
- Storm集成HDFS/HBase
- Storm集成Kafka
六、Flume
七、Sqoop
八、Azkaban
九、HBase
- Hbase 简介
- HBase系统架构及数据结构
- HBase基本环境搭建(Standalone /pseudo-distributed mode)
- HBase常用Shell命令
- HBase Java API
- Hbase 过滤器详解
- HBase 协处理器详解
- HBase 容灾与备份
- HBase的SQL中间层——Phoenix
- Spring/Spring Boot 整合 Mybatis + Phoenix
十、Kafka
- Kafka 核心概念介绍
- 基于Zookeeper搭建Kafka高可用集群
- Kafka生产者详解
- Kafka消费者详解
- Kafka 副本机制以及选举原理剖析
- Kafka的数据可靠性
十一、Zookeeper
- Zookeeper 简介及核心概念
- Zookeeper集群搭建Zookeeper
- Zookeeper分布式锁实现方案
- 集群升级、迁移深入分析 Zookeeper
- Zab协议及选举机制
十二、Scala
Description
Languages
Java
94.4%
Scala
5.2%
Csound
0.4%