2019-04-06 20:47:39 +08:00
2019-04-05 08:45:16 +08:00
add
2019-04-06 20:47:39 +08:00
add
2019-04-06 20:47:39 +08:00
2019-04-05 08:45:16 +08:00
add
2019-04-06 20:47:39 +08:00

BigData-Notes

Java 程序员的大数据学习之路 — — 持续更新中

Hadoop Hive Spark Flink Storm Flume Sqoop Azkaban HBase Kafka Zookeeper Scala

本仓库涉及的所有软件的详细搭建步骤整理至:Linux下大数据常用软件安装指南

一、Hadoop

  1. 分布式文件存储系统——HDFS
  2. 分布式计算框架——MapReduce
  3. 集群资源管理器——YARN
  4. Hadoop单机伪集群环境搭建

二、Hive

  1. 数据仓库Hive
  2. Linux环境下Hive的安装部署

三、Spark

  1. Spark简介
  2. Spark单机版本环境搭建
  3. RDD详解
  4. Spark Transformation 和 Action

TODO

五、Storm

  1. Strom简介
  2. Storm核心概念详解
  3. Storm单机版本环境搭建
  4. Storm编程模型

六、Flume

  1. Flume简介
  2. Linux环境下Flume的安装部署
  3. Flume的使用
  4. Flume整合Kafka

七、Sqoop

  1. Sqoop简介

  2. Sqoop的基本使用

八、Azkaban

  1. Azkaban项目简介
  2. Azkaban3.x编译及部署
  3. Azkaban Flow 1.0 的使用
  4. Azkaban Flow 2.0 的使用

九、HBase

  1. HBase基本环境搭建Standalone /pseudo-distributed mode
  2. HBase系统架构及数据结构
  3. HBase常用Shell命令
  4. HBase Java API
  5. HBase 协处理器
  6. HBase 备份与恢复
  7. HBase的SQL中间层——Phoenix
  8. Spring/Spring Boot 整合 Mybatis + Phoenix

十、Kafka

  1. Kafka 简介及消息处理过程分析
  2. 基于Zookeeper搭建Kafka高可用集群
  3. Kafka 副本机制以及选举原理剖析

十一、Zookeeper

  1. Zookeeper 简介及原理介绍
  2. Zookeeper 集群搭建Zookeeper
  3. 分布式锁实现方案Zookeeper
  4. 集群升级、迁移深入分析 Zookeeper
  5. Zab协议及选举机制

十二、Scala

Description
No description provided
Readme 24 MiB
Languages
Java 94.4%
Scala 5.2%
Csound 0.4%