课程分类

课程介绍
课程目录
用户评论
课程介绍
课程目录
用户评论

你将获得

  • 掌握某些知识点
  • 学会某些技巧(或思路)

教学服务

  • icon

    1v1专属答疑服务

  • icon

    BAT专家面试辅导

课程详情

课程简介:
 

 linux基础和shell脚本

从安装到linux系统配置,从简单命令到复杂命令,逐步深入;

对比windows操作系统学习linux系统,文件操作、用户操作、权限操作、服务软件安装等;对比java编程语言,轻松学习基于linux的shell脚本编程、awk脚本编程。

        Day01:linux介绍和环境搭建

        Day02:linux相关命令介绍1

        Day03:linux相关命令介绍2

        Day04:linux系统下软件安装

        Day05:shell编程


hadoop、hdfs、zookeeper和hadoop的高可用
 

对hadoop的核心概念,核心模块hdfs和yarn详细讲解;对hadoop进行本地、分布式模式和高可用(HA)进行搭建;

讲解hdfs的shell命令、rpc机制和java对hdfs的API操作;对zookeeper作全面讲解和zookeeper集群搭建。

        Day06:hadoop的简介和单机版安装

        Day07:hdfs的理论讲解

        Day08:yarn的理论讲解

        Day09:hadoop的伪分布式和分布式搭建

        Day10:hdfs的shell命令和hdfs api01

        Day11:hdfs的api02和rpc

        Day12:zookeeper的讲解

        Day13:hadoop的高可用

分布式并行离线计算框架Mapreduce
 

mapreduce的重要知识点、运行方式和shuffle的复杂过程讲解;mapreduce的入门案例wordcount详解,经典案例倒排索引、分区、二次排序、join等详解;

mapreduce和awk脚本的对比案例展示;mapreduce自定义数据类型;高级案例之mapreduce的自定义输入输出数据格式编写。

        Day14:mr的理论讲解和wordcount案例

        Day15:mr的基本数学运算和awk脚本案例比较

        Day16:mr的shuffle过程、partitioner、combiner、去重、倒排索引

        Day17:mr的secondarySort、topN、自定义数据类型、单表连接、多表连接

        Day18:mr的chain、oldAPI、简单案例

        Day19:mr自定输入输出数据类型编写
 

数据仓库工具hive

hive的架构讲解、多种模式的安装和hive的hql语句;hive中的高级查询语句使用;hive中常用内部函数详解;

hive的企业真实udf案例编写;hive的存储格式、serde、索引和优化的详解;sqoop的安装和不同数据源的相互整合。

        Day20:hive的介绍、安装和简单命令

        Day21:hive的高级查询

        Day23:hive的复杂类型和内部函数

        Day24:hive的udf编写

        Day25:hive的存储格式、serde、索引、视图、优化

        Day26:sqoop介绍、安装和sqoop语句编写

分布式数据库Hbase
 

Hbase的详细介绍和分布式的搭建详细讲解;java操作Hbase的API和高级过滤器filter的编写;

Hbase和hive、Hbase和mapreduce的整合案例;flume概念介绍、flume的安装、flume基础脚本和高级脚本的编写。

        Day27:Hbase介绍、伪分布式安装、全分布式安装和简单命令

        Day28:Hbase的api和filter

        Day29:Hbase和hive的整合、Hbase和mapreduce的整合

        Day30:flume的介绍、安装、和flume脚本编写

        Day31:flume高级脚本编写