大数据hadoop入门教程
  1. Apache Hadoop简介

    1. 录播
      Hadoop介绍
      10分钟
    2. 录播
      Hadoop发展简史
      7分钟
    3. 录播
      Hadoop特性优点&国内外应用
      10分钟
  2. Apache Hadoop—集群搭建

    1. 录播
      集群搭建--发行版本&集群简介
      13分钟
    2. 录播
      集群搭建--服务器环境准备
      8分钟
    3. 录播
      集群搭建--JDK环境安装
      3分钟
    4. 录播
      集群搭建--安装包目录结构
      8分钟
    5. 录播
      集群搭建--配置文件修改上
      11分钟
    6. 录播
      集群搭建--配置文件修改下
      9分钟
    7. 录播
      集群搭建--配置文件注意事项
      6分钟
    8. 录播
      集群搭建--namenode格式化
      6分钟
    9. 录播
      集群搭建--启动方式
      8分钟
    10. 录播
      集群搭建--集群ui&初体验
      9分钟
  3. Apache Hadoop—HDFS

    1. 录播
      HDFS--介绍&模拟实现思路
      13分钟
    2. 录播
      HDFS--设计目标
      4分钟
    3. 录播
      HDFS--重要特性
      9分钟
    4. 录播
      HDFS--shell客户端
      6分钟
    5. 录播
      HDFS--shell常用命令介绍
      13分钟
    6. 录播
      HDFS基本原理--NameNode概述
      8分钟
    7. 录播
      HDFS基本原理--DataNode概述
      6分钟
    8. 录播
      HDFS工作机制--概述
      5分钟
    9. 录播
      HDFS工作机制--写数据流程--上
      11分钟
    10. 录播
      HDFS工作机制--写数据流程--下
      14分钟
  4. Apache Hadoop—HDFS

    1. 录播
      HDFS工作机制--读数据流程
      12分钟
    2. 录播
      HDFS应用开发--JAVA api环境&对象
      5分钟
    3. 录播
      HDFS应用开发--创建目录&客户端身份设置
      8分钟
    4. 录播
      HDFS应用开发-下载文件&本地hadoop环境配置
      7分钟
    5. 录播
      HDFS应用开发--其他api&Stream操作
      11分钟
    6. 录播
      案例:shell定时采集数据至hdfs--需求分析
      6分钟
    7. 录播
      案例:shell定时采集数据至hdfs--实现
      12分钟
  5. Hadoop MapReduce

    1. 录播
      理解MapReduce思想
      7分钟
    2. 录播
      MapReduce计算模拟实现思路
      11分钟
    3. 录播
      MapReduce设计构思
      6分钟
    4. 录播
      MapReduce框架结构&编程规范
      6分钟
    5. 录播
      WordCount案例--Mapper编写:mr数据类型
      15分钟
    6. 录播
      WordCount案例--Mapper编写:map方法
      12分钟
    7. 录播
      类型确定&如何调用
      12分钟
    8. 录播
      reduce方法编程
      4分钟
    9. 录播
      运行主类Job编程
      14分钟
    10. 录播
      集群运行模式
      10分钟
  6. Hadoop MapReduce

    1. 录播
      本地运行模式
      9分钟
    2. 录播
      MapReduce的输入和输出
      9分钟
  7. MapReduce数据分区&分区规则及编程案例

    1. 录播
      初识mapreduce数据分区&分区规则
      10分钟
    2. 录播
      处理流程--Mapper任务执行流程解析
      12分钟
    3. 录播
      处理流程--Reducer任务执行流程解析
      14分钟
    4. 录播
      编程案例--流量汇总--序列化机制Writable
      3分钟
    5. 录播
      编程案例--流量汇总--对象序列化编写
      15分钟
    6. 录播
      编程案例--流量汇总--mapper编写
      9分钟
    7. 录播
      编程案例--流量汇总--Reducer编写
      7分钟
    8. 录播
      编程案例--流量汇总--运行主类编写
      6分钟
    9. 录播
      流量汇总排序-需求分析&comopareTo方法重写
      13分钟
    10. 录播
      流量汇总排序--mr代码实现
      6分钟
  8. MapReduce数据分区&分区规则及编程案例

    1. 录播
      流量汇总分区需求分析&HashPartitioner讲解
      11分钟
    2. 录播
      流量汇总分区--自定义分区&mr编写
      8分钟
    3. 录播
      流量汇总分区分区个数和reduceTask个数关系
      6分钟
    4. 录播
      combiner组件介绍&使用注意事项
      11分钟
  9. Apache Flume概述及案例讲解

    1. 录播
      Apache Flume--概述&运行机制
      11分钟
    2. 录播
      Apache Flume--安装部署&netcat-logger
      13分钟
    3. 录播
      Apache Flume--案例--采集目录至HDFS
      11分钟
    4. 录播
      Apache Flume--案例--spooldir使用注意事项
      3分钟
    5. 录播
      Apache Flume--案例--采集文件至HDFS
      11分钟
    6. 录播
      Apache Flume--高级功能--load balance
      12分钟
    7. 录播
      Apache Flume--高级功能--failover
      12分钟
    8. 录播
      实战案例--采集日志汇总&拦截器使用
      15分钟
    9. 录播
      扩展了解--自定义拦截器思路
      8分钟

对课程感兴趣?

点击报名,听课时长可兑换余额哦~

大数据hadoop入门教程免费

最近在学 131 累计报名 2029 好评度 100%
咨询老师
用手机看

扫一扫继续用手机看

  • 微信扫码

  • QQ扫码

下载手机APP

课程概述

目录

往期学员作业()

评论

简  介 本课程是大数据学科的入门教程,将会为您讲述hadoop的具体内容,对大数据感兴趣的你一定不要错过哦!Hadoop中的分布式计算框架,使的分布式编程更简单,能够很好的处理存储在hdfs上的海量数据。

课程咨询、获取课件、技术交流直接加入博学谷在线学习:631731828


课程简介

本课程是大数据学科的入门教程,将会为您讲述hadoop的具体内容,对大数据感兴趣的你一定不要错过哦!

Hadoop实现了一个分布式文件系统,简称HDFS。HDFS有高容错性的特点,并且设计用来部署在低廉的硬件上;而且它提供高吞吐量来访问应用程序的数据,适合那些有着超大数据集的应用程序。HDFS放宽了POSIX的要求,可以以流的形式访问文件系统中的数据。Hadoop中的分布式计算框架,使的分布式编程更简单,能够很好的处理存储在hdfs上的海量数据。
 

适合人群

1.想要转行大数据开发的在职程序员

2.想了解大数据处理的所有人员
 

课程亮点

1.从hadoop基本使用、运行原理、实战案例 全方位讲解

2.从概念讲起,没有接触过hadoop的学员也能很好理解

3.课程内容精炼,学习效率高
 

主讲内容

第一章 Apache Hadoop简介

01.Hadoop介绍

02.Hadoop发展简史

03.Hadoop特性优点&国内外应用

第二章 Apache Hadoop—集群搭建

01.集群搭建--发行版本&集群简介

02.集群搭建--服务器环境准备

03.集群搭建--JDK环境安装

04.集群搭建--安装包目录结构

05.集群搭建--配置文件修改上

06.集群搭建--配置文件修改下

07.集群搭建--配置文件注意事项

08.集群搭建--namenode格式化

09.集群搭建--启动方式

10.集群搭建--集群ui&初体验

第三章 Apache Hadoop—HDFS

01.HDFS--介绍&模拟实现思路

02.HDFS--设计目标

03.HDFS--重要特性

04.HDFS--shell客户端

05.HDFS--shell常用命令介绍

06.HDFS基本原理--NameNode概述

07.HDFS基本原理--DataNode概述

08.HDFS工作机制--概述

09.HDFS工作机制--写数据流程--上

10.HDFS工作机制--写数据流程--下

11.HDFS工作机制--读数据流程

12.HDFS应用开发--JAVA api环境&对象

13.HDFS应用开发--创建目录&客户端身份设置

14.HDFS应用开发--下载文件&本地hadoop环境配置

15.HDFS应用开发--其他api&Stream操作

16.案例:shell定时采集数据至hdfs--需求分析

17.案例:shell定时采集数据至hdfs--实现

第四章 Hadoop MapReduce

01.理解MapReduce思想

02.MapReduce计算模拟实现思路

03.MapReduce设计构思

04.MapReduce框架结构&编程规范

05.WordCount案例--Mapper编写:mr数据类型

06.WordCount案例--Mapper编写:map方法

07.WordCount案例--Reducer编写:类型确定&如何调用

08.WordCount案例--Reducer编写:reduce方法编程

09.WordCount案例--运行主类Job编程

10.程序运行模型--集群运行模式

11.程序运行模型--本地运行模式

12.MapReduce的输入和输出

第五章 MapReduce数据分区&分区规则及编程案例

01.理解MapReduce思想

02.MapReduce计算模拟实现思路

03.MapReduce设计构思

04.MapReduce框架结构&编程规范

05.WordCount案例--Mapper编写:mr数据类型

06.WordCount案例--Mapper编写:map方法

07.WordCount案例--Reducer编写:类型确定&如何调用

08.WordCount案例--Reducer编写:reduce方法编程

09.WordCount案例--运行主类Job编程

10.程序运行模型--集群运行模式

11.程序运行模型--本地运行模式

12.MapReduce的输入和输出

第六章 Apache Flume概述及案例讲解

01.概述&运行机制

02.安装部署&netcat-logger

03.案例--采集目录至HDFS

04.案例--spooldir使用注意事项

05.案例--采集文件至HDFS

06.高级功能--load balance

07.高级功能--failover

08.实战案例--采集日志汇总&拦截器使用

09.扩展了解--自定义拦截器思路
 

学完收获

1.快速了解hadoop

2.学会hadoop集群中的文件存储功能.分布式编程框架

3.了解离线大数据处理的基本流程

* 课程提供者:博学谷