Spark从基础到进阶
  1. 01 Spark入门

    1. 录播
      01.spark简介-1
      27分钟
    2. 录播
      02.spark简介-2
      19分钟
    3. 录播
      03.Spark环境搭建
      20分钟
    4. 录播
      04.Spark高可用集群搭建
      39分钟
    5. 录播
      05.SparkShell的使用
      28分钟
    6. 录播
      06.Spark各个进程的作用简介与YARN的对比
      29分钟
    7. 录播
      07.Scala语言编写Spark的WordCount程序
      30分钟
    8. 录播
      08.Java语言编写Spark的WordCount程序
      28分钟
    9. 录播
      09.用JavaLambda编写Spark的WordCount程序
      28分钟
    10. 录播
      10.Spark任务打包和提交
      20分钟
  2. 02 弹性分布式数据集RDD(一)

    1. 录播
      01.复习
      22分钟
    2. 录播
      02.RDD简介
      36分钟
    3. 录播
      03.RDD的Transformation和action
      40分钟
    4. 录播
      04.RDD的常用transfermation
      20分钟
    5. 录播
      05.RDD的分区数量
      30分钟
    6. 录播
      06.RDD的常用transfermation-2
      34分钟
    7. 录播
      06.RDD的常用transfermation-3
      13分钟
    8. 录播
      07.RDD的常用transfermation-4
      13分钟
    9. 录播
      08.RDD的常用Action
      21分钟
    10. 录播
      09.题目4求每个学科最受欢迎的老师
      7分钟
  3. 02 弹性分布式数据集RDD(一)续

    1. 录播
      10.每个学科最受欢迎的老师代码实现
      34分钟
    2. 录播
      11.mapPartitionsWithIndex的使用
      33分钟
    3. 录播
      12.aggregate的使用
      17分钟
  4. 弹性分布式数据集RDD(二)

    1. 录播
      01.复习
      17分钟
    2. 录播
      02.RDD的算子使用-1
      17分钟
    3. 录播
      03.RDD的算子使用-2
      32分钟
    4. 录播
      04.RDD的算子使用-3
      55分钟
    5. 录播
      05.RDD的算子使用-4
      15分钟
    6. 录播
      06.RDD的算子使用-5
      19分钟
    7. 录播
      07.combineByKey的使用
      50分钟
    8. 录播
      08.combineByKey的使用2
      10分钟
    9. 录播
      09.RDD详细说明
      58分钟
    10. 录播
      10.WordCount执行过程
      41分钟
  5. 弹性分布式数据集RDD(三)

    1. 录播
      01.自定义分区器计算最受欢迎的老师
      57分钟
    2. 录播
      02.RDD的cache简介
      22分钟
    3. 录播
      03.自定义分区器避免多少shuffle
      26分钟
    4. 录播
      04.自定义分区器避免多次shuffle
      19分钟
    5. 录播
      05.RDD的cache
      8分钟
    6. 录播
      06.RDD的checkpoint
      25分钟
    7. 录播
      07.RDD的存储级别
      23分钟
    8. 录播
      08.CheckPoint的使用技巧
      45分钟
    9. 录播
      09.RDD的宽依赖和窄依赖
      34分钟
    10. 录播
      10.stage中Task数量
      30分钟
  6. 弹性分布式数据集RDD(四)

    1. 录播
      01.复习和Stage划分实验
      44分钟
    2. 录播
      02.spark认为执行流程
      24分钟
    3. 录播
      03.广播变量
      40分钟
    4. 录播
      04.根据IP计算归属地-1
      33分钟
    5. 录播
      05.根据IP计算归属地-2
      23分钟
    6. 录播
      06利用foreachPartition将数据写入到数据库
      34分钟
    7. 录播
      07.JdbcRDD的使用
      42分钟
    8. 录播
      08.作业
      11分钟
  7. SparkSQL (一)

    1. 录播
      01.复习
      18分钟
    2. 录播
      02.spark-sql简介
      26分钟
    3. 录播
      03.SparkSQL基本使用
      45分钟
    4. 录播
      04.spark基本使用2
      26分钟
    5. 录播
      05Spark老的DataFrame API-1
      29分钟
    6. 录播
      06Spark2.0DataFrame
      24分钟
    7. 录播
      07spark2.0DataSet和DataFrame简介
      19分钟
    8. 录播
      08使用DataSet编写spark程序
      82分钟
    9. 录播
      09.spark2.0新特性
      56分钟
  8. SparkSQL(二)

    1. 录播
      01.复习
      17分钟
    2. 录播
      02.SparkSQL的数据源
      49分钟
    3. 录播
      03.SparkSQL将数据写入到MySQL中
      10分钟
    4. 录播
      04.自定义函数计算IP归属地-1
      49分钟
    5. 录播
      05.自定义函数计算IP归属地-2
      25分钟
    6. 录播
      06.自定义聚合函数UDAF
      47分钟
    7. 录播
      07.spark-sql整合hive-1
      50分钟
    8. 录播
      08.spark-sql整合hive-2
      16分钟
    9. 录播
      09.spark-sql整合hive的自定义函数
      29分钟

对课程感兴趣?

点击报名,听课时长可兑换余额哦~

Spark从基础到进阶免费

最近在学 234 累计报名 1879 好评度 100%
咨询老师

课程概述

目录

评论

老师介绍

  • 洛克 Roke

    洛克 Roke

    人工智能学院院长 毕业于:北京航空航天大学 软件工程系 曾就职于:穷游网 人生信条:莫找借口失败,只找理由成功 熟练掌握Java、Scale、Hadoop编程语言,有独到的编程思路和良好的编程思想。能够从原理上解决学生的问题,长期受到学员好评。
简  介 Spark从基础到进阶 Spark作为新一代大数据计算引擎,因为内存计算的特性,具有比hadoop更快的计算速度。本教程涉及Spark基础概念RDD,KeyValueRDD,RDD的常用Transformation和Action操作等。
关注“小牛学堂”微信公众号,回复0元,参与免费入学一个月活动,长期有效

* 课程提供者:小牛学堂

老师还为你推荐了以下几门课程