课程分类

课程介绍
课程目录
用户评论
课程介绍
课程目录
用户评论

你将获得

  • 掌握某些知识点
  • 学会某些技巧(或思路)

教学服务

  • icon

    1v1专属答疑服务

  • icon

    BAT专家面试辅导

讲师介绍

  • 狂热的Python开发爱好者,数据分析可视化专家,讲课通俗易懂,激情四射。

  • 课程详情

    序号 章节 小节
    第一章 Spark介绍 课程简介
    Spark简介
    Spark生态介绍
    Spark与Hadoop的比较
    第二章 Spark的下载和安装 spark安装
    第三章 开发第一个Spark程序 Spark开发环境搭建
    开发第一个Spark程序
    第四章 认识Spark SQL Spark SQL和Hive
    Spark SQL运行原理
    DataFrame、DataSet和RDD的联系
    Parquet列式存储
    第五章 教你如何使用Rdds Rdds介绍
    RDDs基本操作之Transformations(一)
    RDDs基本操作之Transformations(二)
    RDD基本操作之Action
    RDDS的特性
    第六章 DataFrame/DataSet常用操作 一般操作:查找和过滤
    聚合操作:groupBy和agg
    单表操作:列的增删改与空值处理
    多表操作:join(一)
    多表操作:join(二)
    第七章 自定义函数和开窗函数 自定义函数:UDF
    自定义聚合函数:UDAF
    开窗函数:row_number()
    第八章 Nginx访问日志分析完整实战 项目场景介绍及分析
    第一次数据清洗:格式化原始日志数据
    第二次数据清洗:解析数据并按天以Parquet格式存储
    将分析结果批量写入MySql
    性能监控及优化
    第九章 课程总结 Spark课程总结
    温馨提示
    • 请勿私下交易
      请勿在平台外交易。与机构和老师私下交易造成的任何损失及纠纷,腾讯课堂不承担任何责任
    • 听课说明

      1、电脑:访问腾讯课堂官网 ke.qq.com 查看我的课表或下载win/mac客户端听课

      2、手机/平板:下载腾讯课堂APP, 进入学习页面听课