序号 | 章节 | 小节 |
第一章 | Spark介绍 | 课程简介 |
Spark简介 | ||
Spark生态介绍 | ||
Spark与Hadoop的比较 | ||
第二章 | Spark的下载和安装 | spark安装 |
第三章 | 开发第一个Spark程序 | Spark开发环境搭建 |
开发第一个Spark程序 | ||
第四章 | 认识Spark SQL | Spark SQL和Hive |
Spark SQL运行原理 | ||
DataFrame、DataSet和RDD的联系 | ||
Parquet列式存储 | ||
第五章 | 教你如何使用Rdds | Rdds介绍 |
RDDs基本操作之Transformations(一) | ||
RDDs基本操作之Transformations(二) | ||
RDD基本操作之Action | ||
RDDS的特性 | ||
第六章 | DataFrame/DataSet常用操作 | 一般操作:查找和过滤 |
聚合操作:groupBy和agg | ||
单表操作:列的增删改与空值处理 | ||
多表操作:join(一) | ||
多表操作:join(二) | ||
第七章 | 自定义函数和开窗函数 | 自定义函数:UDF |
自定义聚合函数:UDAF | ||
开窗函数:row_number() | ||
第八章 | Nginx访问日志分析完整实战 | 项目场景介绍及分析 |
第一次数据清洗:格式化原始日志数据 | ||
第二次数据清洗:解析数据并按天以Parquet格式存储 | ||
将分析结果批量写入MySql | ||
性能监控及优化 | ||
第九章 | 课程总结 | Spark课程总结 |
课程介绍
课程目录
往期学员作品
用户评论
课程介绍
课程目录
往期学员作品
用户评论
你将获得
- 掌握某些知识点
- 学会某些技巧(或思路)
教学服务
1v1专属答疑服务
BAT专家面试辅导
讲师介绍
梁锋卫
狂热的Python开发爱好者,数据分析可视化专家,讲课通俗易懂,激情四射。
狂热的Python开发爱好者,数据分析可视化专家,讲课通俗易懂,激情四射。
课程详情
温馨提示
- 请勿私下交易请勿在平台外交易。与机构和老师私下交易造成的任何损失及纠纷,腾讯课堂不承担任何责任
- 听课说明
1、电脑:访问腾讯课堂官网 ke.qq.com 查看我的课表或下载win/mac客户端听课
2、手机/平板:下载腾讯课堂APP, 进入学习页面听课