课程购买咨询和资料获取请加老师QQ 2020363447
本课程讲解大规模数据处理的统一分析引擎—Spark。在本课程中基于大量案例实战,深度剖析和讲解Spark原理和新特性,且会包含完全从企业真实业务需求中抽取出的案例实战。除Spark全体系外还包含机器学习、算法、推荐系统等。
本套大型Spark架构师系列教程共计13季,本套为第七季。
课程目录:
第七季
01.回顾spark内存管理-sqlhive集成
02.spark sql实现hdfs文件的word count scala版
03.spark sql实现hdfs文件的word count java版
04.spark sql实现客户订单的做外链接查询java实现
05.spark sql 保存DataFrame成json格式
06.spark sql读取json数据成为DataFrame
07.spark sql 保存DataFrame成Parquet格式
08.spark sql 读取Parquet格式形成DataFrame
09.spark sql 保存DataFrame到mysql数据库
10.spark sql 读取mysql数据库表数据
11.spark sql作为分布式查询引擎
12.spark sql分布式查询引擎API编程访问
13.spark streaming实现word count统计scala实现
14.spark streaming实现word count java实现
15.spark streaming流上下文介绍-Receiver注意事项
16.spark streaming socket文本流内部分区考察
17.spark streaming socket块间隔设置与考察
13季全部掌握可以达到如下效果:
1.代码和原理驱动讲解Spark的各个技术点(全部手敲代码),全程图文解读
2.能够对常见的Spark性能问题,使用各种技术进行性能调优
3.熟练掌握Spark全体系的知识和操作,可以开发各种复杂的大数据离线批处理程序
4.透彻理解Spark新特性和原理,可以对Spark企业级案例,进行调优和故障排查
5.能熟练对Spark、Sclala、Kafka、机器学习、朴素贝叶斯算法等技术融汇贯通