课程购买咨询和资料获取请加老师QQ 2020363447
本课程讲解大规模数据处理的统一分析引擎—Spark。在本课程中基于大量案例实战,深度剖析和讲解Spark原理和新特性,且会包含完全从企业真实业务需求中抽取出的案例实战。除Spark全体系外还包含机器学习、算法、推荐系统等。
本套大型Spark架构师系列教程共计13季,本套为第一季。
课程目录:
第一季
001.大数据回顾
002.spark介绍-快速-通用-简单-场景多样
003.spark安装与验证
004.spark-shell下实现worcount-链式编程
005.idea下使用spark.2.4.0实现wordcount统计scala实现
006.idea下使用spark.2.4.0实现wordcount统计显式声明变量类型
007.idea实现wordcount java API
008.idea实现历年**气温统计scala实现
009.idea实现历年**气温统计-升降序排列-java实现
010.scala的SeqWrapper类排序不支持原因考察
011.scala的气温数据的多指标聚合
012.spark集群模式介绍-local-standalone-yarn
013.spark 独立集群部署
014.spark-shell在集群模式运行-使用静态数据-观察DAG
015.spark集群和hdfs集成
016.部署程序到spark集群上执行
13季全部掌握可以达到如下效果:
1.代码和原理驱动讲解Spark的各个技术点(全部手敲代码),全程图文解读
2.能够对常见的Spark性能问题,使用各种技术进行性能调优
3.熟练掌握Spark全体系的知识和操作,可以开发各种复杂的大数据离线批处理程序
4.透彻理解Spark新特性和原理,可以对Spark企业级案例,进行调优和故障排查
5.能熟练对Spark、Sclala、Kafka、机器学习、朴素贝叶斯算法等技术融汇贯通