课程购买咨询和资料获取请加老师QQ 2020363447
本课程讲解大规模数据处理的统一分析引擎—Spark。在本课程中基于大量案例实战,深度剖析和讲解Spark原理和新特性,且会包含完全从企业真实业务需求中抽取出的案例实战。除Spark全体系外还包含机器学习、算法、推荐系统等。
本套大型Spark架构师系列教程共计13季,本套为第十三季。
课程目录:
第十三季
01.LFM隐语义模型原理
02.使用矩阵分解算法实现推荐
03.推荐系统-使用基于DataFrame的ALS API实现推荐1
04.推荐系统-使用基于DataFrame的ALS API实现推荐2-错误解决
05.朴素贝叶斯原理分析
06.朴素贝叶斯原理分析回顾
07.朴素贝叶斯算法java实现-1文件加载-数据框变换
08.朴素贝叶斯算法java实现-2使用目录加载-数据框变换
09.朴素贝叶斯算法java实现-3.分词与哈希词频统计
10.朴素贝叶斯算法java实现-4拆分样本数据
11.朴素贝叶斯算法java实现-5数据框转成RDD
12.朴素贝叶斯算法java实现-6.计算标签内文档数和特征向量
13.朴素贝叶斯算法java实现-7使用模型预测测试数据
14.朴素贝叶斯算法java实现-8测试模型
15.朴素贝叶斯算法java实现-9错误查找-标签位置对应的问题
13季全部掌握可以达到如下效果:
1.代码和原理驱动讲解Spark的各个技术点(全部手敲代码),全程图文解读
2.能够对常见的Spark性能问题,使用各种技术进行性能调优
3.熟练掌握Spark全体系的知识和操作,可以开发各种复杂的大数据离线批处理程序
4.透彻理解Spark新特性和原理,可以对Spark企业级案例,进行调优和故障排查
5.能熟练对Spark、Sclala、Kafka、机器学习、朴素贝叶斯算法等技术融汇贯通