课程分类

课程介绍
课程目录
用户评论
课程介绍
课程目录
用户评论

你将获得

  • 掌握某些知识点
  • 学会某些技巧(或思路)

教学服务

  • icon

    1v1专属答疑服务

  • icon

    BAT专家面试辅导

讲师介绍

  • 在Spark内核方面有深入的研究,参与Scala基础入门,Spark内核及性能优化相关书籍部分内容的编写工作。 目前在物联网公司参加公司大数据平台建设及数据挖掘工作,在大数据领域有着丰富的实战经验。

  • 课程详情

            学员通过本课程的学习,不仅可以掌握使用Python3进行Spark3数据分析,还会掌握利用Scala/java进行Spark数据分析,多语言并进,力求全面掌握;另外通过项目驱动,掌握Spark框架的精髓,教导Spark源码查看的技巧;会学到Spark性能优化的核心要点,成为企业急缺的数据分析人才;更会通过Clickhouse和Spark搭建OLAP引擎,使学员对大数据生态圈有一个更加全面的认识和能力的综合提升。真实的数据分析项目,学完即可拿来作为自己的项目经验,增加面试谈薪筹码。
    • Spark内核原理(RDD、DataFrame、Dataset、Structed Stream、SparkML、SparkSQL)
    • Spark离线数据分析(千万简历数据分析、雪花模型离线数仓构建)
    • Spark特征处理及模型预测
    • Spark实时数据分析(Structed Stream)原理及实战
    • Spark+Hive构建离线数据仓库(数仓概念ODS/DWD/DWS/ADS)
    • Clickhouse核心原理及实战
    • Clickhouse engine详解
    • Spark向Clickhouse导入简历数据,进行数据聚合分析
    • catboost训练房价预测机器学习模型
    • 基于Clickhouse构建机器学习模型利用SQL进行房价预测
    • Clickhouse集群监控,Nginx反向代理Prometheus+Grafana+Clickhouse+node_exporter
    • Spark性能优化
    • Spark工程师面试宝典
    课程涉及到的技术:

    Clickhouse集群监控实战截图:

    本课程凡是消费满359的学员,一律送出价值109元的实体书籍,书籍名称为《PyTorch深度学习实战》,为2020年8月出版书籍,目前京东100%好评!符合送书条件的学员,请关注微信公众号:三角兽,后台联系管理员,待管理员确认之后,提供邮寄的地址,书籍会在一周内送达。
     
    温馨提示
    • 请勿私下交易
      请勿在平台外交易。与机构和老师私下交易造成的任何损失及纠纷,腾讯课堂不承担任何责任
    • 听课说明

      1、电脑:访问腾讯课堂官网 ke.qq.com 查看我的课表或下载win/mac客户端听课

      2、手机/平板:下载腾讯课堂APP, 进入学习页面听课