大数据-电商数仓项目
  1. 1数仓项目介绍

    1. 录播
      1数仓项目介绍
      10分钟
  2. 2数仓采集_用户行为采集课程介绍

    1. 录播
      2数仓采集_用户行为采集课程介绍
      4分钟
  3. 3数仓采集_数仓的概念

    1. 录播
      3数仓采集_数仓的概念
      16分钟
  4. 4数仓采集_项目需求

    1. 录播
      4数仓采集_项目需求
      5分钟
  5. 5数仓采集_项目技术选型

    1. 录播
      5数仓采集_项目技术选型
      9分钟
  6. 6数仓采集_系统数据流程设计

    1. 录播
      6数仓采集_系统数据流程设计
      13分钟
  7. 7数仓采集_框架版本选型

    1. 录播
      7数仓采集_框架版本选型
      5分钟
  8. 8数仓采集_框架版本具体型号

    1. 录播
      8数仓采集_框架版本具体型号
      6分钟
  9. 9数仓采集_服务器选型

    1. 录播
      9数仓采集_服务器选型
      10分钟
  10. 10数仓采集_集群资源规划设计

    1. 录播
      10数仓采集_集群资源规划设计
      7分钟
  11. 11数仓采集_测试集群服务器规划

    1. 录播
      11数仓采集_测试集群服务器规划
      13分钟
  12. 12数仓采集_埋点数据基本格式

    1. 录播
      12数仓采集_埋点数据基本格式
      15分钟
  13. 13数仓采集_事件日志数据(上)

    1. 录播
      13数仓采集_事件日志数据(上)
      8分钟
  14. 14数仓采集_事件日志数据(下)

    1. 录播
      14数仓采集_事件日志数据(下)
      14分钟
  15. 15数仓采集_日志生成代码编写

    1. 录播
      15数仓采集_日志生成代码编写
      29分钟
  16. 16数仓采集_Logback日志打印控制

    1. 录播
      16数仓采集_Logback日志打印控制
      8分钟
  17. 17数仓采集_服务器准备

    1. 录播
      17数仓采集_服务器准备
      12分钟
  18. 18数仓采集_Hadoop安装

    1. 录播
      18数仓采集_Hadoop安装
      24分钟
  19. 19数仓采集_项目经验之HDFS多目录配置

    1. 录播
      19数仓采集_项目经验之HDFS多目录配置
      3分钟
  20. 20数仓采集_项目经验之支持LZO压缩配置

    1. 录播
      20数仓采集_项目经验之支持LZO压缩配置
      6分钟
  21. 21数仓采集_项目经验之基准测试

    1. 录播
      21数仓采集_项目经验之基准测试
      10分钟
  22. 22数仓采集_项目经验之HDFS参数调优

    1. 录播
      22数仓采集_项目经验之HDFS参数调优
      9分钟
  23. 23数仓采集_Zookeeper安装

    1. 录播
      23数仓采集_Zookeeper安装
      7分钟
  24. 24数仓采集_项目经验之ZK集群启动停止脚本

    1. 录播
      24数仓采集_项目经验之ZK集群启动停止脚本
      10分钟
  25. 25数仓采集_生成测试日志

    1. 录播
      25数仓采集_生成测试日志
      7分钟
  26. 26数仓采集_集群日志生成启动脚本

    1. 录播
      26数仓采集_集群日志生成启动脚本
      3分钟
  27. 27数仓采集_集群时间同步修改脚本

    1. 录播
      27数仓采集_集群时间同步修改脚本
      7分钟
  28. 28数仓采集_集群所有进程查看脚本

    1. 录播
      28数仓采集_集群所有进程查看脚本
      3分钟
  29. 29数仓采集_每日回顾

    1. 录播
      29数仓采集_每日回顾
      17分钟
  30. 30数仓采集_日志采集Flume安装

    1. 录播
      30数仓采集_日志采集Flume安装
      8分钟
  31. 31数仓采集_Flume组件及配置

    1. 录播
      31数仓采集_Flume组件及配置
      10分钟
  32. 32数仓采集_日志采集Flume配置分析

    1. 录播
      32数仓采集_日志采集Flume配置分析
      12分钟
  33. 33数仓采集_ETL拦截器

    1. 录播
      33数仓采集_ETL拦截器
      27分钟
  34. 34数仓采集_分类型拦截器

    1. 录播
      34数仓采集_分类型拦截器
      12分钟
  35. 35数仓采集_日志采集Flume启动停止脚本

    1. 录播
      35数仓采集_日志采集Flume启动停止脚本
      17分钟
  36. 36数仓采集_Kafka集群安装

    1. 录播
      36数仓采集_Kafka集群安装
      8分钟
  37. 37数仓采集_Kafka集群启动停止脚本

    1. 录播
      37数仓采集_Kafka集群启动停止脚本
      13分钟
  38. 38数仓采集_Kafka Manager安装及脚本

    1. 录播
      38数仓采集_Kafka Manager安装及脚本
      10分钟
  39. 39数仓采集_项目经验之Kafka压力测试

    1. 录播
      39数仓采集_项目经验之Kafka压力测试
      12分钟
  40. 40数仓采集_项目经验之Kafka机器数量计算

    1. 录播
      40数仓采集_项目经验之Kafka机器数量计算
      5分钟
  41. 41数仓采集_消费Kafka数据Flume

    1. 录播
      41数仓采集_消费Kafka数据Flume
      24分钟
  42. 42数仓采集_项目经验之Flume内存优化

    1. 录播
      42数仓采集_项目经验之Flume内存优化
      3分钟
  43. 43数仓采集_项目经验之Flume组件

    1. 录播
      43数仓采集_项目经验之Flume组件
      8分钟
  44. 44数仓采集_采集通道启动停止脚本

    1. 录播
      44数仓采集_采集通道启动停止脚本
      20分钟
  45. 45数仓采集_调试经验

    1. 录播
      45数仓采集_调试经验
      4分钟
  46. 46数仓采集_面试题(Linux、Shell、Hadoop)

    1. 录播
      46数仓采集面试题(Linux、Shell、Hadoop)
      36分钟
  47. 47数仓采集_面试题(Flume、Kafka)

    1. 录播
      47数仓采集_面试题(Flume、Kafka)
      23分钟
  48. 48用户行为数仓_每日回顾

    1. 录播
      48用户行为数仓_每日回顾
      39分钟
  49. 49用户行为数仓_用户行为数仓课程介绍

    1. 录播
      49用户行为数仓_用户行为数仓课程介绍
      4分钟
  50. 50用户行为数仓_为什么要分层

    1. 录播
      50用户行为数仓_为什么要分层
      9分钟
  51. 51用户行为数仓_数仓分层

    1. 录播
      51用户行为数仓_数仓分层
      10分钟
  52. 52用户行为数仓_数据集市与数据仓库概念

    1. 录播
      52用户行为数仓_数据集市与数据仓库概念
      3分钟
  53. 53用户行为数仓_数仓命名规范

    1. 录播
      53用户行为数仓_数仓命名规范
      2分钟
  54. 54用户行为数仓_Hive&MySQL安装

    1. 录播
      54用户行为数仓_Hive&MySQL安装
      16分钟
  55. 55用户行为数仓_Hive运行引擎Tez

    1. 录播
      55用户行为数仓_Hive运行引擎Tez
      18分钟
  56. 56用户行为数仓_项目经验之元数据备份

    1. 录播
      56用户行为数仓_项目经验之元数据备份
      4分钟
  57. 57用户行为数仓_ODS层启动日志和事件日志表创建

    1. 录播
      57用户数仓ODS层启动日志事件日志表创建
      19分钟
  58. 58用户行为数仓_ODS层加载数据脚本

    1. 录播
      58用户行为数仓_ODS层加载数据脚本
      14分钟
  59. 59用户行为数仓_DWD层启动日志建表及导入数据

    1. 录播
      59用户数仓DWD层启动日志建表及导入数据
      30分钟
  60. 60_用户行为数仓_DWD层启动表加载数据脚本

    1. 录播
      60_用户行为数仓_DWD层启动表加载数据脚本
      8分钟
  61. 61用户行为数仓_DWD层事件基础明细表创建

    1. 录播
      61用户行为数仓_DWD层事件基础明细表创建
      11分钟
  62. 62用户行为数仓_自定义UDF函数(解析公共字段)

    1. 录播
      62用户数仓自定义UDF函数(解析公共字段)
      23分钟
  63. 63用户行为数仓_自定义UDTF函数(解析事件日志基础明细表)

    1. 录播
      63用户行为数仓_自定义UDTF函数
      35分钟
  64. 64用户行为数仓_DWD层数据解析脚本

    1. 录播
      64用户行为数仓_DWD层数据解析脚本
      7分钟
  65. 65用户行为数仓_DWD层事件表加载数据脚本

    1. 录播
      65用户行为数仓_DWD层事件表加载数据脚本
      22分钟
  66. 66用户行为数仓_今日回顾

    1. 录播
      66用户行为数仓_今日回顾
      11分钟
  67. 67用户行为数仓_业务术语

    1. 录播
      67用户行为数仓_业务术语
      14分钟
  68. 68用户行为数仓_日期的系统函数

    1. 录播
      68用户行为数仓_日期的系统函数
      15分钟
  69. 69用户行为数仓_每日活跃设备明细

    1. 录播
      69用户行为数仓_每日活跃设备明细
      13分钟
  70. 70用户行为数仓_每周活跃设备明细

    1. 录播
      70用户行为数仓_每周活跃设备明细
      13分钟
  71. 71用户行为数仓_每月活跃设备明细

    1. 录播
      71用户行为数仓_每月活跃设备明细
      7分钟
  72. 72用户行为数仓_DWS层加载数据脚本

    1. 录播
      72用户行为数仓_DWS层加载数据脚本
      4分钟
  73. 73用户行为数仓_需求一:ADS层日活、周活、月活用户数

    1. 录播
      73行为需求一ADS层日活、周活、月活用户数
      19分钟
  74. 74用户行为数仓_每日新增设备明细表

    1. 录播
      74用户行为数仓_每日新增设备明细表
      10分钟
  75. 75用户行为数仓_需求二:ADS层每日新增设备表

    1. 录播
      75用户行为数仓需求二ADS层每日新增设备表
      4分钟
  76. 76用户行为数仓_用户留存分析

    1. 录播
      76用户行为数仓_用户留存分析
      11分钟
  77. 77用户行为数仓_1、2、3、n日留存用户明细

    1. 录播
      77用户行为数仓_1、2、3、n日留存用户明细
      13分钟
  78. 78用户行为数仓_需求三:ADS层留存用户和留存比率

    1. 录播
      78用户数仓_需求三ADS层留存用户和留存比率
      13分钟
  79. 79用户行为数仓_新数据准备

    1. 录播
      79用户行为数仓_新数据准备
      23分钟
  80. 80用户行为数仓_需求四:沉默用户

    1. 录播
      80用户行为数仓_需求四:沉默用户
      13分钟
  81. 81用户行为数仓_需求五:本周回流用户数

    1. 录播
      81用户行为数仓_需求五:本周回流用户数
      19分钟
  82. 82用户行为数仓_需求六:流失用户

    1. 录播
      82用户行为数仓_需求六:流失用户
      7分钟
  83. 83用户行为数仓_需求七:最近连续3周活跃用户数

    1. 录播
      83用户数仓需求七最近连续3周活跃用户数
      9分钟
  84. 84用户行为数仓_需求八:最近七天内连续三天活跃用户数

    1. 录播
      84数仓需求八最近七天内连续三天活跃用户数
      20分钟
  85. 85用户行为数仓_用户行为数仓业务总结

    1. 录播
      85用户行为数仓_用户行为数仓业务总结
      14分钟
  86. 86用户行为数仓_Hive企业面试题总结

    1. 录播
      86用户行为数仓_Hive企业面试题总结
      13分钟
  87. 87业务数仓_业务数仓课程介绍

    1. 录播
      87业务数仓_业务数仓课程介绍
      7分钟
  88. 88业务数仓_电商业务与数据结构简介

    1. 录播
      88业务数仓_电商业务与数据结构简介
      17分钟
  89. 89业务数仓_表的分类

    1. 录播
      89业务数仓_表的分类
      7分钟
  90. 90业务数仓_同步策略

    1. 录播
      90业务数仓_同步策略
      9分钟
  91. 91业务数仓_范式理论

    1. 录播
      91业务数仓_范式理论
      15分钟
  92. 92业务数仓_雪花模型、星型模型和星座模型

    1. 录播
      92业务数仓_雪花模型、星型模型和星座模型
      8分钟
  93. 93业务数仓_配置Hadoop支持Snappy压缩

    1. 录播
      93业务数仓_配置Hadoop支持Snappy压缩
      4分钟
  94. 94业务数仓_业务数据生成

    1. 录播
      94业务数仓_业务数据生成
      12分钟
  95. 95业务数仓_Sqoop安装及参数

    1. 录播
      95业务数仓_Sqoop安装及参数
      8分钟
  96. 96业务数仓_Sqoop导入数据

    1. 录播
      96业务数仓_Sqoop导入数据
      15分钟
  97. 97业务数仓_ODS层建表及数据导入

    1. 录播
      97业务数仓_ODS层建表及数据导入
      8分钟
  98. 98业务数仓_DWD层建表及导入数据

    1. 录播
      98业务数仓_DWD层建表及导入数据
      13分钟
  99. 99业务数仓_需求讲解

    1. 录播
      99业务数仓_需求讲解
      9分钟
  100. 100业务数仓_DWS层之用户行为宽表

    1. 录播
      100业务数仓_DWS层之用户行为宽表
      22分钟
  101. 101业务数仓_需求九:GMV成交总额

    1. 录播
      101业务数仓_需求九:GMV成交总额
      11分钟
  102. 102业务数仓_需求十ADS层之新增用户占日活跃用户比率

    1. 录播
      102需求十ADS层之新增用户占日活跃用户比率
      11分钟
  103. 103业务数仓_需求十一:ADS层之用户行为漏斗分析

    1. 录播
      103业务数仓需十一ADS层之用户行为漏斗分析
      13分钟
  104. 104业务数仓_用户购买商品明细表(宽表)

    1. 录播
      104业务数仓_用户购买商品明细表(宽表)
      23分钟
  105. 105业务数仓_需求十二:ADS层品牌复购率

    1. 录播
      105业务数仓_需求十二:ADS层品牌复购率
      15分钟
  106. 106业务数仓_需求十三:

    1. 录播
      106业务数仓_需求十三:
      28分钟
  107. 107业务数仓_数据可视化

    1. 录播
      107业务数仓_数据可视化
      27分钟
  108. 108业务数仓_Azkaban安装

    1. 录播
      108业务数仓_Azkaban安装
      15分钟
  109. 109业务数仓_GMV指标获取的全调度流程

    1. 录播
      109业务数仓_GMV指标获取的全调度流程
      17分钟
  110. 110业务数仓_拉链表理论

    1. 录播
      110业务数仓_拉链表理论
      14分钟
  111. 111业务数仓_拉链表制作

    1. 录播
      111业务数仓_拉链表制作
      30分钟
  112. 112业务数仓_业务数仓项目总结

    1. 录播
      112业务数仓_业务数仓项目总结
      25分钟
  113. 113业务数仓_即席数仓课程介绍

    1. 录播
      113业务数仓_即席数仓课程介绍
      2分钟
  114. 114即席数仓_Presto简介

    1. 录播
      114即席数仓_Presto简介
      11分钟
  115. 115即席数仓_Presto安装及使用

    1. 录播
      115即席数仓_Presto安装及使用
      23分钟
  116. 116即席数仓_Presto优化

    1. 录播
      116即席数仓_Presto优化
      6分钟
  117. 117即席数仓_Druid概念、特点、场景

    1. 录播
      117即席数仓_Druid概念、特点、场景
      8分钟
  118. 118即席数仓_Druid对比其他框架

    1. 录播
      118即席数仓_Druid对比其他框架
      7分钟
  119. 119即席数仓_Druid框架原理

    1. 录播
      119即席数仓_Druid框架原理
      12分钟
  120. 120即席数仓_Druid数据结构

    1. 录播
      120即席数仓_Druid数据结构
      6分钟
  121. 121即席数仓_Druid安装

    1. 录播
      121即席数仓_Druid安装
      15分钟
  122. 122面试题_总体架构

    1. 录播
      122面试题_总体架构
      19分钟
  123. 123面试题_技术框架

    1. 录播
      123面试题_技术框架
      42分钟
  124. 124面试题_用户行为、业务数据、即席查询

    1. 录播
      124面试题_用户行为、业务数据、即席查询
      22分钟
  125. 125面试题_开发经验

    1. 录播
      125面试题_开发经验
      37分钟
  126. 126CDH数仓_课程介绍

    1. 录播
      126CDH数仓_课程介绍
      4分钟
  127. 127CDH数仓_CM简介及架构

    1. 录播
      127CDH数仓_CM简介及架构
      5分钟
  128. 128CDH数仓_CM安装环境准备

    1. 录播
      128CDH数仓_CM安装环境准备
      21分钟
  129. 129CDH数仓_CM、Hadoop、Zookeeper安装

    1. 录播
      129CDH数仓_CM、Hadoop、Zookeeper安装
      31分钟
  130. 130CDH数仓_采集Flume的安装

    1. 录播
      130CDH数仓_采集Flume的安装
      7分钟
  131. 131CDH数仓_Kafka安装

    1. 录播
      131CDH数仓_Kafka安装
      8分钟
  132. 132CDH数仓_测试Flume和Kafka安装

    1. 录播
      132CDH数仓_测试Flume和Kafka安装
      4分钟
  133. 133CDH数仓_消费Flume配置完成

    1. 录播
      133CDH数仓_消费Flume配置完成
      4分钟
  134. 134CDH数仓_Hive、Oozie、Hue安装

    1. 录播
      134CDH数仓_Hive、Oozie、Hue安装
      10分钟
  135. 135CDH数仓_用户行为数仓ODS层导数据

    1. 录播
      135CDH数仓_用户行为数仓ODS层导数据
      4分钟
  136. 136CDH数仓_用户行为数仓完结

    1. 录播
      136CDH数仓_用户行为数仓完结
      10分钟
  137. 137CDH数仓_业务数据生成

    1. 录播
      137CDH数仓_业务数据生成
      4分钟
  138. 138CDH数仓_业务数仓完结

    1. 录播
      138CDH数仓_业务数仓完结
      16分钟
  139. 139CDH数仓_Oozie执行前准备

    1. 录播
      139CDH数仓_Oozie执行前准备
      7分钟
  140. 140CDH数仓_Oozie任务编写及运行

    1. 录播
      140CDH数仓_Oozie任务编写及运行
      11分钟
  141. 141CDH数仓_即席查询数仓搭建Impala

    1. 录播
      141CDH数仓_即席查询数仓搭建Impala
      6分钟
  142. 142CDH数仓_Spark安装及总结

    1. 录播
      142CDH数仓_Spark安装及总结
      6分钟

对课程感兴趣?

点击报名,听课时长可兑换余额哦~

大数据-电商数仓项目免费

最近在学 2 累计报名 3 好评度 -
咨询老师

课程概述

目录

评论

简  介 数据仓库,是面向分析的集成化数据环境,为企业决策制定过程,提供系统数据支持的战略集合,是国内外各大公司正在重点投入的战略级技术领域,课程结合国内多家企业实际项目经验,加入了项目架构模块,从集群规模的确定到框架版本选型以及服务器选型,教你0基础搭建大数据集群。
一、课程简介
数据仓库(Data Warehouse,可简写为DW或DWH),是面向分析的集成化数据环境,为企业决策制定过程,提供系统数据支持的战略集合,是国内外各大公司正在重点投入的战略级技术领域。
二、课程内容
《尚硅谷_电商数仓项目实战》视频教程,从项目架构的搭建,到数据采集模块的设计、数仓架构的设计、实战需求实现、即席查询的实现,我们针对国内目前广泛使用的Apache原生框架和CDH版本框架进行了分别介绍,Apache原生框架介绍中涉及到的技术框架包括Flume、Kafka、Sqoop、MySql、HDFS、Hive、Tez、Spark、Presto、Druid等,CDH版本框架讲解包括CM的安装部署、Hadoop、Zookeeper、Hive、Flume、Kafka、Oozie、Impala、HUE、Kudu、Spark的安装配置,透彻了解不同版本框架的区别联系,将大数据全生态系统前沿技术一网打尽。在过程中对大数据生态体系进行了系统的讲解,对实际企业数仓项目中可能涉及到的技术点都进行了深入的讲解和探讨。同时穿插了大量数仓基础理论知识,让你在掌握实战经验的同时能够打下坚实的理论基础。
三、课程目标
本课程以国内电商巨头实际业务应用场景为依托,对电商数仓的常见实战指标以及难点实战指标进行了详尽讲解,具体指标包括:每日、周、月活跃设备明细,留存用户比例,沉默用户、回流用户、流失用户统计,最近连续3周活跃用户统计,最近7天内连续3天活跃用户统计,GMV成交总额分析,转化率及漏斗分析,品牌复购率分析、订单表拉链表的设计等,让学生拥有更直观全面的实战经验。通过对本课程的学习,对数仓项目可以建立起清晰明确的概念,系统全面的掌握各项数仓项目技术,轻松应对各种数仓难题。
四、课程亮点
本课程结合国内多家企业实际项目经验,特别加入了项目架构模块,从集群规模的确定到框架版本选型以及服务器选型,手把手教你从零开始搭建大数据集群。并且总结大量项目实战中会遇到的问题,针对各个技术框架,均有调优实战经验,具体包括:常用Linux运维命令、Hadoop集群调优、Flume组件选型及性能优化、Kafka集群规模确认及关键参数调优。通过这部分学习,助学生迅速成长,获取前沿技术经验,从容解决实战问题。
五、适合人群
1.有一定Java、Scala语言基础,希望了解大数据实际应用场景的编程人员
2.了解大数据相关知识,希望增加项目经验的大数据从业者。

* 课程提供者:尚硅谷

老师还为你推荐了以下几门课程