老师介绍
简 介 | 企业真实项目,让学生快速掌握企业大数据开发流程,帮助学生建立企业大数据应用思维,成为真正的企业级大数据应用开发工程师。完全掌握本套教程内容,完全可以胜任目前企业的大数据开发岗位。 |
---|
课程大纲
Hadoop+Hbase+Flume+Zookeeper实现电信级海量通话日志数据的存储,随机访问与实时读写。通过hash技术对rowkey进行分析处理,解决hbase的热点问题,协同coprocessor,解决系统的高吞吐量和查询负载问题以及如何避免中间结果导致通知风暴或死递归问题,让同学们体验到大数据技术在企业中实战应用。
1.整体架构分析
hadoop体系架构与ha配置方案。
hbase体系架构与ha配置方案
flume实时收集架构方案。
SSM实现前端web实现以及与后端HBase的交互架构方案。
hive+oozie实现的周期任务调度。
Spark streaming实现窗口化敏感词实时监控方案。
2.hbase中callLogs表的设计与实现。
通话信息的内容分析与常用场景分析以及对rowkey的设计与实现。
重点讲解盐析的原理与热点问题的解决。rowkey的设计原则与实战中的技巧。
3.协处理原理与应用实战讲解。
被叫通话记录的设计思想讲解,以及通过协处理器方式实现callog日志主叫记录被主换位与同步写入。在callog是表中数据的存储序列与双向查询方方式的一致性透明结果处理。
4.Hadoop以及HBase的HA集群配置与实战。
hadoop的使用QJM的高可用架构配置讲解,ResourceManager的高可用架构配置讲解。
zookeeper的工作原理以及配置、实操演练,hbase与Hadoop HA集成注意事项以及客户端API编程细节处理。
* 课程提供者:北京思无限科技有限责任公司