本系列课程将基于RedHat Linux 7.4版本、Hadoop 2.7.3、Spark 2 版本全面介绍大数据的整体内容,让学员深入理解并掌握运行机制和原理,从而进一步掌握大数据的相关内容。
本门课程课程大纲
==========================================================================
(*)NoSQL数据库简介
(*)HBase的表结构和体系结构
(*)搭建HBase的本地模式和伪分布模式
(*)搭建HBase的全分布环境和HA
(*)HBase在ZK中保存的数据和HA
(*)通过命令行操作HBase
(*)通过JAVA API操作HBase
(*)HBase数据保存的过程和Region的分裂
(*)HBase的过滤器
(*)HBase上的MapReduce