本系列课程将基于RedHat Linux 7.4版本、Hadoop 2.7.3、Spark 2 版本全面介绍大数据的整体内容,让学员深入理解并掌握运行机制和原理,从而进一步掌握大数据的相关内容。
本门课程课程大纲
==========================================================================
(*)数据分析引擎和Hive简介
(*)Hive的体系结构
(*)搭建Hive的嵌入模式
(*)搭建Hive的远程模式
(*)Hive的内部表
(*)Hive的分区表
(*)Hive的外部表
(*)Hive的桶表和视图
(*)Hive的查询
(*)Hive的Java客户端
(*)Hive的自定义函数