数据湖架构Hudi
为了更好管理数据,出现数据湖DataLake:用来存储大量的原始数据。
当下流行数据湖框架Apache Hudi,使用HDFS存储数据,集成Spark、Flink、Hive等分析数据,逐步在大中型公司中使用,构建湖仓一体化架构。
为了让大家更好学习使用Hudi,基于0.9.0版本,推出本套课程,从数据湖概念,到集成Spark和Flink,整合实际需求案例,由0到1深入浅出剖析Hudi使用。
1v1答疑服务
BAT面试辅导
刘老师
一线讲师
从事Java EE的开发与教学18年;曾在软件开发企业担任技术总监;2012年~2015年被东软等多家院校外聘为Java EE考评专家;2015年6月出版发行《Java EE SSH框架开发项目教程》;2019年1月出版发行《Java EE Spring MVC 与MyBatis企业开发实战》。
数据湖架构Hudi
为了更好管理数据,出现数据湖DataLake:用来存储大量的原始数据。
当下流行数据湖框架Apache Hudi,使用HDFS存储数据,集成Spark、Flink、Hive等分析数据,逐步在大中型公司中使用,构建湖仓一体化架构。
为了让大家更好学习使用Hudi,基于0.9.0版本,推出本套课程,从数据湖概念,到集成Spark和Flink,整合实际需求案例,由0到1深入浅出剖析Hudi使用。