简单易学的Spark实战教程

595人 购买 好评度 100%
用手机看

扫一扫继续用手机看

  • 微信扫码

  • QQ扫码

下载手机APP
收藏
  • 第一期
更多班级

第一期

支持随到随学,24年11月过期

¥376.22

本班因教学质量问题暂时不能报名。 查看详情

课程因违反平台规定暂时不能报名。

立即购买

真正的大数据实战课程 ( 共33门 )

套餐价 :¥2980.00 原价 :¥5067.00 立即购买 查看详情

课程概述

目录

评论

老师介绍

  • 黄埔课堂

    黄埔课堂

    10年软件开发经验,曾在中国联通、Motorola等先后做Javaweb开发、手机开发、大数据开发,有丰富的大数据和GO语言实战经验。 培训过的精品课程有:《大数据hadoop开发》、《大数据spark开发》、《Go语言重写大数据日志收集器》 企业内训:中石化(上海,齐鲁,北京),济南联通研究院。
简  介 Apache Spark 是专为大规模数据处理而设计的快速通用的计算引擎。Spark 是一种与 Hadoop 相似的开源集群计算环境,但是两者之间还存在一些不同之处,这些有用的不同之处使 Spark 在某些工作负载方面表现得更加优越,换句话说,Spark 启用了内存分布数据集,除了能够提供交互式查询外,它还可以优化迭代工作负载。
课程咨询和资料获取请加老师QQ  1011800132 

Apache Spark是一个围绕速度、易用性和复杂分析构建的大数据处理框架。最初在2009年由加州大学伯克利分校的AMPLab开发,并于2010年成为Apache的开源项目之一。

与Hadoop和Storm等其他大数据和MapReduce技术相比,Spark有如下优势。

首先,Spark为我们提供了一个全面、统一的框架用于管理各种有着不同性质(文本数据、图表数据等)的数据集和数据源(批量数据或实时的流数据)的大数据处理的需求。


Spark可以将Hadoop集群中的应用在内存中的运行速度提升100倍,甚至能够将应用在磁盘上的运行速度提升10倍。

Spark让开发者可以快速的用Java、Scala或Python编写程序。它本身自带了一个超过80个高阶操作符集合。而且还可以用它在shell中以交互式地查询数据。

除了Map和Reduce操作之外,它还支持SQL查询,流数据,机器学习和图表数据处理。开发者可以在一个数据管道用例中单独使用某一能力或者将这些能力结合在一起使用。

* 课程提供者:黄埔课堂