快时代hadoop spark大数据处理算法与技巧
  1. K-近邻

    1. 直播
      K-近邻
      12月15日 20:00-22:30
  2. K-均值聚类

    1. 直播
      K-均值聚类
      12月16日 20:00-22:30
  3. 朴素贝叶斯

    1. 直播
      朴素贝叶斯
      12月17日 20:00-22:30
  4. 购物车分析

    1. 直播
      购物车分析
      12月18日 20:00-22:30
  5. 移动平均

    1. 直播
      移动平均
      12月19日 20:00-22:30
  6. 左外连接

    1. 直播
      左外连接
      12月20日 20:00-22:30
  7. Cox回归

    1. 直播
      Cox回归
      12月21日 20:00-22:30
  8. 线性回归

    1. 直播
      线性回归
      12月22日 20:00-22:30
  9. ​​​​​​​MapReduce大容量缓存

    1. 直播
      ​​​​​​​MapReduce大容量缓存
      12月23日 20:00-22:30

对课程感兴趣?

点击报名,听课时长可兑换余额哦~

快时代hadoop spark大数据处理算法与技巧免费

最近在学 0 累计报名 2 好评度 -
咨询老师
用手机看

扫一扫继续用手机看

  • 微信扫码

  • QQ扫码

下载手机APP

课程概述

目录

评论

老师介绍

  • key老师

    key老师

    供职于一线某互联网企业,具有丰富的工作经验,在互联网,云计算,大数据具有丰富的经验
简  介 如何在大数据处理中利用高效可伸缩算法解决大数据处理问题
K-近邻
K最近邻(k-Nearest Neighbor,KNN)分类算法,是一个理论上比较成熟的方法,也是最简单的机器学习算法之一。该方法的思路是:在特征空间中,如果一个样本附近的k个最近(即特征空间中最邻近)样本的大多数属于某一个类别,则该样本也属于这个类别。
K-均值聚类
k均值聚类算法(k-means clustering algorithm)是一种迭代求解的聚类分析算法,其步骤是随机选取K个对象作为初始的聚类中心,然后计算每个对象与各个种子聚类中心之间的距离,把每个对象分配给距离它最近的聚类中心。聚类中心以及分配给它们的对象就代表一个聚类。每分配一个样本,聚类的聚类中心会根据聚类中现有的对象被重新计算。这个过程将不断重复直到满足某个终止条件。终止条件可以是没有(或最小数目)对象被重新分配给不同的聚类,没有(或最小数目)聚类中心再发生变化,误差平方和局部最小。
朴素贝叶斯
朴素贝叶斯法是基于贝叶斯定理与特征条件独立假设的分类方法 [1]
最为广泛的两种分类模型是决策树模型(Decision Tree Model)和朴素贝叶斯模型(Naive Bayesian Model,NBM)。和决策树模型相比,朴素贝叶斯分类器(Naive Bayes Classifier 或 NBC)发源于古典数学理论,有着坚实的数学基础,以及稳定的分类效率。同时,NBC模型所需估计的参数很少,对缺失数据不太敏感,算法也比较简单。理论上,NBC模型与其他分类方法相比具有最小的误差率。但是实际上并非总是如此,这是因为NBC模型假设属性之间相互独立,这个假设在实际应用中往往是不成立的,这给NBC模型的正确分类带来了一定影响。
购物车分析
移动平均
左外连接
Cox回归
线性回归
MapReduce大容量缓存

* 课程提供者:快时代

老师还为你推荐了以下几门课程