天天看点

第一章 spark2.3 mllib机器学习简介

本系列”spark mllib机器学习”,均以最新spark2.3.0版本为蓝本进行编写,参考书籍<< spark mllib机器学习 >>黄美灵版,转载请注明出处

GitHub地址:https://github.com/future-fu/learnsparkmllib

目录

  1. 机器学习介绍
  2. spark介绍
  3. spark mllib介绍

明细

1.机器学习介绍

机器学习框架

第一章 spark2.3 mllib机器学习简介

机器学习分类

第一章 spark2.3 mllib机器学习简介

常见的机器学习算法如下:

  • 分类与回归–线性回归,逻辑回归,贝叶斯分类,决策树分类
  • 聚类–k-means,LDA主题,KNN
  • 关联规则–Apriori,FPGrowth
  • 推荐系统–协同过滤,ALS
  • 神经网络–BP,SVM,RBF
  • 深度神经网络–DNN,CNN

2.Spark介绍

spark简单说明一下,既然学到mllib,想必core ,sql, streaming都比较熟悉了;
mllib是机器学习库,里面提供各种各样的算法,可以用来在集群上针对分类,聚类,协同过滤进行计算;
GraphX是一个图计算库,用来处理图,执行基于图的并行操作,一般用的较少;
           

3.Spark Mllib介绍

第一章 spark2.3 mllib机器学习简介

☆┈━═┈━═┈━═┈━═┈━═☆因为您的赞赏,您会读到更多优质文章☆┈━═┈━═┈━═┈━═┈━═☆

第一章 spark2.3 mllib机器学习简介

继续阅读