SparkML

 基于spark的机器学习项目，采用的工具是jupyter是为例方便代码运行和过程的描述。

Spark机器学习库有两套API，ml和mllib,其中Spark.ml使用的数据类型是DataFrame，而spark.mllib使用的是RDD，目前spark会一直保留基于RDD的mllib 但是不会再新增新的功能（等spark.ml可以覆盖大部分的特性，spark.mllib 将会被废弃）

Name		Name	Last commit message	Last commit date
Latest commit History 124 Commits
data		data
examples		examples
分类		分类
协同过滤		协同过滤
回归		回归
总结		总结
数学基础		数学基础
特征值提取和转换		特征值提取和转换
矩阵与向量		矩阵与向量
聚类		聚类
降维		降维
频繁模式挖掘		频繁模式挖掘
README.md		README.md
spark_kernel安装.md		spark_kernel安装.md

Provide feedback