240 发简信
IP属地:贵州
  • Resize,w 360,h 240
  • rdd dataframe dataset 相互转化

    1、RDD <--> DataFrame 2、RDD <-> DataSet 3、DataFrame <-> DataSet

  • 分类算法实测

    决策树算法   数据集是某学校男性女性的身高体重信息。数据说明: height 身高 、weight 体重 、category 0男1女 、ra...

  • Resize,w 360,h 240
    spark入门

    DriverProgram 就是程序员所设计的 Spark 程序,在 Spark 程序中必须定义 SparkContext,它是开发 Spark...

  • maven

    Apache Maven is a software project management and comprehension tool. Ba...

  • Resize,w 360,h 240
    spark 实现回归算法

    知识点 线性回归 最小二乘法 随机梯度下降 逻辑回归 正则化 保序回归 spark官方提供的回归、分类算法:Linear models (SVM...

  • Resize,w 360,h 240
    Hadoop介绍

    用途:数据挖掘、日志分析、商务智能、搜索引擎..... 官网介绍:The Apache™ Hadoop® project develops op...

  • 使用spark mllib库实现协同过滤

    使用的数据集是tpch工具生成的数据集,存放在hive中,关于相关的细节,请看https://www.jianshu.com/p/154069c...

  • spark2.1源码编译

    我的hadoop版本:hadoop-2.6.0-cdh5.7.0我的scala版本:2.11.8我的hive版本:hive-1.1.0-cdh5...