240 发简信
IP属地:广东
  • GBDT的理解笔记

    参考https://cs.nyu.edu/~mohri/mls/ml_boosting.pdf 参考http://www.chengli.io/...

  • 互联网金融做大数据风控的九种维度2018-02-21

    在互联网金融迅猛发展的背景下,风险控制问题已然成为行业焦点,基于大数据的风控模型正在成为互联网金融领域的热门战场。那么,大数据风控到底是怎么一回...

  • 分布式矩阵(Distributed Matrix)

    矩阵RowMatrix是最基础的分布式矩阵类型。每行是一个本地向量,行索引无实际意义(即无法直接使用)。数据存储在一个由行组成的RDD中,其中每...

  • SparkMllib数据类型

    一.本地向量 有如下几个类: Vector(基类),DenseVector,SparseVector,Vectors(工厂方法,推荐用) 工厂模...

  • Resize,w 360,h 240
    CART详解

    CART生成 CART假设决策树是二叉树,内部结点特征的取值为“是”和“否”,左分支是取值为“是”的分支,右分支是取值为“否”的分支。这样的决策...

  • Resize,w 360,h 240
    决策树之C4.5算法

    关于决策树 决策树其实是一种分类算法,目标是将具有P个维度特征的样本n划分到c个类别中: c = f(n); 通过这种分类的过程表示为一棵树,每...