240 发简信
IP属地:广东
  • Python 异常值分析

    异常值分析是检验数据是否有录入错误以及含有不合常理的数据。忽视异常值的存在是十分危险的,不加剔除地把异常值包括进数据的计算分析过程中,对结果会产生不良影响;重视异常值的出现,...

  • 机器学习实战-数据探索(异常值处理)

    《机器学习实战-数据探索(1、变量识别;2、单变量分析;3、双变量分析)》 机器学习实战-数据探索(缺失值处理)上面两篇文章介绍了数据探索的前四步,机器学习更多内容可以关注g...

  • 机器学习之特征工程-数据预处理2

    扩展阅读: 数据预处理 特征二值化 对于某些定量特征,其包含的有效信息为区间划分,例如学习成绩,假若只关心“及格”或不“及格”,那么需要将定量的考分,转换成“1”和“0”表示...

  • 120
    spark 基础知识整理(二)- RDD专题

    一、RDD及其特点 **1. **RDD(Resillient Distributed Dataset)弹性分布式数据集,是spark提供的核心抽象。它代表一个不可变、可分区...