240 发简信
IP属地:山东
  • 120
    《数据挖掘(概念与技术)》第一章 阅读知识点

    最近在自学《数据挖掘(概念与技术)》,为了便于更好地理解此书,在阅读的同时也会用思维导图将知识点列举出来,用来加深印象,也便于以后复习。 每一章都会写一篇文章,用来将整本书所...

  • 120
    线性分类|机器学习推导系列(四)

    一、从线性回归到线性分类 线性回归的特性 线性回归具备线性、全局性和数据未加工的特性。 线性包括三个方面,其中属性线性指的是关于是线性的;全局线性指的是只是一个线性组合,然后...

  • 分位数(quantile)

    分位数是指的把一组按照升序排列的数据分割成n个等份区间并产生n-1个等分点后每个等分点所对应的数据。按照升序排列生做第一至第n-1的n分位数。(如果等分点在其左右两个数据的中...

  • 120
    机器学习高频面试题(41道)

    Q1: What’s the trade-off between bias and variance? 问题1: 什么是偏差(bias)、方差(variable)之间的均衡?...

  • 120
    事实表与维度表

    前文介绍了一维表和二维表的异同及相互转换 今天再来解释一下事实表与维度表 先来看下表。回忆下,这是一维表二维表? 单行记录就能锁定全部信息,个别列存在数量重复,没二话,显然是...