240 发简信
IP属地:河南
  • Resize,w 360,h 240
    浅析XGBOOST

    前言 xgboost是一种集成学习算法,通过回归树,每一次对残差(实际值与预测值之差)进行拟合,最后把预测值相加得到最终的预测值。比如一个小男孩...

  • python open之r,r+,w,w+,a,a+区别

    r: 必须打开一个存在的文件,且只能进行读操作 r+:和r一样,必须打开一个已有的文件。最开始光标在文件前面。如果先读,读完后光标在文件末尾,...

  • 不用写代码的爬虫----web scraper介绍

    本文主要摘自官方文档 1.可以指定多个网址。如果是规律的。例如: http://example.com/page/1 http://exampl...

  • TF-IDF计算过程

    本文内容主要摘自python machine learning 2nd edition 1、假设我们有以下三个文本 • 'The sun is...

  • 感兴趣的kaggle项目

    今天想梳理一下kaggles上面的项目,对于一些感兴趣的,以后再仔细研究下 1、https://www.kaggle.com/c/titanic...

  • Resize,w 360,h 240
    github搜索简介

    -----程序员遇到问题,或者想学习什么,第一个念头可能都是百度/谷歌。然而作为全球最大的代码托管平台,github上面有着海量的代码以及教程,...

  • 朴素贝叶斯简介

    ------朴素贝叶斯是一个基于概率的多分类算法 举个例子,周六了,群主加班的概率是0.3,爬山的概率是0.2,和wanxian约会的概率是0....

  • Resize,w 360,h 240
    决策树之CART算法

    一、基本概念 1.cart使用基尼系数作为划分标准。基尼系数越小,则不纯度越低,区分的越彻底。 2.假设有k个类别,第k个类别的概率为,则基尼系...

  • 数据分析的一般流程(利用机器学习)

    一、EDA ------explore data analysis,顾名思义,数据探索性分析。主要目的是对数据有个大体的认识 1、看下整体数据信...

    0.9 1380 0 10