前言 xgboost是一种集成学习算法,通过回归树,每一次对残差(实际值与预测值之差)进行拟合,最后把预测值相加得到最终的预测值。比如一个小男孩...
r: 必须打开一个存在的文件,且只能进行读操作 r+:和r一样,必须打开一个已有的文件。最开始光标在文件前面。如果先读,读完后光标在文件末尾,...
本文主要摘自官方文档 1.可以指定多个网址。如果是规律的。例如: http://example.com/page/1 http://exampl...
本文内容主要摘自python machine learning 2nd edition 1、假设我们有以下三个文本 • 'The sun is...
今天想梳理一下kaggles上面的项目,对于一些感兴趣的,以后再仔细研究下 1、https://www.kaggle.com/c/titanic...
-----程序员遇到问题,或者想学习什么,第一个念头可能都是百度/谷歌。然而作为全球最大的代码托管平台,github上面有着海量的代码以及教程,...
------朴素贝叶斯是一个基于概率的多分类算法 举个例子,周六了,群主加班的概率是0.3,爬山的概率是0.2,和wanxian约会的概率是0....
一、基本概念 1.cart使用基尼系数作为划分标准。基尼系数越小,则不纯度越低,区分的越彻底。 2.假设有k个类别,第k个类别的概率为,则基尼系...
一、EDA ------explore data analysis,顾名思义,数据探索性分析。主要目的是对数据有个大体的认识 1、看下整体数据信...