回归

回归与分类

回归问题和分类问题在本质上是一样的,都是针对一个输入做出一个输出预测,其区别在于输出变量的类型。分类问题也叫离散变量预测,其输出是输入数据所对应的类别,是一种定性输出。而回归问题也叫连续变量预测,其输出是由输入数据推断出来的一个实数值,是一种定量输出。

回归指研究一组随机变量(Y1 ,Y2 ,…,Yi)和另一组(X1,X2,…,Xk)变量之间关系的统计分析方法,又称多重回归分析。通常前者是因变量,后者是自变量。

回归分析是一种数学模型。当因变量和自变量为线性关系时,它是一种特殊的线性模型。最简单的情形是一元线性回归,由大体上有线性关系的一个自变量和一个因变量组成;模型是Y=a+bX+ε(X是自变量,Y是因变量,ε是随机误差)。通常假定随机误差的均值为0,方差为σ^2(σ^2﹥0,σ^2与X的值无关),若进一步假定随机误差遵从正态分布,就叫做正态线性模型。

一般的,若有k个自变量和1个因变量,则因变量的值分为两部分:一部分由自变量影响,即表示为它的函数,函数形式已知且含有未知参数;另一部分由其他的未考虑因素和随机性影响,即随机误差。

当函数为参数未知的线性函数时,称为线性回归分析模型;当函数为参数未知的非线性函数时,称为非线性回归分析模型。当自变量个数大于1时称为多元回归,当因变量个数大于1时称为多重回归。

回归分析的主要内容为:

1. 从一组数据出发,确定某些变量之间的定量关系式;即建立数学模型并估计未知参数,通常用最小二乘法;

2. 检验这些关系式的可信任程度;

3. 在多个自变量影响一个因变量的关系中,判断自变量的影响是否显著,并将影响显著的选入模型中,剔除不显著的变量,通常用逐步回归、向前回归和向后回归等方法;

4. 利用所求的关系式对某一过程进行预测或控制。

回归分析的应用非常广泛,统计软件包的使用可以让各种算法更加方便。

回归主要的种类有:线性回归,曲线回归,二元logistic回归,多元logistic回归。下面我们以线性回归为例来进一步说明回归算法。

线性回归

实质上,回归算法是先建立一个假设的模型,即一个函数,但是函数中含有未知的参数,通过学习,可以估计出这些未知的参数,最后得到一个完事的函数。把一组数据作为函数的输入,函数的输出便是预测值。而线性回归是回归的一种,它假设特征和结果都满足线性,即不大于一次方。如果线性回归分析中只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为一元线性回归分析。如果回归分析中包括两个或两个以上的自变量,且因变量和自变量之间是线性关系,则称为多元线性回归分析。

函数介绍

LinearRegression实现了普通最小二乘线性回归的估计器,来自sklearn.linear_model包。创建方法如下:

lr = LinearRegression()

常用参数解释:

fit_intercept: boolean类型,默认True,可选。表示是否计算该模型的截距。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,324评论 5 476
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,303评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,192评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,555评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,569评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,566评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,927评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,583评论 0 257
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,827评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,590评论 2 320
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,669评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,365评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,941评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,928评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,159评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,880评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,399评论 2 342

推荐阅读更多精彩内容

  • Chapter 9 Linear Regression 本篇是第九章,内容是回归分析(主要以线性回归为主)。回归分...
    G小调的Qing歌阅读 16,498评论 0 25
  • 办公室正对着水房,每天早上熙来攘往的人们在门口穿梭,刷牙漱口的,洗茶杯毛巾的,换水浇花的……不一会儿水房的地面就布...
    小猫说法阅读 228评论 0 0
  • 01 照片中的女孩神情漠然,戾气不重,却带着一抹隐藏的桀骜,像是在思考,又像是在迷茫,亦或者是在冷眼打量着这个世界...
    potatohorse阅读 501评论 0 2
  • chapter one 星期天的上午,顾时愿不想起床,和对床的妹子一起窝在寝室里看papi酱的视频。 视频讲的是学...
    Nieve徐阅读 326评论 0 3
  • 看看照片就诱人哦!这个红红的东西,我们横溪人叫它麦妞。麦妞是类似于草莓的一种水果,学名叫蓬蘽。唐代诗人贾岛在《逢博...
    陈旦芬阅读 617评论 2 4