单变量的线性回归模型--代价函数(Cost Function)


前言

之前已经把我们的这个模型介绍的很多了,还记得我们是要干什么吗。就是要拟合出一条直线符合大多数的数据点,这就是最为经典的线性回归模型。

输出房价

为了方便说明,我们假设一组房价的数据如下:


模拟的房价数据

可以看到我们这个模型只有一个变量,就是房子的面积,而成交价则对应着函数的输出y。我们最后需要完成一个函数对于新的房子面积,能输出该房子的成交价,我们定义我们的输出函数h(姑且这么叫...)

h(x)=θx;

我们的任务就是找到一个合适的θ值,假如我现在的θ是1.8,那么对于输入100就会给出180,对于150就会给出270。但是现在的这个函数还存在一个问题,就是这个函数是一条过原点的直线,它还不够“通用”,萎了使它尽可能的拟合更多数据,可以修改一下:

h(x)=θ0+θ1x;(这里数字是下标)

这样如果最后直线过原点,只要θ0=0就可以了,所以它的适用性更强一点。这就是我们的输出函数h了,对于每个x它都能给出y(对于每个面积的房子都能预测对应的房价)。但是不要忘了,现在θ是多少我们可还不知道。

差距有多大

想要找到合适的θ,就需要我们评判一下当前的这个输出函数h和实际给出的数据集有多大差距。这就需要我们的代价函数出场了(重点函数QAQ):


代价函数

这里的m表示总共几组数据,我们的模拟数据m=3。而这里的i显而易见就是第几组数据,xi,yi分别代表着第i组数据的x,y。对于我们的模拟数据,x1=100,y1=200,x2=150,y2=250,x3=80,y3=150。

这个函数是如何工作的,其实非常容易理解,我们先把它前面的求和去掉,只看第一组数据,现在函数就是这样子的:

J=(h(x1)-y1)²

第一组数据x1=100,y1=200。通常我们初始化θ为0,所以现在θ0和θ1都为0。那很明显无论输入的x是多少,我们的函数h(x1)其实都是0的,那对于第一组数据,J的值就是(0-200)²=40000。

对于每一组数据都如此计算然后加起来最后除以2m就是我们的代价函数的输出了,对应我们的模拟数据,最后输出应该为20833.3。

从上面不难看出,对每项的计算其实就是在算我们目前的输出函数h输出的预测值和实际的值之间的差距,如果我们的模型已经成熟了,那么这个代价函数理论上的输出值应该为0,因为每项的h(x)-y都为0,求和后也为0,除2m还是为0。

实际上不存在这么完美的事情,但是只要这个代价函数已经很接近0了,那么我们的目标也就达到了,可以看到,代价函数对我们目前仅仅只是初始化的函数h非常不满,输出的值很大,说明离拟合成功还有非常大的差距(这么大的原因还因为模拟的数据比较大,实际上对于比较大的数据通常运用特征缩放让它变小,先不管它)。

接下来干什么

现在我们知道了输出函数h以及代价函数J,也知道了如何评估当前的h的好坏,但是光知道好坏没有用啊,怎么让它变好呢。下一次就会说道梯度下降算法来让我们的h函数越来越好,也就是渐渐的找到合适的θ值(毕竟函数h是由θ决定的)。

当h渐渐符合我们的预期后,我们的模型就已经完成了。我们离预测房价攀上人生巅峰越来越近了2333


这些都是基于我最近自己学习整理的,希望加强自己的理解,也方便以后回顾。希望与大家分享交流,也希望大佬指正(T-T).

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 195,980评论 5 462
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 82,422评论 2 373
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 143,130评论 0 325
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 52,553评论 1 267
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 61,408评论 5 358
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 46,326评论 1 273
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 36,720评论 3 386
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 35,373评论 0 254
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 39,678评论 1 294
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 34,722评论 2 312
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 36,486评论 1 326
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,335评论 3 313
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 37,738评论 3 299
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,009评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,283评论 1 251
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 41,692评论 2 342
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 40,893评论 2 335

推荐阅读更多精彩内容