李航统计学习--第一章统计方法概论

1.根据输入输出变量的不同类型,对预测任务进行不同的命名:

1)input,output均为连续变量--------回归问题--函数拟合

        最常用的损失函数是:平方损失---最小二乘法求解回归问题

        例子:为市场趋势预测、产品质量管理、客户满意度调查,投资风险分析的工具

            股票价格预测

2)output是有限个离散变量(输入可以离散可以连续)-------分类问题

        分类准确率

        对于二分类;指标:精确率precision和召回率recall

        TP正预测为正(正确的prediction);FN正预测为负(错误的N);FP负预测为正(错误           的prediction);TN负预测为负(正确的N)

精确率:正确的prediction/所有的被预测为正。召回率:正确的预测/所有的正预测
P R都高时候,F1也高

        分类算法:K临近,感知机,朴素贝叶斯,决策树,逻辑斯蒂回归,支持向量机,提升方           法,贝叶斯网络,神经网络,Winnow

        例子:银行中对客户按照贷款风险大小进行分类,构建客户分类模型;文本分类

3)input,output均为变量序列------标注问题tagging--分类问题的推广--结构预测问题的简单形式

        输入:观测序列;输出:标记序列或者状态序列

        统计方法 :隐马尔可夫模型,条件随机场

        在信息提取、自然语言处理等领域广泛应用

2.统计学习方法=模型+策略+算法

model:监督学习中模型就是要学习的条件概率或决策函数

strategy:如何选择最佳模型:

        1)损失函数和风险函数

I)0-1损失函数
II)平方损失函数
III)绝对损失函数
IV)对数损失函数

        期望风险Rexp(f)是模型关于联合分布的期望损失,经验风险Remp是模型关于训练样本集的平均损失。

        根据大数定理,样本量N~无穷,经验风险趋近于期望风险,但是往往训练样本有限。so需要对经验风险进行校正。

期望风险
经验风险

        2)对经验风险进行校正-----经验风险最小化和结构风险最小化

N足够大时候,经验风险最小化能保证有很好的学习效果,求解最优化模型,如最大似然估计。当模型是条件概率分布时,损失函数是对数损失函数,经验风险最小化等价于极大似然估计。N比较小时候,会产生过拟合
结构风险最小化,是为了防止过拟合。等价于正则化,是在经验风险加上表示模型复杂度的正则化项或罚项。模型越复杂系数越大。如贝叶斯估计中的最大后验概率估计。当模型是条件概率分布,损失函数是对数损失函数,模型复杂度是模型的先验概率,结构风险最小化等价于最大后验概率估计。

algorithm:用什么样的计算方法求解最优化模型

3. 训练误差:判断给定的问题是不是容易学习;测试误差:学习方法对位置数据的预测能力(泛化能力)

过拟合:学习时选择的模型所包含的参数过多,该模型对已知数据预测的很好,对未知数据预测很差

如何选择模型?--正则化和交叉验证

正则化:--结构风险最小化策略的实现

交叉验证:若样本数据足够,将其分为:训练集,验证集和测试集

    简单交叉验证:数据随机分为两部分:训练与测试

    S折交叉验证:随机将数据切分为S个互不相关的大小相同的子集,S-1个子集训练,剩余数       据测试

    留一交叉验证:S=N,在数据缺乏的情况下用

生成模型与判别模型:

生成模型:数据学习联合概率分布,求出条件概率分布作为预测模型(可还原联合概率分布,学习收敛速度更快)

    朴素贝叶斯和隐马尔科夫模型

判别模型:直接学习决策函数f(X)或者条件概率分布P(Y/X)作为预测模型(学习的准确率更高)

    k临近,感知机,决策树,逻辑斯蒂回归,最大熵模型,支持向量机,提升方法和条件随机场等

4.常用的机器学习算法比较? - 知乎

机器学习包含哪些学习思想? - 知乎


最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,937评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,503评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,712评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,668评论 1 276
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,677评论 5 366
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,601评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,975评论 3 396
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,637评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,881评论 1 298
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,621评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,710评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,387评论 4 319
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,971评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,947评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,189评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 44,805评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,449评论 2 342

推荐阅读更多精彩内容