读书笔记（赤裸裸的统计学）

作者简介

查尔斯•惠伦（Charles Wheelan），于1997～2002年间担任《经济学人》杂志驻美国中西部地区的记者，还为《芝加哥部报》、《纽约时报》和《华尔街日报》撰稿，现任芝加哥公共电台WBEZ节目财经记者。其所著《赤裸裸的经济学》已由中信出版社于2010年出版。

本书的介绍了生活中联系最为紧密的统计学概念，如大数定律、中心极限定理、随机抽样、回归分析以及由于混淆了准确与精确的概念可能造成的黑天鹅事件等。如果我们懂得了这些概念，会有助于在生活或投资领域做出正确的决策。

一辆车和两头羊的故事

美国的一档节目，三个门后面分别是一辆车、和两只羊，选手随机从三个门中选择一个门，只有选中的门后面是车就可以开回家，这其中有一个环节是当你选好一扇门，主持人会将剩余的两扇门打开一个，每一次主持人都打开门后有羊的那扇门，然后问选手是否更改最初的选择，最后确定最终的结果。咋一看上去凭直觉猜对的概率是1/3，其实呢，只要你更改答案，概率提高到2/3！原因如下：三个门任意两个门的组合有三种，车和羊、车和羊、羊和羊，也就是你选择一扇门之后剩余的两个门的组合情况，这三种组合的前两个组合你只要更改答案就能选对，因为主持人会把门后是羊的这扇门打开，剩下的就一定是车，所以对于这三种组合，你更改最初的选择就有两次机会选对。

大数据时代的统计学

现在各种视频、音乐、读书、购物网站都会给你推荐你喜欢的电影、歌曲、书及商品，那么“它们”是如何知道你的喜好的；各行各业都会应用到统计学，比如刚刚提到的各种网站，比如博彩、保险、金融等领域会利用统计学控制风险，比如体育行业利用统计学评判运动员是否优秀等等。所以说统计学是一把武器，让我们更清楚的理解这个世界的本质。

描述统计学

生活中存在各种描述性数据，对于同样一个问题，使用不同的描述性数据可能会得到不同的答案。因此描述性数据有其优点和局限性，有的时候你往往可以用某一个简单的数据就可以得到想要的答案，比如衡量哪个篮球运动员组织能力最强，场均助攻数量就可以足够说明了，但是你可能还要看这名球员身边是否有超级得分手这个因素，生活中这种例子还很多，那么如果多从几个角度去看，就可以比较准确的进行判断了。或许这些概念可以帮到你，平均数与中位数（四分位数、十分位数、百分位数）、绝对值与相对值、与离散程度有关的标准差及正态分布、百分占比等。

统计学数字会撒谎

“谎言有三种：谎言、该死的谎言、以及统计学”——马克吐温。

由于对于同样一个问题可以有不同的描述性数据来回答，那么如何判断哪个数据是对真相的准确描述就变的至关重要，答案是选择更接近真相的统计数据，在商界流传着一句至理名言“你无法管理你无法衡量的事物”，我想对于投资也是一样。另外要学会区分“精确”和“准确”，”精确“反应所描述事物的精度，即使再精确的统计数据结果，也有可能是不准确的，而准确才是接近真相的前提，所以在得到精确的数据时，前提要看是否符合常识。

概率与期望值

概率学时研究不确定事件和结果的学问。投资股市存在不确定性，其他如保险、彩票、赌博等也是具有不确定性的因素，因此概率学被应用在这些领域当中，概率可以告诉我们什么最有可能发生，什么最有可能不发生。期望值的概念是所有事件的概率和收益的乘机之和，用来描述可能的总收益，通常拿期望值与成本进行比较，来判断一项投资值不值。那么期望值的运用有没有前提呢？这里即将提到的一个概念就是大数定律，只有当试验的次数足够多，平均值才能接近期望值，所以某一次的投资结果可能高于或低于期望值，但当次数足够多（满足大数定律时），投资的结果是接近期望值的。当然生活中懂点概率学可以让我们做出更优的决策。

黑天鹅事件

在发现澳大利亚的黑天鹅之前，17世纪之前的欧洲人认为天鹅都是白色的。但随着第一只黑天鹅的出现，这个不可动摇的信念崩溃了。黑天鹅的存在寓意着不可预测的重大稀有事件，它在意料之外，却又改变着一切。人类总是过度相信经验，而不知道一只黑天鹅的出现就足以颠覆一切。黑天鹅事件的发生在我看来是人们模糊了一些概念导致的，精确不代表准确，小概率事件（尾部风险）不代表不会发生，不能仅仅以过往的经验来预测未来，两个事件是否是随机独立事件（赌徒谬误、检方谬误）等等，这些概念都需要清晰且明确。

数据与偏见

随机抽样是收集数据的主要方法，核心是必须保证每个对象被抽到的概率完全相等。如果不能保证等概率抽样，抽样数据就会存在“偏见”，就会得出错误结论。印象最深的两种偏见是“选择性偏见”和“幸存者偏见”，选择性偏见常常是由于样本的选择带有倾向性，不具有代表性，比如进行民意调查，如果只选择某一部分群体，即使样本数量再大，得出的调查结果也会出现偏差，不能反映所有人的意见。而幸存者偏见是由于样本中有数据缺失产生的偏见，最常见的或许就是“读书无用论”了吧，只看到少数没好好上学赚大钱的人，就得出这个结论，这类偏见在金融领域也时常发生，这也和前面提到的数据谎言相呼应。

中心极限定理

依据该定理，我们对一个基数庞大的群体做统计调查时，只要对其中的一部分样本进行研究，得出的结论就能反映整个群体的特点，也就是说任意一个群体的样本平均值都会围绕在该群体的整体平均值周围，并且呈正态分布。应用：1. 如果掌握了某个群体的具体信息，就能推理出从这个群体中正确抽取随机样本的情况。2. 如果已知两个样本的基本特性，就能推理出这两个样本是不是来自同一个群体。

ps:读这本书的目的就是想了解统计学到底是怎么和生活中的一些事情产生联系的，虽然读大学的时候概率论与数理统计是必修课程，但是在学习的过程中仅限于课本和考试，根本就没想过会对生活有什么联系，脑子中也没有这些概念，我想即使生活中遇到了什么相关的事情，也不会第一时间或者可能永远都不会产生一丝的想法，如果在以后的生活中能够时刻的运用这些统计学中的概念，规避一些风险和谎言，就体现了读这本书的意义所在了。

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 203,456评论 5赞 477
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 85,370评论 2赞 381
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 150,337评论 0赞 337
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,583评论 1赞 273
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,596评论 5赞 365
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,572评论 1赞 281
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 37,936评论 3赞 395
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,595评论 0赞 258
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 40,850评论 1赞 297
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,601评论 2赞 321
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,685评论 1赞 329
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,371评论 4赞 318
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 38,951评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,934评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,167评论 1赞 259
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 43,636评论 2赞 349
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,411评论 2赞 342

读书笔记（赤裸裸的统计学）

读书笔记（赤裸裸的统计学）

作者简介

一辆车和两头羊的故事

大数据时代的统计学

描述统计学

统计学数字会撒谎

相关性与相关系数

概率与期望值

黑天鹅事件

数据与偏见

中心极限定理

推荐阅读更多精彩内容