2003年英国政府针对全民的数学水平做了一项调查,结果让人大跌眼镜。工作人群中有47%的人数学水平不及初中一年级。初中一年级是什么水平,也就是掌握有理数分数和小数。白宫因此非常焦虑,制定了很多新的政策,然后在2011年又做了一次调查,结果这个数值上升到了49%。
当我在《金融时报》上提到这个数字的时候,一位读者开玩笑说,那51%的人该感到震惊了。
但我更偏爱另一人的反应,那是当我在学校做演讲的时候,一个学生提问说,你怎么知道做统计的人不也属于那49%呢?
事实已经很清楚的证明了,数学对我们来说是个大问题,其实数学是生活中一项很实用的技能,而且将来时代的很多变化都要求我们要对数字敏感些。
同时这不仅是英国人的问题,经合组织今年发表了针对全球年轻人的数学水平调查,美国首当其冲是40%,除了美国和英国外还有其他七个国家的数值都超过了20%。这显然是个很严重的问题了,但情况却并不是该如此。从这张图表你会发现,荷兰和韩国的数值都是个位数。所以今天我们来谈谈这个问题。
诸如此类的研究显示,我们人为的把人们分成了两类,对数字敏感的和不擅长的。我今天想说的是这个分类是不必要的,事实并非如此。你不必有非常好的数学水平,但对数字还是要有一定的敏感度的,那从何入手呢?
对我来说,端口就是统计学。一提到统计学很多人都觉得头疼,因为即使很多数学家也不喜欢统计学,数学本该是关于精确性和确定的科学,而统计学却恰恰相反。其实我自己也是很晚才接触统计学的,即使我的大学老师也一直认为我最不擅长的两门学科,一是计算机编程,二就是统计学,而现在的我却都掌握了这两门,后面我还会展示我用计算机编程的统计学图表。
那什么改变了我对统计学的态度呢?我的兴趣从何而来?因为我意识到统计学是关于人类团体性的科学,如果你查词典的话会看到统计学的定义,是针对群体而非个体的科学。作为社会的一员,我们都很有兴趣知道个人是如何影响群体的,而统计学在这方面的作用会让你大吃一惊。
英国的伊普索斯莫里民意调查机构近些年做了一些很棒的调查。比如其中一个针对1000名英国成年人的调查,即他们认为每100个英国人中有多少人信仰穆斯林,调查的结果是24,也就是人们认为每100个英国人中有24人信仰穆斯林。而官方统计是5。所以你可以看到,我们的认知和现实之间还是有很大差距的。那是什么导致了认知偏差呢?
基于对这项研究浓厚的兴趣,我自己也开始了调查。当我在哈默史密斯的圣保罗中学为六年级的女学生做演讲的时候,我问她们“你们觉得人们认为每年有多少个年轻女孩子怀孕呢?”。当我说这个数字是15%的时候她们表现的很生气,因为事实是仅有0.5%。
数学问题不仅仅是英国人的问题,伊普索斯莫里民意调查机构近些年在全世界范围内做了类似的调查。比如他们问阿拉伯人,你认为每一百个人中有多少人有肥胖问题。人们的回答是1/4多一点,但官方数据显示是差不多3/4.这是很大的偏差了。
还有个针对日本人的调查,“你认为每100个日本人中有多少人住在乡下”。统计结果是差不多50%,他们认为每100个日本人中有56个人在乡下生活,而官方数据是7%。
这种很严重的认知偏差让人们震惊,但如果你读过诺贝尔经济学家Daniel Kahneman的著作的话,你就会更加冷静的接受这个事实了。Daniel和他的同事Amos Tversky花了很多年研究认知和现实之间的差距,他们发现人类的估计能力较弱,这有很多的原因。
除了个人经历外,媒体也有一定的责任。媒体在报道时为了吸引眼球经常报道那些个例。对此Kahneman有很好的表述,我们不但会选择视而不见,而且对我们的视而不见也选择视而不见。而这对我们做决定时有很严重的影响。
我觉得这个事情很有意思。但我也觉得,可能调查范围太大了,可能一个人更熟悉生活的城市而不是整个国家,你怎么可能对全国的人都了解呢。所以也许把范围缩小结果会不一样呢?所以我重新构建了问题,改为针对你自己生活的地方。答案会不会更准确呢?
后来我做了个网络app,针对你生活的地区。输入你所在区的邮编,然后会跳出一些根据官网统计数据制定的问题。我在设计这个产品的时候非常细心,尽量保证所有的人都能方便的参与。我参考了经济学家奥图纽拉特Isotype 图像符号,即用图像来取代诸如百分比,分数和小数之类的文字。
如下图所示,左边是一个个的圆圈,右边的地图显示了你所处的区域。一共有七个问题,每个问题的得分都是在0到100之间,测试结束会有一个平均值。鉴于今天演讲的城市是埃克塞特,我们把区域设置为埃克塞特。
第一个问题是,你觉得每一百个人中有多少人小于16岁?你选好点提交,然后会得到官方数据是多少,就能看到你的猜测跟现实之间的差距。
第二个问题是,你觉得平均年龄是多少,即一半人的年龄低于这个值,一半人的年龄高于这个值,我觉得是35。但我估计错了,因为我忽略了埃克塞特有大学,所以这个年龄值要年轻许多。
问题会越来越难。第三个问题是,你觉得你所生活的地区,每一百个家庭中有多少人贷款买房了?
你看,问题会越来越难。当你处于一个城市的时候,像年龄这种问题你可以通过观察得到,但像购房比例这个问题就不难容易估计了,这就要求我们要思考,有时难免也带有偏见。
还有就是,当我发布这项测试的时候,很多官方的数据并不是最新的,可能是几年之前的,但其实这也没关系。我只是想让人们意识到,自己的认知和现实还是有差距的,以及人们的反应。
事实证明人们的反应比我预想的要激烈,尽管我有意的进行了一些设置,比如网址中含有统计学,政府和英国这类人们不喜欢在网址在出现的词语。这个网站是晚上九点四十五上线的,因为没有规定人们什么时间要完成这个测试,全凭自愿的,但在开始的两天内,还是突破了四十万的访问量,人们在网上和社交媒体上展开了激烈的讨论。
很多人都发现了自己的认知偏差。而且有些人开始把网址发给政府部门的领导,看他们对自己城市的了解程度。
回到刚开始提到的两种人,即对数字擅长和不擅长的。英国知名的统计学家John Pullinger的得分是44,其实很多人原来认为他应该有很高得分的。Jeremy Paxman也在酒后承认,他的得分是36,这个数字让人太大跌眼镜了。
就像我们之前的认知一样,统计学是关于不确定的科学,但今天我想加一点点,统计学也是关于我们自身的科学,所以请我们对它多一点点兴趣。
本文来源于ted演讲:Alan Smith: why you should love statistics
“本译文仅供个人研习、欣赏语言之用,谢绝任何转载及用于任何商业用途。本译文所涉法律后果均由本人承担。本人同意简书平台在接获有关著作权人的通知后,删除文章。”