一、衡量证据效力的原则
1、认可有些事实断言比其他的事实断言更可靠。
2、是否和常识相一致?
3、判断它的真假,还不如判断它在当下的可靠性(常存敬畏,黑天鹅事件总会存在的)
4、一个断言的证据数量越多,质量越高,可信度也越高。在某种程度上,要以将这样的断言归为事实。
5、表达者应为其言论负责。作为倾听者,用问题引导你的思考、引导你们的沟通方向,以期激发表达者提供更多的论据。如果对方听到你的提问,表现怒火中烧或退避三舍,或许他也意识到证据不足。
6、如果运用得当,每种证据都可以成为有效的证据。
7、没有一样证据,可以一锤定音或一劳永逸。
8、倘若一根筋地寻找完美证据,注定将会泄气,错失最佳的决策窗口。
二、常见的证据类型
书中提到直觉、个人经历、典型案例、当事人证词、权威过专家的意见、个人观察、研究报告和类比,共八类。
尝试进行再分类,如下:
(一)与感觉相关:直觉
举个例子:我就是感觉他和我天生一对,尽管我的朋友都觉得我们俩不搭调。
我就是有这种感觉……;我一下子就知道……。
直觉,即依赖于我们所谓的常识判断力、预感或第六感。源于我们相信自己对某件事情有直接的洞察力,却不能有意识的说出理由的过程。它最大的问题就是私密性,别人根本没办法判断它的可靠性,这也注定它无法作为有力的证据。
1、直觉的优势
有些直觉是依赖于一些其他类型的证据,比如大量的相关的个人经历和阅读经验。例如有个经验丰富的飞行员,在飞机排队起飞的时候,就凭直觉感觉到飞机有点不对劲。我们很可能非常赞成对飞机做进一步的安全检查,然后再起飞。
2、直觉的劣势
直觉,依赖于无意识的加工,极大忽视了相关的证据,并且反映出强烈的偏见。
3、直觉的应用
警惕单凭直觉证实的那些断言。尽管有时候第六感并不是盲目的,只是无法加以解释。作为批判性思考的人,我们只是想查查你那个依赖于直觉的断言有没有其他类型的证据来证实。
(二)与故事相关:个人经历、典型案例
“个人”、“典型”,均代表某一个案,有可能存在以偏概全。个案是否具有足够的代表性?是否可以反映普遍规律?存在的限制条件有哪些?
由于个人经历、典型案例,通常以故事形式呈现,有场景、有情感,易与听众产生共情,似乎更具说服力。作为听众,我们或许会沉浸于故事当中,不再纠缠于它作为证据的价值。如果这个故事是添加了加工色彩,甚至是杜撰出来,你或许会立马有上当的感觉,可惜我们不知道。
(三)与引用相关:当事人证词、权威和专家意见
1、当事人证词
提起当事人证词,想起20+年前我家老人上保健品广告的事。后来与老人核实,老人迷迷模模的,也不知自己为啥就被广告了。这种手法常见于保健品广告,尤其是老年人或病患者。以诉诸个人的经历方式。也见了某些名星为化妆品、汽车代言,“他真的也在用吗?”
采用的论据,只要与人相关,就会带上主观色彩。包括以下情况:
(1)故意为之
他选择性地表达信息吗?例如只说一些想让你接受的,隐藏一些不想让你听到的东西。
(2)与他的认知有关
每个人的认知领域不尽相同,认知边界各有大小。他表达的也只能在他的认识范围。(多交良师益友)
(3)是否存在一些省略信息
你认为很重要,而他完全不觉得。可以通过问题引导对方,“为什么你会这么觉得呢?”、“你判断的标准是什么呢?”
(4)人为因素
某些人天生具备感染力,或者表达者会将自己包装更具感染力。通过他的表达,吸引你的注意。
2、权威和专家意见
专家,一直都被认为是对某个既定主题要比我们绝大部分的常人知道的更多。世界如此复杂,纵深领域诸多,各行各业都会产生专家。
然而这个称谓在谣言中也常出现,戏称为“砖家”。谣言的发布者试图对过“权威和专家意见”这类论据来说服受众。
如何辨别专家意见的可信度呢?
(1)主要取决于这个专家的背景。他的背景是否能够支撑他在某个小领域有所成?他对这个主题的知识储备有多少?例如她是A主题的专家,现在为B主题发言,而AB主题关联度不大。或许你知与他知也差不多。
(2)是否有可能接触到一手资料?
(3)这个专家的口碑如何?
(4)是否采用绝对化的表达。例如总是、从来不等。
(5)观点的发表日期是啥时候?信息处于动态变化,随着世界的有知变大,我们的认知也在水涨船高。
简单而言,遇见专家意见型的论据,自问“哪个行业的哪位专家在什么时候发表的观点?”需要注意的是,专家也是人,他也有可能犯错,他也可以犯错的。
(四)与观察相关:个人观察
眼见者为实。用各种亲眼所见的事实作为论据。
1、它的不足
观察,不等于镜子。我们没办法获得纯粹的观察。观察顶多算是具有一定角度的哈哈镜。与观察者相关,经过一系列的价值偏见和态度期望值的过滤,最终得以呈现。尽管这种加工是无意识的。例如在观察过程中,注意力没办法持续地集中;观察的事件快速地进行;亦或是具备重重压力。
举个例子:
如果一个人拿着手枪指着银行的出纳,而你站的离他非常近的距离进行的观察,有可能会出现偏差吗?
2、最佳的观察
最可信的报道往往是基于最近得来的观察。一个人处在最佳环境里,他们不具备与观察世界有关联的、明显而又强烈的期望,同时不带有任何偏见(挺难的)。
3、观察论据的应用
观察的证据是通过观察者加工处理后得来的。对于这类论据,自问:他的加工方向是什么?加工的程度如何?
(五)与调查相关:研究报告
文中翻译为“研究报告”,或许“调查报告”更合适。与我平时理解的研究报告有差别。通常研究报告可以包含多种类型的证据。而文中仅针对“调查”得来的结论。常见引导词:研究表明……;研究人员在最近一份调查中发现……;某机构的一份报告显示……等等。
调查,是依赖大量的观察或测试,在一定方法论的支持下,通过训练有素的科研人员,系统收集观察数据。属于科学研究的一种,是非常好的论据来源。具备验证性、可控性和精确性。
1、调查研究的三特性
(1)验证性
这个调查是否可具备重现性?即同一种调查方法,在不同的时间、不同的地点,不同的主测者,它的结果是可以重现的,接受公开的验证。由结果得出的结论具备一定的普遍性。
(2)可控性。
可以将外部因素的影响减到最小化。测量(调查)至少有两种:社会测量与自然科学测量。相比自然界的测量,社会测量表引入了人的主观因素。
在心理测量中,通常会有即定的流程和指导语以控制。此处可链接心理测量学和心理测量技能
(3)语言的精确性
采用的概念术语都是有限定的范围。在这个范围内,结论是可行的。其使用的语言,尽可能做到精确和前后一致。
2、调查研究的不足
(1)研究的质量有高有低。
与研究投入的成本、人为因素等相关。
(2)研究结果常常互相矛盾
事实会随着时间的流逝而发生改变。原始的研究是基于某一特定环境。而当期望再次验证时,或许已事过境迁。
(3)研究结果与结论是支撑关系
若将研究结果与证明的结论,视为充分条件的关系,应慎重。
“研究结果表明……”可以转化为“某些研究人员解释他们的研究成果是表明了……”。
(4)以抽样结果推断统计结果
(5)研究人员的期待
大胆假设,小心求证。研究人员也具有期望值、态度、价值偏见和需求。此时,有可能使他们所问的问题、所采用的研究方法,解释的结果方式,带上偏见的印象。
(6)多次引用的信息衰减
引用研究结果的人,有可能歪曲或简化了研究结论。通常一个研究有它的限定范围。如同标准化文件,第一段就是“适用范围”。不可将某一个限制条件所得来的观点泛化。
(7)时间维度的变化
研究的事实会随着时间的流逝而发生变化。随着科技进步,我们认知的角度和范围也在改变。
(8)人为因素的干扰
研究人员、测试人员所提供的数据是否足够的真实?尽管测量的时候,会要求被测者实话实说。但由于各种原因,人们常常需要掩盖真相。他们可能会提供自己认为应该提供的答案,而非真实反映内心想法的答案。
(9)隐含利益诉求
研究调查的问题措辞含糊不清,因此造成引用人的多种解读。
(10)研究中包含偏见用语
偏见或情感用语,会有一种引导或暗示的作用。
……有人的地方,就有江湖。自带主观性与不确定性。
3、衡量调查研究论据的价值
(1)资料的来源
(2)有没有其他线索可以相互印证?
(3)研究时间是最近的,还是比较远的?
(4)研究者是否具备强势批判性的思维?如实说明研究的限制条件,表达希望大家进一步加以验证的意愿。
(5)是否隐含利益关系?
(6)研究样本的随机性和代表性如何?
关于样本,链接抽样检测,详见文章尾部。
(六)与推理相关:类比
这一个论证用两件事物之间熟知的相似点作为基础,推导出关于某一个事物的一个相对未知特性的结论。
逻辑形式:A推出B,所以C推出D。AC的相关性、以及AB关系和CD关系的相关性。
它具有两面性,可以激发深刻的见解,同时又能蒙蔽我们。例如化学品的毒性多以大鼠的半致死量来评价。以此推断,这种化学品对人的毒性。
类比论据的质量两因素:(1)两个比较的事物,它们的相似点与不同点。
(2)相似点和不同点之间的关联。相似点所占的比例越大,类比质量也就越高。
严格意义,所有的类比都是错误的。因为类比的两者,在某一个角度肯定存在着不同点。因此,表达者应该进一步提供证据以支撑两者间最重要的相似点来揭示出具体原则。
三、新增谬误清单
1、强求确定性谬误
每一个研究结论,如果不是百分百确定的话,就应该被抛弃。世上没有完美的东西。批判性的接受,但程度如何把握?
2、错误类比谬误
提出一个类比,其中却存在重要而又相关的不同点。
四、作为表达者的启示
1、要有一套相对科学的方法论(即理论基础)为起点。例如测试智商,可采用通用经典问卷,如瑞文标准智商测验,而不是自编一套。
2、要保存研究的原始记录,精确可随时查看。当发现有问题时,可以通过翻看记录,对结论的可靠性再次验证。
3、承认研究结果的局限性。它是在某一个特定环境、时间得出来的一个结果。这个结果也只局限于你调查过、观察过的领域。
4、慎重看待互联网信息。
在互联网散播信息的成本极低。以官网或主流媒体为主,尽可能寻找一手资料。
5、常存一套“关键问题清单”作为读者的工具箱,反问自己。
五、关于样本的例子:抽检检测
对于检测而言,分类全数检测和抽样检测。全数检测,质量成本高,因此对于检测成本较高的情况,采用抽样检测。
抽样检测,就是将一部分的样品来推断全部产品的质量水平。因此存在两类风险:生产者风险和消费者风险。如果抽样结果的质量,优于全数质量,以抽样结果来推断全数质量,则是拉高了全数质量的水平。作为接受方,消费者并不知情,当属消费者风险。如果抽样结果的质量,劣于全数质量,以抽样结果来推断全数质量,则是降低了全数质量的水平。作为生产方,只能降价或返工,当属生产者风险。对于零风险,只能是一种零容忍的态度。
关注抽样的样本,样本的多样性、随机性、样品的大小,均是决定抽样结果代表性的因素。在实施过程中,研究者应保严格执行抽样方案,谨防选择“方便样本”。
举个例子:抽样中的泰坦尼克事件。它可以帮助我们理解为什么一个好的样本如此重要。
据说在1936年美国总统选举前,一份颇有名气的杂志的工作人员做了一次民意调查。调查兰顿(当时任堪萨斯州州长)和罗斯福(当时的总统)中谁将当选下一届总统。为了了解公众意向,调查者通过电话簿和车辆登记簿上的名单给一大批人发了调查表(注意在1936年电话和汽车只有少数富人拥有)。通过分析收回的调查表,显示兰顿非常受欢迎,于是杂志预测兰顿将在选举中获胜。实际上选举结果正好相反,最后罗斯福在选举中获胜。
研究者从手机电话本、车辆电话号码里面随机筛选了一批人,然后得出了一个预判的结果。最后他的结果跟实际民众投票的结果是相反的。
在那个年代,有手机,有车辆的通常是富人。而投票,是面对全民。上述结论是研究者基于方便样本而得出的结果。