16
置信度可以帮你衡量一个信息到底是否可靠
怎么提高置信度?通常办法就是要增加所统计的样本数量
人们对待信息通常犯的一个错误,就是忽视它的置信度,以至于我们把完全随机的事情,当成必然的事情。
世界上有很多到底其实都很难验证,大到历史事件,由于很难多次重复,总结经验其实是非常难的。
对于能够重复的事情,要被检验足够多次之后,置信度才高。
17
KL散度
如果你的猜测和真实情况完全一致,你不损失任何东西,但是只要猜测和真实情况不一致,或多或少会有损失。
你猜测和真实情况相差越大,损失越大。
自大的人非常容易遗漏很多原本应该考虑的事情。
过分防范各种情况,患得患失,是有损失的。
信息论中,任何硬性的决定都要损失信息。
18
刻意要引起你注意的人,常常会用耸人听闻的信息打动你
1)放在更大的时空来考量
2)要看信息的一致性
3)从一大堆信息中抽取的信息,要看它们的失真率
误导人的信息第二个特征是没有出处,或者只有一个无法验证的出处。
误导人的信息第三个特征是缺乏上下文。
五个原则
1)最好、最重要的资源要用于那些出现最频繁的事情,这样分配资源最有效,其背后的原理是香农第一定律和霍夫曼编码。
2)不要将相关性当成因果关系
3)直接获取某种信息是很困难的,因此获得等价信息,得同样的效果。
4)日常大部分事情,都是渐变的,通过增量改进,要比推倒重来效率高。
5)信息矢量化:将很多维度的信息映射到我们关心的几个维度。
19
先抛出一个颠覆你认知的观点
正确的历史观比历史细节更为重要
只要历史的信噪比足够高,就能还原出历史的大脉络
我们要考察的不是一条信息的准确性,而是大量数据中,有多少是准确的信息,有多少是噪音。
20
能够找到噪音来源的和不清楚来源的。
有规律的噪音和随机的噪音,固定频率的噪音和白噪音
第一个常用方法就是利用信息的冗余
换一个角度看问题
1)通过信息的冗余和比对,过滤噪音
2)将有噪音的信息分解到不同的维度过滤噪音