我今天要分享的这个道理,你应该早就有一点意识和印象,但是你可能没想到它有这么强,你可能不知道它是一个数学定理。这是一个1969年才出现的定理。了解这个思想,你将会变成一个更开朗的人。
这个定理就叫做“丑小鸭定理”。简单的说,就是你认为是一只丑小鸭跟一只天鹅之间的区别大,还是两只天鹅之间的区别大?
直观的答案肯定是丑小鸭跟天鹅的区别大。两只天鹅毕竟都是……天鹅,肯定长得像,丑小鸭跟天鹅那是很不一样。
可是你这么说是只考虑了它们的外形。我还可以从别的方面比较。比如咱们可以比 DNA。假设丑小鸭是这两只天鹅生的女儿。两只天鹅是夫妻,它们的 DNA 并不相似。而丑小鸭的 DNA 有一半来自她的父亲,一半来自她的母亲。所以要是看 DNA 的话,那么丑小鸭跟其中任何一只天鹅相似度,都远远高于这两只天鹅之间的相似度。
这个道理是要比较相似度,首先你得看看比的标准是什么。可是我们能想象的标准可能有无穷多个,这没有办法计数啊?所以我们需要一个数学的洞见。
1.定理
这个洞见就是,所谓这两个东西“相似”,就是在给所有东西分类的时候,这两个东西能被分在同一个类里面。在各自不同的分类之中,它们两个被分到一起的次数,就是相似度的大小。
也就是说,丑小鸭和天鹅之间的相似度,和两只天鹅之间的相似度,是一样的。这就是“丑小鸭定理”。
一般来说,如果有 N 个物体,那么你就一共有2的 N 次方种不同的分类方法,而结果还是这样,各个物体之间的相似度是一样的。
换一个说法,丑小鸭定理也可以表述成:“丑小鸭跟天鹅之间的差异,和两只天鹅之间的差异一样大。”
2.没有“客观”的分类
比如说,咱们现在有一大堆东西,那你能不能给计算机一个任务,让它自动地、客观地把这些东西给分个类呢?丑小鸭定理说,这是不可能的,因为你没给分类标准。
比如说把一群人分类,你是按身高分、按肤色分、按学历分,还是按 DNA 的相似程度分?你必须先主观地给计算机一个标准,它才能进行分类。如果没有主观标准,那根据丑小鸭定理,这些人中任意两个人的相似程度都是一样大,不管怎么分都可以。
这就是“种族不存在”这个说法的最深刻含义。你非得把人按照种族分,你这是一种主观的、偏见的分法!每个人都有各种属性,凭什么非得看种族呢?是从这个意义上说,种族不存在。
但是这个批评也适用于所有的分类。按种族分不合理,难道按学历分、按性别把人分类就合理吗?如果你一定要说“种族不存在”,你也应该说性别和学历不存在。
这个道理是根本不存在完全客观的分类。每一种分类都是主观的 —— 换句话说,每一种分类都是有偏见的。是你先“偏见”这个属性最重要,你才会根据这个属性去分类。
这个思想的应用,何止是计算机模式识别!我们仔细想想,这其实是一个有“佛性”的定理。
3.一点人生哲学
而现在丑小鸭定理则告诉我们,不管你是不是从“我”的视角出发,只要你分类,你就是有偏见的。
完全客观、不偏见、不歧视,那是不可能的。
那我们应该怎么面对这个世界呢?我觉得大概有这么三点。
第一,你可以随时跳出“默认分类”。
以前中国的社会习俗,陌生人见面一上来就先问问“你是哪的人”,老乡跟老乡特别亲,把人按籍贯分类。我们知道了丑小鸭定理,就知道这个分类方法并不是天经地义的。为什么不按照懂数学和不懂数学来分呢?为什么不按照打篮球的和不打篮球的来分呢?
每一只被人歧视过的丑小鸭都应该想想这个定理!你完全可以跟天鹅分在同一类。
第二,任何一个事物,都没有什么“本质的属性”。
比如这有个金元宝,一般人的第一反应肯定是这是个宝贝 ——
但“宝贝”是金元宝的本质属性吗?它同时还是一个金属,它还是一个文物,它比较坚硬可以用来砸核桃,你凭什么就非得把它看成是一个宝物呢?
人也是这样。每个人都有很多很多的属性,相当于是“标签”,而没有哪个标签能代表这个人的本质。
比如霍金,你说霍金的本质是什么?是一个物理学家吗?但他同时也是一个男人,很喜欢女性;他是一个父亲,有三个孩子;他还是一个明星,经常发表各种言论;他还是个特别有趣的人,喜欢讲笑话;当然他还是个残疾人。这几天赶上霍金去世,很多人用各种方法、从各个角度缅怀他,而我们不能说哪个角度就不对。
只要你开口说霍金,你就已经对他有偏见了。
第三,没有好处就别分类。
没有客观的分类,不等于说我们从此就不能分类了,也不等于我们必须看所有东西都一视同仁。把东西分类是一种方便的认知,我们完全可以随时根据当时的用途和价值观来给东西分类。
比如说,如果让小孩给动物分类,他们可能分成天上飞的、地上走的、水里游的。这种分类方法有利于儿童了解动物的活动范围。如果你让一个动物学家来分类,他可能更愿意把它分成哺乳动物类和爬行类等等,那么鲸鱼在他眼里就不是一个在水里游的动物,而是一个哺乳动物。如果让商人分类,他首先想的是经济价值,哪个动物能帮他挣钱。让博物学家分类,他可能最关注的是这个动物的稀有程度。
你得先想到一个价值,分类才是值得的。那如果没有价值,只是随便分类,就很有可能限制自己的认知,还可能无形地伤害别人。
比如我们中国以前用人,有一个填表的项目是“籍贯”,这在我看来就没什么太大意义。每个地区都有很多很多人,籍贯并不能让你更了解一个人,更何况他长大的地方不一定是他出生的地方,更不一定是他祖上居住的地方。问籍贯,除了让某些对地域特别敏感的人感到难受之外,有什么好处呢?
如果没有好处,就不要轻易给人贴标签。如果有人非得贴标签,我们就得小心,他到底想干什么。