幂律分布

好,我们先来看一组现象,一组常见却又特别奇怪的现象——

在抖音和快手上,有的短视频能够吸引几百万个点击量,但是其他绝大多数短视频却无人问津。这是为什么?

在微博上,大V拥有几千万的粉丝,但是普通人的关注度却寥寥无几。这又是为什么?

还有,在中文里,我们经常使用的汉字也就两三千个,但实际上呢,中文汉字的总量是9万多个,换句话说,字典里的绝大多数字,你都不会用到。这又是为什么?

还有,统计学上有一个发现,它讲的是,城市的人口数量排名跟它的人口规模成反比。最大的城市的人口规模,是第二大的城市的两倍,是第三大的城市的三倍,是第四大的城市的四倍,以此类推。用这个方法来估算城市的人口,跟人口普查的数据常常能达到惊人的相似。

你看,这些现象都有一个共同的特征,就是它的数据波动非常地大,少数点的数值特别高,大多数的点数值都很低,最大和最小的点之间,可能相差好几个数量级。统计学上,把这种情况叫做“幂律分布”。

幂律分布的形状,是一个不断下降的曲线,从最高的峰值开始极速下降,后面拖了一个长长的尾巴。自然界中的很多现象都遵循正态分布。比如,人们的身高、体重、智商,这些统计量都有一个平均值。大家在这个平均值的周围小范围地波动。你高一点,我矮一点,差距不是特别地大。

但是,还有一类现象,就像我们刚才讲的点击量、关注度、语言,还有城市人口,甚至包括人脉、财富、声望,这些都遵循的是幂律分布。

世界是不公平的

幂律分布和正态分布,给我们展示了两个非常不同的世界。

以收入为例,在正态分布的社会里,中等收入阶层占绝大多数,低收入和高收入阶层只占极少数。这种分布,被认为是非常理想的社会结构,对聪明勤奋的人有激励,让弱者的落差感没那么大。但是真实世界的趋势,是越来越像幂律分布。

第一个为幂律分布命名的是经济学家帕累托。他发现,在19世纪的意大利,极少数的富人赚走了绝大部分的钱,大部分家庭的收入都很低。他的这一发现被后人称为“帕累托法则”,也叫“二八定律”,也就是20%的人获得了80%的收入。

在美国经济危机期间,幂律分布被赋予了新的意义。占领华尔街的运动让人们关注到一个惊人的事实,在美国,1%的高收入人群,拿走了15%的收入,而且这个贫富差距还在继续扩大。

用《新约·马太福音》里的话就是:“凡有的,还要加倍给他叫他多余;没有的,连他所有的也要夺过来。”

用现在的话来说,就是“穷者越穷、富者越富”。

皮凯蒂在《21世纪新资本论》里也证实了这一观点。他指出贫富两极分化的根本原因,是资本回报率总是大于劳动回报率。所以,资本会倾向于流动到已经聚集的资本上,而不是为劳动增值。因而,有钱的人,会越来越有钱,没钱的人几乎没有办法通过劳动来追赶上。

在电影《西虹市首富》里面,主角王多鱼得到了一笔意外之财,要求在短时间之内必须花掉。他使尽了浑身解数去花钱,没想到,财富像雪球一样越滚越大,挡都挡不住。这背后的原理,就是幂律分布。

产生机制:优先连接

你可能会问,既然这么不公平,那么,幂律分布背后的机制是什么呀?“穷者越穷、富者越富”的现象是怎么形成的?穷人还有没有机会打个翻身仗呢?

这就涉及到我们今天的硬核知识了。幂律分布之所以产生,是网络中的相互影响和正反馈的结果。

你看,身高、体重、智商,这些现象,人和人之间是互不影响、彼此独立的。它们不是网络现象,所以,它们服从的是正态分布。

但是,财富、人脉、声望,还有人口和点击量,它们都是网络现象。一个人有多少钱、有多少人脉、有多少关注度,是在跟别人的互动中形成的。你必须把这些现象放到网络之中,才能理解它为什么是这样。

符合幂律分布的网络,又被称为“无标度网络”。无标度网络的特点,是节点的中心度相差悬殊,无法用均值或方差等指标来反映度分布的聚合或者离散程度,所以,我们把它叫做“无标度”。

真实世界的网络,大部分都是无标度网络,都遵循的是幂律分布。从只有20多年历史的万维网,到经历了40亿年漫长进化过程的蛋白质互动网络;从由分子构成的网络,到由城市构成的网络。幂律分布,铁律,让人惊叹!

那么,网络为什么会呈现幂律分布呢?

这跟网络的生长机制有关。物理学家巴拉巴西(Barabási Albert-László)认为,网络生长的方式不是随机发生的,而是优先连接。当新的节点加入网络,或者网络中有新的连接产生时,连接度高的节点会比连接度低的节点更有可能得到新连接,这就是所谓的优先连接。

在社交网络中,一个人的朋友越多,就越有可能认识新朋友。

在互联网上,一个短视频的点击量越高,就越容易被更多的人看到。

在学术界,一篇论文被引用的数量越多,就越有可能被其他的论文引用。

正是在优先连接这一机制的作用下,网络才出现了幂律分布的结果。幂律分布的出现,预示着一个系统从无序到有序的过程,从随机网络发展到无标度网络的过程。幂律分布的结果,是少数的节点能够施加影响,重新组织整个系统。

以航空网为例,伦敦、芝加哥、法兰克福、阿姆斯特丹的机场都非常地大,有通往全国各地、全世界各地的航班,它们是全球航线网络中的超级节点。但是与此同时,还有大量的小机场,他们是地方性的,只维持了几条航线。航空公司通过小机场覆盖尽可能多的乘客,又通过大机场这样的超级节点,最大程度地减少了转机的次数。所以,航空网的效率,来自于他们主动运用了幂律分布。

城头变幻大王旗

经济学家弗里德曼有一个预言,他说啊,世界是平的。因为全球化、因为互联网,世界在机会分布上变得更公平了。

但实际上呢,幂律分布告诉我们,公平不是世界的真相,而且,这个不公平在互联网时代被放得更大。咱们就看互联网行业,不管是哪条赛道,早期都是千军万马、百舸争流,但是最后,能活下来的只有一个或几个巨头。这些巨头利用已有的用户基础和资本体量,不断地攻城掠地,进一步加强知名度,改变用户习惯,提高用户粘性,巩固行业地位。

但是,巨头永远是巨头,这只是一厢情愿的看法。

当孙正义在投资一家叫做阿里巴巴的小公司时候,他可能没有预计到马云不仅会登上福布斯全球亿万富豪榜,更不会预计到还会排在他前面。而且,跟马云一起登上富豪榜的成功人士中,一半以上都是白手起家。

前几年我们还在焦虑BAT的垄断地位,可能会压制创新创业的发展,然而今天简称TMD的今日头条、美团和滴滴等新一代互联网企业,已经站在新的风口浪尖上。

换句话说,幂律分布没有那么令人绝望。我们如果只是静态地观察的网络,它表现出来的是两极分化和寡头垄断,但如果我们从动态的角度看,你会发现新的超级节点总在不断涌现。社会结构的变化、世代的更替、颠覆性技术的出现,都为新的超级节点的出现创造了机会。正所谓城头变幻大王旗,各领风骚三五年。

今日得到

总结一下这一讲的内容。今天我们讲了网络的一个普遍特征,那就是幂律分布。我们生活中各式各样的现象,从点击量、关注度、语言、城市人口,还有人脉、财富、声望,都遵循的是幂律分布。

幂律分布产生的原因是优先连接。新加入到网络中的节点,更倾向与超级节点产生连接。静态地看,你会看到不公平,但是,动态地看,你会看到新的机会仍然在不断涌现。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,053评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,527评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,779评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,685评论 1 276
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,699评论 5 366
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,609评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,989评论 3 396
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,654评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,890评论 1 298
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,634评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,716评论 1 330
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,394评论 4 319
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,976评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,950评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,191评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 44,849评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,458评论 2 342

推荐阅读更多精彩内容

  • 《网络素养》中的原文: 当你开始分析小世界⽹络,并列出每个节点的连接数量时,你会发现⼤部分节点的连接数都⽐较少,只...
    MeamMr阅读 4,827评论 3 5
  • 01 问题的引入: 在看《跃迁》这本书时,第二章讲到幂律时,提到: 幂律分布的第一个特征,就是高度的不平均。 幂律...
    闪闪发光的Lucky阅读 15,435评论 2 12
  • 一、幂律分布与正态分布 相信不少朋友应该知道“幂律分布”与“正态分布”的概念。首先,幂律分布与“二八法则”的概率类...
    悦读思考阅读 1,585评论 0 4
  • 很喜欢深夜一个人走在街上的感觉,街灯拉长了我的身影,几颗寥寥的星星,那一刻我觉得整个世界都是我的。 我天性不宜交际...
    3720_9bed阅读 244评论 0 0
  • 依稀记得第一次接触灵性成长类书籍是在读初中的时候。英语老师组织大家订阅一些刊物书籍,无意间被一本《遇见未知的自己》...
    海韵梦都阅读 434评论 0 2