数据能力是人类文明最底层的作用力之一,人类对数据的记录和处理能力将直接影响文明的形态。
乍一听,你可能会觉得奇怪,数据不就是人类发展的一个结果吗,它是对现实的记录,又怎么能影响世界,甚至改变文明的形态呢?要想理解这个结论,我们就要建立更宏大的观察视角。提到文明的进步,我们能想到很多作用力,比如制度、经济、技术等等,但是作者认为,假如我们用一个更宏大的视角观察文明的进展,就会发现这些作用力之下有一个更底层的力量,它支撑起人类文明的整个生命线,这就是数据的力量。说得更具体一点,是人类记录和处理信息的能力。
作者认为,原始社会之所以发展缓慢,就是因为缺乏有效的记录手段。因为无法精确记录,所以成果不能积累,但文字诞生之后,信息就被精确地记录下来,这就让人类的智慧突破了原本的时空局限,可以被精确地传播、积累、不断叠加,文明的脚步也因此越来越快。你看,几乎所有的重大进步都发生在文字出现之后,比如造纸术、印刷术、蒸汽机等等。
所以,什么叫文明?按照通常的理解,文明就是人类所有成果的总和,包括财富、技术、文化等等,但作者认为,文明还有另一种解读方式,就是把文和明两个字分开看:文是文字,它指代的是人类记录世界的能力;明,是光明,它指的是由记录带来的真实世界的清晰度。比如过去,我们只知道中国是个国土辽阔的多民族国家,但现在,由于数据能力的进步,我们可以更加精确地统计出,国家有多少人口,他们的姓名、生日、籍贯等等。人类文明的演进,本质上就是不断发现、思考、记录真实世界,让它呈现出更高清晰度的过程。
说到这,你一定已经发现,今天我们正处在一个重大的节点上。互联网、算法技术、人工智能的兴起,让人类的数据能力产生了爆炸式的跃迁,世界以一种前所未有的清晰度呈现在我们面前。这种强大的数据能力,将如何改变文明的走向?它会对社会和人性带来哪些永久性的改变?这已经不再是数据领域的专业问题,而是一个关乎人类未来的重大议题。
本书的作者是著名的信息专家、曾经担任过阿里巴巴副总裁的涂子沛老师。中国第一本聚焦于大数据领域的畅销书就是他的作品,书名就叫《大数据》。这回,涂子沛老师在《数文明》里,用人类文明的大视角重新审视数据的作用。书名“数文明”,其实是一语双关,它既揭示了一种逻辑,也就是数据能力和文明之间的作用关系,同时它也指代一种状态,就是以数据技术为基础的人类文明的新阶段。
接下来,我将分为两部分为你解读这本书。第一部分,我们将回答,数文明的基础是什么?人类是怎么走上数文明的轨道的?第二部分,强大的数据能力,将对人类文明产生哪些重大影响?
第一部分
首先,第一部分,要想理解数文明的特点,我们得先明确一件事:为什么说数文明时代的到来,是一种不可逆的趋势?换句话说,滋养数文明的土壤是什么?
人类迈入数文明时代,一共跨过了三个重大门槛,经历了三次重要的技术突破。这三种技术你一定都不陌生,有的还会让你感觉稀松平常,但是它们却是数文明时代的原力,也就是原始动力,从最底层改写了人类的记录逻辑。
咱们先说数文明的第一个原力。提起数据技术,我们往往首先想到计算机和互联网。你看,我们在网上的社交、娱乐等等一系列行为都被精确记录,你有哪些好友、给谁点过赞、浏览过哪些网站,都被记录得一清二楚。但是,你想过一件事没有,计算机为什么能如此精确地记录我们的行为?要知道,它察觉的可不只是那些有效操作,比如点赞、买东西、看视频,这些在后台都有明确的数据,它还能记录那些无效操作,比如你在网页的空白区上漫无目的地乱点,或者在一个页面上随意滚动,又或者鼠标在电脑上随便滑来滑去。这些不会导致任何结果的无效操作,为什么也会被记录下来呢?其实,答案就在我们每天都在用的、一个不起眼的小东西上,这就是鼠标。它也是数文明的第一个原力。
要想了解鼠标的作用为什么这么大,我们得先知道鼠标到底是什么。上世纪60年代,美国斯坦福研究院的一名教授,发明了世界上第一个鼠标。当时它并不叫鼠标,而是用了另一个名字,叫 X-Y 屏幕方位指示器。也就是,把屏幕像地图上经纬度一样,分成横向的 X 轴和纵向的 Y 轴。你的鼠标停留在屏幕上的任何一点,计算机都可以把它的位置,转化成一组由横纵坐标值构成的数据记录下来。不管你是否点击,只要电脑开机,它的位置就会被记录。显然,无论是更原始的键盘操作,还是更先进的声控技术,都无法达到这个效果。你看,键盘需要敲击,每输入一个指令都带着操作者的清晰动机,这就意味着它只能记录下那些有效的操作,而声音控制也一样,它们都没法像鼠标一样,始终黏在屏幕上。正所谓“凡走过必留下痕迹”,鼠标就是实现这种全方位记录的基础。
但是,你可别以为鼠标的作用仅限于此。除了功能本身,它还揭示了一种当今人类记录数据的逻辑。以往,记录是一种刻意行为,我们是有选择地记录。比如你出去旅游拍照片,你只会拍下那些你认为美好的场景,这种记录是随机的,而且记录的信息不连贯。但现在,记录已经变成了一种不需要刻意启动的附加行为。就像一台始终处在录制状态的摄影机,它不做任何判断,只是客观记录,所有信息都是连贯的,只要开机,它就会不停记录。
说到这,你可能会说,不对啊,我们在云端留下的只是网络上的行踪,要知道,很多人在网上的表现和现实中是大相径庭的,比如我们常说的键盘侠,不就是一个典型吗?那么,我们又该怎么让网络和现实连接在一起呢?这就要说到数据技术的第二个原力了。它和鼠标一样,还是一个不起眼的小东西,这就是摄像头。
你可能会觉得,摄像头无非是记录影像,怎么会成为人类步入数文明时代的一个关键突破呢?这就需要引入另一个因素,数量。截至到目前,全世界已经生产出了140亿个摄像头,平均每人2个;到2020年,这个数字将翻倍,达到280亿,平均每人4个摄像头。人类历史上,还没有任何一种小型机械能达到如此巨大的规模。要知道,这还不包括照相机、摄影机和手机上的摄像头。换句话说,我们已经进入一个全民记录时代,每个人都可以随时随地参与记录。
你可能会觉得,这些照片不是一直都存在吗?在古代,人们就开始画肖像,摄像头和照相机也有很多年的历史。那么,今天的影像记录,除了数量,在本质上和过去的影响有什么不同呢?答案是,今天所有的记录都多了一层技术加持,这就是算法。它进步到什么程度了呢?举个例子,2017年,腾讯总裁马化腾就在全球财富论坛上说过,腾讯每天能收到超过10亿张用户照片,而且很多用户都是从几年前就开始上传。平台不光掌握了这些人的长相,还能根据他们过去的相貌变化,预测出未来的长相。换句话说,摄像头不光能记录你,还能认出你。你看,在算法和人脸识别技术出现之前,所有的声音影像数据都随意地散落在各处,但是现在,每一组数据都能跟它们的主人一一对应起来。这就等于是把人类在真实世界中的活动记录,投影在了云端。
但是,更值得我们注意的并不是摄像头本身,而是它所反映出的数据的一个重要特性,那就是超强的寄生能力。换句话说,摄像头是一个重要的记录手段。但是现在,即便抛开摄像头不提,记录手段依然有很多。照片可以成为个人数据,同样,任何事物都可以成为数据的宿主。比如火车票,在实行实名制之前,它只是通行证,但实名之后,它也成了一条出行数据。再比如去餐馆吃饭,以前用现金支付,吃完留不下任何痕迹,但现在通过网络支付,你的饮食经历也被一并记录。
过去,哲学家说,万物有灵,但现在应该说,万物有数据。数据已经成为人类社会的一套共生系统,它紧紧地嵌入人类社会,我们的每一个行为都在不断地生成数据。只要人类存在,它就会伴随人类的行为,不断地成长壮大。但是,你可别以为这个共生系统只会跟在人类身后,依附于人类,它还有可能超过人类,这就要说到数文明的第三个原力,深度学习技术。
深度学习,也就是让人工智能学习人类的经验,然后自己把这些经验转化成技能。比如下围棋,你可以不用教会人工智能每一步该怎么走,只需要给它输入大量的棋谱,它就会自己推导出一套章法。当年击败人类冠军棋手的 AlphaGo,就是这么培养出来的。当然,我们今天要说的,并不是 AlphaGo 为什么会击败人类,而是深度学习技术所揭示出的一种新的技术演进逻辑。以往,是人类先掌握一门技术,然后把它复制到机器上,比如人类先有手工的活字印刷,然后把这门技术交给自动化的印刷机。换句话说,人是机器的老师,但现在,人类更像是家长。假如把人工智能比作婴儿,那么数据就是奶粉,随着我们生成的数据越来越多,这些奶粉变得越来越有营养,这些婴儿就有可能快速生长,并且超过人类。
你看,我们一直认为人类是智慧的源泉,但现在,人工智能有可能绕过人类,直接获得更强大的能力。AlphaGo 的胜利不就是一个例子吗?所以,深度学习技术,让数据具备了哺育人工智能的新用途,当人工智能进步之后,它又会给数据赋能,让数据变得更有价值。
以上是第一部分内容。我们追根溯源,找到了激发数文明诞生的三个重要技术,分别是鼠标、摄像头和深度学习技术。其实你应该已经发现,这三个发明本身并不能代表人类的全部数据能力,我们真正要揭示的,是当今这个时代数据能力的演化所遵循的一套逻辑。鼠标代表了数据记录的连续性,以往的随机记录,变成了连贯、持续的常态。以往我们选择记录什么,但现在,我们只需要选择不记录什么。同样,我们分析摄像头的目的,也不是在强调摄像头本身的重要性,而是想通过对摄像头这个数据入口的分析,来感受人类挖掘数据的能力。除了摄像头之外,我们身边还有很多数据的记录载体。任何事物都有数据的一面,随着技术的进步,这些数据都可以被人类开发利用。而深度学习技术,揭示的是由数据增长引发的一种新的技术演化方式,那就是技术有可能绕过人类直接获得更强的能力。这三重逻辑叠加在一起,让人类的数据能力越来越强大,这是一个不可逆的趋势。
第二部分
那么,这些改变将对文明产生哪些影响呢?第二部分我们就来回答这个问题。作者认为,最重要的影响有两个:构建高清晰社会、打造高能个体。
先说第一个,构建高清晰社会。也就是通过精确的记录,让社会以一种越来越精确的面目呈现出来。你可能会说,这不是数据积累的自然结果吗?它无非是对社会形态的一种精确描述,对社会本身和人类的心智会产生影响吗?要想明白高清晰社会的意义,我们得建立更大的观测视角。回顾历史你会发现,几乎所有的国家,都在通过各种手段不断努力提高社会的清晰度。
姓氏的出现,就是一个典型的例子。比如日本,国家的人口不算多,但国民的姓氏却多达11万个,这是为什么呢?跟明治维新有关。150年前,绝大多数日本人是没有姓的,19世纪时日本政府发现,国民没有姓对于户籍管理、征税征兵非常不方便,于是下令全体国民都要在规定时间之内取一个姓。日本人情急之下只能自由发挥,看到什么就用什么作姓氏,住在大桥边的就姓“大桥”,门口长了一棵松树的就叫“松下”,村前有一座山的就姓“山口”。国家为什么这么热衷于创造姓氏?因为人口是一个社会最基础的数据,户籍、纳税、征兵、治安、福利、财产等其他社会制度都建立在它的基础之上,掌握清晰的人口数据是国家治理的前提。所以,姓氏是人类社会从模糊迈向清晰化的一种重要的制度设计。
后来,进入工业社会,社会大分工、人口大范围流动,仅凭一个名字显然无法实现精确管理,所以在第一次世界大战期间,西方各国政府都开始强制公民提交照片,办理各种证件都需要附上照片。你看,这又是社会清晰度的一次提升。换句话说,一个现代化社会必定需要现代化的管理,而现代化管理的前提就是构建高清晰社会。今天,社会的清晰度已经达到了空前的程度,你的身份、社交关系、行为记录都可以被察觉到。我们就像一条长着尾巴的蝌蚪,无论去到哪、无论干什么,都会留下一串数据。
这会带来什么呢?除了信息的增长和社会治安的提升,还有一个更重要的影响:高清晰社会正在重新塑造人类的天性,乃至整个人类文明的精神面貌。怎么讲?回顾历史你会发现,一个人不管有多大的权力,他的行为方式都受到一件事的影响,那就是他的一举一动是不是会被记录下来,被他人感知到。换句话说,一个人在社会上的清晰度,会影响他的行为方式。比如,过去的皇帝有着至高无上的权力,但他唯独害怕一个东西,叫起居注,也就是身边的史官写的那个记录皇帝言行举止的小册子,它一旦写成,就不能更改。当年,宋太祖赵匡胤沉迷玩乐,但是又很少有人敢劝他,都怕惹皇帝不高兴,万一被降罪就麻烦了。直到其中一个大臣提醒他,别忘了世界上还有起居注这个东西,赵匡胤一听,马上痛改前非。因为即使当时没人批评他,但起居注会把他当天的一言一行全部如实记录并且传播给后人,至于后人怎么说,他又怎么控制得了呢?
说到这,你应该已经发现,数据记录对于人性的作用到底是什么:它正在一点一点地逼出人性中的侥幸心理。过去,人们会有侥幸心理,觉得自己做了坏事,也不一定会被发现,今天,数据会记录下一切。比如说,在高速公路上一边开车一边玩手机非常危险,但是很多人觉得无伤大雅,反正也不会被交警抓到,但现在不行,比如2017年6月1日,浙江省在高速路上装了一套设备,摄像头自动抓拍、识别开车玩手机的行为,短短5天内就抓到4000多起。当年,爱迪生改造白炽灯,照亮了纽约的黑夜,犯罪率因此大幅度下降。今天的数据也有同样的功效,它就像一束光照向人性的幽暗处,一点点清除人类的侥幸心理。
刚才咱们说了数据对人类社会的影响,构建高清晰社会,这不仅提高了社会的治理效率,也改变了人性,逼出了人们内心的侥幸心理。那么,数文明时代对于我们个人来说又意味着什么呢?数据技术会给个人带来什么样的机遇?这就是咱们接下来要说的,数据对于人类文明的第二个影响:打造高能个体。
高能个体,指的就是拥有强大能力的个人。你可能会说,数据既不是真金白银,也不是实打实的权力,它是怎么打造高能个体的呢?要想明白这个观点,我们得先弄明白一件事:获取财富和权力最有效的方式是什么?你可能会说,靠机遇,巨大的机会意味着巨大的收益。但是,到底什么是机遇?答案是,认知差。也就是说,当一个新资源出现时,你比其他人更早地意识到了它的价值。比如,16世纪初,西班牙人来到墨西哥开掘黄金,当地人就很纳闷,黄金既不能吃,打造成武器又不够硬,这些人要黄金做什么?他们完全不知道,在另外一个世界里,黄金就是货币。此后的300年间,西班牙一共从南美洲拿走了250万吨黄金,依靠这些财富,西班牙成了当时世界上最强大的帝国。
今天,人们看待数据的方式,就像当年人们看待黄金,并不是所有人都意识到了它的价值。比如,当年特朗普竞选美国总统,你可能大概听说过,他使用了大数据技术来辅助竞选。但是当我们仔细分析整个过程,还是不免吃惊于数据的威力。
当年,特朗普雇用了一家大数据公司,叫剑桥公司。这家公司搜集了将近9000万人的网络社交数据,把它们和商业市场上的消费数据匹配分析,得出选民的性格、偏好政治立场。然后,对义愤填膺的爱国者,就给他们推送“鸡血”,告诉他们特朗普能让美国重新伟大;对知识精英,就推送包装得比较理性、显得高深的分析;对民主党的支持者,推送一些和希拉里家族有关的负面信息,让他们对希拉里失望。当然,我们不能断言,特朗普当选完全是数据技术的功劳,但至少可以确定,数据发挥了一定的助推作用。在一场势均力敌的竞争中,这些助推几乎能决定成败。
那么,这些帮助特朗普取胜的数据成本是多少呢?非常低。主要支出的,是数据的获取和分析等技术成本。至于数据本身,是由每一个普通选民免费提供的。他们的每一次留言、点赞、消费,都在提供免费的数据。人们都没有想到,那些看起来无所谓的个人数据到了别人手里,居然可以变成总统竞选中的利器。你看,这不就是典型的认知差吗?在数文明时代,最先意识到数据价值的人,就更有可能成为高能个体。当然,这本书里,作者也号召要尊重个人数据的价值和所有权,数据的提供者应该有权利共享数据带来的收益。有关数据所有权的问题,我在另外一本书《算法的陷阱》里做了集中解读,有兴趣的话,你可以找来听听。
以上是第二部分内容。数文明时代的到来,会对人类文明产生哪些影响?对于社会来说,数据能力的提升,将打造出一个高清晰社会,而社会清晰度的提高,又会对人性产生深远的影响,它将逼出人性中的侥幸心理。对于个人来说,数据是新的金矿,利用人们对数据的认知差,少部分人可以用极少的成本掌握数据的力量,从而成为高能个体。