每一次的技术革命,必将会对人类社会产生巨大冲击,影响人们生活中的方方面面,包括商业模式、产业链条、社会问题等。
走在时代前沿的人,会优先享受技术革命的红利;而广泛的大多数,则需要承接技术革命的波及、消化技术革命的影响。
四、大数据与商业
作者首先举例大数据帮助美国解决毒品问题。
毒品泛滥的一个重要原因,是大麻的种植非常容易,甚至可以用盆栽和LED灯在家里种植,查处非常困难。
而通过大数据把个体用电模式和用电模型做对比,就能快速圈定种植大麻的嫌疑人。
同样的,大数据帮助税务局查偷税漏税,也同样采用“统计规律和个案对比”解决问题的方式。
关于大数据在商业领域的应用,作者首先举例了耳熟能详的大数据案例——美国塔吉特连锁百货预测少女怀孕的案例。当然,在很多版本中主角换成了亚马逊。
大数据当然绕不开亚马逊,亚马逊利用大数据向买家个性化地推荐商品,也就是所谓的“系统推荐”。其销售额占到亚马逊的1/3。
相对于传统的线下商超,亚马逊的优势包括三方面:获取数据的时效性,用户数据的全面性,策略调整的时效性。
除了电子商务领域,在其他商业领域,大数据也有类似的应用。比如美国的在线影片租赁提供商Netflix公司的,个性化影片推荐,也是类似原理——“时效性很强的个性化推荐”。
对Google等搜索引擎的作用,比如“无关键词搜索”,大数据的作用更是不言而喻。
在这些案例中,数据流都是从局部到整体,而要利用大数据得到的规律指导商业行为时,数据流是从整体到局部。
此后,作者又列举了不同的案例,证明大数据在不同的商业领域,通过对细节的把控,创造更大的商业价值。
我们看看其中的一个案例——酒吧管理。
美国酒吧的经营寿命很短,主要原因是大部分酒都被酒保送掉了,并且无法做到有效监控。创业者设计了一套解决方案:给酒架装上测重量的传感器,以及RFID读写器,再给每个酒瓶贴上RFID。这样,哪一瓶酒在什么时间被动过、倒了多少都会记录下来,并且和每一笔交易匹配。
其中进行的数据分析包括:
第一,分析统计数据,了解经营状况;
第二,为异常情况提供预警;
第三,提供行业宏观数据作为参考。
除了酒吧管理,作者还举了其他案例,解决方案具有普遍性。
Prada通过在每件衣服的标签上安装RFID,收集每件衣服的信息;B2B生意也可以通过大数据,收集产品各种数据、提升服务能力。
我们发现,每个商业领域都能通过大数据获益。
大数据三个特征中的的完备性,改变了人们开发产品和解决问题的思路。
作者举了Google关键词搜索中,关键词组合问题,和Google自动驾驶汽车的案例,说明在很多情况下,因为大数据的完备性,使用穷举法反而能更好的解决问题。而“穷举”在之前是很难做到的。
一项技术如果带动整个社会的变革,必将遵循的规律:新技术+原有产业=新产业。即:新技术能够催生新产业。
比如第二次工业革命中,电的应用有和瓦特蒸汽机类似的地方,但更重要的是,电改变的不仅是经济,还改变了国家的政治形态、生活方式和社会结构。比如,导致了大都市的出现——因为电梯可以使房屋盖得更高,公共交通可以把城市拓得更宽。电更重要的影响在于电器的发明,这导致了新产业的出现。
而大数据和机器智能,也会催生众多新产业。
技术革命带来新产业之外,还会带来商业模式和生活方式的改变。
比如在信息革命之后,计算机等硬件设备不断升级,而除了早期之外,我们并没有发现现在的计算机能快多少。这是因为,系统和软件功能的不断增加,要不断吃掉硬件性能的提升,这就是“安迪-比尔定律”——“比尔要拿走安迪所给的。”比尔大家都很熟悉,安迪是个人电脑巅峰时代英特尔当时的CEO安迪·格罗夫。
硬件公司可以学习IBM服务的模式,从硬件设备的制造,转变成为运营和服务。其中,GE的智能冰箱,成为电器公司产品转型的代表,国内也有家喻户晓的小米和格力。
在大数据时代,IT的软件和服务业依然会是IT领域最好的行业。
通过对三次技术革命的分析,可以得出三个结论:
第一,技术革命导致商业模式的变化,新商业模式的诞生。
第二,制造业利润越来越低,人们对服务的需求越来越强烈。
第三,商业模式的变化既有继承性又有创新性。
五、大数据和智能革命的技术挑战
作者通过本章,详细分析了大数据的技术基础和面临的技术挑战。
技术在积累之后取得关键性突破,带来快速发展的点,叫做技术拐点。
历史上有很多关键性的技术拐点。比如1666年,牛顿发明了微积分,发现了力学三定律和万有引力,完成了光学分析,从此世界进入了科学近代社会;到了1905年,爱因斯坦完成了分子说,发现了光电效应,提出了狭义相对论,从此开启科学的现代社会,此后物理学的各个领域全面繁荣;1965年,摩尔博士提出了摩尔定律,同时在工业界大规模集成电路出现,从此信息产业高速发展。
智能技术的拐点,可能就发生在从10年前开始到接下来的一二十年这一段时间。从过去的10年开始,最容易看到的特征,就是全球数据量呈爆炸式增长。
作者从数据的产生、存储、传输和处理四个角度,分析大数据形成的技术条件。
当然,大数据和机器智能,目前仍然存在很多问题。
获得足够量的、具有代表性的数据,远比我们想象的要难的多。大数据时代,怎么样收集到全集是一件很有挑战的事情。
收集的有价值的数据,是在无意之间完成的,因为刻意收集,会引起用户的警惕,从而影响数据的准确性和全面性。
数据收集的方法有很多,但好的办法一定能够保证数据的完备性和不变性。
一些公司已经敏锐地看到了数据的价值,另一些公司却拿着金饭碗在要饭。
在数据存储和数据表示方面,我们也面临着难题。
目前节约存储设备的技术体现在两方面:
第一类技术是存储同样的信息占用的空间小。
从信息论角度讲,就是要去除数据冗余,但是在去除数据冗余之时,相应的数据读写处理要做改变。比如邮件相同附件只保留一个,比如把图片从点阵变成向量。
第二类技术涉及数据安全,这里指的是数据不丢失、不损坏。
数据表示遇到的难题在于:当大数据的颗粒度增大时,索引的建立变得困难,随机访问也就相应困难。比如医疗行业、飞机设计制造行业等涉及数据的随机访问就很困难,他们的基本单元动辄几百上千兆。
大数据面临的另一个数据难题是,如何标准化数据格式,以便共享。
大数据提升计算能力常用的方式:并行计算,也远非增加机器那么简单。
首先,任何一个问题总有一种部分计算是无法并行的,这类计算占比越大,并行处理的效率越低。通常用“并行比例”来度量一个任务中有多少可以并行计算,有多少不能。
即使有5%计算不能并行,无论使用多少台服务器,实际加速也不会超过20倍。如果有50%不能并行,更是只能加速2倍。
另一个影响并行计算效率的因素在于,无法保证每个最小任务的计算量是相同的。最终的计算速度取决于最后完成的子任务。
前文提到,大数据的很多应用场景例如交通管理,要求具有“实时性”。而一些看似简单的操作,一到大数据头上就特别费时间。
要解决实时处理大数据的问题,需要从根本上改变系统设计和算法,需要开发很多新工具,而不是增加机器那么简单。
大数据能产生的效益在很大程度上取决于使用和挖掘数据的水平。
使用大数据第一步,是对数据的过滤和整理。在很多应用中,这一步也不容易做到,原因是噪声太多。在信息处理领域,用信息与噪声之比简称信噪比SNR,来度量信号质量。有时为了提高SNR需要做降噪,损失部分数据,提高信噪比。
接下来关键的一步就是机器学习。今天广泛使用的机器学习算法比如人工神经网络算法、最大熵模型、逻辑自回归等,40年前就已经成熟了。但机器学习一旦上了规模,实现起来不是容易的事。
机器学习是一个期望值最大化的过程:事先定一目标,这些算法就会不断优化模型,越来越接近。算法迭代次数越多,得到的模型效果越好。
但机器学习的算法复杂度通常太高,因此随之数据增加,用时会剧增。
Google在10年开发出名为Google Brain的深度学习工具。从机器学习理论讲并未做出突破,只是把过去的人工神经网络并行地实现了。
作者认为,机器学习的方法不可能由每家公司自己去研究,最终会由专业的公司为大众提供机器学习的服务。但这样会引发另一个问题——数据安全和隐私保护的问题。
数据安全有两层含义:首先是要保证用户的数据不损坏,第二是保证数据不会被盗用。
这里面很多时候,是人为失误造成的。
保护数据安全,科学家首先想到的是从系统上根本解决问题,但并非一朝一夕可以完成。现在的文件系统和操作系统和40年前没有本质差别。
另一种行之有效的方法,是利用大数据本身的特点,来保护大数据的信息安全。有公司利用大数据分析和机器学习,了解公司正常业务流程,发现并防止异常操作。
保护隐私需要新技术。
一类是从收集信息的一开始,就对数据进行一些预处理,但这仍不能限制大公司。
另一类保护隐私的技术是——“双向监视”。让侵犯隐私的人必须以自己的隐私来做交换。
六、未来智能化产业
关于大数据和机器智能影响下的未来产业,不同的人以不同的视角做过不同的分析,相信这一点大家都不陌生,在这里不展开过多介绍。
作者认为,无论哪一种新产业,都有共同点,即“智能化”和“精细化”。
介绍一个书中的例子,未来医疗。
今天人类在医疗保健的瓶颈在于三点:一是医疗成本越来越高;二是医疗资源不平衡;三是很多疾病治不好。
成本高的两个重要原因:一是药品的研制周期太长、费用太高;二是医务人员培养成本太高。
研制周期可以用大数据缩短,方法在前文中有介绍过,比如通过强关联性代替因果性。
而医务人员,也可以用机器人代替。
解决医疗资源短缺问题,可以使用机器医生智能问诊,因为机器医生能学习更多的知识和病例,并且准确性非常高。
很多疾病治不好,比如治疗癌症,有两个难点:一是不同人得了同一种癌症,其病变基因未必相同;二是癌细胞自我复制也会出错。
通过大数据治疗癌症,可以统计每一种癌症的特点特性,做到“穷举”。
甚至在延长寿命方面,找到衰老基因,同时修复我们身体细胞在复制时出错的基因,或许也是一条人类延年益寿的有效途径。
在其他产业,大数据同样会带来革命。
未来农业,举例以色列的农业技术,未来农业会更加智能和精细。
未来制造业,举例特斯拉,说明大数据时代,除了商品的设计和研发,剩下的环节要么高度智能化(比如仓储和物资管理),要么干脆被砍掉(比如批发行业)。
未来体育,举例NBA勇士队,利用数据制定战略;举例美国女排,利用大数据帮助体育训练。
未来记者、编辑,计算机从大量文本语料中学习写作,用一种被称为“语言模型”的概率模型将文字构造成优美的句子,再用另一个模型组成段落。
未来律师业,同机器医生一样的机器律师,拥有更详尽的材料、更多的案例,更加准确和高效。
智能时代的所有行业,都会被重塑。
七、智能革命和未来社会
智能革命下的未来社会,拥有和未来产业相同的特点:智能化和精细化。
智能化社会:比如通过大数据提高社会管理水平,帮助交通优化、反恐等。
精细化社会:追踪每一次交易,从标准化到个性化服务,无隐私的社会。
当然,智能革命下的未来社会,也会有新的社会问题。
我们先回顾一下第一次工业革命。可以把工业革命对社会的影响分成三个阶段:第一个阶段只有发明家和工厂主们受益,普通英国民众并没有受益;第二阶段是全体英国民众普遍受益,但是在世界范围内大家未必受益,这两个阶段时间之间相差半个多世纪;第三个阶段才是整个世界受益,这和第二个阶段又相差很长时间。
而第二次工业革命,上述模式又重复出现了。
到了第三次技术革命“信息革命”,从经济和科技发展看,以苏联为核心的东欧集团、超过10亿人的穆斯林地区、大部分欧洲国家、整个南美洲。他们虽然能够享受到信息革命的产品,却没有享受到信息革命带来的经济增长。
从全世界的范围看,消化掉信息革命的冲击波,或许还需要更长的时间。然而大数据和机器智能革命已经来敲门了。
技术革命使得很多产业消失,或者产业从业人口大量减少,释放出来的劳动力需要寻找出路。事实证明这个时间需要至少一代人以上,因为我们必须承认一个并不愿意承认的事实——被淘汰的产业从业人员,能够进入新行业中的其实非常少。
时至今日,各国政府已经认识到这些被产业淘汰的从业人员的重要性,意识到社会稳定的重要性,因此只能“养着”这些并不创造价值的人。有些国家比如日本和欧盟,把无所事事的人强制塞到公司里;而有些国家不肯淘汰过剩产能。
解决问题的途径都是一个“耗”字。耗上两代,社会问题就解决了。
智能革命对社会的冲击,可能超过过去几次技术革命。
首先,信息革命本身带来的影响还没有消化完。在美国将近一半的人是不上税甚至从政府拿补贴的。智能革命冲击力度将是双重叠加的结果。
其次,今天消化掉技术革命的影响要比工业革命时难得多。由于全球化,全世界已经没有空白的市场可以开拓了。
最后,也是最重要的一点,智能革命所要替代的是人类最值得自豪的部分——大脑。
同样要回答的问题:全球几十亿劳动力何去何从?
第一需要时间;第二需要新产业。
这部分被淘汰的劳动力面临着两条路:要么从事一份工资足够低的服务性工作,要么没有工作靠领取救济过活。
在智能时代,一定会有一小部分人参与智能机器的研发和制造,这是所谓的新行业。很多乐观主义者认为,将来一定会有新的行业适合人们工作,但这需要时间——半个世纪的时间。
其实,社会公平只能反应在机会平等上,而不是结果公平。2014年,美国收入在前1%的人贡献了美国45%的联邦税收。
人工智能在完成任务的时候,不知道自己在做什么。就像AlphaGo并不知道自己是在下棋。但控制人工智能的人,在某种程度上控制着世界。
看似免费的东西才是最贵的,因为我们在获得这些服务的同时交出了自己的自由。而只有当我们失去自由,利益受到损失时,才会体会到自由的可贵。
如何在智能革命中把握住这个时代,首先需要接受新的思维方式,同时需要利用好大数据和机器智能。按照吴军老师的一贯观点,争取进入这个时代前2%的行列。
突然想到之前看到的一个观点:现在的白领,和信息革命之前的工人是一样的,只不过——厂房变成了写字楼,产线变成了电脑,工服变成了西装,出卖体力变成了出卖脑力。
虽然片面,却引人深省。
进步的是我们的时代,而不是我们的“阶层”。