本文为吴军《智能时代》解读版学习笔记。
1. 大数据的特点
信息的层级:
- 数据:网上的所有记录都是数据;
- 信息:数据的系统整理;
- 知识:信息的简洁抽象
大数据的三个特征:
- 体量大
- 多维性
- 完备性
机器的学习方式和人类不同,机器的只能取决与数据量,在互联网数据量 不断增长的大背景下,机器的智能必然不断增长。
以谷歌无人驾驶汽车为例,其驾驶的方式与人类不同:并非人类的即时决策,而是预先输入道路上可能出现的所有路况,根据扫描的情况匹配,做出反应。
2. 人工智能与大数据
2.1 机械思维与确定因果
机械思维认为世界上的所有事物都有确定的因果关系:
- 确定性
- 因果关系
机械思维的成果:
- 基础科学定律:牛顿三定律,焦耳定律,电磁定律;
用极简的数学公式描绘了普适性的物理学原理。 - 现代医学:针对病原体用药;
机械思维的极端情况为决定论,如拉普拉斯妖的描述:
如果一位智者知道宇宙中每个原子确切的位置和动量,能够使用牛顿定律来展现宇宙事件的整个过程,过去以及未来。
换句话说,在机械思维的框架下,如果已知基本的物理规律,如果确知当前事物的一切状态,理论上可以预见未来的所有过程。
然而机械思维的局限性正在于此:
- 不确定性
现实的事物存在很多不确定性,以最简单的掷筛子为例,要想通过物理计算确定筛子的点数需要:形状、质量分布、出手的力量和角速度、桌子的弹性参数等等。这一系列的信息实际难以获得。 - 测不准原理
海森堡不确定性原理陈述如下:
你不可能同时知道一个粒子的位置和它的速度.
用海森堡自己的话说:“在因果律的陈述中,即‘若确切地知道现在,就能预见未来’,所错误的并不是结论,而是前提。我们不能知道现在的所有细节,是一种原则性的事情。”
2.2 大数据思维
由于无法确知状态的局限,机械思维处理实际问题的效率并不高。大数据思维在两个方面补充了机械思维的不足:
- 引入信息,消除不确定性
- 强关联性取代因果关系
在控制影响因素的实验室状态,可以验证少数因素之间的因果关系,如牛顿三定律。而社会、经济等问题无法构建可重复的科学实验条件,无法直接建立因果关系。但可以通过数据统计,发现强关联性。
强关联性取代因果关系的优势在于:
- 强关联性研究现实可行
如需研究烟草有害健康,影响肺癌的因素众多,无法建立吸烟引起肺癌的直接因果关系。但可以通过大样本统计,获得两者的强关联性。美国的法院据此判决了烟草公司败诉。 - 经济效率高
按照因果关系研发新药,时间周期长,投入巨大。但若采用大数据方法,先发现药物与疗效之间的强关联性,再重点验证,则经济效益大大提高。
2.3 产业的变革
传统产业 + 人工智能 = 新的产业
经典案例:
- 金州勇士队崛起
弱队引入大数据分析,针对性训练,获得NBA总冠军。 - 大数据算法确定乳腺癌细胞位置
准确率超过医生。
大数据思维并不是机械思维的对立,而是补充。两者的结合是只能时代的方法论
3. 人工智能的弊端
大数据的广泛应用,有利有弊:
3.1 隐私消失
大数据时代,个人隐私消失。矛盾在于,如果你要享受大数据带来的服务,必然要暴露自己的部分隐私,如网上的购物习惯、社交关系等等。商人可能利用大数据牟利:
- 奸商可能对特定群体推送假货;
- 航空公司对票价不敏感人群抬价;
3.2 贫富差距增大
在大量的传统工作岗位上,机器可以比人做的更好,相应的职位很可能被人工智能取代:
而善于利用人工智能的少数群体财富增加更快,如知乎某贴:
世界不可逆转地在向高人均产出发展。whatsapp五十几号人做到190亿刀,特斯拉十万级的产能工厂里也没几个人,spaceX一年几十亿刀的订单也就一千来人。
贫富差距只会越来越大。
4. 面对人工智能
面对人工智能的理性心态:
- 拥抱新技术,驾驭新工具;
- 跟上时代步伐,争当2%少数人;
人工智能取代人的重复性工作,带来生产力的进一步解放。
5. 启示
人工智能对传统的工程设计行业可能带来什么改变呢?以下是笔者的若干思考。
5.1 工程设计工作是否可能被人工智能取代?
吴宝鑫曰:
是否给人工智能喂1000万套图纸,1000万种工况,就能自动完成工程设计呢?
现在看来没有必要,人工智能对机械思维的补充在于强关联性和不确定性。
- 工程设计的基础是宏观力学,设计参数与工况参数显式因果对应,没有强关联性的需求。
- 工程设计的问题总体是确定,较少存在不确定的困扰。
更大的问题在与工程设计建设尚未实现信息化,换句话说,一套图纸并不是基本的数据形式(文本、数字、图片等),也就是没有大量的数据基础。目前的BIM(建筑信息模型)发展非常关键,工程的设计和建设实现了高度的信息化,未来才有可能利用大数据技术产业升级。
工程行业更需要的是:
- 信息化(BIM)
- 自动化
程序取代人工的重复工作。
5.2 基础设施的检测和监测是人工智能用武之地
在中国大量的基础设施(公路、铁路、桥梁、建筑、综合管廊)在建成后,需要安全监测和养护。这些工作的基础是获取结构的运行状态,由运行状态推定安全状态是理论上的反问题,很难用解析的形式确定。
与此同时,基础设施的监测产生大量的海量的数据,人工处理无法完成,必须借助计算机技术。目前,哈尔滨工业大学的防灾减灾研究组,已经开展了基于大数据的健康监测技术研究。某创业公司以基于人工智能的桥梁安全评定为发展业务。
可以预见,在土木建筑产业,基础设置的监测(检测)将首先进入大数据时代。让我们拭目以待吧。
本文用时 1 h。