我一直在思考,AI的热潮到底能持续多久?为什么现在她如此热,到底极限在哪里?
AI本次的热潮是从06年深度学习问世并且证明自己开始在某个特定领域打败一切其他对手开始(图像识别与分类)。
那么为什么深度学习让大家这么兴奋?
内在原因来看,我们发现她做的比传统方法好,而且也比传统方法成本更低。
从成本来看:以前某个任务需要 3 个工程师从清洗数据、找特征、构建模型、训练与应用,这些都跑完一个流程,需要3个月。这还不算找特征、构建模型这些工作需要很强的行业领域知识与工程经验。总共消耗了9个人月。
而深度学习所做的就是,现在只需要一个工程师,清洗数据、构建模型、训练与应用,可能只需要一个月,总共1个人月。
为什么?首先深度学习降低了找特征的成本,甚至可以说在某些时候可以把这个过程忽略,在以前这个过程本身可能就需要3~5个人月的反复工程实验。而清洗数据也更快了,因为深度学习的鲁棒性更好(rubust),尤其是针对大数据的鲁棒性(百万条数据)。如果放在2、3年前,深度学习的训练与应用所需要的时间成本也不低,可是现在无论是各种框架(Torch,Keras,TensorFlow)也好,还是各种工程经验也好,都更加充足了,使得时间成本越来越低。
从外在原因来看,深度学习遇到了两个机遇:1、GPU(显卡)速度很快,并且深度学习可利用,极大的降低了工程实验成本;2、互联网数据获取越来越容易,数据量越来越大(传统方法很难处理一些领域的大数据)。
你需要知道的:
- 深度学习不是万能药,她可能不会、至少短期不会在所有领域上大放异彩
- 深度学习同样需要领域知识,处理文本和处理图像的模型可以类似,但是细微差别就可能导致极大的不同,而找到最合适的模型需要工程师本身就有很强的经验
- 深度学习并不昂贵,并且成本越来越低,前提是你知道你想要什么
- 深度学习需要其他各种知识与能力的配合,例如处理文本依然需要正则表达式,处理图像与视频,依然需要大量的相关知识
- 深度学习是机器学习 + 大量的技巧与经验,深度学习实际并没有超出机器学习范畴,各种传统的测试、验证方法必须要有;传统的聚类、分类、强化、回归模型经验也要有;除此之外,还需要熟悉深度学习的各种训练技巧
你可能想尝试的:
- 把问题总结好,寻找可能建模的点
- 假设你拥有一些数据,人可以通过这些数据得出结论,深度学习可能也可以并且成本更低;假设你没有数据,或者人也无法仅仅从这些数据得到结论,那么深度学习很可能也无能为力
- 深度学习可能是一种低成本的尝试点,不要太高估她,不过至少你觉得有一点点可能性,最好咨询相关专家,成本可能没有你想象的那么高