计算机视觉应用日趋成熟,但依然处于一个时代生命周期的中前段,意味着CV可以在某些商用和业务领域能够展示出令人惊奇的结果,但其改变的效率还没有达到规模化使用和扩展的预期。
总结2020年CV落地的几个方向:
- 人脸识别:校验、属性提取,比如Facebook、支付宝、公安卡口;
- 图像检索:比如Google Images,图像特征的相似度比对,最终结合偏好策略进行关联图片的推荐;
- 控制与跟踪:游戏界、短视频领域运用最多,在实体商业领域的运用有人体骨骼跟踪、头肩跟踪、行为识别。
- 监测:尤指无人监测或者远程监测,业务应用的初衷是代替人眼对某事物进行监察。诸如高空作业、极寒地带等不利于人直接/长期监测,CV可以帮助组织或机构相对及时的获得问题讯息,再结合自动化方案或者其他多种方案来解决问题。
- 综合运用上述四点的一个领域是机器人,比如波士顿动力公司、中国兵工集团的高性能机器人,这个机器人对CV的要求会更综合,机器眼是机器人认知世界的一个重要方式,如果可以与这类公司擅长的动力学、材料学一同发挥价值,我相信其在军工产业和基建产业上可以率先得到优质口碑。
CV技术解决业务问题有两个入手点:
- CV解决效率。
不论是时间、人力、资金、地理范围的哪一个角度,或者不论帮助企业降低成本还是提高利润,CV是可以做的到的。例如:公安卡口的安防降低了人力筛查成本,; - CV辅助数据分析。
单纯说CV大数据分析范围是很广的,技术的形成就依赖大数据;所以数据分析领域必然要迈过两道坎:
1)大数据分析有前提:也就是以什么准确度来做标杆,当CV产出的数据可以达到标杆的时候,展开业务分析才有价值,反之可能是劳民伤财;
2)在标杆满足的前提下,有足够优秀的业务人员梳理知识,让数据具备指导意义。随着日积月累,这一类无形资产可以有形化,并且能够成为大数据产品的核心推动力。
2020年遇到的核心问题:
- 工程类
CV对光照、色彩、物品遮挡有明确的识别界限。现如今CV所看到边界和人的水平大致趋近,微距/远距下看得比人类清,网电部署不构成问题。所以,如何在原有结构找到合适的点位,尽可能规避识别死角,让相机清晰拍摄到绝大多数的目标是一个挑战。 - 设备类
摄像头硬件发展很成熟,对外接口或输出格式有规范定义,很多平台提供费用合理的物联网服务。但与多数客户对接方案时都免不了设备利旧。利旧的难点不仅仅是工程上的问题,还会收到设备的成像质量较差影响后期数据解析的结果。客户出于装修改造、前后成本付出等考量,产品推荐的新方案很可能会以失败或退而求其次告终。虽然新硬件的费用一般出在羊身上,但如果整体报价提高后,就会让客户产生较高期待的错误认识。若效果没有达到,客户内心中会否认产品价值(这时候的问题一般属于社会学问题了,还不是纯粹的技术或业务问题)。 - 数据准确性以及边界认知
这个问题应该是所有人工智能公司都会遇到的令人痛苦的事情了吧。
1)从全局上看,很多技术为主的公司会过于沉浸在技术的屌酷炫上,实现了一些看起来确实牛逼的东西,但这个东西买不好价钱。我对这类情况的解读就是技术过于技术不考虑市场以及业务,业务过于盲目没有自己的追求,不够强硬和执着(两者反过来的公司也不少)。
2)从业务/市场/产品类的员工对技术过程、数据输出存在一定误解。由于不同工种下知识模型不一样,有些误解不容易解释通,双方保难以同频。我作为产品经理算是中间的环节,但也需要有一定的技术理解,不然就很难承上启下;
3)工程实现类的开发者一般不太考虑业务理解,需求怎么说他就怎么做。某种意义也没有错,但我认为理解业务后再开发代码,你的代码才是最好的,遇到了问题才会形成技术自己的祭奠。如果遇到这一类的开发者,你就需要考虑的比较细致,甚至你要从实现的角度去考虑产品方案。
4)算法模型类的开发者一般都喜欢强调边界(至少在我所在的公司是)。而且产品经理需要推着算法工程师向前走。我猜测可能他们偏向底层,离业务端远,而且有时候过多的业务信息对数据模型的迭代反而起到了干扰作用吧。当然咯,如果是在算法层卡住,这个问题不会很简单,可以理解。但是回过头来,产品经理在尝试让算法想期望的方向发展时,势必要解释清楚场景里遇到的问题,以及每个问题在场景中的重要程度以及优先程度,不然输出模型不符合业务目的,搞半天的寂寞。
2020年度,上述问题综合了行政、公司基因与构成、个人经历等等原因,没有办法完美解决的方法。
但如果由于种种的行业或技术的天花板原因造成业务数据存在问题,怎么办呢?
- 对于人和流程,既然改变不了,那就换成尝试引导
-
对于模型输出的数据不能符合预期时,需要产品经理通过功能设计、逻辑编排,将算法结果变得可解释。但这不是让我们将数据以某种方式进行加工计算,变得看似符合了经验预期(这是自欺欺人的做法),我们需要让数据变成它原本的样子(尊重模型受边界而产生一系列偏差),而让不是数据变得和我们内心想的差不多(不可以因模型数据偏差而人为让数据偏向经验,你又怎么知道经验是错误的呢,这是不理性的)。