近几个月工作繁杂,疲于应对,少有反思。周末闲暇,有时间静下心来思考,花上一天复盘,希望能对接下来的工作带来启发。
复盘提纲
- 互联网保险场景下的业务特点
- 互联网保险场景下的数据价值
- 以上方法论下的数据产品
- 未来一年的三个课题:数据-算法-业务三角、增强分析和5G
一、互联网保险场景下的业务特点
什么是互联网保险?加入了互联网三个字,让保险有什么不同?互联网对保险的意义不只是多了一个卖保险的渠道,互联网给保险带来了彻底的业务模式的改变,我对这种改变理解是四个字,小额高频。投保人可以随时随地对生活中的一次风险快速投保。比如我计划了一次出行,但因各种原因,改变行程的风险非常高,酒店房源紧张,我又不得不现在就订下这不可退订的房间,这时我就可以投保无理由取消险,一旦遇到行程改变,我可以在几分钟内完成理赔,几小时内得到赔偿,降低改变行程带来的损失。同样,一次淘宝退货,一次航班延误,或是一次滴滴出行意外伤害,我们都可以进行投保。这些保单的保费低廉,从几块钱到几十块不等,但却非常高频。相对于传统保险中平均一个人一生只有几张保单的情况,在互联网保险,一个人一个月可能就有几张保单。
这种业务模式的改变对保险公司带来了全面的挑战和机遇,例如,传统保险公司的核心系统无法应对高频业务带来的系统高并发,双十一,一天之内就会涌入上亿的保单,传统的核心系统在这种并发压力下很快会宕机。或是,高频的业务带来了海量的数据,传统数据处理架构在分析这种体量的数据时有心无力,即使能分析,计算时间也需要以小时甚至以天为单位。可是高频业务又对数据处理提出了极高的时间要求。业务以秒为单位,那数据处理就要以秒,甚至以毫秒为单位。一次双十一或是618活动,运营人员不可能到第二天才去看ROI,他们要看的是当下的情况,等不了慢吞吞的T+1结果。
二. 互联网保险场景下的数据价值
前面探讨了互联网给让保险带来的改变。那加入了互联网三个字,让数据有了什么不同?我对这种改变的理解是,对于用户行为的洞察。简单分类下,互联网让数据分为两种,业务数据和用户行为数据。传统保险公司处理的都是业务数据,业务数据描述的是结果,比如保费总计是多少,边际成本率是多少。而用户行为数据描述过程,投保人是一个怎样的人?他/她为什么要进行这次投保?他/她的投保体验如何?只有业务数据,那我们只能知其然而不知所以然,但互联网让我们可以得到用户行为数据,一方面我们可以知道是怎样的过程导致了现在的结果,另一方面,我们可以对用户进行画像,了解我们的用户,知道用户的需求,从而投其所好。
那互联网保险小额高频场景下,有了大量的业务数据和海量的用户行为数据,这给保险带来了哪些机遇和挑战?
先说机遇,就如前面所说,因为有了大量的用户行为数据,这让保险公司有可能深入的了解用户,设想现通过用户行为数据判断一位用户的画像为,30岁,男性,已婚,未育,有房,有车,那这时候推荐准妈妈备孕险和车险的话,用户投保的概率就相对高。
而有了用户行为数据也让一些新的险种成为了可能。例如UBI车险,传统的车险在计算保费时考虑的维度较粗,只取了车品牌,车年限,地域等描述群体的维度,但随着汽车的信息化和网络化程度越来越高,个人驾驶行为数据也可以被收集并参与保费计算。一个人急转急刹等危险驾驶情况较多,那保费相对高,另一个人驾驶习惯良好,那保费就可以少很多。这种基于用户行为数据的险种既可以降低用户的保费,也可以降低赔付的风险,相信会是互联网保险的一种趋势。
跟随机遇而来的是挑战。因为小额高频,所以要求业务处理速度高并且处理成本低。这决定了传统中很多由人工完成的环节需要借由数据和算法进行自动化和智能化。数据应用,也不再是初级的统计报表,数据应用必须被深度融合进业务流程,做到数据驱动决策,甚至数据直接驱动业务。
把统计报表与数据驱动决策做一个对比。传统保险公司做统计报表,是事后总结,按天、周、月、季度、年统计出各项指标,然后把指标组成的报表分发给各职能岗位,由人通过经验分析数据背后的现象,然后做出决策。从数据到决策的周期,最短也要几天。几天过去,可能市场环境已经发生变化,之前的决策已经失效,这种滞后的决策很可能导致失败的结果。但数据驱动决策是在需要作出决策时,可以实时的查看当前的业务数据,甚至看到的不只是报表,一些初步的结论也已经被数据应用呈现出来。如果更近一步,在需要人员作出决策前,数据应用已经把相关的提醒或是警告发送给相应人员,帮助人更快的对市场作出反应。
数据驱动业务,举一个例子,核保核赔的材料审核,无法单纯靠人工在短时间内完成以万为数量单位的材料审核。有了OCR和PS识别等图像模型,可以由模型来辅助审核材料,低风险材料直接通过,只有高风险材料才会被发至人工复审,大大提高业务效率。再举一个碎屏险的例子,如果没有碎屏的图像识别模型,单靠人工去识别每一个碎屏,那人力的投入可能让这个险种的成本高到失去商业价值。由模型来进行碎屏识别,边际成本几乎为零,数据、模型直接驱动业务,代替重复性人力劳动,是未来的方向。
三. 以上方法论下的数据产品
作为一个数据产品经理,单纯的方法论是不够的,必须有能力将方法论转化为落地产品。
针对公司当前的数据发展现状,我们团队正在构建一个数据智能平台,目标是提供一个一站式的数据价值挖掘平台,为公司的数据分析师和算法工程师提供平台性分析型数据产品支持。
数据智能平台包含四大组件,由下至上分别是数据流水线、数据洞察引擎、数据可视化平台和机器学习平台。数据流水线用于数据的连接、同步及ETL。数据洞察引擎用于大数据加速分析。可视化平台和机器学习平台让数据分析师和算法工程师在尽可能少的工程工作下可以快速完成分析结论和模型的交付、迭代。
那在工作中,数据分析师和算法工程师是怎样利用数据智能平台挖掘数据的价值?接下来我们就用一个数据分析师小A的用户故事来说明我们的产品流程。
近期互联网保险直营平台的用户增长率迅猛,可是ROI却降低了,随着获客成本越来越高,老板大为光火,令小A尽快分析广告投放渠道,找到ROI降低的原因,并提出提高ROI方案。
为了完成这项任务,小A在我们的数据智能平台上做了四步工作。
- 数据清理:小A拿到的数据都是存储在ES中的日志。首先,他连接ES并初步观察数据,了解数据特征后,提取关键维度。然后他根据关键维度建立ETL任务,清洗并结构化Raw Data,最终将数据存储在Hive表中。
- 数据建模:Hive的Map Reduce实在慢的令人发指,所以小A利用Kylin对数据进行建模,Kylin会对数据进行预计算,让接下来的分析做到秒级响应。
- 数据分析:在Kylin中建模完成后,小A就可以使用可视化分析页面,拖拽各个维度,展开其分析思路,很快,他发现几处无效投放渠道。
- 可视化:发现原因后,小A马上将他的分析思路固化为广告投放分析Dashboard,报表中实时呈现广告投放数据,下次老板要看广告投放渠道表现,不需要再重复上面的分析过程,只需点击几次筛选器或是对图表进行下钻,就可以得到他想要的数据。
四. 未来一年的三个课题:数据-算法-业务三角、增强分析和5G
- 数据-算法-业务三角:互联网本质是数据流动的桥梁,而算法,是数据与业务之间的门户。数据通过算法,将价值体现到业务中,而业务产生更多的数据,通过互联网,再回流到算法,进行形成闭环。在这样的闭环中,数据既是高速流动的介质,又持续增值;算法既是推动闭环转动的引擎,又持续进化;业务既是闭环的载体,又持续产生数据。未来一年,思考怎样让这个三角更快的转动起来,是我必做的课题。
- 增强分析:Google倡导数据民主化多年,一直没有做到真正的落地,数据还是被那些有着专业数据技能的数据精英们控制,想从数据得到结论,还是不得不借助数据科学家们的帮助,当下的数据操作门槛还是相对较高。但是增强分析可能改变这种情况,通过自然语言发问,直接得到结论,看起来很美好。怎样将增强分析在数据智能平台中和业务结合,以怎样的路径实现,未来一年需深入思考体会。
- 5G:2020年5G商用,任何一次基础设施的升级都会带来全方面的社会效率提升,5G不单是移动网络网速更快,就如4G让移动化成为了可能,而移动互联网奠定了腾讯与阿里的双极地位,带走了没赶上车的百度。在未来几年内,可预见5G会带来车联网和物联网的数据爆炸,而数据处理架构也必须面对更大的数据体量和更快的处理要求。保险行业,如何在5G下调整自己的业务,这对于数据产品经理,是非常有趣的一个课题。