自己的博客维护起来越来越麻烦,简书也越来越好了,所以索性来一次老文搬家。因为是老文,聊的很多都是过去时的内容,感兴趣的可以凑合看看,下面这篇的原始日期是:2012/12/22
关于大数据工作的开展是技术驱动还是业务需求驱动的争论一直都有,其实现在看来这种争论没有太大意义,就像争论是唯物主义和唯心主义哪个好一样,它们各有千秋,各有自己的优缺点。如果非要说点什么,可以这样看:对于已经有明确商业价值模式的领域技术驱动的成分更浓,比如搜索、互联网广告、推荐系统等;而对于商业价值模式模糊,甚至根本没有意识到有商业价值点的场景,业务需求驱动的模式就更有用武之地,这个就好像是,一个业务人员找到公司的数据科学家,说“我的流失会员越来越多,你们数据侧可以帮到什么?”,他首先期望的是解决业务痛点,而不是那个技术或什么产品(当然,这些业务问题做到深处一定无法回避技术问题,但我们谈的是谁驱动的问题,不要捣乱)。
而且,有一点是可以达成共识的,你的大数据只是静静的躺在Hadoop集群里,而没有在某个领域(或场景、流程、产品)中发挥价值,是没有任何意义的,只是让地球更加不低碳而已。有人问,什么是价值?我说的当然是钱了,即要么能够直接变现,要么可以离变现更近一步,这都是价值。
说到如何让大数据变现,Precog的联合创始人John De提到了两块:数据驱动的流程(data-driven processes)和数据驱动的产品(data-driven products)。【来自36氪的文章没有数据驱动的流程和产品,你的大数据毫无价值】。
类似的思想以前也提到过,如果再说详细点,我认为发挥大数据价值的途径可以有三类:
1)、通过数据驱动流程的精细化、智能化
大数据对企业流程的优化已经可以渗透到几乎各个环节,诸如营销流程、会员管理流程、产品管理流程、人力资源优化等等都可以看到他们的身影。
你可以预测未来的销量,已更好的分配资源;你可以为商品找到潜在的喜好用户,以开展主动营销活动;你也可以细分既有用户的各种行为模式,以为产品的优化提供参考;你还可以看看什么员工更稳定、哪些员工会离职……
这些管理、运营流程的改进主要集中为两个词:【效率】、【效果】,驱动的源头便是在这个两个词的环节上出现了越来越严重的问题。
在这个环节中,数据挖掘应用建模者的需求会高一些。
2)、打造数据驱动的数据产品
当你要改造外部公司的流程时,或者自己内部频繁出现的某类流程优化过程,往往需要将大数据的价值整合起来,通过一款数据产品表现出去。比如,淘宝为卖家提供量子恒道产品,帮助卖家更好的经营自己的店铺;比如电商网站内部频繁出现的交叉销售需求,可以给予用户的行为数据打造个性化推荐系统。
根据各方参与度和界限的不同,数据产品可以有很多模式,最简单的,直接出售自己的数据;或者在自己数据的基础上“深加工”再出售;也可以购买多家的数据,自己整合后提供更优质的某种服务,提供诸如定向广告、广告效果监测等;或者不提供数据服务,只提供计算能力,比如类似百分点的推荐引擎;也可以众包模式采集数据,汇集后形成数据交易市场;
这一类别中,成熟的产品类型是搜索、推荐、计算广告,这三个方向更需要大数据技术专家,同时具备一定的商业观、产品观的人才;而此外,还有一些相对不成熟的或短期内没有形成强技术壁垒模式的产品类型,比如上面说的量子恒道、比如大量的第三方微博营销平台,不是说这些产品不需要高深的技术,而且在当前阶段,更需要的是满足客户的“温饱需求”,未来逐渐加重技术驱动的比重。
3)、打造数据驱动的服务产品
之所以把这一类单独提出,主要是这类产品的用户往往是C端,他们大都不会去考虑企业经营、流程层面的问题,而更关注产品的功能及体验。而这类产品和普通的互联网产品的区别在于是否是大数据技术密集型产品,还是人力密集型的产品。
举个例子,要打造一款餐饮服务产品,用传统的“扫街”或积累用户评价的模式就显得人力密集一点;而如果基于用户在特定网站的浏览轨迹进行内容挖掘,进而得到用户的餐饮相关标签(口味、位置、消费力),基于此推出餐饮服务产品则更像我们说的数据驱动的服务产品。
再比如传统门户模式 vs 个性化阅读模式也是类似;包括第二类中的个性化推荐模式,从用户侧看也可以视为数据驱动的服务产品。或许,未来的所有服务产品都会是大数据驱动的,但目前来看还有很长的路要走。
作者:老读悟,微信公众号:laoduwu666