大数据的几个常见误区

这几年有关大数据的话题非常的火,不但是研讨会、培训、微信圈的热门主题,出版行业发行和大数据有关的书也成了销量的保证。由于关注者众,“大数据”变成了流行用语,白领们开口闭口不提几句大数据好像跟不上时代潮流,会显得自己落伍了,而任何事情只要套上了大数据,或是沾到边,瞬间就高大上起来。但是等等,你确定你真的在玩大数据吗?


数据大不等于大数据

大数据最大的迷思在“大”。许多人以为自己公司拥有的会员或是客户数量多,就是在玩大数据,然后老板就夸下海口说未来要成为一家大数据驱动的公司。但是数据大真的不等于大数据,因为这些海量的数据内容通常不过是姓名、地址、电话、电邮、交易记录、性别等传统的、可结构化的资料,从这些数据里面你能用来分析的技术或用法,就是传统的数据分析,一样都是从人口变数(例如性别、年龄、居住地、学历等等)起始去下条件,然后去分析数据。比如,用年龄层去做分析,找出消费公司产品的各个年龄带的分布,进而看哪个年龄带的业绩贡献度较高;或是用地域别,找出消费公司产品的地理分布,看看哪些城市或是省份卖的较好……你说我分析的样本数高达数百万人耶,但是拜托,这真的不叫大数据。


大量数据本身并不会为企业带来价值

大数据的另一个迷思在“贪多”,想尽种种方式去收集消费者的各种结构性、半结构性或其他你能想到的各种信息,但是你在收集数据之前有没有一套数据政策,收集海量数据的目的是什么?收集之后要用做什么?如果不厘清楚,那么就会像蚂蚁把食物携回蚁穴储藏一样,一直堆栈在那里;但公司可是花费了庞大的软硬件投入及后续持续支出的管理成本,储存了海量但是绝大部分将来用不到的各类数据,这是企业资源的严重浪费,而当真想要提炼有用数据的时候,过于庞大的数据反而会形成“噪音”干扰。

拥有大量数据本身并不会为企业增加价值。收集来的数据必须将来能使用的上,否则数量再巨大,内容再多元,它对企业的价值也不会比资源回收场的垃圾更佳。所以,再强调一次,企业必须要有看待数据的清晰政策,而不是人云亦云的也来搞个大数据追时髦。有了清晰的政策,才会知道在收集目标消费者点点滴滴信息时的漫长过程中,什么是必要的,什么是可以暂存的,什么是可以删除的。观念对了,才能驾驭大数据为你创造价值,而不是面对庞大的数据茫茫然不知从何下手。

大数据是一种面对数据的较新观念,不管是在搜集层面、处理层面还是对结果看待的态度,所以只要符合这种观念,即便你的会员或顾客只有几千人或几万人,一样可以玩大数据,关于这一点以后有时间再另文详述。


在规划大数据前,先想一想投入产出比

如果你收集了海量数据,有消费者的个人信息记录、交易记录、手机上网的网页浏览记录、微博上的po文及关注的记录、LBS的所有记录、在公共场合使用免费wifi上网的记录,在亚马逊、京东商城、当当等多家电商的购买记录……OK,这个数据量够大,而且够多元,够复杂,但如果你公司没有足够的能力去分析这些数据,并把分析的结果用起来,那么,我们只能称贵公司拥有大“量”数据,而不是在运营“大数据”。

有没有能力分析是一种限制因素,但也并非斥巨资让公司有大数据的收集、管理及分析能力就OK了,还要看贵公司做这件事情有没有意义。这回到之前谈的,你的数据政策,你的why(为何收集),而不是How(如何收集)。兹假设几个场景及在这些场景下我的个人见解:

场景一:某家公司卖手机配件,主要渠道在门店,他们需要大数据的收集及分析方式吗?哪款手机的配件好卖,看传统的报表就知道了,配件有不同的设计风格,或是颜色,这也可以从日常销售报表看出其在消费者心目中的接受度,更何况设计这种东西通常是在最上游就决定好了,下游店家凭经验及过去的销售报表作为采购的判断就很稳妥了,不致于常常误判造成资金变库存,因此,需要折腾大数据吗?

场景二:某家公司透过电子商务卖学龄前的儿童玩具,好,他们需要LBS的信息吗?需要在公共场所使用wifi的信息吗?如果他们只是一个区域经销商,就算他们用大数据分析出了某些关连性,进而发现某种趋势可能会发生,但是他们的采购量不足以让工厂为他们量身订做可能会大卖的商品,或是商品的零售价太低,即便热销,整体营收跟在大数据上的投入根本不成正比,那么大数据对这家公司的意义是什么?

场景三:某连锁现做饮料品牌在全国有3千家门店,以卖珍珠奶茶,泡沫红茶及现榨果汁为主力,每家门店的空间大约在15平米左右。且让我模拟个夸张一点的情况:如果说他们透过大数据分析得出麻辣锅汤底会是非常抢手好卖的品相,他们能遵从数据分析的结果,在3千家的街边店卖麻辣锅汤底吗?如果从各种多元、庞大的数据分析出来说果汁及冻茶饮会是最好销的,这更是废话了,用了严谨的研究方法及庞大的信息收集与处理成本,却得到一个常识(common sence)。

举这几个假设的例子,也许有些极端或夸张,但我意在说明,不是每家企业都需要大数据,要看用不用的上,就算用的上还要衡量投入产出是否符合经济效益。所以公司必须清楚自己为什么需要大数据?有没有其他替代方式,比如是不是把传统数据分析做好做透,就可以达到数据为企业提供决策参考的目的呢。


关注数据的“相关性”,而非寻找因果证据

笔者企业界的朋友说他们在玩大数据,但在我问了几个问题之后,我就知道他们根本不是在用大数据的观念,所以根本就不是大数据的运用。我为什么这么武断?因为,这些公司分析数据的目的是想找出为什么某样产品卖的好?是谁在购买?他们的购买频率如何?这些抱着目的性的探索是传统数据分析的想法,它可能提供一个因果关系的解答,但是,更多可能是分析者已经带着预设立场,只是想验证是否如此而已。这种处理数据的态度根本不会提升企业的视野,带来“洞见”(Insight)。

大数据的特色之一是找出相关性,在样本等于母体的情况下,去提炼出一个预测性的分析结果,这是很大的一个突破,改变了人类多年来探索世界的方式,因为对分析结果没有预存立场,所以往往会产生很多想像不到的价值,这些价值能帮助企业看到别人看不到的商机,或是不断调整自己的市场战略战术,让对手望尘莫及。在数据分析案例里面很有名的啤酒加尿布故事,以及塔吉特超市预测客人怀孕了的故事,都是很经典的大数据分析思维,从众多不相干的信息里找出关连性,进而挖掘出有用的商机。这两个经典案例我不多做介绍,百度一下就有了,我想说的是如果当初分析人员是带着某种假设来面对超市的原始数据,他们就不会发现或是挖掘出这些倾向或是细节,也就不会改变商品陈列的组合方式或是设计出对企业更有利的采购动线。


后记

大数据时代带来的巨大影响,对厂商、对个人、对国家、对社会还没真正充分的展现出来,但是我们已经可以感受到它在我们生活中的作用以及带来的变化。在这个萌芽阶段百家争鸣是很正常的事情,但是也容易被一些人打着大数据的旗号去忽悠敛财,企业的决策者最好先读几本大数据方面的经典书籍,培养自己对于大数据的正确认知,才不会“为了大数据而大数据”,或是以为在做大数据但其实还是传统数据分析的事情。

因为篇幅的关系,有很多想法无法阐述清楚,我的领域是Direct Marketing;从事过邮购、电话销售、电商、电视购物等工作,这些公司都是高度靠数据驱动生意的行业,所以多年来从工作中积累了一些数据运用的经验与体会,也因为职业的关系,一直关注与数据相关的各种信息或是演变,但我万万不敢称自己是大数据专家,所以在文章中有说的不清楚,甚至观念不对的地方,欢迎各界先进予以指教,感谢。


本文作者蒋博文,文章首发于咨询家,观点仅代表作者个人,不代表咨询家立场;如需转载请注明作者姓名以及 “来源:咨询家(微信号:zixunj)”

前往咨询家微信,回复“蒋博文”,可查看作者信息。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 206,311评论 6 481
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 88,339评论 2 382
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 152,671评论 0 342
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 55,252评论 1 279
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 64,253评论 5 371
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,031评论 1 285
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,340评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,973评论 0 259
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 43,466评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,937评论 2 323
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,039评论 1 333
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,701评论 4 323
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,254评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,259评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,485评论 1 262
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,497评论 2 354
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,786评论 2 345

推荐阅读更多精彩内容