如何对抗BAT数据霸权?

咱不急,先来撩开“BAT数据霸权”的面纱。

关于大数据,有一个传奇故事:美国“创投教父”彼得·蒂尔创立的Palantir公司,通过大数据分析,帮助美国政府抓住了本·拉登。

对此,有人拍手叫好,有人惊叹莫名,而我,在好奇之外,细思极恐:大数据已经越来越成为一种壁垒极高的资产,如果不采取措施,数据就会被BAT等大公司垄断,小公司根本没有出路。

BAT数据霸权已经兵临城下


据2016腾讯智慧峰会披露的数据显示,全网日均产生的可记录数据规模高达18万亿GB。这使得近年来数字数据的数量每3年多就会翻一番。

在全网大数据面前,BAT的数据当然是沧海一粟。但我说它们有形成数据霸权的嫌疑,并不是指他们的数据量大得惊人(当然,他们相比其他公司来说,数据量是遥遥领先的),而是他们的数据实在太有价值。

未来大数据的核心叫“社会化大数据”,人和人的关系、人和数据的关系都要用数据关联和呈现。而BAT三家公司,牢牢把持着互联网搜索、社交以及电商的入口,并且利用巨量的产业资本,将触角四处延伸,聚起了一座座“大数据金矿”。

从数据类型看,腾讯数据最为全面,这与其互联网业务全面相关,其最大的特点是基于社交的各种用户行为和娱乐数据。阿里最为突出的是电商数据,其数据最大特点是从浏览到支付形成的用户漏斗式转化数据。百度的数据以用户搜索的关键词、爬虫抓取的网页、图片和视频数据为主,其特点是通过搜索关键词更直接反映用户兴趣和需求,以非结构化数据更多。

它们所积累的大数据已成为一种底层资产,是帮助它们不断开疆拓土的“骁兵悍将”。百度利用其在搜索领域积累的大数据,现已重点转型研究人工智能,并且做到了国内领先,比肩Google、Facebook、微软等国际巨头。阿里已经通过其电商数据中的交易、信用、SNS等多种数据来决定是否可以发放贷款以及放贷的额度。腾讯的大数据目前更多的是为腾讯企业内部运营服务。

现在,BAT早已知道数据里有金子,因此会采取相对封闭的办法。即使今天不能完全发挥大数据的价值,但守着金矿,不许别人来挖。

这种做法会阻碍行业发展,最优秀的专家未必有机会获得数据进行分析处理。海银资本创始合伙人王煜全老师曾在《数据究竟是资源还是壁垒?》一文中提到一个有趣的故事:美国著名企业家、发明家、《奇点临近》作者库兹韦尔,为了利用谷歌公司的数据研究人工智能,不得不加入谷歌公司。由此可见,数据已成许多公司的核心资产,得到数据的唯一办法就是加盟BAT这类公司。


毫无疑问,拥有大数据的BAT对用户的理解要比其竞争对手深刻许多,容易形成数据霸权。未来,数据垄断的问题会更加严重。

怎么办?

重新焕发“沉默的大多数”

在此背景下,有人提出了三点应对措施:

1.鼓励开发垄断数据之外的数据源,发掘许多“沉默的”数据的价值;

2.培养更多从事数据收集工作的专业人士;

3.每一家公司都应该进一步深入思考目前掌握的数据的作用。

在这三点措施中,第一点是至关重要的,它就像一块石子,投进湖中,涟漪会扩散到第二第三点。在采集数据源这一块,挚金资本投过的八爪鱼无疑是行业翘楚,但在发掘数据价值方面,不得不提快播原人工智能团队创立的一面数据(好了,终于来了)。


一面数据是一家从事数据沉淀、处理、整合、理解,以及可视化工作的公司,也就是说,他们不仅做数据采集,也做数据洞察分析。一面数据CEO任栋霓曾就职于快播平台架构组,从事图像/人脸识别和搜索技术的研究与产品化。他在接受采访时表示,两年前,快播陨落,因不忍看着兄弟东奔西走,他们人工智能部门20多号程序员打算另拉起一支队伍,成立了一面数据。


他们的办公地从30层的大厦搬到6层的小楼,就在一处工业区改造的厂房。近期Pre-A轮融资后,铅笔道曾采访过他们,文中有一处细节让人心感唏嘘。“走出小楼宽敞的货梯,任栋霓站在狭窄的走廊里,眼前没有装潢华丽的会议室、休息室,只有一间间小隔断,里面横着几条电脑桌。”任栋霓说:“突然从一个大公司的程序员,角色转化为创业公司,蛮不适应的。”

一面数据最初是给基金做数据分析,因为基金的支付能力很强,但它的市场容量很小,且很多需求是非标的。

在初期为基金服务时,一面网络也曾有过自己的迷茫,感觉自己像是一个外包公司,长期这样下去会让方向越走越窄。而他们当年创业的几个小伙伴依然希望保持自己的初心,他们认为通过技术手段获取网上越来越丰富的数据,并基于这些数据做分析及可视化,必能产生有价值的结果,帮助大家改善生活。

后来,一面主要往快消、时尚和汽车行业发展,市场边界不断扩大。任栋霓认为中国大部分的企业或个人已经完成了电子化,下一步其实就是要从电子化走到智能化。而一面要做的就是把电子化沉淀下来的东西去做出价值。他们希望能让更多人知道这些价值,便成立了自己的自媒体《数据冰山》,希望透过数据挖掘与分析,呈现互联网海面下隐藏的冰山一角。


他们的数据风文章深受广大知友喜爱,目前数据冰山知乎专栏已有85602人关注,点赞数更是高得吓人,不信自己去看。除了知乎,微信公众号、今日头条、36Kr和i黑马等平台上也能找到他们的足迹。

自媒体的抢眼表现极大助力了他们的业务。其实今年之前,一面没有任何推广销售团队,主要的客户都直接或间接来源于数据冰山。任栋霓回忆说,知乎、广告下面,几乎每天都有客户留言,天天能接到电话。陆续,他们也签约了十几家客户。

经过两年多的发展,一面数据也得到了资本市场的认可,在开启融资仅仅3个月后,就于今年7月拿到了真格基金和联想之星的1400万融资(此处应有掌声)。

好吧,言归正传,这家公司所代表的趋势和模式究竟是怎样对抗数据霸权的呢?又是如何重新焕发数据中“沉默的大多数”?

任栋霓解释说大数据只是一个概念,或者说是一种思考问题的方法,一面落脚点在于做数据分析,然后用分析来形成洞察,去指导厂商的运营跟决策,那他们就能直接用数据驱动业务增长。

现在极少极少的公司能够用到这种数据驱动的理念去指导业务。比如在营销中,我们依然陷在李叫兽所说的“价值攫取型”战略中,想尽办法争取广告位、代言人、流量等存量资源。相对应的,“价值创造型”战略的核心则是通过切换资源的利用方式,来创造新价值。每家公司在发展过程中,都会积累大量的数据,但我们却不加重视,重视了又不知怎么合理利用。现在,我们都应把数据当成公司的重要资产,并且重新创造新的连接,而不是视而不见。

一面数据把整个流程都统合在其旗下三大产品之一的“云雀”,这是一个实时的数据洞察系统。云雀(Lark),取义于在云端穿梭,捕捉动态的百灵鸟。任栋霓说云雀不是给C端用户来采集数据的,主要是给B端去做数据监控的。用户可以用它来跟踪市场、竞品,也可以跟踪自己消费者的反馈和口碑。它是一个行业性的工具,需要非常深的业务绑定。


大数据的特点,关键不在数据本身,而是数据的洞察力。那么第三点如何理解数据就显得尤为重要。在这背后,机器学习和知识图谱构建是关键性技术。


任栋霓解释说,机器学习能做的无非是分类和预测。在运用机器学习时,他们大量使用到了分类功能,比如可以利用机器自动化地将几百万、上千万的用户评论分成好评跟差评,然后再将这些评论维度细化成包装的、物流的、产品质量或者说是一些打折客户的忠诚度。

这些原来都需要靠人去阅读,或者靠一些非常简单的关键词去筛选,但很不准确。只要训练样本足够多,足够完备,其实机器能够自动地帮我们把这些东西分门别类。之后我们再根据分类结果去做一个指标的监控,或者说简单的统计,就能得到很多有价值的、可以长期监控的指标。

任栋霓还提到,机器学习的分类功能也可以对一个用户本身去做分类。机器基于客户的历史行为,如订单、咨询、售后评价、参与的打折活动,将数据标签化并提取特征,再丢进机器学习的模型里去做分类,这样就能够得出一个消费者价值的体系。比如说在一个消费场景里面,一个客户对我来说,究竟是高净值客户呢?还是说有潜在流失的风险呢?还是说他的付费意愿很强,但并没有完全被我激发出来呢?又或者说他其实已经流失掉了,你再怎么唤醒他都不会回来了?

科技一定要有应用才能真正产生影响力。在这里,机器学习已经在商业分析中发挥出它独特的价值。

接下来,云雀不仅仅提供2B服务,在年底左右还会推出2C版本,毕竟未来给用户提供完整解决方案和个性化服务,才是大数据公司真正的竞争优势。到时候,我想更多人一定能感受到大数据采集、分析、可视化给工作和生活带来的巨大改变。

如今正逢资本寒冬,创业维艰,虽然任栋霓说没怎么感受到寒冬的存在,但我还是想替所有正在创业中咬牙坚持的人问一个烂大街的问题:初心对创业者来说重要吗?

任栋霓想了想,很认真地回答道:“创业过程中会有很多问题,你会不断怀疑自己所做的事情。然后市面上也有很多新的机会摆在你面前,比如说互联网金融很火,曾经的O2O也火过一段时间,但在这些新机会面前,你要坚持你原来想做的事情。你要相信你之前做的事情是有价值的,并且这个价值要在你长足持久的努力之下才会被放大,并最终体现出来。在那种时刻,如何去坚持,如何去选择,我觉得这个就是我们理解的不忘初心的含义。”

是的,不忘初心应是一种信仰。

只要出现更多像一面这样的公司,能帮助企业和个人认识和挖掘利用大数据的价值,我想BAT数据霸权将不会再是一个值得担忧的问题。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 194,390评论 5 459
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 81,821评论 2 371
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 141,632评论 0 319
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 52,170评论 1 263
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 61,033评论 4 355
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 46,098评论 1 272
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 36,511评论 3 381
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 35,204评论 0 253
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 39,479评论 1 290
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 34,572评论 2 309
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 36,341评论 1 326
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,213评论 3 312
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 37,576评论 3 298
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 28,893评论 0 17
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,171评论 1 250
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 41,486评论 2 341
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 40,676评论 2 335

推荐阅读更多精彩内容

  • 早晨六点半和她们集合,七点发车。一整天,一半的时间在路上,一半的时间在爬山。上山,下山……累,却是满足的。每次...
    逃避现实阅读 111评论 0 2
  • 一年前,我无聊地刷着手机;看到一个男的,自毁自黑地给自己化妆,像蛇精病一样;用马克笔化妆,创造出了乱七八糟的丑...
    XX的Xixi阅读 392评论 4 0
  • 这次作为会务人员,虽没有全程参加场内活动但却有个不小的收获。当我和对面的那位男士ab练习时,述说着在人格面具背后掩...
    侠骨丹心9号阅读 200评论 0 0
  • 雷霆和雨露 皆为君恩 我不思索从哪里来 我只知晓何时去死
    星火灿烂阅读 197评论 0 0