▼
最近大家都在忙着买回家的火车票。有人给自己买到了,有人给女神买到了,有人还因为买到了而俘获妹子芳心,而你,呵呵呵,与验证码大战几百回合居然败倒在了哪个是C Cup。。。那一刻的你,绝壁是:
善良本真的我好想播放
『嘟~~~~~』
那阵火车鸣笛声
告诉你别抢了
坐灰机吧
…
哎呀,dan好疼,看来扯远了。
▼
周末看了点大数据方面的东西,于是心血来潮,就想从12306入手,看能发现点啥不?不看不知道,一看还是不知道,但是发现『12306』的搜索指数在12月1日达到 2,094,067(下图1_ F点),两百多万啊!而整个15年前11个月平均值才只有 464,137,就46万而已。
这搜索量是个啥概念,咱和淘宝做个对比,为了看清晰一点,把时间跨度集中在近30天内。可以发现12306的这个峰值已经接近于今年双十一当天"淘宝"的搜索指数,均突破200万级别。天了噜,好大好大啊。如图2:
如果单独来看近30天的12306搜索指数,下图3所示,会发现,12月8日又出现了一个小高峰,图中E点,达到1,416,924,一百多万,超出前11个月均值两倍多。
这些神一般的走势,
好像午后两点半庄家迅速拉升,
然后一泻千里,
但感觉这趋势图,
比K线图还刺激啊,
墙裂的吸引我去探索为毛啊!
▍先说12月1日峰值分析:
不否认,进入春运大家买票热情高涨会促使搜索指数增加,可是12月1日买的是1月29,农历腊月二十,并且春运早在11月26就开始了。这一天忽然出现高于前后几天数倍的搜索量,没理由啊,很奇怪nei!
于是就在想,这一天到底发生了什么,让那么多人去搜索12306?你也可以想一下,想得脑瓜仁子直疼,但依旧什么也想不起来 →_→ 这就对了!
双十一淘宝那搜索量我们有目共睹啊,12月1日我也觉得有啥事儿是全民参与了,或者被高频次集中搜索了,于是乎得找信息源或者官方出口寻找答案才比较靠谱。
信息源可以问度娘,输入12306关键字,检索12月1日的所有网页和新闻,果然发现了端倪:原来那一天。。。。。。。
各位大V和路人疯狂转发了需要手机双向验证的消息,不信你看:
看到这个你是不是想打我,憋啊,脱了裤子看这个只为下面有更精彩的!
鉴于这只是一个信息点,还不足以证明全民参与了,所以开始挖掘社交渠道12月1日的信息。
先选了微博,找到了12306的官方单位@中国铁路,输入搜索条件:
发现在此官微所有微博差不多都只有100左右转发评论的时候,有一条闪到了我眼睛,转发2454、评论1402,比之前多了十倍啊!嗯哼,来看证据:
没错,就是官方渠道发布的『手机需要双向核验』通知。不过仅仅是通知的话,大家直接去核验就好了嘛,为啥搜索热度如此之高,很可能是大家广泛讨论或参与了,但是要真的论证全民参与,怎么少得了微信和QQ,于是我继续证明:
已上是我微信和QQ聊天的部分截屏,请注意看时间!可以明显发现:以上手机双向核验消息都集中出现在12.1日,但是关于核验有人说截至12月3日之前,有人说2日之前,并且还传递"错过了或将不能买票的『后果引导性』信息",这必然会加剧大家的重视程度和急迫心理,于是一下子涌入12306进行核验也好,赶紧确认也罢,都是贡献了极大的参与度和搜索量。仔细想一想,说的就是你呀!
所以,我个人认为12.1日12306出现今年以来的搜索峰值是因为:被双向验证手机的通知吸引了、被后果吓到了、被提醒后感觉到与个人切身利益高度相关,然后赶紧来搜索和确认。
▍再来分析下12.8日为啥又会出现一个小高峰:
首先,客观条件导致:因为8日可以买腊月二十七并且是周五的票,肯定会有大批搜索流量带入,天要下雨我要回家,这谁挡得住:
其次,查看当天新闻源,发现了神奇的。。。。。。
验证码!!!
然后朋友圈微信微博,我想我就不用截图了,满满的自发主动传播,还有各种嗅觉灵敏的营销咖学霸tua段子手借势创作添油加醋,于是乎边刷票边吐槽,边乐呵边哭……因为实在是难买票啊!
真是够够的了!
你让这些给自己没买到票更没给女神买到票的人情何以堪啊!不过,12.8日的高峰搜索量也就水落石出啦:就是因为过年回家周五票再加上这他妹的坑爹验证码!
▍最后从新闻监测和微博热度搜索关联词一起来整体看看!
咳咳咳~
既然都写到这儿了,也搜了那么多数据,还有其他结论可以看吗?
当然有啊!说了今天不扯淡做个学术のBoy。
番外1:
15年整体12306的搜索指数平均为48万+,其中PC占了62.5%的份额,而移动端瓜分了37.5%。如下图所示。
这或许说明:大多数人还是在使用网页版进行有关买火车票的搜索和预订。至于为啥,智能手机毕竟少啊、12306的APP有多烂谁用谁知道啊blabla,原因很多,欢迎大家讨论哟~
番外2:
春运期间,搜索12306的人群按照省、市可以划分如下:
这个划分基本上和目前常态的打工大区、一线城市等信息吻合,北京更是几乎等于上海深圳之和。不过我意想不到的是:杭州的排名位居第五,这是啥原因呢?欢迎有答案有见解的朋友一起讨论哈~
番外3:
春运期间,搜索12306的人员,具体年龄和性别:
☞30-39岁,即1976-1985年的叔叔阿姨,占据51%,过半啊!
☞20-29岁,即1986-1995年的哥哥姐姐,占据41%,第二啊!
☞其他年龄阶段占比太少,原因可能不怎么使用网络检索。
☞性别那更是夸张,男性占据了89%,完全彻底压倒性占比啊!
☞难道真的是因为男性要给自己买票还要给妹子媳妇女神买票么!
番外4:
没有了。。。。。。
"那你还写个毛的 番外4啊!!!"
"呃……怪我咯"
其实我感觉这里面还有很多可以去深挖的东西,比如男女比例?比如PC移动差别?后期继续探索呗。
大家有建议或者感觉我行文有漏洞欢迎提出。通过表面数据看本质,我想这是我写这篇文章和做这件事自己最大的收获!
我是Senge.
记录生活,严肃扯淡
欢迎北京的随时带我去飞
不在北京的推荐我地方去飞
好飞的话你来了咱一起去飞
BIU飞起~