昨晚凌晨2点多,学东西学到了这个点,本来我是准备刷刷朋友圈就睡了的,但打开了朋友圈之后我发现了惊奇的一幕:B站、A站和豆瓣崩溃了。
我瞬间就清醒了,这种“百年难得一见”的怪事居然发生了?这一下一些不明“码理”的小伙伴们不得疯狂猜测?
于是为了更了解事情的来龙去脉,我上个很多平台想去看看怎么回事,结果...让我很吃惊,我真佩服他们的脑洞。
事情是这样的,昨晚(13日)23点50分左右,有用户反映B站的直播频道显示“加载失败”,其他频道部分内容均可正常观看;而A站的APP开之后也是显示出现了加载不出来的问题;豆瓣则是正常的。
有人说这是B站在上海的服务器大楼起火了机器烧坏了,最后连上海火警都得大半夜的起来用官媒辟谣。
有人说B站总部停电了。
还有人就更离谱了,说是肖战搞的鬼,连朋友圈都刷起来了......
我压根就没信.....肖战我不认识,不百度我还真不知道他是谁,原来是当下比较火的明星,两者不太可能,估计能搭上边的就是无良媒体的热度炒作罢了。
B站的这次故障也是让给它损失不小,才那么一小会儿就上了热搜,而且股价立马就开始短线走低,这么大一个盘子,涨幅直接收窄3个百分点,这一折腾不知道又是哪些人要卷铺盖走人了......
对于开发者来说,我估计我们八成的人都不会信这些云里雾里的消息,就算是猜测,我们也应该站在技术层面来合理假设。
对这次事件的猜想
1.B站总部停电不太可能。
根据我对B战这种大型的平台的了解,B站总部着火导致平台崩溃这一说法,我觉得是不太可能的,因为接触过大公司设备部署的人都知道,我们不可能把整个平台所有的设备都放在1个楼里,合理的做法往往是把设备分地存放。
拿个最简单的例子,你现在就算是把阿里在杭州的整个部署都烧了,阿里旗下的平台都不会让你看出有丝毫影响,因为他们的设备存放远远不止在1个城市,全国的很多地方都会有所部署。
况且,带点脑子的都知道,机房要地的设备安全和备用方案都十分齐全,出了丝毫纰漏都有可能损失千万流水,所以这种可能基本不存在。
2.我猜想问题出在是云服务商
在官方还未公布事情真相之前,我们可以大胆地从技术层面来做猜想,我觉得很大的概率是B站的云服务商出现了问题。
为什么是云服务商?
B站的云服务商是外面的,B站自己研发的东西有LB和容灾系统等东西。如果云服务商的CDN出现了问题,那么客户端的请求将会大批量地绕过CDN直奔网关,按照设计普遍的思路来讲,这个时候网关极有可能会就会启动容灾系统来应对这种大批量的请求。
一般的容灾系统的设计都是降级处理,保留一部分功能运转,也就是为什么很多人一开始看到的是B站的直播频道崩溃了,接着很多功能用不了,那其实也就是容灾系统在启动服务降级。
最后的结果就是网关也会跟着崩溃,那么服务器也自然“唇亡齿寒”,整个环境都会跟着崩塌。
B站到底有没有全崩?我是没有赶上,这个时候我打开手机,B站已经是正常的了,抢救的速度还是很快的,夜深人静的也挺不容易的。
为了验证这一想法,我还专门去打电话问了一下发朋友圈的好友,得到的回答是抢救是抢救好了,但是刷到的视频都是一些他平时都不会去看的。
这么一想,就更加验证了我这一想法,因为要拯救崩溃的容器系统,就得重启容器,这里需要不少的时间,那么就是说,B站的所有功能并没有完全恢复,起码我可以肯定,那时候B站的推荐系统依然还是没有好,导致B站没有系统推荐算法。
当然了,这只是我猜想,用不了多久B站就会弄好的,事情始终都会过去的,但技术问题却是可能会遗留很长一段时间遭人议论,甚至会成为技术界的一次反面素材.....
作为程序员的你,又是怎么看待这件事情呢?欢迎在评论区留言交流!