抛开成本谈安全就是耍流氓了,可靠性这东西,一分钱一分货,一块钱二分货。
对于大部分业务来说,云平台的故障造成的损失并不致命,也没必要强求在云平台故障的时候依然能保证服务正常。需要做的只是防止云平台故障造成的损失扩大化,让损失可控。
比如:
1、核心数据定期异地备份,这个要定期做模拟测试做演习,别真的用上的时候才发现不备份不可用。
2、及时发布公告告知用户,保留少量自有服务器,或者其它云平台主机,出故障的时候把域名解析过去用来发公告。
3、组织运维人员配合云平台恢复服务,核心运维要24小时 on-call,平时要搞演练,不要真的半夜出事的时候打电话找不到人。
4、对损失做评估,保留证据,该索赔就索赔。
云服务未来就像电力一样成为基础设施,人类至今也没做到绝对避免停电,我们只是做好了避免停电损失扩大化
比如,公共场所的应急照明灯,医院手术室配有发电设备,有可能停电会造成数据损坏的计算机都有UPS,工厂设备设计成停电安全不会因为断电而起火爆炸。
如果自身服务非常重要,可以考虑租用多个云服务互为主备,甚至自建机房,只是这样成本和技术复杂度会成倍增加。
实际从统计上看,中小企业的运维水平是远低于大的云平台的,故障概率要高得多,损失更不可控。没什么公司是中断服务几个小时就会破产倒闭的,不必对云服务故障抱有恐惧,大胆用,相信云服务厂商技术日趋成熟会越来越可靠的。