互联网 频道

云计算浪潮下的安全保障

  随着云被各行各业广泛的应用,云的稳定性和可靠性也显得越来越重要。许多公司逐渐将关键业务和数据部署到云平台上。随着近期云安全事件的爆发,我们不得不反思,是不是所有的云服务商都做好了保证业务和数据安全的准备?

  微软Azure去年11月的大规模故障还让人心有余悸,国内的云服务商也出现了大面积服务中断。2015年6月6日下午,因服务商“睿江科技”机房遭遇雷暴天气引发电力故障,青云广东1区全部硬件设备意外关机重启,造成青云官网及控制台短时无法访问、部署于GD1的用户业务暂时不可用。与此同时,另一家云服务商LeanCloud也发生了长达4小时的服务中断情况。

  云的稳定性依赖于数据中心的稳定性和云平台自身系统稳定性。

  什么样的数据中心才是稳定的数据中心?国内数据中心大致分为运营商机房、运营商合作机房、中立机房。运营商机房是严格遵守IDC建设标准建造的,对建筑承重、抗震、电力、制冷、消防、安防都有一套专门的验收标准。运营商合作机房也是按照运营商的标准设计建造的机房。而中立机房一般良莠不齐,可靠性难以保障。

  青云广东1区所在机房遭受雷暴天气引起UPS瞬间波动,UPS启动自我保护,释放电流导致瞬间断电。按照目前T3级机房标准以及目前防雷技术的成熟度,类似青云这样的故障是不应该发生的。除了硬件设备的支持,更重要的是IDC服务商在运维上的流程和规范。如N+N的电力冗余、定期电力巡检及维护、UPS定期带载供电、电池的维护和更换等。大多数云服务商都是以研发为主,对网络、IDC、运维关注度不够。一方面是重视程度不够,另一方面对网络、IDC、运维的熟悉程度也与专门的运维有一定差距。云服务商与IDC服务商之间的协作成为了整个云稳定链条中的短板,选择一家专业、靠谱的IDC服务商显得尤为重要。

  在微软去年11月的故障中,Azure团队针对AzureStorageTableFront-Ends进行了一次升级,目的是减少CPU开销,提升存储服务性能。在未完成大规模验证的情况下,Azure团队就将该变更全面部署到整个云系统中了。很快就触发了一个Bug,导致系统进入死循环无法提供服务。

  专业的软件开发团队通过规范的代码管理流程开发,并严格执行代码上线流程是可以保证云平台的稳定性的。国内大多数云服务商都将精力放到新功能的开发上,而忽视了云平台的稳定性。如果云服务在给用户带来灵活、方便的同时,忽略了可靠性,那云服务就没有意义。

  微软和青云分别在IDC的稳定性和云平台的稳定性上吃过亏,那有没有云服务商能在根本上规避掉这两种风险呢?如果一家云服务商既擅长云平台技术研发,又在IDC运维上有深厚的功力,那这两个问题就迎刃而解了。

  森华易腾是国内领先的IDC综合服务运营商,有着极为丰富的运维经验。优思得是国内OpenStack最早的实践者,为OpenStack社区贡献了大量的优质代码。森华易腾与优思得达成了战略合作伙伴,优思得专注于云平台研发,森华易腾则利用优思得的云技术部署成对外提供公有云服务的森华云。结合森华易腾在IDC运维方面的丰富经验和优思得在云领域的技术实力,森华云在稳定性、可靠性上有着天然的优势。

  森华云自上线以来未出过一起严重故障,根本的原因在于让专业的人做专业的事。森华易腾提供优异机房;自建高速环网实现各机房互联;专业的监控团队实时监控机房、网络状况,高级网络工程师、运维工程师7x24小时驻场待命,保证森华云基础环境的稳定可靠。优思得专注于云平台研发,依托OpenStack开源社区,不断提高代码健壮性,结合用户需求进行定制化开发,推进云平台往面向客户的方向发展。

  从森华云运营的实际反馈结果来看,这种运维与研发之间的结合是成功的,森华云会按照这种模式继续前进,为用户提供更稳定、可靠的云服务。

0
相关文章