一直以来,公有云最大的威胁和普及障碍就是安全,区别于私有云模式,选择公有云的交付方式,这就意味着将企业业务放到云端,一旦公有云因为故障瘫痪而停止供应,企业业务就无可避免地发生“中断”,直接影响到企业的正常经营活动。这两天,开源软件XEN又再一次曝出安全漏洞,这也导致亚马逊EC2、阿里云ECS、IBMSoftLayer、Linode及Rackspace Cloud等主流公有云提供商都不得不重启,升级版本。
开源软件Xen究竟为何许人也?一个安全漏洞曝出,就能让这么多的公有云大腕“中招”,甚至不得不采取停止服务的方式来打补丁。实际上,在云计算、虚拟化领域,Xen开源软件为人熟知,由剑桥大学开发,本身就是一个虚拟机的监视器和管理功能,类似企业级ESX的一个开源软件,很多主流的公有云平台都是Xen代码的使用大户,虽然普遍采取了定制化开发的Xen版本,避免了更高危的漏洞风险,但依然难绕开。
实际上,任何软件和代码都存在安全漏洞,相对来说,开源的软件更容易受到攻击,早在去年9月,Xen就出现过三个严重漏洞,亚马逊AWS用了5天来修复。往往开源社区会定期发布漏洞,及时打上补丁。只不过,这一次对亚马逊EC2、阿里云ECS、IBMSoftLayer等来说,必须通过重启服务器、暂停服务的方式来解决,而不能通过热升级的方式,因此才会带来更大的波及和影响。毕竟这几家公有云平台几乎占据了接近90%以上的市场份额,用户也只能被迫“中断业务”来消除安全隐患。
很多人有疑问,为什么必须要重启呢?从技术角度看,Xen是管理物理服务器上的所有虚拟机资源的,而应用负载就高度依赖于此,一些安全漏洞会直接影响到虚拟机的工作,包括宕机、获取Root权限,产生的危害相当大,这样的漏洞往往是最恐怖的,不仅波及面广,修补起来又需要重启和业务中断。实际上,公有云平台也没有好的办法,只能通过开发定制版或在不同地区使用多个版本,但往往治标不治本。
目前来看,中国的企业跑在公有云平台上的业务和应用并不多,主要以中小企业为主,一些大型企业也仅仅是将非核心业务应用放在公有云上,所以漏洞、故障甚至中断,短期并未造成太大的影响。当然,如果是自主研发的虚拟机的监控和管理软件,就没有这样的担忧了。比如像致云科技这样的完全自研的云管理平台,拥有更高的可用性,即使存在漏洞,有专门针对云环境开发的自带故障弹性能力,且能进行智能恢复,极大地提高了系统可用率。而且从未来的趋势看,虚拟机资源也可用软件定义来管理,与物理资源隔离,即使虚拟机崩溃,也不会传导到运营平台。
所以说,对所有公有云服务商来说,应该提供更可控、弹性的能力。即使是世界上所有的公有云平台,每年都会出现宕机、故障,影响到平台上的企业,但每发生一次宕机事件,都是对公有云形象的巨大损伤。因为在这个互联网化纵深渗透的时代,企业内部外的价值链和业务应用会逐步迁移到线上,哪怕是停止1小时的服务,对企业来说都是灾难性的。至少公有云平台需要达到“修复漏洞不重启”的要求,否则公有云永远难登主流厅堂。