云故障之后,你的数据还好吗?

2018年08月 · XSKY

频发的云故障事件

2017年2月28日,AWS S3故障,起因:调试时输入错误指令,意外移除大量服务器导致S3不能正常工作;

2017年3月22日,微软云服务一个月内出现又一次宕机(上一次是2017年3月7日);

2017年6月11日,谷歌位于美国数据中心的App Engine服务出现大面积故障;

2018年6月27日,阿里云故障,起因:运维操作失误触发未知bug;

2018年7月17日,AWS管理控制台间歇性失灵;

2018年7月18日,谷歌云平台全局负载均衡服务发生中断;

2018年8月5日,一家创业公司声称,由于其存放在腾讯云的数据全部丢失且无法恢复,要求腾讯云赔偿1100余万人民币……

「用户的上云焦虑」

当越来多的企业将其开发测试、核心生产等工作负载迁移至云端,在充分享受到云计算带来的按需所取、弹性分配等好处同时,大型云提供商在运行过程中暴露出的故障事件,也让用户看到了云的负面影响。

虽然大型云提供商构建的云计算基础设施和服务的正常运转时间百分比,远远超过了平均业务所能达到的水平,但这并不意味着不受系统和人员所造成故障的影响,单一错误、监管失误或者计算错误都将导致彻底的灾难事件。

由于公有云故障带来的系统宕机,数据泄露或丢失,将给企业正常运营带来沉重乃至致命的打击。曾经有人计算过,AWS每宕机一分钟,对亚马逊自身造成的损失是66240美元,这其中还不包括使用AWS服务的用户的损失。

显然,在最终造成数据丢失的不可挽回的后果面前来说,系统停机的影响还在其次。《2017数据泄露的成本》报告显示,在全球范围内,平均每条数据丢失为公司带来的损失为141美元,如果该行业运行着关键数据,损失将会更高,如教育行业数据丢失的成本高达246美元/条。更令人担忧的是,统计显示,全球每年有近百万企业因数据丢失而倒闭。

云系统故障发生率虽然在逐步降低,但云服务也不可能达到100%的持续在线,IDC在调查中就发现,75%的用户焦虑的是:上云后的数据安全性如何保障?数据作为企业的核心资产,在决定迁移到云端前,用户需要的是更加有保障的云策略或者解决方案,一旦遭遇故障至少能够守住数据安全底线。

「更安全的云上数据存储」

大型公有云提供商在数据保护上,普遍采用了多副本保存,但这还远不足以防范云提供商的单点故障问题。根据全球知名云管理平台RightScale 2017年的研究报告,全球已有高达85%的大中型企业采取了多云的IT战略,相比之下,选择单一公有云和单一私有云战略的企业分别只有9%和5%。随着多云、混合云等策略的流行,如何帮助用户既享受到公有云服务的规模效应和成本优势,又能够解除云锁定,同时还拥有完整的本地数据中心和跨集群的持续数据灾备保护?正在成为新的发展趋势。

在这个目标下,要求存储平台既可以部署于本地私有云,又可以提供云交付的方式,部署和运行于不同的公有云端。数据可以在不同的公有云之间、公有云和私有云之间进行自由流动和迁移,实现数据跨云(本地)的互为备份。数据上云之前,经过去重、压缩、加密,进一步降低存储成本,提高存储利用率。

目前,业界一些领先的数据存储和管理厂商,正在提供一系列解决方案满足多云、混合云场景下数据存储和保护需求。以NetApp公司为例,其推出的Cloud ONTAP平台,支持跨云环境的数据存储管理,平台既可以部署于私有云,也可以部署于AWS或者Azure,提供从本地数据中心到云的整个 IT 环境中的灾难恢复,确保业务连续性。VMware和AWS合作的VMware Cloud on AWS集成式云服务,也是一种支持用户在私有云、公有云、混合云环境下运行各种应用,实现简化的混合IT操作的解决方案,并优化和改造了灾难恢复解决方案,支持用户多云策略应用并保障数据安全。

XSKY也提供了基于软件定义的存储解决方案,用户既可以将XSKY软件定义存储产品运行于其本地数据中心,也可以部署于阿里云、腾讯云、AWS等公有云上;

XSKY SDS具有双重数据校验功能,包括存储引擎XStore的CRC校验和多副本Scrub校验功能,Scrub和CRC 相互配合来解决问题,数据写入的时候做CRC以完全解决静默错误,Scrub 发现数据不一致时,通过CRC 确认正确的数据副本,然后恢复静默错误的副本。

XSKY完整的数据保护功能

XSKY还支持用户数据按照设定的1-6副本进行冗余存储,保证单点故障系统不会丢失数据。XSKY系统数据持久度在两副本场景下,达到4个9,在3副本场景下数据持久度达到7个9;XSKY也支持“N+M”的纠删码,可以任意配置不同故障等级的纠删码,提高磁盘空间的利用率;故障域隔离设计,则通过将副本分布到不同故障域,保障数据安全,可以为机架、服务器、硬盘提供故障恢复能力。

在跨集群的数据灾备保护上,XSKY提供基于延展集群实现同城双活和两地三中心;远程备份通过配置定时备份策略,利用同步复制、异步复制与内置的数据跨云备份功能,实现了数据在云端和私有数据中心之间的灵活流动,并通过跨数据中心或云端的存储提供了更高的数据安全性,并且可与公有云对接,通过兼容Amazon S3接口,无缝对接云计算生态,满足云备份、云归档场景需求。

同步复制

XSKY支持分布式场景下写性能更具优势的ROW快照,避免程序错误、误操作、病毒攻击等各种因素导致的逻辑错误故障。对于企业可能面临的各种站点故障,可通过异地备份和远程容灾来降低对业务和数据的影响。

基于XSKY的解决方案,用户在充分获得公有云规模和成本优势的好处基础上,又可以利用存储功能,保障企业业务和数据安全。

「明特量化的部署实践」

明特量化是一家典型的Fintech企业,其选择了全球排名前三的公有云来搭建专属云平台。随着业务的开展,各种类型的用户数据和账单信息,积累了海量的小文件数据,到2017年10月份,各类小文件数量一度逼近8千万个,并且小文件的数量还在保持月均递增200万个。

2017年10月,明特量化正式在公有云引入并部署XSKY X-EOS企业级对象存储产品,并将所有数据迁移到X-EOS。

X-EOS运行半年多时间来,存储集群故障次数为0,保证了明特量化业务的持续性和数据安全;同时随着存储性能的大幅提升,为更多的金融业务创新提供了助力。

「另一种交付形态」

有云具备多种形态,除了为用户提供虚拟机实例的方式,目前大多公有云厂商提供裸机交付服务,用户可按需租赁公有云平台的物理服务器服务。XSKY SDS 除支持在传统公有云平台上部署外,目前正在和国内主流公有云厂商在裸机交付层面陆续启动并展开深度合作,比如腾讯黑石物理服务器,为用户提供云端专用的高性能、安全隔离的存储解决方案,帮助用户搭建高效、弹性、可靠的企业混合云IT环境。

虽然云计算整体的安全性远超过传统数据中心,但也会有意外发生。选择云平台,本质上是在外包能力,而非外包责任。您的数据需要采用适用于多云、混合云的全面而专业的数据保护解决方案。

Pick一波福利

即日起,登录XSKY官网(https://www.xsky.com/)或致电400-016-6101,免费Pick XSKY面向混合云、多云业务环境更强大的数据管理与保护产品试用,我的数据我做主!