没错,它就是存储界的“大胃王”

2017年12月 · XSKY

打个不太恰当的比喻,块存储、文件存储、对象存储就像是饭桌上的“三兄弟”,块存储的饭量偏小,还较为注重养生,讲究的是“食不厌精脍不厌细”,只容得下结构化数据;文件存储饭量尚可,也不挑食,一切以吃饱为好作为前提;对象存储胃口极好,对一切美食来者不拒,图片、音频、视频通通是“它的菜”……

做“大胃王“, 首要“胃容量”要大

在空腹状态下,成人的胃容量约50ml,拳头大小,正常进餐后,胃容量可达到1500ml。一个名副其实的“大胃王”,先决条件就是 “胃容量”比别人大。对象存储的“胃容量”优势,决定了它在和块、文件三兄弟的PK中荣登“大胃王”宝座。

亚马逊在2006年开始的S3对象存储服务,为人们打开了一扇应对海量数据存储的“新天窗”,S3 服务及其使用的REST、SOAP访问接口也成为对象存储的事实标准。超强的稳定性(S3保证99.9%的每月正常运行时间服务水平协议,即每月不超过43分钟的停机时间)让S3成为了全球对象存储的首选方案。据报道,截至2013年4月,Amazon S3存储了超过2万亿的对象,而这一数字在2007年10月还是100亿,不到6年的时间增长了200倍。

目前,全球成熟的公有云均提供了对象存储服务,除了 AWS S3外,像谷歌的Google Cloud Storage,微软的Azure Storage,国内阿里云OSS,腾讯云对象存储COS等都是较为典型的对象存储解决方案。

对象存储的优势在于基于互联网解决海量数据和海量并发访问的需求,通过HTTP直接实现数据的存取,同时对应用的处理能力与高速网络的依赖性较小;对象存储尤其适合用来组织非结构化数据,包括备份归档数据,海量图片数据,医疗影像数据,日志数据,视频监控数据,超算分析数据等。

根据IDC统计数据显示,早在2014年,分布式对象存储就已经在全球存储市场占据了47%的市场份额,折算成金额约为125亿美元,分布式对象存储的应用主要集中在云服务商和互联网。

这一数据充分说明:“对象存储是来自于大型互联网运营商的基础架构技术“;而随着传统企业加速拥抱互联网IT技术,这一技术转移不可避免。此外,事实上,对象存储进入企业IT,不仅作为一种新的存储形态影响企业信息化运维,也影响开发和应用架构模式。

 “消化和吸收”还要好

“胃容量”大只是代表着你在成为一名“大胃王”的道路上,基础底子有优势,但是要想成为名副其实的“大胃王”,你的“消化和吸收”还要比别人好,这样,高效的消化效率确保你胃排空速度够快,能够继续吞下更多的食物,并且充分地吸收营养,将养分输送到身体的各个组织器官,促进身体健康快速成长,使得食物的价值得以最终体现。唯有如此,才能成为一名胃口好、还健康的“大胃王”。

对象存储打通数据转化为资产的“路径”

1、识别数据价值,形成数据资产

当今数据大爆炸时代,如此海量的非结构化数据中,并不是所有数据都有价值,需要通过技术手段去筛选和甄别,真正将数据转化成企业的数据资产。对象存储的“元数据(metadata)”非常方便扩展,用于记录应用相关或用户相关的附加信息,在此基础上可以实现丰富的数据分析、查询、检索等功能,将有价值的数据识别出来,形成数据资产。

2、数据存储合理分级

数据资产还需要有高效的管理和流动机制,进行合理的资源调度和利用,发挥其最大价值。在传统存储管理模型下,数据的访问热度和价值利用事实上是一次性的,集中在热数据设备。要想从备份或者归档的数据中跨层调取做数据分析,需要跨越不同网络、不同的接口协议,在技术和流程上十分困难。对象存储恰恰能够提供用户按需制定策略的手段,使得数据按照既定策略流动起来,实现数据存储合理分级。在系统识别到位于容量层的温数据访问频度变高时,会自动从容量层迁移到高性能层;高性能层的热数据一旦访问频度变低,就会自动从高性能层迁移到容量层;温数据层的数据,还可以按策略迁移到公有云上实施归档,在提升数据安全性的同时,进一步降低存储成本。

3、连接私有云和公有云的桥梁

随着企业互联网业务的快速发展,企业除了要有新颖的产品,还需要能够快速的部署和变现产品价值,促使企业应用云化步伐加快,越来越多的应用运行在智能终端和公有云平台上。而从数据安全性、保密性,以及企业内部数据上云成本多个方面考虑,目前绝大多数数据依然保存在企业内部,这也是企业自建私有云的一个重要原因。对象存储使用HTTP协议,原生对接互联网应用,成为连接内部私有云和外部公有云的桥梁,公有云上的互联网应用、云计算服务可以和私有云内的对象存储系统联动。对象存储系统的数据发生状态改变或满足用户预设值的条件时,可以自动通知公有云上的应用或服务;对象存储可以将应用所需数据推送到公有云,拉近数据和计算的距离,利用云计算的优势进行数据分析和挖掘。这种联动的灵活性,确保企业业务的敏捷性,数据资产快速变现价值,促进更多的互联网创新性业务发展,几乎所有的互联网企业都在使用对象存储作为底层的存储支撑。

4、支持跨地域部署

对于关注高可靠性的企业用户来说,双活,多活等容灾企业级功能非常有必要,同时为了解决用户多地域的访问性能问题,需要支持跨地域部署。对应于云计算的无地域限制性和敏捷弹性,对象存储可以跨地域部署以适配应用弹性扩展,实现负载跨地域分布和数据就近访问,同时具备数据容灾功能。这种跨地域部署的对象存储系统,非常适合构建大型企业的总部分支模式的IT基础架构,还有一些行业(如银行、保险等行业)为了满足法规遵从性要求,也需要建立跨地域的数据容灾机制。

5、影响应用数据共享模式

在互联网信息技术侵入企业IT之前,企业信息系统间的数据传送主要依靠以下四种方式(来自Gregor Hohpe和Bobby Woolf所著《Enterprise Integration Patterns》):

  • 文件传输:利用FTP等协议,一个应用写文件,另一个应用读取文件;
  • 共享NAS或共享数据库;
  • 远程过程调用:一个应用开放一些功能,其他应用根据契约同步调用这些功能;
  • 异步消息传递:应用向消息通道中传送报文,其他应用订阅或者消费。

总而言之,这四种数据共享模式是局域网友好的传输模式,或是水平式的传输模式。在企业信息化面对互联网应用需求和大数据冲击时,这样的数据共享模式不能满足要求,原因有两方面:

一是无法满足跨数据中心多站点数据共享。这样的数据共享需要是HTTP协议友好与CDN友好的。并且有些应用位于私有数据中心,有些应用位于公有云。

二是传统的数据共享是为低带宽的企业内网设计的。大数据时代的海量数据特征,使得传统数据共享方式无法承担负荷。

而对象存储,每个非结构化数据对象具备全局统一的编址,每个对象的属性信息可以自由扩展。其灵活的权限与安全控制,CDN友好特征,百亿级对象容量,以及多站点方案为互联网潮流下的数据共享提供了新的选择。

对象存储为海量数据共享提供了“垂直的分发式模式“

“大胃王”茁壮成长

随着混合云时代的到来,企业正在加快寻找一种可扩展到公有云的敏捷、可编程的基础设施,同时越来越多的客户在应对数据增长时,迫切希望一种高可扩展、经济高效的存储来替代传统的存储方案,对象存储面向企业市场迎来了加速发展的机遇。根据IDC《2017年上半年中国软件定义存储及超融合市场跟踪报告》显示,2017年上半年,XSKY(24.5%)、华为(14.2%)、IBM(10.0%)三家一共占据了48.7%的对象存储市场份额,成为企业级对象存储的领头羊。

具体到应用行业,广电、金融、制造业、教育、军工等都是目前对象存储取得了较大规模应用的领域。