过去已去,未来已来,金融业存储架构演进之路(一)

2019年05月 · XSKY

还记得最近一次用纸币支付是什么时候?

最近一次事故现场勘验理赔呢?

最近一次去柜面进行证券开户呢?

未来已来

随着互联网、云计算技术的迅猛发展,金融科技(FinTech)就像一个觊觎蛋糕已久的门口的野蛮人,企图撕裂传统金融服务方式。而面对一众非银机构争相切入银行传统的支付、贷款、存款、理财等核心业务,传统金融行业当然不会坐以待毙。

图片来源网络

在强力监管和准入门槛的双重加持下,越来越多的传统金融机构希望借力金融科技帮助企业降低揽客成本和客户服务成本,提升风险评估效率和办公效率,构建客户对象精准画像,挖掘新的业务商机。

各种新兴的业务场景早已经来到我们身边,甚至都不再新鲜,比如:

  • 智能化柜台,降低营业网点业务开通成本;无纸化柜台,提升柜台工作和服务效率;
  • 智能信贷审核,提升风险评估效率,降低人力投入成本;
  • 理赔智能手机客户端,提升用户理赔效率;
  • 远程证券开户,提升开户效率,降低获客成本;
  • “社区银行”、“直销银行”、“流程银行”、“智能银行”,“开放银行”,“API Bank”等概念不断的被提出、热议和被实践。

央行前任行长周小川曾说过,金融业尤其是商业银行和保险业,原则上就是一家IT公司,他们主要做的事就是数据处理。货币绝大多数已经数据化了,比如中国的现钞在整个货币中只占5%-6%,其他的都是数字形式的,“都是计算机里存储的0和1”。

当人们发现离钱包越来越远,离手机越来越近;当发现手机里App越来越多,去柜面的次数越来越少时,这一切的背后无时无刻不在叙述传统金融行业的数字化转型的故事。

 

双模IT

数据中心作为金融业数字化转型的中枢系统和业务支撑平台,传统的“稳态”类业务继续保有现有传统架构。而以弹性、敏捷、快速迭代为特征的“敏态”类应用则转向基于x86通用硬件平台,弹性伸缩、开放的软件定义分布式架构。

从使用场景的数量(而不是容量角度)去看,金融机构目前使用存储最多的场景主要是共享块SAN存储(如数据库、VMware/KVM虚拟化集群等)。对传统业务流中文件流转的支撑,可以提供稳定高性能共享文件系统的NAS存储也有较大规模的使用。

这些对“稳态”业务提供数据存储支撑的“基石”也大都是传统的集中式双控或通过专有背板交换协议进行数据交换的紧耦合横向扩展多控存储。

而新兴的软件定义分布式存储从诞生之初,并不是用来替代传统的SAN存储的。它最初的设计用途是为了给云计算的计算节点提供块和对象存储能力。如同电子书不能取代新华书店,Email无法令邮局关闭,新技术带来新的趋势的确立,并不意味着传统的技术会一夜消亡。

恰恰相反,笔者认为在未来很长一段时间,在传统金融行业,传统存储所支撑的“稳态”业务和以分布式软件定义存储为代表的存储架构所支撑的新型“敏态”业务将会是一个互有区分、各擅所长、打通壁垒、互相融合的共生格局。

必须承认的是,分布式SDS存储目前在金融行业还没有得到大规模的推广,主要是金融机构现有应用架构对存储的要求,和分布式SDS存储所提供的能力特性之间有一定的错位。

 

图片来源网络

对于传统OLTP场景对SAN存储的密集IOPS和低时延要求,随着SSD介质的兴起和大规模普及,基于传统存储架构迭代而成的全闪存存储阵列(AFA)既可以有效解决性能压力,又可以完全融合已有的容灾、复制等数据服务生态,只要核心应用的纵向竖井式架构不被颠覆,传统SAN存储都可以提供很好的支撑。

有趣的是,随着新兴业务驱动的大量非结构化数据的增加,我们看到对于共享文件系统的使用和依赖正在持续增强,而这个传统的NAS的强势场景却变成了“痛并快乐着”的状态。

一方面由于使用惯性和上层应用接口的改造难度,NAS存储扩容还在持续,另一方面,新兴业务的需求更加场景化、移动化、及时化和碎片化,所催生的海量的非结构化数据的存放已经触碰了NAS的系统、运维和成本等多重边界。

如何使用分布式对象存储这一具有互联网基因的新兴技术,大部分金融机构都开始了摸索和试探,或者已经初步找到一些切合的应用场景和使用方式的阶段。

 

下一代存储有哪些特征

把视角拉回上世纪80年代,兼容机兴起开启了一个全新的PC时代,笨重的专有计算设备逐渐没落,第一次有了独立的纯软件和纯硬件开发,也创造了Windows和Intel的辉煌。历史在告诉我们:软硬件分离,美好的事情就会发生。

SSD的高性能解决了存储系统I/O负荷瓶颈带来的困扰。通用网络平台延迟的降低打破了网络在I/O通道上的瓶颈,万兆以太网已经能够提供高性能、低时延、低CPU占用率的高带宽连接服务。一系列技术革新所带来的红利,为脱胎于互联网业务的分布式软件定义存储在向传统金融行业移植带来了巨大的想象空间。

当金融科技在前端改变着人们的日常生活时,在后端支撑金融业务发展的下一代存储应该有哪些特征,总结主要有以下几点:

1、高性能

金融业对记录和存储的大量业务数据等进行分析和挖掘,支撑企业经营决策、精准获客、风险防范等多方面数据增值服务,对存储的性能提出更高的要求。

2、高可用性

数据是当下和未来金融机构最核心资产,存储高可用性是金融业务活动的基础支撑。

3、动态扩展

虚拟化技术的广泛使用使计算资源池化非常成熟便捷,进而使业务系统所需资源能按需分配,弹性扩展。相应的,下一代存储应该具有横向池化扩展的特性,并能够按需分配和动态增加资源池的资源,满足业务发展的需要。

4、接口标准性

应用容器化和基础架构云化是大势所趋,在多云和本地之间实现数据自有流动,存储系统应该支持自动对硬件资源的部署、优化和管理,将各类存储资源进行灵活的配置,实现应用按需(容量、性能、QoS、SLA等)分配。

5、高可管理性

存储应该具备日常部署、管理、监控的自动化和可视化,提高存储资源服务的可管理性,包括资源分配、资源监控、存储IOPS和吞吐量检测、故障告警等多方面的内容,从而提高运维管理人员的工作效率。

 

通用适用场景

分布式软件定义存储架构有显著的横向扩展、松耦合、高可靠、低硬件成本等特点,经过多年的发展,逐渐具有与传统SAN存储和NAS存储的可比较的支持能力,其初衷还是拓展在传统企业数据中心的使用范围。

软件定义存储技术相比传统存储在动态扩展、资源利旧、私有云搭建、统一存储资源池等方面的优势越发的明显,很多金融机构已经开始了分布式技术的探索或正式应用。

那么,现阶段分布式存储适合于金融行业哪些应用场景呢?我们根据已有的客户案例和实践经验总结如下:

1、基于KVM虚拟化的私有云对接场景

大型金融机构由业务驱动的数据中心云化趋势已经确立,私有云对接这个场景中,软件定义存储可与同样基于软件定义的计算、网络进行深度融合于一体,软件定义存储的大容量、高安全性、高扩展性、性能线性增长等特性完美贴合私有云需要的存储特性。

图片来源网络

基于KVM虚拟化的云计算技术如OpenStack,已经能够很好的将主流的商业分布式软件定义存储通过RBD驱动,用于为KVM虚拟机提供健壮灵活的块存储支持,可以满足金融机构对存储可靠性和高性能的要求。

2、内部开发测试场景

对于金融行机构而言,开发测试环境、学习实验环境等都是技术预研的重要前沿阵地,分布式存储技术在测试场景的使用广度和深度,决定了以后投入生产环境的稳定性和匹配度。

比如,OLAP(联机分析处理)和OLTP(联机事物处理)。这两大类业务的IO需求有共性也有差异,二者对高并发IOPS都有高要求,而OLTP对时延的要求和OLAP对带宽的要求则彼此有所侧重。

通过部署分布式SDS,在分布式客户端缓存,降低存储时延,满足OLTP需求,亦可满足OLAP所要求的大并发MBPS,高计算和存储带宽、高IOPS并发的要求。

3、数据分层和数据备份归档场景

借助软件定义存储自身的分布式特点,可独立或与备份软件相配合,为生产系统的主用存储提供更为安全的数据备份服务。

随着各主流备份软件对S3接口的支持,采用SDS对象存储作为离线数据中心的温冷层、第二存储或者备份归档存储,既是对现有业务数据备份归档的补强,也可以视为传统金融机构在迈出寻找对象存储使用场景乃至构建的明智无风险的坚实第一步。

4、数据高可用需求场景

金融机构的一些业务天生就需要分布式存储来满足业务逻辑,比如保险行业的远程核保理赔,往往是理赔专员所在的业务处理中心和各种结构化非结构化数据的采集存放都不在同一物理地点。而理赔业务天生是对数据的可用性需求较高的业务系统。

软件定义存储天然可以将非结构化数据进行切分然后松耦合运行,采用无中心节点的设计,将数据进行切分以多副本的形式存放在不同的硬盘、节点、机架上。

即使某个节点出现故障,业务也可以正常运行,进而保证数据的高可用性;多个城市的业务站点可实时调取拼接存放的切片副本,从而保证业务的连续性。

5、容器使用场景

以Docker为代表的容器技术在诞生伊始,就很好地拥抱了分布式存储技术。随着微服务生效,容器从原先的无状态轻量化部署为主,在金融业场景已经逐步过渡到有状态和带数据库有数据持久化需求的阶段。需要的持久化存储就需要依赖分布式存储。

目前K8S为最主流代表的容器编排系统可以很方便的使用各种主流的商业分布式存储技术。而XSKY软件定义存储在业内率先支持代表未来容器数据持久化事实标准的Kubernetes CSI接口驱动,并通过Kubernetes CSI官方认证(相关链接:https://kubernetes-csi.github.io/docs/drivers.html)。

XSKY基于CSI的容器存储方案

6、文件共享和企业网盘场景

传统的文件共享主要通过共享文件系统、或者FTP来解决。共享文件系统为了确保不同业务间的数据安全隔离,只能为一类业务系统建立独占的共享文件系统,共享范围受限,成本高昂,并且缺少比较好安全管控手段(如白名单)。

分布式存储,特别是对象存储就比较适合这种场景,它不存在单点性能瓶颈,分布式的性能和可靠性也会更高,同时还能提供多租户的隔离机制。

 

小结

从以上的场景总结归纳看出,分布式SDS和传统集中式存储在金融行业短期内并不是你死我活的竞争或替代关系,正所谓“尺有所短,寸有所长”,如何在传统金融业数据中心的云化转型之路上把SDS用好用活,是业内所有IT决策人、架构师和SDS厂商的共同使命和课题。

——未完待续——