XSKY助力中国人民银行太原中心支行分布式存储架构转型

2020年12月 · XSKY

写在前面

中国人民银行太原中心支行分布式存储项目是XSKY公司级重点项目,经过与客户长时间、多频次的沟通,XSKY与人行太原中心支行在未来存储选型,架构延续方面达成了架构共识。特别是通过分布式架构来提升人行IT架构RTO、RPO能力,提高业务连续性,并且在保证稳定、可延续性的前提下,稳步推进数据安全底座。人行太原中心支行分布式存储项目也是XSKY在山西金融行业首个采用直投方式合作的项目,通过XSKY专业的服务能力,保证项目整体成效。

客户介绍

中国人民银行太原中心支行。作为中国人民银行的派出机构,人民银行太原中心支行接受中国人民银行总行的统一领导和管理。根据人民银行总行的授权,依法贯彻执行国家的货币政策、维护所在省(区、市)的金融稳定、提供金融服务、并承办有关业务,为促进全省经济金融发展发挥了重要的作用。

微信图片_20201225144038.jpg

微信图片_20201225143608.png

随着云计算、大数据等数字技术的广泛应用,以及在移动互联网、互联网金融、架构可持续性等内外环境和监管政策的指引和驱动下,监管机构、商业银行、保险、证券、信托等金融行业为了提高信息系统的灵活度、降低成本等,纷纷采取分布式架构和相关技术建设新系统或者重构原有系统。

分布式架构以其横向易扩展、松耦合、高可靠、快速迭代开发等优点,极大契合了提升金融服务产能的需求。信息系统分布式架构转型势在必然。从集中式架构向分布式架构转型,可以实现IT系统的“灵活掌控、降本增效”;

人行太原中心支行经过多年发展,业务系统已经实现全面虚拟化,通过高性能x86服务器与VMware虚拟化的结合承载前端业务,存储使用EMC存储,通过存储双活引擎作为底层数据支撑,保证存储架构的高可用性。随着系统业务以及设备年限的不断增加,人行太原中心支行底层存储资源池急需扩容。基于传统存储多年的使用经验,发现了些问题,具体体现在如下几个方面:

资源弹性差

传统的集中式架构难以弹性伸缩、灵活调配资源,这就造成昂贵主机资源浪费,初次规划按照5年性能峰值和容量购买。

成本高

传统存储相关厂商由于架构的封闭性,形成了事实上的垄断,银行议价能力较低,随着主机运营、扩容、升级换代的成本投入相比开放平台来来说较为昂贵。

运行风险高

移动金融的发展,使得监管银行服务也呈现多渠道、移动化和全天候的特征,银行核心业务系统要做到全年365天×24小时的不间断运行。在集中式架构下,高度集中的银行系统带来风险点的高度集中。传统磁盘阵列较为稳定,然而一旦发生故障,影响的范围更为巨大,这对银行系统的可用性带来了巨大的挑战。

微信图片_20201225143630.png

为了应对上述传统存储挑战,银行系统面临集中式架构转型的问题。从当前技术的成熟度与发展趋势看,分布式架构能够较好地解决上述问题,而且更加契合银行业务系统的发展要求,银行选择转型为分布式架构已经成为一种趋势。

从逻辑架构上看:分布式架构的关键点是业务处理分散在多个节点上,通过相互协同,共同提供服务,物理上分散,逻辑上统一。分布式架构的核心理念是对系统进行拆分并合理地抽取公共服务,实现高内聚低耦合的同时,具备并行处理能力,通过集群化的方式、基于相对廉价的基础设施实现系统的高可用、可扩展。

按照“降本增效”、”循序渐进”的原则,XSKY通过调研人行业务场景和信息化要求,结合现有分布式存储技术,分布式存储转型在保证业务安全的前提下防微杜渐,不急于求成。整体转型思路如下:

1、验证分布式架构可用性:硬件采用通用x86服务器,采用国内主流分布式存储软件,验证分布式架构可行性,迁移部分测试及边缘业务,对整体架构的稳定性进行验证

2、验证分布式软件与业务兼容性:通过已经部署的分布式存储软件,验证存储所提供的软件功能、产品稳定性、灵活程度与人行太原中心支行业务系统的兼容性,特别是在数据保护、软件操作、产品性能、扩展灵活性等方面进行长时间验证。逐步迁移部分灾备及生产业务

3、验证分布式双活能力:通过两地双中心部署分布式存储,通过延展集群的验证分布式存储跨数据中心能力,提升人行太原中心支行应对风险能力,满足业务系统RTO、RPO要求

4、迁移核心业务:通过本地、双中心分布式存储架构验证,迁移核心业务系统,验证整体分布式服务的可用性,迁移核心业务系统,实现分布式存储架构的替换。

微信图片_20201225143636.png

在本次项目中,人行太原中心支行通过4节点2U标准服务器搭建分布式存储集群,压力测试中,基于3节点分布式存储系统,IOPS 4k平均写性能稳定在6.1万、读性能20.8万左右,最高带宽3.6GB/s,产品性能大幅超出项目预期和实际场景需求。并且进行了严格的拔盘、断网、断电源的冗余测试。无论是从性能还是稳定性上看,XSKY分布式存储都能胜任企业各种复杂的工作负载和大规模生产环境的使用。接下来会通过持续性的测试,验证分布式存储企业级功能可用性,并迁移部分生产业务作为匹配性验证,所有测试、迁移、软件验证工作,XSKY原厂工程师全程参与。

微信图片_20201225143642.jpg

XSKY工程师在现场调式

微信图片_20201225143656.png

经过产品安装部署,对基于软件定义的分布式存储进行性能、可靠性、功能验证,在整个部署、验证过程中,对于产品稳定性、性能、操作逻辑的合理性以及与VMware生态的整合能力满意。

随着项目一期的上线,通过利用XSKY-分布式存储功能,实现了VMware存储资源扩展,分布式存储集群中任一节点发生故障,不影响集群对外提供服务的能力,且分布式具备极强的线性扩展能力,能够线性扩展至两地三中心架构,满足RTO、RPO要求。通过分布式存储的建设进一步提高数据中心虚拟化支撑平台底层存储的可用性。

总体来说,基于软件定义存储的改造,客户获得以下收益:

1、解决容量问题:通过本次分布式存储扩展,解决VMware容量需求问题

2、验证分布式架构可用性:验证软件定义的分布式存储可用性,架构的稳定性,分布式存储支持全协议,满足未来业务变革对存储兼容性要求

3、解决存储安全性性能问题:多副本数据冗余保护,保证架构高安全性要求;分布式架构弹性扩展,可持续性架构满足未来高性能,高并发需求

4、成本优势:硬件生命周期后无需迁移数据,更替硬件即可;软硬解耦提高硬件自主选择性

5、存储架构规划:对分布式存储稳定性、性能、提供的功能按照规划分布验证,逐步完成架构转型