对话星辰天合王豪迈:对存储系统的优化永无止境

由 王德清 发布于2021-07-29


数据管理,已经成为了当前企业效率的重要指标之一。

数字经济的不断发展,以及先行者的经验让现在大多数企业清晰的认识到,数据只是存起来是不行的,而是需要将数据用起来挖掘出数据存在的价值。

因为他们发现,那些以大数据为驱动的公司,往往更容易获得客户资源,也更容易提高市场份额。

这一理念的更新直接推动了企业内部 IT 架构、特别是存储系统的向前发展,SDS(软件定义存储)/HCI(超融合架构)逐渐开始取代传统企业存储系统(TESS)。

根据 IDC 中国的统计,2020 年 SDS/HCI 的最新份额是 42.4%,渐渐开始和传统企业存储分庭抗礼。


而对于中国市场,IDC 在 2017 年预测,到 2020 年中国 SDS 市场规模将达到 40 亿。而在随后的 2018 年,IDC 上调了预期,预测 2020 年国内 SDS 市场规模会达到 64 亿。

事实上,IDC 虽然每年都在上调对于中国 SDS 市场规模的预期,最终 2020 年中国 SDS 的市场规模还是超乎了所有人的想象,达到了 107 亿。而这背后,则离不开那些一直在深耕 SDS 市场的企业的努力。

也就在近日,雷锋网与星辰天合 CTO 王豪迈展开了一场深度交流,共同探索中国企业如何在 SDS 领域,打造自己的优势?

如何摆脱 “宿命”

我国《十四五规划》中,将超大规模分布式存储技术创新列在数字经济重点产业云计算专项的首要位置。

回看分布式存储技术的整个发展,在诞生之初就被视为是未来存储的发展方向,其中最为人津津乐道的就是 EMC 收购了以色列软件定义初创公司 ScaleIO。

在 XSKY 成立之时,戴尔斥巨资收购全球最大的数据存储公司 EMC,而这也被业界视为软件定义存储时代到来的标志。

“星辰天合过去是一家以 SDS 分析存储为主切入市场的,然后一直围绕着客户的需求不断的打磨产品” 王豪迈说。

“在此之前,很多公司都是一套业务选择一套存储,但由于软硬件无法解耦,往往都是对象存储所使用的设备,刚上的文件系统就无法使用。”

这直接带来的就是,用户往往需要付出很高的成本来为存储买单,而这也正是星辰天合选择软件定义存储这条赛道的重要原因。

在星辰天合看来,软件定义存储具有的三大优势,必将会让其成为未来存储的最重要的形态,而这三个优势则分别是:

  • 可以通过存储系统实现不同品牌硬件设备的共通、兼容;

  • 打破传统存储技术的局限,通过分布式技术实现存储容量线性扩容,规避数据转移成本及风险;

  • 开发成本低、开发周期短,能够根据实际市场情况增添各种混合功能。

2017 年星辰天合发布了分布式统一存储平台 XEDP 后,舆论却发生了两级分化,一边 “一个数据中心一套存储” 成为各厂商追逐的目标,而另一边,传统存储厂商抨击:“存储就是通用服务器加软件 —— 这是谎言”。

而在国外市场,刚刚冒出头的 SDS 厂商的宿命也都是被传统存储厂商收购,而被收购之后,往往也都被市场逐渐遗忘。

如 ScaleIO 在 2013 年被 EMC 以 2 亿美金收购,虽然当时风光无限。但当 EMC 被 Dell 收购后,ScaleIO 就慢慢退出了市场。先改名为 vFLEX OS,现为 PowerFlex,仅仅作为 Dell EMC PowerFlex 软件定义的基础架构平台的一部分,配合 Dell 的硬件捆绑销售。

想要摆脱这种宿命,在王豪迈看来,就必须要不断的打磨产品,在容量、成本、以及性能的三者中,都能够平衡的一款产品。

同时他们也定下了一个目标:在存储入口要满足大部分公司的存储需求,说白了,XSKY 必须要覆盖到绝大部分行业的协议支持。

而这也让他们更加坚定了软件定义存储这条道路,因为软件通过更新,可以不断的实现这个需求。

如何用一套存储覆盖所有场景?

“让用户用一套存储覆盖所有的场景。” 这是星辰天合这家公司在 Day.1 就决定要做的事情,这也是业界对于存储未来发展所达成的共识。

在产品层面,星辰天合打通了各个产品的壁垒,让用户可以轻松购买业务所需要的存储产品(块存储、文件存储、对象存储),只需要简单的 license 控制跟配置控制就能实现全链转化。

但对于所有行业客户而言,高可用性、高稳定性、高一致性是亘古不变的话题。这也正是需要星辰天合等存储产商真正需要解决的问题。

“我们 XSKY 一直在提升 SDS 的得盘率、性能、扩展性、通用性,以便 SDS 适合更多场景。”

在王豪迈看来,想要在相同可靠性的情况下,得到比三副本更高的得盘率,需要使用 Erase Code (纠删码,简称 EC)。三副本的得盘率是 33.3%,EC 4+2 的得盘率是 66.6%,EC 8+2 的得盘率是 80% 。

但需要注意的是,EC 的优势是高可靠性、高得盘率、大块顺序读写性能高,但缺点是小块随机读写性能较差。

在了解之后,星辰天合从 2016 年开始瞄向了 EC。

“在 2016 年,我们 XSKY SDS 产品的存储池就开始支持 EC,先让我们的用户享受到 EC 的实惠。”

但受限于 EC 的特性,对于块和文件存储,星辰天合只是建议在监控和备份场景中使用 EC 存储池。

针对于对象存储的特点,星辰天合则开发了对象存储小文件归并功能,使之成为 EC 的绝配,两者组合不仅带来高可靠性、高得盘率,也带来了高性能的小文件读写能力。

而为了让块和文件存储也能使用 EC,随后在 2019 年,星辰天合推出了 Boost 存储池功能。

王豪迈介绍,Boost 存储池采用全局分层缓存架构,其中数据层可以使用 EC,同时 Cache 层使用三副本提供高性能的读写能力,这使得 Boost 存储池可以用于块和文件存储的大部分场景。

而这也达成了星辰天合的预期目标,但王豪迈对雷锋网表示,对于存储系统的优化是没有止境的。

星辰天合至此也将目标瞄向了,高负载场景下的 Cache 层。

王豪迈解释到:当 Boost 存储池的 Cache 层被业务写爆时,需要把 Cache 层中的脏数据全速回刷到数据层中,回刷速度就决定了此时存储系统的整体性能。

假如脏数据都是随机小块 IO,那么在回刷的时候,数据层的 HDD 承受的压力也是小块随机写 IO。HDD 的小块随机写性能不高,只有 100 + 的 IOPS,所以整体回刷速度不快,瓶颈反向传导,这就导致此时前端业务也只能以相同的速度写新数据到 Cache 层中。此时:前端业务写性能 == 回刷速度 。

如何才能快速的回刷脏数据,不断腾出 Cache 空间,减小对前端业务性能的影响?则成为了星辰天合接下来的目标。

他们发现,在回刷脏数据时,使用大块顺序往数据层的 HDD 写,回刷速度一定非常高,因为 HDD 的大块顺序写带宽能够达到 80MB/s 以上,能够至少包含 20,480 个 4KB 小块数据,回刷速度比之前提高了 20 + 倍。

基于这个发现,星辰天合又对 Boost 架构进行扩展,并在这个月中旬进行了发布,就是 XSKY XSpeed 架构和功能。

王豪迈介绍,XSKY XSpeed 的核心是 LogAppend 模块,可以把随机小块写 IO 聚合成大块顺序写,然后再回刷到数据层中。数据层的大块顺序写性能很高,所以可以快速把脏数据回刷到数据层,腾出 Cache 空间给前端业务使用。

LogAppend 模块不仅聚合随机小块,而且还对数据进行压缩和重删,为用户节省更多空间。同时,由于 XSpeed 的 LogAppend 模块是在 Cache 层中实现的,所以块和文件存储都可以使用 XSpeed 功能。

据王豪迈表示,在发布之前该产品架构和功能已经在用户场景得以应用,通过实践得到了印证。

而为了保证系统的日常稳定运行,让故障防患于未然,星辰天合打造了亚健康 2.0 监控工具,引入数学模型和统计框架,分析导致系统性能降级的部件级故障和周边系统故障,实现对亚健康网络和磁盘亚健康的监测,对故障部分进行主动隔离,提高系统的健壮性。

性能和成本,另一个永恒不变的话题

在存储领域,介质革命一直都在持续不断的进行,而在这背后的核心就是性能与成本的博弈。

其道理很简单,SCM、SSD 等闪存介质可以为用户带来高性能的同时,往往也都让用户的成本居高不下,因此很多用户只会在核心业务中选择闪存介质的存储来支撑。然而对于用户而言,对于存储性能是一直都无比渴望的。

毫不夸张的说,所有做存储产品的厂商,都一直在死磕闪存介质带来的高成本,但从结果来看,收效甚微。

面对所有厂商都在面对的难题,星辰天合则选择在最近发布的全闪存 XINFINI 星飞选择使用 QLC SSD 支持 TLC/Optane + QLC SSD 分层,兼顾高性能与低成本。

王豪迈对雷锋网表示到,QLC SSD 的成本只是 HDD 的 2 倍,但是在整个性能上基本上不是同一个量级,在读的性能上 QLC SSD 是 HDD 的 500 倍,读与写是 25,时延只有 1/10 多一点,可靠性上面也更高,功耗上只有过去相同流量的功耗的 1/3。

唯一的问题就是 QLC 不能做很长时间擦除写的能力,所以 QLC 的壁垒在于 DWPD 的障碍,XSKY 在 DWPD 障碍上面会进行率先解决,实现 QLC SSD 的在真实的企业数据环境里提出问题。

除此之外,王豪迈也表示对于 QLC 带来的小块随机写寿命问题,XINFINI 通过 XSPEED 的技术把小块随机写变成合成为大块顺序写,同时通过 EC 技术能使得 QLC 更好的用 EC,将成本进一步的下降。

综合来看,相比于业界主力全闪存产品,XINFINI 星飞在数据读写性能方面超过 50%,而硬件成本则下降 40%。

对此王豪迈也坦言,目前市场上对于 QLC 的认知还很低,因此在很长一段时间,星辰天合都会选择采用一体化交付模式,只有当 QLC SSD 真正的走进了千家万户,才能够完全的实现软硬件解耦。

除了介质革命之外,星辰天合也在积极推动存储市场的下沉。

“我们要为大型政企机构提供更专业的技术、产品和服务,也要为广大的下沉市场提供更加便捷、优质的数据服务。”XSKY星辰天合 COO 翟静近日在发布会上表示,中国 2000 多个区县每天产生着海量的数据,成为中国数字化转型升级的中坚力量。而下沉市场更需要自助式管理,便捷运维,快速无缝扩容的数据存储和管理。

对于这一需求,星辰天合还发布了订阅模式下基于云边协同架构的数据管理服务,降低客户获得数据管理服务一次性购置费用,实现 “随需使用、所见即所得” 的使用体验,灵活自如地使用最新的技术架构及应用服务。

而对于下沉的市场的潜力,目前行业的认知依旧有限,有报告称,自 2018 年后线城市数字产业指数持续发力,其中,数字五线城市增幅达 216.57%,大幅领先数字一、二线城市。

由于先行一步,星辰天合的技术、产品和服务已覆盖全国 40 多个重点城市,占据了先机。

洞察行业需求,深入数据全生命周期

IDC 预测,2025 年,全球数据量将达到 175ZB,5 年年均复合增长率 31.8%,而数据中心存储量占比将超过 70%。与此同时,软件定义存储市场也不断超预期发展,整体市场规模将超千亿。

除此之外,新基建也对于数据存储提出了更高的要求,随着数字化转型的不断深入,行业用户的对于数据已经不再只是满足将数据存起来,同时也要将数据用起来。

“软件定义存储,既是创新设施,也是融合设施,更是信息基础设施。通过软件定义的方式,更好的适配开放芯片和硬件,分布式的承载海量数据,并做到数据的长期保存,为数据资产化做好底座。”

在星辰天合 CEO 胥昕看来,在云边协同的技术趋势下,新基建带来的海量结构性数据和非结构性数据,离不开弹性、解锁、可持续的软件定义存储平台做数据承载支撑。

“我们不仅仅做产品、设备的供应,更要提供数据基础设施,以此帮助客户建立数据资产平台,把数据汇聚起来,存好、管理好,最终利用好,实现数据常青。”

这一洞察之下,星辰天合开始与国内头部云厂商对接,打造混合云时代云 - 边 - 端的数据存储与管理协同体系。并形成了 “汇存管用” 为核心的未来产品发展矩阵。

而在此产品发展战略之下,星辰天合看来也可以积极把握住国内信创机遇,大力发展国产自研的核心技术。

对此,中国长城科技集团解决方案部湖南技术中心总经理高晓飞表示:“长城云深度融合 XSKY星辰天合分布式存储系统,为客户构建业务驱动的信创 IT 基础设施。同时,飞腾 CPU 通过与软件定义存储产品完成系统性的互验证与适配,进一步优化一体化系统技术,有效提高相关产品的交付效率,增强关键信息系统基础设施的国产化进程。”

而据雷锋网了解,在去年星辰天合就推出国内首款信创 SDS 存储产品天合翔宇分布式存储系统,并完成了近 20 家国内核心信创生态伙伴的生态适配。目前,星辰天合的信创生态合作伙伴已超过 50 家。

中国基础软件革命仍在继续

得益于数字化转型的加速,我国企业在中国基础软件领域,正在突破大家传统的认知,从以前的不敢想,到现在产品从可用走向了好用,这背后离不开这些公司的创新发展。

尤其是在存储行业,作为数字化转型的基础底座,SDS 纯软形态具有特别的意义,特别在信息创新方面。因为目前的服务器和操作系统的信创平台相对完善,如市场上有很多鲲鹏、飞腾、海光的服务器、再搭配麒麟和统信的操作系统,加上一个适配多种信创平台的 SDS 软件,就可以轻松实现存储的信创。并且由于 SDS 的架构优势,可以让用户从非信创生态平滑演进到信创生态。

可喜的是,我们看到,在这条道路上已经有星辰天合这样的公司,在努力前行,并推动着产业以及生态的发展,从根本上保证这着我国数据的安全。

来源:对话星辰天合王豪迈:对存储系统的优化永无止境

在线咨询:
9:00-18:00
快速响应您的问题

方案咨询

400-016-6101

售后支持

400-606-0072

官方微信