新闻动态

BLOG

运维没章法?这锅我不背

2018-05-15 · XSKY

小明最近很忧桑,作为一家大型企业存储管理员的他,早在半年前就向上面提出了存储扩容采购的申请,经历了漫长的决策和招投标流程后,最近被设备供应商告知选定的产品已经停产,这眼瞅着存储池都要写满了,而重新选型按照内控要求还需要再重新跑一遍上述流程……

相信小明同学的遭遇,不是第一个,当然也不会是最后一个。那么问题来了,存储池写满后,来不及增加节点我们怎么办?要坚信办法总比困难多。

「硬盘容量阈值设置」

硬盘容量阈值是指存储池中所有硬盘被写满的阈值,目前XSKY SDS产品系统阈值默认85%。当存储池中有硬盘中的数据量达到该阈值,系统会自动发出告警,用户收到报警后可对存储池进行扩容或在线进行卷迁移等操作。鉴于不同地域不同用户采购周期有所不同,为了给用户扩容留出充裕的时间,XSKY SDS产品允许用户自动调整增大该阈值。

「全向导化在线修改副本」

多副本的存在,是提升分布式系统可靠性、可用性、性能以及可扩展性的必要手段。并且,当遭遇小明类似的困境之时,在紧急情况下,也可以基于XSKY SDS的全向导化在线修改副本功能,临时将三副本在线修改为两副本,为用户获得更多的存储空间,从而为用户设备采购赢得时间。当新采购的设备就绪后,再次利用全向导化在线修改副本手段,恢复更高等级的数据可靠性。

「设备就绪之后」

盼星星,盼月亮,小明最终盼来了新采购的设备,但忧桑的故事却还远没有结束,更大的坑在前面等着他跳下去。

不论传统分布式存储还是SDS,存储扩容或者增加节点都会导致数据的重平衡,这个过程既需要耗费一定时间,同时数据重平衡IO还会导致IO抢占带宽资源的现象,往往会使得业务IO需要等待,延时增大,最终影响业务性能。

为了保证用户体验,在数据重平衡场景下XSKY提供恢复QoS设置,用户可以选择基于业务优先或者是重构优先的策略,保障业务性能下降幅度在可控范围内。

除此之外,对于为应对海量数据而生的对象存储来说,超大规模数据产生的规模效应,海量数据如果还是进行传统扩容的数据重平衡操作,耗费的时间以及对业务所产生的冲击,都将成为“噩梦”般的存在。

XSKY SDS支持对象存储以存储池的级别进行扩容,将新的存储池设置为活动池,原有对象存储池转变成只读的非活动池。扩容后,所有新数据会写入活动池,而数据读取会由活动池和非活动池共同提供。

从硬盘容量阈值设置,全向导化在线修改副本,恢复QoS设置到按池级扩容,这样一套组合拳下来,基本上为用户解决了在存储池空间告急而又来不及增加节点的情况下,尽可能为扩容延长时间,同时降低或者消除扩容时数据重平衡所造成的业务影响。

小明的忧桑之旅至此得以结束,小明和其他内容管理员又可以开始愉快的做朋友。