用户服务体系

按照用户的共有需求,以及业界的通行惯例,XSKY星辰天合的用户服务分为 “在线维保服务”,”续保与扩容”,“现场专家支持” 和 “培训与认证服务” 等类型。

在线维保服务
在线维保服务,是指用户在购买 XSKY 产品后,在产品支持的生命周期及产品服务周期内,XSKY 按照约定的维保服务级别对用户进行的支持服务。
续保与扩容
续保服务,是指用户购买 XSKY 产品维保服务到期后,可选择续购并延长 XSKY 产品的维保服务有效期,在产品支持的生命周期及产品服务周期内,XSKY 按照续购合同约定的维保服务级别为用户提供持续的技术支持服务,以保障用户业务持续运行;扩容服务,是指已购买 XSKY 产品的用户根据自身的业务发展,可以继续购买 XSKY 产品及服务,以保障数据存储空间的容量增涨需求。
现场专家支持
现场专家支持,是指 XSKY星辰天合技术咨询专家亲临用户现场,和用户方一起工作,帮助用户进行规划讨论、架构咨询、系统巡检调优、开发辅助等方面的服务。在服务进行前,XSKY星辰天合服务经理和业务代表会与用户商定服务范围。
培训与认证服务
培训与认证服务,是 XSKY星辰天合为用户提供的系统化和标准化的知识传授服务。XSKY星辰天合认证的讲师将会按照标准的指导教材,在正规的指导实验环境中,涵盖 XSKY星辰天合的产品相关的内容,也包括业界主流的开源云计算架构的内容。

用户服务产品

资深 Ceph 专家服务

服务宗旨

提供资深 Ceph 专家远程或现场的专家服务,针对客户 Ceph 集群重要业务时段、重大 IT 计划变更或故障排查提供 保障服务,保证 Ceph 集群的安全稳定运行,并及时响应、处理可能的已知或未知事件,保证问题解决过程的合理性。

客户受益

Ceph 开源集群在各行各业客户的业务中承担了越来越关键的作用。但客户面对重要的业务时段、重大 IT 变更的过程中 或出现问题时,往往面临没有快速及时的托底服务支持,往往需要四处求助。XSKY星辰天合提供的资深 Ceph 专家服务,为客户 现有的 Ceph 分布式存储集群环境的安全稳定运行进行及时保驾护航,保证客户以最及时的响应度,获取直接的技术支持, 让客户更加聚焦在业务目标本身。

服务简介

XSKY星辰天合利用自身在 Ceph 领域的深厚技术背景,按人天的方式为客户提供的资深 Ceph 专家服务,为客户的 Ceph 集群提 供托底服务,在客户 Ceph 业务的重要时段、关键业务变更过程或出现故障时,即时响应、处理可能的已知或未知事件, 保证问题解决过程的合理性。该服务以及时响应,实时处理的模式,快速解决客户 Ceph 存储集群未知软硬件故障导致的 服务中断,将可能的影响降低到最小。XSKY星辰天合资深专家会深入了解客户 Ceph 存储集群环境,通过信息收集、分析给出优化建议, 并高效地预防问题发生,避免客户环境在关键时段出现各种不良影响。

工作范围

XSKY星辰天合资深 Ceph 专家会对客户现有的 Ceph 存储集群进行深度健康体检,通过远程/现场收集相关信息用于健康分析。 受支持的 Ceph 集群在使用过程中出现的各类非人为故障,由 XSKY星辰天合指定的资深专家对故障进行分析诊断,寻求解决方法。 其结果可能是根据需要向客户提供相关的修正性指导、建议或避免问题的方法、限制使用及进行必要的运行环境变更操作等, 并对现有集群如何增强可靠性给出相关建议。XSKY星辰天合资深 Ceph 专家将通过远程或现场的方式,给客户提供如下建议(但不限于):

  • 为客户解决或解答 Ceph 存储集群故障问题;

  • 协助客户对所报告的问题进行定义及指导客户相关技术人员完成解决问题所需要的相关信息的收集工作;

  • 帮助客户对所报告的问题进行问题根源的分析和诊断,寻求解决方法,可根据需要向客户提供建议解决方案;

  • 在客户要求的情况下,与客户技术人员就当次所发生的故障进行技术交流。

交付内容

  • 现场问题的及时解答,远程定位

  • 现场保障报告:该报告包含 Ceph 现场保障服务中涉及到的 Ceph 存储集群环境健康检查、优化方案和可能的故障问题修复等信息。

  • 培训:针对现场保障过程中发现的问题和改进建议,XSKY星辰天合资深 Ceph 专家将提供必要的培训,以保证客户 Ceph 存储集群环境以最高的效率运行。

  • 定制化运维文档:按客户的需求可提供定制化的运维文档,有针对性的解决用户在特定场景下的运维问题。

服务级别的定义

  • 日常问题:主要指系统在运行过程中所发生的各类报警、报错日志信息等,例如:在不影响业务的情况 下 OSD DOWN/OUT、POOL 容量临近阈值、OSD 用量接近阈值、MON DOWN(MON 节点数依然满足半数以上存活)、 无法响应 Ceph 命令;

  • 紧急故障:主要指 PG 故障、大量 OSD DOWN/OUT 并对业务带来影响,例如:PG stuck、inactive、stale、unclena、peered,MON DOWN(MON 节点数不满足半数以上存活);

  • 重大事故:主要指整个存储系统平台发生宕机等导致系统不可用等情况,例如:MON 灾难性不可恢复故障、数据不一致、数据丢失;

  • 事件值守:针对每年的车展以及项目上线等重大事件,提供专人的现场值守服务(每年 4 个人天)

概要计划

1. 健康检查:重大事件前收集相关信息,并进行健康检查;
2. 分析处理:根据健康检查结果进行分析,给出优化建议;
3. 故障及问题修复:及时处理现场保障服务期间出现的故障和问题。
4. 现场问题的及时解答,远程定位

如何获得

按人天进行统一报价,具体故障操作用人天工时进行抵扣,具体购买方式请联系当地销售人员咨询。

在线咨询:
9:00-18:00
快速响应您的问题

方案咨询

400-016-6101

售后支持

400-606-0072

官方微信