导读 对于保持数据中心灾难恢复和业务连续性的组织和人员来说,数据中心标准机构Uptime Institute最近发布的一份名为 “疫情之后的数据中心”调查报告可能会让他们有些不安。报告指出,“在我们的分析中有一个重要的假设,我们认为,冠状病毒疫情只是众多流行疾病之一,今后将会面临更多的灾害和疫情。”

直到现在,很多人一直没有意识到冠状病毒疫情可能带来的影响。现在,他们对继续实施控制疫情所需的限制措施感到不耐烦,但可能不得不面对一个现实,这样的事件以后还会发生。从现在开始,人们可能生活在疫情的阴影下。

对于数据中心行业关键基础设施的业务连续性管理人员来说,用户的业务连续性取决于数据中心的连续性,其中包括云计算和托管提供商的云服务。企业必须考虑到数据中心在其业务连续性中发挥的关键作用,特别是在疫情期间。

业务连续性的新常态

疫情不仅给业务连续性带来了独特的挑战,而且从购物到员工会议,从物理世界转移到虚拟世界,这些都增加了对数据中心应用程序的需求,还迫使组织在灾难恢复计划的响应阶段运行数月或数年的时间。

这意味着在今年的大部分时间里,人们一直处于多重灾难模式,例如美国在应对飓风和野火之类的短期灾害事件的同时,还需要防范冠状病毒疫情。这可能代表业务连续性的新常态。

业务连续性的优秀实践

在多重灾难期间维护数据中心的连续性需要依赖数据中心的组织、其云计算和托管提供商以及数据中心设备和服务提供商之间进行协作。以下是能够在双重灾难期间为数据中心和和客户业务保持连续性的五种优秀实践:

(1)主动和客户沟通

从今年年初开始,冠状病毒疫情就一直受到业务连续性专业人员的关注。数据中心运营商与云计算和托管服务提供商积极开展合作,以确保对此做好准备。例如,计划在疫情期间实施虚拟桌面基础设施,以便员工在家远程工作,并且需要确保合作伙伴可以提供支持该计划所需的能力。为此,数据中心运营商需要尽早在计划过程中与客户进行沟通,并试图预测他们的需求。

(2)加强电源冗余

在评估潜在的数据中心合作伙伴时,首先要了解的是电源架构。例如是否具有必要的冗余、备用电源系统及其适当的过程,以在发生电网故障时提供电力供应的连续性?数据中心运营商需要注意的是应对停电(例如UPS电源发生故障或发电机无法按计划启动)带来的连续性挑战。还要确保电力来源的多样性,以最大程度地减少发生大范围电网故障的风险。

(3)持续监控设备

持续监控有助于数据中心运营商应对疫情期间发生的电力容量波动。通过了解电力容量的应用情况,数据中心运营商可以与提供商开展合作,及时提升新的电力容量。并希望数据中心合作伙伴在其关键基础设施方面也能做到这一点。事实证明,在疫情持续蔓延期间,越来越多的设备监控实施以及向“智能手”管理的转变对数据中心运营商及其客户具有重要意义。

(4)保持容量弹性

在疫情期间,云计算服务的可用性一直是用户开展业务的救命稻草。但是,依靠云计算服务意味着,随着用户对容量的需求增长,数据中心运营商必须获得更多的可用资源。可以通过优先考虑用户需求并与合作伙伴紧密合作来应对这一挑战。数据中心运营商还必须确保能够为行业用户提供继续扩展可用容量所需的关键基础设施。这包括工厂生产预先设计的数据中心模块和设施的能力。这些预制系统使云计算和托管服务提供商能够比使用传统流程更快地获得新容量,同时降低了部署所需的复杂性和劳动力。

(5)制定服务计划

诸如维护数据中心电源和制冷基础设施所需的专门服务对于受到自然灾害影响的数据中心的安全恢复至关重要。但是,当面对疫情和自然灾害时,技术专家可能无法前往灾区解决问题。业务连续性计划的重要组成部分是确保数据中心运营商在当地获得专家的协助帮助客户进行恢复。

无法保证数据中心运营的连续性就无法实现用户的业务连续性。为了应对发生的灾难,需要维持这些资源以保持业务连续性。但是,这一目标只在更大目标的范围内才重要:确保客户最需要时可以采用数据中心运营商提供的工程、制造和服务资源。

原文来自:https://server.51cto.com/NGDC-630527.htm

本文地址:https://www.linuxprobe.com/data-center-disaster-tolerance.html编辑:KSJXAXOAS,审核员:清蒸github

Linux命令大全:https://www.linuxcool.com/

Linux系统大全:https://www.linuxdown.com/

红帽认证RHCE考试心得:https://www.rhce.net/