TechTarget中国网站推荐

如何将损失减少 企业灾难恢复计划7步曲

2008-8-5  选择字号:  | |
打印本文章

  正如现实生活中其它事物的不可预料性一样,企业很难预先知道其网络、数据中心运作过程中何时会受到威胁。

  但减轻灾难的后果并不是一个轻松的过程。下面笔者给出可以帮助企业提供实用指南并实现高效的业务连续性和灾难恢复计划的七个步骤:

  第一步:承认灾难的可能性

  业务连续性及灾难恢复的第一步是承认自己的单位会碰到可以损害企业发展的现实性威胁。如果企业没有在一个高级的层次上采取这一步,其它的步骤就免谈。

  第二步:列表并分类企业面临的威胁

  企业及其社会环境的性质能够影响一个单位所面临的威胁类型。在列示了威胁之后,单位应当根据这些威胁对不同系统的可能影响对其分类。应当在灾难的响应成本和可容忍的“宕机时间”之间实现平衡,可容忍的“宕机时间”越少,则企业就需要越多的成本来创建恰当的响应。比如,一些系统必须在几分钟或几秒内实现功能恢复,还有一些系统可容忍的“宕机时间”为几小时,还有其它系统即使“宕机时间”多达几天也不会产生严重的后果。

  第三步:概要描述单位的业务连续性和灾难恢复技术的基础结构

  业务连续性和灾难恢复技术基础结构的关键技术要素由以下几部分组成:关键数据中心、一个可以备份主要数据中心资源的远程站点、高带宽的网络连接等部分组成。在整个数据中心,业务连续性和灾难恢复的最佳策略都要遵循所有要素成分都保持冗余性的观点。在生产性和备份数据设施中都应当运行多台主机和服务器。如果一个生产性系统的一个组件碰到了一个问题,此系统组件就立即将其功能转移给本地的备份系统,这可以作为对付灾难的第一道防线。

  在业务连续性和灾难恢复策略中,最关键的要素之一就是电源。根据调查,电力故障是最为常见的也是可预防的中断性故障。

  不管企业的网络带宽多么大,如果一个粗心大意的施工人员偶然弄断了光纤,其作用也就寿终正寝了。网络的连接不但要足够,还要在一个更宽广的WAN技术范围内遵循不同的途径,避免业务限于停顿。

  第四步:清查单位的IT资产

  一旦单位已经草拟了其业务连续性和灾难恢复基础结构的拓扑,下一步就是要制定IT资产的一个精确而详细的目录。这就使得单位能够理解需要保护的资源和业务过程。

  现在有不少业务管理工具有助于制定和维护IT资源的精确目录。这些工具的厂商都提供了一些依靠软件代理来优化IT基础结构的工具模块,并可将硬件和软件资产的细节及其配置参数存储到配置管理数据库中(CMDB)。

  第五步:设置服务水平期望并定义意外事故策略

  配置管理数据库中(CMDB)不但存储着单位软件和硬件资产的细节信息,还包含着服务水平的约定要求信息,这些约定要求可以定义正常运行时间及这些资源的恢复参数。回想前面的第二步,高级管理部门对服务水平期望作出要求是很重要的,因为这些能够决定在某次故障中的5分钟内或5小时之内某种特定的资产是否必须启动和运行。这种决定可以直接影响高级管理部门日后会寻求支持的业务连续性和灾难恢复的成本支出。

  根据对IT资产及配置和服务水平约定的清晰理解,单位就可以定义意外事故的应对策略。这些策略必须得到主管人员的支持,因而需要将IT资产的性能直接与企业需求联系起来。为了形成这种重要的联系,单位需要执行业务影响分析来充实系统需求、过程、系统交互关系的细节。主管人员必须理解系统瘫痪的后果,以便于支持意外事故的应对策略。

  第六步:制定一个业务连续性和灾难恢复的计划

  意外事故的应对计划应当直接根据意外事故的应对策略,详细表述不同部门和个人的角色和责任,以保持技术系统的可用性,并阐明紧急情况下恢复IT系统的过程。意外事故的应对计划的关键元素还包括资源需求、培训需要、培训练习和测试的频率、维护时间表、数据库备份的时间表等。

  意外事故的应对计划的阶段包括以下几个方面,一是灾难降临时的通知过程,二是应急团队动员后的恢复过程,三是回归正常运作过程。

  第七步:测试业务连续性和灾难恢复计划

  在定制了正式的策略和过程之后,最为重要然而却最容易被忽略的一个方面是灾难恢复计划。企业必须从一开始就测试其计划的完整性和有效性,然后再在运作过程中重新测试,以确保对IT基础结构和业务过程的日后改变不会产生策略改变的需要。

  此外,单位应当创建测试平台,以精确地反映日常的业务条件,以使演练可以模拟真实的条件。

  在当今复杂的条件下,要让企业防御每一种灾难事故确实有点儿困难。但是,在无法预料的事情发生后,如果企业采用了恰当的技术、清晰的服务水平期望、实用的恢复策略,再通过灾难恢复计划和严格的测试方法,单位就可以将灾难对业务的影响降至最低。

原文出处:http://www.51cto.com/art/200807/79102.htm
来源:51cto    
有人说“云计算”有一天或许可以帮我们减少电子废弃物的排放。恐怕只有当电子计算机被植入我们人类的大脑、或是电子废弃物跟着我们进入坟墓的时候这一天才会来临。
根据需求和可应用的威胁灾难恢复(DR)计划和战略包含了从简单直接的到复杂的部分以及所有相关部分。下面是制定DR计划时需要考虑的几件事情。
为了经受得住那些意料之外的灾难,中小型企业(SMBs)开始计划增强自身的迅速恢复灾难的能力。对于中小企业来说,最大的挑战就是要以低成本、易于控制的方式来进行灾难恢复。
在理想状况下,周密的灾难恢复计划应包括一系列能够迅速恢复企业关键任务相关应用程序的策略。然而,对于许多CIO们来讲,对一些个别关键进程的恢复还不是考虑的重点。
大多数企业CIO都清楚关于DR测试的一点负面消息:传统DR测试方法的作用变得越来越弱。如今复杂的数据环境使你很难对灾难恢复进行真正的模拟。
业务流程管理(BPM)是一个描述一组服务和工具的一般名词,这些服务和工具为显式的流程管理(如流程的分析、定义、执行、监视和管理)提供支持。业务流程管理(business process management,BPM)不仅仅只是作为一种工具,同时也作为一门科学。BPM能使企业流程更加有效,更加高效地适应不断变化的环境。
灾难恢复(Disaster Recovery)则可将信息系统从灾难 造成的故障或瘫痪状态恢复到可正常运行状态,并将其支持的业务功能从灾难造成的不正常状态恢复到可接受状态。可以说,灾难恢复是信息系统安全的最后防线。
随着电子邮件成为全球企业内部交流、以及企业与外部(包括客户和商业伙伴)信息往来的最主要方式之一,电子邮件数量快速增长,如何安全高效地管理邮件信息,如何从大量邮件中快速搜索出所需的历史邮件和附件,是企业信息管理必须要面对的问题。
最新更新
技巧
在金融海啸的影响下,所有的企业都在想法让各部门tighten the belt过日子,IT当然也不能例外。那么IT如何削减成本呢?Gartner给IT高管们支了20招:
IT要省电,可以从IT设备、机柜与机房下手,但要彻底解决IT的耗电量问题,就要从耗电的IT设备下手,如果能解决服务器的耗电量,相对来说,就可减轻机柜与机房的节能设计。
如何以最快、最直接、最见效的方式降低企业的PC机、服务器等IT产品的能耗。本文整理出由小至大的IT省电秘招,让IT人员可以了解到必须要考虑哪些IT节能方案。
ERP是大中型企业的事情,那么小企业也需要ERP管理吗?这看似是个极其简单的问题,可真正去思考的人并不多。这也是衡量小企业是否需要上ERP的根据。
制造业高速发展的这种趋势,给企业管理层带来了严峻的挑战,同时也有机遇,特别是生产计划的从事者,面对市场的变幻莫测,生产计划排程的技术性更加复杂。