不可能背后的可能:四地五层的冗余解决方案

日期: 2010-05-19 作者:Linda Tucci翻译:秦明焓 来源:TechTarget中国 英文

在一些组织机构看来,虽然其分公司或办事处拥有相应的灾备方案,但灾难一旦降临,恐怕还是只能听天由命。在美国癌症治疗中心(CTCA)的信息总监Chad Eckes看来,这是绝对无法接受的。Chad Eckes认为,既然CTCA拥有着“让每位病患宾至如归”的崇高使命,那么其IT系统也必须足够强大以支持这一理想的实现,具体说来就是:全面实现无纸化健康记录。   “我们对患者的承诺是:随时随地能够访问自己的健康/疾病记录,”Eckes明确表示道。

Eckes是2005年进入CTCA的,职责是负责这一盈利机构的数字化/无纸化办公的全面改造。   CTCA的分部遍及芝加哥、费城、塔尔萨(俄克拉荷马州)及菲尼克……

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

在一些组织机构看来,虽然其分公司或办事处拥有相应的灾备方案,但灾难一旦降临,恐怕还是只能听天由命。在美国癌症治疗中心(CTCA)的信息总监Chad Eckes看来,这是绝对无法接受的。Chad Eckes认为,既然CTCA拥有着“让每位病患宾至如归”的崇高使命,那么其IT系统也必须足够强大以支持这一理想的实现,具体说来就是:全面实现无纸化健康记录。

  “我们对患者的承诺是:随时随地能够访问自己的健康/疾病记录,”Eckes明确表示道。Eckes是2005年进入CTCA的,职责是负责这一盈利机构的数字化/无纸化办公的全面改造。

  CTCA的分部遍及芝加哥、费城、塔尔萨(俄克拉荷马州)及菲尼克斯(亚利桑那州),病患需要平均驱程500英里去就诊,一旦需要在CTCA分部间转院治疗,路程就远远不止这个数。因此很多时候大家戏称CTCA为患者治疗的诀窍就是“让他们跑跑腿”。可想而知,如果办公仍是传统的纸质化,病患和医师根本无法接受。

  实现无纸化的过程包含着更大风险:电子健康记录系统绝不可停运,电子病历系统不仅不能出错而且必须保证访问安全,所有的数据系统、电子设备必须保持良好的连通状态准备随时出现的数据上传下载。

  “正是为了满足这些苛刻的条件,我们一开始就集中精力来规划如何实现一个高度冗余的基础设施,以保证业务连续性完全不受影响。”Eckes总结到。

  集中式数据中心的关键词-冗余

  CCTA因为其医院分布广泛却共享同一医患记录,所以需要有集中式的数据中心。但是这也会增加风险。“如果一个应用出现了故障,受影响的不是一家医院而是我们所有的四个健康中心,”Eckes解释道。

  因此,CCTA为各种系统数据构建了4+1层冗余-4层基本冗余,1层为最坏情况做准备的额外冗余-来保证业务的完全可靠:

  1. 每例生产系统均布置成集群环境,一旦主系统出现故障,集群的辅系统可以照常运行;
  2. 所有新生数据均被立即热备份到镜像数据中心,一旦主数据中心停电,CCTA的业务可以无中断地转移到镜像数据中心,数据也不会丢失。CCTA的主、镜像数据中心之间只有59英里之遥,以保证数据传输的及时无误。“这是我们研究后的最佳距离-太近了没有了‘灾备’的意义,太远了成本增加数据传输的可靠性也降低。”
  3. 数据备份的存储介质是磁盘。“磁盘对拷速度是毫无疑问的快,所以我们可以立即从备份恢复数据或转移业务到镜像中心。我们保证数据在磁盘上停留7天,然后转入磁带存档。”CCTA每天的数据增量大约是4万亿字节(4TB)。
  4. 标准的磁带存档被保存在芝加哥市中心的一处地下室里。“从成本角度看我们不可能全用磁盘存档数据,那太不现实了。采用磁带存档还能防止,一旦两个数据中心同时受灾数据便无处可逃。”
  5. 存档数据一律为PDF格式。每隔4小时,CTCA各分部新增的所有医患记录会被统一转换成PDF文件,并保存在此分部的一台专属服务器上。最糟的情况一旦出现,工作人员会从这些服务器上将病患的相关录全部打印出来,以保证其后续治疗的合理可靠。

  采纳以上所有措施的意义是:一旦CTCA损失了其主数据中心,所有系统均能在最长两小时内启动、运营,数据丢失率因为实时热备份所以降低到零。

  控制无序

  实现以上5层冗余已经相当复杂了,实现网络冗余则更为复杂。而且网络冗余必须实现,否则灾备恢复的成功永远得不到保证。在CCTA内部实现局域网(LAN)级别的冗余还算简单,在现代都市里实现广域网(WAN)级别的冗余则困难得无以复加。

  “我们设计了两条彼此独立对等的WAN数据线路-后来才知道我们的这个设计是全芝加哥地区最复杂的,”Eckes言语之间止不住的自豪。两条WAN分别由AT&T和Qwest设计,每条线路带宽都是20M字节/秒,能“独自畅通无阻地运行CCTA的所有数据”。两条WAN运营在不同的光纤设备上,以保证“两条线路互不影响”。两条WAN更从交付伊始便保持同步运行。

  组织使命决定灾备方案

  CCTA的IT团队包括Eckes在内共有84人。Eckes表示,是CCTA的使命,决定了他和其部下排除万难,齐心协力地规划并实现了上述的灾备体系。

  “以上所讲的,是一直以来我们IT团队所不断扪心自问的答案。我们自问:‘如果我们的父母在这里就诊,我们难道不希望他们能得到最好的健康追踪和持续治疗么?既希望如此,我们难道不应该将CCTA的IT系统打造得尽善尽美么?’”

  “因此,我们将‘尽善尽美’这一目标明确为:100%的系统误故障运行,”他强调道。是的,有很多搞IT的认为这一目标根本不可能实现,“但是为什么你硬要揪住那看似的一点不可能不放呢?我们利用冗余和其他一切先进手段,不断朝向这个目标迈进。”

作者

Linda Tucci
Linda Tucci

Executive Editor Linda Tucci oversees news and e-zine projects for SearchCIO.com and SearchCIO-Midmarket.com. She has covered CIO strategy since joining TechTarget in 2005, focusing most recently on big data, mobile computing and social media. She also writes frequently about the CIO role and CIO careers for SearchCIO.com's weekly CIO Matters column. Prior to joining TechTarget she was a business columnist for the St. Louis Post-Dispatch. Her freelance work has appeared in The Boston Globe and T

翻译

秦明焓
秦明焓

HP服务器产品架构师。

相关推荐

  • 教你如何规避五个常见灾难恢复陷阱

    TechTarget最近在社交媒体Twitter上发起关于灾难恢复计划的讨论,很多从业人员以及专家们,包括特别专家Paul Kirvan(他是一位拥有超过20年业务连续性和灾难恢复经验的独立顾问和审计师),一起分享了他们的建议和想法,比如如何安排灾难恢复(DR)测试。

  • 小企业环境如何避免服务器合并和虚拟化

    对很多公司来说,服务器虚拟化意味着合并。通常,服务器的合并会带来性能和可用性问题。避免服务器合并的时间决定于在一台实体机上可放多少台虚拟机……

  • 美航订票故障警示:IT投入不足后患无穷

    美航糟糕的运营状况极大影响到企业IT系统的正常运营,缺乏足够的预算,无力完成IT系统的部署更新,可谓隐患重重。

  • 信息化内参(3):未雨当绸缪,备份要抓紧

    企业需要面对的是当微软不再提供Windows XP安全更新时,企业的信息和数据安全如何保障?从现在开始,备份和转移数据吧!虚拟化和云备份或许是不错的选择。