东台市人民医院信息系统数据容灾解决方案
需求分析 系统现状 医院院区机房目前有5套重要业务系统,分别是HIS、EMR、LIS、PACS、OA等系统,环境部署如下: 业务系统环境如下: 安全隐患 医院的信息系统虽然做了一定的保护措施,例如数据库服务器做了双机热备,但是显然存在着非常大的风险。 1、如SQLserver数据库发生不稳定,则会造成业务系统中断; 2、即便采取定时备份,也存在备份期间数据丢失,还原导致大量重要数据丢失等情况; 3、SQLserver数据库发生数据损坏或者丢失,需要还原数据库才能使用,这个过程花费时间很长,还原效果不确定; 4、由于软硬件、病毒原因造成的SQLserver数据的逻辑错误; 5、光纤连接发生故障,服务器与存储断开连接,导致业务系统瘫痪; 6、服务器感染病毒或软件原因导致的数据丢失; 7、人为的误操作导致的数据被删除或修改; SQLserver数据库中数据是医院信息系统的关键业务数据,这些系统一旦出现以上7种情况导致的服务器无法访问或数据丢失,如果不能在短时间内恢复系统或启用备用系统接替,就会带来严重的后果。 需求分析 RTO(RecoveryTimeObject,恢复时间目标) RTO是指“将信息系统从灾难造成的故障或瘫痪状态恢复到可正常运行状态,并将其支持的业务功能从灾难造成的不正常状态恢复到可接受状态”所需时间,其中包括备份数据恢复到可用状态所需时间、数据处理系统切换时间、以及备用网络切换时间等,该指标用以衡量容灾方案的业务恢复能力。 RPO(RecoveryPointTime,恢复点目标) RPO是指业务系统所允许的灾难过程中的最大数据丢失量(以时间来度量),这是一个与数据备份系统所选用的技术有密切关系的指标,用以衡量灾难恢复方案的数据冗余备份能力。 容灾半径 容灾半径是指生产中心和灾备中心之间的直线距离,用以衡量容灾方案所能防御的灾难 影响范围。 显然,具有零RTO、零RPO和大容灾半径的灾难恢复方案是用户最期望的,但受系统性能要求、适用技术及成本等方面的约束,这种方案实际上是不大可行的。所以,用户在选择容灾方案时应该综合考虑灾难的发生概率、灾难对数据的破坏力、数据所支撑业务的重要性、适用的技术措施及自身所能承受的成本等多种因素,理性地作出选择。 根据以上指标,结合用户实际需求,总结出需求分析表: 技术方案 灾备系统网络设计 构建一套异地灾备系统,需要二台硬件服务器,其中一台灾备硬件作为HIS(EMR)容灾服务器(为了节省硬件投资,可以利用HIS旧系统数据库服务器,建议进行硬件升级),一旦HIS(EMR)系统发生故障可以立即使用异地灾备系统,保证业务连续运行,保障数据不丢失; 对于LIS、PACS、OA等业务系统,采用浪擎D实时备份软硬一体化方案,将LIS、PACS、OA等业务生产数据实时复制到浪擎提供的硬件服务器中(不需要另外购买硬件服务器),保障数据不丢失; 将旧系统的数据库服务器、浪擎提供的硬件服务器移至异地容灾机房,将生产机房和容灾机房连入局域网内。部署浪擎镜像软件,以及D实时备份软件,将数据从生产系统实时复制至备用系统。网络拓扑和部署如下: 工作流程 在HIS(EMR)生产机上分别安装A镜像系统客户端软件,在HIS(EMR)容灾服务器上安装A镜像服务器端软件以及Web监控界面。 在LIS、PACS、OA等业务系统服务器上安装D实时备份客户端软件,在浪擎一体化设备安装D实时备份服务器端软件和恢复端软件。 配置A镜像客户端软件连接至A镜像服务器端软件;配置D实时备份客户端软件连接至D实时备份服务器端软件,实现实时复制。总体拓扑图如下: 当HIS(EMR)生产服务器处于正常工作状态时,当生产端代理检测到主存储数据变化后,通过A镜像软件将捕获变化的数据实时的复制到备用服务器上并写进数据库,实现了实时镜像。 当LIS、PACS、OA等业务系统生产服务器处于正常状态,通过D实时备份软件将捕获变化的数据实时的复制到备用存储上,实现实时复制,保证数据不丢; HIS(EMR)系统复制技术处于最高等级—-应用级,复制的数据是数据库事务,是属于应用层;备用系统处于在线运行状态,生产端任何数据变化通过WEB管理界面可对实时复制的数据在线查询,可见、可验证。从而为客户构建一套放心的容灾系统、完全保障数据库数据的完整性,在生产端的数据实时复制到备用端的过程中,当HIS(EMR)、LIS等业务系统网络发生故障、电源断电时;待网络、电源修复之后可接替断网、断电前进行续传,完全保障数据不丢失。 容灾接管(以HIS为例) 1、下面以HIS数据库容灾为例说明在线式应用级容灾的工作流程。 1)当主服务器处于正常工作状态时,把主服务器的数据库镜像代理连接至镜像服务器。当镜像代理检测到主存储数据变化后,将捕获变化的数据实时的复制到备用存储上。实现了实时的复制,具体部署如下图: 镜像架构图1 2)当主服务器停止服务,即主服务器无法提供业务系统服务的时候,镜像服务可通过自动切换或手动切换直接接替主备服务器工作保障业务系统的持续运行,具体部署如下图: 镜像架构图2 3)当主服务器恢复工作后,可通过MCenter软件的一键回切工具,使其备端产生的数据回切到修复好的生产机,回切期间不停止业务。 回切是一个反向的追逐式全量的过程,无需重新安装软件和配置,将备端数据同步到源端。 具体部署如下图: 镜像架构图3 通过以上3点保证了备用存储上的数据和主存储上的数据完全一致。避免了主存储的单点故障。 管理端可部署在备用服务器上或系统管理员主机上。 同时与一般的cluster不同,浪擎系统不采用共享存储模式,首先避免了硬件方面的巨量投资;其次避免了由于共享存储硬件或者连接共享存储硬件链路的故障引起的业务系统中断,避免了单点故障。 系统管理员可通过管理端配置镜像策略、全量和增量作业等。 容灾系统功能、优势 功能: l当HIS(EMR)主系统发生故障时,可以立刻使用备用系统顶替使用,保证业务连续不断的运行,实现“零恢复”容灾; l对于HIS(EMR)业务系统的A镜像软件,备端数据库在线状态,可实现生产查询相分离; l对LIS等业务系统进行实时恢复,减小恢复时间和业务接管时间; l将生产机数据实时备份至备用存储,保证数据不丢失,实现“零丢失”容灾; l如果出现误操作,可以使用备份数据将数据库恢复至任意时间点状态,实现容错; 优势: l实施无需停顿业务系统,适合7X24小时连续运行的业务系统; l不需要主备系统硬件保证一致性,极大的降低系统改造及投入的硬件成本,只需备份存储空间大一点就行; l对网络带宽消耗非常小,不需专用的光纤传输网络,采用实时增量复制技术大大减少了资源的开销,对业务系统性能影响很小; l应用方式多样化,支持多对一、一对多等镜像方式,为后期提供扩展平台; l基于WEB的统一管理平台,负责对服务器、数据库等进行配置,设置镜像策略,并监控复制链运行情况,方便管理; lA镜像构建所见即所得的容灾,备用系统直接处于在线运行的状态,是直接可见、可验证的。不像其他容灾系统,一定要恢复后才能知道备用系统的好坏; lA镜像采用应用级的复制技术,即镜像系统复制的数据是数据库事务,是属于应用层的,从而可以保证数据库数据的完整性; l基于A镜像构建的容灾,一旦主系统发生故障,由于备用系统的数据库直接处于运行状态,无需数据恢复阶段,仅需恢复业务系统即可,所以整个备用系统替换主系统的过程非常快; lD实时备份理解应用系统的每个数据块的含义,从而能将应用系统恢复到一致性状态,总能确保恢复的应用系统是可靠的、可用的。 lD实时备份具备实时恢复功能,客户端恢复软件将最新应用数据恢复到备用服务器上,当主服务器发生故障时,可立即启用备用系统,实现无需恢复的备用系统; lD实时备份将数据块一一存储起来,可以手工恢复到任意时间点,实现容错目的; l存储端自动的、智能的合成增量版本,使得恢复路径可选用全量加增量再加小段数据块的恢复路径,使得恢复路径减少99%,从而极大的加快恢复速度; lD实时备份存储将历史的全量或增量版本保留起来以供恢复,这一功能可替代传统的备份功能。根据可用存储空间大小,可设置历史版本保留数量和时间; lD实时备份OOF(一次化全量备份)特性指备份系统对应用系统使用一次全量备份后一直使用增量备份,也可实现实时备份和快速恢复功能,从而大大减少网络流量; l软硬一体使其模块化设计与冗余高可靠设计保障存储的稳定性; l硬件中内嵌全平台、全功能的实时备份软件,使其容灾备份更加可靠、稳定; l全面的、便捷的管理平台。 下图为镜像系统管理界面截图: 监控配置示意图 Web可监控全网所有镜像代理、镜像服务器的工作状态以及所有复制任务。复制任务监控信息包括: 编号:根据任务复制的顺序来排序的。 类型:模块类型,有文件,SQLSERVER和ORACLE三种。 服务器:镜像服务器所在服务器IP。 目标数据库:镜像服务器端备份数据库的名称。 执行内容:具体复制的内容,数据库监控的是SQL语句,文件监控的是复制的文件名。 开始时间:任务开始执行的时间。 结束时间:任务执行结束的时间。 状态:任务执行完成后的状态,如果复制成功显示为成功,失败显示的是失败。 赞赏 |
转载请注明地址:http://www.fusanghuae.com/fshrybw/3573.html
- 上一篇文章: 东台网20万条孩子信息被卖精确到
- 下一篇文章: 东台最新招聘信息20180628