首页 > 技术 > CAE其它 > > 浅析中小企业数据容灾理论和技术

浅析中小企业数据容灾理论和技术

作者:Simwe    来源:万方数据    发布时间:2012-07-17    收藏】 【打印】  复制连接  【 】 我来说两句:(0逛逛论坛

1、引言

随着计算机网络的发展,原来的集中式信息系统逐渐转变成了分布式的网络信息应用系统。同时人类社会对分布式网络系统的依赖程度、可靠性要求也越来越高。特别是称之为关键信息系统的,如金融、电信这样的行业,其企业信息系统往往承载了企业的整个运作过程,因此就对业务系统的可靠性、数据的完整性以及业务的连续性要求很高。据有关报告显示:只有6%的公司在数据丢失后生存下来,43%的公司再也无法重新开业,超过50%的公司会在两到三年后消失。为了保证企业关键数据的完全性和完整性,建立一套完备的容灾系统是企业关键数据的最可靠保证。本文针对数据容灾理论及相关的技术进行分析和研究。

2、容灾的理论

2.1容灾的概念

容灾(disaster tolerance)是一个范畴广泛的概念,从广义上,任何提高系统可靠性与可用性的努力都可称为容灾。从狭义上,容灾是通过在异地建立和维护一个备份存储系统,利用地理上的分离来保证系统和数据对灾难性事件的抵御能力。当灾难发生时,如何能够在最短的时间内使系统恢复正常,保证数据最少丢失,都是容灾技术研究的内容。

2.2容灾的分类

因为灾难所包含的内容较广,容灾所涉及的内容也较多,所以可以从多个角度对容灾进行分类。从距离角度分为木地容灾,近距离容灾,远距离容灾。这三种类型所能容忍的灾难也是不相同的,这与备用系统和生产系统的距离是密切相关的。

从应用角度,容灾系统的实现可分为两个层次:数据容灾和应用容灾。数据容灾指建立一个异地的备份数据系统,备份本地关键应用数据,即数据的异地备份。应用容灾是在数据容灾的基础上,在异地建立一套完整的与本地生产系统相当的备份应用系统(可以互为备份,可以共同工作)。在灾难出现后,远程备份系统迅速接管业务运行。数据容灾是应用容灾的基础,应用容灾是更高层次的容灾系统。

2.3容灾系统的评价指标

容灾系统需要考虑多方面的因素,如备份和恢复数据量大小、灾难发生时数据的丢失量、应用数据中心和备援数据中心之间的地理距离和数据传输方式、灾难发生时所要求的恢复速度和恢复层次、备援中心的管理及投人资金等。根据这些因素和不同的应用场合,容灾备份中心自动异地远程恢复被定义有7层,其中包含了2个技术指标。

一般是以数据丢失量和数据恢复时间作为标准进行评价的,所公认的评价标准是RTO和RPO。

①RPO(Recovery Point Objective):即数据恢复点目标,主要指的是业务系统所能容忍的数据丢失量;

② RTO(Re-coverty Time Objective):即恢复时间目标,主要指的是所能容忍的业务停止服务的最长时间,也就是从灾难发生到业务系统恢复服务功能所需要的最短时间周期。RPO针对的是数据丢失,而RTO针对的是服务丢失,二者没有必然的关联性。

RTO和RPO的确定必须在进行风险分析和业务影响分析后根据不同的业务需求确定。对于不同企业的同一种业务,RTO和RPO的需求也会有所不同。

3、关键技术的分析

用于容灾系统的关键技术主要包含:数据存储管理、数据复制、灾难检测、系统迁移和系统恢复五个方面。在这里只介绍最重要的两个方面。

3.1数据存储管理

数据存储管理,是指对与计算机系统数据存储相关的一系列操作(如备份,归档,恢复等)进行的统一管理,是建立一个容灾系统的重要组成部分。数据存储管理工作包括数据备份、数据恢复、备份索引、备份设备及媒体和灾难恢复等与数据备份相关的所有管理。

(1)数据备份,是指为防止系统出现操作失误或系统故障导致数据丢失,而将全系统或部分数据集合从应用主机的硬盘或阵列复制到其它的存储介质的过程,数据备份是容灾的基石。

(2)数据归档,是将硬盘数据复制到可移动媒体上。与数据备份不同的是,数据归档在完成复制工作后将原始数据从硬盘上删除,释放硬盘空间。

数据备份,是数据存储管理中的一个重要部分。数据备份的评价标准包括备份速度、恢复速度以及数据恢复点。提高数据备份管理的透明性和自动化,管理好各种存储设备,也是需要解决的一个重要问题,而存储虚拟化技术通过将各种异构的存储系统整合成为能够作为单一资源易于管理的单一存储池解决这个问题。

3.2数据复制

数据复制是容灾系统的核心技术,是将一个地点的数据拷贝到另外一个不同的物理点上的过程。数据复制一般分为同步数据复制和异步数据复制。同步数据复制是通过将本地生产数据以完全同步的方式复制到异地,每一本地IO交易均需等待远程复制的完成方予以释放,其特点是基本可以做到零数据丢失;异步数据复制指将本地生产数据以后台同步的方式复制到异地,每一本地IO交易均正常释放,无需等待远程复制的完成。其特点是在灾难发生时,会有少量数据丢失,与网络带宽、网络延迟、I/O吞吐量相关。

实现数据的异地复制,有软件方式和硬件方式两种途径。软件方式,是通过主机端软件来实现。即在主系统和容灾系统的主机上,安装专用的数据复制软件。其优点是与硬件无关,成本较低。缺点是效率较低和可管理性较差。硬件方式,是数据直接在存储设备之间传输,并不依赖主机的管理。这种方式要求在主系统和容灾系统配置上支持这种功能的专用存储设备,所以成本较高。根据复制数据的层次可以分为四种类型:

①硬件级的数据复制;

②操作系统级的复制;

③数据库级的复制;

④业务数据流级复制。

容灾数据复制的性能和网络带宽、复制距离、数据传输方式、数据块打包方式、系统处理能力有关。可以看出,其中通讯问题是影响远程复制效率的最关键因素。

 
分享到: 收藏