首页 理论教育 数据保护技术:拷贝、备份、复制、镜像和快照

数据保护技术:拷贝、备份、复制、镜像和快照

时间:2023-06-29 理论教育 版权反馈
【摘要】:数据保护技术既是提高数据可用性的重要技术,同时又是保证业务连续性的基础技术。数据保护技术包括拷贝、备份、复制、镜像和快照,也包括传统Client/Server备份模式等,如图6-70所示。适用于无连续性要求、简单小数据量备份或者个人不定期的文件保护需要。能够安全、方便而又高效的恢复数据是备份系统的真正生命所在。表6-14 备份与复制的对比复制技术实现了应用系统在不需要停机的前提下对应用数据进行保护。

数据保护技术:拷贝、备份、复制、镜像和快照

数据保护技术既是提高数据可用性的重要技术,同时又是保证业务连续性的基础技术。数据保护技术包括拷贝、备份、复制、镜像和快照,也包括传统Client/Server备份模式等,如图6-70所示。

(一)拷贝

不能判断数据变化增量,每次拷贝都需要拷贝整个文件或文件夹并覆盖上次拷贝内容。无策略,需手工进行。只支持文件格式,无法拷贝正在使用的文件。当数据量大时,数据拷贝和恢复占有大量应用服务器资源。拷贝技术在软硬件方面投入成本较低,但人力和维护成本较高。适用于无连续性要求、简单小数据量备份或者个人不定期的文件保护需要。

(二)备份

备份是指将数据以某种方式加以保留(将数据的副本保存到另外的介质中),以便在系统遭受破坏或其他特定情况下,重新加以利用的一个过程。备份的目的是重新利用,即备份的核心是恢复。一个无法恢复的备份,对任何系统来说都是毫无意义的。能够安全、方便而又高效的恢复数据是备份系统的真正生命所在。

978-7-111-36226-5-Chapter06-82.jpg

图6-70 Client/Server备份模式示意图

1.备份的特点

1)备份方式支持增量数据保护,可以制定策略自动完成,但增量数据量大,可以对正在使用的数据(如注册表)进行保护。

2)备份数据是磁带格式,不能被应用系统直接访问,在源数据被破坏或丢失时,备份数据必须由备份软件恢复成可用数据,才可让数据处理系统访问。

3)备份时严重占用应用服务器资源,应用系统的性能、带宽等都会受影响,有可能需要应用停机或者在业务量较小的时候进行,与业务连续性矛盾突出。

4)定期需要全备份,不宜用于远距离传输。

5)对系统平台兼容性要求很高,服务器增加,软件成本线性增长。

2.备份系统的组成

备份系统由备份软件、磁带库和备份服务器等3个部分构成。

1)备份软件:具体备份策略的制定、备份介质和管理及一些扩展功能的实现,都由其最终完成。如Netbackup、Networker和Brightstor等。

2)磁带库:磁带库由库体、机械手、磁带机、磁带槽位和磁带等组成,是一个完全自行控制并按照备份软件的策略自动进行工作的体系。

3)备份服务器:安装备份软件的服务器端,在应用服务器端安装备份软件的备户端,按照预先制定的备份策略将数据备份到磁带/磁盘上,为了降低成本通常选用Windows PC机作为备份服务器。

备份技术的备份策略分为三种情况:全备份、增量备份和差量备份。全备份是指对数据的完全备份;增量备份是对上次全备份或增量备份后被修改了的文件做备份,备份数据量小,需要的时间短,但其恢复的时候因需要多份备份数据,出问题的风险也较大;差量备份是指从上次全备份后只备份被修改过的文件,因为只需要对两份磁带(最后一次完全备份和最后一次差量备份)备份,故其恢复速度相对也较快,但每次备份需要的时间也较长。如图6-71 所示为增量备份与差量备份的原理示意图。

978-7-111-36226-5-Chapter06-83.jpg

图6-71 增量备份与差量备份的示意图

3.常见的备份模式

1)LAN备份:备份数据通过LAN传送,备份占用大量LAN带宽,如图6-72所示。

978-7-111-36226-5-Chapter06-84.jpg

图6-72 LAN-Base备份模式

2)LAN Free模式:备份数据通过SAN传送,对LAN的带宽无影响,但需要占用服务器资源,如图6-73所示。

3)Server Free模式:备份数据先在应用服务器的授权下生成快照数据,然后备份数据通过SAN传送,对LAN的带宽无影响,但需要占用备份服务器资源,如图6-74所示。

4)Server Less模式:备份数据直接存入备份存储,对LAN及服务器均无影响,成本高,兼容性低,如图6-75所示。

(三)复制

复制是指利用复制软件/硬件把数据从一个存储区域传输到另一个存储区域(通常是逻辑卷),生成一个数据副本。主卷和复制卷被主机/存储控制识别为一个生产卷和一个备用卷,两者之间业务可以通过卷提升操作进行切换,提高可靠性。主卷在向复制卷复制数据的过程中,可以设置灵活的复制策略,提高复制的效率和兼容性。

复制的策略有策略性复制和自适应复制两类。

978-7-111-36226-5-Chapter06-85.jpg

图6-73 LAN Free备份模式

978-7-111-36226-5-Chapter06-86.jpg

图6-74 Server Free备份模式

978-7-111-36226-5-Chapter06-87.jpg

图6-75 Server Less备份模式

1)策略性复制(即阈值触发)包括时间阈值和变化量阈值两种。时间阈值触发是指生产中心的数据每隔一定的时间间隔复制一次。如图6-76所示,若一个Word文件在3:50pm第一次保存,而随后3:56pm生产中心发生故障,那这个文件将不会复制到灾备中心,因此不能被恢复。变化量阈值触发指距上一次复制时只有生产中心的数据变化量达到设定的阈值(如1MB),才会把发生变化的数据复制到灾备中心去。

978-7-111-36226-5-Chapter06-88.jpg

图6-76 时间阈值触发故障示意图

2)自适应复制:数据同时写入磁盘和复制缓存CDR中。在缓存中的数据被顺序写入而不需要经过确认,一旦CDR缓存中的数据被成功地复制到灾备中心,它将所缓存中原有的数据清空。初始时对整个资源的数据进行全部复制,之后仅进行增量复制。

某基于复制技术的灾难恢复解决案例,如图6-77所示。

978-7-111-36226-5-Chapter06-89.jpg

图6-77 基于复制技术的灾难恢复

灾难恢复的过程为:桌面PC将数据通过应用服务器、双IP-SAN交换机等写入Lx3000生成生产卷,经TCP/IP链路复制到远端的Lx3000生成复制卷,完成复制备份过程。若此生产卷出现本地故障停止工作,原来生成的复制卷提升为可用卷并分配给备用服务器,本地数据经应用服务器、双IP-SAN交换机、TCP/IP等访问链路切换到远端Lx3000的可用卷接续存储备份工作。复制卷在工作的同时,反向同步恢复数据到本地的故障Lx3000,将远端复制卷停顿,之后把本地卷提升为生产卷并分配给本地服务器。本地数据再次经应用服务器、双IP-SAN交换机等访问链路切换到本地数据生产卷,生产卷再把本地数据复制到远端的Lx3000服务器。这样就完成了一个完整的基于复制技术的灾难恢复系统。

备份与复制的比较如表6-14所示。

表6-14 备份与复制的对比(www.xing528.com)

978-7-111-36226-5-Chapter06-90.jpg

复制技术实现了应用系统在不需要停机的前提下对应用数据进行保护。基于网络层的复制技术对数据的增量判断精确至硬盘Block级,只需要较小的网络带宽即可将数据传输至远程,实现异地保护。与备份方式不同,利用复制技术保护的数据在格式上与原文件一模一样,不需要进行格式转换的工作,就可以被应用系统访问,大大缩短了业务恢复的时间;一般来说,采用复制方式保护的数据在恢复业务时,需要手工将复制卷提升为生产卷才能被应用系统正常调用,整个过程一般需要十几分钟,在极少数情况下,业务连续性要求实现故障自动切换时,就需要采取其他技术手段来满足。

(四)镜像技术

镜像是指通过同样的I/O读写操作,在独立的2个存储区域(通常是逻辑卷)中保存相同的数据,并且可以同时进行I/O读写操作。两个镜像卷被主机/存储控制器识别为同一个生产卷,之间业务可能直接切换,提高可靠性。对镜像卷同时读操作可以提升性能。

镜像技术实现的层次包括主机层、网络层、逻辑层和物理层等4个层次的镜像,如图6-78所示。

978-7-111-36226-5-Chapter06-91.jpg

图6-78 镜像技术的4个层次示意图

1)硬盘物理镜像(RAID 1):硬盘物理镜像最简单的形式是一个主机控制器带两个互为镜像的硬盘,数据同时写入两个硬盘,两个硬盘上的数据完全相同,因此一个硬盘故障时,另一个硬盘可提供数据,如图6-79所示。

2)存储逻辑卷镜像:卷有物理磁盘、虚拟磁盘和逻辑卷三个层次,如图6-80所示。要建立前,首先要根据不同的RAID策略,采用一块或多块物理磁盘组成虚拟盘,然后在虚拟磁盘上划出需要的空间建立卷。

978-7-111-36226-5-Chapter06-92.jpg

图6-79 硬盘物理镜像示意图

978-7-111-36226-5-Chapter06-93.jpg

图6-80 存储逻辑卷镜像示意图

3)主机RAID卡镜像:一种既可以提供传统主机总线适配器的格式转换功能,又能实现多I/O总线接口以及RAID的数据镜像算法的主机总线适配器,如图6-81所示。

4)网络层镜像:通过在存储网络SAN中实现源I/O转换为镜像I/O来实现镜像,如图6-82所示。镜像可以通过存储交换机的端口镜像功能实现,也可以通过网络层的存储管理设备的镜像功能来实现。

978-7-111-36226-5-Chapter06-94.jpg

图6-81 主机RAID卡镜像示意图

978-7-111-36226-5-Chapter06-95.jpg

图6-82 网络层镜像的示意图

镜像有同步镜像和异步镜像两种工作模式。

1)同步镜像工作模式:来自应用服务器更新数据在写入本地连接的磁盘系统之前,通过磁盘镜像技术,将更新数据转发至异地的磁盘系统,只有更新数据在两个磁盘系统完成写操作后,本地磁盘系统才会向应用服务器的处理器返回写完成指令,从而确保了两地磁盘系统数据的一致性和完整性,即无数据丢失。这种模式的远端数据与本地数据的实时性强,灾难发生时远端数据与本地数据完全同步。该模式传输距离较短(一般小于60km)。如图6-83所示的数字顺序。

978-7-111-36226-5-Chapter06-96.jpg

图6-83 同步镜像工作模式示意图

注:①:I/O写入生产中心磁盘阵列;②:I/O写入灾备中心磁盘阵列;

③:返回接收确认信号;④:返回I/O成功信号给应用服务器。

2)异步镜像工作模式:该模式在软件灾难备份技术中广泛使用,来自应用服务器处理器的更新数据首先被写入本地连接的磁盘系统(即生产中心),并立即向处理器返回一个I/O写完成指令,之后磁盘镜像系统在很短的时间内,将更新数据发送至异地的磁盘系统。如图6-84所示中数字顺序。

优点:对应用程序的运行性能影响较小,不影响本地的交易,传输距离可长达1000km以上,受远程网络的影响较小。

缺点:远程磁盘系统的数据比本地磁盘系统的数据略有时间延迟,若远程网络带宽较小,网络阻塞较大。

978-7-111-36226-5-Chapter06-97.jpg

图6-84 异步镜像工作模式示意图

注:①—I/O写入生产中心磁盘阵列②—I/O写入灾备中心磁盘阵列

③—返回接收确认信号④—返回I/O成功信号给应用服务器。

同步镜像与异步镜像的区别如表6-15所示。

表6-15 同步镜像工作模式与异步镜像工作模式的比较

978-7-111-36226-5-Chapter06-98.jpg

复制与镜像的区别,如表6-16所示。

表6-16 复制技术与镜像技术的比较

978-7-111-36226-5-Chapter06-99.jpg

与复制方式相比,在服务器层和存储网络层的同步镜像技术实现了应用系统在硬件故障时的自动切换,业务连续性达到7×24h。存储层镜像技术受品牌和兼容性限制,往往成本很高,如果与虚拟化技术结合,则会大大降低用户的总体成本。镜像技术对带宽和时延要求很高,因此不适合在远程站点之间采用,当生产中心和灾备中心之间距离达到百公里级别时,更适合采用复制技术实现数据保护。

(五)数据保护实现方法的比较

根据以上内容总结整理出数据保护的几种技术的对比如表6-17所示。

表6-17 4种数据保护技术的比较

978-7-111-36226-5-Chapter06-100.jpg

(续)

978-7-111-36226-5-Chapter06-101.jpg

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈