数据备份系统,计算机技术领域术语,数据备份是指为了防止由于操作失误、系统故障等人为因素或意外原因导致数据丢失,而将整个系统的数据或者一部份关键数据通过一定的方法从主计算机系统的存储设备中复制到其它存储设备的过程。
背景
网络技术的飞速发展和网络的日益普及,建设网络的最根本目的就是更方便地传递信息。 如果不能保障信息的安全,那么对网络的大量投资也将失去原来的意义。数据作为信息应用的核心,其重要性不言而喻。 因此,人们在建立网络信息系统时,会对重要的数据进行备份,以便在系统遭到破坏时,能够尽快恢复数据,保证系统的高可用性。
传统的备份方法有较大的局限,因为传统的备份主要是采用
磁带机、
光盘和
磁盘进行冷备份,备份介质同时也在机房中统一管理,一旦整个机房出现了灾难,这些备份介质也随之销毁,这样的备份将起不到任何灾难备份功能。 所以先进的数据备份系统就是要避免传统冷备份的先天不足, 能在灾难发生时,全面、及时地通过网络恢复信息系统。
简介
概念
当主计算机系统的数据由于某种原因丢失或不可用时,可以利用复制的数据进行恢复,从而保持数据的完整与业务的正常进行。因此,可以说,数据备份主要解决的是数据的可用性问题。
策略
备份策略的制定是备份系统的一个重要部分,备份策略的选择依赖于数据的重要性、允许备份的可用时间以及其它的一些因素。 一般来说,主要有3种备份策略。
1、完全备份(full backup)
执行数据全部备份操作, 每天对自己的系统进行完全备份。 这种备份策略的好处是很直观,而且当发生数据丢失的灾难时, 只要用灾难发生前一天的备份就可以恢复丢失的数据。然而它亦有不足之处,首先,由于每天都对整个系统进行完全备份,造成备份的数据大量重复,这些重复的数据占用了大量的磁带和磁盘空间,这对用户来说就意味着增加成本。其次,由于需要备份的数据量较大,因此备份所需的时间也就较长。 对于那些业务繁忙、数据量大、备份时间有限的单位来说,选择这种备份策略是不明智的。
2、增量备份(incremental backup)
增量备份相对全备份而言,只备份上一次备份后数据的改变量。这种备份的优点很明显,没有重复的备份数据,节省磁带或磁盘空间,又缩短了备份时间。 但它的缺点在于当发生灾难时,恢复数据比较麻烦。 另外,这种备份的可靠性也很差。 在这种备份方式下,各盘磁带间的关系环环相连,其中任何一盘磁带出了问题都会导致整个备份链条脱节。
3、差量备份(differential backup)
差量备份是指每次备份的数据是相对于上一次全备份之后新增加的和修改过的数据。管理员先在星期一进行一次系统完全备份:然后在接下来的几天里,再将当天所有与星期一不同的数据(增加的或修改的)备份到磁带上。差量备份策略在避免了以上两种策略的缺陷的同时, 又具有了它们的所有优点。首先,差量备份无需每天都做系统完全备份,因此备份所需时间短,并节省磁带空间,它的灾难恢复也很方便,系统管理员只需两盘磁带,即系统全备份的磁带与发生灾难前一天的备份磁带,就可以将系统完全恢复。
结构
不同的备份方法,其效果不同,主要表现在性能、自动化程度、对现有系统应用的影响程度、管理、可扩展性等方面。 常见的数据备份系统主要有Host-Based、LAN-Based和基于SAN结构的LAN-Free、Server-Free等多种结构。
主机备份
基于主机(Host-Based) 的备份是传统的数据备份技术,在这种备份架构中,磁带读写设备直接连接在某台需要备份数据的应用服务器上,为该服务器提供数据备份服务。Host-Based备份架构的优点是备份管理简单,数据传输速度快;缺点是不利于备份系统的共享,不适合有多个服务器需要备份的大型信息系统的数据备份要求。
局域网备份
基于局域网(LAN-Based)备份架构中数据的传输是以网络为基础的。 将局域网中一台服务器配置为备份服务器,由备份服务器负责管理整个系统的备份任务。 磁带读写设备可以连接在某台服务器(称为介质服务器)上,多个需要备份数据的应用服务器将需要备份的数据通过局域网络传输到磁带库中实现备份。在局域网中,备份服务器、介质服务器和应用服务器可以是同一台服务器,介质服务器也可以是多台,这种灵活的架构,可以适应大型局域网数据备份的需要。
LAN-Based备份结构的优点是可以共享磁带库以节省投资,同时可以实现集中的备份管理;它的缺点是大量的备份数据需要通过网络传输,对网络带宽和备份窗口的压力比较大。
LAN-Free备份
所谓LAN-Free Backup, 就是指释放网络资源的数据备份方 式。 LAN-Free结构的备份系统是建立在数据存储网(SN,Storage Network)上的一种全新体系结构。
备份服务器向应用服务器发送指令,指挥应用服务器将数据备份到磁带库中。 在这个过程中,庞大的备份数据流没有流经LAN 网络,而是通过数据存储网,直接从磁盘存储系统传送到磁带库内,因此无需占用网络带宽 (LAN-Free),为网络节约了宝贵的带宽资源。 因此基于SN 的备份是一种彻底解决传统备份需要占用LAN 带宽问题的方案。
LAN-Free的优点是数据备份统一管理、备份速度快、网络传输压力小、能够实现磁带库资源共享。但缺点是实现复杂,需要成本较高。
Server-Less备份
在前面的备份架构中,需要备份的数据需要通过应用服务器备份到存储设备中, 大量的数据I/O无疑增加了应用服务器的工作负荷。
Server-Less Backup技术就是以全面释放网络和服务器资源为目的的。Server-Less Backup 技术的核心就是在存储区域网(SAN,Storage Area Network)的交换层实现数据的传输工作。这样,大量的备份数据不仅无需经过网络,而且也不必经过应用服务器的总线(应用服务器仅需发布少量数据备份控制命令),就可以完全保证网络和应用服务器的高效运行。
目前一些厂商已经推出了自己在这方面的相关产品和解决方案。 但Server-Less备份技术总体来说还不太成熟,主要表现在产品的成熟性和开放性还不够, 对硬件的要求比较严格,兼容设备还不是很多。
软件设计
系统性能分析
一套完整的专业数据备份系统,包括备份硬件和备份管理软件两部分。 优秀的备份软件是完成备份的基础,在很大程度上影响着备份的效率。 一般而言,专业的数据备份系统通常具备以下特性:①备份作业集中管理;②跨平台备份与恢复;③自动化备份与恢复;④大型数据库的备份与恢复;⑤系统灾难恢复;⑥节省系统资源和网络带宽;⑦备份设备和介质管理;⑧安全性和可靠性。
软件系统组成
基于网络的数据备份软件在设计上采用多层体系结构,功能模块一般包括:系统管理界面、备份服务器、介质服务器、备份客户端,以及各种应用代理。这些功能模块相对独立,软件系统的各模块功能如下:
1、系统管理界面主要用于显示、配置备份作业信息,并实时查看备份日记、备份进程等信息。
2、备份服务器主要负责备份作业的调度与执行,管理存储介质和存储设备,生成备份日志,向管理界面发出警报等。
3、备份客户端安装于需要备份的应用服务器上,执行备份服务器程序以及对远程服务器和工作站进行查询,使备份服务器能访问工作站的目录和驱动器。具体执行服务器和工作站的文件系统备份任务,执行备份数据压缩和恢复数据解压缩功能,及与应用代理程序通信并传递和恢复数据。
4、应用代理与备份客户端安装在同一台应用服务器上, 主要功能包括:通过数据源的备份接口获取需要备份的数据,通过数据源的备份接口恢复数据,与备份客户端通信并接受备份和恢复指令和数据流。
5、介质服务器主要实现备份介质的读取和写入,接受备份数据,并写入存储设备,如磁带、硬盘、光盘等。 数据恢复时从备份介质中读取数据,发送给备份客户端。