保护环是一种用来在发生故障时保护数据和功能(提升容错度)和避免恶意操作 (提升
计算机安全)的设计方式。保护环是利用网状网中的空闲链路来生成的预置环,它采用的恢复策略是事先确定好的,因此具有很快的恢复速度。保护环所耗费的空闲容量与原来采用的跨度恢复所耗费的空闲容量是大致相当的。采用保护环的恢复机制融合了环形网和网状网在恢复方面的优点,它在网状网的保护和恢复中有着广泛的应用前景。
保护环产生背景
长期以来,人们一直在研究如何在网状网络中引入保护机制。大家普遍认可在两秒钟之内便可从网络中找到某回路的替代路径这一观点的可行性,从而可以在极短的时间之内避免网络内出现波及面较广的问题。经研究发现,我们可利用一种新的方法来对网络进行操作。这种方法建立在预先设置的环的基础上,即保护环。保护环可以实现基本的网络恢复机制。有关保护环的概念,最早于1998年引入,它在一定程度上类似于BLSR即双向线路切换环)环,但区别在于,保护环可支持对环自身SPANS(跨度与范围)的保护。并且保护环最重要的特征在于,它们可以保留环状的交换特性(仅有两个节点进行实时交换,完全可以预算每个可能出现的错误),但也可将其设计为具有同样能效的可恢复的网状网络。
自1998年以来,保护环的基本理论不断发展创新。作为一种预配置结构,它已广泛应用于各种网络、MPLS/IP层等等。
保护环的发展现状
当前,网络技术的高速发展正在迫使人们寻求一种可以传输超大容量信息的方法,但只有以波分复用(WDM)技术为核心的光网络技术才能满足这种要求。
从组网方式来看,光网络将沿着“点到点—环形网—环形网与网状网的混合网—网状网”的进程来发展。现阶段以至将来一段时间内,普遍的组网方式都是环形网与网状网的混合网。但全光网状网是光网络发展的终极方向,因此研究它的生存性问题是十分必要的。
由于发生在光层上的任何看似微小的故障都可以带来灾难性的后果,如何在故障发生后快速、准确地恢复通信是必须要考虑的一个关键问题。一直以来,人们对环形网和网状网在保护和恢复方面的优点都难以取舍。环形网已经发展了很多年,有固定的标准,具有快速恢复的能力(约几十毫秒),但它的结构不灵活;而网状网恢复速度较慢(约秒量级),这对于部分用户是不能接受,但它的结构灵活,容量效率很高。最近的研究表明,保护环理论提供了一种新的方法,它将两者优点结合于一体,既可实现快速的恢复,又可获得几乎等同于网状网跨度恢复那样的高效率。当前,保护环在WDM光网中的使用己经成为研究的热点。当今的高技术战争中,信息化水平越来越高,特别是近几年来,我军各单位均已广泛建立起局域网,并多采用网状网络这一基本形态,因此,无论平时还是战时,网状网络将成为我军信息作战的基本指挥平台。该平台的建立虽然在一定程度上实现了自动化办工、网上公文传输、网络模拟演习等功能,提高了作战指挥和办公效率,但也对我军战时指挥体系的稳定性埋下隐患,从某种意义上说,网络化程度越高,其战斗指挥体系越容易遭敌打击,造成指挥中断。因此如何保证作战指挥体系的顺畅,保护好我们的网络,增强网络的安全性和可靠性对我军信息化建设有着更为特殊的意义。因此,我们必须采取相应的措施,增强网状网络的稳定性。
保护环原理
保护环是利用网状网中的空闲链路来生成的预置环,它采用的恢复策略是事先确定好的,因此具有很快的恢复速度。保护环所耗费的空闲容量与原来采用的跨度恢复所耗费的空闲容量是大致相当的。采用保护环的恢复机制融合了环形网和网状网在恢复方面的优点,它在网状网的保护和恢复中有着广泛的应用前景。
保护环的分类
链路保护环
它由5条链路组成,这里也称链路为跨度(Span),与之相区别的是1一2和l一4,它类似于保护环的弦,称为跨距(StraddlingSPan)。下面来说明故障发生后保护环的使用,可以注意到,链路环在故障发生后只有与故障链路相邻的两个节点会发生变化,带有星号的虚线表示的是发生故障的链路。(c)中的故障发生在保护环跨度上,其恢复机制类似于双向线路倒换环(BLSR,Bidirecti。 nalLine一 switehedRing),可以建立一个恢复通道。(d)中的跨距故障恢复是保护环所特有的,它可以建立两个恢复通道,恢复时可以选择其中的任意一个通道,这点与BLSR有所不同,也正因为如此才使得使用保护环的网状网的兀余度会比环形网低得多。一般来说,环形网的冗余度至少是100%,很多都达到了200%一300%,而采用保护环的网状网的冗余度只有50%左右,甚至还可以更少。
节点保护环
网络中建立了一个O一1一3一4一7一6一0的保护环,且光通道0一2一7中有流量通过。如果节点2发生故障,那么基于节点保护环的恢复机制会自动将光通道转换到由邻近节点组成的恢复通道中的一条:0一6一7或者0一1一3一4一7。上述两类不同的保护环恢复机制有着不同的用途。众所周知,在物理传输层和IP层的恢复具有各自的优点,在某些方面是不能互相替代的。对于物理链路故障的恢复适合在物理层进行,而对于路由器节点的故障采用IP层恢复更加合理。因此,链路保护环多用在WDM和SDH/SONET中,而节点保护环多用在IP层上路由器故障的恢复上。本文将重点研究的是前者,若没有特别的说明,下文所指的保护环都是链路保护环。
可以证明:在网状网中采用与跨度恢复相同的容量效率,通过建立多个保护环就可以实现恢复,而且耗费单位空闲链路可以恢复的工作链路数目有一个上限属。式中N为保护环中的节点数目。N节点的保护环可以恢复不超过N(N一2)个工作链路,它是相应的环形网的(N一2)倍。综上所述,保护环有以下特点:.更好的资源利用率。
.发现网络断裂后重新配置的时间是可接受的。.保护环选择程序倾向于包括最多的节点。.保护环的最佳数量应该控制在十几个左右。首先确定需要的工作容量,总的容量减去工作容量就是空闲容量了,然后再在空闲容量中建立保护环,确保每一个工作链路都可以得到保护或恢复,最后利用计算机程序来获得最优的保护环,使得它的成本最小。由于网络中,光层和IP层路由有不同的特点,在自愈网中都采用了分布式环预置(DCPC, DIStributedCyClePre一Configuration)协议。可以采用某个信令来不断优化保护环,例如将路由数与跳数的比值作为参考值,直到找到最好的参考值为止。上面的模型是一种最原始的模型,要想更符合实际情况例如由于保护环的存在,实际通道的长度可能很大,必须要考虑它带来的延迟和损耗,因而就有一个最大传输长度。在实际的网络中,很可能并不具备全波长转换的条件,那么上面讨论的方案就要做适当的修改,可以预见:在没有全波长转换的条件下,此网络的容量效率不如在满足全波长转换的条件下好。实验证明:在实际的长度下(最大值为4000一6000腼),采用全波长转换的WDM网的兀余度只有5006,而没有采用全波长转换的WDM网的兀余度为71%。
用最少的成本来保护给定的工作流问题是一个NP问题,很难去优化,主要原因是要考虑保护环的大小。对于给定的网络,虽然保护环的构造时间是可以接受的,但总希望可以对原来的问题进行简化,增强实用性和灵活性。可以通过节点优化,合理放置保护环和先选择备用保护环来优化设计。实验证明:采用节点优化策略可以使冗余度减少25ty0,仅有34%左右。采取后两种优化措施也可以获得理想的结果。
保护环对多故障的处理
在保护环优化过程中,构造程序更倾向建立多节点的保护环,但这势必会使保护环的长度较长,从而带来很大的延迟和损耗,对传输不利。更为严重的是,当有多次故障发生(虽然发生概率小,但发生后破坏性很强)在同一个保护环内时,故障是很难恢复的。显然节点数目越小的保护环发生多次故障的概率更小,而且更容易恢复。这就要求在节点数目和多故障恢复能力之间做出一个抉择。对于在不同环中发生多个单次故障的情形,可以将保护环割裂开来看,恢复机制与单环单次故障是一样的。下面考虑在同一环中出现两次故障的情形(两次以上故障发生概率很小,可以暂不考虑)。
假设故障分别发生在t,和t:时刻,且故障之间是相互独立的,即在tZ时刻,t,时刻发生的故障已经被恢复,并假设发生第一次故障后保护环仍然保持原来的结构(对于两个同时发生的故障,用一个保护环是不能恢复的,这种情况这里不做讨论)。两次故障均发生在保护环跨度上;两次故障一次发生在保护环跨度上,而另一次发生在保护环跨距上,只是发生的先后次序不一样;3一4先发生故障,此后建立3一1一O一2一4的恢复通道,在恢复完成后,0一2又发生了故障,恢复通道将被切断,这样的故障是不可以被恢复的。如果tZ时刻,保护环只保护一个工作链路,而3一4又没有工作流量,那么1一2可以用1一0一2恢复,否则就不能恢复。1一2发生故障后被l一3一4一2或者1一。一2恢复,3一再发生故障都是不可以被恢复的。tZ时刻发生的故障可以在一定条件下恢复,用1一0一2来恢复t,时刻的故障,而用1一3一4来恢复tZ时刻的故障,这样两次故障就可以被恢复了。随着节点数目的增加,两次故障发生的概率将增加,恢复的难度也将急剧增加,对于相同的保护环,采用不同的策略来恢复,可能会得到截然不同的结果。实验证明:最大化保护环的数目可以获得高的恢复率(约70%),但需要大量的保护环和高的保护容量;而最小化保护环的数目,将获得较少的环数(<10),虽然使管理变得简单,但出现两次故障的概率增大;容量优化设计和环数最小化可以提高故障的恢复率;最小化选择保护环的工作容量的最大值可以提高恢复能力(约3/4)。显然采用保护环重构的方法是可以恢复多次故障的,但重构并不是一种高效的手段,恢复时间较长。如何在保护环数目和故障恢复率上权衡是网络设计者所必须要考虑的问题。保护环的适用性取决于网络的大小。
保护环构造与优化
构造
保护环的构造具有很大的灵活性,既可以采用SDH/SONET环形网那样的固定结构,也可以由网络的管理系统来构造,它的建立与工作容量完全独立,工作链路可以采用任意的路由算法。
优化
有两种标准来建立保护环:第一种是在满足能够完全恢复的条件下,使总共的空闲容量最小;第二种是在给定空闲容量的情况下,合理地配置保护环,使恢复能力最大化。下面主要讨论前者。假设在网状网中,可以实现全波长转换,则目标函数就应该是其中S为网络的跨度数目路数。为了简化目标函数,可以简化为COStJ为跨度j的成本或长度,s;为跨度j上的空闲链最初的分析可以将各跨度的成本或长度视作一样。
保护环应用
保护环理论可以应用到诸如WDM,IP,SONET,ASON等不同网络中。上面所讨论的应用主要集中在WDM网。“ 1PoverWDM”是当前研究的热点之一,其中主要的故障有:光层的链路故障,IP层的链路故障或接口故障,路由器节点故障。对于不同的故障可以采用不同的保护环恢复策略。上面已经介绍过了对光层链路故障的恢复,下面简要介绍对IP层链路故障和路由器节点故障的恢复。当发生IP链路故障后,可以将这个链路两端的路由器标志为“死”,用保护环包来替代IP包,用链路保护环来恢复传输,当全局的路由信息全部升级完成后,再将保护环包解封装,还原为正常的IP包。这里所谓的保护环包是指在IP前加上保护环报头,主要包括8:保护环ID,目的地址和原路由成本。原路由成本用来保证IP包可以安全地从保护环包中取出来。对路由器节点的故障采用的是节点环绕的保护环恢复机制,而保护环包的封装和解封装与前者类似9。保护环理论发展的过程中不断涌现出新的问题。例如在图4中存在这样的一个保护环,采用传统的保护环恢复策略可以恢复保护环上的跨度和跨距,但是当0一2或2一7发生故障,应该采用怎样的恢复策略呢?现在已经发展了通道保护保护环 (pathsegmentproteetingp一eyeles,简称流保护环)来解决这样的问题,它是保护环理论的拓展。它是通道恢复与保护环恢复的结合,但它的恢复速度要比通道恢复快的多。流保护环可以保护任何一个发生交叉的流段(例如0一2和2一7),而不只是跨度和跨距。很好地发展了流保护环理论,并且讨论了如何实现流保护环和链路保护环的结合。现阶段的全光网技术还很不成熟,有许多的问题需要解决,例如如何做出网络保护和恢复的等级选择,如何进一步改善网络的效率等,如何在网络流量较少的情况下进一步减少网络中跨度的重叠从而提高网络效率。保护环是一种新的算法,它结合了环形网和网状网在恢复上的各自优点,现在己经显示出它极强的优越性,可以通过建立不同的保护环甚至不同的恢复机制来区分业务和恢复的等级,还可以进一步将保护环改进为“增强环”和“定向环覆盖”来减少跨度覆盖。以后的研究可以将保护环溶于采用GMPLS协议的DWDM光层或IP层。
因此,我们可以通过非实时配置来部署保护环(分布式自组织的集中网络管理系统),当模拟网络中的某连接中断,保护环可以立即做出反应。总而言之,通过在网络中引入保护环的概念,我们希望完成以下目标:.随着保护环数目的增多,更有效的利用资源。.当连接发生中断时,需要对网络重新配置,而且配置的计算时间在可接受的范围之内。
.选择保护环时,包含的节点越多越好。.网络中最佳保护环包含环的数量最好控制在十个以内,这便要求系统具备综合判断能力。保护环的适用性取决于网络的大小。长度太大将会造成更多的延迟,从而影响保护状态(在本设计中我们忽略连接的长度,假设保护环适用于所有长度的网络)。