高性能路由器中集成IS-IS协议路由稳定性研究

(整期优先)网络出版时间:2019-07-25
/ 3
摘 要 本文基于高性能路由器,对影响集成IS-IS协议路由稳定性的问题进行了深入研究,通过对协议包处理流程的优化有效地减少了不稳定链路上LSP的产生,高效地处理了最大LSP顺序号的问题,通过理论分析得出了LSP交互的优化方案,利用基于未确认的LSP检测机制研究了减少LSP重传问题。

关键字 高性能路由器;集成IS-IS协议;路由稳定性


1 引言

集成IS-IS( Intermediate System to Intermediate System)协议[1]是一种域内路由协议,通过与自治系统(AS)内其它路由器交互已知的路由信息,学习到整个自治系统的网络拓扑结构;并通过自治系统边界的路由器注入的其它自治系统的路由信息,得到整个Internet的路由信息。IS-IS[2]所使用的协议数据包有以下几种:点到点HELLO包;广播网HELLO包;链路状态协议数据包(LSP);完全序列号协议数据包(CSNP);部分序列号协议数据包(PSNP)。HELLO包用于发现、建立和维护邻居关系,LSP、CSNP、PSNP则主要用于链路状态信息的交换、更新和扩散。

路由软件的稳定性主要与处理器对协议报文及时处理负载和路由抖动因素相关,如果处理器对路由信息处理的负载很高,那么将意味着网络稳定性不够,在网络有突发流量时就可能出现问题。路由抖动则是由于网络的不稳定而不断地进行路径的更替,不仅会产生过多的链路状态包,还增加了SPF计算的数量。本文对集成IS-IS的路由稳定性进行了深入研究,并提出优化改进方案。

2 集成IS-IS协议链路状态数据包处理

2.1 抑制不稳定链路LSP的产生

当IS产生一个新LSP后,就要向外进行扩散,刷新原有的链路状态通告,这样就会在网络中引起一序列的数据包收发过程以及路由的重新计算。如果这种新LSP的产生过于频繁,无疑会增加整个网络的传输和处理负担。当IS某个端口处于不稳定状态,端口UP/DOWN频繁时,就会出现这个问题。一个较简单方法是设定本地LSP最小产生间隔(如30秒),也就是一个LSP产生之后,下一个LSP的产生要等待此间隔超时。如果在此间隔内本地IS状态已经出现了变化,应产生新LSP通告,那么就设置变化标志,等到间隔超时,再由此标志触发新LSP的产生。若在此期间有多次状态变化,则在间隔超时后,IS要对各端口和其它路由信息进行检查,最终的状态结果会包含在新产生的LSP中。

2.2 最大LSP序列号的高效处理

LSP序列号表示了IS产生本地LSP的先后次序,同时也是比较LSP新旧的重要参数。序列号为4个字节,协议要求IS产生LSP序号从1开始,顺序递增,直至最大值。当序列号取最大值时,本地IS需要强制复位,重启后序列号又从1开始。为了保证网络中原有最大序列号LSP能被所有IS从数据库中超时清除,本地IS重启后要延迟足够的时间。如果LSP保持时间为1200秒,再加上60秒的零生命期,那么本地IS至少要等待1260秒才能重新启动。

对于序列号复位可以采用另一种更为有效的处理方法:当序列号取最大值后,由本地IS主动进行老化处理,也就是产生一个新LSP,其序列号为最大值,并且剩余生存期置为0,向所有接口网络中扩散。网络中其它IS收到此LSP后,按照协议规定,清除数据库中带有最大序列号LSP,只保留该LSP的一个摘要,同时启动零生命期。零生命期超时后,LSP被彻底删除。这样本地IS只需等待零生命期超时稍长的时间,就可以重新起用序列号1来产生新的LSP。与前一种方式相比,此种方法等待时间明显缩短,并且路由软件还不需复位重启。

3 集成IS-IS协议链路状态数据包交互研究

只要某些IS具有相似的链路状态数据库,而又与DIS有所不同,就会发生LSP重复广播现象。当DIS A广播CSNP时,多个非DIS路由器都发现自己与DIS间链路状态数据库的差异,同时发出LSP更新对方或本地的链路状态数据库,形成不必要的重复广播,这种情况在新启动路由器被选举成DIS时更明显。

为避免或减少这种重复发生,一种可行处理方法是采用随机延迟策略。在收到DIS的CSNP包后,非DIS若需响应则应随机等待一段时间再发送 LSP。在此时间段内,如果有IS广播了 LSP,其它非DIS接收判别后就不必再作相同的广播,从而有效地减少了数据包重复发送。

随机等待的时间越长,多个IS同时响应的概率越小,产生重复发送的可能性就越小,但平均响应时间会加长。为便于分析,令随机等待时间1619362768.jpg,其中k取0到n的一个随机整数值(均匀分布), 1619364633.jpg为一个时间常数。P表示不产生重复发送的概率,T表示平均响应延时。若处于相同(或近似)状态的IS有m个,则P、 T可分别计算如下:

设P为IS在某一特定时刻产生响应的概率,由于IS在任一时刻(0,1619364633.jpg ,21619364633.jpg,n1619364633.jpg )响应是概率分布,所以 p=1/(n+1)。

0时刻有且只有一个IS首次响应的概率:1619378996.jpg

1619364633.jpg时刻有且只有一个IS首次响应的概率:1619372401.jpg

(n-1)1619364633.jpg时刻有且只有一个IS首次响应的概率: 1619377250.jpg

n1619364633.jpg时刻有且只有一个IS首次响应的概率:1619373706.jpg

任一时刻有且只有一个IS首次响应(不产生重复发送)的概率:

1619389612.jpg

根据上式得出概率P的曲线如图1所示。

1619382146.jpg

图1 不产生包重复发送概率图

在0时刻没有一个IS响应的概率161938667.jpg,至1619364633.jpg时刻没有一个IS响应的概率1619398626.jpg,至(n-1)1619364633.jpg时刻没有一个IS响应的概率1619391491.jpg,至n1619364633.jpg时刻没有一个IS响应的概率Pn=0;

0时刻有IS响应的概率为1- P01619364633.jpg时刻有IS首次响应的概率为P0- P1, (n-1)1619364633.jpg 时刻有IS首次响应的概率为Pn-2- Pn-1,n1619364633.jpg时刻有IS首次响应的概率为Pn-1

IS平均响应延迟:

1619408302.jpg根据上式可画出平均响应延时T的曲线(纵坐标单位为1619364633.jpg)如图2所示。

1619419676.jpg

图2 平均响应延时图

当处于相同状态IS个数m(m>1)一定时,IS允许等待时间越长,避免数据包重复广播概率越大;当IS允许等待的最长时间一定时,m越大,避免数据包重复广播概率越小。随着n取值的增大,不出现重复广播的概率增大,但增大的程度会逐渐趋缓。当n大到一定程度后,对于避免重复广播已不会有太大的改善,如图1所示,当n取值为m的2倍时,P都达到0.8左右,n值再增大,P变化不明显。当m数一定时,n越大,平均响应延迟越大;n取值一定时,m越大,平均响应延迟越大。当n取值较大时,平均响应延迟T与n近似成线性关系,随着n的增加,T将线性增长。

通过以上计算分析我们知道,采用随机延时等待策略可以有效地减少或避免LAN上重复广播的出现,但这并不意味着允许最大等待时间越长越好。当 值较大时,对减少重复广播已无多大改善,相应延迟却仍按比例增加,响应延迟增加会影响链路状态包在网络中的同步和扩散,影响协议性能。因此最大允许等待时间不宜过大,小于CSNP发送周期(10秒),这样可以保证在下一个CSNP到来之前完成本次同步过程。

4 集成IS-IS协议LSP重传问题

在点到点链路上,IS发出LSP包后,对方要根据收到LSP更新其数据库,同时返回PSNP作为确认,发送方接收到确认后,才把LSP在此链路上的发送标志SRM清除,否则此LSP会被再次发送,直至收到对方的确认。这里存在两种可能:其一是在未收到确认前,LSP的重复发送过于频繁,其二是若对方出现故障无法应答,则在邻接关系解除之前,LSP可能要多次传送。在协议信息流已使网络处于拥塞的时期,主要拥塞原因之一是反复重传LSP。通过指数退避算法动态调整LSP的重传速率,可以减轻网络的负载,使网络尽早恢复正常。在对方发生故障情况下,也能减少重传。R(i)表示第i 次LSP重传时的RxmtInterval值。使用如下算法计算:

16194176.jpg

其中k、Rmin和 Rmax是常量。

4.1 基于未确认的LSP数量检测算法

如果路由器发生控制信息拥塞时,其邻居并不能显式知道。但能够从路由器未被确认的LSP的数量隐式检测出来。如果这个值超过一定的“最高阈值”,则LSP发送到该路由器的速率应当使用指数退避算法逐步降低,但不能低于最小速率。如果未确认的LSP的数量降到“最低阈值”,则LSP发送到该路由器的速率应当使用指数退避算法逐步提高,但不能高于最高速率。算法对于每个邻居独立运用,适用于发送到邻居的IS-IS单播的LSP分组。整个算法描述如下:

U(t)=t时刻到邻居的未确认LSP数量;H =最高阈值(未确认LSP数量);L =最低阈值(未确认LSP数量);G(t)=t时刻连续发送LSP到邻居的时隙; F=时隙增长(拥塞情况下)或者降低(拥塞之后)的系数; T=时隙改变的最短间隔; Gmin=时隙最小值;Gmax =时隙最大值。下述方程式表明了时间T后时隙的改变:

1619419386.jpg

4.2 重传时间间隔设置对网络的影响

网络处于LSP拥塞状态下,协议分组传输会受到影响。如果传输延迟超过了设置的重传时间间隔,有可能造成邻居失效或LSP分组的重传,实验模拟当网络发生LSP拥塞时,重传时间间隔参数不同的设置值情况下,网络的某一接口在3分钟内收发的协议分组总数,实验数据见表1。

表1 实验数据表

次数

重传间隔(秒)

接收协议分组数量

1

1

552

2

4

144

3

8

75

4

16

46

5

32

31

从表1中接口协议分组收发数量可以看出,网络发生LSP拥塞时,适当延长重传时间间隔参数的值,可以降低网络中传输协议分组的数量,使网络尽快摆脱LSP拥塞状态,恢复正常。

5 结论

本文以高性能路由器集成IS-IS协议的研究为基础,对集成IS-IS协议的路由稳定性进行了研究并对针对相关问题提出了改进方案。本文通过对协议包处理流程的优化有效地减少了不稳定链路上LSP的产生,高效地处理了最大LSP顺序号的问题,通过理论分析得出了LSP交互的优化方案,利用基于未确认的LSP检测机制研究了减少LSP重传的问题。

参考文献

[1]D. Oran.OSI IS-IS Intra-domain Routing Protocol[S],Request for Comments:1142,1990

[2]R. Callon.Use of OSI IS-IS for Routing in TCP/IP and Dual Environments[S],Request for Comments:1195,1990

[3]Jeff Doyle著,葛建立,吴建章译.Routing TCP/IP Volume 1[M].人民邮电出版社,2002