电信级以太网测试方法

标签:
电信级以太网测试业务能力性能slait |
分类: 网络 |
文/陆宇翔
1 基本业务能力的测试
与普通以太网交换机测试不同,针对城域网设备的业务能力测试主要集中在两个重点领域,针对接口的测试和针对通道的测试,这两个部分在测试手段、测试目的和测试普通以太网交换机有所不同,在电信级以太网中需要将城域网做为一个整体来进行测试。
1.1 针对接口的测试
用户接口是城域网中最重要的组成部分之一,几乎全部业务都跟用户接口息息相关,可以说用户接口的功能齐备稳定可靠是城域网的基本要素,不可不“测”。常规的基本功能如端口自适应能力、MTU、是否支持各种以太网帧格式、是否具备支持多EVC的能力、是否支持流量标记、带宽控制、对于CE侧的二层协议报文的处理方式。
在对用户接口测试中最核心关注的部分是接口和隧道的绑定映射功能。很多测试规范中都建议测试VLAN泄漏/EVC泄漏等,即本应该被映射到某个EVC的报文被错误地映射/复制到另一个EVC,或者本应该从某个VLAN被发送的报文被错误的发送/复制到另一个VLAN。虽然大部分测试规范都提到了这项测试,但是只给出了测试思想——从一个用户接口打入流量,并验证流量是否从预期的接口预期的VLAN中转发出来。在电信级以太网实际测试中,这个方法需要在满规格的条件下,引入网络振荡,反复验证相关功能是否实现正确。
1.2 针对通道的测试
通道是城域网承载业务的主要手段,也是城域网最重要的组成部分之一。对通道的测试除了常规的转发以外,更多地还需要关注系统对于通道的维护方式。如建立通道、撤销通道、通道保活、连通性检测、隧道备份/切换等。此外一些重要的规格也是需要重点测试,如单一通道支持的最大用户接口数、最大设备数、单一通道能够学习的MAC地址表容量、单一设备/整系统能够支持的最大通道数量等。
值得一提的是,即使是一些看似静态的规格指标,也需要考虑网络拓扑变化的情况下系统级的规格是否会受到影响。
此外还需要注意的是,通常而言通道的作用是完整地转发用户报文,通常不会对报文内容做修改,但是诸如标签替换、修改优先级标记一类的操作还是会对报文做修改,这些修改需要对报文以太校验和做重计算和填充,测试中需要确认这部分工作没有被忽略。
1.3 针对QoS的测试
QoS方面测试可以分为两个部分,功能方面的测试,流分类、标记着色、流量控制等;性能方面的测试,主要是延迟、延迟抖动、丢包率等。
城域以太网QOS方面的测试重点主要是衡量系统在同时为不同优先级用户提供服务、或者在为用户不同优先级的业务提供服务的时候,是否有能力同时做好用户接口和隧道中两个方面的带宽分配,尤其是一个隧道中可能包含多个UNI接口的情况下,如何保证剩余带宽被充分利用。
http://www.h3c.com.cn/res/201104/14/20110414_1175255_image002_711491_30008_0.jpg
图1 不同限速手段所产生的效果对比
如图1所示,两种限速效果有明显差别的。通常而言持续平滑的限速效果对于带宽的利用会更加充分,是比较理想的限速效果。
2 性能测试
2.1 故障收敛指标
城域以太网的发展趋势的几个主要特征是万兆、MPLS、环网。继承了传统传输网络的拓扑结构,城域以太网所面临的第一项挑战就是故障收敛指标。传统SDH网络宣称能够做到50ms的故障倒换,对于传统依树型结构而生的以太网来说,这无疑是一项非常严格的指标。而叠加在以太之上的万兆、MPLS技术又给系统增加了不小的复杂度,大大增加了快速收敛的难度。
收敛指标的测试需要在大规格、大业务压力下,覆盖每一条链路、每一个节点的故障和恢复情况下,业务从中断到恢复的全部时间。考虑到一些网络中可能存在二次收敛的可能性,测试这项指标时,需要在故障发生/恢复以后,等待一段时间,确定全部收敛都已经结束后,再计算结果。
2.2 MAC表深度
测试城域以太网的MAC表深度的方法大致同测试一台交换机的MAC表深度类似,不同之处在于城域以太网MAC地址的来源有本地学习和远端学习两个部分,并且远端学习还可能来自多个不同的来源,所以测试中需要考虑这些不同地址来源的组合。
2.3 MAC学习能力
这里所说的学习能力主要是从学习速度来考虑的,对于城域网而言,MAC地址的学习速度显得至关重要,更快的学习速度能够尽可能地减少由于未知单播报文在通道内的广播而带来的带宽浪费。而且,一般而言学习能力强的设备在MAC地址删除和迁移速度方面的标线也会更为优秀,这项指标在一定程度上决定了发生故障时保护倒换的时间。
和普通以太网交换机MAC学习能力测试的不同之处在于,城域网设备学习本地地址和远端地址性能会有所不同,这两方面的指标都需要测试。
2.4 转发性能
与普通以太网交换机测试不同,在测试城域网设备时,由于报文进入通道后会增加封装头部而带来效率上的损失,测试结果不会达到理论上接口速率。实际的测试结果需要考虑测试流报文长度和头部开销换算后,才能判断设备的转发能力是否达到线速。由于现有城域网设备大多具备线速转发能力,现在这项指标基本上已经可以看做是城域网承载技术的效率指标了。
3 基于SLA的测试
关于SLA(service level agreement)各项指标的测试,业内基本达成了一个共识,主要测试项包括延迟、延迟抖动、丢包率和可靠性,根据不同的EVC类型每项指标的测试方法又略有不同。
3.1 点到点EVC的延迟(FD,Forward Delay)
某个报文在一个点到点的EVC上的延迟是这样定义的:当这个报文的第一bit(从目的mac算起)进入UNI开始,到这个报文的最后一bit从另一个UNI上出来为止的这段时间,即被视为这个EVC上的延迟,通常的单位为ms。图2形象地给出了延迟的计算方法。
http://www.h3c.com.cn/res/201104/14/20110414_1175256_image003_711491_30008_0.jpg图2 点到点EVC的延迟
这里定义的延迟是指单向延迟,在实际操作中可能无法直接测量获得,不过通过测量双向延迟再计算单向延迟的方法,还是能够得到一个近似值。
3.2 点到点EVC的延迟抖动(FDV,Forward Delay Variation)
http://www.h3c.com.cn/res/201104/14/20110414_1175257_image004_711491_30008_0.jpg图3 点到点EVC的延迟抖动
图3给出了一个延迟抖动采样的计算方法,在一个长度为T的任意时间段内,任意一对进入UNI时间间隔为Δt的两个报文,到达EVC另一端的延迟之差。在这里Δt的选择是有特殊意义的,而不是一个随机选择的值,比如针对语音业务,Δt一般会被定为一路IP电话的两个相邻报文之间帧间隙的整数倍——2倍或3倍,也不至于太大。
3.3 点到点EVC的丢包率
丢包率的测试方法比较成熟,是那些进入一个UNI本应该被EVC转发的报文,却没有从另一个UNI上被发送出去,占所有进入UNI并且应该被EVC转发的报文的百分比。
3.4 点到点EVC的可靠性
可靠性是指在一个较小的丢包率的范围以内,网络不中断地提供持续业务的能力。如果运营商向用户承诺在一个月内提供99.9%的可靠性,那么按照30天一个月计算,这个月内网络的中断时间累积不能超过43分钟。
在非正式场合中,连通性通常是这样测量的。每隔一小段时间发送一组测试帧,如果这些测试帧的丢包率在指定范围以内,即可认为这一小段时间以内网络是连通的;如果这些测试帧的丢包率超过了指定范围,即可认为这一小段时间以内网络中断。
MEF中定义了6个参数来判定网络的可靠性,这6个参数分别为指定时间段T,检测时间分片Δt,网络不可达丢包率判定门限Cu,网络可达丢包率判断门限Ca,持续倍速n,可靠性A。(其中Cu>=Ca)测试时以Δt为最小时间间隔发送一组测试帧,在网络处于连通的情况下,如果连续n组测试帧的丢包率都大于Cu,则可判定网络进入中断状态,反之网络仍然处于连通状态;在网络处于中断的情况下,如果连续n组测试帧的丢包率都小于Ca,则网络进入连通状态,反正网络仍然处于中断状态。如图4所示为网络连通性的判定方法。
http://www.h3c.com.cn/res/201104/14/20110414_1175258_image005_711491_30008_0.png图4 网络连通性判定方法
网络的可靠性可以按照网络连通的时间段数量/总的时间段数量来计算。
4 结束语
相对于一般的以太网测试,针对电信级以太网的测试在测试方法上会更加侧重于网络与业务的结合部分。不管是功能测试、性能测试还是基于SLA的测试都是由于开展业务的需要而有针对性地设计的,旨在证明在网络部署完成后,通过测试的网络能够实际地根据测试所得的数据,为业务提供支撑,也为运营这张网络提供必要的可考量的参考数据。