首页 理论教育 故障处理的实际应用案例

故障处理的实际应用案例

时间:2023-06-23 理论教育 版权反馈
【摘要】:自环定位故障网元后,更换光板,但告警依旧,确定不是该网元光板的故障。更换时钟板,故障排除。电路、光路、业务配置无任何问题,E300网管管理不到C站点与D站点可以初步定为在ECC故障问题,即可以定位为B、C、D站点的NCP故障。可以前往C站点进行NCP单板复位的工作,如果经过复位后E300网管可以对链上所有站点进行管理,则说明故障得以解决。图10-7案例组网图此案例可以根据故障处理思路进行如下分析。

故障处理的实际应用案例

【案例1】

有一台设备在运行中突然所有光板上报“帧丢失”和“接收信号丢失”告警。

【故障分析】

当设备上报光接收信号丢失或帧丢失告警时,可首先怀疑光板的问题,采用自环光板的方法确定故障点在本端还是在远端。由于SDH信号调制以同步为前提,时钟故障也可导致以上告警,所以也不能忽略时钟板的问题。自环定位故障网元后,更换光板,但告警依旧,确定不是该网元光板的故障。更换时钟板,故障排除。

【总结】

故障的真正原因是SC板故障后,系统内无可用的定帧时钟,光板发出的信号无法成帧,最终导致上报帧丢失或接收信号丢失告警。

【案例2】

赤峰本地传输接入网新建设备,由A、B、C、D四站点组建成链形网,如图10-6所示。A为网关网元,A站点到D站点有2条2M b/s的电路测试业务,光路上无告警,但E300网管登录、管理不到C站点和D站点(A、B、C、D均为ZXMPS320设备)。

图10-6 案例组网图

【故障分析】

此案例可以根据故障处理思路进行如下分析。

(1)先排除外部故障,如设备掉电、光纤性能劣化、损耗过高等硬件造成的故障。E300网络可以管理到A站点,则可以排除Qx口与NCP连接,由于管理网元数量较少,可以排除网管管理数量过多造成ECC管理不到的问题,同时由于站点A到B有2Mb/s的测试业务,但是A站点并没有任何低阶信号的告警,从E300网管上观察业务正常,并没有TU_AIS类告警,所以可以排除C站点与D站点的设备掉电及业务配置不当所产生的故障。

光路上无告警,即B站点4-OIB1无RS_LOS告警,所以可以排除B站点与C站点的光纤连接问题,即B、C站点光路连接正常。A站点4-OIB1无任何远端误码告警(HP_REI、LP_REI)即可以排除A站点到D站点的误码问题,即两站点间光路无损耗。

(2)电路、光路、业务配置无任何问题,E300网管管理不到C站点与D站点可以初步定为在ECC故障问题,即可以定位为B、C、D站点的NCP故障。为什么考虑B站点,因为C、D站点通过B站点与E300网管通信,但不能排斥由于B站点NCP单板通信阻塞导致E300网管对C、D站点管理不到。由于D站点是通过C站点与A站点及B站点进行ECC通信的,所以C站点存在ECC故障,由于ECC通信是由NCP单板来管理的,所以C站点ECC故障点是在NCP单板上。

(3)对故障点进行排除。可以前往C站点进行NCP单板复位的工作,如果经过复位后E300网管可以对链上所有站点进行管理,则说明故障得以解决。此外还可以在E300上对B站点进行NCP单板的复位工作,如果问题不能够解决,则需要更换C站点NCP单板。

【总结】

(1)ECC故障问题可以参考网管连接故障及故障定位的思路来进行。

(2)排除故障要按照由重到轻的顺序进行,可以参考排除故障的步骤来进行。

(3)重点注意处理ECC时复位NCP板与复位光板之间的差别。(www.xing528.com)

【案例3】

某局由4端设备组成一个2.5G复用段保护环,中心局点使用内时钟,其他3端设备从中心局提取线路时钟。一局方反映和中心局之间有光路连接的某站点一直有指针调制事件发生。

【故障分析】

到网管上进行检查,发现13槽位的SC板上报时钟源丢失的警告,检查时钟情况,发现该站点一直处于内时钟状态,而14槽位的SC板无任何告警。一般来说线路时钟丢失,两块时钟板应该同时上报告警,但是现在只有一块时钟板上报告警,显得有点不正常,将时钟板进行强制切换,告警现象不变,检查时钟源,发现仍然工作在13槽位的时钟板上,怀疑13槽位的时钟板S口通信问题影响时钟源对13槽位的时钟板进行S口通信测试,发现不提取时钟,然后将强制状态仍然设置在13槽位时钟板上。

首先复位13槽位SC板,没有效果,将13槽位SC板拔出,此时业务发生中断,将新带的单板插入,等单板运行正常后业务也恢复了正常,对13槽位SC板进行S口通信测试,正常,检查时钟源,显示提取线路时钟正常。

【总结】

对于交叉板和时钟板,在网管中默认的强制状态是清除状态,但是往往由于一些误操作,将强制状态设置为某块固定的单板,这样就会发生插拔单板的时候业务中断的现象。

【案例4】

某地传输接入网一条链形组网,是由A、B、C、D四站点组建成,如图10-7所示。A为网关网元,A-D站点原有3条2Mb/s的电路业务,A站点至B、C站点分别各有5条2Mb/s的电路业务,(A、B、C、D均为ZXMPS320设备)。某天,某小区进行宽带扩容,需要在这条链形网上增加A至D站点3条2M b/s电路业务,突然发现原本A站点至C、D站点的2Mb/s电路都出现了故障,并在相应站点上报TU12-AIS和不可用秒UAS告警。

图10-7 案例组网图

【故障分析】

此案例可以根据故障处理思路进行如下分析。

(1)首先观察E300网管发现网管上只有低阶告警TU12-AIS和不可用秒UAS告警,没有光线路上的告警及误码告警,并且网管可以监控到所有网元,所有排除线路中断,光缆衰耗过大的故障。

(2)由于网管监控到的是低阶AIS类告警,且光线路无任何告警,则可以将故障定位在设备的交叉板、支路板、支路板接口、2Mb/s同轴电缆、DDF端子、底层数据设备。由于A站点至B站点的原有业务无任何告警,且无B站点至C、D站点的业务,所以可以排除A、B站点及其底层数据设备出现故障问题。因为本次新扩容业务是A站点至D站点间的业务,且原A站点至C、D站点的业务全部出现了问题,则可以将故障点定位在C、D两个站点,由于D站点的业务需要通过C站点,所以C站点出现故障的可能性最大,但不排除C、D两站点同时发生支路板故障或底层数据设备故障、支路板接口故障等。

(3)由于是AIS类告警,并且已经将故障点定位在了C、D站点,则可以考虑用逐级环回进行测试。①先通知C、D两站点的工程师,分别在DDF架上将对应A站点的业务进行线路环回(硬件环回),如TU12-AIS告警消失,则说明C、D站点的底层数据设备同时出现了问题。②如告警没有消失,需要继续环回,分别在C、D两个站点的支路板上进行线路环回(软件环回),看告警是否消失。如果消失则说明C、D站点的支路接口或2Mb/s同轴电缆出现了问题。如果是其中的2Mb/s电路接口出现了问题,可以用SDH分析仪来进行故障定位,也可以向客户申请进行板位及业务调整来判断是2Mb/s电缆问题还是支路板接口的问题。③如果进行支路板软件环回问题还没有解决,那故障点就可以定位在C站点与D站点之间。此时可以在C站点对D站点进行终端环回(在C点4-OIB1软件环回),如D站点TU12-AIS告警消失则说明故障点为C站的交叉板,可以对C站点进行软件复位、或更换C站点的交叉板来解决故障。

【总结】

(1)2Mb/s故障问题可以参考业务中断故障定位的思路来进行。

(2)排除故障要按照由重到轻的顺序进行,可以参考排除故障的步骤来进行。

(3)重点注意处理2Mb/s电路业务时故障定位,逐级环回的应用及应用的位置。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈