欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種分布式設(shè)備的故障檢測(cè)方法和裝置的制作方法

文檔序號(hào):7853970閱讀:147來(lái)源:國(guó)知局
專利名稱:一種分布式設(shè)備的故障檢測(cè)方法和裝置的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及通信技術(shù)領(lǐng)域,特別涉及一種分布式設(shè)備的故障檢測(cè)方法和裝置。
背景技術(shù)
目前中高端網(wǎng)絡(luò)設(shè)備主要采用分布式架構(gòu),如圖I所示。典型的分布式設(shè)備由轉(zhuǎn)發(fā)平面、控制平面和檢測(cè)平面等幾個(gè)平面組成,其中,控制平面和轉(zhuǎn)發(fā)平面是主要工作平面,分別負(fù)責(zé)整個(gè)分布式設(shè)備的內(nèi)部管理通信和業(yè)務(wù)轉(zhuǎn)發(fā);檢測(cè)平面主要負(fù)責(zé)實(shí)時(shí)對(duì)分布式設(shè)備內(nèi)的各裝置進(jìn)行檢測(cè)和修復(fù)。圖I所示分布式設(shè)備的協(xié)議報(bào)文發(fā)送過(guò)程可參見(jiàn)圖2,如圖2所示,協(xié)議報(bào)文由主控板中央處理單元(CPU)發(fā)送給主控板以太網(wǎng)交換機(jī)(LSW),再由主控板LSW發(fā)送給接口板 LSff,進(jìn)而由接口板LSW發(fā)送給接口板中的某一個(gè)轉(zhuǎn)發(fā)芯片,最后,由該轉(zhuǎn)發(fā)芯片將接收到的協(xié)議報(bào)文復(fù)制給其它轉(zhuǎn)發(fā)芯片后,通過(guò)轉(zhuǎn)發(fā)芯片上的各個(gè)端口轉(zhuǎn)發(fā)出去。
通過(guò)上述分析可見(jiàn),現(xiàn)有協(xié)議報(bào)文是由主控板CPU通過(guò)主控板的LSW和接口板的 LSW發(fā)送給接口板中某個(gè)轉(zhuǎn)發(fā)芯片,以完成轉(zhuǎn)發(fā)的。如果協(xié)議報(bào)文發(fā)送過(guò)程中所經(jīng)過(guò)的內(nèi)部通道(主控板LSW和接口板LSW的統(tǒng)稱)或轉(zhuǎn)發(fā)芯片故障,則整個(gè)協(xié)議報(bào)文的發(fā)送都會(huì)失敗,從而影響整個(gè)分布式設(shè)備的組網(wǎng)和業(yè)務(wù)。因此,如何快速準(zhǔn)確地檢測(cè)出分布式設(shè)備內(nèi)故障的裝置(轉(zhuǎn)發(fā)芯片或內(nèi)部通道),已經(jīng)成為現(xiàn)有分布式設(shè)備中亟需解決的問(wèn)題。

發(fā)明內(nèi)容
有鑒于此,本發(fā)明提供了一種分布式設(shè)備的故障檢測(cè)方法,能夠快速準(zhǔn)確地檢測(cè)出故障的裝置,以減少故障的裝置對(duì)分布式設(shè)備的整體業(yè)務(wù)的影響。本發(fā)明還提供了一種分布式設(shè)備中的故障檢測(cè)裝置,能夠快速準(zhǔn)確地檢測(cè)出分布式設(shè)備內(nèi)故障的設(shè)備,以減少該故障的裝置對(duì)分布式設(shè)備的整體業(yè)務(wù)的影響。為了達(dá)到上述目的,本發(fā)明提出的技術(shù)方案為一種分布式設(shè)備的故障檢測(cè)方法,該方法包括主控板中的輔助中央處理單元CPU通過(guò)主控板以太網(wǎng)交換機(jī)LSW、接口板LSW將環(huán)回探測(cè)報(bào)文發(fā)送給每一個(gè)接口板中的每一個(gè)轉(zhuǎn)發(fā)芯片;當(dāng)在設(shè)定時(shí)間內(nèi)輔助CPU未收到對(duì)應(yīng)轉(zhuǎn)發(fā)芯片返回的環(huán)回探測(cè)報(bào)文時(shí),輔助CPU 通過(guò)主控板LSW將環(huán)回探測(cè)報(bào)文發(fā)送給每一個(gè)接口板LSW ;當(dāng)在設(shè)定時(shí)間內(nèi)輔助CPU收到對(duì)應(yīng)接口板LSW返回的環(huán)回探測(cè)報(bào)文時(shí),判斷為對(duì)應(yīng)的轉(zhuǎn)發(fā)芯片故障;當(dāng)在設(shè)定時(shí)間內(nèi)輔助CPU未收到對(duì)應(yīng)接口板LSW返回的環(huán)回探測(cè)報(bào)文時(shí),輔助CPU向主控板LSW發(fā)送環(huán)回探測(cè)報(bào)文,當(dāng)在設(shè)定時(shí)間內(nèi)輔助CPU收到主控板LSW返回的環(huán)回探測(cè)報(bào)文時(shí),判斷為對(duì)應(yīng)的接口板LSW故障,否則,判斷為主控板LSW故障。該方法還包括當(dāng)在設(shè)定時(shí)間內(nèi)輔助CPU收到對(duì)應(yīng)轉(zhuǎn)發(fā)芯片返回的環(huán)回探測(cè)報(bào)文時(shí),判斷為對(duì)應(yīng)的轉(zhuǎn)發(fā)芯片、接口板LSW和主控板LSW都正常。
所述主控板中的輔助CPU通過(guò)主控板LSW、接口板LSW將環(huán)回探測(cè)報(bào)文發(fā)送給每一個(gè)接口板中的每一個(gè)轉(zhuǎn)發(fā)芯片包括輔助CPU將環(huán)回探測(cè)報(bào)文發(fā)送給主控板LSW,由主控板 LSff將環(huán)回探測(cè)報(bào)文發(fā)送給每一個(gè)接口板LSW,再由接口板LSW將環(huán)回探測(cè)報(bào)文發(fā)送給該接口板中每一個(gè)轉(zhuǎn)發(fā)芯片;所述輔助CPU收到對(duì)應(yīng)轉(zhuǎn)發(fā)芯片返回的環(huán)回探測(cè)報(bào)文包括對(duì)應(yīng)轉(zhuǎn)發(fā)芯片將環(huán)回探測(cè)報(bào)文發(fā)送給該轉(zhuǎn)發(fā)芯片對(duì)應(yīng)的接口板LSW,由對(duì)應(yīng)的接口板LSW將環(huán)回探測(cè)報(bào)文發(fā)送給主控板LSW,再由主控板LSW將環(huán)回探測(cè)報(bào)文發(fā)送給輔助CPU。所述CPU周期性地將環(huán)回探測(cè)報(bào)文發(fā)送給每一個(gè)轉(zhuǎn)發(fā)芯片,則,所述主控板中的輔助CPU通過(guò)主控板LSW、接口板LSW將環(huán)回探測(cè)報(bào)文發(fā)送給每一個(gè)接口板中的每一個(gè)轉(zhuǎn)發(fā)芯片后,該方法還包括輔助CPU記錄發(fā)送給每一個(gè)轉(zhuǎn)發(fā)芯片的環(huán)回探測(cè)報(bào)文個(gè)數(shù);所述輔助CPU收到對(duì)應(yīng)轉(zhuǎn)發(fā)芯片返回的環(huán)回探測(cè)報(bào)文后,該方法還包括輔助CPU 記錄接收到的每一個(gè)轉(zhuǎn)發(fā)芯片返回的環(huán)回探測(cè)報(bào)文個(gè)數(shù);輔助CPU計(jì)算所述發(fā)送的環(huán)回探測(cè)報(bào)文個(gè)數(shù)與所述接收的環(huán)回探測(cè)報(bào)文個(gè)數(shù)的差值,當(dāng)在設(shè)定時(shí)間內(nèi),計(jì)算出的所述差值小于一閾值時(shí),判斷為輔助CPU收到對(duì)應(yīng)轉(zhuǎn)發(fā)芯片返回的環(huán)回檢測(cè)報(bào)文;否則,判斷為未收到對(duì)應(yīng)轉(zhuǎn)發(fā)芯片返回的環(huán)回檢測(cè)報(bào)文。 所述輔助CPU通過(guò)主控板LSW將環(huán)回探測(cè)報(bào)文發(fā)送給每一個(gè)接口板LSW包括主控板中的輔助CPU將環(huán)回探測(cè)報(bào)文發(fā)送給主控板LSW,由主控板LSW將環(huán)回探測(cè)報(bào)文發(fā)送給每一個(gè)接口板LSW;所述輔助CPU收到對(duì)應(yīng)接口板LSW返回的環(huán)回探測(cè)報(bào)文包括對(duì)應(yīng)接口板LSW將環(huán)回探測(cè)報(bào)文發(fā)送給主控板LSW,由主控板LSW將環(huán)回探測(cè)報(bào)文發(fā)送給輔助CPU。所述輔助CPU周期性將環(huán)回探測(cè)報(bào)文發(fā)送給每一個(gè)接口板LSW,則,所述輔助CPU通過(guò)主控板LSW將環(huán)回探測(cè)報(bào)文發(fā)送給每一個(gè)接口板LSW后,該方法還包括輔助CPU記錄發(fā)送給每一個(gè)接口板LSW的環(huán)回探測(cè)報(bào)文個(gè)數(shù);所述輔助CPU收到對(duì)應(yīng)接口板LSW返回的環(huán)回探測(cè)報(bào)文后,該方法還包括輔助 CPU記錄接收到的每一個(gè)接口板LSW返回的環(huán)回探測(cè)報(bào)文個(gè)數(shù);輔助CPU計(jì)算所述發(fā)送的環(huán)回探測(cè)報(bào)文個(gè)數(shù)與所述接收的環(huán)回探測(cè)報(bào)文個(gè)數(shù)的差值,當(dāng)在設(shè)定時(shí)間內(nèi),計(jì)算出的所述差值小于一閾值時(shí),判斷為輔助CPU收到對(duì)應(yīng)接口板 LSW返回的環(huán)回檢測(cè)報(bào)文;否則,判斷為未收到對(duì)應(yīng)接口板LSW返回的環(huán)回檢測(cè)報(bào)文。所述輔助CPU周期性地向主控板LSW發(fā)送環(huán)回探測(cè)報(bào)文,則,所述輔助CPU將環(huán)回探測(cè)報(bào)文發(fā)送給主控板LSW后,該方法還包括輔助CPU記錄發(fā)送給主控板LSW的環(huán)回探測(cè)報(bào)文個(gè)數(shù);所述輔助CPU收到主控板LSW返回的環(huán)回探測(cè)報(bào)文后,該方法還包括輔助CPU記錄接收到的主控板LSW返回的環(huán)回探測(cè)報(bào)文個(gè)數(shù);輔助CPU計(jì)算所述發(fā)送的環(huán)回探測(cè)報(bào)文個(gè)數(shù)與所述接收的環(huán)回探測(cè)報(bào)文個(gè)數(shù)的差值,當(dāng)在設(shè)定時(shí)間內(nèi),計(jì)算出的所述差值小于一閾值時(shí),判斷為輔助CPU收到主控板LSW 返回的環(huán)回檢測(cè)報(bào)文;否則,判斷為未收到主控板LSW返回的環(huán)回檢測(cè)報(bào)文。所述CPU發(fā)送環(huán)回探測(cè)報(bào)文是以CPU中斷為周期的。當(dāng)所述轉(zhuǎn)發(fā)芯片故障時(shí),該方法還包括輔助CPU將所述轉(zhuǎn)發(fā)芯片故障的消息通知給其他每一個(gè)CPU,以使得后續(xù)交互的報(bào)文通過(guò)正常的轉(zhuǎn)發(fā)芯片進(jìn)行發(fā)送;當(dāng)所述接口板LSW故障時(shí),該方法還包括輔助CPU將所述接口板LSW故障的消息通知給其他每一個(gè)CPU,以使得后續(xù)交互的報(bào)文通過(guò)正常的接口板LSW進(jìn)行發(fā)送。當(dāng)所述轉(zhuǎn)發(fā)芯片故障時(shí),該方法還包括輔助CPU將故障的轉(zhuǎn)發(fā)芯片復(fù)位使其恢復(fù)正常工作;當(dāng)所述接口板LSW故障時(shí),該方法還包括輔助CPU重新啟動(dòng)該故障接口板使該接口板LSW恢復(fù)正常工作;當(dāng)所述主控板LSW故障時(shí),該方法還包括輔助CPU重新啟動(dòng)該故障主控板,并在所有接口板中重新選取主控板。一種分布式設(shè)備中的故障檢測(cè)裝置,該故障檢測(cè)裝置包括第一發(fā)送單元、第二發(fā)送單元、第一判斷單元、第三發(fā)送單元、第二判斷單元和第三判斷單元,其中,所述第一發(fā)送單元,用于通過(guò)主控板以太網(wǎng)交換機(jī)LSW、接口板LSW將環(huán)回探測(cè)報(bào)文發(fā)送給每一個(gè)接口板中的每一個(gè)轉(zhuǎn)發(fā)芯片;第二發(fā)送單元,用于當(dāng)?shù)谝话l(fā)送單元發(fā)送環(huán)回探測(cè)報(bào)文后,在設(shè)定時(shí)間內(nèi)未收到對(duì)應(yīng)轉(zhuǎn)發(fā)芯片返回的環(huán)回探測(cè)報(bào)文時(shí),通過(guò)主控板LSW將環(huán)回探測(cè)報(bào)文發(fā)送給每一個(gè)接口板 LSff ;所述第一判斷單元,用于當(dāng)?shù)诙l(fā)送單元發(fā)送環(huán)回探測(cè)報(bào)文后,在設(shè)定時(shí)間內(nèi)收到對(duì)應(yīng)接口板LSW返回的環(huán)回探測(cè)報(bào)文時(shí),判斷為對(duì)應(yīng)的轉(zhuǎn)發(fā)芯片故障;所述第三發(fā)送單元,用于當(dāng)?shù)诙l(fā)送單元發(fā)送環(huán)回探測(cè)報(bào)文后,在設(shè)定時(shí)間內(nèi)未收到對(duì)應(yīng)接口板LSW返回的環(huán)回探測(cè)報(bào)文時(shí),向主控板LSW發(fā)送環(huán)回探測(cè)報(bào)文;所述第二判斷單元,用于當(dāng)?shù)谌l(fā)送單元發(fā)送環(huán)回探測(cè)報(bào)文后,在設(shè)定時(shí)間內(nèi)收到主控板LSW返回的環(huán)回探測(cè)報(bào)文時(shí),判斷為對(duì)應(yīng)的接口板LSW故障;所述第三判斷單元,用于當(dāng)?shù)谌l(fā)送單元發(fā)送環(huán)回探測(cè)報(bào)文后,在設(shè)定時(shí)間內(nèi)未收到主控板LSW返回的環(huán)回探測(cè)報(bào)文時(shí),判斷為主控板LSW故障。該故障檢測(cè)裝置還包括第四判斷單元,用于當(dāng)?shù)谝话l(fā)送單元發(fā)送環(huán)回探測(cè)報(bào)文后,在設(shè)定時(shí)間內(nèi)收到對(duì)應(yīng)轉(zhuǎn)發(fā)芯片返回的環(huán)回探測(cè)報(bào)文時(shí),判斷為對(duì)應(yīng)的轉(zhuǎn)發(fā)芯片、接口板LSW和主控板LSW都正常。所述第一發(fā)送單元,用于將環(huán)回探測(cè)報(bào)文發(fā)送給主控板LSW,由主控板LSW將環(huán)回探測(cè)報(bào)文發(fā)送給每一個(gè)接口板LSW,再由接口板LSW將環(huán)回探測(cè)報(bào)文發(fā)送給該接口板中每一個(gè)轉(zhuǎn)發(fā)芯片。所述第一發(fā)送單元周期性地將環(huán)回探測(cè)報(bào)文發(fā)送給每一個(gè)轉(zhuǎn)發(fā)芯片,則該故障檢測(cè)裝置還包括第一記錄單元、第一計(jì)算單元和第五判斷單元,其中,所述第一記錄單元,用于當(dāng)?shù)谝话l(fā)送單元將環(huán)回探測(cè)報(bào)文發(fā)送給該接口板中每一個(gè)轉(zhuǎn)發(fā)芯片后,記錄發(fā)送給每一個(gè)轉(zhuǎn)發(fā)芯片的環(huán)回探測(cè)報(bào)文個(gè)數(shù),并記錄接收到的每一個(gè)轉(zhuǎn)發(fā)芯片返回的環(huán)回探測(cè)報(bào)文個(gè)數(shù);所述第一計(jì)算單元,用于計(jì)算第一記錄單元中記錄的發(fā)送的環(huán)回探測(cè)報(bào)文個(gè)數(shù)與所述接收的環(huán)回探測(cè)報(bào)文個(gè)數(shù)的差值;所述第五判斷單元,用于在設(shè)定時(shí)間內(nèi),當(dāng)?shù)谝挥?jì)算單元計(jì)算出的所述差值小于一閾值時(shí),判斷為收到對(duì)應(yīng)轉(zhuǎn)發(fā)芯片返回的環(huán)回檢測(cè)報(bào)文;否則,判斷為未收到對(duì)應(yīng)轉(zhuǎn)發(fā)芯片返回的環(huán)回檢測(cè)報(bào)文。所述第二發(fā)送單元,用于將環(huán)回探測(cè)報(bào)文發(fā)送給主控板LSW,由主控板LSW將環(huán)回探測(cè)報(bào)文發(fā)送給每一個(gè)接口板LSW。所述第二發(fā)送單元周期性將環(huán)回探測(cè)報(bào)文發(fā)送給每一個(gè)接口板LSW,則該故障檢測(cè)裝置還包括第二記錄單元、第二計(jì)算單元和第六判斷單元,其中,所述第二記錄單元,用于當(dāng)?shù)诙l(fā)送單元發(fā)送環(huán)回探測(cè)報(bào)文后,記錄發(fā)送給每一個(gè)接口板LSW的環(huán)回探測(cè)報(bào)文個(gè)數(shù),并記錄接收到的每一個(gè)接口板LSW返回的環(huán)回探測(cè)報(bào)文個(gè)數(shù);所述第二計(jì)算單元,用于計(jì)算第二記錄單元中記錄的發(fā)送的環(huán)回探測(cè)報(bào)文個(gè)數(shù)與所述接收的環(huán)回探測(cè)報(bào)文個(gè)數(shù)的差值;所述第六判斷單元,用于在設(shè)定時(shí)間內(nèi),當(dāng)?shù)诙?jì)算單元計(jì)算出的所述差值小于一閾值時(shí),判斷為收到對(duì)應(yīng)接口板LSW返回的環(huán)回檢測(cè)報(bào)文;否則,判斷為未收到對(duì)應(yīng)接口板LSW返回的環(huán)回檢測(cè)報(bào)文。 所述第三發(fā)送單元周期性將環(huán)回探測(cè)報(bào)文發(fā)送給主控板LSW,則該故障檢測(cè)裝置還包括第三記錄單元、第三計(jì)算單元和第七判斷單元,其中,所述第三記錄單元,用于當(dāng)?shù)谌l(fā)送單元發(fā)送環(huán)回探測(cè)報(bào)文后,記錄發(fā)送給主控板LSW的環(huán)回探測(cè)報(bào)文個(gè)數(shù),并記錄接收到的主控板LSW返回的環(huán)回探測(cè)報(bào)文個(gè)數(shù);所述第三計(jì)算單元,用于計(jì)算第三記錄單元中記錄的發(fā)送的環(huán)回探測(cè)報(bào)文個(gè)數(shù)與所述接收的環(huán)回探測(cè)報(bào)文個(gè)數(shù)的差值;所述第七判斷單元,用于在設(shè)定時(shí)間內(nèi),當(dāng)?shù)谌?jì)算單元計(jì)算出的所述差值小于一閾值時(shí),判斷為收到主控板LSW返回的環(huán)回檢測(cè)報(bào)文;否則,判斷為未收到主控板LSW返回的環(huán)回檢測(cè)報(bào)文。該故障檢測(cè)裝置還包括故障通知單元,用于當(dāng)?shù)谝慌袛鄦卧袛酁檗D(zhuǎn)發(fā)芯片故障時(shí),將所述轉(zhuǎn)發(fā)芯片故障的消息通知給其他每一個(gè)中央處理單元CPU,以使得后續(xù)交互的報(bào)文通過(guò)正常的轉(zhuǎn)發(fā)芯片進(jìn)行發(fā)送;或,當(dāng)?shù)诙袛鄦卧袛酁榻涌诎錖SW故障時(shí),將所述接口板LSW故障的消息通知給其他每一個(gè)CPU,以使得后續(xù)交互的報(bào)文通過(guò)正常的接口板LSW 進(jìn)行發(fā)送。該故障檢測(cè)裝置還包括故障恢復(fù)單元,用于當(dāng)當(dāng)?shù)谝慌袛鄦卧袛酁檗D(zhuǎn)發(fā)芯片故障時(shí),將故障的轉(zhuǎn)發(fā)芯片復(fù)位使其恢復(fù)正常工作;或,當(dāng)?shù)诙袛鄦卧袛酁榻涌诎錖SW故障時(shí),重新啟動(dòng)該故障接口板使該接口板LSW恢復(fù)正常工作;或,當(dāng)?shù)谌袛鄦卧袛酁橹骺匕錖SW故障時(shí),重新啟動(dòng)該故障主控板,并在所有接口板中重新選取主控板。綜上所述,本發(fā)明所采用的分布式設(shè)備的故障檢測(cè)方法,是通過(guò)由輔助CPU將環(huán)回探測(cè)報(bào)文發(fā)送給每一個(gè)轉(zhuǎn)發(fā)芯片,如果在一設(shè)定時(shí)間內(nèi)收到對(duì)應(yīng)轉(zhuǎn)發(fā)芯片返回的環(huán)回探測(cè)報(bào)文,則判斷為分布式設(shè)備內(nèi)裝置正常工作;如果沒(méi)有收到對(duì)應(yīng)轉(zhuǎn)發(fā)芯片返回的環(huán)回探測(cè)報(bào)文,再將環(huán)回探測(cè)報(bào)文發(fā)送給每一個(gè)接口板LSW,當(dāng)收到接口板LSW返回的環(huán)回探測(cè)報(bào)文時(shí),判斷為對(duì)應(yīng)的轉(zhuǎn)發(fā)芯片故障,否則,繼續(xù)向主控板LSW發(fā)送環(huán)回探測(cè)報(bào)文,在收到主控板LSW返回的環(huán)回探測(cè)報(bào)文時(shí),判斷為對(duì)應(yīng)的接口板LSW為故障,如果沒(méi)有收到主控板 LSff返回的環(huán)回探測(cè)報(bào)文,則判斷為主控板LSW故障。由于本發(fā)明方法是通過(guò)輔助CPU在分布式設(shè)備內(nèi)發(fā)送不同路徑的環(huán)回探測(cè)報(bào)文,而環(huán)回探測(cè)報(bào)文發(fā)送的靈敏度很高,因而能夠快速準(zhǔn)確地確定出故障故障檢測(cè)裝置,且環(huán)回探測(cè)報(bào)文的發(fā)送都是通過(guò)輔助CPU來(lái)進(jìn)行的,因?yàn)椴粫?huì)對(duì)分布式設(shè)備內(nèi)部網(wǎng)絡(luò)造成負(fù)荷。


圖I為現(xiàn)有典型的分布式設(shè)備的結(jié)構(gòu)示意圖;圖2為本發(fā)明所采用的故障檢測(cè)方法的工作流程圖;圖3為本發(fā)明輔助CPU發(fā)送環(huán)回探測(cè)報(bào)文實(shí)施例一的示意圖;圖4為本發(fā)明輔助CPU發(fā)送環(huán)回探測(cè)報(bào)文實(shí)施例二的示意圖;圖5為本發(fā)明輔助CPU發(fā)送環(huán)回探測(cè)報(bào)文實(shí)施例三的示意圖; 圖6為本發(fā)明所采用的故障檢測(cè)故障檢測(cè)裝置的結(jié)構(gòu)示意圖。
具體實(shí)施例方式為了解決本發(fā)明提出的技術(shù)問(wèn)題,本發(fā)明所述方案的具體實(shí)現(xiàn)包括主控板中的輔助CPU通過(guò)主控板LSW、接口板LSW將環(huán)回探測(cè)報(bào)文發(fā)送給每一個(gè)接口板中的每一個(gè)轉(zhuǎn)發(fā)芯片;當(dāng)在設(shè)定時(shí)間內(nèi)輔助CPU未收到對(duì)應(yīng)轉(zhuǎn)發(fā)芯片返回的環(huán)回探測(cè)報(bào)文時(shí),輔助CPU通過(guò)主控板LSW將環(huán)回探測(cè)報(bào)文發(fā)送給每一個(gè)接口板LSW ;當(dāng)在設(shè)定時(shí)間內(nèi)輔助CPU收到對(duì)應(yīng)接口板LSW返回的環(huán)回探測(cè)報(bào)文時(shí),判斷為對(duì)應(yīng)的轉(zhuǎn)發(fā)芯片故障;當(dāng)在設(shè)定時(shí)間內(nèi)輔助CPU未收到對(duì)應(yīng)接口板LSW返回的環(huán)回探測(cè)報(bào)文時(shí),輔助CPU向主控板 LSff發(fā)送環(huán)回探測(cè)報(bào)文,當(dāng)在設(shè)定時(shí)間內(nèi)輔助CPU收到主控板LSW返回的環(huán)回探測(cè)報(bào)文時(shí), 判斷為對(duì)應(yīng)的接口板LSW故障,否則,判斷為主控板LSW故障。為使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合附圖及具體實(shí)施例對(duì)本發(fā)明作進(jìn)一步地詳細(xì)描述。圖2為本發(fā)明分布式設(shè)備的故障檢測(cè)方法的工作流程圖,如圖2所示,該流程包括步驟201 :主控板中的輔助CPU通過(guò)主控板LSW將環(huán)回探測(cè)報(bào)文發(fā)送給每一個(gè)接口板中的LSW,由接口板LSW將環(huán)回探測(cè)報(bào)文發(fā)送給每一個(gè)轉(zhuǎn)發(fā)芯片。本步驟的具體處理可參照?qǐng)D3,如圖3所示,主控板中的輔助CPU將環(huán)回探測(cè)報(bào)文發(fā)送給主控板LSW,由主控板LSW將環(huán)回探測(cè)報(bào)文發(fā)送給每一個(gè)接口板LSW,再由接口板LSW 將環(huán)回探測(cè)報(bào)文發(fā)送給該接口板中每一個(gè)轉(zhuǎn)發(fā)芯片。在本步驟中,輔助CPU可以只向每個(gè)轉(zhuǎn)發(fā)芯片發(fā)送一次環(huán)回探測(cè)報(bào)文,也可以周期性地將環(huán)回探測(cè)報(bào)文發(fā)送出去的,該周期可以以CPU中斷為周期,由此可以避免CPU任務(wù)調(diào)度帶來(lái)的干擾,該周期還可以以其它時(shí)間為周期,以不影響本發(fā)明實(shí)施例的實(shí)現(xiàn)為準(zhǔn)。本實(shí)施例中的輔助CPU可以為操作維護(hù)管理(0ΑΜ),其本質(zhì)為一 CPU (本發(fā)明中專用于檢測(cè)故障)。需要說(shuō)明的是,若是輔助CPU周期性地向轉(zhuǎn)發(fā)芯片發(fā)送環(huán)回探測(cè)報(bào)文,則當(dāng)輔助 CPU將環(huán)回探測(cè)報(bào)文發(fā)送給轉(zhuǎn)發(fā)芯片時(shí),還需記錄發(fā)送給每一個(gè)轉(zhuǎn)發(fā)芯片的環(huán)回探測(cè)報(bào)文個(gè)數(shù),以便后續(xù)能夠根據(jù)發(fā)送的報(bào)文個(gè)數(shù)與接收到的報(bào)文個(gè)數(shù)的差值確定是否接收到對(duì)應(yīng)轉(zhuǎn)發(fā)芯片返回的環(huán)回檢測(cè)報(bào)文,當(dāng)在一設(shè)定時(shí)間內(nèi),該差值小于一閾值時(shí),則判斷為收到該轉(zhuǎn)發(fā)芯片返回的環(huán)回檢測(cè)報(bào)文;否則,判斷為未接收到該轉(zhuǎn)發(fā)芯片返回的環(huán)回檢測(cè)報(bào)文。其中,所述閾值大小以實(shí)際實(shí)現(xiàn)為準(zhǔn),例如,實(shí)際應(yīng)用要求比較嚴(yán)格,不允許少許的丟包,則閾值可被設(shè)置小些;否則,閾值可被設(shè)置大些。進(jìn)一步地,對(duì)于首次被檢測(cè)的接口板,可以適當(dāng)增大該設(shè)定時(shí)間,以減少由于接口板初始化帶來(lái)的影響。步驟202 :在設(shè)定時(shí)間內(nèi)主控板中的輔助CPU是否能夠接收到對(duì)應(yīng)轉(zhuǎn)發(fā)芯片返回的環(huán)回探測(cè)報(bào)文,如果是,執(zhí)行步驟203 ;否則,執(zhí)行步驟204。在本步驟中,輔助CPU若能夠接收到對(duì)應(yīng)轉(zhuǎn)發(fā)芯片返回的環(huán)回探測(cè)報(bào)文,則其接收環(huán)回探測(cè)報(bào)文的過(guò)程可參見(jiàn)圖3,即對(duì)應(yīng)的轉(zhuǎn)發(fā)芯片將環(huán)回探測(cè)報(bào)文發(fā)送給該接口板 LSW,由接口板LSW將環(huán)回探測(cè)報(bào)文發(fā)送給主控板LSW,再由主控板LSW將環(huán)回探測(cè)報(bào)文發(fā)送給輔助CPU。需要說(shuō)明的是,當(dāng)輔助CPU收到轉(zhuǎn)發(fā)芯片返回的環(huán)回探測(cè)報(bào)文時(shí),可以將接收到的環(huán)回探測(cè)報(bào)文與之前發(fā)送給該轉(zhuǎn)發(fā)芯片的環(huán)回探測(cè)報(bào)文比較,以確認(rèn)是否準(zhǔn)確地接收到環(huán)回探測(cè)報(bào)文。還需說(shuō)明的是,在本步驟中,設(shè)定時(shí)間的大小依賴于裝置的具體實(shí)現(xiàn),如CPU收發(fā)報(bào)文的速率、轉(zhuǎn)發(fā)芯片轉(zhuǎn)發(fā)報(bào)文的時(shí)延。
步驟203 :判斷為對(duì)應(yīng)的轉(zhuǎn)發(fā)芯片和內(nèi)部管理通道(接口板LSW和主控板LSW)正常后,結(jié)束故障檢測(cè)的流程。若在設(shè)定時(shí)間內(nèi)主控板中的輔助CPU能夠接收到對(duì)應(yīng)轉(zhuǎn)發(fā)芯片返回的環(huán)回探測(cè)報(bào)文,則說(shuō)明該分布式設(shè)備中轉(zhuǎn)發(fā)該環(huán)回探測(cè)報(bào)文的轉(zhuǎn)發(fā)芯片和內(nèi)部管理通道均為正常工作。步驟204 :主控板中的輔助CPU通過(guò)主控板LSW將環(huán)回探測(cè)報(bào)文發(fā)送給每一個(gè)接口板中的LSW。若在設(shè)定時(shí)間內(nèi)主控板中的輔助CPU沒(méi)有接收到對(duì)應(yīng)轉(zhuǎn)發(fā)芯片返回的環(huán)回探測(cè)報(bào)文,則需進(jìn)一步執(zhí)行圖4所示的處理。如圖4所示,主控板中的輔助CPU將環(huán)回探測(cè)報(bào)文發(fā)送給主控板LSW,再由主控板LSW將環(huán)回探測(cè)報(bào)文發(fā)送給每一個(gè)接口板LSW。同步驟201,若是在CPU周期性地發(fā)送環(huán)回探測(cè)報(bào)文,則在本步驟中,當(dāng)輔助CPU將環(huán)回探測(cè)報(bào)文發(fā)送給接口板LSW時(shí),也需記錄發(fā)送給每一個(gè)LSW的環(huán)回探測(cè)報(bào)文個(gè)數(shù),以便后續(xù)能夠根據(jù)發(fā)送的報(bào)文個(gè)數(shù)與接收到的報(bào)文個(gè)數(shù)的差值確定是否接收到對(duì)應(yīng)接口板LSW 返回的環(huán)回檢測(cè)報(bào)文。同樣地,當(dāng)在一設(shè)定時(shí)間內(nèi),該差值小于一閾值時(shí),則判斷為收到該接口板LSW返回的環(huán)回檢測(cè)報(bào)文;否則,判斷為未接收到該LSW返回的環(huán)回檢測(cè)報(bào)文。且本步驟中CPU發(fā)送環(huán)回探測(cè)報(bào)文也是周期性進(jìn)行的。其中,所述閾值大小以實(shí)際實(shí)現(xiàn)為準(zhǔn),例如,實(shí)際應(yīng)用要求比較嚴(yán)格,不允許少許的丟包,則閾值可被設(shè)置小些;否則,閾值可被設(shè)置大些。步驟205 :在設(shè)定時(shí)間內(nèi)主控板中的輔助CPU是否能夠接收到對(duì)應(yīng)接口板LSW返回的環(huán)回探測(cè)報(bào)文,如果是,執(zhí)行步驟206 ;否則,執(zhí)行步驟207。在本步驟中,輔助CPU若能夠接收到對(duì)應(yīng)接口板LSW返回的環(huán)回探測(cè)報(bào)文,則其接收環(huán)回探測(cè)報(bào)文的過(guò)程可參見(jiàn)圖4,即對(duì)應(yīng)的接口板LSW將環(huán)回探測(cè)報(bào)文發(fā)送給主控板 LSW,再由主控板LSW將環(huán)回探測(cè)報(bào)文發(fā)送給輔助CPU。需要說(shuō)明的是,在本步驟中,設(shè)定時(shí)間的大小依賴于設(shè)備的具體實(shí)現(xiàn),如CPU收發(fā)報(bào)文的速率、轉(zhuǎn)發(fā)芯片轉(zhuǎn)發(fā)報(bào)文的時(shí)延。步驟206 :判斷為對(duì)應(yīng)的轉(zhuǎn)發(fā)芯片故障后,結(jié)束故障檢測(cè)的流程。若在設(shè)定時(shí)間內(nèi)主控板中的輔助CPU接收到對(duì)應(yīng)接口板LSW返回的環(huán)回探測(cè)報(bào)文,則判斷為對(duì)應(yīng)的轉(zhuǎn)發(fā)芯片故障。需要說(shuō)明的是,當(dāng)輔助CPU 判斷為轉(zhuǎn)發(fā)芯片故障時(shí),需要將該轉(zhuǎn)發(fā)芯片故障的消息通知給其他所有CPU,每一個(gè)收到故障消息的CPU檢查所有協(xié)議報(bào)文發(fā)送的選擇路徑,如果有協(xié)議報(bào)文發(fā)送的路徑經(jīng)過(guò)該故障的轉(zhuǎn)發(fā)芯片,則將協(xié)議報(bào)文發(fā)送的選擇路徑切換到正常的轉(zhuǎn)發(fā)芯片上;如果有新協(xié)議報(bào)文需要發(fā)送,也選擇正常的轉(zhuǎn)發(fā)芯片發(fā)送該新協(xié)議報(bào)文。進(jìn)而,當(dāng)有其他報(bào)文交互時(shí),能夠?qū)⒃搱?bào)文通過(guò)正常的轉(zhuǎn)發(fā)芯片進(jìn)行發(fā)送,也就避免了由于轉(zhuǎn)發(fā)芯片故障可能帶來(lái)的業(yè)務(wù)丟包。還需說(shuō)明的是,當(dāng)判斷為轉(zhuǎn)發(fā)芯片故障時(shí),可以將該轉(zhuǎn)發(fā)芯片復(fù)位使氣恢復(fù)正常工作,如果該轉(zhuǎn)發(fā)芯片復(fù)位后仍被判斷為故障,則可以down掉該轉(zhuǎn)發(fā)芯片上對(duì)應(yīng)的端口,避免后續(xù)由于該轉(zhuǎn)發(fā)芯片故障帶來(lái)的業(yè)務(wù)丟包。步驟207 :主控板中的輔助CPU向主控板LSW發(fā)送環(huán)回探測(cè)報(bào)文。若在設(shè)定時(shí)間內(nèi)主控板中的輔助CPU沒(méi)有接收到對(duì)應(yīng)接口板LSW返回的環(huán)回探測(cè)報(bào)文,則需進(jìn)一步執(zhí)行圖5所示的處理。如圖4所示,主控板中的輔助CPU將環(huán)回探測(cè)報(bào)文發(fā)送給主控板LSW。同步驟201和步驟204,在本步驟中,若是輔助CPU周期性地向主控板LSW發(fā)送環(huán)回探測(cè)報(bào)文,則當(dāng)輔助CPU將環(huán)回探測(cè)報(bào)文發(fā)送給主控板LSW時(shí),也要記錄發(fā)送給主控板LSff的環(huán)回探測(cè)報(bào)文個(gè)數(shù),以便后續(xù)能夠根據(jù)發(fā)送的報(bào)文個(gè)數(shù)與接收到的報(bào)文個(gè)數(shù)的差值確定是否接收到主控板LSW返回的環(huán)回檢測(cè)報(bào)文。同樣地,當(dāng)在一設(shè)定時(shí)間內(nèi),該差值小于一閾值時(shí),則判斷為收到該主控板LSW返回的環(huán)回檢測(cè)報(bào)文;否則,判斷為未接收到該主控板LSW返回的環(huán)回檢測(cè)報(bào)文。且本步驟中CPU發(fā)送環(huán)回探測(cè)報(bào)文也是周期性進(jìn)行的。其中,設(shè)定時(shí)間的大小也是依賴于裝置的具體實(shí)現(xiàn)的,如CPU收發(fā)報(bào)文的速率、轉(zhuǎn)發(fā)芯片轉(zhuǎn)發(fā)報(bào)文的時(shí)延。步驟208 :在設(shè)定時(shí)間內(nèi)輔助CPU是否能夠接收到主控板LSW返回的環(huán)回探測(cè)報(bào)文,如果是,執(zhí)行步驟210 ;否則,執(zhí)行步驟209。在本步驟中,輔助CPU若能夠接收到主控板LSW返回的環(huán)回探測(cè)報(bào)文,則其接收環(huán)回探測(cè)報(bào)文的過(guò)程可參見(jiàn)圖5,即主控板LSW將環(huán)回探測(cè)報(bào)文發(fā)送給輔助CPU。步驟209 :判斷為主控板LSW故障后,結(jié)束故障檢測(cè)的流程。若在設(shè)定時(shí)間內(nèi)主控板中的輔助CPU沒(méi)有接收到主控板LSW返回的環(huán)回探測(cè)報(bào)文,則判斷為主控板LSW故障。進(jìn)一步地,當(dāng)檢測(cè)出主控板LSW故障時(shí),可以通過(guò)重新啟動(dòng)該主控板的操作使該主控板恢復(fù)正常工作。需要說(shuō)明的是,如果分布式設(shè)備中有主控板LSW和接口板LSW都故障時(shí),則可重新啟動(dòng)主控板和接口板使其恢復(fù)正常工作,并在正常工作的接口板選取新的主控板。步驟210 :判斷為對(duì)應(yīng)的接口板LSW故障后,結(jié)束故障檢測(cè)的流程。若在設(shè)定時(shí)間內(nèi)主控板中的輔助CPU接收到主控板LSW返回的環(huán)回探測(cè)報(bào)文,則判斷為對(duì)應(yīng)的接口板LSW故障。
同步驟206,當(dāng)輔助CPU判斷為接口板LSW故障時(shí),需要將該接口板LSW故障的消息通知給其他所有CPU,每一個(gè)收到故障消息的CPU檢查所有協(xié)議報(bào)文發(fā)送的選擇路徑,如果有協(xié)議報(bào)文發(fā)送的路徑經(jīng)過(guò)該故障的接口板LSW,則將協(xié)議報(bào)文發(fā)送的選擇路徑切換到正常的接口板LSW上;如果有新協(xié)議報(bào)文需要發(fā)送,也選擇正常的接口板LSW發(fā)送該新協(xié)議報(bào)文。進(jìn)而,當(dāng)有其他報(bào)文交互時(shí),能夠?qū)⒃搱?bào)文通過(guò)正常的接口板LSW進(jìn)行發(fā)送,也就避免了由于接口板LSW故障可能帶來(lái)的業(yè)務(wù)丟包。進(jìn)一步地,當(dāng)檢測(cè)出接口板LSW故障時(shí),可以通過(guò)重新啟動(dòng)該接口板的操作使該接口板恢復(fù)正常工作。至此,即完成了本發(fā)明所采用的故障檢測(cè)方法的整個(gè)工作流程?;谏鲜龇椒ǎ瑘D6給出了本發(fā)明所采用的分布式設(shè)備中的故障檢測(cè)裝置的結(jié)構(gòu)示意圖,如圖6所示,該故障檢測(cè)設(shè)備包括第一發(fā)送單元601、第二發(fā)送單元602、第一判斷單元603、第三發(fā)送單元604、第二判斷單元605和第三判斷單元606,其中, 所述第一發(fā)送單元601,用于通過(guò)主控板LSW、接口板LSW將環(huán)回探測(cè)報(bào)文發(fā)送給每一個(gè)接口板中的每一個(gè)轉(zhuǎn)發(fā)芯片。進(jìn)一步地,所述第一發(fā)送單元601,用于將環(huán)回探測(cè)報(bào)文發(fā)送給主控板LSW,由主控板LSW將環(huán)回探測(cè)報(bào)文發(fā)送給每一個(gè)接口板LSW,再由接口板LSW將環(huán)回探測(cè)報(bào)文發(fā)送給該接口板中每一個(gè)轉(zhuǎn)發(fā)芯片;更進(jìn)一步地,所述第一發(fā)送單元601周期性地將環(huán)回探測(cè)報(bào)文發(fā)送給每一個(gè)轉(zhuǎn)發(fā)芯片,則該故障檢測(cè)裝置還包括第一記錄單元608、第一計(jì)算單元609和第五判斷單元610,其中,所述第一記錄單元608,用于當(dāng)?shù)谝话l(fā)送單元601將環(huán)回探測(cè)報(bào)文發(fā)送給該接口板中每一個(gè)轉(zhuǎn)發(fā)芯片后,記錄發(fā)送給每一個(gè)轉(zhuǎn)發(fā)芯片的環(huán)回探測(cè)報(bào)文個(gè)數(shù),并記錄接收到的每一個(gè)轉(zhuǎn)發(fā)芯片返回的環(huán)回探測(cè)報(bào)文個(gè)數(shù);所述第一計(jì)算單元609,用于計(jì)算第一記錄單元608中記錄的發(fā)送的環(huán)回探測(cè)報(bào)文個(gè)數(shù)與所述接收的環(huán)回探測(cè)報(bào)文個(gè)數(shù)的差值;所述第五判斷單元610,用于當(dāng)在設(shè)定時(shí)間內(nèi),第一計(jì)算單元609計(jì)算出的所述差值小于一閾值時(shí),判斷為收到對(duì)應(yīng)轉(zhuǎn)發(fā)芯片返回的環(huán)回檢測(cè)報(bào)文;否則,判斷為未收到對(duì)應(yīng)轉(zhuǎn)發(fā)芯片返回的環(huán)回檢測(cè)報(bào)文。第二發(fā)送單元602,用于當(dāng)?shù)谝话l(fā)送單元601發(fā)送環(huán)回探測(cè)報(bào)文后,在設(shè)定時(shí)間內(nèi)未收到對(duì)應(yīng)轉(zhuǎn)發(fā)芯片返回的環(huán)回探測(cè)報(bào)文時(shí),通過(guò)主控板LSW將環(huán)回探測(cè)報(bào)文發(fā)送給每一個(gè)接口板LSW。進(jìn)一步地,所述第二發(fā)送單元602,用于將環(huán)回探測(cè)報(bào)文發(fā)送給主控板LSW,由主控板LSW將環(huán)回探測(cè)報(bào)文發(fā)送給每一個(gè)接口板LSW。更進(jìn)一步地,所述第二發(fā)送單元602周期性將環(huán)回探測(cè)報(bào)文發(fā)送給每一個(gè)接口板LSff,則該故障檢測(cè)裝置還包括第二記錄單元611、第二計(jì)算單元612和第六判斷單元613,其中,所述第二記錄單元611,用于當(dāng)?shù)诙l(fā)送單元602發(fā)送環(huán)回探測(cè)報(bào)文后,記錄發(fā)送給每一個(gè)接口板LSW的環(huán)回探測(cè)報(bào)文個(gè)數(shù),并記錄接收到的每一個(gè)接口板LSW返回的環(huán)回探測(cè)報(bào)文個(gè)數(shù);
所述第二計(jì)算單元612,用于計(jì)算第二記錄單元611中記錄的發(fā)送的環(huán)回探測(cè)報(bào)文個(gè)數(shù)與所述接收的環(huán)回探測(cè)報(bào)文個(gè)數(shù)的差值;所述第六判斷單元613,用于在設(shè)定時(shí)間內(nèi),當(dāng)?shù)诙?jì)算單元611計(jì)算出的所述差值小于一閾值時(shí),判斷為收到對(duì)應(yīng)接口板LSW返回的環(huán)回檢測(cè)報(bào)文;否則,判斷為未收到對(duì)應(yīng)接口板LSW返回的環(huán)回檢測(cè)報(bào)文。所述第一判斷單元603,用于當(dāng)?shù)诙l(fā)送單元602發(fā)送環(huán)回探測(cè)報(bào)文后,在設(shè)定時(shí)間內(nèi)收到對(duì)應(yīng)接口板LSW返回的環(huán)回探測(cè)報(bào)文時(shí),判斷為對(duì)應(yīng)的轉(zhuǎn)發(fā)芯片故障。所述第三發(fā)送單元604,用于當(dāng)?shù)诙l(fā)送單元602發(fā)送環(huán)回探測(cè)報(bào)文后,在設(shè)定時(shí)間內(nèi)未收到對(duì)應(yīng)接口板LSW返回的環(huán)回探測(cè)報(bào)文時(shí),向主控板LSW發(fā)送環(huán)回探測(cè)報(bào)文。進(jìn)一步地,所述第三發(fā)送單元604周期性將環(huán)回探測(cè)報(bào)文發(fā)送給主控板LSW,則該故障檢測(cè)裝置還包括第三記錄單元614、第三計(jì)算單元615和第七判斷單元616,其中,所述第三記錄單元614,用于當(dāng)?shù)谌l(fā)送單元604發(fā)送環(huán)回探測(cè)報(bào)文后,記錄發(fā)送給主控板LSW的環(huán)回探測(cè)報(bào)文個(gè)數(shù),并記錄接收到的主控板LSW返回的環(huán)回探測(cè)報(bào)文個(gè)數(shù);所述第三計(jì)算單元615,用于計(jì)算第三記錄單元614中記錄的發(fā)送的環(huán)回探測(cè)報(bào)文個(gè)數(shù)與所述接收的環(huán)回探測(cè)報(bào)文個(gè)數(shù)的差值;所述第七判斷單元616,用于在設(shè)定時(shí)間內(nèi),當(dāng)?shù)谌?jì)算單元615計(jì)算出的所述差值小于一閾值時(shí),判斷為收到主控板LSW返回的環(huán)回檢測(cè)報(bào)文;否則,判斷為未收到主控板LSW返回的環(huán)回檢測(cè)報(bào)文。所述第二判斷單元605,用于當(dāng)?shù)谌l(fā)送單元604發(fā)送環(huán)回探測(cè)報(bào)文后,在設(shè)定時(shí)間內(nèi)收到主控板LSW返回的環(huán)回探測(cè)報(bào)文時(shí),判斷為對(duì)應(yīng)的接口板LSW故障;所述第三判斷單元606,用于當(dāng)?shù)谌l(fā)送單元604發(fā)送環(huán)回探測(cè)報(bào)文后,在設(shè)定時(shí)間內(nèi)未收到主控板LSW返回的環(huán)回探測(cè)報(bào)文時(shí),判斷為主控板LSW故障。進(jìn)一步地,該故障檢測(cè)裝置還包括第四判斷單元607,用于當(dāng)?shù)谝话l(fā)送單元601發(fā)送環(huán)回探測(cè)報(bào)文后,在設(shè)定時(shí)間內(nèi)收到對(duì)應(yīng)轉(zhuǎn)發(fā)芯片返回的環(huán)回探測(cè)報(bào)文時(shí),判斷為對(duì)應(yīng)的轉(zhuǎn)發(fā)芯片、接口板LSW和主控板LSW都正常。具體地,該故障檢測(cè)裝置還可包括故障通知單元617,用于當(dāng)?shù)谝慌袛鄦卧?03判斷為轉(zhuǎn)發(fā)芯片故障時(shí),將所述轉(zhuǎn)發(fā)芯片故障的消息通知給其他每一個(gè)CPU,以使得后續(xù)交互的報(bào)文通過(guò)正常的轉(zhuǎn)發(fā)芯片進(jìn)行發(fā)送;或,當(dāng)?shù)诙袛鄦卧?05判斷為接口板LSW故障時(shí),將所述接口板LSW故障的消息通知給其他每一個(gè)CPU,以使得后續(xù)交互的報(bào)文通過(guò)正常的接口板LSW進(jìn)行發(fā)送。即當(dāng)故障通知單元617將轉(zhuǎn)發(fā)芯片故障或接口板LSW故障的故障消息通知給其他每個(gè)CPU后,每一個(gè)收到故障消息的CPU檢查所有協(xié)議報(bào)文發(fā)送的選擇路徑,如果有協(xié)議報(bào)文發(fā)送的路徑經(jīng)過(guò)該故障的轉(zhuǎn)發(fā)芯片或接口板LSW,則將協(xié)議報(bào)文發(fā)送的選擇路徑切換到正常的轉(zhuǎn)發(fā)芯片或接口板LSW上;如果有新協(xié)議報(bào)文需要發(fā)送,也選擇正常的轉(zhuǎn)發(fā)芯片或接口板LSW發(fā)送該新協(xié)議報(bào)文。更加具體地,該故障檢測(cè)裝置還可包括故障恢復(fù)單元618,用于當(dāng)當(dāng)?shù)谝慌袛鄦卧?03判斷為轉(zhuǎn)發(fā)芯片故障時(shí),將故障的轉(zhuǎn)發(fā)芯片復(fù)位使其恢復(fù)正常工作;或,當(dāng)?shù)诙袛鄦卧?05判斷為接口板LSW故障時(shí),重新啟動(dòng)該故障接口板使該接口板LSW恢復(fù)正常工作;或,當(dāng)?shù)谌袛鄦卧?06判斷為主控板LSW故障時(shí),重新啟動(dòng)該故障主控板,并在所有接口、板中重新選取主控板。至此,即得到了本發(fā)明所采用的故障檢測(cè)裝置。圖6所述故障檢測(cè)裝置的具體工作流程可參見(jiàn)圖2、圖3、圖4和圖5所述方法的工作流程,這里不再贅述。總之,本發(fā)明所采用的分布式設(shè)備的故障檢測(cè)方法,首先,通過(guò)由輔助CPU將環(huán)回探測(cè)報(bào)文發(fā)送給每一個(gè)轉(zhuǎn)發(fā)芯片,如果在一設(shè)定時(shí)間內(nèi)收到對(duì)應(yīng)轉(zhuǎn)發(fā)芯片返回的環(huán)回探測(cè)報(bào)文,則判斷為分布式設(shè)備中的所有裝置都正常工作;如果沒(méi)有收到對(duì)應(yīng)轉(zhuǎn)發(fā)芯片返回的環(huán)回探測(cè)報(bào)文,再將環(huán)回探測(cè)報(bào)文發(fā)送給每一個(gè)接口板LSW,當(dāng)收到接口板LSW返回的環(huán)回探測(cè)報(bào)文時(shí),判斷為對(duì)應(yīng)的轉(zhuǎn)發(fā)芯片故障,否則,繼續(xù)向主控板LSW發(fā)送環(huán)回探測(cè)報(bào)文,在收到主控板LSW返回的環(huán)回探測(cè)報(bào)文時(shí),判斷為對(duì)應(yīng)的接口板LSW為故障,如果沒(méi)有收到主控板LSW返回的環(huán)回探測(cè)報(bào)文,則判斷為主控板LSW故障。由于本發(fā)明方法是通過(guò)輔助CPU在分布式設(shè)備內(nèi)發(fā)送不同路徑的環(huán)回探測(cè)報(bào)文,而環(huán)回探測(cè)報(bào)文發(fā)送的靈敏度很高,因而能夠快速準(zhǔn)確地確定出故障裝置,且環(huán)回探測(cè)報(bào)文的發(fā)送都是通過(guò)輔助CPU來(lái)進(jìn)行的,、因?yàn)椴粫?huì)對(duì)分布式設(shè)備內(nèi)部的網(wǎng)絡(luò)造成負(fù)荷。其次,在本發(fā)明所采用的故障檢測(cè)方法中,輔助CPU是周期性地在分布式設(shè)備內(nèi)發(fā)送環(huán)回探測(cè)報(bào)文的,且根據(jù)發(fā)送與接收到的環(huán)回探測(cè)報(bào)文的差值來(lái)確定是否收到環(huán)回探測(cè)報(bào)文,進(jìn)而確定分布式設(shè)備內(nèi)是否存在故障,也就避免了由于外界因素對(duì)探測(cè)結(jié)果準(zhǔn)確性的干擾,確保更準(zhǔn)確地檢測(cè)出故障裝置。再次,本發(fā)明故障檢測(cè)方法,當(dāng)檢測(cè)出某個(gè)裝置、如轉(zhuǎn)發(fā)芯片、接口板LSW或主控板LSW故障時(shí),都會(huì)將其進(jìn)行故障恢復(fù)的操作,也就避免了由于故障而對(duì)分布式設(shè)備內(nèi)部網(wǎng)絡(luò)的其他業(yè)務(wù)帶來(lái)的影響。最后,當(dāng)有裝置故障時(shí),本發(fā)明方法中的輔助CPU能夠?qū)⑦@些故障及時(shí)通知給其他所有CPU,從而當(dāng)后續(xù)報(bào)文交互時(shí),分布式設(shè)備能夠選擇正常工作的裝置對(duì)報(bào)文進(jìn)行轉(zhuǎn)發(fā),從而降低了故障對(duì)分布式設(shè)備業(yè)務(wù)的影響。以上所述僅為本發(fā)明的較佳實(shí)施例而已,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi),所做的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明保護(hù)的范圍之內(nèi)。
權(quán)利要求
1.一種分布式設(shè)備的故障檢測(cè)方法,其特征在于,該方法包括主控板中的輔助中央處理單元CPU通過(guò)主控板以太網(wǎng)交換機(jī)LSW、接口板LSW將環(huán)回探測(cè)報(bào)文發(fā)送給每一個(gè)接口板中的每一個(gè)轉(zhuǎn)發(fā)芯片;當(dāng)在設(shè)定時(shí)間內(nèi)輔助CPU未收到對(duì)應(yīng)轉(zhuǎn)發(fā)芯片返回的環(huán)回探測(cè)報(bào)文時(shí),輔助CPU通過(guò)主控板LSW將環(huán)回探測(cè)報(bào)文發(fā)送給每一個(gè)接口板LSW ;當(dāng)在設(shè)定時(shí)間內(nèi)輔助CPU收到對(duì)應(yīng)接口板LSW返回的環(huán)回探測(cè)報(bào)文時(shí),判斷為對(duì)應(yīng)的轉(zhuǎn)發(fā)芯片故障;當(dāng)在設(shè)定時(shí)間內(nèi)輔助CPU未收到對(duì)應(yīng)接口板LSW返回的環(huán)回探測(cè)報(bào)文時(shí),輔助CPU向主控板LSW發(fā)送環(huán)回探測(cè)報(bào)文,當(dāng)在設(shè)定時(shí)間內(nèi)輔助CPU收到主控板LSW返回的環(huán)回探測(cè)報(bào)文時(shí),判斷為對(duì)應(yīng)的接口板LSW故障,否則,判斷為主控板LSW故障。
2.根據(jù)權(quán)利要求I所述的方法,其特征在于,該方法還包括當(dāng)在設(shè)定時(shí)間內(nèi)輔助CPU收到對(duì)應(yīng)轉(zhuǎn)發(fā)芯片返回的環(huán)回探測(cè)報(bào)文時(shí),判斷為對(duì)應(yīng)的轉(zhuǎn)發(fā)芯片、接口板LSW和主控板LSW都正常。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述主控板中的輔助CPU通過(guò)主控板LSW、接口板LSW將環(huán)回探測(cè)報(bào)文發(fā)送給每一個(gè)接口板中的每一個(gè)轉(zhuǎn)發(fā)芯片包括輔助CPU將環(huán)回探測(cè)報(bào)文發(fā)送給主控板LSW,由主控板LSW 將環(huán)回探測(cè)報(bào)文發(fā)送給每一個(gè)接口板LSW,再由接口板LSW將環(huán)回探測(cè)報(bào)文發(fā)送給該接口板中每一個(gè)轉(zhuǎn)發(fā)芯片;所述輔助CPU收到對(duì)應(yīng)轉(zhuǎn)發(fā)芯片返回的環(huán)回探測(cè)報(bào)文包括對(duì)應(yīng)轉(zhuǎn)發(fā)芯片將環(huán)回探測(cè)報(bào)文發(fā)送給該轉(zhuǎn)發(fā)芯片對(duì)應(yīng)的接口板LSW,由對(duì)應(yīng)的接口板LSW將環(huán)回探測(cè)報(bào)文發(fā)送給主控板LSW,再由主控板LSW將環(huán)回探測(cè)報(bào)文發(fā)送給輔助CPU。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述CPU周期性地將環(huán)回探測(cè)報(bào)文發(fā)送給每一個(gè)轉(zhuǎn)發(fā)芯片,則,所述主控板中的輔助CPU通過(guò)主控板LSW、接口板LSW將環(huán)回探測(cè)報(bào)文發(fā)送給每一個(gè)接口板中的每一個(gè)轉(zhuǎn)發(fā)芯片后,該方法還包括輔助CPU記錄發(fā)送給每一個(gè)轉(zhuǎn)發(fā)芯片的環(huán)回探測(cè)報(bào)文個(gè)數(shù);所述輔助CPU收到對(duì)應(yīng)轉(zhuǎn)發(fā)芯片返回的環(huán)回探測(cè)報(bào)文后,該方法還包括輔助CPU記錄接收到的每一個(gè)轉(zhuǎn)發(fā)芯片返回的環(huán)回探測(cè)報(bào)文個(gè)數(shù);輔助CPU計(jì)算所述發(fā)送的環(huán)回探測(cè)報(bào)文個(gè)數(shù)與所述接收的環(huán)回探測(cè)報(bào)文個(gè)數(shù)的差值, 當(dāng)在設(shè)定時(shí)間內(nèi),計(jì)算出的所述差值小于一閾值時(shí),判斷為輔助CPU收到對(duì)應(yīng)轉(zhuǎn)發(fā)芯片返回的環(huán)回檢測(cè)報(bào)文;否則,判斷為未收到對(duì)應(yīng)轉(zhuǎn)發(fā)芯片返回的環(huán)回檢測(cè)報(bào)文。
5.根據(jù)權(quán)利要求I所述的方法,其特征在于,所述輔助CPU通過(guò)主控板LSW將環(huán)回探測(cè)報(bào)文發(fā)送給每一個(gè)接口板LSW包括主控板中的輔助CPU將環(huán)回探測(cè)報(bào)文發(fā)送給主控板LSW,由主控板LSW將環(huán)回探測(cè)報(bào)文發(fā)送給每一個(gè)接口板LSW;所述輔助CPU收到對(duì)應(yīng)接口板LSW返回的環(huán)回探測(cè)報(bào)文包括對(duì)應(yīng)接口板LSW將環(huán)回探測(cè)報(bào)文發(fā)送給主控板LSW,由主控板LSW將環(huán)回探測(cè)報(bào)文發(fā)送給輔助CPU。
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述輔助CPU周期性將環(huán)回探測(cè)報(bào)文發(fā)送給每一個(gè)接口板LSWH所述輔助CPU通過(guò)主控板LSW將環(huán)回探測(cè)報(bào)文發(fā)送給每一個(gè)接口板LSW后,該方法還包括輔助CPU記錄發(fā)送給每一個(gè)接口板LSW的環(huán)回探測(cè)報(bào)文個(gè)數(shù);所述輔助CPU收到對(duì)應(yīng)接口板LSW返回的環(huán)回探測(cè)報(bào)文后,該方法還包括輔助CPU記錄接收到的每一個(gè)接口板LSW返回的環(huán)回探測(cè)報(bào)文個(gè)數(shù);輔助CPU計(jì)算所述發(fā)送的環(huán)回探測(cè)報(bào)文個(gè)數(shù)與所述接收的環(huán)回探測(cè)報(bào)文個(gè)數(shù)的差值, 當(dāng)在設(shè)定時(shí)間內(nèi),計(jì)算出的所述差值小于一閾值時(shí),判斷為輔助CPU收到對(duì)應(yīng)接口板LSW返回的環(huán)回檢測(cè)報(bào)文;否則,判斷為未收到對(duì)應(yīng)接口板LSW返回的環(huán)回檢測(cè)報(bào)文。
7.根據(jù)權(quán)利要求I所述的方法,其特征在于,所述輔助CPU周期性地向主控板LSW發(fā)送環(huán)回探測(cè)報(bào)文,則,所述輔助CPU將環(huán)回探測(cè)報(bào)文發(fā)送給主控板LSW后,該方法還包括輔助CPU記錄發(fā)送給主控板LSW的環(huán)回探測(cè)報(bào)文個(gè)數(shù);所述輔助CPU收到主控板LSW返回的環(huán)回探測(cè)報(bào)文后,該方法還包括輔助CPU記錄接收到的主控板LSW返回的環(huán)回探測(cè)報(bào)文個(gè)數(shù);輔助CPU計(jì)算所述發(fā)送的環(huán)回探測(cè)報(bào)文個(gè)數(shù)與所述接收的環(huán)回探測(cè)報(bào)文個(gè)數(shù)的差值, 當(dāng)在設(shè)定時(shí)間內(nèi),計(jì)算出的所述差值小于一閾值時(shí),判斷為輔助CPU收到主控板LSW返回的環(huán)回檢測(cè)報(bào)文;否則,判斷為未收到主控板LSW返回的環(huán)回檢測(cè)報(bào)文。
8.根據(jù)權(quán)利要求4、6、7中任一項(xiàng)所述的方法,其特征在于,所述CPU發(fā)送環(huán)回探測(cè)報(bào)文是以CPU中斷為周期的。
9.根據(jù)權(quán)利要求1-7中任一項(xiàng)所述的方法,其特征在于,當(dāng)所述轉(zhuǎn)發(fā)芯片故障時(shí),該方法還包括輔助CPU將所述轉(zhuǎn)發(fā)芯片故障的消息通知給其他每一個(gè)CPU,以使得后續(xù)交互的報(bào)文通過(guò)正常的轉(zhuǎn)發(fā)芯片進(jìn)行發(fā)送;當(dāng)所述接口板LSW故障時(shí),該方法還包括輔助CPU將所述接口板LSW故障的消息通知給其他每一個(gè)CPU,以使得后續(xù)交互的報(bào)文通過(guò)正常的接口板LSW進(jìn)行發(fā)送。
10.根據(jù)權(quán)利要求1-7中任一項(xiàng)所述的方法,其特征在于,當(dāng)所述轉(zhuǎn)發(fā)芯片故障時(shí),該方法還包括輔助CPU將故障的轉(zhuǎn)發(fā)芯片復(fù)位使其恢復(fù)正常工作;當(dāng)所述接口板LSW故障時(shí),該方法還包括輔助CPU重新啟動(dòng)該故障接口板使該接口板 LSff恢復(fù)正常工作;當(dāng)所述主控板LSW故障時(shí),該方法還包括輔助CPU重新啟動(dòng)該故障主控板,并在所有接口板中重新選取主控板。
11.一種分布式設(shè)備中的故障檢測(cè)裝置,其特征在于,該故障檢測(cè)裝置包括第一發(fā)送單元、第二發(fā)送單元、第一判斷單元、第三發(fā)送單元、第二判斷單元和第三判斷單元,其中,所述第一發(fā)送單元,用于通過(guò)主控板以太網(wǎng)交換機(jī)LSW、接口板LSW將環(huán)回探測(cè)報(bào)文發(fā)送給每一個(gè)接口板中的每一個(gè)轉(zhuǎn)發(fā)芯片;第二發(fā)送單元,用于當(dāng)?shù)谝话l(fā)送單元發(fā)送環(huán)回探測(cè)報(bào)文后,在設(shè)定時(shí)間內(nèi)未收到對(duì)應(yīng)轉(zhuǎn)發(fā)芯片返回的環(huán)回探測(cè)報(bào)文時(shí),通過(guò)主控板LSW將環(huán)回探測(cè)報(bào)文發(fā)送給每一個(gè)接口板 LSff ;所述第一判斷單元,用于當(dāng)?shù)诙l(fā)送單元發(fā)送環(huán)回探測(cè)報(bào)文后,在設(shè)定時(shí)間內(nèi)收到對(duì)應(yīng)接口板LSW返回的環(huán)回探測(cè)報(bào)文時(shí),判斷為對(duì)應(yīng)的轉(zhuǎn)發(fā)芯片故障;所述第三發(fā)送單元,用于當(dāng)?shù)诙l(fā)送單元發(fā)送環(huán)回探測(cè)報(bào)文后,在設(shè)定時(shí)間內(nèi)未收到對(duì)應(yīng)接口板LSW返回的環(huán)回探測(cè)報(bào)文時(shí),向主控板LSW發(fā)送環(huán)回探測(cè)報(bào)文;所述第二判斷單元,用于當(dāng)?shù)谌l(fā)送單元發(fā)送環(huán)回探測(cè)報(bào)文后,在設(shè)定時(shí)間內(nèi)收到主控板LSW返回的環(huán)回探測(cè)報(bào)文時(shí),判斷為對(duì)應(yīng)的接口板LSW故障;所述第三判斷單元,用于當(dāng)?shù)谌l(fā)送單元發(fā)送環(huán)回探測(cè)報(bào)文后,在設(shè)定時(shí)間內(nèi)未收到主控板LSW返回的環(huán)回探測(cè)報(bào)文時(shí),判斷為主控板LSW故障。
12.根據(jù)權(quán)利要求11所述的裝置,其特征在于,該裝置還包括第四判斷單元,用于當(dāng)?shù)谝话l(fā)送單元發(fā)送環(huán)回探測(cè)報(bào)文后,在設(shè)定時(shí)間內(nèi)收到對(duì)應(yīng)轉(zhuǎn)發(fā)芯片返回的環(huán)回探測(cè)報(bào)文時(shí),判斷為對(duì)應(yīng)的轉(zhuǎn)發(fā)芯片、接口板LSW和主控板LSW都正常。
13.根據(jù)權(quán)利要求12所述的裝置,其特征在于,所述第一發(fā)送單元,用于將環(huán)回探測(cè)報(bào)文發(fā)送給主控板LSW,由主控板LSW將環(huán)回探測(cè)報(bào)文發(fā)送給每一個(gè)接口板LSW,再由接口板LSW將環(huán)回探測(cè)報(bào)文發(fā)送給該接口板中每一個(gè)轉(zhuǎn)發(fā)芯片。
14.根據(jù)權(quán)利要求13所述的裝置,其特征在于,所述第一發(fā)送單元周期性地將環(huán)回探測(cè)報(bào)文發(fā)送給每一個(gè)轉(zhuǎn)發(fā)芯片,則該裝置還包括第一記錄單元、第一計(jì)算單元和第五判斷單元,其中,所述第一記錄單元,用于當(dāng)?shù)谝话l(fā)送單元將環(huán)回探測(cè)報(bào)文發(fā)送給該接口板中每一個(gè)轉(zhuǎn)發(fā)芯片后,記錄發(fā)送給每一個(gè)轉(zhuǎn)發(fā)芯片的環(huán)回探測(cè)報(bào)文個(gè)數(shù),并記錄接收到的每一個(gè)轉(zhuǎn)發(fā)芯片返回的環(huán)回探測(cè)報(bào)文個(gè)數(shù);所述第一計(jì)算單元,用于計(jì)算第一記錄單元中記錄的發(fā)送的環(huán)回探測(cè)報(bào)文個(gè)數(shù)與所述接收的環(huán)回探測(cè)報(bào)文個(gè)數(shù)的差值;所述第五判斷單元,用于在設(shè)定時(shí)間內(nèi),當(dāng)?shù)谝挥?jì)算單元計(jì)算出的所述差值小于一閾值時(shí),判斷為收到對(duì)應(yīng)轉(zhuǎn)發(fā)芯片返回的環(huán)回檢測(cè)報(bào)文;否則,判斷為未收到對(duì)應(yīng)轉(zhuǎn)發(fā)芯片返回的環(huán)回檢測(cè)報(bào)文。
15.根據(jù)權(quán)利要求11所述的裝置,其特征在于,所述第二發(fā)送單元,用于將環(huán)回探測(cè)報(bào)文發(fā)送給主控板LSW,由主控板LSW將環(huán)回探測(cè)報(bào)文發(fā)送給每一個(gè)接口板LSW。
16.根據(jù)權(quán)利要求15所述的裝置,其特征在于,所述第二發(fā)送單元周期性將環(huán)回探測(cè)報(bào)文發(fā)送給每一個(gè)接口板LSW,則該裝置還包括第二記錄單元、第二計(jì)算單元和第六判斷單元,其中,所述第二記錄單元,用于當(dāng)?shù)诙l(fā)送單元發(fā)送環(huán)回探測(cè)報(bào)文后,記錄發(fā)送給每一個(gè)接口板LSW的環(huán)回探測(cè)報(bào)文個(gè)數(shù),并記錄接收到的每一個(gè)接口板LSW返回的環(huán)回探測(cè)報(bào)文個(gè)數(shù);所述第二計(jì)算單元,用于計(jì)算第二記錄單元中記錄的發(fā)送的環(huán)回探測(cè)報(bào)文個(gè)數(shù)與所述接收的環(huán)回探測(cè)報(bào)文個(gè)數(shù)的差值;所述第六判斷單元,用于在設(shè)定時(shí)間內(nèi),當(dāng)?shù)诙?jì)算單元計(jì)算出的所述差值小于一閾值時(shí),判斷為收到對(duì)應(yīng)接口板LSW返回的環(huán)回檢測(cè)報(bào)文;否則,判斷為未收到對(duì)應(yīng)接口板 LSW返回的環(huán)回檢測(cè)報(bào)文。
17.根據(jù)權(quán)利要求11所述的裝置,其特征在于,所述第三發(fā)送單元周期性將環(huán)回探測(cè)報(bào)文發(fā)送給主控板LSW,則該裝置還包括第三記錄單元、第三計(jì)算單元和第七判斷單元,其中,所述第三記錄單元,用于當(dāng)?shù)谌l(fā)送單元發(fā)送環(huán)回探測(cè)報(bào)文后,記錄發(fā)送給主控板LSW 的環(huán)回探測(cè)報(bào)文個(gè)數(shù),并記錄接收到的主控板LSW返回的環(huán)回探測(cè)報(bào)文個(gè)數(shù);所述第三計(jì)算單元,用于計(jì)算第三記錄單元中記錄的發(fā)送的環(huán)回探測(cè)報(bào)文個(gè)數(shù)與所述接收的環(huán)回探測(cè)報(bào)文個(gè)數(shù)的差值;所述第七判斷單元,用于在設(shè)定時(shí)間內(nèi),當(dāng)?shù)谌?jì)算單元計(jì)算出的所述差值小于一閾值時(shí),判斷為收到主控板LSW返回的環(huán)回檢測(cè)報(bào)文;否則,判斷為未收到主控板LSW返回的環(huán)回檢測(cè)報(bào)文。
18.根據(jù)權(quán)利要求11-17中任一項(xiàng)所述的裝置,其特征在于,該裝置還包括故障通知單元,用于當(dāng)?shù)谝慌袛鄦卧袛酁檗D(zhuǎn)發(fā)芯片故障時(shí),將所述轉(zhuǎn)發(fā)芯片故障的消息通知給其他每一個(gè)中央處理單元CPU,以使得后續(xù)交互的報(bào)文通過(guò)正常的轉(zhuǎn)發(fā)芯片進(jìn)行發(fā)送;或,當(dāng)?shù)诙袛鄦卧袛酁榻涌诎錖SW故障時(shí),將所述接口板LSW故障的消息通知給其他每一個(gè) CPU,以使得后續(xù)交互的報(bào)文通過(guò)正常的接口板LSW進(jìn)行發(fā)送。
19.根據(jù)權(quán)利要求11-17中任一項(xiàng)所述的裝置,其特征在于,該裝置還包括故障恢復(fù)單元,用于當(dāng)當(dāng)?shù)谝慌袛鄦卧袛酁檗D(zhuǎn)發(fā)芯片故障時(shí),將故障的轉(zhuǎn)發(fā)芯片復(fù)位使其恢復(fù)正常工作;或,當(dāng)?shù)诙袛鄦卧袛酁榻涌诎錖SW故障時(shí),重新啟動(dòng)該故障接口板使該接口板 LSW恢復(fù)正常工作;或,當(dāng)?shù)谌袛鄦卧袛酁橹骺匕錖SW故障時(shí),重新啟動(dòng)該故障主控板, 并在所有接口板中重新選取主控板。
全文摘要
本發(fā)明提供了一種分布式設(shè)備的故障檢測(cè)方法和裝置主控板中的輔助CPU將環(huán)回探測(cè)報(bào)文發(fā)送給每一個(gè)轉(zhuǎn)發(fā)芯片;當(dāng)在設(shè)定時(shí)間內(nèi)輔助CPU未收到對(duì)應(yīng)轉(zhuǎn)發(fā)芯片返回的環(huán)回探測(cè)報(bào)文時(shí),再將環(huán)回探測(cè)報(bào)文發(fā)送給每一個(gè)接口板LSW;當(dāng)在設(shè)定時(shí)間內(nèi)輔助CPU收到對(duì)應(yīng)接口板LSW返回的環(huán)回探測(cè)報(bào)文時(shí),判斷為對(duì)應(yīng)的轉(zhuǎn)發(fā)芯片故障;當(dāng)在設(shè)定時(shí)間內(nèi)輔助CPU未收到對(duì)應(yīng)接口板LSW返回的環(huán)回探測(cè)報(bào)文時(shí),再向主控板LSW發(fā)送環(huán)回探測(cè)報(bào)文,當(dāng)在設(shè)定時(shí)間內(nèi)輔助CPU收到主控板LSW返回的環(huán)回探測(cè)報(bào)文時(shí),判斷為對(duì)應(yīng)的接口板LSW故障,否則,判斷為主控板LSW故障。應(yīng)用本發(fā)明所述方法和裝置,能夠快速準(zhǔn)確地檢測(cè)出分布式設(shè)備內(nèi)的故障裝置,以減少故障裝置對(duì)分布式設(shè)備的整體業(yè)務(wù)的影響。
文檔編號(hào)H04L12/26GK102694692SQ20121020436
公開日2012年9月26日 申請(qǐng)日期2012年6月18日 優(yōu)先權(quán)日2012年6月18日
發(fā)明者宋益波, 王 鋒 申請(qǐng)人:杭州華三通信技術(shù)有限公司
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
德格县| 天津市| 得荣县| 吐鲁番市| 南雄市| 梅州市| 格尔木市| 密云县| 尼勒克县| 荣昌县| 勃利县| 米脂县| 五指山市| 静安区| 贵港市| 湄潭县| 昌宁县| 岑溪市| 邵阳市| 涿州市| 黄浦区| 蒙自县| 鹿邑县| 万安县| 峨边| 滕州市| 买车| 绍兴县| 小金县| 潼关县| 青海省| 麻江县| 荔浦县| 辽阳县| 大姚县| 固镇县| 马山县| 噶尔县| 东乡| 浦江县| 芮城县|