專利名稱:數(shù)據(jù)中心網(wǎng)絡(luò)中的選路方法和通信設(shè)備的制作方法
技術(shù)領(lǐng)域:
本發(fā)明實(shí)施例涉及數(shù)據(jù)通信領(lǐng)域,并且更具體地,涉及一種數(shù)據(jù)中心網(wǎng)絡(luò)中的選路方法和通信設(shè)備。
背景技術(shù):
胖樹(shù)架構(gòu)是數(shù)據(jù)中心(Data Center, DC)網(wǎng)絡(luò)的一種重要部署方案,其特點(diǎn)是每個(gè)接入層的交換機(jī)和每個(gè)匯聚層(或作為核心層)的交換機(jī)之間都是相互連接的。因此任意兩個(gè)服務(wù)器(Server)之間要進(jìn)行通信,可以有多條等價(jià)路徑(Equal Cost Multi Path, ECMP)以供選擇。目前,對(duì)于等價(jià)路徑的選路,一般是通過(guò)固定的報(bào)文特征區(qū)域的取值進(jìn)行哈希 (Hash)操作,如按字節(jié)求和、按位與等。再根據(jù)哈希結(jié)果(1字節(jié))選擇相應(yīng)路徑,例如將哈希結(jié)果除以等價(jià)路徑的數(shù)量,取余數(shù)作為選中的路徑。上述報(bào)文特征區(qū)域的例子包括源MAC (Media Access Control,媒體訪問(wèn)控制)地址、目的MAC地址、源IP (Internet Protocol,互聯(lián)網(wǎng)協(xié)議)地址、目的IP地址等。以報(bào)文的源MAC地址字段加目的MAC地址字段進(jìn)行哈希操作為例。報(bào)文的源MAC 地址表示發(fā)出該報(bào)文的服務(wù)器的網(wǎng)卡的MAC地址,報(bào)文的目的MAC地址表示接收該報(bào)文的服務(wù)器的網(wǎng)卡的MAC地址。因?yàn)榉?wù)器的MAC地址基本上都是固定的,所以對(duì)源MAC字段加目的MAC字段進(jìn)行哈希操作的結(jié)果也是固定的。換句話說(shuō),哈希選路的結(jié)果,實(shí)際上都選到了同一條路徑。這樣,由于哈希選路的不均勻性,導(dǎo)致其他等價(jià)路徑的帶寬被浪費(fèi)了。
發(fā)明內(nèi)容
本發(fā)明實(shí)施例提供一種數(shù)據(jù)中心網(wǎng)絡(luò)中的選路方法和通信設(shè)備,能夠解決由于哈希選路的不均勻性引起的路徑帶寬浪費(fèi)問(wèn)題。本發(fā)明實(shí)施例一方面,提供了一種數(shù)據(jù)中心網(wǎng)絡(luò)中的選路方法,包括接收轉(zhuǎn)發(fā)路徑上的下游設(shè)備發(fā)送的流控信號(hào),該流控信號(hào)是由該下游設(shè)備在檢測(cè)到該轉(zhuǎn)發(fā)路徑發(fā)生擁塞后生成的,該流控信號(hào)用于向上游設(shè)備通知該擁塞;根據(jù)該流控信號(hào),在選路時(shí)暫停選擇該轉(zhuǎn)發(fā)路徑。本發(fā)明實(shí)施例第二方面,提供了一種數(shù)據(jù)中心網(wǎng)絡(luò)中的選路方法,包括在檢測(cè)到與上游設(shè)備之間的轉(zhuǎn)發(fā)路徑擁塞時(shí),生成流控信號(hào),該流控信號(hào)用于向上游設(shè)備通知該擁塞;向該上游設(shè)備發(fā)送該流控信號(hào),以使該上游設(shè)備根據(jù)該流控信號(hào),在選路時(shí)暫停選擇該轉(zhuǎn)發(fā)路徑。本發(fā)明實(shí)施例第三方面,提供了一種數(shù)據(jù)中心網(wǎng)絡(luò)中的通信設(shè)備,包括流控模塊,用于接收轉(zhuǎn)發(fā)路徑上的下游設(shè)備發(fā)送的流控信號(hào),該流控信號(hào)是由該下游設(shè)備在檢測(cè)到該轉(zhuǎn)發(fā)路徑發(fā)生擁塞后生成的,該流控信號(hào)用于向上游設(shè)備通知該擁塞;選路模塊,用于根據(jù)該流控模塊接收的流控信號(hào),在選路時(shí)暫停選擇該轉(zhuǎn)發(fā)路徑。本發(fā)明實(shí)施例第四方面,提供了一種數(shù)據(jù)中心網(wǎng)絡(luò)中的通信設(shè)備,包括生成模塊,用于在檢測(cè)到與上游設(shè)備之間的轉(zhuǎn)發(fā)路徑擁塞時(shí),生成流控信號(hào),該流控信號(hào)用于向上游設(shè)備通知該擁塞;發(fā)送模塊,用于向該上游設(shè)備發(fā)送該生成模塊生成的流控信號(hào),以使該上游設(shè)備根據(jù)該流控信號(hào),在選路時(shí)暫停選擇該轉(zhuǎn)發(fā)路徑。本發(fā)明實(shí)施例基于下游設(shè)備返回的流控信號(hào),暫停選擇擁塞的轉(zhuǎn)發(fā)路徑,從而能夠選擇其他等價(jià)路徑,避免浪費(fèi)這些等價(jià)路徑上的帶寬資源。
為了更清楚地說(shuō)明本發(fā)明實(shí)施例的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見(jiàn)地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖。圖1是可應(yīng)用本發(fā)明實(shí)施例的數(shù)據(jù)中心網(wǎng)絡(luò)的架構(gòu)示意圖。圖2是本發(fā)明一個(gè)實(shí)施例的數(shù)據(jù)中心網(wǎng)絡(luò)中的選路方法的流程圖。圖3是本發(fā)明另一實(shí)施例的數(shù)據(jù)中心網(wǎng)絡(luò)中的選路方法的流程圖。圖4是本發(fā)明一個(gè)實(shí)施例的應(yīng)用場(chǎng)景的示意圖。圖5是圖4的示例場(chǎng)景中的選路過(guò)程的示意流程圖。圖6是本發(fā)明一個(gè)實(shí)施例的通信設(shè)備的框圖。圖7是本發(fā)明另一實(shí)施例的通信設(shè)備的框圖。
具體實(shí)施例方式下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒(méi)有作出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。圖1是可應(yīng)用本發(fā)明實(shí)施例的數(shù)據(jù)中心網(wǎng)絡(luò)的架構(gòu)示意圖。圖1的數(shù)據(jù)中心網(wǎng)絡(luò)采用胖樹(shù)架構(gòu),但本發(fā)明實(shí)施例不限于此,也可以應(yīng)用于其他需要進(jìn)行選路的數(shù)據(jù)中心網(wǎng)胖樹(shù)架構(gòu)是DC網(wǎng)絡(luò)的一種重要部署方案,其典型的網(wǎng)絡(luò)拓?fù)淙缦聢D1所示。如圖 1所示,Svri(i = 1,2,...)是服務(wù)器(Server),Six(X = 1,2,...)是接入層的交換機(jī)或路由器(可分別簡(jiǎn)稱為接入交換機(jī)或接入路由器),S2y(y = 1,2,...)是匯聚層的交換機(jī)或路由器(可分別簡(jiǎn)稱為匯聚交換機(jī)或匯聚路由器),或者是核心層的交換機(jī)或路由器(可分別簡(jiǎn)稱為核心交換機(jī)或核心路由器)。圖1中為了簡(jiǎn)潔起見(jiàn),只顯示了三層結(jié)構(gòu);但是本發(fā)明實(shí)施例可應(yīng)用的DC網(wǎng)絡(luò)不限于該具體形式的例子,而是可以具有更多層,每一層可以具有比圖示更多或更少的節(jié)點(diǎn)。從圖1中可以看到,每個(gè)接入層的交換機(jī)Slx和每個(gè)匯聚層(或作為核心層)的交換機(jī)S2y都是相互連接的,任意兩個(gè)服務(wù)器之間要進(jìn)行通信,均有多條等價(jià)路徑可以選擇。 例如,對(duì)于從服務(wù)器Svrl到服務(wù)器Svr4的流量,在交換機(jī)Sll上會(huì)有4條等價(jià)路徑,對(duì)應(yīng)分別選擇上級(jí)的交換機(jī)S21、S22、S23、S24。如何進(jìn)行選路,是胖樹(shù)架構(gòu)的一個(gè)關(guān)鍵問(wèn)題。首先基于圖1的例子,簡(jiǎn)單描述現(xiàn)有哈希選路方法中存在的問(wèn)題。假設(shè)流量還是圖1中所示,服務(wù)器Svrl流向服務(wù)器Svr4,那么在Sll交換機(jī)進(jìn)行上述哈希選路的時(shí)候, 報(bào)文的源MAC為服務(wù)器Svrl網(wǎng)卡的MAC,報(bào)文的目的MAC為服務(wù)器Svr4網(wǎng)卡的MAC地址。 因?yàn)榉?wù)器的MAC地址基本上都是固定的,所以哈希結(jié)果也是固定的。換句話說(shuō),Sll哈希選路的結(jié)果,實(shí)際上都選到了 4條鏈路中的同一條,其它鏈路的帶寬被浪費(fèi)了。圖2是本發(fā)明一個(gè)實(shí)施例的數(shù)據(jù)中心網(wǎng)絡(luò)中的選路方法的流程圖。圖2的方法可以由DC網(wǎng)絡(luò)中的上游設(shè)備執(zhí)行。這里的上游設(shè)備可以是位于接入層、匯聚層或核心層的需要進(jìn)行轉(zhuǎn)發(fā)路徑選擇的交換機(jī)或路由器。201,接收轉(zhuǎn)發(fā)路徑上的下游設(shè)備發(fā)送的流控信號(hào)。該流控信號(hào)是由該下游設(shè)備在檢測(cè)到該轉(zhuǎn)發(fā)路徑發(fā)生擁塞后生成的,該流控信號(hào)用于向上游設(shè)備通知該擁塞。這里的下游設(shè)備可以位于接入層、匯聚層或核心層,只需位于上述上游設(shè)備的下游即可。由于哈希選路的不均勻性,可能導(dǎo)致轉(zhuǎn)發(fā)路徑發(fā)生擁塞。本發(fā)明實(shí)施例中的“擁塞”不僅包括轉(zhuǎn)發(fā)路徑在該下游設(shè)備處的報(bào)文隊(duì)列(或緩沖器)已滿的情況,也包括報(bào)文隊(duì)列(或緩沖器)即將滿的情況,例如隊(duì)列或緩沖器僅剩下低于某一閾值的空間。上述閾值可以是報(bào)文數(shù)(如2個(gè)),也可以是特定百分比(如10%)。本發(fā)明實(shí)施例對(duì)此不做限制。本發(fā)明實(shí)施例對(duì)流控信號(hào)的粒度不作限制。例如,流控信號(hào)可基于整個(gè)端口、基于報(bào)文的優(yōu)先級(jí)或者基于其他更細(xì)或更粗的粒度(如基于報(bào)文/隊(duì)列的其他特征)。202,根據(jù)該流控信號(hào),在選路時(shí)暫停選擇上述轉(zhuǎn)發(fā)路徑。例如,上游設(shè)備在選路時(shí),可剔除上述轉(zhuǎn)發(fā)路徑,即只在上述轉(zhuǎn)發(fā)路徑的等價(jià)路徑中進(jìn)行選擇。本發(fā)明實(shí)施例基于下游設(shè)備返回的流控信號(hào),暫停選擇擁塞的轉(zhuǎn)發(fā)路徑,從而能夠選擇其他等價(jià)路徑,避免浪費(fèi)這些等價(jià)路徑上的帶寬資源。圖3是本發(fā)明另一實(shí)施例的數(shù)據(jù)中心網(wǎng)絡(luò)中的選路方法的流程圖。圖3的方法可以由DC網(wǎng)絡(luò)中的下游設(shè)備(如交換機(jī)或路由器)執(zhí)行,并且與圖2的方法相對(duì)應(yīng)。301,在檢測(cè)到與上游設(shè)備之間的轉(zhuǎn)發(fā)路徑擁塞時(shí),生成流控信號(hào),該流控信號(hào)用于向上游設(shè)備通知該擁塞。由于哈希選路的不均勻性,可能導(dǎo)致轉(zhuǎn)發(fā)路徑發(fā)生擁塞。本發(fā)明實(shí)施例中的“擁塞”不僅包括報(bào)文隊(duì)列(或緩沖器)已滿的情況,也包括報(bào)文隊(duì)列(或緩沖器)即將滿的情況,例如隊(duì)列或緩沖器僅剩下低于某一閾值的空間。上述閾值可以是報(bào)文數(shù)(如2個(gè)),也可以是特定百分比(如10% )。本發(fā)明實(shí)施例對(duì)此不做限制。本發(fā)明實(shí)施例對(duì)流控信號(hào)的粒度不作限制。例如,流控信號(hào)可基于整個(gè)端口、基于報(bào)文的優(yōu)先級(jí)或者基于其他更細(xì)或更粗的粒度(如基于報(bào)文/隊(duì)列的其他特征)。302,向上游設(shè)備發(fā)送流控信號(hào),以使上游設(shè)備根據(jù)流控信號(hào),在選路時(shí)暫停選擇上述轉(zhuǎn)發(fā)路徑。例如,上游設(shè)備在選路時(shí),可剔除上述轉(zhuǎn)發(fā)路徑,即只在上述路徑的等價(jià)路徑中進(jìn)行選擇。本發(fā)明實(shí)施例基于下游設(shè)備返回的流控信號(hào),暫停選擇擁塞的轉(zhuǎn)發(fā)路徑,從而能夠選擇其他等價(jià)路徑,避免浪費(fèi)這些等價(jià)路徑上的帶寬資源。下面結(jié)合圖4和圖5的具體例子,更加詳細(xì)地描述本發(fā)明圖2和圖3所述實(shí)施例。應(yīng)注意,這些例子僅僅是為了幫助本領(lǐng)域技術(shù)人員更好地理解本發(fā)明,而非要限制本發(fā)明的范圍。圖4是本發(fā)明一個(gè)實(shí)施例的應(yīng)用場(chǎng)景的示意圖。圖5是圖4的示例場(chǎng)景中的選路過(guò)程的示意流程圖。如圖4所示,假設(shè)從源服務(wù)器Svl向目的服務(wù)器Sv2發(fā)送數(shù)據(jù),交換機(jī)&是轉(zhuǎn)發(fā)路徑中的上游設(shè)備。有N條等價(jià)路徑(路徑1、路徑2、...路徑N)經(jīng)過(guò)交換機(jī)&,每條等價(jià)路徑的下游交換機(jī)分別為Si、S2、. . .、,N為正整數(shù)。應(yīng)注意,圖4中的連接方式只是示意性的,交換機(jī)&和源服務(wù)器Svl之間不必直接相連,也可以通過(guò)一層或多層交換機(jī)間接相連。 另外,交換機(jī)Sp &、. . . Sn和目的服務(wù)器Sv2之間不必直接相連,也可以通過(guò)一層或多層交換機(jī)間接相連。圖5中以S1發(fā)生擁塞(隊(duì)列已滿或即將滿)為例進(jìn)行描述,本發(fā)明實(shí)施例同樣可應(yīng)用于其他上下游設(shè)備之間的路徑選擇。501,上游設(shè)備&通過(guò)哈希選路,選中路徑1,即選擇下游設(shè)備S1轉(zhuǎn)發(fā)報(bào)文。由于哈希選路不均,導(dǎo)致下游設(shè)備S1發(fā)生擁塞。502,下游設(shè)備S1檢測(cè)到路徑1發(fā)生擁塞后,發(fā)送流控信號(hào)給上游設(shè)備&??蛇x地,作為一個(gè)實(shí)施例,流控信號(hào)可基于報(bào)文的優(yōu)先級(jí)?;趦?yōu)先級(jí)的流控 (PFC, Priority-based Flow Control)標(biāo)準(zhǔn)為 802. lQbb,也稱為基于優(yōu)先級(jí)的暫停(Per Priority Pause)或基于類的流控(CBFC,Class Based Flow Control),是一種基于優(yōu)先級(jí)的流控機(jī)制。當(dāng)下游設(shè)備端口上某個(gè)優(yōu)先級(jí)隊(duì)列即將產(chǎn)生擁塞時(shí),發(fā)送一個(gè)PFC “反壓”信號(hào)到上游設(shè)備,上游設(shè)備停止發(fā)送該優(yōu)先級(jí)隊(duì)列的報(bào)文,該機(jī)制逐級(jí)傳遞,直到源設(shè)備。該反壓只針對(duì)某一個(gè)或幾個(gè)優(yōu)先級(jí),不針對(duì)整個(gè)端口反壓。這里不妨假設(shè)擁塞的隊(duì)列中報(bào)文的優(yōu)先級(jí)為X。在此情況下,只針對(duì)某一個(gè)或幾個(gè)優(yōu)先級(jí)發(fā)送反壓信號(hào),而不針對(duì)整個(gè)端口反壓,可以提高選路控制的靈活性。503,上游設(shè)備&檢測(cè)到流控信號(hào)后,暫停具有優(yōu)先級(jí)X的報(bào)文的發(fā)送。同時(shí),上游設(shè)備&可記錄該流控信號(hào),即生成相應(yīng)的流控記錄。具體地,上游設(shè)備&可暫停相應(yīng)隊(duì)列(該隊(duì)列中報(bào)文的優(yōu)先級(jí)為X)的報(bào)文的發(fā)送。504,后續(xù)為優(yōu)先級(jí)為X的報(bào)文進(jìn)行選路時(shí),上游設(shè)備&將具有流控記錄的路徑 (如圖4中的路徑1)剔除,即選路只在無(wú)流控記錄的等價(jià)路徑(如圖4中的路徑2至路徑 N)中進(jìn)行選擇。不妨假設(shè)選擇路徑2,即選擇下游設(shè)備&轉(zhuǎn)發(fā)報(bào)文。505,上游設(shè)備&在針對(duì)路徑1的流控信號(hào)失效后,在選路時(shí)將仍允許選擇路徑1。 例如上游設(shè)備&可刪除相應(yīng)的流控記錄,恢復(fù)路徑1被選擇的能力。例如,下游設(shè)備S1可以在路徑1不再擁塞時(shí),向上游設(shè)備&通知針對(duì)路徑1的流控信號(hào)失效。或者,上游設(shè)備&可按照其他機(jī)制,自己確定針對(duì)路徑1的流控信號(hào)是否失效。例如,上游設(shè)備&可在接收到或記錄針對(duì)路徑1的流控信息之后設(shè)置定時(shí)器,當(dāng)定時(shí)器期滿時(shí),認(rèn)為針對(duì)路徑1的流控信息失效。上述定時(shí)器的期滿時(shí)間可以由下游設(shè)備S1在流控信號(hào)中通知給上游設(shè)備&。本發(fā)明實(shí)施例對(duì)流控信號(hào)失效的發(fā)現(xiàn)機(jī)制不做限制,只需要上游設(shè)備&在針對(duì)路徑1的流控信號(hào)失效的情況下允許再次選擇路徑1即可。
根據(jù)本發(fā)明實(shí)施例,可以根據(jù)下游設(shè)備的PFC信息進(jìn)行路徑的動(dòng)態(tài)調(diào)整,從而解決胖樹(shù)架構(gòu)下,一部分等價(jià)路徑擁塞,另一部分等價(jià)路徑卻空閑的問(wèn)題。只要有路徑不擁塞,則流量就會(huì)優(yōu)先從不擁塞的路徑上轉(zhuǎn)發(fā),有效提高網(wǎng)絡(luò)帶寬的利用率,避免帶寬浪費(fèi)。因此,如果在網(wǎng)絡(luò)中的接入交換機(jī)(或路由器)、匯聚交換機(jī)(路由器)、核心交換機(jī)(或路由器)上部署上述的選路方案,則能有效提高網(wǎng)絡(luò)的負(fù)載能力。圖6是本發(fā)明一個(gè)實(shí)施例的通信設(shè)備的框圖。圖6的通信設(shè)備60的一個(gè)例子是上述上游設(shè)備(交換機(jī)或路由器),包括流控模塊61和選路模塊62。流控模塊61接收轉(zhuǎn)發(fā)路徑上的下游設(shè)備發(fā)送的流控信號(hào)。該流控信號(hào)是由該下游設(shè)備在檢測(cè)到該轉(zhuǎn)發(fā)路徑發(fā)生擁塞后生成的,該流控信號(hào)用于向上游設(shè)備通知該擁塞。 選路模塊62根據(jù)流控模塊61接收的流控信號(hào),在選路時(shí)暫停選擇上述轉(zhuǎn)發(fā)路徑。本發(fā)明實(shí)施例基于下游設(shè)備返回的流控信號(hào),暫停選擇擁塞的轉(zhuǎn)發(fā)路徑,從而能夠選擇其他等價(jià)路徑,避免浪費(fèi)這些等價(jià)路徑上的帶寬資源。通信設(shè)備60可執(zhí)行上述圖2至圖4的方法中涉及上游設(shè)備的各個(gè)過(guò)程,為避免重復(fù)不再詳細(xì)描述??蛇x地,作為一個(gè)實(shí)施例,流控模塊61接收的流控信號(hào)可基于報(bào)文的優(yōu)先級(jí)(例如,圖5的實(shí)施例中的一個(gè)或多個(gè)優(yōu)先級(jí)X),例如該流控信號(hào)可以是PFC反壓信號(hào)。此時(shí), 選路模塊62可在為具有該優(yōu)先級(jí)(如上述優(yōu)先級(jí)X)的報(bào)文進(jìn)行選路時(shí),暫停選擇上述轉(zhuǎn)發(fā)路徑。在此情況下,只針對(duì)某一個(gè)或幾個(gè)優(yōu)先級(jí)發(fā)送反壓信號(hào),而不針對(duì)整個(gè)端口反壓, 可以提高選路控制的靈活性??蛇x地,作為另一實(shí)施例,流控模塊61還可以在選路之前,根據(jù)流控信號(hào),暫停具有上述優(yōu)先級(jí)(如上述優(yōu)先級(jí)X)的報(bào)文的發(fā)送。同時(shí),流控模塊61可將該流控信息通知給選路模塊62。選路模塊62記錄該流控信息,即生成相應(yīng)的流控記錄。在后續(xù)進(jìn)行選路時(shí),選路模塊62將具有流控記錄的路徑(如圖4中的路徑1)剔除,即選路只在無(wú)流控記錄的等價(jià)路徑(如圖4中的路徑2至路徑N)中進(jìn)行選擇。可選地,作為另一實(shí)施例,選路模塊62還可以在流控信號(hào)失效后,在選路時(shí)允許選擇上述轉(zhuǎn)發(fā)路徑。例如選路模塊62可刪除相應(yīng)的流控記錄,恢復(fù)上述轉(zhuǎn)發(fā)路徑被選擇的能力??蛇x地,作為另一實(shí)施例,通信設(shè)備60可以是接入交換機(jī)、接入路由器、匯聚交換機(jī)、匯聚路由器、核心交換機(jī)、核心路由器中的至少一種。圖7是本發(fā)明另一實(shí)施例的通信設(shè)備的框圖。圖7的通信設(shè)備70的一個(gè)例子是上述下游設(shè)備(交換機(jī)或路由器),包括生成模塊71和發(fā)送模塊72。生成模塊71在檢測(cè)到與上游設(shè)備之間的轉(zhuǎn)發(fā)路徑擁塞時(shí),生成流控信號(hào),該流控信號(hào)將發(fā)生擁塞的轉(zhuǎn)發(fā)路徑通知上游設(shè)備。發(fā)送模塊72向上游設(shè)備發(fā)送生成模塊71生成的流控信號(hào),以使上游設(shè)備根據(jù)流控信號(hào),在選路時(shí)暫停選擇上述轉(zhuǎn)發(fā)路徑。本發(fā)明實(shí)施例基于下游設(shè)備返回的流控信號(hào),暫停選擇擁塞的轉(zhuǎn)發(fā)路徑,從而能夠選擇其他等價(jià)路徑,避免浪費(fèi)這些等價(jià)路徑上的帶寬資源。通信設(shè)備70可執(zhí)行上述圖2至圖4的方法中涉及下游設(shè)備的各個(gè)過(guò)程,為避免重復(fù)不再詳細(xì)描述。可選地,作為一個(gè)實(shí)施例,生成模塊71可生成基于報(bào)文的優(yōu)先級(jí)的流控信號(hào)(例如上述PFC反壓信號(hào)),以使上游設(shè)備在為具有該優(yōu)先級(jí)的報(bào)文進(jìn)行選路時(shí),暫停選擇上述轉(zhuǎn)發(fā)路徑。在此情況下,只針對(duì)某一個(gè)或幾個(gè)優(yōu)先級(jí)發(fā)送反壓信號(hào),而不針對(duì)整個(gè)端口反壓,可以提高選路控制的靈活性。可選地,作為另一實(shí)施例,發(fā)送模塊72還可以在上述路徑不再擁塞時(shí),向上游設(shè)備通知該流控信號(hào)失效,以使上游設(shè)備在選路時(shí)能夠選擇上述路徑??蛇x地,作為另一實(shí)施例,通信設(shè)備70可以是接入交換機(jī)、接入路由器、匯聚交換機(jī)、匯聚路由器、核心交換機(jī)、核心路由器中的至少一種。根據(jù)本發(fā)明實(shí)施例的通信網(wǎng)絡(luò)可包括上述通信設(shè)備60或70。本領(lǐng)域普通技術(shù)人員可以意識(shí)到,結(jié)合本文中所公開(kāi)的實(shí)施例描述的各示例的單元及算法步驟,能夠以電子硬件、或者計(jì)算機(jī)軟件和電子硬件的結(jié)合來(lái)實(shí)現(xiàn)。這些功能究竟以硬件還是軟件方式來(lái)執(zhí)行,取決于技術(shù)方案的特定應(yīng)用和設(shè)計(jì)約束條件。專業(yè)技術(shù)人員可以對(duì)每個(gè)特定的應(yīng)用來(lái)使用不同方法來(lái)實(shí)現(xiàn)所描述的功能,但是這種實(shí)現(xiàn)不應(yīng)認(rèn)為超出本發(fā)明的范圍。所屬領(lǐng)域的技術(shù)人員可以清楚地了解到,為描述的方便和簡(jiǎn)潔,上述描述的系統(tǒng)、 裝置和單元的具體工作過(guò)程,可以參考前述方法實(shí)施例中的對(duì)應(yīng)過(guò)程,在此不再贅述。在本申請(qǐng)所提供的幾個(gè)實(shí)施例中,應(yīng)該理解到,所揭露的系統(tǒng)、裝置和方法,可以通過(guò)其它的方式實(shí)現(xiàn)。例如,以上所描述的裝置實(shí)施例僅僅是示意性的,例如,所述單元的劃分,僅僅為一種邏輯功能劃分,實(shí)際實(shí)現(xiàn)時(shí)可以有另外的劃分方式,例如多個(gè)單元或組件可以結(jié)合或者可以集成到另一個(gè)系統(tǒng),或一些特征可以忽略,或不執(zhí)行。另一點(diǎn),所顯示或討論的相互之間的耦合或直接耦合或通信連接可以是通過(guò)一些接口,裝置或單元的間接耦合或通信連接,可以是電性,機(jī)械或其它的形式。所述作為分離部件說(shuō)明的單元可以是或者也可以不是物理上分開(kāi)的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個(gè)地方,或者也可以分布到多個(gè)網(wǎng)絡(luò)單元上??梢愿鶕?jù)實(shí)際的需要選擇其中的部分或者全部單元來(lái)實(shí)現(xiàn)本實(shí)施例方案的目的。另外,在本發(fā)明各個(gè)實(shí)施例中的各功能單元可以集成在一個(gè)處理單元中,也可以是各個(gè)單元單獨(dú)物理存在,也可以兩個(gè)或兩個(gè)以上單元集成在一個(gè)單元中。所述功能如果以軟件功能單元的形式實(shí)現(xiàn)并作為獨(dú)立的產(chǎn)品銷售或使用時(shí),可以存儲(chǔ)在一個(gè)計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中?;谶@樣的理解,本發(fā)明的技術(shù)方案本質(zhì)上或者說(shuō)對(duì)現(xiàn)有技術(shù)做出貢獻(xiàn)的部分或者該技術(shù)方案的部分可以以軟件產(chǎn)品的形式體現(xiàn)出來(lái),該計(jì)算機(jī)軟件產(chǎn)品存儲(chǔ)在一個(gè)存儲(chǔ)介質(zhì)中,包括若干指令用以使得一臺(tái)計(jì)算機(jī)設(shè)備(可以是個(gè)人計(jì)算機(jī),服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個(gè)實(shí)施例所述方法的全部或部分步驟。 而前述的存儲(chǔ)介質(zhì)包括U盤(pán)、移動(dòng)硬盤(pán)、只讀存儲(chǔ)器(ROM,Read-Only Memory)、隨機(jī)存取存儲(chǔ)器(RAM,Random Access Memory)、磁碟或者光盤(pán)等各種可以存儲(chǔ)程序代碼的介質(zhì)。以上所述,僅為本發(fā)明的具體實(shí)施方式
,但本發(fā)明的保護(hù)范圍并不局限于此,任何熟悉本技術(shù)領(lǐng)域的技術(shù)人員在本發(fā)明揭露的技術(shù)范圍內(nèi),可輕易想到變化或替換,都應(yīng)涵蓋在本發(fā)明的保護(hù)范圍之內(nèi)。因此,本發(fā)明的保護(hù)范圍應(yīng)所述以權(quán)利要求的保護(hù)范圍為準(zhǔn)。
權(quán)利要求
1.一種數(shù)據(jù)中心網(wǎng)絡(luò)中的選路方法,其特征在于,包括接收轉(zhuǎn)發(fā)路徑上的下游設(shè)備發(fā)送的流控信號(hào),所述流控信號(hào)是由所述下游設(shè)備在檢測(cè)到所述轉(zhuǎn)發(fā)路徑發(fā)生擁塞后生成的,所述流控信號(hào)用于向上游設(shè)備通知所述擁塞;根據(jù)所述流控信號(hào),在選路時(shí)暫停選擇所述轉(zhuǎn)發(fā)路徑。
2.如權(quán)利要求1所述的方法,其特征在于,所述流控信號(hào)基于報(bào)文的優(yōu)先級(jí),所述在選路時(shí)暫停選擇所述轉(zhuǎn)發(fā)路徑,包括在為具有所述優(yōu)先級(jí)的報(bào)文進(jìn)行選路時(shí), 暫停選擇所述轉(zhuǎn)發(fā)路徑。
3.如權(quán)利要求2所述的方法,其特征在于,所述方法還包括在選路之前,根據(jù)所述流控信號(hào),暫停具有所述優(yōu)先級(jí)的報(bào)文的發(fā)送。
4.如權(quán)利要求1-3任一項(xiàng)所述的方法,其特征在于,所述方法還包括在所述流控信號(hào)失效后,在選路時(shí)允許選擇所述轉(zhuǎn)發(fā)路徑。
5.一種數(shù)據(jù)中心網(wǎng)絡(luò)中的選路方法,其特征在于,包括在檢測(cè)到與上游設(shè)備之間的轉(zhuǎn)發(fā)路徑擁塞時(shí),生成流控信號(hào),所述流控信號(hào)用于向上游設(shè)備通知所述擁塞;向所述上游設(shè)備發(fā)送所述流控信號(hào),以使所述上游設(shè)備根據(jù)所述流控信號(hào),在選路時(shí)暫停選擇所述轉(zhuǎn)發(fā)路徑。
6.如權(quán)利要求5所述的方法,其特征在于,所述生成流控信號(hào),包括生成基于報(bào)文的優(yōu)先級(jí)的所述流控信號(hào),以使所述上游設(shè)備在為具有所述優(yōu)先級(jí)的報(bào)文進(jìn)行選路時(shí),暫停選擇所述轉(zhuǎn)發(fā)路徑。
7.如權(quán)利要求5或6所述的方法,其特征在于,所述方法還包括在所述轉(zhuǎn)發(fā)路徑不再擁塞時(shí),向所述上游設(shè)備通知所述流控信號(hào)失效,以使所述上游設(shè)備在選路時(shí)能夠選擇所述路徑。
8.一種數(shù)據(jù)中心網(wǎng)絡(luò)中的通信設(shè)備,其特征在于,包括流控模塊,用于接收轉(zhuǎn)發(fā)路徑上的下游設(shè)備發(fā)送的流控信號(hào),所述流控信號(hào)是由所述下游設(shè)備在檢測(cè)到所述轉(zhuǎn)發(fā)路徑發(fā)生擁塞后生成的,所述流控信號(hào)用于向上游設(shè)備通知所述擁塞;選路模塊,用于根據(jù)所述流控模塊接收的流控信號(hào),在選路時(shí)暫停選擇所述轉(zhuǎn)發(fā)路徑。
9.如權(quán)利要求8所述的通信設(shè)備,其特征在于,所述流控模塊接收的流控信號(hào)基于報(bào)文的優(yōu)先級(jí),所述選路模塊具體用于在為具有所述優(yōu)先級(jí)的報(bào)文進(jìn)行選路時(shí),暫停選擇所述轉(zhuǎn)發(fā)路徑。
10.如權(quán)利要求9所述的通信設(shè)備,其特征在于,所述流控模塊還用于在選路之前,根據(jù)所述流控信號(hào),暫停具有所述優(yōu)先級(jí)的報(bào)文的發(fā)送。
11.如權(quán)利要求8-10任一項(xiàng)所述的通信設(shè)備,其特征在于,所述選路模塊還用于在所述流控信號(hào)失效后,在選路時(shí)允許選擇所述轉(zhuǎn)發(fā)路徑。
12.—種數(shù)據(jù)中心網(wǎng)絡(luò)中的通信設(shè)備,其特征在于,包括生成模塊,用于在檢測(cè)到與上游設(shè)備之間的轉(zhuǎn)發(fā)路徑擁塞時(shí),生成流控信號(hào),所述流控信號(hào)用于向上游設(shè)備通知所述擁塞;發(fā)送模塊,用于向所述上游設(shè)備發(fā)送所述生成模塊生成的流控信號(hào),以使所述上游設(shè)備根據(jù)所述流控信號(hào),在選路時(shí)暫停選擇所述轉(zhuǎn)發(fā)路徑。
13.如權(quán)利要求12所述的通信設(shè)備,其特征在于,所述生成模塊具體用于生成基于報(bào)文的優(yōu)先級(jí)的所述流控信號(hào),以使所述上游設(shè)備在為具有所述優(yōu)先級(jí)的報(bào)文進(jìn)行選路時(shí), 暫停選擇所述轉(zhuǎn)發(fā)路徑。
14.如權(quán)利要求12或13所述的通信設(shè)備,其特征在于,所述發(fā)送模塊還用于在所述路徑不再擁塞時(shí),向所述上游設(shè)備通知所述流控信號(hào)失效,以使所述上游設(shè)備在選路時(shí)能夠選擇所述轉(zhuǎn)發(fā)路徑。
全文摘要
本發(fā)明實(shí)施例提供一種數(shù)據(jù)中心網(wǎng)絡(luò)中的選路方法和通信設(shè)備。該選路方法包括接收轉(zhuǎn)發(fā)路徑上的下游設(shè)備發(fā)送的流控信號(hào),該流控信號(hào)是由該下游設(shè)備在檢測(cè)到該轉(zhuǎn)發(fā)路徑發(fā)生擁塞后生成的,該流控信號(hào)用于向上游設(shè)備通知該擁塞;根據(jù)該流控信號(hào),在選路時(shí)暫停選擇該轉(zhuǎn)發(fā)路徑。本發(fā)明實(shí)施例基于下游設(shè)備返回的流控信號(hào),暫停選擇擁塞的轉(zhuǎn)發(fā)路徑,從而能夠選擇其他等價(jià)路徑,避免浪費(fèi)這些等價(jià)路徑上的帶寬資源。
文檔編號(hào)H04L12/56GK102377672SQ201110343038
公開(kāi)日2012年3月14日 申請(qǐng)日期2011年11月3日 優(yōu)先權(quán)日2011年11月3日
發(fā)明者潘灝濤, 胡延興 申請(qǐng)人:華為技術(shù)有限公司