用于促進(jìn)互連交換機(jī)的網(wǎng)絡(luò)中的交換機(jī)虛擬化的方法和系統(tǒng)的制作方法
【專利說明】用于促進(jìn)互連交換機(jī)的網(wǎng)絡(luò)中的交換機(jī)虛擬化的方法和系統(tǒng)
[0001]相關(guān)申請
[0002]本申請主張下述權(quán)益:發(fā)明人格倫.韋尼希(Glenn Wenig)于2014年4月30 日提交的、代理人案號為 BRCD-3287.0.LUS.PSP、名稱為 “Method and System forFacilitating Virtualized Member Switch in a Switch Fabric”的第61/986798號美國臨時(shí)申請的優(yōu)先權(quán),其公開內(nèi)容通過引用的方式結(jié)合在本文中。
技術(shù)領(lǐng)域
[0003]本發(fā)明涉及網(wǎng)絡(luò)設(shè)計(jì)。更具體地,本發(fā)明涉及一種用于構(gòu)造可擴(kuò)展的交換系統(tǒng)的方法,該可擴(kuò)展交換系統(tǒng)延伸了網(wǎng)絡(luò)的邊緣。
【背景技術(shù)】
[0004]網(wǎng)絡(luò)的指數(shù)式增長使得其成為運(yùn)行在物理和虛擬設(shè)備上的各種應(yīng)用的流行的傳送媒介。這些應(yīng)用帶來了對帶寬需求的不斷增加。因此,設(shè)備供應(yīng)商爭先建立具有通用功能的更大、更快的交換機(jī)。然而,交換機(jī)的尺寸不能無限增大。它受到物理空間、功耗和設(shè)計(jì)復(fù)雜度等因素的限制。此外,具有更高性能的交換機(jī)通常更復(fù)雜,并且更昂貴。更重要的是,過于龐大和復(fù)雜的系統(tǒng)常常不能產(chǎn)生規(guī)模經(jīng)濟(jì),因此,由于增加的每端口成本,單純地增大交換機(jī)尺寸和提高交換機(jī)性能可能被證明在經(jīng)濟(jì)上是不可行的。
[0005]提高交換機(jī)系統(tǒng)的可擴(kuò)展性的一個(gè)靈活方式是,建立架構(gòu)(Fabric)交換機(jī)。架構(gòu)交換機(jī)是單獨(dú)的成員交換機(jī)的集合。這些成員交換機(jī)形成單個(gè)的邏輯交換機(jī),其具有任意數(shù)量端口和任意拓?fù)浣Y(jié)構(gòu)。隨著需求的增長,客戶可以采用“按需購買”的方式擴(kuò)展架構(gòu)交換機(jī)的性能。
[0006]同時(shí),第二層(Layer-2)和第三層(Layer-3)(例如,分別為以太網(wǎng)協(xié)議和互聯(lián)網(wǎng)協(xié)議(IP))交換技術(shù)不斷發(fā)展。IP促進(jìn)了廣域網(wǎng)(WAN)中的路由和端到端的數(shù)據(jù)傳輸,同時(shí)為無錯(cuò)通信提供安全保障。在另一方面,更多的路由類似功能迀移到Layer-2中。尤其是最新的多鏈接透明互聯(lián)(Transparent Interconnect1n of Lots of Links,TRILL)協(xié)議的發(fā)展,允許以太網(wǎng)交換機(jī)的功能更像路由設(shè)備。TRILL克服了傳統(tǒng)生成樹協(xié)議固有的低效率,其迫使layer-2交換機(jī)連接在邏輯擴(kuò)充樹拓?fù)浣Y(jié)構(gòu)中,以避免生成環(huán)路。通過在交換機(jī)中執(zhí)行路由功能,并且在TRILL報(bào)頭包括跳躍計(jì)數(shù),TRILL允許路由橋(Routing Bridge,RBridge)連接在任意拓?fù)浣Y(jié)構(gòu)中,而沒有生成環(huán)路的風(fēng)險(xiǎn)。
[0007]雖然架構(gòu)交換機(jī)為網(wǎng)絡(luò)帶來許多理想特性,但是在有效地將大量終端設(shè)備(例如,虛擬機(jī))連接為架構(gòu)交換機(jī)方面,一些問題仍然未得到解決。
【發(fā)明內(nèi)容】
[0008]本發(fā)明的一個(gè)實(shí)施例提供了一種計(jì)算系統(tǒng)。該計(jì)算系統(tǒng)包括處理器和存儲(chǔ)器,該存儲(chǔ)器存儲(chǔ)由該處理器執(zhí)行的指令。所述計(jì)算系統(tǒng)第一表中存儲(chǔ)在第一交換機(jī)標(biāo)識符與該第一交換機(jī)標(biāo)識符的下一跳交換機(jī)標(biāo)識符之間的第一映射,并且在第二表中存儲(chǔ)所述第一交換機(jī)標(biāo)識符與遠(yuǎn)程設(shè)備的第一介質(zhì)訪問控制(Media Access Control,MAC)地址之間的第二映射。所述計(jì)算系統(tǒng)將具有作為目標(biāo)地址的第一 MAC地址的第一包封裝在第一封裝報(bào)頭中,該第一封裝報(bào)頭帶有第一交換機(jī)標(biāo)識符,該第一交換機(jī)標(biāo)識符作為所述第一封裝報(bào)頭的出口交換機(jī)標(biāo)識符。根據(jù)所述第一封裝報(bào)頭,所述封裝的包在互連交換機(jī)的網(wǎng)絡(luò)中被轉(zhuǎn)發(fā)。
[0009]在本實(shí)施例的一個(gè)變形例中,所述第二表存儲(chǔ)在所述網(wǎng)絡(luò)的一個(gè)邊緣交換機(jī)中。邊緣交換機(jī)通過本地邊緣端口與至少一個(gè)終端設(shè)備連接。
[0010]在本實(shí)施了的一個(gè)變形例中,所述計(jì)算系統(tǒng)還在所述第二表中存儲(chǔ)本地交換模塊的第二交換機(jī)標(biāo)識符與本地設(shè)備的MAC地址之間的第三映射。
[0011]在進(jìn)一步的變形例中,所述計(jì)算系統(tǒng)識別在封裝第二包的封裝報(bào)頭中作為出口標(biāo)識符的所述第二交換機(jī)標(biāo)識符,并且將所述第二包提供給所述本地設(shè)備。
[0012]在本實(shí)施例的變形例中,所述計(jì)算系統(tǒng)響應(yīng)于對來自與所述第一交換機(jī)標(biāo)識符相關(guān)聯(lián)的遠(yuǎn)程交換機(jī)的通知消息的負(fù)載中的所述第二映射而在所述第二表中增加所述第二映射。
[0013]在本實(shí)施例的變形例中,所述計(jì)算系統(tǒng)確定交換機(jī)是否能夠處理所述第一封裝報(bào)頭。
[0014]在本實(shí)施例的變形例中,所述網(wǎng)絡(luò)中的一個(gè)交換機(jī)與群標(biāo)識符相關(guān),其中,所述群標(biāo)識符表明所述交換機(jī)是否是所述網(wǎng)絡(luò)的成員交換機(jī)。
【附圖說明】
[0015]圖1A為根據(jù)本發(fā)明的一個(gè)實(shí)施例的帶有虛擬邊緣交換機(jī)的示例性網(wǎng)絡(luò)的示意圖;
[0016]圖1B為根據(jù)本發(fā)明的一個(gè)實(shí)施例的帶有包括虛擬邊緣交換機(jī)的邊緣平面的示例性網(wǎng)絡(luò)的示意圖;
[0017]圖2A為根據(jù)本發(fā)明的一個(gè)實(shí)施例的帶有用于虛擬邊緣交換機(jī)的下一跳交換機(jī)的示例性轉(zhuǎn)發(fā)表的示意圖;
[0018]圖2B為根據(jù)本發(fā)明的一個(gè)實(shí)施例的在虛擬邊緣交換機(jī)中的示例性邊緣介質(zhì)訪問控制(Media Access Control, MAC)表的不意圖;
[0019]圖3A為根據(jù)本發(fā)明的一個(gè)實(shí)施例的虛擬邊緣交換機(jī)發(fā)現(xiàn)未知目標(biāo)的過程的流程圖;
[0020]圖3B為根據(jù)本發(fā)明的一個(gè)實(shí)施例的虛擬邊緣交換機(jī)對未知目標(biāo)發(fā)現(xiàn)的響應(yīng)過程的流程圖;
[0021 ]圖4A為根據(jù)本發(fā)明的一個(gè)實(shí)施例的虛擬邊緣交換機(jī)對從本地設(shè)備接收的包的轉(zhuǎn)發(fā)的過程的流程圖;
[0022]圖4B為根據(jù)本發(fā)明的一個(gè)實(shí)施例的中間節(jié)點(diǎn)對從虛擬邊緣交換機(jī)接收的包的轉(zhuǎn)發(fā)的過程的流程圖;
[0023]圖5為根據(jù)本發(fā)明的一個(gè)實(shí)施例的帶有虛擬邊緣交換機(jī)支持的示例性計(jì)算系統(tǒng)的示意圖。
[0024]附圖中相同或相似的附圖標(biāo)記代表相同或相似的部件。
【具體實(shí)施方式】
[0025]以下描述的提出是為了本領(lǐng)域技術(shù)人員能夠制造和使用本發(fā)明,并且在具體應(yīng)用及其需求的情況下提供。對于本領(lǐng)域的普通技術(shù)人員來說,在不脫離本發(fā)明構(gòu)思的前提下,可以顯而易見地對公開的實(shí)施例做出若干變形和改進(jìn),并且本文限定的一般原則可以應(yīng)用到其他實(shí)施例和應(yīng)用中。因此,本發(fā)明不限于所示的實(shí)施例,其保護(hù)范圍應(yīng)以所附權(quán)利要求為準(zhǔn)。
[0026]概述
[0027]在本發(fā)明的實(shí)施例中,通過向網(wǎng)絡(luò)并入運(yùn)行在主機(jī)上的虛擬邊緣交換機(jī)解決了以可擴(kuò)展的方式延伸網(wǎng)絡(luò)的邊緣的問題。這些主機(jī)可以管理一個(gè)或多個(gè)虛擬機(jī)(VirtualMachine,VM)。這些虛擬邊緣交換機(jī)作為該網(wǎng)絡(luò)的成員交換機(jī)。通過這種方式,網(wǎng)絡(luò)的邊緣延伸到主機(jī)。
[0028]采用現(xiàn)有技術(shù),在互連交換機(jī)的網(wǎng)絡(luò)中的交換機(jī)可以被稱為成員交換機(jī),其通過交換機(jī)相互間端口彼此連接。一些成員交換機(jī)通過邊緣端口連接終端設(shè)備(例如,主機(jī),其為管理一個(gè)或多個(gè)虛擬機(jī)的計(jì)算設(shè)備)。連接終端設(shè)備的交換機(jī)可以被稱為邊緣交換機(jī)。當(dāng)成員交換機(jī)通過邊緣端口接收包時(shí),成員交換機(jī)從包中學(xué)習(xí)介質(zhì)訪問控制(Media AccessControI,MAC)地址,并且將邊緣端口與學(xué)習(xí)的MAC地址相映射。接著,該成員交換機(jī)構(gòu)造通知消息,將該映射包含到該通知消息中,并且將該通知消息發(fā)送到網(wǎng)絡(luò)的其他成員交換機(jī)。通過這種方式,一個(gè)成員交換機(jī)知道從架構(gòu)交換機(jī)的邊緣端口學(xué)習(xí)到的一個(gè)MAC地址。
[0029]運(yùn)用服務(wù)器虛擬技術(shù),終端設(shè)備可以是管理多個(gè)虛擬機(jī)的主機(jī)。主機(jī)可以包括運(yùn)行多個(gè)虛擬機(jī)的管理程序,每個(gè)虛擬機(jī)可以具有一個(gè)或多個(gè)MAC地址。因此,成員交換機(jī)可以從其各自的邊緣端口學(xué)習(xí)大量的MAC地址。此外,成員交換機(jī)還可能學(xué)習(xí)在其他成員交換機(jī)上學(xué)習(xí)到的MAC地址。因此,MAC地址學(xué)習(xí)可以變得不利于網(wǎng)絡(luò)的擴(kuò)展,并且導(dǎo)致網(wǎng)絡(luò)中的MAC地址激增。
[0030]為了解決這個(gè)問題,可以通過在主機(jī)的管理程序中運(yùn)行虛擬的邊緣交換機(jī),將網(wǎng)絡(luò)的邊緣延伸到主機(jī)。這種虛擬邊緣交換機(jī)作為網(wǎng)絡(luò)的成員交換機(jī)。例如,虛擬邊緣交換機(jī)可以封裝包,通過交換機(jī)相互間鏈接將包發(fā)送到網(wǎng)絡(luò)的其他交換機(jī)。因此,這些虛擬邊緣交換機(jī)變成網(wǎng)絡(luò)的邊緣交換機(jī)。其他沒有連接到終端設(shè)備的成員交換機(jī)可以稱為網(wǎng)絡(luò)的中間交換機(jī)。虛擬邊緣交換機(jī)可以存在于主機(jī)的管理程序中。虛擬邊緣交換機(jī)還可以工作在主機(jī)的網(wǎng)絡(luò)接口卡(Network Interface Card,NIC)中。例如,虛擬邊緣交換機(jī)可以實(shí)現(xiàn)在該卡的專用集成電路(Applicat1n-Specific Integrated Circuit,ASIC)中。虛擬邊緣交換機(jī)還可以在虛擬網(wǎng)絡(luò)設(shè)備中,其邏輯連接到管理程序,并運(yùn)行在主機(jī)上。由于虛擬邊緣交換機(jī)為網(wǎng)絡(luò)的成員,因此,中間節(jié)點(diǎn)維持到虛擬邊緣交換機(jī)的路徑。
[0031]在操作期間,在主機(jī)中的虛擬邊緣交換機(jī)接收來自在該主機(jī)中的虛擬機(jī)的包。該虛擬邊緣交換機(jī)依次將包封裝在封裝報(bào)頭,并且將封裝的包轉(zhuǎn)發(fā)到網(wǎng)絡(luò)的中間交換機(jī)。該封裝報(bào)頭可以基于架構(gòu)封裝(fabric encapsulat1n),其允許在架構(gòu)交換機(jī)中轉(zhuǎn)發(fā)包,或者基于隧道封裝,其允許在隧道中轉(zhuǎn)發(fā)包。根據(jù)接收的包,中間交換機(jī)根據(jù)封裝報(bào)頭轉(zhuǎn)發(fā)該包,無需檢查內(nèi)部包。因此,中間節(jié)點(diǎn)可以轉(zhuǎn)發(fā)包而無需學(xué)習(xí)在主機(jī)中的虛擬機(jī)的MAC地址。在這種情況下,虛擬邊緣交換機(jī)學(xué)習(xí)和管理MAC地址,中間節(jié)點(diǎn)轉(zhuǎn)發(fā)包無需學(xué)習(xí)MAC地址。通過這種方式,該網(wǎng)絡(luò)的邊緣網(wǎng)絡(luò)以可擴(kuò)展的方式延伸到主機(jī)。
[0032]在一些實(shí)施例中,該網(wǎng)絡(luò)是架構(gòu)交換機(jī)。在架構(gòu)交換機(jī)中,以邏輯結(jié)構(gòu)連接的任意數(shù)量的交換機(jī)可以邏輯地以單個(gè)交換機(jī)的形式運(yùn)作。該架構(gòu)交換機(jī)可以是以太網(wǎng)架構(gòu)交換機(jī)或虛擬集群交換機(jī)(Virtual Cluster Switch,VCS),其可以以單個(gè)以太網(wǎng)交換機(jī)的形式運(yùn)作。任意數(shù)量的交換機(jī)可以以“即插即用”的模式加入或離開架構(gòu)交換機(jī),無需手動(dòng)配置。在一些實(shí)施例中,在架構(gòu)交換機(jī)中的各交換機(jī)是多鏈接透明互聯(lián)(TransparentInterconnect1n of Lots of Links,TRILL)路由橋(Routing Bridge,RBridge)。在還有一些實(shí)施例中,在架構(gòu)交換機(jī)中的各交換機(jī)是互聯(lián)網(wǎng)協(xié)議(Internet Protocol,IP)具備路由能力的交換機(jī)(例如,IP路由器)。
[0033]應(yīng)該注意的是,架構(gòu)交換機(jī)與傳統(tǒng)的交換機(jī)堆疊是不同的。在交換機(jī)堆疊中,多個(gè)交換機(jī)基于特定的拓?fù)浣Y(jié)構(gòu)在一個(gè)共同位置相互連接(通常在相同的機(jī)架中),并且以特定的方式手動(dòng)配置。這些堆疊的交換機(jī)通常共享相同的地址,例如,IP地址,因此,它們可以作為單個(gè)交換機(jī)被外部尋址。此外,交換機(jī)堆疊需要大量的端口和交換機(jī)相互間鏈接的手動(dòng)配置。在建造大規(guī)模交換系統(tǒng)中,手動(dòng)配置的需要限制交換機(jī)堆疊成為一種可行選擇。交換機(jī)堆疊強(qiáng)加的拓?fù)浣Y(jié)構(gòu)限制也限制了可以堆疊的交換機(jī)的數(shù)量。