專利名稱:用于操作系統(tǒng)集群的自復制安裝方法和系統(tǒng)的制作方法
技術領域:
本發(fā)明涉及在具有CPU集群的計算系統(tǒng)中安裝操作系統(tǒng)。
背景技術:
對于Web服務、高性能計算和其它領域而言,以集群方式提供廉價計算的價值是眾所周知的。然而,集群的規(guī)模通常停滯于512個節(jié)點左右,主要問題在于最初如何建立一個操作系統(tǒng)版本的較大集群。當前的集群通常使用單服務器技術或分層服務器技術來安裝集群。
在單服務器技術中,從作為安裝服務器的具有所有智能和軟件(即安裝所需的、除了普通CPU(系統(tǒng)中的節(jié)點)的公共操作系統(tǒng)軟件之外的額外軟件)的單個工作站安裝所有節(jié)點。在分層技術中,主服務器安裝輔助安裝服務器組,并且以嚴密控制的“波”的形式進行操作系統(tǒng)的傳播。主服務器安裝輔助服務器,而輔助服務器安裝其余客戶機。這兩個方法均受到被稱為“廣播風暴”的現(xiàn)象的不利影響。當以規(guī)則的短間隔同時啟動許多節(jié)點并且廣播網(wǎng)絡分組時會出現(xiàn)廣播風暴,從而使網(wǎng)絡負載飽和,并且最終導致所有網(wǎng)絡傳輸失敗。
發(fā)明內容
本發(fā)明涉及具有限速特征的程序安裝方法,其中安裝服務器以概率性方式響應來自客戶機的請求,從而降低網(wǎng)絡帶寬超載的機會。
本發(fā)明的特征在于根據(jù)[所有]其它客戶機的[總]請求速率的來自客戶機的動態(tài)安裝請求速率。
本發(fā)明的另一個特征是在客戶機安裝足夠允許客戶機在其它客戶機上安裝程序的軟件,使得請求安裝的客戶機至少臨時變成安裝服務器,這種安裝服務器以概率性方式按照低于已經(jīng)安裝它的服務器的速率響應來自客戶機的請求。
本發(fā)明的另一個特征在于一個客戶機根據(jù)其它客戶機的請求數(shù)量自調整請求速率。
本發(fā)明的另一個特征在于每個安裝服務器在客戶機中分配有限范圍的請求客戶機地址,其中新產生的安裝服務器可以響應該范圍內的客戶機。
圖1示意性圖解了用于本發(fā)明的計算機集群。
圖2示出了本發(fā)明的安裝序列。
圖3示出了圖2的一部分序列。
具體實施例方式
參照圖1,其中示意性示出了基于本發(fā)明的計算機集群100的一部分,其中框110示意性代表計算機,包含CPU、盤驅動器、存儲器和其它物理上位于CPU附近的外設。框105代表安裝模塊,包括在另一個計算機安裝有關軟件、相關硬件與固件(例如整個Linux操作系統(tǒng)映像)所需的軟件,和基于本發(fā)明的聯(lián)系和安裝新客戶機節(jié)點的安裝程序。
連線20代表集群中節(jié)點(或CPU)之間的通信鏈路。此鏈路可以是無線鏈路、傳統(tǒng)總線或二者的組合等等。連線22-i代表到集群中其它節(jié)點的鏈路。計算機網(wǎng)絡會具有可以承載數(shù)據(jù)的總網(wǎng)絡帶寬和總網(wǎng)絡帶寬速率,其中總網(wǎng)絡帶寬速率是可以通過網(wǎng)絡完成的單位時間的安裝請求數(shù)量。
本發(fā)明解決的問題是以及時方式在集群的所有節(jié)點中進行安裝,而不會產生“風暴”;即通信鏈路上使節(jié)點之間通信系統(tǒng)容量超載的大量同時事務。在當代計算技術中,已經(jīng)設計出具有數(shù)萬節(jié)點的體系結構,但是當前在這個量級的集群上安裝和升級軟件是不切實際的。
在本發(fā)明的自復制安裝方法(SRIM)中,集群中的所有節(jié)點變成安裝服務器,而不是使受控的、選定節(jié)點組變成安裝服務器。通過使用SRIM,安裝不是受控的,它以非確定性方式傳遍整個集群,直到集群中的所有節(jié)點被安裝。
因為在較大集群(大于512個節(jié)點)中簡單地對節(jié)點加電并使其廣播安裝請求會立即導致廣播風暴,因此SRIM使用客戶機廣播調節(jié)方法(CBRM)限制來自客戶機節(jié)點的安裝請求,從而強制節(jié)點按照不斷增加的請求間隔進行廣播,使得不太經(jīng)常地尋找服務器。類似地,使許多服務器響應客戶機請求會導致類似的“響應風暴”。為避免此情況,SRIM使用服務器響應調節(jié)方法(SRRM)來減少務器響應的數(shù)量。
自復制安裝方法SRIM從單個節(jié)點110,即第一安裝服務器開始,節(jié)點110安裝有作為安裝服務器自身為安裝客戶機節(jié)點所需的操作系統(tǒng)和所有軟件的副本(如圖1中框105和105-i所示)。雖然不特定于操作系統(tǒng),然而在Linux的情況下,第一服務器會安裝有完整版本的Linux,加上安裝另一個節(jié)點所需的所有RPM(安裝包),并且使所有必要的安裝服務運行起來。各種操作進行安裝所需的軟件是整個計算行業(yè)眾所周知的??梢酝ㄟ^制造商推薦的任何方便方法安裝服務器110。
在第一服務器已安裝并且準備開始安裝客戶機的情況下,客戶機的某些根據(jù)經(jīng)驗確定的部分被加電,并且開始使用CBRM(如下所述)進行廣播。在優(yōu)選實施例中,所有這樣的客戶機被加電并且開始廣播過程。服務器遵守眾所周知的例如DHCP的協(xié)議。DHCP是當初始啟動計算節(jié)點時被用來在服務器和計算節(jié)點之間進行通信的協(xié)議。DHCP定義了被服務器用來向節(jié)點提供聯(lián)網(wǎng)和啟動信息(例如其IP地址和網(wǎng)關),并且向節(jié)點提供初始啟動內核的協(xié)議。
一旦服務器接受其第一安裝請求,它以一個應答響應,于是將其自身連接到單個客戶機??蛻魴C還忽略來自其它服務器的響應,如果有的話。一旦連接,服務器關閉其DHCP服務以忽略其它安裝請求,并且開始安裝該客戶機。通過停止其DHCP,服務器消除由其做出任何其它DHCP響應的可能性,從而減少網(wǎng)絡傳輸。服務器接著在客戶機中安裝完整版本的操作系統(tǒng),加上客戶機會需要復制其自身的任何服務或可安裝映像(框105中存儲的)。一旦客戶機被完全安裝,它重新啟動自身并且將其自身變成對等服務器。術語“客戶機”和“安裝服務器”取決于時間??蛻魴C是尚未安裝或升級的節(jié)點;一旦被升級,先前的客戶機變成另一個服務器。上述是根據(jù)本發(fā)明所采取的端到端方案。一旦服務器完成客戶機安裝,它重新打開其DHCP服務,并且準備服務于另一個客戶機,即接受請求并執(zhí)行安裝。
服務器的安裝響應是“概率性”的,這意味著服務器根據(jù)一個概率來響應或不響應其收到的請求;例如,服務器計算從1到100的隨機數(shù),并且根據(jù)答案在按照參考概率(在這種情況下為25%)設置的范圍(例如0-25)之內或之外,決定響應或不響應。
可以參照圖2闡述基本安裝流程。
1.從具有操作系統(tǒng)映像、軟件包和復制自身所需的任何服務的CD(或從磁盤、因特網(wǎng)、或任何眾所周知的OS安裝方法)安裝主(第一)節(jié)點。
2.在主服務器上開始所需的服務。
3.加電客戶機(最好是立即加電所有客戶機)。
4.一旦被加電,客戶機開始廣播尋找一個服務器和使用CBRM處理。
5.該服務器響應一個客戶機以將自身連接到該客戶機,并且接著關閉其DHCP服務。
6.該服務器安裝單個節(jié)點,安裝操作系統(tǒng)映像、可安裝映像和任何所需的服務。
7.新服務器自身重新啟動以作為對等服務器,并且舊服務器重新啟動DHCP以重新連接到一個新客戶機。
8.一旦新服務器完成重新啟動,它開始廣播尋找一個客戶機。
9.各新服務器廣播和尋找要連接的客戶機,直到集群中的所有節(jié)點被安裝。
在當前的技術中,當節(jié)點被加電時,它開始“虛擬廣播”。它按照規(guī)則的短間隔廣播尋找服務器。立即加電均調用虛擬廣播方法的許多客戶機啟動了廣播風暴,廣播風暴使網(wǎng)絡出現(xiàn)飽和,通常使所有網(wǎng)絡通信不可能進行。某些機器的BIOS被指示,如果客戶機在較短的廣播(大約60秒)之后沒有接收到針對其廣播的DHCP應答,節(jié)點會重新啟動。
CBRM提高客戶機上廣播的智能,其中假定客戶機在找到適當服務器之前可以廣播許多小時(在遇到非常大的集群時甚至廣播數(shù)天),從而大大減少網(wǎng)絡傳輸和廣播風暴的可能性。
客戶機廣播調節(jié)方法CBRM是動態(tài)的,依賴對網(wǎng)絡狀態(tài)的靈敏度以限制風暴。當在節(jié)點上啟動CBRM時,以適當?shù)穆俾蕪V播,例如每分鐘6次。在廣播的同時,節(jié)點監(jiān)視網(wǎng)絡上出現(xiàn)的廣播的總數(shù),并且確定廣播的總速率。接著將這個速率與存儲的目標請求速率比較。如果總速率小于目標速率,將節(jié)點自身的廣播速率增加一個與目標速率和總速率之間的差值成比例的量值。相反,如果總速率大于目標速率,將節(jié)點的廣播速率降低一個成比例的量值。通過這種方式,各個節(jié)點的廣播速率會趨向保持總速率接近目標速率的數(shù)值。廣播總數(shù)和其它客戶機的廣播總數(shù)簡單相關,并且相等以便調整單獨的響應速率。
由于總速率往往發(fā)生改變(有時變化很大),應當選擇具有余量的目標速率以允許較大的波動。目標速率會被設置在較小部分的總網(wǎng)絡帶寬上,例如1%。由于DHCP廣播非常小,這允許進行大量廣播,并且允許為可能出現(xiàn)的速率峰值提供空間。允許系統(tǒng)管理員以關于特定網(wǎng)絡的經(jīng)歷對速率進行調節(jié)。應當注意,重要的是客戶機能夠更快速地廣播,并因此能夠較早地找到服務器。本發(fā)明的目的是避免廣播風暴。問題是快速和不受控制的廣播會導致廣播風暴。通過控制廣播間隔,CBRM減輕了虛假網(wǎng)絡傳輸?shù)膯栴}。
再次參照圖2,下文詳細描述了圖2客戶機啟動每分鐘6次的廣播(假定是完整設置)。
各個客戶機從網(wǎng)絡讀取總速率,將其與目標廣播速率(在網(wǎng)絡設置期間得到,或通過廣播消息得到)相比較。
各個客戶機將實際速率與目標速率相比較。在這個例子中,假定目標速率為每分鐘60次,并且其它客戶機的當前速率為每分鐘30次。
由于當前速率低于目標速率,將客戶機速率增加一個比例,例如差值的一半。在這種情況下,差值為每分鐘54次,因此客戶機速率被增加每分鐘27次至每分鐘33次。其它客戶機也增加其速率。
由于沒有服務器應答,客戶機繼續(xù)按照這個速率廣播,并且在一個周期之后,重新評估該速率。周期確定可以具有某些偏差;例如x秒+/-y,其中y是x的10%范圍內的隨機數(shù)。這會減少客戶機同時增加或減少導致的峰值。
這時,由于客戶機自身增加速率,總速率為每分鐘63次。由于總速率現(xiàn)在高于目標速率,客戶機減少其速率。它再次調整差值的一半,從而減少每分鐘1.5次。這使得客戶機速率為每分鐘31次(舍入)。
這個處理繼續(xù)進行,直到服務器應答客戶機。
服務器響應調節(jié)方法和IP地址分配一旦處理在大的集群中良好進行,會有許多服務器能夠響應,使得利于得到避免“響應風暴”(其中過多的服務器響應各個請求)的方法。為了防止這種情況的發(fā)生,使用服務器響應調節(jié)方法(SRRM)。利用SRRM,對任何請求做出響應的機器的平均數(shù)量始終大約為1。
集群可以被視作具有被全局保留的兩個資源。其中一個是響應概率(從100%開始),另一個是網(wǎng)絡內的IP地址(例如使用TCP約定的10.0.0.0.8)。每當服務器安裝客戶機時,它在其自身及其客戶機之間平均分享這些資源。
參照圖3,例子是在第一安裝周期期間,根據(jù)隨機數(shù)發(fā)生器,第一服務器有25%的機會應答客戶機請求。
它(最終)接受客戶機安裝請求。服務器擁有10.64.0.0和10.127.255.255之間眾所周知的IP地址范圍(用于TCP)內的IP地址。服務器為客戶機分配IP地址10.96.0.1(是服務器IP范圍的1/2)。服務器接著在客戶機上安裝操作系統(tǒng)。
在該客戶機與服務器斷開之前,它請求IP地址塊,當該客戶機安裝新客戶機時會為新客戶機分配此IP地址塊。服務器為客戶機分出其IP地址塊的1/2。其一個優(yōu)點是動態(tài)分配IP地址--沒有用于IP地址的單點控制,因此沒有單個瓶頸。將地址分出一半作為可用地址塊的實際優(yōu)點是IP地址分配是動態(tài)的和不受控制的。利用這個算法,僅僅稀疏地使用完整的IP地址塊。這不會消極地影響集群,因為這個IP地址塊不反映到集群外部,因此每個集群可以使用相同的IP地址。
如果節(jié)點在接收到地址塊之后出現(xiàn)故障,它不會影響進行安裝的集群的其余部分。故障節(jié)點會保留某些不起作用的IP地址??赡艿刂返臄?shù)量遠大于任何合理的集群,因此不會出現(xiàn)IP地址用完的問題。
客戶機請求一個響應百分比。服務器分出其響應百分比的1/2。現(xiàn)在,客戶機和服務器具有相同的機會(12.5%)響應客戶機安裝請求,和相同數(shù)量的IP地址可供分配。系統(tǒng)管理員可以對初始值25%及可供分配的分數(shù)進行調整。
處理接著再次啟動。
當在系統(tǒng)管理員確定的期間內沒有請求在網(wǎng)絡上出現(xiàn)時,安裝處理完成。
利用此方法,安裝工作在集群上均勻散布。因為服務器響應客戶機請求的能力是概率性的,不止一個服務器可以響應一個特定請求。然而在平均情況下,大約會有一個服務器響應。隨著集群變大,兩個以上服務器響應請求的機會按指數(shù)規(guī)律減少,于是可以防止出現(xiàn)響應風暴的可能性。
可以通過許多方式實現(xiàn)本發(fā)明的方法(SRIM和CBRM)。一個方案是使用專用BIOS(固件)支持各個節(jié)點或各個節(jié)點的網(wǎng)絡通信卡上的CBRM。其優(yōu)點是不需要修改安裝的操作系統(tǒng)。另一個方案是作為安裝包一部分的程序-當安裝之后第一次重新啟動時被調用,并且當安裝處理完成時自我關閉。本領域的技術人員能夠容易地導出其它方法。無論如何,驅動程序會強制網(wǎng)絡通信卡在廣播之間的時間延遲(廣播間隔)內執(zhí)行CBRM方法。可選的實現(xiàn)是在網(wǎng)卡本身上直接使用CBRM軟件。節(jié)點BIOS會啟動網(wǎng)絡接口卡的設備驅動程序,而卡會執(zhí)行本身的CBRM。CBRM是在節(jié)點BIOS上還是網(wǎng)絡接口卡BIOS上實現(xiàn)對安裝服務器是透明的。
由于本發(fā)明可應用于各種規(guī)模的集群,本領域的技術人員會想到,通過這個方案可比某些現(xiàn)有技術方案更加快速地安裝某些結構,但是某些現(xiàn)有技術方案在某些特定情況下會產生更快速的安裝。本發(fā)明涉及靈活性,而不是特定結構。靈活性,尤其是對于以往認為不切實際的規(guī)模的集群而言,被認為比針對特定結構而定制的方案更加有益。通過使用CBRM而不是傳統(tǒng)廣播方法消除了傳統(tǒng)瓶頸?,F(xiàn)有技術的方法中存在限制--例如,單個節(jié)點會安裝16個其它節(jié)點并且之后停止。
本領域的技術人員會理解,在本發(fā)明的范圍內可以實踐許多變化一例如,服務器的地址范圍可以是動態(tài)的-在安裝速率降低的情況下可增加可能客戶機的數(shù)量。類似地,響應百分比可以是動態(tài)的。服務器可以分出其地址范圍的1/4或某些其它分數(shù),而不是1/2。網(wǎng)絡傳輸?shù)臈l件可以是單位時間的分組或字節(jié)數(shù)量(與容量相比),而不是單位時間的請求數(shù)量,從而允許有較大或較小的操作系統(tǒng),以及快速或慢速的網(wǎng)絡。此方法不局限于諸如Linux的操作系統(tǒng)的初始安裝,而是可以被應用于應用程序(具有與之相關的適當安裝軟件)和升級。術語“操作軟件”是指執(zhí)行所涉及的功能的軟件,無論是操作計算機還是執(zhí)行天氣預報程序中的計算。
雖然前面根據(jù)若干優(yōu)選實施例描述了本發(fā)明,然而本領域的技術人員會認識到,可以在所附權利要求書的宗旨和范圍內以各種版本實施本發(fā)明。
權利要求
1.在具有一組計算機的網(wǎng)絡中安裝計算機程序的方法,包括步驟提供具有操作軟件和安裝軟件的第一安裝計算機;提供包括以動態(tài)可調節(jié)速率廣播安裝請求的至少一個客戶計算機的一組客戶計算機;其中所述第一安裝計算機響應第一安裝請求,并在所述計算機組的第一客戶計算機上安裝所述操作軟件和安裝軟件,從而建立所述客戶計算機作為輔助安裝計算機,并且在該安裝操作期間,所述第一安裝計算機忽略安裝請求;當完成第一安裝時,所述第一安裝計算機和所述輔助安裝計算機通過安裝所述操作軟件和安裝軟件服務于安裝請求。
2.如權利要求1所述的在具有一組客戶計算機的網(wǎng)絡中安裝計算機程序的方法,其中客戶計算機最初按照一個初始請求速率廣播安裝請求,并且監(jiān)視所述網(wǎng)絡上執(zhí)行的總安裝請求速率;并且所述客戶計算機通過比較所述總安裝請求速率和目標安裝請求速率,并且將其自身速率調整一個取決于所述總安裝請求速率和所述目標請求速率之間的差值的調節(jié)量,調整其自身的廣播速率。
3.如權利要求2所述的在網(wǎng)絡中安裝計算機程序的方法,其中所述調節(jié)量與所述總安裝請求速率和所述目標請求速率之間的所述差值成線性比例。
4.如權利要求2所述的在網(wǎng)絡中安裝計算機程序的方法,其中所述目標速率與總網(wǎng)絡帶寬速率成比例。
5.如權利要求4所述的在網(wǎng)絡中安裝計算機程序的方法,其中所述目標速率小于總網(wǎng)絡帶寬速率的10%。
6.如權利要求2所述的在網(wǎng)絡中安裝計算機程序的方法,其中安裝計算機以概率性方式響應其接收的安裝請求。
7.如權利要求6所述的在網(wǎng)絡中安裝計算機程序的方法,其中安裝計算機根據(jù)初始基準概率響應其接收的第一安裝請求。
8.如權利要求7所述的在網(wǎng)絡中安裝計算機程序的方法,其中安裝計算機根據(jù)當前安裝概率響應其接收的安裝請求,并且在完成其響應的安裝請求時,按照一個縮減系數(shù)減少其當前安裝概率,以計算其未來會用以響應請求的新當前安裝概率。
9.如權利要求8所述的在網(wǎng)絡中安裝計算機程序的方法,其中所述安裝計算機向新安裝的客戶計算機,即現(xiàn)在的輔助安裝計算機發(fā)送所述新當前安裝概率,而所述新安裝的輔助安裝計算機按照所述新當前安裝概率響應安裝請求。
10.如權利要求書9所述的在網(wǎng)絡中安裝計算機程序的方法,其中所述縮減系數(shù)是1/2,而所述安裝計算機和所述輔助安裝計算機具有相同概率,并且所述安裝計算機和所述輔助安裝計算機的總響應概率與所述安裝計算機的先前響應概率相同。
11.如權利要求6所述的在網(wǎng)絡中安裝計算機程序的方法,其中所述第一安裝計算機具有網(wǎng)絡地址范圍一半的網(wǎng)絡地址,并且所述第一安裝計算機為其安裝的各個輔助安裝計算機分配一個輔助安裝計算機網(wǎng)絡地址范圍,該范圍是所述第一安裝計算機的當前網(wǎng)絡地址范圍的一半,和作為所述輔助安裝計算機網(wǎng)絡地址范圍一半的網(wǎng)絡地址。
12.如權利要求8所述的在網(wǎng)絡中安裝計算機程序的方法,其中所述第一安裝計算機具有網(wǎng)絡地址范圍一半的網(wǎng)絡地址,并且所述第一安裝計算機為其安裝的各個輔助安裝計算機分配一個輔助安裝計算機網(wǎng)絡地址范圍,該范圍是所述第一安裝計算機的當前網(wǎng)絡地址范圍的一半,和作為所述輔助安裝計算機網(wǎng)絡地址范圍一半的網(wǎng)絡地址。
13.如權利要求10所述的在網(wǎng)絡中安裝計算機程序的方法,其中所述第一安裝計算機具有網(wǎng)絡地址范圍一半的網(wǎng)絡地址,并且所述第一安裝計算機為其安裝的各個輔助安裝計算機分配一個輔助安裝計算機網(wǎng)絡地址范圍,該范圍是所述第一安裝計算機的當前網(wǎng)絡地址范圍的一半,和作為所述輔助安裝計算機網(wǎng)絡地址范圍一半的網(wǎng)絡地址。
14.一種計算機可讀形式的制造產品,包括執(zhí)行在具有一組計算機的網(wǎng)絡中安裝計算機程序的方法的裝置,所述方法包括步驟提供具有操作軟件和安裝軟件的第一安裝計算機;提供包括以動態(tài)可調節(jié)速率廣播安裝請求的至少一個客戶計算機的一組客戶計算機;其中所述第一安裝計算機響應第一安裝請求,并在所述計算機組的第一客戶計算機上安裝所述操作軟件和安裝軟件,從而建立所述客戶計算機作為輔助安裝計算機,并且在該安裝操作期間,所述第一安裝計算機忽略安裝請求;當完成第一安裝時,所述第一安裝計算機和所述輔助安裝計算機通過安裝所述操作軟件和安裝軟件服務于安裝請求。
15.如權利要求14所述的制造產品,其中客戶計算機最初按照初始請求速率廣播安裝請求,并且監(jiān)視所述網(wǎng)絡上的總安裝請求速率;和所述客戶計算機通過比較所述總安裝請求速率和目標安裝請求速率,并且將其自身速率調整一個取決于所述總安裝請求速率和所述目標請求速率之間的差值的調節(jié)量,調整其自身的廣播速率。
16.如權利要求15所述的制造產品,其中所述調節(jié)量與所述總安裝請求速率和所述目標請求速率之間的所述差值成線性比例。
17.如權利要求14所述的制造產品,其中安裝計算機以概率性方式響應其接收的安裝請求。
18.如權利要求17所述的制造產品,其中安裝計算機根據(jù)初始基準概率響應其接收的第一安裝請求。
19.如權利要求18所述的制造產品,其中安裝計算機根據(jù)當前安裝概率響應其接收的安裝請求,并且在完成其響應的安裝請求時,按照一個縮減系數(shù)減少其當前安裝概率,以計算其未來會用以響應請求的新當前安裝概率。
20.一種計算機系統(tǒng),具有一組通過網(wǎng)絡連接的計算機,并且包含運行適于執(zhí)行一個方法的程序的一組計算機,所述方法包括步驟提供具有操作軟件和安裝軟件的第一安裝計算機;提供包括以動態(tài)可調節(jié)速率廣播安裝請求的至少一個客戶計算機的一組客戶計算機;其中所述第一安裝計算機響應第一安裝請求,并在所述計算機組的第一客戶計算機上安裝所述操作軟件和安裝軟件,從而建立所述客戶計算機作為輔助安裝計算機,并且在安裝操作期間,所述第一安裝計算機忽略安裝請求;當完成第一安裝時,所述第一安裝計算機和所述輔助安裝計算機通過安裝所述操作軟件和安裝軟件服務于安裝請求。
21.如權利要求20所述的計算機系統(tǒng),其中客戶計算機最初按照初始請求速率廣播安裝請求,并且監(jiān)視所述網(wǎng)絡上的總安裝請求速率;和所述客戶計算機通過比較所述總安裝請求速率和目標安裝請求速率,并且將其自身速率調整一個取決于所述總安裝請求速率和所述目標請求速率之間的差值的調節(jié)量,調整其自身的廣播速率。
22.如權利要求21所述的計算機系統(tǒng),其中所述調節(jié)量與所述總安裝請求速率和所述目標請求速率之間的所述差值成線性比例。
23.如權利要求22所述的計算機系統(tǒng),其中安裝計算機以概率性方式響應其接收的安裝請求。
24.如權利要求書23所述的計算機系統(tǒng),其中安裝計算機根據(jù)初始基準概率響應其接收的第一安裝請求。
25.如權利要求24所述的計算機系統(tǒng),其中安裝計算機根據(jù)當前安裝概率響應其接收的安裝請求,并且在完成其響應的安裝請求時,按照一個縮減系數(shù)減少其當前安裝概率,以計算其未來會用以響應請求的新當前安裝概率。
全文摘要
一種在不限規(guī)模的集群計算環(huán)境中復制操作系統(tǒng)映像的方法,不需要對安裝進行嚴格的數(shù)量控制(當前方法則有),而是使操作系統(tǒng)映像在集群環(huán)境中本身傳播,從一個節(jié)點散布到下一個節(jié)點,直到整個集群被安裝。使用在繁忙周期期間自動延遲安裝的調節(jié)方法,避免安裝期間的廣播風暴和響應風暴。此方法不需要有關集群中節(jié)點數(shù)量或集群網(wǎng)絡配置的任何預先知識。
文檔編號G06F9/445GK1497439SQ200310100339
公開日2004年5月19日 申請日期2003年10月14日 優(yōu)先權日2002年10月15日
發(fā)明者M·S·蔡斯-薩萊諾, S·L·達格, R·費里, V·F·霍夫曼, M S 蔡斯-薩萊諾, 達格, 霍夫曼 申請人:國際商業(yè)機器公司