專利名稱:自主服務(wù)器場和服務(wù)器場中的自修復(fù)方法
技術(shù)領(lǐng)域:
本發(fā)明涉及自主計(jì)算領(lǐng)域,更具體地說,涉及服務(wù)器場的自修復(fù)。
背景技術(shù):
從企業(yè)計(jì)算技術(shù)的出現(xiàn)開始,與適于在企業(yè)中運(yùn)用的創(chuàng)新技術(shù)的數(shù)目日益增多同步,計(jì)算技術(shù)的復(fù)雜性呈指數(shù)規(guī)律增加。受人推崇的摩爾定律推動(dòng)了信息技術(shù)業(yè)的巨大發(fā)展,并被看作技術(shù)進(jìn)步的基礎(chǔ)。盡管如此,位于運(yùn)用和管理新的計(jì)算技術(shù)最前沿的人們認(rèn)識(shí)到計(jì)算技術(shù)數(shù)目的日益增多以及復(fù)雜性日益提高的代價(jià)是技術(shù)管理。
即,在要求必須監(jiān)視和管理企業(yè)中每個(gè)組成部分的情況下,互用性的主要目的已變得越來越難以實(shí)現(xiàn)。過去,企業(yè)僅僅由數(shù)個(gè)標(biāo)準(zhǔn)化組成部分構(gòu)成,目前,企業(yè)可包括大量根本不同的組成部分,每個(gè)組成部分能夠在規(guī)定的運(yùn)作參數(shù)內(nèi)極好地完成任務(wù),或者在規(guī)定的運(yùn)作參數(shù)外極差地完成工作。從而,雖然外行看來未來的挑戰(zhàn)好象取決于開發(fā)具有更高能力的許多新技術(shù),但是本領(lǐng)域的技術(shù)人員會(huì)認(rèn)識(shí)到未來的真正挑戰(zhàn)由可能已經(jīng)存在的技術(shù)管理決定。
在著名的宣言Automnomic ComputingIBM′s Perspective onthe State of Information Technology中,Paul Horn,IBM Research的高級(jí)副總裁評(píng)述“要忙于的不是跟上摩爾定律,而是應(yīng)付其長達(dá)數(shù)十年統(tǒng)治的結(jié)果”。在該評(píng)述下,Horn提出與生物科學(xué)的自主神經(jīng)系統(tǒng)相似的計(jì)算。即,鑒于人類的自主神經(jīng)系統(tǒng)監(jiān)視、控制、修復(fù)和響應(yīng)不斷變化的條件,而不需要出自人類一方的任何有意識(shí)努力,因此在自主計(jì)算系統(tǒng)中,系統(tǒng)必須自我調(diào)整、自我修復(fù)和響應(yīng)不斷變化的條件,而不需要出自計(jì)算系統(tǒng)操作員的任何有意識(shí)努力。
從而,與自主神經(jīng)系統(tǒng)能夠使人類免于應(yīng)付復(fù)雜事件的負(fù)擔(dān)一樣,自主計(jì)算系統(tǒng)也能夠如此。可確切地說,計(jì)算系統(tǒng)本身能夠承擔(dān)應(yīng)付其自身復(fù)雜性的責(zé)任。IBM宣言的要點(diǎn)和自主計(jì)算系統(tǒng)的八個(gè)主要特征相關(guān)I、系統(tǒng)必須“了解自身”,并包括同樣擁有系統(tǒng)身份的那些系統(tǒng)組成部分。
II、系統(tǒng)必須能夠在不斷變化并且不可預(yù)測的條件下配置和重新配置自身。
III、系統(tǒng)必須決不滿足于現(xiàn)狀,系統(tǒng)必須始終尋找優(yōu)化其工作的方式。
IV、系統(tǒng)必須是能自修復(fù)的,能夠從可能導(dǎo)致其一些部分發(fā)生故障的常規(guī)及異常事件中恢復(fù)過來。
V、系統(tǒng)必須是自我保護(hù)方面的專家。
VI、系統(tǒng)必須了解其環(huán)境以及圍繞其活動(dòng)的背景,并據(jù)此采取行動(dòng)。
VII、系統(tǒng)必須遵守開放式標(biāo)準(zhǔn)。
VIII、系統(tǒng)必須預(yù)期使用戶無法察覺其復(fù)雜性所需的優(yōu)化資源。
特別地,根據(jù)自主計(jì)算的這八個(gè)條件(tenant),已提出數(shù)種單一系統(tǒng)及對等系統(tǒng),其中自我配置、管理和修復(fù)為自主操作建立了基礎(chǔ)。但是,不論自主計(jì)算的這八個(gè)條件,現(xiàn)有的實(shí)現(xiàn)都沒有注意客戶計(jì)算裝置和服務(wù)器場中服務(wù)器過程的相互作用以促進(jìn)服務(wù)器場中的自我管理和自修復(fù)。相反,多數(shù)服務(wù)器場依賴于周期心跳機(jī)制的應(yīng)用,或者依賴于在噴射器(sprayer)指派一個(gè)服務(wù)器處理輸入的請求時(shí)用“噴射器(sprayer)”監(jiān)視服務(wù)器場中服務(wù)器的可用狀態(tài)。
發(fā)明內(nèi)容
本發(fā)明是服務(wù)器場中服務(wù)器故障診斷和自修復(fù)的方法、系統(tǒng)和設(shè)備。具體地說,本發(fā)明能夠?qū)崿F(xiàn)服務(wù)器場的自主配置。根據(jù)本發(fā)明的結(jié)構(gòu)配置的自主服務(wù)器場可包括能夠響應(yīng)從位于服務(wù)器場之外的客戶機(jī)接收的請求的許多服務(wù)器。資源導(dǎo)向器比如IP噴射器或網(wǎng)絡(luò)調(diào)度程序可被配置成根據(jù)諸如隨機(jī)選擇法、循環(huán)選擇法和最近最少使用法之類的資源分配算法,把請求發(fā)送給選定的一些服務(wù)器。重要的是,和其故障診斷及自修復(fù)的管理完全依賴于資源導(dǎo)向器的能力的常規(guī)服務(wù)器場不同,本發(fā)明中,客戶機(jī)輔助故障檢測邏輯部分可與資源導(dǎo)向器耦接,以便提供故障診斷和自修復(fù)的客戶機(jī)輔助管理。
服務(wù)器場中服務(wù)器故障診斷和自修復(fù)的方法可包括在客戶機(jī)試圖參加與服務(wù)器場中的指定服務(wù)器的通信請求/響應(yīng)對話時(shí),從客戶機(jī)接收重試請求??筛鶕?jù)重試請求確定指定服務(wù)器中故障的出現(xiàn)。因此,可指定服務(wù)器場中的一個(gè)不同服務(wù)器處理重試請求。重要的是,也可執(zhí)行補(bǔ)救指定服務(wù)器中的故障的操作。
在本發(fā)明的一個(gè)方面,確定步驟可包括把表示指定服務(wù)器中出現(xiàn)故障的指示設(shè)置在與重試請求相關(guān)的請求串中?;蛘?,確定步驟可包括把表示指定服務(wù)器中出現(xiàn)故障的指示設(shè)置在與重試請求相關(guān)的cookie中。最后,執(zhí)行步驟可包括執(zhí)行從下列操作中選擇的至少一個(gè)補(bǔ)救操作、初始服務(wù)器再循環(huán)(回收),重新啟動(dòng)初始服務(wù)器中的某一設(shè)備,以及重新啟動(dòng)初始服務(wù)器中的某一應(yīng)用程序。可選地,執(zhí)行步驟可包括把故障通知給管理節(jié)點(diǎn)。
附圖中表示了目前的優(yōu)選實(shí)施例,但是,本發(fā)明并不局限于附圖中所示的具體結(jié)構(gòu)和手段,其中圖1是根據(jù)本發(fā)明的方案,為客戶機(jī)輔助診斷和自我修復(fù)而配置的服務(wù)器場的方框圖;圖2是圖解說明服務(wù)器場中客戶機(jī)輔助診斷和自修復(fù)過程的時(shí)序圖。
具體實(shí)施例方式
本發(fā)明是服務(wù)器場中客戶機(jī)輔助診斷和自修復(fù)的一種方法、系統(tǒng)和設(shè)備。具體地說,根據(jù)本發(fā)明的安排,單個(gè)客戶計(jì)算裝置能夠向服務(wù)器場中的一個(gè)或多個(gè)服務(wù)器請求服務(wù),包括數(shù)據(jù)。對于從各個(gè)客戶計(jì)算裝置接收的每個(gè)請求,網(wǎng)絡(luò)調(diào)度程序,例如噴射器(sprayer)可把請求發(fā)送給服務(wù)器場中的可用服務(wù)器,從而,請求客戶機(jī)和指定的服務(wù)器可建立通信對話。
在指定的服務(wù)器不能在通信對話期間應(yīng)答請求客戶機(jī)的情況下,請求客戶機(jī)可隨同表示指定的服務(wù)器不能應(yīng)答請求的指示一起,重試所述請求。所述指示可包括,例如直接提及失敗服務(wù)器,或者網(wǎng)絡(luò)調(diào)度程序可據(jù)其解析失敗服務(wù)器的身份的關(guān)聯(lián)子。當(dāng)收到重試時(shí),網(wǎng)絡(luò)調(diào)度程序可再次把所述請求發(fā)送給服務(wù)器場中的另一服務(wù)器。另外,網(wǎng)絡(luò)調(diào)度程序可在失敗服務(wù)器中采取補(bǔ)救措施,例如使該服務(wù)器再循環(huán)(回收)(recycling),重新啟動(dòng)該服務(wù)器中的特定應(yīng)用程序或過程,以及通知服務(wù)器場管理員(管理器)。
這樣,與服務(wù)器場中的服務(wù)器交互作用的客戶計(jì)算裝置能夠以先前利用在網(wǎng)絡(luò)調(diào)度程序內(nèi)實(shí)現(xiàn)的診斷工具不能實(shí)現(xiàn)的粒度(granularity),監(jiān)視服務(wù)器場中服務(wù)器的響應(yīng)性。即,雖然網(wǎng)絡(luò)調(diào)度程序獨(dú)自只能監(jiān)視把初始請求發(fā)送給服務(wù)器場中的特定服務(wù)器時(shí)的通信對話的成功,但是在本發(fā)明中,在通信耦接的客戶機(jī)和服務(wù)器之間的每個(gè)請求的過程中,都能夠監(jiān)視通信對話的成功。從而,本發(fā)明的應(yīng)用能夠簡化服務(wù)器場中的自主計(jì)算結(jié)構(gòu)。
圖1是根據(jù)本發(fā)明的方案,為客戶機(jī)輔助診斷和自修復(fù)配置的服務(wù)器場的方框圖。服務(wù)器場120可包括一個(gè)或多個(gè)服務(wù)器150,每個(gè)服務(wù)器150上駐留一個(gè)或多個(gè)計(jì)算程序170以及相關(guān)數(shù)據(jù)180。網(wǎng)絡(luò)調(diào)度程序140可被配置成通過計(jì)算機(jī)通信網(wǎng)絡(luò)130,接收來自一個(gè)或多個(gè)客戶機(jī)110的輸入請求。網(wǎng)絡(luò)調(diào)度程序140可根據(jù)眾所周知的諸如循環(huán)法,或者隨機(jī)服務(wù)器選擇法之類的負(fù)載均衡算法,把這樣的輸入請求發(fā)送給服務(wù)器150中的選定服務(wù)器。可選地,可設(shè)置管理節(jié)點(diǎn)160,通過所述管理節(jié)點(diǎn)160,能夠管理服務(wù)器場120的配置。
操作中,可在單個(gè)客戶機(jī)110和服務(wù)器場120中的一個(gè)服務(wù)器150之間建立通信對話。具體地說,當(dāng)從單個(gè)客戶機(jī)110收到初始請求時(shí),網(wǎng)絡(luò)調(diào)度程序,例如前端IP噴射器、資源導(dǎo)向器或者其它這樣的網(wǎng)絡(luò)設(shè)備,能夠根據(jù)任意負(fù)載均衡或者其它服務(wù)器選擇算法,例如隨機(jī)選擇法、最近最少使用算法,或者循環(huán)選擇法,把初始請求發(fā)送給在服務(wù)器場120中選擇的一個(gè)服務(wù)器150。根據(jù)對所述選定的一個(gè)服務(wù)器150的分配,可在客戶機(jī)110和所選定的服務(wù)器150之間建立通信對話,在此期間,可在客戶機(jī)110和選定的服務(wù)器150之間,保持對話親合性(affinity)。
在客戶機(jī)110和所選定的服務(wù)器150的通信耦接過程中,可發(fā)生請求/響應(yīng)事務(wù)。一般地,在所選定的服務(wù)器150能夠以恰當(dāng)?shù)姆绞綉?yīng)答來自客戶機(jī)110的請求的情況下,能夠保持對話親合性。但是,在所選擇的服務(wù)器150不能應(yīng)答請求190A的情況下,甚至在建立對話的初始請求期間發(fā)生故障的情況下,客戶機(jī)110也能夠嘗試重試190B。重要的是,隨同重試請求190B一起,客戶機(jī)110能夠?qū)⒃撨x定服務(wù)器150標(biāo)識(shí)為未能應(yīng)答請求190A。具體地說,所選服務(wù)器150的身份可以cookie(甜點(diǎn)數(shù)據(jù)塊)的形式被包含或者被包含在重試請求串內(nèi)。
在任何情況下,當(dāng)檢測到重試請求190B時(shí),網(wǎng)絡(luò)調(diào)度程序140可指定服務(wù)器150中的一個(gè)新服務(wù)器來響應(yīng)所述重試請求190B。更重要的是,服務(wù)器150中的所述一個(gè)新服務(wù)器能夠在服務(wù)器150中的所述選定服務(wù)器中采取補(bǔ)救措施?;蛘撸蛇x地,附屬的診斷程序(或者位于和網(wǎng)絡(luò)調(diào)度程序140相同的節(jié)點(diǎn)中,或者位于另一節(jié)點(diǎn)之內(nèi))可采取補(bǔ)救措施。這種補(bǔ)救措施可包括,例如,所選定的服務(wù)器150的再循環(huán)(回收),所選定的服務(wù)器150中特定應(yīng)用程序或過程的重新啟動(dòng),以及通知管理節(jié)點(diǎn)160。
重要的是,本發(fā)明既不嚴(yán)格局限于在有超時(shí)條件開始時(shí)響應(yīng)失敗的報(bào)告,也不嚴(yán)格局限于僅僅根據(jù)服務(wù)器中的某一超時(shí)條件,確定已發(fā)生故障。相反,就識(shí)別服務(wù)器中的某一故障而論,在確定已發(fā)生故障之前,請求方客戶機(jī)可多次重新嘗試該主題(subject)請求。此外,通過檢查有缺陷的響應(yīng),客戶機(jī)可宣稱已發(fā)生故障,所述有缺陷的響應(yīng)可以不同的方式指示服務(wù)器中的故障,例如HTTP 4xx通知。
更具體地說,網(wǎng)絡(luò)調(diào)度程序140能夠處理多類服務(wù)器故障。例如,網(wǎng)絡(luò)調(diào)度程序140能夠處理客戶機(jī)110發(fā)送的請求190A未到達(dá)指定服務(wù)器150的情況。另外,網(wǎng)絡(luò)調(diào)度程序140能夠處理指定服務(wù)器150未能產(chǎn)生結(jié)果的情況。網(wǎng)絡(luò)調(diào)度程序140還能夠處理雖然指定服務(wù)器150產(chǎn)生了結(jié)果,但是結(jié)果未到達(dá)客戶機(jī)110的情況??傊?,對本領(lǐng)域的技術(shù)人員來說,網(wǎng)絡(luò)調(diào)度程序140顯然能夠處理由于不能完成客戶機(jī)110和指定服務(wù)器150之間的請求/響應(yīng)事務(wù)而產(chǎn)生的所有故障狀態(tài)。
圖2是圖解說明服務(wù)器場中客戶機(jī)輔助診斷和自修復(fù)的過程的時(shí)序圖。開始于步驟1,客戶機(jī)可把請求轉(zhuǎn)發(fā)給噴射器。噴射器可在步驟2中把所述請求發(fā)送給服務(wù)器場中的初始指定服務(wù)器。如果該初始指定服務(wù)器在一次或多次嘗試之后不能應(yīng)答,或者服務(wù)器以一出錯(cuò)通知作為回答,或者可從響應(yīng)檢測到故障,則在步驟3中,客戶機(jī)可嘗試重試,所述重試可包括表示初始指定服務(wù)器未能應(yīng)答請求的指示。
在步驟4中,認(rèn)識(shí)到需要在服務(wù)器場中指定新服務(wù)器以處理客戶機(jī)的請求,噴射器或者診斷程序(可選)可在服務(wù)器場中指定下一服務(wù)器來處理來自客戶機(jī)的后續(xù)請求,包括所述重試請求。特別地,可根據(jù)任意資源管理或負(fù)載均衡算法,例如循環(huán)選擇法、隨機(jī)選擇法或者最近最少使用法,指定下一服務(wù)器。在任何情況下,在步驟5中,在已確定初始指定的服務(wù)器中的故障的情況下,噴射器或者診斷程序(視情況而定)可進(jìn)一步診斷所述初始指定服務(wù)器的狀態(tài)。
重要的是,噴射器或者診斷程序能夠利用數(shù)種方法識(shí)別不同類別的服務(wù)器故障,每種方法的應(yīng)用取決于錯(cuò)誤的類別。例如,在服務(wù)器未能應(yīng)答請求,或者響應(yīng)沒有被客戶機(jī)接收的情況下,可使用諸如強(qiáng)制回應(yīng)(ping)和尋跡路由程序(trace route)之類傳統(tǒng)IP工具來診斷服務(wù)器故障。作為比較,在服務(wù)器收到請求,但是沒有產(chǎn)生結(jié)果的情況下,診斷程序可向被懷疑的服務(wù)器注入診斷事務(wù),或者診斷請求程序可請求客戶機(jī)把診斷事務(wù)注入被懷疑的服務(wù)器中。隨后,診斷程序可監(jiān)視結(jié)果。
在噴射器或者可選的診斷程序能夠明確識(shí)別故障的情況下,噴射器可采取補(bǔ)救措施,例如再循環(huán)(回收)該初始指定服務(wù)器,或者重新啟動(dòng)該初始指定服務(wù)器中的某一應(yīng)用程序或過程。另外,噴射器可把檢測到的故障通知服務(wù)器場的管理員(管理器)。最后,在步驟6中,假定下一服務(wù)器沒有失敗,那么服務(wù)器場中的下一服務(wù)器可應(yīng)答客戶機(jī)的重試請求以及客戶機(jī)發(fā)出的后續(xù)請求。
可用硬件、軟件或者硬件和軟件的組合實(shí)現(xiàn)本發(fā)明??梢约蟹绞皆谝粋€(gè)計(jì)算機(jī)系統(tǒng)中實(shí)現(xiàn)本發(fā)明的方法和系統(tǒng),或者以其中在數(shù)個(gè)互連的計(jì)算機(jī)系統(tǒng)間分布不同元件的分布式方法實(shí)現(xiàn)本發(fā)明的方法和系統(tǒng)。任意種類的計(jì)算機(jī)系統(tǒng),或者適合于實(shí)現(xiàn)這里描述的方法的其它設(shè)備都適合于實(shí)現(xiàn)這里描述的功能。
硬件和軟件的典型組合可以是具有計(jì)算機(jī)程序的通用計(jì)算機(jī)系統(tǒng),所述計(jì)算機(jī)程序當(dāng)被載入并執(zhí)行時(shí),控制所述計(jì)算機(jī)系統(tǒng),使得所述計(jì)算機(jī)系統(tǒng)實(shí)現(xiàn)這里描述的方法。本發(fā)明還可嵌入計(jì)算機(jī)程序產(chǎn)品中,所述計(jì)算機(jī)程序產(chǎn)品包括能夠?qū)崿F(xiàn)這里描述的方法的所有特征,并且當(dāng)被載入計(jì)算機(jī)系統(tǒng)時(shí),能夠執(zhí)行這些方法。
本語境中的計(jì)算機(jī)程序或應(yīng)用程序意指以任意語言、代碼或符號(hào)表示的,用于使具有信息處理能力的系統(tǒng)直接地或者在下述兩者之一或兩者之后,執(zhí)行特定功能的一組指令的表達(dá)a)轉(zhuǎn)換成另一語言、代碼或符號(hào);b)以不同的材料形式復(fù)制。重要的是,在不脫離本發(fā)明的精神或本質(zhì)屬性的情況下,可以其它具體形式具體體現(xiàn)本發(fā)明,因此,本發(fā)明的范圍應(yīng)參考下述權(quán)利要求,而不是參考在前的說明書。
權(quán)利要求
1.服務(wù)器場中服務(wù)器故障診斷和自修復(fù)的方法,包括下述步驟從試圖參加與服務(wù)器場中的指定服務(wù)器的通信請求/響應(yīng)對話的客戶機(jī)接收重試請求;根據(jù)所述重試請求,確定所述指定服務(wù)器中故障的出現(xiàn);和執(zhí)行補(bǔ)救所述指定服務(wù)器中的所述故障的操作。
2.按照權(quán)利要求1所述的方法,還包括響應(yīng)于根據(jù)所述重試請求對所述指定服務(wù)器中故障的出現(xiàn)的確定,指定服務(wù)器場中的一個(gè)不同服務(wù)器處理所述重試請求。
3.按照權(quán)利要求1所述的方法,其中所述確定步驟包括把表示在所述指定服務(wù)器中出現(xiàn)所述故障的指示設(shè)置在與所述重試請求相關(guān)的請求串中的步驟。
4.按照權(quán)利要求1所述的方法,其中所述確定步驟包括把表示在所述指定服務(wù)器中出現(xiàn)所述故障的指示設(shè)置在與所述重試請求相關(guān)的甜點(diǎn)數(shù)據(jù)塊中的步驟。
5.按照權(quán)利要求1所述的方法,其中所述執(zhí)行步驟包括執(zhí)行從下述操作中選擇的至少一個(gè)補(bǔ)救操作的步驟再循環(huán)所述初始服務(wù)器,重新啟動(dòng)所述初始服務(wù)器中的某一設(shè)備,以及重新啟動(dòng)所述初始服務(wù)器中的某一應(yīng)用程序。
6.按照權(quán)利要求1所述的方法,其中所述執(zhí)行步驟還包括把所述故障通知給管理節(jié)點(diǎn)的步驟。
7.按照權(quán)利要求1所述的方法,其中所述執(zhí)行步驟包括下述步驟診斷所述故障;和根據(jù)所述診斷執(zhí)行至少一個(gè)補(bǔ)救操作,其中所述補(bǔ)救操作選自下述操作再循環(huán)所述初始服務(wù)器,重新啟動(dòng)所述初始服務(wù)器中的某一設(shè)備,以及重新啟動(dòng)所述初始服務(wù)器中的某一應(yīng)用程序。
8.按照權(quán)利要求7所述的方法,其中所述診斷步驟包括下述步驟對所述指定服務(wù)器進(jìn)行強(qiáng)制回應(yīng)檢測;和在所述指定服務(wù)器和所述客戶機(jī)之間執(zhí)行尋跡路由程序。
9.按照權(quán)利要求7所述的方法,其中所述診斷步驟包括下述步驟把測試事務(wù)注入所述指定服務(wù)器;和監(jiān)視所述注入產(chǎn)生的結(jié)果。
10.按照權(quán)利要求9所述的方法,其中所述注入步驟包括促使所述客戶機(jī)向所述指定服務(wù)器中注入測試事務(wù)的步驟。
11.一種自主服務(wù)器場,包括能夠響應(yīng)從位于服務(wù)器場之外的客戶機(jī)接收的請求的許多服務(wù)器;配置成把所述請求發(fā)送給所述服務(wù)器中的選定服務(wù)器的資源導(dǎo)向器;和與所述資源導(dǎo)向器耦接的客戶機(jī)輔助故障檢測邏輯部分。
12.按照權(quán)利要求11所述的自主服務(wù)器場,還包括與所述資源導(dǎo)向器通信耦接,并被配置成診斷檢測所述服務(wù)器中的所述選定服務(wù)器中的故障的診斷程序。
13.一種機(jī)器可讀存儲(chǔ)器,具有保存于其上的執(zhí)行服務(wù)器場中服務(wù)器的故障診斷和自修復(fù)的計(jì)算機(jī)程序,所述計(jì)算機(jī)程序包括一組例程指令,所述一組指令當(dāng)被執(zhí)行時(shí),使機(jī)器執(zhí)行下述步驟從試圖參加與服務(wù)器場中的指定服務(wù)器的通信請求/響應(yīng)對話的客戶機(jī)接收重試請求;根據(jù)所述重試請求,確定所述指定服務(wù)器中故障的出現(xiàn);和執(zhí)行補(bǔ)救所述指定服務(wù)器中的所述故障的操作。
14.按照權(quán)利要求13所述的機(jī)器可讀存儲(chǔ)器,還包括響應(yīng)于根據(jù)所述重試請求對所述指定服務(wù)器中故障的出現(xiàn)的確定,指定服務(wù)器場中的一個(gè)不同服務(wù)器處理所述重試請求。
15.按照權(quán)利要求13所述的機(jī)器可讀存儲(chǔ)器,其中所述確定步驟包括把表示在所述指定服務(wù)器中出現(xiàn)所述故障的指示設(shè)置在與所述重試請求相關(guān)的請求串中的步驟。
16.按照權(quán)利要求13所述的機(jī)器可讀存儲(chǔ)器,其中所述確定步驟包括把表示在所述指定服務(wù)器中出現(xiàn)所述故障的指示設(shè)置在與所述重試請求相關(guān)的甜點(diǎn)數(shù)據(jù)塊中的步驟。
17.按照權(quán)利要求13所述的機(jī)器可讀存儲(chǔ)器,其中所述執(zhí)行步驟包括執(zhí)行從下述操作中選出的至少一個(gè)補(bǔ)救操作的步驟再循環(huán)所述初始服務(wù)器,重新啟動(dòng)所述初始服務(wù)器中的某一設(shè)備,以及重新啟動(dòng)所述初始服務(wù)器中的某一應(yīng)用程序。
18.按照權(quán)利要求13所述的機(jī)器可讀存儲(chǔ)器,其中所述執(zhí)行步驟還包括把所述故障通知給管理節(jié)點(diǎn)的步驟。
19.按照權(quán)利要求13所述的機(jī)器可讀存儲(chǔ)器,其中所述執(zhí)行步驟包括下述步驟診斷所述故障;和根據(jù)所述診斷執(zhí)行至少一個(gè)補(bǔ)救操作,其中所述補(bǔ)救操作選自下述操作再循環(huán)所述初始服務(wù)器,重新啟動(dòng)所述初始服務(wù)器中的某一設(shè)備,以及重新啟動(dòng)所述初始服務(wù)器中的某一應(yīng)用程序。
20.按照權(quán)利要求19所述的機(jī)器可讀存儲(chǔ)器,其中所述診斷步驟包括下述步驟對所述指定服務(wù)器進(jìn)行強(qiáng)制回應(yīng)檢測;和在所述指定服務(wù)器和所述客戶機(jī)之間執(zhí)行尋跡路由程序。
21.按照權(quán)利要求19所述的機(jī)器可讀存儲(chǔ)器,其中所述診斷步驟包括下述步驟把測試事務(wù)注入所述指定服務(wù)器;和監(jiān)視所述注入產(chǎn)生的結(jié)果。
22.按照權(quán)利要求21所述的機(jī)器可讀存儲(chǔ)器,其中所述注入步驟包括促使所述客戶機(jī)向所述指定服務(wù)器中注入測試事務(wù)的步驟。
全文摘要
自主服務(wù)器場和服務(wù)器場中的自修復(fù)方法。根據(jù)本發(fā)明的方案配置的自主服務(wù)器場可包括能夠響應(yīng)從位于服務(wù)器場之外的客戶機(jī)接收的請求的許多服務(wù)器。諸如IP噴射器或網(wǎng)絡(luò)調(diào)度程序之類的資源導(dǎo)向器可被配置成根據(jù)諸如隨機(jī)選擇法、循環(huán)選擇法和最近最少使用法之類的資源分配算法,把請求發(fā)送給所選定的服務(wù)器。重要的是,和其故障診斷及自修復(fù)的管理完全依賴于資源導(dǎo)向器的能力的常規(guī)服務(wù)器場不同,本發(fā)明中,客戶機(jī)輔助故障檢測邏輯部分可與資源導(dǎo)向器耦接,以便提供故障診斷和自修復(fù)的客戶機(jī)輔助管理。
文檔編號(hào)H04L29/08GK1492348SQ0315810
公開日2004年4月28日 申請日期2003年9月3日 優(yōu)先權(quán)日2002年9月18日
發(fā)明者戴維·L·凱明斯基, 戴維 L 凱明斯基, M. 奧格爾, 戴維·M.·奧格爾 申請人:國際商業(yè)機(jī)器公司