專利名稱:計(jì)算機(jī)系統(tǒng)中自適應(yīng)的問(wèn)題確定和恢復(fù)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明一般地涉及改進(jìn)的數(shù)據(jù)處理系統(tǒng),并且更具體地,涉及用于管理硬件和軟件組件的方法和裝置。更加具體地,本發(fā)明提供了一種用于自動(dòng)地識(shí)別、追蹤、診斷硬件和軟件組件中的問(wèn)題和從硬件和軟件組件中的問(wèn)題中恢復(fù)以便達(dá)到功能要求的方法和裝置。
背景技術(shù):
現(xiàn)代計(jì)算技術(shù)導(dǎo)致了非常復(fù)雜和不斷變化的環(huán)境。一個(gè)這種環(huán)境是Internet,它也被稱為“互連網(wǎng)絡(luò)”。Internet是一組計(jì)算機(jī)網(wǎng)絡(luò),這些計(jì)算機(jī)網(wǎng)絡(luò)可能是不同的,并且被用網(wǎng)關(guān)連接在一起,網(wǎng)關(guān)處理數(shù)據(jù)傳輸和從發(fā)送網(wǎng)絡(luò)的協(xié)議到接收網(wǎng)絡(luò)使用的協(xié)議的消息轉(zhuǎn)換。當(dāng)被大寫(xiě)時(shí),術(shù)語(yǔ)“Internet”指使用TCP/IP協(xié)議組的網(wǎng)絡(luò)和網(wǎng)關(guān)的集合。當(dāng)前,最常用的在Internet上傳輸數(shù)據(jù)的方法是采用萬(wàn)維網(wǎng)(WorldWide Web)環(huán)境,萬(wàn)維網(wǎng)也被簡(jiǎn)稱為“Web”。還存在其它的用于傳輸信息的Internet資源,諸如文件傳輸協(xié)議(FTP)和Gopher,但是它們都沒(méi)有達(dá)到Web的流行程度。在Web環(huán)境中,服務(wù)器和客戶機(jī)使用超文本傳輸協(xié)議(HTTP)實(shí)現(xiàn)數(shù)據(jù)處理,HTTP是一種用于處理各種數(shù)據(jù)文件(例如,靜態(tài)圖形圖像、音頻、運(yùn)動(dòng)視頻等)的傳輸?shù)囊阎膮f(xié)議。各種數(shù)據(jù)文件中的信息被編排格式以便通過(guò)標(biāo)準(zhǔn)的頁(yè)面描述語(yǔ)言,超文本標(biāo)記語(yǔ)言(HTML),呈現(xiàn)給用戶。Internet還被廣泛地用于將應(yīng)用傳輸給使用瀏覽器的用戶。用戶時(shí)??梢酝ㄟ^(guò)Internet搜索并獲得軟件包。
雖然計(jì)算機(jī)技術(shù)已經(jīng)變得更加強(qiáng)大,但是計(jì)算機(jī)技術(shù)也變得更加復(fù)雜。隨著計(jì)算機(jī)系統(tǒng)的復(fù)雜性和異質(zhì)性繼續(xù)增加,診斷和糾正硬件和軟件問(wèn)題變得越來(lái)越困難。由于計(jì)算機(jī)系統(tǒng)變得更加自治(即,自我調(diào)節(jié)),出于多個(gè)原因這個(gè)挑戰(zhàn)將變得更加嚴(yán)重。首先,自我配置的自治計(jì)算系統(tǒng)將趨向于繞過(guò)這些問(wèn)題而工作,使得識(shí)別出現(xiàn)了錯(cuò)誤是困難的。第二,由于自治系統(tǒng)中的元件之間的更加短暫的關(guān)系,問(wèn)題將變得更難追蹤到它們的來(lái)源。換言之,共同參予故障的一組元件在該問(wèn)題被注意到時(shí)可能不再彼此連接,這使得重現(xiàn)該問(wèn)題是非常困難的。例如,許多出版物都提出了問(wèn)題識(shí)別主題,但是是在靜態(tài)配置的系統(tǒng)內(nèi)執(zhí)行的,諸如Tang,D;Iyer,R.K,“Analysis and modeling ofcorrelated failures in multicomputer systems,”IEEE Transactions onComputers,Vol.41 Issue 5,May 1992,pp.567-577;Lee,I.;Iyer,R.K.;Tang,D.,“Error/failure analysis using event logs from fault tolerantsystems,”Digest of Papers.,Twenty-First International Symposium onFault-Tolerant Computing(FTCS-21),1991,pp.10-17;以及Thottan,M.;Chuanyi Ji,“Proactive anomaly detection using distributedintelligent agents,”IEEE Network,Vol.12 Issue 5,Sept.-Oct.1998,pp.21-27。
當(dāng)前,人類技術(shù)支持人員或系統(tǒng)管理員手工地執(zhí)行大部分與識(shí)別、診斷和修復(fù)硬件或軟件問(wèn)題相關(guān)聯(lián)的任務(wù),通常采用大量的試錯(cuò)(trial and error),并且依靠他們自己的記憶或識(shí)別類似的行為模式的能力。這是一個(gè)費(fèi)力的過(guò)程,并且由于系統(tǒng)復(fù)雜性的增加,漸漸地只有很少的系統(tǒng)管理員可以勝任地完成這種工作。因此,存在著對(duì)自動(dòng)進(jìn)行自治系統(tǒng)內(nèi)的問(wèn)題識(shí)別、追蹤、診斷和修復(fù)技術(shù)的需要。
發(fā)明內(nèi)容
本發(fā)明涉及用于識(shí)別、追蹤、診斷和修復(fù)自治計(jì)算系統(tǒng)中的問(wèn)題的方法、計(jì)算機(jī)程序產(chǎn)品和數(shù)據(jù)處理系統(tǒng)。使用自適應(yīng)推理和活動(dòng)系統(tǒng)制定在數(shù)據(jù)記錄、診斷故障(或故障的跡象)和處理故障(或故障的跡象)中所遵從的規(guī)則和活動(dòng)過(guò)程。自適應(yīng)推理和活動(dòng)系統(tǒng)包括用于沖突解決的技術(shù),所述的用于沖突解決的技術(shù)基于特定于環(huán)境的信息、積累的具有時(shí)間敏感性的數(shù)據(jù)、采取的活動(dòng)和這些活動(dòng)的效果產(chǎn)生規(guī)則、為規(guī)則分配優(yōu)先級(jí)、修改規(guī)則和刪除規(guī)則。因此,本發(fā)明使得動(dòng)態(tài)的自治計(jì)算系統(tǒng)即使面對(duì)系統(tǒng)配置中的改變也可以制定其自己的用于自我管理的策略。
在所附的權(quán)利要求中提出了被認(rèn)為是本發(fā)明的特征的新特征。然而,通過(guò)結(jié)合附圖進(jìn)行閱讀,參考下面對(duì)示例實(shí)施例的詳細(xì)說(shuō)明,將會(huì)更好地理解本發(fā)明本身以及其使用的優(yōu)選模式、其它目的和優(yōu)點(diǎn),其中圖1是聯(lián)網(wǎng)的數(shù)據(jù)處理系統(tǒng)的圖,本發(fā)明可以被實(shí)現(xiàn)在該聯(lián)網(wǎng)的數(shù)據(jù)處理系統(tǒng)內(nèi);圖2是圖1的聯(lián)網(wǎng)的數(shù)據(jù)處理系統(tǒng)內(nèi)的服務(wù)器系統(tǒng)的方框圖;圖3是圖1的聯(lián)網(wǎng)的數(shù)據(jù)處理系統(tǒng)內(nèi)的客戶機(jī)系統(tǒng)的方框圖;圖4是根據(jù)本發(fā)明的優(yōu)選實(shí)施例的自治元件的圖;圖5是根據(jù)本發(fā)明的優(yōu)選實(shí)施例的用于在自治元件之間建立服務(wù)提供關(guān)系的機(jī)制的圖;
圖6是根據(jù)本發(fā)明的優(yōu)選實(shí)施例的問(wèn)題檢測(cè)和糾正系統(tǒng)的整體視圖;以及圖7是根據(jù)本發(fā)明的優(yōu)選實(shí)施例的問(wèn)題檢測(cè)和糾正系統(tǒng)的詳細(xì)視圖。
具體實(shí)施例方式
現(xiàn)在參考附圖,圖1給出了本發(fā)明可以被實(shí)現(xiàn)在其內(nèi)的數(shù)據(jù)處理系統(tǒng)的網(wǎng)絡(luò)的圖形表示。網(wǎng)絡(luò)數(shù)據(jù)處理系統(tǒng)100是本發(fā)明可以被實(shí)現(xiàn)在其內(nèi)的計(jì)算機(jī)網(wǎng)絡(luò)。網(wǎng)絡(luò)數(shù)據(jù)處理系統(tǒng)100包括網(wǎng)絡(luò)102,網(wǎng)絡(luò)102是用于在網(wǎng)絡(luò)數(shù)據(jù)處理系統(tǒng)100內(nèi)被連接在一起的各種設(shè)備和計(jì)算機(jī)之間提供通信鏈路的介質(zhì)。網(wǎng)絡(luò)102可以包括連接,諸如有線、無(wú)線通信鏈路或光纜。
在給出的例子中,服務(wù)器104連同存儲(chǔ)單元106被連接到網(wǎng)絡(luò)102。此外,客戶機(jī)108、110和112被連接到網(wǎng)絡(luò)102。這些客戶機(jī)108、110和112可以是,例如,個(gè)人計(jì)算機(jī)或網(wǎng)絡(luò)計(jì)算機(jī)。在給出的例子中,服務(wù)器104向客戶機(jī)108-112提供數(shù)據(jù),諸如引導(dǎo)文件、操作系統(tǒng)圖像和應(yīng)用??蛻魴C(jī)108、110和112是服務(wù)器104的客戶機(jī)。網(wǎng)絡(luò)數(shù)據(jù)處理系統(tǒng)100可以包括附加的服務(wù)器、客戶機(jī)以及其它未示出的設(shè)備。在給出的例子中,網(wǎng)絡(luò)數(shù)據(jù)處理系統(tǒng)100是以網(wǎng)絡(luò)102表示世界范圍的使用傳輸控制協(xié)議/網(wǎng)際協(xié)議(TCP/IP)協(xié)議組彼此通信的網(wǎng)絡(luò)和網(wǎng)關(guān)的集合的Internet。Internet的核心是主節(jié)點(diǎn)或主計(jì)算機(jī)之間的高速數(shù)據(jù)通信線路的主干,由對(duì)數(shù)據(jù)和消息進(jìn)行路由的數(shù)以千計(jì)的商業(yè)的、政府的、教育的和其它計(jì)算機(jī)系統(tǒng)組成。當(dāng)然,網(wǎng)絡(luò)數(shù)據(jù)處理系統(tǒng)100還可以被實(shí)現(xiàn)為多個(gè)不同類型的網(wǎng)絡(luò),諸如例如,內(nèi)聯(lián)網(wǎng)、局域網(wǎng)(LAN)、或廣域網(wǎng)(WAN)。圖1旨在作為例子,并且不作為對(duì)本發(fā)明的體系結(jié)構(gòu)的限制。
參考圖2,根據(jù)本發(fā)明的優(yōu)選實(shí)施例,給出了可以被實(shí)現(xiàn)為服務(wù)器,諸如圖1中的服務(wù)器104的數(shù)據(jù)處理系統(tǒng)的方框圖。數(shù)據(jù)處理系統(tǒng)200可以是對(duì)稱多處理器(SMP)系統(tǒng),包括被連接到系統(tǒng)總線206的多個(gè)處理器202和204。可替代地,可以使用單處理器系統(tǒng)。存儲(chǔ)器控制器/高速緩存208也被連接到系統(tǒng)總線206,存儲(chǔ)器控制器/高速緩存208提供了到本地存儲(chǔ)器209的接口。I/O總線橋210被連接到系統(tǒng)總線206,并且提供到I/O總線212的接口。如圖所示,存儲(chǔ)器控制器/高速緩存208和I/O總線橋210可以被集成。
被連接到I/O總線212的外圍組件互連(PCI)總線橋214提供了到PCI局部總線216的接口。多個(gè)調(diào)制解調(diào)器可以被連接到PCI局部總線216。典型的PCI總線實(shí)現(xiàn)支持4個(gè)PCI擴(kuò)展插槽或內(nèi)插連接器。通過(guò)調(diào)制解調(diào)器218和被通過(guò)內(nèi)插板卡連接到PCI局部總線216的網(wǎng)絡(luò)適配器220可以提供圖1中的到客戶機(jī)108-112的通信鏈路。
附加的PCI總線橋222和224為附加的PCI局部總線226和228提供接口,從附加的PCI局部總線226和228可以支持附加的調(diào)制解調(diào)器或網(wǎng)絡(luò)適配器。以這種方式,數(shù)據(jù)處理系統(tǒng)200允許到多個(gè)網(wǎng)絡(luò)計(jì)算機(jī)的連接。如圖所示,存儲(chǔ)器映射圖像適配器230和硬盤(pán)232也可以或是直接地或是間接地連接到I/O總線212。
本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解,圖2中給出的硬件可以改變。例如,除了給出的硬件之外,或是替代給出的硬件,還可以使用其它的外部設(shè)備,諸如光盤(pán)驅(qū)動(dòng)器等。給出的例子并不意味著暗示關(guān)于本發(fā)明的體系結(jié)構(gòu)上的限制。
圖2中給出的數(shù)據(jù)處理系統(tǒng)可以是,例如,運(yùn)行高級(jí)交互執(zhí)行(AIX)操作系統(tǒng)或Linux操作系統(tǒng)的IBM eServer pSeries系統(tǒng),一種紐約Armonk的國(guó)際商用機(jī)器公司的產(chǎn)品。
現(xiàn)在參考圖3,給出了本發(fā)明能夠被實(shí)現(xiàn)在其內(nèi)的數(shù)據(jù)處理系統(tǒng)的方框圖。數(shù)據(jù)處理系統(tǒng)300是客戶計(jì)算機(jī)的一個(gè)例子。數(shù)據(jù)處理系統(tǒng)300采用外部組件互連(PCI)局部總線體系結(jié)構(gòu)。雖然給出的例子采用PCI總線,但是也可以使用其它的總線體系結(jié)構(gòu),諸如加速圖形端口(AGP)和工業(yè)標(biāo)準(zhǔn)體系結(jié)構(gòu)(ISA)。處理器302和主存儲(chǔ)器304通過(guò)PCI橋308連接到PCI局部總線306。PCI橋308還可以包括用于處理器302的集成的存儲(chǔ)器控制器和高速緩存存儲(chǔ)器。可以通過(guò)直接組件互連或通過(guò)內(nèi)插板卡實(shí)現(xiàn)到PCI局部總線306的附加的連接。在給出的例子中,局域網(wǎng)(LAN)適配器310、SCSI主總線適配器312和擴(kuò)展總線接口314被通過(guò)直接組件連接連接到PCI局部總線306。相反,音頻適配器316、圖形適配器318和音頻/視頻適配器319被通過(guò)插入到擴(kuò)展插槽中的內(nèi)插板卡連接到PCI局部總線306。擴(kuò)展總線接口314為鍵盤(pán)和鼠標(biāo)適配器320、調(diào)制解調(diào)器322和附加的存儲(chǔ)器324提供了連接。小型計(jì)算機(jī)系統(tǒng)接口(SCSI)主總線適配器312為硬盤(pán)驅(qū)動(dòng)器326、磁帶驅(qū)動(dòng)器328和CD-ROM驅(qū)動(dòng)器330提供了連接。典型的PCI局部總線實(shí)現(xiàn)支持3個(gè)或4個(gè)PCI擴(kuò)展插槽或內(nèi)插連接器。
一個(gè)操作系統(tǒng)運(yùn)行在處理器302上,并且被用于協(xié)調(diào)并提供對(duì)圖3中的數(shù)據(jù)處理系統(tǒng)300內(nèi)的各種組件的控制。所述的操作系統(tǒng)可以是商業(yè)上可以獲得的操作系統(tǒng),諸如可以從微軟公司獲得的WindowsXP。諸如Java的面向?qū)ο蟮木幊滔到y(tǒng)可以與所述操作系統(tǒng)一起運(yùn)行,并且提供從執(zhí)行在數(shù)據(jù)處理系統(tǒng)300上的Java程序或應(yīng)用對(duì)操作系統(tǒng)的調(diào)用?!癑ava”是Sun Microsystems公司的商標(biāo)。用于操作系統(tǒng)、面向?qū)ο蟮牟僮飨到y(tǒng)和應(yīng)用或程序的指令位于存儲(chǔ)裝置諸如硬盤(pán)驅(qū)動(dòng)器326上,并且可以被裝入主存儲(chǔ)器304以便由處理器302執(zhí)行。
本領(lǐng)域的普通技術(shù)人員將會(huì)理解,圖3中的硬件可以根據(jù)實(shí)現(xiàn)而改變。除了圖3中給出的硬件之外,或是替代圖3中給出的硬件,可以使用其它的內(nèi)部硬件或外部設(shè)備,諸如快閃只讀存儲(chǔ)器(ROM)、等價(jià)的非易失存儲(chǔ)器、或光盤(pán)驅(qū)動(dòng)器等。本發(fā)明的處理也可以應(yīng)用于多處理器數(shù)據(jù)處理系統(tǒng)。
作為另一個(gè)例子,數(shù)據(jù)處理系統(tǒng)300可以是被配置為可引導(dǎo)而不需要依賴某些類型的網(wǎng)絡(luò)通信接口的獨(dú)立的系統(tǒng)。作為另一個(gè)例子,數(shù)據(jù)處理系統(tǒng)300可以是個(gè)人數(shù)字助理(PDA)設(shè)備,它被配置有ROM和/或快閃ROM,以便提供非易失存儲(chǔ)器來(lái)存儲(chǔ)操作系統(tǒng)文件和/或用戶產(chǎn)生的數(shù)據(jù)。
圖3中給出的例子和上面所述的例子不意味著對(duì)體系結(jié)構(gòu)的限制。例如,數(shù)據(jù)處理系統(tǒng)300還可以是除了采用PDA的形式之外的筆記本計(jì)算機(jī)或是手持計(jì)算機(jī)。數(shù)據(jù)處理系統(tǒng)300還可以是信息站或Web設(shè)備。
本發(fā)明涉及用于自我管理的、自治的計(jì)算系統(tǒng)內(nèi)的問(wèn)題確定和糾正的方法和裝置。構(gòu)成這種計(jì)算系統(tǒng)的硬件和軟件組件(例如,數(shù)據(jù)庫(kù)、存儲(chǔ)系統(tǒng)、Web服務(wù)器、文件服務(wù)器等)是被稱為“自治元件”的自我管理的組件。自治元件將傳統(tǒng)的計(jì)算功能(例如,數(shù)據(jù)庫(kù))和附加的自我管理的能力聯(lián)系在一起。圖4是根據(jù)本發(fā)明的優(yōu)選實(shí)施例的自治元件的圖。根據(jù)圖4中給出的優(yōu)選實(shí)施例,自治元件400包括管理單元402和功能單元404。本領(lǐng)域的普通技術(shù)人員可以理解,因?yàn)楣芾韱卧凸δ軉卧g的劃分僅僅是概念上的,自治元件不必被如圖4那樣清楚地劃分到單獨(dú)的單元中。
管理單元402處理自治元件400的自我配置特性。具體地,管理單元402負(fù)責(zé)根據(jù)由監(jiān)視/控制接口414所指示的一組用于自治元件400的目標(biāo)調(diào)整和維護(hù)功能單元404。管理單元402還負(fù)責(zé)將對(duì)功能單元404的訪問(wèn)局限到被許可使用功能單元404的那些其它系統(tǒng)組件(例如,其它的自治元件),如訪問(wèn)控制接口416所指示的。管理單元402還負(fù)責(zé)建立并維護(hù)與其它自治元件的關(guān)系(例如,通過(guò)輸入通道406和輸出通道408)。
根據(jù)自治元件400想要的功能,功能單元404使用由其它系統(tǒng)組件提供的服務(wù)(例如,通過(guò)輸入通道410),并且給其它系統(tǒng)組件提供服務(wù)(例如,通過(guò)輸出通道412)。例如,自治數(shù)據(jù)庫(kù)元件提供數(shù)據(jù)庫(kù)服務(wù),并且自治存儲(chǔ)元件提供存儲(chǔ)服務(wù)。應(yīng)當(dāng)注意,一個(gè)自治元件,諸如自治元件400,可以是軟件組件、硬件組件或是這兩者的某種組合。自治計(jì)算的一個(gè)目標(biāo)是在抽象的功能層次上提供計(jì)算服務(wù),而不用在給定功能的底層實(shí)現(xiàn)之間進(jìn)行剛性的區(qū)分。
自治元件通過(guò)向其它元件(這些元件本身可以是自治元件)提供服務(wù)和/或從其它組件獲得服務(wù)來(lái)工作。為了使自治元件以這種方式協(xié)作,需要一種機(jī)制,通過(guò)該機(jī)制自治元件可以定位并進(jìn)入與提供所需功能的附加組件的關(guān)系。圖5是給出了根據(jù)本發(fā)明的優(yōu)選實(shí)施例所構(gòu)造的機(jī)制的圖。
“請(qǐng)求組件”500,一個(gè)自治元件,請(qǐng)求其它組件的服務(wù)以便完成它的功能。在優(yōu)選實(shí)施例中,這種功能可以用規(guī)則和目標(biāo)的策略來(lái)定義。策略服務(wù)器組件502是一個(gè)為計(jì)算系統(tǒng)內(nèi)的其它自治元件建立策略的自治元件。在圖5中,策略服務(wù)器組件502為請(qǐng)求組件500建立要遵守的規(guī)則和目標(biāo)的策略,并且將這些策略傳遞給請(qǐng)求組件500。例如,在網(wǎng)絡(luò)通信的環(huán)境中,所需要的加密保護(hù)的標(biāo)準(zhǔn)可以是被包含在策略中的規(guī)則,而所希望的服務(wù)質(zhì)量(QoS)可以是策略的目標(biāo)。
在請(qǐng)求組件500的特定的策略的推動(dòng)下,請(qǐng)求組件500從附加組件請(qǐng)求服務(wù)(例如,數(shù)據(jù)的加密)。為了獲得這種服務(wù),請(qǐng)求組件500與另一個(gè)自治元件即目錄組件504協(xié)商。目錄組件504優(yōu)選地是一種類型的數(shù)據(jù)庫(kù),它將功能請(qǐng)求映射到提供所需功能的組件。
在優(yōu)選實(shí)施例中,目錄組件504可以通過(guò)使用諸如Web服務(wù)描述語(yǔ)言(WSDL)的標(biāo)準(zhǔn)的目錄服務(wù)方案和諸如通用描述、發(fā)現(xiàn)和集成(UDDI)的系統(tǒng)提供目錄服務(wù),所述目錄服務(wù)方案和系統(tǒng)允許程序定位提供特定服務(wù)的實(shí)體,并且自動(dòng)地確定如何與那些服務(wù)通信并進(jìn)行事務(wù)處理。WSDL是由有代表性的公司,諸如國(guó)際商用機(jī)器公司、Ariba公司和微軟公司所著的并正由WorldWide Web Consortium考慮的提出標(biāo)準(zhǔn)。UDDI版本3是現(xiàn)在被用于Web服務(wù)應(yīng)用和服務(wù)的當(dāng)前規(guī)范。由結(jié)構(gòu)化信息標(biāo)準(zhǔn)促進(jìn)組織(OASIS)組織負(fù)責(zé)對(duì)UDDI的進(jìn)一步開(kāi)發(fā)和修改。
目錄組件504向請(qǐng)求組件500提供信息以便允許請(qǐng)求組件500使用所需組件506的服務(wù)。這種信息可以包括地址(諸如網(wǎng)絡(luò)地址),以便允許現(xiàn)有的組件可以與可下載代碼或可下載代碼的地址通信,從而可以提供軟件組件或任何其它適合的信息,以便允許請(qǐng)求組件500使用所需組件506的服務(wù)。
圖6是一個(gè)示意圖,它提供了根據(jù)本發(fā)明的優(yōu)選實(shí)施例的用于在自治計(jì)算系統(tǒng)內(nèi)確定問(wèn)題并恢復(fù)錯(cuò)誤的系統(tǒng)的整體視圖。自治計(jì)算系統(tǒng)包括多個(gè)自治元件600、602和604,它們是硬件和軟件組件,因?yàn)檫@些硬件和軟件組件是自我管理的,所以它們是自含的,但是它們通過(guò)使用彼此的服務(wù)以協(xié)作的方式工作。每個(gè)自治元件600、602和604保持一個(gè)事件記錄(分別為606、608和610),并且與問(wèn)題確定和錯(cuò)誤恢復(fù)系統(tǒng)612交互作用,問(wèn)題確定和錯(cuò)誤恢復(fù)系統(tǒng)612可以被包含在單獨(dú)的自治元件600、602和604內(nèi),或是可以被包含在專用于這個(gè)功能的其它自治元件或組件內(nèi)。
問(wèn)題確定和錯(cuò)誤恢復(fù)系統(tǒng)612中的邏輯模塊614指揮每個(gè)自治元件600、602和604在規(guī)定的條件下以規(guī)定的詳細(xì)程度記錄特定類型的事件。根據(jù)從自治元件獲得的事件記錄,邏輯模塊614嘗試診斷問(wèn)題(或問(wèn)題的跡象)。一旦檢測(cè)到問(wèn)題(或潛在的問(wèn)題),邏輯模塊向自治元件建議活動(dòng)過(guò)程以便從問(wèn)題中恢復(fù)。對(duì)可用的元件的類型、事件、問(wèn)題和活動(dòng)的詳細(xì)說(shuō)明被存儲(chǔ)在與邏輯模塊614相關(guān)聯(lián)的數(shù)據(jù)庫(kù)616中。
因此就對(duì)事件的記錄而言,可以說(shuō)邏輯模塊614建立了策略,自治元件600、602和604按照該策略記錄事件。事件可以包括由任意的自治元件600、602和604所采取的活動(dòng)、由自治元件600、602和604接收的輸入、或自治元件600、602和604可以觀察到的其它事件。應(yīng)當(dāng)理解,事件記錄606、608、610還可以分別包括600、602、604中的各種系統(tǒng)配置、負(fù)載特性和性能測(cè)量。雖然在優(yōu)選實(shí)施例中,可以使用結(jié)構(gòu)化的、機(jī)器可讀所格式,諸如XML,事件記錄606、608、610可以任意適合的數(shù)據(jù)格式被書(shū)寫(xiě)。可替代地,事件記錄606、608和610可以任意的數(shù)據(jù)庫(kù)或數(shù)據(jù)存儲(chǔ)格式被表示,諸如關(guān)系數(shù)據(jù)庫(kù)、面向?qū)ο蟮臄?shù)據(jù)庫(kù)、與對(duì)象相關(guān)的數(shù)據(jù)庫(kù)、演繹數(shù)據(jù)庫(kù)或任意其他合適的存儲(chǔ)格式。典型地,存儲(chǔ)在事件記錄606、608、610中的信息將識(shí)別出事件的特定的出現(xiàn)、它們出現(xiàn)的時(shí)間和可用于該事件的解釋的任何參數(shù)或其它數(shù)據(jù)。應(yīng)當(dāng)理解,事件記錄606、608、610還可以分別包括各種系統(tǒng)配置、負(fù)載特性、以及600、602、604中的性能測(cè)量。本領(lǐng)域的普通技術(shù)人員將會(huì)認(rèn)識(shí)到,許多關(guān)于計(jì)算系統(tǒng)內(nèi)的事件的信息項(xiàng)目可以被存儲(chǔ)在事件記錄606、608、610中而不脫離本發(fā)明的范圍和精神。此外,任何數(shù)目的自治元件,包括硬件組件、軟件組件或這兩者可以被使用。
在本發(fā)明的優(yōu)選實(shí)施例中,如圖7所示,邏輯模塊614被劃分為三個(gè)單獨(dú)的邏輯模塊、即記錄邏輯模塊704、問(wèn)題確定邏輯模塊710和錯(cuò)誤恢復(fù)邏輯模塊715。這些邏輯模塊的每一個(gè)包括推理引擎(未示出),所述推理引擎在觀察到的數(shù)據(jù)上施加一組規(guī)則以便做出它們的判定,所述規(guī)則包括下面的形式IF<Condition(s)>THEN<Action(s)>
或WHILE<Condition(s)>DO<Action(s)>
因此,每個(gè)記錄邏輯模塊704、問(wèn)題確定邏輯模塊710和錯(cuò)誤恢復(fù)邏輯模塊715可以被想象成一種具有推理引擎的專家系統(tǒng),它使用邏輯推理規(guī)則的知識(shí)庫(kù)分別做出關(guān)于數(shù)據(jù)記錄、問(wèn)題診斷和從錯(cuò)誤中恢復(fù)的決定。在構(gòu)成每個(gè)知識(shí)庫(kù)的規(guī)則中,條件子句(例如,如果“X”則“Y”中的“X”)可以包括變量,并且可以如同“元件X是類型T1的”這樣簡(jiǎn)單,或是可以是復(fù)雜的,涉及到統(tǒng)計(jì)、機(jī)器學(xué)習(xí)或人工智能技術(shù)。定義條件子句的統(tǒng)計(jì)技術(shù)的例子可以包括(但是不限于)學(xué)生T試驗(yàn)、相關(guān)性分析或回歸分析的應(yīng)用。定義條件子句的機(jī)器學(xué)習(xí)和人工智能技術(shù)的例子可以包括(但是不限于)諸如神經(jīng)網(wǎng)絡(luò)、貝葉斯網(wǎng)絡(luò)或支持向量機(jī)的監(jiān)督學(xué)習(xí)方法,或是諸如K-means聚類、分層聚類或主成分分析的非監(jiān)督學(xué)習(xí)方法。
以類似的方式,活動(dòng)子句可以包括變量,并且可以象“在元件X中記錄E1類型的事件”?;顒?dòng)還可以涉及給元件委派復(fù)雜的任務(wù),諸如“將元件X中的負(fù)載減少10%”,其中如何減少負(fù)載的細(xì)節(jié)由自治元件X確定。此外,活動(dòng)可以包括創(chuàng)建、修改或刪除所述三個(gè)邏輯模塊內(nèi)的規(guī)則集中的規(guī)則。可以使用適當(dāng)?shù)臋C(jī)器學(xué)習(xí)技術(shù)完成這個(gè)規(guī)則學(xué)習(xí)過(guò)程,包括本文前面所列舉的那些技術(shù)。例如,當(dāng)發(fā)現(xiàn)了新的診斷之后,活動(dòng)子句可以規(guī)定“在問(wèn)題確定邏輯模塊中增加一個(gè)新的規(guī)則R,其中RIF如果類型E5和E6的事件同時(shí)出現(xiàn)在類型為T(mén)1的元件中THEN發(fā)生了P9類型的問(wèn)題。”對(duì)可用(或已知的)元件的類型、事件、已知問(wèn)題、條件和活動(dòng)的詳細(xì)說(shuō)明全部分別存儲(chǔ)在與每個(gè)邏輯模塊704、710和715相關(guān)聯(lián)的數(shù)據(jù)庫(kù)705、711、716中。機(jī)器和人兩者都可以更新這些數(shù)據(jù)庫(kù)(例如,引入了新的元件種類)。
從上面的說(shuō)明中應(yīng)當(dāng)注意到,本發(fā)明的優(yōu)選實(shí)施例考慮到包含在三個(gè)邏輯模塊704、710和715中的規(guī)則集中的至少兩個(gè)層次的自適應(yīng)。首先,條件子句中存在自適應(yīng),所述的條件子句處在具有從過(guò)去的經(jīng)驗(yàn)或例子中學(xué)習(xí)的能力的算法的控制下。例如,經(jīng)過(guò)一段時(shí)間,神經(jīng)網(wǎng)絡(luò)可以通過(guò)修改其網(wǎng)絡(luò)中的權(quán)重,學(xué)習(xí)以不斷提高的準(zhǔn)確性診斷特定的問(wèn)題。因此,條件子句將獲得對(duì)診斷該問(wèn)題的提高的特異性。
因?yàn)楸景l(fā)明允許基于規(guī)則本身建議的活動(dòng)的效果,產(chǎn)生邏輯模塊內(nèi)的規(guī)則集中的規(guī)則、為所述規(guī)則分配優(yōu)先級(jí)、修改所述規(guī)則、刪除所述規(guī)則,所以一種更重要的自適應(yīng)類型是可能的。首先,可以使用機(jī)器學(xué)習(xí)方法,諸如歸納邏輯編程,從存在的規(guī)則集中推斷新的規(guī)則。歸納邏輯編程的例子包括描述于在此引入作為參考的Quinlan,J.R.,Cameron-Jones,R.M.,“Induction of Logic ProgramsFOIL andRelated Systems,”New Generation Computing 13(1995),pp.287-312的FOIL,或是描述于在此引入作為參考的Muggleton,S.,F(xiàn)eng,C.,“Efficient Induction of Logic Programs,”inProceedings of the 1st Conference on Algorithmic Learning Theory,Ohmsha,Tokyo,1990的GOLEM算法。此外,新的和舊的規(guī)則在解決和防止問(wèn)題方面的效果被由問(wèn)題確定和錯(cuò)誤恢復(fù)系統(tǒng)700以及其人類操作員監(jiān)視,并且該結(jié)果被用于對(duì)規(guī)則集中規(guī)則重新分配優(yōu)先級(jí)、修改或刪除規(guī)則集中規(guī)則。這些更改可能引起通過(guò)對(duì)歸納邏輯編程的應(yīng)用進(jìn)一步創(chuàng)建新的規(guī)則。因此,通過(guò)邏輯模塊內(nèi)的推理引擎的自動(dòng)應(yīng)用,以及通過(guò)直接的人工干涉,將顯現(xiàn)出邏輯模塊內(nèi)的規(guī)則集的自適應(yīng)性。
圖7提供了本發(fā)明的優(yōu)選實(shí)施例如何可以成功地自動(dòng)確定問(wèn)題,并且成功地從不同自治元件給出的錯(cuò)誤事件登記中恢復(fù)的詳細(xì)的例子。
圖7示出了三個(gè)自治元件701、702、703。記錄邏輯模塊704可以咨詢存儲(chǔ)在它的事實(shí)和條件數(shù)據(jù)庫(kù)705中的上面三個(gè)自治元件的配置和特性以便確定管理由每個(gè)元件記錄的信息的規(guī)則(包括if-then規(guī)則)。例如,記錄邏輯模塊704可以包括下面的記錄邏輯規(guī)則(i)r1IF元件是T1類型的THEN應(yīng)當(dāng)記錄每分鐘E1和E2類型的事件在它的系統(tǒng)內(nèi)的新出現(xiàn)的次數(shù)。
(ii)r2IF元件是T2類型的THEN應(yīng)當(dāng)報(bào)告每5分鐘其以CPU的百分比利用率表示的時(shí)間平均(time-averaged)負(fù)載,和它的以毫秒表示的時(shí)間平均的響應(yīng)時(shí)間。
(iii)r3IF元件是T3類型的THEN應(yīng)當(dāng)報(bào)告每個(gè)小時(shí)E3類型的事件。
記錄邏輯模塊704可以咨詢其數(shù)據(jù)庫(kù)705以便確定自治元件701、702和703分別是T1、T2和T3類型中的哪種元件。數(shù)據(jù)庫(kù)705還說(shuō)明了每種元件可以記錄的事件類型的細(xì)節(jié)。因此,記錄邏輯模塊704不需要知道每個(gè)自治元件實(shí)際上是如何實(shí)現(xiàn)記錄過(guò)程的細(xì)節(jié),它僅是知道某種類型的元件可以記錄特定種類的事件。在來(lái)自記錄邏輯模塊704的指揮下,元件701、702,703將如它們各自的事件記錄706、707、708中的有關(guān)的記錄邏輯規(guī)則所規(guī)定的那樣記錄事件。這些記錄被不斷地編輯到合成記錄709,并且被不斷地送到問(wèn)題確定邏輯模塊710。
問(wèn)題確定邏輯模塊710可以具有各種規(guī)則以便從合成記錄709中檢測(cè)問(wèn)題并進(jìn)行分類。例如,問(wèn)題確定邏輯模塊710可以具有如下的規(guī)則R1、R2、R3和R4R1IF類型T1的元件在任意的一分鐘的時(shí)間跨度內(nèi)沒(méi)有報(bào)告E2類型的事件THEN類型T1的元件具有P1類型的問(wèn)題,R2IF T2類型的元件報(bào)告大于600毫秒的時(shí)間平均的響應(yīng)時(shí)間THEN T2類型的元件具有P2類型的問(wèn)題。
R3IF T1類型的元件具有P1類型或P10類型的問(wèn)題,AND如果T2類型的元件具有P2類型的問(wèn)題THEN T3類型的元件可能在下5分鐘內(nèi)以80%的概率具有P3類型的問(wèn)題。
R4IF以大于50%的概率懷疑在下5分鐘內(nèi)有P3類型的問(wèn)題THEN將該診斷傳遞給錯(cuò)誤恢復(fù)邏輯模塊715。
如果問(wèn)題確定邏輯模塊710確定合成記錄709滿足規(guī)則R1和R2的條件,它將使用其知識(shí)庫(kù)(數(shù)據(jù)庫(kù)711)和它的推理引擎(未示出)以便得出結(jié)論,即,元件701具有P1類型的問(wèn)題,而元件702具有P2類型的問(wèn)題。這些結(jié)論將構(gòu)成新的事實(shí),這些新的事實(shí)一起滿足規(guī)則R3的條件,使得推理引擎進(jìn)一步得出結(jié)論,即,元件703可能以80%的概率在下5分鐘內(nèi)具有P3類型的問(wèn)題。對(duì)P3類型的問(wèn)題的概率的斷言又將觸發(fā)規(guī)則R4,將指揮問(wèn)題確定邏輯模塊710將該診斷傳遞給錯(cuò)誤恢復(fù)邏輯模塊715。還可能的是,問(wèn)題確定邏輯模塊710的數(shù)據(jù)庫(kù)711可能包含一個(gè)將被報(bào)告給錯(cuò)誤恢復(fù)邏輯模塊715以便進(jìn)一步處理的問(wèn)題類型的列表。作為另一種方法,問(wèn)題確定邏輯模塊710可以等待,直到它的推理引擎在將結(jié)果傳達(dá)給錯(cuò)誤恢復(fù)邏輯模塊715之前不再得到更多的問(wèn)題診斷時(shí)為止。
應(yīng)當(dāng)注意,用于問(wèn)題確定邏輯模塊710的數(shù)據(jù)庫(kù)711不僅包含關(guān)于自治元件類型的信息,還可以存儲(chǔ)關(guān)于元件之間的依存關(guān)系的輔助數(shù)據(jù)。問(wèn)題確定邏輯模塊710可以使用關(guān)于元件之間的依存關(guān)系的信息進(jìn)行更快更準(zhǔn)確的問(wèn)題診斷。
在收到可能出現(xiàn)了P3類型的問(wèn)題的信息之后,錯(cuò)誤恢復(fù)邏輯模塊715將在咨詢了其數(shù)據(jù)庫(kù)716并且使用它的推理引擎(未示出)之后確定活動(dòng)過(guò)程。所述的活動(dòng)過(guò)程可以被設(shè)計(jì)為防止、減少或糾正已經(jīng)出現(xiàn)的問(wèn)題或預(yù)期將出現(xiàn)的問(wèn)題。所述的適當(dāng)?shù)幕顒?dòng)過(guò)程可以被表示為包含在錯(cuò)誤恢復(fù)邏輯模塊715內(nèi)的規(guī)則。表示條件和相應(yīng)的活動(dòng)過(guò)程的if-then規(guī)則的例子如下R5IF在T3類型的元件內(nèi)以大于60%的概率在下5分鐘內(nèi)可能出現(xiàn)P3類型的問(wèn)題THEN采取活動(dòng)A1試圖將T2類型的元件的負(fù)載減少10%。
在這種情況下,元件703中的問(wèn)題的增加的可能性使得錯(cuò)誤恢復(fù)邏輯模塊715為了減少問(wèn)題P3實(shí)際發(fā)生在T3類型的元件內(nèi)的可能性為目的,在T2類型的元件內(nèi)采取前攝的活動(dòng)A1。
除了采取直接活動(dòng)糾正、減少或防止問(wèn)題的出現(xiàn)之外,錯(cuò)誤恢復(fù)邏輯模塊715可以具有其它的管理記錄信息集合的規(guī)則。例如,它可以包括這樣的If-then規(guī)則R6IF在T3類型的元件內(nèi)以大于60%的概率在下5分鐘內(nèi)可能出現(xiàn)P3類型的問(wèn)題THEN在記錄邏輯模塊704內(nèi)增加新的規(guī)則R4,其中R4T2類型的元件將報(bào)告其負(fù)載,并且T3類型的元件應(yīng)該每分鐘報(bào)告E3類型的事件,直到由錯(cuò)誤恢復(fù)邏輯模塊715進(jìn)一步通知時(shí)為止。
在這種情況下,自治元件703內(nèi)的問(wèn)題的增加的可能性最終導(dǎo)致了記錄邏輯模塊中的改變,從而元件702和703被監(jiān)視的速率增加了。
一旦采取了上面的活動(dòng),它們?cè)诜乐箚?wèn)題方面的成功(或失敗)的程度被在測(cè)量模塊718內(nèi)監(jiān)視。這個(gè)模塊存儲(chǔ)著關(guān)于由錯(cuò)誤恢復(fù)邏輯模塊建議的過(guò)去的活動(dòng)、以及自治元件隨后的行為的信息。這對(duì)在自治元件內(nèi)在其活動(dòng)和產(chǎn)生的事件之間存在相當(dāng)大的時(shí)間延遲的情況下是特別重要的。例如,測(cè)量模塊718可以確定在過(guò)去的7天內(nèi)P3類型的問(wèn)題出現(xiàn)在當(dāng)規(guī)則R5被激活并且采取活動(dòng)A1時(shí)的9個(gè)情況下的3個(gè)情況中。成功的程度確定如何修改并更新錯(cuò)誤恢復(fù)邏輯模塊715、問(wèn)題確定邏輯模塊710和記錄邏輯模塊721以及相應(yīng)的數(shù)據(jù)庫(kù)(716、711和705)內(nèi)的事實(shí)。例如,更新邏輯719內(nèi)的規(guī)則R7可以規(guī)定R7IF T3類型的元件即使在前5分鐘內(nèi)采取了活動(dòng)A1之后還經(jīng)歷了P3類型的問(wèn)題,THEN修改活動(dòng)A1,使得A1試圖以附加的10%減少T2類型的元件的負(fù)載,除非所測(cè)量到的負(fù)載小于10%。
注意錯(cuò)誤恢復(fù)邏輯模塊719、問(wèn)題確定邏輯模塊720和記錄邏輯模塊721的規(guī)則以及相應(yīng)的數(shù)據(jù)庫(kù)(705、711和716)中的事實(shí)不僅可以由機(jī)器修改,也可以由人修改。這樣先前或新的領(lǐng)域的知識(shí)可以由外部實(shí)體在任意時(shí)間結(jié)合到系統(tǒng)中,以便進(jìn)行更快的問(wèn)題檢測(cè)和錯(cuò)誤恢復(fù)。
自治計(jì)算系統(tǒng)內(nèi)的任何問(wèn)題檢測(cè)和糾正系統(tǒng)都必須應(yīng)付這樣的事實(shí),即,在自治計(jì)算系統(tǒng)內(nèi)自治元件經(jīng)常被增加、刪除和修改以便滿足改變的功能要求。因此,邏輯模塊中的推理和活動(dòng)引擎必須是自適應(yīng)的,并且可以對(duì)診斷失敗(或失敗的跡象)和處理失敗(或失敗的跡象)以其規(guī)則集中的適合的改變進(jìn)行響應(yīng)。為了支持這種自適應(yīng),本發(fā)明的優(yōu)選實(shí)施例滿足由Rouvellou,I.;DeGenaro,L.;Chan,H.;Rasmus,k.;Grosof,B.N.;Ehnebuske,D.;McGee,B.,“CombiningDifferent Business Rules TechnologiesA Rationalization,”In Proc.Ofthe OOPSLA 2000 Workshop on Best-practices in Business RuleDesign and Implementation,held Minneapolis,MN,USA,October15,2000中說(shuō)明的4個(gè)目標(biāo)(i)將邏輯模塊內(nèi)的程序上的邏輯與底層自治元件的原子細(xì)節(jié)隔離開(kāi)。例如,重新考慮由于規(guī)則R7而被修改的活動(dòng)A1A1試圖以附加的10%減少T2類型的元件中的負(fù)載,除非所測(cè)量的負(fù)載小于10%。在這種情況下,更新邏輯模塊719或錯(cuò)誤恢復(fù)邏輯模塊715可以不具有關(guān)于T2類型的元件實(shí)際上如何將所測(cè)量的負(fù)載減少10%的信息。但是,依賴于數(shù)據(jù)庫(kù)716,錯(cuò)誤恢復(fù)邏輯模塊715知道T2類型的元件具有某個(gè)程序或方法以便將其測(cè)量的負(fù)載減少10%。此外,活動(dòng)A1可以被使用在屬于T2類型的所有自治元件上。
注意程序上的邏輯從底層自治元件的這種分離將考慮到邏輯模塊的外部化,其中第三方可以提供用于問(wèn)題確定和錯(cuò)誤恢復(fù)的服務(wù)。
(ii)采用統(tǒng)一的框架,該框架增加、修改和刪除數(shù)據(jù)庫(kù)中與平臺(tái)和環(huán)境相關(guān)的數(shù)據(jù),而不影響邏輯模塊中的推理和活動(dòng)引擎。作為一個(gè)例子,當(dāng)自治元件701首次被加入系統(tǒng)時(shí),在數(shù)據(jù)庫(kù)705中制作一個(gè)新的項(xiàng)目以便指示它的類型是T1。與環(huán)境相關(guān)的數(shù)據(jù)可以將一種類型的元件、事件或問(wèn)題重新指定為另一種,而不影響記錄模塊中的邏輯。例如,由于在T3類型的特定的自治元件703中某些組件不可用,數(shù)據(jù)庫(kù)705、711和716可以臨時(shí)將元件703分類為是T1類型的。
注意關(guān)于自治元件的與平臺(tái)和環(huán)境相關(guān)的數(shù)據(jù)從邏輯模塊內(nèi)的推理和活動(dòng)引擎中的這種分離將考慮到邏輯模塊和數(shù)據(jù)庫(kù)的外部化,其中第三方可以提供用于問(wèn)題確定和錯(cuò)誤恢復(fù)的服務(wù)。
(iii)或是通過(guò)推理引擎的自動(dòng)應(yīng)用或是通過(guò)人工干預(yù)創(chuàng)建邏輯模塊內(nèi)的規(guī)則集中的規(guī)則、為所述規(guī)則重新分配優(yōu)先級(jí)、修改所述規(guī)則和刪除所述規(guī)則。例如,重新考慮規(guī)則R6R6IF在T3類型的元件內(nèi)以大于60%的概率在下5分鐘內(nèi)可能出現(xiàn)P3類型的問(wèn)題THEN在記錄邏輯模塊704內(nèi)增加新的規(guī)則R4,其中R4T2類型的元件應(yīng)該報(bào)告其負(fù)載,并且T3類型的元件應(yīng)該每分鐘報(bào)告E3類型的事件,直到錯(cuò)誤恢復(fù)邏輯模塊715進(jìn)一步通知時(shí)為止。
在這種情況下,新規(guī)則R4被由錯(cuò)誤恢復(fù)邏輯模塊715創(chuàng)建,并且被加入到記錄邏輯模塊704的規(guī)則集內(nèi)。
(iv)在創(chuàng)建、修改或刪除邏輯模塊的規(guī)則集內(nèi)的規(guī)則后產(chǎn)生沖突時(shí),解決多個(gè)規(guī)則之間的沖突。例如,重新考慮記錄邏輯模塊704內(nèi)的上述的規(guī)則R4的引入R4T2類型的元件應(yīng)該報(bào)告其負(fù)載,并且T3類型的元件應(yīng)該每分鐘報(bào)告E3類型的事件,直到錯(cuò)誤恢復(fù)邏輯模塊715進(jìn)一步通知時(shí)為止。
然而,在這個(gè)例子中,記錄邏輯模塊已經(jīng)具有規(guī)則R3R3IF元件是T3類型的元件THEN它應(yīng)該每小時(shí)報(bào)告E3類型的事件。
因此,R3和R4規(guī)則彼此沖突,因?yàn)樗鼈円笞灾卧?03(自治元件703是T3類型的)響應(yīng)E3類型的事件采取不同的活動(dòng)。
在沖突可以被解決之前,推理和活動(dòng)引擎必須能夠識(shí)別沖突的出現(xiàn)。典型地,當(dāng)規(guī)則被創(chuàng)建、被修改、被重新分配優(yōu)先級(jí)或被從邏輯模塊內(nèi)的規(guī)則集中刪除時(shí)有可能出現(xiàn)沖突。因此,當(dāng)規(guī)則集中發(fā)生變化時(shí),推理引擎可以自動(dòng)地調(diào)查沖突的可能的發(fā)生。
一旦識(shí)別到了沖突,推理和活動(dòng)引擎可以使用多種沖突解決機(jī)制,包括基于(單不限于)絕對(duì)預(yù)定優(yōu)先級(jí)(或分級(jí))、特異性或起始時(shí)間的那些機(jī)制。本領(lǐng)域的普通技術(shù)人員將會(huì)認(rèn)識(shí)到,多種可能的啟發(fā)式函數(shù)或隨機(jī)度量中的任意一個(gè)都可以被用來(lái)估計(jì)給定的規(guī)則或關(guān)系的適當(dāng)性,并且此處所列舉出的可能的方法并不旨在于窮舉性地列出。禮貌(courteous)邏輯編程是一種可以被用于處理優(yōu)先級(jí)分配和規(guī)則間的沖突解決的技術(shù)。禮貌邏輯編程描述于Grosof,B.,“IBMResearch ReportCourteous Logic ProgramsPrioritized ConflictHandling for Rules,”May 8,1997中,通過(guò)引用將其結(jié)合在此處。
作為沖突解決的例子,考慮上面的規(guī)則R3和R4。在規(guī)則R3和R4之間的沖突中,記錄邏輯可以包含固定的優(yōu)先級(jí)分配規(guī)則,為規(guī)則R4分配比規(guī)則R3較高的優(yōu)先級(jí)。在其它情況下,可以一種更動(dòng)態(tài)的和間接的方式通過(guò)優(yōu)先級(jí)分配規(guī)則確定規(guī)則的相對(duì)的優(yōu)先級(jí),所述的優(yōu)先級(jí)分配規(guī)則依賴于規(guī)則的某個(gè)方面,諸如它的特異性(例如,關(guān)于T2類型的元件的規(guī)則得到比關(guān)于所有元件的通用規(guī)則更高的優(yōu)先級(jí)),它是多久以前被引入規(guī)則集的(例如,更近來(lái)的規(guī)則比較早的規(guī)則具有優(yōu)先性),它是多久以前被激活的(例如,如果規(guī)則R3在規(guī)則R4之前被滿足了多于10秒鐘,則規(guī)則R4具有優(yōu)先級(jí))或是在一個(gè)給定的時(shí)間段內(nèi)它被如何頻繁地激活(例如,其條件一個(gè)1小時(shí)被滿足10次的規(guī)則可以比其條件1天僅被滿足1次的規(guī)則具有優(yōu)先級(jí))。另一個(gè)規(guī)則優(yōu)先級(jí)分配準(zhǔn)則是規(guī)則被察覺(jué)到的有效性。例如,假設(shè)在過(guò)去的7個(gè)小時(shí)內(nèi),問(wèn)題確定邏輯模塊710已經(jīng)在10個(gè)場(chǎng)合診斷出了P3類型的問(wèn)題的可能的發(fā)生。雖然在每個(gè)情況下,錯(cuò)誤恢復(fù)邏輯模塊715已經(jīng)通過(guò)激活規(guī)則R5并且采取活動(dòng)A1進(jìn)行了響應(yīng),但是它沒(méi)有能夠阻止P3類型的問(wèn)題在10中有8次出現(xiàn)。根據(jù)這個(gè)歷史信息,優(yōu)先級(jí)分配規(guī)則可以判定,活動(dòng)包含A1的所有規(guī)則應(yīng)該被降低優(yōu)先級(jí)。反復(fù)地失敗的規(guī)則可以被降低其優(yōu)先級(jí)到這樣一個(gè)點(diǎn),在該點(diǎn)處它們可以被最終自動(dòng)地從規(guī)則集中刪除。在自治系統(tǒng)中允許規(guī)則優(yōu)先級(jí)中的動(dòng)態(tài)的改變是重要的,因?yàn)樽灾卧徊粩嗟卦黾?、修改和刪除,并且任意推理規(guī)則或它們的關(guān)系,特別是那些從機(jī)器學(xué)習(xí)或數(shù)據(jù)挖掘中得出的,可能在適當(dāng)性方面產(chǎn)生變化。
雖然本發(fā)明的優(yōu)選實(shí)施例的圖7的表示是自然順序的,本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解,圖7中表示的代表活動(dòng)的方框不必按示出的順序或甚至是順序地執(zhí)行??梢詫?shí)現(xiàn)多個(gè)任務(wù)被并行或同時(shí)(例如,作為單獨(dú)的線程或進(jìn)程)執(zhí)行的實(shí)施例,而不脫離本發(fā)明的范圍和精神。
本領(lǐng)域的普通技術(shù)人員將會(huì)認(rèn)識(shí)到,在本發(fā)明的優(yōu)選實(shí)施例中,單個(gè)問(wèn)題檢測(cè)和糾正邏輯被用于執(zhí)行問(wèn)題確定和錯(cuò)誤恢復(fù)中的4個(gè)任務(wù)1)使用推理和活動(dòng)引擎指揮系統(tǒng)組件在規(guī)定的條件下,以規(guī)定的詳細(xì)程度記錄規(guī)定類型的事件,2)使用推理和活動(dòng)引擎,通過(guò)在學(xué)習(xí)/數(shù)據(jù)挖掘算法的幫助下將事件記錄和問(wèn)題的征兆關(guān)聯(lián)在一起診斷問(wèn)題(或問(wèn)題的跡象),3)采用推理和活動(dòng)引擎,該推理和活動(dòng)引擎基于所述的問(wèn)題診斷確定活動(dòng)過(guò)程,并且測(cè)量那些活動(dòng)在解決問(wèn)題方面的成功或失敗,4)使用這樣一種方法,所述方法通過(guò)結(jié)合以下4個(gè)特征允許不同的推理和活動(dòng)引擎自適應(yīng)(a)將不同推理和活動(dòng)引擎的程序上的邏輯與系統(tǒng)組件的細(xì)節(jié)隔離開(kāi),(b)采用一個(gè)框架增加、修改和刪除與平臺(tái)和環(huán)境相關(guān)的數(shù)據(jù)而不影響推理和活動(dòng)引擎(c)創(chuàng)建規(guī)則、修改規(guī)則、為規(guī)則分配優(yōu)先級(jí)或刪除規(guī)則(d)解決多個(gè)規(guī)則之間的沖突。本領(lǐng)域的普通技術(shù)人員將會(huì)認(rèn)識(shí)到分離的自治元件或它們的組件可以單獨(dú)地執(zhí)行這些任務(wù)。例如,第一自治元件可以設(shè)置記錄策略,而另一個(gè)元件使用學(xué)習(xí)算法以便得到關(guān)于問(wèn)題和它們的解決方案的新的知識(shí)。然后自治計(jì)算系統(tǒng)可以用“混合并匹配”的方式組合這些單獨(dú)的問(wèn)題檢測(cè)/糾正元件,以便達(dá)到當(dāng)前的要求。
重要的是要注意到,雖然已經(jīng)在一個(gè)完全運(yùn)行的數(shù)據(jù)處理系統(tǒng)的環(huán)境下描述了本發(fā)明,本領(lǐng)域的普通技術(shù)人員將會(huì)理解本發(fā)明的過(guò)程可以被以指令的計(jì)算機(jī)可讀介質(zhì)或其它功能描述材料的形式和其它多種形式發(fā)布,并且本發(fā)明不論實(shí)際用于承載該發(fā)布的信號(hào)承載介質(zhì)的特定類型同等適用。計(jì)算機(jī)可讀介質(zhì)的例子包括可讀類型的介質(zhì),諸如軟盤(pán)、硬盤(pán)驅(qū)動(dòng)器、RAM、CD-ROM、DVD-ROM和傳輸類型的介質(zhì),傳輸類型的介質(zhì)諸如數(shù)字和模擬通信鏈路、使用諸如射頻和光波傳輸?shù)膫鬏斝问降挠芯€或無(wú)線通信鏈路。計(jì)算機(jī)可讀介質(zhì)可以采用編碼的格式,其被解碼以便在特定的數(shù)據(jù)處理系統(tǒng)內(nèi)實(shí)際使用。功能描述材料是將功能告知機(jī)器的信息。功能描述材料包括但是并不限于,計(jì)算機(jī)程序、指令、規(guī)則、事實(shí)和可計(jì)算的功能、對(duì)象和數(shù)據(jù)結(jié)構(gòu)的定義。
出于示例和說(shuō)明的目的已經(jīng)給出了本發(fā)明的描述,并且該描述并不旨在是窮盡的或是將本發(fā)明限定于所公開(kāi)的形式。許多修改和改變對(duì)于本領(lǐng)域的普通技術(shù)人員來(lái)說(shuō)是明顯的。選擇并描述本文的實(shí)施例以便最好地解釋本發(fā)明的原理、實(shí)際的應(yīng)用,并且使得本領(lǐng)域的普通技術(shù)人員能夠理解本發(fā)明的具有各種改變的各種實(shí)施例適用于所構(gòu)想的特定應(yīng)用。
權(quán)利要求
1.一種為計(jì)算環(huán)境提供問(wèn)題確定和錯(cuò)誤恢復(fù)特征的基于計(jì)算機(jī)的方法,該方法包括接收關(guān)于計(jì)算環(huán)境的狀態(tài)的信息;從規(guī)則的知識(shí)庫(kù)中識(shí)別至少一個(gè)適用的規(guī)則,其中所述至少一個(gè)適用的規(guī)則適用于所述計(jì)算環(huán)境的狀態(tài);和施加所述至少一個(gè)適用的規(guī)則以便獲得結(jié)果,其中規(guī)則的知識(shí)庫(kù)包括記錄邏輯規(guī)則、問(wèn)題確定邏輯規(guī)則和錯(cuò)誤恢復(fù)邏輯規(guī)則中的一個(gè),所述記錄邏輯規(guī)則規(guī)定特定的事件應(yīng)當(dāng)由系統(tǒng)組件在規(guī)定環(huán)境下記錄,所述問(wèn)題確定邏輯規(guī)則規(guī)定被包括在事件記錄中的特定信息的出現(xiàn)指示特定的問(wèn)題,錯(cuò)誤恢復(fù)邏輯規(guī)則規(guī)定特定的問(wèn)題意味著應(yīng)當(dāng)遵從針對(duì)所述特定問(wèn)題的特定解決方案。
2.如權(quán)利要求1的方法,其中規(guī)則的知識(shí)庫(kù)包括至少一個(gè)記錄邏輯規(guī)則,并且所述結(jié)果是規(guī)定了特定的事件應(yīng)當(dāng)如何由系統(tǒng)組件記錄的記錄策略。
3.如權(quán)利要求2的方法,其中所述的記錄策略包括對(duì)執(zhí)行特定事件的記錄的系統(tǒng)組件的識(shí)別。
4.如權(quán)利要求2的方法,其中所述記錄策略包括規(guī)定的條件,所述特定的事件將被在該規(guī)定的條件下記錄。
5.如權(quán)利要求2的方法,其中記錄策略包括規(guī)定的詳細(xì)程度,所述特定的事件將被以該規(guī)定的詳細(xì)程度記錄。
6.如權(quán)利要求1的方法,其中規(guī)則的知識(shí)庫(kù)包括至少一個(gè)問(wèn)題確定邏輯規(guī)則,并且所述的結(jié)果是問(wèn)題的診斷。
7.如權(quán)利要求6的方法,其中所述至少一個(gè)問(wèn)題確定邏輯規(guī)則使用統(tǒng)計(jì)測(cè)試使得包含在事件記錄中的特定信息與問(wèn)題相關(guān)聯(lián)。
8.如權(quán)利要求6的方法,其中所述至少一個(gè)問(wèn)題確定邏輯規(guī)則使用機(jī)器學(xué)習(xí)算法將包含在事件記錄中的特定信息與問(wèn)題相關(guān)聯(lián)。
9.如權(quán)利要求1的方法,其中所述的規(guī)則的知識(shí)庫(kù)包括至少一個(gè)錯(cuò)誤恢復(fù)邏輯規(guī)則,并且所述的結(jié)果是在解決問(wèn)題中所遵循的活動(dòng)過(guò)程。
10.如權(quán)利要求9的方法,還包括遵循所述的活動(dòng)過(guò)程以便解決該問(wèn)題;和響應(yīng)對(duì)所述活動(dòng)過(guò)程的遵循,確定所述活動(dòng)過(guò)程的成功的程度。
11.如權(quán)利要求10的方法,還包括響應(yīng)所述活動(dòng)過(guò)程的成功的程度,為知識(shí)庫(kù)中的規(guī)則分配優(yōu)先級(jí)。
12.如權(quán)利要求1的方法,還包括使用機(jī)器學(xué)習(xí)算法向知識(shí)庫(kù)增加附加的規(guī)則。
13.如權(quán)利要求12的方法,其中所述的機(jī)器學(xué)習(xí)算法是歸納邏輯編程算法。
14.如權(quán)利要求1的方法,還包括確定所述知識(shí)庫(kù)內(nèi)的規(guī)則的適當(dāng)程度;和響應(yīng)對(duì)所述規(guī)則具有低的適當(dāng)程度的確定,刪除規(guī)則。
15.如權(quán)利要求1的方法,還包括確定所述知識(shí)庫(kù)內(nèi)的規(guī)則的適當(dāng)程度;和響應(yīng)對(duì)所述規(guī)則具有低的適當(dāng)程度的確定,在知識(shí)庫(kù)內(nèi)為所述規(guī)則分配低的優(yōu)先級(jí)。
16.如權(quán)利要求1的方法,還包括使用機(jī)器學(xué)習(xí)算法修改知識(shí)庫(kù)中的規(guī)則。
17.如權(quán)利要求16的方法,其中所述的機(jī)器學(xué)習(xí)算法是監(jiān)督學(xué)習(xí)算法。
18.如權(quán)利要求17的方法,其中所述的監(jiān)督學(xué)習(xí)算法是神經(jīng)網(wǎng)絡(luò)、貝葉斯網(wǎng)絡(luò)和支持向量機(jī)器中的一個(gè)。
19.如權(quán)利要求16的方法,其中所述的機(jī)器學(xué)習(xí)算法是非監(jiān)督學(xué)習(xí)算法。
20.如權(quán)利要求19的方法,其中所述的非監(jiān)督學(xué)習(xí)算法是k-means聚類、分層聚類和主成分分析中的一個(gè)。
21.如權(quán)利要求1的方法,其中接收關(guān)于計(jì)算環(huán)境的狀態(tài)的信息、識(shí)別至少一個(gè)適用的規(guī)則和施加所述至少一個(gè)適用的規(guī)則是響應(yīng)來(lái)自客戶的請(qǐng)求而被執(zhí)行的。
22.一種包括功能描述材料的計(jì)算機(jī)可讀介質(zhì)內(nèi)的計(jì)算機(jī)程序產(chǎn)品,當(dāng)被計(jì)算機(jī)執(zhí)行時(shí)能夠使計(jì)算機(jī)執(zhí)行如下的活動(dòng),所述活動(dòng)包括接收關(guān)于計(jì)算環(huán)境的狀態(tài)的信息;從規(guī)則的知識(shí)庫(kù)中識(shí)別至少一個(gè)適用的規(guī)則,其中所述至少一個(gè)適用的規(guī)則對(duì)所述計(jì)算環(huán)境的狀態(tài)是適用的;和施加所述至少一個(gè)適用的規(guī)則以便獲得結(jié)果,其中規(guī)則的知識(shí)庫(kù)包括記錄邏輯規(guī)則、問(wèn)題確定邏輯規(guī)則和錯(cuò)誤恢復(fù)邏輯規(guī)則中的一個(gè),所述記錄邏輯規(guī)則規(guī)定特定的事件應(yīng)當(dāng)由系統(tǒng)組件在特定環(huán)境下記錄,所述問(wèn)題確定邏輯規(guī)則規(guī)定被包括在事件記錄中的特定信息的出現(xiàn)指示特定的問(wèn)題,錯(cuò)誤恢復(fù)邏輯規(guī)則規(guī)定特定的問(wèn)題意味著應(yīng)當(dāng)遵從針對(duì)所述特定問(wèn)題的特定的解決方案。
23.如權(quán)利要求22的計(jì)算機(jī)程序產(chǎn)品,其中規(guī)則的知識(shí)庫(kù)包括至少一個(gè)記錄邏輯規(guī)則,并且所述結(jié)果是規(guī)定了特定的事件應(yīng)當(dāng)如何由系統(tǒng)組件記錄的記錄策略。
24.如權(quán)利要求23的計(jì)算機(jī)程序產(chǎn)品,其中所述的記錄策略包括對(duì)執(zhí)行特定事件的記錄的系統(tǒng)組件的識(shí)別。
25.如權(quán)利要求23的計(jì)算機(jī)程序產(chǎn)品,其中所述記錄策略包括規(guī)定的條件,所述特定的事件將被在該規(guī)定的條件下記錄。
26.如權(quán)利要求23的計(jì)算機(jī)程序產(chǎn)品,其中記錄策略包括規(guī)定的詳細(xì)程度,所述特定的事件將被以該規(guī)定的詳細(xì)程度記錄。
27.如權(quán)利要求22的計(jì)算機(jī)程序產(chǎn)品,其中規(guī)則的知識(shí)庫(kù)包括至少一個(gè)問(wèn)題確定邏輯規(guī)則,并且所述的結(jié)果是問(wèn)題的診斷。
28.如權(quán)利要求27的計(jì)算機(jī)程序產(chǎn)品,其中所述至少一個(gè)問(wèn)題確定邏輯規(guī)則使用統(tǒng)計(jì)測(cè)試使得包含在事件記錄中的特定信息與問(wèn)題相關(guān)聯(lián)。
29.如權(quán)利要求27的計(jì)算機(jī)程序產(chǎn)品,其中所述至少一個(gè)問(wèn)題確定邏輯規(guī)則使用機(jī)器學(xué)習(xí)算法將包含在事件記錄中的特定信息與問(wèn)題相關(guān)聯(lián)。
30.如權(quán)利要求22的計(jì)算機(jī)程序產(chǎn)品,其中所述的規(guī)則的知識(shí)庫(kù)包括至少一個(gè)錯(cuò)誤恢復(fù)邏輯規(guī)則,并且所述的結(jié)果是在解決問(wèn)題中所遵循的活動(dòng)過(guò)程。
31.如權(quán)利要求30的計(jì)算機(jī)程序產(chǎn)品,包括附加的功能描述材料,該材料當(dāng)被計(jì)算機(jī)執(zhí)行時(shí)能夠使計(jì)算機(jī)執(zhí)行附加的活動(dòng),所述活動(dòng)包括遵循所述的活動(dòng)過(guò)程以便解決該問(wèn)題;和響應(yīng)對(duì)所述活動(dòng)過(guò)程的遵從,確定所述活動(dòng)過(guò)程的成功的程度。
32.如權(quán)利要求31的計(jì)算機(jī)程序產(chǎn)品,包括附加的功能描述材料,該材料當(dāng)被計(jì)算機(jī)執(zhí)行時(shí)能夠使計(jì)算機(jī)執(zhí)行附加的活動(dòng),所述活動(dòng)包括響應(yīng)所述活動(dòng)過(guò)程的成功的程度,為知識(shí)庫(kù)中的規(guī)則分配優(yōu)先級(jí)。
33.如權(quán)利要求22的計(jì)算機(jī)程序產(chǎn)品,包括附加的功能描述材料,該材料當(dāng)被計(jì)算機(jī)執(zhí)行時(shí)能夠使計(jì)算機(jī)執(zhí)行附加的活動(dòng),所述活動(dòng)包括使用機(jī)器學(xué)習(xí)算法向知識(shí)庫(kù)增加附加的規(guī)則。
34.如權(quán)利要求33的計(jì)算機(jī)程序產(chǎn)品,其中所述的機(jī)器學(xué)習(xí)算法是歸納邏輯編程算法。
35.如權(quán)利要求22的計(jì)算機(jī)程序產(chǎn)品,包括附加的功能描述材料,該材料當(dāng)被計(jì)算機(jī)執(zhí)行時(shí)能夠使計(jì)算機(jī)執(zhí)行附加的活動(dòng),所述活動(dòng)包括確定所述知識(shí)庫(kù)內(nèi)的規(guī)則的適當(dāng)程度;和響應(yīng)對(duì)所述規(guī)則具有低的適當(dāng)程度的確定,刪除規(guī)則。
36.如權(quán)利要求22的計(jì)算機(jī)程序產(chǎn)品,包括附加的功能描述材料,該材料當(dāng)被計(jì)算機(jī)執(zhí)行時(shí)能夠使計(jì)算機(jī)執(zhí)行附加的活動(dòng),所述活動(dòng)包括確定所述知識(shí)庫(kù)內(nèi)的規(guī)則的適當(dāng)程度;和響應(yīng)對(duì)所述規(guī)則具有低的適當(dāng)程度的確定,在知識(shí)庫(kù)內(nèi)為所述規(guī)則分配低的優(yōu)先級(jí)。
37.如權(quán)利要求22的計(jì)算機(jī)程序產(chǎn)品,包括附加的功能描述材料,該材料當(dāng)被計(jì)算機(jī)執(zhí)行時(shí)能夠使計(jì)算機(jī)執(zhí)行附加的活動(dòng),所述活動(dòng)包括使用機(jī)器學(xué)習(xí)算法修改知識(shí)庫(kù)中的規(guī)則。
38.如權(quán)利要求37的計(jì)算機(jī)程序產(chǎn)品,其中所述的機(jī)器學(xué)習(xí)算法是監(jiān)督學(xué)習(xí)算法。
39.如權(quán)利要求38的計(jì)算機(jī)程序產(chǎn)品,其中所述的監(jiān)督學(xué)習(xí)算法是神經(jīng)網(wǎng)絡(luò)、貝葉斯網(wǎng)絡(luò)和支持向量機(jī)器中的一個(gè)。
40.如權(quán)利要求37的計(jì)算機(jī)程序產(chǎn)品,其中所述的機(jī)器學(xué)習(xí)算法是非監(jiān)督學(xué)習(xí)算法。
41.如權(quán)利要求40的計(jì)算機(jī)程序產(chǎn)品,其中所述的非監(jiān)督學(xué)習(xí)算法是k-means聚類、分層聚類和主成分分析中的一個(gè)。
42.如權(quán)利要求22的計(jì)算機(jī)程序產(chǎn)品,其中接收關(guān)于計(jì)算環(huán)境的狀態(tài)的信息、識(shí)別至少一個(gè)適用的規(guī)則和施加所述至少一個(gè)適用的規(guī)則是響應(yīng)來(lái)自客戶的請(qǐng)求而被執(zhí)行的。
43.一種數(shù)據(jù)處理系統(tǒng),包括用于接收關(guān)于計(jì)算環(huán)境的狀態(tài)的信息的裝置;用于從規(guī)則的知識(shí)庫(kù)中識(shí)別至少一個(gè)適用的規(guī)則的裝置,其中所述至少一個(gè)適用的規(guī)則對(duì)所述計(jì)算環(huán)境的狀態(tài)是適用的;和用于施加所述至少一個(gè)適用的規(guī)則以便獲得結(jié)果的裝置,其中規(guī)則的知識(shí)庫(kù)包括記錄邏輯規(guī)則、問(wèn)題確定邏輯規(guī)則和錯(cuò)誤恢復(fù)邏輯規(guī)則中的一個(gè),所述記錄邏輯規(guī)則規(guī)定特定的事件應(yīng)當(dāng)被由系統(tǒng)組件在特定環(huán)境下記錄,所述問(wèn)題確定邏輯規(guī)則規(guī)定被包括在事件記錄中的特定信息的出現(xiàn)指示特定的問(wèn)題,錯(cuò)誤恢復(fù)邏輯規(guī)則規(guī)定特定的問(wèn)題意味著應(yīng)當(dāng)遵從針對(duì)所述特定問(wèn)題的特定的解決方案。
44.如權(quán)利要求43的數(shù)據(jù)處理系統(tǒng),其中規(guī)則的知識(shí)庫(kù)包括至少一個(gè)記錄邏輯規(guī)則,并且所述結(jié)果是規(guī)定了特定的事件應(yīng)當(dāng)如何由系統(tǒng)組件記錄的記錄策略。
45.如權(quán)利要求44的數(shù)據(jù)處理系統(tǒng),其中所述的記錄策略包括對(duì)執(zhí)行特定事件的記錄的系統(tǒng)組件的識(shí)別。
46.如權(quán)利要求44的數(shù)據(jù)處理系統(tǒng),其中所述記錄策略包括規(guī)定的條件,所述特定的事件將被在該規(guī)定的條件下記錄。
47.如權(quán)利要求44的數(shù)據(jù)處理系統(tǒng),其中記錄策略包括規(guī)定的詳細(xì)程度,所述特定的事件將被以該規(guī)定的詳細(xì)程度記錄。
48.如權(quán)利要求43的數(shù)據(jù)處理系統(tǒng),其中規(guī)則的知識(shí)庫(kù)包括至少一個(gè)問(wèn)題確定邏輯規(guī)則,并且所述的結(jié)果是問(wèn)題的診斷。
49.如權(quán)利要求48的數(shù)據(jù)處理系統(tǒng),其中所述至少一個(gè)問(wèn)題確定邏輯規(guī)則使用統(tǒng)計(jì)測(cè)試使得包含在事件記錄中的特定信息與問(wèn)題相關(guān)聯(lián)。
50.如權(quán)利要求48的數(shù)據(jù)處理系統(tǒng),其中所述至少一個(gè)問(wèn)題確定邏輯規(guī)則使用機(jī)器學(xué)習(xí)算法將包含在事件記錄中的特定信息與問(wèn)題相關(guān)聯(lián)。
51.如權(quán)利要求43的數(shù)據(jù)處理系統(tǒng),其中所述的規(guī)則的知識(shí)庫(kù)包括至少一個(gè)錯(cuò)誤恢復(fù)邏輯規(guī)則,并且所述的結(jié)果是在解決問(wèn)題中所遵循的活動(dòng)過(guò)程。
52.如權(quán)利要求51的數(shù)據(jù)處理系統(tǒng),還包括用于遵循所述的活動(dòng)過(guò)程以便解決該問(wèn)題的裝置;和用于響應(yīng)對(duì)所述活動(dòng)過(guò)程的遵從,確定所述活動(dòng)過(guò)程的成功的程度的裝置。
53.如權(quán)利要求52的數(shù)據(jù)處理系統(tǒng),還包括用于響應(yīng)所述活動(dòng)過(guò)程的成功的程度,為知識(shí)庫(kù)中的規(guī)則分配優(yōu)先級(jí)的裝置。
54.如權(quán)利要求43的數(shù)據(jù)處理系統(tǒng),還包括用于使用機(jī)器學(xué)習(xí)算法向知識(shí)庫(kù)增加附加的規(guī)則的裝置。
55.如權(quán)利要求54的數(shù)據(jù)處理系統(tǒng),其中所述的機(jī)器學(xué)習(xí)算法是歸納邏輯編程算法。
56.如權(quán)利要求43的數(shù)據(jù)處理系統(tǒng),還包括用于確定所述知識(shí)庫(kù)內(nèi)的規(guī)則的適當(dāng)程度的裝置;和用于響應(yīng)對(duì)所述規(guī)則具有低的適當(dāng)程度的確定,刪除規(guī)則的裝置。
57.如權(quán)利要求43的數(shù)據(jù)處理系統(tǒng),還包括用于確定所述知識(shí)庫(kù)內(nèi)的規(guī)則的適當(dāng)程度的裝置;和用于響應(yīng)對(duì)所述規(guī)則具有低的適當(dāng)程度的確定,在知識(shí)庫(kù)內(nèi)為所述規(guī)則分配低的優(yōu)先級(jí)的裝置。
58.如權(quán)利要求43的數(shù)據(jù)處理系統(tǒng),還包括用于使用機(jī)器學(xué)習(xí)算法修改知識(shí)庫(kù)中的規(guī)則的裝置。
59.如權(quán)利要求58的數(shù)據(jù)處理系統(tǒng),其中所述的機(jī)器學(xué)習(xí)算法是監(jiān)督學(xué)習(xí)算法。
60.如權(quán)利要求59的數(shù)據(jù)處理系統(tǒng),其中所述的監(jiān)督學(xué)習(xí)算法是神經(jīng)網(wǎng)絡(luò)、貝葉斯網(wǎng)絡(luò)和支持向量機(jī)器中的一個(gè)。
61.如權(quán)利要求58的數(shù)據(jù)處理系統(tǒng),其中所述的機(jī)器學(xué)習(xí)算法是非監(jiān)督學(xué)習(xí)算法。
62.如權(quán)利要求61的數(shù)據(jù)處理系統(tǒng),其中所述的非監(jiān)督學(xué)習(xí)算法是k-means聚類、分層聚類和主成分分析中的一個(gè)。
63.如權(quán)利要求43的數(shù)據(jù)處理系統(tǒng),其中接收關(guān)于計(jì)算環(huán)境的狀態(tài)的信息、識(shí)別至少一個(gè)適用的規(guī)則和施加所述至少一個(gè)適用的規(guī)則是響應(yīng)來(lái)自客戶的請(qǐng)求而被執(zhí)行的。
全文摘要
公開(kāi)了一種用于在自治計(jì)算系統(tǒng)(400)內(nèi)識(shí)別、追蹤、診斷和修復(fù)問(wèn)題的方法、計(jì)算機(jī)程序產(chǎn)品和數(shù)據(jù)處理系統(tǒng)。使用自適應(yīng)的推理和活動(dòng)系統(tǒng)(710)制定了在記錄數(shù)據(jù)、在診斷故障(或故障的跡象)和在處理故障(或故障的跡象)中應(yīng)遵從的規(guī)則和活動(dòng)過(guò)程(704)。自適應(yīng)的推理和活動(dòng)系統(tǒng)(710)包括沖突解決技術(shù),所述的沖突解決技術(shù)基于特定于環(huán)境的信息、積累的時(shí)間敏感的數(shù)據(jù)、采取的活動(dòng)和這些活動(dòng)的效果產(chǎn)生規(guī)則(704)、為規(guī)則(704)分配優(yōu)先級(jí)、修改規(guī)則(704)和刪除規(guī)則(704)。因此,本發(fā)明使得動(dòng)態(tài)的自治計(jì)算系統(tǒng)(400)即使是面對(duì)系統(tǒng)(400)的配置的改變也能夠制定其自己的用于自我管理的策略。
文檔編號(hào)H04L1/22GK1682243SQ03821448
公開(kāi)日2005年10月12日 申請(qǐng)日期2003年7月21日 優(yōu)先權(quán)日2002年9月20日
發(fā)明者錢(qián)浩(音譯), 拉加什·達(dá)斯, 杰夫里·克普哈特, 埃拉·西加爾 申請(qǐng)人:國(guó)際商業(yè)機(jī)器公司