運維異常處理方法、裝置及設(shè)備的制作方法
【專利摘要】本發(fā)明提供了運維異常處理方法、裝置及設(shè)備。其中的運維異常處理裝置包括:接收模塊,用于接收運維任務(wù);整合模塊,用于將具有關(guān)聯(lián)的運維任務(wù)進行整合,得到整合的運維任務(wù);隊列模塊,用于以任務(wù)隊列形式緩存所述整合的運維任務(wù);以及任務(wù)分配模塊,用于為所述任務(wù)隊列中所述整合的運維任務(wù)分配運維管理平臺。本發(fā)明有效提高了運維異常處理效率。
【專利說明】運維異常處理方法、裝置及設(shè)備
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及計算機領(lǐng)域,尤其涉及一種運維異常處理方法、裝置及設(shè)備。
【背景技術(shù)】
[0002]運維異常處理是用于輔助完成基礎(chǔ)設(shè)施的運維服務(wù),隨著基礎(chǔ)設(shè)施的規(guī)模越來越大,對運維異常處理的要求越來越高。當(dāng)前的運維異常處理系統(tǒng)已很難滿足當(dāng)前的基礎(chǔ)設(shè)施的運維異常處理要求,例如,當(dāng)前的運維異常處理系統(tǒng)信息分散、異常處理流程分散,因此,導(dǎo)致現(xiàn)有的運維異常處理系統(tǒng)進行運維異常處理的效率較低。
【發(fā)明內(nèi)容】
[0003]本發(fā)明解決的技術(shù)問題之一是提供可以將具有關(guān)聯(lián)的運維任務(wù)整合處理的運維異常處理方法、裝置及設(shè)備,提高運維異常處理的效率。
[0004]根據(jù)本發(fā)明一方面的一個實施例,提供了一種運維異常處理裝置,其中,包括:
[0005]接收模塊,用于接收運維任務(wù);
[0006]整合模塊,用于將具有關(guān)聯(lián)的運維任務(wù)進行整合,得到整合的運維任務(wù);
[0007]隊列模塊,用于以任務(wù)隊列形式緩存所述整合的運維任務(wù);
[0008]任務(wù)分配模塊,用于為所述任務(wù)隊列中所述整合的運維任務(wù)分配運維管理平臺。
[0009]可選地,所述接收模塊具體用于:
[0010]接收運維操作中的異常數(shù)據(jù),并將所述異常數(shù)據(jù)轉(zhuǎn)換為統(tǒng)一格式的運維任務(wù)。
[0011]可選地,所述接收模塊接收的所述運維任務(wù)為以任一臺執(zhí)行運維操作的設(shè)備為單位的運維任務(wù)。
[0012]可選地,所述接收模塊針對任一臺執(zhí)行運維操作的設(shè)備提供統(tǒng)一的接口接收所述設(shè)備的各類運維任務(wù)。
[0013]可選地,所述整合模塊包括:
[0014]判斷子模塊,用于判斷任務(wù)隊列中是否存在與當(dāng)前接收的運維任務(wù)具有關(guān)聯(lián)的運維任務(wù);
[0015]整合子模塊,用于在判斷子模塊判斷存在與當(dāng)前接收的運維任務(wù)具有關(guān)聯(lián)的運維任務(wù)情況下,將具有關(guān)聯(lián)的運維任務(wù)整合為一個運維任務(wù)。
[0016]可選地,所述具有關(guān)聯(lián)的運維任務(wù)包括:
[0017]同一物理空間范圍內(nèi)執(zhí)行運維操作的設(shè)備,在同一步驟中發(fā)生的,相同的異常問題產(chǎn)生的運維任務(wù)。
[0018]可選地,還包括:
[0019]過濾模塊,用于過濾掉接收模塊接收的運維任務(wù)中的無效運維任務(wù)。
[0020]可選地,所述任務(wù)分配模塊還用于:
[0021]在分配運維管理平臺失敗情況下,為運維任務(wù)重新分配其他運維管理平臺。
[0022]根據(jù)本發(fā)明另一方面的一個實施例,提供了一種運維異常處理方法,其中,包括:
[0023]接收運維任務(wù);
[0024]將具有關(guān)聯(lián)的運維任務(wù)進行整合,得到整合的運維任務(wù);
[0025]以任務(wù)隊列形式緩存所述整合的運維任務(wù);
[0026]為所述任務(wù)隊列中所述整合的運維任務(wù)分配運維管理平臺。
[0027]可選地,所述接收運維任務(wù)包括:
[0028]接收運維操作中的異常數(shù)據(jù),并將所述異常數(shù)據(jù)轉(zhuǎn)換為統(tǒng)一格式的運維任務(wù)。
[0029]可選地,接收的所述運維任務(wù)包括:
[0030]以任一臺執(zhí)行運維操作的設(shè)備為單位的運維任務(wù)。
[0031 ] 可選地,所述接收運維任務(wù)包括:
[0032]通過針對任一臺執(zhí)行運維操作的設(shè)備提供的統(tǒng)一的接口接收所述設(shè)備的各類運維任務(wù)。
[0033]可選地,所述將具有關(guān)聯(lián)的運維任務(wù)進行整合包括:
[0034]判斷任務(wù)隊列中是否存在與當(dāng)前接收的運維任務(wù)具有關(guān)聯(lián)的運維任務(wù);
[0035]在存在與當(dāng)前接收的運維任務(wù)具有關(guān)聯(lián)的運維任務(wù)情況下,將具有關(guān)聯(lián)的運維任務(wù)整合為一個運維任務(wù)。
[0036]可選地,所述具有關(guān)聯(lián)的運維任務(wù)包括:
[0037]同一物理空間范圍內(nèi)執(zhí)行運維操作的設(shè)備,在同一步驟中發(fā)生的,相同的異常問題產(chǎn)生的運維任務(wù)。
[0038]可選地,還包括:
[0039]過濾掉接收的所述運維任務(wù)中的無效運維任務(wù)。
[0040]可選地,還包括:
[0041]若分配運維管理平臺失敗,則重新分配其他運維管理平臺。
[0042]根據(jù)本發(fā)明的另一方面的一個實施例,還提供了一種計算機設(shè)備,包括前述向運維異常處理裝置。
[0043]由于本申請實施例可對接收的運維任務(wù)中,具有關(guān)聯(lián)的運維任務(wù)進行整合,以集中處理該具有關(guān)聯(lián)的運維任務(wù),可有效縮短運維任務(wù)處理時間,從而提高運維異常處理效率。
[0044]本領(lǐng)域普通技術(shù)人員將了解,雖然下面的詳細說明將參考圖示實施例、附圖進行,但本發(fā)明并不僅限于這些實施例。而是,本發(fā)明的范圍是廣泛的,且意在僅通過后附的權(quán)利要求限定本發(fā)明的范圍。
【專利附圖】
【附圖說明】
[0045]通過閱讀參照以下附圖所作的對非限制性實施例所作的詳細描述,本發(fā)明的其它特征、目的和優(yōu)點將會變得更明顯:
[0046]圖1是根據(jù)本發(fā)明一個實施例的運維異常處理裝置結(jié)構(gòu)示意圖。
[0047]圖2是根據(jù)本發(fā)明另一個實施例的運維異常處理裝置結(jié)構(gòu)示意圖。
[0048]圖3是根據(jù)本發(fā)明一個實施例的運維異常處理方法的流程圖。
[0049]圖4是根據(jù)本發(fā)明一個實施例的將具有關(guān)聯(lián)的運維任務(wù)進行整合的方法的流程圖。
[0050]附圖中相同或相似的附圖標記代表相同或相似的部件。
【具體實施方式】
[0051]下面結(jié)合附圖對本發(fā)明作進一步詳細描述。
[0052]圖1是根據(jù)本發(fā)明一個實施例的一種運維異常處理裝置結(jié)構(gòu)示意圖,該裝置主要包括:接收模塊100、整合模塊110、隊列模塊120以及任務(wù)分配模塊130。
[0053]其中,接收模塊100,主要用于接收運維任務(wù)。
[0054]根據(jù)本申請的一種實施例,所述接收模塊100接收運維任務(wù)的方法包括:接收模塊100接收運維操作中的異常數(shù)據(jù),并將所述異常數(shù)據(jù)轉(zhuǎn)換為統(tǒng)一格式的運維任務(wù)。也就是,本實施例可以將來自執(zhí)行運維操作的設(shè)備的不同模塊的、不同種類的、不同形式的運維異常數(shù)據(jù),轉(zhuǎn)換為統(tǒng)一格式的運維任務(wù),使得進入運維異常處理裝置的運維任務(wù)為統(tǒng)一格式的運維任務(wù),從而可以減少介入運維異常處理裝置內(nèi)部系統(tǒng)的開發(fā)工作量,提高復(fù)用率。
[0055]其中,所述統(tǒng)一格式的運維任務(wù)可以包含如下信息中任一種或多種:異常設(shè)備所屬區(qū)域(例如,所屬機房)、異常所屬系統(tǒng)、異常所屬模塊、原始異常數(shù)據(jù)、處理優(yōu)先級等,其中原始異常數(shù)據(jù)包括轉(zhuǎn)換前的異常數(shù)據(jù)中的異常描述、異常所屬步驟、異常發(fā)生時間等等。
[0056]該接收模塊100接收的所述運維任務(wù)可以以執(zhí)行運維操作的設(shè)備為單位,也就是,所述運維任務(wù)可以為任一臺執(zhí)行運維操作的設(shè)備的運維任務(wù),而并非現(xiàn)有技術(shù)中的以“操作單”為單位的運維任務(wù)?,F(xiàn)有技術(shù)中以“操作單”為單位的運維任務(wù),是將多臺執(zhí)行相同運維操作的設(shè)備的運維操作作為一個整體,生成一個運維操作的“操作單”,并以流程驅(qū)動該運維操作,若多臺設(shè)備中任一臺設(shè)備運維操作失敗,即使其他設(shè)備運維操作成功,則操作成功的運維設(shè)備也無法執(zhí)行后續(xù)操作,需所述多臺設(shè)備同時運維操作成功情況下才能執(zhí)行后續(xù)操作。而本實施例中以單臺設(shè)備的運維任務(wù)為一個單位,在該單臺設(shè)備成功執(zhí)行完一個運維操作后即可執(zhí)行下一個運維操作,與現(xiàn)有技術(shù)相比可有效提升運維操作效率。
[0057]另外,與現(xiàn)有技術(shù)中不同運維異常(即不同模塊發(fā)生的運維異常)對應(yīng)不同的接口相比,該接收模塊100可針對任一臺執(zhí)行運維操作的設(shè)備提供統(tǒng)一的接口接收該設(shè)備的各類運維任務(wù),也就是,針對一臺執(zhí)行運維操作的設(shè)備,無論出現(xiàn)任何種類的運維異常(即任何模塊發(fā)生運維異常),包括外包平臺異常、標準E-mail郵件組異常、iPlat(自動化平臺)異常等等,均可以通過統(tǒng)一的一個接口發(fā)送異常數(shù)據(jù)給該接收模塊100,因此,與現(xiàn)有技術(shù)分散的異常信息相比,本申請實施例避免了在發(fā)生不同運維異常時需要查找對應(yīng)的接口才能發(fā)送該異常數(shù)據(jù),對于提高異常處理效率提供幫助。
[0058]其中的整合模塊110,主要用于將具有關(guān)聯(lián)的運維任務(wù)進行整合,得到整合的運維任務(wù)。將具有關(guān)聯(lián)的運維任務(wù)進行整合,最終可得到一個運維任務(wù),后續(xù)可對該具有關(guān)聯(lián)的運維任務(wù)作為一個任務(wù)來統(tǒng)一處理,以有效提高運維異常處理效率。
[0059]根據(jù)本申請的一種實施例,該整合模塊110可包含如下子模塊,用于完成對具有關(guān)聯(lián)的運維任務(wù)進行整合的操作,具體可包括:判斷子模塊1101和整合子模塊1102。
[0060]該判斷子模塊1101,主要用于判斷任務(wù)隊列中是否存在與當(dāng)前接收的有效運維任務(wù)具有關(guān)聯(lián)的運維任務(wù)。
[0061]其中,所述具有關(guān)聯(lián)的運維任務(wù)包括:同一物理空間范圍內(nèi)(例如同一機房)執(zhí)行運維操作的設(shè)備,在同一步驟中發(fā)生的,相同的異常問題產(chǎn)生的運維任務(wù)。該判斷子模塊1101可通過判斷任務(wù)隊列中運維任務(wù)中的異常設(shè)備所屬區(qū)域、異常所屬步驟以及異常描述是否與當(dāng)前接收的運維任務(wù)的相應(yīng)內(nèi)容相同,來判斷任務(wù)隊列中是否存在與當(dāng)前接收的有效運維任務(wù)具有關(guān)聯(lián)的運維任務(wù)。
[0062]當(dāng)然,本實施例所述的具有關(guān)聯(lián)的運維任務(wù)并不局限于此,該具有關(guān)聯(lián)的運維任務(wù)還包括但不限于:同一類模塊的運維任務(wù)、或同一類系統(tǒng)的運維任務(wù)或同一類運維操作的運維任務(wù)等等,總之,該具有關(guān)聯(lián)的運維任務(wù)是可以統(tǒng)一集中處理的運維任務(wù)。
[0063]該整合子模塊1102,主要用于在判斷子模塊1101判斷存在與當(dāng)前接收的運維任務(wù)具有關(guān)聯(lián)的運維任務(wù)情況下,將具有關(guān)聯(lián)的運維任務(wù)整合為一個運維任務(wù)。
[0064]該整合子模塊1102整合后得到的整合的運維任務(wù)會發(fā)送給隊列模塊120,由隊列模塊120以隊列任務(wù)形式緩存。
[0065]可以理解的是,若判斷子模塊1101判斷不存在與當(dāng)前接收的運維任務(wù)具有關(guān)聯(lián)的運維任務(wù)情況下,該整合子模塊1102整合后得到的整合的運維任務(wù)即為當(dāng)前接收的運維任務(wù)。
[0066]具體的,整合子模塊1102將具有關(guān)聯(lián)的運維任務(wù)整合為一個運維任務(wù)的過程可以包括:
[0067]整合子模塊1102在任務(wù)隊列中與當(dāng)前接收的運維任務(wù)具有關(guān)聯(lián)的運維任務(wù)中添加該當(dāng)前接收的運維任務(wù)的信息,以運維任務(wù)中的異常描述相同作為具有關(guān)聯(lián)的運維任務(wù)的判斷標準為例,為描述方便,將任務(wù)隊列中與當(dāng)前接收的運維任務(wù)具有關(guān)聯(lián)的運維任務(wù)簡稱為待添加運維任務(wù),在待添加運維任務(wù)中更新機器數(shù)量,例如,由原來的I臺增加為2臺;對于與當(dāng)前接收的運維任務(wù)中相同的描述可保持不變。
[0068]經(jīng)整合子模塊1102整合后得到的整合的運維任務(wù),可繼續(xù)緩存在任務(wù)隊列的原位置緩存。當(dāng)然,本申請實施例并不限定于此,也可將整合的運維任務(wù)作為新增加的運維任務(wù)添加到任務(wù)隊列的隊尾等等。整合的運維任務(wù)除包含接收模塊100接收的運維任務(wù)中的信息外,還可包括:運維任務(wù)編號、運維任務(wù)標題、當(dāng)前處理狀態(tài)等中的任一個或多個。
[0069]其中的隊列模塊120,主要用于以任務(wù)隊列形式緩存所述整合的運維任務(wù);
[0070]由前面對于整合模塊110的描述可知,該整合的運維任務(wù)可以為多個設(shè)備的運維任務(wù)整合后的一個運維任務(wù),也可以是一臺設(shè)備的運維任務(wù)(無具有關(guān)聯(lián)的運維任務(wù)的場景)O
[0071]本申請實施例通過使用任務(wù)隊列的形式處理運維任務(wù),與直接采用實時的交互接口的方式相比,不但可以將未處理的運維任務(wù)進行整合,集中處理具有關(guān)聯(lián)的運維任務(wù),而且,還可以避免因為過多任務(wù)導(dǎo)致腳本超時等原因,造成的運維任務(wù)丟失等情況。
[0072]該隊列模塊120可按照運維任務(wù)產(chǎn)生的時間先后順序?qū)θ蝿?wù)隊列中的運維任務(wù)進行排序,其中運維任務(wù)產(chǎn)生的時間可以為運維任務(wù)中的異常發(fā)生時間,也可以為接收模塊110接收運維任務(wù)的時間等。當(dāng)然,該隊列模塊120在確定各運維任務(wù)在任務(wù)隊列中的排序時,可同時參考各運維任務(wù)的優(yōu)先級來排序。在運維任務(wù)整合過程中,可以以被整合的運維任務(wù)中優(yōu)先級最高的運維任務(wù)作為整合后的運維任務(wù)的優(yōu)先級。
[0073]其中的任務(wù)分配模塊130,主要用于為所述任務(wù)隊列中的所述整合的運維任務(wù)分配運維管理平臺。
[0074]具體的,任務(wù)分配模塊130在為任務(wù)隊列中的整合的運維任務(wù)分配運維管理平臺時,可以根據(jù)預(yù)定的規(guī)則來分配,所述預(yù)定分配規(guī)則例如可以為:按照不同的異常描述的類型分配對應(yīng)的運維管理平臺;或者,按照不同異常所屬的模塊分配對應(yīng)的運維管理平臺等等。該預(yù)定的規(guī)則可根據(jù)需要來設(shè)置或更改。由于不同的運維管理平臺對應(yīng)不同的運維工作人員,為運維任務(wù)分配運維管理平臺,相當(dāng)于為運維任務(wù)分配對應(yīng)的運維工作人員來處理。
[0075]另外,該任務(wù)分配模塊130是為隊列模塊120中的整合的運維任務(wù)分配運維管理平臺,因此是按照隊列模塊120中的任務(wù)隊列中各運維任務(wù)的順序來為其分配運維管理平臺。
[0076]需要說明的是,本實施例任務(wù)分配模塊130在自動分配運維管理平臺失敗情況下,可以為運維任務(wù)重新分配其他運維管理平臺,也就是,本實施例對于由于各種原因?qū)е乱淮畏峙溥\維管理平臺失敗的運維任務(wù)可為其再次執(zhí)行分配操作,直到成功分配給對應(yīng)的運維管理平臺為止,以確保每個運維任務(wù)可以得到及時處理。
[0077]可選地,為提高運維任務(wù)處理效率,避免無效的運維任務(wù)進入任務(wù)隊列以及進入分配運維管理平臺的操作,本申請另一實施例所述的運維異常處理裝置如圖2中所示,其還可包括:過濾模塊140。
[0078]該過濾模塊140,主要用于過濾掉接收模塊100接收的運維任務(wù)中的無效運維任務(wù)。則可以理解的是,此時整合模塊I1整合的運維任務(wù)為經(jīng)過濾模塊140過濾后的運維任務(wù)。
[0079]其中一種實施例為:該過濾模塊140與所述接收模塊100相連,從接收模塊100中接收轉(zhuǎn)換后的統(tǒng)一格式的運維任務(wù)。該過濾模塊140過濾掉無效運維任務(wù)的操作,可以依照預(yù)定的過濾規(guī)則進行過濾,從而可以過濾掉無需進入本申請中后續(xù)處理步驟的運維任務(wù)。其中,可以針對不同的系統(tǒng)和模塊設(shè)置預(yù)定的過濾規(guī)則,包括利用正則過濾原則過濾掉無效運維任務(wù),例如,針對標準E-mail郵件模塊,可能會存在一些定期發(fā)送的通知郵件,而該類通知郵件不需要進行后續(xù)的分配到運維管理平臺的處理,因此,可以設(shè)置相應(yīng)的過濾規(guī)則將該類郵件過濾掉。
[0080]為避免出現(xiàn)錯誤過濾的現(xiàn)象,本申請實施例可提供相關(guān)的過濾日志和查看界面,通過該查看界面可以查看到已經(jīng)被過濾掉的運維任務(wù),并可提供恢復(fù)功能,以恢復(fù)過濾掉的運維任務(wù),也就是,若存在錯誤過濾的運維任務(wù),可進行恢復(fù)操作,以將其進入后續(xù)的處理環(huán)節(jié)。
[0081]可選地,本實施例所述裝置還可設(shè)置一權(quán)限管控模塊150(圖中未示出),該權(quán)限管控模塊150可保存用戶權(quán)限,根據(jù)用戶權(quán)限提供對應(yīng)的運維任務(wù)查詢以及操作界面。
[0082]本申請實施例所述運維異常處理裝置可對接收的運維任務(wù)中,具有關(guān)聯(lián)的運維任務(wù)進行整合,以集中處理該具有關(guān)聯(lián)的運維任務(wù),可有效縮短運維任務(wù)處理時間,從而提高運維異常處理效率。
[0083]以上所述為本申請實施例提供的運維異常處理裝置,基于上述裝置同樣的思路,本申請實施例還提供一種運維異常處理方法,圖3是根據(jù)本發(fā)明一個實施例的運維異常處理方法的流程圖。本發(fā)明中的方法主要通過計算機設(shè)備中的操作系統(tǒng)或處理控制器來完成。將操作系統(tǒng)或處理控制器稱為運維異常處理裝置。該計算機設(shè)備包括但不限于以下中的至少一個:用戶設(shè)備、網(wǎng)絡(luò)設(shè)備。用戶設(shè)備包括但不限于計算機、智能手機、PM等。網(wǎng)絡(luò)設(shè)備包括但不限于單個網(wǎng)絡(luò)服務(wù)器、多個網(wǎng)絡(luò)服務(wù)器組成的服務(wù)器組或基于云計算的由大量計算機或網(wǎng)絡(luò)服務(wù)器構(gòu)成的云,其中,云計算是分布式計算的一種,由一群松散耦合的計算機集組成的一個超級虛擬計算機。
[0084]如圖3中所示,本實施例所述運維異常處理方法主要包括如下步驟:
[0085]S300、接收運維任務(wù);
[0086]S310、將具有關(guān)聯(lián)的運維任務(wù)進行整合,得到整合的運維任務(wù);
[0087]S320、以任務(wù)隊列形式緩存所述整合的運維任務(wù);
[0088]S330、為所述任務(wù)隊列中所述整合的運維任務(wù)分配運維管理平臺。
[0089]下面對上述各步驟做進一步詳細介紹。
[0090]步驟S300中,接收運維任務(wù)的方法包括:接收運維操作中的異常數(shù)據(jù),并將所述異常數(shù)據(jù)轉(zhuǎn)換為統(tǒng)一格式的運維任務(wù)。也就是,本實施例可以將來自執(zhí)行運維操作的設(shè)備的不同模塊的、不同種類的、不同形式的運維異常數(shù)據(jù),轉(zhuǎn)換為統(tǒng)一格式的運維任務(wù),使得后續(xù)可以對統(tǒng)一格式的運維任務(wù)進行處理,從而可以減少介入運維異常處理裝置內(nèi)部系統(tǒng)的開發(fā)工作量,提高復(fù)用率。
[0091]其中,所述統(tǒng)一格式的運維任務(wù)可以包含如下信息中任一種或多種:異常設(shè)備所屬區(qū)域(例如,所屬機房)、異常所屬系統(tǒng)、異常所屬模塊、原始異常數(shù)據(jù)、處理優(yōu)先級等,其中原始異常數(shù)據(jù)包括轉(zhuǎn)換前的異常數(shù)據(jù)中的異常描述、異常所屬步驟、異常發(fā)生時間等等。
[0092]需要說明的是,接收的所述運維任務(wù)可以以執(zhí)行運維操作的設(shè)備為單位,也就是,接收的所述運維任務(wù)包括:以任一臺執(zhí)行運維操作的設(shè)備為單位的運維任務(wù),而并非現(xiàn)有技術(shù)中的以“操作單”為單位的運維任務(wù)?,F(xiàn)有技術(shù)中以“操作單”為單位的運維任務(wù),是將多臺執(zhí)行相同運維操作的設(shè)備的運維操作作為一個整體,生成一個運維操作的“操作單”,并以流程驅(qū)動該運維操作,若多臺設(shè)備中任一臺設(shè)備運維操作失敗,即使其他設(shè)備運維操作成功,則操作成功的運維設(shè)備也無法執(zhí)行后續(xù)操作,需所述多臺設(shè)備同時運維操作成功情況下才能執(zhí)行后續(xù)操作。而本實施例中以單臺設(shè)備的運維任務(wù)為一個單位,在該單臺設(shè)備成功執(zhí)行完一個運維操作后即可執(zhí)行下一個運維操作,與現(xiàn)有技術(shù)相比可有效提升運維操作效率。
[0093]另外,與現(xiàn)有技術(shù)中不同運維異常(即不同模塊發(fā)生的運維異常)對應(yīng)不同的接口相比,本實施例可通過針對任一臺執(zhí)行運維操作的設(shè)備提供的統(tǒng)一的接口接收該設(shè)備的各類運維任務(wù),也就是,針對一臺執(zhí)行運維操作的設(shè)備,無論出現(xiàn)任何種類的運維異常(即任何模塊發(fā)生運維異常),包括外包平臺異常、標準E-mail郵件組異常、iPlat(自動化平臺)異常等等,均可以通過統(tǒng)一的一個接口發(fā)送運維異常數(shù)據(jù),因此,與現(xiàn)有技術(shù)分散的異常信息相比本申請實施例避免了在發(fā)生不同運維異常時需要查找對應(yīng)的接口才能發(fā)送該異常數(shù)據(jù),對于提高異常處理效率提供幫助。
[0094]步驟S310中,將具有關(guān)聯(lián)的運維任務(wù)進行整合,最終可得到一個運維任務(wù),后續(xù)可對該具有關(guān)聯(lián)的運維任務(wù)作為一個任務(wù)來統(tǒng)一處理,以有效提高運維異常處理效率。
[0095]如圖4中所示,為根據(jù)本申請的一種實施例對具有關(guān)聯(lián)的運維任務(wù)進行整合操作的流程圖,具體可包括如下子步驟:
[0096]子步驟40、判斷任務(wù)隊列中是否存在與當(dāng)前接收的有效運維任務(wù)具有關(guān)聯(lián)的運維任務(wù)。
[0097]關(guān)于任務(wù)隊列將在對步驟S320的解釋中介紹。
[0098]其中,所述具有關(guān)聯(lián)的運維任務(wù)包括:同一物理空間范圍內(nèi)(例如同一機房)執(zhí)行運維操作的設(shè)備,在同一步驟中發(fā)生的,相同的異常問題產(chǎn)生的運維任務(wù)??赏ㄟ^判斷任務(wù)隊列中運維任務(wù)中的異常設(shè)備所屬區(qū)域、異常所屬步驟以及異常描述是否與當(dāng)前接收的運維任務(wù)的相應(yīng)內(nèi)容相同,來判斷任務(wù)隊列中是否存在與當(dāng)前接收的有效運維任務(wù)具有關(guān)聯(lián)的運維任務(wù)。
[0099]當(dāng)然,本實施例所述的具有關(guān)聯(lián)的運維任務(wù)并不局限于此,該具有關(guān)聯(lián)的運維任務(wù)還包括但不限于:同一類模塊的運維任務(wù)、或同一類系統(tǒng)的運維任務(wù)或同一類運維操作的運維任務(wù)等等,總之,該具有關(guān)聯(lián)的運維任務(wù)是可以統(tǒng)一集中處理的運維任務(wù)。
[0100]子步驟41、在判斷存在與當(dāng)前接收的運維任務(wù)具有關(guān)聯(lián)的運維任務(wù)情況下,將具有關(guān)聯(lián)的運維任務(wù)整合為一個運維任務(wù)。
[0101]可以理解的是,若判斷不存在與當(dāng)前接收的運維任務(wù)具有關(guān)聯(lián)的運維任務(wù)情況下,該整合后得到的整合的運維任務(wù)即為當(dāng)前接收的運維任務(wù)。
[0102]其中,整合后得到的整合的運維任務(wù)會以隊列任務(wù)形式緩存。
[0103]具體的,將具有關(guān)聯(lián)的運維任務(wù)整合為一個運維任務(wù)的過程可以包括:
[0104]在任務(wù)隊列中與當(dāng)前接收的運維任務(wù)具有關(guān)聯(lián)的運維任務(wù)中添加該當(dāng)前接收的運維任務(wù)的信息,以運維任務(wù)中的異常描述相同作為具有關(guān)聯(lián)的運維任務(wù)的判斷標準為例,為描述方便,將任務(wù)隊列中與當(dāng)前接收的運維任務(wù)具有關(guān)聯(lián)的運維任務(wù)簡稱為待添加運維任務(wù),在待添加運維任務(wù)中更新機器數(shù)量,例如,由原來的I臺增加為2臺;對于與當(dāng)前接收的運維任務(wù)中相同的描述可保持不變。整合的運維任務(wù)除包含接收的運維任務(wù)中的信息外,還可包括:運維任務(wù)編號、運維任務(wù)標題、當(dāng)前處理狀態(tài)等中的任一個或多個。
[0105]經(jīng)整合后得到的整合的運維任務(wù),可繼續(xù)緩存在任務(wù)隊列的原位置緩存。當(dāng)然,本申請實施例并不限定于此,也可將整合的運維任務(wù)作為新增加的運維任務(wù)添加到任務(wù)隊列的隊尾等等。
[0106]由前面對于整合過程的描述可知,該整合的運維任務(wù)可以為多個設(shè)備的運維任務(wù)整合后的一個運維任務(wù),也可以是一臺設(shè)備的運維任務(wù)(無具有關(guān)聯(lián)的運維任務(wù)的場景)。
[0107]如步驟S320中所述,本申請實施例通過使用任務(wù)隊列形式緩存所述整合的運維任務(wù),與直接采用實時的交互接口的方式相比,不但可以將未處理的運維任務(wù)進行整合,集中處理具有關(guān)聯(lián)的運維任務(wù),而且,還可以避免因為過多任務(wù)導(dǎo)致腳本超時等原因,造成的運維任務(wù)丟失等情況。
[0108]其中,可按照運維任務(wù)產(chǎn)生的時間先后順序?qū)θ蝿?wù)隊列中的運維任務(wù)進行排序,其中運維任務(wù)產(chǎn)生的時間可以為運維任務(wù)中的異常發(fā)生時間,也可以為接收運維任務(wù)的時間等。當(dāng)然,該在確定各運維任務(wù)在任務(wù)隊列中的排序時,可同時參考各運維任務(wù)的優(yōu)先級來排序。在運維任務(wù)整合過程中,可以以被整合的運維任務(wù)中優(yōu)先級最高的運維任務(wù)作為整合后的運維任務(wù)的優(yōu)先級。
[0109]步驟S330,是實現(xiàn)為所述任務(wù)隊列中的所述整合的運維任務(wù)分配運維管理平臺。
[0110]具體的,在為任務(wù)隊列中的整合的運維任務(wù)分配運維管理平臺時,可以根據(jù)預(yù)定的規(guī)則來分配,所述預(yù)定分配規(guī)則例如可以為:按照不同的異常描述的類型分配對應(yīng)的運維管理平臺;或者,按照不同異常所屬的模塊分配對應(yīng)的運維管理平臺等等。該預(yù)定的規(guī)則可根據(jù)需要來設(shè)置或更改。由于不同的運維管理平臺對應(yīng)不同的運維工作人員,為運維任務(wù)分配運維管理平臺,相當(dāng)于為運維任務(wù)分配對應(yīng)的運維工作人員來處理。
[0111]另外,在為任務(wù)隊列中整合的運維任務(wù)分配運維管理平臺時,可以按照任務(wù)隊列中各運維任務(wù)的順序來為其分配運維管理平臺。
[0112]需要說明的是,本實施例在自動分配運維管理平臺失敗情況下,可以為運維任務(wù)重新分配其他運維管理平臺,也就是,本實施例對于由于各種原因?qū)е乱淮畏峙溥\維管理平臺失敗的運維任務(wù)可為其再次執(zhí)行分配操作,直到成功分配給對應(yīng)的運維管理平臺為止,以確保每個運維任務(wù)可以得到及時處理。
[0113]為提高運維任務(wù)處理效率,避免無效的運維任務(wù)進入任務(wù)隊列以及進入分配運維管理平臺的操作,本申請實施例可以過濾掉接收的運維任務(wù)中的無效運維任務(wù),也就是在步驟S300之后,以及在步驟S310前,過濾掉無效運維任務(wù)。則可以理解的是,此時步驟S310中整合的運維任務(wù)為經(jīng)過過濾后的運維任務(wù)。
[0114]具體的,過濾掉無效運維任務(wù)的操作,可以依照預(yù)定的過濾規(guī)則進行過濾,從而可以過濾掉無需進入本申請中后續(xù)處理步驟的運維任務(wù)。其中,可以針對不同的系統(tǒng)和模塊設(shè)置預(yù)定的過濾規(guī)則,包括利用正則過濾原則過濾掉無效運維任務(wù),例如,針對標準E-mail郵件模塊,可能會存在一些定期發(fā)送的通知郵件,而該類通知郵件不需要進行后續(xù)的分配到運維管理平臺的處理,因此,可以設(shè)置相應(yīng)的過濾規(guī)則將該類郵件過濾掉。
[0115]為避免出現(xiàn)錯誤過濾的現(xiàn)象,本申請實施例可提供相關(guān)的過濾日志和查看界面,通過該查看界面可以查看到已經(jīng)被過濾掉的運維任務(wù),并可提供恢復(fù)功能,以恢復(fù)過濾掉的運維任務(wù),也就是,若存在錯誤過濾的運維任務(wù),可進行恢復(fù)操作,以將其進入后續(xù)的處理環(huán)節(jié)。
[0116]另外,本實施例還可設(shè)置不同用戶的不同權(quán)限,根據(jù)用戶權(quán)限提供對應(yīng)的運維任務(wù)查詢以及調(diào)整等操作界面給用戶。
[0117]為便于理解本實施例所述的運維異常處理方法,以處理服務(wù)器自助重裝過程中的異常為例。當(dāng)服務(wù)器自助重裝操作出現(xiàn)異常時,將會進入如下操作流程:
[0118]首先,接收異常數(shù)據(jù),并將該異常數(shù)據(jù)轉(zhuǎn)換成統(tǒng)一格式的運維任務(wù)。該統(tǒng)一格式的運維任務(wù)是SZJJH機房中的設(shè)備,在硬重啟過程中發(fā)生的異常,異常所在步驟為REBOOTH(18002);異常描述為 Can not get sn from ilo,ilo may not be accessible。
[0119]之后,判斷任務(wù)隊列中是否存在與該運維任務(wù)的設(shè)備在同一機房、異常步驟以及異常描述相同的運維任務(wù);
[0120]若沒有,則直接將該運維任務(wù)放入任務(wù)隊列中,等待后續(xù)處理;
[0121]若有,且任務(wù)隊列中關(guān)聯(lián)的運維任務(wù)包含的信息如下:
[0122]運維任務(wù)編號CASE:#79012 ;
[0123]運維任務(wù)標題:內(nèi)容為SZJJH機房;硬重啟(Can not get sn from ilo, ilo maynot be accessible);
[0124]當(dāng)前處理狀態(tài):待處理;
[0125]異常設(shè)備操作人:劉二 ;
[0126]更新時間:2014-11-0111:20:50(1 小時 35 分);
[0127]錯誤步驟:REBOOTH(18002);
[0128]錯誤描述:Can not get sn from ilo, ilo may not be accessible ;
[0129]機器數(shù)目:已交付:0/操作中:0/總數(shù)I ;
[0130]將上述兩個關(guān)聯(lián)的運維任務(wù)整合,整合后得到的整合的運維任務(wù)為:
[0131]運維任務(wù)編號CASE:#79012 ;
[0132]運維任務(wù)標題:內(nèi)容為SZJJH機房;硬重啟(Can not get sn from ilo, ilo maynot be accessible);
[0133]當(dāng)前處理狀態(tài):待處理;
[0134]異常設(shè)備操作人:劉二 ;
[0135]更新時間:2014-11-0111:20:50(1 小時 35 分);
[0136]錯誤步驟:REBOOTH(18002);
[0137]錯誤描述:Can not get sn from ilo, ilo may not be accessible ;
[0138]機器數(shù)目:已交付:0/操作中:0/總數(shù)2;
[0139]之后,將該整合的運維任務(wù)保持在原編號為#79012的運維任務(wù)所在位置,以集中處理該兩個運維任務(wù)。
[0140]最后,按照任務(wù)隊列中各運維任務(wù)的排序為各運維任務(wù)分配運維管理平臺,當(dāng)為上述整合的運維任務(wù)分配運維管理平臺時,可根據(jù)預(yù)定的規(guī)則,如指定機房的、重啟操作的運維任務(wù)對應(yīng)特定的運維管理平臺,則可從該特定的運維管理平臺中按照負載均衡原則選擇一臺分配給該運維任務(wù),也就是,將該運維任務(wù)發(fā)送到選擇的運維管理平臺。
[0141]按照上述流程,可處理運維操作中各個階段的、各類型的運維異常,直至設(shè)備交付。
[0142]綜上所述,本申請實施例所述運維異常處理裝置可對接收的運維任務(wù)中,具有關(guān)聯(lián)的運維任務(wù)進行整合,以集中處理該具有關(guān)聯(lián)的運維任務(wù),可有效縮短運維任務(wù)處理時間,從而提高運維異常處理效率。
[0143]所屬【技術(shù)領(lǐng)域】的技術(shù)人員知道,本發(fā)明可以實現(xiàn)為設(shè)備、裝置、方法或計算機程序產(chǎn)品。因此,本公開可以具體實現(xiàn)為以下形式,即:可以是完全的硬件,也可以是完全的軟件,還可以是硬件和軟件結(jié)合的形式。
[0144]附圖中的流程圖和框圖顯示了根據(jù)本發(fā)明的多個實施例的系統(tǒng)、方法和計算機程序產(chǎn)品的可能實現(xiàn)的體系架構(gòu)、功能和操作。在這點上,流程圖或框圖中的每個方框可以代表一個模塊、程序段或代碼的一部分,所述模塊、程序段或代碼的一部分包含一個或多個用于實現(xiàn)規(guī)定的邏輯功能的可執(zhí)行指令。也應(yīng)當(dāng)注意,在有些作為替換的實現(xiàn)中,方框中所標注的功能也可以以不同于附圖中所標注的順序發(fā)生。例如,兩個連續(xù)的方框?qū)嶋H上可以基本并行地執(zhí)行,它們有時也可以按相反的順序執(zhí)行,這依所涉及的功能而定。也要注意的是,框圖和/或流程圖中的每個方框、以及框圖和/或流程圖中的方框的組合,可以用執(zhí)行規(guī)定的功能或操作的專用的基于硬件的系統(tǒng)來實現(xiàn),或者可以用專用硬件與計算機指令的組合來實現(xiàn)。
[0145]對于本領(lǐng)域技術(shù)人員而言,顯然本發(fā)明不限于上述示范性實施例的細節(jié),而且在不背離本發(fā)明的精神或基本特征的情況下,能夠以其他的具體形式實現(xiàn)本發(fā)明。因此,無論從哪一點來看,均應(yīng)將實施例看作是示范性的,而且是非限制性的,本發(fā)明的范圍由所附權(quán)利要求而不是上述說明限定,因此旨在將落在權(quán)利要求的等同要件的含義和范圍內(nèi)的所有變化囊括在本發(fā)明內(nèi)。不應(yīng)將權(quán)利要求中的任何附圖標記視為限制所涉及的權(quán)利要求。
【權(quán)利要求】
1.一種運維異常處理裝置,其中,包括: 接收模塊,用于接收運維任務(wù); 整合模塊,用于將具有關(guān)聯(lián)的運維任務(wù)進行整合,得到整合的運維任務(wù); 隊列模塊,用于以任務(wù)隊列形式緩存所述整合的運維任務(wù); 任務(wù)分配模塊,用于為所述任務(wù)隊列中所述整合的運維任務(wù)分配運維管理平臺。
2.根據(jù)權(quán)利要求1所述的裝置,其中,所述接收模塊具體用于: 接收運維操作中的異常數(shù)據(jù),并將所述異常數(shù)據(jù)轉(zhuǎn)換為統(tǒng)一格式的運維任務(wù)。
3.根據(jù)權(quán)利要求1所述的裝置,其中,所述接收模塊接收的所述運維任務(wù)為以任一臺執(zhí)行運維操作的設(shè)備為單位的運維任務(wù)。
4.根據(jù)權(quán)利要求3中所述的裝置,其中,所述接收模塊針對任一臺執(zhí)行運維操作的設(shè)備提供統(tǒng)一的接口接收所述設(shè)備的各類運維任務(wù)。
5.根據(jù)權(quán)利要求1所述的裝置,其中,所述整合模塊包括: 判斷子模塊,用于判斷任務(wù)隊列中是否存在與當(dāng)前接收的運維任務(wù)具有關(guān)聯(lián)的運維任務(wù); 整合子模塊,用于在判斷子模塊判斷存在與當(dāng)前接收的運維任務(wù)具有關(guān)聯(lián)的運維任務(wù)情況下,將具有關(guān)聯(lián)的運維任務(wù)整合為一個運維任務(wù)。
6.根據(jù)權(quán)利要求1或5所述的裝置,其中,所述具有關(guān)聯(lián)的運維任務(wù)包括: 同一物理空間范圍內(nèi)執(zhí)行運維操作的設(shè)備,在同一步驟中發(fā)生的,相同的異常問題產(chǎn)生的運維任務(wù)。
7.根據(jù)權(quán)利要求1所述的裝置,其中,還包括: 過濾模塊,用于過濾掉接收模塊接收的運維任務(wù)中的無效運維任務(wù)。
8.根據(jù)權(quán)利要求1所述的裝置,其中,所述任務(wù)分配模塊還用于: 在分配運維管理平臺失敗情況下,為運維任務(wù)重新分配其他運維管理平臺。
9.一種運維異常處理方法,其中,包括: 接收運維任務(wù); 將具有關(guān)聯(lián)的運維任務(wù)進行整合,得到整合的運維任務(wù); 以任務(wù)隊列形式緩存所述整合的運維任務(wù); 為所述任務(wù)隊列中所述整合的運維任務(wù)分配運維管理平臺。
10.根據(jù)權(quán)利要求9所述的方法,其中,所述接收運維任務(wù)包括: 接收運維操作中的異常數(shù)據(jù),并將所述異常數(shù)據(jù)轉(zhuǎn)換為統(tǒng)一格式的運維任務(wù)。
11.根據(jù)權(quán)利要求9所述的方法,其中,接收的所述運維任務(wù)包括: 以任一臺執(zhí)行運維操作的設(shè)備為單位的運維任務(wù)。
12.根據(jù)權(quán)利要求11所述的方法,其中,所述接收運維任務(wù)包括: 通過針對任一臺執(zhí)行運維操作的設(shè)備提供的統(tǒng)一的接口接收所述設(shè)備的各類運維任務(wù)。
13.根據(jù)權(quán)利要求9所述的方法,其中,所述將具有關(guān)聯(lián)的運維任務(wù)進行整合包括: 判斷任務(wù)隊列中是否存在與當(dāng)前接收的運維任務(wù)具有關(guān)聯(lián)的運維任務(wù); 在存在與當(dāng)前接收的運維任務(wù)具有關(guān)聯(lián)的運維任務(wù)情況下,將具有關(guān)聯(lián)的運維任務(wù)整合為一個運維任務(wù)。
14.根據(jù)權(quán)利要求9或13所述的方法,其中,所述具有關(guān)聯(lián)的運維任務(wù)包括: 同一物理空間范圍內(nèi)執(zhí)行運維操作的設(shè)備,在同一步驟中發(fā)生的,相同的異常問題產(chǎn)生的運維任務(wù)。
15.根據(jù)權(quán)利要求9所述的方法,其中,還包括: 過濾掉接收的所述運維任務(wù)中的無效運維任務(wù)。
16.根據(jù)權(quán)利要求9所述的方法,其中,還包括: 若分配運維管理平臺失敗,則重新分配其他運維管理平臺。
17.一種計算機設(shè)備,包括根據(jù)權(quán)利要求1-8中任一個的運維異常處理裝置。
【文檔編號】G06Q10/06GK104504495SQ201410705749
【公開日】2015年4月8日 申請日期:2014年11月27日 優(yōu)先權(quán)日:2014年11月27日
【發(fā)明者】凌婧, 李博 申請人:北京百度網(wǎng)訊科技有限公司