本發(fā)明涉及計算機技術(shù)領(lǐng)域,尤具體地說是一種實用性強、高可用集群節(jié)點安全狀態(tài)監(jiān)控方法及系統(tǒng)。
背景技術(shù):
計算機系統(tǒng)已全面進入“云計算”、“大數(shù)據(jù)”時代,由大規(guī)模服務(wù)器集群響應(yīng)海量請求和處理海量數(shù)據(jù)已經(jīng)成為必然趨勢。但是僅僅具有高性能計算能力的集群系統(tǒng)還遠(yuǎn)遠(yuǎn)不能滿足這種大規(guī)模應(yīng)用的需要,它必須還能夠提供連續(xù)的服務(wù)。所以如何提高集群系統(tǒng)的可用性,盡最大可能避免因系統(tǒng)失效而導(dǎo)致的嚴(yán)重后果,并設(shè)計可擴展的高可用集群系統(tǒng),已經(jīng)成為當(dāng)前集群系統(tǒng)研究的熱點問題之一。
高可用集群的出現(xiàn)是為了使集群的整體服務(wù)盡可能可用,從而減少由計算機硬件和軟件易錯性所帶來的損失。如果某個節(jié)點失效,其他節(jié)點將在幾秒鐘的時間內(nèi)接管它的職責(zé),從而實現(xiàn)業(yè)務(wù)永不中斷。
高可用集群是一個比較復(fù)雜的系統(tǒng),通常由若干個計算機節(jié)點組成,而每個計算機節(jié)點上又運行著各種各樣的資源。對集群中各個節(jié)點的安全狀態(tài)進行監(jiān)控是集群管理的重要組成部分。集群系統(tǒng)獲得的數(shù)據(jù)可以用于集群系統(tǒng)資源的分配和利用,用戶也可以得知節(jié)點是否出現(xiàn)故障或者提前采取相關(guān)措施防范故障的發(fā)生,最終保證集群的安全性、可靠性。
傳統(tǒng)集群管理軟件沒有對節(jié)點的安全狀態(tài)進行驗證,如果節(jié)點安全性遭到破壞,執(zhí)行惡意代碼,非常容易形成安全隱患。為了確保集群系統(tǒng)運行環(huán)境的安全可靠,本發(fā)明提出了一種高可用集群節(jié)點安全狀態(tài)監(jiān)控方法及系統(tǒng)。
技術(shù)實現(xiàn)要素:
本發(fā)明的技術(shù)任務(wù)是針對以上不足之處,提供一種實用性強、高可用集群節(jié)點安全狀態(tài)監(jiān)控方法及系統(tǒng)。
一種高可用集群節(jié)點安全狀態(tài)監(jiān)控方法,基于由監(jiān)控節(jié)點、管理節(jié)點、若干業(yè)務(wù)節(jié)點組成的集群,其實現(xiàn)過程為,監(jiān)控節(jié)點對集群中各個業(yè)務(wù)節(jié)點的安全狀態(tài)進行檢測,當(dāng)檢測到某個業(yè)務(wù)節(jié)點不安全時,及時的將該業(yè)務(wù)節(jié)點上的服務(wù)進行遷移至其它業(yè)務(wù)節(jié)點,同時將該業(yè)務(wù)節(jié)點進行隔離。
所述監(jiān)控節(jié)點、管理節(jié)點部署配置管理模塊,其他業(yè)務(wù)節(jié)點部署配置代理模塊,其中,代理模塊收集所處業(yè)務(wù)節(jié)點的狀態(tài)信息,并發(fā)送給監(jiān)控節(jié)點、管理節(jié)點,監(jiān)控節(jié)點通過管理模塊對收集的安全狀態(tài)信息進行分析,判斷業(yè)務(wù)節(jié)點是否安全;管理節(jié)點則根據(jù)分析結(jié)果,通過管理模塊對收集的資源信息進行管理,實現(xiàn)對業(yè)務(wù)節(jié)點的資源管理。
監(jiān)控節(jié)點、管理節(jié)點對收集到的狀態(tài)信息進行處理的過程為:
首先進行文件完整性度量,監(jiān)控節(jié)點分析度量業(yè)務(wù)節(jié)點文件的完整性,如果文件度量不通過,說明文件完成性被破壞,則判斷該業(yè)務(wù)節(jié)點不安全;
然后進行程序檢測,分析業(yè)務(wù)節(jié)點中的程序是否包含在程序白名單中,如果程序不包含在白名單中,說明運行了非法程序,則判斷該業(yè)務(wù)節(jié)點不安全;
針對信息的分析結(jié)果,如果判定業(yè)務(wù)節(jié)點不安全則將該業(yè)務(wù)節(jié)點上的服務(wù)進行遷移,同時將該業(yè)務(wù)節(jié)點進行隔離。
文件完整性度量的具體過程為:調(diào)用tcm芯片雜湊算法對業(yè)務(wù)節(jié)點操作系統(tǒng)的文件進行雜湊計算,獲得雜湊值,將所得雜湊值與監(jiān)控節(jié)點上本地存儲的操作系統(tǒng)文件預(yù)期值進行對比,如果相同說明該業(yè)務(wù)節(jié)點操作系統(tǒng)完整性未被破壞,否則該節(jié)點完整性被破壞,處于非安全狀態(tài)。
程序檢測的具體過程為:與運行控制白名單逐一匹配,如果存在于白名單則調(diào)用tcm密碼算法計算程序雜湊值,將雜湊值與白名單內(nèi)保存的預(yù)期值對比,相等則表示程序合法;如果白名單中不存在或者預(yù)期值不一致則表示該程序不合法,業(yè)務(wù)節(jié)點處于非安全狀態(tài)。
一種高可用集群節(jié)點安全狀態(tài)監(jiān)控系統(tǒng),包括監(jiān)控節(jié)點、管理節(jié)點、若干業(yè)務(wù)節(jié)點組成的集群,其中,監(jiān)控節(jié)點、管理節(jié)點部署配置管理模塊,其他業(yè)務(wù)節(jié)點部署配置代理模塊,其中,代理模塊收集所處業(yè)務(wù)節(jié)點的狀態(tài)信息,并發(fā)送給監(jiān)控節(jié)點、管理節(jié)點,監(jiān)控節(jié)點通過管理模塊對收集的安全狀態(tài)信息進行分析,判斷業(yè)務(wù)節(jié)點是否安全;管理節(jié)點則根據(jù)分析結(jié)果,通過管理模塊對收集的資源信息進行管理,實現(xiàn)對業(yè)務(wù)節(jié)點的資源管理。
監(jiān)控節(jié)點、管理節(jié)點對收集到的狀態(tài)信息進行處理,首先度量文件完整度,然后進行程序檢測,當(dāng)文件完整度度量不通過,或程序檢測過程中程序不包含在白名單中,則判斷業(yè)務(wù)節(jié)點不安全,則根據(jù)判斷結(jié)果,對該業(yè)務(wù)節(jié)點上的服務(wù)進行遷移,同時將該業(yè)務(wù)節(jié)點進行隔離。
監(jiān)控節(jié)點、管理節(jié)點對收集到的狀態(tài)信息進行處理過程為:
進行文件完整性度量,監(jiān)控節(jié)點分析度量業(yè)務(wù)節(jié)點文件的完整性,如果文件度量不通過,說明文件完成性被破壞,則判斷該業(yè)務(wù)節(jié)點不安全;
然后進行程序檢測,分析業(yè)務(wù)節(jié)點中的程序是否包含在程序白名單中,如果程序不包含在白名單中,說明運行了非法程序,則判斷該業(yè)務(wù)節(jié)點不安全。
文件完整性度量的具體過程為:調(diào)用tcm芯片雜湊算法對業(yè)務(wù)節(jié)點操作系統(tǒng)的文件進行雜湊計算,獲得雜湊值,將所得雜湊值與監(jiān)控節(jié)點上本地存儲的操作系統(tǒng)文件預(yù)期值進行對比,如果相同說明該業(yè)務(wù)節(jié)點操作系統(tǒng)完整性未被破壞,否則該節(jié)點完整性被破壞,處于非安全狀態(tài)。
程序檢測的具體過程為:與運行控制白名單逐一匹配,如果存在于白名單則調(diào)用tcm密碼算法計算程序雜湊值,將雜湊值與白名單內(nèi)保存的預(yù)期值對比,相等則表示程序合法;如果白名單中不存在或者預(yù)期值不一致則表示該程序不合法,業(yè)務(wù)節(jié)點處于非安全狀態(tài)。
本發(fā)明的一種高可用集群節(jié)點安全狀態(tài)監(jiān)控方法及系統(tǒng),具有以下優(yōu)點:
本發(fā)明的一種高可用集群節(jié)點安全狀態(tài)監(jiān)控方法及系統(tǒng),本發(fā)明通過文件完整性度量、程序白名單機制等措施提高了業(yè)務(wù)節(jié)點的系統(tǒng)安全級別,可以及時發(fā)現(xiàn)系統(tǒng)中存在的潛在威脅;當(dāng)業(yè)務(wù)節(jié)點的系統(tǒng)遭受破壞后,資源管理模塊會將該節(jié)點上的服務(wù)遷移到其他業(yè)務(wù)節(jié)點上,使得業(yè)務(wù)資源能夠在安全可信的環(huán)境中運行,提高系統(tǒng)的安全性,實用性強,適用范圍廣泛,易于推廣。
附圖說明
附圖1為本發(fā)明的實現(xiàn)示意圖。
具體實施方式
下面結(jié)合附圖和具體實施例對本發(fā)明作進一步說明。
如附圖1所示,一種高可用集群節(jié)點安全狀態(tài)監(jiān)控方法,該方法通過監(jiān)控節(jié)點對集群中各個節(jié)點安全狀態(tài)進行檢測,當(dāng)檢測到節(jié)點不安全時,及時的將該節(jié)點上的服務(wù)進行遷移,同時將該節(jié)點進行隔離。
本發(fā)明基于由監(jiān)控節(jié)點、管理節(jié)點、若干業(yè)務(wù)節(jié)點組成的集群,其實現(xiàn)過程為,監(jiān)控節(jié)點對集群中各個業(yè)務(wù)節(jié)點的安全狀態(tài)進行檢測,當(dāng)檢測到某個業(yè)務(wù)節(jié)點不安全時,及時的將該業(yè)務(wù)節(jié)點上的服務(wù)進行遷移至其它業(yè)務(wù)節(jié)點,同時將該業(yè)務(wù)節(jié)點進行隔離。
所述監(jiān)控節(jié)點、管理節(jié)點部署配置管理模塊,其他業(yè)務(wù)節(jié)點部署配置代理模塊,其中,代理模塊收集所處業(yè)務(wù)節(jié)點的狀態(tài)信息,并發(fā)送給監(jiān)控節(jié)點、管理節(jié)點,監(jiān)控節(jié)點通過管理模塊對收集的安全狀態(tài)信息進行分析,判斷業(yè)務(wù)節(jié)點是否安全;管理節(jié)點則根據(jù)分析結(jié)果,通過管理模塊對收集的資源信息進行管理,實現(xiàn)對業(yè)務(wù)節(jié)點的資源管理。
代理模塊一般是指可信代理軟件,管理模塊一般是指可信管理軟件。
本發(fā)明設(shè)計的節(jié)點安全狀態(tài)監(jiān)控方法采取集中式體系結(jié)構(gòu),在集群中每個業(yè)務(wù)節(jié)點上都設(shè)置一個可信代理軟件,可信代理軟件負(fù)責(zé)獲取本節(jié)點的狀態(tài)信息,并響應(yīng)監(jiān)控系統(tǒng)的監(jiān)控命令??尚殴芾碥浖?fù)責(zé)收取各監(jiān)控代理得到的節(jié)點狀態(tài)信息,用于判斷節(jié)點是否安全。
監(jiān)控節(jié)點、管理節(jié)點對收集到的狀態(tài)信息進行處理的過程為:
首先進行文件完整性度量,監(jiān)控節(jié)點分析度量業(yè)務(wù)節(jié)點文件的完整性,如果文件度量不通過,說明文件完成性被破壞,則判斷該業(yè)務(wù)節(jié)點不安全;
然后進行程序檢測,分析業(yè)務(wù)節(jié)點中的程序是否包含在程序白名單中,如果程序不包含在白名單中,說明運行了非法程序,則判斷該業(yè)務(wù)節(jié)點不安全;
針對信息的分析結(jié)果,如果判定業(yè)務(wù)節(jié)點不安全則將該業(yè)務(wù)節(jié)點上的服務(wù)進行遷移,同時將該業(yè)務(wù)節(jié)點進行隔離。
文件完整性度量的具體過程為:調(diào)用tcm芯片雜湊算法對業(yè)務(wù)節(jié)點操作系統(tǒng)的文件進行雜湊計算,獲得雜湊值,將所得雜湊值與監(jiān)控節(jié)點上本地存儲的操作系統(tǒng)文件預(yù)期值進行對比,如果相同說明該業(yè)務(wù)節(jié)點操作系統(tǒng)完整性未被破壞,否則該節(jié)點完整性被破壞,處于非安全狀態(tài)。
程序檢測的具體過程為:與運行控制白名單逐一匹配,如果存在于白名單則調(diào)用tcm密碼算法計算程序雜湊值,將雜湊值與白名單內(nèi)保存的預(yù)期值對比,相等則表示程序合法;如果白名單中不存在或者預(yù)期值不一致則表示該程序不合法,業(yè)務(wù)節(jié)點處于非安全狀態(tài)。
一種高可用集群節(jié)點安全狀態(tài)監(jiān)控系統(tǒng),包括監(jiān)控節(jié)點、管理節(jié)點、若干業(yè)務(wù)節(jié)點組成的集群,其中,監(jiān)控節(jié)點、管理節(jié)點部署配置管理模塊,其他業(yè)務(wù)節(jié)點部署配置代理模塊,其中,代理模塊收集所處業(yè)務(wù)節(jié)點的狀態(tài)信息,并發(fā)送給監(jiān)控節(jié)點、管理節(jié)點,監(jiān)控節(jié)點通過管理模塊對收集的安全狀態(tài)信息進行分析,判斷業(yè)務(wù)節(jié)點是否安全;管理節(jié)點則根據(jù)分析結(jié)果,通過管理模塊對收集的資源信息進行管理,實現(xiàn)對業(yè)務(wù)節(jié)點的資源管理。
監(jiān)控節(jié)點、管理節(jié)點對收集到的狀態(tài)信息進行處理,首先度量文件完整度,然后進行程序檢測,當(dāng)文件完整度度量不通過,或程序檢測過程中程序不包含在白名單中,則判斷業(yè)務(wù)節(jié)點不安全,則根據(jù)判斷結(jié)果,對該業(yè)務(wù)節(jié)點上的服務(wù)進行遷移,同時將該業(yè)務(wù)節(jié)點進行隔離。
監(jiān)控節(jié)點、管理節(jié)點對收集到的狀態(tài)信息進行處理過程為:
進行文件完整性度量,監(jiān)控節(jié)點分析度量業(yè)務(wù)節(jié)點文件的完整性,如果文件度量不通過,說明文件完成性被破壞,則判斷該業(yè)務(wù)節(jié)點不安全;
然后進行程序檢測,分析業(yè)務(wù)節(jié)點中的程序是否包含在程序白名單中,如果程序不包含在白名單中,說明運行了非法程序,則判斷該業(yè)務(wù)節(jié)點不安全。
文件完整性度量的具體過程為:調(diào)用tcm芯片雜湊算法對業(yè)務(wù)節(jié)點操作系統(tǒng)的文件進行雜湊計算,獲得雜湊值,將所得雜湊值與監(jiān)控節(jié)點上本地存儲的操作系統(tǒng)文件預(yù)期值進行對比,如果相同說明該業(yè)務(wù)節(jié)點操作系統(tǒng)完整性未被破壞,否則該節(jié)點完整性被破壞,處于非安全狀態(tài)。
程序檢測的具體過程為:與運行控制白名單逐一匹配,如果存在于白名單則調(diào)用tcm密碼算法計算程序雜湊值,將雜湊值與白名單內(nèi)保存的預(yù)期值對比,相等則表示程序合法;如果白名單中不存在或者預(yù)期值不一致則表示該程序不合法,業(yè)務(wù)節(jié)點處于非安全狀態(tài)。
上述具體實施方式僅是本發(fā)明的具體個案,本發(fā)明的專利保護范圍包括但不限于上述具體實施方式,任何符合本發(fā)明的一種高可用集群節(jié)點安全狀態(tài)監(jiān)控方法及系統(tǒng)的權(quán)利要求書的且任何所述技術(shù)領(lǐng)域的普通技術(shù)人員對其所做的適當(dāng)變化或替換,皆應(yīng)落入本發(fā)明的專利保護范圍。