本發(fā)明涉及云,特別是涉及一種業(yè)務(wù)快照容錯(cuò)方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)。
背景技術(shù):
1、在現(xiàn)有的實(shí)施方法中kubernetes(容器集群管理系統(tǒng))可以通過(guò)存活探針用于檢測(cè)業(yè)務(wù)pod(即容器)是否存活,來(lái)實(shí)現(xiàn)對(duì)業(yè)務(wù)的狀態(tài)及健康情況監(jiān)管。如果探針失敗,kubernetes會(huì)重啟pod,以此來(lái)避免由于硬件故障或者業(yè)務(wù)異常導(dǎo)致的pod崩潰退出。
2、但在實(shí)際操作中,該方法的故障恢復(fù)需要人工干預(yù),這不僅增加了恢復(fù)時(shí)間,也提高了操作的復(fù)雜性和出錯(cuò)率。并且,在一些規(guī)模較大的容器集群中,一方面快照未考慮業(yè)務(wù)響應(yīng)的實(shí)時(shí)變化,以及快照備份對(duì)業(yè)務(wù)性能的影響,另一方面,當(dāng)集群中有較多業(yè)務(wù)容器需要快照備份時(shí),無(wú)法對(duì)一些重要業(yè)務(wù)進(jìn)行及時(shí)快照備份。
3、可見(jiàn),如何在無(wú)需人工干預(yù)的情況下,有效且及時(shí)地針對(duì)不同重要程度的業(yè)務(wù)實(shí)現(xiàn)快照備份與恢復(fù),從而提升容錯(cuò)能力,是本領(lǐng)域技術(shù)人員需要解決的問(wèn)題。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明實(shí)施例的目的是提供一種業(yè)務(wù)快照容錯(cuò)方法、裝置、設(shè)備及存儲(chǔ)介質(zhì),能夠在無(wú)需人工干預(yù)的情況下,有效且及時(shí)地針對(duì)不同重要程度的業(yè)務(wù)實(shí)現(xiàn)快照備份與恢復(fù)的自動(dòng)化,從而提升了云平臺(tái)的容錯(cuò)能力,進(jìn)而提高了云平臺(tái)中容器集群的穩(wěn)定性和可靠性,減少因故障導(dǎo)致的業(yè)務(wù)中斷時(shí)間。
2、為解決上述技術(shù)問(wèn)題,本發(fā)明實(shí)施例提供一種業(yè)務(wù)快照容錯(cuò)方法,應(yīng)用于云平臺(tái),包括:
3、基于預(yù)設(shè)快照任務(wù)定時(shí)觸發(fā)規(guī)則并利用預(yù)先配置好的快照記錄表中記錄的快照信息生成相應(yīng)的待處理快照任務(wù),以得到待處理快照任務(wù)列表;
4、基于所述待處理快照任務(wù)列表中各待處理快照任務(wù)分別對(duì)應(yīng)的服務(wù)性能數(shù)據(jù)與預(yù)設(shè)性能閾值之間的大小關(guān)系,確定與各所述待處理快照任務(wù)對(duì)應(yīng)的目標(biāo)任務(wù)權(quán)重,并利用所述目標(biāo)任務(wù)權(quán)重對(duì)各所述待處理快照任務(wù)進(jìn)行排序以得到排序后列表;
5、判斷所述排序后列表中的各所述待處理快照任務(wù)的快照歷史記錄數(shù)據(jù)是否超出預(yù)設(shè)快照數(shù)據(jù)量上限,并根據(jù)得到的各快照判斷結(jié)果觸發(fā)對(duì)應(yīng)的快照備份操作;
6、若在執(zhí)行任一快照備份操作的過(guò)程中發(fā)生故障容錯(cuò),則在基于初始業(yè)務(wù)鏡像完成第一環(huán)境恢復(fù)后基于與目標(biāo)快照任務(wù)對(duì)應(yīng)的業(yè)務(wù)標(biāo)識(shí)進(jìn)行快照記錄查詢,并根據(jù)查詢結(jié)果進(jìn)行第二環(huán)境恢復(fù)以完成相應(yīng)的快照恢復(fù)操作;所述目標(biāo)快照任務(wù)為所述任一快照備份操作對(duì)應(yīng)的所述待處理快照任務(wù)。
7、可選的,所述基于預(yù)設(shè)快照任務(wù)定時(shí)觸發(fā)規(guī)則并利用預(yù)先配置好的快照記錄表中記錄的快照信息生成相應(yīng)的待處理快照任務(wù),以得到待處理快照任務(wù)列表,包括:
8、基于預(yù)設(shè)參數(shù)以及預(yù)設(shè)時(shí)間信息定時(shí)獲取快照記錄表中快照任務(wù)狀態(tài)值為第一預(yù)設(shè)值的記錄,以得到第一目標(biāo)記錄;其中,所述預(yù)設(shè)參數(shù)包括快照任務(wù)數(shù)量閾值、業(yè)務(wù)窗口時(shí)長(zhǎng);所述第一目標(biāo)記錄中的快照信息包括業(yè)務(wù)權(quán)重、預(yù)設(shè)性能閾值、業(yè)務(wù)標(biāo)識(shí)、預(yù)設(shè)性能期望值、所述快照任務(wù)狀態(tài)值、初始任務(wù)權(quán)重、記錄創(chuàng)建時(shí)間以及記錄更新時(shí)間,并且,所述快照任務(wù)狀態(tài)值為所述第一預(yù)設(shè)值時(shí)表征快照任務(wù)處于待執(zhí)行狀態(tài);
9、基于各所述第一目標(biāo)記錄分別確定對(duì)應(yīng)的待處理快照任務(wù),以得到包括多個(gè)所述待處理快照任務(wù)的待處理快照任務(wù)列表。
10、可選的,所述基于所述待處理快照任務(wù)列表中各待處理快照任務(wù)分別對(duì)應(yīng)的服務(wù)性能數(shù)據(jù)與預(yù)設(shè)性能閾值之間的大小關(guān)系,確定與各所述待處理快照任務(wù)對(duì)應(yīng)的目標(biāo)任務(wù)權(quán)重,包括:
11、基于與所述待處理快照任務(wù)列表中的任一待處理快照任務(wù)對(duì)應(yīng)的所述業(yè)務(wù)標(biāo)識(shí)獲取所述任一待處理快照任務(wù)在所述業(yè)務(wù)窗口時(shí)長(zhǎng)的服務(wù)性能數(shù)據(jù);
12、利用所述服務(wù)性能數(shù)據(jù)和與所述任一待處理快照任務(wù)對(duì)應(yīng)的預(yù)設(shè)性能閾值進(jìn)行對(duì)比,以得到相應(yīng)的大小關(guān)系;
13、若所述大小關(guān)系表明所述服務(wù)性能數(shù)據(jù)不大于所述預(yù)設(shè)性能閾值,則在所述服務(wù)性能數(shù)據(jù)與對(duì)應(yīng)的所述預(yù)設(shè)性能期望值之間的差值未超出預(yù)設(shè)范圍時(shí),基于與所述任一待處理快照任務(wù)對(duì)應(yīng)的所述業(yè)務(wù)權(quán)重以及當(dāng)前所述待處理快照任務(wù)列表中的快照間隔確定與所述任一待處理快照任務(wù)對(duì)應(yīng)的目標(biāo)任務(wù)權(quán)重;
14、基于快照任務(wù)不重復(fù)挑選原則重新跳轉(zhuǎn)至所述基于與所述待處理快照任務(wù)列表中的任一待處理快照任務(wù)對(duì)應(yīng)的所述業(yè)務(wù)標(biāo)識(shí)獲取所述任一待處理快照任務(wù)在所述業(yè)務(wù)窗口時(shí)長(zhǎng)的服務(wù)性能數(shù)據(jù)的步驟,直至完成對(duì)所述待處理快照任務(wù)列表的遍歷。
15、可選的,所述得到相應(yīng)的大小關(guān)系之后,還包括:
16、若所述大小關(guān)系表明所述服務(wù)性能數(shù)據(jù)大于所述預(yù)設(shè)性能閾值,則對(duì)所述待處理快照任務(wù)列表中的所述快照間隔進(jìn)行更新,并將所述任一待處理快照任務(wù)從所述待處理快照任務(wù)列表中刪除。
17、可選的,所述判斷所述排序后列表中的各所述待處理快照任務(wù)的快照歷史記錄數(shù)據(jù)是否超出預(yù)設(shè)快照數(shù)據(jù)量上限,并根據(jù)得到的各快照判斷結(jié)果觸發(fā)對(duì)應(yīng)的快照備份操作,包括:
18、基于所述快照記錄表獲取與所述排序后列表中所述目標(biāo)任務(wù)權(quán)重最大的第一待處理快照任務(wù)對(duì)應(yīng)的快照歷史記錄數(shù)據(jù);
19、判斷所述快照歷史記錄數(shù)據(jù)的數(shù)據(jù)量是否已超出預(yù)設(shè)快照數(shù)據(jù)量上限,以得到相應(yīng)的數(shù)據(jù)量判斷結(jié)果;
20、當(dāng)所述數(shù)據(jù)量判斷結(jié)果表明已超出所述預(yù)設(shè)快照數(shù)據(jù)量上限時(shí),則對(duì)所述快照記錄表中與所述第一待處理快照任務(wù)對(duì)應(yīng)的最早的歷史快照記錄進(jìn)行刪除,并基于與所述第一待處理快照任務(wù)對(duì)應(yīng)的業(yè)務(wù)運(yùn)行情況進(jìn)行快照任務(wù)狀態(tài)更新以及快照地址更新;
21、當(dāng)所述數(shù)據(jù)量判斷結(jié)果表明未超出所述預(yù)設(shè)快照數(shù)據(jù)量上限時(shí),則基于所述第一待處理快照任務(wù)對(duì)應(yīng)的業(yè)務(wù)運(yùn)行節(jié)點(diǎn)以及容器信息進(jìn)行快照備份,以得到相應(yīng)的備份結(jié)果;
22、若所述備份結(jié)果表明備份成功,則更新與所述第一待處理快照任務(wù)對(duì)應(yīng)的快照任務(wù)狀態(tài)值,并在所述快照記錄表中創(chuàng)建一條新的所述快照任務(wù)狀態(tài)值為所述第一預(yù)設(shè)值的記錄;
23、若所述備份結(jié)果表明備份失敗,則更新與所述排序后列表對(duì)應(yīng)的快照間隔,并調(diào)用預(yù)設(shè)報(bào)警組件觸發(fā)相應(yīng)的快照備份警報(bào)。
24、可選的,所述在基于初始業(yè)務(wù)鏡像完成第一環(huán)境恢復(fù)后基于與目標(biāo)快照任務(wù)對(duì)應(yīng)的業(yè)務(wù)標(biāo)識(shí)進(jìn)行快照記錄查詢,并根據(jù)查詢結(jié)果進(jìn)行第二環(huán)境恢復(fù)以完成相應(yīng)的快照恢復(fù)操作,包括:
25、在基于容器集群管理系統(tǒng)以及與所述目標(biāo)快照任務(wù)對(duì)應(yīng)的初始業(yè)務(wù)鏡像進(jìn)行第一環(huán)境恢復(fù)后,基于與所述目標(biāo)快照任務(wù)對(duì)應(yīng)的業(yè)務(wù)標(biāo)識(shí)查詢所述快照記錄表中快照任務(wù)狀態(tài)值為第二預(yù)設(shè)值的記錄,以得到相應(yīng)的查詢結(jié)果;所述快照任務(wù)狀態(tài)值為所述第二預(yù)設(shè)值時(shí)表征快照任務(wù)處于已成功執(zhí)行狀態(tài);
26、根據(jù)所述查詢結(jié)果選擇更新時(shí)間最新的記錄中的快照地址,并通過(guò)預(yù)設(shè)命令將經(jīng)過(guò)所述第一環(huán)境恢復(fù)的業(yè)務(wù)環(huán)境升級(jí)為與所述快照地址對(duì)應(yīng)的快照環(huán)境,以完成相應(yīng)的快照恢復(fù)操作。
27、可選的,所述方法還包括:
28、當(dāng)觸發(fā)快照清理操作時(shí),基于目標(biāo)待清理快照任務(wù)的目標(biāo)業(yè)務(wù)標(biāo)識(shí)獲取所述快照記錄表中快照任務(wù)狀態(tài)值為所述第二預(yù)設(shè)值的記錄,以得到相應(yīng)的第二目標(biāo)記錄;
29、根據(jù)所述第二目標(biāo)記錄中的快照地址進(jìn)行快照數(shù)據(jù)刪除,并將對(duì)應(yīng)的所述快照任務(wù)狀態(tài)值更新為第三預(yù)設(shè)值;
30、若當(dāng)前滿足預(yù)設(shè)條件,則基于所述目標(biāo)業(yè)務(wù)標(biāo)識(shí)對(duì)所述快照記錄表中所述快照任務(wù)狀態(tài)值為第一預(yù)設(shè)值的第三目標(biāo)記錄進(jìn)行刪除。
31、第二方面,本發(fā)明實(shí)施例提供一種業(yè)務(wù)快照容錯(cuò)裝置,應(yīng)用于云平臺(tái),包括:
32、任務(wù)列表獲取模塊,用于基于預(yù)設(shè)快照任務(wù)定時(shí)觸發(fā)規(guī)則并利用預(yù)先配置好的快照記錄表中記錄的快照信息生成相應(yīng)的待處理快照任務(wù),以得到待處理快照任務(wù)列表;
33、任務(wù)排序模塊,用于基于所述待處理快照任務(wù)列表中各待處理快照任務(wù)分別對(duì)應(yīng)的服務(wù)性能數(shù)據(jù)與預(yù)設(shè)性能閾值之間的大小關(guān)系,確定與各所述待處理快照任務(wù)對(duì)應(yīng)的目標(biāo)任務(wù)權(quán)重,并利用所述目標(biāo)任務(wù)權(quán)重對(duì)各所述待處理快照任務(wù)進(jìn)行排序以得到排序后列表;
34、快照備份模塊,用于判斷所述排序后列表中的各所述待處理快照任務(wù)的快照歷史記錄數(shù)據(jù)是否超出預(yù)設(shè)快照數(shù)據(jù)量上限,并根據(jù)得到的各快照判斷結(jié)果觸發(fā)對(duì)應(yīng)的快照備份操作;
35、快照容錯(cuò)模塊,用于若在執(zhí)行任一快照備份操作的過(guò)程中發(fā)生故障容錯(cuò),則在基于初始業(yè)務(wù)鏡像完成第一環(huán)境恢復(fù)后基于與目標(biāo)快照任務(wù)對(duì)應(yīng)的業(yè)務(wù)標(biāo)識(shí)進(jìn)行快照記錄查詢,并根據(jù)查詢結(jié)果進(jìn)行第二環(huán)境恢復(fù)以完成相應(yīng)的快照恢復(fù)操作;所述目標(biāo)快照任務(wù)為所述任一快照備份操作對(duì)應(yīng)的所述待處理快照任務(wù)。
36、第三方面,本發(fā)明實(shí)施例提供一種電子設(shè)備,包括:
37、存儲(chǔ)器,用于保存計(jì)算機(jī)程序;
38、處理器,用于執(zhí)行所述計(jì)算機(jī)程序,以實(shí)現(xiàn)前述公開(kāi)的業(yè)務(wù)快照容錯(cuò)的步驟。
39、第四方面,本發(fā)明實(shí)施例提供一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),用于存儲(chǔ)計(jì)算機(jī)程序;其中,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)前述公開(kāi)的業(yè)務(wù)快照容錯(cuò)的步驟。
40、由上述技術(shù)方案可以看出,本發(fā)明通過(guò)云平臺(tái)基于預(yù)設(shè)快照任務(wù)定時(shí)觸發(fā)規(guī)則并利用預(yù)先配置好的快照記錄表中記錄的快照信息生成相應(yīng)的待處理快照任務(wù),以得到待處理快照任務(wù)列表;基于所述待處理快照任務(wù)列表中各待處理快照任務(wù)分別對(duì)應(yīng)的服務(wù)性能數(shù)據(jù)與預(yù)設(shè)性能閾值之間的大小關(guān)系,確定與各所述待處理快照任務(wù)對(duì)應(yīng)的目標(biāo)任務(wù)權(quán)重,并利用所述目標(biāo)任務(wù)權(quán)重對(duì)各所述待處理快照任務(wù)進(jìn)行排序以得到排序后列表;判斷所述排序后列表中的各所述待處理快照任務(wù)的快照歷史記錄數(shù)據(jù)是否超出預(yù)設(shè)快照數(shù)據(jù)量上限,并根據(jù)得到的各快照判斷結(jié)果觸發(fā)對(duì)應(yīng)的快照備份操作;若在執(zhí)行任一快照備份操作的過(guò)程中發(fā)生故障容錯(cuò),則在基于初始業(yè)務(wù)鏡像完成第一環(huán)境恢復(fù)后基于與目標(biāo)快照任務(wù)對(duì)應(yīng)的業(yè)務(wù)標(biāo)識(shí)進(jìn)行快照記錄查詢,并根據(jù)查詢結(jié)果進(jìn)行第二環(huán)境恢復(fù)以完成相應(yīng)的快照恢復(fù)操作;所述目標(biāo)快照任務(wù)為所述任一快照備份操作對(duì)應(yīng)的所述待處理快照任務(wù)。
41、有益效果:本發(fā)明通過(guò)云平臺(tái)首先基于預(yù)設(shè)快照任務(wù)定時(shí)觸發(fā)規(guī)則并利用預(yù)先配置好的快照記錄表中記錄的快照信息生成相應(yīng)的待處理快照任務(wù),以得到待處理快照任務(wù)列表;基于所述待處理快照任務(wù)列表中各待處理快照任務(wù)分別對(duì)應(yīng)的服務(wù)性能數(shù)據(jù)與預(yù)設(shè)性能閾值之間的大小關(guān)系,確定與各所述待處理快照任務(wù)對(duì)應(yīng)的目標(biāo)任務(wù)權(quán)重,并利用所述目標(biāo)任務(wù)權(quán)重對(duì)各所述待處理快照任務(wù)進(jìn)行排序以得到排序后列表;判斷所述排序后列表中的各所述待處理快照任務(wù)的快照歷史記錄數(shù)據(jù)是否超出預(yù)設(shè)快照數(shù)據(jù)量上限,并根據(jù)得到的各快照判斷結(jié)果觸發(fā)對(duì)應(yīng)的快照備份操作;若在執(zhí)行任一快照備份操作的過(guò)程中發(fā)生故障容錯(cuò),則在基于初始業(yè)務(wù)鏡像完成第一環(huán)境恢復(fù)后基于與目標(biāo)快照任務(wù)對(duì)應(yīng)的業(yè)務(wù)標(biāo)識(shí)進(jìn)行快照記錄查詢,并根據(jù)查詢結(jié)果進(jìn)行第二環(huán)境恢復(fù)以完成相應(yīng)的快照恢復(fù)操作;所述目標(biāo)快照任務(wù)為所述任一快照備份操作對(duì)應(yīng)的所述待處理快照任務(wù)。也即,本發(fā)明基于預(yù)先配置好的快照記錄表中記錄的快照信息定時(shí)對(duì)相應(yīng)業(yè)務(wù)觸發(fā)快照備份。并在觸發(fā)快照任務(wù)時(shí),首先基于與所述待處理快照任務(wù)列表中各待處理快照任務(wù)分別對(duì)應(yīng)的服務(wù)性能數(shù)據(jù)和預(yù)設(shè)性能閾值進(jìn)行權(quán)重計(jì)算,并利用得到的目標(biāo)任務(wù)權(quán)重確定最終要執(zhí)行的快照任務(wù)的列表以及順序,即得到排序后列表。然后根據(jù)所述排序后列表自動(dòng)進(jìn)行備份,并當(dāng)在備份過(guò)程中發(fā)生容錯(cuò)時(shí),在基于初始業(yè)務(wù)鏡像完成第一環(huán)境恢復(fù)后進(jìn)行第二環(huán)境更新,以完成快照恢復(fù)。這樣一來(lái),能夠在無(wú)需人工干預(yù)的情況下,有效且及時(shí)地針對(duì)不同重要程度的業(yè)務(wù)實(shí)現(xiàn)快照備份與恢復(fù)的自動(dòng)化,從而提升了云平臺(tái)的容錯(cuò)能力,進(jìn)而提高了云平臺(tái)中容器集群的穩(wěn)定性和可靠性,減少因故障導(dǎo)致的業(yè)務(wù)中斷時(shí)間。