本發(fā)明涉及智能制造與邊緣計(jì)算,尤其涉及一種面向離散工業(yè)的邊緣計(jì)算系統(tǒng)監(jiān)控方法與系統(tǒng)。
背景技術(shù):
1、在智能生產(chǎn)和智能制造行業(yè),邊緣計(jì)算已成為數(shù)字化工廠實(shí)施的重要一環(huán),由于生產(chǎn)環(huán)境的復(fù)雜性,設(shè)備種類的多樣性,如何穩(wěn)定高效的處理和分析設(shè)備的數(shù)據(jù),對(duì)于工廠生產(chǎn)控制和效率的提高至關(guān)重要。
2、邊緣計(jì)算盒子是實(shí)現(xiàn)企業(yè)數(shù)字化的一個(gè)關(guān)鍵環(huán)節(jié),它是一個(gè)橋梁作用,承上啟下,下連設(shè)備,上通iot平臺(tái),因此它的穩(wěn)定與健壯對(duì)于保障企業(yè)數(shù)字化系統(tǒng)的運(yùn)行有著重要的意義;而目前對(duì)于邊緣計(jì)算盒子監(jiān)控,技術(shù)上一般是自我服務(wù)是否可用的監(jiān)控,系統(tǒng)內(nèi)消息通知;另一個(gè)是系統(tǒng)用戶人工監(jiān)控發(fā)現(xiàn),這導(dǎo)致延時(shí)發(fā)現(xiàn),以及當(dāng)出現(xiàn)異常時(shí)排查問題困難,耗時(shí)耗力的情況,嚴(yán)重時(shí)還會(huì)影響企業(yè)生產(chǎn)運(yùn)作。
3、授權(quán)公開號(hào)為cn117913867a的專利發(fā)明公開了一種基于邊緣計(jì)算監(jiān)控的構(gòu)網(wǎng)儲(chǔ)能控制方法,屬于儲(chǔ)能控制領(lǐng)域;該專利是通過傳感器采集環(huán)境和能源數(shù)據(jù),建立模型進(jìn)行數(shù)據(jù)特征觀察、訓(xùn)練、預(yù)測(cè)等方式實(shí)現(xiàn)它的監(jiān)控。與工業(yè)離散行業(yè)監(jiān)控方式和實(shí)現(xiàn)場(chǎng)景差別很大和不同。
4、總之,目前對(duì)邊緣計(jì)算系統(tǒng)的監(jiān)控存在如下技術(shù)缺陷:
5、1、監(jiān)控精確度不高、系統(tǒng)定位識(shí)別問題不精確;
6、2、實(shí)時(shí)性差等問題,不能及時(shí)識(shí)別和應(yīng)對(duì)處理系統(tǒng)問題;
7、3、邊緣計(jì)算服務(wù)不能自恢復(fù)的問題;
8、4、問題發(fā)現(xiàn)延后,缺少運(yùn)維通知調(diào)度及協(xié)調(diào)處理的對(duì)應(yīng)技術(shù)手段。
技術(shù)實(shí)現(xiàn)思路
1、為了解決現(xiàn)有技術(shù)中存在的問題,本發(fā)明開發(fā)一種面向離散工業(yè)的邊緣計(jì)算系統(tǒng)監(jiān)控方法與系統(tǒng),旨在提高監(jiān)控精確度和實(shí)時(shí)性,很好解決了系統(tǒng)問題邊界的定位,準(zhǔn)確高效的解決問題,既提高工廠的生產(chǎn)設(shè)備有效利用率,也保證了邊緣計(jì)算機(jī)系統(tǒng)的穩(wěn)定性和可靠性,從而提高了客戶的滿意度。一方面,通過采集數(shù)據(jù),分析數(shù)據(jù),再利用自動(dòng)化運(yùn)維技術(shù)能及時(shí)處理和恢復(fù)服務(wù);另一方面,通過實(shí)時(shí)的企業(yè)推送消息,當(dāng)需人工干預(yù)的異常,也能及時(shí)識(shí)別和介入,將對(duì)生產(chǎn)影響降到最低,極大地提高系統(tǒng)的支撐能力和強(qiáng)壯性。本發(fā)明主要解決離散工業(yè)的設(shè)備、邊緣計(jì)算盒子和網(wǎng)絡(luò)三者監(jiān)控服務(wù)問題邊界的問題、精確度不高和實(shí)時(shí)性差等技術(shù)問題,其精確度主要體現(xiàn)在網(wǎng)絡(luò)狀態(tài)、設(shè)備是否開機(jī),設(shè)備是否斷連、邊緣計(jì)算盒子服務(wù)狀態(tài)、盒子運(yùn)行健康情況(cpu、內(nèi)存、磁盤i/o)的監(jiān)控情況。通過精細(xì)化目標(biāo)和監(jiān)控指標(biāo),提升邊緣計(jì)算系統(tǒng)的定位識(shí)別精確度,實(shí)現(xiàn)邊緣計(jì)算服務(wù)的自主恢復(fù)、運(yùn)維通知調(diào)度及協(xié)調(diào)處理優(yōu)化等,從而保證邊緣計(jì)算系統(tǒng)的穩(wěn)定性和有效性。
2、本發(fā)明一方面提供了一種面向離散工業(yè)的邊緣計(jì)算系統(tǒng)監(jiān)控方法,包括:
3、s1,采集指標(biāo)信息和網(wǎng)絡(luò)信息;所述指標(biāo)信息和所述網(wǎng)絡(luò)信息用于當(dāng)所述邊緣計(jì)算系統(tǒng)的服務(wù)出現(xiàn)不可用情況時(shí),能精確識(shí)別界定是否由服務(wù)通信問題造成,并將所述服務(wù)出現(xiàn)不可用情況對(duì)應(yīng)的異常信息即時(shí)推送到運(yùn)維人員;
4、s2,基于所獲得的所述指標(biāo)信息和網(wǎng)絡(luò)信息對(duì)所述邊緣計(jì)算系統(tǒng)進(jìn)行對(duì)應(yīng)監(jiān)控。
5、優(yōu)選的,所述指標(biāo)信息包括離散工業(yè)設(shè)備與所述邊緣計(jì)算系統(tǒng)的服務(wù)網(wǎng)絡(luò)的端口、連接數(shù)和狀態(tài);所述網(wǎng)絡(luò)信息包括所述邊緣計(jì)算系統(tǒng)和監(jiān)控服務(wù)的網(wǎng)絡(luò)信息。
6、優(yōu)選的,所述s2包括:
7、s21,將所述指標(biāo)信息和網(wǎng)絡(luò)信息進(jìn)行分類,從而分類為網(wǎng)絡(luò)信息、邊緣計(jì)算系統(tǒng)信息和設(shè)備信息;
8、s22,基于所述網(wǎng)絡(luò)信息和預(yù)設(shè)定的網(wǎng)絡(luò)參數(shù)指標(biāo)判別是否需要發(fā)出預(yù)警或異常信息給網(wǎng)絡(luò)運(yùn)維人員,當(dāng)采集的指標(biāo)參數(shù)超過預(yù)定設(shè)置值則發(fā)出預(yù)警通知事件,當(dāng)采集的網(wǎng)絡(luò)狀態(tài)是異常信息則確認(rèn)發(fā)生網(wǎng)絡(luò)異常,觸發(fā)網(wǎng)絡(luò)異常事件;
9、s23,獲取心跳檢測(cè)信息,并基于所述心跳檢測(cè)信息確定;若發(fā)生所述邊緣服務(wù)異常,基于所述邊緣計(jì)算系統(tǒng)信息、心跳檢測(cè)信息和預(yù)設(shè)定邊緣系統(tǒng)的參數(shù)指標(biāo)判別是否發(fā)生邊緣服務(wù)異常;如發(fā)生邊緣計(jì)算服務(wù)異常情況,觸發(fā)邊緣服務(wù)異常事件信息,并通過消息任務(wù)服務(wù)將所述邊緣服務(wù)異常事件信息發(fā)送給車間負(fù)責(zé)人;若未發(fā)生所述邊緣服務(wù)異常,則結(jié)束所述對(duì)應(yīng)監(jiān)控;
10、s24,基于所述設(shè)備信息確定是否發(fā)生設(shè)備異常;若發(fā)生所述設(shè)備異常,則通過消息任務(wù)服務(wù)將所述設(shè)備異常的消息發(fā)送給車間負(fù)責(zé)人,跟蹤處理。
11、優(yōu)選的,所述s23還包括:
12、基于所述邊緣計(jì)算系統(tǒng)信息、心跳檢測(cè)信息和預(yù)設(shè)定邊緣系統(tǒng)的參數(shù)指標(biāo)判別是否需要發(fā)出預(yù)警給系統(tǒng)運(yùn)維人員還包括,如發(fā)生邊緣計(jì)算服務(wù)異常情況,則觸發(fā)守護(hù)調(diào)度服務(wù),它根據(jù)異常信息下發(fā)指令到對(duì)應(yīng)的邊緣計(jì)算系統(tǒng)恢復(fù)邊緣服務(wù);包括:通過消息任務(wù)服務(wù)將所述邊緣服務(wù)異常事件信息發(fā)送給車間負(fù)責(zé)人后,基于接收到所述到邊緣服務(wù)異常事件信息,通過守護(hù)調(diào)度服務(wù)下發(fā)邊緣服務(wù)恢復(fù)指令;并判斷所述邊緣服務(wù)是否恢復(fù)成功,如所述邊緣服務(wù)恢復(fù)成功,則流程處理完成結(jié)束;如所述邊緣服務(wù)恢復(fù)不成功,則通過所述消息任務(wù)服務(wù)將企業(yè)信息即時(shí)推送給運(yùn)維人員,便于所述運(yùn)維人員介入處理。
13、本發(fā)明的第二方面在于提供一種面向離散工業(yè)的邊緣計(jì)算系統(tǒng)監(jiān)控系統(tǒng),用于實(shí)施第一方面的方法,包括:
14、信息采集模塊(101),用于采集指標(biāo)信息和網(wǎng)絡(luò)信息;所述指標(biāo)信息和所述網(wǎng)絡(luò)信息用于當(dāng)所述邊緣計(jì)算系統(tǒng)的服務(wù)出現(xiàn)不可用情況時(shí),能精確識(shí)別界定是否由服務(wù)通信問題造成,并將所述服務(wù)出現(xiàn)不可用情況對(duì)應(yīng)的異常信息即時(shí)推送到運(yùn)維人員;
15、系統(tǒng)監(jiān)控模塊(102),用于基于所獲得的所述指標(biāo)信息和網(wǎng)絡(luò)信息對(duì)所述邊緣計(jì)算系統(tǒng)進(jìn)行對(duì)應(yīng)監(jiān)控;包括:所述系統(tǒng)監(jiān)控模塊(102)通過對(duì)各個(gè)邊緣系統(tǒng)側(cè)的心跳檢測(cè),監(jiān)控其服務(wù)是否可用;監(jiān)控網(wǎng)絡(luò)是否正常,監(jiān)控網(wǎng)絡(luò)端口和連接數(shù);監(jiān)控各個(gè)邊緣計(jì)算系統(tǒng)對(duì)接的設(shè)備信息數(shù)據(jù),判定設(shè)備是否正常運(yùn)作;所述系統(tǒng)監(jiān)控模塊(102)通過簡(jiǎn)單網(wǎng)絡(luò)管理協(xié)議snmp采集網(wǎng)絡(luò)相關(guān)數(shù)據(jù),通過采集網(wǎng)絡(luò)的即時(shí)指標(biāo)數(shù)據(jù),判別網(wǎng)絡(luò)的情況,異常則發(fā)出消息事件通知;通過消息隊(duì)列遙測(cè)傳輸協(xié)議mqtt和超文本傳輸協(xié)議http采集邊緣計(jì)算盒子和設(shè)備的數(shù)據(jù),并通過指標(biāo)數(shù)據(jù)對(duì)所述邊緣計(jì)算盒子和設(shè)備是否異常,如果異常則發(fā)出消息事件通知。
16、優(yōu)選的,所述系統(tǒng)監(jiān)控模塊(102)包括:
17、信息分類子模塊(1021),用于將所述指標(biāo)信息和網(wǎng)絡(luò)信息進(jìn)行分類,從而分類為網(wǎng)絡(luò)信息、邊緣計(jì)算系統(tǒng)信息和設(shè)備信息;
18、網(wǎng)絡(luò)異常監(jiān)控子模塊(1022),用于基于所述網(wǎng)絡(luò)信息確定是否發(fā)生網(wǎng)絡(luò)異常;若發(fā)生網(wǎng)絡(luò)異常,則觸發(fā)網(wǎng)絡(luò)異常事件,若未發(fā)生網(wǎng)絡(luò)異常,則結(jié)束所述對(duì)應(yīng)監(jiān)控;
19、邊緣服務(wù)異常監(jiān)控子模塊(1023),用于基于所述邊緣計(jì)算系統(tǒng)信息獲取心跳檢測(cè)信息,并基于所述心跳檢測(cè)信息確定是否發(fā)生邊緣服務(wù)異常;若發(fā)生所述邊緣服務(wù)異常,觸發(fā)邊緣服務(wù)異常事件信息,并通過消息任務(wù)服務(wù)將所述邊緣服務(wù)異常事件信息發(fā)送給車間負(fù)責(zé)人;若未發(fā)生所述邊緣服務(wù)異常,則結(jié)束所述對(duì)應(yīng)監(jiān)控;
20、設(shè)備異常監(jiān)控子模塊(1024),用于基于所述設(shè)備信息確定是否發(fā)生設(shè)備異常;若發(fā)生所述設(shè)備異常,則通過消息任務(wù)服務(wù)將所述設(shè)備異常的消息發(fā)送給車間負(fù)責(zé)人。
21、優(yōu)選的,所述邊緣服務(wù)異常監(jiān)控子模塊(1023)還包括:
22、消息任務(wù)服務(wù)單元(10231)以及守護(hù)調(diào)度服務(wù)單元(10232);
23、其中:所述消息任務(wù)服務(wù)單元(10231)用于提供消息任務(wù)服務(wù),用于發(fā)送邊緣計(jì)算服務(wù)不可用事件消息給運(yùn)維人員;發(fā)送網(wǎng)絡(luò)異常消息給運(yùn)維人員;發(fā)送設(shè)備運(yùn)作異常消息給車間負(fù)責(zé)人;
24、所述守護(hù)調(diào)度服務(wù)單元(10232)用于提供守護(hù)調(diào)度服務(wù);
25、通過消息任務(wù)服務(wù)將所述邊緣服務(wù)異常事件信息發(fā)送給車間負(fù)責(zé)人后,基于接收到所述到邊緣服務(wù)異常事件信息,通過守護(hù)調(diào)度服務(wù)下發(fā)邊緣服務(wù)恢復(fù)指令;并判斷所述邊緣服務(wù)是否恢復(fù)成功,如所述邊緣服務(wù)恢復(fù)成功,則流程處理完成結(jié)束;如所述邊緣服務(wù)恢復(fù)不成功,則通過所述消息任務(wù)服務(wù)將企業(yè)信息即時(shí)推送給運(yùn)維人員,便于所述運(yùn)維人員介入處理。
26、優(yōu)選的,所述系統(tǒng)還包括:基礎(chǔ)模塊,所述基礎(chǔ)模塊用于設(shè)置網(wǎng)絡(luò)的指標(biāo)參數(shù)和指標(biāo)值,設(shè)置監(jiān)控設(shè)備的指標(biāo)參數(shù)和指標(biāo)值以及設(shè)置邊緣計(jì)算盒子的指標(biāo)參數(shù)和指標(biāo)值;
27、所述網(wǎng)絡(luò)的指標(biāo)參數(shù)和指標(biāo)值包括狀態(tài)、延遲、使用率和連接中的一個(gè)或多個(gè)指標(biāo)參數(shù)和指標(biāo)值;所述監(jiān)控設(shè)備的指標(biāo)參數(shù)和指標(biāo)值包括開機(jī)狀態(tài)和連接狀態(tài)中的一個(gè)或多個(gè)指標(biāo)參數(shù)和指標(biāo)值;所述邊緣計(jì)算盒子的指標(biāo)參數(shù)和指標(biāo)值包括服務(wù)狀態(tài)、cpu、內(nèi)存和磁盤i/o中的一個(gè)或多個(gè)指標(biāo)參數(shù)和指標(biāo)值。
28、本發(fā)明的第三方面提供一種電子設(shè)備,包括處理器和存儲(chǔ)器,所述存儲(chǔ)器存儲(chǔ)有多條指令,所述處理器用于讀取所述指令并執(zhí)行如第一方面所述的方法。
29、本發(fā)明的第四方面提供一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)存儲(chǔ)有多條指令,所述多條指令可被處理器讀取并執(zhí)行如第一方面所述的方法。
30、本發(fā)明提供的方法、系統(tǒng)和電子設(shè)備,具有如下有益效果:
31、本發(fā)明解決現(xiàn)有技術(shù)存在的缺陷的主要技術(shù)手段包括:
32、(1)系統(tǒng)問題定位識(shí)別不精確,本發(fā)明通過劃分監(jiān)控目標(biāo)主體以及各主體的監(jiān)控指標(biāo)來實(shí)現(xiàn)定位問題的準(zhǔn)確性;
33、(2)邊緣計(jì)算盒子服務(wù)因異常不可用,不能實(shí)現(xiàn)服務(wù)自我恢復(fù),本發(fā)明通過監(jiān)控指令的下發(fā)實(shí)現(xiàn)服務(wù)恢復(fù);
34、(3)問題發(fā)現(xiàn)延后,缺少運(yùn)維通知調(diào)度及協(xié)調(diào)處理的問題,本發(fā)明通過打通企業(yè)微信/釘釘?shù)燃磿r(shí)推送異常消息至運(yùn)維人員。
35、由此取得的有益效果包括:
36、(1)精準(zhǔn)異常定位:通過智能化分析,能夠準(zhǔn)確識(shí)別異常類型,即時(shí)通知運(yùn)維團(tuán)隊(duì),實(shí)現(xiàn)問題的迅速定位和處理,極大提升了故障解決效率。
37、(2)即時(shí)異常發(fā)現(xiàn)和跟蹤:邊緣計(jì)算監(jiān)控確保服務(wù)異常能在第一時(shí)間被發(fā)現(xiàn),通過實(shí)時(shí)消息推送,使運(yùn)維人員能夠及時(shí)跟進(jìn),有效縮短了問題的響應(yīng)時(shí)間。
38、(3)服務(wù)自恢復(fù)能力:具備自我修復(fù)機(jī)制的邊緣計(jì)算服務(wù),在遇到故障問題時(shí)能夠自動(dòng)恢復(fù),顯著減少了人工的干預(yù),降低了運(yùn)維成本。
39、(4)系統(tǒng)穩(wěn)定和高效運(yùn)行:通過持續(xù)監(jiān)控和優(yōu)化,邊緣計(jì)算不僅提高了系統(tǒng)的整體穩(wěn)定性,還確保了高效率的生產(chǎn)流程,為用戶提供更加流暢和滿意的使用體驗(yàn),從而增強(qiáng)了客戶滿意度和系統(tǒng)競(jìng)爭(zhēng)力。
40、通過以上幾點(diǎn)共同的技術(shù)優(yōu)勢(shì),使得邊緣計(jì)算監(jiān)控成為現(xiàn)代i?t基礎(chǔ)設(shè)施中不可或缺的一部分,在提升服務(wù)質(zhì)量、降低運(yùn)營(yíng)成本和增強(qiáng)用戶體驗(yàn)方面發(fā)揮著關(guān)鍵作用。