本發(fā)明屬于海洋研究,尤其涉及云邊協(xié)同的模型自動化訓(xùn)練與在線學(xué)習(xí)集成方法及系統(tǒng)。
背景技術(shù):
1、本部分的陳述僅僅是提供了與本發(fā)明相關(guān)的背景技術(shù)信息,不必然構(gòu)成在先技術(shù)。
2、近年來,深度學(xué)習(xí)在海洋智能化中扮演著越來越重要的角色,并已廣泛應(yīng)用于多個場景。通過人工智能,可以幫助海洋各個領(lǐng)域解決諸多難題。例如,利用人工智能算法進(jìn)行海洋觀測數(shù)據(jù)的預(yù)測和異常檢測,不僅能更好地掌控海洋變化,而且異常數(shù)據(jù)對科研和決策的準(zhǔn)確性也具有重要影響。因此,海洋觀測數(shù)據(jù)的預(yù)測和異常檢測顯得至關(guān)重要。通過應(yīng)用先進(jìn)的數(shù)據(jù)分析和機器學(xué)習(xí)技術(shù),可以實現(xiàn)對海洋觀測數(shù)據(jù)流的實時監(jiān)測,并自動檢測和識別異常數(shù)據(jù)點。一旦檢測到異常,系統(tǒng)便會發(fā)出警報,以便及時采取糾正措施,從而確保海洋監(jiān)測數(shù)據(jù)的質(zhì)量和可靠性。
3、在海洋智能化領(lǐng)域,目前多數(shù)深度學(xué)習(xí)模型基于離線學(xué)習(xí)范式構(gòu)建,主要適用于數(shù)據(jù)分布相對穩(wěn)定的場景。然而,面對海洋數(shù)據(jù)的實時變化,這些模型的性能難以保證。例如,awac算法的初衷是通過離線預(yù)訓(xùn)練和在線調(diào)整實現(xiàn)深度強化學(xué)習(xí),但由于存在分布偏差,離線訓(xùn)練的智能體策略無法直接用于在線推理。如圖1所示,離線模型學(xué)習(xí)的是突變前的數(shù)據(jù)分布,而突變后的數(shù)據(jù)則會被視為異常數(shù)據(jù)。因此,離線模型難以適應(yīng)數(shù)據(jù)變化的異常檢測和預(yù)測任務(wù)。
4、在線學(xué)習(xí)算法在初始模型預(yù)測階段會遇到冷啟動問題。由于模型缺乏歷史信息,初始階段的預(yù)測和檢測性能波動較大,限制了其在準(zhǔn)確預(yù)測和決策方面的能力。
5、而且在線學(xué)習(xí)系統(tǒng)需要長期運行,持續(xù)采集數(shù)據(jù)、演進(jìn)模型、更新參數(shù)。隨著時間的推移,模型可能會遺忘先前知識,導(dǎo)致災(zāi)難性遺忘的問題。這意味著模型在學(xué)習(xí)新知識的同時可能會遺忘之前獲得的知識。此外,深度學(xué)習(xí)模型通常由專家通過試錯過程手動設(shè)計,這需要大量資源和時間,即使是專家也不例外。
6、綜上,目前的深度學(xué)習(xí)模型應(yīng)用在海洋數(shù)據(jù)中,至少存在如下問題:
7、1、基于離線學(xué)習(xí)的深度學(xué)習(xí)模型存在不適應(yīng)數(shù)據(jù)分布實時變化的海洋觀測數(shù)據(jù)的問題,離線模型不能適應(yīng)于變化的數(shù)據(jù)異常檢測任務(wù)和預(yù)測任務(wù);
8、2、在線學(xué)習(xí)算法存在冷啟動,以及災(zāi)難性遺忘問題;
9、3、深度學(xué)習(xí)模型通常由專家通過試錯過程手動設(shè)計,這需要大量資源和時間。
技術(shù)實現(xiàn)思路
1、為克服上述現(xiàn)有技術(shù)的不足,本發(fā)明提供了云邊協(xié)同的模型自動化訓(xùn)練與在線學(xué)習(xí)集成方法及系統(tǒng),離線訓(xùn)練和在線學(xué)習(xí)相結(jié)合,不僅適應(yīng)變化的實時海洋數(shù)據(jù),而且解決了在線學(xué)習(xí)冷啟動問題;通過改進(jìn)的貝葉斯優(yōu)化算法進(jìn)行超參數(shù)尋優(yōu),提高超參數(shù)優(yōu)化的效率和效果,提升海洋模型訓(xùn)練效率。
2、為實現(xiàn)上述目的,本發(fā)明的第一個方面提供云邊協(xié)同的模型自動化訓(xùn)練與在線學(xué)習(xí)集成方法,包括:
3、在云端利用歷史海洋觀測數(shù)據(jù)對海洋模型進(jìn)行離線預(yù)訓(xùn)練,并將預(yù)訓(xùn)練好的海洋模型發(fā)布到邊緣端;
4、在邊緣端基于實時的海洋觀測數(shù)據(jù),對預(yù)訓(xùn)練好的海洋模型進(jìn)行在線學(xué)習(xí),得到最佳海洋模型;
5、其中,在對海洋模型離線訓(xùn)練中,采用改進(jìn)的貝葉斯優(yōu)化算法對海洋模型的超參數(shù)進(jìn)行優(yōu)化,具體為:將廣義相加模型作為貝葉斯優(yōu)化算法的代理模型;利用同倫優(yōu)化方法構(gòu)建廣義相加模型的連續(xù)變形路徑,利用nelder-mead算法沿所述連續(xù)變形路徑跟蹤同倫函數(shù)局部最小值。
6、本發(fā)明的第二個方面提供云邊協(xié)同的模型自動化訓(xùn)練與在線學(xué)習(xí)集成系統(tǒng),包括:
7、離線訓(xùn)練單元,用于在云端利用歷史海洋觀測數(shù)據(jù)對海洋模型進(jìn)行離線預(yù)訓(xùn)練,并將預(yù)訓(xùn)練好的海洋模型發(fā)布到邊緣端;其中,在對海洋模型離線訓(xùn)練中,采用改進(jìn)的貝葉斯優(yōu)化算法對海洋模型的超參數(shù)進(jìn)行優(yōu)化,具體為:將廣義相加模型作為貝葉斯優(yōu)化算法的代理模型;利用同倫優(yōu)化方法構(gòu)建廣義相加模型的連續(xù)變形路徑,利用nelder-mead算法沿所述連續(xù)變形路徑跟蹤同倫函數(shù)局部最小值;
8、在線學(xué)習(xí)單元,用于在邊緣端基于實時的海洋觀測數(shù)據(jù),對預(yù)訓(xùn)練好的海洋模型進(jìn)行在線學(xué)習(xí),得到最佳海洋模型。
9、本發(fā)明的第三個方面提供一種計算機設(shè)備,包括:處理器、存儲器和總線,所述存儲器存儲有所述處理器可執(zhí)行的機器可讀指令,當(dāng)計算機設(shè)備運行時,所述處理器與所述存儲器之間通過總線通信,所述機器可讀指令被所述處理器執(zhí)行時執(zhí)行云邊協(xié)同的模型自動化訓(xùn)練與在線學(xué)習(xí)集成方法。
10、本發(fā)明的第四個方面提供一種計算機可讀存儲介質(zhì),所述計算機可讀存儲介質(zhì)上存儲有計算機程序,所述計算機程序被處理器運行時執(zhí)行云邊協(xié)同的模型自動化訓(xùn)練與在線學(xué)習(xí)集成方法。
11、以上一個或多個技術(shù)方案存在以下有益效果:
12、在本發(fā)明中,通過云端對海洋模型進(jìn)行離線訓(xùn)練,然后將預(yù)訓(xùn)練好的海洋模型發(fā)布到邊緣端進(jìn)行在線學(xué)習(xí)推理,以解決在線學(xué)習(xí)算法在初始模型預(yù)測階段會遇到冷啟動問題;將廣義相加模型作為貝葉斯優(yōu)化算法的代理模型,并采用同倫優(yōu)化方法沿變形路徑跟蹤局部最小值,通過改進(jìn)的貝葉斯優(yōu)化算法對海洋模型進(jìn)行超參數(shù)優(yōu)化,提高超參數(shù)優(yōu)化的效率和效果,提升海洋模型訓(xùn)練效率,縮短整個流程所需時間。
13、本發(fā)明附加方面的優(yōu)點將在下面的描述中部分給出,部分將從下面的描述中變得明顯,或通過本發(fā)明的實踐了解到。
1.云邊協(xié)同的模型自動化訓(xùn)練與在線學(xué)習(xí)集成方法,其特征在于,包括:
2.如權(quán)利要求1所述的云邊協(xié)同的模型自動化訓(xùn)練與在線學(xué)習(xí)集成方法,其特征在于,對邊緣端在線訓(xùn)練的海洋模型,利用均方差指標(biāo)和決定系數(shù)指標(biāo)衡量海洋模型的性能,若在線訓(xùn)練的海洋模型不滿足均方差指標(biāo)和決定系數(shù)指標(biāo)時,云端獲取實時海洋觀測數(shù)據(jù)對海洋模型進(jìn)行訓(xùn)練,得到最佳海洋模型。
3.如權(quán)利要求1所述的云邊協(xié)同的模型自動化訓(xùn)練與在線學(xué)習(xí)集成方法,其特征在于,將在線學(xué)習(xí)過程中達(dá)到評估標(biāo)準(zhǔn)的海洋模型作為基學(xué)習(xí)器上傳至云端,將所述基學(xué)習(xí)器以及在云端采用全量海洋觀測數(shù)據(jù)訓(xùn)練好的最佳海洋模型進(jìn)行集成,采用stacking的動態(tài)集成學(xué)習(xí)方法,將最優(yōu)的海洋模型部署到邊緣端。
4.如權(quán)利要求1所述的云邊協(xié)同的模型自動化訓(xùn)練與在線學(xué)習(xí)集成方法,其特征在于,在離線訓(xùn)練中,采用混合時間序列交叉驗證策略對海洋模型進(jìn)行選擇,具體為:
5.如權(quán)利要求1所述的云邊協(xié)同的模型自動化訓(xùn)練與在線學(xué)習(xí)集成方法,其特征在于,利用同倫優(yōu)化方法構(gòu)建廣義相加模型的連續(xù)變形路徑,利用nelder-mead算法沿所述連續(xù)變形路徑跟蹤同倫函數(shù)局部最小值,具體為:
6.如權(quán)利要求1或5所述的云邊協(xié)同的模型自動化訓(xùn)練與在線學(xué)習(xí)集成方法,其特征在于,在每個固定的同倫參數(shù)下,通過nelder-mead算法的反射、擴展、收縮和收縮操作來實現(xiàn)逐步逼近目標(biāo)函數(shù)的局部最小值。
7.云邊協(xié)同的模型自動化訓(xùn)練與在線學(xué)習(xí)集成系統(tǒng),其特征在于,包括:
8.如權(quán)利要求7所述的云邊協(xié)同的模型自動化訓(xùn)練與在線學(xué)習(xí)集成系統(tǒng),其特征在于,在所述離線訓(xùn)練單元中,利用同倫優(yōu)化方法構(gòu)建廣義相加模型的連續(xù)變形路徑,利用nelder-mead算法沿所述連續(xù)變形路徑跟蹤同倫函數(shù)局部最小值,具體為:
9.一種計算機設(shè)備,其特征在于,包括:處理器、存儲器和總線,所述存儲器存儲有所述處理器可執(zhí)行的機器可讀指令,當(dāng)計算機設(shè)備運行時,所述處理器與所述存儲器之間通過總線通信,所述機器可讀指令被所述處理器執(zhí)行時執(zhí)行如權(quán)利要求1至6任一項所述的云邊協(xié)同的模型自動化訓(xùn)練與在線學(xué)習(xí)集成方法。
10.一種計算機可讀存儲介質(zhì),其特征在于,所述計算機可讀存儲介質(zhì)上存儲有計算機程序,所述計算機程序被處理器運行時執(zhí)行如權(quán)利要求1至6任一項所述的云邊協(xié)同的模型自動化訓(xùn)練與在線學(xué)習(xí)集成方法。