本發(fā)明涉及一種車聯(lián)網(wǎng)駕駛狀態(tài)智能監(jiān)控方法及系統(tǒng),屬于智能網(wǎng)聯(lián)汽車領(lǐng)域。
背景技術(shù):
1、隨著車聯(lián)網(wǎng)技術(shù)的迅速發(fā)展,實時監(jiān)控駕駛員的行為和生理狀態(tài)以提高道路安全已變得尤為重要。目前,大多數(shù)監(jiān)控系統(tǒng)通過中央服務(wù)器處理來自駕駛員的數(shù)據(jù),導(dǎo)致在緊急情況下反應(yīng)速度不足。
2、大多數(shù)監(jiān)控系統(tǒng)采用傳統(tǒng)的整數(shù)階微分方程來建模駕駛員狀態(tài)的動態(tài)變化,難以準(zhǔn)確反應(yīng)復(fù)雜系統(tǒng)的長程相關(guān)性和非局部效應(yīng)?,F(xiàn)有方法通常直接處理高維度的原始數(shù)據(jù),缺乏有效的特征提取和降維步驟,導(dǎo)致計算復(fù)雜度高、模型泛化能力差。當(dāng)前監(jiān)控系統(tǒng)大多依賴中心化的數(shù)據(jù)處理和決策,缺乏分布式協(xié)同優(yōu)化機制,難以適應(yīng)多變的駕駛環(huán)境和個體差異?,F(xiàn)有的駕駛員狀態(tài)輔助方法通?;诤唵蔚拈撝蹬袛嗷蛞?guī)則推理,缺乏對駕駛員、車輛和環(huán)境之間動態(tài)交互的系統(tǒng)考慮。
3、6g網(wǎng)絡(luò)可以提供高速率和低延遲,為解決上述問題提供了基礎(chǔ),6g網(wǎng)絡(luò)的應(yīng)用現(xiàn)有技術(shù)在進(jìn)行監(jiān)測過程中減少數(shù)據(jù)傳輸延遲、計算資源分配不合理的問題需要進(jìn)一步解決。
技術(shù)實現(xiàn)思路
1、本發(fā)明所要解決的技術(shù)問題是:現(xiàn)有車聯(lián)網(wǎng)系統(tǒng)在實時監(jiān)測駕駛員狀態(tài)時,數(shù)據(jù)處理延遲,需要進(jìn)一步提高交通安全性和駕駛體驗。
2、為解決上述技術(shù)問題,本發(fā)明提供一種車聯(lián)網(wǎng)駕駛狀態(tài)監(jiān)控方法,包括以下步驟:
3、步驟一,在車輛中設(shè)置多種傳感器,用于實時采集駕駛狀態(tài)數(shù)據(jù),所述駕駛狀態(tài)數(shù)據(jù)包括駕駛員的行為數(shù)據(jù)以及環(huán)境數(shù)據(jù);
4、步驟二,在車載邊緣計算節(jié)點,對采集的多源異構(gòu)數(shù)據(jù)進(jìn)行預(yù)處理,預(yù)處理包括數(shù)據(jù)清洗、數(shù)據(jù)歸一化和數(shù)據(jù)融合;
5、步驟三,將融合后的數(shù)據(jù)輸入到變分自編碼器中,所述變分自編碼器在提取駕駛狀態(tài)數(shù)據(jù)的低維隱變量表示時,通過優(yōu)化變分下界,推斷出隱變量分布;
6、步驟四,將推斷出的隱變量輸入到分?jǐn)?shù)階微分方程模型中,所述分?jǐn)?shù)階微分方程模型描述駕駛狀態(tài)的動態(tài)變化規(guī)律,通過求解分?jǐn)?shù)階微分方程,得到駕駛狀態(tài)的預(yù)測值,反映駕駛員的生理和行為狀態(tài);
7、步驟五,在多個車載邊緣節(jié)點上進(jìn)行聯(lián)邦學(xué)習(xí),通過加密的梯度聚合和差分隱私算法,在保護(hù)數(shù)據(jù)隱私的同時實現(xiàn)全局模型的協(xié)同優(yōu)化;
8、步驟六,基于博弈模型,構(gòu)建駕駛員-車輛-環(huán)境的動態(tài)交互過程模型,所述駕駛員-車輛-環(huán)境的動態(tài)交互過程模型采用hjb方程,通過求解hjb方程,在動態(tài)環(huán)境中實現(xiàn)參與者之間的協(xié)同優(yōu)化,使參與者獲得在復(fù)雜的駕駛場景中的最優(yōu)決策駕駛數(shù)據(jù)。
9、前述的一種車聯(lián)網(wǎng)駕駛狀態(tài)監(jiān)控方法,還包括:
10、步驟七,在步驟六獲得的最優(yōu)決策駕駛數(shù)據(jù)基礎(chǔ)上,根據(jù)實時道路和網(wǎng)絡(luò)狀況,利用深度強化學(xué)習(xí)算法動態(tài)調(diào)整車載計算、存儲和通信資源,以實現(xiàn)能耗的最小化和任務(wù)延遲最小化。
11、前述的一種車聯(lián)網(wǎng)駕駛狀態(tài)監(jiān)控方法,在步驟二中,在所述數(shù)據(jù)融合過程中,通過求解如下多目標(biāo)優(yōu)化問題動態(tài)調(diào)整權(quán)重:
12、,
13、,
14、,
15、其中,表示均方誤差,為數(shù)據(jù)的重構(gòu)值,目標(biāo)函數(shù)和分別是最小化重構(gòu)誤差和權(quán)重的?l2?范數(shù),自適應(yīng)權(quán)重;為數(shù)據(jù)種類。
16、前述的一種車聯(lián)網(wǎng)駕駛狀態(tài)監(jiān)控方法,在步驟三中,變分自編碼器表示為:
17、,
18、其中,?為解碼器的參數(shù)化概率分布,?為先驗分布,?為待學(xué)習(xí)的參數(shù),?為散度,用于度量兩個概率分布之間的差異;為隱變量;是重構(gòu)誤差。
19、前述的一種車聯(lián)網(wǎng)駕駛狀態(tài)監(jiān)控方法,在步驟四中,所述分?jǐn)?shù)階微分方程為:
20、,,
21、其中,?表示階數(shù)為??的?caputo?分?jǐn)?shù)階導(dǎo)數(shù),定義為:
22、,,
23、其中,?為gamma函數(shù),為正整數(shù),當(dāng)??時,caputo導(dǎo)數(shù)退化為經(jīng)典的一階導(dǎo)數(shù);是積分變量,表示過去的時間點;
24、?為駕駛狀態(tài)變量,所述駕駛狀態(tài)變量;?為非線性函數(shù),?為過程噪聲。
25、前述的一種車聯(lián)網(wǎng)駕駛狀態(tài)監(jiān)控方法,在步驟五中,聯(lián)邦學(xué)習(xí)的優(yōu)化過程為:
26、,
27、,
28、,
29、其中,為第個節(jié)點基于本地數(shù)據(jù)計算的損失函數(shù),為對應(yīng)的梯度,為節(jié)點總數(shù),在第?次迭代中,各節(jié)點首先計算本地梯度?,然后通過安全的加密通信協(xié)議將梯度發(fā)送到中心節(jié)點;中心節(jié)點對收到的梯度進(jìn)行聚合,并添加滿足?-差分隱私的高斯噪聲?,得到全局梯度?;最后,中心節(jié)點利用全局梯度更新模型參數(shù)?,并將更新后的模型廣播給各節(jié)點,完成一次聯(lián)邦學(xué)習(xí)迭代。
30、前述的一種車聯(lián)網(wǎng)駕駛狀態(tài)監(jiān)控方法,在步驟六中,定義博弈模型為;
31、其中??為博弈參與者的集合,和?分別為博弈參與者??的狀態(tài)空間和動作空間,?為參與者的效用函數(shù);所述博弈參與者包括駕駛員、車輛、環(huán)境;表示的是博弈參與者之間的動態(tài)交互關(guān)系;
32、將博弈模型描述為如下隨機微分方程,即hjb方程:
33、,
34、其中,為參與者在時刻的狀態(tài)變量,表示駕駛員、車輛或環(huán)境的當(dāng)前狀態(tài);
35、為參與者在時刻的動作變量,表示該參與者可以采取的行動;
36、?為其他參與者在時刻的動作變量,表示除參與者以外其他所有參與者的行動,會影響參與者的決策和狀態(tài);
37、表示參與者的狀態(tài)轉(zhuǎn)移函數(shù),描述在給定當(dāng)前狀態(tài)和動作時,狀態(tài)如何隨時間變化;
38、表示參與者??噪聲影響函數(shù);
39、為布朗運動,表示隨機擾動。
40、前述的一種車聯(lián)網(wǎng)駕駛狀態(tài)監(jiān)控方法,在步驟六中,求解過程為:
41、,
42、其中,為參與者的值函數(shù),表示在狀態(tài)和時間下,參與者能獲得的最大預(yù)期收益;
43、為參與者的狀態(tài)變量,表示參與者在時刻的當(dāng)前狀態(tài);
44、為參與者的動作變量,表示參與者可以采取的行動;
45、為參與者的動作空間,包括參與者所有可能的動作選擇;
46、為其他參與者的最優(yōu)動作,表示在當(dāng)前狀態(tài)下,其他參與者所采取的最佳策略;
47、為狀態(tài)轉(zhuǎn)移函數(shù),描述在給定狀態(tài)和動作以及其他參與者的最優(yōu)動作??時,參與者的狀態(tài)如何變化;
48、為值函數(shù)對狀態(tài)變量的梯度,表示狀態(tài)變化對預(yù)期收益的影響;
49、為噪聲影響函數(shù),描述在狀態(tài)轉(zhuǎn)移過程中,隨機因素對參與者??的影響;
50、表示矩陣的跡運算,通常用于計算方差或協(xié)方差的總和;
51、為參與者的效用函數(shù),表示在狀態(tài)和動作以及其他參與者的最優(yōu)動作下,參與者的即時收益,上標(biāo)t表示轉(zhuǎn)置。
52、前述的一種車聯(lián)網(wǎng)駕駛狀態(tài)監(jiān)控方法,在步驟七中,定義強化學(xué)習(xí)模型為,其中:
53、狀態(tài)?,包括系統(tǒng)的隊列狀態(tài)、網(wǎng)絡(luò)狀態(tài)以及傳感器采集的數(shù)據(jù),狀態(tài)反映當(dāng)前系統(tǒng)的運行情況和環(huán)境變化;
54、動作?指資源調(diào)度決策,包括分配車載計算、存儲和通信資源;
55、狀態(tài)轉(zhuǎn)移概率?:描述在當(dāng)前狀態(tài)下采取某一動作后,轉(zhuǎn)移到下一個狀態(tài)的概率;
56、獎勵函數(shù)?:用于評估智能體在特定狀態(tài)和動作下的表現(xiàn);
57、折扣因子?:用于平衡當(dāng)前獎勵與未來獎勵的重要性;
58、目標(biāo)函數(shù)是最大化長期累積獎勵的期望值:
59、,
60、其中,?為調(diào)度策略,?為任務(wù)延遲,?為延遲的最大約束值;
61、獎勵函數(shù)??為:
62、,
63、其中,?和??為權(quán)重系數(shù)一和權(quán)重系數(shù)二,用于平衡能耗和延遲的影響。
64、一種計算機裝置/設(shè)備/系統(tǒng),包括存儲器、處理器及存儲在存儲器上的計算機程序,所述處理器執(zhí)行所述計算機程序以實現(xiàn)上述方法的步驟。
65、一種計算機可讀存儲介質(zhì),其上存儲有計算機程序/指令,該計算機程序/指令被處理器執(zhí)行時實現(xiàn)上述方法的步驟。
66、一種計算機程序產(chǎn)品,包括計算機程序/指令,該計算機程序/指令被處理器執(zhí)行時實現(xiàn)上述方法的步驟。
67、本發(fā)明達(dá)到的有益效果:本發(fā)明的車聯(lián)網(wǎng)駕駛員狀態(tài)監(jiān)控方法,采用變分自編碼器實現(xiàn)駕駛員狀態(tài)數(shù)據(jù)的降維和特征提取,通過優(yōu)化變分下界自適應(yīng)地學(xué)習(xí)隱空間表示,減小模型復(fù)雜度,進(jìn)而減少了數(shù)據(jù)傳輸延遲;本發(fā)明基于隨機微分博弈的多智能體協(xié)同優(yōu)化框架,通過求解納什均衡實現(xiàn)多智能體的分布式協(xié)同決策,提高了系統(tǒng)的適應(yīng)性和魯棒性,可顯著提高交通安全性和駕駛體驗。
68、同時,引入分?jǐn)?shù)階微分方程對駕駛員狀態(tài)的動態(tài)變化進(jìn)行建模,通過分?jǐn)?shù)階導(dǎo)數(shù)更準(zhǔn)確地描述復(fù)雜系統(tǒng)的記憶效應(yīng)和非局部相關(guān)性,提高狀態(tài)估計精度;提出自適應(yīng)駕駛員狀態(tài)輔助方法,綜合考慮駕駛員狀態(tài)、環(huán)境風(fēng)險,動態(tài)調(diào)整車輛控制參數(shù)和人機交互方式,提高輔助決策的實時性和有效性。