本發(fā)明涉及無(wú)線通信,具體涉及一種基于通感一體化的無(wú)人機(jī)信息采集系統(tǒng)速率優(yōu)化方法。
背景技術(shù):
1、通信感知一體化(integrated?sensing?and?communication,簡(jiǎn)稱isac)系統(tǒng)是一種將無(wú)線通信和環(huán)境感知功能集成在同一平臺(tái)上的新興技術(shù),旨在通過(guò)共享無(wú)線頻譜和硬件資源,實(shí)現(xiàn)高效的通信和精準(zhǔn)的環(huán)境感知。isac系統(tǒng)在智能交通、無(wú)人駕駛、智慧城市和工業(yè)物聯(lián)網(wǎng)等多個(gè)領(lǐng)域具有廣泛應(yīng)用前景。isac系統(tǒng)可以通過(guò)頻譜共享,在相同頻譜資源下同時(shí)實(shí)現(xiàn)無(wú)線通信和環(huán)境感知,網(wǎng)絡(luò)可以同時(shí)用于數(shù)據(jù)傳輸和雷達(dá)探測(cè),顯著提高頻譜利用率;通過(guò)硬件共享,如天線陣列和射頻前端,毫米波雷達(dá)和通信基站共享天線,減少了獨(dú)立通信和感知設(shè)備的需求,降低了硬件成本和系統(tǒng)復(fù)雜度;通過(guò)信號(hào)處理集成和信息融合,協(xié)同優(yōu)化通信和感知性能,提高系統(tǒng)整體效率和可靠性。
2、隨著無(wú)人機(jī)技術(shù)的發(fā)展,isac系統(tǒng)開(kāi)始在無(wú)人機(jī)領(lǐng)域廣泛應(yīng)用,可以通過(guò)集成感知和通信功能,實(shí)現(xiàn)無(wú)人機(jī)在廣域環(huán)境中為地面用戶提供無(wú)線覆蓋、偵察、植保作業(yè)等任務(wù),使得無(wú)人機(jī)群可以在未知的環(huán)境中自主進(jìn)行飛行路徑規(guī)劃和軌跡優(yōu)化,提升飛行安全性和工作效率。在無(wú)人機(jī)的按需部署和強(qiáng)視距鏈路的驅(qū)動(dòng)下,無(wú)人機(jī)成為一種空中isac平臺(tái),根據(jù)傳感頻率和通信質(zhì)量的要求,提供更可控、更均衡的綜合服務(wù)。由于頻譜資源的共享和信號(hào)散射的復(fù)雜性,在高質(zhì)量通信服務(wù)和高時(shí)效性感知需求這兩個(gè)可能相互沖突的設(shè)計(jì)目標(biāo)之間取得良好的平衡是保證通感性能的關(guān)鍵。而波束賦形的設(shè)計(jì)是isac的核心問(wèn)題之一,技術(shù)重點(diǎn)在于如何設(shè)計(jì)能夠同時(shí)滿足通信和感知需求的波束陣列矩陣。
3、為了解決這個(gè)問(wèn)題,衍生出了使用陣列信號(hào)處理算法,如最小均方誤差(mmse)算法和自適應(yīng)濾波技術(shù),實(shí)時(shí)監(jiān)測(cè)環(huán)境和目標(biāo)信息,動(dòng)態(tài)調(diào)整波束方向和形狀,以優(yōu)化信號(hào)質(zhì)量和感知性能;多輸入多輸出(mimo)技術(shù)利用多天線同時(shí)傳輸和接收信號(hào),提高系統(tǒng)的空間分辨率和信號(hào)強(qiáng)度實(shí)現(xiàn)高效波束賦形;大規(guī)模天線陣列(massive?mimo)利用大量天線單元形成極窄的波束,顯著提升系統(tǒng)的角度分辨率和感知精度,通過(guò)精確的天線排列和先進(jìn)的信號(hào)處理算法,實(shí)現(xiàn)高效的信號(hào)傳輸與接收。
4、隨著近年來(lái)人工智能的發(fā)展,對(duì)于強(qiáng)化學(xué)習(xí)的應(yīng)用的關(guān)注程度越來(lái)越高。強(qiáng)化學(xué)習(xí)的核心概念是智能體與環(huán)境的互動(dòng),通過(guò)智能體一系列的行為,做出行為后的反饋,不斷迭代最終得到問(wèn)題的最優(yōu)結(jié)果。強(qiáng)化學(xué)習(xí)應(yīng)用在無(wú)線通信領(lǐng)域中,由于環(huán)境是變化、復(fù)雜且具有隨機(jī)性的,傳統(tǒng)的算法難以適應(yīng)這些特點(diǎn),不能在快速變化的環(huán)境中做出相應(yīng)的最優(yōu)決策。而在強(qiáng)化學(xué)習(xí)中,智能體可以根據(jù)環(huán)境的實(shí)時(shí)狀況進(jìn)行反饋從而在不同的環(huán)境下做出最優(yōu)的決策。同時(shí)強(qiáng)化學(xué)習(xí)提升了網(wǎng)絡(luò)管理效率,其自主決策的能力能夠有效利用現(xiàn)有的無(wú)線和計(jì)算資源。
5、由于具備在復(fù)雜環(huán)境中進(jìn)行策略優(yōu)化的優(yōu)勢(shì),深度強(qiáng)化學(xué)習(xí)(deepreinforcement?learning,drl)技術(shù)已逐漸成為isac系統(tǒng)中解決波束賦形問(wèn)題的有效工具。波束賦形是通過(guò)控制天線陣列的發(fā)射和接收方向來(lái)提高通信和感知性能的技術(shù)。傳統(tǒng)的波束賦形方法,如基于預(yù)編碼的最優(yōu)波束設(shè)計(jì),通常需要精確的信道狀態(tài)信息(csi)和復(fù)雜的計(jì)算。而在實(shí)際環(huán)境中,csi往往難以準(zhǔn)確獲取,且環(huán)境是動(dòng)態(tài)變化的,需要實(shí)時(shí)調(diào)整波束方向。在深度強(qiáng)化學(xué)習(xí)應(yīng)用中,對(duì)于環(huán)境的建模,智能體的狀態(tài)可包括信道狀態(tài)信息、干擾情況、目標(biāo)位置和運(yùn)動(dòng)狀態(tài)等,動(dòng)作空間則定義為天線陣列的波束方向、功率分配策略或多波束組合策略等,通過(guò)深度神經(jīng)網(wǎng)絡(luò)(如卷積神經(jīng)網(wǎng)絡(luò),cnn)提取高維特征,獲取系統(tǒng)優(yōu)化配置。
6、當(dāng)前在使用深度強(qiáng)化學(xué)習(xí)求解無(wú)人機(jī)軌跡優(yōu)化問(wèn)題中,應(yīng)用了兩種特定的方法:深度q網(wǎng)絡(luò)(deep?q?network,dqn)和雙深度q網(wǎng)絡(luò)(double?dqn,ddqn)方法,適用于離散動(dòng)作空間,通過(guò)q網(wǎng)絡(luò)評(píng)估每個(gè)動(dòng)作的價(jià)值,并選擇最優(yōu)動(dòng)作。首先收集環(huán)境狀態(tài)數(shù)據(jù)、通信信道信息數(shù)據(jù)和目標(biāo)感知數(shù)據(jù),進(jìn)行預(yù)處理以適應(yīng)drl模型輸入要求。然后對(duì)模型訓(xùn)練,選擇適當(dāng)?shù)膁rl算法,構(gòu)建深度神經(jīng)網(wǎng)絡(luò)模型,定義狀態(tài)、動(dòng)作和獎(jiǎng)勵(lì)函數(shù)。在模擬環(huán)境中進(jìn)行模型訓(xùn)練,通過(guò)大量交互數(shù)據(jù)更新策略,優(yōu)化無(wú)人機(jī)軌跡。dqn算法作為一種基于深度學(xué)習(xí)的強(qiáng)化學(xué)習(xí)算法,在單智能體離散動(dòng)作空間問(wèn)題上性能較好,然而在多無(wú)人機(jī)相互協(xié)作的場(chǎng)景中,尤其在智能體對(duì)其它智能體所作出的決策未知的情況下無(wú)法得到良好解決方案。多智能體強(qiáng)化學(xué)習(xí)(marl)、多智能深度強(qiáng)化學(xué)習(xí)(madrl)在單智能體強(qiáng)化學(xué)習(xí)的基礎(chǔ)上,為多智能體聯(lián)合訓(xùn)練問(wèn)題提供了解決方法,其算法在無(wú)人機(jī)對(duì)其它無(wú)人機(jī)決策未知的情況下仍然可以做出最優(yōu)決策,有效解決多無(wú)人機(jī)聯(lián)合執(zhí)行任務(wù)、資源調(diào)度等問(wèn)題,并取得了優(yōu)越的系統(tǒng)性能。
7、先前關(guān)于isac系統(tǒng)的開(kāi)發(fā)主要集中在讓通信和感知同時(shí)提高性能,忽略了實(shí)際的不對(duì)稱傳感和通信需求,在isac模型下對(duì)無(wú)人機(jī)的軌跡優(yōu)化問(wèn)題的探索也并不充分。同時(shí),關(guān)于無(wú)人機(jī)軌跡優(yōu)化的研究仍然存在局限性,大部分研究只考慮了以功率作為限制的單個(gè)、多個(gè)無(wú)人機(jī)的軌跡優(yōu)化,忽略了在實(shí)際isac場(chǎng)景中存在的問(wèn)題,例如無(wú)人機(jī)作為通信的中轉(zhuǎn)站其位置對(duì)通信質(zhì)量的影響、無(wú)人機(jī)感知精度與其軌跡及能耗的關(guān)系等,因此需要將無(wú)人機(jī)的軌跡優(yōu)化與模型下各因素進(jìn)行聯(lián)合開(kāi)發(fā)。
技術(shù)實(shí)現(xiàn)思路
1、有鑒于此,本發(fā)明提供了一種基于通感一體化的無(wú)人機(jī)信息采集系統(tǒng)速率優(yōu)化方法,以現(xiàn)有技術(shù)中無(wú)法在保證感知精度的前提下,保證無(wú)人機(jī)與物聯(lián)網(wǎng)設(shè)備之間的通信速率,進(jìn)而影響無(wú)人機(jī)群的整體路徑優(yōu)化的問(wèn)題。
2、第一方面,本發(fā)明提供了一種基于通感一體化的無(wú)人機(jī)信息采集系統(tǒng)速率優(yōu)化方法,該方法包括:
3、步驟s1,確定無(wú)人機(jī)到地面物聯(lián)網(wǎng)設(shè)備的基帶等效信道;其中,步驟s1包括:
4、步驟s11,確定無(wú)人機(jī)到用戶的信道增益βm,i,式中,表示無(wú)人機(jī)m在高度g時(shí)的二維平面位置,表示第i個(gè)物聯(lián)網(wǎng)設(shè)備的二維坐標(biāo)信息,β0表示1米處的信道增益,n為時(shí)隙,總時(shí)隙個(gè)數(shù)為n;
5、步驟s12,基于信道增益,確定從第m架無(wú)人機(jī)到第i個(gè)地面物聯(lián)網(wǎng)設(shè)備的基帶等效信道hm,i,其中,式中,dm,i表示第m個(gè)無(wú)人機(jī)與第i個(gè)地面物聯(lián)網(wǎng)設(shè)備之間的距離,上標(biāo)h表示共軛轉(zhuǎn)置,為無(wú)人機(jī)m對(duì)用戶的發(fā)射信號(hào)響應(yīng)向量,式中,b為天線半波長(zhǎng)邊距,λ為載波波長(zhǎng),nt表示無(wú)人機(jī)發(fā)射天線的總個(gè)數(shù),發(fā)射天線與接收天線個(gè)數(shù)相同,θm,i為第m個(gè)無(wú)人機(jī)與第i個(gè)地面物聯(lián)網(wǎng)設(shè)備之間的地理路徑仰角,
6、步驟s2,基于基帶等效信道,確定無(wú)人機(jī)通過(guò)接收天線接收的數(shù)據(jù)信號(hào)
7、式中,αm,i為無(wú)人機(jī)m的雷達(dá)散射截面積,滿足正態(tài)分布,為無(wú)人機(jī)m在時(shí)隙n發(fā)射的感知信號(hào),表示無(wú)人機(jī)m發(fā)射的感知信號(hào),且表示所述感知信號(hào)的發(fā)射波束預(yù)編碼向量,且為地面物聯(lián)網(wǎng)設(shè)備i向無(wú)人機(jī)m發(fā)送的數(shù)據(jù),表示數(shù)據(jù)信號(hào)的接收波束編碼向量,且表示加性高斯白噪聲,滿足上標(biāo)t表示轉(zhuǎn)置;
8、步驟s3,確定第m架無(wú)人機(jī)收集第i個(gè)地面物聯(lián)網(wǎng)設(shè)備的數(shù)據(jù)速率rm,i[n],rm,i[n]=log2(1+γm,i[n]),式中,
9、步驟s4,基于約束條件以及數(shù)據(jù)速率,建立優(yōu)化問(wèn)題;
10、其中,優(yōu)化問(wèn)題為:式中,為感知信號(hào)的協(xié)方差矩陣,m為無(wú)人機(jī)總數(shù),i為地面物聯(lián)網(wǎng)設(shè)備總數(shù);
11、約束條件包括:
12、式中,c1表示對(duì)所有無(wú)人機(jī)的軌跡約束,c2表示對(duì)無(wú)人機(jī)的功率約束,c3表示為無(wú)人機(jī)感知精度需求,c4表示對(duì)無(wú)人機(jī)之間的最小距離約束以避免碰撞,s表示整個(gè)覆蓋區(qū)域的半徑,p表示功率上限,γ表示感知精度限制,lmin表示無(wú)人機(jī)與無(wú)人機(jī)之間的最小間隔距離,k代表除了無(wú)人機(jī)m以外的無(wú)人機(jī);
13、步驟s5,通過(guò)多智能體強(qiáng)化學(xué)習(xí)模型對(duì)優(yōu)化問(wèn)題進(jìn)行求解,確定m架無(wú)人機(jī)向i個(gè)地面物聯(lián)網(wǎng)設(shè)備收集信息的最大總速率。
14、本發(fā)明考慮包含多無(wú)人機(jī)、多地面物聯(lián)網(wǎng)設(shè)備的isac系統(tǒng)場(chǎng)景,針對(duì)構(gòu)建的無(wú)人機(jī)信息采集系統(tǒng)建立優(yōu)化問(wèn)題,該問(wèn)題在滿足感知精度、無(wú)人機(jī)軌跡限制、功率限制和無(wú)人機(jī)之間距離的同時(shí),對(duì)無(wú)人機(jī)的軌跡、發(fā)射波束賦形和發(fā)送符號(hào)進(jìn)行了聯(lián)合優(yōu)化,以達(dá)到高速率信號(hào)傳輸和高效信息收集目的,使無(wú)人機(jī)信息采集系統(tǒng)總傳輸速率最大化。為了更好的體現(xiàn)實(shí)際場(chǎng)景下多智能體相互協(xié)助,避免智能體之間的干擾,本發(fā)明還結(jié)合了多智能體深度強(qiáng)化學(xué)習(xí)方法,獲取無(wú)人機(jī)信息采集系統(tǒng)傳輸速率最優(yōu)的智能體動(dòng)作設(shè)置,從而實(shí)現(xiàn)無(wú)人機(jī)群的整體路徑優(yōu)化。
15、在一種可選的實(shí)施方式中,通過(guò)以下步驟確定參數(shù)φ估計(jì)的crb(φ):
16、確定需要感知的參數(shù)為其中,
17、對(duì)無(wú)人機(jī)接收的回波信號(hào)做向量化處理,將地面物聯(lián)網(wǎng)設(shè)備向無(wú)人機(jī)傳輸?shù)臄?shù)據(jù)信號(hào)看作為噪聲,即
18、確定無(wú)人機(jī)接收的數(shù)據(jù)信號(hào)為:
19、將轉(zhuǎn)換為:y=αhx+v,其中,
20、將y=αhx+v進(jìn)行向量化表示,確定η=vec{αhx},其中,將費(fèi)舍信息矩陣fim里的第m行第i列的元素表示為:其中,ξm和ξi表示ξ的第m個(gè)和第i個(gè)元素;
21、將費(fèi)舍信息矩陣劃分成2x2的矩陣fim,其中,式中,表示對(duì)參數(shù)φ求二次偏導(dǎo)的矩陣,表示對(duì)參數(shù)求二次偏導(dǎo)的矩陣,表示對(duì)參數(shù)φ和參數(shù)分別求偏導(dǎo)的矩陣;
22、根據(jù)費(fèi)舍信息矩陣與crb矩陣的關(guān)系,對(duì)參數(shù)φ估計(jì)的crb為:
23、在一種可選的實(shí)施方式中,通過(guò)多智能體強(qiáng)化學(xué)習(xí)模型對(duì)優(yōu)化問(wèn)題進(jìn)行求解,確定m架無(wú)人機(jī)向i個(gè)地面物聯(lián)網(wǎng)設(shè)備收集信息的最大總速率,包括:
24、確定m架無(wú)人機(jī)為m個(gè)智能體,并確定每個(gè)智能體對(duì)應(yīng)的狀態(tài)集合、觀察集合以及動(dòng)作集合;
25、根據(jù)狀態(tài)集合、觀察集合以及動(dòng)作集合,確定每個(gè)智能體對(duì)應(yīng)的策略;
26、基于優(yōu)化問(wèn)題,確定獎(jiǎng)勵(lì)函數(shù),其中,獎(jiǎng)勵(lì)函數(shù)為:式中,β表示懲罰因子,p1、p2、p3、p4均為懲罰項(xiàng),其中:
27、
28、式中,f(f(x))表示通過(guò)判別函數(shù)f(x)判斷后的判別值,其中:
29、
30、獲取預(yù)先建立的策略決策模型,策略決策模型包括actor-critic網(wǎng)絡(luò);
31、基于獎(jiǎng)勵(lì)函數(shù)、策略決策模型,對(duì)每個(gè)策略進(jìn)行決策,確定最優(yōu)策略,使得m架無(wú)人機(jī)向i個(gè)地面物聯(lián)網(wǎng)設(shè)備收集信息的總速率最大。
32、在一種可選的實(shí)施方式中,actor-critic網(wǎng)絡(luò)中的actor網(wǎng)絡(luò)用于根據(jù)策略對(duì)每一個(gè)觀察做出一個(gè)動(dòng)作決策,critic網(wǎng)絡(luò)用于使用state-value函數(shù)評(píng)估actor網(wǎng)絡(luò)選擇的動(dòng)作;
33、其中,state-value函數(shù)為:
34、
35、式中,γ表示折扣因子、τ表示折扣因子次冪參數(shù)、rm表示智能體m的獎(jiǎng)勵(lì)、表示智能體m的輸入狀態(tài)、am表示輸入狀態(tài)對(duì)應(yīng)的動(dòng)作。
36、在一種可選的實(shí)施方式中,actor-critic網(wǎng)絡(luò)通過(guò)調(diào)整actor網(wǎng)絡(luò)與critic網(wǎng)絡(luò)的參數(shù)來(lái)確定最優(yōu)策略;其中,actor-critic網(wǎng)絡(luò)由評(píng)估網(wǎng)絡(luò)和目標(biāo)網(wǎng)絡(luò)構(gòu)成,評(píng)估網(wǎng)絡(luò)包括actor網(wǎng)絡(luò)的參數(shù)和critic網(wǎng)絡(luò)的參數(shù)目標(biāo)網(wǎng)絡(luò)包括actor網(wǎng)絡(luò)的參數(shù)和critic網(wǎng)絡(luò)的參數(shù)
37、critic網(wǎng)絡(luò)的評(píng)估網(wǎng)絡(luò)參數(shù)通過(guò)減少損失來(lái)調(diào)整,第l次狀態(tài)轉(zhuǎn)移的損失函數(shù)為:其中,h′(·)是目標(biāo)網(wǎng)絡(luò)的狀態(tài)價(jià)值函數(shù),在連續(xù)且可微分的條件下,critic網(wǎng)絡(luò)根據(jù)損失函數(shù)的梯度進(jìn)行調(diào)整;
38、actor網(wǎng)絡(luò)的評(píng)估網(wǎng)絡(luò)參數(shù)通過(guò)最大化策略目標(biāo)函數(shù)更新,策略目標(biāo)函數(shù)為:式中,χm(·)為actor網(wǎng)絡(luò)的評(píng)估網(wǎng)絡(luò)函數(shù);
39、critic網(wǎng)絡(luò)的目標(biāo)網(wǎng)絡(luò)參數(shù)采用第一函數(shù)更新,第一函數(shù)為:式中,κ為一個(gè)正數(shù)常量;
40、actor網(wǎng)絡(luò)的目標(biāo)網(wǎng)絡(luò)參數(shù)采用第二函數(shù)更新,第二函數(shù)為:
41、在一種可選的實(shí)施方式中,actor-critic網(wǎng)絡(luò)通過(guò)調(diào)整actor網(wǎng)絡(luò)與critic網(wǎng)絡(luò)的參數(shù),包括:
42、初始化每個(gè)智能體對(duì)應(yīng)的actor網(wǎng)絡(luò)與critic網(wǎng)絡(luò)的評(píng)估網(wǎng)絡(luò)參數(shù)和目標(biāo)網(wǎng)絡(luò)參數(shù);
43、初始化每個(gè)智能體的經(jīng)驗(yàn)池大??;
44、確定時(shí)隙n以及智能體m;
45、觀測(cè)智能體m環(huán)境,獲得狀態(tài)sm[n];
46、根據(jù)狀態(tài)sm[n],智能體m選擇執(zhí)行動(dòng)作am[n];
47、智能體m執(zhí)行動(dòng)作后,獲得下一時(shí)隙狀態(tài)sm[n+1],直至智能體m的所有動(dòng)作am[n]執(zhí)行完成,并將所有狀態(tài)、動(dòng)作、獎(jiǎng)勵(lì)存儲(chǔ)至經(jīng)驗(yàn)池;
48、從經(jīng)驗(yàn)池中選擇經(jīng)驗(yàn)樣本;
49、基于經(jīng)驗(yàn)樣本,通過(guò)最小化損失函數(shù)更新critic網(wǎng)絡(luò)的評(píng)估網(wǎng)絡(luò)參數(shù)、通過(guò)最大化策略目標(biāo)函數(shù)更新actor網(wǎng)絡(luò)的評(píng)估網(wǎng)絡(luò)參數(shù)、通過(guò)第一函數(shù)更新critic網(wǎng)絡(luò)的目標(biāo)網(wǎng)絡(luò)參數(shù)、通過(guò)第二函數(shù)更新述actor網(wǎng)絡(luò)的目標(biāo)網(wǎng)絡(luò)參數(shù)。
50、第二方面,本發(fā)明提供了一種基于通感一體化的無(wú)人機(jī)信息采集系統(tǒng)速率優(yōu)化裝置,該裝置包括:
51、基帶等效信道確定模塊,用于確定無(wú)人機(jī)到地面物聯(lián)網(wǎng)設(shè)備的基帶等效信道;其中包括:用于確定無(wú)人機(jī)到用戶的信道增益βm,i,式中,表示無(wú)人機(jī)m在高度g時(shí)的二維平面位置,表示第i個(gè)物聯(lián)網(wǎng)設(shè)備的二維坐標(biāo)信息,β0表示1米處的信道增益,n為時(shí)隙,總時(shí)隙個(gè)數(shù)為n;還用于基于信道增益確定從第m架無(wú)人機(jī)到第i個(gè)地面物聯(lián)網(wǎng)設(shè)備的基帶等效信道hm,i,其中,式中,dm,i表示第m個(gè)無(wú)人機(jī)與第i個(gè)地面物聯(lián)網(wǎng)設(shè)備之間的距離,上標(biāo)h表示共軛轉(zhuǎn)置,為無(wú)人機(jī)m對(duì)用戶i的發(fā)射信號(hào)響應(yīng)向量,式中,b為天線半波長(zhǎng)邊距,λ為載波波長(zhǎng),nt表示無(wú)人機(jī)發(fā)射天線的總個(gè)數(shù),發(fā)射天線與接收天線個(gè)數(shù)相同,θm,i為第m個(gè)無(wú)人機(jī)與第i個(gè)地面物聯(lián)網(wǎng)設(shè)備之間的地理路徑仰角,
52、數(shù)據(jù)信號(hào)確定模塊,用于基于基帶等效信道確定無(wú)人機(jī)通過(guò)接收天線接收的數(shù)據(jù)信號(hào)式中,αm,i為無(wú)人機(jī)m的雷達(dá)散射截面積,滿足正態(tài)分布,為無(wú)人機(jī)m在時(shí)隙n發(fā)射的感知信號(hào),表示無(wú)人機(jī)m發(fā)射的感知信號(hào),且表示感知信號(hào)的發(fā)射波束預(yù)編碼向量,且為地面物聯(lián)網(wǎng)設(shè)備i向無(wú)人機(jī)m發(fā)送的數(shù)據(jù),表示所述數(shù)據(jù)信號(hào)的接收波束編碼向量,且zm,i[n]表示加性高斯白噪聲,滿足上標(biāo)t表示轉(zhuǎn)置;
53、速率確定模塊,用于確定第m架無(wú)人機(jī)收集第i個(gè)地面物聯(lián)網(wǎng)設(shè)備的數(shù)據(jù)速率rm,i[n],rm,i[n]=log2(1+γm,i[n]),式中,
54、建立模塊,用于基于約束條件以及數(shù)據(jù)速率,建立優(yōu)化問(wèn)題;其中,優(yōu)化問(wèn)題為:式中,為感知信號(hào)的協(xié)方差矩陣,m為無(wú)人機(jī)總數(shù),i為地面物聯(lián)網(wǎng)設(shè)備總數(shù);
55、約束條件包括:
56、式中,c1表示對(duì)所有無(wú)人機(jī)的軌跡約束,c2表示對(duì)無(wú)人機(jī)和地面物聯(lián)網(wǎng)設(shè)備的功率約束,c3表示為無(wú)人機(jī)感知精度需求,c4表示對(duì)無(wú)人機(jī)之間的最小距離約束以避免碰撞,s表示整個(gè)覆蓋區(qū)域的半徑,p表示功率上限,γ表示感知精度限制,lmin表示無(wú)人機(jī)與無(wú)人機(jī)之間的最小間隔距離,k代表除了無(wú)人機(jī)m以外的無(wú)人機(jī);
57、優(yōu)化模塊,用于通過(guò)多智能體強(qiáng)化學(xué)習(xí)模型對(duì)優(yōu)化問(wèn)題進(jìn)行求解,確定m架無(wú)人機(jī)向i個(gè)地面物聯(lián)網(wǎng)設(shè)備收集信息的最大總速率。
58、第三方面,本發(fā)明提供了一種計(jì)算機(jī)設(shè)備,包括:存儲(chǔ)器和處理器,存儲(chǔ)器和處理器之間互相通信連接,存儲(chǔ)器中存儲(chǔ)有計(jì)算機(jī)指令,處理器通過(guò)執(zhí)行計(jì)算機(jī)指令,從而執(zhí)行上述第一方面或其對(duì)應(yīng)的任一實(shí)施方式的基于通感一體化的無(wú)人機(jī)信息采集系統(tǒng)速率優(yōu)化方法。
59、第四方面,本發(fā)明提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)存儲(chǔ)有計(jì)算機(jī)指令,計(jì)算機(jī)指令用于使計(jì)算機(jī)執(zhí)行上述第一方面或其對(duì)應(yīng)的任一實(shí)施方式的基于通感一體化的無(wú)人機(jī)信息采集系統(tǒng)速率優(yōu)化方法。
60、第五方面,本發(fā)明提供了一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)指令,計(jì)算機(jī)指令用于使計(jì)算機(jī)執(zhí)行上述第一方面或其對(duì)應(yīng)的任一實(shí)施方式的基于通感一體化的無(wú)人機(jī)信息采集系統(tǒng)速率優(yōu)化方法。
61、需要說(shuō)明的是,由于本發(fā)明提供的基于通感一體化的無(wú)人機(jī)信息采集系統(tǒng)速率優(yōu)化裝置,計(jì)算機(jī)設(shè)備以及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)與上述的基于通感一體化的無(wú)人機(jī)信息采集系統(tǒng)速率優(yōu)化方法是對(duì)應(yīng)的。因此,關(guān)于基于通感一體化的無(wú)人機(jī)信息采集系統(tǒng)速率優(yōu)化裝置,計(jì)算機(jī)設(shè)備以及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)的有益效果,請(qǐng)參見(jiàn)上文基于通感一體化的無(wú)人機(jī)信息采集系統(tǒng)速率優(yōu)化方法的對(duì)應(yīng)有益效果的描述,在此不再贅述。