1.一種基于通感一體化的無(wú)人機(jī)信息采集系統(tǒng)速率優(yōu)化方法,其特征在于,所述方法包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,通過(guò)以下步驟確定參數(shù)φ估計(jì)的crb(φ):
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述通過(guò)多智能體強(qiáng)化學(xué)習(xí)模型對(duì)所述優(yōu)化問(wèn)題進(jìn)行求解,確定m架無(wú)人機(jī)向i個(gè)地面物聯(lián)網(wǎng)設(shè)備收集信息的最大總速率,包括:
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述actor-critic網(wǎng)絡(luò)中的actor網(wǎng)絡(luò)用于根據(jù)策略對(duì)每一個(gè)觀察做出一個(gè)動(dòng)作決策,critic網(wǎng)絡(luò)用于使用state-value函數(shù)評(píng)估所述actor網(wǎng)絡(luò)選擇的動(dòng)作;
5.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述actor-critic網(wǎng)絡(luò)通過(guò)調(diào)整actor網(wǎng)絡(luò)與critic網(wǎng)絡(luò)的參數(shù)來(lái)確定所述最優(yōu)策略;其中,所述actor-critic網(wǎng)絡(luò)由評(píng)估網(wǎng)絡(luò)和目標(biāo)網(wǎng)絡(luò)構(gòu)成,所述評(píng)估網(wǎng)絡(luò)包括所述actor網(wǎng)絡(luò)的參數(shù)和所述critic網(wǎng)絡(luò)的參數(shù)所述目標(biāo)網(wǎng)絡(luò)包括所述actor網(wǎng)絡(luò)的參數(shù)和critic網(wǎng)絡(luò)的參數(shù)
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述actor-critic網(wǎng)絡(luò)通過(guò)調(diào)整所述actor網(wǎng)絡(luò)與所述critic網(wǎng)絡(luò)的參數(shù),包括:
7.一種基于通感一體化的無(wú)人機(jī)信息采集系統(tǒng)速率優(yōu)化裝置,其特征在于,所述裝置包括:
8.一種計(jì)算機(jī)設(shè)備,其特征在于,包括:
9.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其特征在于,所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)存儲(chǔ)有計(jì)算機(jī)指令,所述計(jì)算機(jī)指令用于使所述計(jì)算機(jī)執(zhí)行權(quán)利要求1-6任一項(xiàng)所述的基于通感一體化的無(wú)人機(jī)信息采集系統(tǒng)速率優(yōu)化方法。
10.一種計(jì)算機(jī)程序產(chǎn)品,其特征在于,包括計(jì)算機(jī)指令,所述計(jì)算機(jī)指令用于使計(jì)算機(jī)執(zhí)行權(quán)利要求1-6中任一項(xiàng)所述的基于通感一體化的無(wú)人機(jī)信息采集系統(tǒng)速率優(yōu)化方法。