1.一種基于ddpg模型的無(wú)線(xiàn)傳輸擁塞控制方法,其特征在于,包括以下步驟:
2.根據(jù)權(quán)利要求1所述的一種基于ddpg模型的無(wú)線(xiàn)傳輸擁塞控制方法,其特征在于,所述s1包括:
3.根據(jù)權(quán)利要求1所述的一種基于ddpg模型的無(wú)線(xiàn)傳輸擁塞控制方法,其特征在于,所述s2中,利用卷積矩陣對(duì)所述網(wǎng)絡(luò)統(tǒng)計(jì)信息進(jìn)行預(yù)處理,包括:
4.根據(jù)權(quán)利要求1所述的一種基于ddpg模型的無(wú)線(xiàn)傳輸擁塞控制方法,其特征在于,所述s2中,網(wǎng)絡(luò)狀態(tài)向量表示為:
5.根據(jù)權(quán)利要求1所述的一種基于ddpg模型的無(wú)線(xiàn)傳輸擁塞控制方法,其特征在于,所述s3中,獎(jiǎng)勵(lì)函數(shù)表示為:
6.根據(jù)權(quán)利要求1所述的一種基于ddpg模型的無(wú)線(xiàn)傳輸擁塞控制方法,其特征在于,所述s4包括:
7.根據(jù)權(quán)利要求6所述的一種基于ddpg模型的無(wú)線(xiàn)傳輸擁塞控制方法,其特征在于,所述s43中,累積預(yù)期回報(bào)rt表示為:
8.根據(jù)權(quán)利要求6所述的一種基于ddpg模型的無(wú)線(xiàn)傳輸擁塞控制方法,其特征在于,所述s45包括:
9.根據(jù)權(quán)利要求1所述的一種基于ddpg模型的無(wú)線(xiàn)傳輸擁塞控制方法,其特征在于,所述s5包括:
10.一種基于ddpg模型的無(wú)線(xiàn)傳輸擁塞控制系統(tǒng),其特征在于,包括: