欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

智能體博弈方法、裝置、計(jì)算機(jī)設(shè)備及可讀存儲(chǔ)介質(zhì)與流程

文檔序號(hào):40435613發(fā)布日期:2024-12-24 15:09閱讀:25來源:國知局
智能體博弈方法、裝置、計(jì)算機(jī)設(shè)備及可讀存儲(chǔ)介質(zhì)與流程

本技術(shù)涉及博弈對(duì)抗,尤其涉及一種智能體博弈方法、裝置、計(jì)算機(jī)設(shè)備及可讀存儲(chǔ)介質(zhì)。


背景技術(shù):

1、智能體博弈是指多個(gè)智能體(可以是軟件、機(jī)器人、算法模型、對(duì)象等)在特定的博弈環(huán)境中進(jìn)行交互,并嘗試通過交互和策略選擇來進(jìn)行決策的過程。通過模擬和優(yōu)化智能體之間的交互過程,可以理解和優(yōu)化智能體系統(tǒng)中的策略選擇和利益分配,以在復(fù)雜系統(tǒng)中找到更有效的決策方案,提高系統(tǒng)的整體性能和效率。

2、相關(guān)技術(shù)中,在智能體博弈的過程中,博弈環(huán)境可以向智能體提供當(dāng)前的狀態(tài),智能體可以根據(jù)狀態(tài)選擇相應(yīng)的動(dòng)作,以使博弈環(huán)境可以根據(jù)動(dòng)作更新狀態(tài)。但是,這種交互方式,會(huì)出現(xiàn)當(dāng)某個(gè)智能體占用過多的計(jì)算資源或者運(yùn)行崩潰時(shí),直接對(duì)博弈環(huán)境或者其他智能體產(chǎn)生影響,進(jìn)而降低系統(tǒng)的穩(wěn)定性和可靠性。


技術(shù)實(shí)現(xiàn)思路

1、本技術(shù)實(shí)施例的主要目的在于提出一種智能體博弈方法、裝置、計(jì)算機(jī)設(shè)備及可讀存儲(chǔ)介質(zhì),能夠提高系統(tǒng)在智能體博弈時(shí)的穩(wěn)定性和可靠性。

2、為實(shí)現(xiàn)上述目的,本技術(shù)實(shí)施例的第一方面提出了一種智能體博弈方法,所述方法包括:

3、響應(yīng)于針對(duì)目標(biāo)博弈環(huán)境的博弈觸發(fā)操作,確定當(dāng)前所述目標(biāo)博弈環(huán)境下各博弈代理智能體的調(diào)用順序;

4、獲取所述目標(biāo)博弈環(huán)境當(dāng)前的博弈狀態(tài),并根據(jù)所述博弈狀態(tài)生成所述調(diào)用順序?qū)?yīng)的博弈代理智能體的博弈動(dòng)作調(diào)用信息;

5、確定每個(gè)所述博弈代理智能體關(guān)聯(lián)的資源代理端,通過所述資源代理端將所述博弈動(dòng)作調(diào)用信息發(fā)送至對(duì)應(yīng)的博弈代理智能體,并獲取所述博弈代理智能體根據(jù)所述博弈動(dòng)作調(diào)用信息返回的博弈動(dòng)作信息;

6、將所述資源代理端接收的所述博弈動(dòng)作信息通過連接接口反饋至所述目標(biāo)博弈環(huán)境中,并根據(jù)所述目標(biāo)博弈環(huán)境下的多個(gè)所述博弈代理智能體對(duì)應(yīng)的多個(gè)博弈動(dòng)作信息形成博弈對(duì)局信息;

7、基于所述博弈對(duì)局信息在所述目標(biāo)博弈環(huán)境中進(jìn)行智能體博弈。

8、相應(yīng)的,本技術(shù)實(shí)施例的第二方面提出了一種智能體博弈裝置,所述裝置包括:

9、響應(yīng)模塊,用于響應(yīng)于針對(duì)目標(biāo)博弈環(huán)境的博弈觸發(fā)操作,確定當(dāng)前所述目標(biāo)博弈環(huán)境下各博弈代理智能體的調(diào)用順序;

10、生成模塊,用于獲取所述目標(biāo)博弈環(huán)境當(dāng)前的博弈狀態(tài),并根據(jù)所述博弈狀態(tài)生成所述調(diào)用順序?qū)?yīng)的博弈代理智能體的博弈動(dòng)作調(diào)用信息;

11、獲取模塊,用于確定每個(gè)所述博弈代理智能體關(guān)聯(lián)的資源代理端,通過所述資源代理端將所述博弈動(dòng)作調(diào)用信息發(fā)送至對(duì)應(yīng)的博弈代理智能體,并獲取所述博弈代理智能體根據(jù)所述博弈動(dòng)作調(diào)用信息返回的博弈動(dòng)作信息;

12、反饋模塊,用于將所述資源代理端接收的所述博弈動(dòng)作信息通過連接接口反饋至所述目標(biāo)博弈環(huán)境中,并根據(jù)所述目標(biāo)博弈環(huán)境下的多個(gè)所述博弈代理智能體對(duì)應(yīng)的多個(gè)博弈動(dòng)作信息形成博弈對(duì)局信息;

13、博弈模塊,用于基于所述博弈對(duì)局信息在所述目標(biāo)博弈環(huán)境中進(jìn)行智能體博弈。

14、在一些實(shí)施方式中,所述獲取模塊,還用于:

15、根據(jù)各博弈代理智能體的調(diào)用順序,確定當(dāng)前調(diào)用順序?qū)?yīng)的博弈代理智能體的代理標(biāo)識(shí);

16、通過總資源代理端確定所述代理標(biāo)識(shí)對(duì)應(yīng)的資源代理端,并將所述博弈動(dòng)作調(diào)用信息通過連接接口發(fā)送至對(duì)應(yīng)的所述博弈代理智能體的資源代理端,以使所述資源代理端將所述博弈動(dòng)作調(diào)用信息發(fā)送至對(duì)應(yīng)的博弈代理智能體;其中,所述總資源代理端用于建立并存儲(chǔ)所述目標(biāo)博弈環(huán)境中的多個(gè)所述博弈代理智能體與多個(gè)資源代理端的對(duì)應(yīng)關(guān)系。

17、在一些實(shí)施方式中,每個(gè)所述博弈代理智能體屬于機(jī)器代理智能體、對(duì)象代理智能體中的一種,所述獲取模塊,還用于:

18、所述獲取所述博弈代理智能體根據(jù)所述博弈動(dòng)作調(diào)用信息返回的博弈動(dòng)作信息,包括:

19、當(dāng)所述博弈代理智能體屬于機(jī)器代理智能體時(shí),通過所述資源代理端獲取所述機(jī)器代理智能體根據(jù)所述博弈動(dòng)作調(diào)用信息進(jìn)行動(dòng)作選擇后返回的博弈動(dòng)作信息;

20、當(dāng)所述博弈代理智能體屬于對(duì)象代理智能體時(shí),通過所述資源代理端獲取所述對(duì)象代理智能體根據(jù)所述博弈動(dòng)作調(diào)用信息返回的博弈動(dòng)作信息;其中,所述博弈動(dòng)作信息由所述對(duì)象代理智能體在將所述博弈動(dòng)作調(diào)用信息轉(zhuǎn)發(fā)至終端進(jìn)行動(dòng)作選擇后,通過與所述終端之間的長(zhǎng)連接接收得到。

21、在一些實(shí)施方式中,所述智能體博弈裝置還包括建立模塊,用于:

22、確定所述資源代理端對(duì)應(yīng)的服務(wù)子節(jié)點(diǎn),以及每個(gè)所述博弈代理智能體對(duì)應(yīng)的客戶子節(jié)點(diǎn);

23、通過所述服務(wù)子節(jié)點(diǎn)和各所述客戶子節(jié)點(diǎn)之間的網(wǎng)絡(luò)接口,建立所述資源代理端和對(duì)應(yīng)的博弈代理智能體之間的網(wǎng)絡(luò)通信。

24、在一些實(shí)施方式中,所述建立模塊,還用于:

25、獲取系統(tǒng)的可用資源量;

26、獲取預(yù)設(shè)的資源量閾值,并將所述可用資源量和所述資源量閾值進(jìn)行比較,得到比較結(jié)果;

27、基于所述比較結(jié)果,將所述服務(wù)子節(jié)點(diǎn)和所述客戶子節(jié)點(diǎn)分配至對(duì)應(yīng)的計(jì)算節(jié)點(diǎn)中運(yùn)行。

28、在一些實(shí)施方式中,所述建立模塊,還用于:

29、當(dāng)所述比較結(jié)果表征所述可用資源量大于所述資源量閾值時(shí),將所述服務(wù)子節(jié)點(diǎn)和各所述客戶子節(jié)點(diǎn)分配至不同的計(jì)算節(jié)點(diǎn)中運(yùn)行;

30、當(dāng)所述比較結(jié)果表征所述可用資源量小于所述資源量閾值時(shí),將所述服務(wù)子節(jié)點(diǎn)和每個(gè)所述客戶子節(jié)點(diǎn)分配相同的計(jì)算節(jié)點(diǎn)中運(yùn)行。

31、在一些實(shí)施方式中,所述智能體博弈裝置還包括接收模塊,用于:

32、針對(duì)所述目標(biāo)博弈環(huán)境,創(chuàng)建對(duì)應(yīng)的總資源代理端;

33、通過所述總資源代理端的對(duì)外端口接收各所述博弈代理智能體的注冊(cè)信息;

34、對(duì)所述注冊(cè)信息進(jìn)行驗(yàn)證,得到驗(yàn)證結(jié)果;

35、當(dāng)所述驗(yàn)證結(jié)果表征所述博弈代理智能體的驗(yàn)證通過時(shí),在所述總資源代理端中創(chuàng)建所述博弈代理智能體對(duì)應(yīng)的資源代理端。

36、相應(yīng)的,本技術(shù)實(shí)施例的第三方面提出了一種計(jì)算機(jī)設(shè)備,所述計(jì)算機(jī)設(shè)備包括存儲(chǔ)器和處理器,所述存儲(chǔ)器存儲(chǔ)有計(jì)算機(jī)程序,所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)本技術(shù)第一方面實(shí)施例任一項(xiàng)所述的智能體博弈方法。

37、相應(yīng)的,本技術(shù)實(shí)施例的第四方面提出了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述存儲(chǔ)介質(zhì)存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)本技術(shù)第一方面實(shí)施例任一項(xiàng)所述的智能體博弈方法。

38、本技術(shù)實(shí)施例通過響應(yīng)于針對(duì)目標(biāo)博弈環(huán)境的博弈觸發(fā)操作,并確定當(dāng)前目標(biāo)博弈環(huán)境下各博弈代理智能體的調(diào)用順序;獲取目標(biāo)博弈環(huán)境當(dāng)前的博弈狀態(tài),并根據(jù)博弈狀態(tài)生成調(diào)用順序?qū)?yīng)的博弈代理智能體的博弈動(dòng)作調(diào)用信息;確定每個(gè)博弈代理智能體關(guān)聯(lián)的資源代理端,通過資源代理端將博弈動(dòng)作調(diào)用信息發(fā)送至對(duì)應(yīng)的博弈代理智能體,并獲取博弈代理智能體根據(jù)博弈動(dòng)作調(diào)用信息返回的博弈動(dòng)作信息;將資源代理端接收的博弈動(dòng)作信息通過連接接口反饋至目標(biāo)博弈環(huán)境中,并根據(jù)目標(biāo)博弈環(huán)境下的多個(gè)博弈代理智能體對(duì)應(yīng)的多個(gè)博弈動(dòng)作信息形成博弈對(duì)局信息;基于博弈對(duì)局信息在目標(biāo)博弈環(huán)境中進(jìn)行智能體博弈。以此,能夠通過設(shè)立資源代理端,實(shí)現(xiàn)了博弈代理智能體與目標(biāo)博弈環(huán)境交互進(jìn)程的解耦,確保了每個(gè)博弈代理智能體的資源獨(dú)立性,即使存在某個(gè)博弈代理智能體消耗了大量計(jì)算資源或發(fā)生崩潰,也不會(huì)對(duì)目標(biāo)博弈環(huán)境或其他的博弈代理智能體產(chǎn)生直接的影響,提高了系統(tǒng)在智能體博弈時(shí)的穩(wěn)定性和可靠性。

當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
资源县| 沈丘县| 庆云县| 东兰县| 盐山县| 天全县| 崇义县| 元氏县| 杨浦区| 湖北省| 常宁市| 九寨沟县| 平原县| 洞头县| 肇东市| 华亭县| 深泽县| 青浦区| 靖西县| 萍乡市| 衡水市| 滨海县| 武隆县| 五莲县| 衡水市| 九台市| 隆安县| 武清区| 海城市| 井冈山市| 湖北省| 乌拉特后旗| 文昌市| 曲周县| 宾川县| 平潭县| 济阳县| 宝应县| 宁安市| 彰化市| 漾濞|