1.一種基于簇間對抗的智能體訓(xùn)練方法,其特征在于,所述方法包括:
2.根據(jù)權(quán)利要求1所述的一種基于簇間對抗的智能體訓(xùn)練方法,其特征在于,控制所述目標(biāo)方擴展智能體簇和所述對手方擴展智能體簇中的智能體進行對抗訓(xùn)練,以更新所述目標(biāo)方擴展智能體簇和所述對手方擴展智能體簇中的智能體的步驟,包括:
3.根據(jù)權(quán)利要求2所述的一種基于簇間對抗的智能體訓(xùn)練方法,其特征在于,將所述智能體從所述目標(biāo)方擴展智能體簇或者所述對手方擴展智能體簇中刪除的步驟之后,所述方法還包括:
4.根據(jù)權(quán)利要求2所述的一種基于簇間對抗的智能體訓(xùn)練方法,其特征在于,控制所述目標(biāo)方擴展智能體簇中的智能體與所述對手方擴展智能體簇中的智能體進行預(yù)設(shè)輪次的仿真對抗,以得到每個智能體的仿真對抗結(jié)果的步驟,包括:
5.根據(jù)權(quán)利要求4所述的一種基于簇間對抗的智能體訓(xùn)練方法,其特征在于,所述方法還包括:
6.根據(jù)權(quán)利要求1所述的一種基于簇間對抗的智能體訓(xùn)練方法,其特征在于,針對任一目標(biāo)方智能體簇,控制所述目標(biāo)方智能體簇分別與多個所述對手池中的對手方智能體簇進行對抗訓(xùn)練,以訓(xùn)練得到所述目標(biāo)方智能體簇中的每個初始目標(biāo)方智能體各自對應(yīng)的多個個性化智能體的步驟,包括:
7.根據(jù)權(quán)利要求1所述的一種基于簇間對抗的智能體訓(xùn)練方法,其特征在于,基于多個所述個性化智能體的智能體參數(shù),得到所述初始目標(biāo)方智能體對應(yīng)的個性化目標(biāo)方智能體的步驟,包括:
8.根據(jù)權(quán)利要求1所述的一種基于簇間對抗的智能體訓(xùn)練方法,其特征在于,得到每個初始目標(biāo)方智能體各自對應(yīng)的目標(biāo)方均衡化智能體的步驟之后,所述方法還包括:
9.根據(jù)權(quán)利要求2所述的一種基于簇間對抗的智能體訓(xùn)練方法,其特征在于,所述方法還包括:
10.一種基于簇間對抗的智能體訓(xùn)練裝置,其特征在于,所述裝置包括: