1.一種具身智能機器人的信息交互方法,其特征在于,所述方法包括:
2.根據(jù)權(quán)利要求1所述的一種具身智能機器人的信息交互方法,其特征在于:所述步驟s1包括:
3.根據(jù)權(quán)利要求2所述的一種具身智能機器人的信息交互方法,其特征在于:所述步驟s13包括:
4.根據(jù)權(quán)利要求1所述的一種具身智能機器人的信息交互方法,其特征在于:所述步驟s22包括:
5.根據(jù)權(quán)利要求4所述的一種具身智能機器人的信息交互方法,其特征在于:所述步驟s24包括:
6.根據(jù)權(quán)利要求1所述的一種具身智能機器人的信息交互方法,其特征在于:所述步驟s31包括:
7.根據(jù)權(quán)利要求1所述的一種具身智能機器人的信息交互方法,其特征在于:所述步驟s32包括:
8.根據(jù)權(quán)利要求1所述的一種具身智能機器人的信息交互方法,其特征在于:所述步驟s33包括:
9.根據(jù)權(quán)利要求1所述的一種具身智能機器人的信息交互方法,其特征在于:所述步驟s34包括:
10.根據(jù)權(quán)利要求9所述的一種具身智能機器人的信息交互方法,其特征在于:所述使用強化學習法更新公式調(diào)整q值表,根據(jù)更新后的q值表,不斷優(yōu)化機器人在不同狀態(tài)下的行動策略π(s),選擇能最大化q值的動作;