技術(shù)編號:40575200
提示:您尚未登錄,請點(diǎn) 登 陸 后下載,如果您還沒有賬戶請點(diǎn) 注 冊 ,登陸完成后,請刷新本頁查看技術(shù)詳細(xì)信息。本發(fā)明涉及無模型回歸強(qiáng)化學(xué)習(xí),特別是指一種基于無模型回歸強(qiáng)化學(xué)習(xí)的機(jī)器人系統(tǒng)控制方法及裝置。背景技術(shù)、機(jī)器人控制在工業(yè)領(lǐng)域、服務(wù)領(lǐng)域以及自動(dòng)駕駛和無人機(jī)領(lǐng)域等具有重要應(yīng)用。hjb方程旨在描述機(jī)器人動(dòng)態(tài)系統(tǒng)中的最優(yōu)決策過程,而機(jī)器人動(dòng)態(tài)系統(tǒng)的最優(yōu)決策問題的解往往依賴于hjb方程的解。強(qiáng)化學(xué)習(xí)能夠處理高維狀態(tài)空間,克服傳統(tǒng)方法的“維度詛咒”問題,并且可以在環(huán)境中實(shí)時(shí)學(xué)習(xí),適應(yīng)系統(tǒng)的動(dòng)態(tài)變化如文獻(xiàn)和[frank?l.?lewis,draguna?vrabie,?kyriakos?g.?vamvo...
注意:該技術(shù)已申請專利,請尊重研發(fā)人員的辛勤研發(fā)付出,在未取得專利權(quán)人授權(quán)前,僅供技術(shù)研究參考不得用于商業(yè)用途。
該專利適合技術(shù)人員進(jìn)行技術(shù)研發(fā)參考以及查看自身技術(shù)是否侵權(quán),增加技術(shù)思路,做技術(shù)知識儲備,不適合論文引用。