技術(shù)編號:40605972
提示:您尚未登錄,請點 登 陸 后下載,如果您還沒有賬戶請點 注 冊 ,登陸完成后,請刷新本頁查看技術(shù)詳細信息。本發(fā)明屬于計算機與人工智能領(lǐng)域。背景技術(shù)、深度強化學習作為一種智能決策方法具有搜索能力強,決策性能好的特點,可以解決復雜問題的最優(yōu)決策難題。但在實際使用中,由于深度強化學習中用于策略表征的神經(jīng)網(wǎng)絡(luò)不具有可解釋性而難以對智能體做出的決策進行有效分析和判斷,因此難以達到良好的人機互信;同時,由于神經(jīng)網(wǎng)絡(luò)的全連接特性,當決策出現(xiàn)異常時難以對異常參數(shù)進行定位和修改。這極大地限制了深度強化學習方法在飛行器控制、自動駕駛和工業(yè)機器人等對人機互信和策略可調(diào)試性有極高要求的應(yīng)用領(lǐng)域中的實際部署。、雙機追逃博...
注意:該技術(shù)已申請專利,請尊重研發(fā)人員的辛勤研發(fā)付出,在未取得專利權(quán)人授權(quán)前,僅供技術(shù)研究參考不得用于商業(yè)用途。
該專利適合技術(shù)人員進行技術(shù)研發(fā)參考以及查看自身技術(shù)是否侵權(quán),增加技術(shù)思路,做技術(shù)知識儲備,不適合論文引用。
請注意,此類技術(shù)沒有源代碼,用于學習研究技術(shù)思路。