一種基于模糊推理樹的深度強化學習策略遷移方法

一種基于模糊推理樹的深度強化學習策略遷移方法技術(shù)資料下載

技術(shù)編號：40605972

提示：您尚未登錄，請點 登陸 后下載，如果您還沒有賬戶請點 注冊 ，登陸完成后，請刷新本頁查看技術(shù)詳細信息。

本發(fā)明屬于計算機與人工智能領(lǐng)域。背景技術(shù)、深度強化學習作為一種智能決策方法具有搜索能力強，決策性能好的特點，可以解決復雜問題的最優(yōu)決策難題。但在實際使用中，由于深度強化學習中用于策略表征的神經(jīng)網(wǎng)絡(luò)不具有可解釋性而難以對智能體做出的決策進行有效分析和判斷，因此難以達到良好的人機互信；同時，由于神經(jīng)網(wǎng)絡(luò)的全連接特性，當決策出現(xiàn)異常時難以對異常參數(shù)進行定位和修改。這極大地限制了深度強化學習方法在飛行器控制、自動駕駛和工業(yè)機器人等對人機互信和策略可調(diào)試性有極高要求的應(yīng)用領(lǐng)域中的實際部署。、雙機追逃博...
注意：該技術(shù)已申請專利，請尊重研發(fā)人員的辛勤研發(fā)付出，在未取得專利權(quán)人授權(quán)前，僅供技術(shù)研究參考不得用于商業(yè)用途。
該專利適合技術(shù)人員進行技術(shù)研發(fā)參考以及查看自身技術(shù)是否侵權(quán)，增加技術(shù)思路，做技術(shù)知識儲備，不適合論文引用。
請注意，此類技術(shù)沒有源代碼，用于學習研究技術(shù)思路。

詳細技術(shù)文檔下載地址↓↓

提示：您尚未登錄，請點 登陸 后下載，如果您還沒有賬戶請點 注冊 ，登陸完成后，請刷新本頁查看技術(shù)詳細信息。

該分類下的技術(shù)專家--如需求助專家，請聯(lián)系客服

李老師：1.計算力學 2.無損檢測
畢老師：機構(gòu)動力學與控制
袁老師：1.計算機視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
王老師：1.計算機網(wǎng)絡(luò)安全 2.計算機仿真技術(shù)
王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
孫老師：1.機機器人技術(shù) 2.機器視覺 3.網(wǎng)絡(luò)控制系統(tǒng)
葛老師：1.機器人技術(shù) 2.計算機輔助技術(shù)
張老師：1.內(nèi)燃機燃燒及能效管理技術(shù) 2.計算機數(shù)據(jù)采集與智能算法 3.助航設(shè)備開發(fā)

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

詳細技術(shù)文檔下載地址↓↓