一種基于高斯過程的機器人模仿學(xué)習(xí)方法與流程

文檔序號：12459328閱讀：844來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>控制;調(diào)節(jié)裝置的制造及其應(yīng)用技術(shù)

本發(fā)明涉及一種機器人模仿學(xué)習(xí)方法，具體涉及一種基于高斯過程的機器人模仿學(xué)習(xí)方法，屬于智能產(chǎn)品技術(shù)領(lǐng)域。

背景技術(shù)：

人類和其他生物能夠通過觀察和模仿同伴的行為，有效地獲得同伴行為的運動方式，并理解這些行為的涵義，賦予機器人像人類一樣模仿學(xué)習(xí)的能力，能夠有效地解決機器人運動技能獲取的問題，提高機器人的學(xué)習(xí)效率和自適應(yīng)能力，是機器人仿生研究的一個重要研究方向；模仿學(xué)習(xí)的一般學(xué)習(xí)形式為動作復(fù)制，動作復(fù)制主要是基于示教者的動作軌跡，通過解決從示教者軌跡到執(zhí)行動作的回歸問題，以決定控制策略，模仿者執(zhí)行控制策略進行行為再現(xiàn)，實現(xiàn)模仿學(xué)習(xí)，在模仿學(xué)習(xí)算法中大多采用逆強化學(xué)習(xí)算法尋求控制策略，逆強化學(xué)習(xí)的方法主要是基于模仿者對示教行為進行模仿學(xué)習(xí)的代價函數(shù)，尋求使代價函數(shù)最小的控制策略.然而，逆強化學(xué)習(xí)的方法對代價函數(shù)要求較高，不適用于代價函數(shù)難以獲取的模仿學(xué)習(xí)任務(wù)。

技術(shù)實現(xiàn)要素：

（一）要解決的技術(shù)問題

為解決上述問題，本發(fā)明提出了一種基于高斯過程的機器人模仿學(xué)習(xí)方法，將高斯過程應(yīng)用于機器人模仿學(xué)習(xí)控制策略算法的研究，通過采集示教機器人的示教行為樣本點，利用高斯過程算法進行樣本點訓(xùn)練，學(xué)習(xí)示教機器人的感知和行為之間的映射關(guān)系，并將此映射關(guān)系應(yīng)用于模仿機器人模仿學(xué)習(xí)控制策略并加以執(zhí)行。

（二）技術(shù)方案

本發(fā)明的基于高斯過程的機器人模仿學(xué)習(xí)方法，包括以下步驟：

第一步：示教機器人采用Braitenberg車的非交叉連接方式，光傳感器輸出值與對應(yīng)的電機輸出值成反比例關(guān)系，光源位置任意設(shè)定，模仿機器人同樣采用Braitenberg車的非交叉連接方式，光傳感器輸出值與對應(yīng)的電機輸出值之間的關(guān)系未知，需要通過模仿學(xué)習(xí)策略給出；

第二步：示教機器人進行動作示范，完成趨光動作，同時隨機選取樣本點，構(gòu)成樣本點集合，每個樣本點包含兩個參數(shù)；

第三步：用高斯過程的方法對樣本點集合進行訓(xùn)練，建立并求解其高斯過程模型，得到示教機器人傳感器與電機之間的映射關(guān)系；

第四步：模仿機器人將此映射關(guān)系應(yīng)用于自身控制策略，進行模仿示教機器人行為的模仿學(xué)習(xí)；

第五步：模仿行為分析。

進一步地，所述第二步中的兩個參數(shù)為光傳感器輸出值和對應(yīng)的電機輸出值。

（三）有益效果

與現(xiàn)有技術(shù)相比，本發(fā)明的基于高斯過程的機器人模仿學(xué)習(xí)方法，將高斯過程應(yīng)用于機器人模仿學(xué)習(xí)控制策略算法的研究，通過采集示教機器人的示教行為樣本點，利用高斯過程算法進行樣本點訓(xùn)練，學(xué)習(xí)示教機器人的感知和行為之間的映射關(guān)系，并將此映射關(guān)系應(yīng)用于模仿機器人模仿學(xué)習(xí)控制策略并加以執(zhí)行。

具體實施方式

一種基于高斯過程的機器人模仿學(xué)習(xí)方法，包括以下步驟：

第二步：示教機器人進行動作示范，完成趨光動作，同時隨機選取樣本點，構(gòu)成樣本點集合，每個樣本點包含兩個參數(shù)；

第三步：用高斯過程的方法對樣本點集合進行訓(xùn)練，建立并求解其高斯過程模型，得到示教機器人傳感器與電機之間的映射關(guān)系；

第四步：模仿機器人將此映射關(guān)系應(yīng)用于自身控制策略，進行模仿示教機器人行為的模仿學(xué)習(xí)；

第五步：模仿行為分析。

其中，所述第二步中的兩個參數(shù)為光傳感器輸出值和對應(yīng)的電機輸出值。

上面所述的實施例僅僅是對本發(fā)明的優(yōu)選實施方式進行描述，并非對本發(fā)明的構(gòu)思和范圍進行限定。在不脫離本發(fā)明設(shè)計構(gòu)思的前提下，本領(lǐng)域普通人員對本發(fā)明的技術(shù)方案做出的各種變型和改進，均應(yīng)落入到本發(fā)明的保護范圍，本發(fā)明請求保護的技術(shù)內(nèi)容，已經(jīng)全部記載在權(quán)利要求書中。

完整全部詳細技術(shù)資料下載

當前第1頁1 2 3

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：常琳
技術(shù)所有人：哈爾濱工大天才智能科技有限公司
我是此專利的發(fā)明人

上一篇：一種單鋼輪振動壓路機的輪體的制作方法與工藝
上一篇：一種熱軋軋制計劃編排方法與流程

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點此查看客服電話進行咨詢。
1、唐老師：1.高效節(jié)能裝備 2.流動穩(wěn)定性 3.汽車流場分析和淀粉糖工藝技術(shù)。
2、孫老師：1.振動信號時頻分析理論與測試系統(tǒng)設(shè)計 2.汽車檢測系統(tǒng)設(shè)計 3.汽車電子控制系統(tǒng)設(shè)計
3、王老師：電子信息處理、先進檢測方法和智能化儀表
4、周老師：1.智能電網(wǎng) 2.新能源利用 3.泛在電力物聯(lián)網(wǎng)
5、趙老師：檢測與控制技術(shù)、機器人技術(shù)、機電一體化技術(shù)
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種基于高斯過程的機器人模仿學(xué)習(xí)方法與流程