一種基于線性落腳點補償器的機器人行走控制方法
【專利摘要】本發(fā)明涉及一種基于線性落腳點補償器的機器人行走控制方法,包括以下步驟:1)建立機器人的動力學模型;2)根據(jù)機器人的動力學模型,建立線性落腳點補償器;3)通過嘗試-評估-改進的學習方法,學習特定環(huán)境下的落腳點補償器最優(yōu)增益系數(shù);4)驗證所述方法在仿人機器人行走控制中的作用。與現(xiàn)有技術相比,本發(fā)明具有學習能力強,抗干擾能力強等優(yōu)點。
【專利說明】一種基于線性落腳點補償器的機器人行走控制方法
【技術領域】
[0001] 本發(fā)明涉及機器人控制領域,尤其是涉及一種基于線性落腳點補償器的機器人行 走控制方法。
【背景技術】
[0002] 許多仿人機器人行走控制的研究人員將重點放在規(guī)劃機器人的質心軌跡,使得機 器人行走時的實際ZMP軌跡能精確地跟蹤事先規(guī)劃的ZMP軌跡。而該事先規(guī)劃的ZMP軌跡 一般是由預先規(guī)劃的機器人的落腳位置(即落腳點)來決定的。這一類控制方法總體來說 屬于開環(huán)控制方法,對機器人預設軌跡的跟蹤建立在對機器人可以完全控制的假設之上, 即機器人的質心狀態(tài)是完全可控的。事實上,由于仿人機器人與地面的接觸是非穩(wěn)固的,地 面只能對仿人機器人提供推力而不能提供反向的吸引力。因此,仿人機器人的質心控制是 半可控的。一旦機器人的落腳點決定了,機器人能夠獲得用來加速質心的力也就同時被限 定在一定的區(qū)域以內(nèi)。
[0003] 另一方面,由于仿人機器人的落腳點決定了行走控制中質心的可控性,因此動態(tài) 的調整仿人機器人的落腳點便可以調整機器人的動態(tài)特性及可控性,進而可以改善機器人 對未知擾動的抑制能力。事實上,落腳點對雙足行走的重要性在生物機械學領域已有較深 入的研究。最近,在機器人領域也有一些利用落腳點補償技巧提高仿人機器人行走控制魯 棒性的初步探索。目前的方法大多數(shù)是建立在簡化的線性機器人動力學模型上,落腳點修 改技巧無法動態(tài)調整且基于線性模型預測控制方法的計算量較大。
【發(fā)明內(nèi)容】
[0004] 本發(fā)明的目的就是為了克服上述現(xiàn)有技術存在的缺陷而提供一種學習能力強、可 靠性高的基于線性落腳點補償器的機器人行走控制方法。
[0005] 本發(fā)明的目的可以通過以下技術方案來實現(xiàn):
[0006] -種基于線性落腳點補償器的機器人行走控制方法,包括以下步驟:
[0007] 1)建立機器人的動力學模型;
[0008] 2)根據(jù)機器人的動力學模型,建立線性落腳點補償器;
[0009] 3)通過嘗試-評估-改進的學習方法,學習特定環(huán)境下的落腳點補償器最優(yōu)增益 系數(shù);
[0010] 4)驗證所述方法在仿人機器人行走控制中的作用。
[0011] 所述的步驟1)包括以下步驟:
[0012] 11)建立機器人三維線性倒立擺動力學模型,該動力學模型的表達式為:
【權利要求】
1. 一種基于線性落腳點補償器的機器人行走控制方法,其特征在于,包括以下步驟: 1) 建立機器人的動力學模型; 2) 根據(jù)機器人的動力學模型,建立線性落腳點補償器; 3) 通過嘗試、評估和改進的學習方法,學習特定環(huán)境下的線性落腳點補償器最優(yōu)增益 系數(shù); 4) 根據(jù)基于線性落腳點補償器對仿人機器人行走進行預測控制。
2. 根據(jù)權利要求1所述的一種基于線性落腳點補償器的機器人行走控制方法,其特征 在于,所述的步驟1)包括以下步驟: 11)建立機器人三維線性倒立擺動力學模型,該動力學模型的表達式為:xr =Axtf +Bn, xz=Cxc OiOj· 1 其中,A=gIJ,B= ||,c=丨〇 = 為機器人質心在世界 λL ^*i 坐標系下沿X軸的位置、速度和加速度,Ux為質心加速度的變化量并用來控制質心加速度,p。=[X。,y。,yJT為質心在世界坐標系下的三維位置,而Pz = [xz,yz,yz]T為ZMP在世界坐 標系下的位置,g為重力加速度;
3. 根據(jù)權利要求1所述的一種基于線性落腳點補償器的機器人行走控制方法,其特征 在于,所述的步驟2)包括以下步驟: 21) 定義線性落腳點補償器的輸出Apf : s(雜? 22) 定義線性落腳點補償器為:
其中,0,負為估計的支撐腳坐標系下質心位置、速度和加速度,和 前i巾貞中估計的和參考的支撐腳坐標系下ZMP軌跡,GKx、GKy、Glx和Gly為增益系數(shù); 23) 選擇最優(yōu)的線性落腳點補償器增益系數(shù),使增益系數(shù)滿足最小化的條件:
其中紙,為ZMP的跟蹤誤差,丄卜爲KI}是為了保證輸出 J1隹i I雄I 不過大,ξ為一非線性函數(shù),η為ZMP累計誤差的幀數(shù),αx和ay表示X軸和y軸分別所占 的比例,m是統(tǒng)計過程落腳點修改的次數(shù),βx和βy控制X和y軸的比例,PG為每步需要的 時間巾貞數(shù),Y為常系數(shù)。
4. 根據(jù)權利要求1所述的一種基于線性落腳點補償器的機器人行走控制方法,其特征 在于,所述的步驟3)包括以下步驟: 31) 賦予機器人線性落腳補償器初始增益系數(shù)Φμ并將待測參數(shù)R=Ir1,…rM}根據(jù) 初始增益系數(shù)和原子策略集合Vi產(chǎn)生行走參數(shù)h: rj = { Θ j+ Δ J,…,θν+Δν} Φ= [GKx,Glx,GKy,Gly] = {θρ…,θN} Vi= {-εj,〇, +εJ 其中,Vi中隨機抽取的值,-£i,£i為趨近于零的實數(shù); 32) 機器人按產(chǎn)生的多組行走參數(shù)行走,并搜集計算線性落腳點補償器性能指標所需 的數(shù)據(jù); 33) 在完成多組行走參數(shù)行走測試后,計算線性落腳點補償器的當前梯度▽#,并且更 新線性落腳點補償器的增益系數(shù); 34) 機器人重復步驟31)-步驟33),通過迭代過程獲取最優(yōu)的線性落腳點補償器參數(shù)。
5.根據(jù)權利要求4所述的一種基于線性落腳點補償器的機器人行走控制方法,其特征 在于,所述的步驟33)包括以下步驟: 331) 計算平均分值矩陣JL,,] 4亥矩陣表示在參數(shù)第η維選取策略-ε、0或 +ε的所有&的平均分值; 332) 當且時,計算平均分值F1^O;否則平均分值為 333) 計算落腳點補償器當前梯度為V# = -||j5 334) 更新落腳點補償器的增益系數(shù)Φ: #=#+V舞f 其中,η為每次迭代的步長。
【文檔編號】G05B13/04GK104318071SQ201410520386
【公開日】2015年1月28日 申請日期:2014年9月30日 優(yōu)先權日:2014年9月30日
【發(fā)明者】陳啟軍, 劉成菊, 許濤 申請人:同濟大學