本發(fā)明涉及機(jī)車運(yùn)行優(yōu)化操縱技術(shù),尤其涉及一種基于高階相關(guān)學(xué)習(xí)的機(jī)車節(jié)能優(yōu)化自動(dòng)駕駛方法。
背景技術(shù):
鐵路機(jī)車運(yùn)行控制是一個(gè)典型的多目標(biāo)、多約束、非線性的復(fù)雜實(shí)時(shí)變化過程。因此針對鐵路機(jī)車的運(yùn)行操縱問題是一個(gè)非線性有約束的動(dòng)態(tài)優(yōu)化問題。
現(xiàn)有工程領(lǐng)域應(yīng)用中,復(fù)雜操縱序列優(yōu)化的解決方案主要有數(shù)值搜索,解析求解和啟發(fā)式策略設(shè)計(jì)三大類。
上述數(shù)值搜索方法即通過數(shù)值搜索算法對操縱序列進(jìn)行尋優(yōu)搜索從而得到優(yōu)化的操縱序列。常見的算法有遺傳算法、群搜索算法、動(dòng)態(tài)規(guī)劃等,這種方式耗時(shí)長,且短時(shí)間內(nèi)無法收斂到最優(yōu)結(jié)果,不適合在線控制系統(tǒng)優(yōu)化。
上述解析求解方法即基于領(lǐng)域知識(shí)對操縱控制過程中不同狀況下的關(guān)鍵轉(zhuǎn)換點(diǎn)根據(jù)解析公式求解來得到最終的優(yōu)化操縱序列。這種方式主要缺陷是轉(zhuǎn)換點(diǎn)的解析公式推導(dǎo)過程復(fù)雜,較難處理多約束條件。
上述啟發(fā)式策略設(shè)計(jì)即考慮諸多復(fù)雜因素,人工通過現(xiàn)有領(lǐng)域的一些操縱規(guī)范等啟發(fā)式的進(jìn)行策略設(shè)計(jì)。該種方式過多的引入人工的分析與設(shè)計(jì),極大的降低了策略設(shè)計(jì)的效率,同時(shí)由于人思考范圍有限,無法覆蓋所有可能的情況,這勢必會(huì)導(dǎo)致部分優(yōu)化解遺漏。
通過上述分析可以看出,上述幾種解決方案較難同時(shí)滿足復(fù)雜操縱序列優(yōu)化問題對計(jì)算效率和優(yōu)化效果的需求。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的目的是提供一種基于高階相關(guān)學(xué)習(xí)的機(jī)車節(jié)能優(yōu)化自動(dòng)駕駛方法,以便獲得更好地控制和節(jié)能效果。
本發(fā)明通過如下技術(shù)方案實(shí)現(xiàn):
一種基于高階相關(guān)學(xué)習(xí)的機(jī)車節(jié)能優(yōu)化自動(dòng)駕駛方法,其特征在于,所述的方法包括:
步驟1)、獲取司機(jī)對機(jī)車的實(shí)際駕駛數(shù)據(jù)和運(yùn)行數(shù)據(jù),并對實(shí)際駕駛數(shù)據(jù)和運(yùn)行數(shù)據(jù)進(jìn)行預(yù)處理;
步驟2)、確定影響機(jī)車油耗的因素,基于各因素的重要性提取與機(jī)車運(yùn)行相關(guān)的特征組;
步驟3)、基于由構(gòu)建的特征組描述的司機(jī)實(shí)際駕駛數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)構(gòu)建超圖,并基于構(gòu)建的超圖訓(xùn)練學(xué)習(xí)模型,在訓(xùn)練過程中對訓(xùn)練數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化,調(diào)整所述特征組中至少部分特征的參數(shù),同時(shí)通過迭代更新的方式訓(xùn)練學(xué)習(xí)模型;
步驟4)、將當(dāng)前運(yùn)行狀態(tài)下的由特征組描述的機(jī)車數(shù)據(jù)輸入訓(xùn)練好的學(xué)習(xí)模型,基于所述學(xué)習(xí)模型獲得相應(yīng)駕駛策略。
在一種優(yōu)選實(shí)現(xiàn)方式中,所述預(yù)處理包括將機(jī)車運(yùn)行數(shù)據(jù)中的坡度值進(jìn)行分類合并。
在另一種優(yōu)選實(shí)現(xiàn)方式中,影響機(jī)車油耗的因素至少包括:機(jī)車屬性、線路特征和機(jī)車運(yùn)行信息。
在一種優(yōu)選實(shí)現(xiàn)方式中,所構(gòu)建的超圖定義為g=(V,ε,w),其中V是超圖中頂點(diǎn)的集合,ε是超圖中邊的集合,w是超圖中所有邊的權(quán)重的集合,
構(gòu)建超圖的過程包括:將每一條訓(xùn)練數(shù)據(jù)視為一個(gè)頂點(diǎn),通過對所有的訓(xùn)練數(shù)據(jù)進(jìn)行聚類,每一個(gè)聚類為一條邊。
在一種優(yōu)選實(shí)現(xiàn)方式中,所述方法還包括,將超圖表示成|V|×|ε|的關(guān)聯(lián)矩陣。
在一種優(yōu)選實(shí)現(xiàn)方式中,所述方法還包括,基于超圖獲得用于區(qū)別不同分類的學(xué)習(xí)投影矩陣M,所述學(xué)習(xí)投影矩陣M的代價(jià)函數(shù)包括以下三部分:超圖拉普拉斯正則化Ω(M)、經(jīng)驗(yàn)損失Remp(M)以及投影矩陣的正則化φ(M)。
在一種優(yōu)選實(shí)現(xiàn)方式中,所述方法還包括對所述超圖模型進(jìn)行強(qiáng)化更新,所述強(qiáng)化更新過程包括:
3-1、通過歸納學(xué)習(xí)方法,獲得學(xué)習(xí)投影矩陣M;
3-2、獲取選擇的nt條測試線路的仿真結(jié)果;
3-3、按評價(jià)標(biāo)準(zhǔn)對總共的nr+nt條線路進(jìn)行排序,其中,nr,Ti,Ei,Wi分別為用于提取訓(xùn)練數(shù)據(jù)的線路的數(shù)量、線路i的運(yùn)行時(shí)間、油耗以及車重;
3-4、若收斂或者達(dá)到最大的迭代次數(shù)則退出,否則進(jìn)入步驟3-5,
3-5、選擇所述步驟3-3的排序結(jié)果中的前nr條線路獲取ns個(gè)訓(xùn)練數(shù)據(jù),進(jìn)行預(yù)處理,然后返回步驟3-1)。
需要說明的是,在本發(fā)明中,每一條數(shù)據(jù)都是由特征組來描述的,比如在實(shí)例中一個(gè)特征組包括59維特征,那么每一條訓(xùn)練數(shù)據(jù)都是一組59維的特征數(shù)據(jù)組成,而一條訓(xùn)練數(shù)據(jù)就是超圖中的一個(gè)點(diǎn)。而每一條線路都是由很多點(diǎn)組成。
在另一種優(yōu)選實(shí)現(xiàn)方式中,所述超圖的構(gòu)建過程包括:
1)將超圖的表達(dá)式定義為g=(V,ε,w),其中V是超圖中頂點(diǎn)的集合,ε是超圖中邊的集合,w是超圖中所有邊的權(quán)重的集合,超圖中每一條邊e可和任意多個(gè)點(diǎn)相連,超圖中每條邊e都設(shè)置了權(quán)重w(e);
2)、將超圖表示為一個(gè)|V|×|ε|的關(guān)聯(lián)矩陣,矩陣中每一個(gè)條目可定義如下:
對于每一個(gè)頂點(diǎn)v∈V,該頂點(diǎn)的度可定義如下:
d(v)=∑e∈εw(e)h(v,e)
對于每一條邊e∈ε,該邊的度可定義如下:
δ(e)=∑v∈Vh(v,e)
Dv和De分別為表示超圖中頂點(diǎn)的度和邊的度的對角矩陣,W為表示超圖中各個(gè)邊的權(quán)重的對角矩陣;
3)、將每一條訓(xùn)練數(shù)據(jù)視為一個(gè)頂點(diǎn),通過對所有的訓(xùn)練數(shù)據(jù)進(jìn)行聚類,每一個(gè)聚類即為一條邊;
4)、在構(gòu)建好超圖之后,構(gòu)建學(xué)習(xí)投影矩陣M,學(xué)習(xí)投影矩陣M的代價(jià)函數(shù)包括以下部分:超圖拉普拉斯正則化Ω(M)、經(jīng)驗(yàn)損失Remp(M),以及投影矩陣的正則化φ(M):
Ψ={Ω(M)+λRemp(M)+μφ(M)}
其中,λ和μ分別是Remp(M)和正則化φ(M)的系數(shù)。
其中超圖的拉普拉斯正則化為:
其中k是從1到c的臨時(shí)變量,c的取值范圍為1-17(檔位的個(gè)數(shù)),u,v表示超圖中的點(diǎn),e表示超圖中的邊,X表示由所有訓(xùn)練數(shù)據(jù)構(gòu)成的矩陣,T是矩陣運(yùn)算中的矩陣轉(zhuǎn)置的符號(hào)。
經(jīng)驗(yàn)損失定義如下:
Remp(M)=||XTM-Y||
φ(M)是一個(gè)l2范數(shù)正則式,其定義如下:
φ(M)=||M||2
5)、利用所述學(xué)習(xí)投影矩陣M進(jìn)行歸納學(xué)習(xí),學(xué)習(xí)任務(wù)表示為argminM{Ω(M)+λRemp(M)+μφ(M)};
6)求解獲得所述學(xué)習(xí)投影矩陣M=λ(XΔXT+λXXT+μI)-1XY。
7)得到投影矩陣后,利用當(dāng)前運(yùn)行狀態(tài)下的特征組作為一個(gè)輸入x,按照公式argmax xTM可獲得當(dāng)前運(yùn)行狀態(tài)下的建議檔位。
有益效果
本發(fā)明將超圖模型引入到機(jī)車的控制系統(tǒng)中,離線訓(xùn)練學(xué)習(xí)模型的過程不受時(shí)間因素的限制,因此從鐵路機(jī)車運(yùn)行時(shí)間以及能耗角度具有更好的優(yōu)化空間,且鐵路機(jī)車運(yùn)行過程中應(yīng)用離線訓(xùn)練的學(xué)習(xí)模型獲取鐵路機(jī)車運(yùn)行操縱檔位時(shí)能夠取得很好的節(jié)能效果。利用本發(fā)明的方法,可以更加準(zhǔn)確地獲得所需要的建議檔位。
附圖說明
圖1表示在預(yù)處理階段對坡度進(jìn)行分類的坡度分類表;
圖2表示所提取出的59維特征組圖;
圖3表示超圖構(gòu)建過程示意圖;
圖4表示牽引特性曲線和制動(dòng)特性曲線;
圖5表示超圖預(yù)測結(jié)果和司機(jī)實(shí)際駕駛數(shù)據(jù)對比圖。
具體實(shí)施方式
以下結(jié)合附圖及其實(shí)施例對本發(fā)明進(jìn)行詳細(xì)說明,但并不因此將本發(fā)明的保護(hù)范圍限制在實(shí)施例描述的范圍之中。
為使本發(fā)明更為清晰,下面對本發(fā)明進(jìn)行詳細(xì)的說明。
本發(fā)明第一實(shí)施例提供一種基于高階相關(guān)學(xué)習(xí)的機(jī)車節(jié)能優(yōu)化自動(dòng)駕駛方法,其處理過程包括:
1.司機(jī)駕駛經(jīng)驗(yàn)梳理及預(yù)處理。
機(jī)車駕駛的優(yōu)化問題可視為一個(gè)常見的以離散的檔位作為輸出并需考慮機(jī)車屬性,運(yùn)行狀態(tài),線路屬性等因素的優(yōu)化問題。司機(jī)駕駛時(shí)所作的加檔或減檔操作的決定都是基于有經(jīng)驗(yàn)的司機(jī)給予的指導(dǎo)或自身的駕駛經(jīng)驗(yàn)。整個(gè)駕駛過程中每一個(gè)操作都會(huì)對總油耗以及花費(fèi)的總時(shí)間產(chǎn)生影響。因此本發(fā)明分析大量的司機(jī)駕駛實(shí)際運(yùn)行數(shù)據(jù),從司機(jī)駕駛操作中發(fā)現(xiàn)一般化的模式。司機(jī)實(shí)際駕駛數(shù)據(jù)中隱藏的模式對于發(fā)現(xiàn)一個(gè)優(yōu)化較好的駕駛方案能提供很重要的線索。因此本發(fā)明從有經(jīng)驗(yàn)的司機(jī)的駕駛數(shù)據(jù)中學(xué)習(xí)較好的駕駛方案。
為了避免在上坡或下坡段出現(xiàn)過多的零碎檔位,本發(fā)明在預(yù)處理階段將坡度值進(jìn)行分類合并,分類合并的標(biāo)準(zhǔn)如圖1所示,并在新合并的坡度段上進(jìn)行接下來的操作。
2.構(gòu)建特征組。
通過分析實(shí)際運(yùn)行數(shù)據(jù)可知,影響機(jī)車油耗的因素主要有機(jī)車屬性、線路特征、運(yùn)行信息、機(jī)車運(yùn)行狀態(tài)、人為因素以及其他一些干擾因素。根據(jù)以上因素構(gòu)建特征組,圖2給出其中一個(gè)實(shí)例,該特征組內(nèi)的特征可以分為以下三類:機(jī)車屬性,線路屬性和運(yùn)行信息。其中,機(jī)車屬性包括車重、車長、重車數(shù)量和空車數(shù)量等四個(gè)特征;線路屬性包括當(dāng)前線路的坡度信息、限速信息以及前后兩端線路的坡度信息和前后三段線路的限速信息等36個(gè)特征;運(yùn)行信息包括當(dāng)前公里標(biāo)、當(dāng)前速度、上一個(gè)檔位等19個(gè)特征。因?yàn)樽罱K運(yùn)行操縱的預(yù)測是基于所給出的特征值進(jìn)行的,因此所構(gòu)建的特征組對于最終的訓(xùn)練得到的學(xué)習(xí)模型的預(yù)測性能有很大的影響。
3.構(gòu)建超圖,訓(xùn)練模型。
為了更好地從訓(xùn)練數(shù)據(jù)中學(xué)習(xí)出高階關(guān)系,本發(fā)明提出根據(jù)實(shí)際運(yùn)行數(shù)據(jù)構(gòu)建超圖,并基于構(gòu)建的超圖訓(xùn)練學(xué)習(xí)模型。
其中超圖的構(gòu)建過程如下:
超圖即圖中每一條邊可和任意多個(gè)點(diǎn)相連,下面給出超圖的一個(gè)初步定義,其中V是超圖中頂點(diǎn)的集合,ε是超圖中邊的集合,w是超圖中所有邊的權(quán)重的集合。超圖中每條邊e都設(shè)置了權(quán)重w(e)。因此超圖可表示為一個(gè)|V|×|ε|的關(guān)聯(lián)矩陣,矩陣中每一個(gè)條目可定義如下:
對于每一個(gè)頂點(diǎn)v∈V,該頂點(diǎn)的度可定義如下:
d(v)=∑e∈εw(e)h(v,e)
對于每一條邊e∈ε,該邊的度可定義如下:
δ(e)=∑v∈vh(v,e)
Dv和De分別為表示超圖中頂點(diǎn)的度和邊的度的對角矩陣,W為表示超圖中各個(gè)邊的權(quán)重的對角矩陣。
在構(gòu)建過程中將每一條訓(xùn)練數(shù)據(jù)視為一個(gè)頂點(diǎn),通過對所有的訓(xùn)練數(shù)據(jù)進(jìn)行聚類,每一個(gè)聚類即為一條邊。具體聚類的方式如下,每次選一個(gè)點(diǎn)作為中心點(diǎn),其本身與前n個(gè)距離最近的點(diǎn)構(gòu)成一個(gè)聚類,即這些點(diǎn)由一條邊相連,在本專利給出的實(shí)例中n選擇為5。如圖3給出了超圖構(gòu)建過程示意圖?;跇?gòu)建的超圖,相應(yīng)的關(guān)聯(lián)矩陣H,表示超圖的邊的度的對角矩陣De以及表示超圖的頂點(diǎn)的度的對角矩陣Dv都可相應(yīng)的獲得。
在構(gòu)建好超圖之后,通過基于超圖的歸納學(xué)習(xí)過程以得出一個(gè)規(guī)范化的投影來區(qū)別不同的分類。學(xué)習(xí)投影矩陣M的代價(jià)函數(shù)包括以下三部分:超圖拉普拉斯正則化Ω(M),經(jīng)驗(yàn)損失Remp(M),以及投影矩陣的正則化φ(M):
Ψ={Ω(M)+λRemp(M)+μφ(M)}
其中,λ和μ分別是公式中的系數(shù),超圖的拉普拉斯正則化是基于如下假設(shè):強(qiáng)關(guān)聯(lián)的頂點(diǎn)屬于相似的類別,超圖的拉普拉斯正則化如下:
經(jīng)驗(yàn)損失定義如下:
Remp(M)=||XTM-Y||
φ(M)是一個(gè)l2范數(shù)正則式,主要用于避免M過度擬合,其定義如下:
φ(M)=||M||2
基于超圖的歸納學(xué)習(xí)任務(wù)可描述如下:
argminM{Ω(M)+λRemp(M)+μφ(M)}
為了完成上述學(xué)習(xí)任務(wù),我們對M進(jìn)行求導(dǎo),如下所示:
因此可得:
M=λ(XΔXT+λXXT+μI)-1XY
對于每一個(gè)需要進(jìn)行預(yù)測的數(shù)據(jù)x,對于x的預(yù)測操作可以通過如下定義獲取:
argmaxk xTM
因此訓(xùn)練好超圖模型后,即可為機(jī)車的實(shí)時(shí)駕駛生成實(shí)時(shí)的運(yùn)行操縱檔位。
4.調(diào)整以及高階關(guān)系強(qiáng)化更新
在模型的訓(xùn)練過程中,本發(fā)明對構(gòu)建的特征組中的特征進(jìn)行了標(biāo)準(zhǔn)化。為了提高聚類的性能,特定參數(shù)比如上述公式中的λ也都針對特定的環(huán)境進(jìn)行了調(diào)整。在訓(xùn)練和仿真的過程中也需調(diào)整主要特征的權(quán)重,比如車重,車長,限速等。同時(shí),還需對一些跟安全相關(guān)的因素進(jìn)行實(shí)現(xiàn)和調(diào)整。比如整個(gè)行駛過程中速度不能超過限速等。
由步驟3訓(xùn)練得出的超圖模型可得出一個(gè)高于平均水平的運(yùn)行方案。為了提高超圖模型的質(zhì)量,本發(fā)明提出通過強(qiáng)化更新的方式提高超圖模型的質(zhì)量。強(qiáng)化更新的算法如下算法1所示。在模型更新的代價(jià)中同時(shí)考慮了油耗以及花費(fèi)的時(shí)間。
5.設(shè)置實(shí)驗(yàn)環(huán)境進(jìn)行實(shí)驗(yàn)
本發(fā)明選用的進(jìn)行實(shí)驗(yàn)的機(jī)車一共有17個(gè)檔位,1~8檔和-1~-8檔以及0檔。機(jī)車的功率特性曲線如圖4所示,左側(cè)為牽引力的功率特性曲線,右側(cè)為制動(dòng)力的功率特性曲線。
可選擇不同車重范圍內(nèi)的訓(xùn)練數(shù)據(jù)來訓(xùn)練不同的超圖模型以提高預(yù)測的準(zhǔn)確率,在本發(fā)明所給出的實(shí)例中將上千條線路按照油耗和車重的比值進(jìn)行排序,選擇車重范圍在3000噸到4000噸的前400條最好的數(shù)據(jù)進(jìn)行訓(xùn)練?;谶@400條線路通過預(yù)處理得到23499個(gè)訓(xùn)練數(shù)據(jù),每個(gè)訓(xùn)練數(shù)據(jù)都有59維特征。參數(shù)λ通過測試結(jié)果分析對比,設(shè)置為0.1最佳。并對所有的數(shù)據(jù)進(jìn)行歸一化。在本發(fā)明給出的實(shí)例中選用兩個(gè)車站總共15.85km的距離作為測試線路距離。通過對比訓(xùn)練數(shù)據(jù)和測試數(shù)據(jù)的平均油耗結(jié)果可知,由本發(fā)明提出的方法的平均油耗為159.95kg,由有經(jīng)驗(yàn)的司機(jī)駕駛的平均油耗為160.68,對比降低了0.46%。由此可知本發(fā)明提出的方法在節(jié)能方面的效果跟提供的好的訓(xùn)練數(shù)據(jù)一樣甚至更節(jié)能。選擇的訓(xùn)練數(shù)據(jù)比所有司機(jī)的平均油耗要少7.7%,因此可知提出的方法在節(jié)能方面比所有司機(jī)的平均油耗要少8.16%。圖5給出了由訓(xùn)練的模型得到的速度曲線和檔位與司機(jī)實(shí)際駕駛的速度曲線和檔位的對比圖。之后根據(jù)步驟4中提出的算法1進(jìn)行強(qiáng)化訓(xùn)練過程。通過10次迭代之后,平均油耗下降9.86%。因此也說明了本發(fā)明提出的方法的有效性。
以上所述僅為本發(fā)明的較佳實(shí)施例,并非對本發(fā)明做任何形式上的限制,凡在本發(fā)明的精神和原則之內(nèi),依據(jù)本發(fā)明的技術(shù)實(shí)質(zhì)對以上實(shí)施例所做的任何簡單修改、等同變化與修飾,均仍屬于本發(fā)明的保護(hù)范圍之內(nèi)。
雖然上面結(jié)合本發(fā)明的優(yōu)選實(shí)施例對本發(fā)明的原理進(jìn)行了詳細(xì)的描述,本領(lǐng)域技術(shù)人員應(yīng)該理解,上述實(shí)施例僅僅是對本發(fā)明的示意性實(shí)現(xiàn)方式的解釋,并非對本發(fā)明包含范圍的限定。實(shí)施例中的細(xì)節(jié)并不構(gòu)成對本發(fā)明范圍的限制,在不背離本發(fā)明的精神和范圍的情況下,任何基于本發(fā)明技術(shù)方案的等效變換、簡單替換等顯而易見的改變,均落在本發(fā)明保護(hù)范圍之內(nèi)。