本發(fā)明涉及計算機(jī)視覺和模式識別,具體涉及一種基于深度神經(jīng)網(wǎng)絡(luò)的步態(tài)識別方法。
背景技術(shù):
在現(xiàn)有的步態(tài)識別技術(shù)中,步態(tài)能量圖作為一種步態(tài)特征描述子識別效果比較理想而且計算簡單,在步態(tài)能量圖中做了部分改進(jìn)對其添加一個高斯系數(shù)得到步態(tài)高斯圖,其識別效果明顯優(yōu)于步態(tài)能量圖,應(yīng)用步態(tài)高斯圖作為步態(tài)特征選擇合適的分類器可以有效識別人的身份。但是這種識別在視角跨度較大(36度以上)或者衣著攜帶情況顯著改變時識別率很難達(dá)到理想的效果。
卷積神經(jīng)網(wǎng)絡(luò)是為識別二維形狀而特殊設(shè)計的一個多層感知器,這種網(wǎng)絡(luò)結(jié)構(gòu)對平移、比例縮放、傾斜或者其他形式的變形具有高度不變性。深度神經(jīng)網(wǎng)絡(luò)由于可以自主的提取圖像的特征并進(jìn)行逐層抽象而在圖像分類領(lǐng)域應(yīng)用比較廣泛,特別是其激活函數(shù)具備的非線性特性使其適應(yīng)能力更強(qiáng)并具有很好的分類特性,同時每一個卷積核共享權(quán)重有效減少了訓(xùn)練參數(shù)及訓(xùn)練時間。
由于深度學(xué)習(xí)是以數(shù)據(jù)為驅(qū)動,利用反向傳播算法對其參數(shù)更新,因此要訓(xùn)練一個新的性能優(yōu)越的網(wǎng)絡(luò)往往需要大量的數(shù)據(jù)和較長的時間,而現(xiàn)有的數(shù)據(jù)庫所提供的數(shù)據(jù)往往很難去訓(xùn)練一個新的網(wǎng)絡(luò)。為了克服該缺陷,可以對原始的圖像數(shù)據(jù)進(jìn)行相關(guān)處理(旋轉(zhuǎn),縮放,尺度變化)以對有線的數(shù)據(jù)擴(kuò)增,或者在已有相應(yīng)模型中進(jìn)行繼續(xù)訓(xùn)練使其適合于你的實驗任務(wù)。
技術(shù)實現(xiàn)要素:
為了解決現(xiàn)有步態(tài)識別技術(shù)中識別性能受較多協(xié)變量的影響較大,本發(fā)明提出了一種基于深度神經(jīng)網(wǎng)絡(luò)的步態(tài)識別方法,該方法對跨視角,不同的攜帶狀況,衣著,復(fù)雜的背景情況都表現(xiàn)出較好的魯棒性,在復(fù)雜場景及多協(xié)變量的影響下顯著提高了識別率;采用微調(diào)已訓(xùn)練好的網(wǎng)絡(luò),有效的解決了數(shù)據(jù)量不足問題并節(jié)省了計算量及運行時間。
為實現(xiàn)上述目的,本發(fā)明采取的技術(shù)方案為:
一種基于深度神經(jīng)網(wǎng)絡(luò)的步態(tài)識別方法,包括如下步驟:
s1、從原始的步態(tài)視頻圖像中減除運動背景得到人體運動輪廓圖,對輪廓圖進(jìn)行形態(tài)學(xué)處理使其噪聲減小,并填充圖像中的空洞,然后提取步態(tài)周期,進(jìn)一步對輪廓圖進(jìn)行歸一化使其大小相等,在一個步態(tài)周期內(nèi)計算步態(tài)高斯圖;
s2、將所得的將步態(tài)高斯圖按照設(shè)計的規(guī)則以5∶1的比例將樣本數(shù)據(jù)集劃分為訓(xùn)練集和測試集;
s3、建立與alexnet結(jié)構(gòu)相一致的八層卷積神經(jīng)網(wǎng)絡(luò)模型,并對模型最后一層的神經(jīng)元的個數(shù)修改使其適應(yīng)于步態(tài)識別的分類任務(wù);該模型的前七層用已經(jīng)訓(xùn)練好的alexnet模型的參數(shù)對進(jìn)行初始化,模型的最后一層進(jìn)行隨機(jī)初始化;修改配置文件中的部分參數(shù),使模型可以更加快速收斂;部分參數(shù)包括基礎(chǔ)學(xué)習(xí)率、權(quán)重衰減、學(xué)習(xí)率變化比率、最大迭代次數(shù)等。
s4、將已標(biāo)記好的訓(xùn)練樣本集輸入到上述神經(jīng)網(wǎng)絡(luò)模型,然后根據(jù)正向傳播和反向傳播對神經(jīng)網(wǎng)絡(luò)的參數(shù)進(jìn)行更新,直到模型收斂,保存訓(xùn)練好的模型;
s5、應(yīng)用訓(xùn)練好的模型和標(biāo)記好的測試數(shù)據(jù)對模型進(jìn)行預(yù)測,根據(jù)模型的訓(xùn)練日志和預(yù)測日志對模型進(jìn)行分析,繪制訓(xùn)練和測試accracy及l(fā)oss曲線,判斷該模型是否可以有效地進(jìn)行步態(tài)識別。
本發(fā)明具有以下有益效果:
相比于傳統(tǒng)的步態(tài)識別方法,該方法的魯棒性較高,在多種協(xié)變量存在的情況下可以更有效的識人的身份。由于alexnet是一種用于圖像分類的卷積神經(jīng)網(wǎng)絡(luò)模型,使用該模型對建立的用于步態(tài)識別的卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行初始化可以顯著提高模型的收斂速度,避免了由于樣本較少而使得模型的分類性能較差的缺點,同時顯著減少了模型訓(xùn)練所需的資源和時間。
附圖說明
圖1為本發(fā)明實施例基于深度神經(jīng)網(wǎng)絡(luò)的步態(tài)識別方法的框架示意圖。
圖2為本發(fā)明實施例中深度神經(jīng)網(wǎng)絡(luò)的訓(xùn)練和測試流程圖。
圖3為本發(fā)明實施例中步態(tài)高斯圖的提取過程示意圖。
具體實施方式
為了使本發(fā)明的目的及優(yōu)點更加清楚明白,以下結(jié)合實施例對本發(fā)明進(jìn)行進(jìn)一步詳細(xì)說明。應(yīng)當(dāng)理解,此處所描述的具體實施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。
如圖1-圖2所示,本發(fā)明實施例提供了一種基于深度神經(jīng)網(wǎng)絡(luò)的步態(tài)識別方法,包括如下步驟:
s1、如圖3所示,從視頻序列中減除運動背景得到人體運動輪廓圖,對輪廓圖進(jìn)行形態(tài)學(xué)處理使其噪聲減小,并填充圖像中的空洞,然后提取步態(tài)周期,進(jìn)一步對輪廓圖進(jìn)行歸一化使其大小相等,在一個步態(tài)周期內(nèi)計算步態(tài)高斯圖,建立步態(tài)高斯圖的樣本數(shù)據(jù)集。按照設(shè)計的規(guī)則對數(shù)據(jù)集以5∶1的比例劃分訓(xùn)練集和測試集;
s2、建立與alexnet結(jié)構(gòu)相一致的八層卷積神經(jīng)網(wǎng)絡(luò)模型,并對模型最后一層的神經(jīng)元的個數(shù)修改使其適應(yīng)于步態(tài)識別的分類任務(wù);該模型的前七層用已經(jīng)訓(xùn)練好的alexnet模型的參數(shù)對進(jìn)行初始化,模型的最后一層進(jìn)行隨機(jī)初始化;修改配置文件中的部分參數(shù),使模型可以更加快速收斂;部分參數(shù)包括基礎(chǔ)學(xué)習(xí)率、權(quán)重衰減、學(xué)習(xí)率變化比率、最大迭代次數(shù)等;
s3、根據(jù)發(fā)明內(nèi)容的不同本實驗進(jìn)行了三組實驗,分別為:
a:選取相同攜帶狀態(tài)的訓(xùn)練樣本和測試樣本(均為nm或者bg或者cl),選取72、90、108三個視角下的步態(tài)序列作為訓(xùn)練集,任意角度的視頻序列作為測試集。
b:選取nm狀態(tài)下的72,、90、108視角作為訓(xùn)練樣本集同視角下的bg和cl狀態(tài)的視頻作為測試序列。
c:選取nm、bg、cl狀態(tài)下72、90、108視角下的序列作為訓(xùn)練樣本集,任意角度與狀態(tài)下的序列作為測試集;
s4、將已標(biāo)記好的訓(xùn)練樣本集輸入到上述神經(jīng)網(wǎng)絡(luò)模型,然后根據(jù)正向傳播和反向傳播對神經(jīng)網(wǎng)絡(luò)的參數(shù)進(jìn)行更新,直到模型收斂,保存訓(xùn)練好的模型;
s5、應(yīng)用訓(xùn)練好的模型和標(biāo)記好的測試數(shù)據(jù)對模型進(jìn)行預(yù)測,根據(jù)模型的訓(xùn)練日志和預(yù)測日志對模型進(jìn)行分析;測試過程是對于每一張標(biāo)記好的測試樣本我們遍歷整個樣本集對比測試樣本與樣本集的相似度并根據(jù)一定的判決規(guī)則判定測試樣本所屬的類別。
以上所述僅是本發(fā)明的優(yōu)選實施方式,應(yīng)當(dāng)指出,對于本技術(shù)領(lǐng)域的普通技術(shù)人員來說,在不脫離本發(fā)明原理的前提下,還可以作出若干改進(jìn)和潤飾,這些改進(jìn)和潤飾也應(yīng)視為本發(fā)明的保護(hù)范圍。