本發(fā)明涉及一種紅外圖像中人體目標識別技術(shù),對紅外圖像中的人體目標進行有效識別,屬于圖像處理和模式識別技術(shù)領(lǐng)域。
背景技術(shù):
人體目標識別是計算機視覺領(lǐng)域研討的熱點問題,其結(jié)合了機器學習、數(shù)字圖像處理以及模式識別等諸多學科的知識。目前,可見光圖像人體目標識別技術(shù)已經(jīng)比較成熟,但對于紅外圖像而言,由于已標注訓練樣本的數(shù)量一般較少,很難經(jīng)訓練得到一個性能優(yōu)異的分類模型來進行人體目標的識別。此外,在實際紅外圖像應(yīng)用領(lǐng)域中,人體目標的成像距離一般較遠,目標在圖像中只占據(jù)了較少的像素大小,導致可用于識別的信息很少,且由于紅外成像系統(tǒng)中噪聲或背景雜波的干擾,復雜背景下紅外人體目標識別技術(shù)的研究變得富有挑戰(zhàn)性。
傳統(tǒng)的機器學習算法應(yīng)用于行人目標的檢測時,嚴格要求訓練樣本數(shù)據(jù)和測試數(shù)據(jù)之間滿足同分布,且需要大量的訓練樣本來進行訓練,這在可見光圖像領(lǐng)域中可以實現(xiàn)。但是在處理紅外人體目標識別問題時,若需要足夠多的已標記紅外樣本圖像來進行訓練,就要付出很大的代價,導致成本的無限增大,影響其可行性。事實上,在不同場景中,測試數(shù)據(jù)和訓練數(shù)據(jù)難以避免出現(xiàn)數(shù)據(jù)分布的差異,這會嚴重影響傳統(tǒng)機器學習的效果。
與傳統(tǒng)的機器學習“種瓜得瓜,種豆得豆”的模式不同,遷移學習是一種“舉一反三”的框架。通過在某種場景中對某事物進行分析,獲取其中的經(jīng)驗和方法,在遇到新問題時,可以直接利用以提高學習的效率。近年來,隨著遷移學習理論的不斷發(fā)展,很多研究學者將其應(yīng)用于目標分類與識別的問題中。這些研究主要集中于使用通用數(shù)據(jù)集在特定的場景中進行訓練,擴展訓練樣本集,通過分類器的重訓練以提高分類器的性能。
公開號cn104361609a面向變化場景的遠紅外行人檢測方法,它以基于boosting-style的歸納遷移學習算法dtlboost為基礎(chǔ),利用k近鄰度量模型評估輔助數(shù)據(jù)與目標數(shù)據(jù)之間的相似度,從輔助數(shù)據(jù)中篩選樣本以擴展目標數(shù)據(jù)集,訓練出集成分類器。這種方法可以增強新場景中行人檢測的魯棒性,但是當選取的行人分類器泛化性能比較差時,可能會無法處理新場景中沒有訓練過的行人模式,且訓練過程中會由于樣本的高特征維數(shù)而導致時間復雜度的上升,影響實用性能。
wang等人(wangx,wangm,liw.scene-specificpedestriandetectionforstaticvideosurveillance[j].ieeetransactionsonpatternanalysis&machineintelligence,2014,36(2):361-374.)提出,在特殊場景中利用通用分類器來進行樣本的識別,得到一定數(shù)量的正負樣本作為輔助樣本,然后再借助這些輔助樣本來提升分類器的性能。這種方法可以在一定程度上解決特殊場景下訓練樣本過少而無法獲取高效分類器的問題,但是通用分類器進行識別時,樣本的分布差異比較下,樣本之間有一定的相似性,因此導致泛化性能比較差。
總之,現(xiàn)有的基于hog-pca和遷移學習的紅外人體目標識別方法,其存在的局限性主要表現(xiàn)在:
(1)訓練過程中使用的是通用分類器和數(shù)據(jù)集進行識別,樣本的分布差異很小,泛化性能比較差;
(2)訓練過程中使用的圖像集中人體目標姿態(tài)單一,場景單一,無法滿足現(xiàn)實應(yīng)用的需求;
(3)訓練過程中由于樣本圖像的特征維數(shù)很高,導致時間復雜度的無限增大,影響了實用性。
現(xiàn)假設(shè),我們有足夠多的已標記可見光人體目標圖像,也可以獲取一定量的紅外人體目標圖像。盡管兩者之間不滿足同分布的條件,但是前者中一定會有部分樣本圖像,與后者中的圖像具有某些相似性,可以幫助構(gòu)建一個更好的紅外人體目標識別分類器,這樣不僅可以減少資源的浪費,也可以提高分類器的性能。本發(fā)明以tradaboost算法為基本框架,如圖2所示,該算法通過對源域樣本和輔助域樣本進行權(quán)重的設(shè)置和更新,在保證分類器在目標域中高分類性能的前提下,充分利用輔助域中具備正遷移能力的樣本,輔助分類器的訓練,提高分類器的泛化能力。
技術(shù)實現(xiàn)要素:
發(fā)明目的:針對現(xiàn)有技術(shù)中存在的問題,本發(fā)明提供一種基于hog-pca和遷移學習的紅外人體目標識別方法,改善了傳統(tǒng)的機器學習方法由于紅外圖像領(lǐng)域中因缺少足量訓練樣本而無法訓練出高效分類器的缺點,提高了紅外場景下人體目標識別的準確性,改善了識別的效率。
技術(shù)方案:一種基于hog-pca和遷移學習的紅外人體目標識別方法,包括如下步驟:
步驟1,利用紅外及可見光圖像分別構(gòu)建源訓練樣本集和輔助訓練樣本集其操作過程如下:
選取的紅外樣本圖像來源于otcbvsbenchmarkdatasetcollection數(shù)據(jù)集,該圖像庫中的紅外圖像包含人體目標和非人體目標,且目標形態(tài)各異,所處的環(huán)境不同,滿足了構(gòu)建樣本集的多樣性需求。通過手動截取,獲取一定數(shù)量64×64像素大小的紅外樣本圖像,并進行樣本的標記;選取的可見光樣本圖像主要來源于足量的已標記inria行人數(shù)據(jù)集,且樣本數(shù)量遠多于紅外樣本圖像的數(shù)量。inria行人數(shù)據(jù)集中包含人體目標的圖像中行人姿態(tài)豐富,背景復雜;而非人體目標的圖像包含街道、建筑物、自然風景等不同的形式,同樣滿足了構(gòu)建樣本集所需的正負輔助樣本的多樣性。
源訓練樣本集和輔助訓練樣本集分別記為
然后,將以上兩組數(shù)據(jù)集進行合并,得到完整的訓練樣本數(shù)據(jù)集:
g=[g1,g2,...,gm,...,gm+n]
第三,考慮到樣本圖像中可能包含噪聲,其會對后續(xù)的特征提取及分類器訓練產(chǎn)生一定的干擾,因此這里采用中值濾波方式對所有的樣本圖像進行降噪處理,則降噪后的樣本數(shù)據(jù)集更新為g'=[g1',g2',...,gm',...,gm+n']。
第四,對每一個樣本給出對應(yīng)的類別標簽,對應(yīng)的類標數(shù)據(jù)集設(shè)為:
l=[label1,label2,...,labelm,...,labelm+n]
其中,labeli∈{0,1}為第i個樣本圖像的類標,源訓練樣本類標集和輔助訓練樣本類標集分別為lb=[label1,label2,...,labelm],la=[labelm+1,labelm+2,...,labelm+n]。
步驟2,提取每個樣本圖像的hog特征,構(gòu)建特征集。采用pca對特征進行降維,以提高后續(xù)計算的效率。對每一個訓練樣本,hog特征向量維數(shù)一般較高,用于后續(xù)分類器訓練時,將會導致訓練過程中計算量很大,同時,特征向量中可能包含的冗余信息也會妨礙重要信息的挖掘。為了克服上述問題,針對提取出的特征集,提出采用pca對其進行降維。具體步驟為:
首先,針對計算得到的hog特征向量集featset,求解其協(xié)方差矩陣cp×p,其中,p=m+n。計算cp×p的特征值,并按從大到小的進行排列,得到λ1,λ2,...,λp及其對應(yīng)的特征向量v1,v2,...,vp。
然后,根據(jù)累計方差貢獻率g(k):
根據(jù)預先設(shè)定的累計方差貢獻率閾值,求出主成分的個數(shù)k。
第三,取λ1,λ2,...,λp中前k個特征值λ1,λ2,...,λk對應(yīng)的特征向量v1,v2,...,vk構(gòu)成投影矩陣v:
v=[v1,v2,...,vk]
第四,利用投影矩陣v對原特征矩陣featset進行投影,即可得到降維后的特征矩陣featset_p:
featset_p=featset*vt
其中,降維后源訓練樣本的特征向量集表示為tb=[featset_p1,featset_p2,...,featset_pm]t,輔助訓練樣本的特征向量集表示為ta=[featset_pm+1,featset_pm+2,...,featset_pm+n]t。
步驟3.基于降維后的hog-pca目標特征集,采用遷移學習理論訓練得到紅外人體目標識別分類器。tradaboost算法的基本思想在于:對于源領(lǐng)域訓練數(shù)據(jù)而言,如果樣本出現(xiàn)了誤分類,就增大該樣本的權(quán)重,使得在若干輪的迭代之后,樣本分類成功的可能性變大;對于輔助域訓練樣本而言,如果樣本被錯誤分類,就減小其權(quán)重,降低其對目標領(lǐng)域分類模型的負面影響,正確分類的樣本擁有更大的權(quán)重,以幫助建立更好的分類模型。具體實現(xiàn)步驟如下:
首先,選取svm分類器作為紅外人體目標識別的基本分類器,后續(xù)將利用tradaboost對其進行訓練。計算訓練數(shù)據(jù)集中每個樣本數(shù)據(jù)的初始權(quán)重wi:
第二,歸一化權(quán)重:
其中,pi(i=1,2,...,m+n)為歸一化后的權(quán)值。
第三,基于訓練數(shù)據(jù)集tb和ta、類標lb和la、及權(quán)重pi(i=1,2,...,m+n),對svm分類器進行訓練,得到分類映射h:
第四,計算h在tb上的分類錯誤率:
其中,h(featset_pi)(i=1,2,...,m+n)表示第i個訓練樣本的分類結(jié)果,labeli表示第i個訓練樣本的真實類標。
第五,根據(jù)計算得到的分類錯誤率,調(diào)整權(quán)重:
其中,參數(shù)
第六,重復上述步驟二至步驟五n次。最終可以得到訓練后的紅外人體目標識別分類器:
其中,h(x)表示第t次迭代時,待識別目標x的分類結(jié)果。
步驟4,基于tradaboost的紅外人體目標識別分類器訓練完畢后,即可對新輸入的待識別圖像進行識別。具體步驟如下:
首先,給定一幅待識別的紅外圖像i,采用hog特征提取方法,計算其hog特征向量feature;
然后,根據(jù)訓練階段計算所得的投影矩陣v,對feature進行pca降維,得到降維后的特征feature_p;
最后,基于feature_p和訓練好的分類器hf(x),即可得到最終識別結(jié)果:
本發(fā)明采用上述技術(shù)方案,具有以下有益效果:
(1)實現(xiàn)了可見光圖像領(lǐng)域到紅外圖像領(lǐng)域的知識遷移,對于源領(lǐng)域樣本數(shù)據(jù)和輔助領(lǐng)域樣本數(shù)據(jù)采用不同的權(quán)重調(diào)整策略,保證了分類器在目標領(lǐng)域的分類準確性,同時減小了大量輔助領(lǐng)域樣本的浪費,提高了資源的利用率,改善了系統(tǒng)的性能;
(2)對于出現(xiàn)的高維特征,采用了降維方法進行了降維,極大地減小了訓練時間,降低了方法的時間復雜度;
(3)本方法選取支持向量機作為基礎(chǔ)分類器,利用了存在分布差異的樣本數(shù)據(jù)進行訓練,較大地提高了系統(tǒng)的泛化性能,改善了識別的準確率。
附圖說明
圖1為本發(fā)明實施例的框架圖;
圖2為本發(fā)明方法的總體框架圖。
具體實施方式
下面結(jié)合具體實施例,進一步闡明本發(fā)明,應(yīng)理解這些實施例僅用于說明本發(fā)明而不用于限制本發(fā)明的范圍,在閱讀了本發(fā)明之后,本領(lǐng)域技術(shù)人員對本發(fā)明的各種等價形式的修改均落于本申請所附權(quán)利要求所限定的范圍。
如圖1所示,基于hog-pca和遷移學習的紅外人體目標識別方法,包括如下步驟:
第一步,利用紅外及可見光圖像分別構(gòu)建源訓練樣本集和輔助訓練樣本集,其具體過程如下:
構(gòu)建的源訓練樣本集和輔助訓練樣本集均由正負樣本構(gòu)成。源訓練樣本集包含了m幅紅外圖像,輔助域樣本則有n幅可見光圖像。紅外樣本圖像均來源于otcbvsbenchmarkdatasetcollection數(shù)據(jù)集,從中選取q幅圖像(q<m),從每一幅圖像中截取出包含一個人體目標的64×64大小圖像塊,再從庫中選取m-q幅不包含人體目標的圖像作為源域訓練樣本的負樣本??梢姽馊梭w目標樣本則主要來源于inria行人數(shù)據(jù)集,從中選出n幅圖像,進行尺寸大小的歸一化,構(gòu)成輔助訓練樣本集。
源訓練樣本集和輔助訓練樣本集,分別記為
然后,將以上兩組數(shù)據(jù)集進行合并,得到完整的訓練樣本數(shù)據(jù)集:
g=[g1,g2,...,gm,...,gm+n]
第三,考慮到樣本圖像中可能包含噪聲,其會對后續(xù)的特征提取及分類器訓練產(chǎn)生一定的干擾,因此這里采用中值濾波方式對所有的樣本圖像進行降噪處理,則降噪后的樣本數(shù)據(jù)集更新為g'=[g1',g2',...,gm',...,gm+n']。
第四,對每一個樣本給出對應(yīng)的類別標簽,對應(yīng)的類標數(shù)據(jù)集設(shè)為:
l=[label1,label2,...,labelm,...,labelm+n]
其中,labeli∈{0,1}為第i個樣本圖像的類標,源訓練樣本類標集和輔助訓練樣本類標集分別為lb=[label1,label2,...,labelm],la=[labelm+1,labelm+2,...,labelm+n]。
第二步,提取每個樣本圖像的hog特征,構(gòu)建特征集,具體實現(xiàn)過程如下:
針對每一個樣本圖像gi'(1≤i≤m+n),用hog特征描述子進行特征提取,得到其hog特征feati,最終,可以得到所有訓練樣本圖像的特征集:
featset=[feat1,…,featm+n]t
第三步,采用pca對特征進行降維,以提高后續(xù)計算的效率。其實現(xiàn)過程如下:
首先,針對計算得到的hog特征向量集featset,求解其協(xié)方差矩陣cp×p,其中,p=m+n。計算cp×p的特征值,并按從大到小的進行排列,得到λ1,λ2,...,λp及其對應(yīng)的特征向量v1,v2,...,vp。
然后,根據(jù)累計方差貢獻率g(k):
根據(jù)預先設(shè)定的累計方差貢獻率閾值,求出主成分的個數(shù)k。
第三,取λ1,λ2,...,λp中前k個特征值λ1,λ2,...,λk對應(yīng)的特征向量v1,v2,...,vk構(gòu)成投影矩陣v:
v=[v1,v2,...,vk]
第四,利用投影矩陣v對原特征矩陣featset進行投影,即可得到降維后的特征矩陣featset_p:
featset_p=featset*vt
其中,降維后源訓練樣本的特征向量集表示為tb=[featset_p1,featset_p2,...,featset_pm]t,輔助訓練樣本的特征向量集表示為ta=[featset_pm+1,featset_pm+2,...,featset_pm+n]t。
第四步,基于降維后的hog-pca目標特征集,采用遷移學習理論訓練得到紅外人體目標識別分類器,其實現(xiàn)步驟如下:
首先,選取svm分類器作為紅外人體目標識別的基本分類器,后續(xù)將利用tradaboost對其進行訓練。計算訓練數(shù)據(jù)集中每個樣本數(shù)據(jù)的初始權(quán)重wi:
第二,歸一化權(quán)重:
其中,pi(i=1,2,...,m+n)為歸一化后的權(quán)值。
第三,基于訓練數(shù)據(jù)集tb和ta、類標lb和la、及權(quán)重pi(i=1,2,...,m+n),對svm分類器進行訓練,得到分類映射h:
第四,計算h在tb上的分類錯誤率:
其中,h(featset_pi)表示第i個訓練樣本的分類結(jié)果,labeli表示第i個訓練樣本的真實類標。
第五,根據(jù)計算得到的分類錯誤率,調(diào)整權(quán)重:
其中,參數(shù)
第六,重復上述步驟二至步驟五n次。最終可以得到訓練后的紅外人體目標識別分類器:
其中,h(x)表示第t次迭代時,待識別目標x的分類結(jié)果。
第五步,基于tradaboost的紅外人體目標識別分類器訓練完畢后,即可對新輸入的待識別圖像進行識別。具體步驟如下:
首先,給定一幅待識別的紅外圖像i,采用hog特征提取方法,計算其hog特征向量feature;
然后,根據(jù)訓練階段計算所得的投影矩陣v,對feature進行pca降維,得到降維后的特征feature_p;
最后,基于feature_p和訓練好的分類器hf(x),即可得到最終識別結(jié)果: