本發(fā)明涉及生物識別領(lǐng)域,尤其是一種基于深度學(xué)習(xí)和軀干提取的行人識別系統(tǒng)及方法。
背景技術(shù):
道路行人識別的核心是利用安裝在運動車輛上的攝像機檢測行人,從而估計出潛在的危險以便采取策略保護行人?;诮y(tǒng)計分類的方法是通過機器學(xué)習(xí),從一系列訓(xùn)練數(shù)據(jù)中得到一個分類器,利用該分類器對輸入窗口圖像進行識別,并判斷是否為行人。基于統(tǒng)計分類方法的優(yōu)點是魯棒較好,但是需要很多訓(xùn)練數(shù)據(jù),實時性差。目前,基于統(tǒng)計分類方法識別行人主要類型有:神經(jīng)網(wǎng)絡(luò)、支持向量機和AdaBoost方法。神經(jīng)網(wǎng)絡(luò)方法可以描述極為復(fù)雜的模式,已經(jīng)成功地應(yīng)用在字符識別和人臉檢測上,它在行人的檢測上也有應(yīng)用,但實時性和魯棒性都不夠理想。支持向量機是基于結(jié)構(gòu)風(fēng)險最小化原理的統(tǒng)計學(xué)習(xí)理論,該方法比神經(jīng)網(wǎng)絡(luò)方法具有更好的泛化能力。
行人兼具剛性物體和柔性物體的特性,表觀受光照、尺度、姿態(tài)、視角、部分遮擋和復(fù)雜場景等因素的影響,使得構(gòu)建實用化的行人檢測器挑戰(zhàn)性極大。如何減弱甚至克服各種影響因素對識別的干擾,行人檢測方法可大致分為三大類:基于全局特征的方法,基于人體部件的方法、基于立體視覺的方法。此外,除了檢測方法的多樣化和系統(tǒng)化,行人數(shù)據(jù)庫也越來越完善,如MIT、Caltech、INRIA等行人數(shù)據(jù)庫,這些行人數(shù)據(jù)庫都為行人檢測方法的研究提供了專業(yè)的檢測和評估方法,但是仍然需要設(shè)計一種更完善的行人識別算法。。
技術(shù)實現(xiàn)要素:
本發(fā)明的發(fā)明目的在于:針對上述存在的問題,提供一種基于深度學(xué)習(xí)和軀干提取的行人識別系統(tǒng)及方法。本發(fā)明有效降低了行人檢測的失誤率,方法具有很強的實用價值。
本發(fā)明采用的技術(shù)方案如下:
一種基于深度學(xué)習(xí)和軀干提取的行人識別系統(tǒng),其特征在于,所述系統(tǒng)包括:數(shù)據(jù)輸入層、第一卷積層、子采樣層、第二卷積層和數(shù)據(jù)輸出層;所述數(shù)據(jù)輸入層信號連接于第一卷積層;所述第一卷積層信號連接于子采樣層;所述子采樣層信號連接于第二卷積層;所述第二卷積層信號連接于數(shù)據(jù)輸出層。
所述數(shù)據(jù)輸入層用于獲取原始的圖像數(shù)據(jù),對獲取的圖像數(shù)據(jù)進行預(yù)處理,將預(yù)處理后的圖像數(shù)據(jù)發(fā)送給第一卷積層。
所述第一卷積層用于把輸入的圖像提取出多幅特征提取圖,將提取出的多幅特征提取圖發(fā)送給子采樣層。
所述子采樣層用于將獲取的多幅特征提取圖再次進行特征提取和取樣壓縮,將處理后的圖像發(fā)送給第二卷積層。
所述第二卷積層用于將特征圖提取成局部檢測圖,并通過隱藏層獲得這些局部檢測圖的的評分。
所述系統(tǒng)還包括若干個遮擋濾波器,所述折當(dāng)率波器分為不同等級,高一級的組件由低一級的組件構(gòu)成,越是高級的組件也就越是完整,最高級的組件也可能處于被遮擋狀態(tài),進而得到局部檢測圖。
一種基于深度學(xué)習(xí)和軀干提取的行人識別系統(tǒng)的方法,其特征在于,所述方法包括以下步驟:
步驟1:首先對行人的整體特征進行提取,然后構(gòu)建深度學(xué)習(xí)模型,獲取圖像累積梯度信息,找出行人目標(biāo)可能存在的感興趣區(qū)域;
步驟2:再對行人的局部特征進行進一步提取:構(gòu)建軀干模型,利用紋理特征提取算法獲取行人紋理特征;
步驟3:利用第一卷積層以及子采樣層共同作用,形成模型的特征提取層,利用第二卷積層對特征提取圖進行處理后得到局部檢測圖。
所述紋理特征提取算法的方法為:首先對像素點的梯度進行計算,根據(jù)計算結(jié)果尋找并將像素發(fā)生一定程度變化的區(qū)域作為感興趣區(qū)域,對這些區(qū)域進行重點關(guān)注,減少特征提取的搜尋區(qū)域,增強特征計算的實時性;同時取區(qū)域中像素的平均亮度值為閾值平滑特征紋理信息。
綜上所述,由于采用了上述技術(shù)方案,本發(fā)明的有益效果是:將變形處理引入到卷積神經(jīng)網(wǎng)絡(luò),利用多層相互關(guān)聯(lián)的網(wǎng)絡(luò)來模擬人類的大腦的多層抽象機制和視覺信息的處理過程,逐層對輸入圖像進行抽象處理,提取圖像的顯著特征,實現(xiàn)對輸入圖像的抽象描述與分類,該基于深度學(xué)習(xí)和軀干提取的行人識別算法有效降低了行人檢測的失誤率,方法具有很強的實用價值。
附圖說明
本發(fā)明將通過例子并參照附圖的方式說明,其中:
圖1是本發(fā)明的一種基于深度學(xué)習(xí)和軀干提取的行人識別系統(tǒng)的系統(tǒng)結(jié)構(gòu)示意圖。
圖2是本發(fā)明的一種基于深度學(xué)習(xí)和軀干提取的行人識別系統(tǒng)的遮擋組件的模型示意圖。
具體實施方式
本說明書中公開的所有特征,或公開的所有方法或過程中的步驟,除了互相排斥的特征和/或步驟以外,均可以以任何方式組合。
本說明書(包括任何附加權(quán)利要求、摘要)中公開的任一特征,除非特別敘述,均可被其他等效或具有類似目的的替代特征加以替換。即,除非特別敘述,每個特征只是一系列等效或類似特征中的一個例子而已。
如圖1 和圖2所示的一種基于深度學(xué)習(xí)和軀干提取的行人識別系統(tǒng),其特征在于,所述系統(tǒng)包括:數(shù)據(jù)輸入層、第一卷積層、子采樣層、第二卷積層和數(shù)據(jù)輸出層;所述數(shù)據(jù)輸入層信號連接于第一卷積層;所述第一卷積層信號連接于子采樣層;所述子采樣層信號連接于第二卷積層;所述第二卷積層信號連接于數(shù)據(jù)輸出層。
所述數(shù)據(jù)輸入層用于獲取原始的圖像數(shù)據(jù),對獲取的圖像數(shù)據(jù)進行預(yù)處理,將預(yù)處理后的圖像數(shù)據(jù)發(fā)送給第一卷積層。
所述第一卷積層用于把輸入的圖像提取出多幅特征提取圖,將提取出的多幅特征提取圖發(fā)送給子采樣層。
所述子采樣層用于將獲取的多幅特征提取圖再次進行特征提取和取樣壓縮,將處理后的圖像發(fā)送給第二卷積層。
所述第二卷積層用于將特征圖提取成局部檢測圖,并通過隱藏層獲得這些局部檢測圖的的評分。
所述系統(tǒng)還包括若干個遮擋濾波器,所述折當(dāng)率波器分為不同等級,高一級的組件由低一級的組件構(gòu)成,越是高級的組件也就越是完整,最高級的組件也可能處于被遮擋狀態(tài),進而得到局部檢測圖。
一種基于深度學(xué)習(xí)和軀干提取的行人識別系統(tǒng)的方法,其特征在于,所述方法包括以下步驟:
步驟1:首先對行人的整體特征進行提取,然后構(gòu)建深度學(xué)習(xí)模型,獲取圖像累積梯度信息,找出行人目標(biāo)可能存在的感興趣區(qū)域;
步驟2:再對行人的局部特征進行進一步提?。簶?gòu)建軀干模型,利用紋理特征提取算法獲取行人紋理特征;
步驟3:利用第一卷積層以及子采樣層共同作用,形成模型的特征提取層,利用第二卷積層對特征提取圖進行處理后得到局部檢測圖。
卷積神經(jīng)網(wǎng)絡(luò)的第一卷積層以及子采樣層共同作用,形成了模型的特征提取層,卷積神經(jīng)網(wǎng)絡(luò)第一層輸入層將28×84大小的圖片作為第一卷積層的輸入,第一卷積層中有64個濾波器,輸入數(shù)據(jù)的每個9×9鄰域數(shù)據(jù)與濾波器中參數(shù)作用,作為一幅輸出特征圖的一個元素,最終,經(jīng)過第一卷積層的64個濾波器卷積作用,輸出結(jié)果是64幅20×76大小的特征圖。
所述紋理特征提取算法的方法為:首先對像素點的梯度進行計算,根據(jù)計算結(jié)果尋找并將像素發(fā)生一定程度變化的區(qū)域作為感興趣區(qū)域,對這些區(qū)域進行重點關(guān)注,減少特征提取的搜尋區(qū)域,增強特征計算的實時性;同時取區(qū)域中像素的平均亮度值為閾值平滑特征紋理信息。
所述軀干模型的提出源于對道路場景中兩大類非行人模式的考慮,一方面,道路場景中的某些干擾熱源的溫度通常比行人的溫度更高,此類干擾熱源的輪廓信息比較豐富,所形成的非行人對象通常易于產(chǎn)生虛警,另一方面,道路場景中的某些干擾熱源的溫度通常比行人的溫度更低,其溫度雖然明顯低于行人但又略高于背景,亦易于形成非行人對象。
在行人對象選取階段,采用局部自適應(yīng)雙閾值分割算法對圖像進行分割以獲取行人對象,只對奇數(shù)行圖像進行分割,偶數(shù)行的分割結(jié)果直接取自上一奇數(shù)行的分割結(jié)果,進而采用形態(tài)學(xué)操作對分割結(jié)果進行處理、使用行人對象寬高比和最小高度限制對形態(tài)學(xué)結(jié)果進行過濾,從而得到對象。
利用卷積神經(jīng)網(wǎng)絡(luò)的第一卷積層以及子采樣層共同作用,形成了模型的特征提取層,利用第二卷積層對特征提取圖進行處理后得到局部檢測圖,由于人身體各個部位的尺寸不同,算法設(shè)計了20個遮擋濾波器作為組件模型,組件一共分為三個等級,其中一級組件有6個,二級組件有7個,三級組件有7個,黑色表示被遮擋狀態(tài)。
高一級的組件由低一級的組件構(gòu)成, 越是高級的組件也就越是完整, 最高級的組件也可能處于被遮擋狀態(tài),但也會有重復(fù)出現(xiàn),三級和二級中都出現(xiàn)了同樣的頭-肩部組件, 這說明人體能自己遮擋自己,形成另類的遮擋。
本發(fā)明并不局限于前述的具體實施方式。本發(fā)明擴展到任何在本說明書中披露的新特征或任何新的組合,以及披露的任一新的方法或過程的步驟或任何新的組合。