一種基于運(yùn)動(dòng)平臺(tái)的紅外行人檢測(cè)方法
【專利摘要】本發(fā)明公開(kāi)一種基于運(yùn)動(dòng)平臺(tái)的紅外行人檢測(cè)方法,屬于模式識(shí)別和圖像處理【技術(shù)領(lǐng)域】。該方法利用連接于運(yùn)動(dòng)平臺(tái)的紅外攝像頭獲取紅外圖像;對(duì)紅外圖像提取梯度范數(shù)特征,利用級(jí)聯(lián)線性支持向量機(jī)獲取行人候選區(qū)域;對(duì)行人候選區(qū)域進(jìn)行方向梯度直方圖特征提取,利用極限學(xué)習(xí)機(jī)對(duì)行人候選區(qū)域進(jìn)行檢測(cè),最終得到包含行人的區(qū)域。本發(fā)明方法中通過(guò)候選區(qū)域選取大大減少了計(jì)算量,同時(shí)本發(fā)明方法中采用的極限學(xué)習(xí)機(jī)與支持向量機(jī)等現(xiàn)有分類(lèi)算法相比具有更高的實(shí)時(shí)性和更高的檢測(cè)精度。
【專利說(shuō)明】一種基于運(yùn)動(dòng)平臺(tái)的紅外行人檢測(cè)方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及一種基于運(yùn)動(dòng)平臺(tái)的紅外行人檢測(cè)方法,屬于模式識(shí)別和圖像處理技 術(shù)領(lǐng)域。
【背景技術(shù)】
[0002] 行人檢測(cè)在視頻監(jiān)控、人機(jī)交互、駕駛輔助系統(tǒng)等方面獲得了越來(lái)越廣泛的應(yīng)用。 與可見(jiàn)光圖像相比,紅外圖像最大的優(yōu)勢(shì)在于可全天候工作。因此,近幾年來(lái)很多學(xué)者致力 于紅外行人檢測(cè)問(wèn)題,并取得了一定的成果。
[0003] 然而,紅外行人檢測(cè)仍有一些亟待克服的問(wèn)題:首先,紅外攝像頭由于技術(shù)本身的 原因具有信噪比低、高噪聲等缺陷;其次,紅外圖像丟失了可見(jiàn)光圖像的紋理細(xì)節(jié)等信息。
[0004] 現(xiàn)有的行人檢測(cè)系統(tǒng)大多數(shù)是基于可見(jiàn)光圖像,經(jīng)過(guò)對(duì)現(xiàn)有技術(shù)文獻(xiàn)檢索分 析,發(fā)現(xiàn)劉瓊等人的發(fā)明專利"一種實(shí)時(shí)魯棒的遠(yuǎn)紅外車(chē)載行人檢測(cè)方法",申請(qǐng)?zhí)枮?201310104777. 8,該專利實(shí)現(xiàn)的方法以像素梯度的垂直投影捕捉輸入圖像中潛在的行人預(yù) 選區(qū)域,以局部閾值化方法和形態(tài)學(xué)后處理技術(shù)搜索感興趣區(qū)域,以多級(jí)熵加權(quán)梯度方向 直方圖為特征描述感興趣區(qū)域并輸入支持向量機(jī)行人分類(lèi)器進(jìn)行在線感興趣區(qū)域判斷,通 過(guò)多幀校驗(yàn)篩選行人分類(lèi)器判斷結(jié)果實(shí)現(xiàn)行人檢測(cè)。
【發(fā)明內(nèi)容】
[0005] 本發(fā)明的目的是提出一種基于運(yùn)動(dòng)平臺(tái)的紅外行人檢測(cè)方法,對(duì)已有的紅外檢測(cè) 方法進(jìn)行改進(jìn),由紅外攝像頭采集包含行人和背景的紅外圖像,然后運(yùn)動(dòng)平臺(tái)實(shí)時(shí)對(duì)紅外 圖像進(jìn)行處理,以提高檢測(cè)速度和檢測(cè)精度。
[0006] 本發(fā)明提出的基于運(yùn)動(dòng)平臺(tái)的紅外行人檢測(cè)方法,包括以下步驟:
[0007] (1)訓(xùn)練一個(gè)用于對(duì)運(yùn)動(dòng)平臺(tái)的紅外攝像頭拍攝的圖像中的行人候選區(qū)域進(jìn)行選 取的分類(lèi)器《、增益系數(shù)V i和偏置系數(shù)具體過(guò)程如下:
[0008] (1-1)將包含行人的紅外圖像作為訓(xùn)練樣本,通過(guò)插值方法,將訓(xùn)練樣本中的圖像 調(diào)整成長(zhǎng)寬分別為W和H的圖像,其中W,H e {10,20,40,80,160,320},計(jì)算調(diào)整后的圖像 的梯度范數(shù),對(duì)長(zhǎng)寬為8 X 8的圖像窗口的梯度求范數(shù),得到8 X 8圖像窗口的64維梯度范 數(shù)特征,記為gtrain ;
[0009] (1-2)設(shè)T為圖像中所有包含行人的窗口,S為圖像中的任意窗口,則窗口 t e T 和窗口 s e S的疊加面積〇(t,s)為:
【權(quán)利要求】
1. 一種基于運(yùn)動(dòng)平臺(tái)的紅外行人檢測(cè)方法,其特征在于該方法包括以下步驟: (1) 訓(xùn)練一個(gè)用于對(duì)運(yùn)動(dòng)平臺(tái)的紅外攝像頭拍攝的圖像中的行人候選區(qū)域進(jìn)行選取的 分類(lèi)器《、增益系數(shù)Vi和偏置系數(shù)ti,具體過(guò)程如下: (1-1)將包含行人的紅外圖像作為訓(xùn)練樣本,通過(guò)插值方法,將訓(xùn)練樣本中的圖像調(diào)整 成長(zhǎng)寬分別為W和H的圖像,其中W,He{10,20,40,80,160,320},計(jì)算調(diào)整后的圖像的梯 度范數(shù),對(duì)長(zhǎng)寬為8X8的圖像窗口的梯度求范數(shù),得到8X8圖像窗口的64維梯度范數(shù)特 征,記為gtrain ; (1-2)設(shè)T為圖像中所有包含行人的窗口,S為圖像中的任意窗口,則窗口teT和窗 口seS的疊加面積〇 (t,s)為: ,、tns o(t,s) =-, t^JS 采用8X8圖像窗口對(duì)步驟(1-1)中調(diào)整大小后的訓(xùn)練樣本進(jìn)行滑動(dòng)采樣,得到多個(gè) 8X8滑動(dòng)窗口,計(jì)算與8X8滑動(dòng)窗口相對(duì)應(yīng)的〇 (t,s),將與〇 (t,s)彡0. 5的8X8滑動(dòng)窗 口相對(duì)應(yīng)的64維梯度范數(shù)作為正樣本,與〇 (t,s) < 0. 5的8X8滑動(dòng)窗口相對(duì)應(yīng)的64維 梯度范數(shù)作為負(fù)樣本,利用線性支持向量機(jī),計(jì)算得到分類(lèi)器w; (1-3)利用下述公式,計(jì)算訓(xùn)練樣本的排序得分Scoretrain : Scoretrain = (w, gtrain) 其中,〈·,·〉表示內(nèi)積; (1-4)利用非極大抑制方法,從每個(gè)大小為i的原始圖像窗口中任意選擇多個(gè)原始圖 像窗口作為訓(xùn)練樣本,將上述SC〇retMin作為原始圖像窗口的一維特征,利用線性支持向量 機(jī),計(jì)算得到增益系數(shù)Vi及偏置系數(shù)h; (2) 訓(xùn)練一個(gè)用于對(duì)運(yùn)動(dòng)平臺(tái)的紅外攝像頭拍攝的圖像中的行人候選區(qū)域進(jìn)行判斷的 極限學(xué)習(xí)機(jī),具體過(guò)程如下: (2-1)設(shè)定權(quán)重Ci以及閾值%,通過(guò)下式計(jì)算得到一個(gè)輸出隱藏層矩陣Htest :
其中,Xl,. . .,xN為N個(gè)訓(xùn)練樣本的方向梯度直方圖特征,#為隱藏節(jié)點(diǎn)數(shù)量,# <iV, G為極限學(xué)習(xí)機(jī)的激勵(lì)函數(shù); (2-2)通過(guò)下式,計(jì)算得到一個(gè)輸出權(quán)重矩陣β: β=H+T 其中,IC為隱藏層輸出矩陣Htost的廣義逆矩陣,T為訓(xùn)練樣本的標(biāo)簽; (3) 將紅外攝像頭分別連接到運(yùn)動(dòng)平臺(tái)及直流移動(dòng)電源上; (4) 對(duì)紅外攝像頭的焦距和顯示模式進(jìn)行初始設(shè)置,采集紅外圖像,實(shí)時(shí)讀取紅外攝像 頭拍攝的原始紅外圖像; (5) 對(duì)上述讀取的原始紅外圖像進(jìn)行候選區(qū)域選取,具體過(guò)程如下: (5-1)將讀取的原始紅外圖像通過(guò)插值方法,調(diào)整成長(zhǎng)寬分別為W和H的圖像,其中W,He{10,20,40,80,160,320},計(jì)算調(diào)整后的圖像的梯度范數(shù),對(duì)長(zhǎng)寬為8X8的圖像窗口的 梯度求范數(shù),得到8X8圖像窗口的64維梯度范數(shù)特征,記為g; (5-2)采用8X8圖像窗口對(duì)步驟(5-1)中調(diào)整大小后的原始紅外圖像進(jìn)行滑動(dòng)采樣, 得到多個(gè)8X8滑動(dòng)窗口; (5-3)利用下述公式,計(jì)算原始紅外圖像的排序得分score:score= (w,g) 其中,〈·,·〉表示內(nèi)積,w為步驟(1-2)得到的分類(lèi)器; (5-4)通過(guò)下式,分別計(jì)算與多個(gè)8X8大小的滑動(dòng)窗口相對(duì)應(yīng)的調(diào)整大小之前的原始 紅外圖像窗口得分為〇 : 〇 =Vi ·score+tj 其中Vi為步驟(1-4)得到的增益系數(shù),心為步驟(1-4)得到的偏置系數(shù); (5-5)對(duì)上述多個(gè)得分〇從高到低進(jìn)行排序,得分越高,則原始紅外圖像窗口中包含行 人的可能性越大; (5-6)從排序后的原始紅外圖像窗口中選取前M個(gè)原始紅外圖像窗口作為行人候選區(qū) 域; (6)對(duì)M個(gè)行人候選區(qū)域進(jìn)行方向梯度直方圖特征提取,具體過(guò)程如下: (6-1)分別計(jì)算M個(gè)行人候選區(qū)域在原始紅外圖像中的橫坐標(biāo)方向和縱坐標(biāo)方向的梯 度: Gx (x,y) =H(x+1,y)-H(x-l,y) Gy (x,y) =H(x,y+l)-H(x,y-1) 其中,Gx(x,y)和Gy(x,y)分別為行人候選區(qū)域中像素點(diǎn)(x,y)的橫坐標(biāo)方向和縱坐 標(biāo)方向的梯度,H(X,y)為該像素點(diǎn)(X,y)的像素值; 分別計(jì)算行人候詵K域中毎個(gè)像素點(diǎn)(x,y)的梯度幅值G(x,y)和梯度方向a(x,y):
(6-2)將行人候選區(qū)域分成多個(gè)單元格,將每個(gè)單元格的梯度方向360度分成9個(gè)方向 塊,分別對(duì)每個(gè)單元格內(nèi)的每個(gè)像素點(diǎn)(X,y)按照梯度方向在直方圖中進(jìn)行加權(quán)投影,得 到與多個(gè)單元格相對(duì)應(yīng)的多個(gè)9維特征向量; (6-3)將行人候選區(qū)域內(nèi)的多個(gè)單元格組合成空間上連通的多個(gè)塊,塊與塊之間互有 重疊區(qū)域,將同一個(gè)塊內(nèi)的多個(gè)單元格的9維特征向量串聯(lián),得到該塊的方向梯度直方圖 特征,對(duì)多個(gè)塊的方向梯度直方圖特征進(jìn)行歸一化處理,將歸一化處理后的多個(gè)塊的方向 梯度直方圖特征作為該行人候選區(qū)域的方向梯度直方圖特征; (6-4)重復(fù)步驟(6-1)?步驟(6-3),得到M個(gè)行人候選區(qū)域的方向梯度直方圖特征; ⑵利用極限學(xué)習(xí)機(jī),對(duì)M個(gè)行人候選區(qū)域的方向梯度直方圖特征進(jìn)行檢測(cè),得到檢測(cè) 結(jié)果,具體過(guò)程如下: (7-1)將上述M個(gè)行人候選區(qū)域的方向梯度直方圖特征作為測(cè)試樣本,利用下式,計(jì)算 測(cè)試樣本的輸出隱藏層矩陣H及輸出權(quán)重矩陣β: 卩=HT
其中,X1,. . .,xM為M個(gè)行人候選區(qū)域的方向梯度直方圖特征,Ci和ai為任意設(shè)定的權(quán) 重和閾值,汾為隱藏節(jié)點(diǎn)數(shù)量,# G為極限學(xué)習(xí)機(jī)的激勵(lì)函數(shù),H+為隱藏層輸出矩陣H 的廣義逆矩陣; (7-2)通過(guò)判斷函數(shù)f(x),對(duì)原始紅外圖像的行人候選區(qū)域進(jìn)行判定: /'(X) -.s7g/?(/7(x)Hy (- + HHy)1T) C , 若f(x) =1,則判定原始紅外圖像中的行人候選區(qū)域包含行人,若f(x) =-1,則判定 原始紅外圖像中的行人候選區(qū)域不包含行人,其中,叫xMGU.c,,%)…G(x,c.,·,,",·,)]。
【文檔編號(hào)】G06K9/62GK104239852SQ201410421355
【公開(kāi)日】2014年12月24日 申請(qǐng)日期:2014年8月25日 優(yōu)先權(quán)日:2014年8月25日
【發(fā)明者】王仕成, 楊春偉, 劉華平, 廖守億, 張金生, 楊東方 申請(qǐng)人:中國(guó)人民解放軍第二炮兵工程大學(xué)