一種基于輪廓和色彩相似對(duì)稱(chēng)分布特征的行人檢測(cè)方法
【專(zhuān)利摘要】本發(fā)明屬于計(jì)算機(jī)視覺(jué)領(lǐng)域,公開(kāi)了一種基于輪廓和色彩相似對(duì)稱(chēng)分布特征的行人檢測(cè)方法。包括:輸入被檢測(cè)行人圖像,并轉(zhuǎn)換為圖片數(shù)據(jù);對(duì)圖像進(jìn)行滑窗掃描;選擇訓(xùn)練樣本;提取訓(xùn)練樣本的輪廓HOG特征和色彩相似對(duì)稱(chēng)分布特征LVHCSSF特征;將提取的特征保存到特征向量中,輸入線(xiàn)性支持向量機(jī)訓(xùn)練得到SVM分類(lèi)器;提取掃描窗口圖像的HOG和LVHCSSF特征并輸入SVM分類(lèi)器,得到輸出分類(lèi)結(jié)果,即行人和非行人;進(jìn)行窗口融合;將融合結(jié)果顯示在圖像上,實(shí)現(xiàn)行人定位。本發(fā)明將HOG與LVHCSSF特征相結(jié)合應(yīng)用于行人檢測(cè),降低了特征的維度及其計(jì)算量,提高了計(jì)算速度、識(shí)別效果和檢測(cè)率。
【專(zhuān)利說(shuō)明】一種基于輪廓和色彩相似對(duì)稱(chēng)分布特征的行人檢測(cè)方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明屬于計(jì)算機(jī)視覺(jué)領(lǐng)域,涉及一種基于輪廓和色彩相似對(duì)稱(chēng)分布特征的行人檢測(cè)方法。
【背景技術(shù)】
[0002]行人檢測(cè)在視頻監(jiān)控、機(jī)器人學(xué)、虛擬現(xiàn)實(shí)技術(shù)等領(lǐng)域有廣泛的應(yīng)用,也是計(jì)算機(jī)視覺(jué)和模式識(shí)別領(lǐng)域中的重要研究方向。不同行人的身材、姿勢(shì)、視角和衣著、光照方面都有著極大的變化,加之復(fù)雜的背景場(chǎng)景以及攝像頭自身的移動(dòng)和晃動(dòng),這都給行人檢測(cè)帶來(lái)了很大的困難。
[0003]目前行人檢測(cè)的方法主要分為三類(lèi):第一類(lèi)是基于確定人體模型的方法,但是模型的求解比較復(fù)雜;第二類(lèi)是基于模板匹配的方法,但由于行人的多態(tài)性很難構(gòu)造出足夠的模板;第三類(lèi)是基于統(tǒng)計(jì)分類(lèi)的方法,此方法通過(guò)提取人體的各種特征,然后利用模式識(shí)別的方法進(jìn)行分類(lèi)。在這類(lèi)方法中最具影響的是,DALAL于2005年在Proceedings of IEEEConference on Computer Vision and Pattern Recognition 上發(fā)表的論文“Histogramsof Oriented Gradients for Human Detection”中提出的基于梯度方向直方圖(Histogramof Oriented Gradient, HOG)的特征描述行人的方法。由于HOG特征描述了圖像局部區(qū)域的梯度強(qiáng)度和梯度方向的分布情況,而該分布情況對(duì)局部對(duì)象外觀和形狀可以進(jìn)行很好的表征,因此,該方法具有優(yōu)良的檢測(cè)性能,成為目前行人檢測(cè)的主流方法。但是HOG僅僅是對(duì)矩形區(qū)域中的梯度方向上的梯度強(qiáng)度統(tǒng)計(jì),HOG僅僅反映了行人的輪廓的統(tǒng)計(jì)特征,采用HOG訓(xùn)練的分類(lèi)器,容易將樹(shù)木等一些非行人的環(huán)境圖片誤檢為行人。
[0004]行人的輪廓梯度特征在行人的特征描述中占著非常重要的地位,其中以HOG作為行人檢測(cè)中最為廣泛使用的特征。行人具有非剛性、姿態(tài)多樣化、所處環(huán)境復(fù)雜等特點(diǎn),僅僅使用行人的輪廓特征不足以充分表征和描述行人的這些特點(diǎn),難以降低行人檢測(cè)的漏檢率和誤檢率。針對(duì)HOG特征單一、誤檢率和漏檢率高的狀況,Stenfan Walk于2010年IEEE國(guó)際計(jì)算機(jī)視覺(jué)與模式識(shí)別會(huì)議上提出了 HOG結(jié)合行人的色彩信息CSS (Color SelfSimilarity)的行人檢測(cè)方法,通過(guò)統(tǒng)計(jì)矩形區(qū)域中的色彩的統(tǒng)計(jì)信息、計(jì)算顏色直方圖的相似性來(lái)表征行人的色彩分布特征。Walk結(jié)合了 HOG特征得到了很好的行人檢測(cè)效果,但其特征高達(dá)8128維,HOG特征為3780維,給計(jì)算機(jī)帶來(lái)了很大的計(jì)算負(fù)擔(dān),其主要原因是CSS特征需要很大的計(jì)算量。
【發(fā)明內(nèi)容】
[0005]針對(duì)現(xiàn)有技術(shù)中存在的上述問(wèn)題,本發(fā)明提出了一種基于輪廓和局部色彩相似對(duì)稱(chēng)分布特征的行人檢測(cè)方法,將HOG輪廓特征與本發(fā)明提出的多部位局部色彩相似對(duì)稱(chēng)分布特征 LVHCSSF (Local Vertical Horizontal Color Self-similarity Feature)相結(jié)合,提高了計(jì)算速度,降低了漏檢率和誤檢率。
[0006]一種基于輪廓和局部色彩相似對(duì)稱(chēng)分布特征的行人檢測(cè)方法,主要包括以下步驟:
[0007]步驟一,輸入被檢測(cè)的行人圖像,將視頻流圖像數(shù)據(jù)轉(zhuǎn)換為圖片數(shù)據(jù)。
[0008]步驟二,對(duì)被檢測(cè)行人圖像進(jìn)行滑窗掃描。
[0009]根據(jù)行人在圖像中的成像比例,設(shè)置滑動(dòng)窗口的大小,并從第一行開(kāi)始對(duì)被檢測(cè)行人圖像進(jìn)行滑動(dòng)掃描,水平掃描的長(zhǎng)度(水平滑動(dòng)步長(zhǎng)stridestep)為8個(gè)像素,豎直掃描的長(zhǎng)度(豎直滑動(dòng)步長(zhǎng)stridestep)也為8個(gè)像素,將滑動(dòng)窗口掃描的圖像送入步驟四訓(xùn)練得到的SVM分類(lèi)器。
[0010]步驟三,選擇訓(xùn)練樣本。
[0011]選取行人圖像作為訓(xùn)練樣本,其中,正樣本為有行人的圖像;負(fù)樣本為沒(méi)有行人的圖像。
[0012]步驟四,提取訓(xùn)練樣本的HOG輪廓特征,同時(shí)提取訓(xùn)練樣本的行人局部水平、豎直顏色相似及水平顏色對(duì)稱(chēng)性特征LVHCSSF。方法如下:
[0013](I)提取樣本的HOG輪廓特征
[0014]HOG特征是針對(duì)矩形區(qū)域中的梯度方向上的強(qiáng)度統(tǒng)計(jì)。一個(gè)正樣本圖像的水平和豎直方向梯度示意圖如圖3所示。
[0015]采用行人模板大小為64*128,將行人模板樣本分為16*16大小的block塊,設(shè)block的高為H,寬為W,本發(fā)明采用H:W=1:1塊特征提取方法:每個(gè)block塊分為4個(gè)相同的cell單元,每個(gè)cell單元的大小為8*8,每個(gè)單元的特征是其內(nèi)部64個(gè)像素的特征向量之和。
[0016]用I(x,y)表示圖像I在(x,y)處像素點(diǎn)的灰度值,按下式計(jì)算矩形區(qū)域中的梯度方向的強(qiáng)度統(tǒng)計(jì)特征:
【權(quán)利要求】
1.一種基于輪廓和色彩相似對(duì)稱(chēng)分布特征的行人檢測(cè)方法,其特征在于包括以下步驟: 步驟一,輸入被檢測(cè)的行人圖像,將視頻流圖像數(shù)據(jù)轉(zhuǎn)換為圖片數(shù)據(jù); 步驟二,對(duì)被檢測(cè)行人圖像進(jìn)行滑窗掃描; 根據(jù)行人在圖像中的成像比例,設(shè)置滑動(dòng)窗口的大小,并從第一行開(kāi)始對(duì)被檢測(cè)行人圖像進(jìn)行滑動(dòng)掃描,將滑動(dòng)窗口掃描的圖像送入步驟四訓(xùn)練得到的SVM分類(lèi)器; 步驟三,選擇訓(xùn)練樣本; 選取行人圖像作為訓(xùn)練樣本,其中,正樣本為有行人的圖像;負(fù)樣本為沒(méi)有行人的圖像; 步驟四,提取訓(xùn)練樣本的HOG輪廓特征,同時(shí)提取訓(xùn)練樣本的行人局部水平、豎直顏色相似及水平顏色對(duì)稱(chēng)性特征LVHCSSF ; 步驟五,將步驟四提取的HOG特征和LVHCSSF特征保存到特征向量中,輸入線(xiàn)性支持向量機(jī)SVM,訓(xùn)練得到SVM分類(lèi)器; 步驟六,提取步驟二掃描窗口圖像的HOG輪廓特征,和行人局部水平、豎直顏色相似及水平顏色對(duì)稱(chēng)性特征LVHCSSF,并將提取的特征輸入步驟五訓(xùn)練得到的SVM分類(lèi)器,得到輸出分類(lèi)結(jié)果,即行人和非行人; 步驟七,將判斷為同一個(gè)行人的窗口進(jìn)行窗口融合;` 一張圖像中的行人會(huì)被多個(gè)滑窗檢測(cè),將重合面積達(dá)到三分之二窗口面積的相鄰滑窗的檢測(cè)結(jié)果合并為一個(gè)檢測(cè)結(jié)果; 步驟八,將步驟七的融合結(jié)果顯示在圖像上,實(shí)現(xiàn)行人定位。
2.根據(jù)權(quán)利要求1所述的一種基于輪廓和色彩相似對(duì)稱(chēng)分布特征的行人檢測(cè)方法,其特征在于,所述步驟四提取訓(xùn)練樣本HOG輪廓特征的方法如下:米用行人模板大小為64*128,將行人模板樣本分為16*16大小的block塊,設(shè)block塊的高為H,寬為W,采用H:W=1:1塊特征提取方法:每個(gè)block塊分為4個(gè)相同的cell單元,每個(gè)cell單元的大小為8*8,每個(gè)cell單元的特征是其內(nèi)部64個(gè)像素的特征向量之和;用I(x,y)表示圖像I在(x,y)處像素點(diǎn)的灰度值,按下式計(jì)算矩形區(qū)域中的梯度方向的強(qiáng)度統(tǒng)計(jì)特征:
Gx(X,y) = I (x+1, y)-1 (x_l, y) (O
Gy (x, y) = I (x, y+1)-1 (x, y-1) (2) G(x, >.)=~/g2'+ G2,.(u)(3 )
a (x, y) = arctan (Gy (x, y), Gx (x, y)) (4) 其中,Gx(x,y)、Gy(x,y)分別表示(x,y)處像素點(diǎn)的水平方向和垂直方向的梯度幅值,G(x, y)為(X,y)處像素點(diǎn)的梯度強(qiáng)度,α (x, y)表示(X,y)處像素點(diǎn)的梯度方向; HOG特征將H的梯度方向均勻分為9個(gè)bin,即區(qū)間,第k個(gè)方向的梯度幅值大小Ak (X,y)為:
3.根據(jù)權(quán)利要求1所述的一種基于輪廓和色彩相似對(duì)稱(chēng)分布特征的行人檢測(cè)方法,其特征在于,所述步驟四提取樣本的LVHCSSF特征的方法如下: 采用行人模板大小為64*128,將行人模板無(wú)重疊地等分成大小為8*8的block塊; 將每個(gè)行人模板變換到HSV色彩空間,U,y)處像素點(diǎn)在色彩空間H、S、V的值分別為H(x, y), S (x, y), V (x, y); 將每個(gè)色彩空間均勻分為3個(gè)bin ; (X,y)處像素點(diǎn)在H、S、V色彩空間第k個(gè)bin的幅值分別為:
【文檔編號(hào)】G06K9/66GK103514444SQ201310481275
【公開(kāi)日】2014年1月15日 申請(qǐng)日期:2013年10月15日 優(yōu)先權(quán)日:2013年10月15日
【發(fā)明者】鮑泓, 田仙仙, 徐成, 張璐璐 申請(qǐng)人:北京聯(lián)合大學(xué)