專(zhuān)利名稱(chēng):一種基于小波分形特征的行人檢測(cè)方法
技術(shù)領(lǐng)域:
本發(fā)明涉及智能交通系統(tǒng)中的智能車(chē)輛技術(shù),尤其是一種基于小波分形特 征的行人檢測(cè)方法。
背景技術(shù):
目標(biāo)檢測(cè)是機(jī)器視覺(jué)研究的重要內(nèi)容,在視頻監(jiān)控,移動(dòng)機(jī)器人,智能車(chē) 輛等領(lǐng)域中得到廣泛的應(yīng)用。由于行人外表,姿勢(shì)以及光照強(qiáng)度的組合千變?nèi)f 化,導(dǎo)致行人檢測(cè)成為視覺(jué)目標(biāo)檢測(cè)中最為復(fù)雜的問(wèn)題之一。
現(xiàn)有的行人檢測(cè)方法在過(guò)程上可歸結(jié)為兩個(gè)主要的處理步驟,即特征提取 和目標(biāo)檢測(cè)。目標(biāo)檢測(cè)步驟的主要任務(wù)是將特征提取步驟構(gòu)造出來(lái)的目標(biāo)特征, 用于分類(lèi)器訓(xùn)練,從而對(duì)新的測(cè)試樣本做出判別。因此,特征提取方法對(duì)行人 檢測(cè)的效果有著重要的影響。特征提取根據(jù)特征表達(dá)的方式,又可分為稀疏表 達(dá)和稠密表達(dá)兩類(lèi)。稀疏表達(dá)法通過(guò)某種關(guān)鍵特征提取算法,將目標(biāo)區(qū)域中的 興趣點(diǎn)提取出來(lái),組成目標(biāo)的稀疏特征表達(dá)模式。例如尺度不變特征變換 (Scale-invariant feature transform, SIFT)禾Q主成分分析(Principal Component Analysis, PCA)。使用這些特征表達(dá)方式提取的目標(biāo)特征具有表達(dá)簡(jiǎn)潔的優(yōu)點(diǎn), 但在描述復(fù)雜模式時(shí),其特征向量所包含的信息不利于分類(lèi)器訓(xùn)練,因而在行 人檢測(cè)領(lǐng)域的應(yīng)用效果不佳。而稠密表達(dá)是對(duì)給定區(qū)域進(jìn)行逐點(diǎn)掃描,提取出 目標(biāo)區(qū)域的稠密特征表達(dá)模式。典型的有哈爾特征和梯度方向直方圖 (Histograms of Oriented Gradient, HOG)等。這些提取方法提取的目標(biāo)特征包含的 信息量大,有利于分類(lèi)器訓(xùn)練,但特征向量維數(shù)過(guò)高。以HOG方法為例,64X 128大小的圖像將產(chǎn)生至少4096維的特征向量,若采用哈爾特征將得到更多的特 征維數(shù),導(dǎo)致特征冗余量大,計(jì)算效率低, 一般還需要特征選擇方法的配合。
發(fā)明內(nèi)容
本發(fā)明目的在于提供一種特征表達(dá)簡(jiǎn)潔,信息冗余小,檢測(cè)效率高的基于小波分形特征的行人檢測(cè)方法。
本發(fā)明所采用的技術(shù)方案是-
(1) 、讀入訓(xùn)練樣本集,樣本集合包括分類(lèi)器訓(xùn)練的完整行人圖像和不包含行人的
自然場(chǎng)景圖像,將所有樣本圖像規(guī)格化到48X96像素大小,其中訓(xùn)練樣本圖像 為灰度圖像;
(2) 、對(duì)樣本圖像/;c,力進(jìn)行3次二維小波變換,得到3層小波分解后的12個(gè)子 圖,各層對(duì)應(yīng)的尺度分別是2x2、 4x4、 8x8,取其中尺度為4x4、 8xg兩層中的 6個(gè)小波子圖,即
其中,y(x,力為圖像灰度值,(x,力為像素坐標(biāo),/的上標(biāo)A、 V、 D、 H為二維小波 分解子空間包含的各子圖,分別對(duì)應(yīng)LL子圖、LH子圖、HL子圖和HH子圖,/ 的下標(biāo)代表分解層數(shù);
(3) 、對(duì)步驟(2)得到各小波子圖分別取絕對(duì)值后再進(jìn)行適當(dāng)?shù)睦旌涂s放變換,使 其取值范圍統(tǒng)一映射到0 255;
(4) 、對(duì)步驟(3)處理后的小波子圖分別求取分形維數(shù)向量,令尺度^= 1,2,3,...,", n取2 100中的正整數(shù),按照下式依次求得A"2,…,A^,即分形維數(shù)向量,
<formula>formula see original document page 5</formula>
(5) 、對(duì)步驟(4)得到的每個(gè)子圖所對(duì)應(yīng)的分形向量分別做規(guī)范化處理;
(6) 、將步驟(5)規(guī)范化后的所有子圖對(duì)應(yīng)的規(guī)范化后的分形向量進(jìn)行組合,得到一
個(gè)6x("—l)維向量,即小波分形特征向量;
(7) 、將步驟(6)提取的小波分形特征用于訓(xùn)練軟支持向量分類(lèi)器,用訓(xùn)練后的判別 函數(shù)實(shí)現(xiàn)對(duì)未知樣本的檢測(cè)。
本發(fā)明結(jié)合小波和分形理論,提出一種新的行人目標(biāo)特征提取方法,稱(chēng)為小波分形特征(Wavelet Fractal Signature, WFS),用于訓(xùn)練SVM分類(lèi)器,該特征具有 簡(jiǎn)潔的特征表達(dá)形式,更優(yōu)的特征分辨能力,從而能提高行人檢測(cè)效果。 WFS特征包括稠密采樣和抽象兩個(gè)環(huán)節(jié)
(1) 在稠密采樣環(huán)節(jié)將輸入圖像分解到不同分辨率下非自相關(guān)的小波子模式, 選擇其中最有利于刻畫(huà)行人特征的6個(gè)子模式,包含了大量的亮度差信息,方向 信息,從而將行人檢測(cè)問(wèn)題轉(zhuǎn)化為6維空間的模式分類(lèi)問(wèn)題,提高了分類(lèi)效果。
(2) 在抽象環(huán)節(jié),通過(guò)計(jì)算分形維向量,提取出各子模式在不同尺度下的特 征差別,能夠在非常少的特征維數(shù)(尺度s的最大取值w為9時(shí),生成的特征向量 僅有48維)下抽象出目標(biāo)在不同分辨率下的特征,具有表達(dá)簡(jiǎn)潔的優(yōu)點(diǎn)。
(3) 根據(jù)常識(shí),本發(fā)明所涉及的二維小波分解,分形維計(jì)算、Ll規(guī)范化等
環(huán)節(jié)計(jì)算效率都很高,SVM的計(jì)算開(kāi)銷(xiāo)主要取決于特征維數(shù)和支持向量個(gè)數(shù)。
一方面,給出的WFS特征僅有48維,僅為H0G特征的1X;另一方面,采用WFS
特征能夠在非常少的訓(xùn)練樣本時(shí)就能取得較高的檢測(cè)效率,大幅減少了支持向
量的個(gè)數(shù),從而降低了計(jì)算開(kāi)銷(xiāo)。
因此,本發(fā)明既具有稠密采樣信息量大的優(yōu)點(diǎn),又具備稀疏采樣簡(jiǎn)潔性的優(yōu)
點(diǎn)。在降低計(jì)算效率的同時(shí),提高了檢測(cè)率。本發(fā)明的另一個(gè)有益效果是,實(shí)踐
證明在訓(xùn)練樣本非常少時(shí),本發(fā)明方案仍能具有很高的檢測(cè)率,可應(yīng)用于訓(xùn)練樣
本難以收集的場(chǎng)合。
圖l是本發(fā)明的方法流程圖。
具體實(shí)施例方式
下面結(jié)合附圖對(duì)發(fā)明的實(shí)施做出進(jìn)一步說(shuō)明。圖l是本發(fā)明的方法流程圖, 如圖1所示,該方法包括以下7個(gè)步驟。
.步驟101:讀入訓(xùn)練樣本集,樣本集合包括分類(lèi)器訓(xùn)練的完整行人圖像和不包含
行人的自然場(chǎng)景圖像,將所有樣本圖像規(guī)格化到48X96像素大小,其中訓(xùn)練樣 本圖像為灰度圖像;
步驟102、對(duì)樣本圖像Xx,力進(jìn)行3次二維小波變換,得到3層小波分解后的子圖, 各層對(duì)應(yīng)的尺度分別是2x2、 4x4、 8x8。除去尺度為2x2的所有子圖,以及其它兩種尺度中的/A子圖,剩下的子圖為
"H",/3D} (1)
其中,/x,力為圖像灰度值,(x,力為像素坐標(biāo),/的上標(biāo)A、 V、 D、 H為二維小波分解子空間包含的各子圖,分別對(duì)應(yīng)LL子圖、LH子圖、HL子圖和HH子圖,/的下標(biāo)代表分解層數(shù);
步驟103:對(duì)式(l)中的每個(gè)小波子圖取絕對(duì)值后再進(jìn)行適當(dāng)?shù)睦旌涂s放變換,使其取值范圍統(tǒng)一映射到0 255;
步驟104:對(duì)步驟103處理后的小波子圖分別求取分形維數(shù)向量,具體為,令尺度e二 1,2,3,...,",按照式(2)依次求得A,"2,…,A:-i,即分形維數(shù)向量,"取2 100之間的整數(shù)。w的取值與生成的特征維數(shù)成正比,但其值越大,包含的特征信息量越大,反之則越小。通過(guò)大量實(shí)驗(yàn)得到當(dāng)"取9時(shí)為最優(yōu);
A=2 —
(2)
''J
、("= max & i (/, , max 6F, (w,")}
步驟105:對(duì)步驟104得到的每個(gè)子圖所對(duì)應(yīng)的分形向量分別做規(guī)范化,即用式(3)規(guī)范化每個(gè)子圖對(duì)應(yīng)的分形維向量,
A=]i^TT (3)
II' +幾
其中,1Hh為l范數(shù),a,表示規(guī)范化之前的子圖分形維向量,A表示規(guī)范化之后的標(biāo)準(zhǔn)化向量,義為一個(gè)很小的正數(shù),為了保證式(3)有效;
該步驟還可以使用L2范數(shù)等其它方式來(lái)規(guī)范化分形向量,但L1范數(shù)具有最高的計(jì)算效率。
步驟106:將步驟105規(guī)范化后的所有子圖對(duì)應(yīng)的規(guī)范化后的分形向量進(jìn)行組合,得到一個(gè)6x^—l)維向量,即最終的小波分形特征向量;
步驟107:將步驟106提取的小波分形特征用于訓(xùn)練軟支持向量分類(lèi)器。具體算
7法如下
(A) 已知訓(xùn)練樣本集
<formula>formula see original document page 8</formula>
(B) 選擇核函數(shù)和懲罰參數(shù)C,構(gòu)造并求解最優(yōu)化問(wèn)題
<formula>formula see original document page 8</formula>
其中,〖(x,,x,)-^(x,)沐&)為核函數(shù)。
(C) 解出步驟(B)中式(4)的最優(yōu)解,記作ct 用式(5)求出最優(yōu)分類(lèi)超平面(v//),
(D) 從而得到用于分類(lèi)的判別函數(shù)/x),
<formula>formula see original document page 8</formula>
其中,SVM的懲罰因子C為大于零的常數(shù),其最優(yōu)值需要通過(guò)試驗(yàn)確定,本發(fā)明中取2000。核函數(shù)可使用多項(xiàng)式核、二層神經(jīng)網(wǎng)絡(luò)核和高斯核,本發(fā)明首選高斯核,"取1.5,其它核次之。
利用一個(gè)與訓(xùn)練樣本圖像同樣尺寸的窗口在被測(cè)圖像中滑動(dòng),通過(guò)得到判別
函數(shù)/(x)對(duì)窗口中的目標(biāo)進(jìn)行分類(lèi),判斷該模式是否為行人,從而實(shí)現(xiàn)行人檢測(cè),其中x代表圖像的WFS特征,判別函數(shù)/(;c)的輸出代表行人或非行人。
權(quán)利要求
1.一種基于小波分形特征的行人檢測(cè)方法,其特征是,該方法包括以下步驟(1)、讀入訓(xùn)練樣本集,樣本集合包括分類(lèi)器訓(xùn)練的完整行人圖像和不包含行人的自然場(chǎng)景圖像,將所有樣本圖像規(guī)格化到48×96像素大小,其中訓(xùn)練樣本圖像為灰度圖像;(2)、對(duì)樣本圖像f(x,y)進(jìn)行3次二維小波變換,得到3層小波分解后的12個(gè)子圖,各層對(duì)應(yīng)的尺度分別是2×2、4×4、8×8,取其中尺度為4×4、8×8兩層中的6個(gè)小波子圖,即{f2H,f2V,f2D,f3H,f3V,f3D}其中,f(x,y)為圖像灰度值,(x,y)為像素坐標(biāo),f的上標(biāo)A、V、D、H為二維小波分解子空間包含的各子圖,分別對(duì)應(yīng)LL子圖、LH子圖、HL子圖和HH子圖,f的下標(biāo)代表分解層數(shù);(3)、對(duì)步驟(2)得到各小波子圖分別取絕對(duì)值后再進(jìn)行適當(dāng)?shù)睦旌涂s放變換,使其取值范圍統(tǒng)一映射到0~255;(4)、對(duì)步驟(3)處理后的小波子圖分別求取分形維數(shù)向量,令尺度ε=1,2,3,...,n,n取2~100中的正整數(shù),按照下式依次求得D1,D2,...,Dn-1,即分形維數(shù)向量,<maths id="math0001" num="0001" ><math><![CDATA[ <mrow><msub> <mi>D</mi> <mi>k</mi></msub><mo>=</mo><mn>2</mn><mo>-</mo><mfrac> <mrow><mi>ln</mi><mi>A</mi><mrow> <mo>(</mo> <msub><mi>ϵ</mi><mi>k</mi> </msub> <mo>)</mo></mrow><mo>-</mo><mi>ln</mi><mi>A</mi><mrow> <mo>(</mo> <msub><mi>ϵ</mi><mrow> <mi>k</mi> <mo>+</mo> <mn>1</mn></mrow> </msub> <mo>)</mo></mrow> </mrow> <mrow><mi>ln</mi><msub> <mi>ϵ</mi> <mi>k</mi></msub><mo>-</mo><mi>ln</mi><msub> <mi>ϵ</mi> <mrow><mi>k</mi><mo>+</mo><mn>1</mn> </mrow></msub> </mrow></mfrac> </mrow>]]></math></maths><maths id="math0002" num="0002" ><math><![CDATA[ <mrow><mi>A</mi><mrow> <mo>(</mo> <msub><mi>ϵ</mi><mi>k</mi> </msub> <mo>)</mo></mrow><mo>=</mo><mfrac> <mrow><msub> <mi>V</mi> <msub><mi>ϵ</mi><mi>k</mi> </msub></msub><mo>-</mo><msub> <mi>V</mi> <msub><mi>ϵ</mi><mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn></mrow> </msub></msub> </mrow> <mn>2</mn></mfrac> </mrow>]]></math></maths><maths id="math0003" num="0003" ><math><![CDATA[ <mrow><msub> <mi>V</mi> <mi>ϵ</mi></msub><mo>=</mo><munder> <mi>Σ</mi> <mrow><mi>i</mi><mo>,</mo><mi>j</mi> </mrow></munder><mrow> <mo>(</mo> <msub><mi>u</mi><mi>ϵ</mi> </msub> <mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo> </mrow> <mo>-</mo> <msub><mi>b</mi><mi>ϵ</mi> </msub> <mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo> </mrow> <mo>)</mo></mrow> </mrow>]]></math></maths><maths id="math0004" num="0004" ><math><![CDATA[ <mrow><msub> <mi>u</mi> <mi>ϵ</mi></msub><mrow> <mo>(</mo> <mi>i</mi> <mo>,</mo> <mi>j</mi> <mo>)</mo></mrow><mo>=</mo><mi>max</mi><mo>{</mo><msub> <mi>u</mi> <mrow><mi>ϵ</mi><mo>-</mo><mn>1</mn> </mrow></msub><mrow> <mo>(</mo> <mi>i</mi> <mo>,</mo> <mi>j</mi> <mo>)</mo></mrow><mo>,</mo><munder> <mi>max</mi> <mrow><mo>|</mo><mrow> <mo>(</mo> <mi>m</mi> <mo>,</mo> <mi>n</mi> <mo>)</mo></mrow><mo>-</mo><mrow> <mo>(</mo> <mi>i</mi> <mo>,</mo> <mi>j</mi> <mo>)</mo></mrow><mo>≤</mo><mn>1</mn><mo>|</mo> </mrow></munder><msub> <mi>u</mi> <mrow><mi>ϵ</mi><mo>-</mo><mn>1</mn> </mrow></msub><mrow> <mo>(</mo> <mi>m</mi> <mo>,</mo> <mi>n</mi> <mo>)</mo></mrow><mo>}</mo> </mrow>]]></math></maths><maths id="math0005" num="0005" ><math><![CDATA[ <mrow><msub> <mi>b</mi> <mi>ϵ</mi></msub><mrow> <mo>(</mo> <mi>i</mi> <mo>,</mo> <mi>j</mi> <mo>)</mo></mrow><mo>=</mo><mi>max</mi><mo>{</mo><msub> <mi>b</mi> <mrow><mi>ϵ</mi><mo>-</mo><mn>1</mn> </mrow></msub><mrow> <mo>(</mo> <mi>i</mi> <mo>,</mo> <mi>j</mi> <mo>)</mo></mrow><mo>,</mo><munder> <mi>max</mi> <mrow><mo>|</mo><mrow> <mo>(</mo> <mi>m</mi> <mo>,</mo> <mi>n</mi> <mo>)</mo></mrow><mo>-</mo><mrow> <mo>(</mo> <mi>i</mi> <mo>,</mo> <mi>j</mi> <mo>)</mo></mrow><mo>≤</mo><mn>1</mn><mo>|</mo> </mrow></munder><msub> <mi>b</mi> <mrow><mi>ϵ</mi><mo>-</mo><mn>1</mn> </mrow></msub><mrow> <mo>(</mo> <mi>m</mi> <mo>,</mo> <mi>n</mi> <mo>)</mo></mrow><mo>}</mo> </mrow>]]></math></maths>(5)、對(duì)步驟(4)得到的每個(gè)子圖所對(duì)應(yīng)的分形向量分別做規(guī)范化處理;(6)、將步驟(5)規(guī)范化后的所有子圖對(duì)應(yīng)的規(guī)范化后的分形向量進(jìn)行組合,得到一個(gè)6×(n-1)維向量,即小波分形特征向量;(7)、將步驟(6)提取的小波分形特征用于訓(xùn)練軟支持向量分類(lèi)器,獲得用于分類(lèi)的判別函數(shù),再利用一個(gè)與訓(xùn)練樣本圖像同樣尺寸的窗口在被測(cè)圖像中滑動(dòng),用訓(xùn)練后得到的判別函數(shù)對(duì)滑動(dòng)窗口中的目標(biāo)進(jìn)行分類(lèi),判斷該模式是否為行人,從而實(shí)現(xiàn)行人檢測(cè)。
2. 根據(jù)權(quán)利要求1所述的一種基于小波分形特征的行人檢測(cè)方法,其特征是-所述步驟(4)中尺度s的最大取值n為9。
3. 根據(jù)權(quán)利要求1所述的一種基于小波分形特征的行人檢測(cè)方法,其特征是-所述步驟(5)所使用的規(guī)范化的方法為用Ll范數(shù)規(guī)范化每個(gè)子圖對(duì)應(yīng)的分形維向量,艮卩其中,l卜lh為l范數(shù),a,表示規(guī)范化之前的子圖分形維向量,A表示規(guī)范化之后 的標(biāo)準(zhǔn)化向量,A為一個(gè)很小的正數(shù),為了保證除法有效。
全文摘要
本發(fā)明公開(kāi)了一種基于小波分形特征的行人檢測(cè)方法,涉及智能交通系統(tǒng)中的智能車(chē)輛技術(shù),包括(1)讀入訓(xùn)練樣本集,將所有樣本圖像規(guī)格化到48×96像素大??;(2)對(duì)樣本圖像進(jìn)行3次二維小波變換,取其中2、3兩層的6個(gè)小波子圖;(3)對(duì)步驟(2)得到各小波子圖取絕對(duì)值,再進(jìn)行拉伸和縮放,使其取值范圍統(tǒng)一映射到0~255;(4)對(duì)步驟(3)處理后的小波子圖分別求取分形維數(shù)向量;(5)對(duì)步驟(4)得到的各子圖對(duì)應(yīng)的分形向量規(guī)范化;(6)將步驟(5)規(guī)范化后的分形向量進(jìn)行組合,得到一個(gè)6×(n-1)維的小波分形特征向量;(7)將步驟(6)提取的小波分形特征用于訓(xùn)練軟支持向量機(jī),用得到判別函數(shù)實(shí)現(xiàn)行人檢測(cè);本發(fā)明的特征表達(dá)形式簡(jiǎn)潔,特征分辨能力強(qiáng),能提高行人檢測(cè)效率。
文檔編號(hào)G06K9/66GK101630369SQ20091018307
公開(kāi)日2010年1月20日 申請(qǐng)日期2009年7月30日 優(yōu)先權(quán)日2009年7月30日
發(fā)明者李舜酩, 柏芳超, 毛建國(guó), 峘 沈, 繆小冬 申請(qǐng)人:南京航空航天大學(xué)