一種單幅圖像行人檢測(cè)方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于計(jì)算機(jī)視覺(jué)和圖像處理技術(shù)領(lǐng)域,特別的設(shè)及單幅圖像的行人檢測(cè)方 法。
【背景技術(shù)】
[0002] 行人檢測(cè)是計(jì)算機(jī)視覺(jué)技術(shù)中的熱點(diǎn)和難點(diǎn),可理解為判斷輸入圖像是否包含行 人,如果包含行人,則給出行人的位置信息,近年來(lái),行人檢測(cè)技術(shù)在人體行為分析、視頻監(jiān) 控、車(chē)輛輔助駕駛及災(zāi)難營(yíng)救等領(lǐng)域發(fā)揮了作用。
[0003] 行人檢測(cè)技術(shù)中最為核屯、的問(wèn)題可W歸結(jié)為特征提取,分類和定位=個(gè)方面?,F(xiàn) 有技術(shù)中對(duì)該=個(gè)方面的研究可歸結(jié)為兩類;基于背景建模的方法和基于統(tǒng)計(jì)學(xué)習(xí)的方 法,都取得了一定的成果,然而基于背景建模的方法魯椿性不高,抗干擾能力較差,而基于 統(tǒng)計(jì)學(xué)習(xí)的方法受訓(xùn)練樣本的影響較大,且應(yīng)對(duì)真實(shí)場(chǎng)景的能力不夠。
[0004] 為克服現(xiàn)有技術(shù)的上述不足之處,本發(fā)明提出了一種多層次的基于快速和精細(xì)行 人檢測(cè)器的行人檢測(cè)方法,利用梯度幅值特征和線性支持向量機(jī),訓(xùn)練得到粗的行人檢測(cè) 器,實(shí)現(xiàn)非行人窗口的快速過(guò)濾,在快速過(guò)濾的結(jié)果上,利用加速的窗口掃描方法,得到更 為精確的窗口正例樣本的反例樣本,W此訓(xùn)練得到作為精細(xì)檢測(cè)器的自動(dòng)編碼機(jī),基于層 疊的自動(dòng)編碼機(jī),區(qū)分行人和非行人窗口,實(shí)現(xiàn)對(duì)輸入圖像的行人檢測(cè),本發(fā)明提供的多層 次的基于訓(xùn)練實(shí)現(xiàn)的行人檢測(cè)方法具有更好的魯椿性,能夠快速且準(zhǔn)確的實(shí)現(xiàn)圖像中行人 的檢測(cè)。
【發(fā)明內(nèi)容】
[0005] 在本發(fā)明要解決的問(wèn)題是提供一種單幅圖像行人檢測(cè)方法,W解決現(xiàn)有技術(shù)中行 人檢測(cè)易受環(huán)境影響,不夠準(zhǔn)確的缺陷。
[0006] 為了實(shí)現(xiàn)W上目的,本發(fā)明提供了一種單幅圖像行人檢測(cè)方法,其特征在于: (1) 數(shù)據(jù)準(zhǔn)備,設(shè)置行人數(shù)據(jù)集和背景數(shù)據(jù)集; (2) 訓(xùn)練快速行人檢測(cè)器; (3) 利用快速行人檢測(cè)器進(jìn)行快速行人檢測(cè)與行人樣本提?。?(4) 利用快速檢測(cè)結(jié)果訓(xùn)練精細(xì)行人檢測(cè)器; (5) 利用訓(xùn)練得到的快速行人檢測(cè)器和精細(xì)行人檢測(cè)器對(duì)輸入圖像進(jìn)行行人檢測(cè)。
[0007] 優(yōu)選的,其中步驟(1)具體為: (1.1) 設(shè)置行人數(shù)據(jù)集并標(biāo)記人體矩形框; (1.2) 設(shè)置背景數(shù)據(jù)集。
[0008] 優(yōu)選的,其中步驟(1.1)具體為: 義集M幅圖像組成行人數(shù)據(jù)集,記為/=L./j,/y.../j,....1/,圖 像馬上包含有禹個(gè)行人樣本,A; > 1,標(biāo)記圖像/;:上第j個(gè)行人樣本的位置為: Z,U,,r.rj,其中|,v,_r.)為矩形框左上頂點(diǎn)坐標(biāo),r為矩形框?qū)挾?,A為矩 形框長(zhǎng)度,所述矩形框?yàn)楸硎就耆撔腥藰颖据喞娜梭w矩形框,采集的每幅圖像的 寬均大于20像素,高均大于50像素。
[0009] 優(yōu)選的,其中步驟(1. 2)具體為: 采集N幅不包含行人的圖像組成背景數(shù)據(jù)集,記為:浸,,皮。
[0010] 優(yōu)選的,其中步驟(2)具體為: (2. 1)利用行人數(shù)據(jù)集獲取正例樣本的特征表示; (2. 2)利用背景數(shù)據(jù)集獲取反例樣本的特征表示; (2. 3)利用W上獲取的正例樣本和反例樣本的特征表示訓(xùn)練線性分類器作為快速行人 檢測(cè)器。
[0011] 優(yōu)選的,其中步驟化1)具體為: (2. 1. 1)對(duì)行人數(shù)據(jù)集I中的每一幅圖像i;,根據(jù)圖像上每個(gè)人體矩形框的位置,經(jīng)過(guò) 截取,獲得對(duì)應(yīng)的人體子圖像,行人數(shù)據(jù)集I中所有圖像的所有人體子圖像構(gòu)成了正例樣 本; (2. 1. 2)將截取的正例人體子圖像轉(zhuǎn)換為對(duì)應(yīng)的人體灰度子圖像,經(jīng)過(guò)歸一化處理得 至IJ10*25像素大小的標(biāo)準(zhǔn)人體灰度子圖像; (2. 1. 3)計(jì)算該10*25像素大小的標(biāo)準(zhǔn)人體灰度子圖像的梯度幅值特征Fe公將 該特征拉直,該拉直后的梯度幅值特征為一個(gè)250維的列向量; (2. 1.4)將所有正例樣本的特征記為:巧,朽.f 其中
巧表示第i幅圖像的第j個(gè)人體矩形框的拉直梯度幅值特征。
[0012] 優(yōu)選的,其中步驟化2)具體為: (2. 2. 1)在訓(xùn)練集B中的圖像上,選擇寬高比例為10:25的背景矩形框共10T個(gè),經(jīng)過(guò) 截取,獲得對(duì)應(yīng)的背景子圖像,則該10T個(gè)背景子圖像構(gòu)成了反例樣本; (2. 2. 2)將截取的反例背景子圖像轉(zhuǎn)換為對(duì)應(yīng)的背景灰度子圖像,經(jīng)過(guò)歸一化處理得 至IJ10*25像素大小的標(biāo)準(zhǔn)背景灰度子圖像; (2. 2. 3)計(jì)算該10*25像素大小的標(biāo)準(zhǔn)背景灰度子圖像的梯度幅值特征/應(yīng),將 該特征拉直,該拉直后的梯度幅值特征為一個(gè)250維的列向量; (2. 2. 4)將所有反例樣本的特征記為: ;/:. £,.....如]& 其中表示第a個(gè)反例樣本的拉直梯度幅值特征。
[0013] 優(yōu)選的,其中步驟化3)具體為: (2. 3. 1)將所有正例樣本的標(biāo)簽設(shè)置為1,反例樣本的標(biāo)簽設(shè)置為0,訓(xùn)練一個(gè)二類線 性分類的SVM,得到判別投影W6 5^4; (2. 3. 2)設(shè)置得分函數(shù)J:::::々:切'知醬》=r;' *ir,其中g(shù)表示任意10*25大小的灰度圖 像樣本經(jīng)過(guò)拉直后的梯度幅值特征,該拉直后的梯度幅值特征是一個(gè)250維的列向量; (2. 3. 3)計(jì)算每個(gè)正例樣本的標(biāo)準(zhǔn)人體灰度子圖像的得分函數(shù)值,進(jìn)行排序,設(shè)置檢測(cè) 闊值ff,使得該闊值大于99%的正例樣本的標(biāo)準(zhǔn)人體灰度子圖像的得分函數(shù)值。
[0014] 優(yōu)選的,其中步驟(3)具體為: (3. 1)將行人訓(xùn)練集I中的每幅圖像進(jìn)行灰度處理,得到灰度圖像,對(duì)其進(jìn)行高斯金字 塔處理,縮放比例為1. 日' < 化巧> 1,直到最小尺寸的灰度圖像的 寬大于10個(gè)像素且高大于25個(gè)像素; (3. 2)將上述D+1個(gè)尺度作為主尺度,計(jì)算每個(gè)主尺度灰幅圖像的梯度幅值特征圖像; (3. 3)通過(guò)雙=次Bi-化bic插值在每?jī)蓚€(gè)相鄰主尺度之間獲得中間尺度的梯度幅值 特征圖像; (3. 4)在所有尺度的梯度幅值特征圖像上進(jìn)行窗口掃描,窗口大小為10*25像素,水平 和垂直方向的步長(zhǎng)都是1; (3. 5)對(duì)掃描得到的每個(gè)10*25像素大小的梯度幅值特征窗口,將其拉直為一個(gè)250維 的列向量,計(jì)算其得分函數(shù)值; (3. 6)對(duì)得分函數(shù)值大于檢測(cè)闊值^的窗口,W該窗口所在的比例為的梯度幅值 特征圖像的比例倒數(shù)2 =縮放該圖像,并W該窗口在該尺度的梯度幅值特征圖像上的相對(duì)位 置進(jìn)行還原,還原得到該窗口在行人訓(xùn)練集I中的對(duì)應(yīng)圖像的灰度圖像上的相對(duì)位置,該 灰度圖像的尺度為1,該位置為一個(gè)寬高比為10:25的矩形框; (3. 7)計(jì)算還原得到的每個(gè)矩形框與行人訓(xùn)練集I中對(duì)應(yīng)圖像上的所有人體矩形框之 間的重合度,重合度具體計(jì)算方法為
,即該兩個(gè)矩形框.1. 的面積重合 部分除W兩個(gè)矩形框的平均面積; (3. 8)將與對(duì)應(yīng)圖像上的所有人體矩形框之間的重合度都低于0. 5的矩形框作為反 例,將與所有人體矩形框中任意一個(gè)的重合度大于0. 8的矩形框作為正例。
[0015] 優(yōu)選的,其中步驟化3)具體為:在相鄰的兩個(gè)主尺度之間等間隔的插入四個(gè)中 間尺度,上述四個(gè)尺度由距離其最近的主尺度的梯度幅值特征圖像插值得到。
[0016] 優(yōu)選的,其中在相鄰的兩個(gè)主尺度之間等間隔的插入四個(gè)中間尺度具體為;在1-^ 尺度圖像和^,尺度圖像之間等間隔的插入四個(gè)中間尺度,則每個(gè)中間尺度可W表示為:
其申巧表示.1.尺度圖像和^尺 -,- I.]二-- 度圖像之間第q個(gè)中間尺度的縮放比例。
[0017] 優(yōu)選的,其中步驟(4)具體為: (4. 1)對(duì)步驟3. 8中得到的正例矩形框和反例矩形框,統(tǒng)一縮放為10*25像素大小的灰 度圖像,組成精細(xì)行人檢測(cè)器的訓(xùn)練樣本集合,記為Z= [?,,%.],其中正 例矩形框有C個(gè),反例矩形框有V個(gè),r>Lr> '!; (4. 2)設(shè)置一個(gè)包含=個(gè)隱層的自動(dòng)編碼機(jī)作為精細(xì)行人檢測(cè)器; (4. 3)逐層進(jìn)行預(yù)訓(xùn)練Pre-Train; (4. 4)進(jìn)行微調(diào)Fine-tune,將正例樣本的輸出設(shè)置為1,反例樣本的輸出設(shè)置為 0,利用BP算法對(duì)層級(jí)編碼機(jī)S個(gè)隱層的參數(shù)ff-,,r:.N':,W及sofwmax層的參數(shù)fi,;進(jìn)行 Fine-tune,W此訓(xùn)練得到具有上述參數(shù)的自動(dòng)編碼機(jī)作為精細(xì)行人檢測(cè)器。
[0018] 優(yōu)選的,其中步驟(4. 3)具體為: (4.3. 1)基于去噪自動(dòng)編碼機(jī)De-noisingAutoEncoder!^無(wú)監(jiān)督的方式訓(xùn)練神經(jīng)網(wǎng) 絡(luò)的第一層,將其輸出作為原始輸入的最小化重構(gòu)誤差; (4. 3. 2)將每個(gè)隱含層的輸出作為下一層神經(jīng)網(wǎng)絡(luò)的輸入,進(jìn)行無(wú)監(jiān)督訓(xùn)練; (4. 3. 3)重復(fù)步驟4. 3. 2,直到