描得到的每個10*25像素大小的梯度幅值特征窗口,將其拉直為250維的列向 量,計算其得分函數(shù)值; 3. 6對得分函數(shù)值大于闊值的窗口,W該窗口所在的比例為> .0引kD的梯度幅 值特征圖像的比例倒數(shù)2*^縮放該圖像,并W該窗口在該尺度的梯度幅值特征圖像上的相對 位置進(jìn)行還原,還原得到該窗口在行人訓(xùn)練集I中的對應(yīng)圖像的灰度圖像上的相對位置, 該灰度圖像的尺度為1,該位置為一個寬高比為10:25的矩形框; 3. 7計算還原得到的每個矩形框與行人訓(xùn)練集I中其所在的圖像上的所有人體矩形框 之間的重合度,重合度具體計算方法為:
即該兩個矩形框的面積重合部分 除W兩個矩形框的平均面積。
[0029] 將與對應(yīng)圖像上所有人體矩形框之間的重合度都低于0. 5的矩形框作為反例,將 與所有人體矩形框中任意一個的重合度大于0. 8的矩形框作為正例。
[0030] 圖4所示為快速檢測器輸出的正例和反例樣本示例圖,如圖4所示,實線框標(biāo)注的 是正例,虛線框標(biāo)注的是反例。
[0031] 步驟4;利用快速檢測結(jié)果訓(xùn)練精細(xì)行人檢測器 4. 1對步驟3. 8中得到的正例矩形框和反例矩形框,統(tǒng)一縮放為10*25像素大小的灰度 圖像,組成精細(xì)行人檢測器的訓(xùn)練樣本集合,記為-[巧,而,…《,..衣,;,…足,其中正例 矩形框有C個,反例矩形框有V個,t- >Isi- 3 !; 4. 2設(shè)置一個包含=個隱層的自動編碼機(jī)作為精細(xì)行人檢測器,自動編碼器的結(jié)構(gòu)如 圖5所示; 4. 3逐層進(jìn)行預(yù)訓(xùn)練Pre-Train 4.3. 1基于無噪聲編碼機(jī)De-noisingAutoEncoder!^無監(jiān)督的方式訓(xùn)練神經(jīng)網(wǎng)絡(luò)的 第一層,將其輸出作為原始輸入的最小化重構(gòu)誤差,其基本原理見圖6所示; 4. 3. 2將每個隱含層的輸出作為下一層神經(jīng)網(wǎng)絡(luò)的輸入,進(jìn)行無監(jiān)督訓(xùn)練; 4. 3. 3重復(fù)步驟4.3. 2,直到完成所有隱含層的預(yù)訓(xùn)練為止,得到IfI,r;,ir:;的初始值. 4. 3. 4將最后一個隱含層的輸出作為softmax層的輸入,并且初始化softmax層的參數(shù) 資;。
[0032]進(jìn)行微調(diào)Fine-tune 將正例樣本的輸出設(shè)置為1,反例樣本的輸出設(shè)置為0,利用BP算法對層級編碼機(jī)S個 隱層的參數(shù) >自-1,W及softmax層的參數(shù)進(jìn)行Fine-tune。W此訓(xùn)練得到具有上述參 數(shù)的自動編碼機(jī)作為精細(xì)行人檢測器。
[0033] 下面將介紹行人檢測部分: 步驟5;利用訓(xùn)練得到的快速行人檢測器和精細(xì)行人檢測器對輸入圖像進(jìn)行行人檢 巧。,如圖7所示,具體為: 5.1;對輸入圖形E進(jìn)行灰度圖像轉(zhuǎn)換,得到輸入灰度圖像,輸入圖像的寬大于20像素, 高大于50像素,對其進(jìn)行高斯金字塔縮放,縮放比例為I. ^ …2^,0 ;;A0 ,直到 最小的灰度圖像的寬大于10個像素且高大于25個像素,共得到0+1個主尺度; 5. 2;在該0+1個主尺度灰度圖像上分別計算其對應(yīng)的梯度幅值特征圖像; 5. 3;通過Bi-化bic插值在該0+1個主尺度梯度幅值圖像的0個間隔中,W等間隔方 式在每個間隔中進(jìn)行中間尺度插入,每個間隔插入四個中間尺度,共得到0*5+1個尺度的 梯度幅值特征圖像,上述四個中間尺度由距離其最近的主尺度的梯度幅值特征圖像插值得 到; 5. 4;在每個尺度的梯度幅值特征圖像上進(jìn)行快速窗口掃描,使用10*25大小的窗口在 每個梯度幅值特征圖像上掃描,對掃描得到的每個10*25像素大小的梯度幅值特征窗口, 將其拉直為250維的列向量,計算其得分函數(shù)值; 5. 5;輸出大于闊值綠的窗口,W該窗口所在的比例為勺梯度幅值特征圖像的比例 - 倒數(shù):T縮放該圖像,并W該窗口在該尺度的梯度幅值特征圖像上的相對位置進(jìn)行還原,還 原得到該窗口在輸入圖像E的灰度圖像上的相對位置,該灰度圖像的尺度為1,該位置為一 個寬高比為10:25的矩形框; 5. 6;將還原得到的所有該些矩形框縮放為10*25像素大小的灰度窗口圖像,輸入到訓(xùn) 練得到的作為精細(xì)行人檢測器的自動編碼機(jī)進(jìn)行分類; 5. 7;保留輸出層輸出的置信度《的/大于0. 5的灰度窗口圖像,將其作為候選人體框; 5. 8;為每個候選人體框標(biāo)記一個五元組標(biāo)簽.r,n',么aw/'),分別對應(yīng)該候選人體 框左上頂點的橫坐標(biāo),縱坐標(biāo),該候選人體框的寬度,高度W及置信度。
[0034] :對該些候選人體框進(jìn)行聚類,輸出人體檢測框,過程具體為: 5. 9. 1將所有候選人體框按照置信度排序,每個框標(biāo)記設(shè)置為0,形成候選人體框集合H,設(shè)置集合R表示真實候選框集合,初始化R為空集; 5. 9. 2在集合H中選擇置信度最大的候選人體框,記為祭=U-J,..IT,,. 將 馬從H中移除,加入集合R后將其標(biāo)記設(shè)置為1; 5. 9.3計算H中所有候選人體框和J的重合度,重合度的計算方法為:
即該兩個矩形框的面積重合部分除W兩個矩形框的平均面積; 5. 9. 4將重合度大于0. 8的候選人體框從H中移除并加入到集合R中,且將該些候選人 體框的標(biāo)記設(shè)置為1,此時集合R中的候選人體框可W記為:齊二[心巧,,..憑。,。..4],其 中渾,,=L、,J*,,, £|> 4'>n妍> 0; 5. 9. 5計算R中每個候選人體框的權(quán)重,
對該化1個候選人體框進(jìn)行加 權(quán)融合,輸出人體檢測框位置記為
5. 9. 6判斷集合H中是否還有候選人體框,如果沒有,結(jié)束檢測;如果集合H中還有候 選人體框,將集合R清空,在集合H中重復(fù)步驟5. 9. 2-5. 9. 5。
[0035] 顯然,本領(lǐng)域的技術(shù)人員可W對本發(fā)明進(jìn)行各種改動和變形而不脫離本發(fā)明的精 神和范圍,該樣,倘若本發(fā)明的該些修改和變形屬于本發(fā)明權(quán)利要求及其等同技術(shù)的范圍 之內(nèi),則本發(fā)明也意圖包含該些改動和變形在內(nèi)。
【主權(quán)項】
1. 一種單幅圖像行人檢測方法,其特征在于: (1) 數(shù)據(jù)準(zhǔn)備,設(shè)置行人數(shù)據(jù)集和背景數(shù)據(jù)集; (2) 訓(xùn)練快速行人檢測器; (3) 利用快速行人檢測器進(jìn)行快速行人檢測與行人樣本提??; (4) 利用快速檢測結(jié)果訓(xùn)練精細(xì)行人檢測器; (5) 利用訓(xùn)練得到的快速行人檢測器和精細(xì)行人檢測器對輸入圖像進(jìn)行行人檢測。2. 如權(quán)利要求1所述的方法,其中步驟(1)具體為: (1. 1)設(shè)置行人數(shù)據(jù)集并標(biāo)記人體矩形框; (1.2)設(shè)置背景數(shù)據(jù)集。3. 如權(quán)利要求2所述的方法,其中步驟(I. 1)具體為: 采集M幅圖像組成行人數(shù)據(jù)集,記為/ =;/r/::.……/,Ui = iA…,V,圖像./;上包含 有身,個行人樣本,4 kl,標(biāo)記圖像A上第j個行人樣本的位置為:::iL 其中(λ· ..?!篂榫匦慰蜃笊享旤c坐標(biāo),3為矩形框?qū)挾龋珹為矩形框長度,所述矩形框為 完全包含該行人樣本輪廓的人體矩形框,采集的每幅圖像的寬均大于20像素,高均大于50 像素。4. 如權(quán)利要求2或3所述的方法,其中步驟(1. 2)具體為: 采集娜畐不包含行人的圖像組成背景數(shù)據(jù)集,記為5。14為,…4…/i,:. λ +:+ V。5. 如權(quán)利要求4所述的方法,其中步驟(2)具體為: (2. 1)利用行人數(shù)據(jù)集獲取正例樣本的特征表示; (2. 2)利用背景數(shù)據(jù)集獲取反例樣本的特征表示; (2. 3)利用以上獲取的正例樣本和反例樣本的特征表示訓(xùn)練線性分類器作為快速行人 檢測器。6. 如權(quán)利要求5所述的方法,其中步驟(2. 1)具體為: (2. I. 1)對行人數(shù)據(jù)集I中的每一幅圖像&,根據(jù)圖像上每個人體矩形框的位置,經(jīng)過 截取,獲得對應(yīng)的人體子圖像,行人數(shù)據(jù)集I中所有圖像的所有人體子圖像構(gòu)成了正例樣 本; (2. 1.2)將截取的正例人體子圖像轉(zhuǎn)換為對應(yīng)的人體灰度子圖像,經(jīng)過歸一化處理得 到10*25像素大小的標(biāo)準(zhǔn)人體灰度子圖像; (2. 1. 3)計算該10*25像素大小的標(biāo)準(zhǔn)人體灰度子圖像的梯度幅值特征F e 弋將 該特征拉直,該拉直后的梯度幅值特征為一個250維的列向量; (2. 1. 4)將所有正例樣本的特征記為:- ….Fv,a ] C'其中 I 4表示第i幅圖像的第j個人體矩形框的拉直梯度幅值特征。7. 如權(quán)利要求6所述的方法,其中步驟(2. 2)具體為: (2.2. 1)在訓(xùn)練集i?中的圖像上,選擇寬高比例為10:25的背景矩形框共川7個,經(jīng)過 截取,獲得對應(yīng)的背景子圖像,則這川7個背景子圖像構(gòu)成了反例樣本; (2. 2. 2)將截取的反例背景子圖像轉(zhuǎn)換為對應(yīng)的背景灰度子圖像,經(jīng)過歸一化處理得 到10*25像素大小的標(biāo)準(zhǔn)背景灰度子圖像; (2. 2. 3)計算該10*25像素大小的