一種目標(biāo)檢測(cè)方法及裝置以及移動(dòng)終端的制作方法
【專利摘要】本發(fā)明公開(kāi)了一種目標(biāo)檢測(cè)方法及裝置以及移動(dòng)終端,屬于圖像分類檢測(cè)技術(shù)領(lǐng)域;方法包括:輸入多個(gè)訓(xùn)練樣本并反復(fù)訓(xùn)練得到一級(jí)聯(lián)分類模型的分類參數(shù);根據(jù)分類參數(shù)在需要檢測(cè)的圖像上篩選出多個(gè)經(jīng)過(guò)排序的候選窗口;訓(xùn)練生成相應(yīng)的卷積神經(jīng)網(wǎng)絡(luò)模型,并采用卷積神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練形成相應(yīng)的分類器;根據(jù)訓(xùn)練完成的分類器對(duì)經(jīng)過(guò)排序的所有候選窗口進(jìn)行檢測(cè),以得到目標(biāo)檢測(cè)的輸出結(jié)果。裝置包括:第一訓(xùn)練單元、篩選單元、第二訓(xùn)練單元以及檢測(cè)單元。上述技術(shù)方案的有益效果是:減少窗口獲取的數(shù)據(jù)計(jì)算量,提升窗口獲取的檢測(cè)效率使得目標(biāo)檢測(cè)算法更簡(jiǎn)潔更高效,并且提升目標(biāo)檢測(cè)所針對(duì)目標(biāo)的泛化性,使得目標(biāo)檢測(cè)適用于移動(dòng)終端。
【專利說(shuō)明】
-種目標(biāo)檢測(cè)方法及裝置從及移動(dòng)終端
技術(shù)領(lǐng)域
[0001] 本發(fā)明設(shè)及圖像分類檢測(cè)技術(shù)領(lǐng)域,尤其設(shè)及一種目標(biāo)檢測(cè)方法及裝置W及移動(dòng) 終端。
【背景技術(shù)】
[0002] 目標(biāo)檢測(cè)是一項(xiàng)設(shè)及計(jì)算機(jī)視覺(jué)和圖像處理的重要技術(shù),其主要目的是在圖像和 視頻中檢測(cè)出某些類別(例如人類、建筑、車(chē)輛等)的目標(biāo)實(shí)例。目標(biāo)檢測(cè)技術(shù)目前應(yīng)用于 圖像檢索、視頻監(jiān)控W及人機(jī)交互領(lǐng)域。
[0003] 現(xiàn)有的目標(biāo)檢測(cè)技術(shù),通常存在較大的局限性,并且由于采用滑動(dòng)窗口檢測(cè)方法, 使得需要檢測(cè)和計(jì)算的數(shù)據(jù)量較大,從而導(dǎo)致計(jì)算復(fù)雜度增加,降低檢測(cè)效率。
【發(fā)明內(nèi)容】
[0004] 根據(jù)現(xiàn)有技術(shù)中存在的問(wèn)題,現(xiàn)提供一種目標(biāo)檢測(cè)方法及裝置W及移動(dòng)終端的技 術(shù)方案,旨在現(xiàn)有技術(shù)中目標(biāo)檢測(cè)局限性較大,計(jì)算量較大,計(jì)算模型尚不夠完善的缺陷。 陽(yáng)0化]上述技術(shù)方案具體包括:
[0006] 一種目標(biāo)檢測(cè)方法,適用于移動(dòng)終端;其中,其特征在于:
[0007] 輸入多個(gè)訓(xùn)練樣本并反復(fù)訓(xùn)練得到一級(jí)聯(lián)分類模型的分類參數(shù);
[0008] 訓(xùn)練生成相應(yīng)的卷積神經(jīng)網(wǎng)絡(luò)模型,并采用所述卷積神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練形成相應(yīng) 的分類器;
[0009] 所述目標(biāo)檢測(cè)方法包括:
[0010] 根據(jù)所述分類參數(shù)在需要檢測(cè)的圖像上篩選出多個(gè)經(jīng)過(guò)排序的候選窗口;
[0011] 根據(jù)訓(xùn)練完成的所述分類器對(duì)經(jīng)過(guò)排序的所有所述候選窗口進(jìn)行檢測(cè),W得到目 標(biāo)檢測(cè)的輸出結(jié)果。
[0012] 優(yōu)選的,該目標(biāo)檢測(cè)分類方法,其中,通過(guò)訓(xùn)練得到所述分類參數(shù)的過(guò)程具體包 括:
[0013] 步驟Sla,輸入多個(gè)所述訓(xùn)練樣本,并提取每個(gè)所述訓(xùn)練樣本的范數(shù)梯度特征;
[0014] 步驟S2a,分別計(jì)算得到每個(gè)所述范數(shù)梯度特征的響應(yīng)值,并進(jìn)行統(tǒng)計(jì)計(jì)算,作為 所述分類參數(shù)輸出。
[0015] 優(yōu)選的,該目標(biāo)檢測(cè)方法,其中,所述步驟Sla具體包括:
[0016] 步驟S1 la,將輸入的所有所述訓(xùn)練樣本縮放至統(tǒng)一尺度;
[0017] 步驟S12a,獲取每個(gè)所述訓(xùn)練樣本的范數(shù)梯度特征;
[0018] 優(yōu)選的,該目標(biāo)檢測(cè)方法,其中,所述步驟S12a中,首先采用一預(yù)定的濾波模板分 別對(duì)每個(gè)所述訓(xùn)練樣本進(jìn)行濾波,W計(jì)算得到對(duì)應(yīng)于每個(gè)所述訓(xùn)練樣本X軸方向的梯度圖 像的,W及對(duì)應(yīng)于每個(gè)所述訓(xùn)練樣本y軸方向的梯度圖像Gy;
[0019] 隨后W下述公式計(jì)算每個(gè)所述訓(xùn)練樣本的范數(shù)梯度特征: 陽(yáng)020] Gn"m=min(|Gj + |Gy|,25W; 陽(yáng)02U 其中,
[0022] 為對(duì)應(yīng)所述訓(xùn)練樣本的所述范數(shù)梯度特征的通項(xiàng)變量表示。
[0023] 優(yōu)選的,該目標(biāo)檢測(cè)方法,其中,采用一預(yù)定的濾波模板分別對(duì)每個(gè)所述訓(xùn)練樣本 進(jìn)行濾波包括:
[0024] 采用一維中屯、濾波模板P = [-1,0, 1]分別對(duì)所述訓(xùn)練樣本進(jìn)行濾波,W及 [00巧]采用模板P的轉(zhuǎn)置ρΤ作為濾波模板分別對(duì)所述訓(xùn)練樣本進(jìn)行濾波。
[0026] 優(yōu)選的,該目標(biāo)檢測(cè)方法,其中,所述步驟S2a具體包括:
[0027] 步驟S21a,采用第一層的線性支持向量機(jī)提取所述范數(shù)梯度特征的第一響應(yīng)值;
[0028] Sl=<Wi,Gl>;
[0029] 其中,
[0030] 或表示所述第一響應(yīng)值,W 1表示第一層的所述線性支持向量機(jī)經(jīng)過(guò)學(xué)習(xí)后得到的 參數(shù),G,表示對(duì)應(yīng)一預(yù)定的所述訓(xùn)練樣本,下標(biāo)L表示所述訓(xùn)練樣本于相應(yīng)的圖像上的位 置;
[0031] 步驟S22a,對(duì)所述第一響應(yīng)值進(jìn)行非極值抑制處理;
[0032] 步驟S23a,采用第二層的線性支持向量機(jī)對(duì)經(jīng)過(guò)非極值抑制處理的所述第一響應(yīng) 值進(jìn)行調(diào)整,W得到所述響應(yīng)值: 陽(yáng) 03引 CL=aq.SL+bq;
[0034] 其中,
[0035] C茂示所述第一響應(yīng)值經(jīng)過(guò)調(diào)整后得到的所述響應(yīng)值,W2= <aq,bq>表示第二層 的所述線性支持向量機(jī)經(jīng)過(guò)學(xué)習(xí)后得到的參數(shù);
[0036] 提取所有所述訓(xùn)練樣本對(duì)應(yīng)的所述第一響應(yīng)值W及相應(yīng)的所述響應(yīng)值,并做反復(fù) 計(jì)算和統(tǒng)計(jì),W訓(xùn)練得到最終的所述第一響應(yīng)值和相應(yīng)的所述響應(yīng)值;
[0037] 所述分類參數(shù)包括第一層的所述線性支持向量機(jī)的參數(shù)Wi、第二層的所述線性支 持向量機(jī)的參數(shù)W2、所述第一響應(yīng)值或W及所述響應(yīng)值C ^
[0038] 優(yōu)選的,該目標(biāo)檢測(cè)方法,其中,所述步驟S22a中,使用累計(jì)直方圖對(duì)所述第一響 應(yīng)值進(jìn)行非極值抑制處理。
[0039] 優(yōu)選的,該目標(biāo)檢測(cè)方法,其中,所述分類參數(shù)包括第一層的線性支持向量機(jī)的參 數(shù)Wi,W及根據(jù)對(duì)應(yīng)于范數(shù)梯度特征的第一響應(yīng)值經(jīng)過(guò)調(diào)整得到的響應(yīng)值
[0040] 獲得用于表示每個(gè)所述訓(xùn)練樣本縮放前的尺度和橫縱比的量化參數(shù),所述量化參 數(shù)具有預(yù)設(shè)的取值范圍;
[0041] 根據(jù)所述分類參數(shù)在需要檢測(cè)的圖像上篩選出多個(gè)經(jīng)過(guò)排序的候選窗口的過(guò)程 具體包括:
[00創(chuàng)步驟Slb,根據(jù)所述量化參數(shù),將需要檢測(cè)的圖像進(jìn)行縮放,W得到縮放尺度處于 所述取值范圍內(nèi)的多幅縮放圖像;
[0043] 步驟S2b,提取每幅所述縮放圖像的范數(shù)梯度特征,將每個(gè)所述范數(shù)梯度特征與第 一層的支持向量機(jī)的參數(shù)Wi進(jìn)行卷積計(jì)算,W得到對(duì)應(yīng)于每幅所述縮放圖像的匹配響應(yīng) 圖; W44] 步驟S3b,在所述匹配響應(yīng)圖上執(zhí)行非極值抑制處理,W得到對(duì)應(yīng)的所述縮放圖像 上能夠保留的窗口的最大數(shù);
[0045] 步驟S4b,于每個(gè)所述縮放尺度上獲取相應(yīng)的所述縮放圖像上的數(shù)量不多于所述 最大數(shù)的多個(gè)窗口;
[0046] 步驟S5b,根據(jù)所述響應(yīng)值從大到小對(duì)需要檢測(cè)的圖像上的所有所述窗口進(jìn)行排 序,選取預(yù)定數(shù)量的多個(gè)排序在前的所述窗口作為需要檢測(cè)的圖像上的候選窗口并保留。
[0047] 優(yōu)選的,該目標(biāo)檢測(cè)方法,其中,訓(xùn)練生成相應(yīng)的卷積神經(jīng)網(wǎng)絡(luò)模型的過(guò)程具體包 括:
[0048] 步驟Slc,構(gòu)建一個(gè)初始的所述卷積神經(jīng)網(wǎng)絡(luò)模型;
[0049] 步驟S2c,使用稀疏自編碼方法訓(xùn)練得到所述卷積神經(jīng)網(wǎng)絡(luò)模型的權(quán)重參數(shù)和偏 置參數(shù);
[0050] 步驟S3c,繼續(xù)訓(xùn)練得到所述卷積神經(jīng)網(wǎng)絡(luò)模型的其他參數(shù),W構(gòu)成訓(xùn)練完畢的所 述卷積神經(jīng)網(wǎng)絡(luò)模型。
[0051] 優(yōu)選的,該目標(biāo)檢測(cè)方法,其中,所述步驟S2c具體包括:
[0052] 步驟S21C,輸入多個(gè)所述訓(xùn)練樣本,并對(duì)輸入數(shù)據(jù)進(jìn)行白化處理;
[0053] 步驟S22C,根據(jù)經(jīng)過(guò)白化處理的所述輸入數(shù)據(jù)進(jìn)行稀疏自編碼處理,W訓(xùn)練得到 相應(yīng)的所述權(quán)重參數(shù)和所述偏置參數(shù)。
[0054] 優(yōu)選的,該目標(biāo)檢測(cè)方法,其中,所述步驟S21C中,對(duì)所述輸入數(shù)據(jù)進(jìn)行白化處理 的方式具體包括: 陽(yáng)化5] 步驟S211C,采用下述公式對(duì)所述輸入數(shù)據(jù)進(jìn)行主成分分析白化處理:
[0056]
[0057] 其中,
[005引 XpcAwhit。表示經(jīng)過(guò)所述主成分分析白化處理后的所述輸入數(shù)據(jù);
[0059] U表示奇異值分解獲得的正交矩陣,相應(yīng)地護(hù)表示U矩陣的轉(zhuǎn)置矩陣;
[0060] λ表示奇異值分解獲得的對(duì)角矩陣;
[0061] ε表示正則化常數(shù);
[0062] 步驟S212C,采用下述公式,在主成分分析白化處理后,繼續(xù)對(duì)所述輸入數(shù)據(jù)進(jìn)行 白化處理:
[0063] XzCA_white -化 P心white;
[0064] 其中,
[00化]XzcA^hit。表示于主成分分析白化處理的基礎(chǔ)上,繼續(xù)進(jìn)行白化處理后得到的所述 輸入數(shù)據(jù)。
[0066] 優(yōu)選的,該目標(biāo)檢測(cè)方法,其中,所述卷積神經(jīng)網(wǎng)絡(luò)中包括第一層的輸入節(jié)點(diǎn)、第 二層的隱藏節(jié)點(diǎn)W及第Ξ層的輸出節(jié)點(diǎn),所述輸入節(jié)點(diǎn)連接所述隱藏節(jié)點(diǎn),所述隱藏節(jié)點(diǎn) 連接所述輸出節(jié)點(diǎn);
[0067] 所述卷積神經(jīng)網(wǎng)絡(luò)的總體代價(jià)函數(shù)如下:
[0069]共中,
[0068]
[0070] J(W,b)為經(jīng)典神經(jīng)網(wǎng)絡(luò)中的基本代價(jià)函數(shù);
[0071] β表示控制稀疏性懲罰因子的權(quán)重;
[0072] S2表示所述隱藏節(jié)點(diǎn)的數(shù)量; 陽(yáng)〇7引 化(戶Μ A)為相對(duì)賭;
[0074] P為稀疏性參數(shù);
[00巧]^表示所述隱藏節(jié)點(diǎn)的平均活躍度;
[0076] W表示所述權(quán)重參數(shù),b表示所述偏置參數(shù);
[0077] 所述步驟S22C中,訓(xùn)練得到使上述總體代價(jià)函數(shù)的代價(jià)最小的相應(yīng)的所述權(quán)重 參數(shù)W及偏置參數(shù)。
[007引優(yōu)選的,該目標(biāo)檢測(cè)方法,其中,W根據(jù)所述稀疏自編碼方法計(jì)算輸出的所述權(quán)重 參數(shù)和所述偏置參數(shù)作為輸入,采用所述稀疏自編碼方法多次迭代計(jì)算輸出最終的所述權(quán) 重參數(shù)和所述偏置參數(shù)。
[0079] 優(yōu)選的,該目標(biāo)檢測(cè)方法,其中,所述步驟S3c具體包括:
[0080] 步驟S31C,將輸入的所述訓(xùn)練樣本分別與所述步驟S2c中輸出的對(duì)應(yīng)每個(gè)所述隱 藏節(jié)點(diǎn)的所述權(quán)重參數(shù)進(jìn)行卷積操作,W輸出對(duì)應(yīng)于每個(gè)所述隱藏節(jié)點(diǎn)的卷積特征圖像:
[0081] I_ConVi= I convolution 化 W_Sparse i) I ; 陽(yáng)0間其中,
[0083] I_Conv康示輸入的一預(yù)定的訓(xùn)練樣本I與第i個(gè)隱藏節(jié)點(diǎn)的權(quán)重參數(shù)¥_59曰'36 i 進(jìn)行卷積操作后得到的卷積特征圖像;
[0084] convolution表示卷積計(jì)算;
[00化]步驟S32C,對(duì)所述卷積特征圖像進(jìn)行池化操作,W提取相應(yīng)的特征值;
[0086] 步驟S33C,根據(jù)所述特征值,訓(xùn)練一相應(yīng)的分類器,W供后續(xù)進(jìn)行目標(biāo)檢測(cè)使用:
陽(yáng)0蝴 其中,
[0089] m表示特征值的數(shù)量,η表示特征值的維數(shù),k表示對(duì)圖像進(jìn)行分類的類別數(shù)量, xW表示第i個(gè)特征值,y W表示第i個(gè)特征值的標(biāo)注,λ表示權(quán)重衰減項(xiàng),Θ表示需要訓(xùn) 練的所述分類器的參數(shù);
[0090] 通過(guò)訓(xùn)練得到使得所述步驟S33C中的公式的總體代價(jià)最小的所述分類器的參數(shù) 并輸出。
[0091] 優(yōu)選的,該目標(biāo)檢測(cè)方法,其中,W所述步驟S33C中輸出的所述分類器的參數(shù)作 為輸入,采用所述步驟S33C中的的公式多次迭代計(jì)算,W得到最終的所述分類器的參數(shù)。
[0092] 優(yōu)選的,該目標(biāo)檢測(cè)方法,其中,根據(jù)訓(xùn)練完成的所述分類器對(duì)經(jīng)過(guò)排序的所有所 述候選窗口進(jìn)行處理的過(guò)程具體包括:
[0093] 步驟Sld,將所有所述候選窗口縮放至統(tǒng)一的尺度和橫縱比;
[0094] 步驟S2d,對(duì)每個(gè)經(jīng)過(guò)縮放后的所述候選窗口,根據(jù)訓(xùn)練完成的所述卷積神經(jīng)網(wǎng) 絡(luò)參數(shù)計(jì)算相應(yīng)的卷積特征圖像,并進(jìn)行池化操作,w獲得對(duì)應(yīng)每個(gè)所述候選窗口的特征 值;
[0095] 步驟S3d,根據(jù)訓(xùn)練完成的所述分類器的參數(shù),分別對(duì)每個(gè)所述特征值進(jìn)行分類, W確定每個(gè)所述特征值對(duì)應(yīng)的分類標(biāo)簽;
[0096] 步驟S4d,捜索并選中預(yù)設(shè)的所述分類標(biāo)簽對(duì)應(yīng)的所述候選窗口,作為本次目標(biāo)檢 測(cè)的輸出結(jié)果。
[0097] 優(yōu)選的,該目標(biāo)檢測(cè)方法,其中,執(zhí)行所述步驟S4d時(shí),在一次捜索和選擇的結(jié)果 上進(jìn)行預(yù)定次數(shù)的迭代捜索和選擇;
[0098] 每次迭代捜索和選擇的過(guò)程具體包括:
[0099] 步驟S41d,W被選中的候選窗口為中屯、,在具有預(yù)定的鄰域半徑的捜索范圍內(nèi)捜 索新的候選窗口;
[0100] 步驟S42d,比較捜索到的新的候選窗口的似然度與被選中的候選窗口的似然度, 并在新的候選窗口的似然度大于被選中的候選窗口的似然度,則改為選中新的候選窗口; 陽(yáng)101] 下一次迭代捜索和選擇的過(guò)程中,所依據(jù)的預(yù)定的鄰域半徑相對(duì)于上一次迭代捜 索和選擇遞減。 陽(yáng)102] -種目標(biāo)檢測(cè)裝置,適用于移動(dòng)終端;其中,包括: 陽(yáng)103] 第一訓(xùn)練單元,用于根據(jù)外部輸入的多個(gè)訓(xùn)練樣本反復(fù)訓(xùn)練得到一級(jí)聯(lián)分類模型 的分類參數(shù).
[0104] 篩選單元,連接所述第一訓(xùn)練單元,用于根據(jù)所述分類參數(shù)在需要檢測(cè)的圖像上 篩選出多個(gè)經(jīng)過(guò)排序的候選窗口;
[01化]第二訓(xùn)練單元,用于采用稀疏自編碼的方法訓(xùn)練生成相應(yīng)的卷積神經(jīng)網(wǎng)絡(luò)模型, 并采用所述卷積神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練形成相應(yīng)的分類器;
[0106] 檢測(cè)單元,分別連接所述篩選單元和所述第二訓(xùn)練單元,用于根據(jù)訓(xùn)練完成的所 述分類器對(duì)經(jīng)過(guò)排序的所有所述候選窗口進(jìn)行檢測(cè),W得到目標(biāo)檢測(cè)的輸出結(jié)果。 陽(yáng)107] -種移動(dòng)終端,其中,采用上述的目標(biāo)檢測(cè)方法。 陽(yáng)10引一種移動(dòng)終端,其中,包括上述的目標(biāo)檢測(cè)裝置。
[0109] 上述技術(shù)方案的有益效果是:
[0110] 1)采用目標(biāo)性評(píng)估的方法(包括訓(xùn)練級(jí)聯(lián)分類模型W及采用級(jí)聯(lián)分類模型對(duì)候 選窗口進(jìn)行排序)作為初始化,減少窗口獲取的數(shù)據(jù)計(jì)算量,提升窗口獲取的檢測(cè)效率,使 得目標(biāo)檢測(cè)適用于移動(dòng)終端; 陽(yáng)111 ] 2)采用訓(xùn)練好的卷積神經(jīng)網(wǎng)絡(luò)模型和分類器對(duì)候選窗口中的圖像進(jìn)行分類,使得 目標(biāo)檢測(cè)算法更簡(jiǎn)潔更高效,并且提升目標(biāo)檢測(cè)所針對(duì)目標(biāo)的泛化性,使得目標(biāo)檢測(cè)適用 于移動(dòng)終端。
【附圖說(shuō)明】
[0112] 圖1-10是本發(fā)明的較佳的實(shí)施例中,目標(biāo)檢測(cè)方法的具體流程示意圖;
[0113] 圖11是本發(fā)明的較佳的實(shí)施例中,卷積神經(jīng)網(wǎng)絡(luò)模型的示意圖;
[0114] 圖12是本發(fā)明的較佳的實(shí)施例中,對(duì)候選窗口進(jìn)行微調(diào)處理的示意圖;
[0115] 圖13是本發(fā)明的較佳的實(shí)施例中,一種目標(biāo)檢測(cè)裝置的結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0116] 下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完 整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;?本發(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒(méi)有作出創(chuàng)造性勞動(dòng)的前提下所獲得的所有其 他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
[0117] 需要說(shuō)明的是,在不沖突的情況下,本發(fā)明中的實(shí)施例及實(shí)施例中的特征可W相 互組合。
[0118] 下面結(jié)合附圖和具體實(shí)施例對(duì)本發(fā)明作進(jìn)一步說(shuō)明,但不作為本發(fā)明的限定。
[0119] 現(xiàn)有的目標(biāo)檢測(cè)技術(shù)中,通常采用W下幾種計(jì)算模型實(shí)現(xiàn):
[0120] 1.自提升級(jí)聯(lián)模型(AdaBoost Cascaded Model),主要和哈爾(Haar)特征一起應(yīng) 用于人臉檢測(cè)領(lǐng)域(Face Detection)。該方案使用簡(jiǎn)單的哈爾特征學(xué)習(xí)許多簡(jiǎn)單的弱分類 器(Weak Classifier),在訓(xùn)練階段不斷調(diào)整被錯(cuò)誤分類樣本的權(quán)重,最后通過(guò)加權(quán)平均來(lái) 獲得最終分類器。在實(shí)際檢測(cè)時(shí)采用級(jí)聯(lián)結(jié)構(gòu),每一層濾掉大部分非人臉候選,同時(shí)讓大部 分人臉候選通過(guò),從而加速檢測(cè)。 陽(yáng)121 ] 上述哈爾特征和自提升級(jí)聯(lián)模型目前主要用于人臉檢測(cè)中,而在其他類別的目標(biāo) 檢測(cè)中的表現(xiàn)未必最好,因此具有一定的局限性。
[0122] 2.支持向量機(jī)(Supprot Vector Machine, SVM),主要和梯度方向直方圖 化istogram ofOriented Gradients, HOG)特征一起應(yīng)用于行人檢測(cè)任edestrian Detection)領(lǐng)域。該方案計(jì)算稠密的梯度方向特征,使用簡(jiǎn)單的線性SVM對(duì)高維的冊(cè)G描 述子進(jìn)行分類就能取得很好的效果。
[0123] 上述HOG特征和SVM分類器所實(shí)現(xiàn)的行人檢測(cè)器主要采用傳統(tǒng)的滑動(dòng)窗口方法對(duì) 圖像做多尺度上的遍歷檢測(cè)。相比人類的視覺(jué)系統(tǒng),上述方法非常耗時(shí),數(shù)據(jù)計(jì)算量極大。
[0124] 3.基于部件的變形模型值eform油le Part-based Model, DPM),可W實(shí)現(xiàn)對(duì)泛化 目標(biāo)(Generalization化ject)的檢測(cè)和識(shí)別。在多類目標(biāo)檢測(cè)領(lǐng)域,通常的做法是把HOG 特征融入DPM模型。部件在整體模型下的兩層金字塔進(jìn)行訓(xùn)練和檢測(cè),將部件相對(duì)位置和 整體位置視為隱變量,使用隱形SVM化atent-SVM)完成半監(jiān)督學(xué)習(xí)。運(yùn)是目前最好的多類 目標(biāo)檢測(cè)方法之一。
[01巧]上述基于DPM模型和HOG特征的泛化檢測(cè)器同樣存在計(jì)算量較大的問(wèn)題。而且,現(xiàn) 有技術(shù)中構(gòu)建的上述模型還不完善,其中檢測(cè)到的結(jié)果遠(yuǎn)低于人類視覺(jué)系統(tǒng)的檢測(cè)水平。 陽(yáng)126] 因此,上述多個(gè)問(wèn)題使得現(xiàn)有的目標(biāo)檢測(cè)過(guò)程很難適用于移動(dòng)終端。
[0127] 基于現(xiàn)有技術(shù)中存在的上述問(wèn)題,現(xiàn)提供一種可適用于移動(dòng)終端的目標(biāo)檢測(cè)方 法。
[0128] 本發(fā)明的較佳的實(shí)施例中,上述目標(biāo)檢測(cè)方法包括多個(gè)步驟,下文對(duì)每個(gè)步驟均 進(jìn)行一一說(shuō)明。
[0129] 本發(fā)明的較佳的實(shí)施例中,首先進(jìn)行目標(biāo)性評(píng)估的bjectness Estimation)。
[0130] 本發(fā)明的較佳的實(shí)施例中,目標(biāo)性評(píng)估的過(guò)程總體分為兩步:訓(xùn)練級(jí)聯(lián)分類模型, W及在測(cè)試圖像上篩選候選窗口W用于后續(xù)的檢測(cè)任務(wù)。 陽(yáng)131] 本發(fā)明的較佳的實(shí)施例中,首先,在執(zhí)行目標(biāo)檢測(cè)方法之前,需要輸入多個(gè)訓(xùn)練樣 本并反復(fù)訓(xùn)練得到一級(jí)聯(lián)分類模型的分類參數(shù);下文中介紹輸入多個(gè)訓(xùn)練樣本并反復(fù)訓(xùn)練 得到一級(jí)聯(lián)分類模型的分類參數(shù)的過(guò)程。
[0132] 本發(fā)明的較佳的實(shí)施例中,上述訓(xùn)練樣本為圖像上隨意指定并輸入的樣本,可W 看做是圖像上一個(gè)窗口中包括的圖像數(shù)據(jù)。
[0133] 本發(fā)明的較佳的實(shí)施例中,訓(xùn)練樣本可W被區(qū)分為正樣本和負(fù)樣本。所謂正樣本 即為使系統(tǒng)得出正確結(jié)論的樣本,在本發(fā)明的較佳的實(shí)施例中即為目標(biāo)樣本,例如人臉識(shí) 別樣本、建筑物識(shí)別樣本W(wǎng)及車(chē)輛識(shí)別樣本等。所謂負(fù)樣本,是指使系統(tǒng)得出錯(cuò)誤結(jié)論的樣 本,在本發(fā)明的較佳的實(shí)施例中即為隨機(jī)選取的背景樣本。本發(fā)明的較佳的實(shí)施例中,將隨 機(jī)選取的訓(xùn)練樣本(無(wú)論正樣本或是負(fù)樣本)輸入至系統(tǒng)中,并進(jìn)行反復(fù)訓(xùn)練,最終得到級(jí) 聯(lián)分類模型,即得到該模型的分類參數(shù)。
[0134] 本發(fā)明的較佳的實(shí)施例中,如圖1所示,上述過(guò)程具體包括:
[0135] 步驟Sla,輸入多個(gè)訓(xùn)練樣本,并提取每個(gè)訓(xùn)練樣本的范數(shù)梯度特征;
[0136] 本發(fā)明的較佳的實(shí)施例中,采用范數(shù)梯度特征(Normed Gradient,NG)來(lái)區(qū)別正樣 本或者負(fù)樣本。此類特征的優(yōu)點(diǎn)是具有平移、尺度W及橫縱比的不變形,適用于進(jìn)行類別無(wú) 關(guān)的目標(biāo)檢測(cè)。同時(shí)運(yùn)類特征的計(jì)算效率較高,易于實(shí)時(shí)運(yùn)算和匯編優(yōu)化。
[0137] 本發(fā)明的較佳的實(shí)施例中,如圖2所示,上述步驟Sla具體包括:
[013引步驟S1 la,將輸入的所有訓(xùn)練樣本縮放至統(tǒng)一尺度;
[0139] 本發(fā)明的較佳的實(shí)施例中,在進(jìn)行訓(xùn)練之前,首先將輸入的所有訓(xùn)練樣本進(jìn)行縮 放,縮放尺度相同,例如將所有訓(xùn)練樣本縮放至M*N的大小,其中Μ為縮放后圖像的寬,N為 縮放后圖像的高。上述縮放尺度可W根據(jù)訓(xùn)練效果和計(jì)算效率進(jìn)行權(quán)衡和調(diào)整。
[0140] 本發(fā)明的較佳的實(shí)施例中,在進(jìn)行縮放前,保留每個(gè)訓(xùn)練樣本的量化參數(shù)q。本發(fā) 明的較佳的實(shí)施例中,上述量化參數(shù)q用于表示相應(yīng)的訓(xùn)練樣本縮放前的尺度(Scale)和 橫縱比(Aspect Ratios)。進(jìn)一步地,本發(fā)明的較佳的實(shí)施例中,上述量化參數(shù)q為相應(yīng)的 訓(xùn)練樣本進(jìn)行縮放前的尺度和橫縱比的編碼值。 陽(yáng)141] 步驟S12a,獲取每個(gè)訓(xùn)練樣本的范數(shù)梯度特征。 陽(yáng)142] 本發(fā)明的較佳的實(shí)施例中,上述步驟S12a中,首先采用一預(yù)定的濾波模板分別對(duì) 每個(gè)訓(xùn)練樣本進(jìn)行濾波,W計(jì)算得到對(duì)應(yīng)于每個(gè)訓(xùn)練樣本X軸方向的梯度圖像的,W及對(duì)應(yīng) 于每個(gè)訓(xùn)練樣本y軸方向的梯度圖像Gy; 陽(yáng)143] 本發(fā)明的較佳的實(shí)施例中,上述預(yù)定的濾波模板,可W為:
[0144] 采用一維中心濾波模板P = [-1,0, 1]分別對(duì)訓(xùn)練樣本進(jìn)行濾波,W及
[0145] 采用模板P的轉(zhuǎn)置ρτ作為濾波模板分別對(duì)訓(xùn)練樣本進(jìn)行濾波。 陽(yáng)146] 本發(fā)明的較佳的實(shí)施例中,濾波模板Ρ = [-1,0, 1],是指W當(dāng)前檢測(cè)的像素點(diǎn)為 中屯、點(diǎn)(0位),W該像素點(diǎn)前一個(gè)像素點(diǎn)(-1位)W及該像素點(diǎn)后一個(gè)像素點(diǎn)(1位)為參 照對(duì)當(dāng)前檢測(cè)的像素點(diǎn)進(jìn)行濾波; 陽(yáng)147] 本發(fā)明的較佳的實(shí)施例中,相應(yīng)地,濾波模板
是指W當(dāng)前檢測(cè)的像 素點(diǎn)為中屯、點(diǎn)(0位),W該像素點(diǎn)上一個(gè)像素點(diǎn)(-1位)W及該像素點(diǎn)下一個(gè)像素點(diǎn)(1 位)為參照對(duì)當(dāng)前檢測(cè)的像素點(diǎn)進(jìn)行濾波。
[0148] 隨后,本發(fā)明的較佳的實(shí)施例中,W下述公式計(jì)算每個(gè)訓(xùn)練樣本的范數(shù)梯度特 征:
[0149] Gn"m=min(|Gj + |Gy|,25W; (1) 陽(yáng)150] 其中,
[0151] 為對(duì)應(yīng)訓(xùn)練樣本的范數(shù)梯度特征的通項(xiàng)變量表示。 陽(yáng)152] 步驟S2a,分別計(jì)算得到每個(gè)范數(shù)梯度特征的響應(yīng)值,并進(jìn)行統(tǒng)計(jì)計(jì)算,作為分類 參數(shù)輸出。 陽(yáng)153] 本發(fā)明的較佳的實(shí)施例中,如圖3所示,上述步驟S2a具體包括:
[0154] 步驟S21a,采用第一層的線性支持向量機(jī)提取范數(shù)梯度特征的第一響應(yīng)值;
[0155] 本發(fā)明的較佳的實(shí)施例中,提取上述范數(shù)梯度特征之后,使用兩層的級(jí)聯(lián)支持向 量機(jī)(Cascaded SVM)對(duì)訓(xùn)練樣本進(jìn)行分類。
[0156] 本發(fā)明的較佳的實(shí)施例中,如上文所述,首先在第一層使用線性支持向量機(jī) (Linear SVM)計(jì)算范數(shù)梯度特征的響應(yīng)值: 陽(yáng) 157] Sl=<Wi,Gl>; (2) 陽(yáng)15引其中,
[0159] 或表示第一響應(yīng)值,Wi表示第一層的線性支持向量機(jī)經(jīng)過(guò)學(xué)習(xí)后得到的參數(shù),Gt 表示對(duì)應(yīng)一預(yù)定的訓(xùn)練樣本,下標(biāo)L表示訓(xùn)練樣本于相應(yīng)的圖像上的位置。
[0160] 步驟S22a,對(duì)第一響應(yīng)值進(jìn)行非極值抑制處理; 陽(yáng)161] 本發(fā)明的較佳的實(shí)施例中,步驟S22a中所述的非極值抑制處理,實(shí)際為非極大值 抑制處理。
[0162] 現(xiàn)有技術(shù)中,普通的非極值抑制方法需要一個(gè)排序的預(yù)處理過(guò)程,而在目標(biāo)檢測(cè) 過(guò)程中,需要處理的數(shù)據(jù)量較大,即便使用平均復(fù)雜度較低的快速排序方法(如ick Sort) 也無(wú)法將數(shù)據(jù)處理量降低到一個(gè)比較適合的程度。為此,本發(fā)明的較佳的實(shí)施例中,采用了 累積直方圖(Cumulate Histogram)來(lái)替代快速排序,可W將運(yùn)一部分的平均算法復(fù)雜度從 0(nlog η)降低到 0(n)。 陽(yáng)163] 步驟S23a,采用第二層的線性支持向量機(jī)對(duì)經(jīng)過(guò)非極值抑制處理的第一響應(yīng)值進(jìn) 行調(diào)整,W得到響應(yīng)值:
[0164] 本發(fā)明的較佳的實(shí)施例中,第二層同樣采用線性支持向量機(jī)進(jìn)行分類。該分類所 依據(jù)的特征是上一層線性支持向量機(jī),分類的類別即為上文中所述的被保留的量化參數(shù)q。 因此,本發(fā)明的較佳的實(shí)施例中,W下文中所述的公式進(jìn)行第二層的分類處理: 陽(yáng) 1 化]CL=aq'SL+bq; 0) 陽(yáng)166] 其中, 陽(yáng)167] (:^表示所述第一響應(yīng)值經(jīng)過(guò)調(diào)整后得到的所述響應(yīng)值,W2= <曰。,6?!当硎镜诙?的所述線性支持向量機(jī)經(jīng)過(guò)學(xué)習(xí)后得到的參數(shù);則如上文中所述,aq,bq表示對(duì)應(yīng)量化參數(shù) 為q的訓(xùn)練樣本的參數(shù)。
[0168] 本發(fā)明的較佳的實(shí)施例中,上述過(guò)程可W反復(fù)進(jìn)行,即根據(jù)每個(gè)訓(xùn)練樣本均進(jìn)行 第一響應(yīng)值W及響應(yīng)值的計(jì)算,經(jīng)過(guò)迭代統(tǒng)計(jì)和反復(fù)訓(xùn)練,最終得到可W被輸出的第一響 應(yīng)值W及響應(yīng)值。
[0169] 本發(fā)明的較佳的實(shí)施例中,上述分類參數(shù)包括第一層的線性支持向量機(jī)的參數(shù) Wi、第二層的線性支持向量機(jī)的參數(shù)W2、第一響應(yīng)值S山及響應(yīng)值C ^
[0170] 本發(fā)明的較佳的實(shí)施例中,在訓(xùn)練形成級(jí)聯(lián)分類模型的分類參數(shù)后,根據(jù)分類參 數(shù)在需要檢測(cè)的圖像上篩選出多個(gè)經(jīng)過(guò)排序的候選窗口,上述過(guò)程即屬于目標(biāo)檢測(cè)方法中 的一部分,其步驟如圖4所示,具體包括: 陽(yáng)171] 步驟S化,根據(jù)量化參數(shù),將需要檢測(cè)的圖像進(jìn)行縮放,W得到縮放尺度處于取值 范圍內(nèi)的多幅縮放圖像;
[0172] 本發(fā)明的較佳的實(shí)施例中,量化參數(shù)q的取值范圍q e [1,閑,即可W得到縮放尺 度處于對(duì)應(yīng)取值范圍1 一 N的范圍內(nèi)的對(duì)應(yīng)需要檢測(cè)的圖像的N幅縮放圖像。 陽(yáng)173] 步驟S2b,提取每幅縮放圖像的范數(shù)梯度特征,將每個(gè)范數(shù)梯度特征與第一層的支 持向量機(jī)的參數(shù)Wi進(jìn)行卷積計(jì)算,W得到對(duì)應(yīng)于每幅縮放圖像的匹配響應(yīng)圖;
[0174] 本發(fā)明的較佳的實(shí)施例中,所謂匹配響應(yīng)圖(Match Response Map),實(shí)際為對(duì)應(yīng) 于每幅縮放圖像的一卷積圖。 陽(yáng)175] 步驟S3b,在匹配響應(yīng)圖上執(zhí)行非極值抑制處理,W得到對(duì)應(yīng)的縮放圖像上能夠保 留的窗口的最大數(shù);
[0176] 本發(fā)明的較佳的實(shí)施例中,在匹配響應(yīng)圖上進(jìn)行非極值抑制處理,獲得不多于F 個(gè)候選匹配點(diǎn),因此也就可W獲得不多于F個(gè)窗口。本發(fā)明的較佳的實(shí)施例中,F(xiàn)即為每一 縮放尺度上縮放圖像保留窗口的最大數(shù)。
[0177] 步驟S4b,于每個(gè)縮放尺度上獲取相應(yīng)的縮放圖像上的數(shù)量不多于最大數(shù)的多個(gè) 窗口;
[017引步驟S5b,根據(jù)響應(yīng)值從大到小對(duì)需要檢測(cè)的圖像上的所有窗口進(jìn)行排序,選取預(yù) 定數(shù)量的多個(gè)排序在前的窗口作為需要檢測(cè)的圖像上的候選窗口并保留。
[0179] 本發(fā)明的較佳的實(shí)施例中,根據(jù)上文中所述的經(jīng)過(guò)訓(xùn)練最終得到的響應(yīng)值C苗f上 述選出的窗口進(jìn)行排序。本發(fā)明的較佳的實(shí)施例中,排序?yàn)閺拇蟮叫∨判颍错憫?yīng)值較大的 候窗口排列在前。
[0180] 本發(fā)明的較佳的實(shí)施例中,根據(jù)排序,選擇預(yù)設(shè)的多個(gè)窗口作為候選窗口并保留。 運(yùn)些候選窗口可W作為后續(xù)目標(biāo)分類的初始化窗口。 陽(yáng)181 ] 本發(fā)明的較佳的實(shí)施例中,上述目標(biāo)性評(píng)估結(jié)束后,可W開(kāi)始進(jìn)行目標(biāo)分類。 陽(yáng)182] 本發(fā)明的較佳的實(shí)施例中,目標(biāo)分類同樣分為兩步:首先,在執(zhí)行上述目標(biāo)檢測(cè)方 法之前,訓(xùn)練生成相應(yīng)的卷積神經(jīng)網(wǎng)絡(luò)模型,并采用卷積神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練形成相應(yīng)的分 類器。 陽(yáng)183] 本發(fā)明的較佳的實(shí)施例中,如圖5所示,上述過(guò)程具體包括: 陽(yáng)184] 步驟Slc,構(gòu)建一個(gè)初始的卷積神經(jīng)網(wǎng)絡(luò)模型;
[0185] 本發(fā)明的較佳的實(shí)施例中,構(gòu)建初始的卷積神經(jīng)網(wǎng)絡(luò)模型,并采用下文中所述的 方法不斷訓(xùn)練該神經(jīng)網(wǎng)絡(luò)模型,W使該神經(jīng)網(wǎng)絡(luò)模型自學(xué)習(xí)并最終訓(xùn)練形成可W被實(shí)際使 用的神經(jīng)網(wǎng)絡(luò)模型。
[0186] 本發(fā)明的較佳的實(shí)施例中,該卷積神經(jīng)網(wǎng)絡(luò)模型的學(xué)習(xí)過(guò)程屬于無(wú)監(jiān)督學(xué)習(xí) (Unsupervised Learning),其形式是學(xué)習(xí)一個(gè)恒等函數(shù): 陽(yáng) 187] F,,b(x)>x; (4)
[0188] 即只有輸入數(shù)據(jù)沒(méi)有設(shè)定期望輸出,全憑神經(jīng)網(wǎng)絡(luò)模型自身的反復(fù)訓(xùn)練和統(tǒng)計(jì)最 終得到正確輸出。
[0189] 本發(fā)明的較佳的實(shí)施例中,如圖11所示,上述卷積神經(jīng)網(wǎng)絡(luò)模型包括Ξ層節(jié)點(diǎn): 第一層為輸入節(jié)點(diǎn)A11-A15,第二層為隱藏節(jié)點(diǎn)A21-A23,第Ξ層為輸出節(jié)點(diǎn)A31-A35。本發(fā) 明的較佳的實(shí)施例中,隱藏節(jié)點(diǎn)A21-A23連接相應(yīng)的輸入節(jié)點(diǎn)A11-A15,輸出節(jié)點(diǎn)A31-A35 連接相應(yīng)的隱藏節(jié)點(diǎn)A21-A23。數(shù)據(jù)從輸入節(jié)點(diǎn)A11-A15輸入,經(jīng)過(guò)隱藏節(jié)點(diǎn)A21-A23,由 輸出節(jié)點(diǎn)A31-A35輸出。
[0190] 本發(fā)明的較佳的實(shí)施例中,在卷積神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練過(guò)程中,采用稀疏自編碼 (Sparse Autoencoder)方法即是對(duì)隱藏節(jié)點(diǎn)加入了稀疏限制,換言之,大部分隱藏節(jié)點(diǎn)處 于被抑制狀態(tài),而只有少部分隱藏節(jié)點(diǎn)處于被激活狀態(tài)。上述方法能夠處理卷積神經(jīng)網(wǎng)絡(luò) 模型中存在較多的隱藏節(jié)點(diǎn)的情況。 陽(yáng)191] 步驟S2c,使用稀疏自編碼方法訓(xùn)練得到卷積神經(jīng)網(wǎng)絡(luò)模型的權(quán)重參數(shù)和偏置參 數(shù); 陽(yáng)192] 本發(fā)明的較佳的實(shí)施例中,如圖6所示,上述步驟S2C具體包括: 陽(yáng)193] 步驟S21C,輸入多個(gè)訓(xùn)練樣本,并對(duì)輸入數(shù)據(jù)進(jìn)行白化處理;
[0194] 本發(fā)明的較佳的實(shí)施例中,如圖7所示,對(duì)輸入數(shù)據(jù)進(jìn)行白化處理的過(guò)程具體包 括: 陽(yáng)195] 步驟S211C,采用下述公式對(duì)輸入數(shù)據(jù)進(jìn)行主成分分析白化處理: 陽(yáng) 196]
(5) 陽(yáng)197] 其中,
[0198] 表示經(jīng)過(guò)主成分分析白化處理后的輸入數(shù)據(jù);
[0199] U表示奇異值分解獲得的正交矩陣,相應(yīng)地護(hù)表示U矩陣的轉(zhuǎn)置矩陣; 陽(yáng)200] λ表示奇異值分解獲得的對(duì)角矩陣; 陽(yáng)201] ε表示正則化常數(shù); 陽(yáng)202] 步驟S212C,采用下述公式,在主成分分析白化處理后,繼續(xù)對(duì)輸入數(shù)據(jù)進(jìn)行白化 處理: 悅〇引 XzCA_ivhite -化 PCA_ivhite;做 陽(yáng)204] 其中, 陽(yáng)205] XzcA_"hit。表示于主成分分析白化處理的基礎(chǔ)上,繼續(xù)進(jìn)行ZCA狂ero-phase ComponentAnalysis,零相位成分分析)白化處理得到的輸入數(shù)據(jù)。 陽(yáng)206] 步驟S22C,根據(jù)經(jīng)過(guò)白化處理的輸入數(shù)據(jù)進(jìn)行稀疏自編碼處理,W訓(xùn)練得到相應(yīng) 的權(quán)重參數(shù)和偏置參數(shù)。 陽(yáng)207] 本發(fā)明的較佳的實(shí)施例中,使用稀疏自編碼方法訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò)模型,其總體 代價(jià)函數(shù)可W表示為下述公式: 悅卿
(7) 陽(yáng)209] 其中,
[0210] J(W,b)為經(jīng)典神經(jīng)網(wǎng)絡(luò)中的基本代價(jià)函數(shù),由于現(xiàn)有技術(shù)中存在很多實(shí)現(xiàn)該基本 代價(jià)函數(shù)的方法,因此在此不再寶述; 陽(yáng)211 ] β表示控制稀疏性懲罰因子的權(quán)重;
[0212] Sz表示隱藏節(jié)點(diǎn)的數(shù)量; 陽(yáng)21引 化(戶I I A.)為相對(duì)賭;
[0214] P為稀疏性參數(shù);
[0215] 表示隱藏節(jié)點(diǎn)的平均活躍度;
[0216] W表示權(quán)重參數(shù)(Wei曲t),b表示偏置參數(shù)度ias);
[0217] 因此,本發(fā)明的較佳的實(shí)施例中,上述步驟S22c中,通過(guò)反復(fù)訓(xùn)練(反復(fù)求導(dǎo)),得 到使上述總體代價(jià)函數(shù)的代價(jià)最小的相應(yīng)的權(quán)重參數(shù)W W及偏置參數(shù)b。
[0218] 本發(fā)明的較佳的實(shí)施例中,在實(shí)際求解時(shí),需要采用梯度下降法。本發(fā)明的較佳的 實(shí)施例中,上述梯度下降法可W選用共輛梯度法,最速下降法,隨機(jī)下降法,牛頓法等等。
[0219] 本發(fā)明的較佳的實(shí)施例中,上述采用稀疏自編碼方法進(jìn)行訓(xùn)練的過(guò)程中,可W選 擇采用找式自編碼(StackedAutoencoder),即W根據(jù)稀疏自編碼方法計(jì)算輸出的權(quán)重參 數(shù)和偏置參數(shù)作為輸入,采用稀疏自編碼方法多次迭代計(jì)算輸出最終的權(quán)重參數(shù)和偏置參 數(shù)。換言之,選用上一層稀疏自編碼學(xué)習(xí)到的特征參數(shù)(權(quán)重參數(shù)和偏置參數(shù))作為輸入 數(shù)據(jù),迭代學(xué)習(xí)更高層的特征參數(shù)。 陽(yáng)220] 本發(fā)明的較佳的實(shí)施例中,學(xué)習(xí)得到特征參數(shù)W_Sparsei (對(duì)應(yīng)第i個(gè)隱藏節(jié)點(diǎn)的 權(quán)重參數(shù))并輸出。 陽(yáng)221] 步驟S3C,繼續(xù)訓(xùn)練得到卷積神經(jīng)網(wǎng)絡(luò)模型的其他參數(shù),W構(gòu)成訓(xùn)練完畢的卷積神 經(jīng)網(wǎng)絡(luò)模型。 陽(yáng)222] 本發(fā)明的較佳的實(shí)施例中,如圖8所示,上述步驟S3C具體包括:
[0223] 步驟S31C,將輸入的訓(xùn)練樣本分別與步驟S2c中輸出的對(duì)應(yīng)每個(gè)隱藏節(jié)點(diǎn)的權(quán)重 參數(shù)進(jìn)行卷積操作,W輸出對(duì)應(yīng)于每個(gè)隱藏節(jié)點(diǎn)的卷積特征圖像: 陽(yáng)224] I_ConVi= I convolution 化 W_Sparse i) I ; (8) 陽(yáng)225] 其中, 陽(yáng)226] I_ConVi表示輸入的一預(yù)定的訓(xùn)練樣本I與第i個(gè)隱藏節(jié)點(diǎn)的權(quán)重參數(shù)胖_59曰'36 i 進(jìn)行卷積操作后得到的卷積特征圖像; 陽(yáng)227] convolution表不卷積計(jì)算;
[0228] 本發(fā)明的較佳的實(shí)施例中,如上述公式(8)所示,為了增強(qiáng)特征值的響應(yīng)值,在公 式(8)中進(jìn)行卷積運(yùn)算后,采用絕對(duì)值計(jì)算的做法處理。 陽(yáng)229] 本發(fā)明的其他實(shí)施例中,在公式(8)中,進(jìn)行卷積運(yùn)算后,同樣可W采用例如 Sigmoid函數(shù)或者采用雙曲正切型激活函數(shù)來(lái)代替上文中所述的絕對(duì)值計(jì)算的方法進(jìn)行處 理。
[0230] 步驟S32C,對(duì)卷積特征圖像進(jìn)行池化操作,W提取相應(yīng)的特征值; 陽(yáng)231] 本發(fā)明的較佳的實(shí)施例中,上述池化操作任ooling)可W選擇采用均值池化操作 (Mean 化0ling)進(jìn)行。
[0232] 本發(fā)明的其他實(shí)施例中,上述池化操作也可W選擇采用極值池化操作(Maximum 化oling)或者方差池化操作(Variance化oling)等進(jìn)行。
[023引步驟S33C,根據(jù)特征值,訓(xùn)練一相應(yīng)的分類器,W供后續(xù)進(jìn)行目標(biāo)檢測(cè)使用: 陽(yáng)234]
陽(yáng)23引其中, 陽(yáng)236] m表示特征值的數(shù)量,η表示特征值的維數(shù),k表示對(duì)圖像進(jìn)行分類的類別數(shù)量, xW表示第i個(gè)特征值,y W表示第i個(gè)特征值的標(biāo)注,λ表示權(quán)重衰減項(xiàng),Θ表示需要訓(xùn) 練的分類器的參數(shù); 陽(yáng)237] 本發(fā)明的較佳的實(shí)施例中,上文中所述的包括特征值的數(shù)量m、特征值的維數(shù)η、 分類的類別數(shù)量k、第i個(gè)特征值及其標(biāo)注W及權(quán)重衰減項(xiàng)λ等均為在計(jì)算得到如步驟 S32C中所述的特征值后已知的。因此上述公式(9)中的唯一變量為需要訓(xùn)練的分類器的參 數(shù)Θ。
[023引本發(fā)明的較佳的實(shí)施例中所使用的分類器為Softmax分類器。本發(fā)明的其他實(shí)施 例中,也可W使用其他分類器,例如SVM分類器、級(jí)聯(lián)分類器W及Fisher分類器等。 陽(yáng)239] 本發(fā)明的較佳的實(shí)施例中,在計(jì)算上述公式巧)時(shí),同樣可W采用迭代的梯度下 降法求解。
[0240] 本發(fā)明的較佳的實(shí)施例中,通過(guò)訓(xùn)練得到使得上述公式巧)的總體代價(jià)最小的分 類器(優(yōu)選的為Softmax分類器)的參數(shù)并輸出。 陽(yáng)241 ] 本發(fā)明的較佳的實(shí)施例中,若上述步驟S22C中采用了找式自編碼進(jìn)行處理,即W 上一層輸出作為輸入,迭代計(jì)算得到最終的處理結(jié)果;則步驟S33C中同樣采用找式自編碼 處理。找式自編碼的過(guò)程類似上文所述。通過(guò)找式自編碼處理,可W訓(xùn)練得到更細(xì)致的結(jié) 果。 陽(yáng)242] 本發(fā)明的較佳的實(shí)施例中,在對(duì)卷積神經(jīng)網(wǎng)絡(luò)模型W及分類器均訓(xùn)練完畢后,根 據(jù)訓(xùn)練完成的分類器對(duì)經(jīng)過(guò)排序的所有候選窗口進(jìn)行處理。上述過(guò)程屬于目標(biāo)檢測(cè)方法中 的一部分。 陽(yáng)243] 本發(fā)明的較佳的實(shí)施例中,如圖9所示,上述處理過(guò)程具體包括:
[0244] 步驟Sld,將所有候選窗口縮放至統(tǒng)一的尺度和橫縱比;
[0245] 本發(fā)明的較佳的實(shí)施例中,縮放尺度和橫縱比可W根據(jù)實(shí)際需要進(jìn)行設(shè)置。
[0246] 步驟S2d,對(duì)每個(gè)經(jīng)過(guò)縮放后的候選窗口,根據(jù)訓(xùn)練完成的卷積神經(jīng)網(wǎng)絡(luò)參數(shù)計(jì)算 相應(yīng)的卷積特征圖像,并進(jìn)行池化操作,W獲得對(duì)應(yīng)每個(gè)候選窗口的特征值; 陽(yáng)247] 本發(fā)明的較佳的實(shí)施例中,上述計(jì)算卷積特征圖像、進(jìn)行池化操作W及獲得每個(gè) 候選窗口的特征值等處理過(guò)程如上文所述,在此不再寶述。
[0248] 步驟S3d,根據(jù)訓(xùn)練完成的分類器的參數(shù),分別對(duì)每個(gè)特征值進(jìn)行分類,W確定每 個(gè)特征值對(duì)應(yīng)的分類標(biāo)簽; 陽(yáng)249] 步驟S4d,捜索并選中預(yù)設(shè)的分類標(biāo)簽對(duì)應(yīng)的候選窗口,作為本次目標(biāo)檢測(cè)的輸出 結(jié)果。
[0250] 本發(fā)明的較佳的實(shí)施例中,在進(jìn)行檢測(cè)的過(guò)程中,可能存在漏檢的問(wèn)題??刂茩z測(cè) 的漏檢率在檢測(cè)過(guò)程中的地位非常重要。本發(fā)明的較佳的實(shí)施例中,在執(zhí)行檢測(cè)的過(guò)程中 使用微調(diào)技術(shù)來(lái)降低漏檢率。具體地如圖10所示,在執(zhí)行上述步驟S4d中,采用微調(diào)技術(shù), 步驟包括: 陽(yáng)251] 步驟S41d,W被選中的候選窗口為中屯、,在具有預(yù)定的鄰域半徑的捜索范圍內(nèi)捜 索新的候選窗口; 陽(yáng)252] 步驟S42d,比較捜索到的新的候選窗口的似然度與被選中的候選窗口的似然度, 并在新的候選窗口的似然度大于被選中的候選窗口的似然度,則改為選中新的候選窗口。 陽(yáng)253] 本發(fā)明的較佳的實(shí)施例中,下一次迭代捜索和選擇的過(guò)程中,所依據(jù)的預(yù)定的鄰 域半徑相對(duì)于上一次迭代捜索和選擇遞減。迭代預(yù)定次數(shù)后輸出最終選中的候選窗口。 陽(yáng)254] 換言之,本發(fā)明的較佳的實(shí)施例中,上述微調(diào)技術(shù)即為:W被初步選中的候選窗口 為中屯、,捜索其鄰域內(nèi)的其他候選窗口。若鄰域內(nèi)的某個(gè)新的候選窗口的似然度大于被初 步選中的候選窗口的似然度,則轉(zhuǎn)而新的候選窗口。本發(fā)明的實(shí)施例中,可W采用迭代逼近 的方式,即多次進(jìn)行鄰域捜索過(guò)程,每次捜索的中屯、候選窗口為上次捜索并選中的候選窗 口,每次捜索的鄰域半徑相對(duì)于上次捜索遞減,如圖12所示,第二次捜索(捜索框B2)的捜 索鄰域半徑相對(duì)于第一次捜索(捜索框B1)的捜索鄰域半徑更小。圖12中,W實(shí)線表示第 一次捜索的鄰域半徑,W虛線表示第二次捜索的鄰域半徑。 陽(yáng)巧5] 本發(fā)明的較佳的實(shí)施例中,上述遞減幅度可W自行設(shè)定,迭代次數(shù)也可W自行設(shè) 定。本發(fā)明的較佳的實(shí)施例中,通過(guò)多次迭代捜索得到最終被選中的候選窗口并輸出。 陽(yáng)256]綜上所述,本發(fā)明技術(shù)方案中,首先采用目標(biāo)性評(píng)估操作(分為訓(xùn)練級(jí)聯(lián)分類模 型和排序候選窗口兩個(gè)步驟)得到最終排序完成的位于需要檢測(cè)的圖像上的多個(gè)候選窗 口;隨后采用目標(biāo)分類操作(包括稀疏自編碼計(jì)算W及訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò)和分類器兩個(gè)步 驟)得到后續(xù)分類需要用到的訓(xùn)練完畢的卷積神經(jīng)網(wǎng)絡(luò)模型W及分類器相關(guān)參數(shù);最后采 用訓(xùn)練完畢的卷積神經(jīng)網(wǎng)絡(luò)模型W及分類器相關(guān)參數(shù)對(duì)候選窗口進(jìn)行分類,檢測(cè)并輸出處 于預(yù)設(shè)的分類標(biāo)簽下的候選窗口中的圖像數(shù)據(jù)。上述技術(shù)方案可W解決現(xiàn)有的目標(biāo)檢測(cè)方 法中數(shù)據(jù)量處理較大W及檢測(cè)時(shí)間過(guò)長(zhǎng)的問(wèn)題,提升目標(biāo)檢測(cè)的運(yùn)算效率和檢測(cè)精度。因 此上述目標(biāo)檢測(cè)方法可W適用于硬件資源有限、計(jì)算能力一般的移動(dòng)終端內(nèi),用W實(shí)現(xiàn)移 動(dòng)終端的快速多目標(biāo)檢測(cè)的目的。 陽(yáng)257] 本發(fā)明的較佳的實(shí)施例中,上文中所述的"在執(zhí)行目標(biāo)檢測(cè)方法之前"并非表示相 應(yīng)的步驟不包括在本發(fā)明技術(shù)方案的保護(hù)范圍之內(nèi)。相反,上述在執(zhí)行目標(biāo)檢測(cè)方法之前 進(jìn)行的步驟為執(zhí)行目標(biāo)檢測(cè)方法所必需的前置步驟,因此需要包括在本發(fā)明技術(shù)方案的保 護(hù)范圍之內(nèi)。上文中對(duì)執(zhí)行目標(biāo)檢測(cè)方法之前W及執(zhí)行目標(biāo)檢測(cè)方法之間進(jìn)行的步驟進(jìn)行 區(qū)分的目的僅在于表示執(zhí)行目標(biāo)檢測(cè)方法之前的步驟并不是在每次執(zhí)行目標(biāo)檢測(cè)方法時(shí) 進(jìn)行的,而是執(zhí)行目標(biāo)檢測(cè)方法的前置步驟。 陽(yáng)25引本發(fā)明的較佳的實(shí)施例中,基于上文中所述的目標(biāo)檢測(cè)方法,提供一種目標(biāo)檢測(cè) 裝置,同樣適用于移動(dòng)終端。本發(fā)明的較佳的實(shí)施例中,目標(biāo)檢測(cè)裝置的具體結(jié)構(gòu)如圖13 所示,包括: 陽(yáng)259] 第一訓(xùn)練單元1,用于根據(jù)外部輸入的多個(gè)訓(xùn)練樣本反復(fù)訓(xùn)練得到一級(jí)聯(lián)分類模 型的分類參數(shù);
[0260] 篩選單元2,連接第一訓(xùn)練單元1,用于根據(jù)分類參數(shù)在需要檢測(cè)的圖像上篩選出 多個(gè)經(jīng)過(guò)排序的候選窗口; 陽(yáng)%1] 第二訓(xùn)練單元3,用于采用稀疏自編碼的方法訓(xùn)練生成相應(yīng)的卷積神經(jīng)網(wǎng)絡(luò)模型, 并采用卷積神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練形成相應(yīng)的分類器; 陽(yáng)262] 檢測(cè)單元4,分別連接篩選單元2和第二訓(xùn)練單元3,用于根據(jù)訓(xùn)練完成的分類器 對(duì)經(jīng)過(guò)排序的所有候選窗口進(jìn)行檢測(cè),W得到目標(biāo)檢測(cè)的輸出結(jié)果。 陽(yáng)%3] 本發(fā)明的較佳的實(shí)施例中,上述單元中包括用于實(shí)現(xiàn)如上文中所述的目標(biāo)檢測(cè)方 法的各項(xiàng)功能模塊,在此不再一一寶述。
[0264] 本發(fā)明的較佳的實(shí)施例中,還提供一種移動(dòng)終端,其中采用上文中所述的目標(biāo)檢 測(cè)方法。
[02化]本發(fā)明的較佳的實(shí)施例中,還提供一種移動(dòng)終端,其中包括上文中所述的目標(biāo)檢 測(cè)裝置。 陽(yáng)%6] W上所述僅為本發(fā)明較佳的實(shí)施例,并非因此限制本發(fā)明的實(shí)施方式及保護(hù)范 圍,對(duì)于本領(lǐng)域技術(shù)人員而言,應(yīng)當(dāng)能夠意識(shí)到凡運(yùn)用本發(fā)明說(shuō)明書(shū)及圖示內(nèi)容所作出的 等同替換和顯而易見(jiàn)的變化所得到的方案,均應(yīng)當(dāng)包含在本發(fā)明的保護(hù)范圍內(nèi)。
【主權(quán)項(xiàng)】
1. 一種目標(biāo)檢測(cè)方法,適用于移動(dòng)終端;其特征在于: 輸入多個(gè)訓(xùn)練樣本并反復(fù)訓(xùn)練得到一級(jí)聯(lián)分類模型的分類參數(shù); 訓(xùn)練生成相應(yīng)的卷積神經(jīng)網(wǎng)絡(luò)模型,并采用所述卷積神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練形成相應(yīng)的分 類器; 所述目標(biāo)檢測(cè)方法包括: 根據(jù)所述分類參數(shù)在需要檢測(cè)的圖像上篩選出多個(gè)經(jīng)過(guò)排序的候選窗口; 根據(jù)訓(xùn)練完成的所述分類器對(duì)經(jīng)過(guò)排序的所有所述候選窗口進(jìn)行檢測(cè),W得到目標(biāo)檢 測(cè)的輸出結(jié)果。2. 如權(quán)利要求1所述的目標(biāo)檢測(cè)分類方法,其特征在于,通過(guò)訓(xùn)練得到所述分類參數(shù) 的過(guò)程具體包括: 步驟Sla,輸入多個(gè)所述訓(xùn)練樣本,并提取每個(gè)所述訓(xùn)練樣本的范數(shù)梯度特征; 步驟S2a,分別計(jì)算得到每個(gè)所述范數(shù)梯度特征的響應(yīng)值,并進(jìn)行統(tǒng)計(jì)計(jì)算,作為所述 分類參數(shù)輸出。3. 如權(quán)利要求2所述的目標(biāo)檢測(cè)方法,其特征在于,所述步驟Sla具體包括: 步驟Slla,將輸入的所有所述訓(xùn)練樣本縮放至統(tǒng)一尺度; 步驟S12a,獲取每個(gè)所述訓(xùn)練樣本的范數(shù)梯度特征。4. 如權(quán)利要求3所述的目標(biāo)檢測(cè)方法,其特征在于,所述步驟S12a中,首先采用一預(yù)定 的濾波模板分別對(duì)每個(gè)所述訓(xùn)練樣本進(jìn)行濾波,W計(jì)算得到對(duì)應(yīng)于每個(gè)所述訓(xùn)練樣本X軸 方向的梯度圖像Gy, W及對(duì)應(yīng)于每個(gè)所述訓(xùn)練樣本y軸方向的梯度圖像Gy; 隨后W下述公式計(jì)算每個(gè)所述訓(xùn)練樣本的范數(shù)梯度特征: G"""=min(|Gj + |Gj,255); 其中, 咕。"為對(duì)應(yīng)所述訓(xùn)練樣本的所述范數(shù)梯度特征的通項(xiàng)變量表示。5. 如權(quán)利要求4所述的目標(biāo)檢測(cè)方法,其特征在于,采用一預(yù)定的濾波模板分別對(duì)每 個(gè)所述訓(xùn)練樣本進(jìn)行濾波包括: 采用一維中屯、濾波模板P = [-1,0, 1]分別對(duì)所述訓(xùn)練樣本進(jìn)行濾波,W及 采用模板P的轉(zhuǎn)置pT作為濾波模板分別對(duì)所述訓(xùn)練樣本進(jìn)行濾波。6. 如權(quán)利要求2所述的目標(biāo)檢測(cè)方法,其特征在于,所述步驟S2a具體包括: 步驟S21a,采用第一層的線性支持向量機(jī)提取所述范數(shù)梯度特征的第一響應(yīng)值; Sl= <Wi,Gl〉; 其中, 或表示所述第一響應(yīng)值,Wi表示第一層的所述線性支持向量機(jī)經(jīng)過(guò)學(xué)習(xí)后得到的參 數(shù),G,表示對(duì)應(yīng)一預(yù)定的所述訓(xùn)練樣本,下標(biāo)L表示所述訓(xùn)練樣本于相應(yīng)的圖像上的位置; 步驟S22a,對(duì)所述第一響應(yīng)值進(jìn)行非極值抑制處理; 步驟S23a,采用第二層的線性支持向量機(jī)對(duì)經(jīng)過(guò)非極值抑制處理的所述第一響應(yīng)值進(jìn) 行調(diào)整,W得到所述響應(yīng)值: Cl= a。. SL+bq; 其中, (:^表示所述第一響應(yīng)值經(jīng)過(guò)調(diào)整后得到的所述響應(yīng)值,Wz=細(xì)。,6。〉表示第二層的所 述線性支持向量機(jī)經(jīng)過(guò)學(xué)習(xí)后得到的參數(shù); 提取所有所述訓(xùn)練樣本對(duì)應(yīng)的所述第一響應(yīng)值W及相應(yīng)的所述響應(yīng)值,并做反復(fù)計(jì)算 和統(tǒng)計(jì),W訓(xùn)練得到最終的所述第一響應(yīng)值和相應(yīng)的所述響應(yīng)值; 所述分類參數(shù)包括第一層的所述線性支持向量機(jī)的參數(shù)Wi、第二層的所述線性支持向 量機(jī)的參數(shù)W2、所述第一響應(yīng)值或W及所述響應(yīng)值C ^7. 如權(quán)利要求6所述的目標(biāo)檢測(cè)方法,其特征在于,所述步驟S22a中,使用累計(jì)直方圖 對(duì)所述第一響應(yīng)值進(jìn)行非極值抑制處理。8. 如權(quán)利要求1所述的目標(biāo)檢測(cè)方法,其特征在于,所述分類參數(shù)包括第一層的線性 支持向量機(jī)的參數(shù)Wi, W及根據(jù)對(duì)應(yīng)于范數(shù)梯度特征的第一響應(yīng)值經(jīng)過(guò)調(diào)整得到的響應(yīng)值 Cl; 獲得用于表示每個(gè)所述訓(xùn)練樣本縮放前的尺度和橫縱比的量化參數(shù),所述量化參數(shù) 具有預(yù)設(shè)的取值范圍; 根據(jù)所述分類參數(shù)在需要檢測(cè)的圖像上篩選出多個(gè)經(jīng)過(guò)排序的候選窗口的過(guò)程具體 包括: 步驟Slb,根據(jù)所述量化參數(shù),將需要檢測(cè)的圖像進(jìn)行縮放,W得到縮放尺度處于所述 取值范圍內(nèi)的多幅縮放圖像; 步驟S2b,提取每幅所述縮放圖像的范數(shù)梯度特征,將每個(gè)所述范數(shù)梯度特征與第一層 的支持向量機(jī)的參數(shù)Wi進(jìn)行卷積計(jì)算,W得到對(duì)應(yīng)于每幅所述縮放圖像的匹配響應(yīng)圖; 步驟S3b,在所述匹配響應(yīng)圖上執(zhí)行非極值抑制處理,W得到對(duì)應(yīng)的所述縮放圖像上能 夠保留的窗口的最大數(shù); 步驟S4b,于每個(gè)所述縮放尺度上獲取相應(yīng)的所述縮放圖像上的數(shù)量不多于所述最大 數(shù)的多個(gè)窗口; 步驟S5b,根據(jù)所述響應(yīng)值從大到小對(duì)需要檢測(cè)的圖像上的所有所述窗口進(jìn)行排序,選 取預(yù)定數(shù)量的多個(gè)排序在前的所述窗口作為需要檢測(cè)的圖像上的候選窗口并保留。9. 如權(quán)利要求1所述的目標(biāo)檢測(cè)方法,其特征在于,訓(xùn)練生成相應(yīng)的卷積神經(jīng)網(wǎng)絡(luò)模 型的過(guò)程具體包括: 步驟Slc,構(gòu)建一個(gè)初始的所述卷積神經(jīng)網(wǎng)絡(luò)模型; 步驟S2c,使用稀疏自編碼方法訓(xùn)練得到所述卷積神經(jīng)網(wǎng)絡(luò)模型的權(quán)重參數(shù)和偏置參 數(shù); 步驟S3C,繼續(xù)訓(xùn)練得到所述卷積神經(jīng)網(wǎng)絡(luò)模型的其他參數(shù),W構(gòu)成訓(xùn)練完畢的所述卷 積神經(jīng)網(wǎng)絡(luò)模型。10. 如權(quán)利要求9所述的目標(biāo)檢測(cè)方法,其特征在于,所述步驟S2c具體包括: 步驟S21C,輸入多個(gè)所述訓(xùn)練樣本,并對(duì)輸入數(shù)據(jù)進(jìn)行白化處理; 步驟S22C,根據(jù)經(jīng)過(guò)白化處理的所述輸入數(shù)據(jù)進(jìn)行稀疏自編碼處理,W訓(xùn)練得到相應(yīng) 的所述權(quán)重參數(shù)和所述偏置參數(shù)。11. 如權(quán)利要求10所述的目標(biāo)檢測(cè)方法,其特征在于,所述步驟S21C中,對(duì)所述輸入數(shù) 據(jù)進(jìn)行白化處理的方式具體包括: 步驟S211C,采用下述公式對(duì)所述輸入數(shù)據(jù)進(jìn)行主成分分析白化處理:其中, XpcA_"hit :表示經(jīng)過(guò)所述主成分分析白化處理后的所述輸入數(shù)據(jù); U表示奇異值分解獲得的正交矩陣,相應(yīng)地IJT表示U矩陣的轉(zhuǎn)置矩陣; 入表示奇異值分解獲得的對(duì)角矩陣; e表示正則化常數(shù); 步驟S212C,采用下述公式,在主成分分析白化處理后,繼續(xù)對(duì)所述輸入數(shù)據(jù)進(jìn)行白化 處理: XzCA-ivhit E - Ux PCA *hit E ; 其中, 表示于主成分分析白化處理的基礎(chǔ)上,繼續(xù)進(jìn)行白化處理后得到的所述輸入 數(shù)據(jù)。12. 如權(quán)利要求10所述的目標(biāo)檢測(cè)方法,其特征在于,所述卷積神經(jīng)網(wǎng)絡(luò)中包括第一 層的輸入節(jié)點(diǎn)、第二層的隱藏節(jié)點(diǎn)W及第=層的輸出節(jié)點(diǎn),所述輸入節(jié)點(diǎn)連接所述隱藏節(jié) 點(diǎn),所述隱藏節(jié)點(diǎn)連接所述輸出節(jié)點(diǎn); 所述卷積神經(jīng)網(wǎng)絡(luò)的總體代價(jià)函數(shù)如下:其中, J (W,b)為經(jīng)典神經(jīng)網(wǎng)絡(luò)中的基本代價(jià)函數(shù); 0表示控制稀疏性懲罰因子的權(quán)重; Sz表示所述隱藏節(jié)點(diǎn)的數(shù)量; 姐! .1 P,)為相對(duì)賭; P為稀疏性參數(shù); 表示所述隱藏節(jié)點(diǎn)的平均活躍度; W表示所述權(quán)重參數(shù),b表示所述偏置參數(shù)。13. 如權(quán)利要求12所述的目標(biāo)檢測(cè)方法,其特征在于,W根據(jù)所述稀疏自編碼方法計(jì) 算輸出的所述權(quán)重參數(shù)和所述偏置參數(shù)作為輸入,采用所述稀疏自編碼方法多次迭代計(jì)算 輸出最終的所述權(quán)重參數(shù)和所述偏置參數(shù)。14. 如權(quán)利要求9所述的目標(biāo)檢測(cè)方法,其特征在于,所述步驟S3c具體包括: 步驟S31C,將輸入的所述訓(xùn)練樣本分別與所述步驟S2c中輸出的對(duì)應(yīng)每個(gè)所述隱藏節(jié) 點(diǎn)的所述權(quán)重參數(shù)進(jìn)行卷積操作,W輸出對(duì)應(yīng)于每個(gè)所述隱藏節(jié)點(diǎn)的卷積特征圖像: I_ConVi= I convolution (I, W-Spars e ;); 其中, I_ConVi表示輸入的一預(yù)定的訓(xùn)練樣本I與第i個(gè)隱藏節(jié)點(diǎn)的權(quán)重參數(shù)W_Spars e i進(jìn) 行卷積操作后得到的卷積特征圖像; convolution表示卷積計(jì)算; 步驟S32C,對(duì)所述卷積特征圖像進(jìn)行池化操作,W提取相應(yīng)的特征值; 步驟S33C,根據(jù)所述特征值,訓(xùn)練一相應(yīng)的分類器,W供后續(xù)進(jìn)行目標(biāo)檢測(cè)使用:其中, m表示特征值的數(shù)量,n表示特征值的維數(shù),k表示對(duì)圖像進(jìn)行分類的類別數(shù)量,表 示第i個(gè)特征值,yW表示第i個(gè)特征值的標(biāo)注,A表示權(quán)重衰減項(xiàng),0表示需要訓(xùn)練的所 述分類器的參數(shù); 通過(guò)訓(xùn)練得到使得所述步驟S33C中的公式的總體代價(jià)最小的所述分類器的參數(shù)并輸 出。15. 如權(quán)利要求14所述的目標(biāo)檢測(cè)方法,其特征在于,W所述步驟S33C中輸出的所述 分類器的參數(shù)作為輸入,采用所述步驟S33C中的的公式多次迭代計(jì)算,W得到最終的所述 分類器的參數(shù)。16. 如權(quán)利要求1所述的目標(biāo)檢測(cè)方法,其特征在于,根據(jù)訓(xùn)練完成的所述分類器對(duì)經(jīng) 過(guò)排序的所有所述候選窗口進(jìn)行處理的過(guò)程具體包括: 步驟Sld,將所有所述候選窗口縮放至統(tǒng)一的尺度和橫縱比; 步驟S2d,對(duì)每個(gè)經(jīng)過(guò)縮放后的所述候選窗口,根據(jù)訓(xùn)練完成的所述卷積神經(jīng)網(wǎng)絡(luò)參數(shù) 計(jì)算相應(yīng)的卷積特征圖像,并進(jìn)行池化操作,W獲得對(duì)應(yīng)每個(gè)所述候選窗口的特征值; 步驟S3d,根據(jù)訓(xùn)練完成的所述分類器的參數(shù),分別對(duì)每個(gè)所述特征值進(jìn)行分類,W確 定每個(gè)所述特征值對(duì)應(yīng)的分類標(biāo)簽; 步驟S4d,捜索并選中預(yù)設(shè)的所述分類標(biāo)簽對(duì)應(yīng)的所述候選窗口,作為本次目標(biāo)檢測(cè)的 輸出結(jié)果。17. 如權(quán)利要求16所述的目標(biāo)檢測(cè)方法,其特征在于,執(zhí)行所述步驟S4d時(shí),在一次捜 索和選擇的結(jié)果上進(jìn)行預(yù)定次數(shù)的迭代捜索和選擇; 每次迭代捜索和選擇的過(guò)程具體包括: 步驟S41d,W被選中的候選窗口為中屯、,在具有預(yù)定的鄰域半徑的捜索范圍內(nèi)捜索新 的候選窗口; 步驟S42d,比較捜索到的新的候選窗口的似然度與被選中的候選窗口的似然度,并在 新的候選窗口的似然度大于被選中的候選窗口的似然度,則改為選中新的候選窗口; 下一次迭代捜索和選擇的過(guò)程中,所依據(jù)的預(yù)定的鄰域半徑相對(duì)于上一次迭代捜索和 選擇遞減。18. -種目標(biāo)檢測(cè)裝置,適用于移動(dòng)終端;其特征在于,包括: 第一訓(xùn)練單元,用于根據(jù)外部輸入的多個(gè)訓(xùn)練樣本反復(fù)訓(xùn)練得到一級(jí)聯(lián)分類模型的分 類參數(shù); 篩選單元,連接所述第一訓(xùn)練單元,用于根據(jù)所述分類參數(shù)在需要檢測(cè)的圖像上篩選 出多個(gè)經(jīng)過(guò)排序的候選窗口; 第二訓(xùn)練單元,用于采用稀疏自編碼的方法訓(xùn)練生成相應(yīng)的卷積神經(jīng)網(wǎng)絡(luò)模型,并采 用所述卷積神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練形成相應(yīng)的分類器; 檢測(cè)單元,分別連接所述篩選單元和所述第二訓(xùn)練單元,用于根據(jù)訓(xùn)練完成的所述分 類器對(duì)經(jīng)過(guò)排序的所有所述候選窗口進(jìn)行檢測(cè),W得到目標(biāo)檢測(cè)的輸出結(jié)果。19. 一種移動(dòng)終端,其特征在于,采用如權(quán)利要求1-17所述的目標(biāo)檢測(cè)方法。20. -種移動(dòng)終端,其特征在于,包括如權(quán)利要求18所述的目標(biāo)檢測(cè)裝置。
【文檔編號(hào)】G06K9/62GK105989368SQ201510080103
【公開(kāi)日】2016年10月5日
【申請(qǐng)日】2015年2月13日
【發(fā)明人】劉陽(yáng), 陳敏杰, 林福輝
【申請(qǐng)人】展訊通信(天津)有限公司