本發(fā)明屬于圖像處理與計算機視覺領(lǐng)域,涉及一種基于超像素分割的滑動窗口快速目標檢測方法。
背景技術(shù):
視覺是人類獲取外界信息的重要途徑,而圖像則是信息的重要載體。隨著圖像處理技術(shù)的日益發(fā)展,圖像的尺寸、分辨率逐漸增大,其包含的信息也在不斷豐富。研究表明,人類在觀察圖像時視線通常在圖像所包含的物體之間移動,而對背景等其他區(qū)域并不感興趣,大部分的視覺技術(shù),如行人檢測、人臉識別、目標跟蹤和目標識別等,也是作用于上述包含物體的區(qū)域。因此如何在整幅圖像中快速、有效地檢測感興趣物體區(qū)域具有重要的研究意義。
目標檢測是圖像理解、目標識別領(lǐng)域的重要內(nèi)容,其主要任務(wù)包括從一幅給定圖像中定位目標,其中基于滑窗搜索的方法在目標檢測中得到廣泛應(yīng)用。上述方法將分類函數(shù)應(yīng)用于不同位置、尺度和長寬比下的窗口,對窗口所覆蓋的圖像區(qū)域進行評價,具有最大響應(yīng)的窗口視為物體的預(yù)測區(qū)域。但基于滑窗搜索的方法在實際應(yīng)用中主要面臨兩個問題:
1、由于窗口滑動步長的影響,窗口所覆蓋的矩形區(qū)域通常不能夠?qū)δ繕说倪吘夁M行較好的覆蓋,如圖2中白色實線所示。為提高窗口的覆蓋準確性,如果降低窗口的滑動步長,又會造成搜索效率的下降;
2、如何有效地訓(xùn)練具有位置判別特征的泛化分類器。
針對第一個問題,已有的改進大都采用啟發(fā)式算法,首先對目標在圖像中的分布進行初步估計,在概率高的區(qū)域進行精細搜索,在概率低的區(qū)域進行粗略搜索,從而達到提高搜索效率的目的,但其搜索精度依賴于初始的位置分布精度,且會增大目標誤檢和漏檢的概率?;诨八阉鞯乃惴m然效率較低,但仍具有精度高,漏檢率低的優(yōu)點。因此采用結(jié)合上述兩種搜索方式的優(yōu)點,發(fā)展一種運行速度快、誤檢率低的搜索方法,同時保證目標檢測結(jié)果與實際盡可能吻合,具有十分重要的意義。
技術(shù)實現(xiàn)要素:
要解決的技術(shù)問題
為了避免現(xiàn)有技術(shù)的不足之處,本發(fā)明提出一種基于超像素分割的滑動窗口快速目標檢測方法,彌補現(xiàn)有的滑窗搜索算法在運行速度、目標檢測精度的不足。
技術(shù)方案
一種基于超像素分割的滑動窗口快速目標檢測方法,其特征在于步驟如下:
步驟1、圖像超像素分割:采用SLIC算法將圖像分割為互不重合超像素的圖像塊,每個圖像塊有唯一的標記信息i,N表示超像素的總數(shù)目,i=0,1,2,…N-1;
步驟2、滑動窗口初始化:將滑動窗口的尺度分別設(shè)置為圖像尺寸的1/2,1/3或1/4;每個尺度的滑動窗口的長寬比分別設(shè)置為1:1,2:1,1:2,3:2,2:3,16:9或9:16,得到21組尺寸/長寬比的滑動窗口;
步驟3、滑動窗口超像素激活:將其中一個滑動窗口作為初始窗口,將初始窗口所覆蓋像素點對應(yīng)的超像素集合作為實際的滑動窗口為超像素激活區(qū)域;所述超像素集合中所有像素點橫坐標的最小值作為激活區(qū)域的左邊界,最大值作為激活區(qū)域的右邊界,所有像素點縱坐標的最小值作為激活區(qū)域的上邊界,最大值作為激活區(qū)域的下邊界;
步驟4、激活區(qū)域評價:采用目標評價函數(shù)計算當前的超像素激活區(qū)域包含有目標概率;
步驟5:將滑動窗口滑動至下一個區(qū)域,再重復(fù)步驟3~步驟4得到下一個區(qū)域的目標概率;
步驟6、基于超像素激活區(qū)域的滑窗搜索:
對21組尺寸/長寬比的滑動窗口重復(fù)步驟3~步驟5,得到每個滑動窗口在不同位置的目標概率;
將得到的21組評價概率由高到低進行排列,取每組內(nèi)排列前三的評價概率的3個滑動窗口作為目標的檢測候選滑動窗口,21種組合共生成63個目標候選區(qū)域;
以0.5作為窗口覆蓋率閾值,采用非極大值抑制算法對63個目標候選區(qū)域篩選出具有全局最大概率的超像素激活區(qū)域,作為最終的目標檢測區(qū)域。窗口覆蓋率γ:
其中,i≠j且1≤i,j≤63,pi,pj分別表示第i,j個超像素激活區(qū)域;|·|表示對應(yīng)區(qū)域的像素個數(shù)。
有益效果
本發(fā)明提出的一種基于超像素分割的滑動窗口快速目標檢測方法,其主要由圖像超像素分割、滑動窗口初始化、滑動窗口超像素激活、激活區(qū)域評價和基于超像素激活區(qū)域的滑窗搜索五部分構(gòu)成。
與現(xiàn)有技術(shù)相比,本發(fā)明具有以下有益效果:
1.通過控制圖像分割算法參數(shù),本發(fā)明能夠方便地改變超像素的尺寸和內(nèi)部的特征一致性,從而改變同一滑動窗口所激活的超像素區(qū)域,實現(xiàn)提高目標檢測精度的目的;
2.當滑動窗口未能與目標邊界較好吻合時,本發(fā)明能夠?qū)⑵涓采w像素點對應(yīng)的超像素區(qū)域納入滑動窗口,由于超像素的特征一致性保證了其對目標邊界較好的分割效果,因此本發(fā)明能夠保證激活區(qū)域與目標邊界有較好理想的符合度。
3.由于超像素具有一定的尺寸,本發(fā)明能夠在一定范圍內(nèi)增大窗口的滑動步長,同時保證其對應(yīng)的激活區(qū)域不變,從而達到提高算法運行效率的目的。
本發(fā)明的方法易于實現(xiàn),其應(yīng)用價值主要體現(xiàn)在以下幾個方面:
1.可以在保證搜索精度的前提下,顯著提升搜索步長設(shè)置,從而加速傳統(tǒng)基于像素點的滑窗搜索算法;
2.本發(fā)明可以方便地嵌入現(xiàn)有的滑窗搜索算法,在不改變算法實施方式的前提下提高現(xiàn)有算法對目標的檢測精度。
附圖說明
圖1為本發(fā)明的流程圖;
圖2為本發(fā)明的超像素激活窗口與原初始窗口的對比示意圖;
圖3為本發(fā)明的不同階段的算法效果圖,其中,(a)為輸入圖像的超像素分割效果圖,(b)、(c)分別為不同尺度/長寬比組合下的目標檢測結(jié)果,(d)為應(yīng)用非極大值抑制后的最終檢測結(jié)果。
具體實施方式
現(xiàn)結(jié)合實施例、附圖對本發(fā)明作進一步描述:
參見圖1,本發(fā)明為一種基于超像素分割的滑動窗口快速目標檢測方法,其主要由圖像超像素分割、滑動窗口初始化、滑動窗口超像素激活、激活區(qū)域評價和基于超像素激活區(qū)域的滑窗搜索五部分構(gòu)成。
該方法具體包括步驟如下:
1.圖像超像素分割
選取包含目標的圖像作為待處理圖像,應(yīng)用SLIC(Simple Linear Iterative Clustering)算法將圖像分割為尺寸相當、內(nèi)部元素特征相似的超像素。超像素互不重合,且有唯一的標記信息i(i=0,1,2,…N-1),N表示超像素的總數(shù)目。簡要做法如下:
1)按固定采樣步長s初始化聚類中心點,每個像素的標記設(shè)為-1,距最近中心點的距離設(shè)為正無窮;
2)對每一個中心點,計算其2s×2s鄰域中每個像素點距此中心點的距離,并與該像素點已有的距離進行比較,較小的值設(shè)為當前像素點的距離,并保持像素點標記與該聚類中心點標記一致;
3)更新聚類中心點,計算分割誤差;
4)重復(fù)執(zhí)行步驟2)和3),直到誤差滿足條件。
2.滑動窗口初始化
為使滑動窗口能夠盡可能完整地覆蓋圖像中的目標,需給滑動窗口設(shè)置不同的尺度和長寬比。在本發(fā)明中,滑動窗口的尺度分別設(shè)置為圖像尺寸的1/2,1/3,1/4,每個尺度的滑動窗口的長寬比分別設(shè)置為1:1,2:1,1:2,3:2,2:3,16:9,9:16,共有21組尺寸/長寬比組合情況。選定一組組合參數(shù),生成初始化滑動窗口。
3.滑動窗口超像素激活
將其中一個滑動窗口作為初始窗口,將初始窗口所覆蓋像素點對應(yīng)的超像素區(qū)域的集合作為實際的滑動窗口,即超像素激活區(qū)域。超像素集合中所有像素點橫坐標的最小值作為激活區(qū)域的左邊界,最大值作為激活區(qū)域的右邊界;同理,計算所有像素點縱坐標的最小值作為激活區(qū)域的上邊界,最大值作為激活區(qū)域的下邊界。當初始窗口由于滑動步長的影響未能與目標邊界較好符合時,由于其能夠覆蓋一部分的超像素像素點,而超像素內(nèi)部具有較好的特征一致性,其對邊界的分割效果較為理想,因此將這些像素點對應(yīng)的超像素區(qū)域納入滑動窗口,能夠保證激活區(qū)域與目標邊界有良好的符合度,如圖2中白色虛線所示。
當每個超像素均只包含1個像素點時,本方法退化為傳統(tǒng)的滑動窗口搜索算法,因此本是對傳統(tǒng)算法的一般化。
4.激活區(qū)域評價
采用目標評價函數(shù)對當前的超像素激活區(qū)域進行評價,計算其中包含有目標的概率。目標評價函數(shù)的選取同傳統(tǒng)滑動窗口算法一致,此處不再贅述。
5.將滑動窗口滑動至下一個區(qū)域,再重復(fù)步驟3~步驟4得到下一個區(qū)域的目標概率;
6.基于超像素激活區(qū)域的滑窗搜索
生成新一組尺度/長寬比組合,重復(fù)執(zhí)行步驟3和步驟4,直到所有組合完成遍歷。針對每一組合,將其產(chǎn)生的超像素激活區(qū)域按照評價概率由高到低進行排列,取最高的3組區(qū)域作為目標的檢測候選區(qū)域,21種組合共生成63個目標候選區(qū)域。
最后以0.5作為窗口覆蓋率閾值,采用非極大值抑制算法(NMS,Non-Maximal Suppression)篩選出具有全局最大概率的超像素激活區(qū)域,作為最終的目標檢測區(qū)域。窗口覆蓋率γ定義如下:
其中,i≠j且1≤i,j≤63,pi,pj分別表示第i,j個超像素激活區(qū)域。|·|表示對應(yīng)區(qū)域的像素個數(shù)。