欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種基于超像素分割的滑動窗口快速目標檢測方法與流程

文檔序號:12471820閱讀:1274來源:國知局
一種基于超像素分割的滑動窗口快速目標檢測方法與流程

本發(fā)明屬于圖像處理與計算機視覺領(lǐng)域,涉及一種基于超像素分割的滑動窗口快速目標檢測方法。



背景技術(shù):

視覺是人類獲取外界信息的重要途徑,而圖像則是信息的重要載體。隨著圖像處理技術(shù)的日益發(fā)展,圖像的尺寸、分辨率逐漸增大,其包含的信息也在不斷豐富。研究表明,人類在觀察圖像時視線通常在圖像所包含的物體之間移動,而對背景等其他區(qū)域并不感興趣,大部分的視覺技術(shù),如行人檢測、人臉識別、目標跟蹤和目標識別等,也是作用于上述包含物體的區(qū)域。因此如何在整幅圖像中快速、有效地檢測感興趣物體區(qū)域具有重要的研究意義。

目標檢測是圖像理解、目標識別領(lǐng)域的重要內(nèi)容,其主要任務(wù)包括從一幅給定圖像中定位目標,其中基于滑窗搜索的方法在目標檢測中得到廣泛應(yīng)用。上述方法將分類函數(shù)應(yīng)用于不同位置、尺度和長寬比下的窗口,對窗口所覆蓋的圖像區(qū)域進行評價,具有最大響應(yīng)的窗口視為物體的預(yù)測區(qū)域。但基于滑窗搜索的方法在實際應(yīng)用中主要面臨兩個問題:

1、由于窗口滑動步長的影響,窗口所覆蓋的矩形區(qū)域通常不能夠?qū)δ繕说倪吘夁M行較好的覆蓋,如圖2中白色實線所示。為提高窗口的覆蓋準確性,如果降低窗口的滑動步長,又會造成搜索效率的下降;

2、如何有效地訓(xùn)練具有位置判別特征的泛化分類器。

針對第一個問題,已有的改進大都采用啟發(fā)式算法,首先對目標在圖像中的分布進行初步估計,在概率高的區(qū)域進行精細搜索,在概率低的區(qū)域進行粗略搜索,從而達到提高搜索效率的目的,但其搜索精度依賴于初始的位置分布精度,且會增大目標誤檢和漏檢的概率?;诨八阉鞯乃惴m然效率較低,但仍具有精度高,漏檢率低的優(yōu)點。因此采用結(jié)合上述兩種搜索方式的優(yōu)點,發(fā)展一種運行速度快、誤檢率低的搜索方法,同時保證目標檢測結(jié)果與實際盡可能吻合,具有十分重要的意義。



技術(shù)實現(xiàn)要素:

要解決的技術(shù)問題

為了避免現(xiàn)有技術(shù)的不足之處,本發(fā)明提出一種基于超像素分割的滑動窗口快速目標檢測方法,彌補現(xiàn)有的滑窗搜索算法在運行速度、目標檢測精度的不足。

技術(shù)方案

一種基于超像素分割的滑動窗口快速目標檢測方法,其特征在于步驟如下:

步驟1、圖像超像素分割:采用SLIC算法將圖像分割為互不重合超像素的圖像塊,每個圖像塊有唯一的標記信息i,N表示超像素的總數(shù)目,i=0,1,2,…N-1;

步驟2、滑動窗口初始化:將滑動窗口的尺度分別設(shè)置為圖像尺寸的1/2,1/3或1/4;每個尺度的滑動窗口的長寬比分別設(shè)置為1:1,2:1,1:2,3:2,2:3,16:9或9:16,得到21組尺寸/長寬比的滑動窗口;

步驟3、滑動窗口超像素激活:將其中一個滑動窗口作為初始窗口,將初始窗口所覆蓋像素點對應(yīng)的超像素集合作為實際的滑動窗口為超像素激活區(qū)域;所述超像素集合中所有像素點橫坐標的最小值作為激活區(qū)域的左邊界,最大值作為激活區(qū)域的右邊界,所有像素點縱坐標的最小值作為激活區(qū)域的上邊界,最大值作為激活區(qū)域的下邊界;

步驟4、激活區(qū)域評價:采用目標評價函數(shù)計算當前的超像素激活區(qū)域包含有目標概率;

步驟5:將滑動窗口滑動至下一個區(qū)域,再重復(fù)步驟3~步驟4得到下一個區(qū)域的目標概率;

步驟6、基于超像素激活區(qū)域的滑窗搜索:

對21組尺寸/長寬比的滑動窗口重復(fù)步驟3~步驟5,得到每個滑動窗口在不同位置的目標概率;

將得到的21組評價概率由高到低進行排列,取每組內(nèi)排列前三的評價概率的3個滑動窗口作為目標的檢測候選滑動窗口,21種組合共生成63個目標候選區(qū)域;

以0.5作為窗口覆蓋率閾值,采用非極大值抑制算法對63個目標候選區(qū)域篩選出具有全局最大概率的超像素激活區(qū)域,作為最終的目標檢測區(qū)域。窗口覆蓋率γ:

其中,i≠j且1≤i,j≤63,pi,pj分別表示第i,j個超像素激活區(qū)域;|·|表示對應(yīng)區(qū)域的像素個數(shù)。

有益效果

本發(fā)明提出的一種基于超像素分割的滑動窗口快速目標檢測方法,其主要由圖像超像素分割、滑動窗口初始化、滑動窗口超像素激活、激活區(qū)域評價和基于超像素激活區(qū)域的滑窗搜索五部分構(gòu)成。

與現(xiàn)有技術(shù)相比,本發(fā)明具有以下有益效果:

1.通過控制圖像分割算法參數(shù),本發(fā)明能夠方便地改變超像素的尺寸和內(nèi)部的特征一致性,從而改變同一滑動窗口所激活的超像素區(qū)域,實現(xiàn)提高目標檢測精度的目的;

2.當滑動窗口未能與目標邊界較好吻合時,本發(fā)明能夠?qū)⑵涓采w像素點對應(yīng)的超像素區(qū)域納入滑動窗口,由于超像素的特征一致性保證了其對目標邊界較好的分割效果,因此本發(fā)明能夠保證激活區(qū)域與目標邊界有較好理想的符合度。

3.由于超像素具有一定的尺寸,本發(fā)明能夠在一定范圍內(nèi)增大窗口的滑動步長,同時保證其對應(yīng)的激活區(qū)域不變,從而達到提高算法運行效率的目的。

本發(fā)明的方法易于實現(xiàn),其應(yīng)用價值主要體現(xiàn)在以下幾個方面:

1.可以在保證搜索精度的前提下,顯著提升搜索步長設(shè)置,從而加速傳統(tǒng)基于像素點的滑窗搜索算法;

2.本發(fā)明可以方便地嵌入現(xiàn)有的滑窗搜索算法,在不改變算法實施方式的前提下提高現(xiàn)有算法對目標的檢測精度。

附圖說明

圖1為本發(fā)明的流程圖;

圖2為本發(fā)明的超像素激活窗口與原初始窗口的對比示意圖;

圖3為本發(fā)明的不同階段的算法效果圖,其中,(a)為輸入圖像的超像素分割效果圖,(b)、(c)分別為不同尺度/長寬比組合下的目標檢測結(jié)果,(d)為應(yīng)用非極大值抑制后的最終檢測結(jié)果。

具體實施方式

現(xiàn)結(jié)合實施例、附圖對本發(fā)明作進一步描述:

參見圖1,本發(fā)明為一種基于超像素分割的滑動窗口快速目標檢測方法,其主要由圖像超像素分割、滑動窗口初始化、滑動窗口超像素激活、激活區(qū)域評價和基于超像素激活區(qū)域的滑窗搜索五部分構(gòu)成。

該方法具體包括步驟如下:

1.圖像超像素分割

選取包含目標的圖像作為待處理圖像,應(yīng)用SLIC(Simple Linear Iterative Clustering)算法將圖像分割為尺寸相當、內(nèi)部元素特征相似的超像素。超像素互不重合,且有唯一的標記信息i(i=0,1,2,…N-1),N表示超像素的總數(shù)目。簡要做法如下:

1)按固定采樣步長s初始化聚類中心點,每個像素的標記設(shè)為-1,距最近中心點的距離設(shè)為正無窮;

2)對每一個中心點,計算其2s×2s鄰域中每個像素點距此中心點的距離,并與該像素點已有的距離進行比較,較小的值設(shè)為當前像素點的距離,并保持像素點標記與該聚類中心點標記一致;

3)更新聚類中心點,計算分割誤差;

4)重復(fù)執(zhí)行步驟2)和3),直到誤差滿足條件。

2.滑動窗口初始化

為使滑動窗口能夠盡可能完整地覆蓋圖像中的目標,需給滑動窗口設(shè)置不同的尺度和長寬比。在本發(fā)明中,滑動窗口的尺度分別設(shè)置為圖像尺寸的1/2,1/3,1/4,每個尺度的滑動窗口的長寬比分別設(shè)置為1:1,2:1,1:2,3:2,2:3,16:9,9:16,共有21組尺寸/長寬比組合情況。選定一組組合參數(shù),生成初始化滑動窗口。

3.滑動窗口超像素激活

將其中一個滑動窗口作為初始窗口,將初始窗口所覆蓋像素點對應(yīng)的超像素區(qū)域的集合作為實際的滑動窗口,即超像素激活區(qū)域。超像素集合中所有像素點橫坐標的最小值作為激活區(qū)域的左邊界,最大值作為激活區(qū)域的右邊界;同理,計算所有像素點縱坐標的最小值作為激活區(qū)域的上邊界,最大值作為激活區(qū)域的下邊界。當初始窗口由于滑動步長的影響未能與目標邊界較好符合時,由于其能夠覆蓋一部分的超像素像素點,而超像素內(nèi)部具有較好的特征一致性,其對邊界的分割效果較為理想,因此將這些像素點對應(yīng)的超像素區(qū)域納入滑動窗口,能夠保證激活區(qū)域與目標邊界有良好的符合度,如圖2中白色虛線所示。

當每個超像素均只包含1個像素點時,本方法退化為傳統(tǒng)的滑動窗口搜索算法,因此本是對傳統(tǒng)算法的一般化。

4.激活區(qū)域評價

采用目標評價函數(shù)對當前的超像素激活區(qū)域進行評價,計算其中包含有目標的概率。目標評價函數(shù)的選取同傳統(tǒng)滑動窗口算法一致,此處不再贅述。

5.將滑動窗口滑動至下一個區(qū)域,再重復(fù)步驟3~步驟4得到下一個區(qū)域的目標概率;

6.基于超像素激活區(qū)域的滑窗搜索

生成新一組尺度/長寬比組合,重復(fù)執(zhí)行步驟3和步驟4,直到所有組合完成遍歷。針對每一組合,將其產(chǎn)生的超像素激活區(qū)域按照評價概率由高到低進行排列,取最高的3組區(qū)域作為目標的檢測候選區(qū)域,21種組合共生成63個目標候選區(qū)域。

最后以0.5作為窗口覆蓋率閾值,采用非極大值抑制算法(NMS,Non-Maximal Suppression)篩選出具有全局最大概率的超像素激活區(qū)域,作為最終的目標檢測區(qū)域。窗口覆蓋率γ定義如下:

其中,i≠j且1≤i,j≤63,pi,pj分別表示第i,j個超像素激活區(qū)域。|·|表示對應(yīng)區(qū)域的像素個數(shù)。

當前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
凉城县| 武威市| 仪陇县| 顺平县| 隆德县| 新疆| 荣成市| 台湾省| 舒城县| 井陉县| 福清市| 民和| 南宫市| 沁源县| 莱西市| 灵寿县| 阳曲县| 涟水县| 陆河县| 湟源县| 山西省| 海阳市| 乡城县| 兴文县| 中卫市| 民县| 昌乐县| 广南县| 开阳县| 乐陵市| 庆元县| 周宁县| 通渭县| 道真| 长白| 怀宁县| 嘉黎县| 临朐县| 青龙| 越西县| 苍南县|