欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

檢測圖像中的對象的裝置和方法、分類器生成裝置和方法

文檔序號:6607951閱讀:368來源:國知局
專利名稱:檢測圖像中的對象的裝置和方法、分類器生成裝置和方法
技術(shù)領(lǐng)域
本發(fā)明涉及圖像處理領(lǐng)域,尤其涉及一種檢測圖像中的對象的裝置和方法以及分類器生成裝置和方法。
背景技術(shù)
在圖像檢測和識別等很多應(yīng)用場合中,諸如,在對圖像中的對象進(jìn)行檢測以及生成對象分類器的應(yīng)用中,圖像中的對象的形狀成為檢測和識別的極為有用的依據(jù)。因此,如何有效并且高效地表征對象的形狀成為人們關(guān)注的問題。已經(jīng)提出了很多表征圖像的形狀的方法,包括基于網(wǎng)格的方法、使用傅立葉描述子的方法、使用Zernike矩特征的方法以及曲率尺度空間(CCS,curvature scale space) 方法?;诰W(wǎng)格的方法將圖像映射到具有固定大小的網(wǎng)格。然后,對網(wǎng)格進(jìn)行掃描,并依據(jù)每個網(wǎng)格中前景像素的數(shù)目是否大于預(yù)定閾值來為各個網(wǎng)格分配“1”和“0”。最后,連接這些“ 1,,和“0”來生成最終的形狀特征。傅立葉描述子在頻域中獲得圖像中對象的輪廓表示,以傅立葉級數(shù)展開的系數(shù)作為對象的形狀特征。其中,形狀特征可以基于曲率、半徑或邊界坐標(biāo)。由于基于正交多項(xiàng)式分解的矩能夠?qū)D像內(nèi)容進(jìn)行重建,有人提出了 Zernike矩特征。具體來說,該方法將圖像信號展開為正交基的級數(shù),并采用變換系數(shù)作為特征元素。在常用的曲率尺度空間方法中,使用不同的尺度對圖像輪廓進(jìn)行平滑,并檢測曲率為零的位置,由此生成曲率尺度空間圖像,最后使用曲率尺度空間圖像的極大值來表示圖像中對象輪廓的形狀。

發(fā)明內(nèi)容
然而,已有的方法只描述圖像中對象的空間信息。一些方法使用部分結(jié)構(gòu)作為特征描述子,諸如基于網(wǎng)格的方法,而其它方法從整體統(tǒng)計(jì)中提取特征,諸如傅立葉描述子以及基于特征的矩。基本沒有特征能夠?qū)⒖臻g結(jié)構(gòu)和統(tǒng)計(jì)特征有機(jī)的結(jié)合起來。傳統(tǒng)的特征通常限于一些特定目標(biāo)圖像。例如,CSS特征只能處理閉合的輪廓。此外,在已有方法中存在的另一個問題是仿射不變性。本發(fā)明的目的是提供一種對圖像中的對象進(jìn)行檢測的裝置和方法以及生成分類器的裝置和方法,其將圖像中對象的空間結(jié)構(gòu)和統(tǒng)計(jì)特征有機(jī)結(jié)合,并實(shí)現(xiàn)對象檢測的特征描述子的旋轉(zhuǎn)不變性。本發(fā)明的一個實(shí)施例是一種用于對圖像中的對象進(jìn)行檢測的裝置,包括網(wǎng)格劃分部分,用于在以圖像中的特定點(diǎn)為極點(diǎn)的極坐標(biāo)系中,用多條極線和以極點(diǎn)為圓心的多個圓劃分網(wǎng)格,其中,網(wǎng)格是相鄰極線與相鄰圓或相鄰極線與圓中的最小圓所限定的區(qū)域, 極線的條數(shù)和圓的個數(shù)為常數(shù),并且,圓中最大圓的半徑大于等于圖像中的前景圖像的像素與特定點(diǎn)之間的最大距離;梯度方向直方圖獲得部分,用于針對每個網(wǎng)格,至少計(jì)算前景圖像中輪廓像素的相對于網(wǎng)格的參考方向的梯度方向并且根據(jù)所計(jì)算的梯度方向獲得網(wǎng)格的梯度方向直方圖;特征構(gòu)造部分,用于將所有網(wǎng)格的梯度方向直方圖連接成總直方圖向量,其中,每對相鄰極線限定的網(wǎng)格的梯度方向直方圖的連接順序相同,并且,特征構(gòu)造部分對總直方圖向量進(jìn)行傅立葉變換,以得到圖像的特征向量;以及對象檢測部分,用于基于所得到的特征向量對圖像中的對象進(jìn)行檢測。本發(fā)明的另一個實(shí)施例是一種對圖像中的對象進(jìn)行檢測的方法,包括在以圖像中的特定點(diǎn)為極點(diǎn)的極坐標(biāo)系中,用多條極線和以極點(diǎn)為圓心的多個圓劃分網(wǎng)格,其中,網(wǎng)格是相鄰極線與相鄰圓或相鄰極線與圓中的最小圓所限定的區(qū)域,極線的條數(shù)和圓的個數(shù)為常數(shù),并且,圓中最大圓的半徑大于等于圖像中的前景圖像的像素與特定點(diǎn)之間的最大距離;針對每個網(wǎng)格,至少計(jì)算前景圖像中輪廓像素的相對于網(wǎng)格的參考方向的梯度方向并且根據(jù)所計(jì)算的梯度方向獲得網(wǎng)格的梯度方向直方圖;將所有網(wǎng)格的梯度方向直方圖連接成總直方圖向量,其中,每對相鄰極線限定的網(wǎng)格的梯度方向直方圖的連接順序相同,并且,對總直方圖向量進(jìn)行傅立葉變換,以得到圖像的特征向量;以及基于所得到的特征向量對圖像中的對象進(jìn)行檢測。本發(fā)明的另一個實(shí)施例是一種用于生成分類器的裝置,包括網(wǎng)格劃分部分,用于在以圖像中的特定點(diǎn)為極點(diǎn)的極坐標(biāo)系中,用多條極線和以極點(diǎn)為圓心的多個圓劃分網(wǎng)格,其中,網(wǎng)格是相鄰極線與相鄰圓或相鄰極線與圓中的最小圓所限定的區(qū)域,極線的條數(shù)和圓的個數(shù)為常數(shù),并且,圓中最大圓的半徑大于等于圖像中的前景圖像的像素與特定點(diǎn)之間的最大距離;梯度方向直方圖獲得部分,用于針對每個網(wǎng)格,至少計(jì)算前景圖像中輪廓像素的相對于網(wǎng)格的參考方向的梯度方向并且根據(jù)所計(jì)算的梯度方向獲得網(wǎng)格的梯度方向直方圖;特征構(gòu)造部分,用于將所有網(wǎng)格的梯度方向直方圖連接成總直方圖向量,其中, 每對相鄰極線限定的網(wǎng)格的梯度方向直方圖的連接順序相同,并且,特征構(gòu)造部分對總直方圖向量進(jìn)行傅立葉變換,以得到圖像的特征向量;以及分類器生成部分,用于基于所得到的特征向量生成分類器。本發(fā)明的另一個實(shí)施例是一種生成分類器的方法,包括在以圖像中的特定點(diǎn)為極點(diǎn)的極坐標(biāo)系中,用多條極線和以極點(diǎn)為圓心的多個圓劃分網(wǎng)格,其中,網(wǎng)格是相鄰極線與相鄰圓或相鄰極線與圓中的最小圓所限定的區(qū)域,極線的條數(shù)和圓的個數(shù)為常數(shù),并且, 圓中最大圓的半徑大于等于圖像中的前景圖像的像素與特定點(diǎn)之間的最大距離;針對每個網(wǎng)格,至少計(jì)算前景圖像中輪廓像素的相對于網(wǎng)格的參考方向的梯度方向并且根據(jù)所計(jì)算的梯度方向獲得網(wǎng)格的梯度方向直方圖;將所有網(wǎng)格的梯度方向直方圖連接成總直方圖向量,其中,每對相鄰極線限定的網(wǎng)格的梯度方向直方圖的連接順序相同,并且,對總直方圖向量進(jìn)行傅立葉變換,以得到圖像的特征向量;以及基于所得到的特征向量生成分類器。利用本發(fā)明,通過網(wǎng)格劃分和在每個網(wǎng)格中的信息提取來將對象內(nèi)容的空間分布轉(zhuǎn)換為由網(wǎng)格劃分得到的特征,并將局部統(tǒng)計(jì)信息整合為圖像特征。除此之外,還實(shí)現(xiàn)了對象檢測的特征描述子的旋轉(zhuǎn)不變性。


參照下面結(jié)合附圖對本發(fā)明實(shí)施例的說明,會更加容易地理解本發(fā)明的以上和其它目的、特點(diǎn)和優(yōu)點(diǎn)。在附圖中,相同的或?qū)?yīng)的技術(shù)特征或部件將采用相同或?qū)?yīng)的附圖標(biāo)記來表示。在附圖中不必依照比例繪制出單元的尺寸和相對位置。圖1是示出根據(jù)本發(fā)明一個實(shí)施例的對象檢測裝置的結(jié)構(gòu)的框圖。圖2是示出根據(jù)本發(fā)明一個實(shí)施例的對象檢測方法的流程圖。圖3是示出根據(jù)本發(fā)明一個實(shí)施例的分類器生成裝置的結(jié)構(gòu)的框圖。圖4是示出根據(jù)本發(fā)明一個實(shí)施例的分類器生成方法的流程圖。圖5是示出根據(jù)本發(fā)明一個實(shí)施例的基于前景圖像的輪廓獲得圖像的特征向量的過程的流程圖。圖6是示出根據(jù)本發(fā)明一個實(shí)施例的基于前景圖像所有內(nèi)容獲得圖像的特征向量的過程的流程圖。圖7是說明如何均勻劃分網(wǎng)格以及基于輪廓像素非均勻劃分網(wǎng)格的示意圖。圖8是說明如何均勻劃分網(wǎng)格以及基于前景圖像上全部像素非均勻劃分網(wǎng)格的示意圖。圖9是說明梯度方向總直方圖連接順序的圖。圖10是說明如何通過距離變換得到非輪廓像素的梯度方向的示意圖。圖11是示出實(shí)現(xiàn)本發(fā)明實(shí)施例的計(jì)算機(jī)的示例性結(jié)構(gòu)的框圖。
具體實(shí)施例方式下面參照附圖來說明本發(fā)明的實(shí)施例。應(yīng)當(dāng)注意,為了清楚的目的,附圖和說明中省略了與本發(fā)明無關(guān)的、本領(lǐng)域技術(shù)人員已知的部件和處理的表示和描述。圖1是示出根據(jù)本發(fā)明一個實(shí)施例的對象檢測裝置的結(jié)構(gòu)框圖。如圖1所示,對象檢測裝置100包括網(wǎng)格劃分部分101、梯度方向直方圖獲得部分102、特征構(gòu)造部分103 以及對象檢測部分104。該對象檢測裝置進(jìn)行檢測所采用的分類器以及該分類器的訓(xùn)練過程將在后文中進(jìn)行說明。當(dāng)對象檢測裝置100接收到待檢測的圖像時(shí),由網(wǎng)格劃分部分101針對待檢測圖像劃分網(wǎng)格。為了保證圖像特征提取的旋轉(zhuǎn)不變性,該劃分在極坐標(biāo)系中進(jìn)行。選擇待檢測圖像中的特定點(diǎn)作為該極坐標(biāo)系的極點(diǎn)。該特定點(diǎn)可以是任意的。在某些實(shí)施例中,示例性而非限制地,可以采用待檢測圖像中的前景圖像的重心或者幾何中心作為該坐標(biāo)系的極點(diǎn)。下面說明前景圖像的幾何中心和重心的概念。設(shè)對于任一前景圖像和特定的直角坐標(biāo)系,該前景圖像的幾何中心為(,^iniL-),其中^-和^^是前景圖像
在該特定直角坐標(biāo)系上的最小橫坐標(biāo)和最小縱坐標(biāo),Xfflax和ymax是前景圖像在該特定直角坐標(biāo)系上的最大橫坐標(biāo)和最大縱坐標(biāo)。
QQ而該前景圖像的重心為()其中,Q為前景圖像中像素的數(shù)目,(Xi,
β ‘ β ‘
Yi)為前景圖像中第i個像素Pi的坐標(biāo)。恰當(dāng)?shù)臉O點(diǎn)選擇可以帶來圖像檢測的平移不變性。參考圖8,圖8的(a)中所示的黑色部分是待檢測圖像的前景圖像。在使用圖8所描述的實(shí)施例中,如圖8的(b)和(c)所示,極坐標(biāo)系的極點(diǎn)選擇為前景圖像的幾何中心。在確定極點(diǎn)后,以多條從極點(diǎn)發(fā)射的射線(下文中稱為“極線”)以及多個以極點(diǎn)為圓心的圓劃分網(wǎng)格。所謂網(wǎng)格,即兩條相鄰極線與兩個相鄰圓或者兩條相鄰極線與該多個同心圓中的最小圓共同限定的區(qū)域。就特定的分類器而言,對于不同的樣本圖像,用于劃分網(wǎng)格的極線的條數(shù)和圓的個數(shù)分別為常數(shù)。極線條數(shù)和圓的個數(shù)的確定取決于特定分類器的具體要求,通常考慮圖像檢測準(zhǔn)確度和對噪聲的魯棒性來確定。大體來說,網(wǎng)格劃分越精細(xì),即極線條數(shù)和圓的個數(shù)越多,圖像檢測準(zhǔn)確度越高,但當(dāng)達(dá)到或超過一定閾值時(shí),檢測準(zhǔn)確性受噪聲干擾的影響將變得不可接受。在一些實(shí)施例中,所采用的角度方向的劃分(如12個)比徑向方向的劃分(如4 至8個)要多。也就是說,用于劃分的極線的數(shù)目多于以極點(diǎn)為中心的圓的數(shù)目。以極點(diǎn)為圓心的圓中的最大圓的半徑可以根據(jù)前景圖像的像素與極點(diǎn)的最大距離來確定。雖然在圖7和圖8中只示出了最大圓的半徑等于前景圖像的像素與極點(diǎn)的最大距離的實(shí)施例,然而,本領(lǐng)域技術(shù)人員可以明白該最大圓半徑的選取只要滿足使得能夠?qū)λ_定的前景圖像進(jìn)行全面分析,即網(wǎng)格能夠覆蓋前景圖像的所有像素即可。因此,該最大圓的半徑也可以大于待檢測的圖像中的前景圖像的像素與極點(diǎn)之間的最大距離。關(guān)于前景圖像的確定,可以使用本領(lǐng)域公知的各種方法。需要注意的是在確定出前景圖像之后,使用本申請公開的方法進(jìn)行網(wǎng)格劃分之前,在某些實(shí)施例中,出于突出主體的目的,將使用已有方法確定出的前景圖像中某些異常突起的部分作為噪聲排除在要進(jìn)行網(wǎng)格劃分的前景圖像之外,來確定多個圓中最大圓的半徑。針對這種實(shí)施例,“要進(jìn)行網(wǎng)格劃分的前景圖像”是進(jìn)行了上述排除之后的前景圖像。下面說明這種排除的具體實(shí)現(xiàn)的例子。例如,以圖像的重心(此處必須是重心,不能是中心)為極點(diǎn),在極坐標(biāo)系中建立同心圓的劃分。一般來說,同心圓的距離相等,即同心圓的半徑構(gòu)成等差序列。然后,統(tǒng)計(jì)相鄰?fù)膱A之間的圓環(huán)中圖像的像素的數(shù)目。最后, 從最大的同心圓圓環(huán)開始,如果連續(xù)幾個圓環(huán)中的像素?cái)?shù)目都比較少,則認(rèn)為這幾個圓環(huán)對應(yīng)的圖像屬于“異常突起或噪聲”,于是,將這部分圖像從前景圖像中排除。下面參考圖7和圖8進(jìn)一步說明網(wǎng)格劃分部分101進(jìn)行的網(wǎng)格劃分的具體示例。 在不同的實(shí)施例中,可以采用不同的網(wǎng)格劃分方式,大致分為均勻劃分和非均勻劃分方式。其中,均勻劃分是指用于劃分網(wǎng)格的圓中相鄰圓之間的徑向距離等于最小圓的半徑, 并且相鄰極線之間的夾角相等。非均勻劃分是指使得相鄰圓之間所限定的以及最小圓所限定的前景圖像上的像素或輪廓像素的數(shù)目相等,并且使得相鄰極線之間所限定的前景圖像上的像素或輪廓像素的數(shù)目相等的劃分方式??梢姡蔷鶆騽澐址绞娇煞譃榛谇熬皥D像上的全部像素的劃分和基于前景圖像上的輪廓像素的劃分。下面將逐個說明這幾種方式。圖7是說明如何均勻劃分網(wǎng)格以及基于輪廓像素非均勻劃分網(wǎng)格的示意圖。圖8 是說明如何均勻劃分網(wǎng)格以及基于前景圖像上全部像素非均勻劃分網(wǎng)格的示意圖。圖7和圖8的(a)中各自示出了從待檢測圖像中確定出的前景圖像(黑色部分)。 圖7的(b)和(c)示出該前景圖像的輪廓部分。圖8的(b)和(c)示出該前景圖像的全部內(nèi)容。在圖7和圖8的(b)中,各自示出了以均勻劃分的方式劃分網(wǎng)格的實(shí)施例。在這兩個實(shí)施例中,網(wǎng)格劃分部分101都使用4條極線和4個以極點(diǎn)為圓心的圓對前景圖像進(jìn)行劃分。從圖中可以直觀地看到4條極線兩兩之間的夾角相等(90° ),并且相鄰圓之間的徑向距離等于4個圓中最小圓的半徑。采用均勻劃分方式,使得對對象的檢測過程更簡單且計(jì)算量較小。圖7的(c)中示出了基于前景圖像上的輪廓像素的數(shù)目進(jìn)行非均勻劃分的示例。 所述的非均勻是指幾何空間上可能出現(xiàn)的不均勻,如圖7的(c)所示。在該實(shí)施例中,網(wǎng)格劃分部分101確定圓和極線,使得相鄰圓之間所限定的以及最小圓內(nèi)限定的前景圖像上的輪廓像素的數(shù)目相等,并且相鄰極線之間所限定的輪廓像素的數(shù)目相等。例如,該示例中,最小圓內(nèi)所限定的輪廓像素的數(shù)目等于最小圓與第二小的圓所限定圓環(huán)內(nèi)的輪廓像素的數(shù)目,等于第二小的圓與第三小的圓(即第二大的圓)所限定圓環(huán)內(nèi)的輪廓像素的數(shù)目,并等于第二大的圓與最大圓所限定圓環(huán)內(nèi)的輪廓像素的數(shù)目。同時(shí),圖7的(c)中所示4條極線中兩兩相鄰的兩條極線所限定的區(qū)域內(nèi)的前景圖像輪廓像素的數(shù)目相等。圖8的(c)中示出了基于前景圖像上的全部像素的數(shù)目進(jìn)行非均勻劃分的示例。 在該示例中,網(wǎng)格劃分部分101確定圓和極線,使得相鄰圓之間所限定的以及最小圓所限定的前景圖像上的像素的數(shù)目相等,并且相鄰極線之間所限定的前景圖像上的像素的數(shù)目相等。例如,該實(shí)施例中,最小圓內(nèi)所限定的前景圖像像素的數(shù)目等于最小圓與第二小的圓所限定的圓環(huán)內(nèi)的前景圖像像素的數(shù)目,等于第二小的圓與第三小的圓(即第二大的圓)所限定圓環(huán)內(nèi)的前景圖像像素的數(shù)目,并等于第二大的圓與最大圓所限定圓環(huán)內(nèi)的前景圖像像素的數(shù)目。同時(shí),圖8的(c)中所示4條極線中兩兩相鄰的兩條極線所限定的區(qū)域內(nèi)的前景圖像像素的數(shù)目相等。在對待檢測圖像進(jìn)行網(wǎng)格劃分后,針對由網(wǎng)格劃分部分101劃分的每個網(wǎng)格,梯度方向直方圖獲得部分102進(jìn)行計(jì)算以獲得每個網(wǎng)格的梯度方向直方圖。為了得到每個網(wǎng)格的梯度方向直方圖,梯度方向直方圖獲得部分102計(jì)算前景圖像上輪廓像素或前景圖像中所有像素的相對于網(wǎng)格的參考方向的梯度方向。像素相對于網(wǎng)格的參考方向的梯度方向例如可以通過該像素的梯度方向與該網(wǎng)格的參考方向的夾角來獲得。然后,梯度方向直方圖獲得部分102根據(jù)所計(jì)算的梯度方向獲得每個網(wǎng)格的梯度方向直方圖。首先,說明網(wǎng)格參考方向的概念。為了便于說明,設(shè)給定一個網(wǎng)格Cij,其中i = 1,. . .,M,j = 1,. . . N分別表示角度方向和徑向網(wǎng)格個數(shù)。假設(shè)限定該網(wǎng)格Cij的兩條極線的極角分別是Qi* ei+1。則在一個實(shí)施例中,參考圖7,代表該網(wǎng)格Cu的參考方向的X方向的反向延長線穿過極點(diǎn),并且,該χ方向與極軸所成的極角是θχ= (θ +θ +1)/2ο換句話說,該網(wǎng)格的參考方向經(jīng)過極點(diǎn)并且均分限定該網(wǎng)格的兩個相鄰極線的夾角。但可選擇的網(wǎng)格的參考方向不限于此,參考方向χ既可以均分限定該網(wǎng)格的兩條相鄰極線的夾角, 也可以不均分相鄰極線的夾角,諸如以1 2或2 3等任意比例分割該夾角。對于所劃分的網(wǎng)格中的每個網(wǎng)格,可以基于相同的準(zhǔn)則來確定參考方向。網(wǎng)格參考方向的確定規(guī)則可以是預(yù)先指定的。在不同的實(shí)施例中,梯度方向直方圖獲得部分102可以只計(jì)算前景圖像中的輪廓像素相對于網(wǎng)格參考方向的梯度方向,也可以計(jì)算前景圖像中所有像素相對于網(wǎng)格參考方向的梯度方向。相比較而言,計(jì)算前景圖像中所有像素相對于網(wǎng)格參考方向的梯度方向增加了計(jì)算量,但帶來了相對更準(zhǔn)確的檢測效果。在只計(jì)算前景圖像中的輪廓像素相對于網(wǎng)格參考方向的梯度方向的一個實(shí)施例中,梯度方向直方圖獲得部分102計(jì)算網(wǎng)格中輪廓像素的梯度方向,并針對該網(wǎng)格的參考方向進(jìn)行轉(zhuǎn)換,得到輪廓像素相對于該參考方向的梯度方向。輪廓像素梯度方向的計(jì)算方法可以使用本領(lǐng)域中已知的各種方法。在得到該網(wǎng)格中輪廓像素相對于參考方向的梯度方向后,將該網(wǎng)格中的輪廓像素按方向劃分到k個區(qū)間(bin)中,即生成k-bin的方向直方圖。在計(jì)算前景圖像中的所有像素相對于網(wǎng)格參考方向的梯度方向的實(shí)施例中,在得到輪廓像素的梯度方向之后,通過到輪廓像素的距離變換來獲得非輪廓像素的梯度方向。 具體來說,首先,以輪廓像素為邊界像素計(jì)算整個連通域的距離變換。距離變換以后,就可以為連通域內(nèi)部的每個像素(即非輪廓像素)找到距離最近的輪廓像素。換句話說,連通域內(nèi)部的每個像素都有至少一個對應(yīng)的輪廓像素。將與非輪廓像素距離最近的輪廓像素的梯度方向作為該非輪廓像素的梯度方向。同樣,在得到網(wǎng)格中所有前景圖像上的像素相對于參考方向的梯度方向后,將該網(wǎng)格中的前景圖像上的像素按方向劃分到k個區(qū)間(bin) 中,即生成k-bin的方向直方圖。距離變換的具體方法參見諸如Heinz Breu, Joseph Gil, David Kirkpatrick,以 Μ. Michael Werman ^AW "Linear Time Euclidean Distance Transform Algorithms,,。圖10是說明如何通過距離變換得到非輪廓像素的梯度方向的示意圖。如圖10所示,閉合連通域1001是待檢測圖像的前景圖像。其中,像素a、b和c是該前景圖像上的非輪廓像素,而像素A、B以及C和C’是非輪廓像素a、b和c通過距離變換分別映射到的輪廓像素。根據(jù)上述本發(fā)明的實(shí)施例,則輪廓像素A和B的梯度方向分別作為非輪廓像素a和b的梯度方向。而由于非輪廓像素c具有兩個對應(yīng)的輪廓像素C和C’, 因此,擇一選用輪廓像素C和C’的梯度方向作為非輪廓像素c的梯度方向。該選擇可以隨機(jī)進(jìn)行。顯然,在不同實(shí)施例中,既可以先計(jì)算輪廓像素相對于參考方向的梯度方向,再進(jìn)行距離變換以獲得非輪廓像素相對于參考方向的梯度方向;也可以在計(jì)算輪廓像素的梯度方向之后即進(jìn)行距離變換,以得到非輪廓像素的梯度方向,然后,再統(tǒng)一計(jì)算輪廓像素和非輪廓像素相對于參考方向的梯度方向。在由梯度方向直方圖獲得部分102獲得每個網(wǎng)格的梯度方向直方圖之后,特征構(gòu)造部分103將獲得的所有網(wǎng)格的梯度方向直方圖連接成MXNXk(M,角度方向劃分?jǐn)?shù);N,徑向劃分?jǐn)?shù);k,每個網(wǎng)格的梯度方向直方圖的區(qū)間(bin)數(shù))的總直方圖向量。需要注意的是每對相鄰極線限定的網(wǎng)格的梯度方向直方圖的連接順序相同?,F(xiàn)在參考圖9說明總直方圖的連接順序。圖9是說明梯度方向總直方圖連接順序的圖。如上面提到的,設(shè)給定一個網(wǎng)格Cij,其中,i = 1,...,M,j = 1,...N分別表示角度方向和徑向網(wǎng)格個數(shù)。在圖9所示的實(shí)施例中,M = N = 4。在一個實(shí)施例中,可以先徑向后角度地且按照逆時(shí)針方向進(jìn)行總直方圖的連接。 具體來說,連接順序可以是 ^n ? C12 9 C13 C14 C219 C22J C23J C24,· · ·,C42 ? C43 C^o 此外,連接順序還可以是 〇14,C13,C12 C11J C24, C23,C22,C2i ? · · ·,C44 C43,C42 ? C4^ ;或者甚至是 C12, C11J C13
C14,C22,C219 C23J C24,· · · c42 9 C41,C43 C440在另外一個實(shí)施例中,可以先徑向后角度地且按照順時(shí)針方向進(jìn)行總直方圖的連接。例如, Cn,C14 C12 9 C13 C419 C44 C42,C43,C3i· · · C219 c24,C22,C230 其它情況與上面類似,不再贅述??梢姡灰WC每對相鄰極線限定的網(wǎng)格(即徑向方向)的梯度方向直方圖的連接順序相同,而無論是先后如何的連接順序,都可以滿足要求。上面兩個實(shí)施例舉出了沿角度方向順時(shí)針、逆時(shí)針連接的情況,此外,即使在角度方向上跳行連接也可以滿足要求。例
如C11J C12 ? C13 C14 C3I ? C32J C33J C34 C41,· · ·,c21,C22,C23,C240在將所有網(wǎng)格的梯度方向直方圖連接成總直方圖向量之后,特征構(gòu)造部分103對該總直方圖向量進(jìn)行傅立葉變換,并以變換后得到的幅值作為待檢測圖像的特征向量。由于采用了極坐標(biāo)空間和傅立葉變換,所得到的特征向量具有旋轉(zhuǎn)不變性。基于所得到的特征向量,對象檢測部分104采用要在下面結(jié)合圖3說明的對象分類器對待檢測圖像中的對象進(jìn)行檢測。圖2是示出根據(jù)本發(fā)明一個實(shí)施例的對象檢測方法的流程圖。以下說明的對象檢測是采用后文將要結(jié)合圖3說明的分類器進(jìn)行的。如圖2所示,在步驟S201中,針對待檢測圖像中的前景圖像劃分網(wǎng)格。該劃分在以待檢測圖像中的特定點(diǎn)為極點(diǎn)的極坐標(biāo)系中進(jìn)行。就特定的分類器而言,對于不同的樣本圖像,劃分網(wǎng)格所使用的以極點(diǎn)為中心的圓和極線的個數(shù)分別為常數(shù)。此外,這些圓中最大圓的半徑大于等于待檢測圖像中前景圖像的像素與極點(diǎn)之間的最大距離。該極點(diǎn)可以選用前景圖像的重心或幾何中心。網(wǎng)格的劃分可以采用基于幾何空間的均勻劃分方法,或者基于相鄰圓和相鄰極線之間所限定輪廓像素?cái)?shù)或前景像素?cái)?shù)的非均勻劃分方法。其具體實(shí)現(xiàn)與對檢測裝置的描述部分相同,此處不再進(jìn)行贅述。在步驟S202中,計(jì)算每個網(wǎng)格中前景圖像上的像素或輪廓像素相對于該網(wǎng)格的參考方向的梯度方向,并獲得梯度方向直方圖。像素相對于網(wǎng)格的參考方向的梯度方向例如可以通過該像素的梯度方向與該網(wǎng)格的參考方向的夾角來獲得。網(wǎng)格的參考方向可以是預(yù)先確定的。該方向所在直線可以經(jīng)過極點(diǎn),均分或以任意比例分割限定該網(wǎng)格的兩個極線的夾角??梢愿鶕?jù)每個網(wǎng)格中輪廓像素或所有前景像素的梯度方向相對于參考方向的梯度方向獲得每個網(wǎng)格的k-bin梯度方向直方圖。在基于所有前景像素的梯度方向獲得梯度方向直方圖的實(shí)施例中,可以使用距離變換將非輪廓像素映射到最近的輪廓像素,并將該最近的輪廓像素的梯度方向作為該非輪廓像素的梯度方向。在步驟S203中,基于每個網(wǎng)格的梯度方向直方圖獲得總直方圖,并進(jìn)行傅立葉變換,從而將變換后的幅值作為待檢測圖像的特征向量。在將所有網(wǎng)格的梯度方向直方圖連接為總直方圖的過程中,每對相鄰極線所限定的網(wǎng)格的梯度方向直方圖的連接順序保持相同。在步驟S204中,基于構(gòu)造的特征向量,采用下面結(jié)合圖3所說明的分類器,檢測圖像中的對象。根據(jù)本發(fā)明的實(shí)施例,還提供了一種圖像分類器生成裝置。圖3是示出根據(jù)本發(fā)明一個實(shí)施例的分類器生成裝置的結(jié)構(gòu)的框圖。
如圖3所示,分類器生成裝置300包括網(wǎng)格劃分部分301、梯度方向直方圖獲得部分302、特征構(gòu)造部分303以及分類器生成部分304。其中,網(wǎng)格劃分部分301、梯度方向直方圖獲得部分302和特征構(gòu)造部分303的功能和構(gòu)造分別與圖1中所示網(wǎng)格劃分部分 101、梯度方向直方圖獲得部分102和特征構(gòu)造部分103的相似;其區(qū)別僅在于網(wǎng)格劃分部分301、梯度方向直方圖獲得部分302和特征構(gòu)造部分303對一組樣本圖像進(jìn)行特征提取,而檢測裝置100中的網(wǎng)格劃分部分101、梯度方向直方圖獲得部分102和特征構(gòu)造部分 103只對待檢測圖像的前景圖像進(jìn)行特征提取。因而,省略重復(fù)說明。在分類器生成部分304中,基于從特征構(gòu)造部分303得到的多個樣本圖像的特征向量生成分類器。相似地,根據(jù)本發(fā)明的實(shí)施例,還提供了一種分類器生成方法。圖4是示出根據(jù)本發(fā)明一個實(shí)施例的分類器生成方法的流程圖。圖4中所示的、為獲得圖像特征向量所進(jìn)行的步驟S401到S403與圖2中所示的步驟S201到S203中所進(jìn)行的處理相似;區(qū)別在于步驟S401到S403中進(jìn)行的處理是針對一組樣本圖像進(jìn)行的。因而,省略其重復(fù)說明。在圖4的步驟S404中,基于在步驟S403中得到的樣本圖像的特征向量,生成圖像的分類器。下面結(jié)合具體實(shí)例說明從輸入圖像中提取圖像的特征向量的處理。圖5是示出根據(jù)本發(fā)明一個實(shí)施例的基于前景圖像的輪廓獲得圖像的特征向量的過程的流程圖。首先,在步驟S501中,對輸入的圖像進(jìn)行二值化處理以及連通域分析,以確定前
景圖像。 前景圖像確定后,在步驟S502中,計(jì)算前景圖像的輪廓像素的梯度方向。然后,進(jìn)行到步驟S503。在步驟S503中,按照預(yù)先確定的網(wǎng)格劃分規(guī)則,確定劃分網(wǎng)格的同心圓和極線的數(shù)目,以及使用均勻劃分和非均勻劃分哪一種劃分方式。并基于前景圖像,選擇網(wǎng)格所在極坐標(biāo)系的極點(diǎn),并確定同心圓中最大圓的半徑。在網(wǎng)格劃分完畢后,按照一定規(guī)則確定網(wǎng)格的參考方向。在確定了網(wǎng)格以及其參考方向后,在步驟S504中,計(jì)算輪廓像素相對于各網(wǎng)格參考方向的梯度方向,并得到每個網(wǎng)格的梯度方向直方圖。然后,步驟進(jìn)行到步驟S505。在步驟S505中,將每個網(wǎng)格的方向直方圖連接為整個前景圖像的總直方圖向量, 并對該總直方圖向量進(jìn)行傅立葉變換,從而得到待檢測圖像的特征向量。在本實(shí)例中,該特征向量為傅立葉變換后得到的幅值。圖6是示出根據(jù)本發(fā)明一個實(shí)施例的基于前景圖像所有內(nèi)容獲得圖像的特征向量的過程的流程圖。圖6所述實(shí)例與圖5所述實(shí)例的區(qū)別在于除前景圖像的輪廓像素之外,還基于前景圖像的非輪廓像素獲得圖像的特征向量。圖6中的步驟S601、S602以及步驟S603到S605與圖5中的步驟S501到S505實(shí)質(zhì)相同。唯一的區(qū)別是在S604中,每個網(wǎng)格的梯度方向直方圖是基于前景圖像中的輪廓像素和非輪廓像素相對于參考方向的梯度方向獲得的。因此,在此省略這些步驟的詳細(xì)說明。
在圖6的步驟S606中,計(jì)算前景圖像的非輪廓像素的梯度方向。該梯度方向可以利用距離變換來獲得。詳細(xì)地說,將輪廓像素作為邊界像素,通過距離變換,將非輪廓像素映射到距其最近的輪廓像素,并將該輪廓像素的梯度方向作為該非輪廓像素的梯度方向。在本發(fā)明的各個實(shí)施例中,將對象內(nèi)容的空間分布轉(zhuǎn)換為由網(wǎng)格劃分得到的特征,并且將局部統(tǒng)計(jì)信息整合為特征。更具體地,在每個網(wǎng)格中分別計(jì)算邊緣方向直方圖, 并根據(jù)所有這些直方圖產(chǎn)生最終的特征向量。此外,提出了實(shí)現(xiàn)特征的仿射不變性的方案 采用極坐標(biāo)系和傅立葉變換實(shí)現(xiàn)了對象檢測的旋轉(zhuǎn)不變性;在一些實(shí)施例中,采用圖像的特定點(diǎn)諸如中心或重心提取特征,實(shí)現(xiàn)了對象檢測的平移不變性;此外,還可以在一些實(shí)施例中,使用歸一化的直方圖(即直方圖的和為1),實(shí)現(xiàn)對象檢測的尺度不變性。下文中,參考圖11描述實(shí)現(xiàn)本發(fā)明的數(shù)據(jù)處理設(shè)備的計(jì)算機(jī)的示例性結(jié)構(gòu)。圖11 是示出實(shí)現(xiàn)本發(fā)明的計(jì)算機(jī)的示例性結(jié)構(gòu)的框圖。在圖11中,中央處理單元(CPU) 1101根據(jù)只讀存儲器(ROM) 1102中存儲的程序或從存儲部分1108加載到隨機(jī)存取存儲器(RAM) 1103的程序執(zhí)行各種處理。在RAM 1103中, 也根據(jù)需要存儲當(dāng)CPU 1101執(zhí)行各種處理時(shí)所需的數(shù)據(jù)。CPU 110UR0M 1102和RAM 1103經(jīng)由總線1104彼此連接。輸入/輸出接口 1105 也連接到總線1104。下述部件連接到輸入/輸出接口 1105 輸入部分1106,包括鍵盤、鼠標(biāo)等;輸出部分1107,包括顯示器,諸如陰極射線管(CRT)、液晶顯示器(LCD)等,以及揚(yáng)聲器等;存儲部分1108,包括硬盤等;以及通信部分1109,包括網(wǎng)絡(luò)接口卡諸如LAN卡、調(diào)制解調(diào)器等。通信部分1109經(jīng)由網(wǎng)絡(luò)諸如因特網(wǎng)執(zhí)行通信處理。根據(jù)需要,驅(qū)動器1110也連接到輸入/輸出接口 1105??刹鹦督橘|(zhì)1111諸如磁盤、光盤、磁光盤、半導(dǎo)體存儲器等根據(jù)需要被安裝在驅(qū)動器1110上,使得從中讀出的計(jì)算機(jī)程序根據(jù)需要被安裝到存儲部分1108中。在通過軟件實(shí)現(xiàn)上述步驟和處理的情況下,從網(wǎng)絡(luò)諸如因特網(wǎng)或存儲介質(zhì)諸如可拆卸介質(zhì)1111安裝構(gòu)成軟件的程序。本領(lǐng)域的技術(shù)人員應(yīng)當(dāng)理解,這種存儲介質(zhì)不局限于圖11所示的其中存儲有程序、與方法相分離地分發(fā)以向用戶提供程序的可拆卸介質(zhì)1111??刹鹦督橘|(zhì)1111的例子包含磁盤、光盤(包含光盤只讀存儲器(⑶-ROM)和數(shù)字通用盤(DVD))、磁光盤(包含迷你盤 (MD)和半導(dǎo)體存儲器?;蛘?,存儲介質(zhì)可以是ROM 1102、存儲部分1108中包含的硬盤等, 其中存有程序,并且與包含它們的方法一起被分發(fā)給用戶。在前面的說明書中參照特定實(shí)施例描述了本發(fā)明。然而本領(lǐng)域的普通技術(shù)人員理解,在不偏離如權(quán)利要求書限定的本發(fā)明的范圍的前提下可以進(jìn)行各種修改和改變。關(guān)于包括以上各實(shí)施例的實(shí)施方式,還公開下述附記Mid 1. 一種用于對圖像中的對象進(jìn)行檢測的裝置,包括網(wǎng)格劃分部分,用于在以圖像中的特定點(diǎn)為極點(diǎn)的極坐標(biāo)系中,用多條極線和以極點(diǎn)為圓心的多個圓劃分網(wǎng)格,其中,所述網(wǎng)格是相鄰極線與相鄰圓或相鄰極線與圓中的最小圓所限定的區(qū)域,所述極線的條數(shù)和所述圓的個數(shù)為常數(shù),并且,所述圓中最大圓的半徑大于等于所述圖像中的前景圖像的像素與所述特定點(diǎn)之間的最大距離;
梯度方向直方圖獲得部分,用于針對每個網(wǎng)格,至少計(jì)算前景圖像中輪廓像素的相對于所述網(wǎng)格的參考方向的梯度方向并且根據(jù)所計(jì)算的梯度方向獲得所述網(wǎng)格的梯度方向直方圖;特征構(gòu)造部分,用于將所有網(wǎng)格的梯度方向直方圖連接成總直方圖向量,其中,每對相鄰極線限定的網(wǎng)格的梯度方向直方圖的連接順序相同,并且,所述特征構(gòu)造部分對所述總直方圖向量進(jìn)行傅立葉變換,以得到所述圖像的特征向量;以及對象檢測部分,用于基于所得到的特征向量對所述圖像中的對象進(jìn)行檢測。2.根據(jù)附記1所述的裝置,其中,所述梯度方向直方圖獲得部分還計(jì)算在所述前景圖像上的非輪廓像素的梯度方向。3.根據(jù)附記2所述的裝置,其中,所述梯度方向直方圖獲得部分將所述前景圖像的非輪廓像素通過距離變換所映射到的輪廓像素的梯度方向作為所述非輪廓像素的梯度方向。4.根據(jù)附記1到3中任一個所述的裝置,其中,所述相鄰圓之間的徑向距離等于所述圓中最小圓的半徑,并且所述相鄰極線之間的夾角相等。5.根據(jù)附記1到3中任一個所述的裝置,其中,所述網(wǎng)格劃分部分確定所述圓和極線,使得相鄰圓之間所限定的以及所述最小圓所限定的前景圖像上的像素或輪廓像素的數(shù)目相等,并且使得所述相鄰極線之間所限定的前景圖像上的像素或輪廓像素的數(shù)目相等。6.根據(jù)附記1到3中任一個所述的裝置,其中,所述特定點(diǎn)是所述前景圖像的幾何中心或重心。7.根據(jù)附記1到3中任一個所述的裝置,其中,所述網(wǎng)格的所述參考方向經(jīng)過所述特定點(diǎn)并且均分限定所述網(wǎng)格的兩個極線的夾角。8. 一種對圖像中的對象進(jìn)行檢測的方法,包括在以圖像中的特定點(diǎn)為極點(diǎn)的極坐標(biāo)系中,用多條極線和以極點(diǎn)為圓心的多個圓劃分網(wǎng)格,其中,所述網(wǎng)格是相鄰極線與相鄰圓或相鄰極線與圓中的最小圓所限定的區(qū)域, 所述極線的條數(shù)和所述圓的個數(shù)為常數(shù),并且,所述圓中最大圓的半徑大于等于所述圖像中的前景圖像的像素與所述特定點(diǎn)之間的最大距離;針對每個網(wǎng)格,至少計(jì)算前景圖像中輪廓像素的相對于所述網(wǎng)格的參考方向的梯度方向并且根據(jù)所計(jì)算的梯度方向獲得所述網(wǎng)格的梯度方向直方圖;將所有網(wǎng)格的梯度方向直方圖連接成總直方圖向量,其中,每對相鄰極線限定的網(wǎng)格的梯度方向直方圖的連接順序相同,并且,對所述總直方圖向量進(jìn)行傅立葉變換,以得到所述圖像的特征向量;以及基于所得到的特征向量對所述圖像中的對象進(jìn)行檢測。9.根據(jù)附記8所述的方法,其中,所述計(jì)算還包括計(jì)算在所述前景圖像上的非輪廓像素的梯度方向。10.根據(jù)附記9所述的方法,其中,所述計(jì)算還包括將所述前景圖像的非輪廓像素通過距離變換所映射到的輪廓像素的梯度方向作為所述非輪廓像素的梯度方向。11.根據(jù)附記8到10中任一個所述的方法,其中,所述相鄰圓之間的徑向距離等于所述圓中最小圓的半徑,并且所述相鄰極線之間的夾角相等。12.根據(jù)附記8到10中任一個所述的方法,其中,所述劃分包括確定所述圓和極線,使得相鄰圓之間所限定的以及所述最小圓所限定的前景圖像上的像素或輪廓像素的數(shù)目相等,并且使得所述相鄰極線之間所限定的前景圖像上的像素或輪廓像素的數(shù)目相等。13.根據(jù)附記8到10中任一個所述的方法,其中,所述特定點(diǎn)是所述前景圖像的幾何中心或重心。14.根據(jù)附記8到10中任一個所述的方法,其中,所述網(wǎng)格的所述參考方向經(jīng)過所述特定點(diǎn)并且均分限定所述網(wǎng)格的兩個極線的夾角。15. 一種用于生成分類器的裝置,包括網(wǎng)格劃分部分,用于在以圖像中的特定點(diǎn)為極點(diǎn)的極坐標(biāo)系中,用多條極線和以極點(diǎn)為圓心的多個圓劃分網(wǎng)格,其中,所述網(wǎng)格是相鄰極線與相鄰圓或相鄰極線與圓中的最小圓所限定的區(qū)域,所述極線的條數(shù)和所述圓的個數(shù)為常數(shù),并且,所述圓中最大圓的半徑大于等于所述圖像中的前景圖像的像素與所述特定點(diǎn)之間的最大距離;梯度方向直方圖獲得部分,用于針對每個網(wǎng)格,至少計(jì)算前景圖像中輪廓像素的相對于所述網(wǎng)格的參考方向的梯度方向并且根據(jù)所計(jì)算的梯度方向獲得所述網(wǎng)格的梯度方向直方圖;特征構(gòu)造部分,用于將所有網(wǎng)格的梯度方向直方圖連接成總直方圖向量,其中,每對相鄰極線限定的網(wǎng)格的梯度方向直方圖的連接順序相同,并且,所述特征構(gòu)造部分對所述總直方圖向量進(jìn)行傅立葉變換,以得到所述圖像的特征向量;以及分類器生成部分,用于基于所得到的特征向量生成分類器。16.根據(jù)附記15所述的裝置,其中,所述梯度方向直方圖獲得部分還計(jì)算在所述前景圖像上的非輪廓像素的梯度方向。17.根據(jù)附記16所述的裝置,其中,所述梯度方向直方圖獲得部分將所述前景圖像的非輪廓像素通過距離變換所映射到的輪廓像素的梯度方向作為所述非輪廓像素的梯度方向。18.根據(jù)附記15到17中任一個所述的裝置,其中,所述相鄰圓之間的徑向距離等于所述圓中最小圓的半徑,并且所述相鄰極線之間的夾角相等。19.根據(jù)附記15到17中任一個所述的裝置,其中,所述網(wǎng)格劃分部分確定所述圓和極線,使得相鄰圓之間所限定的以及所述最小圓所限定的前景圖像上的像素或輪廓像素的數(shù)目相等,并且使得所述相鄰極線之間所限定的前景圖像上的像素或輪廓像素的數(shù)目相寸。20.根據(jù)附記15到17中任一個所述的裝置,其中,所述特定點(diǎn)是所述前景圖像的幾何中心或重心。21.根據(jù)附記15到17中任一個所述的裝置,其中,所述網(wǎng)格的所述參考方向經(jīng)過所述特定點(diǎn)并且均分限定所述網(wǎng)格的兩個極線的夾角。22. 一種生成分類器的方法,包括在以圖像中的特定點(diǎn)為極點(diǎn)的極坐標(biāo)系中,用多條極線和以極點(diǎn)為圓心的多個圓劃分網(wǎng)格,其中,所述網(wǎng)格是相鄰極線與相鄰圓或相鄰極線與圓中的最小圓所限定的區(qū)域, 所述極線的條數(shù)和所述圓的個數(shù)為常數(shù),并且,所述圓中最大圓的半徑大于等于所述圖像中的前景圖像的像素與所述特定點(diǎn)之間的最大距離;針對每個網(wǎng)格,至少計(jì)算前景圖像中輪廓像素的相對于所述網(wǎng)格的參考方向的梯度方向并且根據(jù)所計(jì)算的梯度方向獲得所述網(wǎng)格的梯度方向直方圖;將所有網(wǎng)格的梯度方向直方圖連接成總直方圖向量,其中,每對相鄰極線限定的網(wǎng)格的梯度方向直方圖的連接順序相同,并且,對所述總直方圖向量進(jìn)行傅立葉變換,以得到所述圖像的特征向量;以及基于所得到的特征向量生成分類器。23.根據(jù)附記22所述的方法,其中,所述計(jì)算還包括計(jì)算在所述前景圖像上的非輪廓像素的梯度方向。24.根據(jù)附記23所述的方法,其中,所述計(jì)算還包括將所述前景圖像的非輪廓像素通過距離變換所映射到的輪廓像素的梯度方向作為所述非輪廓像素的梯度方向。25.根據(jù)附記22到M中任一個所述的方法,其中,所述相鄰圓之間的徑向距離等于所述圓中最小圓的半徑,并且所述相鄰極線之間的夾角相等。26.根據(jù)附記22到M中任一個所述的方法,其中,所述劃分包括確定所述圓和極線,使得相鄰圓之間所限定的以及所述最小圓所限定的前景圖像上的像素或輪廓像素的數(shù)目相等,并且使得所述相鄰極線之間所限定的前景圖像上的像素或輪廓像素的數(shù)目相等。27.根據(jù)附記22到M中任一個所述的方法,其中,所述特定點(diǎn)是所述前景圖像的幾何中心或重心。28.根據(jù)附記22到M中任一個所述的方法,其中,所述網(wǎng)格的所述參考方向經(jīng)過所述特定點(diǎn)并且均分限定所述網(wǎng)格的兩個極線的夾角。
權(quán)利要求
1.一種用于對圖像中的對象進(jìn)行檢測的裝置,包括網(wǎng)格劃分部分,用于在以圖像中的特定點(diǎn)為極點(diǎn)的極坐標(biāo)系中,用多條極線和以極點(diǎn)為圓心的多個圓劃分網(wǎng)格,其中,所述網(wǎng)格是相鄰極線與相鄰圓或相鄰極線與圓中的最小圓所限定的區(qū)域,所述極線的條數(shù)和所述圓的個數(shù)為常數(shù),并且,所述圓中最大圓的半徑大于等于所述圖像中的前景圖像的像素與所述特定點(diǎn)之間的最大距離;梯度方向直方圖獲得部分,用于針對每個網(wǎng)格,至少計(jì)算前景圖像中輪廓像素的相對于所述網(wǎng)格的參考方向的梯度方向并且根據(jù)所計(jì)算的梯度方向獲得所述網(wǎng)格的梯度方向直方圖;特征構(gòu)造部分,用于將所有網(wǎng)格的梯度方向直方圖連接成總直方圖向量,其中,每對相鄰極線限定的網(wǎng)格的梯度方向直方圖的連接順序相同,并且,所述特征構(gòu)造部分對所述總直方圖向量進(jìn)行傅立葉變換,以得到所述圖像的特征向量;以及對象檢測部分,用于基于所得到的特征向量對所述圖像中的對象進(jìn)行檢測。
2.根據(jù)權(quán)利要求1所述的裝置,其中,所述梯度方向直方圖獲得部分還計(jì)算在所述前景圖像上的非輪廓像素的梯度方向。
3.根據(jù)權(quán)利要求2所述的裝置,其中,所述梯度方向直方圖獲得部分將所述前景圖像的非輪廓像素通過距離變換所映射到的輪廓像素的梯度方向作為所述非輪廓像素的梯度方向。
4.根據(jù)權(quán)利要求1到3中任一個所述的裝置,其中,所述相鄰圓之間的徑向距離等于所述圓中最小圓的半徑,并且所述相鄰極線之間的夾角相等。
5.根據(jù)權(quán)利要求1到3中任一個所述的裝置,其中,所述網(wǎng)格劃分部分確定所述圓和極線,使得相鄰圓之間所限定的以及所述最小圓所限定的前景圖像上的像素或輪廓像素的數(shù)目相等,并且使得所述相鄰極線之間所限定的前景圖像上的像素或輪廓像素的數(shù)目相等。
6.根據(jù)權(quán)利要求1到3中任一個所述的裝置,其中,所述特定點(diǎn)是所述前景圖像的幾何中心或重心。
7.根據(jù)權(quán)利要求1到3中任一個所述的裝置,其中,所述網(wǎng)格的所述參考方向經(jīng)過所述特定點(diǎn)并且均分限定所述網(wǎng)格的兩個極線的夾角。
8.一種對圖像中的對象進(jìn)行檢測的方法,包括在以圖像中的特定點(diǎn)為極點(diǎn)的極坐標(biāo)系中,用多條極線和以極點(diǎn)為圓心的多個圓劃分網(wǎng)格,其中,所述網(wǎng)格是相鄰極線與相鄰圓或相鄰極線與圓中的最小圓所限定的區(qū)域,所述極線的條數(shù)和所述圓的個數(shù)為常數(shù),并且,所述圓中最大圓的半徑大于等于所述圖像中的前景圖像的像素與所述特定點(diǎn)之間的最大距離;針對每個網(wǎng)格,至少計(jì)算前景圖像中輪廓像素的相對于所述網(wǎng)格的參考方向的梯度方向并且根據(jù)所計(jì)算的梯度方向獲得所述網(wǎng)格的梯度方向直方圖;將所有網(wǎng)格的梯度方向直方圖連接成總直方圖向量,其中,每對相鄰極線限定的網(wǎng)格的梯度方向直方圖的連接順序相同,并且,對所述總直方圖向量進(jìn)行傅立葉變換,以得到所述圖像的特征向量;以及基于所得到的特征向量對所述圖像中的對象進(jìn)行檢測。
9.一種用于生成分類器的裝置,包括網(wǎng)格劃分部分,用于在以圖像中的特定點(diǎn)為極點(diǎn)的極坐標(biāo)系中,用多條極線和以極點(diǎn)為圓心的多個圓劃分網(wǎng)格,其中,所述網(wǎng)格是相鄰極線與相鄰圓或相鄰極線與圓中的最小圓所限定的區(qū)域,所述極線的條數(shù)和所述圓的個數(shù)為常數(shù),并且,所述圓中最大圓的半徑大于等于所述圖像中的前景圖像的像素與所述特定點(diǎn)之間的最大距離;梯度方向直方圖獲得部分,用于針對每個網(wǎng)格,至少計(jì)算前景圖像中輪廓像素的相對于所述網(wǎng)格的參考方向的梯度方向并且根據(jù)所計(jì)算的梯度方向獲得所述網(wǎng)格的梯度方向直方圖;特征構(gòu)造部分,用于將所有網(wǎng)格的梯度方向直方圖連接成總直方圖向量,其中,每對相鄰極線限定的網(wǎng)格的梯度方向直方圖的連接順序相同,并且,所述特征構(gòu)造部分對所述總直方圖向量進(jìn)行傅立葉變換,以得到所述圖像的特征向量;以及分類器生成部分,用于基于所得到的特征向量生成分類器。
10. 一種生成分類器的方法,包括在以圖像中的特定點(diǎn)為極點(diǎn)的極坐標(biāo)系中,用多條極線和以極點(diǎn)為圓心的多個圓劃分網(wǎng)格,其中,所述網(wǎng)格是相鄰極線與相鄰圓或相鄰極線與圓中的最小圓所限定的區(qū)域,所述極線的條數(shù)和所述圓的個數(shù)為常數(shù),并且,所述圓中最大圓的半徑大于等于所述圖像中的前景圖像的像素與所述特定點(diǎn)之間的最大距離;針對每個網(wǎng)格,至少計(jì)算前景圖像中輪廓像素的相對于所述網(wǎng)格的參考方向的梯度方向并且根據(jù)所計(jì)算的梯度方向獲得所述網(wǎng)格的梯度方向直方圖;將所有網(wǎng)格的梯度方向直方圖連接成總直方圖向量,其中,每對相鄰極線限定的網(wǎng)格的梯度方向直方圖的連接順序相同,并且,對所述總直方圖向量進(jìn)行傅立葉變換,以得到所述圖像的特征向量;以及基于所得到的特征向量生成分類器。
全文摘要
檢測圖像中的對象的裝置和方法和分類器生成裝置和方法。對圖像中的對象進(jìn)行檢測的方法包括在以圖像中的特定點(diǎn)為極點(diǎn)的極坐標(biāo)系中,用多條極線和以極點(diǎn)為圓心的多個圓劃分網(wǎng)格,網(wǎng)格是相鄰極線與相鄰圓或與最小圓限定的區(qū)域,極線的條數(shù)和圓的個數(shù)為常數(shù),最大圓的半徑大于等于前景圖像的像素與特定點(diǎn)之間的最大距離;針對每個網(wǎng)格,至少計(jì)算前景圖像中輪廓像素相對于網(wǎng)格的參考方向的梯度方向并且根據(jù)梯度方向獲得網(wǎng)格的梯度方向直方圖;將所有網(wǎng)格的梯度方向直方圖連接成總直方圖向量,每對相鄰極線限定的網(wǎng)格的梯度方向直方圖的連接順序相同,對總直方圖向量進(jìn)行傅立葉變換,以得到圖像的特征向量;基于該特征向量對圖像中的對象進(jìn)行檢測。
文檔編號G06T7/00GK102376087SQ201010257560
公開日2012年3月14日 申請日期2010年8月17日 優(yōu)先權(quán)日2010年8月17日
發(fā)明者上原祐介, 于浩, 劉汝杰, 增本大器, 王月紅 申請人:富士通株式會社
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1
金沙县| 和龙市| 昆山市| 阳城县| 莱州市| 阜平县| 仪征市| 临邑县| 鄢陵县| 阜新市| 麦盖提县| 铜陵市| 台北市| 房产| 伊通| 额敏县| 黑山县| 岳阳市| 乌鲁木齐县| 衡东县| 长沙市| 中方县| 平昌县| 延川县| 连平县| 四会市| 通化县| 邯郸县| 武功县| 息烽县| 普兰县| 淮滨县| 衡山县| 康平县| 都安| 汝阳县| 甘孜| 桐柏县| 集安市| 永顺县| 治多县|