專利名稱:基于多模式組合策略的移動(dòng)互聯(lián)網(wǎng)色情圖像識(shí)別方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種移動(dòng)互聯(lián)網(wǎng)色情圖像識(shí)別方法,特別是涉及一種基于多模式組合策略的移動(dòng)互聯(lián)網(wǎng)色情圖像識(shí)別方法。
背景技術(shù):
近年來移動(dòng)互聯(lián)網(wǎng)發(fā)展迅速,預(yù)計(jì)2012年中國移動(dòng)互聯(lián)網(wǎng)網(wǎng)民數(shù)量將達(dá)4. 5億,而這其中很大一部分都是青少年,他們可以很方便地通過手機(jī)從網(wǎng)絡(luò)下載色情圖像和不良信息。而由于青少年身心尚未發(fā)育成熟,對(duì)一切都比較好奇,又處于青春叛逆期,很容易誘使他們走向歧途。色情圖像和色情網(wǎng)站的存在已經(jīng)嚴(yán)重威脅到青少年的身心健康。因此,有必要利用智能圖像識(shí)別技術(shù)對(duì)移動(dòng)互聯(lián)網(wǎng)色情圖像進(jìn)行過濾,為通信運(yùn)營(yíng)商更有效地封堵色情網(wǎng)站提供技術(shù)支持。目前通信運(yùn)營(yíng)商已經(jīng)部署了不良圖像過濾系統(tǒng),該系統(tǒng)在前端機(jī)利用基于內(nèi)容的不良圖像識(shí)別技術(shù)對(duì)圖像進(jìn)行識(shí)別,將中標(biāo)圖像數(shù)據(jù)上傳到后臺(tái)進(jìn)行管理并由人工坐席審核,根據(jù)發(fā)現(xiàn)的色情圖像來對(duì)色情網(wǎng)站進(jìn)行封堵。現(xiàn)有的移動(dòng)互聯(lián)網(wǎng)不良圖像識(shí)別技術(shù)都是在前端機(jī)采用一種色情圖像識(shí)別算法對(duì)圖像進(jìn)行過濾,結(jié)果是色情圖像的查全率可以滿足客戶的要求,但是正常圖像的誤判率卻很高,需要很多的人工坐席來對(duì)算法的識(shí)別結(jié)果進(jìn)行審核。圖I給出了一種現(xiàn)有通信運(yùn)營(yíng)商采用的移動(dòng)互聯(lián)網(wǎng)色情圖像識(shí)別方案,該技術(shù)方案注重色情圖像的查全率,也就是保證盡可能多的色情圖像被識(shí)別正確。但是會(huì)造成前端機(jī)識(shí)別結(jié)果中包含有很多的正常圖像,再加上通過移動(dòng)互聯(lián)網(wǎng)上網(wǎng)的用戶眾多,下載的數(shù)據(jù)量非常大,交給人工坐席審核的圖像里面正常圖像的總量很大,這就需要花費(fèi)大量的人力和財(cái)力來對(duì)圖像進(jìn)行人工審核,極大地增加通信運(yùn)營(yíng)商的運(yùn)營(yíng)成本。因此,如何在保證色情圖像較高查全率的前提下,使正常圖像的誤判率有較大地降低(也就是色情圖像的查準(zhǔn)率有較大提高),正是本領(lǐng)域技術(shù)人員一直在研究、解決的問題。
發(fā)明內(nèi)容
本發(fā)明針對(duì)目前移動(dòng)互聯(lián)網(wǎng)色情圖像識(shí)別中正常圖像誤判率過高的問題,提出一種基于多模式組合策略的移動(dòng)互聯(lián)網(wǎng)色情圖像識(shí)別方法。在保證色情圖像較高識(shí)別率的前提下,可以有效地降低正常圖像的誤判率。本發(fā)明所采用的技術(shù)方案—種基于多模式組合策略的移動(dòng)互聯(lián)網(wǎng)色情圖像識(shí)別方法,首先利用基于小波紋理修正膚色的色情圖像識(shí)別算法對(duì)圖像進(jìn)行第一次粗過濾,識(shí)別出疑似色情圖像,并在此基礎(chǔ)上首先,采用誤判圖像匹配技術(shù)把經(jīng)常誤判的圖像搜集起來,組建成一個(gè)百萬級(jí)規(guī)模的誤判圖像庫,然后提取圖像的全局特征,采用E2LSH技術(shù)對(duì)圖像庫中的圖像建立索引;其次,對(duì)識(shí)別出的疑似色情圖像利用基于百萬級(jí)誤判圖像庫的E2LSH進(jìn)行快速精確匹配,經(jīng)過匹配如果在圖像庫中,則認(rèn)為是正常的圖像,如果不在誤判圖像庫中,則認(rèn)為是疑似色情圖像;最后,對(duì)于經(jīng)過匹配不在誤判圖像庫中的疑似色情圖像,采用基于最大連通感興趣區(qū)的多種特征融合識(shí)別算法進(jìn)行二次過濾,最終識(shí)別出色情圖像。所述的基于多模式組合策略的移動(dòng)互聯(lián)網(wǎng)色情圖像識(shí)別方法,基于小波紋理修正膚色的色情圖像識(shí)別算法在膚色檢測(cè)基礎(chǔ)上,加入小波紋理分析去除由于類膚色背景引起的類膚色點(diǎn),最后利用膚色面積比對(duì)圖像進(jìn)行第一次粗過濾,其流程如下I) RGB顏色空間變換到HSV顏色空間;2)將HSV顏色空間進(jìn)行量化,劃分成L個(gè)顏色子空間,通過統(tǒng)計(jì)分析確定皮膚顏色在這L個(gè)子空間中的分布,聚類得到皮膚顏色的分布子空間集合A以及A的隸屬度集合W ;3)膚色建模,確定樣本皮膚像素的總數(shù)shin_COunt以及樣本皮膚像素在這L個(gè)子 空間的頻次 sub_count_i, i = I,. . . , L,
LΣ sub _count_i — shin—count
-1以歸一化的頻次作為皮膚像素分布于該子空間的可能性;Vi = sub_count_i/skin_count為了消除皮膚樣本選取不精確和統(tǒng)計(jì)因素的影響,設(shè)定一個(gè)膚色分布概率的可能性閾值T_vi,如果滿Svi彡 TjiJJwi = Vi ;否則,Wi = O,得至 Ij A = (A1, A2, , AJW = Iw1, W2, , wL}其中,Wi表示對(duì)應(yīng)子空間Ai的隸屬度,即Ai中的顏色是皮膚顏色的可能性,i =
I,2,... L,參數(shù) L = 72 ;4)計(jì)算膚色概率對(duì)任意圖像F(x,y),將每一個(gè)像素(x,y)轉(zhuǎn)換到HSV顏色空間并量化,得到該像素的顏色子空間標(biāo)號(hào)k,該點(diǎn)屬于膚色的概率為w (k);5)小波紋理修正膚色,去除類膚色點(diǎn)的干擾對(duì)原圖像做一層小波分解,取出變換后的高頻系數(shù)LH、HH和HL,對(duì)三個(gè)高頻系數(shù)求平均得到一個(gè)高頻平均系數(shù)H_AVE ;設(shè)某個(gè)像素點(diǎn)屬于膚色的臨界概率閾值為th,如果w (k) <th,則該點(diǎn)不是一個(gè)膚色點(diǎn),否則利用H_AVE計(jì)算該點(diǎn)周圍36*36鄰域的小波特征。利用小波高頻平均系數(shù)計(jì)算36*36鄰域方差WAVE_VAR,定義屬于類膚色點(diǎn)的方差閾值為FALSE_TH,如果WAVE_VAR>=FALSE_TH,該像素不是一個(gè)膚色點(diǎn),否則是一個(gè)膚色點(diǎn);6)重復(fù)步驟4) —5)可以完成對(duì)一個(gè)圖像的膚色分割,計(jì)算膚色面積比SKIN_RATION,定義色情圖像閾值SEX_TH,如果SKIN_RATION>=SEX_TH,該圖像是一副色情圖像,否則是一副正常圖像。所述的基于多模式組合策略的移動(dòng)互聯(lián)網(wǎng)色情圖像識(shí)別方法,利用E2LSH進(jìn)行誤判圖像快速匹配,分為誤判圖像庫中每一幅圖像索引的建立和圖像匹配兩部分,E2LSH建立索引的過程如下I)提取圖像特征p,對(duì)于圖像庫中的每一張圖像,進(jìn)行4*4的分塊,計(jì)算每一塊的hu矩特征,16塊一共112維特征向量;
2) E2LSH映射降維利用散列函數(shù)g (v) = (v), h2 (v), . . . , hk(v))對(duì)特征p進(jìn)行降維,得到一個(gè)k維的向量g(v);3) E2LSH桶哈希對(duì)第二步得到的k維向量,計(jì)算主哈希值Ii1 (g(v))和次哈希值h2 (g (v));4)將主哈希值和次哈希值相同的點(diǎn)放入同一個(gè)桶中,生成哈希表T=Od1, b2, . . . , bk, . . . , bN},同時(shí)把特征向量P的數(shù)據(jù)存進(jìn)桶中,其中bk表示哈希表T的第k個(gè)桶,N為哈希表T中包含的桶的個(gè)數(shù);5)為哈希表中的每個(gè)桶生成一個(gè)索引文件,索引文件由該桶中各點(diǎn)的主次哈希值組成;6)重復(fù)上述步驟,完成所有圖像索引的建立;匹配過程如下 I)計(jì)算圖像4*4分塊Hu矩特征P ;2)計(jì)算P的哈希表索引;3)根據(jù)索引,搜索該哈希表中的所有桶b,并計(jì)算桶中的每個(gè)點(diǎn)與P的歐氏距離,如果存在距離小于O. 001,則認(rèn)為該圖像在圖像庫中,否則就認(rèn)為不在圖像庫中。所述的基于多模式組合策略的移動(dòng)互聯(lián)網(wǎng)色情圖像識(shí)別方法,基于最大連通感興趣區(qū)的多種特征融合識(shí)別算法,只對(duì)一副圖像的最大連通區(qū)域進(jìn)行分析,以避免一副色情圖像由于膚色面積比過小而被漏判的可能,提高了色情圖像的識(shí)別率;同時(shí)提取基于顏色、形狀、位置、紋理的多種特征,采用支持向量機(jī)(Support Vector Machine, SVM)進(jìn)行分類,在保持較高識(shí)別率的同時(shí),可以較好地降低誤判率?;谧畲筮B通感興趣區(qū)的多種特征融合識(shí)別算法,具體實(shí)施方案如下I)圖像尺寸歸一化,對(duì)圖像進(jìn)行縮放操作,以提高運(yùn)算速度;2)膚色分割首先對(duì)RGB顏色空間進(jìn)行變換,令某個(gè)像素點(diǎn)的像素值為R、G、B,歸一化后的像素值為r、g、b,如果R+G+B=0,則r=0, g=0, b=0,如果R+G+B Φ 0,則r=R/(R+G+B),g=G/(R+G+B),b=B/(R+G+B);定義顏色分量rg、rb、lgrg、lgrb,如果 g=0,則 rg=0, Igrg=O,如果 g 古 0,則 rg=r/g, Igrg=Iogrg ;如果 b=0,貝丨J rb=0, Igrb=O,如果 b ^ O, rb=r/b, Igrb=Ioglgrb ;令某點(diǎn)屬于膚色的概率為 P,如果 R>95&&G>40&&B>20&&R>G&&abs (R-G) >15&&R>B,則把 Igrg 和 Igrb 代入事先訓(xùn)練好的膚色模型進(jìn)行計(jì)算得到P,否則P=0,設(shè)屬于膚色的概率閾值為skin_th,如果p>=skin_th,該點(diǎn)是一個(gè)膚色點(diǎn),否則不是一個(gè)膚色點(diǎn)。3)圖像平滑以及形態(tài)學(xué)開閉操作;4)連通域分析使用區(qū)域生長(zhǎng)法標(biāo)記連通域,只需對(duì)圖像進(jìn)行一次掃描就能標(biāo)記出所有連通區(qū)域;5)如果沒有連通區(qū)域,認(rèn)為圖像是一副正常圖像,如果有,則進(jìn)入下面的特征提取過程;6)最大連通域特征提取提取的特征分為顏色、形狀、紋理、空間位置;使用72HSV直方圖作為顏色特征,首先把RGB顏色空間變換到HSV,隨后對(duì)HSV顏色空間量化成72個(gè)bin,最后統(tǒng)計(jì)一副圖像每一個(gè)bin出現(xiàn)的頻次,并進(jìn)行頻次歸一化;7)支持向量機(jī)分類,經(jīng)過步驟6)提取100維特征,先對(duì)特征進(jìn)行歸一化,然后把歸一化后的100維特征代入事先訓(xùn)練好的支持向量機(jī)識(shí)別模型進(jìn)行計(jì)算,即可以得出分類結(jié)果;8)人臉檢測(cè)。所述的基于多模式組合策略的移動(dòng)互聯(lián)網(wǎng)色情圖像識(shí)別方法,連通域標(biāo)記方法如下I)經(jīng)過膚色分割后的二值圖像為待標(biāo)記圖像,初始化一個(gè)標(biāo)記矩陣matrix,該矩陣的大小為二值圖像的長(zhǎng)乘以寬,一個(gè)隊(duì)列queue以及標(biāo)記計(jì)數(shù)器label ;2)從二值圖像的原點(diǎn)開始掃描圖像,當(dāng)掃描到一個(gè)沒有被標(biāo)記的前景像素pixel時(shí),label加I,并在matrix中標(biāo)記pixel,同時(shí)掃描pixel的8鄰域,若存在未被標(biāo)記的前景像素,則在matrix中進(jìn)行標(biāo)記,并放入queue中,作為區(qū)域生長(zhǎng)的種子;
3)如果queue不為空,從queue中取出一個(gè)生長(zhǎng)種子點(diǎn)newpixel,掃描newpixel的八鄰域,若存在未被標(biāo)記過的前景像素,貝1J在matrix中進(jìn)行標(biāo)記,并放入queue中;4)重復(fù)3),直到queue為空,一個(gè)連通區(qū)域標(biāo)記完畢;5)回到2),直到整個(gè)圖像被掃描完畢。通過比較label可以得到最大的連通域。所述的基于多模式組合策略的移動(dòng)互聯(lián)網(wǎng)色情圖像識(shí)別方法,形狀特征屬于圖像的中級(jí)特征,采用Zernike矩描述圖像形狀特征Zernike矩的基函數(shù)為Vnm (x, y) =VnmCrcos Θ,rsin Θ ) =RnmCr) exp (jm θ )Zernike矩的徑向基函數(shù)RnmCr)為Zernike多項(xiàng)式
n-\m\= Yj (-1) ~T-jr~I-rk
2 2 2RnmCr)滿足RnmCr) = Rn,_m (r),當(dāng)η和m取不同數(shù)值時(shí),就是不同階數(shù)的Zernike多項(xiàng)式,這里取m=4, n=4,通過計(jì)算Zernike矩可以得到9個(gè)特征。色情圖像的最大連通區(qū)域一般來講都是出現(xiàn)在圖像的正中間以及附近位置,所以選取最大連通域的重心作為一個(gè)特征,設(shè)最大連通域外接矩形的高為roiheight,寬為roiwidth,中心坐標(biāo)為X, y,則最大連同區(qū)域在原圖中的位置為(x+roiwidth/2)/wd、(y+r0iheight/2)/ht ;由于長(zhǎng)短軸之比過大的連通域通常是類膚色的一些圖標(biāo)形成的,所以選取最大連通區(qū)域長(zhǎng)短軸之比作為一個(gè)特征,計(jì)算公式為roiheight/roiwidth。所述的基于多模式組合策略的移動(dòng)互聯(lián)網(wǎng)色情圖像識(shí)別方法,采用2*2分塊的灰度共生矩陣來描述圖像紋理特征,在估計(jì)圖像的二階組合條件概率密度函數(shù)的基礎(chǔ)上,通過計(jì)算圖像中一定距離和一定方向的兩個(gè)像素之間的灰度相關(guān)性,對(duì)圖像的所有像素進(jìn)行統(tǒng)計(jì),反映圖像在方向、相鄰間隔、變化幅度及快慢上的綜合信息,P (i, j, d, Θ ) = {[ (X,y),(χ+dx, y+dy) | f (x, y) =i, f (x+dx, y+dy) = j]}x,y是圖像的像素坐標(biāo),dx,dy是位置偏移量,d是灰度共生矩陣的的生長(zhǎng)步長(zhǎng),Θ為灰度共生矩陣的生長(zhǎng)方向,取0° ,45° ,90° ,135°四個(gè)方向,
經(jīng)過多次試驗(yàn),灰度共生矩陣參數(shù)里面的能量、對(duì)比度、逆差矩、自相關(guān)四個(gè)特征在區(qū)分色情圖像和正常圖像方面效果較好,四個(gè)特征的計(jì)算公式如下
權(quán)利要求
1.一種基于多模式組合策略的移動(dòng)互聯(lián)網(wǎng)色情圖像識(shí)別方法,首先利用基于小波紋理修正膚色的色情圖像識(shí)別算法對(duì)圖像進(jìn)行第一次粗過濾,識(shí)別出疑似色情圖像,并在此基礎(chǔ)上 首先,采用誤判圖像匹配技術(shù)把經(jīng)常誤判的圖像搜集起來,組建成ー個(gè)百萬級(jí)規(guī)模的誤判圖像庫,然后提取圖像的全局特征,采用E2LSH技術(shù)對(duì)圖像庫中的圖像建立索引; 其次,對(duì)識(shí)別出的疑似色情圖像利用基于百萬級(jí)誤判圖像庫的E2LSH進(jìn)行快速精確匹配,經(jīng)過匹配如果在圖像庫中,則認(rèn)為是正常的圖像,如果不在誤判圖像庫中,則認(rèn)為是疑似色情圖像; 最后,對(duì)于經(jīng)過匹配不在誤判圖像庫中的疑似色情圖像,采用基于最大連通感興趣區(qū)的多種特征融合識(shí)別算法進(jìn)行二次過濾,最終識(shí)別出色情圖像。
2.根據(jù)權(quán)利要求I所述的基于多模式組合策略的移動(dòng)互聯(lián)網(wǎng)色情圖像識(shí)別方法,其特征是基于小波紋理修正膚色的色情圖像識(shí)別算法在膚色檢測(cè)基礎(chǔ)上,加入小波紋理分析去除由于類膚色背景引起的類膚色點(diǎn),最后利用膚色面積比對(duì)圖像進(jìn)行第一次粗過濾,其流程如下 1)RGB顏色空間變換到HSV顏色空間; 2)將HSV顔色空間進(jìn)行量化,劃分成L個(gè)顏色子空間,通過統(tǒng)計(jì)分析確定皮膚顏色在這L個(gè)子空間中的分布,聚類得到皮膚顏色的分布子空間集合A以及A的隸屬度集合W ; 3)膚色建摸,確定樣本皮膚像素的總數(shù)shin_COunt以及樣本皮膚像素在這L個(gè)子空間的步頁次 sub_count_i, i = I,. . . , L, LZsiib count i = shin count一一 —i=l 以歸ー化的頻次作為皮膚像素分布于該子空間的可能性;V,- = sub_count_i/skin_count 為了消除皮膚樣本選取不精確和統(tǒng)計(jì)因素的影響,設(shè)定一個(gè)膚色分布概率的可能性閾 如果滿足Vi彡T_vi,則Wi = Vi ;否則,Wi = O,得到A = (A1, A2,, AJW = Iw1, W2, , WlI 其中,Wi表示對(duì)應(yīng)子空間Ai的隸屬度,即Ai中的顏色是皮膚顏色的可能性,i =I, 2,... L,參數(shù) L = 72 ; 4)計(jì)算膚色概率對(duì)任意圖像F(x,y),將每ー個(gè)像素(X,y)轉(zhuǎn)換到HSV顔色空間并量化,得到該像素的顔色子空間標(biāo)號(hào)k,該點(diǎn)屬于膚色的概率為w (k); 5)小波紋理修正膚色,去除類膚色點(diǎn)的干擾對(duì)原圖像做ー層小波分解,取出變換后的高頻系數(shù)LH、HH和HL,對(duì)三個(gè)高頻系數(shù)求平均得到一個(gè)高頻平均系數(shù)H_AVE ;設(shè)某個(gè)像素點(diǎn)屬于膚色的臨界概率閾值為th,如果w(k)〈th,則該點(diǎn)不是ー個(gè)膚色點(diǎn),否則利用H_AVE計(jì)算該點(diǎn)周圍36*36鄰域的小波特征。利用小波高頻平均系數(shù)計(jì)算36*36鄰域方差WAVE_VAR,定義屬于類膚色點(diǎn)的方差閾值為FALSE_TH,如果WAVE_VAR>=FALSE_TH,該像素不是ー個(gè)膚色點(diǎn),否則是ー個(gè)膚色點(diǎn); 6)重復(fù)步驟4)一5)可以完成對(duì)ー個(gè)圖像的膚色分割,計(jì)算膚色面積比SKIN_RATION,定義色情圖像閾值SEX_TH,如果SKIN_RATION>=SEX_TH,該圖像是ー副色情圖像,否則是ー副正常圖像。
3.根據(jù)權(quán)利要求I所述的基于多模式組合策略的移動(dòng)互聯(lián)網(wǎng)色情圖像識(shí)別方法,其特征是利用E2LSH進(jìn)行誤判圖像快速匹配,分為誤判圖像庫中每一幅圖像索引的建立和圖像匹配兩部分,E2LSH建立索引的過程如下 1)提取圖像特征P,對(duì)于圖像庫中的每ー張圖像,進(jìn)行4*4的分塊,計(jì)算每ー塊的hu矩特征,16塊一共112維特征向量; 2)E2LSH映射降維利用散列函數(shù)g(v) = Qll (V),h2 (V),· · ·,hk(v))對(duì)特征p進(jìn)行降維,得到ー個(gè)k維的向量g(v); 3)E2LSH桶哈希對(duì)第二步得到的k維向量,計(jì)算主哈希值Ii1(g(v))和次哈希值h2 (g (v)); 4)將主哈希值和次哈希值相同的點(diǎn)放入同一個(gè)桶中,生成哈希表T=Od1, b2, . . . , bk, . . . , bN},同時(shí)把特征向量P的數(shù)據(jù)存進(jìn)桶中,其中bk表示哈希表T的第k個(gè)桶,N為哈希表T中包含的桶的個(gè)數(shù); 5)為哈希表中的每個(gè)桶生成ー個(gè)索引文件,索引文件由該桶中各點(diǎn)的主次哈希值組成; 6)重復(fù)上述步驟,完成所有圖像索引的建立; 匹配過程如下 1)計(jì)算圖像4*4分塊Hu矩特征P; 2)計(jì)算P的哈希表索引; 3)根據(jù)索引,捜索該哈希表中的所有桶b,并計(jì)算桶中的每個(gè)點(diǎn)與P的歐氏距離,如果存在距離小于O. 001,則認(rèn)為該圖像在圖像庫中,否則就認(rèn)為不在圖像庫中。
4.根據(jù)權(quán)利要求I 3任一項(xiàng)所述的基于多模式組合策略的移動(dòng)互聯(lián)網(wǎng)色情圖像識(shí)別方法,其特征是基于最大連通感興趣區(qū)的多種特征融合識(shí)別算法,只對(duì)ー副圖像的最大連通區(qū)域進(jìn)行分析,以避免一副色情圖像由于膚色面積比過小而被漏判的可能,提高了色情圖像的識(shí)別率;同時(shí)提取基于顏色、形狀、位置、紋理的多種特征,采用支持向量機(jī)(SupportVector Machine, SVM)進(jìn)行分類,在保持較高識(shí)別率的同時(shí),可以較好地降低誤判率。
5.根據(jù)權(quán)利要求4所述的基于多模式組合策略的移動(dòng)互聯(lián)網(wǎng)色情圖像識(shí)別方法,其特征是基于最大連通感興趣區(qū)的多種特征融合識(shí)別算法,具體實(shí)施方案如下 O圖像尺寸歸ー化,對(duì)圖像進(jìn)行縮放操作,以提高運(yùn)算速度; 2)膚色分割首先對(duì)RGB顏色空間進(jìn)行變換,令某個(gè)像素點(diǎn)的像素值為R、G、B,歸ー化后的像素值為 r、g、b,如果 R+G+B=0,則 r=0,g=0,b=0,如果 R+G+B 幸 O,則 r=R/ (R+G+B),g=G/(R+G+B), b=B/(R+G+B); 定義顏色分量rg、rb、lgrg、lgrb,如果g=0,貝丨J rg=0, Igrg=O,如果g幸0,貝丨J rg=r/g,Igrg=Iogrg ;如果 b=0,貝丨J rb=0, Igrb=O,如果 b デ O, rb=r/b, Igrb=Ioglgrb ;令某點(diǎn)屬于膚色的概率為 P,如果 R>95&&G>40&&B>20&&R>G&&abs (R-G) >15&&R>B,則把 Igrg 和 Igrb 代入事先訓(xùn)練好的膚色模型進(jìn)行計(jì)算得到P,否則P=0。設(shè)屬于膚色的概率閾值為skin_th,如果p>=skin_th,該點(diǎn)是一個(gè)膚色點(diǎn),否則不是一個(gè)膚色點(diǎn); 3)圖像平滑以及形態(tài)學(xué)開閉操作;4)連通域分析使用區(qū)域生長(zhǎng)法標(biāo)記連通域,只需對(duì)圖像進(jìn)行一次掃描就能標(biāo)記出所有連通區(qū)域; 5)如果沒有連通區(qū)域,認(rèn)為圖像是ー副正常圖像,如果有,則進(jìn)入下面的特征提取過程; 6)最大連通域特征提取提取的特征分為顏色、形狀、紋理、空間位置;使用72HSV直方圖作為顏色特征,首先把RGB顏色空間變換到HSV,隨后對(duì)HSV顏色空間量化成72個(gè)bin,最后統(tǒng)計(jì)ー副圖像每ー個(gè)bin出現(xiàn)的頻次,并進(jìn)行頻次歸一化; 7)支持向量機(jī)分類,經(jīng)過步驟6)提取100維特征,先對(duì)特征進(jìn)行歸一化,然后把歸ー化后的100維特征代入事先訓(xùn)練好的支持向量機(jī)識(shí)別模型進(jìn)行計(jì)算,即可以得出分類結(jié)果; 8)人臉檢測(cè)。
6.根據(jù)權(quán)利要求5所述的基于多模式組合策略的移動(dòng)互聯(lián)網(wǎng)色情圖像識(shí)別方法,其特征是連通域標(biāo)記方法如下 1)經(jīng)過膚色分割后的ニ值圖像為待標(biāo)記圖像,初始化ー個(gè)標(biāo)記矩陣matrix,該矩陣的大小為ニ值圖像的長(zhǎng)乘以寬,一個(gè)隊(duì)列queue以及標(biāo)記計(jì)數(shù)器label ; 2)從ニ值圖像的原點(diǎn)開始掃描圖像,當(dāng)掃描到一個(gè)沒有被標(biāo)記的前景像素Pixel吋,label加I,并在matrix中標(biāo)記pixel,同時(shí)掃描pixel的8鄰域,若存在未被標(biāo)記的前景像素,則在matrix中進(jìn)行標(biāo)記,并放入queue中,作為區(qū)域生長(zhǎng)的種子; 3)如果queue不為空,從queue中取出一個(gè)生長(zhǎng)種子點(diǎn)newpixel,掃描newpixel的八鄰域,若存在未被標(biāo)記過的前景像素,貝1J在matrix中進(jìn)行標(biāo)記,并放入queue中; 4)重復(fù)3),直到queue為空,一個(gè)連通區(qū)域標(biāo)記完畢; 5)回到2),直到整個(gè)圖像被掃描完畢。通過比較label可以得到最大的連通域。
7.根據(jù)權(quán)利要求5所述的基于多模式組合策略的移動(dòng)互聯(lián)網(wǎng)色情圖像識(shí)別方法,其特征是形狀特征屬于圖像的中級(jí)特征,采用Zernike矩描述圖像形狀特征=Zernike矩的基函數(shù)為 Vnm (x, y) =VnmCrcos Θ,rsin Θ ) =Rnm (r) exp (jm θ ) Zernike矩的徑向基函數(shù)RnmCr)為Zernike多項(xiàng)式
8.根據(jù)權(quán)利要求5所述的基于多模式組合策略的移動(dòng)互聯(lián)網(wǎng)色情圖像識(shí)別方法,其特征是色情圖像的最大連通區(qū)域一般來講都是出現(xiàn)在圖像的正中間以及附近位置,所以選取最大連通域的重心作為ー個(gè)特征,設(shè)最大連通域外接矩形的高為roiheight,寬為roiwidth,中心坐標(biāo)為x, y,則最大連同區(qū)域在原圖中的位置為(ズ+ roiwiSCM) /、(y+r0iheight/2)/ht ;由于長(zhǎng)短軸之比過大的連通域通常是類膚色的一些圖標(biāo)形成的,所以選取最大連通區(qū)域長(zhǎng)短軸之比作為一個(gè)特征,計(jì)算公式為roiheight/roiwidth。
9.根據(jù)權(quán)利要求5所述的基于多模式組合策略的移動(dòng)互聯(lián)網(wǎng)色情圖像識(shí)別方法,其特征是采用2*2分塊的灰度共生矩陣來描述圖像紋理特征,在估計(jì)圖像的二階組合條件概率密度函數(shù)的基礎(chǔ)上,通過計(jì)算圖像中一定距離和一定方向的兩個(gè)像素之間的灰度相關(guān)性,對(duì)圖像的所有像素進(jìn)行統(tǒng)計(jì),反映圖像在方向、相鄰間隔、變化幅度及快慢上的綜合信息, P (i, j, d, Θ ) = {[ (X,y),(χ+dx, y+dy) | f (x, y) =i, f (x+dx, y+dy) = j]} x,y是圖像的像素坐標(biāo),dx,dy是位置偏移量,d是灰度共生矩陣的的生長(zhǎng)步長(zhǎng),Θ為灰度共生矩陣的生長(zhǎng)方向,取0° ,45° ,90° ,135°四個(gè)方向。
經(jīng)過多次試驗(yàn),灰度共生矩陣參數(shù)里面的能量、對(duì)比度、逆差矩、自相關(guān)四個(gè)特征在區(qū)分色情圖像和正常圖像方面效果較好,四個(gè)特征的計(jì)算公式如下
10.根據(jù)權(quán)利要求5 9任一項(xiàng)所述的基于多模式組合策略的移動(dòng)互聯(lián)網(wǎng)色情圖像識(shí)別方法,其特征是采用AdaBoost實(shí)現(xiàn)人臉檢測(cè) 首先使用Harr-Like表示人臉特征,使用積分圖實(shí)現(xiàn)特征值的快速計(jì)算; 接著使用AdaBoost算法挑選出一些最能代表人臉的矩形特征(弱分類器),按照加權(quán)投票的方式把弱分類器構(gòu)造成一個(gè)強(qiáng)分類器;最后把訓(xùn)練得到的若干個(gè)強(qiáng)分類器串聯(lián)組成一個(gè)級(jí)聯(lián)結(jié)構(gòu)的層疊分類器,該分類器可以對(duì)不含人臉的矩形窗口進(jìn)行逐級(jí)剔除,利用層疊分類器實(shí)現(xiàn)人臉檢測(cè); 利用人臉信息對(duì)疑似色情圖像進(jìn)一步判別的方法如下 1)如果人臉的個(gè)數(shù)大于5,則認(rèn)為這是一副多人的合影照,是一副正常的圖像; 2)如果人臉的個(gè)數(shù)大于等于2小于等于5,計(jì)算所有人臉的面積和sum_faCe,設(shè)圖像的寬為width,高為height,如果sum face>=0. 7*height*width,則認(rèn)為是一副正常圖像,否則是一副色情圖像; 3)如果人臉的個(gè)數(shù)為1,計(jì)算人臉的面積area,如果area>=0.25*height*width,則認(rèn) 為是一副正常的人臉大頭照?qǐng)D像,否則,進(jìn)一步計(jì)算人臉在原圖中的位置x、y,如果O. 4*height<=x<=0. 6*height&&0. 4*width〈=y〈=0. 6*width,貝U人臉在圖像的中間位置,是一副正常的人臉圖像,否則是一副色情圖像; 4)如果人臉的個(gè)數(shù)為O,認(rèn)為是一副色情圖像。
全文摘要
本發(fā)明涉及一種移動(dòng)互聯(lián)網(wǎng)色情圖像識(shí)別方法。一種基于多模式組合策略的移動(dòng)互聯(lián)網(wǎng)色情圖像識(shí)別方法,首先利用基于小波紋理修正膚色的色情圖像識(shí)別算法對(duì)圖像進(jìn)行粗過濾,識(shí)別出疑似色情圖像,并在此基礎(chǔ)上首先采用誤判圖像匹配技術(shù)把經(jīng)常誤判的圖像搜集起來組建成誤判圖像庫,然后提取圖像的全局特征,采用E2LSH技術(shù)對(duì)圖像庫中的圖像建立索引;其次,對(duì)識(shí)別出的疑似色情圖像利用圖像庫的E2LSH進(jìn)行快速精確匹配,經(jīng)過匹配如果不在誤判圖像庫中,則認(rèn)為是疑似色情圖像;最后,對(duì)于經(jīng)過匹配不在誤判圖像庫中的疑似色情圖像,采用基于最大連通感興趣區(qū)的多種特征融合識(shí)別算法進(jìn)行最終識(shí)別。在保證色情圖像較高識(shí)別率的前提下,可以有效地降低正常圖像的誤判率。
文檔編號(hào)G06K9/64GK102842032SQ20121025226
公開日2012年12月26日 申請(qǐng)日期2012年7月18日 優(yōu)先權(quán)日2012年7月18日
發(fā)明者彭天強(qiáng), 張晨民, 趙慧琴, 孫曉峰, 崔鵬飛 申請(qǐng)人:鄭州金惠計(jì)算機(jī)系統(tǒng)工程有限公司