專(zhuān)利名稱(chēng):一種色情圖像偵測(cè)的方法和系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本申請(qǐng)涉及圖像識(shí)別的技術(shù)領(lǐng)域,特別是涉及ー種色情圖像偵測(cè)的方法和系統(tǒng)。
背景技術(shù):
隨著互聯(lián)網(wǎng)的快速發(fā)展,互聯(lián)網(wǎng)在為人們認(rèn)識(shí)世界、方便生活、提供幫助的同吋,也為有害信息的廣泛傳播提供了便捷的途徑,例如,人們常常會(huì)受到含有如色情、暴力等不健康的色情圖像和視頻的侵?jǐn)_;網(wǎng)絡(luò)犯罪活動(dòng)的現(xiàn)象也日漸增多,如色情小說(shuō)、色情圖像和錄像的傳播,它們擾亂社會(huì)秩序、破壞社會(huì)風(fēng)氣,給人們尤其是青少年帶來(lái)了極大的負(fù)面影響。據(jù)統(tǒng)計(jì),全球現(xiàn)有色情網(wǎng)站數(shù)以百萬(wàn),另外,約28%的網(wǎng)站包含成人內(nèi)容;ー個(gè)人在互聯(lián)網(wǎng)上隨便點(diǎn)擊每七次就有一次可能點(diǎn)擊到色情站點(diǎn),25%的小網(wǎng)迷曾主動(dòng)訪問(wèn)色情網(wǎng)站,20%的人曾被動(dòng)收到色情信息,全球75%的家長(zhǎng)明確表示擔(dān)心不良信息對(duì)孩子的負(fù)面影響;全球電子郵件中有大約55%是垃圾郵件,而其中色情圖像大約占20%左右。目前,過(guò)濾色情圖像信息主要采用以下三種策略:1、文本關(guān)鍵詞過(guò)濾;2、針對(duì)包含成人內(nèi)容的網(wǎng)站建立黑名單,從而根據(jù)IP地址進(jìn)行過(guò)濾;3、基于內(nèi)容進(jìn)行圖像識(shí)別。對(duì)于第一種文本關(guān)鍵詞過(guò)濾的方法而言,盡管文本檢索、自然語(yǔ)言處理等技術(shù)已經(jīng)發(fā)展地相當(dāng)成熟,但單純的基于文本過(guò)濾的方式,仍然存在著較大的漏殺率。主要原因之一在于文本修改的成本較低,惡意用戶(hù)往往可以通過(guò)嘗試不同的文字變形(錯(cuò)別字、象形文字等)來(lái)突破單純依賴(lài)辭典的關(guān)鍵詞過(guò)濾手段。另ー方面,圖像對(duì)人眼的沖擊カ往往更大(換言之,色情圖像的危害程度相較文字更大),惡意用戶(hù)甚至直接將文字印在圖像上,對(duì)于這類(lèi)情況,文本過(guò)濾的方式往往無(wú)能為力。對(duì)于第二種根據(jù)黑名單網(wǎng)站IP地址進(jìn)行過(guò)濾的方法而言,由于IP過(guò)濾的方式是一種靜態(tài)防御的方式,無(wú)法第一時(shí)間發(fā)現(xiàn)包含成人內(nèi)容的網(wǎng)站,而往往依賴(lài)其它技術(shù)或者人工舉報(bào)的方式去維護(hù)黑名単。與上述兩種方法相比,第三種基于內(nèi)容的圖像識(shí)別技術(shù)通過(guò)分析、提取色情圖像不同于正常圖像的特征,作為機(jī)器判斷的依據(jù),提供了更靈活、直接且文字無(wú)關(guān)的處理手段。傳統(tǒng)的基于內(nèi)容的圖像識(shí)別技術(shù),基本上單純依賴(lài)皮膚顔色檢測(cè),往往會(huì)有較為嚴(yán)重的誤判問(wèn)題,即對(duì)于某些正常圖像,只要其出現(xiàn)了黃色背景、紡織物、毛發(fā)等情況,都有很大概率會(huì)被過(guò)濾為色情圖像。特別的,對(duì)于電子商務(wù)網(wǎng)站中存在的大量?jī)?nèi)衣、首飾等產(chǎn)品圖像,存在十分嚴(yán)重的誤殺率。因此,目前需要本領(lǐng)域技術(shù)人員迫切解決的ー個(gè)技術(shù)問(wèn)題就是:提出ー種色情圖像的偵測(cè)技術(shù),用以提高色情圖像識(shí)別的召回率和準(zhǔn)確率。
發(fā)明內(nèi)容
本申請(qǐng)的目的是提供ー種色情圖像偵測(cè)的方法和系統(tǒng),用以提高色情圖像識(shí)別的召回率和準(zhǔn)確率。為了解決上述問(wèn)題,本申請(qǐng)公開(kāi)了ー種色情圖像偵測(cè)的方法,包括:檢測(cè)目標(biāo)圖像中的皮膚區(qū)域;若所述皮膚區(qū)域在目標(biāo)圖像整體區(qū)域中的占比大于第一預(yù)設(shè)閾值,則檢測(cè)所述目標(biāo)圖像中的連通域;判斷所述連通域在皮膚區(qū)域中的分布是否滿(mǎn)足預(yù)置規(guī)則,若是,則判定所述目標(biāo)圖像為色情圖像。優(yōu)選的是,所述檢測(cè)目標(biāo)圖像中的皮膚區(qū)域的步驟進(jìn)一歩包括:對(duì)目標(biāo)圖像進(jìn)行膚色檢測(cè),獲得候選皮膚區(qū)域;在所述候選皮膚區(qū)域在目標(biāo)圖像整體區(qū)域中的占比大于第一預(yù)設(shè)閾值時(shí),對(duì)所述候選皮膚區(qū)域進(jìn)行紋理特征檢測(cè);確定所述紋理特征強(qiáng)度大于第二預(yù)設(shè)閾值的候選皮膚區(qū)域?yàn)槠つw區(qū)域。優(yōu)選的是,所述判斷連通域在皮膚區(qū)域中的分布是否滿(mǎn)足預(yù)置規(guī)則的步驟進(jìn)一歩包括:獲取各連通域的面積,判斷其中面積最大的連通域在皮膚區(qū)域中的占比是否大于第三預(yù)設(shè)閾值;和/或,獲取各連通域的面積,判斷其中面積大小在前n位的連通域,在皮膚區(qū)域中的占比是否大于第四預(yù)設(shè)閾值,所述n大于I。優(yōu)選的是,在所述判定目標(biāo)圖像為色情圖像的步驟之前,還包括:檢測(cè)目標(biāo)圖像中的臉部區(qū)域;若所述臉部區(qū)域在目標(biāo)圖像整體區(qū)域中的占比小于第五預(yù)設(shè)閾值,則根據(jù)所述臉部區(qū)域估算軀干區(qū)域,并檢測(cè)軀干區(qū)域中的皮膚區(qū)域;若所述軀干區(qū)域中的皮膚區(qū)域在軀干區(qū)域中的占比超過(guò)第六預(yù)設(shè)閾值,則判定所述目標(biāo)圖像為色情圖像。優(yōu)選的是,所述第一預(yù)設(shè)閾值為20% ;所述紋理特征檢測(cè)采用邊緣提取算法,所述第二預(yù)設(shè)閾值為5 ;所述第三預(yù)設(shè)閾值為5% ;所述n為3,所述第四預(yù)設(shè)閾值為50% ;所述第五預(yù)設(shè)閾值為65% ;所述第六預(yù)設(shè)閾值75%。本申請(qǐng)還公開(kāi)了ー種色情圖像偵測(cè)的方法,包括:檢測(cè)樣本圖像中的皮膚區(qū)域;所述樣本圖像包括正樣本圖像和反樣本圖像;若所述皮膚區(qū)域在當(dāng)前樣本圖像整體區(qū)域中的占比大于第一預(yù)設(shè)閾值,則檢測(cè)所述樣本圖像中的連通域;針對(duì)所述正樣本圖像和反樣本圖像中,連通域面積大小在前m位的目標(biāo)連通域提取預(yù)設(shè)特征;根據(jù)所提取的預(yù)設(shè)特征生成分類(lèi)模型;將待檢測(cè)的目標(biāo)圖像輸入分類(lèi)模型,判斷是否為色情圖像。優(yōu)選的是,所述預(yù)設(shè)特征包括:
第一特征:所述目標(biāo)連通域的面積在當(dāng)前樣本圖像中的占比;和/或,第二特征:所述目標(biāo)連通域最小外接橢圓的中心與當(dāng)前樣本圖像中心的距離;和/或,第三特征:所述目標(biāo)連通域最小外接橢圓的長(zhǎng)軸與水平或者垂直方向的最小夾角;和/或,第四特征:所述目標(biāo)連通域最小外接橢圓的長(zhǎng)軸與短軸的比例;和/或,第五特征:所述目標(biāo)連通域中皮膚區(qū)域的面積占整個(gè)目標(biāo)連通域面積的比例;和/或,第六特征:所述目標(biāo)連通域中皮膚區(qū)域的各像素所對(duì)應(yīng)的每ー個(gè)通道值的均方差。本申請(qǐng)同時(shí)公開(kāi)了ー種色情圖像偵測(cè)的系統(tǒng),包括:皮膚區(qū)域檢測(cè)模塊,用于檢測(cè)目標(biāo)圖像中的皮膚區(qū)域;第一判斷模塊,用于判斷所述皮膚區(qū)域在目標(biāo)圖像整體區(qū)域中的占比是否大于第ー預(yù)設(shè)閾值,若是,則調(diào)用連通域分析模塊;連通域分析模塊,用于檢測(cè)所述目標(biāo)圖像中的連通域;第二判斷模塊,用于判斷所述連通域在皮膚區(qū)域中的分布是否滿(mǎn)足預(yù)置規(guī)則,若是,則判定所述目標(biāo)圖像為色情圖像。優(yōu)選的是,所述皮膚區(qū)域檢測(cè)模塊進(jìn)一歩包括:膚色檢測(cè)子模塊,用于對(duì)目標(biāo)圖像進(jìn)行膚色檢測(cè),獲得候選皮膚區(qū)域;紋理特征檢測(cè)子模塊,用于在所述候選皮膚區(qū)域在目標(biāo)圖像整體區(qū)域中的占比大于第一預(yù)設(shè)閾值時(shí),對(duì)所述候選皮膚區(qū)域進(jìn)行紋理特征檢測(cè);皮膚區(qū)域確定子模塊,用于確定所述紋理特征強(qiáng)度大于第二預(yù)設(shè)閾值的候選皮膚區(qū)域?yàn)槠つw區(qū)域。優(yōu)選的是,所述連通域分析模塊進(jìn)一歩包括:最大連通域分析子模塊,用于獲取各連通域的面積,判斷其中面積最大的連通域在皮膚區(qū)域中的占比是否大于第三預(yù)設(shè)閾值;和/或,優(yōu)選連通域分析子模塊,用于獲取各連通域的面積,判斷其中面積大小在前n位的連通域,在皮膚區(qū)域中的占比是否大于第四預(yù)設(shè)閾值,所述n大于I。優(yōu)選的是,所述的系統(tǒng),還包括:臉部區(qū)域檢測(cè)模塊,用于檢測(cè)目標(biāo)圖像中的臉部區(qū)域;第三判斷模塊,用于判斷所述臉部區(qū)域在目標(biāo)圖像整體區(qū)域中的占比是否小于第五預(yù)設(shè)閾值,若是,則調(diào)用軀干區(qū)域檢測(cè)模塊;軀干區(qū)域檢測(cè)模塊,用于根據(jù)所述臉部區(qū)域估算軀干區(qū)域,并檢測(cè)軀干區(qū)域中的皮膚區(qū)域;第四判斷模塊,用于判斷所述軀干區(qū)域中的皮膚區(qū)域在軀干區(qū)域中的占比是否超過(guò)第六預(yù)設(shè)閾值,若是,則判定所述目標(biāo)圖像為色情圖像。本申請(qǐng)還公開(kāi)了ー種色情圖像偵測(cè)的系統(tǒng),包括:樣本皮膚檢測(cè)模塊,用于檢測(cè)樣本圖像中的皮膚區(qū)域;所述樣本圖像包括正樣本圖像和反樣本圖像;第五判斷模塊,用于判斷所述皮膚區(qū)域在當(dāng)前樣本圖像整體區(qū)域中的占比大于第ー預(yù)設(shè)閾值,若是,則調(diào)用連通域檢測(cè)模塊;連通域檢測(cè)模塊,用于檢測(cè)所述樣本圖像中的連通域;特征提取模塊,用于針對(duì)所述正樣本圖像和反樣本圖像中,連通域面積大小在前m位的目標(biāo)連通域提取預(yù)設(shè)特征;模型生成模塊,用于根據(jù)所提取的預(yù)設(shè)特征生成分類(lèi)模型;模型判斷模塊,用于將待檢測(cè)的目標(biāo)圖像輸入分類(lèi)模型,判斷是否為色情圖像。優(yōu)選的是,所述預(yù)設(shè)特征包括:第一特征:所述目標(biāo)連通域的面積在當(dāng)前樣本圖像中的占比;和/或,第二特征:所述目標(biāo)連通域最小外接橢圓的中心與當(dāng)前樣本圖像中心的距離;和/或,第三特征:所述目標(biāo)連通域最小外接橢圓的長(zhǎng)軸與水平或者垂直方向的最小夾角;和/或,第四特征:所述目標(biāo)連通域最小外接橢圓的長(zhǎng)軸與短軸的比例;和/或,第五特征:所述目標(biāo)連通域中皮膚區(qū)域的面積占整個(gè)目標(biāo)連通域面積的比例;和/或,第六特征:所述目標(biāo)連通域中皮膚區(qū)域的各像素所對(duì)應(yīng)的每ー個(gè)通道值的均方差。與現(xiàn)有技術(shù)相比,本申請(qǐng)包括以下優(yōu)點(diǎn):傳統(tǒng)的基于內(nèi)容的圖像識(shí)別技術(shù),基本上單純依賴(lài)皮膚顔色檢測(cè),往往會(huì)有較為嚴(yán)重的誤判問(wèn)題,即對(duì)于某些正常圖像,只要其出現(xiàn)了黃色背景、紡織物、毛發(fā)等情況,都有很大概率會(huì)被過(guò)濾為色情圖像。特別的,對(duì)于電子商務(wù)網(wǎng)站中存在的大量?jī)?nèi)衣、首飾等產(chǎn)品圖像,存在十分嚴(yán)重的誤殺率。本申請(qǐng)實(shí)施例在膚色檢測(cè)的基礎(chǔ)上,新增了皮膚紋理檢測(cè)、連通域分析、臉部檢測(cè)、軀干輪廓判斷,并輔以機(jī)器學(xué)習(xí)等手段,顯著了提高了召回率和準(zhǔn)確率。
圖1是本申請(qǐng)ー種色情圖像偵測(cè)的方法實(shí)施例1的步驟流程圖;圖2是本申請(qǐng)ー種色情圖像偵測(cè)的方法實(shí)施例2的步驟流程圖;圖3是本申請(qǐng)ー種色情圖像偵測(cè)的方法實(shí)施例3的步驟流程圖;圖4是本申請(qǐng)的ー種色情圖像偵測(cè)的系統(tǒng)實(shí)施例1的結(jié)構(gòu)框圖;圖5是本申請(qǐng)的ー種色情圖像偵測(cè)的系統(tǒng)實(shí)施例2的結(jié)構(gòu)框圖。
具體實(shí)施例方式為使本申請(qǐng)的上述目的、特征和優(yōu)點(diǎn)能夠更加明顯易懂,下面結(jié)合附圖和具體實(shí)施方式
對(duì)本申請(qǐng)作進(jìn)一步詳細(xì)的說(shuō)明。參照?qǐng)D1,示出了本申請(qǐng)ー種色情圖像偵測(cè)的方法實(shí)施例1的步驟流程圖,具體可以包括如下步驟:步驟101、檢測(cè)目標(biāo)圖像中的皮膚區(qū)域;在具體實(shí)現(xiàn)中,可以通過(guò)膚色檢測(cè)和紋理特征檢測(cè)確定目標(biāo)圖像中的皮膚區(qū)域。具體而言,本步驟具體可以包括如下子步驟:子步驟S11、對(duì)目標(biāo)圖像進(jìn)行膚色檢測(cè),獲得候選皮膚區(qū)域,判斷所述候選皮膚區(qū)域在目標(biāo)圖像整體區(qū)域中的占比是否大于第一預(yù)設(shè)閾值,若是,則執(zhí)行子步驟S12 ;膚色檢測(cè)可以作為確定目標(biāo)圖像中皮膚區(qū)域的第一歩。皮膚區(qū)域在圖像中所占的比例是判斷色情圖像的ー個(gè)重要指標(biāo),同時(shí)也為后續(xù)的操作奠定了基礎(chǔ)。研究表明,皮膚的顔色主要反映了血液的顔色,而不同人種的膚色主要反映在亮度上,其色調(diào)大致相同,因此在YCbCr或者HSV等色彩空間上進(jìn)行計(jì)算的效果要優(yōu)于傳統(tǒng)的RGB空間。公知的是,YCbCr是DVD、攝像機(jī)、數(shù)字電視等消費(fèi)類(lèi)視頻產(chǎn)品中常用的色彩編碼方案。其中Y是指亮度分量,Cb指藍(lán)色色度分量,而Cr指紅色色度分量。人的肉眼對(duì)視頻的Y分量更敏感,因此在通過(guò)對(duì)色度分量進(jìn)行子采樣來(lái)減少色度分量后,肉眼將察覺(jué)不到圖像質(zhì)量的變化。HSV這個(gè)模型中顏色的參數(shù)分別是:色調(diào)(H),飽和度(S),亮度(V)。HSV模型的三維表示從RGB立方體演化而來(lái)。設(shè)想從RGB沿立方體對(duì)角線(xiàn)的白色頂點(diǎn)向黑色頂點(diǎn)觀察,就可以看到立方體的六邊形外形。六邊形邊界表示色彩,水平軸表示純度,明度沿垂直軸測(cè)量。作為本實(shí)施例具體應(yīng)用的ー種示例,判斷某ー個(gè)像素是否為皮膚,可以采用如下兩種方法:第一種、基于經(jīng)驗(yàn)所得閾值的方式:如果該像素的各通道值均在指定的閾值范圍內(nèi),則判定該像素為皮膚。通道對(duì)于RGB來(lái)說(shuō)就是每個(gè)像素R、G、B的值,同樣HSV也是每個(gè)像素的H、S、V的值。閾值的設(shè)定一般是根據(jù)經(jīng)驗(yàn)所得,所使用的閾值可以作為ー個(gè)參考,即滿(mǎn)足下式的像素被歸類(lèi)到皮膚像素。red > 95&&green > 40&&blue > 20&&(maxrgb-minrgb) > 15&&abs(red-green)> 15&&red > green &&red > blue Mgreen > blue &&red < (green+150)&&red< (blue+150)&&green < (blue+150);上式中,red、green、blue分別是當(dāng)前像素的RGB值,maxrgb、minrgb是當(dāng)前像素RGB值中的最大值和最小值,abs代表取絕對(duì)值操作。第二種、基于統(tǒng)計(jì)的方式:首先對(duì)ー批樣本圖像進(jìn)行人工皮膚標(biāo)注,對(duì)顏色空間的每ー個(gè)值存儲(chǔ)皮膚/非皮膚的概率;在膚色檢測(cè)時(shí),針對(duì)輸入圖像各個(gè)像素的顔色空間值,結(jié)合貝葉斯公式進(jìn)行判斷。例如,貝葉斯公式的數(shù)學(xué)表達(dá)式為P (AIB) = P (B I A) *P (A) /P (B),其中,A、B指的是事件,比如A為是否為皮膚,B為像素值是多少;各變量的意義是:
P(A):訓(xùn)練集合中,皮膚或者非皮膚區(qū)域的概率;P⑶:訓(xùn)練集合中,該像素值出現(xiàn)的概率;P(B|A):訓(xùn)練集合中,在已知的皮膚區(qū)域中,該像素出現(xiàn)的概率;P(A|B):已知某一像素值,是皮膚或者非皮膚的概率。上述P(A)、P(B)和P(B|A)為先驗(yàn)概率,可以通過(guò)事先的訓(xùn)練得到;P(A|B)為設(shè)置的用于判斷某一個(gè)像素是否屬于皮膚的依據(jù)。在實(shí)際應(yīng)用中,可以準(zhǔn)備多張包含人物的樣本圖像,并采取如下手段:I)首先通過(guò)手工標(biāo)注的方式,勾勒出皮膚區(qū)域;一般以如下形式保存:像素值(Key),作為皮膚出現(xiàn)的次數(shù)(Valuel),作為非皮膚出現(xiàn)的次數(shù)(Value2);2)對(duì)每ー張圖像來(lái)說(shuō),逐像素掃描,如果某一點(diǎn)為皮膚,則找到該像素值Key存放的地址,將Valuel自增一,反之則將Value2自增一,形如:Pixell, 4, 5Pixel2,2,7Pixel3,10,21......
3)對(duì)訓(xùn)練集中的圖像都采用上面的方式。最后會(huì)形成一個(gè)很大的文件;
4)根據(jù)這個(gè)文件,可以得到某一像素是皮膚或者非皮膚的概率,如下:A:判斷某一像素是皮膚的概率Pl:P (A)(累加各像素Value I的和,與累加各像素Value2+Value I的和,的比值)、P(B)(指定像素的Valuel+Value2,與所有像素的Valuel+Value2之和,的比值)、P(B|A)(如果是指定像素的Valuel,與所有像素的Valuel之和,的比值);再通過(guò)貝葉斯公式算得P(A|B);B:判斷某一像素是非皮膚的概率P2:P(A)(累加各像素Value2的和,與累加各像素Value2+ValueI的和,的比值)、P(B)(指定像素的Valuel+Value2,與所有像素的Valuel+Value2之和,的比值)、P (B | A)(指定像素的Value2,與所有像素的Value2之和,的比值);再通過(guò)貝葉斯公式算得P(A|B);5)如果Pl:P2 > N(本方案N取3),則判定該像素是皮膚,否則即是非皮膚。對(duì)于檢測(cè)出的皮膚面積占全圖比例小于第一預(yù)設(shè)閾值,如20%,的圖像,直接將其判定為正常圖像;否則轉(zhuǎn)入子步驟S 12。當(dāng)然,上述膚色檢測(cè)的方法僅僅用作示例,本領(lǐng)域技術(shù)人員采用任ー種膚色檢測(cè)的方法都是可行的,本申請(qǐng)對(duì)此無(wú)需加以限制。子步驟S12、對(duì)所述候選皮膚區(qū)域進(jìn)行紋理特征檢測(cè);子步驟S13、確定所述紋理特征強(qiáng)度大于第二預(yù)設(shè)閾值的候選皮膚區(qū)域?yàn)槠つw區(qū)域。單純依靠顏色來(lái)判斷皮膚,會(huì)有較大的誤判率,某些接近皮膚顏色的毛發(fā)、織物等也會(huì)被誤判為皮膚,因此為進(jìn)一步提高色情圖像檢測(cè)的準(zhǔn)確率,降低誤判率,在本申請(qǐng)的ー種優(yōu)選實(shí)施例中可以引入紋理特征檢測(cè)。計(jì)算機(jī)圖形學(xué)中的紋理既包括通常意義上物體表面的紋理即使物體表面呈現(xiàn)凹凸不平的溝紋,同時(shí)也包括在物體的光滑表面上的彩色圖案。皮膚區(qū)別于毛發(fā)、織物等物體的ー個(gè)重要特征在于更為光滑,反映在圖像特征上,即紋理的幅度較弱。作為本實(shí)施例具體應(yīng)用的ー種示例,可以采用如下方式對(duì)候選皮膚區(qū)域進(jìn)行紋理特征檢測(cè):A)針對(duì)膚色檢測(cè)輸出的圖像,采用邊緣提取算法提取其紋理特征;B)針對(duì)已通過(guò)膚色判定為皮膚區(qū)域的每ー個(gè)像素,如果其紋理的強(qiáng)度大于第二預(yù)設(shè)閾值,則判定為非皮膚。作為ー種示例,可以選擇Sobel算子來(lái)進(jìn)行邊緣檢測(cè),在這種情況下,所述第二預(yù)設(shè)閾值可以為5。C)由于步驟B)輸出的圖像可能會(huì)存在許多細(xì)小的皮膚/非皮膚區(qū)域,在具體實(shí)現(xiàn)中,還可以采用形態(tài)學(xué)濾波的方式(對(duì)皮膚區(qū)域進(jìn)行先腐蝕后膨脹)來(lái)濾除這些噪音。其中,數(shù)學(xué)形態(tài)學(xué)是由一組形態(tài)學(xué)的代數(shù)運(yùn)算子組成的,它的基本運(yùn)算有4個(gè):膨脹(或擴(kuò)張)、腐蝕(或侵蝕)、開(kāi)啟和閉合,它們?cè)讠酥祱D像和灰度圖像中各有特點(diǎn)。基于這些基本運(yùn)算還可推導(dǎo)和組合成各種數(shù)學(xué)形態(tài)學(xué)實(shí)用算法,用它們可以進(jìn)行圖像形狀和結(jié)構(gòu)的分析及處理,包括圖像分割、特征抽取、邊界檢測(cè)、圖像濾波、圖像增強(qiáng)和恢復(fù)等。對(duì)于皮膚區(qū)域的面積占全圖比例小于第一預(yù)設(shè)閾值的圖像,直接將其判定為正常圖像;否則轉(zhuǎn)入下一步驟。理論上,膚色檢測(cè)與紋理特征檢測(cè)是兩個(gè)獨(dú)立的判別方法,可以任選其一或者更換順序;但實(shí)際使用過(guò)程中,優(yōu)選為使用先進(jìn)行膚色檢測(cè)再紋理特征檢測(cè)的方式,主要原因在干:膚色是一個(gè)較強(qiáng)的過(guò)濾器,根據(jù)統(tǒng)計(jì),大約可以過(guò)濾掉大約80 %的無(wú)關(guān)圖像,而紋理則要弱的多;紋理更適合在膚色檢測(cè)基礎(chǔ)上,做ー些修正,去除ー些膚色相近紋理較強(qiáng)的非皮膚區(qū)域(肉色外衣以及金發(fā)等等)步驟102、若所述皮膚區(qū)域在目標(biāo)圖像整體區(qū)域中的占比大于第一預(yù)設(shè)閾值,則檢測(cè)所述目標(biāo)圖像中的連通域;由于色情圖像往往會(huì)呈現(xiàn)大塊的皮膚區(qū)域,因此對(duì)色情圖像偵測(cè)來(lái)說(shuō),大塊連通的皮膚區(qū)域往往嫌疑程度越高,反之則越低。連通域提取有許多很成熟的算法,比較經(jīng)典的包括四連通域(查看某一個(gè)像素的相鄰四個(gè)像素是否也為皮膚,是則添加進(jìn)連通域中,以此類(lèi)推)和八連通域(類(lèi)似)。最終可以得到各連通域在圖像中的位置以及面積。步驟103、判斷所述連通域在皮膚區(qū)域中的分布是否滿(mǎn)足預(yù)置規(guī)則,若是,則判定所述目標(biāo)圖像為色情圖像。在本申請(qǐng)的ー種優(yōu)選實(shí)施例中,本步驟103具體可以包括如下子步驟:子步驟S21、獲取各連通域的面積,判斷其中面積最大的連通域在皮膚區(qū)域中的占比是否大于第三預(yù)設(shè)閾值;和/或,子步驟S21、獲取各連通域的面積,判斷其中面積大小在前n位的連通域,在皮膚區(qū)域中的占比是否大于第四預(yù)設(shè)閾值,所述n大于I。由于面積較大的連通域?yàn)榇髩K皮膚區(qū)域的可能性更高,大塊皮膚區(qū)域?yàn)樯閳D像的嫌疑程度更高,因此在本申請(qǐng)的優(yōu)選實(shí)施例中,可以提取面積最大的連通域和/或面積大小在前n位的連通域進(jìn)行判斷,在實(shí)際中,所述第三預(yù)設(shè)閾值可以為5% ;所述n可以為3,所述第四預(yù)設(shè)閾值可以為50%。在實(shí)際中,若面積最大的連通域在皮膚區(qū)域中的占比小于第三預(yù)設(shè)閾值;和/或,其中面積大小在前n位的連通域,在皮膚區(qū)域中的占比小于第四預(yù)設(shè)閾值,則可以判斷目標(biāo)圖像為正常圖像。參照?qǐng)D2,示出了本申請(qǐng)ー種色情圖像偵測(cè)的方法實(shí)施例2的步驟流程圖,具體可以包括如下步驟:步驟201、檢測(cè)目標(biāo)圖像中的皮膚區(qū)域;步驟202、若所述皮膚區(qū)域在目標(biāo)圖像整體區(qū)域中的占比大于第一預(yù)設(shè)閾值,則檢測(cè)所述目標(biāo)圖像中的連通域;步驟203、判斷所述連通域在皮膚區(qū)域中的分布是否滿(mǎn)足預(yù)置規(guī)則,若是,則執(zhí)行步驟204 ;步驟204、檢測(cè)目標(biāo)圖像中的臉部區(qū)域;步驟205、判斷所述臉部區(qū)域在目標(biāo)圖像整體區(qū)域中的占比是否小于第五預(yù)設(shè)閾值,若是,則執(zhí)行步驟206 ;步驟206、根據(jù)所述臉部區(qū)域估算軀干區(qū)域,并檢測(cè)軀干區(qū)域中的皮膚區(qū)域;步驟207、判斷所述軀干區(qū)域中的皮膚區(qū)域在軀干區(qū)域中的占比是否超過(guò)第六預(yù)設(shè)閾值,若是,則執(zhí)行步驟208 ;步驟208、判定所述目標(biāo)圖像為色情圖像。在本實(shí)施例中,采用臉部檢測(cè)的方法來(lái)輔助識(shí)別色情圖像。目前常用的臉部檢測(cè)的方法包括:自適應(yīng)增強(qiáng)(adaboost,adaptive boosting)、ASM(算法狀態(tài)機(jī))>AAM(activeappearance model,主動(dòng)形狀模型)等,本領(lǐng)域技術(shù)人員可以根據(jù)實(shí)際情況選擇合適的算法。應(yīng)用本實(shí)施例,對(duì)于包含人臉的目標(biāo)圖像,結(jié)合提取出來(lái)的臉部信息,可以采用如下策略來(lái)進(jìn)行篩選:I)如果臉部的面積占全圖面積的比例超過(guò)第五預(yù)設(shè)閾值,如65%,則該圖很有可能是臉部特寫(xiě),判定為正常圖像。2)根據(jù)人臉的位置、大小估算軀干區(qū)域。得到人臉信息后,根據(jù)正常人體的比例,可以估計(jì)出大致軀干的區(qū)域。在具體應(yīng)用中可以將人臉下方、以人臉為中心,寬度為2倍人臉直徑,高度為5倍人臉直徑的矩形區(qū)域定義為人體軀干。3)如果軀干區(qū)域皮膚的面積占軀干面積的比例超過(guò)第六預(yù)設(shè)閾值,如75%,則判定為色情圖像參照?qǐng)D3,示出了本申請(qǐng)ー種色情圖像偵測(cè)的方法實(shí)施例3的步驟流程圖,具體可以包括如下步驟:步驟301、檢測(cè)樣本圖像中的皮膚區(qū)域;其中,所述樣本圖像可以包括正樣本圖像和反樣本圖像;步驟302、若所述皮膚區(qū)域在當(dāng)前樣本圖像整體區(qū)域中的占比大于第一預(yù)設(shè)閾值,則檢測(cè)所述樣本圖像中的連通域;步驟303、針對(duì)所述正樣本圖像和反樣本圖像中,連通域面積大小在前m位的目標(biāo)連通域提取預(yù)設(shè)特征;步驟304、根據(jù)所提取的預(yù)設(shè)特征生成分類(lèi)模型;步驟305、將待檢測(cè)的目標(biāo)圖像輸入分類(lèi)模型,判斷是否為色情圖像。在具體實(shí)現(xiàn)中,可以選擇若干數(shù)量的正樣本圖像(色情圖像)和反樣本圖像(正常圖像),按照前述方法實(shí)施例1和方法實(shí)施例2中的相關(guān)方法進(jìn)行皮膚區(qū)域提取及連通域分析。作為本申請(qǐng)的ー種優(yōu)選實(shí)施例,所述預(yù)設(shè)特征可以包括:第一特征:所述目標(biāo)連通域的面積在當(dāng)前樣本圖像中的占比;所述第一特征可以理解為相對(duì)面積的特征,即皮膚連通域面積占全圖面積的比例,該參數(shù)越大說(shuō)明為色情圖像的可能性越高。和/或,第二特征:所述目標(biāo)連通域最小外接橢圓的中心與當(dāng)前樣本圖像中心的距離;所述第二特征可以理解為相對(duì)位置的特征,即皮膚連通域最小外接橢圓的中心與圖像中心的距離。絕大多數(shù)情況下,圖像的主體位于其中心位置,因此該參數(shù)越小,說(shuō)明裸露皮膚位于圖像的位置越重要,該圖像為色情圖像的可能性越高。和/或,第三特征:所述目標(biāo)連通域最小外接橢圓的長(zhǎng)軸與水平或者垂直方向的最小夾角;所述第三特征可以理解為相對(duì)方向的特征,即皮膚連通域最小外接橢圓的長(zhǎng)軸與水平或者垂直方向的最小夾角。大多數(shù)情況下,色情圖像中裸露的軀干四肢往往會(huì)呈水平或者垂直方向,因此該參數(shù)越小,說(shuō)明該圖像為色情圖像的可能性越高。和/或,第四特征:所述目標(biāo)連通域最小外接橢圓的長(zhǎng)軸與短軸的比例;所述第四特征可以理解為形狀特征,即皮膚連通域最小外接橢圓的長(zhǎng)軸與短軸的比例。由于人體的軀干、四肢都呈狹長(zhǎng)狀并且長(zhǎng)寬比都在一定的閾值范圍內(nèi),如2: 5。因此該參數(shù)如果在預(yù)設(shè)的閾值范圍內(nèi),則該圖像為色情圖像的可能性越高。和/或,第五特征:所述目標(biāo)連通域中皮膚區(qū)域的面積占整個(gè)目標(biāo)連通域面積的比例;所述第五特征可以理解為填充率特征,即皮膚連通域中實(shí)際皮膚像素的面積與整個(gè)連通域面積的比例。該參數(shù)越高,則說(shuō)明該圖像為色情圖像的可能性也越高。和/或,第六特征:所述目標(biāo)連通域中皮膚區(qū)域的各像素所對(duì)應(yīng)的每ー個(gè)通道值的均方差。所述第六特征可以理解為顏色均方差特征,即皮膚連通域中各個(gè)像素分別每ー個(gè)通道值的均方差。由于膚色檢測(cè)具有一定的誤差,會(huì)將ー些類(lèi)似膚色的其它物體(毛發(fā)、衣物、家具等)誤判為皮膚區(qū)域。同一個(gè)人的皮膚區(qū)域其顔色往往呈現(xiàn)出較強(qiáng)的一致性,因此可以使用連通域內(nèi)各像素的顔色均方差來(lái)衡量該區(qū)域是皮膚的置信度。該參數(shù)越低,則說(shuō)明該圖像為色情圖像的可能性也越高。針對(duì)之前提取的特征,使用機(jī)器學(xué)習(xí)的方式,如支持向量機(jī)(SVM)或者神經(jīng)網(wǎng)絡(luò)的方式進(jìn)行訓(xùn)練,得到分類(lèi)所用的模型。訓(xùn)練可以選用上述一個(gè)或多個(gè)特征,本申請(qǐng)對(duì)此不作限制。對(duì)輸入待檢測(cè)的圖像,使用前一步輸出的模型進(jìn)行最終的判斷。需要說(shuō)明的是,對(duì)于前述的方法實(shí)施例,為了簡(jiǎn)單描述,故將其都表述為一系列的動(dòng)作組合,但是本領(lǐng)域技術(shù)人員應(yīng)該知悉,本申請(qǐng)并不受所描述的動(dòng)作順序的限制,因?yàn)橐罁?jù)本申請(qǐng),某些步驟可以采用其他順序或者同時(shí)進(jìn)行。其次,本領(lǐng)域技術(shù)人員也應(yīng)該知悉,說(shuō)明書(shū)中所描述的實(shí)施例均屬于優(yōu)選實(shí)施例,所涉及的動(dòng)作和模塊并不一定是本申請(qǐng)所必須的。參考圖4,示出了本申請(qǐng)的ー種色情圖像偵測(cè)的系統(tǒng)實(shí)施例1的結(jié)構(gòu)框圖,具體可以包括如下模塊:皮膚區(qū)域檢測(cè)模塊401,用于檢測(cè)目標(biāo)圖像中的皮膚區(qū)域;第一判斷模塊402,用于判斷所述皮膚區(qū)域在目標(biāo)圖像整體區(qū)域中的占比是否大于第一預(yù)設(shè)閾值,若是,則調(diào)用連通域分析模塊403 ;連通域分析模塊403,用于檢測(cè)所述目標(biāo)圖像中的連通域;第二判斷模塊404,用于判斷所述連通域在皮膚區(qū)域中的分布是否滿(mǎn)足預(yù)置規(guī)則,若是,則判定所述目標(biāo)圖像為色情圖像。在本申請(qǐng)的ー種優(yōu)選實(shí)施例中,所述皮膚區(qū)域檢測(cè)模塊401可以進(jìn)一歩包括如下子模塊:膚色檢測(cè)子模塊,用于對(duì)目標(biāo)圖像進(jìn)行膚色檢測(cè),獲得候選皮膚區(qū)域;紋理特征檢測(cè)子模塊,用于在所述候選皮膚區(qū)域在目標(biāo)圖像整體區(qū)域中的占比大于第一預(yù)設(shè)閾值時(shí),對(duì)所述候選皮膚區(qū)域進(jìn)行紋理特征檢測(cè);皮膚區(qū)域確定子模塊,用于確定所述紋理特征強(qiáng)度大于第二預(yù)設(shè)閾值的候選皮膚區(qū)域?yàn)槠つw區(qū)域。在本申請(qǐng)的ー種優(yōu)選實(shí)施例中,所述連通域分析模塊402可以進(jìn)一歩包括以下子模塊:最大連通域分析子模塊,用于獲取各連通域的面積,判斷其中面積最大的連通域在皮膚區(qū)域中的占比是否大于第三預(yù)設(shè)閾值;和/或,優(yōu)選連通域分析子模塊,用于獲取各連通域的面積,判斷其中面積大小在前n位的連通域,在皮膚區(qū)域中的占比是否大于第四預(yù)設(shè)閾值,所述n大于I。更為優(yōu)選的是,本申請(qǐng)實(shí)施例還可以包括如下模塊:臉部區(qū)域檢測(cè)模塊,用于檢測(cè)目標(biāo)圖像中的臉部區(qū)域;第三判斷模塊,用于判斷所述臉部區(qū)域在目標(biāo)圖像整體區(qū)域中的占比是否小于第五預(yù)設(shè)閾值,若是,則調(diào)用軀干區(qū)域檢測(cè)模塊;軀干區(qū)域檢測(cè)模塊,用于根據(jù)所述臉部區(qū)域估算軀干區(qū)域,并檢測(cè)軀干區(qū)域中的皮膚區(qū)域;第四判斷模塊,用于判斷所述軀干區(qū)域中的皮膚區(qū)域在軀干區(qū)域中的占比是否超過(guò)第六預(yù)設(shè)閾值,若是,則判定所述目標(biāo)圖像為色情圖像。在具體實(shí)現(xiàn)中,所述第一預(yù)設(shè)閾值可以為20% ;所述紋理特征檢測(cè)可以采用邊緣提取算法,所述第二預(yù)設(shè)閾值可以為5 ;所述第三預(yù)設(shè)閾值可以為5%;所述n可以為3,所述第四預(yù)設(shè)閾值可以為50% ;所述第五預(yù)設(shè)閾值可以為65% ;所述第六預(yù)設(shè)閾值可以75%。參考圖5,示出了本申請(qǐng)的ー種色情圖像偵測(cè)的系統(tǒng)實(shí)施例2的結(jié)構(gòu)框圖,具體可以包括如下模塊:樣本皮膚檢測(cè)模塊501,用于檢測(cè)樣本圖像中的皮膚區(qū)域;所述樣本圖像包括正樣本圖像和反樣本圖像;第五判斷模塊502,用于判斷所述皮膚區(qū)域在當(dāng)前樣本圖像整體區(qū)域中的占比大于第一預(yù)設(shè)閾值,若是,則調(diào)用連通域檢測(cè)模塊503 ;連通域檢測(cè)模塊503,用于檢測(cè)所述樣本圖像中的連通域;特征提取模塊504,用于針對(duì)所述正樣本圖像和反樣本圖像中,連通域面積大小在前m位的目標(biāo)連通域提取預(yù)設(shè)特征;模型生成模塊505,用于根據(jù)所提取的預(yù)設(shè)特征生成分類(lèi)模型;模型判斷模塊506,用于將待檢測(cè)的目標(biāo)圖像輸入分類(lèi)模型,判斷是否為色情圖像。作為本申請(qǐng)實(shí)施例的一種優(yōu)選示例,所述預(yù)設(shè)特征具體可以包括:第一特征:所述目標(biāo)連通域的面積在當(dāng)前樣本圖像中的占比;和/或,第二特征:所述目標(biāo)連通域最小外接橢圓的中心與當(dāng)前樣本圖像中心的距離;和/或,第三特征:所述目標(biāo)連通域最小外接橢圓的長(zhǎng)軸與水平或者垂直方向的最小夾角;和/或,第四特征:所述目標(biāo)連通域最小外接橢圓的長(zhǎng)軸與短軸的比例;和/或,第五特征:所述目標(biāo)連通域中皮膚區(qū)域的面積占整個(gè)目標(biāo)連通域面積的比例;和/或,第六特征:所述目標(biāo)連通域中皮膚區(qū)域的各像素所對(duì)應(yīng)的每ー個(gè)通道值的均方差。對(duì)于系統(tǒng)實(shí)施例而言,由于其與方法實(shí)施例基本相似,所以描述的比較簡(jiǎn)單,相關(guān)之處參見(jiàn)方法實(shí)施例的部分說(shuō)明即可。本說(shuō)明書(shū)中的各個(gè)實(shí)施例均采用遞進(jìn)的方式描述,每個(gè)實(shí)施例重點(diǎn)說(shuō)明的都是與其他實(shí)施例的不同之處,各個(gè)實(shí)施例之間相同相似的部分互相參見(jiàn)即可。以上對(duì)本申請(qǐng)所提供的ー種色情圖像偵測(cè)的方法和系統(tǒng),進(jìn)行了詳細(xì)介紹,本文中應(yīng)用了具體個(gè)例對(duì)本申請(qǐng)的原理及實(shí)施方式進(jìn)行了闡述,以上實(shí)施例的說(shuō)明只是用于幫助理解本申請(qǐng)的方法及其核心思想;同時(shí),對(duì)于本領(lǐng)域的一般技術(shù)人員,依據(jù)本申請(qǐng)的思想,在具體實(shí)施方式
及應(yīng)用范圍上均會(huì)有改變之處,綜上所述,本說(shuō)明書(shū)內(nèi)容不應(yīng)理解為對(duì)本申請(qǐng)的限制。
權(quán)利要求
1.一種色情圖像偵測(cè)的方法,其特征在于,包括: 檢測(cè)目標(biāo)圖像中的皮膚區(qū)域; 若所述皮膚區(qū)域在目標(biāo)圖像整體區(qū)域中的占比大于第一預(yù)設(shè)閾值,則檢測(cè)所述目標(biāo)圖像中的連通域; 判斷所述連通域在皮膚區(qū)域中的分布是否滿(mǎn)足預(yù)置規(guī)則,若是,則判定所述目標(biāo)圖像為色情圖像。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述檢測(cè)目標(biāo)圖像中的皮膚區(qū)域的步驟進(jìn)ー步包括: 對(duì)目標(biāo)圖像進(jìn)行膚色檢測(cè),獲得候選皮膚區(qū)域; 在所述候選皮膚區(qū)域在目標(biāo)圖像整體區(qū)域中的占比大于第一預(yù)設(shè)閾值時(shí),對(duì)所述候選皮膚區(qū)域進(jìn)行紋理特征檢測(cè); 確定所述紋理特征強(qiáng)度大于第二預(yù)設(shè)閾值的候選皮膚區(qū)域?yàn)槠つw區(qū)域。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述判斷連通域在皮膚區(qū)域中的分布是否滿(mǎn)足預(yù)置規(guī)則的步驟進(jìn)一歩包括: 獲取各連通域的面積,判斷其中面積最大的連通域在皮膚區(qū)域中的占比是否大于第三預(yù)設(shè)閾值; 和/或, 獲取各連通域的面積,判斷其中面積大小在前n位的連通域,在皮膚區(qū)域中的占比是否大于第四預(yù)設(shè)閾值,所述n大于I。
4.根據(jù)權(quán)利要求1或2或3所述的方法,其特征在于,在所述判定目標(biāo)圖像為色情圖像的步驟之前,還包括: 檢測(cè)目標(biāo)圖像中的臉部區(qū)域; 若所述臉部區(qū)域在目標(biāo)圖像整體區(qū)域中的占比小于第五預(yù)設(shè)閾值,則根據(jù)所述臉部區(qū)域估算軀干區(qū)域,并檢測(cè)軀干區(qū)域中的皮膚區(qū)域; 若所述軀干區(qū)域中的皮膚區(qū)域在軀干區(qū)域中的占比超過(guò)第六預(yù)設(shè)閾值,則判定所述目標(biāo)圖像為色情圖像。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述第一預(yù)設(shè)閾值為20%;所述紋理特征檢測(cè)采用邊緣提取算法,所述第二預(yù)設(shè)閾值為5 ;所述第三預(yù)設(shè)閾值為5% ;所述n為3,所述第四預(yù)設(shè)閾值為50% ;所述第五預(yù)設(shè)閾值為65% ;所述第六預(yù)設(shè)閾值75%。
6.一種色情圖像偵測(cè)的方法,其特征在于,包括: 檢測(cè)樣本圖像中的皮膚區(qū)域;所述樣本圖像包括正樣本圖像和反樣本圖像; 若所述皮膚區(qū)域在當(dāng)前樣本圖像整體區(qū)域中的占比大于第一預(yù)設(shè)閾值,則檢測(cè)所述樣本圖像中的連通域; 針對(duì)所述正樣本圖像和反樣本圖像中,連通域面積大小在前m位的目標(biāo)連通域提取預(yù)設(shè)特征; 根據(jù)所提取的預(yù)設(shè)特征生成分類(lèi)模型; 將待檢測(cè)的目標(biāo)圖像輸入分類(lèi)模型,判斷是否為色情圖像。
7.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述預(yù)設(shè)特征包括: 第一特征:所述目標(biāo) 連通域的面積在當(dāng)前樣本圖像中的占比;和/或, 第二特征:所述目標(biāo)連通域最小外接橢圓的中心與當(dāng)前樣本圖像中心的距離; 和/或, 第三特征:所述目標(biāo)連通域最小外接橢圓的長(zhǎng)軸與水平或者垂直方向的最小夾角; 和/或, 第四特征:所述目標(biāo)連通域最小外接橢圓的長(zhǎng)軸與短軸的比例; 和/或, 第五特征:所述目標(biāo)連通域中皮膚區(qū)域的面積占整個(gè)目標(biāo)連通域面積的比例; 和/或, 第六特征:所述目標(biāo)連通域中皮膚區(qū)域的各像素所對(duì)應(yīng)的每ー個(gè)通道值的均方差。
8.一種色情圖像偵測(cè)的系統(tǒng),其特征在于,包括: 皮膚區(qū)域檢測(cè)模塊,用于檢測(cè)目標(biāo)圖像中的皮膚區(qū)域; 第一判斷模塊,用于判斷所述皮膚區(qū)域在目標(biāo)圖像整體區(qū)域中的占比是否大于第一預(yù)設(shè)閾值,若是,則調(diào)用連通域分析模塊; 連通域分析模塊,用于檢測(cè)所述目標(biāo)圖像中的連通域; 第二判斷模塊,用于判斷所述連通域在皮膚區(qū)域中的分布是否滿(mǎn)足預(yù)置規(guī)則,若是,則判定所述目標(biāo)圖像為色情圖像。
9.根據(jù)權(quán)利要求8所述的系統(tǒng),其特征在于,所述皮膚區(qū)域檢測(cè)模塊進(jìn)一歩包括: 膚色檢測(cè)子模塊,用于對(duì)目標(biāo)圖像進(jìn)行膚色檢測(cè),獲得候選皮膚區(qū)域; 紋理特征檢測(cè)子模塊,用于在所述候選皮膚區(qū)域在目標(biāo)圖像整體區(qū)域中的占比大于第一預(yù)設(shè)閾值時(shí),對(duì)所述候選皮膚區(qū)域進(jìn)行紋理特征檢測(cè); 皮膚區(qū)域確定子模塊,用于確定所述紋理特征強(qiáng)度大于第二預(yù)設(shè)閾值的候選皮膚區(qū)域?yàn)槠つw區(qū)域。
10.根據(jù)權(quán)利要求8所述的系統(tǒng),其特征在于,所述連通域分析模塊進(jìn)一歩包括: 最大連通域分析子模塊,用于獲取各連通域的面積,判斷其中面積最大的連通域在皮膚區(qū)域中的占比是否大于第三預(yù)設(shè)閾值; 和/或, 優(yōu)選連通域分析子模塊,用于獲取各連通域的面積,判斷其中面積大小在前n位的連通域,在皮膚區(qū)域中的占比是否大于第四預(yù)設(shè)閾值,所述n大于I。
11.根據(jù)權(quán)利要求8或9或10所述的系統(tǒng),其特征在于,還包括: 臉部區(qū)域檢測(cè)模塊,用于檢測(cè)目標(biāo)圖像中的臉部區(qū)域; 第三判斷模塊,用于判斷所述臉部區(qū)域在目標(biāo)圖像整體區(qū)域中的占比是否小于第五預(yù)設(shè)閾值,若是,則調(diào)用軀干區(qū)域檢測(cè)模塊; 軀干區(qū)域檢測(cè)模塊,用于根據(jù)所述臉部區(qū)域估算軀干區(qū)域,并檢測(cè)軀干區(qū)域中的皮膚區(qū)域; 第四判斷模塊,用于判斷所述軀干區(qū)域中的皮膚區(qū)域在軀干區(qū)域中的占比是否超過(guò)第六預(yù)設(shè)閾值,若是,則判定所述目標(biāo)圖像為色情圖像。
12.一種色情圖像偵測(cè)的系統(tǒng),其特征在于,包括: 樣本皮膚檢測(cè)模塊,用于檢測(cè)樣本圖像中的皮膚區(qū)域;所述樣本圖像包括正樣本圖像和反樣本圖像; 第五判斷模塊,用于判斷所述皮膚區(qū)域在當(dāng)前樣本圖像整體區(qū)域中的占比大于第一預(yù)設(shè)閾值,若是,則調(diào)用連通域檢測(cè)模塊; 連通域檢測(cè)模塊,用于檢測(cè)所述樣本圖像中的連通域; 特征提取模塊,用于針對(duì)所述正樣本圖像和反樣本圖像中,連通域面積大小在前m位的目標(biāo)連通域提取預(yù)設(shè)特征; 模型生成模塊,用于根據(jù)所提取的預(yù)設(shè)特征生成分類(lèi)模型; 模型判斷模塊,用于將待檢測(cè)的目標(biāo)圖像輸入分類(lèi)模型,判斷是否為色情圖像。
13.根據(jù)權(quán)利要求12所述的系統(tǒng),其特征在于,所述預(yù)設(shè)特征包括: 第一特征:所述目標(biāo)連通域的面積在當(dāng)前樣本圖像中的占比; 和/或, 第二特征:所述目標(biāo)連通域最小外接橢圓的中心與當(dāng)前樣本圖像中心的距離; 和/或, 第三特征:所述目標(biāo)連通域最小外接橢圓的長(zhǎng)軸與水平或者垂直方向的最小夾角; 和/或, 第四特征:所述目標(biāo)連通域最小外接橢圓的長(zhǎng)軸與短軸的比例; 和/或, 第五特征:所述目標(biāo)連通域中皮膚區(qū)域的面積占整個(gè)目標(biāo)連通域面積的比例; 和/或, 第六特征:所述目標(biāo)連通域中皮膚區(qū)域的各像素所對(duì)應(yīng)的每ー個(gè)通道值的均方差。
全文摘要
本申請(qǐng)?zhí)峁┝艘环N色情圖像偵測(cè)的方法和系統(tǒng),其中所述方法包括檢測(cè)目標(biāo)圖像中的皮膚區(qū)域;若所述皮膚區(qū)域在目標(biāo)圖像整體區(qū)域中的占比大于第一預(yù)設(shè)閾值,則檢測(cè)所述目標(biāo)圖像中的連通域;判斷所述連通域在皮膚區(qū)域中的分布是否滿(mǎn)足預(yù)置規(guī)則,若是,則判定所述目標(biāo)圖像為色情圖像。本申請(qǐng)可以提高色情圖像識(shí)別的召回率和準(zhǔn)確率。
文檔編號(hào)G06K9/00GK103093180SQ201110336168
公開(kāi)日2013年5月8日 申請(qǐng)日期2011年10月28日 優(yōu)先權(quán)日2011年10月28日
發(fā)明者薛暉 申請(qǐng)人:阿里巴巴集團(tuán)控股有限公司