專利名稱:基于高斯分布的色情視頻快速檢測方法
技術(shù)領(lǐng)域:
本發(fā)明一般涉及視頻處理以及視頻識別領(lǐng)域,具體涉及基于高斯分布的色情視頻快速檢測方法。
背景技術(shù):
隨著社會的迅速進(jìn)步,互聯(lián)網(wǎng)在人們生活中的普及程度越來越高,這使得網(wǎng)絡(luò)視頻數(shù)量急劇增長。在這海量的網(wǎng)絡(luò)視頻中,也會同時混雜著ー些色情視頻,但是由于視頻數(shù)量太大,通過人工審核的方式不可能審核所有的網(wǎng)絡(luò)視頻,這些色情視頻往往都只能由視頻用戶舉報然后再刪除。將網(wǎng)絡(luò)色情視頻檢測自動化、高效化,對節(jié)省人力資源,提高網(wǎng)絡(luò)視頻的過濾效率起著很大的作用?,F(xiàn)有主流的色情圖片或視頻過濾方法有基于膚色檢測的色情圖片過濾方法和基于神經(jīng)網(wǎng)絡(luò)的色情圖片分類方法。基于膚色檢測的色情圖片過濾方法是比較原始的顏色檢測方法,速度是最快的,但是誤判率比較高;基于神經(jīng)網(wǎng)絡(luò)的色情圖片分類方法在一定條件下時候能得到比較好的分類結(jié)果,但是這種方法要求的樣本數(shù)量很大,樣本訓(xùn)練的時間很
IXo
發(fā)明內(nèi)容
本發(fā)明針對當(dāng)前網(wǎng)絡(luò)視頻量巨大,視頻審核人力資源缺乏的情況,提供了基于高斯分布的色情視頻快速檢測方法。本發(fā)明目的在于幫助視頻網(wǎng)站快速并準(zhǔn)確審核用戶上傳的視頻,如果是色情視頻則予以刪除。具體技術(shù)方案如下?;诟咚狗植嫉纳橐曨l快速檢測方法,包括以下步驟1)提取樣本圖片的色調(diào)(H)、飽和度( 和亮度(V)的顏色直方圖并保存在數(shù)組中;2)對顏色直方圖數(shù)組的每ー維進(jìn)行高斯分布建模;3)由高斯分布函數(shù)提取樣本圖片的權(quán)值P ;4)利用權(quán)值P確定區(qū)分色情圖片和普通圖片的閾值P閾;5)讀入測試視頻,提取關(guān)鍵幀圖像序列;6)用步驟幻得出的高斯分布函數(shù)計算每一個關(guān)鍵幀圖像的權(quán)值P';7)如果有10%以上的關(guān)鍵幀圖像的權(quán)值P'大于步驟4)的閾值Pw,則判定這個視頻為色情視頻,否則為普通視頻。上述基于高斯分布的色情視頻快速檢測方法中,步驟幻中測試視頻為xvid編碼的avi格式,其他格式的視頻要進(jìn)行轉(zhuǎn)換。上述基于高斯分布的色情視頻快速檢測方法中,步驟6)中視頻關(guān)鍵幀圖像序列的提取方法采用OpenCV開源庫中的視頻處理函數(shù)進(jìn)行提取。上述基于高斯分布的色情視頻快速檢測方法中,步驟1)的樣本圖片包括色情圖片樣本和普通圖片樣本,數(shù)量均為2000張或以上,圖片格式為jpg、bmp或png。
上述基于高斯分布的色情視頻快速檢測方法中,樣本圖片的色調(diào)(H)、飽和度(S) 和亮度(V)的顏色直方圖的提取方法采用OpenCV開源庫的顏色直方圖提取函數(shù)。上述基于高斯分布的色情視頻快速檢測方法中,色情圖片樣本和普通圖片樣本的顏色直方圖保存的數(shù)組均為η * 48的ニ維數(shù)組,其中η為圖片樣本的數(shù)量。上述基于高斯分布的色情視頻快速檢測方法中,步驟2~)的高斯分布建模是對樣本圖片的顏色直方圖每ー維數(shù)值分別經(jīng)過求均值和標(biāo)準(zhǔn)差建立高斯分布函數(shù)
權(quán)利要求
1.基于高斯分布的色情視頻快速檢測方法,其特征在干,包括以下步驟1)提取樣本圖片的色調(diào)(H)、飽和度( 和亮度(V)的顏色直方圖并保存在數(shù)組中;2)對顏色直方圖數(shù)組的每ー維進(jìn)行高斯分布建摸;3)由高斯分布函數(shù)提取樣本圖片的權(quán)值P;4)利用權(quán)值P確定區(qū)分色情圖片和普通圖片的閾值Pw;5)讀入測試視頻,提取關(guān)鍵幀圖像序列;6)用步驟幻得出的高斯分布函數(shù)計算每一個關(guān)鍵幀圖像的權(quán)值P';7)如果有10%以上的關(guān)鍵幀圖像的權(quán)值P'大于步驟4)的閾值Pw,則判定這個視頻為色情視頻,否則為普通視頻。
2.根據(jù)權(quán)利要求1所述基于高斯分布的色情視頻快速檢測方法,其特征在于步驟5) 中測試視頻為xvid編碼的avi格式,其他格式的視頻要進(jìn)行轉(zhuǎn)換。
3.根據(jù)權(quán)利要求2所述基于高斯分布的色情視頻快速檢測方法,其特征在于步驟6) 中視頻關(guān)鍵幀圖像序列的提取方法采用OpenCV開源庫中的視頻處理函數(shù)進(jìn)行提取。
4.根據(jù)權(quán)利要求1所述基于高斯分布的色情視頻快速檢測方法,其特征在于步驟1) 的樣本圖片包括色情圖片樣本和普通圖片樣本,數(shù)量均為2000張或以上,圖片格式為jpg、 bmp 或 png0
5.根據(jù)權(quán)利要求4或所述基于高斯分布的色情視頻快速檢測方法,其特征在于樣本圖片的色調(diào)(H)、飽和度⑶和亮度(V)的顏色直方圖的提取方法采用OpenCV開源庫的顏色直方圖提取函數(shù)。
6.根據(jù)權(quán)利要求5所述基于高斯分布的色情視頻快速檢測方法,其特征在于顏色直方圖的空間維度為48,其中色調(diào)(H)分量有12維,飽和度( 分量有4維,亮度 (V)分量有1維。
7.根據(jù)權(quán)利要求6所述基于高斯分布的色情視頻快速檢測方法,其特征在于色情圖片樣本和普通圖片樣本的顏色直方圖保存的數(shù)組均為η * 48的ニ維數(shù)組,其中 η為圖片樣本的數(shù)量。
8.根據(jù)權(quán)利要求7所述基于高斯分布的色情視頻快速檢測方法,其特征在于步驟幻的高斯分布建模是對樣本圖片的顏色直方圖每ー維數(shù)值分別經(jīng)過求均值和標(biāo)準(zhǔn)差建立高斯分布函數(shù) 其中μ i為第i維顏色直方圖數(shù)值的均值,O i為標(biāo)準(zhǔn)差,1彡i彡48。
9.根據(jù)權(quán)利要求6所述基于高斯分布的色情視頻快速檢測方法,其特征在于步驟3) 和步驟6)中的權(quán)值為每ー維均值逼近概率Pi之和P = Σ Pi ;
10.根據(jù)權(quán)利要求7所述基于高斯分布的色情視頻快速檢測方法,其特征在于步驟4) 中的閾值P 的確定包括以下步驟.4. 1)計算普通圖片樣本權(quán)值的平均值,記為 ^,計算色情圖片樣本權(quán)值的平均值,記為&,另外設(shè)Ptraip為臨時閾值;.4. 2) 閾=i 普,Ptemv = J 普,Amax = O ;.4. 3)如果> Pih,跳到步驟4. 6);色.4. 4)計算用當(dāng)前Ptemp為閾值劃分普通圖片樣本和色情圖片樣本的準(zhǔn)確率A,如果A >Amax,1L· ^niax 一 Aj P 闔一 ιtemp.4. 5)令 Ptemp = Pt_+0. 01,重復(fù)步驟 4. 3);temp.4. 6)循環(huán)結(jié)束,最終得到的Pffl就是最優(yōu)的閾值
全文摘要
本發(fā)明提供了一種基于高斯分布的色情視頻快速檢測方法,先對普通圖片樣本和色情圖片樣本的HSV顏色空間的顏色直方圖建立一個高斯模型,然后提取視頻中的關(guān)鍵幀,并用建立的高斯模型對視頻關(guān)鍵幀進(jìn)行判斷,如果視頻中有一定數(shù)量的關(guān)鍵幀被判定為黃色圖片,就可以判定這個視頻為色情視頻。本發(fā)明只需對顏色直方圖進(jìn)行高斯分布建模,沒有復(fù)雜的訓(xùn)練過程,而且不用對視頻每一幀進(jìn)行檢測,檢測速度快,準(zhǔn)確率高。
文檔編號G06K9/62GK102567738SQ20121000389
公開日2012年7月11日 申請日期2012年1月6日 優(yōu)先權(quán)日2012年1月6日
發(fā)明者劉遠(yuǎn)一, 楊忠明, 索亞南, 蔡昭權(quán), 郝志峰, 黃翰 申請人:華南理工大學(xué)