專利名稱:色情圖片檢查系統(tǒng)及方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種圖片識別系統(tǒng)及方法,特別涉及一種色情圖片檢查系統(tǒng)及方法。
近來網(wǎng)絡(luò)犯罪逐漸增多,引起各界關(guān)注,其中特別以網(wǎng)絡(luò)色情的泛濫,戕害青少年身心十分嚴(yán)重,由于網(wǎng)絡(luò)使用者可以輕易地從許多色情網(wǎng)站接觸到色情信息,包括色情文字、圖片以及動畫等,父母們一直擔(dān)心自己的孩子通過網(wǎng)絡(luò)接觸色情內(nèi)容,那些上網(wǎng)的學(xué)校和公共圖書館將受到來自父母們的壓力,要求在計(jì)算機(jī)中安裝不健康內(nèi)容過濾軟件。此外,在公司企業(yè)里,不少企業(yè)主對于員工自網(wǎng)絡(luò)下載色情圖片,或其往來郵件中的色情圖片頗有微詞,因?yàn)榇蟛糠值木W(wǎng)絡(luò)頻寬被這些圖片占去,無端耗費(fèi)公司資源。
目前市售可防阻色情信息的過濾軟件,具有大量的站臺信息庫,可安裝在提供上網(wǎng)服務(wù)的計(jì)算機(jī),例如網(wǎng)絡(luò)色情鎖閘X-STOP或SurfWatch網(wǎng)站過濾軟件,如果使用者上網(wǎng)時(shí)所連結(jié)的網(wǎng)絡(luò)是屬于過濾軟件內(nèi)的黑名單時(shí),將會出現(xiàn)無法連接的情形,如此便能防堵上萬個(gè)色情網(wǎng)站、FTP(FileTransfer Protocol)文件傳輸中心和新聞討論群組(News Group);然而如果過濾軟件未能定期更新站臺信息,一旦色情網(wǎng)站更換網(wǎng)址或有新增的色情網(wǎng)站產(chǎn)生時(shí),便無法有效杜絕色情信息的入侵。因此能夠即時(shí)針對信息內(nèi)容提供一套的檢查機(jī)制,直接對可疑的圖片文件數(shù)據(jù)進(jìn)行過濾檢查,才能真正使未成年人善用網(wǎng)絡(luò)資源而不致受網(wǎng)絡(luò)有害信息的負(fù)面影響,或者能夠有效防止公司員工占用網(wǎng)絡(luò)頻寬下載色情圖片。
然而局限于傳統(tǒng)上的影像識別技術(shù),直接對可疑的圖片數(shù)據(jù)進(jìn)行過濾檢查,其識別效果仍無法達(dá)到令人滿意的程度,因?yàn)槟壳皥D片識別引擎的識別處理能力約相當(dāng)于一個(gè)十歲的幼童,因此色情圖片識別引擎僅能大概分辨出圖片是否為色情圖片,對于一張被誤判為“非色情”的色情圖片,永遠(yuǎn)會通過色情圖片識別引擎的檢查。另一方面,如果過濾檢查可疑的圖片數(shù)據(jù)是采數(shù)據(jù)庫比較的方式進(jìn)行,則只能針對數(shù)據(jù)庫所存的已知色情圖片進(jìn)行比較,至于數(shù)據(jù)庫中未存有的色情圖片,則只能判斷為非色情圖片,對于一些新出版的色情圖片,由于數(shù)據(jù)庫中尚未有數(shù)據(jù),因此新的色情圖片會被誤判為“非色情”圖片。
根據(jù)本發(fā)明的一個(gè)目的,提出一種色情圖片檢查方法,雙重過濾待檢查圖片,以提高色情圖片識別的準(zhǔn)確度。首先輸入待檢查圖片,接著提取待檢查圖片的特征數(shù)據(jù),而后先根據(jù)其特征數(shù)據(jù)識別待檢查圖片,再根據(jù)特征數(shù)據(jù)比較待檢查圖片與數(shù)據(jù)庫圖片,最后輸出判斷信號。
根據(jù)本發(fā)明的另一目的,提出一種色情圖片檢查系統(tǒng),雙重過濾待檢查圖片,以提高色情圖片識別的準(zhǔn)確度。色情圖片檢查系統(tǒng)包括色情圖片識別引擎、數(shù)據(jù)庫比較引擎及色情圖片數(shù)據(jù)庫。色情圖片識別引擎是用以識別待檢查圖片,并在待檢查圖片和第一判斷信號兩者之間擇一個(gè)輸出;數(shù)據(jù)庫比較引擎連接色情圖片數(shù)據(jù)庫,用以比較數(shù)據(jù)庫圖片和待檢查圖片,輸出第二判斷信號。
根據(jù)本發(fā)明的再一目的,提出一種計(jì)算機(jī)可讀取的記錄介質(zhì),用以記錄使計(jì)算機(jī)執(zhí)行色情圖片檢查方法,雙重過濾一待檢查圖片,以提高色情圖片識別的準(zhǔn)確度。其中色情圖片檢查方法包括首先輸入待檢查圖片,接著擷取待檢查圖片的特征數(shù)據(jù),而后先根據(jù)其特征數(shù)據(jù)識別待檢查圖片,再根據(jù)特征數(shù)據(jù)比較待檢查圖片與數(shù)據(jù)庫圖片,最后輸出判斷信號。
為了實(shí)現(xiàn)上述各發(fā)明目的,按照本發(fā)明的第一個(gè)方面提出以下技術(shù)方案一種色情圖片檢查方法,雙重過濾待檢查圖片,以提高色情圖片辨識的準(zhǔn)確度,該方法包括(a)輸入該待檢查圖片;(b)提取該待檢查圖片的特征數(shù)據(jù);(c)根據(jù)該特征數(shù)據(jù)識別該待檢查圖片;(d)根據(jù)該特征數(shù)據(jù)比較該待檢查圖片與數(shù)據(jù)庫圖片;及(e)輸出判斷信號。
為了實(shí)現(xiàn)上述各發(fā)明目的,按照本發(fā)明的第二個(gè)方面提出以下技術(shù)方案為了實(shí)現(xiàn)上述各發(fā)明目的,按照本發(fā)明的第一個(gè)方面提出以下技術(shù)方案一種色情圖片檢查系統(tǒng),雙重過濾待檢查圖片,以提高色情圖片識別的準(zhǔn)確度,該系統(tǒng)包括一個(gè)色情圖片識別引擎,用以識別該待檢查圖片,并在該待檢查圖片及一第一判斷信號兩者之間擇一個(gè)輸出;以及一個(gè)數(shù)據(jù)庫比較引擎,用以比較一數(shù)據(jù)庫圖片及該待檢查圖片,輸出一個(gè)第二判斷信號。
為了實(shí)現(xiàn)上述各發(fā)明目的,按照本發(fā)明的第三個(gè)方面提出以下技術(shù)方案一種計(jì)算機(jī)可讀取的記錄介質(zhì),用以記錄使計(jì)算機(jī)執(zhí)行色情圖片檢查方法,雙重過濾待檢查圖片,以提高色情圖片識別的準(zhǔn)確度,該方法包括(a)輸入該待檢查圖片;(b)提取該待檢查圖片的特征數(shù)據(jù);(c)根據(jù)該特征數(shù)據(jù)識別該待檢查圖片;(d)根據(jù)該特征數(shù)據(jù)比較該待檢查圖片與數(shù)據(jù)庫圖片;及(e)輸出判斷信號。
為使本發(fā)明的上述目的、特征、和優(yōu)點(diǎn)能更明顯易懂,下面結(jié)合附圖對本發(fā)明的優(yōu)選實(shí)施例進(jìn)行詳細(xì)說明。
色情圖片識別引擎102是以統(tǒng)計(jì)作為其判斷的基礎(chǔ),運(yùn)用數(shù)學(xué)運(yùn)算法針對待檢查圖片的特征數(shù)據(jù)計(jì)算出其特征值,同時(shí)色情圖片識別引擎102設(shè)定有色情特征識別值。而圖片的特征數(shù)據(jù)來源大致包括顏色、型態(tài)、位置、大小、條紋分布、物件屬性等;舉例來說,由于色情圖片多半呈現(xiàn)半裸或全裸的圖面,因此可將以圖片的膚色比例作為其特征數(shù)據(jù)來源,提供色情圖片辨識引擎102進(jìn)行判斷;色情圖片識別引擎102首先定義出膚色密度分布的機(jī)率臨界值,并計(jì)算出圖片區(qū)塊色彩的機(jī)率密度函數(shù)值。將機(jī)率密度函數(shù)值與機(jī)率臨界值比較后,如果機(jī)率密度函數(shù)值大于機(jī)率臨界值,則認(rèn)定此色彩向量屬膚色,否則,為非膚色。據(jù)此,逐一將各區(qū)塊色彩的機(jī)率密度函數(shù)值與機(jī)率臨界值比較,即可將圖片內(nèi)的所有像素分為膚色與非膚色兩類,而統(tǒng)計(jì)判斷出整張圖片的膚色比例作為該張圖片的特征值,此時(shí),色情圖片識別引擎102根據(jù)膚色比例的特征值與其所設(shè)定的色情特征識別值的關(guān)系,來判斷圖片是否為色情圖片,由于色情圖片識別引擎102是直接對待檢查圖片進(jìn)行識別,無須擔(dān)心待檢查圖片為新出版的色情圖片,可避免數(shù)據(jù)庫比較引擎104因色情圖片數(shù)據(jù)庫106尚未更新,而無法過濾出色情圖片的情況。
而數(shù)據(jù)庫比較引擎104通過與色情圖片數(shù)據(jù)庫106的連接,以搜索色情圖片數(shù)據(jù)庫106的方式,將數(shù)據(jù)庫圖片與待檢查圖片進(jìn)行近似性比較。數(shù)據(jù)庫比較引擎104的比較方式是采以圖片特征點(diǎn)(feature points)為基礎(chǔ)的查詢方式;圖片的特征數(shù)據(jù)來源大致包括顏色、型態(tài)、位置、大小、條紋分布、物件屬性等,因此需找出能保留圖片重要特性的特征點(diǎn)作為索引數(shù)據(jù),經(jīng)由比較待檢查圖片及數(shù)據(jù)庫圖片的特征點(diǎn)的對應(yīng)關(guān)系,找出具有最多特征點(diǎn)對應(yīng)群組的相似色情圖片,進(jìn)行兩圖片特征點(diǎn)相似度的比較與近似判斷,以此來比較判斷色情圖片。色情圖片數(shù)據(jù)庫106建立有諸多可供比較的色情圖片,并會定期更新色情圖片數(shù)據(jù)庫106,特別是加入色情圖片識別引擎102容易誤判為“非色情”的色情圖片,以彌補(bǔ)色情圖片辨識引擎102難以識別處理的部分,而能有效的判斷出色情圖片,提高色情圖片的識別率。
參照圖2,其中表示本發(fā)明的一個(gè)優(yōu)選實(shí)施例的色情圖片檢查方法的流程圖;并同時(shí)參照
圖1。色情圖片檢查方法,采用色情圖片識別引擎102及數(shù)據(jù)庫比較引擎104雙重過濾待檢查圖片,以提高色情圖片識別的準(zhǔn)確度。首先開始步驟202,將待檢查圖片輸入至色情圖片識別引擎102以進(jìn)行第一階段的檢查,第一階段所進(jìn)行的色情圖片識別,其基礎(chǔ)在于數(shù)學(xué)運(yùn)算法的設(shè)計(jì),設(shè)計(jì)運(yùn)算法以進(jìn)行特征識別,因而色情圖片識別引擎102設(shè)定有色情特征識別值。接著在步驟204中,色情圖片檢查系統(tǒng)100從輸入的待檢查圖片提取其特征數(shù)據(jù),色情圖片識引擎102運(yùn)用數(shù)學(xué)運(yùn)算法針對待檢查圖片的特征數(shù)據(jù)計(jì)算出其特征值,進(jìn)入步驟206的判斷,色情圖片識別引擎102根據(jù)特征數(shù)據(jù)識別待檢查圖片是否為色情圖片,當(dāng)特征值高于色情特征識別值時(shí),色情圖片識別引擎102判斷出色情圖片,進(jìn)入步驟212,色情圖片檢查系統(tǒng)100于是輸出第一判斷信號Ds1,第一判斷信號Ds1包括待檢查圖片為色情圖片的判斷結(jié)果;當(dāng)該色情圖片識別引擎102特征值低于色情特征識別值,色情圖片識別引擎102判斷出待檢查圖片為非色情圖片,或因識別率偏低而無法判斷時(shí),色情圖片識別引擎102則將待檢查圖片輸出到數(shù)據(jù)庫比較引擎104進(jìn)行第二階段檢查。在步驟208中,數(shù)據(jù)庫比較引擎104搜索色情圖片數(shù)據(jù)庫106,并根據(jù)所提取的特征數(shù)據(jù)進(jìn)行數(shù)據(jù)庫圖片與待檢查圖片的近似性比較。當(dāng)數(shù)據(jù)庫比較引擎104找到具有最多特征點(diǎn)對應(yīng)群組的相似色情圖片,進(jìn)行兩圖片特征點(diǎn)相似度的比較與近似判斷而判斷出待檢查圖片為色情圖片時(shí),進(jìn)入步驟212,色情圖片檢查系統(tǒng)100于是輸出第二判斷信號Ds2,而第二判斷信號包括待檢查圖片為色情圖片的判斷。如果數(shù)據(jù)庫比較引擎104未能找到較多特征點(diǎn)對應(yīng)的相似色情圖片,數(shù)據(jù)庫比較引擎104未判斷出待檢查圖片為色情圖片時(shí),進(jìn)入步驟214,輸入下一張待檢查圖片至色情圖片檢查系統(tǒng)100,重復(fù)進(jìn)行此色情圖片檢查方法。
由于數(shù)據(jù)庫比較引擎104連接有色情圖片數(shù)據(jù)庫106,其處理時(shí)間比色情圖片識別引擎的處理時(shí)間久,因此設(shè)定第一階段檢查為色情圖片識別引擎對圖片進(jìn)行色情識別,設(shè)定第二階段檢查為數(shù)據(jù)庫比較引擎的圖片比較,對于可通過色情圖片識別引擎檢查出的色情圖片,不必再由數(shù)據(jù)庫比較引擎104的進(jìn)行檢查,因此整體而言,可減少檢查過程所需花費(fèi)的時(shí)間及系統(tǒng)的負(fù)荷。發(fā)明效果本發(fā)明上述實(shí)施例所披露的色情圖片檢查系統(tǒng)及方法,利用色情圖片辨識引擎及數(shù)據(jù)庫比較引擎的雙重過濾,先對圖片進(jìn)行色情識別,再對過濾后的圖片進(jìn)行數(shù)據(jù)庫的比較,不但能有效識別出數(shù)據(jù)庫已知的圖片,還可以識別出新的圖片,提高色情圖片的識別率。具體優(yōu)點(diǎn)描述如下1.色情圖片識別引擎直接對待檢查圖片進(jìn)行識別,無須擔(dān)心待檢查圖片為新出版的色情圖片,可避免數(shù)據(jù)庫比較引擎因色情圖片數(shù)據(jù)庫尚未更新,而無法過濾出色情圖片的情況。
2.數(shù)據(jù)庫比較引擎可以彌補(bǔ)色情圖片識別引擎難以識別處理的部分,而能有效的判斷出色情圖片。特別是將色情圖片識別引擎容易誤判為“非色情”的色情圖片加入色情圖片數(shù)據(jù)庫,更可提高色情圖片的識別率。
3.設(shè)定第一階段檢查為色情圖片識別引擎先對圖片進(jìn)行色情識別,再對過濾后的圖片進(jìn)行第二階段的數(shù)據(jù)庫比較引擎的比較檢查,可減低檢查過程所需的時(shí)間及系統(tǒng)的負(fù)荷。
綜上所述,雖然本發(fā)明已經(jīng)結(jié)合一個(gè)優(yōu)選實(shí)施例進(jìn)行了披露,但并非用以限制本發(fā)明,對于本專業(yè)的技術(shù)人員而言,在不脫離本發(fā)明的精神和范圍的情況下,可以對本發(fā)明作出各種修改或變化。因此,本發(fā)明的保護(hù)范圍應(yīng)當(dāng)以后附的權(quán)利要求書所所限定的范圍為準(zhǔn)。
權(quán)利要求
1.一種色情圖片檢查方法,雙重過濾待檢查圖片,以提高色情圖片辨識的準(zhǔn)確度,該方法包括(a)輸入該待檢查圖片;(b)提取該待檢查圖片的特征數(shù)據(jù);(c)根據(jù)該特征數(shù)據(jù)識別該待檢查圖片;(d)根據(jù)該特征數(shù)據(jù)比較該待檢查圖片與數(shù)據(jù)庫圖片;及(e)輸出判斷信號。
2.如權(quán)利要求1所述的色情圖片檢查方法,其中在步驟(d)之前還包括步驟(d0),搜索色情圖片數(shù)據(jù)庫,進(jìn)行該數(shù)據(jù)庫圖片與該待檢查圖片的近似比較。
3.如權(quán)利要求1所述的色情圖片檢查方法,其中步驟(c)是由色情圖片識別引擎進(jìn)行識別。
4.如權(quán)利要求3所述的色情圖片檢查方法,其中該色情圖片識別引擎是以統(tǒng)計(jì)作為其判斷的基礎(chǔ)。
5.如權(quán)利要求4所述的色情圖片檢查方法,其中該色情圖片識別引擎設(shè)定有一個(gè)色情特征識別值,在步驟(c)中,當(dāng)該色情圖片識別引擎以運(yùn)算法計(jì)算出該特征數(shù)據(jù)的特征值低于該色情特征識別值時(shí),進(jìn)入步驟(d)。
6.如權(quán)利要求2所述的色情圖片檢查方法,其中步驟(d)是由數(shù)據(jù)庫比較引擎進(jìn)行比較。
7.如權(quán)利要求1所述的色情圖片檢查方法,其中步驟(e)所輸出的該判斷信號,包括該待檢查圖片為色情圖片的判定結(jié)果。
8.一種色情圖片檢查系統(tǒng),雙重過濾待檢查圖片,以提高色情圖片識別的準(zhǔn)確度,該系統(tǒng)包括一個(gè)色情圖片識別引擎,用以識別該待檢查圖片,并在該待檢查圖片及一第一判斷信號兩者之間擇一個(gè)輸出;以及一個(gè)數(shù)據(jù)庫比較引擎,用以比較一數(shù)據(jù)庫圖片及該待檢查圖片,輸出一個(gè)第二判斷信號。
9.如權(quán)利要求8所述的色情圖片檢查系統(tǒng),其中該數(shù)據(jù)庫比較引擎還連接到色情圖片數(shù)據(jù)庫,該數(shù)據(jù)庫比較引擎在該色情圖片數(shù)據(jù)庫搜索近似于該待檢查圖片的該數(shù)據(jù)庫圖片。
10.如權(quán)利要求8所述的色情圖片檢查系統(tǒng),其中該色情圖片識別引擎是以統(tǒng)計(jì)作為其判斷的基礎(chǔ)。
11.如權(quán)利要求10所述的色情圖片檢查系統(tǒng),其中該待檢查圖片具有特征數(shù)據(jù)。
12.如權(quán)利要求11所述的色情圖片檢查系統(tǒng),其中該色情圖片識別引擎是根據(jù)該特征數(shù)據(jù)進(jìn)行該待檢查圖片的識別。
13.如權(quán)利要求12所述的色情圖片檢查系統(tǒng),其中該色情圖片識別引擎設(shè)定有色情特征識別值。
14.如權(quán)利要求13所述的色情圖片檢查系統(tǒng),其中當(dāng)該色情圖片識別引擎以運(yùn)算法計(jì)算出該特征數(shù)據(jù)的特征值高于該色情特征識別值時(shí),該色情圖片識別引擎輸出第一判斷信號。
15.如權(quán)利要求13所述的色情圖片檢查系統(tǒng),其中當(dāng)該色情圖片識別引擎以運(yùn)算法計(jì)算出該特征數(shù)據(jù)的特征值低于該色情特征識別值時(shí),該色情圖片識別引擎輸出該待檢查圖片到該數(shù)據(jù)庫比較引擎。
16.如權(quán)利要求11所述的色情圖片檢查系統(tǒng),其中該數(shù)據(jù)庫比較引擎是根據(jù)該特征數(shù)據(jù)進(jìn)行該檢查圖片與該數(shù)據(jù)庫圖片的比較。
17.如權(quán)利要求8所述的色情圖片檢查系統(tǒng),其中該第一判斷信號包括該待檢查圖片為色情圖片的判定結(jié)果。
18.如權(quán)利要求8所述的色情圖片檢查系統(tǒng),其中該第二判斷信號包括該待檢查圖片為色情圖片的判定結(jié)果。
19.一種計(jì)算機(jī)可讀取的記錄介質(zhì),用以記錄使計(jì)算機(jī)執(zhí)行色情圖片檢查方法,雙重過濾待檢查圖片,以提高色情圖片識別的準(zhǔn)確度,該方法包括(a)輸入該待檢查圖片;(b)提取該待檢查圖片的特征數(shù)據(jù);(c)根據(jù)該特征數(shù)據(jù)識別該待檢查圖片;(d)根據(jù)該特征數(shù)據(jù)比較該待檢查圖片與數(shù)據(jù)庫圖片;及(e)輸出判斷信號。
20.如權(quán)利要求19所述的計(jì)算機(jī)可讀取的記錄介質(zhì),其中在步驟(d)之前還包括步驟(d0),搜索色情圖片數(shù)據(jù)庫,進(jìn)行該數(shù)據(jù)庫圖片與該待檢查圖片的近似比較。
21.如權(quán)利要求19所述的計(jì)算機(jī)可讀取的記錄介質(zhì),其中步驟(c)是由色情圖片識別引擎進(jìn)行識別。
22.如權(quán)利要求19所述的計(jì)算機(jī)可讀取的記錄介質(zhì),其中該色情圖片識別引擎是以統(tǒng)計(jì)作為其判斷的基礎(chǔ)。
23.如權(quán)利要求21所述的計(jì)算機(jī)可讀取的記錄介質(zhì),其中該色情圖片識別引擎設(shè)定有色情特征辨識值,在步驟(c)中,當(dāng)該色情圖片識別引擎以運(yùn)算法計(jì)算出該特征數(shù)據(jù)的特征值低于該色情特征識別值時(shí),進(jìn)入步驟(d)。
24.如權(quán)利要求19所述的計(jì)算機(jī)可讀取的記錄介質(zhì),其中步驟(d)是由數(shù)據(jù)庫比較引擎進(jìn)行比較。
25.如權(quán)利要求19所述的計(jì)算機(jī)可讀取的記錄介質(zhì),其中步驟(e)所輸出的該判斷信號,包括該待檢查圖片是否為色情圖片的信息。
全文摘要
一種色情圖片檢查系統(tǒng)及方法,通過雙重引擎過濾待檢查圖片,以提高色情圖片識別的準(zhǔn)確度。當(dāng)待檢查圖片輸入色情圖片檢查系統(tǒng)后,提取待檢查圖片的特征數(shù)據(jù),首先由色情圖片識別引擎識別,如果色情圖片識別引擎判斷出待檢查圖片為非色情圖片,或因識別率偏低而無法判斷時(shí),色情圖片識別引擎會將待檢查圖片輸出到數(shù)據(jù)庫比較引擎進(jìn)行檢查。數(shù)據(jù)庫比較引擎連接色情圖片數(shù)據(jù)庫,用以比較數(shù)據(jù)庫圖片及待檢查圖片,根據(jù)特征數(shù)據(jù)比較待檢查圖片與數(shù)據(jù)庫圖片,最后輸出判斷信號。
文檔編號G06F17/00GK1396532SQ0112312
公開日2003年2月12日 申請日期2001年7月16日 優(yōu)先權(quán)日2001年7月16日
發(fā)明者吳冠廷 申請人:友立資訊股份有限公司