專利名稱:色情圖片的識別方法及其設(shè)備的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及通信領(lǐng)域,尤其涉及一種色情圖片的識別方法及其設(shè)備。
背景技術(shù):
在搜索引擎業(yè)務(wù)中,當(dāng)用戶通過搜索引擎瀏覽一個(gè)網(wǎng)頁時(shí),如果網(wǎng)頁中有色情圖片,需要對色情圖片進(jìn)行屏蔽處理。同時(shí),為了不影響用戶的正常圖片瀏覽速度,必須要預(yù)先識別圖片是否為色情圖片?,F(xiàn)有技術(shù)中,搜索引擎系統(tǒng)中部署色情圖片掃描功能模塊,色情圖片掃描功能模塊不斷的掃描系統(tǒng)網(wǎng)頁中的圖片,識別網(wǎng)頁中的色情圖片?,F(xiàn)有的色情圖片識別方法,是通過對圖片中的色情特征點(diǎn)(判斷一張圖片是否是色情圖片的圖像特征,最典型的就是圖片中的露點(diǎn)、性器官等)進(jìn)行打分來判斷。例如,設(shè)置滿分為100分,閾值為80分,如果一個(gè)圖片的得分超過80分的判定為色情圖片,反之則為·非色情圖片。但是,根據(jù)圖片本身的色情特征點(diǎn)的打分進(jìn)行色情圖片識別的誤差很大,有時(shí)候會將一張風(fēng)景、一張桌子等非色情圖片打很高的分?jǐn)?shù),準(zhǔn)確性差。
發(fā)明內(nèi)容
本發(fā)明實(shí)施例提供了一種色情圖片的識別方法及其設(shè)備,提高色情圖片識別的準(zhǔn)確性。本發(fā)明實(shí)施例提供了一種色情圖片的識別方法,包括
根據(jù)圖片相關(guān)統(tǒng)一資源定位符URL信息確定圖片相關(guān)URL信息色情度評價(jià)信息,和/或根據(jù)圖片相關(guān)文字信息確定圖片相關(guān)文字信息色情度評價(jià)信息;
根據(jù)所述圖片相關(guān)URL信息色情度評價(jià)信息和/或圖片相關(guān)文字信息色情度評價(jià)信息與對應(yīng)色情度評價(jià)閾值的關(guān)系,判斷圖片是否為色情圖片。本發(fā)明實(shí)施例提供了一種色情圖片的識別方法,包括
根據(jù)圖片相關(guān)統(tǒng)一資源定位符URL信息,確定圖片相關(guān)URL信息色情度評價(jià)信息,和/或根據(jù)圖片相關(guān)文字信息確定圖片相關(guān)文字信息色情度評價(jià)信息;
查找與所述圖片相關(guān)URL信息色情度評價(jià)信息和/或圖片相關(guān)文字信息色情度評價(jià)信息對應(yīng)的色情圖片概率;
根據(jù)查找到的各色情圖片概率以及概率閾值,判斷圖片是否為色情圖片。本發(fā)明實(shí)施例提供了一種色情圖片的識別設(shè)備,包括
評價(jià)信息確定單元,用于根據(jù)圖片相關(guān)統(tǒng)一資源定位符URL信息確定圖片相關(guān)URL信息色情度評價(jià)信息,和/或根據(jù)圖片相關(guān)文字信息確定圖片相關(guān)文字信息色情度評價(jià)信息;
判斷單元,用于根據(jù)所述圖片相關(guān)URL信息色情度評價(jià)信息和/或圖片相關(guān)文字信息色情度評價(jià)信息與對應(yīng)色情度評價(jià)閾值的關(guān)系,判斷圖片是否為色情圖片。本發(fā)明實(shí)施例提供了一種色情圖片的識別設(shè)備,包括評價(jià)信息確定單元,用于根據(jù)圖片相關(guān)統(tǒng)一資源定位符URL信息,確定圖片相關(guān)URL信息色情度評價(jià)信息,和/或根據(jù)圖片相關(guān)文字信息確定圖片相關(guān)文字信息色情度評價(jià)信息;
查找單元,用于查找與所述圖片相關(guān)URL信息色情度評價(jià)信息和/或圖片相關(guān)文字信息色情度評價(jià)信息對應(yīng)的色情圖片概率;
判斷單元,用于根據(jù)所述查找單元查找到的各色情圖片概率以及概率閾值,判斷圖片是否為色情圖片。與現(xiàn)有技術(shù)相比,本發(fā)明實(shí)施例至少具有以下優(yōu)點(diǎn)
本發(fā)明實(shí)施例中,根據(jù)圖片相關(guān)URL信息、和/或圖片相關(guān)文字信息識別圖片是否為色情圖片,提高色情圖片識別的準(zhǔn)確性。
圖I是本發(fā)明實(shí)施例一提供的色情圖片的識別方法的流程示意 圖2是本發(fā)明實(shí)施例二提供的色情圖片的識別方法的流程示意 圖3是本發(fā)明實(shí)施例三提供的色情圖片的識別方法的流程示意 圖4是本發(fā)明實(shí)施例四提供的色情圖片的識別設(shè)備的結(jié)構(gòu)示意 圖5和圖6是本發(fā)明實(shí)施例五提供的色情圖片的識別設(shè)備的結(jié)構(gòu)示意圖。
具體實(shí)施例方式實(shí)施例一
本發(fā)明實(shí)施例一提供一種色情圖片的識別方法,色情圖片掃描功能模塊根據(jù)圖片相關(guān)URL (Universal Resource Locator,統(tǒng)一資源定位符)信息色情度打分和/或圖片相關(guān)文字信息色情度打分識別色情圖片。其中,圖片相關(guān)URL信息包括但不限于圖片本身的URL和/或圖片所在網(wǎng)頁的URL。圖片相關(guān)文字信息包括但不限于以下信息之一或任意組合圖片所在網(wǎng)頁的文字、圖片說明文字、圖片所在網(wǎng)頁的標(biāo)題。下面結(jié)合附圖對本發(fā)明實(shí)施例進(jìn)行詳細(xì)描述。參見圖1,為本發(fā)明實(shí)施例一提供的色情圖片的識別方法的流程示意圖。該流程以以下場景為例描述根據(jù)圖片相關(guān)URL信息色情度打分和圖片相關(guān)文字信息色情度打分識別色情圖片,其中,圖片相關(guān)URL信息包括圖片本身的URL和/或圖片所在網(wǎng)頁的URL,圖片相關(guān)文字信息包括圖片所在網(wǎng)頁的文字、圖片說明文字和/或圖片所在網(wǎng)頁的標(biāo)題。如圖I所示,該方法包括以下步驟
步驟101,色情圖片掃描功能模塊掃描圖片,分別確定圖片本身的URL色情度得分、圖片所在網(wǎng)頁的URL色情度得分、圖片所在網(wǎng)頁的文字色情度得分、圖片說明文字色情度得分和/或圖片所在網(wǎng)頁的標(biāo)題色情度得分。其中,圖片所在網(wǎng)頁的URL信息的色情度得分,可根據(jù)該網(wǎng)頁URL中的敏感詞匯進(jìn)行計(jì)算,該敏感詞匯例如sexy、girls、tenns等;同理,圖片本身的URL信息的色情度得分,可根據(jù)該圖片的URL中的敏感詞匯進(jìn)行計(jì)算。圖片所在網(wǎng)頁的文字信息的色情度得分,可根據(jù)文字中的敏感詞匯進(jìn)行計(jì)算,該敏感詞匯例如“騷婦”、“性感”、“自拍”、“科學(xué)技術(shù)”等;同理,圖片說明文字和圖片所在網(wǎng)頁的標(biāo)題的色情度得分。優(yōu)選的,可根據(jù)圖片本身的URL中所有敏感詞匯的得分之和或加權(quán)后的得分之和,或進(jìn)一步求平均值得到圖片本身的URL色情度得分,同理可根據(jù)圖片所在網(wǎng)頁文字的所有敏感詞匯的得分之和或加權(quán)后的得分之和,或進(jìn)一步求平均值得到圖片所在網(wǎng)頁文字的色情度得分。類似的,可根據(jù)敏感詞匯的得分之和或加權(quán)后的得分,或進(jìn)一步求平均值得到圖片所在網(wǎng)頁的URL色情度得分、圖片說明文字色情度得分以及圖片所在網(wǎng)頁的標(biāo)題色情度得分。每一個(gè)敏感詞匯的得分為預(yù)先設(shè)定。色情圖片掃描功能模塊執(zhí)行圖片掃描功能時(shí),從預(yù)先加載的配置文件中獲取每一敏感詞匯的得分,進(jìn)而根據(jù)掃描得到的敏感詞匯計(jì)算色情度得分。每一個(gè)敏感詞匯的得分的預(yù)先設(shè)定方式包括但不限于機(jī)器訓(xùn)練方式通過計(jì)算機(jī)程序?qū)σ欢ㄒ?guī)模的數(shù)據(jù)集合進(jìn)行分析和計(jì)算得出相應(yīng)結(jié)果。該數(shù)據(jù)集合可以為預(yù)先設(shè)置的樣本數(shù)據(jù)。步驟102,色情圖片掃描功能模塊根據(jù)圖片相關(guān)的色情度得分與閾值的關(guān)系判斷圖片是否為色情圖片。例如,色情圖片掃描功能模塊將圖片本身的URL色情度得分、圖片所在網(wǎng)頁的URL 色情度得分、圖片所在網(wǎng)頁的文字色情度得分、圖片說明文字色情度得分和圖片所在網(wǎng)頁的標(biāo)題色情度得分求和得到色情度總得分,如果色情度總得分滿足預(yù)設(shè)的閾值條件,則判斷為色情圖片,否則判斷圖片為非色情圖片。或者,色情圖片掃描功能模塊將圖片本身的URL色情度得分、圖片所在網(wǎng)頁的URL色情度得分、圖片所在網(wǎng)頁的文字色情度得分、圖片說明文字色情度得分和圖片所在網(wǎng)頁的標(biāo)題色情度得分求平均得到色情度平均得分,根據(jù)色情度平均得分與閾值的關(guān)系判斷圖片是否為色情圖片。需要說明,上述實(shí)施例是以色情圖片掃描功能模塊根據(jù)圖片本身的URL和圖片所在網(wǎng)頁的URL色情度得分,以及圖片所在網(wǎng)頁的文字、圖片說明文字和圖片所在網(wǎng)頁的標(biāo)題色情度得分為例進(jìn)行描述的,事實(shí)上,色情圖片掃描功能模塊也可以僅以上述信息之一或任意組合的色情度得分識別色情圖片另外,還可以在上述信息的色情度得分基礎(chǔ)上結(jié)合圖片本身的色情特征點(diǎn)得分來識別色情圖片。例如,在步驟101中計(jì)算圖片本身的色情特征點(diǎn)得分,在步驟102中根據(jù)圖片相關(guān)URL信息色情度得分、圖片相關(guān)文字信息色情度得分和圖片本身的色情特征點(diǎn)得分與預(yù)設(shè)閾值的關(guān)系,判斷圖片是否為色情圖片。具體識別過程可以參考步驟101與102,在此不再贅述。實(shí)施例二
本發(fā)明實(shí)施例二提供一種色情圖片的識別方法,同實(shí)施例一類似,色情圖片掃描功能模塊根據(jù)圖片相關(guān)URL信息色情度打分和/或圖片相關(guān)文字信息色情度打分識別色情圖片。圖片相關(guān)URL信息包括但不限于以下信息之一或組合圖片本身的URL、圖片所在網(wǎng)頁的URL。圖片相關(guān)文字信息包括但不限于以下信息之一或組合圖片所在網(wǎng)頁的文字、圖片說明文字、圖片所在網(wǎng)頁的標(biāo)題。本實(shí)施例中根據(jù)圖片相關(guān)URL信息色情度打分和圖片相關(guān)文字信息色情度打分識別色情圖片,其中,圖片相關(guān)URL信息包括圖片本身的URL、圖片所在網(wǎng)頁的URL,圖片相關(guān)文字信息包括圖片所在網(wǎng)頁的文字、圖片說明文字和圖片所在網(wǎng)頁的標(biāo)題,如圖2所示,該方法包括以下步驟
步驟201,色情圖片掃描功能模塊掃描圖片,分別確定圖片本身的URL色情度得分、圖片所在網(wǎng)頁的URL色情度得分、圖片所在網(wǎng)頁的文字色情度得分、圖片說明文字色情度得分和/或圖片所在網(wǎng)頁的標(biāo)題色情度得分。該過程的具體實(shí)現(xiàn)可以參考步驟101,在此不再贅述。步驟202,色情圖片掃描功能模塊確定各色情度得分的分?jǐn)?shù)段,獲取各分?jǐn)?shù)段對應(yīng)的色情圖片概率。具體的,預(yù)先設(shè)定各色情度得分的不同分?jǐn)?shù)段的色情圖片概率。例如,通過機(jī)器訓(xùn)練圖片所在網(wǎng)頁的文字色情度得分,發(fā)現(xiàn)網(wǎng)頁色情度得分在20到30分之間的色情圖片為S張,非色情圖片為N張,則S/N為圖片所在網(wǎng)頁的文字色情度得分在20到30分之間的色情圖片概率。在確定各色情度得分的分?jǐn)?shù)段后,色情圖片掃描功能模塊查找該分?jǐn)?shù)段對應(yīng) 的色情圖片概率。步驟203,色情圖片掃描功能模塊將各分?jǐn)?shù)段對應(yīng)的色情圖片概率相乘,如果積大于1,則判定圖片為色情圖片,否則,判定圖片為非色情圖片。具體的,數(shù)值I只是本實(shí)施例給出的一個(gè)作為判斷標(biāo)準(zhǔn)的值,還可以設(shè)置其他能夠有效區(qū)分色情圖片與非色情圖片的值作為判斷標(biāo)準(zhǔn)。需要說明,本實(shí)施例中,色情圖片掃描功能模塊還可以在根據(jù)圖片相關(guān)URL信息色情度打分和/或圖片相關(guān)文字信息色情度打分的基礎(chǔ)上,結(jié)合圖片本身的色情特征點(diǎn)得分識別色情圖片。相應(yīng)的,在步驟201中色情圖片掃描功能模塊還需要計(jì)算圖片本身的色情特征點(diǎn)得分,在步驟202和203中增加圖片本身的色情特征點(diǎn)得分對應(yīng)的色情圖片概率,其中,預(yù)先設(shè)定色情特征點(diǎn)得分的不同分?jǐn)?shù)段對應(yīng)的色情圖片概率。實(shí)施例三
在實(shí)施例一或二的基礎(chǔ)上,本發(fā)明實(shí)施例三提供一種色情圖片的識別方法,如圖3所示,色情圖片掃描功能模塊在進(jìn)行色情圖片識別之前,還可以包括
步驟301,色情圖片掃描功能模塊判斷圖片來源是否屬于白名單或黑名單。如果圖片來源屬于白名單,則執(zhí)行步驟302 ;如果圖片來源屬于黑名單,則執(zhí)行步驟303 ;如果圖片來源不屬于白名單也不屬于黑名單,參考實(shí)施例一或二的方式進(jìn)行識別。白名單和黑名單需要預(yù)先設(shè)置,優(yōu)選的,白名單為一些大型主流網(wǎng)站,黑名單為已知的黃色網(wǎng)站。例如,白名單和黑名單內(nèi)存儲網(wǎng)站的IP地址,色情圖片掃描功能模塊獲取圖片的來源IP地址,如果白名單或黑名單內(nèi)存儲有該IP地址,則判定圖片來源屬于白名單或黑名單。步驟302,色情圖片掃描功能模塊判定圖片為非色情圖片。步驟303,色情圖片掃描功能模塊判定圖片為色情圖片。采取上述方式,在實(shí)際的運(yùn)行過程中,色情圖片判斷的準(zhǔn)確率和召回率可以達(dá)到90%。實(shí)施例四
基于與上述方法實(shí)施例一或三相同的技術(shù)構(gòu)思,本發(fā)明實(shí)施例提供一種色情圖片的識別設(shè)備,如圖4所示,包括
評價(jià)信息確定單元11,用于根據(jù)圖片相關(guān)URL信息確定圖片相關(guān)URL信息色情度得分,和/或根據(jù)圖片相關(guān)文字信息確定圖片相關(guān)文字信息色情度得分;判斷單元12,用于根據(jù)所述圖片相關(guān)URL信息色情度得分和/或圖片相關(guān)文字信息色情度得分與對應(yīng)色情度得分閾值的關(guān)系,判斷圖片是否為色情圖片。所述評價(jià)信息確定單元11具體用于 獲取所述圖片相關(guān)URL信息中的敏感詞匯,根據(jù)獲取到的敏感詞匯和預(yù)先設(shè)置的每一敏感詞匯的得分,得到圖片相關(guān)URL信息色情度得分;和/或
獲取所述圖片相關(guān)文字信息中的敏感詞匯,根據(jù)獲取到的敏感詞匯和預(yù)先設(shè)置的每一敏感詞匯的得分,得到圖片相關(guān)文字信息色情度得分。所述圖片相關(guān)URL信息包括但不限于以下信息之一或組合圖片本身的URL、圖片所在網(wǎng)頁的URL,所述圖片相關(guān)文字信息包括圖片所在網(wǎng)頁的文字、圖片說明文字、圖片所在網(wǎng)頁的標(biāo)題。所述評價(jià)信息確定單元11還用于獲取圖片本身的色情特征點(diǎn)得分;
所述判斷單元12還用于根據(jù)色情特征點(diǎn)評價(jià)信息、所述圖片相關(guān)URL信息色情度評價(jià)信息和圖片相關(guān)文字信息色情度評價(jià)信息與對應(yīng)色情度評價(jià)閾值的關(guān)系,判斷圖片是否為色情圖片;或者,根據(jù)色情特征點(diǎn)評價(jià)信息和所述圖片相關(guān)URL信息色情度評價(jià)信息與對應(yīng)色情度評價(jià)閾值的關(guān)系,判斷圖片是否為色情圖片;或者,根據(jù)色情特征點(diǎn)評價(jià)信息和所述圖片相關(guān)文字信息色情度評價(jià)信息與對應(yīng)色情度評價(jià)閾值的關(guān)系,判斷圖片是否為色情圖片。實(shí)施例五
基于與上述方法實(shí)施例二或三相同的技術(shù)構(gòu)思,本發(fā)明實(shí)施例提供一種色情圖片的識別設(shè)備,如圖5所示,包括
評價(jià)信息確定單元21,用于根據(jù)圖片相關(guān)URL信息,確定圖片相關(guān)URL信息色情度得分,和/或根據(jù)圖片相關(guān)文字信息確定圖片相關(guān)文字信息色情度得分;
查找單元22,用于查找與所述圖片相關(guān)URL信息色情度得分和/或圖片相關(guān)文字信息色情度得分對應(yīng)的色情圖片概率;
判斷單元23,用于根據(jù)所述查找單元查找到的各色情圖片概率以及概率閾值,判斷圖片是否為色情圖片。如圖6所示,還包括存儲單元24,用于存儲預(yù)先設(shè)定的各色情度得分的不同分?jǐn)?shù)段對應(yīng)的色情圖片概率;
所述查找單元22具體用于查找與各色情度得分歸屬的分?jǐn)?shù)段對應(yīng)的色情圖片概率。所述判斷單元23具體用于
將所述查找單元查找到的各色情圖片概率相乘,如果積大于1,則判定圖片為色情圖片。所述評價(jià)信息確定單元21還用于獲取圖片本身的色情特征點(diǎn)得分;相應(yīng)的,所述查找單元22還用于查找與所述圖片本身的色情特征點(diǎn)得分對應(yīng)的色情圖片概率。本發(fā)明實(shí)施例中,根據(jù)圖片相關(guān)URL信息和/或圖片相關(guān)文字信息識別圖片是否為色情圖片,提高色情圖片識別的準(zhǔn)確性。以上實(shí)施例中所述信息色情度得分可以是信息色情度評價(jià)信息中的一種,但是,本發(fā)明并非局限于此,任何本領(lǐng)域的技術(shù)人員能夠想到的評價(jià)信息的形式都應(yīng)包括在內(nèi)。通過以上的實(shí)施方式的描述,本領(lǐng)域的技術(shù)人員可以清楚地了解到本發(fā)明可借助軟件加必需的通用硬件平臺的方式來實(shí)現(xiàn),當(dāng)然也可以通過硬件,但很多情況下前者是更佳的實(shí)施方式。基于這樣的理解,本發(fā)明的技術(shù)方案本質(zhì)上或者說對現(xiàn)有技術(shù)做出貢獻(xiàn)的部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計(jì)算機(jī)軟件產(chǎn)品存儲在一個(gè)存儲介質(zhì)中,包括若干指令用以使得一臺計(jì)算機(jī)設(shè)備(可以是個(gè)人計(jì)算機(jī),服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個(gè)實(shí)施例所述的方法。本領(lǐng)域技術(shù)人員可以理解附圖只是一個(gè)優(yōu)選實(shí)施例的示意圖,附圖中的模塊或流程并不一定是實(shí)施本發(fā)明所必須的。本領(lǐng)域技術(shù)人員可以理解實(shí)施例中的裝置中的模塊可以按照實(shí)施例描述進(jìn)行分布于實(shí)施例的裝置中,也可以進(jìn)行相應(yīng)變化位于不同于本實(shí)施例的一個(gè)或多個(gè)裝置中。上述實(shí)施例的模塊可以合并為一個(gè)模塊,也可以進(jìn)一步拆分成多個(gè)子模塊。以上公開的僅為本發(fā)明的幾個(gè)具體實(shí)施例,但是,本發(fā)明并非局限于此,任何本領(lǐng) 域的技術(shù)人員能思之的變化都應(yīng)落入本發(fā)明的保護(hù)范圍。
權(quán)利要求
1.一種色情圖片的識別方法,其特征在于,包括 根據(jù)圖片相關(guān)統(tǒng)一資源定位符URL信息確定圖片相關(guān)URL信息色情度評價(jià)信息,和/或根據(jù)圖片相關(guān)文字信息確定圖片相關(guān)文字信息色情度評價(jià)信息; 根據(jù)所述圖片相關(guān)URL信息色情度評價(jià)信息和/或圖片相關(guān)文字信息色情度評價(jià)信息與對應(yīng)色情度評價(jià)閾值的關(guān)系,判斷圖片是否為色情圖片。
2.如權(quán)利要求I所述的方法,其特征在于,所述根據(jù)圖片相關(guān)URL信息確定圖片相關(guān)URL信息色情度評價(jià)信息,和/或根據(jù)圖片相關(guān)文字信息確定圖片相關(guān)文字信息色情度評價(jià)信息,包括 獲取所述圖片相關(guān)URL信息中的敏感詞匯,根據(jù)獲取到的敏感詞匯和預(yù)先設(shè)置的敏感詞匯的得分,得到圖片相關(guān)URL信息色情度得分;和/或 獲取所述圖片相關(guān)文字信息中的敏感詞匯,根據(jù)獲取到的敏感詞匯和預(yù)先設(shè)置的敏感詞匯的得分,得到圖片相關(guān)文字信息色情度得分。
3.如權(quán)利要求I或2所述的方法,其特征在于,所述圖片相關(guān)URL信息包括以下至少一個(gè)圖片本身的URL和圖片所在網(wǎng)頁的URL,所述圖片相關(guān)文字信息包括以下至少一個(gè)圖片所在網(wǎng)頁的文字、圖片說明文字和圖片所在網(wǎng)頁的標(biāo)題。
4.如權(quán)利要求I所述的方法,其特征在于,還包括獲取圖片本身的色情特征點(diǎn)評價(jià)信息; 所述根據(jù)所述圖片相關(guān)URL信息色情度評價(jià)信息和/或圖片相關(guān)文字信息色情度評價(jià)信息與對應(yīng)色情度評價(jià)閾值的關(guān)系,判斷圖片是否為色情圖片具體包括 根據(jù)色情特征點(diǎn)得分、所述圖片相關(guān)URL信息色情度得分和圖片相關(guān)文字信息色情度得分與對應(yīng)色情度得分閾值的關(guān)系,判斷圖片是否為色情圖片;或者, 根據(jù)色情特征點(diǎn)得分和所述圖片相關(guān)URL信息色情度得分與對應(yīng)色情度得分閾值的關(guān)系,判斷圖片是否為色情圖片;或者, 根據(jù)色情特征點(diǎn)得分和所述圖片相關(guān)文字信息色情度得分與對應(yīng)色情度得分閾值的關(guān)系,判斷圖片是否為色情圖片。
5.如權(quán)利要求1、2、4中任一項(xiàng)所述的方法,其特征在于,在根據(jù)圖片相關(guān)URL信息確定圖片相關(guān)URL信息色情度評價(jià)信息,和/或根據(jù)圖片相關(guān)文字信息確定圖片相關(guān)文字信息色情度評價(jià)信息之前,還包括判斷圖片來源是否屬于白名單或黑名單;其中,來源于白名單的圖片為非色情圖片,來源于黑名單的圖片為色情圖片; 所述根據(jù)圖片相關(guān)URL信息確定圖片相關(guān)URL信息色情度評價(jià)信息,和/或根據(jù)圖片相關(guān)文字信息確定圖片相關(guān)文字信息色情度評價(jià)信息,包括 如果圖片來源不屬于白名單也不屬于黑名單,則根據(jù)圖片相關(guān)URL信息確定圖片相關(guān)URL信息色情度評價(jià)信息,和/或根據(jù)圖片相關(guān)文字信息確定圖片相關(guān)文字信息色情度評價(jià)信息。
6.一種色情圖片的識別方法,其特征在于,包括 根據(jù)圖片相關(guān)統(tǒng)一資源定位符URL信息,確定圖片相關(guān)URL信息色情度評價(jià)信息,和/或根據(jù)圖片相關(guān)文字信息確定圖片相關(guān)文字信息色情度評價(jià)信息; 查找與所述圖片相關(guān)URL信息色情度評價(jià)信息和/或圖片相關(guān)文字信息色情度評價(jià)信息對應(yīng)的色情圖片概率;根據(jù)查找到的各色情圖片概率以及概率閾值,判斷圖片是否為色情圖片。
7.如權(quán)利要求6所述的方法,其特征在于,還包括預(yù)先設(shè)定各色情度評價(jià)信息的不同級別對應(yīng)的色情圖片概率; 所述查找與所述圖片相關(guān)URL信息色情度評價(jià)信息和/或圖片相關(guān)文字信息色情度評價(jià)信息對應(yīng)的色情圖片概率具體為查找與各色情度評價(jià)信息歸屬的級別對應(yīng)的色情圖片概率。
8.如權(quán)利要求6或7所述的方法,其特征在于,所述根據(jù)查找到的各色情圖片概率以及概率閾值,判斷圖片是否為色情圖片包括 將查找到的各色情圖片概率相乘,如果積大于1,則判定圖片為色情圖片。
9.如權(quán)利要求6所述的方法,其特征在于,還包括獲取圖片本身的色情特征點(diǎn)評價(jià)信息; 判斷圖片是否為色情圖片之前,還包括查找與所述圖片本身的色情特征點(diǎn)評價(jià)信息對應(yīng)的色情圖片概率。
10.如權(quán)利要求6、7、9中任一項(xiàng)所述的方法,其特征在于,在根據(jù)圖片相關(guān)URL信息,確定圖片相關(guān)URL信息色情度評價(jià)信息,和/或根據(jù)圖片相關(guān)文字信息確定圖片相關(guān)文字信息色情度評價(jià)信息之前,還包括判斷圖片來源是否屬于白名單或黑名單;其中,來源于白名單的圖片為非色情圖片,來源于黑名單的圖片為色情圖片; 所述根據(jù)圖片相關(guān)URL信息,確定圖片相關(guān)URL信息色情度評價(jià)信息,和/或根據(jù)圖片相關(guān)文字信息確定圖片相關(guān)文字信息色情度評價(jià)信息,包括 如果圖片來源不屬于白名單也不屬于黑名單,則根據(jù)圖片相關(guān)URL信息,確定圖片相關(guān)URL信息色情度評價(jià)信息,和/或根據(jù)圖片相關(guān)文字信息確定圖片相關(guān)文字信息色情度評價(jià)Ih息。
11.一種色情圖片的識別設(shè)備,其特征在于,包括 評價(jià)信息確定單元,用于根據(jù)圖片相關(guān)統(tǒng)一資源定位符URL信息確定圖片相關(guān)URL信息色情度評價(jià)信息,和/或根據(jù)圖片相關(guān)文字信息確定圖片相關(guān)文字信息色情度評價(jià)信息; 判斷單元,用于根據(jù)所述圖片相關(guān)URL信息色情度評價(jià)信息和/或圖片相關(guān)文字信息色情度評價(jià)信息與對應(yīng)色情度評價(jià)閾值的關(guān)系,判斷圖片是否為色情圖片。
12.如權(quán)利要求11所述的設(shè)備,其特征在于,所述評價(jià)信息確定單元具體用于 獲取所述圖片相關(guān)URL信息中的敏感詞匯,根據(jù)獲取到的敏感詞匯和預(yù)先設(shè)置的每一敏感詞匯的得分,得到圖片相關(guān)URL信息色情度得分;和/或 獲取所述圖片相關(guān)文字信息中的敏感詞匯,根據(jù)獲取到的敏感詞匯和預(yù)先設(shè)置的每一敏感詞匯的得分,得到圖片相關(guān)文字信息色情度得分。
13.如權(quán)利要求11或12所述的設(shè)備,其特征在于,所述圖片相關(guān)URL信息包括以下至少一個(gè)圖片本身的URL和圖片所在網(wǎng)頁的URL,所述圖片相關(guān)文字信息包括以下至少一個(gè)圖片所在網(wǎng)頁的文字、圖片說明文字和圖片所在網(wǎng)頁的標(biāo)題。
14.如權(quán)利要求11所述的設(shè)備,其特征在于, 所述評價(jià)信息確定單元還用于獲取圖片本身的色情特征點(diǎn)評價(jià)信息; 所述判斷單元具體用于根據(jù)色情特征點(diǎn)得分、所述圖片相關(guān)URL信息色情度得分和圖片相關(guān)文字信息色情度得分與對應(yīng)色情度得分閾值的關(guān)系,判斷圖片是否為色情圖片;或者, 根據(jù)色情特征點(diǎn)得分和所述圖片相關(guān)URL信息色情度得分與對應(yīng)色情度得分閾值的關(guān)系,判斷圖片是否為色情圖片;或者, 根據(jù)色情特征點(diǎn)得分和所述圖片相關(guān)文字信息色情度得分與對應(yīng)色情度得分閾值的關(guān)系,判斷圖片是否為色情圖片。
15.一種色情圖片的識別設(shè)備,其特征在于,包括 評價(jià)信息確定單元,用于根據(jù)圖片相關(guān)統(tǒng)一資源定位符URL信息,確定圖片相關(guān)URL信息色情度評價(jià)信息,和/或根據(jù)圖片相關(guān)文字信息確定圖片相關(guān)文字信息色情度評價(jià)信息; 查找單元,用于查找與所述圖片相關(guān)URL信息色情度評價(jià)信息和/或圖片相關(guān)文字信息色情度評價(jià)信息對應(yīng)的色情圖片概率; 判斷單元,用于根據(jù)所述查找單元查找到的各色情圖片概率以及概率閾值,判斷圖片是否為色情圖片。
16.如權(quán)利要求15所述的設(shè)備,其特征在于,還包括存儲單元,用于存儲預(yù)先設(shè)定的各色情度評價(jià)信息的不同級別對應(yīng)的色情圖片概率; 所述查找單元具體用于查找與各色情度評價(jià)信息歸屬的級別對應(yīng)的色情圖片概率。
17.如權(quán)利要求15或16所述的設(shè)備,其特征在于,所述判斷單元具體用于 將所述查找單元查找到的各色情圖片概率相乘,如果積大于1,則判定圖片為色情圖片。
18.如權(quán)利要求15所述的設(shè)備,其特征在于, 所述評價(jià)信息確定單元還用于獲取圖片本身的色情特征點(diǎn)評價(jià)信息; 所述查找單元還用于查找與所述圖片本身的色情特征點(diǎn)評價(jià)信息對應(yīng)的色情圖片概率。
全文摘要
本發(fā)明實(shí)施例公開了一種色情圖片的識別方法及其設(shè)備,該方法包括根據(jù)圖片相關(guān)統(tǒng)一資源定位符URL信息確定圖片相關(guān)URL信息色情度得分,和/或根據(jù)圖片相關(guān)文字信息確定圖片相關(guān)文字信息色情度得分;根據(jù)所述圖片相關(guān)URL信息色情度得分、和/或圖片相關(guān)文字信息色情度得分與對應(yīng)色情度得分閾值的關(guān)系,判斷圖片是否為色情圖片。本發(fā)明實(shí)施例中,根據(jù)圖片相關(guān)URL信息、和/或圖片相關(guān)文字信息識別圖片是否為色情圖片,提高色情圖片識別的準(zhǔn)確性。
文檔編號G06F17/30GK102880613SQ201110197350
公開日2013年1月16日 申請日期2011年7月14日 優(yōu)先權(quán)日2011年7月14日
發(fā)明者王濤偉, 張立明 申請人:騰訊科技(深圳)有限公司