本發(fā)明涉及數(shù)據(jù)處理技術(shù)領(lǐng)域,具體而言,涉及一種信息審核方法、裝置、計(jì)算機(jī)可讀介質(zhì)和電子設(shè)備。
背景技術(shù):
在電商發(fā)展日益成熟的今天,用戶在購買商品后可以對(duì)商品進(jìn)行文字和圖片評(píng)論,以對(duì)其他用戶的網(wǎng)上購物提供更好的參考意見。
目前,針對(duì)用戶評(píng)論的內(nèi)容,部分電商平臺(tái)沒有進(jìn)行相關(guān)的審核工作,這樣會(huì)導(dǎo)致不法人員發(fā)布帶有廣告信息或者違法信息的評(píng)論。而采用了審核機(jī)制的電商平臺(tái)一般是采用人工審核評(píng)論圖片的方式,這種審核方式會(huì)耗費(fèi)大量的人力資源,并且人工審核會(huì)有較大的主觀性且審核速度較慢,造成審核結(jié)果的不可控。
需要說明的是,在上述背景技術(shù)部分公開的信息僅用于加強(qiáng)對(duì)本發(fā)明的背景的理解,因此可以包括不構(gòu)成對(duì)本領(lǐng)域普通技術(shù)人員已知的現(xiàn)有技術(shù)的信息。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的目的在于提供一種信息審核方法、裝置、計(jì)算機(jī)可讀介質(zhì)和電子設(shè)備,進(jìn)而至少在一定程度上克服由于相關(guān)技術(shù)的限制和缺陷而導(dǎo)致的一個(gè)或者多個(gè)問題。
本發(fā)明的其他特性和優(yōu)點(diǎn)將通過下面的詳細(xì)描述變得顯然,或部分地通過本發(fā)明的實(shí)踐而習(xí)得。
根據(jù)本發(fā)明的第一方面,提供了一種信息審核方法,包括:獲取用戶設(shè)置的審核強(qiáng)度系數(shù);從已存儲(chǔ)的圖片信息中獲得與模板圖片的相似度系數(shù)大于或等于所述審核強(qiáng)度系數(shù)的至少一個(gè)圖片信息;將待審核圖片的信息與所述至少一個(gè)圖片信息進(jìn)行比較;若所述待審核圖片的信息與任一所述圖片信息的比較結(jié)果滿足所述審核強(qiáng)度系數(shù),則確定所述待審核圖片審核通過。
在本發(fā)明的一些實(shí)施例中,基于前述方案,所述至少一個(gè)圖片信息包括至少一個(gè)圖像特征點(diǎn)向量集合。
在本發(fā)明的一些實(shí)施例中,基于前述方案,將待審核圖片的信息與所述至少一個(gè)圖片信息進(jìn)行比較的步驟,包括:提取所述待審核圖片的特征點(diǎn)向量集合;將所述待審核圖片的特征點(diǎn)向量集合與所述至少一個(gè)圖像特征點(diǎn)向量集合進(jìn)行比較。
在本發(fā)明的一些實(shí)施例中,基于前述方案,還包括:根據(jù)所述待審核圖片的特征點(diǎn)向量集合與任一所述圖像特征點(diǎn)向量集合中相匹配的特征點(diǎn)向量的個(gè)數(shù),確定所述待審核圖片的信息與任一所述圖片信息的比較結(jié)果是否滿足所述審核強(qiáng)度系數(shù)。
在本發(fā)明的一些實(shí)施例中,基于前述方案,還包括:將所述待審核圖片的信息與所述模板圖片的信息進(jìn)行比較,以得到所述待審核圖片與所述模板圖片的相似度系數(shù);在所述待審核圖片與所述模板圖片的相似度系數(shù)大于或等于預(yù)定閾值時(shí),保存所述待審核圖片的信息和所述待審核圖片與所述模板圖片的相似度系數(shù)。
在本發(fā)明的一些實(shí)施例中,基于前述方案,還包括:獲取待審核的文字內(nèi)容;檢測(cè)所述待審核的文字內(nèi)容中是否包含有敏感詞;在所述待審核的文字內(nèi)容中包含有敏感詞時(shí),確定所述待審核的文字內(nèi)容審核未通過。
在本發(fā)明的一些實(shí)施例中,基于前述方案,還包括:在所述待審核的文字內(nèi)容中不包含敏感詞時(shí),檢測(cè)所述待審核的文字內(nèi)容中是否包含通用詞,和/或?qū)λ龃龑徍说奈淖謨?nèi)容進(jìn)行詞法分析,以確定所述待審核的文字內(nèi)容所針對(duì)的對(duì)象是否符合要求;若所述待審核的文字內(nèi)容中包含有通用詞,和/或所述待審核的文字內(nèi)容所針對(duì)的對(duì)象符合要求,則確定所述待審核的文字內(nèi)容審核通過;否則,確定所述待審核的文字內(nèi)容審核未通過。
根據(jù)本發(fā)明的第二方面,提供了一種信息審核裝置,包括:第一獲取單元,用于獲取用戶設(shè)置的審核強(qiáng)度系數(shù);第二獲取單元,用于從已存儲(chǔ)的圖片信息中獲得與模板圖片的相似度系數(shù)大于或等于所述審核強(qiáng)度系數(shù)的至少一個(gè)圖片信息;處理單元,用于將待審核圖片的信息與所述至少一個(gè)圖片信息進(jìn)行比較;確定單元,用于在所述待審核圖片的信息與任一所述圖片信息的比較結(jié)果滿足所述審核強(qiáng)度系數(shù)時(shí),確定所述待審核圖片審核通過。
根據(jù)本發(fā)明的第三方面,提供了一種計(jì)算機(jī)可讀介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,其特征在于,所述程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如上述第一方面所述的信息審核方法。
根據(jù)本發(fā)明的第四方面,提供了一種電子設(shè)備,包括:一個(gè)或多個(gè)處理器;存儲(chǔ)裝置,用于存儲(chǔ)一個(gè)或多個(gè)程序,當(dāng)所述一個(gè)或多個(gè)程序被所述一個(gè)或多個(gè)處理器執(zhí)行時(shí),使得所述一個(gè)或多個(gè)處理器實(shí)現(xiàn)如上述第一方面所述的信息審核方法。
在本發(fā)明的一些實(shí)施例所提供的技術(shù)方案中,能夠自動(dòng)實(shí)現(xiàn)對(duì)待審核圖片的審核工作,解決了人工審核的方式導(dǎo)致審核速度慢、審核結(jié)果不可控的問題。通過獲取用戶設(shè)置的審核強(qiáng)度系數(shù)和與模板圖片的相似度系數(shù)大于或等于該審核強(qiáng)度系數(shù)的至少一個(gè)圖片信息,并在待審核圖片的信息與任一圖片信息的比較結(jié)果滿足審核強(qiáng)度系數(shù)時(shí),確定待審核圖片審核通過,使得用戶能夠?qū)D片的審核強(qiáng)度進(jìn)行動(dòng)態(tài)控制,實(shí)現(xiàn)了對(duì)圖片審核結(jié)果的可控。
在本發(fā)明的一些實(shí)施例所提供的技術(shù)方案中,通過將待審核圖片的信息與模板圖片的信息進(jìn)行比較,得到待審核圖片與模板圖片的相似度系數(shù),并在該相似度系數(shù)大于或等于預(yù)定閾值時(shí),保存待審核圖片的信息和待審核圖片與模板圖片的相似度系數(shù),使得能夠完善已存儲(chǔ)的圖片信息,以在再次審核其它圖片時(shí)使用,實(shí)現(xiàn)了特征庫的自學(xué)習(xí)過程。
在本發(fā)明的一些實(shí)施例所提供的技術(shù)方案中,通過在對(duì)待審核的文字內(nèi)容進(jìn)行敏感詞檢測(cè)處理之后,檢測(cè)待審核的文字內(nèi)容中是否包含通用詞和/或?qū)Υ龑徍说奈淖謨?nèi)容進(jìn)行詞法分析,以確定待審核的文字內(nèi)容所針對(duì)的對(duì)象是否符合要求,使得能夠判斷出敏感詞之外的其它非法信息,提高對(duì)文字內(nèi)容的審核質(zhì)量。
應(yīng)當(dāng)理解的是,以上的一般描述和后文的細(xì)節(jié)描述僅是示例性和解釋性的,并不能限制本發(fā)明。
附圖說明
此處的附圖被并入說明書中并構(gòu)成本說明書的一部分,示出了符合本發(fā)明的實(shí)施例,并與說明書一起用于解釋本發(fā)明的原理。顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖。在附圖中:
圖1示出了可以應(yīng)用本發(fā)明實(shí)施例的信息審核方法或信息審核裝置的示例性系統(tǒng)架構(gòu)示意圖;
圖2示意性示出了根據(jù)本發(fā)明的第一個(gè)實(shí)施例的信息審核方法的流程圖;
圖3示意性示出了根據(jù)本發(fā)明的第二個(gè)實(shí)施例的信息審核方法的流程圖;
圖4示出了根據(jù)本發(fā)明的實(shí)施例的評(píng)論信息的審核系統(tǒng)的結(jié)構(gòu)示意圖;
圖5示出了根據(jù)本發(fā)明的實(shí)施例的對(duì)圖片進(jìn)行審核的系統(tǒng)架構(gòu)示意圖;
圖6示出了根據(jù)本發(fā)明的實(shí)施例的對(duì)文字進(jìn)行審核的系統(tǒng)架構(gòu)示意圖;
圖7示出了根據(jù)本發(fā)明的實(shí)施例的對(duì)評(píng)論信息進(jìn)行審核的流程示意圖;
圖8示意性示出了根據(jù)本發(fā)明的一個(gè)實(shí)施例的信息審核裝置的框圖;
圖9示出了適于用來實(shí)現(xiàn)本發(fā)明實(shí)施例的電子設(shè)備的計(jì)算機(jī)系統(tǒng)的結(jié)構(gòu)示意圖。
具體實(shí)施方式
現(xiàn)在將參考附圖更全面地描述示例實(shí)施方式。然而,示例實(shí)施方式能夠以多種形式實(shí)施,且不應(yīng)被理解為限于在此闡述的范例;相反,提供這些實(shí)施方式使得本發(fā)明將更加全面和完整,并將示例實(shí)施方式的構(gòu)思全面地傳達(dá)給本領(lǐng)域的技術(shù)人員。
此外,所描述的特征、結(jié)構(gòu)或特性可以以任何合適的方式結(jié)合在一個(gè)或更多實(shí)施例中。在下面的描述中,提供許多具體細(xì)節(jié)從而給出對(duì)本發(fā)明的實(shí)施例的充分理解。然而,本領(lǐng)域技術(shù)人員將意識(shí)到,可以實(shí)踐本發(fā)明的技術(shù)方案而沒有特定細(xì)節(jié)中的一個(gè)或更多,或者可以采用其它的方法、組元、裝置、步驟等。在其它情況下,不詳細(xì)示出或描述公知方法、裝置、實(shí)現(xiàn)或者操作以避免模糊本發(fā)明的各方面。
附圖中所示的方框圖僅僅是功能實(shí)體,不一定必須與物理上獨(dú)立的實(shí)體相對(duì)應(yīng)。即,可以采用軟件形式來實(shí)現(xiàn)這些功能實(shí)體,或在一個(gè)或多個(gè)硬件模塊或集成電路中實(shí)現(xiàn)這些功能實(shí)體,或在不同網(wǎng)絡(luò)和/或處理器裝置和/或微控制器裝置中實(shí)現(xiàn)這些功能實(shí)體。
附圖中所示的流程圖僅是示例性說明,不是必須包括所有的內(nèi)容和操作/步驟,也不是必須按所描述的順序執(zhí)行。例如,有的操作/步驟還可以分解,而有的操作/步驟可以合并或部分合并,因此實(shí)際執(zhí)行的順序有可能根據(jù)實(shí)際情況改變。
圖1示出了可以應(yīng)用本發(fā)明實(shí)施例的信息審核方法或信息審核裝置的示例性系統(tǒng)架構(gòu)示意圖。
如圖1所示,在本發(fā)明的實(shí)施例中,系統(tǒng)架構(gòu)100可以包括終端設(shè)備101、102、103,網(wǎng)絡(luò)104和服務(wù)器105。網(wǎng)絡(luò)104用以在終端設(shè)備101、102、103和服務(wù)器105之間提供通信鏈路的介質(zhì)。網(wǎng)絡(luò)104可以包括各種連接類型,例如有線、無線通信鏈路或者光纖電纜等等。
用戶可以使用終端設(shè)備101、102、103通過網(wǎng)絡(luò)104與服務(wù)器105交互,以接收或發(fā)送消息等。終端設(shè)備101、102、103上可以安裝有各種客戶端應(yīng)用,例如購物類應(yīng)用、網(wǎng)頁瀏覽器應(yīng)用、搜索類應(yīng)用、即時(shí)通信工具、郵箱客戶端、社交平臺(tái)軟件等。
終端設(shè)備101、102、103可以是具有顯示屏并且支持網(wǎng)頁瀏覽的各種電子設(shè)備,包括但不限于智能手機(jī)、平板電腦、膝上型便攜計(jì)算機(jī)和臺(tái)式計(jì)算機(jī)等等。
服務(wù)器105可以是提供各種服務(wù)的服務(wù)器,例如對(duì)用戶利用終端設(shè)備101、102、103所瀏覽的購物類網(wǎng)站提供支持的后臺(tái)管理服務(wù)器。后臺(tái)管理服務(wù)器可以對(duì)接收到的產(chǎn)品信息查詢請(qǐng)求等數(shù)據(jù)進(jìn)行分析等處理,并將處理結(jié)果反饋給終端設(shè)備。
需要說明的是,本發(fā)明實(shí)施例中所提供的信息審核方法一般由服務(wù)器105執(zhí)行,相應(yīng)地,信息審核裝置一般設(shè)置于服務(wù)器105中。
應(yīng)該理解,圖1中的終端設(shè)備、網(wǎng)絡(luò)和服務(wù)器的數(shù)目?jī)H僅是示意性的。根據(jù)實(shí)現(xiàn)需要,可以具有任意數(shù)目的終端設(shè)備、網(wǎng)絡(luò)和服務(wù)器。
圖2示意性示出了根據(jù)本發(fā)明的第一個(gè)實(shí)施例的信息審核方法的流程圖。
參照?qǐng)D2,根據(jù)本發(fā)明的第一個(gè)實(shí)施例的信息審核方法,包括如下步驟:
步驟s20,獲取用戶設(shè)置的審核強(qiáng)度系數(shù)。
在本發(fā)明的實(shí)施例中,用戶可以根據(jù)實(shí)際的審核強(qiáng)度來設(shè)置審核強(qiáng)度系數(shù)。具體地,用戶可以通過輸入設(shè)備(如鍵盤、觸摸屏、語音輸入設(shè)備等)來設(shè)置審核強(qiáng)度系數(shù)。其中,輸入強(qiáng)度系數(shù)可以是一個(gè)固定的范圍,用戶可以在該范圍內(nèi)來選擇所要設(shè)置的審核強(qiáng)度系數(shù)。
步驟s22,從已存儲(chǔ)的圖片信息中獲得與模板圖片的相似度系數(shù)大于或等于所述審核強(qiáng)度系數(shù)的至少一個(gè)圖片信息。
在本發(fā)明的實(shí)施例中,已存儲(chǔ)的圖片信息是在圖片審核時(shí)進(jìn)行匹配的圖片特征庫,由于本發(fā)明的實(shí)施例能夠?qū)υ搱D片特征庫進(jìn)行完善,因此能夠?qū)崿F(xiàn)圖片特征庫的自學(xué)習(xí)過程,進(jìn)而能夠提高圖片審核的質(zhì)量。
根據(jù)本發(fā)明的示例性實(shí)施例,所述至少一個(gè)圖片信息包括至少一個(gè)圖像特征點(diǎn)向量集合。優(yōu)選地,圖像特征點(diǎn)向量集合可以是通過sifi(scale-invariantfeaturetransform,尺度不變特征變換)算法從圖片中提取出的特征點(diǎn)向量集合。一個(gè)圖像特征點(diǎn)向量集合就是從一個(gè)圖片中提取出的圖像特征點(diǎn)向量集合。
步驟s24,將待審核圖片的信息與所述至少一個(gè)圖片信息進(jìn)行比較。
根據(jù)本發(fā)明的示例性實(shí)施例,在上述的至少一個(gè)圖片信息包括至少一個(gè)圖像特征點(diǎn)向量集合時(shí),步驟s24具體包括:提取所述待審核圖片的特征點(diǎn)向量集合;將所述待審核圖片的特征點(diǎn)向量集合與所述至少一個(gè)圖像特征點(diǎn)向量集合進(jìn)行比較。
在本發(fā)明的實(shí)施例中,可以通過sift算法提取待審核圖片的特征點(diǎn)向量集合。
根據(jù)本發(fā)明的示例性實(shí)施例,根據(jù)所述待審核圖片的特征點(diǎn)向量集合與任一所述圖像特征點(diǎn)向量集合中相匹配的特征點(diǎn)向量的個(gè)數(shù),確定所述待審核圖片的信息與任一所述圖片信息的比較結(jié)果是否滿足所述審核強(qiáng)度系數(shù)。
需要說明的是,若相匹配的特征點(diǎn)向量的個(gè)數(shù)越多,則說明兩張圖片的相似度越高,而審核強(qiáng)度系數(shù)是與圖片的相似度相關(guān)的,因此可以基于相匹配的特征點(diǎn)向量的個(gè)數(shù)來確定待審核圖片的信息與任一所述圖片信息的比較結(jié)果是否滿足審核強(qiáng)度系數(shù)。
步驟s26,若所述待審核圖片的信息與任一所述圖片信息的比較結(jié)果滿足所述審核強(qiáng)度系數(shù),則確定所述待審核圖片審核通過。
當(dāng)然,如果待審核圖片的信息與上述至少一個(gè)圖片信息的比較結(jié)果都不滿足審核強(qiáng)度系數(shù),則確定待審核圖片審核不通過。
在本發(fā)明的一些實(shí)施例中,基于前述方案,還包括:將所述待審核圖片的信息與所述模板圖片的信息進(jìn)行比較,以得到所述待審核圖片與所述模板圖片的相似度系數(shù);在所述待審核圖片與所述模板圖片的相似度系數(shù)大于或等于預(yù)定閾值時(shí),保存所述待審核圖片的信息和所述待審核圖片與所述模板圖片的相似度系數(shù)。
需要說明的是,不管待審核圖片是否審核通過,都可以將其與模板圖片的信息進(jìn)行比較來確定待審核圖片與模板圖片的相似度系數(shù)。
圖3示意性示出了根據(jù)本發(fā)明的第二個(gè)實(shí)施例的信息審核方法的流程圖。
參照?qǐng)D3,根據(jù)本發(fā)明的第二個(gè)實(shí)施例的信息審核方法,包括如下步驟:
步驟s30,獲取待審核的文字內(nèi)容。
步驟s32,檢測(cè)所述待審核的文字內(nèi)容中是否包含有敏感詞。
步驟s34,在所述待審核的文字內(nèi)容中包含有敏感詞時(shí),確定所述待審核的文字內(nèi)容審核未通過。
在本發(fā)明的一些實(shí)施例中,基于前述方案,還包括:在所述待審核的文字內(nèi)容中不包含敏感詞時(shí),檢測(cè)所述待審核的文字內(nèi)容中是否包含通用詞,和/或?qū)λ龃龑徍说奈淖謨?nèi)容進(jìn)行詞法分析,以確定所述待審核的文字內(nèi)容所針對(duì)的對(duì)象是否符合要求;若所述待審核的文字內(nèi)容中包含有通用詞,和/或所述待審核的文字內(nèi)容所針對(duì)的對(duì)象符合要求,則確定所述待審核的文字內(nèi)容審核通過;否則,確定所述待審核的文字內(nèi)容審核未通過。
需要說明的是,通用詞是較為通用的詞語,比如對(duì)于商品的評(píng)論信息,可以將“很好用”、“很喜歡”等詞語設(shè)置為通用詞,進(jìn)而在進(jìn)行評(píng)論信息的審核時(shí),若評(píng)論信息中出現(xiàn)這些詞語,則認(rèn)為審核通過。同樣以商品的評(píng)論信息為例,若評(píng)論信息針對(duì)的是鍵盤(即待審核的文字內(nèi)容所針對(duì)的對(duì)象),則可以通過對(duì)評(píng)論信息進(jìn)行詞法分析來確定該評(píng)論信息是否是針對(duì)鍵盤而言的,比如通過詞法分析確定評(píng)論信息是“制冷很快”,則確定該評(píng)論信息與所評(píng)論的商品無關(guān),此時(shí)可以確定審核未通過。
本發(fā)明實(shí)施例的技術(shù)方案不僅可以應(yīng)用在對(duì)商品的評(píng)論信息進(jìn)行審核的場(chǎng)景,而且可以應(yīng)用在對(duì)論壇或貼吧上發(fā)表的文字或圖片進(jìn)行審核的場(chǎng)景、對(duì)社交網(wǎng)絡(luò)中用戶發(fā)表的文字或圖片進(jìn)行審核的場(chǎng)景等。為了充分闡述本發(fā)明實(shí)施例的技術(shù)方案,以下以對(duì)商品的評(píng)論信息進(jìn)行審核的場(chǎng)景和對(duì)論壇或貼吧上發(fā)表的文字或圖片進(jìn)行審核的場(chǎng)景為例進(jìn)行詳細(xì)說明:
應(yīng)用場(chǎng)景一(對(duì)商品的評(píng)論信息進(jìn)行審核的場(chǎng)景):
如圖4所示為根據(jù)本發(fā)明的實(shí)施例的評(píng)論信息的審核系統(tǒng)的結(jié)構(gòu)示意圖,在圖4所示的系統(tǒng)架構(gòu)中,包括了客戶端模塊、http服務(wù)器集群、圖片審核服務(wù)器集群、文字審核服務(wù)器集群、數(shù)據(jù)存儲(chǔ)模塊等,以下分別介紹每個(gè)模塊的功能:
1、客戶端模塊可以是app客戶端、瀏覽器客戶端等,用戶可以通過其發(fā)表文字評(píng)論和圖片評(píng)論。
2、http服務(wù)器集群主要用于處理http請(qǐng)求,其屬于應(yīng)用層服務(wù)器集群。
3、圖片審核服務(wù)器集群用于對(duì)評(píng)論的圖片進(jìn)行審核,通過基于服務(wù)器集群來審核圖片,可以應(yīng)對(duì)海量的數(shù)據(jù)。當(dāng)然在數(shù)據(jù)較少時(shí),也可以不通過服務(wù)器集群來對(duì)圖片進(jìn)行審核。
4、文字審核服務(wù)器集群用于對(duì)評(píng)論的文字內(nèi)容進(jìn)行審核。類似地,在數(shù)據(jù)較少時(shí),也可以不通過服務(wù)器集群來對(duì)文字內(nèi)容進(jìn)行審核。
5、數(shù)據(jù)存儲(chǔ)模塊用于存儲(chǔ)圖片數(shù)據(jù)和/或文字?jǐn)?shù)據(jù)。在本發(fā)明的實(shí)施例中,數(shù)據(jù)存儲(chǔ)模塊可以分為:存儲(chǔ)審核通過的數(shù)據(jù)的服務(wù)器、存儲(chǔ)審核未通過的數(shù)據(jù)的服務(wù)器和保存圖片特征點(diǎn)向量集的服務(wù)器。
以下結(jié)合圖5和圖6對(duì)圖片和文字的審核過程分別進(jìn)行詳細(xì)說明。在本發(fā)明的實(shí)施例中,對(duì)評(píng)論的圖片進(jìn)行審核的系統(tǒng)架構(gòu)如圖5所示。
其中,主線程負(fù)責(zé)管理工作線程。需要說明的是,在該實(shí)施例中,是按照linux系統(tǒng)的服務(wù)器結(jié)構(gòu)來進(jìn)行說明,在本發(fā)明的其它實(shí)施例中,也可以不劃分主線程和工作線程,而僅以http服務(wù)器來進(jìn)行說明。
圖片處理服務(wù)器可以使用sift算法提取評(píng)論圖片的特征點(diǎn)向量集合,并根據(jù)已有的圖片特征點(diǎn)向量集合進(jìn)行比較來判斷圖片相似度,同時(shí)根據(jù)配置的審核強(qiáng)度參數(shù)來確定圖片是否審核通過。此外,圖片處理服務(wù)器也可以根據(jù)需要判斷是否需要保存新上傳的圖片的特征點(diǎn)向量集合,以完善特征庫。
審核通過數(shù)據(jù)存儲(chǔ)服務(wù)器用于存儲(chǔ)審核通過的圖片,審核未通過數(shù)據(jù)存儲(chǔ)服務(wù)器用于存儲(chǔ)審核未通過的圖片。
圖片特征點(diǎn)向量集合存儲(chǔ)服務(wù)器用于存儲(chǔ)需要保存的圖片特征點(diǎn)向量集合。
需要說明的是,對(duì)于審核通過數(shù)據(jù)存儲(chǔ)服務(wù)器和審核未通過數(shù)據(jù)存儲(chǔ)服務(wù)器中的數(shù)據(jù),可以通過人工巡查的方式對(duì)評(píng)論的圖片進(jìn)行進(jìn)一步審查。比如,對(duì)于審核通過數(shù)據(jù)存儲(chǔ)服務(wù)器中的數(shù)據(jù),如果人工審查之后發(fā)現(xiàn)不符合規(guī)定,則可以將其移至審核未通過數(shù)據(jù)存儲(chǔ)服務(wù)器中;同樣地,對(duì)于審核未通過數(shù)據(jù)存儲(chǔ)服務(wù)器中的數(shù)據(jù),如果人工審查之后發(fā)現(xiàn)符合規(guī)定,則可以將其移至審核通過數(shù)據(jù)存儲(chǔ)服務(wù)器中。
在本發(fā)明的實(shí)施例中,對(duì)評(píng)論的文字內(nèi)容進(jìn)行審核的系統(tǒng)架構(gòu)如圖6所示。
其中,主線程負(fù)責(zé)管理工作線程。需要說明的是,在該實(shí)施例中,是按照linux系統(tǒng)的服務(wù)器結(jié)構(gòu)來進(jìn)行說明,在本發(fā)明的其它實(shí)施例中,也可以不劃分主線程和工作線程,而僅以http服務(wù)器來進(jìn)行說明。
文字處理服務(wù)器可以通過以下方式來對(duì)文字進(jìn)行審核:敏感詞過濾,通用詞匹配,自然語言處理中的詞法分析。
審核通過數(shù)據(jù)存儲(chǔ)服務(wù)器用于存儲(chǔ)審核通過的文字?jǐn)?shù)據(jù),審核未通過數(shù)據(jù)存儲(chǔ)服務(wù)器用于存儲(chǔ)審核未通過的文字?jǐn)?shù)據(jù)。
需要說明的是,對(duì)于審核通過數(shù)據(jù)存儲(chǔ)服務(wù)器和審核未通過數(shù)據(jù)存儲(chǔ)服務(wù)器中的數(shù)據(jù),可以通過人工巡查的方式對(duì)評(píng)論的文字?jǐn)?shù)據(jù)進(jìn)行進(jìn)一步審查。比如,對(duì)于審核通過數(shù)據(jù)存儲(chǔ)服務(wù)器中的數(shù)據(jù),如果人工審查之后發(fā)現(xiàn)不符合規(guī)定,則可以將其移至審核未通過數(shù)據(jù)存儲(chǔ)服務(wù)器中;同樣地,對(duì)于審核未通過數(shù)據(jù)存儲(chǔ)服務(wù)器中的數(shù)據(jù),如果人工審查之后發(fā)現(xiàn)符合規(guī)定,則可以將其移至審核通過數(shù)據(jù)存儲(chǔ)服務(wù)器中。
以下結(jié)合圖7對(duì)本發(fā)明實(shí)施例的評(píng)論信息進(jìn)行審核的流程進(jìn)行詳細(xì)說明。參照?qǐng)D7,根據(jù)本發(fā)明實(shí)施例的對(duì)評(píng)論信息進(jìn)行審核的流程,包括:
步驟702,當(dāng)用戶提交評(píng)論之后,判斷用戶提交的評(píng)論中是否有圖片和文字,若有文字,則執(zhí)行步驟704;若有圖片,則執(zhí)行步驟712。
步驟704,判斷文字內(nèi)容中是否有敏感詞,若是,則確定文字審核未通過;若否,則執(zhí)行步驟706。需要說明的是,步驟704即為敏感詞過濾過程,具體可以通過敏感詞詞庫來確定文字內(nèi)容中是否有敏感詞。
步驟706,判斷文字內(nèi)容中是否有通用詞,若是,則確定文字審核通過;若否,則執(zhí)行步驟708。需要說明的是,步驟706即為通用詞匹配過程。
其中,通用詞匹配是與敏感詞過濾相反的過程。通常情況下,用戶評(píng)論的文字內(nèi)容里面會(huì)有諸如“很好用”、“很喜歡”、“跟想象中的有點(diǎn)不一樣”等與商品無直接相關(guān)的詞語,這些詞語是很通用的評(píng)論,每個(gè)商品都可以套用。因此,若匹配到這些通用詞之后就可以判斷這是一個(gè)有效的評(píng)論,即可以判定審核通過。
步驟708,對(duì)評(píng)論的文字內(nèi)容進(jìn)行分詞處理,然后執(zhí)行步驟710。
步驟710,判斷文字內(nèi)容是否與商品相關(guān),若是,則判定文字審核通過;若否,則判定文字審核未通過。
需要說明的是,詞法分析就是對(duì)評(píng)論的文字內(nèi)容進(jìn)行分詞處理,然后進(jìn)行詞法分析,主要是判斷出文字內(nèi)容與商品是否相關(guān)。比如商品是一個(gè)鍵盤,而用戶的評(píng)論是“自從有了它,我就愛上打字了”,當(dāng)通過詞法分析之后,可以確定打字是與鍵盤有關(guān)系的,因此可以判定用戶的評(píng)論是有效的評(píng)論,是可以通過審核的;而如果用戶評(píng)論的是“制冷很快”,這樣在經(jīng)過詞法分析之后,會(huì)判定該文字內(nèi)容與商品無關(guān),進(jìn)而可以判定未通過審核。
步驟712,使用sifi算法提取評(píng)論圖片的圖像特征點(diǎn)向量集合。
步驟714,從已有的圖像特征點(diǎn)向量集合中找到相似度系數(shù)≥審核強(qiáng)度系數(shù)的數(shù)據(jù)。
需要說明的是,審核強(qiáng)度系數(shù)可以是由運(yùn)營人員、管理人員等(優(yōu)選情況下,這里的運(yùn)營人員、管理人員等并非是提交評(píng)論的用戶)設(shè)置的,比如可以約定用0~100的審核強(qiáng)度范圍,那么運(yùn)營人員、管理人員等可以在該審核強(qiáng)度范圍內(nèi)來設(shè)置審核強(qiáng)度系數(shù)。其中,審核強(qiáng)度系數(shù)與相匹配的特征點(diǎn)數(shù)量是成比例的。具體地,在商品上架時(shí),可以通過sift算法提取商品圖片的特征點(diǎn)向量集合,然后保存商品圖片的特征點(diǎn)向量集合到服務(wù)器,并設(shè)置圖片的相似度系數(shù),這個(gè)相似度系數(shù)與審核強(qiáng)度系數(shù)是同一個(gè)度量。
由于商品圖片基本都是高清大圖,因此提取出來的特征點(diǎn)向量集合基本都是有效特征點(diǎn),比如一個(gè)商品圖片g的特征點(diǎn)向量集合中有50個(gè)特征點(diǎn)向量,且使用了0~100的審核強(qiáng)度范圍。若圖片a與商品圖g有10個(gè)相似特征點(diǎn)就可以認(rèn)為達(dá)到了20這個(gè)審核強(qiáng)度,圖片b與官方商品圖g有40個(gè)相似特征點(diǎn)就可以達(dá)到80這個(gè)審核強(qiáng)度,這樣如果設(shè)置商品g的審核強(qiáng)度系數(shù)為60,那么圖片b就能通過審核,圖片a就無法通過審核。
步驟716,將從評(píng)論圖片中提取出的圖像特征點(diǎn)向量集合與上步驟(即步驟714)得到的數(shù)據(jù)進(jìn)行比較。
需要說明的是,在進(jìn)行比較時(shí),可以將從評(píng)論圖片中提取出的圖像特征點(diǎn)向量集合逐一與步驟714中得到的特征點(diǎn)向量集合進(jìn)行比較,比如按照步驟714中得到的特征點(diǎn)向量集合的相似度系數(shù)從高到低的順序來進(jìn)行比較;當(dāng)然,也可以將從評(píng)論圖片中提取出的圖像特征點(diǎn)向量集合同時(shí)與步驟714中得到的多個(gè)特征點(diǎn)向量集合進(jìn)行比較。
步驟718,判斷比較結(jié)果是否滿足審核強(qiáng)度系數(shù),若是,則判定圖片審核通過;否則,判定圖片審核未通過。
需要說明的是,從評(píng)論圖片中提取出的圖像特征點(diǎn)向量集合只要與步驟714中得到的任一特征點(diǎn)向量集合的比較結(jié)果滿足審核強(qiáng)度系數(shù),就確定圖片審核通過。
步驟720,不管圖片是否審核通過,都將評(píng)論的圖片與原商品圖進(jìn)行比較,得到一個(gè)相似度系數(shù)。
需要說明的是,之所以不直接把審核通過的圖片的特征點(diǎn)向量集保存起來,而是不管圖片是否審核通過,都將其與原商品圖進(jìn)行比較,是因?yàn)檫\(yùn)營人員、管理人員等設(shè)置的審核強(qiáng)度有高有低,因此需要建立一個(gè)豐富完善的特征庫。同時(shí),由于是與原商品圖進(jìn)行比較,因此也可以保證計(jì)算得到的相似度系數(shù)更加準(zhǔn)確。
步驟722,判斷相似度系數(shù)是否大于或等于設(shè)置的最小閾值,若是,則執(zhí)行步驟726;否則,執(zhí)行步驟724。
步驟724,丟棄評(píng)論圖片的特征點(diǎn)向量集合。
步驟736,保存評(píng)論圖片的特征點(diǎn)向量集合和相似度系數(shù),這樣能夠完善特征庫,進(jìn)而能夠在再次執(zhí)行步驟714時(shí)使用。
應(yīng)用場(chǎng)景二(對(duì)論壇或貼吧上發(fā)表的文字或圖片進(jìn)行審核的場(chǎng)景):
在對(duì)論壇或貼吧上發(fā)表的圖片進(jìn)行審核時(shí),先獲得運(yùn)營人員、管理人員等設(shè)置的審核強(qiáng)度系數(shù);然后從已存儲(chǔ)的圖片信息中獲得與模板圖片的相似度系數(shù)大于或等于該審核強(qiáng)度系數(shù)的至少一個(gè)圖片信息;其次將待審核圖片的信息與獲得的至少一個(gè)圖片信息進(jìn)行比較;當(dāng)待審核圖片的信息與獲得的任一圖片信息的比較結(jié)果滿足上述審核強(qiáng)度系數(shù)時(shí),確定待審核圖片審核通過。
需要說明的是,對(duì)于對(duì)論壇或貼吧來說,模板圖片可以是一些合法的圖片(如已經(jīng)通過審核的圖片等),已存儲(chǔ)的圖片信息可以包含預(yù)置的圖片,也可以包含已經(jīng)審核通過的圖片等。
在對(duì)論壇或貼吧上發(fā)表的文字進(jìn)行審核時(shí),先檢測(cè)待審核的文字內(nèi)容中是否包含有敏感詞,若待審核的文字內(nèi)容中包含有敏感詞,則確定待審核的文字內(nèi)容審核未通過;若待審核的文字內(nèi)容中不包含敏感詞,則檢測(cè)待審核的文字內(nèi)容中是否包含通用詞,和/或?qū)Υ龑徍说奈淖謨?nèi)容進(jìn)行詞法分析,以確定待審核的文字內(nèi)容所針對(duì)的對(duì)象是否符合要求;若待審核的文字內(nèi)容中包含有通用詞,和/或待審核的文字內(nèi)容所針對(duì)的對(duì)象符合要求,則確定待審核的文字內(nèi)容審核通過;否則,確定待審核的文字內(nèi)容審核未通過。
比如,在對(duì)論壇或貼吧上發(fā)表的文字進(jìn)行審核時(shí),若回帖的文字信息中包含有如“贊”、“頂一下”等通用詞,則可以認(rèn)為審核通過。同樣,若對(duì)待審核文字進(jìn)行詞法分析之后確定該待審核文字與帖子毫不相關(guān),則可以認(rèn)為審核未通過。
此外,本發(fā)明實(shí)施例的技術(shù)方案還可以應(yīng)用到其它需要對(duì)文字和/或圖片進(jìn)行審核的場(chǎng)景。
圖8示意性示出了根據(jù)本發(fā)明的一個(gè)實(shí)施例的信息審核裝置的框圖。
參照?qǐng)D8,根據(jù)本發(fā)明的一個(gè)實(shí)施例的信息審核裝置800,包括:第一獲取單元802、第二獲取單元804、處理單元806和確定單元808。
具體地,第一獲取單元802用于獲取用戶設(shè)置的審核強(qiáng)度系數(shù);第二獲取單元804用于從已存儲(chǔ)的圖片信息中獲得與模板圖片的相似度系數(shù)大于或等于所述審核強(qiáng)度系數(shù)的至少一個(gè)圖片信息;處理單元806用于將待審核圖片的信息與所述至少一個(gè)圖片信息進(jìn)行比較;確定單元808用于在所述待審核圖片的信息與任一所述圖片信息的比較結(jié)果滿足所述審核強(qiáng)度系數(shù)時(shí),確定所述待審核圖片審核通過。
需要說明的是,圖8中所示的信息審核裝置800中包含的各模塊/單元的具體細(xì)節(jié)已經(jīng)在對(duì)應(yīng)的信息審核方法中進(jìn)行了詳細(xì)的描述,因此此處不再贅述。
下面參考圖9,其示出了適于用來實(shí)現(xiàn)本發(fā)明實(shí)施例的電子設(shè)備的計(jì)算機(jī)系統(tǒng)900的結(jié)構(gòu)示意圖。圖9示出的電子設(shè)備的計(jì)算機(jī)系統(tǒng)900僅是一個(gè)示例,不應(yīng)對(duì)本發(fā)明實(shí)施例的功能和使用范圍帶來任何限制。
如圖9所示,計(jì)算機(jī)系統(tǒng)900包括中央處理單元(cpu)901,其可以根據(jù)存儲(chǔ)在只讀存儲(chǔ)器(rom)902中的程序或者從存儲(chǔ)部分908加載到隨機(jī)訪問存儲(chǔ)器(ram)903中的程序而執(zhí)行各種適當(dāng)?shù)膭?dòng)作和處理。在ram903中,還存儲(chǔ)有系統(tǒng)操作所需的各種程序和數(shù)據(jù)。cpu901、rom902以及ram903通過總線904彼此相連。輸入/輸出(i/o)接口905也連接至總線904。
以下部件連接至i/o接口905:包括鍵盤、鼠標(biāo)等的輸入部分906;包括諸如陰極射線管(crt)、液晶顯示器(lcd)等以及揚(yáng)聲器等的輸出部分907;包括硬盤等的存儲(chǔ)部分908;以及包括諸如lan卡、調(diào)制解調(diào)器等的網(wǎng)絡(luò)接口卡的通信部分909。通信部分909經(jīng)由諸如因特網(wǎng)的網(wǎng)絡(luò)執(zhí)行通信處理。驅(qū)動(dòng)器910也根據(jù)需要連接至i/o接口905??刹鹦督橘|(zhì)911,諸如磁盤、光盤、磁光盤、半導(dǎo)體存儲(chǔ)器等等,根據(jù)需要安裝在驅(qū)動(dòng)器910上,以便于從其上讀出的計(jì)算機(jī)程序根據(jù)需要被安裝入存儲(chǔ)部分908。
特別地,根據(jù)本發(fā)明的實(shí)施例,上文參考流程圖描述的過程可以被實(shí)現(xiàn)為計(jì)算機(jī)軟件程序。例如,本發(fā)明的實(shí)施例包括一種計(jì)算機(jī)程序產(chǎn)品,其包括承載在計(jì)算機(jī)可讀介質(zhì)上的計(jì)算機(jī)程序,該計(jì)算機(jī)程序包含用于執(zhí)行流程圖所示的方法的程序代碼。在這樣的實(shí)施例中,該計(jì)算機(jī)程序可以通過通信部分909從網(wǎng)絡(luò)上被下載和安裝,和/或從可拆卸介質(zhì)911被安裝。在該計(jì)算機(jī)程序被中央處理單元(cpu)901執(zhí)行時(shí),執(zhí)行本申請(qǐng)的系統(tǒng)中限定的上述功能。
需要說明的是,本發(fā)明所示的計(jì)算機(jī)可讀介質(zhì)可以是計(jì)算機(jī)可讀信號(hào)介質(zhì)或者計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)或者是上述兩者的任意組合。計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)例如可以是——但不限于——電、磁、光、電磁、紅外線、或半導(dǎo)體的系統(tǒng)、裝置或器件,或者任意以上的組合。計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)的更具體的例子可以包括但不限于:具有一個(gè)或多個(gè)導(dǎo)線的電連接、便攜式計(jì)算機(jī)磁盤、硬盤、隨機(jī)訪問存儲(chǔ)器(ram)、只讀存儲(chǔ)器(rom)、可擦式可編程只讀存儲(chǔ)器(eprom或閃存)、光纖、便攜式緊湊磁盤只讀存儲(chǔ)器(cd-rom)、光存儲(chǔ)器件、磁存儲(chǔ)器件、或者上述的任意合適的組合。在本發(fā)明中,計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)可以是任何包含或存儲(chǔ)程序的有形介質(zhì),該程序可以被指令執(zhí)行系統(tǒng)、裝置或者器件使用或者與其結(jié)合使用。而在本發(fā)明中,計(jì)算機(jī)可讀的信號(hào)介質(zhì)可以包括在基帶中或者作為載波一部分傳播的數(shù)據(jù)信號(hào),其中承載了計(jì)算機(jī)可讀的程序代碼。這種傳播的數(shù)據(jù)信號(hào)可以采用多種形式,包括但不限于電磁信號(hào)、光信號(hào)或上述的任意合適的組合。計(jì)算機(jī)可讀的信號(hào)介質(zhì)還可以是計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)以外的任何計(jì)算機(jī)可讀介質(zhì),該計(jì)算機(jī)可讀介質(zhì)可以發(fā)送、傳播或者傳輸用于由指令執(zhí)行系統(tǒng)、裝置或者器件使用或者與其結(jié)合使用的程序。計(jì)算機(jī)可讀介質(zhì)上包含的程序代碼可以用任何適當(dāng)?shù)慕橘|(zhì)傳輸,包括但不限于:無線、電線、光纜、rf等等,或者上述的任意合適的組合。
附圖中的流程圖和框圖,圖示了按照本發(fā)明各種實(shí)施例的系統(tǒng)、方法和計(jì)算機(jī)程序產(chǎn)品的可能實(shí)現(xiàn)的體系架構(gòu)、功能和操作。在這點(diǎn)上,流程圖或框圖中的每個(gè)方框可以代表一個(gè)模塊、程序段、或代碼的一部分,上述模塊、程序段、或代碼的一部分包含一個(gè)或多個(gè)用于實(shí)現(xiàn)規(guī)定的邏輯功能的可執(zhí)行指令。也應(yīng)當(dāng)注意,在有些作為替換的實(shí)現(xiàn)中,方框中所標(biāo)注的功能也可以以不同于附圖中所標(biāo)注的順序發(fā)生。例如,兩個(gè)接連地表示的方框?qū)嶋H上可以基本并行地執(zhí)行,它們有時(shí)也可以按相反的順序執(zhí)行,這依所涉及的功能而定。也要注意的是,框圖或流程圖中的每個(gè)方框、以及框圖或流程圖中的方框的組合,可以用執(zhí)行規(guī)定的功能或操作的專用的基于硬件的系統(tǒng)來實(shí)現(xiàn),或者可以用專用硬件與計(jì)算機(jī)指令的組合來實(shí)現(xiàn)。
描述于本發(fā)明實(shí)施例中所涉及到的單元可以通過軟件的方式實(shí)現(xiàn),也可以通過硬件的方式來實(shí)現(xiàn),所描述的單元也可以設(shè)置在處理器中。其中,這些單元的名稱在某種情況下并不構(gòu)成對(duì)該單元本身的限定。
作為另一方面,本申請(qǐng)還提供了一種計(jì)算機(jī)可讀介質(zhì),該計(jì)算機(jī)可讀介質(zhì)可以是上述實(shí)施例中描述的電子設(shè)備中所包含的;也可以是單獨(dú)存在,而未裝配入該電子設(shè)備中。上述計(jì)算機(jī)可讀介質(zhì)承載有一個(gè)或者多個(gè)程序,當(dāng)上述一個(gè)或者多個(gè)程序被一個(gè)該電子設(shè)備執(zhí)行時(shí),使得該電子設(shè)備實(shí)現(xiàn)如上述實(shí)施例中所述的信息審核方法。
例如,可以實(shí)現(xiàn)如圖2中所示的:步驟s20,獲取用戶設(shè)置的審核強(qiáng)度系數(shù);步驟s22,從已存儲(chǔ)的圖片信息中獲得與模板圖片的相似度系數(shù)大于或等于所述審核強(qiáng)度系數(shù)的至少一個(gè)圖片信息;步驟s24,將待審核圖片的信息與所述至少一個(gè)圖片信息進(jìn)行比較;步驟s26,若所述待審核圖片的信息與任一所述圖片信息的比較結(jié)果滿足所述審核強(qiáng)度系數(shù),則確定所述待審核圖片審核通過。又如,也可以實(shí)現(xiàn)如圖3和/或圖7中所示的步驟。
應(yīng)當(dāng)注意,盡管在上文詳細(xì)描述中提及了用于動(dòng)作執(zhí)行的設(shè)備的若干模塊或者單元,但是這種劃分并非強(qiáng)制性的。實(shí)際上,根據(jù)本發(fā)明的實(shí)施方式,上文描述的兩個(gè)或更多模塊或者單元的特征和功能可以在一個(gè)模塊或者單元中具體化。反之,上文描述的一個(gè)模塊或者單元的特征和功能可以進(jìn)一步劃分為由多個(gè)模塊或者單元來具體化。
本領(lǐng)域技術(shù)人員在考慮說明書及實(shí)踐這里公開的發(fā)明后,將容易想到本發(fā)明的其它實(shí)施方案。本申請(qǐng)旨在涵蓋本發(fā)明的任何變型、用途或者適應(yīng)性變化,這些變型、用途或者適應(yīng)性變化遵循本發(fā)明的一般性原理并包括本發(fā)明未公開的本技術(shù)領(lǐng)域中的公知常識(shí)或慣用技術(shù)手段。說明書和實(shí)施例僅被視為示例性的,本發(fā)明的真正范圍和精神由下面的權(quán)利要求指出。
應(yīng)當(dāng)理解的是,本發(fā)明并不局限于上面已經(jīng)描述并在附圖中示出的精確結(jié)構(gòu),并且可以在不脫離其范圍進(jìn)行各種修改和改變。本發(fā)明的范圍僅由所附的權(quán)利要求來限制。