本發(fā)明涉及計算機互聯(lián)網(wǎng)技術領域,特別涉及一種數(shù)據(jù)發(fā)布的審核方法及裝置。
背景技術:
隨著互聯(lián)網(wǎng)技術的普及,在網(wǎng)站或APP上發(fā)表評論,或者和其它網(wǎng)友互動,早已成為廣大網(wǎng)民除瀏覽內(nèi)容之外最主要的上網(wǎng)需求。
網(wǎng)絡數(shù)據(jù)評論的發(fā)布一方面能夠降低普通公眾發(fā)表言論的門檻,對政府部門了解民意有很大的幫助;另一方面則會存在一些不良影響,例如:涉嫌違反法律法規(guī)的過激言論,惡意引導輿論的網(wǎng)絡水軍,發(fā)布虛假廣告信息的惡意用戶,格調(diào)不高的低俗評論等。
這些不良評論容易引發(fā)負面的社會問題,給政府監(jiān)管部門、網(wǎng)站以及APP的平臺運營團隊都帶來極大的麻煩。為此,對于具有數(shù)據(jù)評論發(fā)布功能的網(wǎng)站或APP都必須花費一定的精力處理所述些不良評論內(nèi)容。
現(xiàn)有技術中,通過設置相關識別策略來攔截相關數(shù)據(jù)評論,但通常情況下識別策略要求非常嚴格,需要做到極高的召回率,方能保證不漏掉不良評論,但其準確性較低。對于大型網(wǎng)站和超級APP,出于用戶體驗考慮,會有專門的審核團隊對被攔截的疑似不良評論做二次確認。如果發(fā)現(xiàn)有被誤殺的評論數(shù)據(jù),可以人工操作放出。對于無力承擔審核成本的小型網(wǎng)站和APP,一般情況下會容忍部分正常評論被誤殺。
然而,在審核被攔截的疑似不良評論時,待審核評論的排序使得審核團隊的審核效率受到較大影響。最常見的排序策略是按照評論發(fā)表時間排序,但在實際審核過程中按照評論發(fā)表時間排序的策略其審核效率很低。例如:一條被攔截評論發(fā)表的時間更早,但是被評論的文章不存在點擊量或者點擊量較低,審核這條評論后,即使發(fā)現(xiàn)所述評論是誤殺并成功放出,這條評論存在的意義也不大。反之,如果一條新發(fā)的被攔截評論本來是發(fā)表在一篇熱門文章下面,如果經(jīng)過審核認為所述評論可以放出,產(chǎn)生的收益就會遠大于審核之前那條更老的評論。
基于現(xiàn)有技術存在的問題如何提供一種能夠根據(jù)數(shù)據(jù)發(fā)布的優(yōu)先級來實現(xiàn)對所述數(shù)據(jù)發(fā)布的審核成為本領域亟待解決的技術問題。
技術實現(xiàn)要素:
本發(fā)明要解決的技術問題是如何提供一種數(shù)據(jù)發(fā)布的審核方法及裝置,以解決現(xiàn)有技術中對發(fā)布數(shù)據(jù)審核效率較低的技術問題。
為解決上述技術問題,本發(fā)明提供一種數(shù)據(jù)發(fā)布的審核方法,具體包括:
一種數(shù)據(jù)發(fā)布的審核方法,包括:
接收待發(fā)布數(shù)據(jù),將其作為待審核數(shù)據(jù)放入審核隊列中;
對所述審核隊列中的所述待審核數(shù)據(jù)賦予審核優(yōu)先級分值;
根據(jù)所述審核優(yōu)先級分值對所述審核隊列進行排序,對排序后的所述待審核數(shù)據(jù)進行審核。
優(yōu)選的,所述接收待發(fā)布數(shù)據(jù),將其作為待審核數(shù)據(jù)放入審核隊列中包括:
判斷所述待發(fā)布數(shù)據(jù)是否符合發(fā)布條件,若是,則發(fā)布,若否,則將所述待發(fā)布數(shù)據(jù)作為所述待審核數(shù)據(jù)放入審核隊列,并進入所述對所述待審核數(shù)據(jù)進行審核優(yōu)先級分值的步驟。
優(yōu)選的,所述對所述待審核數(shù)據(jù)賦予審核優(yōu)先級分值包括:
預先根據(jù)訓練數(shù)據(jù)的數(shù)據(jù)特征構建優(yōu)先級評分模型;
根據(jù)所述待審核數(shù)據(jù)的數(shù)據(jù)特征導出所述待審核數(shù)據(jù)在所述優(yōu)先級評分模型中對應的審核優(yōu)先級分值。
優(yōu)選的,所述數(shù)據(jù)特征包括:
所述待審核數(shù)據(jù)本身的特征參數(shù)、發(fā)表所述待審核數(shù)據(jù)的用戶特征參數(shù)和/或與所述待審核數(shù)據(jù)相對應的數(shù)據(jù)內(nèi)容的狀態(tài)統(tǒng)計參數(shù)。
優(yōu)選的,所述待審核數(shù)據(jù)本身的特征參數(shù)包括:
具有廣告詞的特征參數(shù)和/或具有敏感詞的特征參數(shù);
優(yōu)選的,所述發(fā)表所述待審核數(shù)據(jù)的用戶特征參數(shù)包括:
發(fā)表評論被禁言的次數(shù)、距離上次被禁言到當前發(fā)表評論為止的時間和/或被禁止評論放出的比例。
優(yōu)選的,與所述待審核數(shù)據(jù)相對應的數(shù)據(jù)內(nèi)容的狀態(tài)統(tǒng)計參數(shù)包括:
所述數(shù)據(jù)內(nèi)容單位時間的閱讀量和/或所述數(shù)據(jù)內(nèi)容單位時間內(nèi)所發(fā)表評論的點贊量之和。
優(yōu)選的,所述根據(jù)所述審核優(yōu)先級分值對所述審核隊列進行排序,對排序后的所述待審核數(shù)據(jù)進行審核包括:
在預設時間內(nèi)檢測所述審核隊列中的所述待審核數(shù)據(jù)的所述數(shù)據(jù)特征是否變化,若變化則進入下一步;
根據(jù)所述檢測結果對所述待審核數(shù)據(jù)的審核優(yōu)先級分值執(zhí)行更新。
優(yōu)選的,所述根據(jù)所述檢測結果對所述待審核數(shù)據(jù)的審核優(yōu)先級分值執(zhí)行更新包括:
判斷所述待審核數(shù)據(jù)的審核優(yōu)先級分值距離上一次的更新時間是否大于設定的更新時間閾值,若是,則更新所述待審核數(shù)據(jù)的審核優(yōu)先級分值;若否,則將所述審核數(shù)據(jù)放入緩存隊列。
優(yōu)選的,包括:
對更新后的所述待審核數(shù)據(jù)的審核優(yōu)先級分值,對所述審核隊列進行排序。
一種數(shù)據(jù)發(fā)布的審核裝置,包括:
接收模塊,用于接收待審核數(shù)據(jù),并將其作為待審核數(shù)據(jù)放入審核隊列中;
賦值模塊,用于所述審核隊列中的所述待審核數(shù)據(jù)賦予審核優(yōu)先級分值;
排序?qū)徍四K,用于根據(jù)所述審核優(yōu)先級分值對所述審核隊列進行排序,并對排序后的所述待審核數(shù)據(jù)進行審核。
優(yōu)選的,所述接收模塊包括:
攔截模塊,攔截所述接收模塊中的所述待發(fā)布數(shù)據(jù)是否為疑似不良數(shù)據(jù);所述攔截模塊包括:判斷模塊,用于判斷所述接收模塊中的所述待發(fā)布數(shù)據(jù)是否符合發(fā)布條件,若是,則發(fā)布;若否,則將所述待發(fā)布數(shù)據(jù)作為待審核數(shù)據(jù)放入審核隊列中,并進入所述賦值模塊。
優(yōu)選的,所述賦值模塊包括:
構建模塊,用于預先根據(jù)訓練數(shù)據(jù)的數(shù)據(jù)特征構建優(yōu)先級評分模型;
導出模塊,用于根據(jù)所述優(yōu)先級評分模型中導出所述待審核數(shù)據(jù)在所述優(yōu)先級評分模型中對應的審核優(yōu)先級分值。
優(yōu)選的,所述排序?qū)徍四K包括:
檢測模塊,用于在預設時間內(nèi)檢測所述審核隊列中的所述待審核數(shù)據(jù)的所述數(shù)據(jù)特征是否變化,若變化則進入更新模塊;
所述更新模塊,用于根據(jù)所述檢測結果對所述待審核數(shù)據(jù)的審核優(yōu)先級分值執(zhí)行更新。
優(yōu)選的,所述更新模塊包括:
更新時間判斷模塊,用于判斷所述待審核數(shù)據(jù)的審核優(yōu)先級分值距離上一次的更新時間是否大于設定的更新時間閾值,若是,則更新所述待審核數(shù)據(jù)的審核優(yōu)先級分值;若否,則將所述審核數(shù)據(jù)放入緩存隊列等待更新。
與現(xiàn)有技術相比,本發(fā)明的特點在于:通過對審核隊列中的待審核數(shù)據(jù)賦予審核優(yōu)先級的分值,進而使得審核隊列中的待審核數(shù)據(jù)是按照審核優(yōu)先級分值進行排序,審核人員能夠?qū)^高優(yōu)先級的待審核數(shù)據(jù)進行優(yōu)先審核,從而提高審核效率,并且降低審核過程誤殺的概率,使放出的評論量更多;影響面更大;被閱讀,回復和點贊的概率更大;所述審核方法的過程相當于雇傭更多的審核人員按照簡單排序?qū)徍嗽u論的效果,在沒有增加人力成本的情況下大幅提高的評論的用戶體驗。
附圖說明
為了更清楚地說明本發(fā)明實施例和現(xiàn)有技術中的技術方案,下面將對實施例和現(xiàn)有技術描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于本領域普通技術人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1是本發(fā)明提供的一種數(shù)據(jù)發(fā)布的審核方法的流程圖;
圖2是本發(fā)明提供的一種數(shù)據(jù)發(fā)布的審核裝置的結構示意圖。
具體實施方式
下面將接合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領域普通技術人員在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。
請參考圖1所示,圖1是本發(fā)明提供的一種數(shù)據(jù)發(fā)布的審核方法的流程圖。
如圖1所示,本發(fā)明提供的一種數(shù)據(jù)發(fā)布的審核方法包括:
步驟S110:接收待發(fā)布數(shù)據(jù),將其作為待審核數(shù)據(jù)放入審核隊列中。
在所述步驟S110的具體實現(xiàn)過程中,所述接收待發(fā)布數(shù)據(jù)可以是評論數(shù)據(jù)信息,即:對文章或?qū)π侣劵驅(qū)δ承┚W(wǎng)絡信息發(fā)表的評論數(shù)據(jù),也或者是基于某些已發(fā)表的評論數(shù)據(jù)發(fā)表的評論數(shù)據(jù),即:嵌套評論數(shù)據(jù);或者是針對已發(fā)表評論數(shù)據(jù)的回復評論數(shù)據(jù)等等,所述些評論數(shù)據(jù)可以是文本數(shù)據(jù)、圖形數(shù)據(jù)和/或語音數(shù)據(jù)等。
在本實施例中,采用針對文本數(shù)據(jù)下的評論數(shù)據(jù)信息的審核過程進行說明,但實際上,在使用本發(fā)明提供的數(shù)據(jù)發(fā)布的審核方法,并不僅限于本實施中的內(nèi)容。
為提高待發(fā)布數(shù)據(jù)的審核效率,在本實施例中,對所述接收發(fā)布數(shù)據(jù)進行判斷,即:判斷所述待發(fā)布數(shù)據(jù)是否符合發(fā)布條件,若是,則發(fā)布,若否,則將所述待發(fā)布數(shù)據(jù)作為所述待審核數(shù)據(jù)放入審核隊列,并進入步驟S120中,即:所述對所述待審核數(shù)據(jù)進行審核優(yōu)先級分值。也就是說,接收到對某一文本數(shù)據(jù)(即:文章)的評論數(shù)據(jù)(即:待發(fā)布數(shù)據(jù))后,先對所述評論數(shù)據(jù)進行篩選過濾,判斷所述評論數(shù)據(jù)是否為疑似不良評論,以便將無需進行審核隊列的正常評論數(shù)據(jù)直接發(fā)布,進而提高審核效率。
在判斷所述待發(fā)布的評論數(shù)據(jù)是否符合發(fā)布條件,可以通過基于敏感詞命中的簡單規(guī)則,或者基于敏感詞命中次數(shù),位置等額外信息的復雜規(guī)則,或者基于文本相似的規(guī)則。
通常情況下可以先用敏感詞命中做觸發(fā),一旦觸發(fā)后再用一個復雜的機器學習模型對評論打分,比如Logistic Regression,神經(jīng)網(wǎng)絡等。所述機器學習模型需要預先在人工標注的不良評論樣本上進行訓練,建立評論攔截訓練模型。所述評論攔截訓練模型在攔截時主要考慮評論的文本內(nèi)容,或者可以考慮評論發(fā)表用戶的歷史行為。一般來說有過不良行為記錄的用戶風險更高,即使是在類似的評論數(shù)據(jù)內(nèi)容下,這類用戶的評論更容易被所述評論攔截訓練模型識別為不良評論,并被攔截,并放入審核隊列中。
以上僅是對于疑似不良評論的攔截進行簡單說明,實際操作過程中,可以選取現(xiàn)有技術中對疑似不良評論的攔截方式,只要是能夠?qū)⒋l(fā)布評論數(shù)據(jù)中存在的疑似不良評論攔截即可,因為攔截的疑似不良評論可能存在有誤攔截的情況,因此,還需要對進入審核隊列中的疑似不良評論數(shù)據(jù)進行再次審核,以免發(fā)生誤殺情況。
步驟S120:對所述待審核數(shù)據(jù)賦予審核優(yōu)先級分值。
所述步驟S120的具體實現(xiàn)過程可以是,預先根據(jù)訓練數(shù)據(jù)的數(shù)據(jù)特征構建優(yōu)先級評分模型,構建所述優(yōu)先級評分模型可以采用pair-wise算法,具體過程可以是:
具體的,先自動構造數(shù)萬評論pair然后標注評論pair中那一條應所述被優(yōu)先審核,不好判斷的pair則被丟棄。需要說明的是,此處的判斷可以存在兩種情況,一種是:當審核隊列中的待審核數(shù)據(jù)為已經(jīng)被篩選過濾的疑似不良評論數(shù)據(jù)的情況下,可以將不好判斷的pair丟棄;另一種是:當審核隊列中的待審核數(shù)據(jù)沒有經(jīng)過篩選過濾,則可以將沒有任何特征的評論數(shù)據(jù)設定為最高優(yōu)先級。
比如,如果評論pair中有一條是不良評論,另一條是正常評論,則后一條的審核優(yōu)先級分值應所述高于前一條的審核優(yōu)先級分值。再比如,如果評論pair中兩條都是正常評論,在單位時間內(nèi)被點贊更多的評論可以設定為優(yōu)先審核。如果評論pair中兩條都是不良評論,可以設定為丟棄pair。
通過上述規(guī)則,得到一定數(shù)量的標注pair后,用若干現(xiàn)有的pair-wise學習算法學習任意一個能夠把這些pair全部排序正確的排序模型F(x),即給定:x1,x2,如果審核人員認為x1比x2優(yōu)先級高,F(xiàn)(x1)應所述大于F(x2)。優(yōu)先級評分模型最后用于給待審核的評論數(shù)據(jù)分配審核優(yōu)先級分值,也就是說給定評論x,其優(yōu)先級為F(x),即:通過審核隊列中的評論數(shù)據(jù)x,可以通過優(yōu)先級評分模型獲知評論x的審核優(yōu)先級分值F(x)。
在構建優(yōu)先級評分模型后,根據(jù)所述待審核數(shù)據(jù)的數(shù)據(jù)特征導出所述待審核數(shù)據(jù)在所述優(yōu)先級評分模型中對應的審核優(yōu)先級分值。
再對所述優(yōu)先級評分模型構建的過程中,可以通過評論數(shù)據(jù)的數(shù)據(jù)特征供其構建,并能夠通過抽取出審核隊列中的待發(fā)布評論數(shù)據(jù)的數(shù)據(jù)特征得到特征向量,將所述特征向量發(fā)送至優(yōu)先級評分模型中,所述優(yōu)先級評分模型則會根據(jù)特征向量查詢到對應的審核優(yōu)先級分值并導出,從而獲得所述待發(fā)布評論數(shù)據(jù)的審核優(yōu)先級分值。
在本實施例中,所述數(shù)據(jù)特征可以包括以下形式:
1、所述待審核數(shù)據(jù)本身的特征參數(shù),即:評論數(shù)據(jù)本身的特征參數(shù),包括:具有廣告詞的特征參數(shù)和/或具有敏感詞的特征參數(shù);具體可以為:機器識別評論是廣告的概率,機器識別評論包含臟話的概率,機器識別評論屬于人身攻擊的概率和/或機器識別評論有色情意味的概率等等。
2、發(fā)表所述待審核數(shù)據(jù)的用戶特征參數(shù),即:發(fā)表評論數(shù)據(jù)的用戶特征參數(shù),其具體是可以是,用戶發(fā)表評論被禁言的次數(shù),所述次數(shù)可以是統(tǒng)計用戶歷史發(fā)表評論的數(shù)據(jù)的次數(shù);用戶距離最近一次被禁言到當前發(fā)表評論為止的時間;和/或,用戶被禁止評論數(shù)據(jù)放出的比例,所述放出比例可以是設定為某一時間端內(nèi)評論被禁止放出的比例。
3、與所述待審核數(shù)據(jù)相對應的數(shù)據(jù)內(nèi)容的狀態(tài)統(tǒng)計參數(shù),即:與所述評論數(shù)據(jù)相對應的文章(數(shù)據(jù)內(nèi)容),所述文章已經(jīng)放出評論的數(shù)量;可以理解為對文章冷熱程度的判斷數(shù)據(jù),具體可以是:評論文章(數(shù)據(jù)內(nèi)容)單位時間的閱讀量和/或評論文章(數(shù)據(jù)內(nèi)容)單位時間內(nèi)所有放出評論的點贊量之和。
需要說明的是,上述數(shù)據(jù)特征僅為本實施中的舉例,實際應用過程中還可以根據(jù)審核內(nèi)容等采用不同的數(shù)據(jù)特征。所述優(yōu)先級評分模塊是通過待審核數(shù)據(jù)的數(shù)據(jù)特征,導出其對應的審核優(yōu)先級分值。
步驟S130:根據(jù)所述審核優(yōu)先級分值進行排序,對排序后的所述待審核數(shù)據(jù)進行審核。
所述步驟S130的具體實現(xiàn)過程可以是,根據(jù)審核隊列中的賦予待審核評論數(shù)據(jù)審核優(yōu)先級分值的大小對待審核評論數(shù)據(jù)進行排序,根據(jù)審核要求,按照降序的方式對待審核評論數(shù)據(jù)進行排序,即:審核優(yōu)先級分值從大到小排列。
由于在對某一文本數(shù)據(jù)進行評論時,會在短時間內(nèi)產(chǎn)生大量的評論數(shù)據(jù),審核隊列的評論數(shù)據(jù)量會不斷的產(chǎn)生變化,另外,在對已賦予審核優(yōu)先級分值的評論數(shù)據(jù)還存在評述數(shù)據(jù)的數(shù)據(jù)特征產(chǎn)生變化的情況,例如:點擊量和/或閱讀量的變化等等,對于已經(jīng)賦予審核優(yōu)先級分值的評述數(shù)據(jù)很有可能發(fā)生審核優(yōu)先級分值的變化,因此,為提高審核效率,保證審核隊列中評述數(shù)據(jù)審核優(yōu)先級分值能夠隨數(shù)據(jù)特征的變化而變化,在本實施例中,所述步驟S130:對審核優(yōu)先級分值對所述審核隊列進行排序,對排序后的所述待審核數(shù)據(jù)進行審核還包括:
在預設時間內(nèi)檢測所述審核隊列中的所述待審核數(shù)據(jù)的所述數(shù)據(jù)特征是否變化,若變化則進入下一步;
根據(jù)所述檢測結果對所述待審核數(shù)據(jù)的審核優(yōu)先級分值執(zhí)行更新。
所述更新的過程可以在原有的審核隊列基礎上對待審核評論數(shù)據(jù)的審核優(yōu)先級分值進行更新,也可以新建一個審核隊列將更新后的待審核評論數(shù)據(jù)的審核優(yōu)先級分值進行存儲,在更新完畢后將就的審核隊列刪除。
可以理解的是,對一篇文章的評論數(shù)據(jù)可能在短時間內(nèi)容生產(chǎn)大量評論數(shù)據(jù),而數(shù)據(jù)特征的變化也發(fā)生大量變化,不斷的更新優(yōu)先級分值會對審核人員的審核工作帶來困擾,因此,可以通過設定一個更新時間閾值,在更新時間閾值到達后才進行更新,進而提高審核工作的效率。具體可以是:
判斷所述待審核數(shù)據(jù)的審核優(yōu)先級分值距離上一次的更新時間是否大于設定的更新時間閾值,若是,則更新所述待審核數(shù)據(jù)的審核優(yōu)先級分值;若否,則將所述審核數(shù)據(jù)放入緩存隊列。
在本實施例中,更新時間的閾值可以根據(jù)通常情況下的審核數(shù)據(jù)變化量的平均值來設定,也可以根據(jù)實際審核工作的時間要求來設定。
在更新后,需要根據(jù)更新后的所述待審核數(shù)據(jù)的審核優(yōu)先級分值,重新對所述審核隊列進行排序,以便審核人員根據(jù)最新優(yōu)先級情況對待審核評論數(shù)據(jù)進行審核。
可以理解是,在對于放入緩存隊列的待審核評論數(shù)據(jù)當?shù)竭_更新時間后,其優(yōu)先權分值會被更新,并放入審核隊列中,之后刪除緩存隊列中的待審核評論數(shù)據(jù),對更新后的待審核評論數(shù)據(jù)的排序也會隨之重新排序。在本實施例中,更新審核隊列的過程可以新建一個審核隊列,所述審核隊列可以包括舊審核隊列中的評論和緩存隊列中的評論,建好后新的審核隊列后,審核人員通過新的審核隊列對待審核評論數(shù)據(jù)進行審核,并刪除舊的審核隊列。
需要說明的是,對于具有審核優(yōu)先級分值的審核隊列,在審核人員審核的顯示畫面中使將審核優(yōu)先級分值從高到低顯示,進而便于審核人員將審核優(yōu)先級分值較高的評述數(shù)據(jù)進行優(yōu)先審核。
以上為本發(fā)明提供的一種數(shù)據(jù)發(fā)布的審核方法的具體實現(xiàn)過程的描述,所述方法能夠提高審核效率,并且能夠使放出的評論量更多,影響面更大,被閱讀,回復和點贊的概率更大,采用所述審核方法的效果相當于雇傭更多的審核人員按照簡單排序?qū)徍嗽u論的效果,在沒有增加人力成本的情況下大幅提高的評論的用戶體驗。
基于上述本發(fā)明提供的一種數(shù)據(jù)發(fā)布的審核方法,本發(fā)明還提供一種與數(shù)據(jù)發(fā)布的審核方法相對應的數(shù)據(jù)發(fā)布的審核裝置,因為所述數(shù)據(jù)發(fā)布的審核裝置與數(shù)據(jù)發(fā)布的審核方法相對應,因此僅為示意性的描述,所述裝置的具體實現(xiàn)過程及內(nèi)容可以參考方法的描述。
請參考圖2所示,圖2是本發(fā)明提供的一種數(shù)據(jù)發(fā)布的審核裝置的結構示意圖。
如圖2所示,本發(fā)明提供的一種數(shù)據(jù)發(fā)布的審核裝置包括:
接收模塊201,用于接收待審核數(shù)據(jù),并將其作為待審核數(shù)據(jù)放入審核隊列中;
賦值模塊202,用于所述審核隊列中的所述待審核數(shù)據(jù)賦予審核優(yōu)先級分值;
排序?qū)徍四K203,用于根據(jù)所述審核優(yōu)先級分值對所述審核隊列進行排序,并對排序后的所述待審核數(shù)據(jù)進行審核。
其中,所述接收模塊201,包括:
攔截模塊,用于攔截所述接收模塊中的所述待發(fā)布數(shù)據(jù)是否為疑似不良數(shù)據(jù),所述攔截模塊包括:判斷模塊,用于判斷所述接收模塊中的所述待發(fā)布數(shù)據(jù)是否符合發(fā)布條件,若是,則發(fā)布;若否,則將所述待發(fā)布數(shù)據(jù)作為待審核數(shù)據(jù)放入審核隊列中,并進入所述賦值模塊。
所述賦值模塊202包括:
構建模塊,用于預先根據(jù)訓練數(shù)據(jù)的數(shù)據(jù)特征構建優(yōu)先級評分模型;
導出模塊,用于根據(jù)所述優(yōu)先級評分模型中導出所述待審核數(shù)據(jù)在所述優(yōu)先級評分模型中對應的審核優(yōu)先級分值。
所述排序?qū)徍四K203包括:
檢測模塊,用于在預設時間內(nèi)檢測所述審核隊列中的所述待審核數(shù)據(jù)的所述數(shù)據(jù)特征是否變化,若變化則進入更新模塊;
所述更新模塊,用于根據(jù)所述檢測結果對所述待審核數(shù)據(jù)的審核優(yōu)先級分值執(zhí)行更新。
所述更新模塊包括:
更新時間判斷模塊,用于判斷所述待審核數(shù)據(jù)的審核優(yōu)先級分值距離上一次的更新時間是否大于設定的更新時間閾值,若是,則更新所述待審核數(shù)據(jù)的審核優(yōu)先級分值;若否,則將所述審核數(shù)據(jù)放入緩存隊列等待更新。
可以理解的是,本發(fā)明提供的一種數(shù)據(jù)發(fā)布的審核裝置,還可以包括:交互模塊,用于將具有審核優(yōu)先級分值的審核隊列顯示供審核人員審核,判斷對應的待審核評論數(shù)據(jù)是否可以放出。
以上所述僅為本發(fā)明提供的一種數(shù)據(jù)發(fā)布的審核方法及裝置的優(yōu)選實施方式,并不構成對本發(fā)明保護范圍的限定。所述實施例中的部件數(shù)量并不局限于實施例中所采用的方式,任何在本發(fā)明的精神和原則之內(nèi)所作的任何修改、等同替換和改進等,均應包含在本發(fā)明的權利要求保護范圍之內(nèi)。