本發(fā)明涉及網(wǎng)絡(luò)交互管理的技術(shù)領(lǐng)域,更具體地,涉及一種交互過程中智能識別并處理敏感內(nèi)容的方法及系統(tǒng)。
背景技術(shù):
隨著網(wǎng)絡(luò)技術(shù)的發(fā)展,各種社交應(yīng)用程序(app)、社交平臺的推出,社交聊天逐漸成為了人們常用的信息交互方式,但是社交過程中人員錯(cuò)綜復(fù)雜,聊天內(nèi)容也是各種各樣,聊天內(nèi)容多,為保證聊天質(zhì)量,社交系統(tǒng)需要屏蔽一些不文明或不合法的敏感詞匯或發(fā)廣告(即社交敏感內(nèi)容,也有的稱其為黃版詞匯)。
目前,現(xiàn)有技術(shù)中通過將聊天詞匯與預(yù)設(shè)的黃版數(shù)據(jù)庫中詞匯對比搜索識別是否為黃版詞匯,如果發(fā)現(xiàn)有黃版詞匯,對其使用者的id進(jìn)行屏蔽。但是,用戶如果采用其它形式詞匯替代存在于詞庫中的黃版詞匯,如將“8”替換為“八”的形式,就能繞過屏蔽,不能達(dá)到預(yù)期的黃版詞匯屏蔽的目的。而且網(wǎng)絡(luò)詞匯更新?lián)Q代如此之快,現(xiàn)有系統(tǒng)對新興的敏感內(nèi)容的自動(dòng)識別能力還不夠強(qiáng),在數(shù)據(jù)庫中也不能智能地、及時(shí)地收錄這些新興的敏感詞匯內(nèi)容。
再者,中英文相結(jié)合的多個(gè)詞匯的組合就能得到各種不同的詞匯含義,對于如此之多的組合形式,采用現(xiàn)有的敏感詞匯庫匹配對比查詢敏感詞匯的方式難道較大且準(zhǔn)確性不高,還需要消耗較長的匹配比對時(shí)間,執(zhí)行效率不高,不能夠全面地、準(zhǔn)確地改變現(xiàn)有敏感詞匯的使用和傳播。而誤操作屏蔽用戶之后的申訴過程又很復(fù)雜,對用戶造成很不好的使用體驗(yàn)。
因此,提供一種智能化、準(zhǔn)確度高、操作簡便及效率高的交互過程中敏感內(nèi)容處理方案是本領(lǐng)域亟待解決的問題。
技術(shù)實(shí)現(xiàn)要素:
有鑒于此,本發(fā)明提供了一種交互過程中智能識別并處理敏感內(nèi)容的方法及系統(tǒng),解決了現(xiàn)有技術(shù)中不能智能化集中處理交互過程中敏感內(nèi)容的技術(shù)問題。
為了解決上述技術(shù)問題,本發(fā)明提出一種交互過程中智能識別并處理敏感內(nèi)容的方法,包括:
接收預(yù)設(shè)敏感內(nèi)容,按照ac自動(dòng)機(jī)的機(jī)制將所述預(yù)設(shè)敏感內(nèi)容編譯成自動(dòng)機(jī);將所述自動(dòng)機(jī)按照預(yù)設(shè)的關(guān)鍵字編碼的字符順序排列,并根據(jù)所述字符順序排列將所述自動(dòng)機(jī)構(gòu)建成自動(dòng)機(jī)搜索樹,并將所述自動(dòng)機(jī)搜索樹存儲(chǔ)至遠(yuǎn)程網(wǎng)絡(luò)請求服務(wù)平臺上;
接收客戶端的交互內(nèi)容,解析所述交互內(nèi)容得到交互字符,通過遠(yuǎn)程服務(wù)協(xié)議在所述自動(dòng)機(jī)搜索樹中逐字讀入所述交互字符,通過所述交互字符遍歷所述自動(dòng)機(jī)搜索樹得到所述交互內(nèi)容中的敏感內(nèi)容;
搜索所述客戶端的歷史交互記錄,得到所述敏感內(nèi)容出現(xiàn)的次數(shù),結(jié)合預(yù)先設(shè)置的敏感內(nèi)容處理策略,對所述客戶端執(zhí)行相應(yīng)的處理操作;
基于當(dāng)前的所述字符順序排列,根據(jù)所述敏感內(nèi)容更新所述自動(dòng)機(jī)搜索樹;
將更新后的所述自動(dòng)機(jī)搜索樹及所述敏感內(nèi)容對應(yīng)的處理策略存儲(chǔ)至所述遠(yuǎn)程網(wǎng)絡(luò)請求服務(wù)平臺上;
統(tǒng)計(jì)所述交互字符在交互過程中出現(xiàn)的次數(shù),在所述交互字符在交互過程中出現(xiàn)的次數(shù)大于或等于敏感次數(shù)時(shí),將所述交互字符反饋至管理端口;
接收所述管理端口的敏感內(nèi)容指令,并根據(jù)所述敏感內(nèi)容指令將所述交互字符更新至所述自動(dòng)機(jī)搜索樹中。
進(jìn)一步地,其中,所述敏感內(nèi)容處理策略,為:
所述敏感內(nèi)容出現(xiàn)次數(shù)小于或等于設(shè)定次數(shù)時(shí),在交互界面中屏蔽該敏感內(nèi)容,并向所述客戶端發(fā)送警示消息;
所述敏感內(nèi)容出現(xiàn)次數(shù)大于設(shè)定次數(shù)且小于或等于設(shè)定次數(shù)閾值時(shí),在交互界面中屏蔽該敏感內(nèi)容,并將所述客戶端屏蔽預(yù)設(shè)時(shí)間;
所述敏感內(nèi)容出現(xiàn)次數(shù)大于所述設(shè)定次數(shù)閾值時(shí),在交互界面中屏蔽該敏感內(nèi)容,并屏蔽所述客戶端。
進(jìn)一步地,其中,所述設(shè)定次數(shù),為一到三次;所述設(shè)定次數(shù)閾值,為三到五次。
進(jìn)一步地,其中,將所述自動(dòng)機(jī)按照預(yù)設(shè)的關(guān)鍵字編碼的字符順序排列,并根據(jù)所述字符順序排列將所述自動(dòng)機(jī)構(gòu)建成自動(dòng)機(jī)搜索樹,為:
根據(jù)預(yù)設(shè)的自動(dòng)機(jī)擴(kuò)展策略獲取所述自動(dòng)機(jī)對應(yīng)的擴(kuò)展自動(dòng)機(jī);
將所述自動(dòng)機(jī)及其擴(kuò)展自動(dòng)機(jī)按照預(yù)設(shè)的關(guān)鍵字編碼的字符順序排列,并根據(jù)所述字符順序排列將所述自動(dòng)機(jī)構(gòu)建成自動(dòng)機(jī)搜索樹。
另一方面,本發(fā)明還提供一種交互過程中智能識別并處理敏感內(nèi)容的系統(tǒng),包括:自動(dòng)機(jī)搜索樹創(chuàng)建模塊、敏感內(nèi)容獲取模塊、敏感內(nèi)容處理模塊、自動(dòng)機(jī)搜索樹更新模塊及敏感內(nèi)容處理策略存儲(chǔ)模塊;其中,
所述自動(dòng)機(jī)搜索樹創(chuàng)建模塊,用于與所述敏感內(nèi)容獲取模塊相連接,接收預(yù)設(shè)敏感內(nèi)容,按照ac自動(dòng)機(jī)的機(jī)制將所述預(yù)設(shè)敏感內(nèi)容編譯成自動(dòng)機(jī);將所述自動(dòng)機(jī)按照預(yù)設(shè)的關(guān)鍵字編碼的字符順序排列,并根據(jù)所述字符順序排列將所述自動(dòng)機(jī)構(gòu)建成自動(dòng)機(jī)搜索樹,并將所述自動(dòng)機(jī)搜索樹存儲(chǔ)至遠(yuǎn)程網(wǎng)絡(luò)請求服務(wù)平臺上;
所述敏感內(nèi)容獲取模塊,用于與所述自動(dòng)機(jī)搜索樹創(chuàng)建模塊及敏感內(nèi)容處理模塊相連接,接收客戶端的交互內(nèi)容,解析所述交互內(nèi)容得到交互字符,通過遠(yuǎn)程服務(wù)協(xié)議在所述自動(dòng)機(jī)搜索樹中逐字讀入所述交互字符,通過所述交互字符遍歷所述自動(dòng)機(jī)搜索樹得到所述交互內(nèi)容中的敏感內(nèi)容;
所述敏感內(nèi)容處理模塊,用于與所述敏感內(nèi)容獲取模塊及自動(dòng)機(jī)搜索樹更新模塊相連接,搜索所述客戶端的歷史交互記錄,得到所述敏感內(nèi)容出現(xiàn)的次數(shù),結(jié)合預(yù)先設(shè)置的敏感內(nèi)容處理策略,對所述客戶端執(zhí)行相應(yīng)的處理操作;
所述自動(dòng)機(jī)搜索樹更新模塊,用于與所述敏感內(nèi)容處理模塊及敏感內(nèi)容處理策略存儲(chǔ)模塊相連接,基于當(dāng)前的所述字符順序排列,根據(jù)所述敏感內(nèi)容更新所述自動(dòng)機(jī)搜索樹;
所述敏感內(nèi)容處理策略存儲(chǔ)模塊,用于與所述自動(dòng)機(jī)搜索樹更新模塊相連接,將更新后的所述自動(dòng)機(jī)搜索樹及所述敏感內(nèi)容對應(yīng)的處理策略存儲(chǔ)至所述遠(yuǎn)程網(wǎng)絡(luò)請求服務(wù)平臺上;
進(jìn)一步包括:預(yù)設(shè)敏感內(nèi)容更新模塊,用于與所述自動(dòng)機(jī)搜索樹創(chuàng)建模塊相連接,統(tǒng)計(jì)所述交互字符在交互過程中出現(xiàn)的次數(shù),在所述交互字符在交互過程中出現(xiàn)的次數(shù)大于或等于敏感次數(shù)時(shí),將所述交互字符反饋至管理端口;
接收所述管理端口的敏感內(nèi)容指令,并根據(jù)所述敏感內(nèi)容指令將所述交互字符更新至所述自動(dòng)機(jī)搜索樹中。
進(jìn)一步地,其中,所述敏感內(nèi)容處理模塊,為:敏感內(nèi)容出現(xiàn)的次數(shù)統(tǒng)計(jì)單元、第一敏感內(nèi)容處理單元、第二敏感內(nèi)容處理單元及第三敏感內(nèi)容處理單元;其中,
所述敏感內(nèi)容出現(xiàn)的次數(shù)統(tǒng)計(jì)單元,用于與所述敏感內(nèi)容獲取模塊、自動(dòng)機(jī)搜索樹更新模塊及第一敏感內(nèi)容處理單元相連接,搜索所述客戶端的歷史交互記錄,得到所述敏感內(nèi)容出現(xiàn)的次數(shù);
所述第一敏感內(nèi)容處理單元,用于與所述敏感內(nèi)容出現(xiàn)的次數(shù)統(tǒng)計(jì)單元及第二敏感內(nèi)容處理單元相連接,在所述敏感內(nèi)容出現(xiàn)次數(shù)小于或等于設(shè)定次數(shù)時(shí),在交互界面中屏蔽該敏感內(nèi)容,并向所述客戶端發(fā)送警示消息;
所述第二敏感內(nèi)容處理單元,用于與所述第一敏感內(nèi)容處理單元及第三敏感內(nèi)容處理單元相連接,所述敏感內(nèi)容出現(xiàn)次數(shù)大于設(shè)定次數(shù)且小于或等于設(shè)定次數(shù)閾值時(shí),在交互界面中屏蔽該敏感內(nèi)容,并將所述客戶端屏蔽預(yù)設(shè)時(shí)間;
所述第三敏感內(nèi)容處理單元,用于與所述第二敏感內(nèi)容處理單元相連接,所述敏感內(nèi)容出現(xiàn)次數(shù)大于所述設(shè)定次數(shù)閾值時(shí),在交互界面中屏蔽該敏感內(nèi)容,并屏蔽所述客戶端。
進(jìn)一步地,其中,所述設(shè)定次數(shù),為一到三次;所述設(shè)定次數(shù)閾值,為三到五次。
進(jìn)一步地,其中,所述自動(dòng)機(jī)搜索樹創(chuàng)建模塊,為:自動(dòng)機(jī)獲取單元及自動(dòng)機(jī)搜索樹創(chuàng)建單元;其中,
所述自動(dòng)機(jī)獲取單元,用于與所述敏感內(nèi)容獲取模塊及自動(dòng)機(jī)搜索樹創(chuàng)建單元相連接,按照ac自動(dòng)機(jī)的機(jī)制將所述預(yù)設(shè)敏感內(nèi)容編譯成自動(dòng)機(jī),根據(jù)預(yù)設(shè)的自動(dòng)機(jī)擴(kuò)展策略獲取所述自動(dòng)機(jī)對應(yīng)的擴(kuò)展自動(dòng)機(jī);
所述自動(dòng)機(jī)搜索樹創(chuàng)建單元,用于與所述自動(dòng)機(jī)獲取單元相連接,將所述自動(dòng)機(jī)及其擴(kuò)展自動(dòng)機(jī)按照預(yù)設(shè)的關(guān)鍵字編碼的字符順序排列,并根據(jù)所述字符順序排列將所述自動(dòng)機(jī)構(gòu)建成自動(dòng)機(jī)搜索樹,并將所述自動(dòng)機(jī)搜索樹存儲(chǔ)至遠(yuǎn)程網(wǎng)絡(luò)請求服務(wù)平臺上。
與現(xiàn)有技術(shù)相比,本發(fā)明的交互過程中智能識別并處理敏感內(nèi)容的方法及系統(tǒng),實(shí)現(xiàn)了如下的有益效果:
(1)本發(fā)明所述的交互過程中智能識別并處理敏感內(nèi)容的方法及系統(tǒng),利用ac自動(dòng)機(jī)建立搜索樹進(jìn)行黃版詞匯搜索、處理,能夠全面地搜索、處理各種黃版詞匯及其變形;建立可對外提供調(diào)用服務(wù)的rpc黃版詞匯搜索服務(wù)系統(tǒng),不需要對每個(gè)交互系統(tǒng)構(gòu)建一個(gè)黃版詞匯處理模塊,對黃版詞匯也能進(jìn)行統(tǒng)一管理,提升了黃版詞匯的處理效率。
(2)本發(fā)明所述的交互過程中智能識別并處理敏感內(nèi)容的方法及系統(tǒng),利用ac自動(dòng)機(jī)建立搜索樹進(jìn)行黃版詞匯搜索、處理,并設(shè)置分級式的敏感內(nèi)容處理方案及自動(dòng)機(jī)搜索樹和新興黃版詞匯數(shù)據(jù)的更新策略,保證了敏感內(nèi)容處理的及時(shí)性和準(zhǔn)確性。
當(dāng)然,實(shí)施本發(fā)明的任一產(chǎn)品必不特定需要同時(shí)達(dá)到以上所述的所有技術(shù)效果。
通過以下參照附圖對本發(fā)明的示例性實(shí)施例的詳細(xì)描述,本發(fā)明的其它特征及其優(yōu)點(diǎn)將會(huì)變得清楚。
附圖說明
被結(jié)合在說明書中并構(gòu)成說明書的一部分的附圖示出了本發(fā)明的實(shí)施例,并且連同其說明一起用于解釋本發(fā)明的原理。
圖1為本發(fā)明實(shí)施例1中所述交互過程中智能識別并處理敏感內(nèi)容的方法的流程示意圖;
圖2為本發(fā)明實(shí)施例2中所述交互過程中智能識別并處理敏感內(nèi)容的方法的流程示意圖;
圖3為本發(fā)明實(shí)施例3中所述交互過程中智能識別并處理敏感內(nèi)容的系統(tǒng)的結(jié)構(gòu)示意圖;
圖4為本發(fā)明實(shí)施例4中所述交互過程中智能識別并處理敏感內(nèi)容的系統(tǒng)的結(jié)構(gòu)示意圖。
具體實(shí)施方式
現(xiàn)在將參照附圖來詳細(xì)描述本發(fā)明的各種示例性實(shí)施例。應(yīng)注意到:除非另外具體說明,否則在這些實(shí)施例中闡述的部件和步驟的相對布置、數(shù)字表達(dá)式和數(shù)值不限制本發(fā)明的范圍。
以下對至少一個(gè)示例性實(shí)施例的描述實(shí)際上僅僅是說明性的,決不作為對本發(fā)明及其應(yīng)用或使用的任何限制。
對于相關(guān)領(lǐng)域普通技術(shù)人員已知的技術(shù)、方法和設(shè)備可能不作詳細(xì)討論,但在適當(dāng)情況下,所述技術(shù)、方法和設(shè)備應(yīng)當(dāng)被視為說明書的一部分。
在這里示出和討論的所有例子中,任何具體值應(yīng)被解釋為僅僅是示例性的,而不是作為限制。因此,示例性實(shí)施例的其它例子可以具有不同的值。
應(yīng)注意到:相似的標(biāo)號和字母在下面的附圖中表示類似項(xiàng),因此,一旦某一項(xiàng)在一個(gè)附圖中被定義,則在隨后的附圖中不需要對其進(jìn)行進(jìn)一步討論。
實(shí)施例1
如圖1所示,為本實(shí)施例所述交互過程中智能識別并處理敏感內(nèi)容的方法的流程示意圖,本實(shí)施例提供了一種集中智能化處理交互過程中黃版敏感內(nèi)容的方法,該方法包括如下的步驟:
步驟101、接收預(yù)設(shè)敏感內(nèi)容,按照ac自動(dòng)機(jī)的機(jī)制將預(yù)設(shè)敏感內(nèi)容編譯成自動(dòng)機(jī);將自動(dòng)機(jī)按照預(yù)設(shè)的關(guān)鍵字編碼的字符順序排列,并根據(jù)字符順序排列將自動(dòng)機(jī)構(gòu)建成自動(dòng)機(jī)搜索樹,并將自動(dòng)機(jī)搜索樹存儲(chǔ)至遠(yuǎn)程網(wǎng)絡(luò)請求服務(wù)平臺上。
ac自動(dòng)機(jī)(aho-corasick),是一種基于自動(dòng)機(jī)原理的字符串匹配算法,如圖1所示,其基本工作原理為:首先將特征字符串(如病毒特征庫、過濾關(guān)鍵字等)編譯成自動(dòng)機(jī),從狀態(tài)0開始,逐字讀入待匹配內(nèi)容,每次讀入一個(gè)字符時(shí),檢查當(dāng)前狀態(tài)是否有對應(yīng)字符的跳轉(zhuǎn)箭頭,若有,則跳到此跳轉(zhuǎn)對應(yīng)的下一狀態(tài),若沒有,則跳回到狀態(tài)0。有一些狀態(tài)被標(biāo)記為匹配狀態(tài),如果進(jìn)入這個(gè)狀態(tài)代表匹配成功。將用戶的交互內(nèi)容以關(guān)鍵字編碼的字符形式進(jìn)行順序組合后能夠體現(xiàn)出該交互內(nèi)容的詞匯組合。
將敏感詞匯集中存儲(chǔ)在遠(yuǎn)程網(wǎng)絡(luò)請求服務(wù)平臺上進(jìn)行管理,通過遠(yuǎn)程網(wǎng)絡(luò)請求服務(wù)平臺連接各個(gè)交互服務(wù)平臺,有利于保證敏感詞匯標(biāo)準(zhǔn)的統(tǒng)一性和網(wǎng)絡(luò)信息的一致性。
步驟102、接收客戶端的交互內(nèi)容,解析交互內(nèi)容得到交互字符,通過遠(yuǎn)程服務(wù)協(xié)議在自動(dòng)機(jī)搜索樹中逐字讀入交互字符,通過交互字符遍歷自動(dòng)機(jī)搜索樹得到交互內(nèi)容中的敏感內(nèi)容。
如果遍歷自動(dòng)機(jī)搜索樹后沒得到任何敏感內(nèi)容,對該交互不做任何干涉,僅獲取客戶端的交互內(nèi)容進(jìn)行記錄,以便后續(xù)使用。
步驟103、搜索客戶端的歷史交互記錄,得到敏感內(nèi)容出現(xiàn)的次數(shù),結(jié)合預(yù)先設(shè)置的敏感內(nèi)容處理策略,對客戶端執(zhí)行相應(yīng)的處理操作。
可選地,搜索客戶端在最近一段時(shí)間內(nèi)的交互記錄,該一段時(shí)間可以是1個(gè)月到1年內(nèi)。因?yàn)榫W(wǎng)絡(luò)語言更新?lián)Q代速度很快,如果不對記錄交互記錄的時(shí)間段加以限制,可能會(huì)對敏感內(nèi)容處理造成較大的誤差。
步驟104、基于當(dāng)前的字符順序排列,根據(jù)敏感內(nèi)容更新自動(dòng)機(jī)搜索樹。
本次搜索得到的敏感內(nèi)容可能成為之后敏感內(nèi)容搜索的基礎(chǔ)自動(dòng)機(jī)字符,利用交互過程中搜索出的敏感內(nèi)容本身更新可以更好地完善自動(dòng)機(jī)搜索樹。
步驟105、將更新后的自動(dòng)機(jī)搜索樹及敏感內(nèi)容對應(yīng)的處理策略存儲(chǔ)至遠(yuǎn)程網(wǎng)絡(luò)請求服務(wù)平臺上。
通過存儲(chǔ)敏感內(nèi)容對應(yīng)的處理策略,可以為其它交互平臺上相應(yīng)敏感詞匯或者相似敏感詞匯的處理提供依據(jù),甚至可以智能化綜合各個(gè)交互平臺的敏感內(nèi)容處理策略得到該敏感內(nèi)容的處理標(biāo)準(zhǔn)。
步驟106、統(tǒng)計(jì)交互字符在交互過程中出現(xiàn)的次數(shù),在交互字符在交互過程中出現(xiàn)的次數(shù)大于或等于敏感次數(shù)時(shí),將交互字符反饋至管理端口;接收管理端口的敏感內(nèi)容指令,并根據(jù)敏感內(nèi)容指令將交互字符更新至自動(dòng)機(jī)搜索樹中。
實(shí)施例2
如圖2所示,為本實(shí)施例所述交互過程中智能識別并處理敏感內(nèi)容的方法的流程示意圖,本實(shí)施例是在上述實(shí)施例1基礎(chǔ)上提供的一種優(yōu)選實(shí)施例,該方法包括如下步驟:
步驟201、接收預(yù)設(shè)敏感內(nèi)容,按照ac自動(dòng)機(jī)的機(jī)制將預(yù)設(shè)敏感內(nèi)容編譯成自動(dòng)機(jī),根據(jù)預(yù)設(shè)的自動(dòng)機(jī)擴(kuò)展策略獲取自動(dòng)機(jī)對應(yīng)的擴(kuò)展自動(dòng)機(jī)。
可選地,自動(dòng)機(jī)擴(kuò)展策略可以是:詞匯的中文、拼音、中文拼音首字母、英文、英文首字母、變形詞等。
步驟202、將自動(dòng)機(jī)及其擴(kuò)展自動(dòng)機(jī)按照預(yù)設(shè)的關(guān)鍵字編碼的字符順序排列,并根據(jù)字符順序排列將自動(dòng)機(jī)構(gòu)建成自動(dòng)機(jī)搜索樹,并將自動(dòng)機(jī)搜索樹存儲(chǔ)至遠(yuǎn)程網(wǎng)絡(luò)請求服務(wù)平臺上。
步驟203、接收客戶端的交互內(nèi)容,解析交互內(nèi)容得到交互字符,通過遠(yuǎn)程服務(wù)協(xié)議在自動(dòng)機(jī)搜索樹中逐字讀入交互字符,通過交互字符遍歷自動(dòng)機(jī)搜索樹得到交互內(nèi)容中的敏感內(nèi)容。
步驟204、搜索客戶端的歷史交互記錄,得到敏感內(nèi)容出現(xiàn)的次數(shù),結(jié)合預(yù)先設(shè)置的敏感內(nèi)容處理策略,對客戶端執(zhí)行相應(yīng)的處理操作。
步驟205、敏感內(nèi)容出現(xiàn)次數(shù)小于或等于設(shè)定次數(shù)時(shí),在交互界面中屏蔽該敏感內(nèi)容,并向客戶端發(fā)送警示消息;敏感內(nèi)容出現(xiàn)次數(shù)大于設(shè)定次數(shù)且小于或等于設(shè)定次數(shù)閾值時(shí),在交互界面中屏蔽該敏感內(nèi)容,并將客戶端屏蔽預(yù)設(shè)時(shí)間;敏感內(nèi)容出現(xiàn)次數(shù)大于設(shè)定次數(shù)閾值時(shí),在交互界面中屏蔽該敏感內(nèi)容,并屏蔽客戶端。
可選地,設(shè)定次數(shù),進(jìn)一步為一到三次;設(shè)定次數(shù)閾值,進(jìn)一步為三到五次。
步驟206、基于當(dāng)前的字符順序排列,根據(jù)敏感內(nèi)容更新自動(dòng)機(jī)搜索樹。
步驟207、將更新后的自動(dòng)機(jī)搜索樹及敏感內(nèi)容對應(yīng)的處理策略存儲(chǔ)至遠(yuǎn)程網(wǎng)絡(luò)請求服務(wù)平臺上。
步驟208、統(tǒng)計(jì)交互字符在交互過程中出現(xiàn)的次數(shù),在交互字符在交互過程中出現(xiàn)的次數(shù)大于或等于敏感次數(shù)時(shí),將交互字符反饋至管理端口;接收管理端口的敏感內(nèi)容指令,并根據(jù)敏感內(nèi)容指令將交互字符更新至自動(dòng)機(jī)搜索樹中。
實(shí)施例3
如圖3所示,為本實(shí)施例所述交互過程中智能識別并處理敏感內(nèi)容的系統(tǒng)的結(jié)構(gòu)示意圖,本實(shí)施例所述系統(tǒng)用于實(shí)施上述實(shí)施例中所述交互過程中智能識別并處理敏感內(nèi)容的方法,該系統(tǒng)包括:自動(dòng)機(jī)搜索樹創(chuàng)建模塊301、敏感內(nèi)容獲取模塊302、敏感內(nèi)容處理模塊303、自動(dòng)機(jī)搜索樹更新模塊304及敏感內(nèi)容處理策略存儲(chǔ)模塊305。
其中,自動(dòng)機(jī)搜索樹創(chuàng)建模塊301與敏感內(nèi)容獲取模塊302相連接,用于接收預(yù)設(shè)敏感內(nèi)容,按照ac自動(dòng)機(jī)的機(jī)制將預(yù)設(shè)敏感內(nèi)容編譯成自動(dòng)機(jī);將自動(dòng)機(jī)按照預(yù)設(shè)的關(guān)鍵字編碼的字符順序排列,并根據(jù)字符順序排列將自動(dòng)機(jī)構(gòu)建成自動(dòng)機(jī)搜索樹,并將自動(dòng)機(jī)搜索樹存儲(chǔ)至遠(yuǎn)程網(wǎng)絡(luò)請求服務(wù)平臺上。
敏感內(nèi)容獲取模塊302與自動(dòng)機(jī)搜索樹創(chuàng)建模塊301及敏感內(nèi)容處理模塊303相連接,用于接收客戶端的交互內(nèi)容,解析交互內(nèi)容得到交互字符,通過遠(yuǎn)程服務(wù)協(xié)議在自動(dòng)機(jī)搜索樹中逐字讀入交互字符,通過交互字符遍歷自動(dòng)機(jī)搜索樹得到交互內(nèi)容中的敏感內(nèi)容。
敏感內(nèi)容處理模塊303與敏感內(nèi)容獲取模塊302及自動(dòng)機(jī)搜索樹更新模塊304相連接,用于搜索客戶端的歷史交互記錄,得到敏感內(nèi)容出現(xiàn)的次數(shù),結(jié)合預(yù)先設(shè)置的敏感內(nèi)容處理策略,對客戶端執(zhí)行相應(yīng)的處理操作。
自動(dòng)機(jī)搜索樹更新模塊304與敏感內(nèi)容處理模塊303及敏感內(nèi)容處理策略存儲(chǔ)模塊305相連接,用于基于當(dāng)前的字符順序排列,根據(jù)敏感內(nèi)容更新自動(dòng)機(jī)搜索樹。
敏感內(nèi)容處理策略存儲(chǔ)模塊305與自動(dòng)機(jī)搜索樹更新模塊304相連接,用于將更新后的自動(dòng)機(jī)搜索樹及敏感內(nèi)容對應(yīng)的處理策略存儲(chǔ)至遠(yuǎn)程網(wǎng)絡(luò)請求服務(wù)平臺上。
上述系統(tǒng)進(jìn)一步包括:預(yù)設(shè)敏感內(nèi)容更新模塊306,用于與自動(dòng)機(jī)搜索樹創(chuàng)建模塊301相連接,統(tǒng)計(jì)交互字符在交互過程中出現(xiàn)的次數(shù),在交互字符在交互過程中出現(xiàn)的次數(shù)大于或等于敏感次數(shù)時(shí),將交互字符反饋至管理端口;接收管理端口的敏感內(nèi)容指令,并根據(jù)敏感內(nèi)容指令將交互字符更新至自動(dòng)機(jī)搜索樹中。
實(shí)施例4
如圖4所示,為本實(shí)施例所述交互過程中智能識別并處理敏感內(nèi)容的系統(tǒng)的結(jié)構(gòu)示意圖,本實(shí)施例是在上述實(shí)施例3基礎(chǔ)上提供的一種優(yōu)選實(shí)施例,該系統(tǒng)包括:自動(dòng)機(jī)搜索樹創(chuàng)建模塊401、敏感內(nèi)容獲取模塊402、敏感內(nèi)容處理模塊403、自動(dòng)機(jī)搜索樹更新模塊404及敏感內(nèi)容處理策略存儲(chǔ)模塊405。
其中,自動(dòng)機(jī)搜索樹創(chuàng)建模塊401進(jìn)一步為:自動(dòng)機(jī)獲取單元411及自動(dòng)機(jī)搜索樹創(chuàng)建單元412。
自動(dòng)機(jī)獲取單元411,用于與敏感內(nèi)容獲取模塊402及自動(dòng)機(jī)搜索樹創(chuàng)建單元412相連接,按照ac自動(dòng)機(jī)的機(jī)制將預(yù)設(shè)敏感內(nèi)容編譯成自動(dòng)機(jī),根據(jù)預(yù)設(shè)的自動(dòng)機(jī)擴(kuò)展策略獲取自動(dòng)機(jī)對應(yīng)的擴(kuò)展自動(dòng)機(jī)。
自動(dòng)機(jī)搜索樹創(chuàng)建單元412,用于與自動(dòng)機(jī)獲取單元411相連接,將自動(dòng)機(jī)及其擴(kuò)展自動(dòng)機(jī)按照預(yù)設(shè)的關(guān)鍵字編碼的字符順序排列,并根據(jù)字符順序排列將自動(dòng)機(jī)構(gòu)建成自動(dòng)機(jī)搜索樹,并將自動(dòng)機(jī)搜索樹存儲(chǔ)至遠(yuǎn)程網(wǎng)絡(luò)請求服務(wù)平臺上。
敏感內(nèi)容獲取模塊402與自動(dòng)機(jī)搜索樹創(chuàng)建模塊401及敏感內(nèi)容處理模塊403相連接,用于接收客戶端的交互內(nèi)容,解析交互內(nèi)容得到交互字符,通過遠(yuǎn)程服務(wù)協(xié)議在自動(dòng)機(jī)搜索樹中逐字讀入交互字符,通過交互字符遍歷自動(dòng)機(jī)搜索樹得到交互內(nèi)容中的敏感內(nèi)容。
敏感內(nèi)容處理模塊403與敏感內(nèi)容獲取模塊402及自動(dòng)機(jī)搜索樹更新模塊404相連接,用于搜索客戶端的歷史交互記錄,得到敏感內(nèi)容出現(xiàn)的次數(shù),結(jié)合預(yù)先設(shè)置的敏感內(nèi)容處理策略,對客戶端執(zhí)行相應(yīng)的處理操作。
敏感內(nèi)容處理模塊403,進(jìn)一步為:敏感內(nèi)容出現(xiàn)的次數(shù)統(tǒng)計(jì)單元431、第一敏感內(nèi)容處理單元432、第二敏感內(nèi)容處理單元433及第三敏感內(nèi)容處理單元434.
其中,敏感內(nèi)容出現(xiàn)的次數(shù)統(tǒng)計(jì)單元431,用于與敏感內(nèi)容獲取模塊402、自動(dòng)機(jī)搜索樹更新模塊404及第一敏感內(nèi)容處理單元432相連接,搜索客戶端的歷史交互記錄,得到敏感內(nèi)容出現(xiàn)的次數(shù)。
第一敏感內(nèi)容處理單元432,用于與敏感內(nèi)容出現(xiàn)的次數(shù)統(tǒng)計(jì)單元431及第二敏感內(nèi)容處理單元433相連接,在敏感內(nèi)容出現(xiàn)次數(shù)小于或等于設(shè)定次數(shù)時(shí),在交互界面中屏蔽該敏感內(nèi)容,并向客戶端發(fā)送警示消息。
第二敏感內(nèi)容處理單元433,用于與第一敏感內(nèi)容處理單元432及第三敏感內(nèi)容處理單元434相連接,敏感內(nèi)容出現(xiàn)次數(shù)大于設(shè)定次數(shù)且小于或等于設(shè)定次數(shù)閾值時(shí),在交互界面中屏蔽該敏感內(nèi)容,并將客戶端屏蔽預(yù)設(shè)時(shí)間。
第三敏感內(nèi)容處理單元434,用于與第二敏感內(nèi)容處理單元433相連接,敏感內(nèi)容出現(xiàn)次數(shù)大于設(shè)定次數(shù)閾值時(shí),在交互界面中屏蔽該敏感內(nèi)容,并屏蔽客戶端。
可選地,設(shè)定次數(shù),進(jìn)一步為一到三次;設(shè)定次數(shù)閾值,進(jìn)一步為三到五次。
自動(dòng)機(jī)搜索樹更新模塊404與敏感內(nèi)容處理模塊403及敏感內(nèi)容處理策略存儲(chǔ)模塊405相連接,用于基于當(dāng)前的字符順序排列,根據(jù)敏感內(nèi)容更新自動(dòng)機(jī)搜索樹。
敏感內(nèi)容處理策略存儲(chǔ)模塊405與自動(dòng)機(jī)搜索樹更新模塊404相連接,用于將更新后的自動(dòng)機(jī)搜索樹及敏感內(nèi)容對應(yīng)的處理策略存儲(chǔ)至遠(yuǎn)程網(wǎng)絡(luò)請求服務(wù)平臺上。
上述系統(tǒng)進(jìn)一步包括:預(yù)設(shè)敏感內(nèi)容更新模塊406,用于與自動(dòng)機(jī)搜索樹創(chuàng)建模塊401相連接,統(tǒng)計(jì)交互字符在交互過程中出現(xiàn)的次數(shù),在交互字符在交互過程中出現(xiàn)的次數(shù)大于或等于敏感次數(shù)時(shí),將交互字符反饋至管理端口;接收管理端口的敏感內(nèi)容指令,并根據(jù)敏感內(nèi)容指令將交互字符更新至自動(dòng)機(jī)搜索樹中。
通過上述實(shí)施例可知,本發(fā)明的交互過程中智能識別并處理敏感內(nèi)容的方法及系統(tǒng),達(dá)到了如下的有益效果:
(1)本發(fā)明所述的交互過程中智能識別并處理敏感內(nèi)容的方法及系統(tǒng),利用ac自動(dòng)機(jī)建立搜索樹進(jìn)行黃版詞匯搜索、處理,能夠全面地搜索、處理各種黃版詞匯及其變形;建立可對外提供調(diào)用服務(wù)的rpc黃版詞匯搜索服務(wù)系統(tǒng),不需要對每個(gè)交互系統(tǒng)構(gòu)建一個(gè)黃版詞匯處理模塊,對黃版詞匯也能進(jìn)行統(tǒng)一管理,提升了黃版詞匯的處理效率。
(2)本發(fā)明所述的交互過程中智能識別并處理敏感內(nèi)容的方法及系統(tǒng),利用ac自動(dòng)機(jī)建立搜索樹進(jìn)行黃版詞匯搜索、處理,并設(shè)置分級式的敏感內(nèi)容處理方案及自動(dòng)機(jī)搜索樹和新興黃版詞匯數(shù)據(jù)的更新策略,保證了敏感內(nèi)容處理的及時(shí)性和準(zhǔn)確性。
本領(lǐng)域內(nèi)的技術(shù)人員應(yīng)明白,本發(fā)明的實(shí)施例可提供為方法、裝置、或計(jì)算機(jī)程序產(chǎn)品。因此,本發(fā)明可采用完全硬件實(shí)施例、完全軟件實(shí)施例、或結(jié)合軟件和硬件方面的實(shí)施例的形式。而且,本發(fā)明可采用在一個(gè)或多個(gè)其中包含有計(jì)算機(jī)可用程序代碼的計(jì)算機(jī)可用存儲(chǔ)介質(zhì)(包括但不限于磁盤存儲(chǔ)器、cd-rom、光學(xué)存儲(chǔ)器等)上實(shí)施的計(jì)算機(jī)程序產(chǎn)品的形式。
雖然已經(jīng)通過例子對本發(fā)明的一些特定實(shí)施例進(jìn)行了詳細(xì)說明,但是本領(lǐng)域的技術(shù)人員應(yīng)該理解,以上例子僅是為了進(jìn)行說明,而不是為了限制本發(fā)明的范圍。本領(lǐng)域的技術(shù)人員應(yīng)該理解,可在不脫離本發(fā)明的范圍和精神的情況下,對以上實(shí)施例進(jìn)行修改。本發(fā)明的范圍由所附權(quán)利要求來限定。