欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種檢測網(wǎng)絡(luò)上傳文件中敏感軌跡的方法

文檔序號:6635136閱讀:206來源:國知局
一種檢測網(wǎng)絡(luò)上傳文件中敏感軌跡的方法
【專利摘要】本發(fā)明公開了一種檢測網(wǎng)絡(luò)上傳文件中敏感軌跡的方法。該方法先通過設(shè)置敏感軌跡集,在上傳文件中查找敏感詞匯并將按順序提取敏感詞匯及其當前所處字符位置,將提取的敏感詞匯按提取順序構(gòu)成待檢測敏感軌跡,將待檢測敏感軌跡與敏感軌跡集中的每條敏感軌跡逐一匹配;當匹配成功后,再判斷相鄰兩個敏感詞匯之間的字符間距是否小于等于字符間距閾值M來確定待檢測敏感軌跡是否為該上傳文件中的敏感軌跡,可以對敏感詞匯進行精確查找以確定待檢測敏感軌跡是否為該上傳文件中的敏感軌跡。
【專利說明】一種檢測網(wǎng)絡(luò)上傳文件中敏感軌跡的方法

【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及安全文件上傳領(lǐng)域,特別是一種檢測網(wǎng)絡(luò)上傳文件中敏感軌跡的方法。

【背景技術(shù)】
[0002]隨著網(wǎng)絡(luò)的開發(fā),用戶可以在網(wǎng)上自由發(fā)表言論,雖然這樣可以獲得更全面的信息,但這樣也使得網(wǎng)絡(luò)上一些不好的言論,嚴重的甚至?xí)鹂只?,這樣對于網(wǎng)絡(luò)中上傳的文件要進行嚴格的監(jiān)控。
[0003]如果各個終端服務(wù)器需要人工進行文件內(nèi)容篩查,這樣不僅效率很低而且浪費人力資源,為了提高效率,目前,各個終端常用的方法為在服務(wù)器上設(shè)置關(guān)鍵詞,通過對上傳文件內(nèi)容進行關(guān)鍵詞屏蔽以達到監(jiān)控的效果。
[0004]如申請?zhí)枴?00710308404.7 ”發(fā)明名稱“針對不良短消息的關(guān)鍵詞防范方法”本發(fā)明提供了一種針對不良短消息的關(guān)鍵詞防范方法,包括如下步驟:(I)運營商或者業(yè)務(wù)提供商預(yù)先提供一份針對不良短消息的關(guān)鍵詞列表,關(guān)鍵詞列表的每個條目包括兩項內(nèi)容:關(guān)鍵詞、關(guān)鍵詞的出現(xiàn)概率;(2)用戶獲得關(guān)鍵詞列表的全部內(nèi)容或者一個子集;(3)將已獲得的關(guān)鍵詞合并到用戶手機內(nèi)部的關(guān)鍵詞列表中;(4)用戶手機根據(jù)關(guān)鍵詞列表直接過濾包含關(guān)鍵詞的短消息。本發(fā)明有效補充了原有“關(guān)鍵詞方法”在實用性方面存在的不足。
[0005]申請?zhí)枴?01210479196.8”發(fā)明名稱“基于關(guān)鍵詞權(quán)值的文本過濾方法”本申請?zhí)峁┝艘环N基于關(guān)鍵詞權(quán)值的文本過濾方法,該方法包括以下步驟:計算關(guān)鍵詞的權(quán)值;以及基于所計算出的關(guān)鍵詞的權(quán)值對文本進行過濾;其中,計算關(guān)鍵詞權(quán)值的步驟包括:判斷所述關(guān)鍵詞是否是全新關(guān)鍵詞,如果是,則計算歷史判定數(shù)據(jù)中的正確判定數(shù)據(jù)的條數(shù)和錯誤判定數(shù)據(jù)的條數(shù)、以及包含所述關(guān)鍵詞的正確判定數(shù)據(jù)的條數(shù)和錯誤判定數(shù)據(jù)的條數(shù);以及計算所述關(guān)鍵詞的權(quán)值。此外,本申請還提供了一種基于關(guān)鍵詞權(quán)值的文本過濾系統(tǒng)。
[0006]雖然通過單一關(guān)鍵詞和關(guān)鍵詞的權(quán)值可以有效的對不良信息進行屏蔽,但這樣也使得一些上傳文件中僅存在單一關(guān)鍵詞且不屬于不良消息的文件也同樣被屏蔽。


【發(fā)明內(nèi)容】

[0007]本發(fā)明所解決的技術(shù)問題在于提供一種檢測網(wǎng)絡(luò)上傳文件中敏感軌跡的方法,該方法利用敏感軌跡匹配來實現(xiàn)對上傳文件中的敏感詞匯進行驗證后確定上傳文件中是否包含敏感軌跡。
[0008]實現(xiàn)本發(fā)明目的的技術(shù)解決方案為:一種檢測網(wǎng)絡(luò)上傳文件中敏感軌跡的方法,具體包括以下步驟:
步驟1、設(shè)置敏感詞匯庫,用于存儲敏感詞匯;
步驟2、根據(jù)敏感詞匯庫中的敏感詞匯設(shè)置敏感軌跡集,其中每一條敏感軌跡由至少兩個敏感詞匯組成,且敏感詞匯具有有向性,相鄰兩個敏感詞匯之間的字符間距閾值為M,M為正整數(shù);
步驟3、監(jiān)控上傳文件,查找上傳文件中是否包含敏感詞匯,若包含則執(zhí)行步驟4,否則該上傳文件中不包含敏感軌跡;
步驟4、判斷該上傳文件中包含的敏感詞匯的數(shù)量,當僅包含一個敏感詞匯時,則該上傳文件中不包含敏感軌跡;當包含兩個或兩個以上敏感詞匯時,執(zhí)行步驟5 ;
步驟5、從該上傳文件中按順序提取敏感詞匯及其當前所處字符位置,將提取的敏感詞匯按照順序形成待檢測敏感軌跡后執(zhí)行步驟6 ;
步驟6、將步驟5中獲得的待檢測敏感軌跡與步驟2中的敏感軌跡集中每一條敏感軌跡進行匹配,當與其中一條敏感軌跡匹配成功后,執(zhí)行步驟7 ;
步驟7、判斷待檢測敏感軌跡中相鄰兩個敏感詞匯之間的字符間距是否小于等于字符間距閾值M,若小于等于,則判定該待檢測敏感軌跡即為該上傳文件中的敏感軌跡;否則,判定該上傳文件中不包含敏感軌跡。
[0009]進一步地優(yōu)選方案,本發(fā)明檢測網(wǎng)絡(luò)上傳文件中敏感軌跡的方法中,字符間距閾值M為20。
[0010]進一步地優(yōu)選方案,本發(fā)明檢測網(wǎng)絡(luò)上傳文件中敏感軌跡的方法中,步驟5中按順序提取為從文件第一個字符開始查找,提取屬于敏感詞匯庫中存儲的敏感詞匯。
[0011]進一步地優(yōu)選方案,本發(fā)明檢測網(wǎng)絡(luò)上傳文件中敏感軌跡的方法中,步驟5將提取的敏感詞匯按照順序形成待檢測敏感軌跡,具體為將敏感詞匯按照提取的先后順序形成待檢測敏感軌跡。
[0012]進一步地優(yōu)選方案,本發(fā)明檢測網(wǎng)絡(luò)上傳文件中敏感軌跡的方法中,將步驟5中獲得的待檢測敏感軌跡與步驟2中的敏感軌跡集中每一條敏感軌跡進行匹配,具體為:敏感軌跡中包含待檢測敏感軌跡即為該待檢測敏感軌跡與敏感軌跡匹配成功。
[0013]本發(fā)明與現(xiàn)有技術(shù)相比,其顯著優(yōu)點:
(I)通過設(shè)置敏感軌跡集,在上傳文件中查找敏感詞匯并將按順序提取敏感詞匯及其當前所處字符位置,將提取的敏感詞匯按提取順序構(gòu)成待檢測敏感軌跡,將待檢測敏感軌跡與敏感軌跡集中的每條敏感軌跡逐一匹配可以提高關(guān)聯(lián)關(guān)鍵詞的查找速度。
[0014](2)當匹配成功后,再判斷相鄰兩個敏感詞匯之間的字符間距是否小于等于字符間距閾值M來確定待檢測敏感軌跡是否為該上傳文件中的敏感軌跡,可以對敏感詞匯進行精確查找以確定待檢測敏感軌跡是否為該上傳文件中的敏感軌跡。

【具體實施方式】
[0015]本發(fā)明一種檢測網(wǎng)絡(luò)上傳文件中敏感軌跡的方法,具體包括以下步驟:
步驟1、設(shè)置敏感詞匯庫,用于存儲敏感詞匯;
步驟2、根據(jù)敏感詞匯庫中的敏感詞匯設(shè)置敏感軌跡集,其中每一條敏感軌跡由至少兩個敏感詞匯組成,且敏感詞匯具有有向性,相鄰兩個敏感詞匯之間的字符間距閾值為M,M為正整數(shù);
步驟3、監(jiān)控上傳文件,查找上傳文件中是否包含敏感詞匯,若包含則執(zhí)行步驟4,否則該上傳文件中不包含敏感軌跡; 步驟4、判斷該上傳文件中包含的敏感詞匯的數(shù)量,當僅包含一個敏感詞匯時,則該上傳文件中不包含敏感軌跡;當包含兩個或兩個以上敏感詞匯時,執(zhí)行步驟5 ;
步驟5、從該上傳文件中按順序提取敏感詞匯及其當前所處字符位置,將提取的敏感詞匯按照順序形成待檢測敏感軌跡后執(zhí)行步驟6 ;
步驟6、將步驟5中獲得的待檢測敏感軌跡與步驟2中的敏感軌跡集中每一條敏感軌跡進行匹配,當與其中一條敏感軌跡匹配成功后,執(zhí)行步驟7 ;
步驟7、判斷待檢測敏感軌跡中相鄰兩個敏感詞匯之間的字符間距是否小于等于字符間距閾值M,若小于等于,則判定該待檢測敏感軌跡即為該上傳文件中的敏感軌跡;否則,判定該上傳文件中不包含敏感軌跡。
[0016]本發(fā)明先通過設(shè)置敏感軌跡集,在上傳文件中查找敏感詞匯并將按順序提取敏感詞匯及其當前所處字符位置,將提取的敏感詞匯按提取順序構(gòu)成待檢測敏感軌跡,將待檢測敏感軌跡與敏感軌跡集中的每條敏感軌跡逐一匹配;當匹配成功后,再判斷相鄰兩個敏感詞匯之間的字符間距是否小于等于字符間距閾值M來確定待檢測敏感軌跡是否為該上傳文件中的敏感軌跡,可以對敏感詞匯進行精確查找以確定待檢測敏感軌跡是否為該上傳文件中的敏感軌跡。
[0017]實施例1
一種檢測網(wǎng)絡(luò)上傳文件中敏感軌跡的方法,具體包括以下步驟:
步驟1、設(shè)置敏感詞匯庫,用于存儲敏感詞匯;
步驟2、根據(jù)敏感詞匯庫中的敏感詞匯設(shè)置敏感軌跡集,其中每一條敏感軌跡由至少兩個敏感詞匯組成,且敏感詞匯具有有向性,相鄰兩個敏感詞匯之間的字符間距閾值為20,M為正整數(shù);
步驟3、監(jiān)控上傳文件,查找上傳文件中是否包含敏感詞匯,若包含則執(zhí)行步驟4,否則該上傳文件中不包含敏感軌跡;
步驟4、判斷該上傳文件中包含的敏感詞匯的數(shù)量,當僅包含一個敏感詞匯時,則該上傳文件中不包含敏感軌跡;當包含兩個或兩個以上敏感詞匯時,執(zhí)行步驟5 ;
步驟5、從該上傳文件中按順序提取敏感詞匯及其當前所處字符位置,其中,按順序提取為從文件第一個字符開始查找,提取屬于敏感詞匯庫中存儲的敏感詞匯,將提取的敏感詞匯按照順序形成待檢測敏感軌跡后執(zhí)行步驟6 ;
步驟6、將步驟5中獲得的待檢測敏感軌跡與步驟2中的敏感軌跡集中每一條敏感軌跡進行匹配,其匹配過程為:敏感軌跡中包含待檢測敏感軌跡即為該待檢測敏感軌跡與敏感軌跡匹配成功;當與其中一條敏感軌跡匹配成功后,執(zhí)行步驟7 ;
步驟7、判斷待檢測敏感軌跡中相鄰兩個敏感詞匯之間的字符間距是否小于等于字符間距閾值M,若小于等于,則判定該待檢測敏感軌跡即為該上傳文件中的敏感軌跡;否則,判定該上傳文件中不包含敏感軌跡。
[0018]實施例2
本實施例中敏感詞匯庫包括敏感詞匯:“大爆炸” “南京” “明晚”等;從該敏感詞匯庫中設(shè)置一條敏感軌跡:明晚-南京-大爆炸,這三個敏感詞匯之間的字符間隔閾值為20 ;對網(wǎng)絡(luò)上傳文件I和網(wǎng)絡(luò)上傳文件2分別進行查找,從上傳文件I中查找到“明晚”這個敏感詞匯,由于上傳文件I中僅包括一個敏感詞匯,則認為上傳文件I中不包含敏感軌跡;
從上傳文件2中查找到“南京”“大爆炸”兩個敏感詞匯,按順序提取“南京20”“大爆炸24”,其中,20和24分別表示“南京”和“大爆炸”兩個敏感詞匯在上傳文件2中存儲的字符位置,將這兩個敏感詞匯按提取順序形成待檢測敏感軌跡:南京-大爆炸,將該待檢測敏感軌跡與敏感軌跡進行匹配,由于敏感軌跡中包括該待檢測敏感軌跡,且“南京”和“大爆炸”兩個敏感詞匯在上傳文件2中的字符間隔為4小于字符間隔閾值20 ;則認為該待檢測敏感軌跡為上傳文件2中的敏感軌跡。
[0019]顯然,本發(fā)明的上述實施例僅是為清楚地說明本發(fā)明所作的舉例,而并非是對本發(fā)明的實施方式的限定。對于所屬領(lǐng)域的普通技術(shù)人員來說,在上述說明的基礎(chǔ)上還可以做出其它不同形式的變化或變動。這里無需也無法對所有的實施方式予以窮舉。而這些屬于本發(fā)明的實質(zhì)精神所引伸出的顯而易見的變化或變動仍屬于本發(fā)明的保護范圍。
【權(quán)利要求】
1.一種檢測網(wǎng)絡(luò)上傳文件中敏感軌跡的方法,其特征在于,具體包括以下步驟: 步驟1、設(shè)置敏感詞匯庫,用于存儲敏感詞匯; 步驟2、根據(jù)敏感詞匯庫中的敏感詞匯設(shè)置敏感軌跡集,其中每一條敏感軌跡由至少兩個敏感詞匯組成,且敏感詞匯具有有向性,相鄰兩個敏感詞匯之間的字符間距閾值為1,I為正整數(shù); 步驟3、監(jiān)控上傳文件,查找上傳文件中是否包含敏感詞匯,若包含則執(zhí)行步驟4,否則該上傳文件中不包含敏感軌跡; 步驟4、判斷該上傳文件中包含的敏感詞匯的數(shù)量,當僅包含一個敏感詞匯時,則該上傳文件中不包含敏感軌跡;當包含兩個或兩個以上敏感詞匯時,執(zhí)行步驟5 ; 步驟5、從該上傳文件中按順序提取敏感詞匯及其當前所處字符位置,將提取的敏感詞匯按照順序形成待檢測敏感軌跡后執(zhí)行步驟6 ; 步驟6、將步驟5中獲得的待檢測敏感軌跡與步驟2中的敏感軌跡集中每一條敏感軌跡進行匹配,當與其中一條敏感軌跡匹配成功后,執(zhí)行步驟7 ; 步驟7、判斷待檢測敏感軌跡中相鄰兩個敏感詞匯之間的字符間距是否小于等于字符間距閾值1,若小于等于,則判定該待檢測敏感軌跡即為該上傳文件中的敏感軌跡;否則,判定該上傳文件中不包含敏感軌跡。
2.根據(jù)權(quán)利要求1所述檢測網(wǎng)絡(luò)上傳文件中敏感軌跡的方法,其特征在于,字符間距閾值1為20。
3.根據(jù)權(quán)利要求1所述檢測網(wǎng)絡(luò)上傳文件中敏感軌跡的方法,其特征在于,步驟5中按順序提取為從文件第一個字符開始查找,提取屬于敏感詞匯庫中存儲的敏感詞匯。
4.根據(jù)權(quán)利要求1所述檢測網(wǎng)絡(luò)上傳文件中敏感軌跡的方法,其特征在于,步驟5將提取的敏感詞匯按照順序形成待檢測敏感軌跡,具體為將敏感詞匯按照提取的先后順序形成待檢測敏感軌跡。
5.根據(jù)權(quán)利要求1所述檢測網(wǎng)絡(luò)上傳文件中敏感軌跡的方法,其特征在于,將步驟5中獲得的待檢測敏感軌跡與步驟2中的敏感軌跡集中每一條敏感軌跡進行匹配,具體為:敏感軌跡中包含待檢測敏感軌跡即為該待檢測敏感軌跡與敏感軌跡匹配成功。
【文檔編號】G06F17/27GK104375984SQ201410668759
【公開日】2015年2月25日 申請日期:2014年11月21日 優(yōu)先權(quán)日:2014年11月21日
【發(fā)明者】沈智廣 申請人:無錫科思電子科技有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
南华县| 肃北| 普洱| 高密市| 霍林郭勒市| 隆回县| 集贤县| 威宁| 乌鲁木齐市| 昆山市| 舟山市| 甘孜县| 越西县| 栾川县| 松滋市| 瓦房店市| 江北区| 抚远县| 西林县| 莱州市| 大荔县| 宜君县| 香港| 汝阳县| 黎城县| 翁牛特旗| 乌拉特中旗| 亳州市| 荣昌县| 永兴县| 温宿县| 鲁山县| 榕江县| 海城市| 龙川县| 习水县| 社会| 图片| 加查县| 德阳市| 乌鲁木齐县|