欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

網(wǎng)絡(luò)上傳文件中敏感軌跡的檢測系統(tǒng)的制作方法

文檔序號:6635134閱讀:306來源:國知局
網(wǎng)絡(luò)上傳文件中敏感軌跡的檢測系統(tǒng)的制作方法
【專利摘要】本發(fā)明公開了一種網(wǎng)絡(luò)上傳文件中敏感軌跡的檢測系統(tǒng)。該系統(tǒng)包括敏感詞匯庫、敏感軌跡集、文件監(jiān)控模塊、查找模塊、第一判斷模塊、提取模塊、待檢測敏感軌跡形成模塊、敏感軌跡匹配模塊、第二判斷模塊、敏感軌跡確定模塊,通過設(shè)置敏感軌跡集,在上傳文件中查找敏感詞匯并將按順序提取敏感詞匯及其當(dāng)前所處字符位置,將提取的敏感詞匯按提取順序構(gòu)成待檢測敏感軌跡,將待檢測敏感軌跡與敏感軌跡集中的每條敏感軌跡逐一匹配可以提高關(guān)聯(lián)關(guān)鍵詞的查找速度。
【專利說明】網(wǎng)絡(luò)上傳文件中敏感軌跡的檢測系統(tǒng)

【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及安全文件上傳領(lǐng)域,特別是網(wǎng)絡(luò)上傳文件中敏感軌跡的檢測系統(tǒng)。

【背景技術(shù)】
[0002]隨著網(wǎng)絡(luò)的開發(fā),用戶可以在網(wǎng)上自由發(fā)表言論,雖然這樣可以獲得更全面的信息,但這樣也使得網(wǎng)絡(luò)上一些不好的言論,嚴(yán)重的甚至?xí)鹂只?,這樣對于網(wǎng)絡(luò)中上傳的文件要進(jìn)行嚴(yán)格的監(jiān)控。
[0003]如果各個(gè)終端服務(wù)器需要人工進(jìn)行文件內(nèi)容篩查,這樣不僅效率很低而且浪費(fèi)人力資源,為了提高效率,目前,各個(gè)終端常用的方法為在服務(wù)器上設(shè)置關(guān)鍵詞,通過對上傳文件內(nèi)容進(jìn)行關(guān)鍵詞屏蔽以達(dá)到監(jiān)控的效果。
[0004]如申請?zhí)枴?00710308404.7 ”發(fā)明名稱“針對不良短消息的關(guān)鍵詞防范方法”本發(fā)明提供了一種針對不良短消息的關(guān)鍵詞防范方法,包括如下步驟:(I)運(yùn)營商或者業(yè)務(wù)提供商預(yù)先提供一份針對不良短消息的關(guān)鍵詞列表,關(guān)鍵詞列表的每個(gè)條目包括兩項(xiàng)內(nèi)容:關(guān)鍵詞、關(guān)鍵詞的出現(xiàn)概率;(2)用戶獲得關(guān)鍵詞列表的全部內(nèi)容或者一個(gè)子集;(3)將已獲得的關(guān)鍵詞合并到用戶手機(jī)內(nèi)部的關(guān)鍵詞列表中;(4)用戶手機(jī)根據(jù)關(guān)鍵詞列表直接過濾包含關(guān)鍵詞的短消息。本發(fā)明有效補(bǔ)充了原有“關(guān)鍵詞方法”在實(shí)用性方面存在的不足。
[0005]申請?zhí)枴?01210479196.8”發(fā)明名稱“基于關(guān)鍵詞權(quán)值的文本過濾方法”本申請?zhí)峁┝艘环N基于關(guān)鍵詞權(quán)值的文本過濾方法,該方法包括以下步驟:計(jì)算關(guān)鍵詞的權(quán)值;以及基于所計(jì)算出的關(guān)鍵詞的權(quán)值對文本進(jìn)行過濾;其中,計(jì)算關(guān)鍵詞權(quán)值的步驟包括:判斷所述關(guān)鍵詞是否是全新關(guān)鍵詞,如果是,則計(jì)算歷史判定數(shù)據(jù)中的正確判定數(shù)據(jù)的條數(shù)和錯(cuò)誤判定數(shù)據(jù)的條數(shù)、以及包含所述關(guān)鍵詞的正確判定數(shù)據(jù)的條數(shù)和錯(cuò)誤判定數(shù)據(jù)的條數(shù);以及計(jì)算所述關(guān)鍵詞的權(quán)值。此外,本申請還提供了一種基于關(guān)鍵詞權(quán)值的文本過濾系統(tǒng)。
[0006]雖然通過單一關(guān)鍵詞和關(guān)鍵詞的權(quán)值可以有效的對不良信息進(jìn)行屏蔽,但這樣也使得一些上傳文件中僅存在單一關(guān)鍵詞且不屬于不良消息的文件也同樣被屏蔽。


【發(fā)明內(nèi)容】

[0007]本發(fā)明所解決的技術(shù)問題在于提供一種網(wǎng)絡(luò)上傳文件中敏感軌跡的檢測系統(tǒng),該系統(tǒng)利用敏感軌跡匹配來實(shí)現(xiàn)對上傳文件中的敏感詞匯進(jìn)行驗(yàn)證。
[0008]實(shí)現(xiàn)本發(fā)明目的的技術(shù)解決方案為:本發(fā)明網(wǎng)絡(luò)上傳文件中敏感軌跡的檢測系統(tǒng),具體包括:
敏感詞匯庫,用于存儲敏感詞匯;
敏感軌跡集,用于存儲敏感軌跡,其中每一條敏感軌跡由至少兩個(gè)敏感詞匯組成,且敏感詞匯具有有向性,相鄰兩個(gè)敏感詞匯之間的字符間距閾值為M,M為正整數(shù);
文件監(jiān)控模塊,用于監(jiān)控有文件上傳時(shí)觸發(fā)查找模塊工作; 查找模塊,用于通過查找上傳文件中是否包含敏感詞匯來觸發(fā)第一判斷模塊工作;第一判斷模塊,用于判斷上傳文件中包含的敏感詞匯的數(shù)量至少為兩個(gè)時(shí)觸發(fā)提取模塊工作;
提取模塊,用于從該上傳文件中按順序提取敏感詞匯及其當(dāng)前所處字符位置;
待檢測敏感軌跡形成模塊,用于將提取的敏感詞匯按照順序形成待檢測敏感軌跡;敏感軌跡匹配模塊,用于將待檢測敏感軌跡與敏感軌跡集中每一條敏感軌跡進(jìn)行匹配,并在匹配成功后觸發(fā)第二判斷模塊工作;
第二判斷模塊,用于判斷待檢測敏感軌跡中相鄰兩個(gè)敏感詞匯之間的字符間距是否小于等于字符間距閾值M,并在確定小于等于字符間距閾值M后觸發(fā)敏感軌跡確定模塊工作;敏感軌跡確定模塊,用于經(jīng)敏感軌跡匹配模塊匹配成功且第二判斷模塊確定待檢測敏感軌跡中相鄰兩個(gè)敏感詞匯之間的字符間距小于等于字符間距閾值M下確定待檢測敏感軌跡即為該上傳文件中的敏感軌跡。
[0009]進(jìn)一步的優(yōu)選方案,本發(fā)明網(wǎng)絡(luò)上傳文件中敏感軌跡的檢測系統(tǒng)中,還包括存儲模塊,所述存儲模塊用于存儲敏感詞匯庫和敏感軌跡集。
[0010]進(jìn)一步的優(yōu)選方案,本發(fā)明網(wǎng)絡(luò)上傳文件中敏感軌跡的檢測系統(tǒng)中,提取模塊中按順序提取為從文件第一個(gè)字符開始。
[0011 ] 進(jìn)一步的優(yōu)選方案,本發(fā)明網(wǎng)絡(luò)上傳文件中敏感軌跡的檢測系統(tǒng)中,字符間距閾值M為20。
[0012]進(jìn)一步的優(yōu)選方案,本發(fā)明網(wǎng)絡(luò)上傳文件中敏感軌跡的檢測系統(tǒng)中,敏感軌跡匹配模塊的匹配過程:敏感軌跡中包含待檢測敏感軌跡即為該待檢測敏感軌跡與敏感軌跡匹配成功。
[0013]本發(fā)明與現(xiàn)有技術(shù)相比,其顯著優(yōu)點(diǎn):
(I)通過設(shè)置敏感軌跡集,在上傳文件中查找敏感詞匯并將按順序提取敏感詞匯及其當(dāng)前所處字符位置,將提取的敏感詞匯按提取順序構(gòu)成待檢測敏感軌跡,將待檢測敏感軌跡與敏感軌跡集中的每條敏感軌跡逐一匹配可以提高關(guān)聯(lián)關(guān)鍵詞的查找速度。
[0014](2)當(dāng)匹配成功后,再判斷相鄰兩個(gè)敏感詞匯之間的字符間距是否小于等于字符間距閾值M來確定待檢測敏感軌跡是否為該上傳文件中的敏感軌跡,可以對敏感詞匯進(jìn)行精確查找以確定待檢測敏感軌跡是否為該上傳文件中的敏感軌跡。

【具體實(shí)施方式】
[0015]本發(fā)明網(wǎng)絡(luò)上傳文件中敏感軌跡的檢測系統(tǒng),具體包括:
敏感詞匯庫,用于存儲敏感詞匯;
敏感軌跡集,用于存儲敏感軌跡,其中每一條敏感軌跡由至少兩個(gè)敏感詞匯組成,且敏感詞匯具有有向性,相鄰兩個(gè)敏感詞匯之間的字符間距閾值為M,M為正整數(shù);
文件監(jiān)控模塊,用于監(jiān)控有文件上傳時(shí)觸發(fā)查找模塊工作;
查找模塊,用于通過查找上傳文件中是否包含敏感詞匯來觸發(fā)第一判斷模塊工作;第一判斷模塊,用于判斷上傳文件中包含的敏感詞匯的數(shù)量至少為兩個(gè)時(shí)觸發(fā)提取模塊工作;
提取模塊,用于從該上傳文件中按順序提取敏感詞匯及其當(dāng)前所處字符位置; 待檢測敏感軌跡形成模塊,用于將提取的敏感詞匯按照順序形成待檢測敏感軌跡;敏感軌跡匹配模塊,用于將待檢測敏感軌跡與敏感軌跡集中每一條敏感軌跡進(jìn)行匹配,并在匹配成功后觸發(fā)第二判斷模塊工作;
第二判斷模塊,用于判斷待檢測敏感軌跡中相鄰兩個(gè)敏感詞匯之間的字符間距是否小于等于字符間距閾值M,并在確定小于等于字符間距閾值M后觸發(fā)敏感軌跡確定模塊工作;敏感軌跡確定模塊,用于經(jīng)敏感軌跡匹配模塊匹配成功且第二判斷模塊確定待檢測敏感軌跡中相鄰兩個(gè)敏感詞匯之間的字符間距小于等于字符間距閾值M下確定待檢測敏感軌跡即為該上傳文件中的敏感軌跡。
實(shí)施例
[0016]本發(fā)明網(wǎng)絡(luò)上傳文件中敏感軌跡的檢測系統(tǒng),具體包括:
敏感詞匯庫,用于存儲敏感詞匯;
敏感軌跡集,用于存儲敏感軌跡,其中每一條敏感軌跡由至少兩個(gè)敏感詞匯組成,且敏感詞匯具有有向性,相鄰兩個(gè)敏感詞匯之間的字符間距閾值為20 ;
存儲模塊,所述存儲模塊用于存儲敏感詞匯庫和敏感軌跡集;
文件監(jiān)控模塊,用于監(jiān)控有文件上傳時(shí)觸發(fā)查找模塊工作;
查找模塊,用于通過查找上傳文件中是否包含敏感詞匯來觸發(fā)第一判斷模塊工作;第一判斷模塊,用于判斷上傳文件中包含的敏感詞匯的數(shù)量至少為兩個(gè)時(shí)觸發(fā)提取模塊工作;
提取模塊,用于從該上傳文件中按順序提取敏感詞匯及其當(dāng)前所處字符位置,所述按順序提取為從文件第一個(gè)字符開始;
待檢測敏感軌跡形成模塊,用于將提取的敏感詞匯按照順序形成待檢測敏感軌跡;敏感軌跡匹配模塊,用于將待檢測敏感軌跡與敏感軌跡集中每一條敏感軌跡進(jìn)行匹配,并在匹配成功后觸發(fā)第二判斷模塊工作,所述匹配成功為敏感軌跡中包含待檢測敏感軌跡即為該待檢測敏感軌跡與敏感軌跡匹配成功;
第二判斷模塊,用于判斷待檢測敏感軌跡中相鄰兩個(gè)敏感詞匯之間的字符間距是否小于等于字符間距閾值20,并在確定小于等于字符間距閾值20后觸發(fā)敏感軌跡確定模塊工作;
敏感軌跡確定模塊,用于經(jīng)敏感軌跡匹配模塊匹配成功且第二判斷模塊確定待檢測敏感軌跡中相鄰兩個(gè)敏感詞匯之間的字符間距小于等于字符間距閾值M下確定待檢測敏感軌跡即為該上傳文件中的敏感軌跡。
[0017]為了進(jìn)一步描述本發(fā)明網(wǎng)絡(luò)上傳文件中敏感軌跡的檢測系統(tǒng),提供一種檢測網(wǎng)絡(luò)上傳文件中敏感軌跡的方法,具體包括以下步驟:
步驟1、設(shè)置敏感詞匯庫,用于存儲敏感詞匯;
步驟2、根據(jù)敏感詞匯庫中的敏感詞匯設(shè)置敏感軌跡集,其中每一條敏感軌跡由至少兩個(gè)敏感詞匯組成,且敏感詞匯具有有向性,相鄰兩個(gè)敏感詞匯之間的字符間距閾值為M,M為正整數(shù);
步驟3、監(jiān)控上傳文件,查找上傳文件中是否包含敏感詞匯,若包含則執(zhí)行步驟4,否則該上傳文件中不包含敏感軌跡; 步驟4、判斷該上傳文件中包含的敏感詞匯的數(shù)量,當(dāng)僅包含一個(gè)敏感詞匯時(shí),則該上傳文件中不包含敏感軌跡;當(dāng)包含兩個(gè)或兩個(gè)以上敏感詞匯時(shí),執(zhí)行步驟5 ;
步驟5、從該上傳文件中按順序提取敏感詞匯及其當(dāng)前所處字符位置,將提取的敏感詞匯按照順序形成待檢測敏感軌跡后執(zhí)行步驟6 ;
步驟6、將步驟5中獲得的待檢測敏感軌跡與步驟2中的敏感軌跡集中每一條敏感軌跡進(jìn)行匹配,當(dāng)與其中一條敏感軌跡匹配成功后,執(zhí)行步驟7 ;
步驟7、判斷待檢測敏感軌跡中相鄰兩個(gè)敏感詞匯之間的字符間距是否小于等于字符間距閾值M,若小于等于,則判定該待檢測敏感軌跡即為該上傳文件中的敏感軌跡;否則,判定該上傳文件中不包含敏感軌跡。
[0018]顯然,本發(fā)明的上述實(shí)施例僅是為清楚地說明本發(fā)明所作的舉例,而并非是對本發(fā)明的實(shí)施方式的限定。對于所屬領(lǐng)域的普通技術(shù)人員來說,在上述說明的基礎(chǔ)上還可以做出其它不同形式的變化或變動(dòng)。這里無需也無法對所有的實(shí)施方式予以窮舉。而這些屬于本發(fā)明的實(shí)質(zhì)精神所引伸出的顯而易見的變化或變動(dòng)仍屬于本發(fā)明的保護(hù)范圍。
【權(quán)利要求】
1.一種網(wǎng)絡(luò)上傳文件中敏感軌跡的檢測系統(tǒng),其特征在于,具體包括: 敏感詞匯庫,用于存儲敏感詞匯; 敏感軌跡集,用于存儲敏感軌跡,其中每一條敏感軌跡由至少兩個(gè)敏感詞匯組成,且敏感詞匯具有有向性,相鄰兩個(gè)敏感詞匯之間的字符間距閾值為1,I為正整數(shù); 文件監(jiān)控模塊,用于監(jiān)控有文件上傳時(shí)觸發(fā)查找模塊工作; 查找模塊,用于通過查找上傳文件中是否包含敏感詞匯來觸發(fā)第一判斷模塊工作;第一判斷模塊,用于判斷上傳文件中包含的敏感詞匯的數(shù)量至少為兩個(gè)時(shí)觸發(fā)提取模塊工作; 提取模塊,用于從該上傳文件中按順序提取敏感詞匯及其當(dāng)前所處字符位置; 待檢測敏感軌跡形成模塊,用于將提取的敏感詞匯按照順序形成待檢測敏感軌跡;敏感軌跡匹配模塊,用于將待檢測敏感軌跡與敏感軌跡集中每一條敏感軌跡進(jìn)行匹配,并在匹配成功后觸發(fā)第二判斷模塊工作;第二判斷模塊,用于判斷待檢測敏感軌跡中相鄰兩個(gè)敏感詞匯之間的字符間距是否小于等于字符間距閾值1,并在確定小于等于字符間距閾值1后觸發(fā)敏感軌跡確定模塊工作;敏感軌跡確定模塊,用于經(jīng)敏感軌跡匹配模塊匹配成功且第二判斷模塊確定待檢測敏感軌跡中相鄰兩個(gè)敏感詞匯之間的字符間距小于等于字符間距閾值1下確定待檢測敏感軌跡即為該上傳文件中的敏感軌跡。
2.根據(jù)權(quán)利要求1所述網(wǎng)絡(luò)上傳文件中敏感軌跡的檢測系統(tǒng),其特征在于,還包括存儲模塊,所述存儲模塊用于存儲敏感詞匯庫和敏感軌跡集。
3.根據(jù)權(quán)利要求1所述網(wǎng)絡(luò)上傳文件中敏感軌跡的檢測系統(tǒng),其特征在于,提取模塊中按順序提取為從文件第一個(gè)字符開始。
4.根據(jù)權(quán)利要求1所述網(wǎng)絡(luò)上傳文件中敏感軌跡的檢測系統(tǒng),其特征在于,字符間距閾值1為20。
5.根據(jù)權(quán)利要求1所述網(wǎng)絡(luò)上傳文件中敏感軌跡的檢測系統(tǒng),其特征在于,敏感軌跡匹配模塊的匹配過程:敏感軌跡中包含待檢測敏感軌跡即為該待檢測敏感軌跡與敏感軌跡匹配成功。
【文檔編號】G06F17/27GK104375983SQ201410668638
【公開日】2015年2月25日 申請日期:2014年11月21日 優(yōu)先權(quán)日:2014年11月21日
【發(fā)明者】沈智廣 申請人:無錫科思電子科技有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1
壤塘县| 纳雍县| 万源市| 灵山县| 招远市| 中宁县| 任丘市| 波密县| 山东省| 沐川县| 胶南市| 泰宁县| 渭南市| 浑源县| 荆门市| 广元市| 江安县| 且末县| 乌恰县| 华坪县| 临清市| 扶风县| 神木县| 大石桥市| 怀来县| 长沙县| 苍南县| 沅陵县| 固安县| 宜兰县| 景泰县| 牙克石市| 泸溪县| 耿马| 北碚区| 五家渠市| 宜君县| 桐乡市| 保定市| 原平市| 隆林|