欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

計算機系統(tǒng)涉密文件知識庫搜索方法

文檔序號:6399904閱讀:728來源:國知局
專利名稱:計算機系統(tǒng)涉密文件知識庫搜索方法
計算機系統(tǒng)涉密文件知識庫搜索方法
技術(shù)領(lǐng)域
本發(fā)明涉及對計算機系統(tǒng)中存放的已知涉密文件進行搜索的方法。
背景技術(shù)
信息技術(shù)的快速發(fā)展大力推動了計算機網(wǎng)絡(luò)與信息系統(tǒng)在政府及企事業(yè)單位的廣泛應(yīng)用,為辦公及生產(chǎn)建設(shè)的電子化、自動化、信息化提供了堅實保障,同時,各種涉密信息也大量以電子文件的形式存儲于計算機系統(tǒng)中。這種涉密文件在非涉密算機上的存在,給信息安全帶來了嚴(yán)重隱患,尤其在政府內(nèi)網(wǎng)(公安、檢察院、法院、政府、財稅、電力等等領(lǐng)域)環(huán)境中,防止涉密文件的非法存儲可以說已成為國家安全保密工作的重中之重。雖然國家對涉密文件有明確的文件格式和標(biāo)識規(guī)定,但是在實際應(yīng)用當(dāng)中有許多單位和部門為了便于自己內(nèi)部管理和使用,都會有自己的一套涉密信息文件格式和標(biāo)識規(guī)定,有的甚至沒有明確的格式和標(biāo)識,甚至還有一些管理人員為了逃避涉密檢查故意破壞涉密信息文件格式,打亂涉密信息文件內(nèi)容。那么面對這些問題如何準(zhǔn)確的發(fā)現(xiàn)這些涉密信息文件,對這些文件進行保護和管理已近成為當(dāng)前解決涉密信息泄露的關(guān)鍵問題。目前的涉密文件搜索程序主要采用關(guān)鍵字檢查和涉密文件格式檢查方法,這樣的檢查方式存在一定的漏洞和缺陷。1、搜索結(jié)果準(zhǔn)確性不高。許多非涉密文件中會存在同樣的關(guān)鍵字,導(dǎo)致關(guān)鍵字檢查準(zhǔn)確度不高。2、搜索結(jié)果完整性不強。許多部門和單位對涉密文件格式要求不嚴(yán)格,導(dǎo)致采用涉密文件格式檢查方式會遺漏很多涉密文檔。3、搜索方式抗干擾性弱。如果人為的破壞一些涉密文檔的格式,比如刪除涉密文件文件頭內(nèi)容、打亂涉密文 件段落次序,那么原本能通過涉密文件格式特征搜索方式能發(fā)現(xiàn)的涉密文檔可能就會發(fā)現(xiàn)不了。4、對已知涉密文件缺乏有效管理。對發(fā)布的涉密信息文件缺乏原始記錄追蹤,t匕如發(fā)布部門、發(fā)布時間、發(fā)布人等。導(dǎo)致無法對涉密文檔整個生命周期進行有效的管理。一但發(fā)生泄密,無法取證,無法追查其泄密源頭。

發(fā)明內(nèi)容本發(fā)明的目的就是解決現(xiàn)有技術(shù)中的問題,提出一種計算機系統(tǒng)涉密文件知識庫搜索方法,能夠更加完整且準(zhǔn)確地發(fā)現(xiàn)計算機系統(tǒng)中存放的涉密文件并且加以有效的管理,以便于消除信息安全保密工作的隱患。為實現(xiàn)上述目的,本發(fā)明提出了一種計算機系統(tǒng)涉密文件知識庫搜索方法,依次包括以下步驟:a)敏感信息文件整理:由各部門涉密信息管理員把涉密文件通過錄入模塊導(dǎo)入到系統(tǒng)內(nèi),并通過錄入模塊錄入文件來源管理信息;b) “學(xué)習(xí)”涉密文件:由學(xué)習(xí)模塊提取涉密文件的多個內(nèi)容特征信息,并將學(xué)習(xí)到的內(nèi)容特征信息與a)步驟中錄入的文件來源管理信息相對應(yīng)保存到知識庫中;學(xué)習(xí)到的多個內(nèi)容特征信息分成基礎(chǔ)特征信息和附加特征信息兩類;d)解析掃描對象:對計算機進行檢查時,依照不同計算機文件類型、版本,解析出文檔的內(nèi)容信息;e)搜索匹配步驟:將解析出的文檔對象的內(nèi)容信息與知識庫中的內(nèi)容特征信息通過“設(shè)定策略組合”進行匹配掃描,生成該掃描對象文件是否被判斷為涉密文件的結(jié)果;f)展現(xiàn)步驟:在頁面上展現(xiàn)被判斷為涉密文件的文件名、文件存放路徑、文件來
源管理信息。作為優(yōu)選,所述a)敏感信息文件整理步驟中文件來源管理信息包括文件名、發(fā)布部門、發(fā)布人和發(fā)布時間;f)展現(xiàn)步驟中展現(xiàn)的文件來源管理信息也包括文件名、發(fā)布部門、發(fā)布人和發(fā)布時間。作為優(yōu)選,所述b) “學(xué)習(xí)”涉密文件步驟中提取內(nèi)容特征信息時,內(nèi)容特征信息的提取位置和提取大小按 照“設(shè)定提取策略”來進行提取。作為優(yōu)選,所述“設(shè)定提取策略”是提取位置至少有3處,提取大小少于50個字節(jié)。作為優(yōu)選,在d)解析掃描對象步驟之前還設(shè)有c)文件系統(tǒng)恢復(fù)步驟:通過文件系統(tǒng)恢復(fù),將刪除的文件進行復(fù)原,然后再進入d)解析掃描對象步驟。作為優(yōu)選,所述d)解析掃描對象步驟中采用二進制碼解析方法、字符解析方法、文字解析方法相結(jié)合。作為優(yōu)選,所述e)搜索匹配步驟中“設(shè)定策略組合”是指根據(jù)匹配文檔對象的內(nèi)容大小、段落數(shù)量和內(nèi)容特征信息,設(shè)定匹配規(guī)律,根據(jù)匹配算法來計算出匹配對象文檔的匹配相似度。作為優(yōu)選,所述e)搜索匹配步驟中匹配相似度采用基礎(chǔ)特征信息與附加特征信息相結(jié)合的方式來判斷,基礎(chǔ)特征信息用來初次過濾明顯不符合的匹配文檔對象,附加特征信息用來提高搜索精度,相似度分?jǐn)?shù)越高說明匹配程度越高。作為優(yōu)選,所述f)展現(xiàn)步驟中按相似度排序展現(xiàn),根據(jù)相似度分?jǐn)?shù)分成相似、可疑和準(zhǔn)確三類進行直觀顯示,展現(xiàn)的文件來源管理信息包括發(fā)布部門、發(fā)布人和發(fā)布時間。本發(fā)明的有益效果:本發(fā)明通過對已知涉密信息文檔的內(nèi)容特征學(xué)習(xí),解決了特定行業(yè)和特定部門自定義一些涉密文件格式,和一些人為的破壞涉密文件格式內(nèi)容而導(dǎo)致通過傳統(tǒng)的關(guān)鍵字檢查和涉密文件格式檢查發(fā)現(xiàn)不了的難題,同時引入了涉密文件的生命周期信息管理方式,能夠準(zhǔn)確定位涉密信息文檔泄密源頭。本方法搜索的針對性強、準(zhǔn)確性大大提高,對于減少涉密信息泄露風(fēng)險,提高涉密文件管理能力,加強信息安全保護具有重要作用。本發(fā)明的特征及優(yōu)點將通過實施例結(jié)合附圖進行詳細(xì)說明。

圖1是本發(fā)明計算機系統(tǒng)涉密文件知識庫搜索方法的流程框圖。圖2是本發(fā)明計算機系統(tǒng)涉密文件知識庫搜索方法的具體流程圖。
具體實施方式
參閱圖1、2,計算機系統(tǒng)涉密文件知識庫搜索方法,依次包括以下步驟:I)、進行文件信息整理,判斷是否是涉密信息文檔,如果是涉密信息文檔,則進入學(xué)習(xí)涉密文件步驟;如果不是涉密信息文檔,則結(jié)束程序。2)、將涉密文件導(dǎo)入系統(tǒng)內(nèi),并錄入文件來源管理信息,同時,提取涉密文件的內(nèi)容特征信息,將內(nèi)容特征信息與文件來源管理信息相對應(yīng)關(guān)聯(lián)后保存到知識庫中。3)由用戶設(shè)定搜索范圍,選擇精確搜索或全面搜索及是否進行文件系統(tǒng)恢復(fù)搜索。4)、若設(shè)定為進行文件系統(tǒng)恢復(fù)搜索,則對搜索范圍內(nèi)的刪除文件進行恢復(fù),每一個恢復(fù)文件均做標(biāo)記。5)、開始遍歷搜索范圍內(nèi)的每一個文件,若文件為壓縮文件,則先進行解壓縮。6)、解析文檔內(nèi)容及格式信息,根據(jù)不同的文件類型,使用相應(yīng)的方法進行解析。如TXT文檔,直接讀取文本內(nèi)容及相應(yīng)格式信息;如WORD文檔,按照其結(jié)構(gòu)化存儲格式進行結(jié)構(gòu)解析,提取其中文本、圖片及相應(yīng)格式信息,或特定地針對W0RD2007及以上版本,在解壓縮之后解析其包含的XML標(biāo)簽,取得文本、圖片及相應(yīng)格式信息;對TOF等其他文件類型,采用相關(guān)方法解析出文本、圖片及相應(yīng)格式信息。7)、判斷是否符合涉密文件知識庫特征,如果符合的,則進行界面顯示及記錄,如果不符合的,則進入是否符合涉密文件格式特征的判斷。8)對文檔內(nèi)容及能展現(xiàn)在打印稿中的格式特征按照涉密文件樣式進行聯(lián)合查找匹配,判斷該文件是否符合涉密文件特征。9)、若判斷符合涉密文件特征,則進入到第9步判斷是否為涉密文件教學(xué)例文,若不符合涉密文件特征,則判斷是否搜索完成。10)、判斷是否為涉密文件教學(xué)例文,若不是涉密文件教學(xué)例文,則為搜索到涉密文件,進行界面顯示并記錄;若是涉密文件教學(xué)例文,則判斷是否搜索完成。11)、對搜索到的涉密文件進行界面顯示。12)、若設(shè)定備份,則將涉密文件及文件存放路徑備份到U盤隱藏扇區(qū)中,同時將原文件粉碎。并轉(zhuǎn)到判斷是否搜索完成。13)、判斷是否搜索完成,若未搜索完成,則選擇下一文件,并轉(zhuǎn)到第5步進行判斷,若搜索完成,則結(jié)束流程。本實施例通過已知涉密信息文檔的內(nèi)容特征學(xué)習(xí),解決了特定行業(yè)和特定部門自定義一些涉密文件格式,和一些人為的破壞涉密文件格式內(nèi)容而導(dǎo)致通過傳統(tǒng)的關(guān)鍵字檢查和涉密文件格式檢查發(fā)現(xiàn)不了的難題,同時引入了涉密文件的生命周期信息管理方式,能夠準(zhǔn)確定位涉密信息文檔泄密源頭,使風(fēng)險可靠。本方法搜索的針對性強、準(zhǔn)確性大大提高,對于減少涉密信息泄露風(fēng)險,提高涉密文件管理能力,加強信息安全保護具有重要作用。本發(fā)明可應(yīng)用于政府內(nèi)網(wǎng)(公安、檢察院、法院、政府、財稅、電力、等等領(lǐng)域)、企事業(yè)單位的計算機安全保密檢查工作,對(非涉密)計算機上存儲涉密文件進行檢查。本發(fā)明提出的計算機系統(tǒng)涉密文件搜索方法可做成單機版和網(wǎng)絡(luò)版兩種形式,更多的應(yīng)用于網(wǎng)絡(luò)版的內(nèi)網(wǎng)安全管理系統(tǒng)軟件中,實現(xiàn)網(wǎng)絡(luò)化、高效率、實時性監(jiān)測、檢查,為信息安全工作提供強有力技術(shù)手段。
雖然本發(fā)明已通過參考優(yōu)選的實施例進行了圖示和描述,但是,本專業(yè)普通技術(shù)人員應(yīng)當(dāng)了解,在權(quán)利要求書的范圍內(nèi),可作形式和細(xì)節(jié)上的各種各樣變化。
權(quán)利要求
1.計算機系統(tǒng)涉密文件知識庫搜索方法,其特征在于:依次包括以下步驟: a)敏感信息文件整理:由各部門涉密信息管理員把涉密文件通過錄入模塊導(dǎo)入到系統(tǒng)內(nèi),并通過錄入模塊錄入文件來源管理信息; b)“學(xué)習(xí)”涉密文件:由學(xué)習(xí)模塊提取涉密文件的多個內(nèi)容特征信息,并將學(xué)習(xí)到的內(nèi)容特征信息與a)步驟中錄入的文件來源管理信息相對應(yīng)保存到知識庫中;學(xué)習(xí)到的多個內(nèi)容特征信息分成基礎(chǔ)特征信息和附加特征信息兩類; d)解析掃描對象:對計算機進行檢查時,依照不同計算機文件類型、版本,解析出文檔的內(nèi)容信息; e)搜索匹配步驟:將解析出的文檔對象的內(nèi)容信息與知識庫中的內(nèi)容特征信息通過“設(shè)定策略組合”進行匹配掃描,生成該掃描對象文件是否被判斷為涉密文件的結(jié)果; f)展現(xiàn)步驟:在頁面上展現(xiàn)被判斷為涉密文件的文件名、文件存放路徑、文件來源管理信息。
2.如權(quán)利要求1所述的計算機系統(tǒng)涉密文件知識庫搜索方法,其特征在于:所述a)敏感信息文件整理步驟中文件來源管理信息包括文件名、發(fā)布部門、發(fā)布人和發(fā)布時間;f)展現(xiàn)步驟中展現(xiàn)的文件來源管理信息也包括文件名、發(fā)布部門、發(fā)布人和發(fā)布時間。
3.如權(quán)利要求1所述的計算機系統(tǒng)涉密文件知識庫搜索方法,其特征在于:所述b)“學(xué)習(xí)”涉密文件步驟中提取內(nèi)容特征信息時,內(nèi)容特征信息的提取位置和提取大小按照“設(shè)定提取策略”來進行提取。
4.如權(quán)利要求3所述的計算機系統(tǒng)涉密文件知識庫搜索方法,其特征在于:所述“設(shè)定提取策略”是提取位置至少有3處,提取大小少于50個字節(jié)。
5.如權(quán)利要求1所述的計算機系統(tǒng)涉密文件知識庫搜索方法,其特征在于:在d)解析掃描對象步驟之前還設(shè)有c)文件系統(tǒng)恢復(fù)步驟:通過文件系統(tǒng)恢復(fù),將刪除的文件進行復(fù)原,然后再進入d)解析掃描對象步驟。
6.如權(quán)利要求1所述的計算機系統(tǒng)涉密文件知識庫搜索方法,其特征在于:所述d)解析掃描對象步驟中采用二進制碼解析方法、字符解析方法、文字解析方法相結(jié)合。
7.如權(quán)利要求1-6中任一項所述的計算機系統(tǒng)涉密文件知識庫搜索方法,其特征在于:所述e)搜索匹配步驟中“設(shè)定策略組合”是指根據(jù)匹配文檔對象的內(nèi)容大小、段落數(shù)量和內(nèi)容特征信息,設(shè)定匹配規(guī)律,根據(jù)匹配算法來計算出匹配對象文檔的匹配相似度。
8.如權(quán)利要求7所述的計算機系統(tǒng)涉密文件知識庫搜索方法,其特征在于:所述e)搜索匹配步驟中匹配相似度采用基礎(chǔ)特征信息與附加特征信息相結(jié)合的方式來判斷,基礎(chǔ)特征信息用來初次過濾明顯不符合的匹配文檔對象,附加特征信息用來提高搜索精度,相似度分?jǐn)?shù)越高說明匹配程度越高。
9.如權(quán)利要求8所述的計算機系統(tǒng)涉密文件知識庫搜索方法,其特征在于:所述f)展現(xiàn)步驟中按相似度排序展現(xiàn),根據(jù)相似度分?jǐn)?shù)分成相似、可疑和準(zhǔn)確三類進行直觀顯示,展現(xiàn)的文件來源管理信息包括發(fā)布部門、發(fā)布人和發(fā)布時間。
全文摘要
本發(fā)明公開了一種計算機系統(tǒng)涉密文件知識庫搜索方法,依次包括a)敏感信息文件整理、b)“學(xué)習(xí)”涉密文件、c)文件系統(tǒng)恢復(fù)、d)解析掃描對象、e)搜索匹配步驟和f)展現(xiàn)等步驟。本發(fā)明通過對已知涉密信息文檔的內(nèi)容特征學(xué)習(xí),解決了特定行業(yè)和特定部門自定義一些涉密文件格式,和一些人為的破壞涉密文件格式內(nèi)容而導(dǎo)致通過傳統(tǒng)的關(guān)鍵字檢查和涉密文件格式檢查發(fā)現(xiàn)不了的難題,同時引入了涉密文件的生命周期信息管理方式,能夠準(zhǔn)確定位涉密信息文檔泄密源頭。本方法搜索的針對性強、準(zhǔn)確性大大提高,對于減少涉密信息泄露風(fēng)險,提高涉密文件管理能力,加強信息安全保護具有重要作用。
文檔編號G06F17/30GK103164515SQ20131006697
公開日2013年6月19日 申請日期2013年3月1日 優(yōu)先權(quán)日2013年3月1日
發(fā)明者傅如毅 申請人:傅如毅
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
绿春县| 屯昌县| 日照市| 芮城县| 株洲县| 玉环县| 治多县| 桃源县| 南雄市| 慈溪市| 新化县| 阿瓦提县| 洛川县| 老河口市| 临江市| 邢台市| 余江县| 巴彦淖尔市| 长白| 邛崃市| 中超| 喀什市| 台中县| 永春县| 田阳县| 五莲县| 安陆市| 桃园县| 贵阳市| 彩票| 赤水市| 通州市| 安吉县| 赣榆县| 武汉市| 合肥市| 弋阳县| 嘉黎县| 二连浩特市| 顺平县| 壤塘县|