實(shí)現(xiàn)文件系統(tǒng)索引建立的方法及實(shí)現(xiàn)文件系統(tǒng)查詢的方法
【專利摘要】本發(fā)明涉及一種實(shí)現(xiàn)文件系統(tǒng)索引建立的方法,其中包括基于文件信息為所述的文件系統(tǒng)中各個(gè)文件建立一元數(shù)據(jù),各個(gè)所述的元數(shù)據(jù)存儲(chǔ)所對(duì)應(yīng)的文件的屬性和屬性值信息;從文件系統(tǒng)的元數(shù)據(jù)集合中抽取屬性形成屬性集合;基于所述的屬性集合中各個(gè)屬性建立對(duì)應(yīng)的屬性索引文件得到屬性和屬性索引文件的集合共同形成文件系統(tǒng)索引,本發(fā)明還涉及一種基于所述的實(shí)現(xiàn)文件系統(tǒng)索引建立的方法實(shí)現(xiàn)文件系統(tǒng)查詢的方法。采用該種實(shí)現(xiàn)文件系統(tǒng)索引建立的方法及實(shí)現(xiàn)文件系統(tǒng)查詢的方法,實(shí)現(xiàn)面向?qū)嶋H的取證搜索需求,文件系統(tǒng)索引快速建立,文件快速查詢,在索引建立時(shí)充分考慮取證人員的主觀索引需求,利于存儲(chǔ)多值屬性,具有更廣泛的應(yīng)用范圍。
【專利說明】實(shí)現(xiàn)文件系統(tǒng)索引建立的方法及實(shí)現(xiàn)文件系統(tǒng)查詢的方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及數(shù)據(jù)查詢【技術(shù)領(lǐng)域】,尤其涉及建立文件系統(tǒng)索引【技術(shù)領(lǐng)域】,具體是指 一種實(shí)現(xiàn)文件系統(tǒng)索引建立的方法及實(shí)現(xiàn)文件系統(tǒng)查詢的方法。
【背景技術(shù)】
[0002] 在實(shí)際的取證操作過程中,取證分析人員的活動(dòng)依賴大量的基于文件系統(tǒng)的搜索 行為。在取證分析人員進(jìn)行搜索時(shí),主要關(guān)注文件的修改時(shí)間、文件的真實(shí)類型、文件的刪 除狀態(tài)、文件的特征等類型信息。
[0003] 目前已有的取證相關(guān)軟件對(duì)于文件系統(tǒng)的索引主要采取兩種方案進(jìn)行建立:一種 方案是遍歷整個(gè)磁盤,提取每個(gè)文件的屬性信息,建立一個(gè)多維的數(shù)據(jù)庫表,將文件的各個(gè) 屬性信息都存儲(chǔ)到數(shù)據(jù)庫的表中然后建立索引。另外一種方案是根據(jù)磁盤上文件系統(tǒng)的部 分索引信息建立零碎的索引,當(dāng)用戶執(zhí)行搜索操作時(shí)再進(jìn)行整個(gè)磁盤的遍歷,逐步完善建 立整個(gè)文件系統(tǒng)的索引信息。
[0004] 這兩種方案對(duì)于實(shí)際取證分析人員的搜索行為都存在一定的缺陷,第一種方案 對(duì)于已經(jīng)建立的索引信息進(jìn)行動(dòng)態(tài)擴(kuò)充的代價(jià)很大,不利于存儲(chǔ)多值的屬性,在建立索引 的時(shí)候無法參考取證分析人員的主觀索引建立需求,并且基于文件內(nèi)容的搜索難以提供加 速。第二種方案無法預(yù)先處理好所有的文件,在實(shí)際搜索過程中花費(fèi)時(shí)間過長(zhǎng),同時(shí)也存在 了第一種方案的缺陷。
【發(fā)明內(nèi)容】
[0005] 本發(fā)明的目的是克服了上述現(xiàn)有技術(shù)的缺點(diǎn),提供了一種能夠?qū)崿F(xiàn)面向?qū)嶋H的取 證搜索需求、文件系統(tǒng)索引快速建立、文件快速查詢、具有更廣泛應(yīng)用范圍的實(shí)現(xiàn)文件系統(tǒng) 索引建立的方法及實(shí)現(xiàn)文件系統(tǒng)查詢的方法。
[0006] 為了實(shí)現(xiàn)上述目的,本發(fā)明的實(shí)現(xiàn)文件系統(tǒng)索引建立的方法及實(shí)現(xiàn)文件系統(tǒng)查詢 的方法具有如下構(gòu)成:
[0007] 該實(shí)現(xiàn)文件系統(tǒng)索引建立的方法,其主要特點(diǎn)是,所述的方法包括以下步驟:
[0008] (1-1)基于文件信息為所述的文件系統(tǒng)中各個(gè)文件建立一元數(shù)據(jù),各個(gè)所述的元 數(shù)據(jù)存儲(chǔ)所對(duì)應(yīng)的文件的屬性和屬性值信息;
[0009] (1-2)從文件系統(tǒng)的元數(shù)據(jù)集合中抽取屬性形成屬性集合;
[0010] (1-3)基于所述的屬性集合中各個(gè)屬性建立對(duì)應(yīng)的屬性索引文件得到屬性和屬性 索引文件的集合共同形成文件系統(tǒng)索引。
[0011] 較佳地,所述的元數(shù)據(jù)為基于XML格式的元數(shù)據(jù),所述的元數(shù)據(jù)集合為XML文檔。
[0012] 較佳地,所述的屬性包括路徑、創(chuàng)建時(shí)間、修改信息、原始類型和刪除狀態(tài)。
[0013] 較佳地,所述的屬性還包括文件名稱、文件關(guān)鍵詞和占用空間。
[0014] 本發(fā)明還涉及一種基于所述的實(shí)現(xiàn)文件系統(tǒng)索引建立的方法實(shí)現(xiàn)文件系統(tǒng)查詢 的方法,其特征在于,所述的實(shí)現(xiàn)文件系統(tǒng)索引建立的方法包括以下步驟:
[0015] (2-1)將對(duì)文件系統(tǒng)的查詢分散為對(duì)各個(gè)屬性的查詢;
[0016] (2-2)對(duì)各個(gè)屬性的屬性索引文件進(jìn)行查詢;
[0017] (2-3)將各個(gè)屬性的查詢結(jié)果進(jìn)行交集運(yùn)算得到符合查詢條件的元數(shù)據(jù)文件;
[0018] (2-4)根據(jù)查詢得到的元數(shù)據(jù)文件返回所對(duì)應(yīng)的真實(shí)文件。
[0019] 較佳地,所述的基于XML格式的元數(shù)據(jù),所述的元數(shù)據(jù)集合為XML文檔。
[0020] 較佳地,所述的屬性包括路徑、創(chuàng)建時(shí)間、修改信息、原始類型和刪除狀態(tài)。
[0021] 較佳地,所述的屬性還包括文件名稱、文件關(guān)鍵詞和占用空間。
[0022] 采用了該發(fā)明中的實(shí)現(xiàn)文件系統(tǒng)索引建立的方法及實(shí)現(xiàn)文件系統(tǒng)查詢的方法,具 有如下有益效果:
[0023] 提供了一種實(shí)現(xiàn)文件系統(tǒng)索引建立的方法及實(shí)現(xiàn)文件系統(tǒng)查詢的方法,面向?qū)嶋H 的取證搜索需求,文件系統(tǒng)索引快速建立,文件快速查詢,在索引建立時(shí)充分考慮取證人員 的主觀索引需求,利于存儲(chǔ)多值屬性,具有更廣泛的應(yīng)用范圍。
【專利附圖】
【附圖說明】
[0024] 圖1為本發(fā)明的實(shí)現(xiàn)文件系統(tǒng)索引建立的方法的流程圖。
[0025] 圖2為本發(fā)明的實(shí)現(xiàn)文件系統(tǒng)索引建立的方法應(yīng)用于具體實(shí)施例的流程圖。
【具體實(shí)施方式】
[0026] 為了能夠更清楚地描述本發(fā)明的技術(shù)內(nèi)容,下面結(jié)合具體實(shí)施例來進(jìn)行進(jìn)一步的 描述。
[0027] 本發(fā)明提出一種新型的實(shí)現(xiàn)文件系統(tǒng)索引建立及實(shí)現(xiàn)文件系統(tǒng)查詢的方法,主要 面向?qū)嶋H的取證搜索需求。
[0028] -種實(shí)現(xiàn)文件系統(tǒng)索引建立的方法,包括以下步驟:
[0029] (1-1)基于文件信息為所述的文件系統(tǒng)中各個(gè)文件建立一元數(shù)據(jù),各個(gè)所述的元 數(shù)據(jù)存儲(chǔ)所對(duì)應(yīng)的文件的屬性和屬性值信息;
[0030] (1-2)從文件系統(tǒng)的元數(shù)據(jù)集合中抽取屬性形成屬性集合;
[0031] (1-3)基于所述的屬性集合中各個(gè)屬性建立對(duì)應(yīng)的屬性索引文件得到屬性和屬性 索引文件的集合共同形成文件系統(tǒng)索引。
[0032] 在一種較佳的實(shí)施例中,所述的元數(shù)據(jù)為基于XML格式的元數(shù)據(jù),所述的元數(shù)據(jù) 集合為XML文檔,在實(shí)際應(yīng)用中,還可以采用其他數(shù)據(jù)格式和文件格式進(jìn)行存儲(chǔ)。
[0033] 在一種較佳的實(shí)施例中,所述的屬性包括路徑、創(chuàng)建時(shí)間、修改信息、原始類型和 刪除狀態(tài)。
[0034] 在一種較佳的實(shí)施例中,所述的屬性還包括文件名稱、文件關(guān)鍵詞和占用空間。還 可以包括其他可以作為索引的屬性類別。
[0035] 本發(fā)明還涉及一種基于所述的實(shí)現(xiàn)文件系統(tǒng)索引建立的方法實(shí)現(xiàn)文件系統(tǒng)查詢 的方法,包括以下步驟:
[0036] (2-1)將對(duì)文件系統(tǒng)的查詢分散為對(duì)各個(gè)屬性的查詢;
[0037] (2-2)對(duì)各個(gè)屬性的屬性索引文件進(jìn)行查詢;
[0038] (2-3)將各個(gè)屬性的查詢結(jié)果進(jìn)行交集運(yùn)算得到符合查詢條件的元數(shù)據(jù)文件;
[0039] (2-4)根據(jù)查詢得到的元數(shù)據(jù)文件返回所對(duì)應(yīng)的真實(shí)文件。
[0040] 下面以一具體實(shí)施例來進(jìn)一步說明本發(fā)明的實(shí)現(xiàn)文件系統(tǒng)索引建立的方法及實(shí) 現(xiàn)文件系統(tǒng)查詢的方法。
[0041] 本發(fā)明在對(duì)文件系統(tǒng)進(jìn)行索引建立時(shí),首先定義每個(gè)文件的元信息。元信息基于 XML格式,具備豐富的擴(kuò)展能力,如下所示:
[0042]
【權(quán)利要求】
1. 一種實(shí)現(xiàn)文件系統(tǒng)索引建立的方法,其特征在于,所述的實(shí)現(xiàn)文件系統(tǒng)索引建立的 方法包括以下步驟: (1-1)基于文件信息為所述的文件系統(tǒng)中各個(gè)文件建立一元數(shù)據(jù),各個(gè)所述的元數(shù)據(jù) 存儲(chǔ)所對(duì)應(yīng)的文件的屬性和屬性值信息; (1-2)從文件系統(tǒng)的元數(shù)據(jù)集合中抽取屬性形成屬性集合; (1-3)基于所述的屬性集合中各個(gè)屬性建立對(duì)應(yīng)的屬性索引文件得到屬性和屬性索引 文件的集合共同形成文件系統(tǒng)索引。
2. 根據(jù)權(quán)利要求1所述的實(shí)現(xiàn)文件系統(tǒng)索引建立的方法,其特征在于,所述的元數(shù)據(jù) 為基于XML格式的元數(shù)據(jù),所述的元數(shù)據(jù)集合為XML文檔。
3. 根據(jù)權(quán)利要求1所述的實(shí)現(xiàn)文件系統(tǒng)索引建立的方法,其特征在于,所述的屬性包 括路徑、創(chuàng)建時(shí)間、修改信息、原始類型和刪除狀態(tài)。
4. 根據(jù)權(quán)利要求1所述的實(shí)現(xiàn)文件系統(tǒng)索引建立的方法,其特征在于,所述的屬性還 包括文件名稱、文件關(guān)鍵詞和占用空間。
5. -種基于權(quán)利要求1所述的實(shí)現(xiàn)文件系統(tǒng)索引建立的方法實(shí)現(xiàn)文件系統(tǒng)查詢的方 法,其特征在于,所述的實(shí)現(xiàn)文件系統(tǒng)索引建立的方法包括以下步驟: (2-1)將對(duì)文件系統(tǒng)的查詢分散為對(duì)各個(gè)屬性的查詢; (2-2)對(duì)各個(gè)屬性的屬性索引文件進(jìn)行查詢; (2-3)將各個(gè)屬性的查詢結(jié)果進(jìn)行交集運(yùn)算得到符合查詢條件的元數(shù)據(jù)文件; (2-4)根據(jù)查詢得到的元數(shù)據(jù)文件返回所對(duì)應(yīng)的真實(shí)文件。
6. 根據(jù)權(quán)利要求5所述的實(shí)現(xiàn)文件系統(tǒng)查詢的方法,其特征在于,所述的基于XML格式 的元數(shù)據(jù),所述的元數(shù)據(jù)集合為XML文檔。
7. 根據(jù)權(quán)利要求5所述的實(shí)現(xiàn)文件系統(tǒng)查詢的方法,其特征在于,所述的屬性包括路 徑、創(chuàng)建時(shí)間、修改信息、原始類型和刪除狀態(tài)。
8. 根據(jù)權(quán)利要求5所述的實(shí)現(xiàn)文件系統(tǒng)查詢的方法,其特征在于,所述的屬性還包括 文件名稱、文件關(guān)鍵詞和占用空間。
【文檔編號(hào)】G06F17/30GK104391952SQ201410708668
【公開日】2015年3月4日 申請(qǐng)日期:2014年11月28日 優(yōu)先權(quán)日:2014年11月28日
【發(fā)明者】吳松洋, 熊雄, 張旭, 孔華鋒 申請(qǐng)人:公安部第三研究所