欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

面向光盤庫的全文檢索系統(tǒng)的制作方法

文檔序號:8512516閱讀:449來源:國知局
面向光盤庫的全文檢索系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種面向光盤庫的全文檢索系統(tǒng),屬于計算機(jī)應(yīng)用技術(shù)領(lǐng)域。
【背景技術(shù)】
[0002]日益增長的存儲需要使得人們對超大容量存儲設(shè)備的需求也相應(yīng)的提高。目前基于光盤的存儲設(shè)備有光盤塔、光盤庫和光盤鏡服務(wù)器,而其中光盤庫顯得尤為重要。光盤庫是一種帶有自動換盤機(jī)構(gòu)(機(jī)械手)的光盤網(wǎng)絡(luò)共享設(shè)備。光盤庫一般由放置光盤的光盤架、自動換盤機(jī)構(gòu)(機(jī)械手)和驅(qū)動器三部分組成。近年來,由于單張光盤的存儲容量大大增加,光盤庫相較于常見的存儲設(shè)備如磁盤陣?yán)?、磁帶庫等其價格性能優(yōu)勢逐漸顯露出來。目前關(guān)于光盤庫的數(shù)據(jù)管理多是基于光盤庫上的數(shù)據(jù)庫來操作的,對于某些數(shù)據(jù),通過光盤上的數(shù)據(jù)庫進(jìn)行管理確實比較方便。但是對于某些文件數(shù)據(jù),特別是需要進(jìn)行全文檢索的文件數(shù)據(jù),用光盤上的數(shù)據(jù)庫來管理,就相當(dāng)于在檢索引擎和數(shù)據(jù)之間增加了一層數(shù)據(jù),造成檢索上的不方便。所以對于需要進(jìn)行全文檢索的數(shù)據(jù),直接以文件形式存儲在光盤庫中是合理高效的,因而本發(fā)明以此形式實現(xiàn)光盤庫的數(shù)據(jù)存儲。
[0003]全文檢索技術(shù),就是以數(shù)據(jù)諸如文字,聲音,圖像等為主要內(nèi)容,以檢索文獻(xiàn)資料的內(nèi)容而不是外表特征的一種檢索技術(shù)。與其他搜索引擎相比,全文搜索引擎的顯著特點(diǎn)是它能夠以文中任何一個有檢索意義的詞作為檢索入口,而且取得的檢索結(jié)果是原始文獻(xiàn),而不是文獻(xiàn)線索。目前有許多高效的全文檢索引擎,但是這些引擎基于的存儲介質(zhì)大多都是磁盤,而在大數(shù)據(jù)存儲的今天,亟需一種由光盤庫作為存儲介質(zhì)的檢索引擎所構(gòu)成的全文檢索系統(tǒng)。本發(fā)明實現(xiàn)了面向光盤庫的全文檢索系統(tǒng)。
[0004]綜上所述,本發(fā)明不僅在光盤庫數(shù)據(jù)管理和全文檢索數(shù)據(jù)存儲介質(zhì)上做了創(chuàng)新,還將兩者結(jié)合,實現(xiàn)了基于光盤庫的全文檢索系統(tǒng)。

【發(fā)明內(nèi)容】

[0005]本發(fā)明的目的是為了解決現(xiàn)有光盤庫管理系統(tǒng)無法實現(xiàn)光盤庫全文檢索的問題,提出一種面向光盤庫的全文檢索系統(tǒng)。
[0006]本發(fā)明的目的是通過下述技術(shù)方案實現(xiàn)的。
[0007]一種面向光盤庫的全文檢索系統(tǒng),包括文件數(shù)據(jù)存儲模塊、文件索引建立模塊、關(guān)鍵詞檢索模塊、文件信息讀取模塊。其中,
[0008]文件數(shù)據(jù)存儲模塊包含文件容量計算模塊、光盤分配模塊、數(shù)據(jù)存入模塊;
[0009]文件索引建立模塊包含文件讀取模塊、文件信息分詞模塊、磁盤索引文件建立模塊;
[0010]關(guān)鍵詞檢索模塊包括含關(guān)鍵詞獲取模塊、關(guān)鍵詞處理模塊、磁盤檢索模塊、檢索結(jié)果輸出申吳塊。
[0011]文件數(shù)據(jù)存儲模塊通過文件容量計算模塊統(tǒng)計所要存入光盤庫的總文件大小,以此確定分配光盤的數(shù)量。再通過光盤分配模塊對文件進(jìn)行分配,確定每個文件要存入的光盤編號,最后通過數(shù)據(jù)存入模塊將文件存入對應(yīng)的光盤中。
[0012]文件索引建立模塊通過文件讀取模塊獲得存入光盤庫中的文件,再通過文件信息分詞模塊對文件內(nèi)容進(jìn)行分詞處理,最后通過磁盤索引文件建立模塊在磁盤上建立這些文件的索引文件。
[0013]關(guān)鍵詞檢索模塊通過關(guān)鍵詞獲取模塊獲得用戶輸入的關(guān)鍵詞,再利用關(guān)鍵詞處理模塊實現(xiàn)對關(guān)鍵詞的識別和拆分處理,最后通過磁盤檢索模塊對各個關(guān)鍵詞進(jìn)行檢索,獲得關(guān)鍵詞檢索結(jié)果,并通過檢索結(jié)果輸出模塊根據(jù)關(guān)鍵詞在文件中出現(xiàn)頻率的遞減順序輸出文件路徑。
[0014]文件信息讀取模塊根據(jù)關(guān)鍵詞檢索模塊得到的文件路徑,讀取相應(yīng)文件內(nèi)容。
[0015]一種面向光盤庫的全文檢索方法,先將文件存入光盤庫中,再通過讀取光盤庫文件的操作在磁盤上建立文件的索引信息。通過關(guān)鍵詞檢索時,只需對磁盤上的索引文件進(jìn)行操作即可按照關(guān)鍵詞出現(xiàn)頻率遞減的順序顯示相關(guān)的文件路徑,并通過文件路徑讀取文件內(nèi)容。
[0016]所述將文件數(shù)據(jù)存儲到光盤庫,步驟如下:
[0017]步驟I從磁盤或其它存儲介質(zhì)上讀取要存入的文件數(shù)據(jù)。
[0018]步驟2計算這些將要存入的文件數(shù)據(jù)總的容量大小M0
[0019]步驟3將文件總?cè)萘砍悦繌埞獗P的總?cè)萘縨,得到所需要的空白光盤數(shù)量η。
[0020]步驟4對于空白光盤數(shù)量η,在光盤庫中找到η張空白光盤,若光盤庫中沒有足夠的η張空白光盤,則提醒存儲容量不足。
[0021]步驟5將文件總?cè)萘繙p去η張空白光盤的總?cè)萘?,得到文件所需的剩余容量I。
[0022]步驟6搜索光盤庫中已經(jīng)寫入數(shù)據(jù)但是未寫滿的光盤,查看是否有剩余容量大于文件所需的剩余容量I的光盤。
[0023]步驟7若找到剩余容量大于文件所需的剩余容量I的光盤,分配該光盤上的空間給文件,并更新該光盤的剩余容量;若沒有,則分配一張新的空白光盤,并更新該光盤的剩余容量。若既沒有剩余容量大于文件所需的剩余容量的光盤,也沒有剩余的空白光盤,則提醒存儲容量不足。
[0024]步驟8根據(jù)分配給文件的光盤編號,使用光盤庫中的機(jī)械換盤器找到對應(yīng)編號的光盤。
[0025]步驟9使用光盤庫中的光盤驅(qū)動器驅(qū)動找到的光盤,為光盤數(shù)據(jù)的寫入做準(zhǔn)備。
[0026]步驟10將文件數(shù)據(jù)通過光驅(qū)寫入到光盤中。
[0027]所述在磁盤上直接建立光盤文件的倒排索引,步驟如下:
[0028]步驟I在磁盤上存放索引文件的位置對索引文件執(zhí)行讀操作,以判斷磁盤上的索引文件是否已經(jīng)存在;
[0029]步驟2若磁盤上的索引文件不存在,則先在磁盤上指定位置建立磁盤索引文件的初始哈希表,索引文件內(nèi)容為空。
[0030]步驟3讀取新存入光盤的文件,獲得文件的相關(guān)信息,這些信息包括文件存放的光盤編號、文件的編號、文件的內(nèi)容。
[0031]步驟4對文件的內(nèi)容進(jìn)行分詞處理,將文件的內(nèi)容劃分成單詞的集合,保存每個單詞的相關(guān)信息,包括單詞在文件中出現(xiàn)的位置和頻率。
[0032]步驟5將文件所包含的單詞集合、各單詞的相關(guān)信息以及為文件在光盤上的路徑做為索引的內(nèi)容鏈接到磁盤索弓I文件的哈希表上。
[0033]所述通過磁盤索引文件直接檢索關(guān)鍵詞所在文件信息,步驟如下:
[0034]步驟I獲取用戶輸入的用于檢索的關(guān)鍵詞。
[0035]步驟2對關(guān)鍵詞進(jìn)行分詞解析,得到多個關(guān)鍵詞,確定用戶要檢索的信息。
[0036]步驟3對每個關(guān)鍵詞采取同樣的操作,依次通過磁盤上的索引文件檢索包含該關(guān)鍵詞的文件相關(guān)的索引信息。
[0037]步驟4文件的索引信息包含關(guān)鍵詞出現(xiàn)的頻度,依據(jù)關(guān)鍵詞出現(xiàn)的頻度將與關(guān)鍵詞相關(guān)的多個文件路徑輸出,供用戶選擇。
[0038]所述根據(jù)檢索結(jié)果讀取光盤庫信息文件,步驟如下:
[0039]步驟I用戶選擇檢索到的文件路徑用于讀取。
[0040]步驟2使用光盤庫的機(jī)械換盤器找到文件路徑對應(yīng)的光盤。
[0041]步驟3使用光盤庫的光盤驅(qū)動器驅(qū)動光盤數(shù)據(jù)的讀取。
[0042]有益效果
[0043]本發(fā)明實現(xiàn)面向光盤庫的全文檢索系統(tǒng)。該系統(tǒng)的實現(xiàn)方法是在文件數(shù)據(jù)存入后再建立相應(yīng)的索引,節(jié)省了數(shù)據(jù)存入的時間,且只需在磁盤上建立索引而不需要在光盤上建立索引,節(jié)省了光盤的存儲容量。在檢索時只需操作磁盤上的索引文件,檢索速度快。本發(fā)明直接以文件的形式將數(shù)據(jù)存入光盤庫中,直接對光盤庫的文件進(jìn)行操作而并不是通過數(shù)據(jù)庫文件進(jìn)行存儲和檢索,降低了數(shù)據(jù)存儲和光盤庫操作的復(fù)雜性。
【附圖說明】
[0044]圖1是本發(fā)明利用磁盤索引文件實現(xiàn)的基于光盤庫的全文檢索系統(tǒng)的結(jié)構(gòu)示意圖;
[0045]圖2是本發(fā)明利用基于光盤庫的全文檢索系統(tǒng)在磁盤上直接建立文件索引的方法流程圖;
[0046]圖3是本發(fā)明利用基于光盤庫的全文檢索系統(tǒng)通過磁盤索引文件直接查詢與關(guān)鍵詞相關(guān)的文件信息的方法流程圖;
[0047]圖中標(biāo)號,100-全文檢索系統(tǒng)、110-文件數(shù)據(jù)存儲模塊、120-文件索引建立模塊、130-關(guān)鍵詞檢索模塊、140-文件信息讀取模塊、ml-文件容量計算模塊、m2-光盤分配模塊、m3-數(shù)據(jù)存入模塊、m4-文件讀取模塊、m5-文件信息分詞模塊、m6-磁盤索引文件建立模塊、m7-關(guān)鍵詞獲取模塊、m8-關(guān)鍵詞處理模塊、m9_磁盤檢索模塊、mlO-檢索結(jié)果輸出模塊、200-光盤庫、210-機(jī)械換盤器、220-光盤驅(qū)動器、230-光盤、240-光盤上的索引文件、300-磁盤存儲器、310-磁盤上的索引文件、X-光盤庫管理系統(tǒng)。
【具體實施方式】
[0048]下面結(jié)合附圖和實施例對本發(fā)明做詳細(xì)說明。
[0049]一種面向光盤庫的全文檢索系統(tǒng),包括文件數(shù)據(jù)存儲模塊110、文件索引建立模塊120、關(guān)鍵詞檢索模塊130、文件信息讀取模塊140。
[0050]其中文件數(shù)據(jù)存儲模110塊包含文件容量計算模塊ml、光盤分配模塊m2、數(shù)據(jù)存入模塊m3 ;
[0051]文件索引建立模塊120包含文件讀取模塊m4、文件信息分詞模塊m5、磁盤索引文件建立模塊m6 ;
[0052]關(guān)鍵詞檢索模塊130包括關(guān)鍵詞獲取模塊m7、關(guān)鍵詞處理模塊m8、磁盤檢索模塊m9、檢索結(jié)果輸出模塊mlO。
[0053]文件數(shù)據(jù)存儲模塊110通過文件容量計算模塊統(tǒng)計所要存入光盤庫的總文件大小,以此確定分配光盤的數(shù)量。再通過光盤分配模塊對文件進(jìn)行分配,確定每個文件要存入的光盤編號,最后通過數(shù)據(jù)
當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1
葫芦岛市| 寻乌县| 永安市| 崇阳县| 张家港市| 若羌县| 寻乌县| 平阴县| 安塞县| 铁力市| 福泉市| 仁寿县| 增城市| 营山县| 昔阳县| 沾益县| 讷河市| 留坝县| 崇信县| 唐河县| 当雄县| 密云县| 台东县| 米泉市| 韩城市| 上虞市| 武穴市| 绵竹市| 涪陵区| 宁陵县| 全椒县| 壶关县| 汝城县| 蛟河市| 五莲县| 格尔木市| 汾西县| 卓资县| 内乡县| 呼玛县| 工布江达县|