欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

信息檢索系統(tǒng)、信息檢索方法及程序的制作方法

文檔序號(hào):6478203閱讀:301來源:國知局
專利名稱:信息檢索系統(tǒng)、信息檢索方法及程序的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及迅速檢索用戶的目標(biāo)信息的信息檢索系統(tǒng)。
背景技術(shù)
隨著互聯(lián)網(wǎng)對(duì)社會(huì)的滲透,在日常生活、社會(huì)活動(dòng)中人們處理的信息量極大。并 且是日趨激增的現(xiàn)狀。隨著通信網(wǎng)的普及,提高了能一覽全世界信息的便利性。Web服務(wù)、 EDI (electronic data interchange) 、EC (電子商務(wù)-electronic commerce)等進(jìn)入日常生活。 而且,由于高速光通信互聯(lián)網(wǎng)和地面數(shù)字播放、衛(wèi)星通信網(wǎng)、GPS(global positioning system)基礎(chǔ)設(shè)備的整備和傳輸質(zhì)量的提高,使得在全世界不論何處都能利 用網(wǎng)絡(luò)。人類社會(huì)通過這些信息網(wǎng)的普及和使用廉價(jià)設(shè)備,而得到了無論在何處都能利用 高附加值信息的好處。 然而,有時(shí)人們難以從這樣龐大的信息中迅速且正確地檢索所需的目標(biāo)信息。由 于信息量太多并且遍及各處,所以檢索方法也需要高度的技術(shù)。 企業(yè)、法人、個(gè)人所尋求的信息是多方面的。包括企業(yè)信息、學(xué)術(shù)信息、普通信息在 內(nèi)需要能瞬間提供特別專業(yè)化的信息。 從基因排列信息數(shù)據(jù)庫的檢索、從文獻(xiàn)數(shù)據(jù)庫的全文檢索等,需要處理太字節(jié)級(jí) 的信息。 另外近幾年,在企業(yè)中為了把握是否適當(dāng)?shù)厥褂糜?jì)算機(jī),有時(shí)在日常中取得積蓄 計(jì)算機(jī)的操作履歷。這樣的操作履歷每天積蓄,所以信息(數(shù)據(jù))量有時(shí)也會(huì)達(dá)到太字節(jié) 級(jí)。 為了利用這樣的信息,需要從大量信息中迅速檢索作為目標(biāo)的信息,然而對(duì)于太 字節(jié)級(jí)的信息,卻難以用通用的市售的關(guān)系數(shù)據(jù)庫系統(tǒng)進(jìn)行處理。 對(duì)于難以用市售的數(shù)據(jù)庫系統(tǒng)進(jìn)行處理的信息,多數(shù)情況是以XML (extensible markup language) 、 CSV格式(comma separated values :把信息按每個(gè)項(xiàng)目以逗號(hào)分開進(jìn) 行羅列的文件格式)或是固有格式等被結(jié)構(gòu)化的信息格式加以保存。 作為處理被結(jié)構(gòu)化的信息的方法,例如提出有對(duì)于XML數(shù)據(jù),是使XML文件的處理 對(duì)象外因素成為CSV格式而謀求減輕CPU(centralprocessor unit)的負(fù)荷,期望節(jié)省存儲(chǔ) 器的"XML CSV壓縮"等(參照專利文獻(xiàn)1、專利文獻(xiàn)2)。 通常,在從大容量的數(shù)據(jù)庫檢索作為目標(biāo)的信息時(shí),多數(shù)情況是由用戶逐步精煉 條件,或者不斷出現(xiàn)試行錯(cuò)誤地反復(fù)嘗試。 但是,在大容量信息為對(duì)象的情況下,因?yàn)?次信息檢索所需的時(shí)間變長,所以不 能在一定的時(shí)間,例如數(shù)小時(shí)程度以內(nèi)進(jìn)行這樣的試行錯(cuò)誤的作業(yè),因此實(shí)質(zhì)上不少情況 下難以得到作為目標(biāo)的信息。 特別是在這樣大容量信息的情況下,因?yàn)椴荒芎鲆暟殡S盤1/0(Input/Output)的 文件的讀寫處理所需的時(shí)間,所以在用戶進(jìn)行的全部作業(yè)中減少文件的讀寫次數(shù),這對(duì)于
4謀求用戶作業(yè)的效率化、短時(shí)間化方面是重要的因素。
專利文獻(xiàn)1 :日本特開2006-277031號(hào)公報(bào)
專利文獻(xiàn)2 :日本特開2007-179492號(hào)公報(bào)

發(fā)明內(nèi)容
本發(fā)明能提供一種利用群集計(jì)算機(jī)系統(tǒng)(cluster computer system)、可并行處 理的陣列計(jì)算機(jī)系統(tǒng)(array computer system)、網(wǎng)格計(jì)算等網(wǎng)絡(luò)上分布的計(jì)算機(jī)群或者 高端個(gè)人計(jì)算機(jī),從上述被結(jié)構(gòu)化的信息中盡可能迅速地檢索需要的信息的信息檢索系 統(tǒng)。 本發(fā)明能對(duì)于數(shù)百GB(千兆字節(jié),Giga byte :10的9次方)至TB(太字節(jié),Tera byte :10的12次方)級(jí)的大容量信息盡可能迅速地進(jìn)行以與用戶的目標(biāo)對(duì)應(yīng)的條件的信 息檢索。 根據(jù)本發(fā)明,提供一種信息檢索系統(tǒng)、方法和程序,能夠盡可能通過存儲(chǔ)器上的處 理進(jìn)行上述分步和試行錯(cuò)誤的信息檢索的一連串作業(yè)。 對(duì)于分步進(jìn)行信息檢索的情況,以前考慮在文件中保存某1次檢索結(jié)果,并把該 文件作為源信息而進(jìn)行下次檢索的方法,然而這樣的方法在1次檢索時(shí)必須發(fā)生文件的讀 入、寫入。 在本發(fā)明中,能把檢索結(jié)果寫入存儲(chǔ)器中來代替寫入文件中。
由此,在下次檢索中不發(fā)生從文件的讀入。 還有,使用戶指定的名稱與寫入檢索結(jié)果的存儲(chǔ)器區(qū)域?qū)?yīng),用戶能以與使用文 件名訪問文件時(shí)同樣的感覺訪問該存儲(chǔ)器區(qū)域。 因此,根據(jù)本發(fā)明的第1觀點(diǎn),提供一種信息檢索系統(tǒng),具備接收單元,其接收表 示作為檢索對(duì)象的條件的檢索對(duì)象條件信息、表示作為檢索對(duì)象的源信息是否存在于文件 或存儲(chǔ)器的任意一個(gè)中的源信息檢索處信息、以及作為檢索對(duì)象的源信息的源信息名;管 理表,其把存儲(chǔ)器區(qū)域的名稱和表示存儲(chǔ)器區(qū)域的存儲(chǔ)器區(qū)域信息相關(guān)聯(lián)進(jìn)行存儲(chǔ);檢索 單元,其在表示由上述接收到的源信息檢索處信息表示的作為檢索對(duì)象的源信息存在于存 儲(chǔ)器中的情況下,從上述管理表中檢索與上述接收到的作為檢索對(duì)象的源信息的源信息名 一致的存儲(chǔ)器區(qū)域的名稱;以及取得單元,其在利用上述檢索單元檢索到與上述接收到的 作為檢索對(duì)象的源信息的源信息名一致的存儲(chǔ)器區(qū)域的名稱的情況下,從由上述檢索到的 存儲(chǔ)器區(qū)域的名稱相關(guān)聯(lián)的存儲(chǔ)器區(qū)域信息所表示的存儲(chǔ)器區(qū)域中,取得與上述接收到的 檢索對(duì)象條件信息相符的信息。


圖1是表示本發(fā)明的實(shí)施方式涉及的信息檢索系統(tǒng)的圖。 圖2是表示本發(fā)明的實(shí)施方式涉及的帶名稱存儲(chǔ)器的管理表的圖。 圖3是表示分步的檢索作業(yè)的流程的流程圖。 圖4是表示利用多CPU和并列設(shè)備時(shí)的例子的圖。 圖5是表示通過通信網(wǎng)執(zhí)行檢索時(shí)的圖。 圖6是表示線程管理表的圖。
圖7是表示調(diào)整各處理中使用的線程數(shù)的流程的圖。
具體實(shí)施例方式
以下,參照附圖對(duì)本發(fā)明的實(shí)施方式涉及的信息檢索系統(tǒng)進(jìn)行說明。
圖1表示本發(fā)明的實(shí)施方式涉及的信息檢索系統(tǒng)的程序的構(gòu)成。
本程序主要由指令程序101和檢索程序102構(gòu)成。 指令程序101和檢索程序102可以在同一設(shè)備上執(zhí)行,也可以在不同的設(shè)備上執(zhí) 行。 指令程序101通過通信單元向檢索程序102發(fā)送執(zhí)行參數(shù)。執(zhí)行參數(shù)包括表示 作為檢索對(duì)象的條件的檢索對(duì)象條件信息、表示作為檢索對(duì)象的源信息是否存在于文件或 帶名稱存儲(chǔ)器的任意一個(gè)中的源信息檢索處信息、作為檢索對(duì)象的源信息的源信息名、表 示在文件或帶名稱存儲(chǔ)器的哪個(gè)中保存檢索到的信息的保存處信息、作為寫入對(duì)象的檢索 到的信息的檢索結(jié)果信息名。 在此,"帶名稱存儲(chǔ)器"是指帶有用戶指定的名稱的存儲(chǔ)器區(qū)域。
可以把這些執(zhí)行參數(shù)指定為指令程序的執(zhí)行指令的自變量(例如,"cmd prml prm2 prm3"),也可以將其記在文件中,把該文件指定為執(zhí)行指令的自變量(例如,"cmd filel"),另外還可以采用把它們混合起來的方法來指定(例如,"cmd filel prml prm2")。 在上述例子中cmd表示指令名,prml、prm2、prm3表示執(zhí)行參數(shù),filel表示文件名。
也可以把GUI (Graphical User Interface)給予指令程序101,并從GUI輸入執(zhí)行 參數(shù)。這樣的指令程序也可以作為瀏覽器上的程序進(jìn)行制作。 檢索程序102按照從指令程序101傳遞的執(zhí)行參數(shù),依次掃描源信息(作為檢索 對(duì)象的信息)中的信息組(被結(jié)構(gòu)化的信息(數(shù)據(jù))的塊),并判斷該信息組是否符合檢索 條件(檢索對(duì)象條件信息),在符合時(shí)就把該信息組作為檢索結(jié)果信息寫入帶名稱存儲(chǔ)器 或文件中。 檢索程序102,當(dāng)源信息的檢索完成時(shí),就把檢索處理完成了的意思通知到指令程 序101。此時(shí)也可以將檢索到的信息組的件數(shù)、或處理所花費(fèi)的時(shí)間等一并進(jìn)行通知。
檢索程序102在指令程序101涉及的最初的執(zhí)行指令發(fā)出之前啟動(dòng)。另外,檢索 程序102 —直裝載在存儲(chǔ)器上直到指令程序101涉及的一連串執(zhí)行指令的結(jié)果輸出完成為 止。 在重復(fù)進(jìn)行的一連串的執(zhí)行指令期間,檢索程序102 —直裝載在存儲(chǔ)器上,在此 期間可以把帶名稱存儲(chǔ)器保持在存儲(chǔ)器上,像文件一樣在執(zhí)行指令間反復(fù)使用。
檢索程序102具備通信處理部103、信息讀入處理部104、信息比較/操作處理部 105、信息寫入處理部106以及管理表107。 通信處理部103從指令程序101接收?qǐng)?zhí)行參數(shù)。另外,向指令程序101發(fā)送檢索 結(jié)果。所發(fā)送的結(jié)果中包括處理的成功/失敗、檢索到的信息組的件數(shù)以及處理所花費(fèi)的 時(shí)間等。指令程序101和檢索程序102之間的通信假定是在同一設(shè)備內(nèi)、LAN上、互聯(lián)網(wǎng)上。
104是信息讀入處理部。在由執(zhí)行參數(shù)(表示作為檢索對(duì)象的源信息是否存在于 文件或存儲(chǔ)器的任意一個(gè)中的源信息檢索處信息)指定的源信息為文件時(shí),把文件的一部 分或全部暫時(shí)讀入到存儲(chǔ)器上。在由執(zhí)行參數(shù)(源信息檢索處信息)指定的源信息為帶名
6稱存儲(chǔ)器時(shí),參照管理表107,根據(jù)作為執(zhí)行參數(shù)(作為檢索對(duì)象的源信息的源信息名)所 給出的名稱,確定存儲(chǔ)器區(qū)域。 作為源信息,可以使用多個(gè)文件108和帶名稱存儲(chǔ)器109。也可以把文件夾、驅(qū)動(dòng) 器內(nèi)的文件以及分散到多個(gè)PC中的文件等作為源信息。 信息比較/操作處理部105按照從指令程序101傳遞的執(zhí)行參數(shù)(檢索對(duì)象條件 信息、源信息檢索處信息、源信息名),依次掃描源信息中的信息組,來判斷該信息組是否符 合檢索條件。 作為檢索對(duì)象條件信息,例如,如果在作為檢索對(duì)象的源信息中有日期和時(shí)間信 息項(xiàng)目,則該日期和時(shí)間信息為特定的日期和時(shí)間范圍等。 在成為判斷對(duì)象的信息組符合條件時(shí),也可以加上置換某信息項(xiàng)目的值等的選擇 處理。 信息寫入處理部106把由信息比較/操作處理部105判斷為符合條件的信息組, 按照?qǐng)?zhí)行參數(shù)(保存處信息、檢索結(jié)果信息名),寫入文件111或帶名稱存儲(chǔ)器110中。在 寫入處為文件時(shí)也可以把寫入信息的一部分或全部暫時(shí)保持在存儲(chǔ)器上之后寫入文件中。
在以執(zhí)行參數(shù)(保存處信息)指定了帶名稱存儲(chǔ)器為寫入處時(shí),在存儲(chǔ)器上確保 一定尺寸的區(qū)域,并把其起始地址和以執(zhí)行參數(shù)(檢索結(jié)果信息名)指定的名稱的組寫入 管理表107中。也可以把所確保的存儲(chǔ)器區(qū)域的尺寸、日期和時(shí)間等其他信息一并記錄在 管理表中。要確保的存儲(chǔ)器區(qū)域的尺寸也可以由執(zhí)行參數(shù)來指定。在寫入處為帶名稱存儲(chǔ) 器時(shí),把由信息比較/操作處理部105判斷為符合條件的信息組寫入帶名稱存儲(chǔ)器中。
管理表107管理帶名稱存儲(chǔ)器,如圖2所示,記錄帶名稱存儲(chǔ)器的名稱202和存儲(chǔ) 器上的起始地址203的對(duì)應(yīng)關(guān)系,并可以互相參照。另外,也一并記錄最大尺寸204和使用 尺寸205等信息。此外,還記錄有帶名稱存儲(chǔ)器的作成日期和時(shí)間、更新日期和時(shí)間等日期 和時(shí)間信息206、和起始地址中現(xiàn)在的偏離位置等其他信息。根據(jù)該管理表,可以使用多個(gè) 帶名稱存儲(chǔ)器。檢索程序102,當(dāng)源信息的掃描完成時(shí),把檢索處理完成了的意思通知到指 令程序101。 結(jié)果通知113能通知檢索到的件數(shù)、處理所花費(fèi)的時(shí)間等。 另外,在結(jié)果通知113中能通知在檢索程序的處理中發(fā)生的錯(cuò)誤。作為這樣的錯(cuò)
誤,例如可以考慮有與指定了的名稱對(duì)應(yīng)的帶名稱存儲(chǔ)器的區(qū)域未被確保的情況、對(duì)帶名
稱存儲(chǔ)器指定了的尺寸的存儲(chǔ)器區(qū)域不能確保的情況、要進(jìn)行超過對(duì)帶名稱存儲(chǔ)器指定了
的最大尺寸的寫入的情況等。另外,作為檢索程序102的功能,也可以追加針對(duì)特定的信息
項(xiàng)目或者信息項(xiàng)目的組合來數(shù)出同一值各有幾個(gè)的功能,由此能有效地?cái)?shù)出。 圖3是用于說明本發(fā)明的實(shí)施方式涉及的信息檢索處理的流程圖。 在一連串的檢索作業(yè)中,初次檢索的源信息301通常是從文件中讀入。即,從指令
程序101發(fā)送到檢索程序102的執(zhí)行參數(shù)中的"源信息檢索處信息"中指定文件,在"源信
息名"中指定文件上的文件名。另外,這些執(zhí)行參數(shù)也可以通過指令程序IOI由用戶來指
定,還可以由指令程序本身自動(dòng)地設(shè)定。 檢索程序102基于從指令程序101發(fā)送的執(zhí)行參數(shù)進(jìn)行檢索處理。具體而言,基 于執(zhí)行參數(shù)的"源信息檢索處信息"來決定作為檢索對(duì)象的源信息是否存在于文件或存儲(chǔ) 器中的任意一個(gè)中,并基于"源信息名"來決定作為檢索對(duì)象的源信息。
7
在此,由于在"源信息檢索處信息"中指定了文件,在"源信息名"中指定了文件上 的文件名,因而把由文件上的文件名指定的信息作為源信息,來檢索與表示為"檢索對(duì)象條 件信息"的檢索對(duì)象條件相符的信息。 檢索結(jié)果的信息( 一次檢索信息)302是按照?qǐng)?zhí)行參數(shù),保存在帶名稱存儲(chǔ)器或 文件中(303)。具體而言,檢索程序102基于從指令程序101發(fā)送的執(zhí)行參數(shù)的"保存處信 息",來決定把檢索到的信息保存在文件或存儲(chǔ)器的哪個(gè)中,并在決定的存放處中,以"檢索 結(jié)果信息名"保存作為寫入對(duì)象的檢索到的信息。 在此,"保存處信息"是表示保存在存儲(chǔ)器中的信息。在該情況下,檢索程序102在 帶名稱存儲(chǔ)器中寫入檢索到的信息,并且將其與"檢索結(jié)果信息名"以及寫入信息的存儲(chǔ)器 區(qū)域信息一起,保存到管理表201中。如圖2所示,在"存儲(chǔ)器區(qū)域"中包括起始地址、最大 尺寸、使用尺寸。另外,也可以保存寫入信息的日期和時(shí)間等附加的信息。
在下次檢索中,用"源信息檢索處信息"指定帶名稱存儲(chǔ)器,用"源信息名"指定名 稱,由此能把作為上次檢索結(jié)果的保存在帶名稱存儲(chǔ)器中的信息作為源信息(304)。
在此,在從指令程序101發(fā)送來的執(zhí)行參數(shù)的"源信息檢索處信息"中指定存儲(chǔ) 器,在"源信息名"中指定與保存最初檢索到的信息的名稱相同的名稱(即,最初檢索時(shí)執(zhí) 行參數(shù)的"檢索結(jié)果信息名")。 檢索程序102,在"源信息檢索處信息"中指定了存儲(chǔ)器的情況下,從管理表201中 檢索與"源信息名"一致的存儲(chǔ)器區(qū)域的名稱。并且,在檢索到與源信息名一致的存儲(chǔ)器區(qū) 域名稱的情況下,從檢索到的存儲(chǔ)器區(qū)域的名稱相關(guān)聯(lián)的存儲(chǔ)器區(qū)域,取得與接收到的檢 索對(duì)象條件信息相符的信息。 另外,在"源信息檢索處信息"中指定了文件的情況下,從與"源信息名"一致的文 件名的文件中取得與檢索對(duì)象條件信息相符的信息。 檢索程序102,基于從指令程序101發(fā)送的執(zhí)行參數(shù)的"存放處信息",決定把檢索 到的信息保存到文件或存儲(chǔ)器的哪個(gè)中,并在決定的保存處,用"檢索結(jié)果信息名"保存作 為寫入對(duì)象的檢索到的信息(305)。 在此,"存放處信息"是表示保存在存儲(chǔ)器中的信息。在該情況下,檢索程序102在 帶名稱存儲(chǔ)器中寫入檢索到的信息,并且將其與"檢索結(jié)果信息名"以及寫入信息的存儲(chǔ)器 區(qū)域信息一起,保存到管理表201中。 在上述執(zhí)行參數(shù)的例子中,對(duì)于具有與檢索對(duì)象處以及信息的保存處相關(guān)的信息 進(jìn)行了說明,然而也可以只把與信息的保存處相關(guān)的信息("存放處信息"、"檢索結(jié)果信息 名")作為執(zhí)行參數(shù),只預(yù)先確保帶名稱存儲(chǔ)器區(qū)域,并在管理表201上確保該名稱和存儲(chǔ) 器區(qū)域信息。 另外,在管理表201上,有時(shí)存在與"檢索結(jié)果信息名"相當(dāng)?shù)拿Q,在這樣的情況 下,在由該"檢索結(jié)果信息名"相關(guān)聯(lián)的存儲(chǔ)器信息所表示的存儲(chǔ)器區(qū)域,寫入檢索到的信息。 通過這樣逐步反復(fù)檢索,用執(zhí)行參數(shù)("存放處信息")指定文件,從而能夠把最終 的檢索結(jié)果的信息保存到文件中(306)。 另外,中途的檢索結(jié)果可以根據(jù)需要而寫出到文件中,還可以將其作為下一個(gè)源 信息來使用。
各檢索可以在每次用戶確認(rèn)了結(jié)果之后,決定并執(zhí)行下一個(gè)檢索條件,如果是定 型地進(jìn)行的作業(yè),則可以事先決定各次的檢索條件,利用批、腳本等連續(xù)地執(zhí)行指令。
圖4表示為了從大量的信息中高效且高速地檢索作為目標(biāo)的信息,而在涉及多 CPU或多個(gè)PC的并列設(shè)備環(huán)境下利用本發(fā)明的情況。 為了高速化,有處理器存在多種的方式。陣列計(jì)算機(jī)(arraycomputer system)用 于處理成為排列、矩陣形式的信息,能以一個(gè)指令同時(shí)處理多個(gè)信息。其典型是超級(jí)計(jì)算機(jī) (supercomputer),能處理龐大數(shù)值的矩陣信息等并行高速處理。 此夕卜,并行處理計(jì)算豐幾(parallel computer system)有矢量處理器(vector processor system)、群集計(jì)算機(jī)(cluster computer system),會(huì)g應(yīng)對(duì)高速化,在這樣的環(huán) 境下利用本發(fā)明也是有效的。 在圖4中表示作為核的主處理器和按照主處理器的指令進(jìn)行動(dòng)作處理的多個(gè) 子處理器。401是系統(tǒng)總線。系統(tǒng)總線401上連接有主CPU402、雙端口 RAM (dual port RAM) 403、 RAM404、 R0M405以及子處理器406。 主CPU402控制子處理器群406nl 406nm、406n0。主CPU402進(jìn)行與子處理器 406nl 406nm、406n0的信息交換以及子處理器406nl 406nm、406n0的控制。雙端口 RAM403能同時(shí)對(duì)存儲(chǔ)器進(jìn)行信息的輸入輸出。 RAM404用于主CPU402的存儲(chǔ)器。R0M405是程序存儲(chǔ)器,寫入主處理器402的程 序,主處理器402根據(jù)該程序進(jìn)行處理。 子處理器406nl 406nm、406n0在主處理器402的管理下執(zhí)行處理。按照各帶名 稱存儲(chǔ)器和各文件的輸入輸出處理、按照I/O設(shè)備的控制處理、按照其他處理,來分配子處 理器進(jìn)行并行處理??傊且愿咚倩癁槟康牡貑卧?。 406nl進(jìn)行處理407,例如從文件、帶名稱存儲(chǔ)器進(jìn)行信息讀入的處理。
406n2進(jìn)行處理408,例如進(jìn)行向文件、帶名稱存儲(chǔ)器寫入信息的處理。
406nm進(jìn)行處理409,例如進(jìn)行檢索條件的比較處理。 這樣把獨(dú)立的處理分配給各處理器是有效的。根據(jù)需要,對(duì)子處理器406、處理 407 409進(jìn)行增減。 任務(wù)的生成、消去、程序的裝載、對(duì)任務(wù)分配子處理器406、中斷處理的任務(wù)管理 (task management),由主處理器402進(jìn)行。
子處理器406n0進(jìn)行1/0410的控制。
1/0410通過LAN412與PC411nl nm連接。 把源信息分散于多個(gè)PC411,并通過在各PC中并列地使檢索程序動(dòng)作,從而能高 速地進(jìn)行檢索。按各PC中所分配的源信息能一次讀入到存儲(chǔ)器上的方式來分割源信息是 有效的。即配合假定的源信息的尺寸增加PC數(shù)即可。 也可以由多個(gè)PC411中的一個(gè)或多個(gè)PC利用指令程序,并在其他PC中使檢索程 序動(dòng)作。 本實(shí)施方式涉及的多CPU以及并列設(shè)備系統(tǒng),通過對(duì)各CPU和PC有效地分配處理 和源信息,從而能進(jìn)行檢索的高速處理。 圖5是表示把本發(fā)明的實(shí)施方式涉及的檢索系統(tǒng)通過互聯(lián)網(wǎng)等通信網(wǎng)進(jìn)一步擴(kuò) 張的情況的圖。500表示檢索站點(diǎn)的構(gòu)成。501是檢索引擎,包括由檢索程序組成的上述說明了的圖4構(gòu)成的并列設(shè)備環(huán)境。 502是PC,用戶、客戶從這里開始檢索。如先前說明的那樣,即使不用PC,用戶、客 戶也能從其他信息設(shè)備、PDA (personal digitalassistant)、手機(jī)、數(shù)字信息家電設(shè)備之類 的終端設(shè)備發(fā)送檢索指令。 503是萬維網(wǎng)服務(wù)器(world wide web server),具備互聯(lián)網(wǎng)的事務(wù) (transaction)處理功能。具有對(duì)公共信息通信網(wǎng)的訪問功能,還具備抵御黑客(hacker) 等不正當(dāng)侵入的防火墻(fire wall :針對(duì)在互聯(lián)網(wǎng)和LAN之間不正當(dāng)侵入而守護(hù)內(nèi)部網(wǎng)絡(luò) 的機(jī)制)功能。 504是服務(wù)器,具有文件服務(wù)器、打印服務(wù)器、數(shù)據(jù)庫服務(wù)器、進(jìn)行通信控制的交流 服務(wù)器、進(jìn)行特定業(yè)務(wù)處理的應(yīng)用服務(wù)器的功能。 505、506是數(shù)據(jù)庫,其保管信息的各種文件。根據(jù)用戶的要求訪問這里存在的文件 進(jìn)行檢索。隨時(shí)更新、制作信息。 507是有機(jī)地連接這些設(shè)備的LAN。 508是與信息通信網(wǎng)510連接的通信線路。 509、510、511是各種專用萬維網(wǎng)站(web site)。 511是數(shù)據(jù)庫網(wǎng)站。除了文本數(shù)據(jù)以外,例如可以作為提供影像、電影等圖像的網(wǎng) 站。電影在近年由于高清數(shù)字相機(jī)(hi-vision digitalcamera)的低價(jià)格化和高功能化, 即使是外行也可以進(jìn)行高水平的電影制作,因此利用這樣的檔案庫的個(gè)人、法人不斷增加。
該網(wǎng)站511由通信線路508連接。512是有機(jī)地連接檔案庫設(shè)備的LAN,用于連接 服務(wù)器513、 PC514以及數(shù)據(jù)庫515。另外,數(shù)據(jù)庫515積蓄文本、影像、語音信息是太字節(jié) 級(jí)的大容量,在PC514中需要像檢索引擎501中的上述說明了的與來自外部的檢索對(duì)應(yīng)的 檢索引擎501。 這樣通過對(duì)在全世界分散的信息配置檢索引擎,從而能從具有指令程序的PC和 各種信息設(shè)備中進(jìn)行信息的檢索。 在圖4中,說明了在多CPU等并列環(huán)境中,對(duì)檢索程序的各處理適當(dāng)?shù)胤峙滟Y源, 從而能謀求處理的高速化的情況。在這里,更具體地?cái)⑹鲆远鄠€(gè)線程進(jìn)行檢索程序的處理 時(shí)優(yōu)化對(duì)各處理分配的線程數(shù)的方法。 作為檢索程序的處理,例如可以列舉出以下處理從文件或存儲(chǔ)器上保持的信息 中讀入1個(gè)或多個(gè)信息組的讀入處理、對(duì)由上述讀入單元讀入的信息區(qū)分與所指定的條件 相符的信息項(xiàng)目組的區(qū)分處理、把由上述區(qū)分單元區(qū)分的信息寫入到文件或存儲(chǔ)器上的寫 入處理等。 這些處理能以各自獨(dú)立的線程進(jìn)行。 另外,在檢索處理中,信息讀入處理中的信息讀入順序、區(qū)分處理中進(jìn)行條件比較 的信息順序、寫入處理中信息的寫入順序,一般不會(huì)對(duì)結(jié)果造成影響,所以能以多個(gè)線程來 處理各個(gè)處理。 在預(yù)先決定信息的格式且一組信息單位的長度為固定的情況下,信息讀入或?qū)懭?位置能容易地計(jì)算,因而趨向于這樣的并行處理。 假定以一定數(shù)的多個(gè)線程進(jìn)行處理的情況下,所有線程為相等的高負(fù)荷狀態(tài),整 體效率最好。 例如,讀入處理、區(qū)分處理、寫入處理的負(fù)荷為全部相等的高負(fù)荷狀態(tài)的情況。
作為處理負(fù)荷的定義,例如考慮有進(jìn)行了該處理的所有線程的一定時(shí)間內(nèi)的CPU 使用時(shí)間的總計(jì)等。 在本實(shí)施方式中提出通過增加高負(fù)荷處理的線程數(shù),減少低負(fù)荷處理的線程數(shù),
來動(dòng)態(tài)地提高檢索程序整體的處理效率的方法。 圖6是用于管理各處理可使用的線程數(shù)的線程管理表。 本實(shí)施方式的檢索程序102具備以下功能等,S卩接收功能,其接收表示作為檢索 對(duì)象的條件的檢索對(duì)象條件信息、表示作為檢索對(duì)象的源信息是否存在于文件或存儲(chǔ)器中 任意一個(gè)中的源信息檢索處信息、表示把作為檢索對(duì)象的源信息的源信息名和檢索到的信 息保存于文件或存儲(chǔ)器的哪個(gè)中的保存處信息、作為寫入對(duì)象的檢索到的信息的檢索結(jié)果 信息名;檢索功能,其在表示由上述接收到的源信息檢索處信息表示的作為檢索對(duì)象的源 信息存在于存儲(chǔ)器中的情況下,從管理表中檢索與上述接收到的作為檢索對(duì)象的源信息的 源信息名一致的存儲(chǔ)器區(qū)域的名稱;取得功能,在利用上述檢索功能檢索到與上述接收到 的作為檢索對(duì)象的源信息的源信息名一致的存儲(chǔ)器區(qū)域的名稱的情況下,從上述檢索到的 與存儲(chǔ)器區(qū)域的名稱相關(guān)聯(lián)的存儲(chǔ)器區(qū)域中,取得與上述接收到的檢索對(duì)象條件信息相符 的信息;以及保存功能,在表示上述接收到的保存處信息保存在存儲(chǔ)器中的情況下,把利用 上述取得功能取得的信息寫入存儲(chǔ)器中,并且把上述接收到的作為寫入對(duì)象的檢索到的信 息的檢索結(jié)果信息名,與存儲(chǔ)器區(qū)域一起保存于上述管理表中,然而可把這些各功能分配 給線程。 由檢索程序102在線程管理表601中,對(duì)各處理記錄可使用線程數(shù)602和現(xiàn)在的 負(fù)荷信息603。作為負(fù)荷信息,如先前敘述的那樣,例如考慮有進(jìn)行了該處理的所有線程一 定時(shí)間內(nèi)的CPU使用時(shí)間的總計(jì)等。線程管理表可由各處理訪問。
圖7表示動(dòng)態(tài)地優(yōu)化各處理的可使用線程數(shù)的方法的流程。
處理S701是以一定的信息塊單位而重復(fù)進(jìn)行。 S702判斷對(duì)最后的信息塊的處理是否完成,在完成時(shí)則結(jié)束處理,在未完成時(shí)則 進(jìn)行線程數(shù)的調(diào)整處理。 在S703中,參照?qǐng)D6所示的線程管理表,比較各處理的負(fù)荷信息,在本處理為最大 負(fù)荷時(shí),就增加記錄在S704線程管理表中的本處理的可使用線程數(shù)。例如增加1。
另外,在S705中,對(duì)于最小負(fù)荷的處理,按其量減少記錄在線程管理表中的可使 用線程數(shù)。例如減少l。 在對(duì)下一個(gè)信息塊進(jìn)行S701的處理時(shí),是以更新的線程數(shù)來進(jìn)行。
舉例具體地說明讀入處理。 在S701中從文件中讀入一定單位數(shù)的信息??墒褂镁€程數(shù)設(shè)定為2,把這些線程 作為A、 B。按ABAB…交替地讀入1個(gè)單位的信息。 假定進(jìn)行本處理的2線程的總計(jì)負(fù)荷,例如CPU使用時(shí)間為最大,例如寫入處理的 負(fù)荷為最低時(shí),則在線程管理表中把讀入處理的可使用線程數(shù)增加為3。并且把寫入處理的 可使用線程數(shù)減l。接下來在S701中進(jìn)行讀入處理時(shí),以3個(gè)線程A、B、C按ABCABC…交替地讀取。
這樣,隨時(shí)進(jìn)行增加高負(fù)荷處理的線程數(shù),減少低負(fù)荷處理的線程數(shù),從而能夠以 檢索程序整體有效地動(dòng)作的方式動(dòng)態(tài)地進(jìn)行優(yōu)化。
11
在符合條件的信息組較少的情況下,可以預(yù)想,與讀入處理、區(qū)分處理相比,寫入 處理的處理量會(huì)減少,然而在這樣的情況下不是對(duì)各處理平均地分配線程數(shù)而是利用這樣 的結(jié)構(gòu),從而能動(dòng)態(tài)地并且自發(fā)地分配最佳的線程數(shù)。
產(chǎn)業(yè)上的可利用性 根據(jù)本發(fā)明,通過對(duì)信息檢索結(jié)果附加用戶指定的名稱并將其在存儲(chǔ)器上保管, 從而在很多情況下能實(shí)現(xiàn)提高分步或重復(fù)進(jìn)行的信息檢索作業(yè)的用戶的作業(yè)效率、縮短作 業(yè)時(shí)間。 尤其對(duì)于太字節(jié)級(jí)涉及的大容量信息的檢索是有效的。
能短時(shí)間進(jìn)行本地硬盤上或通過網(wǎng)絡(luò)檢索分散的信息。 可期待應(yīng)用于從基因排列信息數(shù)據(jù)庫進(jìn)行檢索、從文獻(xiàn)數(shù)據(jù)庫進(jìn)行全文檢索、從 計(jì)算機(jī)的操作履歷等中進(jìn)行信息檢索等。
權(quán)利要求
一種信息檢索系統(tǒng),其具備接收單元,其接收表示作為檢索對(duì)象的條件的檢索對(duì)象條件信息、表示作為檢索對(duì)象的源信息是否存在于文件或存儲(chǔ)器的任意一個(gè)中的源信息檢索處信息、以及作為檢索對(duì)象的源信息的源信息名;管理表,其把存儲(chǔ)器區(qū)域的名稱和表示存儲(chǔ)器區(qū)域的存儲(chǔ)器區(qū)域信息相關(guān)聯(lián)進(jìn)行存儲(chǔ);檢索單元,其在表示由上述接收到的源信息檢索處信息表示的作為檢索對(duì)象的源信息存在于存儲(chǔ)器中的情況下,從上述管理表中檢索與上述接收到的作為檢索對(duì)象的源信息的源信息名一致的存儲(chǔ)器區(qū)域的名稱;以及取得單元,其在利用上述檢索單元檢索到與上述接收到的作為檢索對(duì)象的源信息的源信息名一致的存儲(chǔ)器區(qū)域的名稱的情況下,從由上述檢索到的存儲(chǔ)器區(qū)域的名稱相關(guān)聯(lián)的存儲(chǔ)器區(qū)域信息所表示的存儲(chǔ)器區(qū)域中,取得與上述接收到的檢索對(duì)象條件信息相符的信息。
2. 根據(jù)權(quán)利要求1所述的信息檢索系統(tǒng),其特征在于,上述接收單元還接收表示將檢索到的信息保存到文件或存儲(chǔ)器的哪個(gè)中的保存處信息、以及作為寫入對(duì)象的檢索到的信息的檢索結(jié)果信息名,上述信息檢索系統(tǒng)還具備保存單元,該保存單元在表示將上述接收到的保存處信息保存于存儲(chǔ)器中的情況下,把利用上述取得單元取得的信息寫入存儲(chǔ)器中,并把上述接收到的作為寫入對(duì)象的檢索到的信息的檢索結(jié)果信息名、與表示寫入上述存儲(chǔ)器中的信息所寫入的存儲(chǔ)器區(qū)域的存儲(chǔ)器區(qū)域信息一起,保存到上述管理表中。
3. 根據(jù)權(quán)利要求2所述的信息檢索系統(tǒng),其中,上述存儲(chǔ)器區(qū)域信息包括保存上述取得的信息的存儲(chǔ)器的起始地址、最大尺寸以及使用尺寸。
4. 根據(jù)權(quán)利要求l所述的信息檢索系統(tǒng),其中,上述檢索對(duì)象條件信息、上述源信息檢索處信息以及上述源信息名是從指令程序輸出,且上述檢索單元以及取得單元是與上述指令程序不同的檢索程序。
5. 根據(jù)權(quán)利要求4所述的信息檢索系統(tǒng),其中,上述指令程序保存于第1終端,上述檢索程序保存于第2終端。
6. 根據(jù)權(quán)利要求2所述的信息檢索系統(tǒng),其中,上述檢索單元、上述取得單元以及上述保存單元分別被分配到多個(gè)線程,上述信息檢索系統(tǒng)還具備測(cè)量單元,其對(duì)進(jìn)行上述多個(gè)線程的處理的CPU測(cè)量各線程的處理負(fù)荷;以及變更單元,其基于由上述測(cè)量單元測(cè)量出的各線程的處理負(fù)荷,變更分配到上述檢索單元、上述取得單元以及上述保存單元的線程的數(shù)量。
7. 根據(jù)權(quán)利要求1所述的信息檢索系統(tǒng),其特征在于,上述接收單元還接收表示將檢索到的信息保存在文件或存儲(chǔ)器的哪個(gè)中的保存處信息、以及作為寫入對(duì)象的檢索到的信息的檢索結(jié)果信息名,上述信息檢索系統(tǒng)還具備保存單元,該保存單元在表示將上述接收到的保存處信息保存于存儲(chǔ)器中,并且與上述接收到的檢索結(jié)果信息名對(duì)應(yīng)的存儲(chǔ)器區(qū)域信息存在于上述管理表上的情況下,把由上述取得單元取得的信息寫入由與上述檢索結(jié)果信息名對(duì)應(yīng)的存儲(chǔ)器區(qū)域信息表示的存儲(chǔ)器區(qū)域中。
8. —種信息檢索方法,是具備把存儲(chǔ)器區(qū)域的名稱和表示存儲(chǔ)器區(qū)域的存儲(chǔ)器區(qū)域信息相關(guān)聯(lián)進(jìn)行存儲(chǔ)的管理表的信息檢索系統(tǒng)中的信息檢索方法,其中,接收表示作為檢索對(duì)象的條件的檢索對(duì)象條件信息、表示作為檢索對(duì)象的源信息是否存在于文件或存儲(chǔ)器的任意一個(gè)中的源信息檢索處信息、以及作為檢索對(duì)象的源信息的源信息名,在表示由上述接收到的源信息檢索處信息表示的作為檢索對(duì)象的源信息存在于存儲(chǔ)器中的情況下,從上述管理表中檢索與上述接收到的作為檢索對(duì)象的源信息的源信息名一致的存儲(chǔ)器區(qū)域的名稱,在利用上述檢索單元檢索到與上述接收到的作為檢索對(duì)象的源信息的源信息名一致的存儲(chǔ)器區(qū)域的名稱的情況下,從由上述檢索到的存儲(chǔ)器區(qū)域的名稱相關(guān)聯(lián)的存儲(chǔ)器區(qū)域信息所表示的存儲(chǔ)器區(qū)域中,取得與上述接收到的檢索對(duì)象條件信息相符的信息。
9. 一種程序,是在具備把存儲(chǔ)器區(qū)域的名稱和表示存儲(chǔ)器區(qū)域的存儲(chǔ)器區(qū)域信息相關(guān)聯(lián)進(jìn)行存儲(chǔ)的管理表的信息檢索系統(tǒng)中使用的程序,其中,上述程序使上述信息檢索系統(tǒng)進(jìn)行以下動(dòng)作接收表示作為檢索對(duì)象的條件的檢索對(duì)象條件信息、表示作為檢索對(duì)象的源信息是否存在于文件或存儲(chǔ)器的任意一個(gè)中的源信息檢索處信息、以及作為檢索對(duì)象的源信息的源信息名,在表示由上述接收到的源信息檢索處信息表示的作為檢索對(duì)象的源信息存在于存儲(chǔ)器中的情況下,從上述管理表中檢索與上述接收到的作為檢索對(duì)象的源信息的源信息名一致的存儲(chǔ)器區(qū)域的名稱,在利用上述檢索單元檢索到與上述接收到的作為檢索對(duì)象的源信息的源信息名一致的存儲(chǔ)器區(qū)域的名稱的情況下,從由上述檢索到的存儲(chǔ)器區(qū)域的名稱相關(guān)聯(lián)的存儲(chǔ)器區(qū)域信息所表示的存儲(chǔ)器區(qū)域中,取得與上述接收到的檢索對(duì)象條件信息相符的信息。
全文摘要
本發(fā)明是具備把存儲(chǔ)器區(qū)域的名稱和表示存儲(chǔ)器區(qū)域的存儲(chǔ)器區(qū)域信息相關(guān)聯(lián)進(jìn)行存儲(chǔ)的管理表的信息檢索系統(tǒng)。信息檢索系統(tǒng)在表示由接收到的源信息檢索處信息表示的作為檢索對(duì)象的源信息存在于存儲(chǔ)器中的情況下,從上述管理表中檢索與上述接收到的作為檢索對(duì)象的源信息的源信息名一致的存儲(chǔ)器區(qū)域的名稱。并且,在檢索到與接收到的作為檢索對(duì)象的源信息的源信息名一致的存儲(chǔ)器區(qū)域的名稱的情況下,從上述檢索到的存儲(chǔ)器區(qū)域的名稱相關(guān)聯(lián)的存儲(chǔ)器區(qū)域信息中,取得與上述接收到的檢索對(duì)象條件信息相符的信息。
文檔編號(hào)G06F17/30GK101796493SQ20088010546
公開日2010年8月4日 申請(qǐng)日期2008年8月29日 優(yōu)先權(quán)日2007年9月7日
發(fā)明者前一樹, 南井佑介, 大江尚之, 志摩貴浩, 齋藤浩, 曾根田亮 申請(qǐng)人:哈明頭株式會(huì)社
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
永年县| 抚远县| 南宫市| 肥城市| 聊城市| 嘉善县| 马鞍山市| 和林格尔县| 北安市| 嘉祥县| 禄劝| 郑州市| 龙里县| 临泽县| 宜川县| 额敏县| 长沙县| 泸水县| 扶风县| 鄄城县| 博白县| 南陵县| 平凉市| 尚义县| 临桂县| 于田县| 沙河市| 邯郸市| 鹿泉市| 峡江县| 福州市| 彰化市| 仁寿县| 固安县| 昆山市| 涞源县| 梅州市| 视频| 临海市| 高雄县| 方正县|