專利名稱:檢索系統(tǒng)和檢索程序以及個(gè)人計(jì)算機(jī)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及可以根據(jù)所輸入的自然語言,高效率地檢索所需的文檔數(shù)據(jù)的檢索系統(tǒng)和檢索程序以及個(gè)人計(jì)算機(jī)。
背景技術(shù):
專利文獻(xiàn)1特開2001-67363號(hào)公報(bào)當(dāng)前,在內(nèi)聯(lián)網(wǎng)(intranet)和互聯(lián)網(wǎng)(internet)等各種情況下,廣泛使用著以標(biāo)準(zhǔn)化形式準(zhǔn)備的檢索系統(tǒng)。
即,文檔的存儲(chǔ)和發(fā)布比較盛行,檢索系統(tǒng)成為用于從大量文檔中檢索所需文檔的重要工具。
以往,在內(nèi)聯(lián)網(wǎng)的情況下,主流是在公開服務(wù)器上啟動(dòng)HTTP服務(wù)器,利用服務(wù)器腳本(例如,ASP,CGI,PHP)從HTTP頁(yè)面進(jìn)行檢索。
另一方面,在個(gè)人計(jì)算機(jī)內(nèi)等,在用戶對(duì)硬盤上的任意文檔進(jìn)行檢索時(shí),有很多計(jì)算機(jī)的配置不允許啟動(dòng)HTTP服務(wù)器,或者本來就沒有安裝HTTP服務(wù)器。
因此,在幫助檢索等中,預(yù)先通過詞素分析抽出所含的關(guān)鍵字,啟動(dòng)應(yīng)用程序,使用該應(yīng)用程序,根據(jù)上述關(guān)鍵字來檢索所需的文檔(參照專利文獻(xiàn)1)。
然而,上述檢索處理在進(jìn)行檢索時(shí),必須啟動(dòng)特別的應(yīng)用程序,并在輸入欄內(nèi)進(jìn)行關(guān)鍵字輸入,上述檢索處理存在以下缺點(diǎn)對(duì)于不經(jīng)常使用幫助等、不習(xí)慣幫助檢索等的初學(xué)者而言,使用比較困難。
并且,上述檢索處理必須輸入關(guān)鍵字,存在以下缺點(diǎn)例如,對(duì)初學(xué)者而言,盡管知道誤動(dòng)作的狀況,但很難正確地抽出用于獲得自己想知道的信息的單詞并按順序進(jìn)行檢索。
例如,在“打印機(jī)動(dòng)作不良”的情況下,用戶輸入“打印機(jī)”,在打印機(jī)的項(xiàng)目下,還有多個(gè)項(xiàng)目,必須從該項(xiàng)目中選擇對(duì)未動(dòng)作狀況進(jìn)行分析的項(xiàng)目,這對(duì)不習(xí)慣的人而言比較困難。
發(fā)明內(nèi)容
本發(fā)明是鑒于這種情況而提出的,本發(fā)明的目的是提供一種利用Web瀏覽器的檢索系統(tǒng)和檢索程序,其不使用HTTP服務(wù)器,而是通過輸入作為提問語句的自然語言的字符串,可容易地根據(jù)該字符串檢索所需文檔。
本發(fā)明的檢索系統(tǒng)具有接口單元,其利用可解釋HTML形式的文件內(nèi)所含的腳本的瀏覽器功能,啟動(dòng)與所安裝的瀏覽器對(duì)應(yīng)的接口組件,并由該接口組件調(diào)用檢索組件;以及檢索引擎單元,其由上述檢索組件啟動(dòng),對(duì)所輸入的字符串進(jìn)行解釋,并與解釋結(jié)果對(duì)應(yīng),在數(shù)據(jù)庫(kù)中進(jìn)行與該字符串對(duì)應(yīng)的數(shù)據(jù)檢索處理。
因此,根據(jù)本發(fā)明的檢索系統(tǒng),由于利用個(gè)人計(jì)算機(jī)內(nèi)所安裝的瀏覽器的腳本或小應(yīng)用程序(applet)等的對(duì)象調(diào)用(加載DLL)功能來調(diào)用檢索組件,并啟動(dòng)檢索引擎部5,因而可構(gòu)成不運(yùn)行HTTP服務(wù)器而利用Web瀏覽器的檢索系統(tǒng)。
并且,根據(jù)本發(fā)明的檢索系統(tǒng),通過象在通?;ヂ?lián)網(wǎng)的檢索中向使用的瀏覽器輸入檢索關(guān)鍵字那樣,作為自然語言的字符串輸入提問語句,從而對(duì)所輸入的提問語句進(jìn)行分析,進(jìn)行與該提問語句對(duì)應(yīng)的所需文檔的檢索,具有以下效果即使對(duì)于不習(xí)慣幫助檢索的初學(xué)者用戶,也能容易地進(jìn)行所需文檔的檢索。
而且,根據(jù)本發(fā)明的檢索系統(tǒng),由于接口單元的描述是HTML內(nèi)的腳本語句,因而可容易地進(jìn)行變更,通過使其與所安裝的瀏覽器對(duì)應(yīng),并通過腳本語句的變更,可容易地進(jìn)行系統(tǒng)移植。
本發(fā)明的檢索系統(tǒng),在上述接口單元中具有檢索單元,該檢索單元根據(jù)存儲(chǔ)在安裝信息存儲(chǔ)部(例如,實(shí)施方式中的安裝信息存儲(chǔ)部4)中的組件的安裝信息(若是Windows(注冊(cè)商標(biāo)),則為注冊(cè)表信息,若是Mac-OS(注冊(cè)商標(biāo)),則為優(yōu)選(preference)信息),對(duì)安裝有何種瀏覽器進(jìn)行檢測(cè)。
根據(jù)本發(fā)明的檢索系統(tǒng),可與所安裝的上述瀏覽器中的任何一種對(duì)應(yīng),并且在變更了瀏覽器種類的情況下,也不用重新安裝系統(tǒng),也不用進(jìn)行麻煩的設(shè)定變更等處理,就能與多個(gè)瀏覽器對(duì)應(yīng)。
這樣,本發(fā)明的檢索系統(tǒng)中,用戶不用有意識(shí)地去做,接口單元就能對(duì)安裝在個(gè)人計(jì)算機(jī)內(nèi)的上述瀏覽器的種類進(jìn)行檢測(cè),因而,用戶可輸入字符串容易地進(jìn)行所需數(shù)據(jù)的檢索。
本發(fā)明的檢索系統(tǒng)在上述接口單元中,上述檢索單元具有表,該表中記載著多個(gè)瀏覽器和與各瀏覽器分別對(duì)應(yīng)的接口單元之間的關(guān)系。
本發(fā)明的檢索系統(tǒng)在上述接口單元中具有判定部,該判定部從上述表中抽出與檢索單元檢測(cè)出的瀏覽器對(duì)應(yīng)的接口組件。
這樣,根據(jù)本發(fā)明的檢索系統(tǒng),當(dāng)根據(jù)存儲(chǔ)在安裝信息存儲(chǔ)部?jī)?nèi)的安裝信息,檢測(cè)出安裝有何種瀏覽器時(shí),可容易地從上述表中選擇與所檢測(cè)出的瀏覽器對(duì)應(yīng)的接口組件,可加載并使用所選擇的組件,并可使接口部與多個(gè)瀏覽器分別對(duì)應(yīng)。
本發(fā)明的檢索系統(tǒng)的上述檢索引擎單元具有文檔數(shù)據(jù)庫(kù),其存儲(chǔ)檢索對(duì)象的文檔數(shù)據(jù);詞素分析用詞典數(shù)據(jù)庫(kù),其預(yù)先存儲(chǔ)了詞素分析用數(shù)據(jù);詞素分析單元,其參照上述詞素分析用詞典數(shù)據(jù)庫(kù),通過對(duì)從輸入部輸入的字符串進(jìn)行詞素分析來抽出單詞,并針對(duì)該單詞確定肯定形或否定形;檢索條件生成單元,其根據(jù)上述單詞和確定肯定或否定的信息,生成檢索條件;以及文檔檢索單元,其從上述文檔數(shù)據(jù)庫(kù)中檢索符合上述檢索條件的文檔數(shù)據(jù)。
根據(jù)本發(fā)明的檢索系統(tǒng),由于在文檔登錄時(shí)的詞素分析時(shí),把肯定否定標(biāo)志登錄在檢索用數(shù)據(jù)庫(kù)內(nèi),因而可防止找到意思完全相反的文檔。特別是,在進(jìn)行故障對(duì)應(yīng)處理時(shí),意思完全相反的文檔數(shù)據(jù)是不需要的,因而,可以高效率地找出所需的文檔數(shù)據(jù)。并且,由于檢索包含對(duì)提問語句進(jìn)行詞素分析所得到的單詞的類似詞的文檔,因而可容易地找出所需的文檔數(shù)據(jù)。
本發(fā)明的檢索程序可以在計(jì)算機(jī)中運(yùn)行,并具有以下處理接口單元利用可解釋HTML形式的文件內(nèi)所含的腳本的瀏覽器功能,啟動(dòng)與所安裝的瀏覽器對(duì)應(yīng)的接口組件,并由該接口組件調(diào)用檢索組件;以及檢索引擎單元由上述檢索組件啟動(dòng),對(duì)所輸入的字符串進(jìn)行解釋,并與解釋結(jié)果對(duì)應(yīng),在數(shù)據(jù)庫(kù)中進(jìn)行與該字符串對(duì)應(yīng)的數(shù)據(jù)檢索處理。
本發(fā)明的檢索程序在上述的檢索程序中,具有以下檢索處理根據(jù)存儲(chǔ)在存儲(chǔ)部?jī)?nèi)的安裝信息,對(duì)安裝有何種瀏覽器進(jìn)行檢測(cè)。
本發(fā)明的個(gè)人計(jì)算機(jī),其特征在于,具有手冊(cè)存儲(chǔ)部,其存儲(chǔ)HTML形式的手冊(cè)文檔;瀏覽器,其可解釋上述手冊(cè)文檔內(nèi)所含的腳本;接口部,其啟動(dòng)與上述瀏覽器對(duì)應(yīng)的接口組件,并由上述接口組件調(diào)用檢索組件;文檔數(shù)據(jù)庫(kù),其存儲(chǔ)檢索對(duì)象的文檔數(shù)據(jù);檢索引擎部,其由上述檢索組件啟動(dòng),對(duì)所輸入的提問語句進(jìn)行解釋,并與該解釋結(jié)果對(duì)應(yīng),進(jìn)行上述檢索對(duì)象的文檔數(shù)據(jù)檢索;以及安裝信息存儲(chǔ)部,其存儲(chǔ)所安裝的各種應(yīng)用程序和數(shù)據(jù)信息。
圖1是表示根據(jù)本發(fā)明的一個(gè)實(shí)施方式的檢索系統(tǒng)的結(jié)構(gòu)的一例的方框圖。
圖2是表示圖1的檢索引擎部5的結(jié)構(gòu)的一例的方框圖。
圖3對(duì)HTML形式的手冊(cè)文件的啟動(dòng)動(dòng)作進(jìn)行說明的流程圖。
圖4是表示檢索組件的加載(檢索引擎部5的啟動(dòng))動(dòng)作的一例的流程圖。
圖5是表示檢索引擎部5的檢索動(dòng)作的一例的流程圖。
圖6是表示把圖1的檢索系統(tǒng)安裝在計(jì)算機(jī)中的安裝處理的一例的流程圖。
圖7是表示根據(jù)本發(fā)明的一個(gè)實(shí)施方式的個(gè)人計(jì)算機(jī)上的結(jié)構(gòu)的方框圖。
1手冊(cè)存儲(chǔ)部;2接口部;2a檢索部;2b判定部;2c表;3組件;4安裝信息存儲(chǔ)部;5檢索引擎部;6詞素分析用詞典數(shù)據(jù)庫(kù);7文檔數(shù)據(jù)庫(kù);10詞素分析部;11輸入部;12檢索條件生成部;13類似詞詞典數(shù)據(jù)庫(kù);14檢索部;20瀏覽器;21接口組件;22檢索組件;100個(gè)人計(jì)算機(jī)。
具體實(shí)施例方式
本發(fā)明是一種檢索系統(tǒng),該檢索系統(tǒng)使用具有調(diào)用在Windows(注冊(cè)商標(biāo))等中預(yù)先設(shè)置的Internet Explorer(注冊(cè)商標(biāo))等具有的ActiveX(注冊(cè)商標(biāo))或者JAVA(注冊(cè)商標(biāo))小應(yīng)用程序等組件的功能的瀏覽器,與通?;ヂ?lián)網(wǎng)的檢索方法相同,在檢索條件的輸入欄內(nèi)輸入自然語言的字符串,在用戶的個(gè)人計(jì)算機(jī)內(nèi)進(jìn)行所需文檔的檢索。此時(shí),在檢索引擎中,對(duì)所輸入的字符串進(jìn)行詞素分析,并進(jìn)行必要的關(guān)鍵字(檢索條件)的抽出。
此處,上述ActiveX和JAVA(注冊(cè)商標(biāo))小應(yīng)用程序等組件,在具有開始檢索處理功能的HTML形式的文件內(nèi)所含的腳本和進(jìn)行檢索的檢索引擎部(即,由檢索組件啟動(dòng)的檢索引擎部)之間,進(jìn)行關(guān)鍵字和檢索結(jié)果的傳遞。即,本發(fā)明利用預(yù)先安裝在個(gè)人計(jì)算機(jī)內(nèi)的瀏覽器的功能,在HTML形式的文件內(nèi)所含的腳本和檢索引擎部之間進(jìn)行自然語言檢索的啟動(dòng)處理和數(shù)據(jù)傳遞。
以下,參照附圖,對(duì)根據(jù)本發(fā)明的一個(gè)實(shí)施方式的檢索系統(tǒng)進(jìn)行說明。圖1是表示該實(shí)施方式的結(jié)構(gòu)的方框圖。在手冊(cè)存儲(chǔ)部1內(nèi),以HTML形式記載存儲(chǔ)有與個(gè)人計(jì)算機(jī)連接的外圍設(shè)備(例如,打印機(jī),掃描器,CRT等)的使用說明等的手冊(cè)。
接口部2在選擇了手冊(cè)時(shí),啟動(dòng)預(yù)先在個(gè)人計(jì)算機(jī)內(nèi)為讀取HTML形式的文件而設(shè)定的瀏覽器,該瀏覽器是通過解釋執(zhí)行手冊(cè)的腳本語句來啟動(dòng)的。并且,接口部2在啟動(dòng)時(shí)通過執(zhí)行接口功能,調(diào)用與作為瀏覽器的組件3的描述形式(命令形式)對(duì)應(yīng)記載的組件(以下稱為接口組件),并啟動(dòng)該組件。此處,接口功能是手冊(cè)內(nèi)記載的調(diào)用以HTML形式記載的上述接口組件的腳本語句的處理功能。
組件3同樣啟動(dòng)接口組件,調(diào)用啟動(dòng)檢索引擎部5的DLL(檢索組件),并進(jìn)行所啟動(dòng)的檢索引擎部5和接口部2的各數(shù)據(jù)(提問語句的字符串、檢索結(jié)果)的接收和發(fā)送。并且,接口部2具有檢索部2a,其從安裝信息存儲(chǔ)部4中對(duì)檢索用瀏覽器的種類進(jìn)行檢索;判定部2b,其根據(jù)表2c判定是否可以使用所檢索到的檢索用瀏覽器;以及表2c,其示出各檢索用瀏覽器和與該各檢索用瀏覽器對(duì)應(yīng)的接口組件之間的關(guān)系。
并且,接口組件是以各對(duì)應(yīng)的瀏覽器的命令形式來記載的,例如在Windows(注冊(cè)商標(biāo))的情況下,是以與Internet Explorer(注冊(cè)商標(biāo))具有的ActiveX(注冊(cè)商標(biāo))對(duì)應(yīng)的形式來記載的,或者是以與JAVA(注冊(cè)商標(biāo))小應(yīng)用程序?qū)?yīng)的形式來記載的,并具有調(diào)用用于啟動(dòng)后面說明的檢索引擎部5的檢索組件的功能。安裝信息存儲(chǔ)部4中存儲(chǔ)有安裝在個(gè)人計(jì)算機(jī)內(nèi)的應(yīng)用程序的信息;以及檢索引擎部5的組件、文檔數(shù)據(jù)庫(kù)7、詞素分析用詞典數(shù)據(jù)庫(kù)6和類似詞詞典數(shù)據(jù)庫(kù)13的目錄信息。
接口組件是用與各檢索用瀏覽器對(duì)應(yīng)的內(nèi)容來記載的,如上所述,具有調(diào)用檢索組件的功能。此處,檢索用瀏覽器是指具有與OS(操作系統(tǒng))一起安裝的Internet Explorer(Windows(注冊(cè)商標(biāo))系統(tǒng))等的ActiveX(注冊(cè)商標(biāo))或者JAVA(注冊(cè)商標(biāo))小應(yīng)用程序(Macintosh(注冊(cè)商標(biāo)))等的瀏覽器功能,能解釋HTML語句,并能通過HTML記載調(diào)用DLL的腳本語句的瀏覽器。
關(guān)于瀏覽器,除了上述種類以外,還可以使用不是與OS同時(shí)安裝的、可通過HTML的腳本語句進(jìn)行調(diào)用并可通過HTML的腳本語句調(diào)用DLL的其他瀏覽器。以下,把該其他瀏覽器以及ActiveX(注冊(cè)商標(biāo))和JAVA(注冊(cè)商標(biāo))小應(yīng)用程序總稱為檢索用瀏覽器。
檢索引擎部5使用詞素分析用詞典數(shù)據(jù)庫(kù)6對(duì)所輸入的字符串進(jìn)行詞素分析,并抽出關(guān)鍵字。詞素分析用詞典數(shù)據(jù)庫(kù)6存儲(chǔ)有用于對(duì)語句進(jìn)行詞素分析的詞典數(shù)據(jù)。并且,檢索引擎部5通過文檔數(shù)據(jù)庫(kù)7中的上述關(guān)鍵字檢索,檢索字符串,即檢索與提問語句對(duì)應(yīng)的所需的文檔數(shù)據(jù),并輸出檢索結(jié)果。文檔數(shù)據(jù)庫(kù)7中存儲(chǔ)有檢索對(duì)象的多個(gè)文檔數(shù)據(jù)。
而且,在上述該實(shí)施方式的個(gè)人計(jì)算機(jī)上的模塊結(jié)構(gòu)如圖7所示。在圖7所示的個(gè)人計(jì)算機(jī)100中,示出圖1所示的檢索系統(tǒng)的各要素與瀏覽器20、接口組件21、檢索組件22之間的關(guān)系。
下面,參照?qǐng)D2,對(duì)檢索引擎部5的結(jié)構(gòu)進(jìn)行說明。圖2是表示檢索引擎部5的結(jié)構(gòu)例的方框圖。在該圖中,文檔數(shù)據(jù)庫(kù)7、詞素分析用詞典數(shù)據(jù)庫(kù)6以及類似詞詞典數(shù)據(jù)庫(kù)13是圖1記載的數(shù)據(jù)庫(kù)。
詞素分析部10參照詞素分析用詞典數(shù)據(jù)庫(kù)6,對(duì)通過輸入部11輸入的提問語句的字符串進(jìn)行詞素分析。輸入部11從組件3輸入用于查找所需文檔數(shù)據(jù)的提問語句的字符串。檢索條件生成部12根據(jù)字符串生成檢索條件(關(guān)鍵字),該檢索條件用于高效率地檢索針對(duì)從輸入部11輸入的提問語句的回答。此處,檢索條件生成部12,例如,作為檢索條件,參照類似詞詞典數(shù)據(jù)庫(kù)13,對(duì)于對(duì)提問語句進(jìn)行詞素分析所得到的單詞,求出類似詞。在類似詞詞典數(shù)據(jù)庫(kù)13中把每個(gè)使用頻度高的單詞與類似詞關(guān)聯(lián)起來進(jìn)行存儲(chǔ)。文檔檢索部14根據(jù)檢索條件生成部12生成的檢索條件進(jìn)行檢索。
并且,在文檔數(shù)據(jù)庫(kù)7中,將區(qū)域分成索引部和數(shù)據(jù)部,來存儲(chǔ)單詞和與該單詞對(duì)應(yīng)的文檔之間的關(guān)聯(lián)關(guān)系。即,在索引部中,表示出單詞的一部分和具有該單詞的一部分的單詞組在數(shù)據(jù)部中的開頭地址的對(duì)應(yīng)關(guān)系。并且,在數(shù)據(jù)部中,對(duì)于具有上述單詞的一部分的各單詞組,存儲(chǔ)有單詞的完整數(shù)據(jù)和表示存儲(chǔ)包含該單詞的文檔的地址的文檔地址,在別的區(qū)域中存儲(chǔ)上述文檔的文檔數(shù)據(jù)。
這樣,文檔檢索部14由于從在索引部中得到的地址所表示的數(shù)據(jù)部中檢索文檔,因而,可從文檔數(shù)據(jù)庫(kù)7中高速地進(jìn)行基于單詞的文檔檢索,這一點(diǎn)在后面還要說明。
而且,在對(duì)語句進(jìn)行詞素分析時(shí),可取得獨(dú)立詞和附屬詞,并可取得各自的活用形。此處,在登錄到文檔數(shù)據(jù)庫(kù)7中時(shí),分類成動(dòng)詞、形容詞、形容動(dòng)詞、名詞中的任何一種。而且,原則上不登錄活用詞尾詞類(附屬詞詞類)。但是,對(duì)形成詞、形容動(dòng)詞和動(dòng)詞等單詞設(shè)置“肯定否定標(biāo)志”,在“肯定”的情況下,把“肯定否定標(biāo)志”設(shè)定為“0”,在有“否定”的情況下,把“肯定否定標(biāo)志”設(shè)定為“1”。
下面,參照?qǐng)D1、圖2和圖3,對(duì)加載一個(gè)實(shí)施方式的檢索組件,啟動(dòng)檢索引擎部5的動(dòng)作例進(jìn)行說明。圖3是表示檢索引擎部5的啟動(dòng)動(dòng)作的流程圖。在以下的說明中,把檢索打印機(jī)手冊(cè)的處理作為檢索系統(tǒng)的動(dòng)作例進(jìn)行說明。
用戶使用鼠標(biāo)等點(diǎn)擊預(yù)先安裝在個(gè)人計(jì)算機(jī)上并顯示在CRT畫面上的HTML形式的打印機(jī)手冊(cè)的圖標(biāo)。由此,啟動(dòng)安裝在個(gè)人計(jì)算機(jī)上的可解釋HTML的瀏覽器,對(duì)打印機(jī)手冊(cè)的HTML的腳本語句進(jìn)行解釋,使接口部2啟動(dòng),開始進(jìn)行檢索組件的加載處理。
然后,在接口部2中,檢索部2a從安裝信息存儲(chǔ)部4中檢索安裝在個(gè)人計(jì)算機(jī)上的瀏覽器。然后,判定部2b判定在表2c中是否將該瀏覽器設(shè)定成檢索用瀏覽器。
此時(shí),當(dāng)判定部2b檢測(cè)出從安裝信息存儲(chǔ)部4檢索出的瀏覽器在表2c中被設(shè)定成檢索用瀏覽器時(shí),判定為檢索引擎部5可以使用(可加載接口組件),處理進(jìn)入步驟S2。另一方面,當(dāng)判定部2b在表2c中檢測(cè)出從安裝信息存儲(chǔ)部4檢索出的瀏覽器未被設(shè)定成檢索用瀏覽器時(shí),判定為檢索引擎部5不可使用,處理進(jìn)入步驟S5(步驟S1)。
然后,接口部2從規(guī)定的DLL存儲(chǔ)區(qū)域加載被判定為可以使用的接口組件,將其在存儲(chǔ)器上展開,進(jìn)行檢索組件的啟動(dòng),即組件3的啟動(dòng)。該啟動(dòng)的瀏覽器是與OS同時(shí)安裝的瀏覽器,如果OS是Windows(注冊(cè)商標(biāo)),則該瀏覽器是ActiveX(注冊(cè)商標(biāo))或者JAVA(注冊(cè)商標(biāo))小應(yīng)用程序,如果OS是Mac-OS-X(注冊(cè)商標(biāo)),則該瀏覽器是JAVA(注冊(cè)商標(biāo))小應(yīng)用程序組中的任何一個(gè)(步驟S2)。
而且,組件3具有調(diào)用檢索引擎部5的檢索組件的功能(根據(jù)HTML的腳本語句的描述調(diào)用檢索引擎部5的檢索組件的功能),從上述DLL存儲(chǔ)區(qū)域中檢索上述檢索組件,將其加載,在存儲(chǔ)器上展開,并啟動(dòng)檢索引擎部5(步驟S3)。這樣,組件3在CRT畫面中顯示包含輸入檢索使用的提問語句的字符串的輸入欄的檢索窗(步驟S4),并結(jié)束檢索引擎部5的啟動(dòng)處理(步驟S5)。然后,接口部2把打印機(jī)手冊(cè)的封面等其他HTML顯示在上述檢索窗的相鄰部分(步驟S6)。這樣,接口部2結(jié)束從手冊(cè)存儲(chǔ)部1加載打印機(jī)手冊(cè)的動(dòng)作。
下面,參照?qǐng)D4,對(duì)組件3進(jìn)行的檢索組件的加載動(dòng)作進(jìn)行說明。圖4是表示組件3中的檢索組件的加載動(dòng)作(與圖3的步驟S2和S3對(duì)應(yīng))的一例的流程圖。
接口部2加載組件3的接口組件,啟動(dòng)組件3(步驟S11)。然后,當(dāng)組件3啟動(dòng)時(shí),根據(jù)HTML的腳本語句中描述的處理,對(duì)檢索組件是否可加載進(jìn)行判定,如果可加載,則進(jìn)行檢索組件的加載,處理進(jìn)入步驟S13,如果不可加載,則處理進(jìn)入步驟S16,即,跳過檢索HTML的顯示(步驟S12)。
然后,組件3在通過檢索引擎部5加載檢索組件而啟動(dòng)時(shí),從安裝信息存儲(chǔ)部4中讀出詞素分析用詞典數(shù)據(jù)庫(kù)6、文檔數(shù)據(jù)庫(kù)7和類似詞詞典數(shù)據(jù)庫(kù)13等的目錄信息,并進(jìn)行檢索引擎部5的檢索處理所需的初始化(步驟S13)。然后,組件3例如從手冊(cè)存儲(chǔ)部1中取得以檢索HTML形式顯示的檢索分類(步驟S14)。該檢索分類是為了縮小檢索范圍而按照檢索對(duì)象的文檔種類來分類的,例如,打印機(jī)手冊(cè)分類成“打印方法”、“故障”、“軟件”等類別。
然后,組件3在CRT畫面中顯示包含輸入檢索用的提問語句的輸入欄的檢索窗和用于選擇上述檢索分類的選擇部(步驟S15)。然后,接口部2結(jié)束組件3的接口組件的加載,組件3結(jié)束檢索引擎部5的初始化(步驟S16)。
下面,參照?qǐng)D5,對(duì)檢索引擎部5進(jìn)行的檢索處理的動(dòng)作進(jìn)行說明。圖5是表示檢索引擎部5中的檢索處理的動(dòng)作例的流程圖。
如圖4的步驟S13所記載的那樣,進(jìn)行檢索引擎部5的檢索處理所需的初始化(步驟S21)。檢索引擎部5從上述選擇部中取得檢索分類,縮小檢索對(duì)象的范圍,對(duì)通過組件3從接口部2輸入的字符串進(jìn)行詞素分析,并進(jìn)行檢索條件的分析和抽出(步驟S22)。
即,在步驟S22中,輸入部11讀取所輸入的提問語句。此處,假定作為字符串,輸入了“打印機(jī)不工作”。輸入部11把此處輸入的字符串傳遞到檢索條件生成部12。然后,檢索條件生成部12把接收到的提問語句傳送給詞素分析部10。詞素分析部10接收該提問語句,參照詞素分析用詞典數(shù)據(jù)庫(kù)6,對(duì)接收到的提問語句進(jìn)行詞素分析。作為該分析的結(jié)果得到“名詞打印機(jī)”、“動(dòng)詞工作(否定形)”。
接著,詞素分析部10把此處獲得的分析結(jié)果返回到檢索條件生成部12。
然后,檢索條件生成部12根據(jù)詞素分析結(jié)果,生成檢索條件。此處,檢索條件為“名詞打印機(jī),動(dòng)詞工作(否定肯定標(biāo)志=1)”。檢索條件生成部12把此處生成的檢索條件傳遞到檢索部14。
并且,在步驟S23中,文檔檢索部14使用從檢索條件生成部12接收的檢索條件,在文檔數(shù)據(jù)庫(kù)7內(nèi)進(jìn)行檢索(步驟S23)。該檢索的結(jié)果是,在文檔檢索部14中,從文檔數(shù)據(jù)庫(kù)7獲得包含名詞的“打印機(jī)”且包含動(dòng)詞的“工作(否定形)”的文檔數(shù)據(jù)的頁(yè)面ID。如果存在多個(gè)對(duì)應(yīng)的文檔數(shù)據(jù),則在文檔檢索部14中獲得多個(gè)頁(yè)面ID。然后,文檔檢索部14把檢索結(jié)束通知給檢索條件生成部12。接著,檢索條件生成部12根據(jù)預(yù)先設(shè)定的重要度、加權(quán)值或者標(biāo)題順序(例如,あいうえお順序,字母順序),把頁(yè)面ID按照文檔數(shù)據(jù)順序重新排列之后,把文檔檢索部14檢索的檢索結(jié)果輸出給文檔檢索部14(步驟S24)。然后,接口部2通過組件3,把從文檔檢索部14輸入的重新排列后的檢索結(jié)果的文檔顯示在CRT(陰極射線管)等上。
然后,參照?qǐng)D6,對(duì)本發(fā)明的檢索系統(tǒng)在個(gè)人計(jì)算機(jī)上的安裝處理進(jìn)行說明。圖6是用于對(duì)安裝動(dòng)作例進(jìn)行說明的流程圖。使用存儲(chǔ)有安裝程序和檢索系統(tǒng)所需的文件等的CD-ROM(只讀光盤存儲(chǔ)器compactdisc read-only memory)進(jìn)行安裝。
當(dāng)用戶開始安裝處理時(shí),在個(gè)人計(jì)算機(jī)的存儲(chǔ)器上展開并啟動(dòng)安裝程序,該安裝程序(安裝單元)判定安裝在個(gè)人計(jì)算機(jī)上的OS的種類是例如Windows(注冊(cè)商標(biāo))還是Mac-OS(注冊(cè)商標(biāo))(步驟S31)。
然后,轉(zhuǎn)到安裝檢索組件的處理,在圖1所示的接口部2的結(jié)構(gòu)的情況下,在接口部2啟動(dòng)時(shí),檢測(cè)所安裝的檢索用瀏覽器的種類,使用與該檢索用瀏覽器對(duì)應(yīng)的調(diào)用DLL。因此,由于沒有必要進(jìn)行檢索用瀏覽器的檢索和判定,因而在安裝操作中,跳過步驟S32和步驟S33而不執(zhí)行。即,安裝程序使處理從步驟S31進(jìn)入步驟S34,進(jìn)行檢索用組件的安裝處理。
例如,安裝程序在步驟S31中,檢測(cè)出OS是Windows(注冊(cè)商標(biāo))時(shí),把與Internet Explorer(注冊(cè)商標(biāo))中的ActiveX(注冊(cè)商標(biāo))對(duì)應(yīng)的檢索組件或者與JAVA(注冊(cè)商標(biāo))小應(yīng)用程序?qū)?yīng)的檢索組件等與各檢索用瀏覽器的種類相對(duì)應(yīng),作為接口部2的表2c進(jìn)行安裝(步驟S34)。
然后,安裝程序把所安裝的全部種類的檢索組件登錄在安裝信息存儲(chǔ)部4內(nèi)(步驟S35)。然后,安裝程序安裝檢索使用的其他文件,即,安裝接口部2的檢索部2a和判定部2b、檢索引擎部5的組件、詞素分析用詞典數(shù)據(jù)庫(kù)6、文檔數(shù)據(jù)庫(kù)7的文件(步驟S36),結(jié)束安裝處理(步驟S37)。然后,安裝程序進(jìn)行打印機(jī)手冊(cè)的文件等的安裝(步驟S38)。
另一方面,與圖1的接口部2的結(jié)構(gòu)不同,與預(yù)先安裝的檢索用瀏覽器對(duì)應(yīng),在安裝檢索組件時(shí),執(zhí)行圖6中的步驟S32和步驟S33的處理。
在步驟S31中檢測(cè)出OS的種類之后,安裝程序在安裝信息存儲(chǔ)部4中,對(duì)安裝有何種檢索用瀏覽器進(jìn)行檢測(cè)(步驟S32)。
然后,當(dāng)安裝程序檢測(cè)出檢索用瀏覽器時(shí),處理進(jìn)入步驟S34,并且當(dāng)未檢測(cè)出檢索用瀏覽器時(shí),處理進(jìn)入步驟S37(步驟S33)。然后,安裝程序進(jìn)行與上述檢索用瀏覽器對(duì)應(yīng)的檢索組件的安裝(步驟S34)。以后的處理與已述的步驟S35~S38相同。此處,在步驟S37中,在安裝的接口部2內(nèi)沒有檢索部2a、判定部2b和表2c的文件,不進(jìn)行所安裝的檢索用瀏覽器的檢索,而是僅安裝加載所安裝的檢索組件的功能。
另外,也可以把用于實(shí)現(xiàn)圖1中的處理部的功能的程序存儲(chǔ)在計(jì)算機(jī)可讀的存儲(chǔ)介質(zhì)內(nèi),通過把存儲(chǔ)在該存儲(chǔ)介質(zhì)內(nèi)的程序讀入到計(jì)算機(jī)系統(tǒng)內(nèi)并執(zhí)行該程序,來進(jìn)行上述檢索系統(tǒng)中的檢索處理。另外,此處所謂的“計(jì)算機(jī)系統(tǒng)”包含OS和外圍設(shè)備等硬件。并且,“計(jì)算機(jī)系統(tǒng)”也包含具有主頁(yè)提供環(huán)境(或者顯示環(huán)境)的WWW系統(tǒng)。而且,“計(jì)算機(jī)可讀的存儲(chǔ)介質(zhì)”是指軟磁盤、光磁盤、ROM、CD-ROM等可移動(dòng)介質(zhì)、內(nèi)置于計(jì)算機(jī)系統(tǒng)中的硬盤等存儲(chǔ)裝置。此外,“計(jì)算機(jī)可讀的存儲(chǔ)介質(zhì)”也包含將程序保持一定時(shí)間的介質(zhì),如通過互聯(lián)網(wǎng)等網(wǎng)絡(luò)或電話線路等通信線路發(fā)送程序時(shí)的成為服務(wù)器或客戶機(jī)的計(jì)算機(jī)系統(tǒng)內(nèi)部的易失性存儲(chǔ)器(RAM)。
并且,上述程序可以從把該程序存儲(chǔ)在存儲(chǔ)裝置等內(nèi)的計(jì)算機(jī)系統(tǒng),通過傳送介質(zhì),或者由傳送介質(zhì)中的傳送波傳送到其他計(jì)算機(jī)系統(tǒng)。此處,傳送程序的“傳送介質(zhì)”是指如互聯(lián)網(wǎng)等網(wǎng)絡(luò)(通信網(wǎng))或電話線路等通信線路(通信線)那樣,具有信息傳送功能的介質(zhì)。并且,上述程序可以是用于實(shí)現(xiàn)上述功能的一部分的程序。而且,可以是可以通過與已存儲(chǔ)在計(jì)算機(jī)系統(tǒng)內(nèi)的程序相組合來實(shí)現(xiàn)上述功能的所謂的差文件(差程序)。
權(quán)利要求
1.一種檢索系統(tǒng),其特征在于,具有接口單元,其利用可解釋HTML形式的文件內(nèi)所含的腳本的瀏覽器功能,啟動(dòng)與所安裝的瀏覽器對(duì)應(yīng)的接口組件,并由該接口組件調(diào)用檢索組件;以及檢索引擎單元,其由上述檢索組件啟動(dòng),對(duì)所輸入的字符串進(jìn)行解釋,并與解釋結(jié)果對(duì)應(yīng),在數(shù)據(jù)庫(kù)中進(jìn)行與該字符串對(duì)應(yīng)的數(shù)據(jù)的檢索處理。
2.根據(jù)權(quán)利要求1所述的檢索系統(tǒng),其特征在于,上述接口單元具有檢索單元,該檢索單元根據(jù)存儲(chǔ)在安裝信息存儲(chǔ)部?jī)?nèi)的安裝信息,對(duì)安裝有何種瀏覽器進(jìn)行檢測(cè)。
3.根據(jù)權(quán)利要求1或權(quán)利要求2所述的檢索系統(tǒng),其特征在于,上述接口單元具有表,該表中記載著多個(gè)瀏覽器和與各瀏覽器分別對(duì)應(yīng)的接口組件之間的關(guān)系。
4.根據(jù)權(quán)利要求3所述的檢索系統(tǒng),其特征在于,上述接口單元具有判定部,該判定部從上述表中抽出與檢索單元檢測(cè)出的瀏覽器對(duì)應(yīng)的接口組件。
5.根據(jù)權(quán)利要求1至權(quán)利要求3中的任何一項(xiàng)所述的檢索系統(tǒng),其特征在于,上述檢索引擎單元具有文檔數(shù)據(jù)庫(kù),其存儲(chǔ)檢索對(duì)象的文檔數(shù)據(jù);詞素分析用詞典數(shù)據(jù)庫(kù),其預(yù)先存儲(chǔ)了詞素分析用數(shù)據(jù);詞素分析單元,其參照上述詞素分析用詞典數(shù)據(jù)庫(kù),通過對(duì)從輸入部輸入的字符串進(jìn)行詞素分析來抽出單詞,并針對(duì)該單詞,確定肯定形或否定形;檢索條件生成單元,其根據(jù)上述單詞和確定肯定或否定的信息,生成檢索條件;以及文檔檢索單元,其從上述文檔數(shù)據(jù)庫(kù)中檢索符合上述檢索條件的文檔。
6.一種可在計(jì)算機(jī)中執(zhí)行的檢索程序,包括以下處理接口單元利用可解釋HTML形式的文件內(nèi)所含的腳本的瀏覽器功能,啟動(dòng)與所安裝的瀏覽器對(duì)應(yīng)的接口組件,并由該接口組件調(diào)用檢索組件;以及檢索引擎單元由上述檢索組件啟動(dòng),對(duì)所輸入的字符串進(jìn)行解釋,并與解釋結(jié)果對(duì)應(yīng),在數(shù)據(jù)庫(kù)中進(jìn)行與該字符串對(duì)應(yīng)的數(shù)據(jù)的檢索處理。
7.根據(jù)權(quán)利要求6所述的檢索程序,其特征在于,上述接口處理包括以下處理根據(jù)存儲(chǔ)在安裝信息存儲(chǔ)部?jī)?nèi)的安裝信息,對(duì)安裝有何種瀏覽器進(jìn)行檢測(cè)。
8.一種個(gè)人計(jì)算機(jī),其特征在于,具有手冊(cè)存儲(chǔ)部,其存儲(chǔ)HTML形式的手冊(cè)文檔;瀏覽器,其可解釋上述手冊(cè)文件內(nèi)所含的腳本;接口部,其啟動(dòng)與上述瀏覽器對(duì)應(yīng)的接口組件,并通過上述接口組件調(diào)用檢索組件;文檔數(shù)據(jù)庫(kù),其存儲(chǔ)檢索對(duì)象的文檔數(shù)據(jù);檢索引擎部,其由上述檢索組件啟動(dòng),解釋所輸入的提問語句,并與該解釋結(jié)果對(duì)應(yīng),進(jìn)行上述檢索對(duì)象的文檔數(shù)據(jù)的檢索;以及安裝信息存儲(chǔ)部,其存儲(chǔ)所安裝的各種應(yīng)用程序和數(shù)據(jù)的信息。
9.根據(jù)權(quán)利要求8所述的個(gè)人計(jì)算機(jī),其特征在于,上述接口部具有檢索部,該檢索部根據(jù)存儲(chǔ)在上述安裝信息存儲(chǔ)部?jī)?nèi)的信息,對(duì)安裝有何種瀏覽器進(jìn)行檢測(cè)。
10.根據(jù)權(quán)利要求8或權(quán)利要求9所述的個(gè)人計(jì)算機(jī),其特征在于,上述接口部具有表,該表中記載著多個(gè)瀏覽器和與各瀏覽器分別對(duì)應(yīng)的接口組件之間的關(guān)系。
11.根據(jù)權(quán)利要求10所述的個(gè)人計(jì)算機(jī),其特征在于,上述接口部具有判定部,該判定部從上述表中抽出與上述檢索部檢測(cè)出的瀏覽器對(duì)應(yīng)的接口組件。
12.根據(jù)權(quán)利要求8至權(quán)利要求11中的任何一項(xiàng)所述的個(gè)人計(jì)算機(jī),其特征在于,還具有詞素分析用詞典數(shù)據(jù)庫(kù),其預(yù)先存儲(chǔ)了詞素分析用數(shù)據(jù);以及類似詞詞典數(shù)據(jù)庫(kù),其把每個(gè)使用頻度高的單詞與類似詞關(guān)聯(lián)起來進(jìn)行存儲(chǔ);上述檢索引擎部具有詞素分析部,其參照上述詞素分析用詞典數(shù)據(jù)庫(kù),分析上述提問語句來抽出單詞,并針對(duì)上述單詞確定肯定形或否定形;檢索條件生成部,其參照上述類似詞詞典數(shù)據(jù)庫(kù),求出包含通過分析上述提問語句所抽出的單詞的類似詞的檢索條件;以及文檔檢索部,其從上述文檔數(shù)據(jù)庫(kù)中檢索符合上述檢索條件的文檔。
全文摘要
本發(fā)明提供一種利用Web瀏覽器的檢索系統(tǒng)和檢索程序以及個(gè)人計(jì)算機(jī),即使是初學(xué)者用戶,也可以在沒有條件運(yùn)行HTTP服務(wù)器的個(gè)人計(jì)算機(jī)內(nèi),通過輸入作為提問語句的自然語言的字符串,容易地根據(jù)該字符串檢索所需的文章。該檢索系統(tǒng)具有接口單元,其利用可解釋HTML形式的文件內(nèi)所含的腳本的瀏覽器功能,啟動(dòng)與所安裝的瀏覽器對(duì)應(yīng)的接口組件,并由該接口組件調(diào)用檢索組件;以及檢索引擎單元,其由上述檢索組件啟動(dòng),對(duì)所輸入的字符串進(jìn)行解釋,并與解釋結(jié)果對(duì)應(yīng),在數(shù)據(jù)庫(kù)中進(jìn)行與該字符串對(duì)應(yīng)的數(shù)據(jù)檢索處理。
文檔編號(hào)G06F17/30GK1591420SQ20041005729
公開日2005年3月9日 申請(qǐng)日期2004年8月27日 優(yōu)先權(quán)日2003年8月29日
發(fā)明者田中敬重, 河西庸雄, 長(zhǎng)保和義 申請(qǐng)人:精工愛普生株式會(huì)社