欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

在一個(gè)或多個(gè)網(wǎng)絡(luò)上進(jìn)行通用搜索管理的系統(tǒng)的制作方法

文檔序號(hào):6377902閱讀:170來源:國知局
專利名稱:在一個(gè)或多個(gè)網(wǎng)絡(luò)上進(jìn)行通用搜索管理的系統(tǒng)的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及數(shù)據(jù)庫網(wǎng)絡(luò)。更具體地說,本發(fā)明涉及在數(shù)據(jù)庫網(wǎng)絡(luò)上管理關(guān)鍵詞搜索和搜索結(jié)果。
背景技術(shù)
因特網(wǎng)(互聯(lián)網(wǎng))文本檢索系統(tǒng)接受按照由多個(gè)關(guān)鍵詞T1、T2、...Ti、...Tn構(gòu)成的搜索查詢S給出的請(qǐng)求信息語句(statement)并返回與該搜索查詢匹配的文檔列表。對(duì)在因特網(wǎng)數(shù)據(jù)庫上進(jìn)行這種搜索的需求已引起搜索引擎的發(fā)展,這些搜索引擎提供到信息源的查詢接口并根據(jù)所列文檔與搜索查詢的匹配好壞程度順序排隊(duì)返回搜索結(jié)果。然而,各種搜索引擎以不同方式處理搜索詢問(interrogation),結(jié)果,相同的查詢從不同的搜索引擎會(huì)得到不同的結(jié)果。再有,隨著萬維網(wǎng)(word wide web)的擴(kuò)展,可用于搜索的數(shù)據(jù)庫和搜索引擎已增長到使得用戶可得到的數(shù)據(jù)量急驟增長的程度。此外,由搜索者請(qǐng)求的信息可以是印刷的、音頻和/或可視的數(shù)據(jù)。這種數(shù)據(jù)可以是以模擬的和數(shù)字的形式、以多種不同格式和以多種機(jī)器的和自然的語言來表現(xiàn)。數(shù)據(jù)的類型及其形式、格式和語言可能不是搜索者所要求的或者甚至可能不是搜索者所能理解的,而且結(jié)果可能是不完全的、不能理解的、不準(zhǔn)確的和變化的。
由于上述的以及其他的考慮,要從所有有關(guān)來源的信息搜索得到完全的、可理解的和準(zhǔn)確的結(jié)果是困難的。再有,進(jìn)行這種搜索所需要的信息處理資源和工時(shí)會(huì)是昂貴的。為在分布式信息系統(tǒng)中克服信息過載(overload),需要一個(gè)自動(dòng)的信息檢索系統(tǒng)和方法,它優(yōu)選最可能向搜索提供最佳響應(yīng)的各類數(shù)據(jù)源或數(shù)據(jù)庫,并根據(jù)搜索者的需要定制所收到的響應(yīng)。

發(fā)明內(nèi)容
所以,本發(fā)明的一個(gè)目的是提供一種改進(jìn)的查詢路由選擇系統(tǒng)。
本發(fā)明進(jìn)一步的目的是提供一種查詢路由系統(tǒng),它能夠訪問以多種形式、格式和語言表現(xiàn)的信息,并能將該信息以其他類型、格式和語言提供給搜索者。
根據(jù)本發(fā)明,提供了一種搜索引擎系統(tǒng),其中,以各種配置的輸入數(shù)據(jù)首先通過過渡轉(zhuǎn)換層,該層把多種配置的數(shù)據(jù)轉(zhuǎn)換成共同的(common)或內(nèi)核(kernel)計(jì)算機(jī)形式和語言。以這種內(nèi)核形式和語言對(duì)該數(shù)據(jù)進(jìn)行操作和存儲(chǔ)。然后,被操作的數(shù)據(jù)通過過渡轉(zhuǎn)換層輸出,并以所希望的與輸入形式和語言相同或不同的格式提供。


圖1是在線區(qū)域網(wǎng)絡(luò)的系統(tǒng)組織的示意圖;圖2是包含本發(fā)明并與圖1所示網(wǎng)絡(luò)連接的一個(gè)專用網(wǎng)絡(luò)的示意圖;圖3是展示與本發(fā)明的轉(zhuǎn)換層及信息內(nèi)核相連的信息內(nèi)源及搜索引擎的結(jié)構(gòu)安排的示意圖;圖4是展示本發(fā)明的內(nèi)核的細(xì)節(jié)的示意圖;圖5是展示根據(jù)本發(fā)明進(jìn)行的后端(back-end)數(shù)據(jù)收集的示意流程圖;圖6是展示根據(jù)本發(fā)明對(duì)關(guān)鍵詞查詢的處理的示意流程圖;以及圖7是展示根據(jù)本發(fā)明對(duì)文檔請(qǐng)求查詢的處理的示意流程圖。
具體實(shí)施例方式
現(xiàn)在參考圖1,通過包括網(wǎng)絡(luò)節(jié)點(diǎn)服務(wù)器的廣域網(wǎng),如因特網(wǎng)104,經(jīng)由在線服務(wù)實(shí)現(xiàn)多個(gè)用戶計(jì)算機(jī)100a至100n和多個(gè)信息服務(wù)器102a至102n之間的通信。網(wǎng)絡(luò)節(jié)點(diǎn)服務(wù)器管理網(wǎng)絡(luò)通信,例如任何給定用戶的計(jì)算機(jī)與一個(gè)信息服務(wù)器之間的通信。
計(jì)算機(jī)100裝備有通信軟件,包括WWW瀏覽器,如網(wǎng)景通信公司的Netscape瀏覽器,它允許購物者經(jīng)由因特網(wǎng)連接和使用在線購物服務(wù)。在用戶計(jì)算機(jī)100上的軟件管理用戶從服務(wù)器接收的信息的顯示并把用戶操作(動(dòng)作)回送到適當(dāng)?shù)男畔⒎?wù)器102,從而可以向用戶呈現(xiàn)附加的顯示信息或?qū)ζ淦鹱饔玫男畔?。可通過調(diào)制解調(diào)器或其他手段,如電纜連接,建立到因特網(wǎng)網(wǎng)絡(luò)節(jié)點(diǎn)的連接(106)。
圖1所示服務(wù)器(下文中討論)是商家(merchant)的服務(wù)器,它們通過因特網(wǎng)提供收費(fèi)的產(chǎn)品、服務(wù)和信息。盡管下文的討論是針對(duì)購物者和這類商家之間在因特網(wǎng)上的通信,但它可通用于網(wǎng)絡(luò)上的任何信息查尋者和任何信息提供者。(例如,信息提供者可以是一個(gè)圖書館,如大學(xué)圖書館、公共圖書館或國會(huì)圖書館,或者其他類型的信息提供者)。關(guān)于一個(gè)商家和該商家的產(chǎn)品的信息被存儲(chǔ)在購物數(shù)據(jù)庫108中,商家服務(wù)器102有權(quán)訪問它。這可以是商家自己的數(shù)據(jù)庫或該商家的供應(yīng)商的數(shù)據(jù)庫??捎缮碳曳?wù)器訪問的可作為網(wǎng)頁(web page)公布的全部產(chǎn)品信息被編制索引,全文本索引數(shù)據(jù)庫110記錄每個(gè)詞的出現(xiàn)的次數(shù)和它們?cè)谠撐恢蒙系氖褂?。除了單?dú)商家的服務(wù)器以及其他信息提供者外,還有多個(gè)搜索服務(wù)提供者的服務(wù)器114a至114n,如Google公司的Google,這些提供者維護(hù)各單獨(dú)商家102a至102n的產(chǎn)品的全文本索引116,這是通過詢問各單獨(dú)商家的產(chǎn)品信息數(shù)據(jù)庫108得到的。這些搜索服務(wù)提供者中有些,如Google,是通用搜索提供者,而另一些是特定主題的搜索提供者。
商家和搜索應(yīng)用服務(wù)提供者每個(gè)可以維護(hù)一個(gè)關(guān)于購物者以及他們的購買習(xí)慣信息的數(shù)據(jù)庫,以便為購物者定制在線購物。為購物者建立定制的電子購物環(huán)境的操作包括積累關(guān)于該購物者喜好的數(shù)據(jù)。與電子購物選項(xiàng)有關(guān)的數(shù)據(jù),如由購物者選定的特定網(wǎng)站和特定產(chǎn)品、對(duì)這些網(wǎng)站的進(jìn)入和退出時(shí)間、對(duì)這些網(wǎng)站的光顧次數(shù)等,都由每個(gè)商家記錄和處理,以為購物者建立購物簡檔。然后,可對(duì)原始數(shù)據(jù)進(jìn)行處理以建立購物者的喜好簡檔。該簡檔還可以包括關(guān)于該購物者的個(gè)人數(shù)據(jù)或特征(如年齡、職業(yè)、地址、愛好),如購物者在訂購服務(wù)時(shí)由購物者提供的或從其他來源得到的。簡檔數(shù)據(jù)能幫助鑒別關(guān)鍵詞查詢中詞的含義。例如,在醫(yī)生的查詢中的一個(gè)關(guān)鍵詞與土本工程師給出的同一關(guān)鍵詞的使用會(huì)有完全不同的含義。關(guān)于購物者的數(shù)據(jù)積累被放在每個(gè)商家的購物者簡檔數(shù)據(jù)庫112或118中。在商家和搜索應(yīng)用服務(wù)提供者的數(shù)據(jù)庫中每個(gè)單獨(dú)購物者的簡檔可以是彼此不同的,這取決于特定商家或服務(wù)提供者與該購物者的經(jīng)歷以及它們的建檔軟件。可以在由購物者進(jìn)行搜索的過程中不斷收集數(shù)據(jù),從而能得到和使用最新的簡檔數(shù)據(jù)。
利用關(guān)于在購物事務(wù)(transaction)中涉及的購物者的信息,商家能滿足購物者的需要并向購物者呈現(xiàn)觀看和購買最可能感興趣的商品的機(jī)會(huì),因?yàn)樵撋碳业漠a(chǎn)品和服務(wù)被引導(dǎo)向那些已經(jīng)直接或間接表示過對(duì)這些產(chǎn)品和服務(wù)感興趣的那些購物者。
當(dāng)由購物者把搜索特征以關(guān)鍵詞的形式輸入他/她的瀏覽器的默認(rèn)頁或主頁上提供的空間中時(shí),商家web服務(wù)器102的搜索引擎使用這些關(guān)鍵詞對(duì)所訪問的全文本索引數(shù)據(jù)庫110或118進(jìn)行搜索,并得到描述含有與這些關(guān)鍵詞匹配的那些產(chǎn)品和服務(wù)的一個(gè)文檔列表。這一文檔列表含有基本測試等級(jí)Tf(包括點(diǎn)擊次數(shù)、它們的位置等,這些用于對(duì)文檔列表排序),以具有較高評(píng)分的文檔排在頂部。然后把這一列表發(fā)送給排序模塊,它將應(yīng)用一個(gè)排序算法,如斯坦福大學(xué)(Stanford,CA94305)計(jì)算機(jī)科學(xué)系的Sergey Brin和Lawrence Page的題為“大規(guī)模超文本W(wǎng)eb搜索引擎結(jié)構(gòu)剖析”(“The Anatomy of a Large-Scale Hypertextual Web SearchEngine”)的文章(該文章在這里被納入作為參考)中描述的算法,使用文本因子(text factor)和其他排序因子(ranking factor),如鏈接分析、普及性、來自用戶簡檔的用戶喜好等,對(duì)文檔列表排序,還可以引入其他反映該信息提供者的偏向和興趣的因子。然后向用戶提供基于該排序算法的一個(gè)重新排序的文檔列表。
圖1顯示一個(gè)信息整合器(consolidator)120。信息整合器從各種商家服務(wù)器102和搜索應(yīng)用服務(wù)提供者服務(wù)器114得到信息并將其提供給用戶。信息整合器可以是一個(gè)獨(dú)立的數(shù)據(jù)源,或者如圖中虛線所示,與提供數(shù)據(jù)的商家102a相關(guān)聯(lián)或與獲得數(shù)據(jù)的用戶100a關(guān)聯(lián)。信息整合器通過修改它從各來源接收的數(shù)據(jù)提供附加值。如所指出的那樣,由商家或搜索應(yīng)用服務(wù)提供者提供的數(shù)據(jù)的排序不同于由原始排序元素?cái)?shù)據(jù)(rawranking element data)所提供的排序,這種排序或者是對(duì)用戶有幫助的,或者是會(huì)添加數(shù)據(jù)提供者的偏向(bias)。信息整合器可以修改那些數(shù)據(jù)以去掉數(shù)據(jù)提供者的偏向并增加對(duì)用戶有用的其他信息。如這里描述的那樣,信息整合器是在一個(gè)專用網(wǎng)絡(luò)上。
如圖2中所示,信息整合器120被連入專用內(nèi)部網(wǎng)絡(luò)(private intranet)200,該專用內(nèi)部網(wǎng)絡(luò)200具有一個(gè)服務(wù)器202并包含若干計(jì)算機(jī)100,如圖1中描述的那些計(jì)算機(jī),從而計(jì)算機(jī)100能獲得存儲(chǔ)在該專用內(nèi)部網(wǎng)的內(nèi)部源中的信息。對(duì)內(nèi)部網(wǎng)200提供了公共因特網(wǎng)的訪問能力,它提供對(duì)公共因特網(wǎng)104上服務(wù)的訪問并使信息整合器能在該因特網(wǎng)上提供服務(wù)?!胺阑饓Α?22把公共因特網(wǎng)104與專用內(nèi)部網(wǎng)200分離開,只允許具有正確ID和口令的那些用戶從公共因特網(wǎng)104進(jìn)入內(nèi)部網(wǎng)200。內(nèi)部網(wǎng)200的內(nèi)部源是公司文檔管理系統(tǒng)204和內(nèi)部數(shù)據(jù)庫206。還有,對(duì)內(nèi)部網(wǎng)200提供了一個(gè)語音識(shí)別系統(tǒng)220,其能響應(yīng)語音命令和語音指令的壓縮數(shù)字化數(shù)據(jù),這些數(shù)據(jù)是由客戶計(jì)算機(jī)100從單獨(dú)計(jì)算機(jī)100或者這種計(jì)算機(jī)的客戶機(jī)網(wǎng)絡(luò)提供的。
根據(jù)本發(fā)明,信息整合器120包含一個(gè)集成的搜索管理系統(tǒng)226,它接收來自內(nèi)部網(wǎng)和因特網(wǎng)中的搜索引擎的查詢和信息,并通過計(jì)算機(jī)100、PDA 228訪問除在內(nèi)部網(wǎng)和因特網(wǎng)之外的其他信息源。例如,傳送給計(jì)算機(jī)224并由語音識(shí)別系統(tǒng)220與文本關(guān)聯(lián)的語音消息能被存儲(chǔ)在集成的搜索管理系統(tǒng)226中。該集成管理系統(tǒng)包含中央處理單元230、網(wǎng)絡(luò)接口232以及足夠大的隨機(jī)存取存儲(chǔ)器234和高密度存儲(chǔ)裝置236,以完成它的功能。
如圖3中所示,該集成搜索管理系統(tǒng)226有一個(gè)核心或內(nèi)核300,它只對(duì)擴(kuò)展標(biāo)記語言(XML)形式的具有以通用統(tǒng)一字符編碼字符集(Universal Unicode Character)編碼的字符的數(shù)據(jù)和代碼進(jìn)行操作。來自所有可能的源的數(shù)據(jù)在進(jìn)入該集成搜索管理系統(tǒng)之前均被轉(zhuǎn)換成共同的形式。例如,HTML頁、文本文件以及所提到的語音消息都被轉(zhuǎn)換成共同的形式。以搜索引擎302、信息源304和用戶機(jī)器306的各種源形式出現(xiàn)的數(shù)據(jù)在一系列含有翻譯器的外殼程序(shell)中被轉(zhuǎn)換成XML內(nèi)核形式,在這些外殼程序中各種文檔在內(nèi)部翻譯器中從它們的源形式轉(zhuǎn)換成XML形式。這些翻譯器308被安排在若干層中,從而在源語言和內(nèi)核語言之間的翻譯過程中它們能被共享。當(dāng)要增加一個(gè)新的源層時(shí),可以提供一個(gè)附加層以在新的或被修改的源語言和已有的源語言之間進(jìn)行翻譯。如果要容納一個(gè)完全新的協(xié)議,則可以增加翻譯器308和310的附加段(segment)312。這將演變技術(shù)提供(應(yīng)用于)給搜索管理系統(tǒng),從而模塊化使用用于翻譯單元308和310的面向?qū)ο蟮某绦蚰K。
如圖4中所示,這種結(jié)構(gòu)安排允許內(nèi)核300包含最小數(shù)量部件。這些部件是文檔提取管理器(Mocument Extraction Manager)402,它負(fù)責(zé)搜尋(crawl)原始信息源并使用與信息源兼容的適當(dāng)機(jī)制提取數(shù)據(jù)和文檔內(nèi)容,并以能由可搜索內(nèi)容管理器處理的格式放置該數(shù)據(jù)。美國專利申請(qǐng),序列號(hào)為10/157,243,2002年5月30日提交,包含對(duì)文檔提取管理器的描述。
可搜索內(nèi)容管理器(Searchable Content Manager)404,它負(fù)責(zé)處理從各信息源提取的數(shù)據(jù)并將其存儲(chǔ)在內(nèi)容庫406中。該數(shù)據(jù)以標(biāo)準(zhǔn)格式存儲(chǔ),優(yōu)選地,基于文檔的顆粒單元/組成部分(granularelements/components)。這些單元以后能被組合,以構(gòu)成連貫的文檔。在2002年6月30日提交的序列號(hào)10/159,373的美國專利申請(qǐng)中能找到對(duì)該處理過程的描述。
內(nèi)容庫(Content Repository)406,它是一個(gè)文檔組成部分的可搜索庫,其中存儲(chǔ)可搜索內(nèi)容的單元(element)。該庫具有一個(gè)搜索索引408,用于提供一種機(jī)制,能以給定的一組屬性,如文檔視圖、文檔類型、元數(shù)據(jù)等,來請(qǐng)求一個(gè)指定的文檔。文檔以所有被支持的自然語言NL存儲(chǔ)在該內(nèi)容庫中,該索引包含以下兩個(gè)專利申請(qǐng)描述的倒排索引(2002年6月27日提交的序列號(hào)10/180,195的美國專利申請(qǐng),以及2002年2月1日提交的序列號(hào)10/066,346的美國專利申請(qǐng))以允許選擇適當(dāng)語言的文檔。
索引管理器(Index Manager)412,它負(fù)責(zé)通過使用由搜索引擎提供的適當(dāng)接口和基于內(nèi)容庫中存儲(chǔ)的內(nèi)容來建立和更新搜索索引408。該索引管理器能處理多個(gè)搜索索引。
搜索管理引擎(Search Management Engine)414,它主要負(fù)責(zé)從接口管理器部件收集用于搜索查詢的輸入?yún)?shù),并使用配置信息(例如搜索引擎參數(shù))、個(gè)性化信息(例如優(yōu)選文檔類型)和分類信息(例如搜索類別)創(chuàng)建最終查詢對(duì)象。2002年7月23日提交的美國專利申請(qǐng)(YOR9-2002-0163)含有對(duì)搜索管理引擎的描述。
訪問管理器(Access Manager)416,它是到(一個(gè)或多個(gè))搜索引擎的直接接口。它負(fù)責(zé)以適當(dāng)?shù)母袷较蛩阉饕嫣峤凰阉鞑樵?,收集要處理的并將由其他部件返回給用戶的搜索結(jié)果。這能通過使用面向內(nèi)部部件的通用適配器接口和面向不同搜索引擎的可插入適配器來實(shí)現(xiàn)。2002年7月31日提交的序列號(hào)10/209,619的美國專利申請(qǐng),以及2002年6月3日提交的序列號(hào)10/759,373的美國專利申請(qǐng),包含對(duì)該訪問管理器的描述。
局布管理器(Layout Manager)418,它負(fù)責(zé)創(chuàng)建和定制文檔內(nèi)容及搜索結(jié)果的布局。該內(nèi)容是從內(nèi)容庫模塊406中檢索的。2002年6月3日提交的序列號(hào)10/159,373的美國專利申請(qǐng)含有對(duì)布局管理器的描述。
接口管理器(Interface Manager)420,它負(fù)責(zé)處理用戶的GUI和與后端模塊接口。對(duì)內(nèi)核的輸入和輸出422、424、426、428、430及432分別是與內(nèi)核300接口的各轉(zhuǎn)換級(jí)(translation stage)310的輸出和輸入。
現(xiàn)在參照?qǐng)D5,通過連續(xù)提取、存儲(chǔ)數(shù)據(jù)和對(duì)數(shù)據(jù)編索引的后端過程,文檔和其他數(shù)據(jù)被從內(nèi)部網(wǎng)和因特網(wǎng)二者上的源中提取出來。文檔提取管理器402通過到每個(gè)源的翻譯器308和310向外達(dá)到數(shù)據(jù)源,以向信息源提供兼容的請(qǐng)求(步驟500和502)。它從數(shù)據(jù)源提取數(shù)據(jù),在翻譯器(translator)308和310中把數(shù)據(jù)轉(zhuǎn)換成XML形式,并把數(shù)據(jù)放入內(nèi)容庫406(步驟504、506和510)。索引管理器412為提取的文檔生成索引數(shù)據(jù)并將其與該數(shù)據(jù)一起放入內(nèi)容庫(步驟512)。該文檔的所有被支持的國家語言NL被提取和存儲(chǔ)在該庫中并可用倒排索引410訪問。
現(xiàn)在參照?qǐng)D6,一旦收到HTTP語言的查詢(步驟600),翻譯器308和310便把該查詢變換成內(nèi)核XML形式(步驟602)。接口管理器將該查詢公式化,用于訪問內(nèi)容庫406(步驟604)并把該查詢提供給搜索管理引擎414(步驟606和608),搜索管理引擎414獲得定制數(shù)據(jù)和配置數(shù)據(jù)并將其加到查詢的數(shù)據(jù)中。定制數(shù)據(jù)使查詢個(gè)性化于該用戶,而配置數(shù)據(jù)標(biāo)識(shí)提供該數(shù)據(jù)的特定因特網(wǎng)或內(nèi)部網(wǎng)的數(shù)據(jù)源。訪問管理器416為該信息生成一個(gè)命中列表(步驟610)并把它提供給接口管理器420,接口管理器420將其改變成用戶GUI,把它傳送給翻譯器308和310以把它轉(zhuǎn)換成用戶界面的語言(步驟612)。
現(xiàn)在參照?qǐng)D7,當(dāng)一個(gè)用戶觀看該命中列表并以一個(gè)HTTP文檔視圖查詢請(qǐng)求該數(shù)據(jù)時(shí)(步驟700),該數(shù)據(jù)被轉(zhuǎn)換成XML查詢(步驟702)并饋送給接口管理器302用于查詢收集(步驟704)。來自接口管理器的信息被饋送給布局管理器418,它從內(nèi)容庫314的內(nèi)容中產(chǎn)生文檔(步驟706和708)并通過接口管理器420把文檔傳送給用戶,翻譯器308和310把XML文檔轉(zhuǎn)換成HTTP形式(步驟710和712)并把它們提供給用戶顯示器(步驟714)。
上面我們已描述了本發(fā)明的一個(gè)實(shí)施例,而對(duì)這一實(shí)施例的修改對(duì)于本領(lǐng)域技術(shù)人員可以是顯然的。例如,如已指出的那樣,通過向翻譯器添加另一層能容易地納入不同的語言,而通過添加附加段訪問內(nèi)核能增加完全不同的語言。再有,盡管使用了XML作為各語言的內(nèi)核,但其他語言,如GML、html,可以用于代替XML。此外,所描述的翻譯器是用作XML和HTTP,html,之間的轉(zhuǎn)換,但其他連接器也能被使用。由于這一理由,應(yīng)該理解本發(fā)明不限于所描述的實(shí)施例,而是包括落入所附權(quán)利要求的精神和范圍內(nèi)的所有改變。
權(quán)利要求
1.一種搜索引擎管理系統(tǒng),具有一個(gè)或多個(gè)中央處理單元,一個(gè)或多個(gè)存儲(chǔ)器,以及一個(gè)或多個(gè)網(wǎng)絡(luò)連接,該系統(tǒng)進(jìn)一步包括格式轉(zhuǎn)換層,該格式轉(zhuǎn)換層從一個(gè)或多個(gè)網(wǎng)絡(luò)連接接收一個(gè)或多個(gè)輸入,這些輸入具有輸入格式和輸入數(shù)據(jù),該格式轉(zhuǎn)換層使用輸入適配器把輸入格式變換成內(nèi)核格式,該轉(zhuǎn)換層進(jìn)一步具有一個(gè)或多個(gè)輸出適配器;以及內(nèi)核,使用內(nèi)核格式以一個(gè)或多個(gè)內(nèi)核單元對(duì)輸入數(shù)據(jù)進(jìn)行操作,以產(chǎn)生內(nèi)核結(jié)果,由此內(nèi)核結(jié)果被通過該轉(zhuǎn)換層發(fā)送到一個(gè)或多個(gè)網(wǎng)絡(luò)輸出端,其中輸出適配器把內(nèi)核結(jié)果變換成輸出格式。
2.根據(jù)權(quán)利要求1所述的系統(tǒng),其特征在于該內(nèi)核格式包括統(tǒng)一字符編碼的下列格式中的任何一個(gè)或多個(gè)XML、GML、以及html。
3.根據(jù)權(quán)利要求1所述的系統(tǒng),其特征在于該內(nèi)核單元包括內(nèi)容庫以及下列部件中的任何一個(gè)或多個(gè)內(nèi)容提取管理器;可搜索內(nèi)容管理器;訪問管理器;索引管理器;接口管理器;布局管理器;以及SM引擎。
4.一種在用于具有一個(gè)或多個(gè)中央處理單元、一個(gè)或多的個(gè)存儲(chǔ)器以及一個(gè)或多個(gè)網(wǎng)絡(luò)連接的搜索引擎管理系統(tǒng)的計(jì)算機(jī)可用系統(tǒng)上的計(jì)算機(jī)程序產(chǎn)品,包括用于格式轉(zhuǎn)換層的軟件,該格式轉(zhuǎn)換層從一個(gè)或多個(gè)網(wǎng)絡(luò)連接接收一個(gè)或多個(gè)輸入,這些輸入具有輸入格式和輸入數(shù)據(jù),該格式轉(zhuǎn)換層使用輸入適配器把輸入格式變換成內(nèi)核格式,該轉(zhuǎn)換層進(jìn)一步具有一個(gè)或多個(gè)輸出適配器;以及用于內(nèi)核的軟件,該內(nèi)核使用內(nèi)核格式以一個(gè)或多個(gè)內(nèi)核單元對(duì)輸入數(shù)據(jù)進(jìn)行操作以產(chǎn)生內(nèi)核結(jié)果,由此內(nèi)核結(jié)果被通過該轉(zhuǎn)換層發(fā)送到一個(gè)或多個(gè)網(wǎng)絡(luò)輸出端,其中輸出適配器把內(nèi)核結(jié)果變換成輸出格式。
5.根據(jù)權(quán)利要求4所述的計(jì)算機(jī)程序產(chǎn)品,其特征在于該內(nèi)核格式包括統(tǒng)一字符編碼的下列格式中的任何一個(gè)或多個(gè)XML、GML、以及html。
6.根據(jù)權(quán)利要求4所述的計(jì)算機(jī)程序產(chǎn)品,其特征在于該內(nèi)核單元包括內(nèi)容庫以及下列部件中的任何一個(gè)或多個(gè)內(nèi)容提取管理器;可搜索內(nèi)容管理器;訪問管理器;索引管理器;接口管理器;布局管理器;以及SM引擎。
全文摘要
本發(fā)明提供了一種搜索引擎系統(tǒng),其中,各種配置的輸入數(shù)據(jù)首先通過過渡轉(zhuǎn)換層,該層把有多種配置的數(shù)據(jù)轉(zhuǎn)換成通用的或內(nèi)核計(jì)算機(jī)形式和語言。以該內(nèi)核形式和語言對(duì)該數(shù)據(jù)進(jìn)行操作和存儲(chǔ)。然后,被操作過的數(shù)據(jù)通過過渡轉(zhuǎn)換層輸出,并以所希望的與輸入形式和語言相同的或不同的格式提供。
文檔編號(hào)G06F15/16GK1487452SQ0315598
公開日2004年4月7日 申請(qǐng)日期2003年8月27日 優(yōu)先權(quán)日2002年8月28日
發(fā)明者M·J·金, M J 金, Y·N·德里西, 德里西, G·T·布朗, 布朗, Y·N·多格那塔, 多格那塔, L·N·科扎科夫, 科扎科夫, T·A·科菲尼奧, 科菲尼奧, 芬, T-H·N·芬 申請(qǐng)人:國際商業(yè)機(jī)器公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
武邑县| 屏边| 四川省| 丁青县| 光泽县| 饶阳县| 龙州县| 潞西市| 山东省| 岗巴县| 牟定县| 榆中县| 昌都县| 云安县| 石台县| 肃北| 四子王旗| 焉耆| 汶上县| 阳谷县| 宿松县| 黄陵县| 平潭县| 乌海市| 凤冈县| 岚皋县| 微山县| 平顺县| 清水河县| 老河口市| 十堰市| 梨树县| 河曲县| 东安县| 襄垣县| 阿巴嘎旗| 肇州县| 宝清县| 闸北区| 同江市| 五台县|