欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種通過搜索重建數(shù)據(jù)的方法

文檔序號:6463360閱讀:236來源:國知局
專利名稱:一種通過搜索重建數(shù)據(jù)的方法
技術(shù)領(lǐng)域
本發(fā)明屬于網(wǎng)絡(luò)信息處理領(lǐng)域,特別是一種通過搜索重建數(shù)據(jù)的方法。
背景技術(shù)
對于依賴互聯(lián)網(wǎng)為生的企業(yè)來說,往往需要通過搜索引擎査詢各類信息。如對零售商來說,某一產(chǎn)品的全部生產(chǎn)商,該產(chǎn)品在不同時期不同地點(diǎn)的銷售價(jià)格,該產(chǎn)品的用戶評價(jià)等,是其所關(guān)注的。
由于原始數(shù)據(jù)提供者的原因,互聯(lián)網(wǎng)上的這些數(shù)據(jù)往往會隨著時間的流逝而不斷變化或消失,從而導(dǎo)致用戶即便以同一方式搜索數(shù)據(jù),也會在不同時期
看到迥異的結(jié)果;或者當(dāng)下一次搜索時,己找不到期望的數(shù)據(jù)。數(shù)據(jù)的變化會導(dǎo)致結(jié)論上的差異;數(shù)據(jù)的缺失更難以形成結(jié)論。因此如能將用戶通過互聯(lián)網(wǎng)搜索到的公開信息資源重新組織、歸類,把用戶關(guān)注的內(nèi)容收集整理,將無序、不可控制的公共數(shù)據(jù)變成有組織、可控制的私人數(shù)據(jù)。將為那些對相關(guān)信息資源敏感度很高的用戶帶來極大的便利。

發(fā)明內(nèi)容
鑒于以上需求,本發(fā)明的目的在于通過技術(shù)手段將互聯(lián)網(wǎng)上公開的和公共的各類信息資源重新組織、歸類,把用戶關(guān)注的內(nèi)容,那些看似龐大、混亂
的數(shù)據(jù)以更合理、有序的方式呈現(xiàn)出來。即將各種非關(guān)系型數(shù)據(jù)通過技術(shù)手段重新組合,形成關(guān)系型數(shù)據(jù)。通過這項(xiàng)技術(shù),可以將無組織、無管理的公共數(shù)據(jù)變成有組織、可管理的私人數(shù)據(jù)。
本發(fā)明所采用的技術(shù)方案是 一種通過搜索重建數(shù)據(jù)的方法,可以利用通過互聯(lián)網(wǎng)提供服務(wù)的搜索引擎完成數(shù)據(jù)重建工作,本方法基于一個插入在用戶和搜索引擎之間的解析接口系統(tǒng);所述解析接口系統(tǒng)包括前端Web服務(wù)器、解析服務(wù)器和解析數(shù)據(jù)庫服務(wù)器;
所述前端Web服務(wù)器包括一定制的用戶搜索頁面、以及一語義檢査模塊;
所述解析服務(wù)器包括搜索條件翻譯模塊、語義轉(zhuǎn)化模塊、網(wǎng)頁編譯模塊、超文本解析模塊、以及數(shù)據(jù)存儲模塊;
所述解析數(shù)據(jù)庫服務(wù)器用于存儲經(jīng)過加工處理的數(shù)據(jù)。
本發(fā)明中,基于解析接口系統(tǒng)的方法包括以下步驟
步驟h在用戶和搜索引擎之間插入解析接口系統(tǒng);
步驟2:當(dāng)用戶進(jìn)行搜索時,首先訪問解析接口系統(tǒng)中的前端Web服務(wù)器,通過前端Web服務(wù)器提供的用戶搜索頁面,以接近自然語言的表達(dá)方式填寫搜索條件進(jìn)行搜索,語義檢査模塊對搜索條件進(jìn)行語法檢査,并發(fā)送給解析服務(wù)器;
步驟3:解析服務(wù)器收到搜索條件后,啟用搜索條件翻譯模塊將搜索條件翻譯為機(jī)器識別的結(jié)構(gòu)化査詢語言,然后解析服務(wù)器用此結(jié)構(gòu)化査詢語言到解析數(shù)據(jù)庫服務(wù)器進(jìn)行查詢;
步驟4:解析數(shù)據(jù)庫服務(wù)器返回搜索結(jié)果到解析服務(wù)器;步驟5:網(wǎng)頁編譯模塊將搜索結(jié)果加工成符合特定形式的字符流發(fā)送給解析服務(wù)器;
步驟6:解析服務(wù)器將該字符流呈現(xiàn)給用戶,用戶得到檢索結(jié)果。本發(fā)明的有益效果是
本發(fā)明一種通過搜索重建數(shù)據(jù)的方法可以滿足用戶在不同時期通過搜索引擎査詢各類信息時,對公開信息資源重新組織、歸類,把用戶關(guān)注的內(nèi)容收集整理,將無組織、無管理的公共數(shù)據(jù)變成有組織、有管理的私人數(shù)據(jù)。


以下結(jié)合實(shí)施例及其附圖對本發(fā)明作進(jìn)一步說明。
圖1是一般情況下用戶通過搜索引擎搜索信息的結(jié)構(gòu)流程示意圖2是本發(fā)明的結(jié)構(gòu)流程示意圖3是本發(fā)明方法的流程示意圖。
圖中l(wèi).用戶、2.解析接口系統(tǒng)、3.搜索引擎、4.前端Web服務(wù)器、5.解析服務(wù)器、6.解析數(shù)據(jù)庫服務(wù)器、7.用戶搜索頁面、8.語義檢査模塊、9.搜索條件翻譯模塊、IO.語義轉(zhuǎn)化模塊、ll.網(wǎng)頁編譯模塊、12.超文本解析模塊、13.數(shù)據(jù)存儲模塊、14.WEB服務(wù)器、15.中間服務(wù)器、16.數(shù)據(jù)庫服務(wù)器
具體實(shí)施例方式
圖1展示了一般情況下用戶通過搜索引擎搜索信息的結(jié)構(gòu)和流程,在傳統(tǒng)搜索行為中,僅有用戶1和搜索引擎3,搜索引擎3包括WEB服務(wù)器14、中間服務(wù)器15、數(shù)據(jù)庫服務(wù)器16。
用戶直接訪問搜索引擎3的WEB服務(wù)器14提供的査詢頁面,并在査詢頁面上輸入搜索條件,WEB服務(wù)器14對搜索條件進(jìn)行語法檢査,然后發(fā)送給中間服務(wù)器15,中間服務(wù)器15收到搜索條件后,將搜索條件翻譯為機(jī)器識別的結(jié)構(gòu)化査詢語言,中間服務(wù)器15用該結(jié)構(gòu)化查詢語言到數(shù)據(jù)庫服務(wù)器16查詢,數(shù)據(jù)庫服務(wù)器16返回查詢結(jié)果之后,中間服務(wù)器15將査詢結(jié)果加工成HTML或XML發(fā)送給WEB服務(wù)器14,并由WEB服務(wù)器14將該HTML或XML字符流呈現(xiàn)給最終用戶。
而本發(fā)明一種通過搜索重建數(shù)據(jù)的方法,則不同于以上提及的傳統(tǒng)的用戶搜索方法。本發(fā)明的方法可以利用通過互聯(lián)網(wǎng)提供服務(wù)的搜索引擎3完成數(shù)據(jù)
重建工作。從圖2中可以看到
具體實(shí)施例方式
基于一個插入在用戶1和搜索引擎3之間的解析接口系統(tǒng)2;所述解析接
口系統(tǒng)2包括前端Web服務(wù)器4、解析服務(wù)器5和解析數(shù)據(jù)庫服務(wù)器5;
所述前端Web服務(wù)器4包括一定制的用戶搜索頁面7、以及一語義檢查模
塊8;
所述解析服務(wù)器5包括搜索條件翻譯模塊9、語義轉(zhuǎn)化模塊IO、阿頁編譯模塊ll、超文本解析模塊12、以及數(shù)據(jù)存儲模塊13;
所述解析數(shù)據(jù)庫服務(wù)器6用于存儲經(jīng)過加工處理的數(shù)據(jù)。
本發(fā)明實(shí)施例
所述的基于解析接口系統(tǒng)2的方法包括以下步驟步驟h在用戶l和搜索引擎3之間插入解析接口系統(tǒng)2;
步驟2:當(dāng)用戶l進(jìn)行搜索時,首先訪問解析接口系統(tǒng)2中的前端Web服務(wù)器4,通過前端Web服務(wù)器4提供的用戶搜索頁面7,以接近自然語言的表達(dá)方式填寫搜索條件進(jìn)行搜索,語義檢查模塊8對搜索條件進(jìn)行語法檢査,并發(fā)送給解析服務(wù)器5;
步驟3:解析服務(wù)器5收到搜索條件后,啟用搜索條件翻譯模塊9將搜索條件翻譯為機(jī)器識別的結(jié)構(gòu)化査詢語言,然后解析服務(wù)器5用此結(jié)構(gòu)化查詢語言到解析數(shù)據(jù)庫服務(wù)器6進(jìn)行查詢;
步驟4:解析數(shù)據(jù)庫服務(wù)器6返回搜索結(jié)果到解析服務(wù)器5;
步驟5:網(wǎng)頁編譯模塊11將搜索結(jié)果加工成符合特定形式的字符流發(fā)送給解析服務(wù)器5;
步驟6:解析服務(wù)器5將該字符流呈現(xiàn)給用戶1,用戶l得到檢索結(jié)果。在本發(fā)明實(shí)施例中,所述步驟4由以下步驟組成步驟4a:判斷解析數(shù)據(jù)庫服務(wù)器6返回的搜索結(jié)果,如果解析數(shù)據(jù)庫服務(wù)器6返回的搜索結(jié)果大于零,則進(jìn)入步驟5;如果解析數(shù)據(jù)庫服務(wù)器6返回的
搜索結(jié)果不大于零,則進(jìn)入步驟4b;
步驟4b:解析服務(wù)器5啟用語義轉(zhuǎn)化模塊10將前端WEB服務(wù)器4的搜索條件轉(zhuǎn)換為符合搜索引擎3規(guī)范的搜索條件,并將轉(zhuǎn)換完成的搜索條件發(fā)送
給搜索引擎3;
步驟4c:解析服務(wù)器5獲取搜索引擎3返回的搜索結(jié)果,該搜索結(jié)果以搜索引擎3規(guī)定的特定字符流形式返回到解析服務(wù)器5;
步驟4d:解析服務(wù)器5啟用超文本解析模塊12將步驟4c中返回的字符流重新組裝成符合解析數(shù)據(jù)庫服務(wù)器6存儲要求的數(shù)據(jù)對象;
步驟4e:解析服務(wù)器5啟用數(shù)據(jù)存儲模塊13將步驟4d組裝完成的數(shù)據(jù)對象與通過步驟3翻譯成的結(jié)構(gòu)化査詢語言建立對應(yīng)關(guān)系,并將它們存儲于解析數(shù)據(jù)庫服務(wù)器6中;
步驟4f:轉(zhuǎn)到步驟5。
步驟4a到步驟4f的目的是,如果解析數(shù)據(jù)庫服務(wù)器6中'儲存有用戶1欲獲取的信息,則直接將該信息呈現(xiàn)給用戶1,以提高搜索速度;如果解析數(shù)據(jù)庫服務(wù)器6中不包含用戶1所需信息,則交由搜索引擎3進(jìn)行檢索并返回信息,同時將該信息與查詢條件建立對應(yīng)關(guān)系,并將他們存儲于解析數(shù)據(jù)庫服務(wù)器6中,完善解析數(shù)據(jù)庫服務(wù)器6存儲的信息數(shù)據(jù),以便用戶1下次搜索時可以直接從解析數(shù)據(jù)庫服務(wù)器6中調(diào)用。
在本發(fā)明的實(shí)施例中,所述方法的步驟5:網(wǎng)頁編譯模塊ll將搜索結(jié)果加工成符合特定形式的字符流發(fā)送給解析服務(wù)器5。其中符合特定形式的字符流為HTML或XML字符流。所述方法的步驟4C:解析服務(wù)器5獲取搜索引擎3返回的搜索結(jié)果,該搜
索結(jié)果以搜索引擎3規(guī)定的特定字符流形式返回到解析服務(wù)器5。其中符合特定形式的字符流為HTML或XML字符流。
本發(fā)明一種通過搜索重建數(shù)據(jù)的方法,通過技術(shù)手段將互聯(lián)網(wǎng)上公開的和公共的各類信息資源重新組織、歸類,把用戶關(guān)注的內(nèi)容,使看似龐大、混亂的數(shù)據(jù)以更合理的方式呈現(xiàn)出來。即將各種非關(guān)系型數(shù)據(jù)通過技術(shù)手段重新組合,形成關(guān)系型數(shù)據(jù)。通過這項(xiàng)技術(shù),可以將無序、不可控制的公共數(shù)據(jù)變成有組織、可控制的私人數(shù)據(jù)。將為那些對相關(guān)信息資源敏感度很高的用戶帶來極大的便利。在網(wǎng)絡(luò)信息處理領(lǐng)域?qū)⒂泻艽蟮膸垐銮熬啊?br> 權(quán)利要求
1.一種通過搜索重建數(shù)據(jù)的方法,可以利用通過互聯(lián)網(wǎng)提供服務(wù)的搜索引擎完成數(shù)據(jù)重建工作,其特征在于本方法基于一個插入在用戶和搜索引擎之間的解析接口系統(tǒng);所述解析接口系統(tǒng)包括前端Web服務(wù)器、解析服務(wù)器和解析數(shù)據(jù)庫服務(wù)器;所述前端Web服務(wù)器包括一定制的用戶搜索頁面、以及一語義檢查模塊;所述解析服務(wù)器包括搜索條件翻譯模塊、語義轉(zhuǎn)化模塊、網(wǎng)頁編譯模塊、超文本解析模塊、以及數(shù)據(jù)存儲模塊;所述解析數(shù)據(jù)庫服務(wù)器用于存儲經(jīng)過加工處理的數(shù)據(jù)。
2. 根據(jù)權(quán)利要求l所述的一種通過搜索重建數(shù)據(jù)的方法,其特征在于所述的 基于解析接口系統(tǒng)的方法包括以下步驟步驟l:在用戶和搜索引擎之間插入解析接口系統(tǒng);步驟2:用戶進(jìn)行搜索時,首先訪問解析接口系統(tǒng)中的前端Web服務(wù)器,通過 前端Web服務(wù)器提供的用戶搜索頁面,以接近自然語言的表達(dá)方式填寫搜索條 件進(jìn)行搜索,語義檢査模塊對搜索條件進(jìn)行語法檢查,并發(fā)送給解析服務(wù)器;步驟3:解析服務(wù)器收到搜索條件后,啟用搜'索條件翻譯模塊將搜索條件翻譯為 機(jī)器識別的結(jié)構(gòu)化查詢語言,然后解析服務(wù)器用此結(jié)構(gòu)化查詢語言到解析數(shù)據(jù) 庫服務(wù)器進(jìn)行查詢;步驟4:解析數(shù)據(jù)庫服務(wù)器返回搜索結(jié)果到解析服務(wù)器;步驟5:網(wǎng)頁編譯模塊將搜索結(jié)果加工成符合特定形式的字符流發(fā)送給解析服務(wù) 器;步驟6:解析服務(wù)器將該字符流呈現(xiàn)給用戶,用戶得到檢索結(jié)果。
3. 根據(jù)權(quán)利要求2所述的一種通過搜索重建數(shù)據(jù)的方法,其特征在于所述步驟4由以下步驟組成步驟4a:判斷解析數(shù)據(jù)庫服務(wù)器返回的搜索結(jié)果,如果解析數(shù)據(jù)庫服務(wù)器返回的搜索結(jié)果大于零,則進(jìn)入步驟5;如果解析數(shù)據(jù)庫服務(wù)器返回的搜索結(jié)果不大于零,則進(jìn)入步驟4b;步驟4b:解析服務(wù)器啟用語義轉(zhuǎn)化模塊將前端WEB服務(wù)器的搜索條件轉(zhuǎn)換為符合搜索引擎規(guī)范的搜索條件,并將轉(zhuǎn)換完成的搜索條件發(fā)送給搜索引擎;步驟4c:解析服務(wù)器獲取搜索引擎返回的搜索結(jié)果,該搜索結(jié)果以搜索引擎規(guī)定的特定字符流形式返回到解析服務(wù)器;步驟4d:解析服務(wù)器啟用超文本解析模塊將步驟4c中返回的字符流重新組裝成符合解析數(shù)據(jù)庫服務(wù)器存儲要求的數(shù)據(jù)對象;步驟4e:解析服務(wù)器啟用數(shù)據(jù)存儲模塊將步驟4d組裝完成的數(shù)據(jù)對象與通過步驟3翻譯成的結(jié)構(gòu)化査詢語言建立對應(yīng)關(guān)系,并將它們存儲于解析數(shù)據(jù)庫服務(wù)器中;步驟4f:轉(zhuǎn)到步驟5。
4. 根據(jù)權(quán)利要求2所述的一種通過搜索重建數(shù)據(jù)的方法,其特征在于所述符合特定形式的字符流為HTML或XML字符流。
5. 根據(jù)權(quán)利要求3所述的一種通過搜索重建數(shù)據(jù)的方法,其特征在于所述符合特定形式的字符流為HTML或XML字符流。
全文摘要
本發(fā)明涉及一種通過搜索重建數(shù)據(jù)的方法,可以利用通過互聯(lián)網(wǎng)提供服務(wù)的搜索引擎完成數(shù)據(jù)重建工作,本方法基于一個插入在用戶和搜索引擎之間的解析接口系統(tǒng);解析接口系統(tǒng)包括前端Web服務(wù)器、解析服務(wù)器和解析數(shù)據(jù)庫服務(wù)器;本發(fā)明的方法包括步驟1在用戶和搜索引擎之間插入解析接口系統(tǒng);步驟2用戶訪問解析接口系統(tǒng)填寫搜索條件進(jìn)行搜索;步驟3解析服務(wù)器到解析數(shù)據(jù)庫服務(wù)器進(jìn)行查詢;步驟4解析數(shù)據(jù)庫服務(wù)器返回搜索結(jié)果到解析服務(wù)器;步驟5將搜索結(jié)果加工成符合特定形式的字符流發(fā)送給解析服務(wù)器;步驟6解析服務(wù)器將該字符流呈現(xiàn)給用戶,用戶得到檢索結(jié)果。產(chǎn)品適用范圍廣,有廣闊的國內(nèi)和國際市場前景。
文檔編號G06F17/30GK101561808SQ20081010441
公開日2009年10月21日 申請日期2008年4月18日 優(yōu)先權(quán)日2008年4月18日
發(fā)明者晨 孫 申請人:北京瑞佳晨科技有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1
彰化县| 静安区| 湘阴县| 哈巴河县| 济源市| 拉萨市| 武安市| 武安市| 金溪县| 昌平区| 石城县| 美姑县| 宜兰县| 吴桥县| 崇信县| 白水县| 宁河县| 仙游县| 新蔡县| 井陉县| 镇江市| 施秉县| 太仆寺旗| 泊头市| 开鲁县| 宜良县| 游戏| 新巴尔虎右旗| 贡嘎县| 奉贤区| 岳阳县| 洪湖市| 聊城市| 桦川县| 锦州市| 象州县| 襄垣县| 阿巴嘎旗| 桓台县| 舟曲县| 日照市|