欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

提供與文檔相關(guān)的信息的制作方法

文檔序號:6553063閱讀:206來源:國知局
專利名稱:提供與文檔相關(guān)的信息的制作方法
技術(shù)領(lǐng)域
符合本發(fā)明原理的系統(tǒng)與方法一般涉及信息檢索,更具體而言,涉及提供與特定文檔相關(guān)的信息。
背景技術(shù)
現(xiàn)代計(jì)算機(jī)網(wǎng)絡(luò),尤其是因特網(wǎng),使得大量信息能夠廣泛地且容易地獲得。例如,免費(fèi)因特網(wǎng)搜索引擎標(biāo)引(index)出了鏈接至因特網(wǎng)的成千上萬的web文檔。連接至因特網(wǎng)的用戶可以輸入簡單的搜索查詢以快速地定位與該搜索查詢相關(guān)的web文檔。
然而,在因特網(wǎng)上不能廣泛獲得的一類內(nèi)容包括更傳統(tǒng)的作者印刷作品,例如書籍和雜志。使這些作品能夠以數(shù)字方式獲得的阻礙在于難以將作品的印刷版本轉(zhuǎn)換為數(shù)字形式。光學(xué)字符識別(OCR)(它是使用光學(xué)掃描設(shè)備生成接下來轉(zhuǎn)換為計(jì)算機(jī)可讀格式(例如ASCII文件)的字符的文本圖像的動作),是將印刷文本轉(zhuǎn)換為可用數(shù)字形式的已知技術(shù)。OCR系統(tǒng)一般包括用于生成印刷頁面圖像的光學(xué)掃描儀,以及用于分析該圖像的軟件。

發(fā)明內(nèi)容
根據(jù)一個方面,一種方法可以包括接收搜索查詢;基于該搜索查詢執(zhí)行第一搜索以識別文檔;基于與該文檔關(guān)聯(lián)的屬性執(zhí)行第二搜索;并呈現(xiàn)第二搜索的結(jié)果。
根據(jù)另一方面,一種系統(tǒng)可以包括存儲指令的存儲器和執(zhí)行這些指令的處理器。該系統(tǒng)可以識別文檔,執(zhí)行搜索以識別帶有與該文檔關(guān)聯(lián)的屬性相關(guān)的信息的web文檔,并呈現(xiàn)與該web文檔關(guān)聯(lián)的信息。
根據(jù)又一方面,計(jì)算機(jī)可讀媒體中體現(xiàn)的圖形用戶界面可以包括到文檔各部分的一組鏈接,文檔內(nèi)容的描述,以及與該文檔關(guān)聯(lián)的著錄信息。該圖形用戶界面還可以包括用于使web文檔的搜索得以執(zhí)行的鏈接,該web文檔帶有與該文檔關(guān)聯(lián)的屬性相關(guān)的信息。
根據(jù)再一方面,一種方法可以包括接收來自用戶的文檔標(biāo)識;自動執(zhí)行多個搜索以識別與該文檔關(guān)聯(lián)的屬性相關(guān)的web文檔;并向用戶提供與這些web文檔關(guān)聯(lián)的信息。
根據(jù)又一方面,一種計(jì)算機(jī)可讀媒體可以包含計(jì)算機(jī)可執(zhí)行指令,這些計(jì)算機(jī)可執(zhí)行指令包括用于識別文檔的指令,用于執(zhí)行搜索以識別帶有與該文檔關(guān)聯(lián)的屬性相關(guān)的信息的web文檔的指令,用于從這些web文檔提取信息的指令,以及用于呈現(xiàn)所提取的信息以及與該文檔關(guān)聯(lián)的信息的指令。


并入本說明書并構(gòu)成其一部分的附圖,圖示了本發(fā)明的實(shí)施例,并且與說明書一起對本發(fā)明進(jìn)行解釋。在附圖中,圖1是其中可以實(shí)現(xiàn)符合本發(fā)明原理的系統(tǒng)和方法的網(wǎng)絡(luò)的示例圖;圖2是根據(jù)符合本發(fā)明原理的實(shí)現(xiàn)方式,圖1的客戶端或服務(wù)器的示例圖;圖3A-3D是根據(jù)符合本發(fā)明原理的某些實(shí)現(xiàn)方式,用于呈現(xiàn)與同文檔相關(guān)的web文檔有關(guān)的信息的示例處理的流程圖;圖4是根據(jù)符合本發(fā)明原理的一種實(shí)現(xiàn)方式,其中可以以搜索結(jié)果形式呈現(xiàn)與文檔關(guān)聯(lián)的信息的圖形用戶界面的示例圖;圖5是根據(jù)符合本發(fā)明原理的一種實(shí)現(xiàn)方式,呈現(xiàn)與文檔關(guān)聯(lián)的引用頁面的示例圖;圖6是根據(jù)符合本發(fā)明原理的一種實(shí)現(xiàn)方式,其中可以呈現(xiàn)與web文檔關(guān)聯(lián)的信息的圖形用戶界面的示例圖;圖7是根據(jù)符合本發(fā)明原理的另一實(shí)現(xiàn)方式,引用頁面部分的示例圖;圖8是根據(jù)符合本發(fā)明原理的又一實(shí)現(xiàn)方式,引用頁面部分的示例圖;圖9是根據(jù)符合本發(fā)明原理的替代實(shí)現(xiàn)方式,其中可以以搜索結(jié)果形式呈現(xiàn)與文檔關(guān)聯(lián)的信息的圖形用戶界面的示例圖;以及圖10A和圖10B是根據(jù)符合本發(fā)明原理的兩種不同實(shí)現(xiàn)方式,其中可以呈現(xiàn)相關(guān)信息的圖形用戶界面的示例圖。
具體實(shí)施例方式
本發(fā)明的下述詳細(xì)描述參照附圖。不同附圖中相同的附圖標(biāo)記可以識別相同或類似的元素。同樣,下述詳細(xì)描述并不限制本發(fā)明。
總述越來越多類型的文檔可以通過搜索引擎來進(jìn)行搜索。例如,某些文檔(諸如書籍、雜志、和/或目錄)可以被掃描,并且它們的文本可以通過OCR進(jìn)行識別。對這些文檔進(jìn)行更多了解,并使得該附加信息可以被用戶獲得是有益的。
符合本發(fā)明原理的系統(tǒng)和方法可以自動地對與同文檔關(guān)聯(lián)的一個或多個屬性(也稱作“文檔屬性”)相關(guān)的附加信息進(jìn)行搜索,并與該文檔關(guān)聯(lián)地提供該附加信息。
示例性網(wǎng)絡(luò)配置圖1是其中可以實(shí)現(xiàn)符合本發(fā)明原理的系統(tǒng)和方法的網(wǎng)絡(luò)100的示例圖。網(wǎng)絡(luò)100可以包括通過網(wǎng)絡(luò)150連接至多個服務(wù)器120-140的多個客戶端110。為了簡便起見,將兩個客戶端110和三個服務(wù)器120-140圖示為連接至網(wǎng)絡(luò)150。實(shí)際上,可以有更多或更少的客戶端和服務(wù)器。同樣,在某些實(shí)例中,客戶端也可以執(zhí)行服務(wù)器的功能,而服務(wù)器也可以執(zhí)行客戶端的功能。
客戶端110可以包括客戶端實(shí)體。實(shí)體可以定義為諸如無線電話、個人計(jì)算機(jī)、個人數(shù)字助理(PDA)、膝上型電腦,或其他類型的計(jì)算或通信設(shè)備的設(shè)備,在這些設(shè)備之一上運(yùn)行的線程或進(jìn)程,和/或可由這些設(shè)備之一執(zhí)行的對象。服務(wù)器120-140可以包括以符合本發(fā)明原理的方式來采集、處理、搜索,和/或保存文檔的服務(wù)器實(shí)體。
在符合本發(fā)明原理的一種實(shí)現(xiàn)方式中,服務(wù)器120可以包括客戶端110可以使用的搜索引擎125。服務(wù)器120可以爬過(crawl)文檔大全(corpus)(例如web文檔),標(biāo)引這些文檔,并且在文檔倉庫中存儲與這些文檔關(guān)聯(lián)的信息。替代地或另外地,服務(wù)器120可以分析文檔(例如書籍、雜志、報紙、文章、目錄等)的數(shù)據(jù)庫(或數(shù)據(jù)庫集),并且在相同倉庫或不同倉庫中存儲與這些文檔關(guān)聯(lián)的信息。服務(wù)器130和140可以存儲或保存可以由服務(wù)器120爬過或分析的文檔。
盡管將服務(wù)器120-140示為分立實(shí)體,服務(wù)器120-140中的一個或多個有可能執(zhí)行服務(wù)器120-140中另一個或另外多個的一個或多個功能。例如,服務(wù)器120-140中的兩個或更多可能實(shí)現(xiàn)為單一服務(wù)器。服務(wù)器120-140中的單獨(dú)一個還可能實(shí)現(xiàn)為兩個或更多分立(并且可能是分布式)設(shè)備。
網(wǎng)絡(luò)150可以包括局域網(wǎng)(LAN),廣域網(wǎng)(WAN),諸如公用交換電話網(wǎng)(PSTN)的電話網(wǎng)絡(luò),內(nèi)聯(lián)網(wǎng),因特網(wǎng),存儲設(shè)備,或網(wǎng)絡(luò)組合。客戶端110和服務(wù)器120-140可以通過有線、無線,和/或光連接與網(wǎng)絡(luò)150連接。
作為此處使用的術(shù)語,“文檔”廣泛地解釋為包括任何傳統(tǒng)的作者印刷作品,諸如書籍、雜志、目錄、報紙、文章等等。作為此處使用的術(shù)語,“web文檔”廣泛地解釋為包括可以通過網(wǎng)絡(luò)(如網(wǎng)絡(luò)150)獲得的任何機(jī)器可讀的且機(jī)器可存儲的作品產(chǎn)品。例如,Web文檔可以包括web站點(diǎn),文件,文件組合,帶有到其他文件的嵌入式鏈接的一個或多個文件,新聞組張貼版,博客(blog),web廣告等等。在因特網(wǎng)的情境里,通常的web文檔是網(wǎng)頁。網(wǎng)頁經(jīng)常包括文本信息,并且可以包括嵌入式信息(例如元信息、圖像、超鏈接等)和/或嵌入式指令(例如Java腳本等)。最為此處使用的術(shù)語,“鏈接”廣泛地解釋為包括對或來自web文檔的任何引用。
示例性客戶端/服務(wù)器架構(gòu)圖2是根據(jù)符合本發(fā)明原理的實(shí)現(xiàn)方式,可對應(yīng)于客戶端110和服務(wù)器120-140中一個或多個的客戶端或服務(wù)器實(shí)體(下文中稱作“客戶端/服務(wù)器實(shí)體”)的示例圖??蛻舳?服務(wù)器實(shí)體可以包括總線210,處理器220,主存儲器230,只讀存儲器(ROM)240,存儲設(shè)備250,輸入設(shè)備260,輸出設(shè)備270,以及通信接口280??偩€210可以包括允許客戶端/服務(wù)器實(shí)體的元件之間進(jìn)行通信的路徑。
處理器220可以包括常規(guī)處理器,微處理器,或解譯且執(zhí)行指令的處理邏輯。主存儲器230可以包括可以存儲由處理器220執(zhí)行的信息和指令的隨機(jī)訪問存儲器(RAM)或其他類型的動態(tài)存儲設(shè)備。ROM240可以包括可以存儲由處理器220使用的靜態(tài)信息和指令的常規(guī)ROM設(shè)備或其他類型的靜態(tài)存儲設(shè)備。存儲設(shè)備250可以包括磁和/或光記錄媒體及其相應(yīng)驅(qū)動器。
輸入設(shè)備260可以包括允許操作者向客戶端/服務(wù)器實(shí)體輸入信息的常規(guī)機(jī)制,例如鍵盤、鼠標(biāo)、手寫筆、語音識別和/或生物測定機(jī)制等等。輸出設(shè)備270可以包括向操作者輸出信息的常規(guī)機(jī)制,包括顯示器、打印機(jī)、揚(yáng)聲器等等。通信接口280可以包括任何能夠使客戶端/服務(wù)器實(shí)體與其他設(shè)備和/或系統(tǒng)進(jìn)行通信的象收發(fā)機(jī)一樣的機(jī)制。例如,通信接口280可以包括用于通過網(wǎng)絡(luò),如網(wǎng)絡(luò)150,與其他設(shè)備或系統(tǒng)進(jìn)行通信的機(jī)制。
正如將要在下文中詳細(xì)描述的那樣,符合本發(fā)明原理的客戶端/服務(wù)器實(shí)體,可以執(zhí)行特定的與搜索相關(guān)的操作。客戶端/服務(wù)器實(shí)體可以響應(yīng)于處理器220執(zhí)行計(jì)算機(jī)可讀媒體(如存儲器230)中包含的軟件指令,執(zhí)行這些操作。計(jì)算機(jī)可讀媒體可以定義為物理或邏輯存儲設(shè)備和/或載波。
軟件指令可以從其他計(jì)算機(jī)可讀媒體(如數(shù)據(jù)存儲設(shè)備250),或者通過通信接口280從其他設(shè)備讀取到存儲器230中。存儲器230中包含的軟件指令可以使處理器220執(zhí)行稍后將要描述的過程。替代地,硬件電路可以代替或者結(jié)合軟件指令來使用以實(shí)現(xiàn)符合本發(fā)明原理的過程。因此,符合本發(fā)明原理的實(shí)現(xiàn)方式并不局限于硬件電路和軟件的任何特定組合。
示例性處理圖3A-3D是根據(jù)符合本發(fā)明原理的某些實(shí)現(xiàn)方式,用于呈現(xiàn)與同文檔相關(guān)的web文檔有關(guān)的信息的示例處理的流程圖。處理可以始于用戶提供搜索項(xiàng)(或一組搜索項(xiàng))作為搜索文檔倉庫的搜索查詢。在一種實(shí)現(xiàn)方式中,文檔倉庫包括可以從因特網(wǎng)和/或數(shù)據(jù)庫(或數(shù)據(jù)庫集)獲得的文檔,而用于搜索該倉庫的工具(vehicle)是搜索引擎,例如搜索引擎125(圖1)。用戶可以通過客戶端,如客戶端110(圖1)上的web瀏覽器軟件來提供搜索查詢。
搜索查詢可以由搜索引擎來接收,并用來識別與搜索查詢相關(guān)的文檔(例如書籍、雜志、報紙、文章、目錄,等等)(動作305和310)(圖3A)。已經(jīng)存在用于識別與搜索查詢相關(guān)的文檔的基于技術(shù)。一種這樣的技術(shù)可能包括識別包含該搜索項(xiàng)或者搜索項(xiàng)同義字的文檔。當(dāng)搜索查詢包括多于一個搜索項(xiàng)時,則技術(shù)可能包括識別包含這些搜索項(xiàng)作為詞組的文檔,或者包含這些搜索項(xiàng)但不必同時包含的文檔,或者不用包含全部這些搜索項(xiàng)的文檔。其他技術(shù)對本領(lǐng)域技術(shù)人員而言也是眾所周知的。
任選地,可以以某種方式對這些文檔進(jìn)行評分(動作315)。例如,文檔的評分可以基于信息檢索(IR)得分。已經(jīng)存在用于生成IR分?jǐn)?shù)的若干技術(shù)。例如,文檔的IR得分可以基于文檔內(nèi)出現(xiàn)搜索項(xiàng)的文檔文本中(例如,在標(biāo)題、主體、頁腳、頁眉,等等)搜索項(xiàng)的出現(xiàn)數(shù)目,或者基于搜索項(xiàng)的出現(xiàn)特性(例如字體、尺寸、顏色,等等)來生成。其他技術(shù)對本領(lǐng)域技術(shù)人員而言也是眾所周知的。
搜索結(jié)果可以基于這些文檔及其任選得分來形成,并呈現(xiàn)給用戶(動作320)。在一種實(shí)現(xiàn)方式中,搜索結(jié)果可以包括與文檔關(guān)聯(lián)的信息,例如到文檔的鏈接,其可以基于文檔得分任選地進(jìn)行分類。類似于常規(guī)搜索引擎提供的搜索結(jié)果,可以將搜索結(jié)果提供為HTML文檔。替代地,可以根據(jù)搜索引擎和客戶端約定一致的其他格式(例如可擴(kuò)展標(biāo)記語言(XML))來提供搜索結(jié)果。
圖4是根據(jù)符合本發(fā)明原理的一種實(shí)現(xiàn)方式,其中可以以搜索結(jié)果400的形式呈現(xiàn)與文檔關(guān)聯(lián)的信息的圖形用戶界面的示例圖。如圖4所示,搜索結(jié)果400可以包括文檔標(biāo)題410,作者信息420,來自文檔的摘錄430,以及任選地到該文檔中其他相關(guān)摘錄的鏈接440。假設(shè)對于該例,以及隨后的那些例子,用戶已經(jīng)對與搜索項(xiàng)“military(軍事)”相關(guān)的文檔執(zhí)行了搜索,并且所得到的一個文檔包括“9/11Report(9/11報告)”。
文檔標(biāo)題410可以包括與該文檔關(guān)聯(lián)的標(biāo)題。文檔標(biāo)題410的選擇可以使得很可能采用(下文描述的)引用頁面的形式的與該文檔關(guān)聯(lián)的詳細(xì)信息得以呈現(xiàn)。作者信息420可以包括該文檔作者的姓名。摘錄430可以包括文檔中包括搜索查詢的搜索項(xiàng)的部分。搜索項(xiàng)的出現(xiàn)可以在摘錄430內(nèi)在視覺上加以辨別(例如高亮顯示)。鏈接440可以允許將含有搜索項(xiàng)的,來自該文檔的一個或多個其他摘錄呈現(xiàn)給用戶。
返回到圖3A,用戶可以選擇搜索結(jié)果中的一個文檔(動作325)。各種各樣的公知技術(shù)可以用于選擇。例如,選擇可以通過點(diǎn)擊、鼠標(biāo)懸停(mousehover)、鼠標(biāo)經(jīng)過(mouseover)、鍵盤敲擊等等來進(jìn)行。在一種實(shí)現(xiàn)方式中,文檔選擇可以包括與該文檔關(guān)聯(lián)的鏈接的選擇,諸如圖4所示的文檔標(biāo)題410的選擇。
在符合本發(fā)明原理的一種實(shí)現(xiàn)方式中,有可能采用引用頁面的方式的有關(guān)文檔的詳細(xì)信息,可以響應(yīng)于用戶對該文檔的選擇而呈現(xiàn)給用戶(動作330)(圖3B)。圖5是根據(jù)符合本發(fā)明原理的一種實(shí)現(xiàn)方式,與文檔關(guān)聯(lián)的引用頁面500的示例圖。如圖5所示,引用頁面500可用包括來自該文檔的摘錄510,有關(guān)該文檔的提要(synopsis)520,與該文檔關(guān)聯(lián)的封皮(iacket)或封皮內(nèi)折邊(flap)說明530,相關(guān)信息540,著錄信息550,以及到該文檔不同部分的一組鏈接560。在另外的實(shí)現(xiàn)方式中,引用頁面500可以包括更多、更少、或不同類型的信息。
摘錄510可以包括來自該文檔的、可以包括搜索查詢的搜索項(xiàng)的文本部分。該文本部分可以對應(yīng)于文檔文本的圖像或文本版本。搜索項(xiàng)的出現(xiàn)可以在該文本部分中在視覺上加以辨別(例如高亮顯示)。提要520可以包括該文檔內(nèi)容的簡短描述。封皮或封皮內(nèi)折邊說明530可以包括來自與該文檔關(guān)聯(lián)的封皮、封皮頁(cover)或封皮內(nèi)折邊的文本。
著錄信息510可以包括諸如ISBN,ISSN,出版者名稱,標(biāo)識文檔主題內(nèi)容類別的類別代碼,和/或
公開日期的信息。在其他實(shí)現(xiàn)方式中,著錄信息550可以包括更多,更少,或不同條信息。鏈接560可以包括到該文檔各部分的鏈接。例如,這些鏈接可以引用文檔的封面(front cover),內(nèi)容表,相關(guān)摘錄,索引,和/或封底(back cover)。這些鏈接之一的選擇可以使相應(yīng)文檔部分的圖像得以呈現(xiàn)。
相關(guān)信息540可以包括各種類型的與用戶可能發(fā)現(xiàn)有用的文檔相關(guān)的信息。該信息可以通過執(zhí)行與文檔屬性(例如標(biāo)題,作者,出版者,出版日期等)相關(guān)的搜索來獲得,以識別相關(guān)的web文檔。
可以通過搜索獲得的信息的例子可以包括與文檔評論關(guān)聯(lián)的信息,與文檔話題關(guān)聯(lián)的信息,與文檔主題或類別關(guān)聯(lián)的信息,與同該文檔同一系列書籍關(guān)聯(lián)的信息,與該文檔同一雜志中雜志發(fā)行(magazine issue)關(guān)聯(lián)的信息,與該文檔來自同一會議的同一日志中或與該文檔在同一雜志中的文章關(guān)聯(lián)的信息,與新聞文章關(guān)聯(lián)的信息,博客,或者其他類型的引用該文檔或文檔作者的張貼公告(posting),與同該文檔或該文檔話題相關(guān)產(chǎn)品關(guān)聯(lián)的信息,與該文檔出版者關(guān)聯(lián)的信息,與同該文檔關(guān)聯(lián)的出版日期關(guān)聯(lián)的信息,與作者傳記關(guān)聯(lián)的信息,與同作者相關(guān)的web文檔(諸如作者的網(wǎng)頁)關(guān)聯(lián)的信息,與作者圖像關(guān)聯(lián)的信息,和/或與相同作者的其他文檔關(guān)聯(lián)的信息。
在一種實(shí)現(xiàn)方式中,相關(guān)信息540可以包括與一個或多個文檔屬性關(guān)聯(lián)的鏈接列表。如圖5所示,示出了兩個示例性鏈接542和544。實(shí)際上,可以有另外的鏈接。這些鏈接之一的選擇可以使與特定文檔屬性相關(guān)的搜索得以執(zhí)行。例如,與作者傳記關(guān)聯(lián)的鏈接544的選擇可以使搜索得以執(zhí)行,以便識別包括與該文檔作者傳記相關(guān)的信息的web文檔。形成與各種話題相關(guān)的搜索查詢的技術(shù)是本領(lǐng)域眾所周知的。
相關(guān)信息540可任選地還包括與一個或多個文檔屬性相關(guān)的廣告集547。例如,廣告可以為銷售該文檔、該文檔的一部分、與作者相關(guān)的其它文檔或與該文檔屬于同一話題的其它文檔而提供。廣告集547可還或替換地與其它信息相關(guān)或從其它信息得出,所述其它信息例如搜索查詢項(xiàng)、另一(例如相關(guān))文檔或用戶行為(例如搜索或觀看歷史)。
返回到圖3B,可以判斷是否需要與文檔屬性相關(guān)的信息(動作335)。例如,可以判斷用戶是否選擇了一個鏈接或與相關(guān)信息540關(guān)聯(lián)的廣告。如果需要與文檔屬性相關(guān)的信息,那么可以執(zhí)行與文檔屬性相關(guān)的搜索以識別相關(guān)的web文檔(動作340)。例如,如果用戶需要有關(guān)文檔評論的信息,那么可以利用例如與文檔標(biāo)題或作者姓名關(guān)聯(lián)的詞或多個詞,以及類似“評論”或“多個評論”的詞作為搜索查詢,來執(zhí)行搜索。與上述技術(shù)類似的技術(shù)可以用來識別與搜索查詢相關(guān)的web文檔。
Web文檔可以基于IR得分和/或基于鏈接的得分任意地進(jìn)行評分。已經(jīng)存在生成IR和基于鏈接的得分的若干技術(shù)。用于生成IR得分的示例性技術(shù)可能基于該文檔中搜索項(xiàng)的出現(xiàn)數(shù)目。用于生成基于鏈接的得分的技術(shù)在美國專利No.6,285,999中進(jìn)行了描述。其他技術(shù)對本領(lǐng)域技術(shù)人員而言也是眾所周知的。
在另一實(shí)現(xiàn)方式中,作為后臺任務(wù),可以對與相關(guān)信息540關(guān)聯(lián)的所有鏈接進(jìn)行搜索。換句話說,為與相關(guān)信息540關(guān)聯(lián)的不同類型的信息,可以識別相關(guān)的web文檔,而且這些相關(guān)的web文檔可以進(jìn)行高速緩存,以便用于稍后當(dāng)用戶指示需要這些信息時,呈現(xiàn)給用戶。
搜索結(jié)果可以基于web文檔及其任選得分來形成,并呈現(xiàn)給用戶(動作345)。在一種實(shí)現(xiàn)方式中,搜索結(jié)果可以包括與web文檔關(guān)聯(lián)的信息,例如到web文檔的鏈接,它可以基于web文檔得分任意地進(jìn)行分類。類似于常規(guī)搜索引擎提供的搜索結(jié)果,可以將搜索結(jié)果提供為HTML文檔。替代地,可以根據(jù)搜索引擎和客戶端約定一致的格式(例如XML)來提供搜索結(jié)果。
圖6是根據(jù)符合本發(fā)明原理的一種實(shí)現(xiàn)方式,其中可以呈現(xiàn)關(guān)聯(lián)信息的圖形用戶界面的示例圖。在該示例性實(shí)現(xiàn)方式中,假設(shè)用戶通過選擇與相關(guān)信息540關(guān)聯(lián)的相應(yīng)鏈接,要求與該文檔評論相關(guān)的附加信息。在這種情況下,可以執(zhí)行搜索以識別帶有該文檔評論的web文檔。例如,諸如與文檔標(biāo)題(如“9/11 Report(9/11報告)”)或作者姓名關(guān)聯(lián)的詞或多個詞,以及類似“評論”或“多個評論”(或者很可能識別帶有該文檔評論的web文檔的其他搜索項(xiàng))的詞的搜索查詢,可以用來識別相關(guān)的web文檔。
一組搜索結(jié)果(在圖6中圖示了其兩個例子)可以呈現(xiàn)給用戶。在圖6中,示例性搜索結(jié)果對應(yīng)于書籍評論-9/11 Report(9/11報告)。例如,搜索結(jié)果600可以包括web文檔標(biāo)識符610,來自該web文檔的摘錄620,以及與該web文檔關(guān)聯(lián)的其他信息630。標(biāo)識符610可以識別該web文檔。標(biāo)識符610的選擇可以使得該web文檔得以呈現(xiàn)。摘錄620可以包括該web文檔中可以包括搜索查詢的搜索項(xiàng)的部分。搜索項(xiàng)的出現(xiàn)可以在摘錄620中在視覺上加以辨別(例如高亮顯示)。其他信息630可以包括web文檔的地址,web文檔的大小,與web文檔關(guān)聯(lián)的日期,或者與該web文檔關(guān)聯(lián)的其他信息。
在符合本發(fā)明原理的另一實(shí)現(xiàn)方式中,可以響應(yīng)于用戶在搜索結(jié)果中選擇文檔(動作325)(圖3A)而執(zhí)行搜索。在這種實(shí)現(xiàn)方式中,可以執(zhí)行與一個或多個文檔屬性相關(guān)的搜索,以識別相關(guān)的web文檔(動作350)(圖3C)。例如,可以對不同的文檔屬性形成搜索查詢,并且可以執(zhí)行搜索以識別相關(guān)的web文檔。上述技術(shù)的類似技術(shù)可以用來識別并有可能為與搜索查詢相關(guān)的web文檔評分。
有關(guān)該文檔的詳細(xì)信息(包括關(guān)于相關(guān)web文檔的信息),很可能以引用頁面的形式呈現(xiàn)給用戶(動作355)。在一種實(shí)現(xiàn)方式中,引用頁面可以類似于上面關(guān)于圖5所述的引用頁面500。然而,在這種實(shí)現(xiàn)方式中,與相關(guān)信息540關(guān)聯(lián)的鏈接可以用與相關(guān)web文檔關(guān)聯(lián)的信息來代替或加以補(bǔ)充。
圖7是根據(jù)符合本發(fā)明原理的另一實(shí)現(xiàn)方式,引用頁面部分700的示例圖。在該實(shí)現(xiàn)方式中,與一個或多個文檔屬性相關(guān)的一組搜索結(jié)果可以呈現(xiàn)給用戶。如圖7所示,與文檔評論542相對應(yīng)地呈現(xiàn)兩個示例性搜索結(jié)果。同樣如圖7所示,可以提供鏈接以用于另外的搜索結(jié)果。
例如,搜索結(jié)果710可以包括web文檔源712,來自該web文檔的摘錄714,以及與該web文檔關(guān)聯(lián)的其他信息716。源712可以包括該web文檔的源。源712的選擇可以使得對應(yīng)的web文檔得以呈現(xiàn)。摘錄714可以包括web文檔中可以包括搜索查詢的搜索項(xiàng)的部分。搜索項(xiàng)的出現(xiàn)可以在摘錄714中在視覺上加以辨別(例如高亮顯示)。其他信息716可以包括web文檔的地址,web文檔的大小,與web文檔關(guān)聯(lián)的日期,或者與該web文檔關(guān)聯(lián)的其他信息。
在符合本發(fā)明原理的另一實(shí)現(xiàn)方式中,可以響應(yīng)于用戶在搜索結(jié)果中選擇文檔(動作325)(圖3A)而執(zhí)行搜索。在這種實(shí)現(xiàn)方式中,可以執(zhí)行與一個或多個文檔屬性相關(guān)的搜索,以識別相關(guān)的web文檔(動作360)(圖3D)。例如,可以對不同的文檔屬性形成搜索查詢,并且可以執(zhí)行搜索以識別相關(guān)的web文檔。上述技術(shù)的類似技術(shù)可以用來識別并有可能為與搜索查詢相關(guān)的web文檔評分。
可以從相關(guān)的web文檔中提取信息(動作365)。可能是引用頁面形式的頁面可以基于所提取的信息來創(chuàng)建,并且該頁面可以呈現(xiàn)給用戶(動作370和375)。在一種實(shí)現(xiàn)方式中,引用頁面可以類似上面關(guān)于圖5描述的引用頁面500。然而,在這種實(shí)現(xiàn)方式中,與相關(guān)信息540關(guān)聯(lián)的鏈接可以用從相關(guān)web文檔提取的信息來代替或加以補(bǔ)充。
圖8是根據(jù)符合本發(fā)明原理的又一實(shí)現(xiàn)方式,引用頁面部分800的示例圖。在該實(shí)現(xiàn)方式中,對于各種類型的相關(guān)信息540,可以從對應(yīng)于一組搜索結(jié)果的web文檔中提取信息,并且該信息可以呈現(xiàn)給用戶。從搜索結(jié)果提取的特定類型的信息可以包括用戶可能發(fā)現(xiàn)有用的任何信息。
如圖8所示,呈現(xiàn)關(guān)于文檔評論的從兩個示例性搜索結(jié)果提取的信息。例如,信息810可以包括信息源812,任選用戶評級(rating)814,評論816,和其他信息818。源812可以包括該信息的源(例如Amazon.com)。源812的選擇可以使得來自該源的web文檔得以呈現(xiàn)。用戶評級814可以包括源812(例如Amazon.com)的用戶對該文檔的評級。評論816可以包括源812(例如Amazon.com)提供的文檔評論(或評論的一部分)。其他信息818可以包括web文檔的地址,web文檔的大小,與web文檔關(guān)聯(lián)的日期,或者與該web文檔關(guān)聯(lián)的其他信息。
替代的圖形用戶界面在符合本發(fā)明原理的替代實(shí)現(xiàn)方式中,與上面關(guān)于圖4所描述的類似,信息可以關(guān)于文檔而呈現(xiàn)。然而,在這種情況下,與相關(guān)信息540(圖5)類似,可以為相關(guān)信息提供附加鏈接。圖9是根據(jù)符合本發(fā)明原理的該替代實(shí)現(xiàn)方式,其中可以以搜索結(jié)果900的形式呈現(xiàn)與文檔關(guān)聯(lián)的信息的圖形用戶界面的示例圖。如圖9所示,搜索結(jié)果900可以包括文檔標(biāo)題410,作者信息420,來自文檔的摘錄430,到該文檔中其他相關(guān)摘錄的任選鏈接440,以及到相關(guān)信息的鏈接910。文檔標(biāo)題410,作者信息420,摘錄430,任選鏈接440可以類似于上面關(guān)于圖4所述的部分。
鏈接910可以使得相關(guān)信息得以呈現(xiàn)。圖10A和圖10B是根據(jù)符合本發(fā)明原理的兩種不同實(shí)現(xiàn)方式,其中可以呈現(xiàn)相關(guān)信息的圖形用戶界面的示例圖。如圖10A所示,鏈接910的選擇可以使一組鏈接得以提供,這組鏈接可以基于它們所關(guān)聯(lián)的不同類型的文檔屬性進(jìn)行任意地分離。如上所述,該組鏈接中某一鏈接的選擇可以使得執(zhí)行搜索并呈現(xiàn)結(jié)果。
如圖10B所示,鏈接910的選擇可以使得關(guān)于它們所關(guān)聯(lián)的不同類型的文檔屬性,執(zhí)行搜索并呈現(xiàn)結(jié)果。在一種實(shí)現(xiàn)方式中,可以提供一組搜索結(jié)果(類似于圖7)。如上所述,這些搜索結(jié)果之一的選擇可以使得對應(yīng)的web文檔得以呈現(xiàn)。在另一實(shí)現(xiàn)方式中,可以提供對應(yīng)于一組搜索結(jié)果的從web文檔(多個web文檔)提取的信息(類似于圖8)。
結(jié)論符合本發(fā)明原理的系統(tǒng)和方法可以對與一個或多個文檔屬性相關(guān)的附加信息進(jìn)行搜索,并且與該文檔關(guān)聯(lián)地提供所述附加信息。
本發(fā)明優(yōu)選實(shí)施例的前述說明提供了說明和描述,但是并不意圖是窮盡的或?qū)⒈景l(fā)明局限于所公開的確切形式。各種修改和變形可以根據(jù)上述教導(dǎo)作出,或可以從本發(fā)明的實(shí)踐中獲得。
例如,盡管已經(jīng)關(guān)于圖3A-3D描述了一系列的動作,但是在符合本發(fā)明原理的其他實(shí)現(xiàn)方式中,可以對這些動作的次序進(jìn)行修改。此外,還可以并行地執(zhí)行不相互依賴的動作。
已經(jīng)描述了將文檔識別為搜索結(jié)果,并且可以呈現(xiàn)與該文檔或文檔作者相關(guān)的web文檔。然而,在其他實(shí)現(xiàn)方式中,文檔可以以其他方式來標(biāo)識,例如通過目錄、類別,或其他文檔列表。
同樣,已經(jīng)關(guān)于圖4-10B描述了示例性圖形用戶界面。在符合本發(fā)明原理的其他實(shí)現(xiàn)方式中,圖形用戶界面可以包括更多,更少,或不同條信息。
如上所述,對本領(lǐng)域普通技術(shù)人員而言顯而易見的是,本發(fā)明的這些方面可以在如附圖中所示實(shí)現(xiàn)方式中以軟件、硬件和固件的許多不同形式來實(shí)現(xiàn)。用來實(shí)現(xiàn)符合本發(fā)明原理的方面的實(shí)際軟件代碼或?qū)S每刂朴布⒎菍Ρ景l(fā)明的限制。因此,并不參照特定的軟件代碼對這些方面的操作和性能進(jìn)行描述——可以理解本領(lǐng)域普通技術(shù)人員能夠根據(jù)此處的說明,設(shè)計(jì)軟件和控制硬件來實(shí)現(xiàn)這些方面。
本申請中使用的元件、動作或指令都不應(yīng)當(dāng)解釋為對本發(fā)明關(guān)鍵或必要的,除非進(jìn)行了這樣的明確描述。同樣,在此處使用時,冠詞“一”意圖包括一個或多個項(xiàng)目。在意指唯一一個項(xiàng)目的時候,使用術(shù)語“一個”或類似語言。此外,短語“基于”意圖表達(dá)“至少部分地基于”的含義,除非另外進(jìn)行了明確表明。
權(quán)利要求
1.一種方法,包括接收搜索查詢;基于該搜索查詢執(zhí)行第一搜索以識別文檔;基于與該文檔關(guān)聯(lián)的屬性執(zhí)行第二搜索;以及呈現(xiàn)第二搜索的結(jié)果。
2.根據(jù)權(quán)利要求1的方法,其中執(zhí)行第二搜索的步驟包括接收該文檔的選擇,以及響應(yīng)于該文檔的選擇,執(zhí)行第二搜索。
3.根據(jù)權(quán)利要求1的方法,其中執(zhí)行第二搜索的步驟包括接收該文檔的選擇,呈現(xiàn)與該文檔關(guān)聯(lián)的引用頁面,該引用頁面包括與屬性關(guān)聯(lián)的多個鏈接,接收這些鏈接之一的選擇,以及響應(yīng)于這些鏈接之一的所述選擇,執(zhí)行第二搜索。
4.根據(jù)權(quán)利要求1的方法,其中呈現(xiàn)第二搜索的結(jié)果的步驟包括識別與屬性相關(guān)的web文檔,從該web文檔中提取信息,以及呈現(xiàn)所提取的信息。
5.根據(jù)權(quán)利要求1的方法,其中呈現(xiàn)第二搜索的結(jié)果的步驟包括將web文檔識別為第二搜索的結(jié)果,生成所述web文檔的得分,基于所述得分對web文檔進(jìn)行分類,以及呈現(xiàn)分類后的web文檔。
6.根據(jù)權(quán)利要求5的方法,其中生成所述web文檔的得分的步驟包括生成所述web文檔的信息檢索得分,生成所述web文檔的基于鏈接的得分,以及基于信息檢索得分和基于鏈接的得分,生成所述web文檔的總體得分。
7.根據(jù)權(quán)利要求1的方法,還包括呈現(xiàn)與該文檔關(guān)聯(lián)的引用頁面,該引用頁面包括與帶有與屬性相關(guān)的信息的web文檔的搜索關(guān)聯(lián)的鏈接。
8.根據(jù)權(quán)利要求7的方法,其中鏈接的選擇使得第二搜索得以執(zhí)行。
9.根據(jù)權(quán)利要求7的方法,其中所述引用頁面還包括以下中的至少之一該文檔的內(nèi)容的描述,與同該文檔關(guān)聯(lián)的封皮、封皮頁或封皮內(nèi)折邊之一關(guān)聯(lián)的文本,與該文檔關(guān)聯(lián)的著錄信息,或廣告。
10.根據(jù)權(quán)利要求7的方法,其中所述引用頁面還包括來自該文檔的摘錄,和到該文檔各部分的一組鏈接。
11.根據(jù)權(quán)利要求10的方法,其中所述摘錄包括來自該文檔的一部分文本的圖像。
12.根據(jù)權(quán)利要求10的方法,其中該組鏈接引用以下中的至少之一與該文檔關(guān)聯(lián)的封面,與該文檔關(guān)聯(lián)的內(nèi)容表,與該文檔關(guān)聯(lián)的索引,或與該文檔關(guān)聯(lián)的封底。
13.根據(jù)權(quán)利要求1的方法,其中呈現(xiàn)第二搜索的結(jié)果的步驟包括呈現(xiàn)與該文檔關(guān)聯(lián)的引用頁面,該引用頁面包括到帶有與所述屬性相關(guān)的信息的web文檔的鏈接。
14.根據(jù)權(quán)利要求13的方法,其中該鏈接通過執(zhí)行第二搜索而生成。
15.根據(jù)權(quán)利要求13的方法,其中所述引用頁面還包括以下中的至少之一該文檔的內(nèi)容的描述,與同該文檔關(guān)聯(lián)的封皮、封面或封皮內(nèi)折邊之一關(guān)聯(lián)的文本,與該文檔關(guān)聯(lián)的著錄信息,或廣告。
16.根據(jù)權(quán)利要求13的方法,其中所述引用頁面還包括來自該文檔的摘錄,和到該文檔各部分的一組鏈接。
17.根據(jù)權(quán)利要求13的方法,其中所述廣告與搜索查詢、文檔或用戶行為中的至少一個相關(guān),或者從搜索查詢、文檔或用戶行為中的至少一個導(dǎo)出。
18.根據(jù)權(quán)利要求1的方法,其中呈現(xiàn)第二搜索的結(jié)果的步驟包括呈現(xiàn)與該文檔關(guān)聯(lián)的引用頁面,該引用頁面含有從帶有與所述屬性相關(guān)的信息的web文檔中提取的信息。
19.根據(jù)權(quán)利要求18的方法,其中所述web文檔通過第二搜索來識別。
20.根據(jù)權(quán)利要求1的方法,其中所述屬性對應(yīng)于與該文檔關(guān)聯(lián)的標(biāo)題、作者、類別、出版者、或出版日期中的至少一個。
21.一種系統(tǒng),包括用于標(biāo)識文檔的部件;用于執(zhí)行搜索以識別與同該文檔關(guān)聯(lián)的屬性相關(guān)的web文檔的部件;以及用于提供與所述web文檔關(guān)聯(lián)的信息和該文檔的部件。
22.一種系統(tǒng),包括存儲指令的存儲器;和執(zhí)行這些指令以便實(shí)現(xiàn)以下動作的處理器識別文檔,執(zhí)行搜索以識別帶有與同該文檔關(guān)聯(lián)的屬性相關(guān)的信息的web文檔,以及呈現(xiàn)與該web文檔關(guān)聯(lián)的信息。
23.一種計(jì)算機(jī)可讀媒體中體現(xiàn)的圖形用戶界面,包括到文檔各部分的一組鏈接;該文檔的內(nèi)容的描述;與該文檔關(guān)聯(lián)的著錄信息;和鏈接,用于使帶有與同該文檔關(guān)聯(lián)的屬性相關(guān)的信息的web文檔的搜索得以執(zhí)行。
24.根據(jù)權(quán)利要求23的圖形用戶界面,其中所述鏈接包括與同該文檔關(guān)聯(lián)的不同屬性關(guān)聯(lián)的多個鏈接。
25.根據(jù)權(quán)利要求23的圖形用戶界面,還包括來自該文檔的摘錄。
26.根據(jù)權(quán)利要求25的圖形用戶界面,其中所述摘錄包括多個詞,這些詞之一相對于這些詞的另一個,可以在視覺上加以辨別。
27.根據(jù)權(quán)利要求23的圖形用戶界面,其中該組鏈接引用以下中的至少之一與該文檔關(guān)聯(lián)的封面,與該文檔關(guān)聯(lián)的內(nèi)容表,與該文檔關(guān)聯(lián)的索引,或與該文檔關(guān)聯(lián)的封底。
28.根據(jù)權(quán)利要求23的圖形用戶界面,其中所述屬性對應(yīng)于與該文檔關(guān)聯(lián)的標(biāo)題、作者、類別、出版者、或出版日期中的至少一個。
29.一種方法,包括接收來自用戶的文檔標(biāo)識;自動執(zhí)行多個搜索以識別與同該文檔關(guān)聯(lián)的屬性相關(guān)的web文檔;以及向用戶提供與該web文檔關(guān)聯(lián)的信息。
30.一種包含有計(jì)算機(jī)可執(zhí)行指令的計(jì)算機(jī)可讀媒體,所述計(jì)算機(jī)可執(zhí)行指令包括用于識別文檔的指令;用于執(zhí)行搜索以識別帶有與同該文檔關(guān)聯(lián)的屬性相關(guān)的信息的web文檔的指令;用于從所述web文檔提取信息的指令;以及用于連同與該文檔關(guān)聯(lián)的信息呈現(xiàn)所提取的信息的指令。
全文摘要
一種系統(tǒng),識別文檔,執(zhí)行搜索以識別與同該文檔關(guān)聯(lián)的屬性相關(guān)的web文檔,并提供與所述web文檔關(guān)聯(lián)的信息和該文檔。
文檔編號G06F17/30GK101061478SQ200580039693
公開日2007年10月24日 申請日期2005年8月29日 優(yōu)先權(quán)日2004年9月30日
發(fā)明者舍拉佳·哈利克, 威廉姆·C·布魯格赫 申請人:Google公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1
邵武市| 虎林市| 桂阳县| 石城县| 泗洪县| 上林县| 西乌珠穆沁旗| 沁阳市| 静乐县| 新密市| 西充县| 蕲春县| 江门市| 界首市| 霍邱县| 安平县| 灵台县| 蒲城县| 长兴县| 嘉峪关市| 南投县| 清新县| 天镇县| 汉川市| 三台县| 安多县| 灵石县| 玉田县| 苗栗县| 辰溪县| 洪泽县| 松江区| 四平市| 吉林市| 达尔| 大城县| 望奎县| 金堂县| 吴忠市| 成安县| 博乐市|