專利名稱:基于詞法和本體概念重排搜索結(jié)果的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及計算機搜索,尤其涉及搜索結(jié)果的重排。
背景技術(shù):
搜索引擎可用于為搜索查詢提取web結(jié)果、新聞以及其他感興趣的文檔。當搜索門戶希望以有意義的方式呈現(xiàn)這些結(jié)果時,這些門戶通常不知道這些文檔對于它們的用戶上下文的相對重要性??捎梦臋n、新聞文章以及其他文檔被排列,但不必要考慮主導(dǎo)的話題上下文。這具有減低和用戶上下文有關(guān)的關(guān)鍵結(jié)果項的重要性的無意效果。
發(fā)明內(nèi)容
提供本發(fā)明內(nèi)容是為了以簡化的形式介紹將在以下具體實施方式
中進一步描述的一些概念。本發(fā)明內(nèi)容不旨在標識所要求保護的主題的關(guān)鍵特征或本質(zhì)特征,也不旨在用于幫助確定所要求保護的主題的范圍。本發(fā)明的各實施例涉及提供搜索結(jié)果的改進的相關(guān)性。當接收到搜索查詢時,分析搜索查詢的查詢上下文以標識搜索查詢的一個或多個主導(dǎo)概念。然后使用來自元數(shù)據(jù)庫的概念圖來擴展主導(dǎo)概念以標識多個擴展的概念。分析搜索查詢的搜索結(jié)果以標識每個搜索結(jié)果包括擴展的概念的程度。搜索結(jié)果基于每個搜索結(jié)果到擴展概念的關(guān)系強度、以及每個擴展概念到查詢上下文的主導(dǎo)概念的關(guān)系強度來重排序。
下面參考附圖詳細描述本發(fā)明,附圖中圖1是適用于實現(xiàn)本發(fā)明的各實施例的示例性計算環(huán)境的框圖;圖2是示出其中可以使用本發(fā)明各實施例的示例性系統(tǒng)的框圖;圖3是示出根據(jù)本發(fā)明一實施例的用于標識查詢上下文的主導(dǎo)概念、并且使用元數(shù)據(jù)庫來擴展所述概念的方法的流程圖;圖4是示出根據(jù)本發(fā)明的一實施例的用于采用元數(shù)據(jù)庫來標識搜索查詢的擴展概念的方法的流程圖;圖5是示出根據(jù)本發(fā)明的一實施例的用于使用擴展概念來排序搜索結(jié)果的方法的流程圖;以及圖6是示出根據(jù)本發(fā)明的一實施例的用于使用擴展概念來分析和排序搜索結(jié)果的方法的流程圖。
具體實施例方式此處用細節(jié)來描述本發(fā)明的主題以滿足法定要求。然而,該描述本身并非旨在限制本專利的范圍。相反,發(fā)明人設(shè)想所要求保護的主題還可結(jié)合其他當前或未來技術(shù)按照其他方式來具體化,以包括不同的步驟或類似于本文中所描述的步驟的步驟組合。此外,盡
4管術(shù)語“步驟”和/或“框”可在此處用于指示所采用的方法的不同元素,但除非而且僅當明確描述了各個步驟的順序,否則該術(shù)語不應(yīng)被解釋為意味著此處公開的各個步驟之中或之間的任何特定順序。如前所述,本發(fā)明的各實施例一般針對通過處理相關(guān)概念的搜索查詢和結(jié)果,來為搜索查詢的上下文改進搜索結(jié)果的相關(guān)性。按照本發(fā)明各實施例,可以分析搜索查詢來標識查詢上下文。也可以標識查詢上下文內(nèi)的主導(dǎo)概念。可以使用來自元數(shù)據(jù)庫的概念圖來擴展主導(dǎo)概念以標識擴展的概念。概念圖將概念表示為節(jié)點,將概念間的關(guān)系表示為節(jié)點間的邊。可以通過分析電子文檔的語料庫來提取概念和關(guān)系,從而構(gòu)建概念圖。概念圖中的概念包括具有相關(guān)聯(lián)的表面形式或字符串的詞法概念、以及具有和圖中其他概念的語義關(guān)系的本體概念。此外,概念圖可以包括表示每個概念之間的關(guān)系強度的數(shù)據(jù)??梢酝ㄟ^確定概念圖內(nèi)主導(dǎo)概念的位置、并且標識和主導(dǎo)概念具有關(guān)系的概念, 從而從概念圖中標識擴展的概念。擴展概念可以基于從概念圖確定的、每個概念與主導(dǎo)概念的關(guān)系強度來選擇。擴展概念可用于分析搜索查詢的一組搜索結(jié)果并對其進行重排。特別是,可以分析每個搜索結(jié)果以確定搜索結(jié)果是否包含每個擴展概念。可以在每個搜索結(jié)果和每個擴展概念之間確定關(guān)系強度。然后基于每個搜索結(jié)果到每個擴展概念的關(guān)系強度、以及每個擴展概念到搜索查詢的主導(dǎo)概念的關(guān)系強度,對搜索結(jié)果進行重排。因而,在一方面,本發(fā)明的實施例針對一種用于重排多個搜索結(jié)果的計算機實現(xiàn)的方法。該方法包括接收搜索查詢并且從搜索查詢中標識一個或多個主導(dǎo)概念。該方法還包括用和元數(shù)據(jù)庫中的一個或多個主導(dǎo)概念具有關(guān)系的多個擴展概念來擴展一個或多個主導(dǎo)概念。該方法還包括接收多個經(jīng)排序的搜索結(jié)果,使用擴展概念分析搜索結(jié)果,以及基于擴展概念重排搜索結(jié)果。該方法還包括提供經(jīng)重排的搜索結(jié)果以呈現(xiàn)給終端用戶。在另一實施例中,本發(fā)明的一方面涉及存儲計算機可使用指令的一個或多個計算機可讀介質(zhì),當這些指令由一個或多個計算設(shè)備使用時,使該一個或多個計算設(shè)備執(zhí)行一種方法。該方法包括接收搜索查詢并且標識所述搜索查詢的查詢上下文。該方法還包括分析查詢上下文以標識一個或多個主導(dǎo)概念。該方法還包括標識概念圖內(nèi)一個或多個主導(dǎo)概念的每一個的位置、并且標識和概念圖內(nèi)的一個或多個主導(dǎo)概念具有關(guān)系的多個附加概念。該方法還包括向每個附加概念分配第一權(quán)重,表示每個附加概念到概念圖內(nèi)的一個或多個主導(dǎo)概念的關(guān)系強度。該方法還包括基于所分配的權(quán)重選擇附加概念的一個子集以提供一組擴展概念。該方法還包括接收多個搜索結(jié)果并且分析每個搜索結(jié)果以確定每個搜索結(jié)果是否包括擴展概念中的一個或多個。該方法還包括向每個搜索結(jié)果分配一個或多個第二權(quán)重,表示每個搜索結(jié)果到擴展概念的關(guān)系強度。該方法還包括基于第一權(quán)重和第二權(quán)重的組合來排序搜索結(jié)果,并且提供經(jīng)排序的搜索結(jié)果供呈現(xiàn)給終端用戶。本發(fā)明的又一實施例針對一種包括一個或多個處理器和存儲計算機可使用組件的一個或多個計算機可讀介質(zhì)的系統(tǒng)。計算機可使用組件包括查詢上下文分析組件、查詢擴展組件、搜索結(jié)果分析組件以及搜索結(jié)果排序組件。查詢上下文分析組件分析接收到的搜索查詢的查詢上下文以標識搜索查詢的一個或多個主導(dǎo)概念。查詢擴展組件使用來自元數(shù)據(jù)庫的概念圖將一個或多個主導(dǎo)概念擴展為多個擴展概念。搜索結(jié)果分析組件分析多個搜索結(jié)果以確定每個搜索結(jié)果到擴展概念的關(guān)系強度。搜索結(jié)果排序組件基于每個搜索結(jié)果到擴展概念的關(guān)系強度、以及每個擴展概念到一個或多個主導(dǎo)概念的關(guān)系強度來排序多個搜索結(jié)果。在簡要描述了本發(fā)明各實施例的概覽之后,以下描述可實現(xiàn)本發(fā)明的各實施方式的示例性操作環(huán)境,以便為本發(fā)明各方面提供通用上下文。首先具體參考圖1,示出了用于實現(xiàn)本發(fā)明的各實施方式的示例性操作環(huán)境,并將其概括地指定為計算設(shè)備100。計算設(shè)備100只是合適的計算環(huán)境的一個示例,并且不旨在對本發(fā)明的使用范圍或功能提出任何限制。也不應(yīng)該將計算設(shè)備100解釋為對所示出的組件的任何一個或組合有任何依賴性或要求。本發(fā)明可以在由計算機或諸如個人數(shù)據(jù)助理或其他手持式設(shè)備之類的其他機器執(zhí)行的計算機代碼或機器可使用指令(包括諸如程序模塊之類的計算機可執(zhí)行指令)的一般上下文中描述。一般而言,包括例程、程序、對象、組件、數(shù)據(jù)結(jié)構(gòu)等的程序模塊指的是執(zhí)行特定任務(wù)或?qū)崿F(xiàn)特定抽象數(shù)據(jù)類型的代碼。本發(fā)明可以在各種系統(tǒng)配置中實施,這些系統(tǒng)配置包括手持式設(shè)備、消費電子產(chǎn)品、通用計算機、專用計算設(shè)備等等。本發(fā)明也可以在其中任務(wù)由通過通信網(wǎng)絡(luò)鏈接的遠程處理設(shè)備執(zhí)行的分布式計算環(huán)境中實施。參考圖1,計算設(shè)備100包括直接或間接耦合以下設(shè)備的總線110 存儲器112、一個或多個處理器114、一個或多個呈現(xiàn)組件116、輸入/輸出端口 118、輸入/輸出組件120、 和說明性電源122??偩€110表示一條或多條總線(諸如地址總線、數(shù)據(jù)總線、或其組合)。 雖然為了清楚起見利用線條示出了圖1的各個框,但實際上,這些框表示邏輯組件而不一定是實際組件。例如,可以認為諸如顯示設(shè)備的呈現(xiàn)組件是I/O組件。而且,處理器具有存儲器??梢哉J識到,這是本領(lǐng)域的特性,并且重申,圖1的圖示只是例示可結(jié)合本發(fā)明的一個或多個實施例來使用的示例性計算設(shè)備。諸如“工作站”、“服務(wù)器”、“膝上型計算機”、“手持式設(shè)備”等分類之間沒有區(qū)別,它們?nèi)慷急徽J為是在圖1的范圍之內(nèi)的并且被稱為“計算設(shè)備”。計算設(shè)備100通常包括各種計算機可讀介質(zhì)。計算機可讀介質(zhì)可以是可由計算機設(shè)備100訪問的任何可用介質(zhì),且包括用任何方法或技術(shù)實現(xiàn)以存儲諸如計算機可讀指令、數(shù)據(jù)結(jié)構(gòu)、程序模塊或其它數(shù)據(jù)等信息的易失性和非易失性介質(zhì)、可移動和不可移動介質(zhì)。計算機可讀介質(zhì)包括但不限于,RAM、ROM、EEPR0M、閃存或其它存儲器技術(shù)、CD-ROM、數(shù)字多功能盤(DVD)或其它光盤存儲、盒式磁帶、磁帶、磁盤存儲或其它磁存儲設(shè)備,或者可用于存儲所需信息并且可由計算設(shè)備100訪問的任何其它介質(zhì)。上述的任意組合也應(yīng)包含在計算機可讀介質(zhì)的范圍內(nèi)。存儲器112包括易失性和/或非易失性存儲器形式的計算機存儲介質(zhì)。存儲器可以是可移動的、不可移動的、或其組合。示例性硬件設(shè)備包括固態(tài)存儲器、硬盤驅(qū)動器、光盤驅(qū)動器等。計算設(shè)備100包括從諸如存儲器112或I/O組件120等各種實體讀取數(shù)據(jù)的一個或多個處理器。呈現(xiàn)組件116向終端用戶或其他設(shè)備呈現(xiàn)數(shù)據(jù)指示。示例性呈現(xiàn)組件包括顯示設(shè)備、揚聲器、打印組件、振動組件等等。I/O端口 118允許計算設(shè)備100邏輯上耦合至包括I/O組件120的其他設(shè)備,其中的一些設(shè)備可以是內(nèi)置的。說明性組件包括話筒、操縱桿、游戲手柄、圓盤式衛(wèi)星天線、掃描儀、打印機、無線設(shè)備等等?,F(xiàn)參考圖2,提供了示出在其中可以采用本發(fā)明的各實施方式的示例性系統(tǒng)200的框圖。應(yīng)當理解,此處所描述的這一和其他安排僅作為示例來闡明。除了所示的安排和元素之外,或作為其替代,可使用其他安排和元素(例如,機器、接口、功能、次序、以及功能組等),并且可完全省略某些元素。此外,此處所描述的許多元素是可以實現(xiàn)為分立或分布式組件或結(jié)合其他組件來實現(xiàn)的、以及以任何合適的組合和在任何合適的位置的功能實體。 此處被描述為由一個或多個實體執(zhí)行的各種功能可由硬件、固件和/或軟件來執(zhí)行。例如, 各種功能可由執(zhí)行存儲在存儲器中的指令的處理器來執(zhí)行。除了未示出的其他組件之外,系統(tǒng)200包括用戶設(shè)備202、搜索引擎204和重排序引擎206。圖2中所示的組件的每一個可以包括在任何類型的計算設(shè)備上,諸如例如參考圖 1描述的計算設(shè)備100。各組件可以經(jīng)由網(wǎng)絡(luò)208彼此通信,網(wǎng)絡(luò)208包括但不限于一個或多個局域網(wǎng)(LAN)和/或廣域網(wǎng)(WAN)。這樣的聯(lián)網(wǎng)環(huán)境常見于辦公室、企業(yè)范圍計算機網(wǎng)絡(luò)、內(nèi)聯(lián)網(wǎng)和因特網(wǎng)中。應(yīng)理解,可在本發(fā)明范圍內(nèi)的系統(tǒng)200內(nèi)采用任何數(shù)量的用戶設(shè)備、重排序引擎和搜索引擎。它們各自可包括單個設(shè)備或在分布式環(huán)境中協(xié)作的多個設(shè)備。 例如,重排序引擎206可包括安排在分布式環(huán)境中共同提供此處描述的重排序引擎206的功能的多個設(shè)備。另外,未示出的其他組件還可被包括在系統(tǒng)200中并且在某些實施方式中可以排除圖2所示的組件。按照本發(fā)明的各實施例,重排序引擎206 —般用于標識搜索查詢的主導(dǎo)概念,使用元數(shù)據(jù)庫218來擴展主導(dǎo)概念,并且基于到擴展概念的關(guān)系強度來重排序搜索結(jié)果。如圖2所示,重排序引擎206 —般包括查詢上下文分析組件210、查詢擴展組件212、搜索結(jié)果分析組件214和搜索結(jié)果排序組件216。在操作中,重排序組件206可以接收搜索查詢。在一些實施例中,搜索查詢可由采用諸如用戶設(shè)備202等用戶設(shè)備的終端用戶提交。例如,終端用戶可以使用用戶設(shè)備202 上的web瀏覽器來訪問搜索輸入網(wǎng)頁并輸入搜索查詢。作為另一示例,用戶可以經(jīng)由搜索引擎工具欄所提供的搜索輸入框來輸入搜索查詢,搜索引擎工具欄位于例如web瀏覽器、 用戶設(shè)備202的桌面、或其他位置內(nèi)。本領(lǐng)域技術(shù)人員將認識到,在本發(fā)明的各實施方式的范圍內(nèi)還可以使用各種其他方法來提供搜索查詢。在其他實施例中,可以提供API,其允許應(yīng)用程序提交由重排序引擎206所接收的搜索查詢。例如,應(yīng)用程序可以駐留在向重排序引擎206提交搜索查詢的用戶設(shè)備202或其他第三方設(shè)備上。當重排序引擎206接收搜索查詢時,查詢上下文分析組件210分析搜索查詢以標識查詢上下文。查詢上下文可以包括關(guān)于搜索查詢的各種信息。例如,搜索查詢可以包括由終端用戶輸入的搜索項,查詢上下文包括那些搜索項。在其他情況下,搜索查詢可以包括空查詢,其中終端用戶未提供搜索項。查詢上下文還可以包括其他信息,諸如例如,提交搜索查詢的時間、或者提交搜索查詢的終端用戶的位置。在本發(fā)明各實施例中,與搜索查詢有關(guān)的各種附加信息可由查詢上下文分析組件210標識為查詢上下文的一部分。查詢上下文分析組件210也可以基于查詢上下文來標識搜索查詢的一個或多個主導(dǎo)概念。每個主導(dǎo)概念可以是搜索查詢相關(guān)的一個特定的話題或?qū)嶓w,諸如人、地方或事物。主導(dǎo)概念不僅僅是來自搜索查詢的項,而是表示由查詢上下文的分析而確定的搜索查詢的主焦點。在一些實施例中,可以通過結(jié)合來自元數(shù)據(jù)庫218的概念分析查詢上下文,來標識主導(dǎo)概念。特別是,元數(shù)據(jù)庫218可以包括概念圖等。概念圖可以存儲和概念以及概念間的關(guān)系有關(guān)的數(shù)據(jù)。概念可以由概念圖中的節(jié)點來表示,節(jié)點間的邊可以表示概念間的關(guān)系。此外,邊可以標識概念間的關(guān)系強度。可以通過分析諸如萬維網(wǎng)上可用的文檔等電子文檔的語料庫來構(gòu)建元數(shù)據(jù)庫218所存儲的數(shù)據(jù),包括概念圖,從而標識文檔內(nèi)的概念以及概念間的關(guān)系?;趯ξ臋n的改變以及新文檔的添加,數(shù)據(jù)可以是動態(tài)的。例如,概念圖可以基于在新聞文章被發(fā)布時從所述文章收集的概念來更新。由此,概念圖和元數(shù)據(jù)庫不是域受限的。查詢擴展組件212通過用來自元數(shù)據(jù)庫218的擴展概念的集合來擴展搜索查詢的主導(dǎo)概念從而進行操作。按照本發(fā)明的一些實施例,這可以包括在元數(shù)據(jù)庫218的概念圖中標識每個主導(dǎo)概念的位置。標識與概念圖中的主導(dǎo)概念具有關(guān)系的其他概念。此外,從概念圖確定概念到主導(dǎo)概念的關(guān)系強度。在各實施例中,可以為每個概念確定表示所述概念到主導(dǎo)概念的關(guān)系強度的權(quán)重、排名或其他分數(shù)。概念權(quán)重、排名或分數(shù)可用于確定將哪些概念選擇作為供進一步分析的擴展概念。例如,在一些實施例中,可以選擇最上面的N個概念作為擴展概念。在其他實施例中,可以選擇具有超過一預(yù)定閾值的權(quán)重、排名或其他分數(shù)的概念作為擴展概念??梢圆捎脭U展概念來重排一組搜索結(jié)果。在本發(fā)明各實施例中,可以以多種不同的方式將要被重排的搜索結(jié)果提供給重排序引擎206。在一些實施例中,搜索引擎204提供一組經(jīng)排序的搜索結(jié)果。搜索結(jié)果可以使用初始搜索查詢并且基于搜索引擎204對可搜索內(nèi)容220的底層搜索算法來選擇和排序,所述可搜索內(nèi)容220可以包括搜索系統(tǒng)索引。在一些情況下,搜索結(jié)果也可以初始地部分基于為查詢上下文標識的主導(dǎo)概念和/或擴展概念來選擇??伤阉鲀?nèi)容220可以包括多個不同的源,諸如一般web文檔、新聞文檔、照片、 TWITTER源等。由此,在一些實施例中,接收到的搜索查詢可以包括對應(yīng)于不同源的單獨的搜索結(jié)果集合。例如,接收到的搜索結(jié)果可以包括一組一般web文檔、一組新聞文檔、一組照片、一組TWITTER源等。按照各實施例,搜索引擎204和重排序引擎206兩者可由單個搜索系統(tǒng)提供者來提供,使得搜索引擎204和重排序引擎206共同用于從終端用戶接收搜索查詢并且返回經(jīng)重排的搜索結(jié)果。在其他實施例中,搜索引擎204可由與重排序引擎206的提供者分開的搜索系統(tǒng)提供者來提供。由此,重排序引擎可以接收初始搜索查詢以及用于重排的一組搜索結(jié)果,作為來自搜索引擎204的輸入。在進一步的實施例中,圖2中未示出的其他組件可以向重排序引擎206提供搜索查詢和該組搜索結(jié)果,用于重排搜索結(jié)果。搜索結(jié)果分析組件214使用擴展概念來分析該組搜索結(jié)果。按照一些實施例,搜索結(jié)果分析組件214分析每個搜索結(jié)果以標識搜索結(jié)果是否包含擴展概念。分析可以對搜索結(jié)果標題、搜索結(jié)果片段、搜索結(jié)果所引用的文檔、或與搜索結(jié)果相關(guān)聯(lián)的其他文本或元數(shù)據(jù)來執(zhí)行??梢詾槊總€搜索結(jié)果和每個擴展概念分配表示擴展概念到搜索結(jié)果的關(guān)系強度的權(quán)重、排名或其他分數(shù)。搜索結(jié)果排序組件216使用搜索結(jié)果/擴展概念權(quán)重、排名或分數(shù)以及擴展概念 /主導(dǎo)概念對的權(quán)重、排名或分數(shù),來排序搜索結(jié)果。特別是,搜索結(jié)果/擴展概念對的權(quán)重、排名或分數(shù)表示每個搜索結(jié)果到擴展概念的關(guān)系強度,擴展概念/主導(dǎo)概念的權(quán)重、排名或分數(shù)表示每個擴展概念到主導(dǎo)概念的關(guān)系強度。在一些實施例中,搜索結(jié)果可以包括在被接收時可由搜索結(jié)果排序組件216用來或不用來確定搜索結(jié)果排名的初始排名。搜索結(jié)果可以被提供給終端用戶,并且按照搜索結(jié)果排序組件216所確定的排名來呈現(xiàn)。轉(zhuǎn)向圖3,提供了示出根據(jù)本發(fā)明的一實施例的用于采用元數(shù)據(jù)庫來標識搜索查詢的擴展概念的方法300的流程圖。最初,如在框302所示,接收搜索查詢。在一些實施例中,搜索查詢可由終端用戶提交。例如,終端用戶可以采用web瀏覽器來訪問搜索輸入網(wǎng)頁并輸入搜索查詢。作為另一示例,終端用戶可以經(jīng)由搜索引擎工具欄所提供的搜索輸入框來輸入搜索查詢,搜索引擎工具欄位于例如web瀏覽器、終端用戶設(shè)備的桌面、或其他位置內(nèi)。本領(lǐng)域技術(shù)人員將認識到,終端用戶還可以采用各種其它方法來提供搜索查詢。在進一步的實施例中,可以提供API,其允許任一應(yīng)用查詢查詢系統(tǒng)以接收使用本發(fā)明各實施例重排的搜索結(jié)果的列表。在接收搜索查詢后,分析搜索查詢的查詢上下文,如框304所示。特別是,查詢上下文包括關(guān)于搜索查詢的信息。在一些實例中,搜索查詢包括由終端用戶輸入的搜索項,查詢上下文包括那些搜索項。在其他情況下,搜索查詢可以包括空查詢,其中終端用戶未提供搜索項。查詢上下文還可以包括其他信息,諸如例如,提交搜索查詢的時間、或者提交搜索查詢的終端用戶的位置。在本發(fā)明各實施例中,可以將關(guān)于搜索查詢的各種附加信息標識為查詢上下文的一部分。如框306所示,從查詢上下文標識一個或多個主導(dǎo)概念。每個主導(dǎo)概念可以是搜索查詢相關(guān)的一個特定的話題或?qū)嶓w,諸如人、地方或事物。主導(dǎo)概念不僅僅是來自搜索查詢的項,而是表示由查詢上下文的分析而確定的搜索查詢的主焦點。在一些實施例中,可以通過結(jié)合來自元數(shù)據(jù)庫的概念圖分析查詢上下文,來標識主導(dǎo)概念。如上所述,概念圖可以包括概念以及概念間的關(guān)系的集合。概念被表示為概念圖內(nèi)的節(jié)點,概念間的關(guān)系被表示為節(jié)點間的邊。通過使用查詢上下文,可以將來自概念圖的概念標識為搜索查詢的主導(dǎo)概念。在進一步的實施例中,可以為特定類型的搜索預(yù)定義主導(dǎo)概念。例如,當終端用戶首次訪問金融門戶或金融搜索聯(lián)合過程時而終端用戶不提交搜索查詢時,該門戶或搜索聯(lián)合過程可以自動地提供諸如金融相關(guān)新聞等多個搜索結(jié)果。金融門戶或搜索聯(lián)合過程用來訪問這種搜索結(jié)果的搜索查詢可以被視為空查詢,因為終端用戶未提供任何搜索項。在這種情況下,查詢上下文可以將搜索查詢標識為由金融門戶或金融搜索聯(lián)合過程生成,并且可以標識與金融有關(guān)的一個或多個缺省主導(dǎo)概念。如框308所示,為查詢上下文標識的主導(dǎo)概念用來自元數(shù)據(jù)庫的附加概念來擴展??梢圆捎枚喾N方法來用來自元數(shù)據(jù)庫的附加概念來擴展主導(dǎo)概念。圖4中示出使用元數(shù)據(jù)庫來擴展主導(dǎo)概念的一種示例性方法400。如框402所示,該過程包括標識概念圖內(nèi)的主導(dǎo)概念。此外,如框404所示,在概念圖內(nèi)標識與主導(dǎo)概念具有關(guān)系的其他概念。如框 406所示,基于到概念圖內(nèi)每一個主導(dǎo)概念的關(guān)系強度,向每一個附加概念分配權(quán)重或其他類型的分數(shù)。在框408基于分配給每個概念的權(quán)重來選擇一組擴展的概念。在一些實施例中, 選擇具有最大權(quán)重(即表示到主導(dǎo)概念的最強關(guān)系)的預(yù)定數(shù)量的擴展概念。例如,可以在框408選擇最上面N個概念。在其他實施例中,在框408選擇具有超過預(yù)定閾值的權(quán)重的所有概念。例如,可由系統(tǒng)提供者預(yù)定義一閾值,該閾值表示到主導(dǎo)概念的充分關(guān)系強度。 權(quán)重超過該閾值的任何概念會被認為可用于進一步評估。相反,不具有到主導(dǎo)概念的充分關(guān)系(即不超過閾值)的概念會被排除。用于確定從概念圖選擇哪些概念的任何或全部這樣的變化方式都可被構(gòu)想在本發(fā)明各實施例的范圍內(nèi)。接著參考圖5,提供了示出根據(jù)本發(fā)明的一實施例的、用于使用擴展概念來重排搜索結(jié)果的方法500的流程圖。如框502所示,接收到給定搜索查詢的一組搜索結(jié)果。搜索結(jié)果可以從單個源或從多個源獲得。例如,搜索結(jié)果可以包括一般web搜索結(jié)果、新聞結(jié)果、 圖像結(jié)果、視頻結(jié)果、TffITTER搜索結(jié)果等等。在一些實施例中,可以通過使用初始搜索查詢進行搜索來獲得一組搜索結(jié)果??梢圆捎盟阉饕娴谋緳C搜索技術(shù)和算法來執(zhí)行搜索以選擇和排序該組搜索結(jié)果。在一些實施例中,在選擇初始搜索結(jié)果集合時,可以采用為搜索查詢標識的主導(dǎo)概念和/或擴展概念。在進一步的實施例中,可以提供一組經(jīng)排序的搜索結(jié)果作為搜索查詢的一部分。例如, 可以提供API,其允許應(yīng)用程序通過提供一組搜索結(jié)果供使用本發(fā)明各實施例來重排,來查詢系統(tǒng)。如框504所示,使用為搜索查詢標識的擴展概念來分析搜索結(jié)果。擴展概念已經(jīng)使用諸如上面參照圖3描述的方法來標識。搜索結(jié)果基于擴展概念在框506被排序。根據(jù)本發(fā)明的各實施例,可以使用多種不同的方法來分析和排序搜索結(jié)果。圖6示出使用擴展概念來分析和重排搜索結(jié)果的一種示例性的方法600。如框602 所示,分析每一個搜索結(jié)果來標識擴展概念是否出現(xiàn)在每個搜索結(jié)果中。這可以包括分析搜索結(jié)果標題、搜索結(jié)果片段和/或搜索結(jié)果所引用的文檔的部分。如框604所示,基于該分析,向每個擴展概念的每個搜索結(jié)果分配一權(quán)重或其他分數(shù)。給定搜索結(jié)果和擴展概念的權(quán)重表示搜索結(jié)果到擴展概念的關(guān)系強度。權(quán)重可以例如通過確定擴展概念出現(xiàn)在搜索結(jié)果中的次數(shù)來導(dǎo)出。作為另一例子,可以通過標識搜索結(jié)果中的概念并且使用來自元數(shù)據(jù)庫的概念圖來確定那些概念到擴展概念的關(guān)系強度,來導(dǎo)出權(quán)重??梢圆捎枚喾N附加方法來為給定的搜索結(jié)果和擴展概念對分配權(quán)重。作為框604處分析的結(jié)果,搜索結(jié)果對于每一個擴展概念會有一個相關(guān)聯(lián)的權(quán)重。如框606所示,這些權(quán)重對于每個搜索結(jié)果總計并且用來排序搜索結(jié)果。在各實施例中,搜索結(jié)果/擴展概念權(quán)重結(jié)合被分配給每個擴展概念的權(quán)重一起使用,被分配給每個擴展概念的權(quán)重表示每個擴展概念到來自查詢上下文的主導(dǎo)概念的關(guān)系強度。在一些實施例中,搜索結(jié)果具有初始排名。例如,可以通過使用搜索查詢來執(zhí)行一般web搜索來獲得搜索結(jié)果,搜索查詢?yōu)樗阉鹘Y(jié)果提供排名。在本發(fā)明各實施例中,基于搜索結(jié)果/擴展概念權(quán)重以及擴展概念/主導(dǎo)概念權(quán)重,初始排名或者可以被丟棄或者可以結(jié)合排名一起使用。作為使用權(quán)重的替換,在一些實施例中可以采用排名或其他分數(shù)。例如,可以為每個擴展概念排序搜索結(jié)果,使得搜索結(jié)果基于搜索結(jié)果到每個擴展概念的關(guān)系強度來排序。每個擴展概念也可以對于來自查詢上下文的主導(dǎo)概念被排序,使得擴展概念基于到主導(dǎo)概念的關(guān)系強度被排序。排序可以總計以確定搜索結(jié)果的總排序。返回圖5,在基于搜索結(jié)果到擴展概念的關(guān)系強度以及擴展概念到來自查詢上下文的主導(dǎo)概念的關(guān)系強度對搜索結(jié)果進行排序之后,提供搜索結(jié)果供呈現(xiàn)給終端用戶,如框508所示。搜索結(jié)果按照在框506確定的排名來呈現(xiàn)。例如,搜索結(jié)果可以在基于排名排序的列表中呈現(xiàn)。在一些實施例中,一個或多個最高排名的搜索結(jié)果可以在顯著位置中呈現(xiàn),而其他搜索結(jié)果被置于較不顯著的位置中。例如,較高排名的搜索結(jié)果可以在搜索結(jié)果頁面上呈現(xiàn),而較低排名的搜索結(jié)果可以在各種選項卡中提供并且在終端用戶選擇這些選項卡之前不呈現(xiàn)。在從多個源獲得搜索結(jié)果的實施例中,可以在分開的組中提供搜索結(jié)果。例如,可以在一個組中提供一般web搜索結(jié)果,可以在另一個組中提供新聞搜索結(jié)果,等等??梢岳斫猓景l(fā)明的各實施例針對通過處理來自查詢上下文的主導(dǎo)概念來從概念圖標識擴展概念、并且使用擴展概念來重排搜索結(jié)果,從而改進搜索結(jié)果的相關(guān)性。參考各具體實施方式
描述了本發(fā)明,各具體實施方式
在所有方面都旨在是說明性的而非限制性的。在不偏離本發(fā)明范圍的情況下,各替換實施方式對于本發(fā)明所屬領(lǐng)域的技術(shù)人員將變得顯而易見。從前面的描述可以看出,本發(fā)明很好地適用于實現(xiàn)上文所闡述的所有目的和目標,并且具有對于該系統(tǒng)和方法是顯而易見且固有的其他優(yōu)點。也可理解特定的特征和子組合是有用的,并且可以加以利用而無需參考其他特征和子組合。這由權(quán)利要求所構(gòu)想的, 并在權(quán)利要求的范圍內(nèi)。
權(quán)利要求
1.一種用于重排多個搜索結(jié)果的計算機實現(xiàn)的方法,所述方法包括 接收(30 搜索查詢;標識(306)來自所述搜索查詢的一個或多個主導(dǎo)概念;用和元數(shù)據(jù)庫中的一個或多個主導(dǎo)概念具有關(guān)系的多個擴展概念來擴展(308)所述一個或多個主導(dǎo)概念;接收(502)多個經(jīng)排序的搜索結(jié)果; 使用所述擴展概念來分析(504)所述搜索結(jié)果; 基于所述擴展概念來重排(506)所述搜索結(jié)果;以及提供(508)經(jīng)重排的搜索結(jié)果供呈現(xiàn)給終端用戶。
2.如權(quán)利要求1所述的計算機實現(xiàn)的方法,其特征在于,所述搜索查詢包括一個或多個搜索項,所述一個或多個主導(dǎo)概念至少部分基于所述一個或多個搜索項來標識。
3.如權(quán)利要求2所述的計算機實現(xiàn)的方法,其特征在于,通過使用元數(shù)據(jù)庫來分析所述一個或多個搜索項,來標識所述一個或多個主導(dǎo)概念。
4.如權(quán)利要求2所述的計算機實現(xiàn)的方法,其特征在于,通過除一個或多個搜索項之外使用查詢上下文信息,來標識所述一個或多個主導(dǎo)概念。
5.如權(quán)利要求1所述的計算機實現(xiàn)的方法,其特征在于,通過在萬維網(wǎng)上可用的電子文檔中標識概念和概念間的關(guān)系來構(gòu)建元數(shù)據(jù)庫,所述元數(shù)據(jù)庫在新內(nèi)容被發(fā)布在萬維網(wǎng)上時動態(tài)地更新。
6.如權(quán)利要求1所述的計算機實現(xiàn)的方法,其特征在于,所述多個經(jīng)排序的搜索結(jié)果包括來自多個源的多個單獨的搜索結(jié)果集合,其中所述多個源包括從以下中選擇的一個或多個一般web搜索結(jié)果、新聞和照片。
7.如權(quán)利要求1所述的計算機實現(xiàn)的方法,其特征在于,使用擴展概念分析搜索結(jié)果包括標識每個搜索結(jié)果到每個擴展概念的關(guān)系強度,其中基于附加概念重排搜索結(jié)果包括基于每個搜索結(jié)果到每個擴展概念的關(guān)系強度以及每個擴展概念到一個或多個主導(dǎo)概念的關(guān)系強度來重排搜索結(jié)果。
8.一個或多個存儲計算機可使用指令的計算機可讀介質(zhì),所述指令在由一個或多個計算設(shè)備使用時使得所述一個或多個計算設(shè)備執(zhí)行一種方法,所述方法包括接收(30 搜索查詢; 標識(304)所述搜索查詢的查詢上下文; 分析(304、306)查詢上下文以標識一個或多個主導(dǎo)概念; 標識(40 概念圖內(nèi)的所述一個或多個主導(dǎo)概念的每一個的位置; 標識(404)與概念圖內(nèi)的一個或多個主導(dǎo)概念具有關(guān)系的多個附加概念; 向每個附加概念分配(406)第一權(quán)重,表示每個附加概念到概念圖內(nèi)的一個或多個主導(dǎo)概念的關(guān)系強度;基于所分配的權(quán)重選擇G08)附加概念的一個子集以提供一組擴展概念; 接收(502)多個搜索結(jié)果;分析(60 每個搜索結(jié)果以確定每個搜索結(jié)果是否包括擴展概念中的一個或多個; 向每個搜索結(jié)果分配(604) —個或多個第二權(quán)重,表示每個搜索結(jié)果到擴展概念的關(guān)系強度;基于第一權(quán)重和第二權(quán)重的組合來排序(606)搜索結(jié)果;以及提供(508)經(jīng)排序的搜索結(jié)果供呈現(xiàn)給終端用戶。
9.如權(quán)利要求8所述的一個或多個計算機可讀介質(zhì),其特征在于,所述搜索查詢包括一個或多個搜索項,所述查詢上下文包括所述一個或多個搜索項。
10.如權(quán)利要求9所述的一個或多個計算機可讀介質(zhì),其特征在于,所述查詢上下文包括除所述一個或多個搜索項之外的信息。
11.如權(quán)利要求8所述的一個或多個計算機可讀介質(zhì),其特征在于,所述搜索查詢包括空查詢。
12.如權(quán)利要求8所述的一個或多個計算機可讀介質(zhì),其特征在于,通過使用概念圖來分析查詢上下文,來標識所述一個或多個主導(dǎo)概念。
13.如權(quán)利要求8所述的一個或多個計算機可讀介質(zhì),其特征在于,通過在萬維網(wǎng)上可用的電子文檔中標識概念和概念間的關(guān)系來構(gòu)建概念圖,所述概念圖在新內(nèi)容被發(fā)布在萬維網(wǎng)上時動態(tài)地更新。
14.如權(quán)利要求8所述的一個或多個計算機可讀介質(zhì),其特征在于,所述多個搜索結(jié)果包括來自多個源的多個單獨的搜索結(jié)果集合,其中所述多個源包括從以下中選擇的一個或多個一般web搜索結(jié)果、新聞和照片。
15.一種包括一個或多個處理器和存儲計算機可使用組件的一個或多個計算機可讀介質(zhì)的系統(tǒng),所述計算機可使用組件包括查詢上下文分析(210)組件,其分析接收到的搜索查詢的查詢上下文以標識搜索查詢的一個或多個主導(dǎo)概念;查詢擴展組件012),其使用來自元數(shù)據(jù)庫的概念圖將一個或多個主導(dǎo)概念擴展為多個擴展概念;搜索結(jié)果分析組件014),其分析多個搜索結(jié)果以確定每個搜索結(jié)果到擴展概念的關(guān)系強度;以及搜索結(jié)果排序組件016),其基于每個搜索結(jié)果到擴展概念的關(guān)系強度、以及每個擴展概念到一個或多個主導(dǎo)概念的關(guān)系強度來排序多個搜索結(jié)果。
全文摘要
本發(fā)明涉及基于詞法和本體概念重排搜索結(jié)果。通過采用來自元數(shù)據(jù)庫的概念圖提供了搜索結(jié)果重排。當接收到搜索查詢時,分析搜索查詢的查詢上下文以標識搜索查詢的主導(dǎo)概念。通過標識概念圖內(nèi)的主導(dǎo)概念并且標識與概念圖內(nèi)的主導(dǎo)概念具有強關(guān)系的附加概念,來擴展主導(dǎo)概念。分析搜索查詢的一組搜索結(jié)果以確定每個搜索結(jié)果到擴展概念的關(guān)系強度。搜索結(jié)果基于每個搜索結(jié)果到擴展概念的關(guān)系強度、以及每個擴展概念到主導(dǎo)概念的關(guān)系強度來重排序。
文檔編號G06F17/30GK102279871SQ20111016518
公開日2011年12月14日 申請日期2011年6月7日 優(yōu)先權(quán)日2010年6月8日
發(fā)明者A·C·薩瑞德蘭, A·斯里瓦斯塔瓦, J·米奇利, M·A·阿里, M·斯里坎斯, T·納杰姆, V·瓦德拉曼尼 申請人:微軟公司