查詢建議模板的制作方法
【專利摘要】提供了查詢建議模板。方法和裝置涉及識別包括一個或多個詞語和實體類別的成員的查詢模板以及對查詢模板排名??梢曰诓樵兡0鍋泶_定查詢建議。查詢模板的排名可以用來確定查詢模板是否是有效的查詢模板。模板的排名可以至少基于符合查詢模板的過去查詢中的實體類別的實體的一個或多個的出現計數。
【專利說明】查詢建議模板
【技術領域】
[0001] 本說明書一般地涉及確定在確定提供給用戶的查詢建議中利用的查詢建議模板。
【背景技術】
[0002] 諸如互聯(lián)網搜索引擎的信息檢索系統(tǒng)使用戶能夠定位大型數據庫中的信息。例 如,互聯(lián)網搜索引擎使用戶能夠響應于由用戶提交的、由一個或多個搜索詞語(search terms)組成的搜索查詢,訪問諸如網頁、圖像、文本文檔和/或多媒體內容的信息。
[0003] 當用戶正鍵入查詢時和/或用戶已經提交查詢后,一些信息檢索系統(tǒng)可以向用戶 提供一個或多個查詢建議。用戶可以選擇查詢建議中的一個來用作所提交的查詢和/或用 作用于所提交的查詢的基礎(例如,通過修改所選擇的查詢建議、向所選擇的查詢建議增 加和/或從所選擇的查詢建議刪除)。查詢建議通常經由過去的用戶查詢來生成和/或自 動地生成。
【發(fā)明內容】
[0004] 本公開涉及用于確定利用諸如知識圖的實體的一個或多個數據庫的查詢模板的 方法和裝置。識別符合模板的多個查詢,其中,每個查詢包括作為實體類別的成員的至少一 個詞語,以及還包括與其他所識別的查詢中的詞語匹配的一個或多個詞語。構造包括匹配 詞語和實體類別的查詢模板??梢源_定查詢模板的排名,并且排名可以指示在確定響應于 未來的部分查詢而提供給用戶的查詢建議中該查詢模板有效的可能性。
[0005] 在一些實現中,提供了一種計算機實現的方法,包括步驟:識別實體類別,其中,所 述實體類別是共同共享一個或多個方面的實體的分組;識別實體別名,所述實體別名中的 每一個與所述實體類別中的實體中的至少一個相關聯(lián);識別查詢模板,其中,所述查詢模板 包括一個或多個模板詞語和所述實體類別的標識符;確定符合所述查詢模板的查詢組,其 中,所述查詢組中的每個查詢包括所識別的實體別名中的一個和與所述模板詞語匹配的一 個或多個詞語;以及確定所述查詢模板的排名,其中,所述排名至少基于符合所述查詢模板 的所述查詢組中所述實體類別的實體中的一個或多個的出現計數。
[0006] 在此公開的技術的該方法和其他實現可以分別可選地包括下述特征中的一個或 多個。
[0007] 該方法可以進一步包括基于所述排名是否滿足閾值來確定所述查詢模板是否有 效的步驟。
[0008] 符合所述查詢模板的所述查詢組中所述實體類別的實體中的一個或多個的出現 計數可以基于實體類別成員的數量,其中,符合的實體類別成員是在所述實體類別中并且 存在于符合所述查詢模板的查詢組中的實體。在那些實現的一些中,確定所述查詢模板的 排名可以包括:將符合的實體類別成員的數量與實體類別成員的數量進行比較,其中,實體 類別成員的數量基于該實體類別中的實體的數量。
[0009] 符合所述查詢模板的所述查詢組中所述實體類別的實體中的一個或多個的出現 計數可以基于多個實體的相容出現頻率,其中,每個相容出現頻率可以基于符合所述查詢 模板的該查詢組中的實體中的一個的出現頻率。在那些實現的一些中,確定所述查詢模板 的排名可以包括:將相容出現頻率與另外的查詢組中的實體類別的多個實體的出現頻率進 行比較,其中所述另外的查詢組包括不符合所述查詢模板的查詢。
[0010] 所述出現計數可以基于符合所述查詢模板的過去查詢的數量??梢赃M一步基于所 述實體類別的實體的成員之間的相似性來確定所述排名。類別詞語可以是所述查詢模板的 前綴。與所述模板詞語匹配的一個或多個詞語可以包括不存在于所述查詢模板中的一個或 多個詞語。
[0011] 在一些實現中,提供了一種計算機實現的方法,包括步驟:識別部分查詢;基于所 述部分查詢,識別查詢模板,其中,所述查詢模板包括一個或多個模板詞語和實體類別的標 識符,以及其中,所述實體類別是共同共享一個或多個方面的實體的分組;以及基于所述查 詢模板,提供至少一個查詢建議,其中,所提供的查詢建議包括所述一個或多個模板詞語和 實體中的一個的實體別名。
[0012] 在此公開的技術的該方法和其他實現可以每一個可選地包括下述特征中的一個 或多個。
[0013] 可以基于所述部分查詢來識別實體別名??梢曰谟脩舻奈恢脕碜R別實體別名。 可以基于與和實體別名相關聯(lián)的實體相關聯(lián)的流行性度量來識別查詢建議。識別查詢模板 可以進一步包括確定所述部分查詢中的一個或多個詞語是否匹配所述查詢模板中的一個 或多個詞語??梢曰谒霾樵兡0宓呐琶麃碜R別查詢模板。
[0014] 識別查詢模板可以進一步包括步驟:基于部分查詢來確定實體類別;以及基于所 確定的實體類別來確定查詢模板。在那些實現中的一些中,基于部分查詢來確定實體類別 可以包括:基于所述部分查詢的一個或多個部分查詢詞語來確定部分查詢實體;以及基于 所述部分查詢實體來確定所述實體類別。在那些實現中的一些中,該方法可以進一步包括 步驟:確定除用來確定所述部分查詢實體的部分查詢詞語外的所述部分查詢中的另外的字 符,其中,確定查詢模板進一步基于所述另外的字符。
[0015] 該方法可以進一步包括基于與和所述實體別名相關聯(lián)的實體相關聯(lián)的流行性度 量來確定所述查詢建議的排名的步驟。
[0016] 該方法可以進一步包括基于與所述實體模板相關聯(lián)的排名來確定所述查詢建議 的排名的步驟。
[0017] 其他實現可以包括非瞬時計算機可讀存儲介質,存儲可由處理器執(zhí)行的指令來執(zhí) 行諸如在此所述的方法中的一個或多個的方法。又一實現可以包括系統(tǒng),該系統(tǒng)包括存儲 器和可用來執(zhí)行存儲在存儲器中的指令的一個或多個處理器,以便執(zhí)行諸如在此所述的方 法中的一個或多個的方法。
[0018] 在此所述的主題的特定實現基于從查詢組識別具有一個或多個匹配詞語和具有 作為詞語的實體類別的成員的一個或多個詞語的查詢,確定查詢模板和/或與查詢模板相 關聯(lián)的排名。在一些實現中,可以基于符合查詢模板的查詢集合中的先前輸入的查詢的數 量,來確定查詢模板的排名。在一些實現中,可以基于來自存在于符合查詢中的實體類別的 已知實體的數量,來確定查詢模板的排名。在一些實現中,可以基于符合查詢模板的查詢中 的實體類別的成員的分布和包括不符合查詢模板的查詢的查詢組中的實體類別的成員的 分布,來確定查詢模板的排名。查詢模板和查詢模板的排名表示可以由諸如用戶先前提交 的查詢中的一個或多個查詢取得的新查詢模板??梢岳貌樵兡0鍋頌橛脩籼峁┯糜诜?查詢模板的部分查詢的查詢建議。
[0019] 應當認識到,上述概念和在此更詳細論述的另外的概念的所有組合均預期為在此 公開的本發(fā)明主題的一部分。例如,出現在本公開內容的結尾處的所要求保護的主題的所 有組合均預期為在此公開的發(fā)明主題的一部分。
【專利附圖】
【附圖說明】
[0020] 圖1是其中可以實現確定和排序查詢模板的方法的示例性環(huán)境的框圖。
[0021] 圖2是圖示確定查詢模板和排序查詢模板的示例性方法的流程圖。
[0022] 圖3是圖示基于所識別的查詢模板,為用戶提供一個或多個查詢建議的示例性方 法的流程圖。
[0023] 圖4圖示了查詢列表和可以符合查詢的查詢模板。
[0024] 圖5圖示了基于構造的查詢模板可以提供給用戶的查詢完成建議的示例性圖形 用戶界面。
[0025] 圖6A圖示了在符合查詢模板的查詢組中實體類別的成員的出現頻率的示例直方 圖。
[0026] 圖6B圖示了在包括不符合模板的查詢的查詢組中圖6A的類別的成員的出現頻率 的示例直方圖。
[0027] 圖7A圖示了在符合查詢模板的查詢組中實體類別的成員的出現頻率的另一示例 直方圖。
[0028] 圖7B圖示了在包括不符合模板的查詢的查詢組中圖7A的類別的成員的出現頻率 的另一示例直方圖。
[0029] 圖8圖示了示例性計算機系統(tǒng)的框圖。
【具體實施方式】
[0030] 用戶可以提交多個查詢,每個查詢包括匹配其他查詢中的詞語的一個或多個詞 語,以及與實體類別相關聯(lián)的一個或多個詞語。例如,搜索查詢短語"restaurants in"可 以包括在多個所提交的查詢中,接著與實體類別"city"相關聯(lián)的城市名。所提交的查詢 可以包括例如 "restaurants in San Francisco,'、"restaurant in LA" 和 "restaurants in Los Angeles"。實體類別"city"可以包括多個實體,每個實體與特定城市相關聯(lián)并且 與一個或多個別名相關聯(lián)。例如,與加利福尼亞的舊金山市相關聯(lián)的實體可以與諸如"San Francisco"、"SF"和"SF0"的別名相關聯(lián)。與實體類別的實體相關聯(lián)的別名可以用作與實 體類別相關聯(lián)的詞語。而且,例如,搜索查詢短語"beach in"可以包括在多個所提交的查詢 中,在與實體類別"beach cities"相關聯(lián)的城市名之后。實體類別"beach cities"可以是 與實體類別"city"不同的實體組,諸如與沿海城市相關聯(lián)的實體組。例如,與城市拉斯維 加斯相關聯(lián)的實體可以包括在一般"city"實體類別中,但可以不包括在"coastal cities" 實體類別中。
[0031] 查詢組中的一個或多個查詢,諸如先前由一個或多個用戶提交的查詢組,可以用 來確定多個查詢可以符合的查詢模板。查詢模板包括一個或多個詞語以及詞語的類別的 標識符。例如,查詢模板可以是"restaurants in [city] ",其中," [city] "是與實體類別 "city"相關聯(lián)的一個或多個詞語的標識符??梢曰诓樵兡0宓挠行缘拇_定,來對查詢 模板排名??梢岳貌樵兡0宓呐琶麃泶_定該模板是否是有效模板。查詢模板的排名可以 附加地和/或替選地與該模板相關聯(lián)并且用在確定是否將查詢模板用在形成查詢建議中 和/或用在確定基于查詢模板形成的查詢建議的排名中。
[0032] 例如,用戶可以輸入部分查詢"restaurants in s",以及基于例如模板的共同 詞語和所輸入的部分查詢,可以將查詢模板"restaurants in[city]"識別為用于所輸 入的部分查詢的查詢模板。在一些實現中,可以已基于在此所述的技術確定查詢模板 "restaurants in[city]",以及可以已基于在此所述的技術將查詢模板確定為有效查詢 模板??梢曰诓樵兡0?,形成用于部分查詢的一個或多個查詢建議。例如,基于查詢 模板形成的查詢建議可以包括可以基于從與實體類別"city"相關聯(lián)的詞語選擇的"San Francisco"形成的查詢建議"restaurants in San Francisco"。在一些實現中,可以只有 查詢模板的排名滿足閾值時,才形成查詢建議。例如,閾值可以基于與和"restaurants in s"相關聯(lián)的其他查詢建議相關聯(lián)的排名。例如,只有當相對于查詢建議,用于部分查詢的 其他查詢建議不被認為是高排名的查詢建議時,才基于查詢模板來形成用于部分查詢的查 詢建議。然后,可以選擇所形成的查詢建議"restaurants in San Francisco"以作為用 于部分查詢的查詢建議提供給用戶。查詢建議"restaurants in San Francisco"的排名 可以可選地被確定并且用在確定是否選擇該查詢建議提供給用戶和/或在提供給用戶中 在哪兒呈現該查詢建議。排名可以基于例如與別名"San Francisco"相關聯(lián)的排名、與和 城市San Francisco相關聯(lián)的實體相關聯(lián)的排名、和/或可選地與查詢模板"restaurants in [city] "相關聯(lián)的排名。
[0033] 在整個說明書中,由方括號包圍的一個或多個詞語將用來表示與實體類別相關聯(lián) 的詞語的類別和/或實體類別本身的標識符。例如" [city] "表示與實體類別"city"相關 聯(lián)的詞語的類別的標識符。例如,查詢"restaurants in San Francisco"、"restaurants in New York" 和 "restaurants in Denver" 可以被稱為符合查詢模板 "restaurants in[city]"。如在此所述,包括[city]的查詢模板可以用來形成用來自詞語的類別(諸如 城市別名"San Francisco"、"New York"和/或"Denver")的一個或多個詞語替換標識符 [city]的多個查詢建議。例如,查詢模板"restaurants in[city]"可以用來形成查詢建 議 "restaurants in San Francisco,',restaurants in New York,'和 "restaurants in Denver,'。
[0034] 參考圖1,示出了其中可以實現確定和排名查詢模板的方法的示例性環(huán)境的框圖。 環(huán)境包括具有瀏覽器110的計算設備105、模板生成器115、查詢建議引擎120、搜索引擎 125和內容數據庫130。該環(huán)境還包括實現該環(huán)境的各個組件之間的通信的通信網絡101。
[0035] 在一些實現中,用戶可以通過客戶端計算設備105上的Web瀏覽器110與搜索引 擎125交互。計算設備105可以是例如臺式計算機、膝上型計算機、蜂窩電話、智能電話、個 人數字助理(PDA)、平板電腦、可配戴式計算設備(例如數字手表、耳機、眼鏡等等)、導航系 統(tǒng)、和/或另一計算設備。計算設備105和搜索引擎125每一個包括用于存儲數據和軟件應 用的存儲器、用于訪問數據和執(zhí)行應用的處理器、以及促進通信網絡101上的通信的組件。 由計算設備105、瀏覽器110和/或搜索引擎125執(zhí)行的操作可以分布在多個計算系統(tǒng)上。
[0036] 搜索引擎125接收查詢和在諸如網頁、文本文檔和/或多媒體的可用文檔的搜索 引擎內容數據庫(例如內容數據庫130)中執(zhí)行查詢。為了本說明書的目的,文檔是與文檔 地址相關聯(lián)的任何數據。僅舉幾例,文檔包括網頁、字處理文檔、可移植文檔格式(PDF)文 檔、圖像、視頻、音頻、電子郵件、日歷項、任務項和饋給源。文檔可以包括內容,例如詞、短 語、圖片、音頻、任務標識符、實體標識符等等;嵌入式信息(諸如元信息和/或超鏈接);和 /或嵌入式指令(諸如JavaScript腳本)。搜索引擎125識別與所提交的查詢匹配的內容 并且通過以對該設備有用的形式生成傳送給一個或多個設備的搜索結果來響應。例如,響 應于來自計算設備105的查詢,搜索引擎125可以傳送將在計算設備105上執(zhí)行的Web瀏 覽器110中顯示的多個搜索結果。內容數據庫130可以包括一個或多個存儲介質。例如, 在一些實現中,內容數據庫130可以包括每個包含一個或多個存儲介質的多個計算機服務 器。
[0037] 在用戶已指示完成查詢之前,在計算設備105上執(zhí)行的應用還可以提供由用戶制 定的部分查詢。應用可以是例如Web瀏覽器110、在Web瀏覽器110中運行的工具欄、電子 郵件應用、文本消息應用、和/或運行在計算設備105上的搜索客戶端。在一些實現中,當 由用戶鍵入或者以其它方式輸入時,應用提供查詢的每一字符。在一些實現中,應用一次提 供多個字符,可選地,在字符項之間接著用戶的暫停。
[0038] 部分查詢是在由用戶指示該查詢是完整查詢前由用戶制定的查詢。在一些實現 中,用戶可以通過輸入回車和/或其他符號來指示完整查詢。在一些實現中,用戶可以通過 選擇呈現給用戶的用戶界面中的搜索按鈕或其他提交按鈕來指示完整查詢。在一些實現 中,用戶可以通過在語音用戶接口中說出命令來指示完整查詢。在一些實現中,用戶可以在 輸入查詢期間停頓超出預定時間量來指示完整查詢??梢粤硗夂?或替選地利用提供部分 查詢和/或指示完整查詢的其他形式。
[0039] 響應于用戶輸入的部分查詢,計算設備105可以通過向用戶提供建議輸入來促進 用戶輸入。例如,當用戶輸入一個或多個字符時,計算設備105能提供使用一個或多個字符 選擇的查詢建議。在一些實現中,可以通過查詢建議引擎120將查詢建議提供給計算設備 105。所提供的查詢建議可以包括包含由用戶輸入的一個或多個字符的詞或短語。例如,對 用戶已經輸入(例如說出或使用物理或虛擬鍵盤輸入)的部分詞或部分短語,能建議完整 詞或擴展短語。查詢建議還能包括與用戶輸入類似(例如同義詞或拼寫校正)的詞或短語。 查詢建議中的一個或多個可以包括基于在此所述的查詢模板確定的查詢建議。用戶能與所 提供的查詢建議中的一個交互(例如敲擊、點擊或者以其它方式肯定選擇)來輸入所選擇 的查詢建議的文本。
[0040] 可以在計算設備105的用戶界面上將查詢建議顯示給用戶。例如,當用戶正鍵入 查詢時,可以在諸如在計算設備105上執(zhí)行的Web瀏覽器的應用的搜索字段的層疊下拉菜 單內顯示查詢建議。
[0041] 在一些實現中,響應于在計算設備105輸入的部分查詢,搜索引擎125可以接收部 分查詢并且將部分查詢轉發(fā)到查詢建議引擎120。在一些實現中,響應于在計算設備105輸 入的部分查詢,在計算設備105上執(zhí)行的一個或多個應用可以可選地將部分查詢直接轉發(fā) 到查詢建議引擎120。查詢建議引擎120可以包括用于存儲數據和軟件應用的存儲器、用 于訪問數據和執(zhí)行應用的處理器、以及促進在通信網絡101上通信的組件。查詢建議引擎 120可以將所提交的部分查詢與作為該查詢的適當匹配的多個查詢建議中的一個或多個匹 配。例如,查詢建議引擎120可以將所提交的查詢與查詢模板匹配以及利用該查詢模板來 確定作為該查詢的適合匹配的一個或多個查詢建議。而且,例如,查詢建議引擎120可以將 所提交的查詢與利用查詢模板形成的查詢建議匹配。在一些實現中,查詢建議可以表示潛 在完整查詢,其可以被提供給用戶以使得用戶選擇查詢建議中的一個作為用在搜索或其他 信息檢索應用中的基礎。
[0042] 在一些實現中,查詢建議數據庫可以包括一個或多個查詢建議和/或可以用來確 定查詢建議的查詢模板??梢愿鶕诖怂龅囊粋€或多個方法和/或裝置來確定和/或排 名查詢建議數據庫中的這樣的查詢建議和/或查詢建議模板。
[0043] 在一些實現中,搜索引擎125和/或計算設備105可以可選地將完整查詢提供給 查詢建議引擎120。完整查詢是用戶已指示是完整的查詢。然后,查詢建議引擎120可以 將完整查詢與一個或多個查詢建議匹配來為用戶的完整查詢確定一個或多個查詢建議。例 如,可以基于在此所述的查詢模板來確定一個或多個查詢建議。然后,查詢建議引擎120可 以將這些查詢建議提供給用戶。查詢建議可以例如嵌入將在諸如Web瀏覽器110的應用中 顯示的搜索結果網頁中,作為潛在的進一步搜索選項。
[0044] 在一些實現中,內容數據庫130可以包括包含實體之間的關系的映射等的實體數 據庫。在一些實現中,實體是演說的主題。在一些實現中,實體是人、地點、概念和/或能由 文本段(例如詞語或短語)引用并且相互區(qū)別(例如基于上下文)的事物。例如,查詢或 網頁中的文本"bush"可以潛在地引用多個實體,諸如President George Herbert Walker Bush、President George Walker Bush、shrub (灌木)、和搖滾樂隊 Bush。在一些實現中, 可以由可以用來識別實體的唯一實體標識符引用實體。唯一實體標識符可以與和實體和/ 或和其他實體相關聯(lián)的一個或多個屬性相關聯(lián)。例如,在一些實現中,一個或多個實體數 據庫可以包括與一個或多個實體的唯一標識符相關聯(lián)的屬性。例如,對于多個實體中的每 一個,可以在實體數據庫中標識實體和一個或多個屬性和/或與實體有關的其他實體之間 的映射(例如,定義關聯(lián)的數據)。例如,用于與"LAX"相關聯(lián)的實體的唯一標識符可以與 "洛杉磯國際機場"的名稱或別名屬性"LAX"、另一別名屬性(常常引用LAX的替選名稱)、 電話號碼屬性、地址屬性、和/或實體屬性數據庫中的實體類型屬性"機場"相關聯(lián)。另外 和/或替選屬性可以與諸如實體數據庫的一個或多個數據庫中的實體相關聯(lián)。例如,如在 此所述,實體可以與一個或多個實體類別相關聯(lián)。例如,與加利福尼亞的舊金山市相關聯(lián)的 實體可以與實體類別"city"、"large cities"、"cities in California"和"cities with a bay"相關聯(lián)。
[0045] 在本說明書中,詞語"數據庫"將被廣泛地用來指任何數據的集合。數據庫的數據 不需要以任何特定方式結構化、或完全不結構化、并且能存儲在存儲設備上的一個或多個 位置。由此,例如,數據庫可以包括數據的多個集合,可以不同地組織和訪問每一數據集合。
[0046] 在一些實現中,內容數據庫130可以包含先前提交的搜索查詢和/或先前提交的 查詢的搜索結果的引用。例如,用戶可以通過將查詢直接提交到搜索引擎125或通過選擇 響應于由用戶提交的部分查詢而提供給用戶的查詢建議,提交查詢"restaurants in San Francisco"??梢詫⑺峤坏牟樵?restaurants in San Francisco"存儲在內容數據庫 130 中。
[0047] 在一些實現中,模板生成器115可以基于諸如來自內容數據庫的查詢的一個或多 個查詢來確定查詢模板。在一些實現中,可以基于確定符合查詢模板的多個查詢來確定查 詢模板。在一些實現中,可以從單個查詢來確定查詢模板。例如,模板生成器可以識別查詢 "bike shops in san diego"??梢曰诎ń又鳛閷嶓w類別[city]的成員的附加詞語 "san diego"的詞語"bike shops in"的查詢來確定查詢模板。在一些實現中,模板生成器 115可以訪問查詢與實體映射,如在此所述,確定附加詞語"san diego"與和加利福尼亞的 圣地亞哥市相關聯(lián)的實體相關聯(lián)。在一些實現中,模板生成器115可以進一步訪問實體映 射來確定與加利福尼亞的圣地亞哥市相關聯(lián)的實體是實體類別[city]的成員。因此,可以 確定查詢模板"bike shops in[city]"。在一些實現中,可以由用戶構造查詢模板并且根據 在此所述的一個或多個技術排名。
[0048] 在一些實現中,模板生成器115可以從內容數據庫130識別一個或多個查詢以及 確定查詢是否與查詢模板相符??梢岳门c查詢模板相符的多個模板的確定來確定查詢模 板和/或對所確定的查詢模板排名。在一些實現中,由模板生成器115識別的查詢可以是 由一個或多個用戶先前提交的查詢。如果多個查詢共享除了作為實體類別的成員的一個或 多個詞語外的一個或多個匹配詞語,模板生成器115可以將多個查詢確定為與查詢模板相 符。如在此所述,詞語的匹配可以包括詞語的精確匹配和/或詞語的軟匹配。例如,模板生 成器115可以從內容數據庫130識別查詢"bike shops in san diego"、"bike shops in los angeles"和"bike shops in louisville"??梢曰诎ㄔ诮又鳛閷嶓w類別"city" 的成員的一個或多個附加詞語的共同詞語"bike shops in"的所有查詢,來確定查詢與查 詢模板相符。因此,緊接在前的查詢與查詢模板"bike shops in[city]"相符。
[0049] 在一些實現中,模板生成器115在確定一個或多個查詢是否符合查詢模板時,可 以忽略一個或多個詞語,諸如無用詞(例如"a"、"of"和"in")。例如,模板生成器115 可以確定 "bike shops in los angeles,'、"bike shops in san diego,'和 "bike shops around louisville"符合查詢模板"bike shops in [city]"。在一些實現中,模板生成器 115可以忽略先前提交的查詢中的詞語之間的空白和/或詞語之間缺少空格。例如,可以確 定 "bikeshops in losangeles" 和 "bike shops san diego" 符合查詢模板 "bike shops in[city]"。在一些實現中,模板生成器115可以將包括處于不同位置的匹配詞語的查詢 確定為符合查詢模板的查詢。例如,模板生成器115可以確定"bike shops los angeles" 和"san diego bike shops"符合查詢模板"bike shops[city]"和 / 或查詢模板"[city] bike shops"。在一些實現中,模板生成器115可以將查詢的一個或多個詞語規(guī)范成確定查 詢是否符合查詢模板中的標準時態(tài)和/或復數形式。例如,模板生成器115可以確定"flows west mississippi river" 和 "flowing west ohio river" 具有共同詞語 "flow west" 和 /或"flowing west",以及確定它們符合查詢模板"flow west[river]"。而且,例如,模板 生成器 115 可以確定"lakes near detroit"和"lake near Chicago"具有共同詞語"lake near ",并且確定它們符合查詢模板" lake near [city] "。
[0050] 在一些實現中,在確定與查詢模板的符合度中,可以不修改否則可以被規(guī)范和/ 或可以是無用詞的一個或多個詞語。是否修改一個或多個詞語可以基于例如查詢的語法和 /或語義屬性和/或響應于查詢返回的搜索結果文檔。例如,"rivers near ohio"和"river Ohio"可以不被識別為符合查詢模板,因為查詢的可能含義不同,諸如"rivers near Ohio" 作為返回有關在俄亥俄州附近的河流的文檔的查詢,以及"river ohio"作為返回有關俄亥 俄河的文檔的查詢。
[0051] 如所述,模板生成器115可以確定所識別的查詢中的一個或多個詞語是作為在確 定所識別的查詢是否符合查詢模板中的實體類別的成員的詞語。例如,模板生成器115可 以確定"los angeles"是作為實體類別"city"的成員的別名的詞語。而且,例如,模板生 成器115可以將"san diego"識別為作為實體類別"city"的成員的別名的詞語。在一些 實現中,模板生成器115可以經由諸如內容數據庫130的數據庫識別作為給定實體類別的 成員的給定查詢的詞語。例如,在一些實現中,數據庫可以包括用于多個查詢的查詢與實體 映射。對于每一查詢,查詢實體映射可以將查詢映射到與查詢相關聯(lián)的一個或多個實體和/ 或將查詢的一個或多個詞語映射到與這樣的一個或多個詞語相關聯(lián)的一個或多個實體。查 詢和一個或多個實體之間的映射可以基于例如響應于查詢的搜索結果文檔包括一個或多 個實體的確定。例如,對于查詢"battleship movie",可以確定響應于該查詢的搜索結果文 檔主要集中在與影片"Battleship"相關聯(lián)的實體上。查詢"battleship movie"和與影片 "Battleship"相關聯(lián)的實體之間的映射可以基于這樣的確定。
[0052] 例如,可以將查詢"battleship gross sales"映射到與影片"Battleship"相關 聯(lián)的實體??梢詤⒖紝嶓w數據庫來確定詞語"Battleship"是與影片"Battleship"相關聯(lián) 的實體的別名以及確定與影片"Battleship"相關聯(lián)的實體是實體類別[films]的成員。因 此,可以確定查詢"battleship gross sales"中的詞語"Battleship"是實體類別[films] 的成員。基于這樣的確定,可以確定查詢"battle ship gross sales"符合查詢模板"[影 片]銷售總額"。而且,例如,可以將查詢"board game battleship"映射到與棋盤游戲 "Battleship"相關聯(lián)的實體。可以參考實體數據庫來確定詞語"Battleship"是與棋盤游 戲"Battleship"相關聯(lián)的實體的別名,以及確定與棋盤游戲"Battleship"相關聯(lián)的實體 是實體類別[board game]的成員。因此,可以確定查詢"board game battleship"中的 "Battleship"是實體類別[board game]的成員?;谶@樣的確定,可以確定查詢"board game battleship"符合查詢模板"board game [board game] "。應注意到在一些實現中,查 詢"board game battleship"中的詞語"Battleship"將不被確定為實體類別[film]的成 員,因為查詢"board game battleship"可以不被映射到與影片"Battleship"相關聯(lián)的實 體。
[0053] 在一些實現中,諸如在確定查詢中的一個或多個詞語是否是實體類別的成員的詞 語中利用查詢實體映射的實現,可以僅利用映射到查詢的實體中的一個或多個。例如,在前 面的例子中,可以將查詢"board game battleship"映射到與影片"Battleship"相關聯(lián)的 實體,但是到與電影相關聯(lián)的實體的映射可以與相對弱的排名相關聯(lián)(例如,反映響應于 該查詢的與該電影相關聯(lián)的搜索結果的相對低的重要性)。在一些實現中,可以僅利用映射 到該查詢并且至少與閾值排名相關聯(lián)的實體。在一些實現中,可以僅利用映射到該查詢的 最1?排名實體。
[0054] 在一些實現中,在確定所識別的查詢中的一個或多個詞語是否是實體類別的成員 的詞語中,可以直接參考與實體類別相關聯(lián)的詞語的列表。例如,諸如內容數據庫130的 數據庫可以包括多個實體類別,以及用于每一實體類別的作為該實體類別的成員的詞語的 列表。如果給定查詢包含映射到實體類別的詞語,在確定該給定查詢是否符合查詢模板中, 可以確定該詞語是該實體類別的成員。在一些實現中,必須確定查詢的詞語被映射到實體 類別以及該查詢被映射到包括在實體類別(例如經由查詢實體映射)中的實體。在一些實 現中,模板生成器115可以通過識別被映射到指示給定類別的相同屬性的實體的別名,來 確定作為實體類別的成員的詞語。例如,模板生成器115可以基于"los angeles"和"san diego"都是被映射到實體屬性[city]的實體的別名,確定"los angeles"和"san diego" 屬于實體類別[city]。在一些實現中,模板生成器115可以確定實體的別名屬于多個實體 類別。例如,"l〇s angeles"、"san diego" 和 "louisville" 可以是實體類別 "city" 的別 名,以及"l〇s angeles"和"san diego"可以是實體類別"California cities"的別名,以 及"louisvilie"的別名可以不被映射到實體相關聯(lián)的"California cities"。
[0055] 在一些實現中,模板生成器115可以確定所確定的查詢模板的排名。排名指示在 形成查詢建議中查詢模板的有用性。在一些實現中,查詢模板的排名可以用來確定模板是 否是有效的模板。在一些實現中,查詢模板的排名可以另外和/或替選地與該模板相關聯(lián) 并且用在確定形成查詢建議中是否利用查詢模板和/或用于確定基于查詢模板形成的查 詢建議的排名。
[0056] 在一些實現中,查詢模板的排名可以基于實體類別的內聚性。實體類別的內聚性 可以指示實體類別的實體之間的相似性,相似性越高,指示越大的內聚性。實體類別的實 體之間的高相似度將以比實體之間的低相似度更影響排名。例如,除與實體類別[movie subject]相關聯(lián)外,諸如[movie subject]的實體類別可以包括彼此之間具有低相似性的 多個實體。例如,[movie subject]可以包括與諸如"aliens"、"art"和"wars"的不同主 題相關聯(lián)的多個實體。因此,在一些實現中,可以將實體類別[movie subject]識別為具有 低內聚性水平。另一方面,實體類別[U.S. presidents]可以包括彼此之間具有高相似度的 實體?;趯嶓w類別的內聚性的查詢模板的排名可以指示可以產生無用和/或多余查詢建 議的查詢模板。例如,基于實體類別的內聚性的查詢模板的排名可以使包括不能滿足內聚 性的閾值水平的實體類別的查詢模板不被考慮為有效查詢模板。
[0057] 在一些實現中,查詢模板的排名可以基于符合查詢模板的所識別的先前提交的查 詢的數量。例如,在一些實現中,當符合查詢模板的所識別的先前提交的查詢的數量滿足閾 值時,模板生成器115可以確定積極影響排名。而且,例如,在一些實現中,模板生成器115 可以確定在基于符合模板的所識別的先前提交的查詢的數量的程度上積極影響排名(例 如,符合的越多,排名越高)。在一些實現中,確定符合查詢模板的所識別的先前提交的查詢 的數量可以考慮查詢中的一個或多個出現的頻率。例如,提交過10次的給定查詢(例如計 數10次,或計數大于1次)可以加權高于僅提交過一次的另一查詢。在一些實現中,確定 符合查詢模板的所識別的先前提交的查詢的數量可以忽略查詢中的一個或多個的出現頻 率(例如,每一查詢僅計數一次,與出現頻率無關)。
[0058] 在一些實現中,查詢模板的排名可以包括基于符合該模板的所識別的先前提交 的查詢的數量是否滿足閾值,來確定該模板是否有效。例如,模板生成器115可以識別 1,000, 000先前識別的查詢以及識別第一查詢模板"bike shop [city] "和第二查詢模板 "independently owned bike shop[city]"。可以基于先前識別的查詢的數量來確定閾值 和/或另外確定(例如,缺省閾值)。例如,閾值可以是20。模板生成器115可以確定先前 提交的查詢中的500個符合第一查詢模板"bike shop [city] "并且確定第一查詢模板潛 在有效。另一方面,模板生成器115可以確定先前提交的查詢中的僅10個符合第二模板 "independently owned bike shop [city] "并且確定第二查詢模板潛在無效。在一些實現 中,符合查詢模板的所識別的先前提交的查詢的數量和/或閾值可以基于百分比。
[0059] 在一些實現中,查詢模板的排名可以基于確定作為查詢模板的實體類別的成員并 且存在于符合該模板的至少一個先前識別的查詢中的實體的數量。例如,查詢模板可以是 "restaurants in[city]"以及實體類別[city]可以與100, 000個實體相關聯(lián)。模板生成 器115可以確定與實體類別[city]相關聯(lián)的10, 000實體存在于符合模板"restaurants in[city]"的先前所識別的查詢中。因此,作為實體類別[city]的成員的實體的10%存在 于符合模板"restaurants in [city] "的先前所識別的查詢中。隨著作為實體類別的成員 并且存在于至少一個先前所識別的查詢中的實體的數量增加,積極影響排名。因此,如果作 為實體類別[city]的成員的實體的20, 000個存在于符合模板"restaurants in[city]" 的先前所識別的查詢中比僅存在實體的10, 〇〇〇個更積極地影響查詢模板"restaurants in [city] " 的排名。
[0060] 在一些實現中,確定排名可以包括基于作為查詢模板的實體類別的成員并且存在 于符合該模板的至少一個先前所識別的查詢中的實體的數量是否滿足閾值,來確定該模板 是否有效。例如,模板生成器115可以識別第一查詢模板"bike sh〇p[city]"和第二查詢模 板" independently owned bike shop [city] "。模板生成器 115 可以進一步確定與[city] 相關聯(lián)的實體類別可以與100, 〇〇〇個實體相關聯(lián)??梢曰谙嚓P聯(lián)的實體的數量確定閾值 和/或另外確定(例如缺省閾值)。例如,閾值可以是實體的5%。模板生成器115可以確 定作為類別[city]的成員的實體的7%存在于符合第一查詢模板"bike shop[city]"的 先前提交的查詢中并且確定第一查詢模板潛在有效。另一方面,模板生成器115可以確定 作為類別[city]的成員的實體的僅1%存在于符合第二查詢模板"independently owned bike shop [city] "的先前提交的查詢中,并且確定第二查詢模板潛在無效。
[0061] 在一些實現中,查詢模板的排名可以基于確定符合該模板的先前所識別的查詢中 的實體類別的成員的出現頻率與包括不符合該模板的查詢的另外的先前所識別的查詢的 集合中的同一實體的出現頻率之間的相似性。當符合該模板的先前所識別的查詢中的實體 類別的實體的出現頻率與另外的先前所識別的查詢的集合中的同一實體的出現頻率之間 的相似性增加時,積極地影響排名。例如,查詢模板可以是"restaurants in [city] "以及可 以確定在符合查詢模板的先前所識別的查詢中,與舊金山相關聯(lián)的實體以第一頻率出現以 及可以確定在符合查詢模板的先前所識別的查詢中與圣地亞哥相關聯(lián)的實體以第二頻率 出現。例如,可以確定與舊金山相關聯(lián)的實體以符合該查詢模板的查詢中的0.08%出現,以 及與圣地亞哥相關聯(lián)的實體以符合該查詢模板的查詢中的 0.06%出現??梢赃M一步確定與 舊金山相關聯(lián)的實體在包括不符合該模板的查詢的另外的先前所識別的查詢集合(例如, 所有所識別的查詢,包括類別[city]的實體的所有所識別的查詢)中以第三頻率出現,以 及可以確定與圣地亞哥相關聯(lián)的實體在另外的查詢集合中以第四頻率出現。例如,可以確 定與舊金山相關聯(lián)的實體在另外的查詢集合中以查詢中的〇. 08%出現,以及與圣地亞哥相 關聯(lián)的實體在符合另外的查詢集合的查詢中以〇. 06%出現。因此,舊金山和圣地亞哥的出 現頻率之間的分布在符合該模板的查詢和另外的查詢集合之間是相同的?;谶@樣的分布 相似性,可以積極地影響查詢模板的排名。為了簡化起見,在前面的例子中論述了比較僅兩 個實體之間的出現頻率。如在此所述,可以考慮2個以上實體之間的分布相似性。
[0062] 在一些實現中,確定排名可以包括確定在符合該模板的先前所識別的查詢中實體 類別的成員的出現頻率與包括不符合該模板的查詢的另外的先前所識別的查詢集合中相 同實體的出現頻率之間的相似性是否滿足閾值。例如,可以基于在符合模板的先前所識別 的查詢中實體類別的成員的出現頻率與包括不符合模板的查詢的另外的先前所識別的查 詢的集合中相同實體的出現頻率之間的相似性,來確定相似性度量。如果相似性度量滿足 閾值,可以將該查詢模板視為潛在有效。如果相似性度量不能滿足該閾值,則可以將該查詢 模板視為潛在無效。
[0063] 參考圖6A-7B,提供了基于確定符合模板的先前所識別的查詢中實體類別的成員 的出現頻率與包括不符合該模板的查詢的另外的先前所識別的查詢的集合中相同實體的 出現頻率之間的相似性,來確定查詢模板的排名的另外的例子。
[0064] 在圖6A中,圖示了在符合查詢模板"restaurants in [city] "的查詢集合中實體 類別[city]的四個實體的出現頻率的示例性直方圖。在圖6B中,圖示了在包括不符合該 查詢模板的查詢的另外的所識別的查詢集合中同樣四個實體的出現頻率的示例性直方圖。 在一些實現中,另外的查詢集合可以包括符合模板"restaurants in[city] "的查詢中的一 個或多個。在一些實現中,另外的查詢集合可以包括來自過去查詢的日志的所有查詢。在 一些實現中,另外的查詢集合可以僅包括包含實體類別[city]的實體的查詢。圖6A和6B 圖示了模板生成器115可以確定集合之間具有高相似度并且可以積極地影響查詢模板的 排名的出現頻率的直方圖。
[0065] 參考圖6A,圖示了城市"洛杉肌,CA"、"路易斯維爾,KY"、"舊金山,CA"和"塞勒 姆,0R"。盡管僅圖示了四個城市,應理解到可以利用另外的城來確定出現頻率的相似性。 例如,在一些實現中,可以利用存在于在符合查詢模板"restaurants in [city] "的查詢集 合中的所有城市。而且,例如,在一些實現中,可以利用存在于符合查詢模板"restaurants in [city] "的查詢集合中的城市的子集(例如,200個隨機選擇的城市)。
[0066] 模板生成器115可以識別在符合模板"restaurants in[city] "的查詢中實體類 別[city]的四個圖示成員的出現頻率。在所圖示的直方圖中,由條的高度表示查詢中的城 市的出現頻率。例如,符合該模板并且包括與"l〇s angeles"相關聯(lián)的實體的查詢出現約 120次。如在此所述,在一些實現中,在確定出現頻率中,模板生成器115可以包括用于實體 的多個別名。例如,用于"los angeles"的出現頻率計數可以包括查詢"restaurants in Los Angeles"中出現70次以及查詢"restaurants in LA"出現50次。
[0067] 參考圖6B,圖示了對包括不符合模板"restaurants in[city] "的查詢的查詢集 合的類別[city]的相同成員的出現頻率。在一些實現中,查詢集合可以包括符合查詢模板 的查詢和不符合查詢。例如,查詢集合可以包括"restaurants in Los Angeles"和查詢 "basketball team los angeles"。而且,例如,可以僅利用不符合模板的查詢來確定計數。 圖6B中的城市的出現頻率在分布上類似于圖6A中的城市的出現頻率。圖6B中的城市的 每一個具有如圖6A中所圖示的出現頻率的約2倍,但表示相對彼此的類似分布。圖6B的 較大出現頻率可以是由于例如所考慮的較大查詢集合。
[0068] 模板生成器115可以確定符合模板的先前所識別的查詢中類別的成員的出現頻 率和包括不符合該模板的查詢的另外的先前所識別的查詢集合中相同實體的出現頻率之 間的相似性。例如,模板生成器115可以使用一個或多個統(tǒng)計方法,諸如適合度測試、卡方 分析、和/或基于熵的方法來確定相似性。
[0069] 在圖7A中,圖示了在符合查詢模板"NBA teams in[city] "的查詢集合中實體類 別[city]的四個實體的出現頻率的示例性直方圖。在圖7B中,圖示了在包括不符合查詢 模板的查詢的先前所識別的查詢集合中同樣四個實體的出現頻率的示例性直方圖。圖7A 和7B圖示了模板生成器115可以確定會不利地影響查詢模板的排名和/或僅有限程度地 積極影響查詢模板的排名的集合之間不具有高相似度的出現頻率的直方圖。
[0070] 參考圖7A,圖示了"洛杉fl,CA"、"路易斯維爾,KY"、"芝加哥,IL"和"塞勒姆,0R"。 盡管僅圖示了四個城市,但應理解到可以利用另外的城市來確定出現頻率的相似性。模板 生成器115可以在符合模板"NBA teams in[city]"的查詢中識別實體類別[city]的四個 所圖示成員的出現頻率。如所圖示的,在圖7A中與"洛杉磯,CA"和"芝加哥,IL"相關聯(lián)的 實體具有約225的出現頻率,其中,與"路易斯維爾,KY"和"塞勒姆,0R"相關聯(lián)的實體具有 最小出現頻率(由于例如符合用于那些實體的查詢模板的有限查詢提交,因為在那些城市 中不存在NBA隊)。
[0071] 參考圖7B,圖示了包括不符合模板"NBA teams in[city] "的查詢的另外的查詢集 合的類別[city]的相同成員的出現頻率。在一些實現中,另外的查詢集合可以包括符合查 詢模板的查詢和不符合查詢。而且,例如,可以僅利用不符合模板的查詢來確定出現頻率。 圖7B中的城市的出現頻率在分布上與圖7A的城市的出現頻率不相似。例如,與"路易斯維 爾,KY"和"塞勒姆,0R"相關聯(lián)的實體表示在圖7B中比在圖7A中更大的出現頻率。
[0072] 模板生成器115可以確定在符合模板的先前所識別的查詢中類別的成員的出現 頻率和在包括不符合模板的查詢的另外的先前所識別的查詢集合中相同實體的出現頻率 之間的相似性。例如,模板生成器115可以使用一個或多個統(tǒng)計方法,諸如適合度測試、卡 方分析和/或基于熵的方法來確定相似性。
[0073] 在此描述了確定查詢模板的排名的各種技術。查詢模板的排名可以基于一個或多 個這樣的技術和/或另外的技術。例如,查詢模板是否是有效的查詢模板可以基于:查詢模 板的實體類別的內聚性、作為實體類別的成員并且存在于符合查詢模板的至少一個先前識 別的查詢中的實體的數量、符合查詢模板的多個所識別的先前提交查詢、以及符合模板的 先前所識別的查詢中實體類別的成員的出現頻率和包括不符合該模板的查詢的另外的先 前所識別的查詢集合中相同實體的出現頻率之間的相似性。例如,累積排名可以基于所有 在前因素來確定以及如果累計排名滿足閾值,可以將該查詢模板視為有效。而且,例如,可 以對于在前因素中的每一個確定個體排名,以及如果個體排名中的每一個滿足閾值,可以 該查詢模板視為有效??梢岳迷诖怂龅囊粋€或多個技術的另外和/或替選組合來確定 查詢模板的排名。
[0074] 在一些實現中,模板生成器115可以將確定的查詢模板存儲在內容數據庫130中。 在一些實現中,當由模板生成器115將模板確定為有效時,可以將查詢模板僅存儲為有效 查詢模板。在一些實現中,與查詢模板相關聯(lián)的任何所確定的排名可以可選地與內容數據 庫130中的查詢模板關聯(lián)。
[0075] 查詢建議引擎120可以識別由模板生成器115制定的一個或多個查詢模板并且在 制定用于部分查詢的查詢建議中利用該查詢模板。在一些實現中,可以利用查詢模板來制 定查詢建議以便擴展現有的查詢建議的數據庫。在一些實現中,可以利用查詢模板來實時 地制定查詢建議。
[0076] 作為基于查詢模板來制定查詢建議的例子,查詢建議引擎120可以識別部分 查詢并且確定包括來自部分查詢的一個或多個詞語的查詢模板。例如,對于部分查詢 "restaurant i",可以識別查詢模板"restaurants in[city] "。然后,可以基于所識別的查 詢模板來確定一個或多個查詢建議。例如,可以通過將用于來自實體類別[city]的實體的 別名插入查詢模板中來確定查詢建議。在一些實現中,將實體的哪一別名插入查詢模板中 可以基于實體的流行度和/或別名的流行度。流行度可以基于一個或多個因素,諸如過去 查詢中的流行度。例如,與舊金山市,CA相關聯(lián)的實體可以比安克雷奇,AK相關聯(lián)的實體 更流行。同樣地,與和San Francisco市相關聯(lián)的實體相關聯(lián)的別名"San Francisco"可 以比與和舊金山市相關聯(lián)的實體相關聯(lián)的別名SF更流行。
[0077] 在一些實現中,插入查詢模板中的實體的別名可以基于另外和/或替選因素。例 如,當響應于來自特定用戶的部分查詢來制定查詢建議時,插入查詢模板中的實體的別名 可以基于用戶和實體之間和/或用戶和別名之間的關系。例如,用戶可能處于安克雷奇,AK 并且基于用戶的位置,更可能選擇與安克雷奇市,AK相關聯(lián)的實體。而且,例如,當響應于 來自特定用戶的部分查詢而正制定查詢建議時,插入查詢模板中的實體的別名可以基于與 用戶的先前搜索請求相關聯(lián)的實體。例如,用戶可能頻繁地發(fā)出與實體安克雷奇,AK相關 聯(lián)的搜索查詢,以及基于用戶的過去的搜索查詢,更可能選擇與安克雷奇市,AK相關聯(lián)的 實體。
[0078] 在一些實現中,當部分查詢包括查詢模板的實體類別的一個或多個字符時,查詢 建議引擎120可以訪問實體數據庫來基于一個或多個字符識別一個或多個潛在的別名。例 如,對于部分查詢"restaurants in s",可以識別查詢模板"restaurants in[city]"。然 后,通過將對來自實體類別[city]的實體以"s"開始的別名插入到查詢模板中,可以基 于所識別的查詢模板來確定一個或多個查詢建議。例如,可以識別城市的別名,諸如"San Francisco"、"Santa Monica"和"Santa Fe"。而且,例如,用戶可以將部分查詢"bike shops s"輸入為部分查詢。查詢建議引擎120可以基于部分查詢和包括詞語"bike shops"的模 板,將模板"bike sh〇pS[city]"識別為潛在模板。查詢建議引擎120可以訪問實體數據庫 并且識別用于實體類別[city]的實體,并且可以進一步識別映射到諸如"San Diego"和 "San Francisco"的實體類別[city]的實體的一個或多個別名。查詢建議引擎可以識別 部分查詢中的詞語"s"和在實體數據庫中的一個或多個別名(例如,"San Diego"和"San Francisco"之間的相似性,以及查詢建議引擎120可以為用戶提供符合該模板并且包括以 "s"開始的別名的一個或多個查詢建議。例如,查詢建議引擎120可以為用戶提供查詢建議 "bike shops in San Diego"和"bike shops in San Francisco",作為用于用戶的部分查 詢的潛在完整查詢。用戶可以選擇查詢建議中的一個并且將所選的查詢建議提交給搜索引 擎125,和/或用戶可以輸入另外的字符來生成新的部分查詢(例如,輸入"bike shops in sa")。
[0079] 作為基于查詢模板來制定查詢建議的另一例子,查詢建議引擎120可以識別部分 查詢并且確定映射到來自部分查詢的一個或多個詞語的實體類別。例如,對于部分查詢 "snow white and the huntsman",能將詞語"snow white and the huntsman"識別為映射 到實體類別[film]。在一些實現中,可以利用在此所述的實體數據庫,來識別用于查詢的一 個或多個詞語的實體類別。基于實體類別[film],可以識別包括實體類別[film]的一個或 多個查詢模板,諸如查詢模板" [film]actors"。然后,可以利用所識別的查詢模板來確定查 詢建議"snow white and the huntsman actors"。而且,例如,對于部分查詢"snow white and the huntsman gr",能將詞語 "snow white and the huntsman" 識別為映射到實體類 別[film]?;趯嶓w類別[film],以及在實體類別[film]后的另外的字符"gr",可以識別包 括實體類別影片和字符"gr"的一個或多個查詢模板,諸如" [film] gross sales"。然后,可 以利用所識別的查詢模板來確定查詢建議"snow white and the huntsman gross sales"。 而且,例如,對于部分查詢"snow white and the hu",能基于用于"snow white and the hu"的現有的查詢建議來識別詞語"snow white and the huntsman"??梢詫⒃~語"snow white and the huntsman"映射到實體類別[film]?;趯嶓w類別[film],可以識別包括實 體類別[film]的一個或多個查詢模板,諸如查詢模板"[filnjactors"。然后利用所識別的查 詢模板來確定查詢建議"snow white and the huntsman actors"。
[0080] 在一些實現中,查詢建議引擎120可以對基于查詢模板所確定的一個或多個查詢 建議進行排名。在一些實現中,查詢建議的排名可以基于用來制定查詢建議的查詢建議 模板的排名。例如,基于在此所述的一個或多個標準,模板生成器115可以確定查詢模板 "rivers in [state]"排名高于用于查詢建議的查詢模板"rivers in [city]",以及基于這 樣的排名,確定基于查詢模板的查詢建議的排名。在一些實現中,基于查詢模板所確定的查 詢建議的排名可以另外和/或替選地基于別名和/或與輸入到查詢建議中的別名相關聯(lián)的 實體的流行性。例如,查詢建議的流行性可以基于插入到查詢模板中來形成查詢建議的別 名的流行性和基于與插入到查詢建議中的別名相關聯(lián)的實體的流行性。如在此所述,一個 或多個數據庫可以存儲有關實體和/或實體的別名的流行性的信息。例如,查詢建議引擎 120可以識別與"San Antonio"相關聯(lián)的實體比與"Saskatoon"相關聯(lián)的實體更流行以及 基于這樣的流行性來確定包括"San Antonio"和/或"Saskatoon"的查詢建議的排名。而 且,例如,查詢建議引擎120可以識別與實體"San Antonio"相關聯(lián)的別名"San Antonio" 比與實體"Saskatoon"相關聯(lián)的別名"SAT"更流行,并且基于這樣的流行性,確定包括"San Antonio"和/或"SAT"的查詢建議的排名。
[0081] 在一些實現中,查詢建議引擎120可以基于特定于該用戶的信息對用來形成查詢 建議的一個或多個實體和/或別名排名。查詢建議引擎120可以使用用戶的文檔,諸如電 子郵件、導航歷史、來自用戶的一個或多個應用的信息、和/或有關已經識別的用戶的特性 的相關聯(lián)信息(例如用戶的位置、用戶的年齡組、用戶的興趣)。例如,查詢建議引擎120可 以識別用戶先前瀏覽過的有關與圣地亞哥市相關聯(lián)的實體的網頁,以及查詢建議引擎120 可以基于用戶對識別有關圣地亞哥的一個或多個另外的文檔比可能另外選擇的另一城市 更感興趣的可能性,排序查詢建議"圣地亞哥的飯店"(基于查詢模板確定)。在一些實現 中,查詢建議引擎120可以識別用戶的當前位置并且利用該位置來基于查詢模板來排序用 在形成用于用戶的查詢建議中的實體和/或別名。例如,查詢建議引擎120可以基于用戶在 圣地亞哥的信息,諸如來自GPS和/或計算設備105的IP地址的信息,將包括"san diego" 的查詢建議提升為高于包括"San Antonio"的查詢建議。
[0082] 具有比圖1所示的環(huán)境更多或更少組件的許多其他配置是可能的。例如,盡管在 圖1中單獨地分別圖示了查詢建議引擎120和模板生成器115,應理解到,在一些實現中,查 詢建議引擎120和/或模板生成器115可以可選地彼此組合和/或與搜索引擎125和/或 計算設備105中的一個或多個組合。
[0083] 參考圖2,提供了圖示確定查詢模板和排名查詢模板的示例性方法的流程圖。其他 實現可以以不同的順序執(zhí)行步驟、省略某些步驟和/或執(zhí)行與圖2所示不同的和/或另外 的步驟??梢杂蓤D1中所示的一個或多個組件,諸如模板生成器115,來執(zhí)行圖2所示的方 法的步驟。
[0084] 在步驟200,識別實體類別。例如,模板生成器115可以通過訪問與內容數據庫130 共享一個或多個特性的數據庫來識別實體類別。例如,模板生成器115可以識別實體類別 [city],其中,與城市相關聯(lián)的多個實體可以是實體類別的成員。而且,例如,模板生成器 115可以識別實體類別[動物],其中,與動物相關聯(lián)的多個實體可以是實體類別的成員。
[0085] 在步驟205,對于與在步驟200中識別的實體類別相關聯(lián)的實體,識別別名。相 關聯(lián)的實體的別名可以是實體的相關聯(lián)的文本表示,諸如用于加利福尼亞的洛杉磯市的 名稱"los angeles"。在一些實現中,實體可以與多個別名相關聯(lián)。例如,具有別名"los angeles"的實體可以另外與別名"LA"和"City of Angles"、洛杉磯市的實體的另外的別 名相關聯(lián)。
[0086] 在步驟210,識別共享一個或多個匹配詞語和在步驟205中識別的別名中的一個 或多個的查詢組??梢曰诶缭~匹配、基于前綴的匹配、編輯距離和/或詞語的嚴格識 另 1J,來確定匹配詞語。例如,可以將查詢"cities in New York(紐約城市)"和"加 cities in California(利福尼亞城市)"識別為包括匹配詞語"cities in"和映射到實體類別 [state]的實體的別名。在一些實現中,經由一個或多個軟匹配技術,諸如忽略可選停止詞 語、規(guī)范一個或多個詞語、軟化詞語位置需求等等,將詞語確定為匹配。
[0087] 在一些實現中,在步驟200和205前,可選地執(zhí)行步驟210。例如,模板生成器115 可以首先識別包括匹配詞語的查詢,然后從相同查詢識別在查詢之間的不匹配并且可以是 相同類別的成員的一個或多個詞語。模板生成器115可以訪問實體數據庫并且確定來自多 個查詢的非匹配詞語是否是與一個實體類別相關聯(lián)的實體的別名,以及如果是,識別實體 類別。例如,模板生成器115可以將查詢"Oscar winnerl939"和"Oscar winner2002"識 別為包括共同詞語"Oscar winner"和不匹配詞語"1939"和"2002"。模板生成器115可以 識別實體數據庫中的具有別名"1939"和"2002"的實體,以及識別這兩個實體均與實體類 別[year]相關聯(lián)。
[0088] 在步驟215,確定查詢模板。在一些實現中,可以基于在步驟210識別的一個或多 個查詢來確定查詢模板。在一些實現中,可以在執(zhí)行步驟200、205和210的一個或多個之前 確定該模板。例如,可以通過確定與單個查詢的詞語相關聯(lián)的實體類別和識別單個查詢的 另外的詞語,來基于該單個查詢確定查詢模板??梢岳盟_定的查詢模板的實體類別來 在步驟200識別實體類別,以及可以利用步驟205和210來識別符合查詢模板的查詢組。模 板可以包括來自所識別的查詢的一個或多個共同詞、以及實體類別。例如,模板生成器115 可以將查詢"best picture winner gone with the wind"識別為包括詞語"best picture winner"和作為用于與實體類別[movie]相關聯(lián)的實體的別名的詞語的序列。
[0089] 在步驟220,對在步驟215確定的查詢模板確定排名。在一些實現中,可以利用排 名來確定該模板是否是有效的查詢模板。在一些實現中,可以由查詢建議引擎120利用該 排名來確定基于查詢模板確定的一個或多個查詢建議的排名。例如,可以確定模板具有使 模板將用于為大量部分查詢提供查詢建議是不可能的排名。而且,例如,模板生成器115可 以基于查詢模板的排名將查詢模板確定為有效或無效。
[0090] 可以利用在此所述的一個或多個技術來確定模板的排名。例如,用于有效查詢模 板的排名可以基于:查詢模板的實體類別的內聚性、作為實體類別的成員并且存在于符合 該查詢模板的至少一個先前所識別的查詢中的實體的數量、符合查詢模板的多個所識別的 先前提交的查詢、以及符合模板的先前所識別的查詢中的實體類別的成員的出現頻率與包 括不符合模板的查詢的另外的先前所識別的查詢集合中的相同實體的出現頻率之間的相 似性。
[0091] 參考圖3,提供了圖示基于查詢模板向用戶提供一個或多個查詢建議的示例方法 的流程圖。其他實現可以以不同順序執(zhí)行步驟、省略某些步驟和/或執(zhí)行與圖3中所示的 步驟不同的和/或另外的步驟。圖3所示的方法的步驟可以由圖1所示的一個或多個組件 執(zhí)行。例如,圖3的方法的步驟可以由查詢建議引擎120執(zhí)行。
[0092] 在步驟300,識別用戶的部分查詢。例如,可以經諸如瀏覽器110的在計算設備105 上執(zhí)行的應用,由用戶將部分查詢提供給查詢建議引擎120。在一些實現中,用戶可以將部 分查詢輸入到與圖5中并且如在此所述的圖形用戶界面共享一個或多個特性的界面中。
[0093] 在步驟305,基于在步驟300識別的部分查詢,識別查詢模板。例如,查詢建議引 擎120可以從由模板識別引擎115先前確定并且存儲在內容數據庫130中的一個或多個 查詢模板識別查詢模板。在一些實現中,查詢模板可以另外包括相關聯(lián)的排名。在一些實 現中,查詢建議引擎120可以基于一個或多個模板與由用戶輸入的部分查詢之間的相似性 來識別模板。例如,查詢建議引擎120可以使用基于前綴的匹配、編輯距離,和/或精確詞 語匹配來識別部分查詢和模板之間的相似性。在一些實現中,查詢建議引擎120可以初始 地識別多于一個潛在模板并且基于用戶對部分查詢的進一步精化,確定用于制定查詢建議 的模板。例如,查詢建議引擎120可以基于所識別的部分查詢"bas"初始地識別查詢模板 "baseball teams in [state] " 和 "basketball teams in [city] ",以及如果用戶進一步將 "e"提供給查詢,使得部分查詢?yōu)?base",查詢建議引擎120可以僅識別"baseball teams in [state],'。
[0094] 在步驟310,識別用于包括在步驟305中識別的模板中的類別的一個或多個實體。 例如,可以由查詢建議引擎120從實體數據庫識別實體。查詢建議引擎120可以識別隨模 板包括的實體類別,以及識別與該實體類別相關聯(lián)的一個或多個實體。例如,查詢建議引擎 120 可以從部分查詢"baseball teams in t"識別模板"baseball teams in[state]"以及 查詢建議引擎120可以識別與用于該類別[state]的實體相關聯(lián)的一個或多個實體,諸如 與州"texas"和"tennessee"相關聯(lián)的實體。
[0095] 在步驟315,基于查詢模板和在步驟310識別的實體的別名的中一個或多個,選擇 至少一個查詢建議以便提供給用戶。在一些實現中,可以基于與查詢模板相關聯(lián)的一個或 多個排名、插入在查詢建議中的別名和/或與插入在查詢建議中的別名相關聯(lián)的實體,選 擇查詢建議。例如,查詢建議引擎120可以識別與舊金山市,CA和塞勒姆,俄勒R州相關 聯(lián)的實體,以及基于例如用戶已經提交的在前查詢,確定舊金山更可能是用戶感興趣的類 別的成員。可以由模板生成器115在初始確定模板時和/或基于由查詢建議引擎210從一 個或多個數據庫識別的另外的信息,來確定查詢的流行性。
[0096] 參考圖4,圖示了符合查詢模板405的查詢400A-D的列表和符合查詢模板410的 查詢400E-H的列表。在一些實現中,可以利用查詢400A-H中的一個或多個來確定相應查 詢模板405或410??梢杂赡0迳善?15利用可以包括在圖2中提供的方法的一個或多 個步驟的方法來識別查詢400A-H。例如,圖4的查詢400A-H可以是在步驟210中由模板生 成器115識別的查詢。查詢400A-H是可以從一個或多個源識別的查詢。例如,查詢400A-H 可以是從與內容數據庫130共享一個或多個方面的數據庫識別的。
[0097] 在一些實現中,可以基于查詢400A-D中的一個或多個來確定查詢模板405。同樣 地,在一些實現中,可以基于查詢400E-H中的一個或多個來確定查詢模板410。例如,在所 圖示的查詢列表中,所有查詢400A-D包括詞語"bike shops in"。模板生成器115可以識 別查詢中的一個或多個以及確定接著一個或多個詞語的詞語"bike shops in"可以是在 未來利用查詢建議的有效模板。模板生成器115可以訪問實體數據庫并且識別與和查詢 400A-D中的一個或多個另外的詞語匹配的別名相關聯(lián)的實體(例如,"los angeles"、"san dieg〇"、"l〇UiSVill e"和"detroit")。模板生成器115可以識別與別名相關聯(lián)的實體被 映射到實體類別[city],并且確定模板"bike shops in[city]" 405。
[0098] 而且,例如,模板生成器115可以識別先前提交的查詢的列表中的查詢400E至 400H,以及確定查詢中的一個或多個詞語可以在模板中利用。在查詢400E-H中,查詢包括 在查詢之間不共有并且不是實體類別的一部分的一個或多個詞語,諸如"oscar"(400G)和 " in"(400H)。模板生成器115可以確定查詢模板410可以排除非匹配詞。而且,例如,模板 生成器115可以確定在查詢模板中非匹配詞是可選的。在一些實現中,模板生成器115可 以僅識別包括共同詞語和類別成員的查詢。如在此所述,在一些實現中,模板生成器115可 以基于一個或多個標準對所確定的模板410排名。
[0099] 參考圖5,圖示了基于查詢模板提供給用戶的查詢完整建議的示例性圖形用戶界 面??梢杂芍T如瀏覽器110的在計算設備105上執(zhí)行的一個或多個應用向用戶提供該界面。 可以通過與查詢建議引擎120共享一個或多個特性的組件將建議提供給一個或多個應用。
[0100] 在所圖示的界面中,用戶已將部分查詢"bike shops in S"輸入到查詢輸入500 中。如在此所述,可以將部分查詢提交給查詢建議引擎120。另外或替選地,用戶可以肯定 地選擇搜索按鈕510來將查詢提交給搜索引擎125。響應于查詢輸入500中的查詢,搜索引 擎125可以向用戶提供一個或多個搜索結果,以及可選地,可以與搜索結果一起提供用于 查詢的一個或多個查詢建議。查詢建議列表520可以基于查詢輸入500中的部分查詢而包 括用于查詢的一個或多個建議。用戶可以從查詢建議列表520點擊或者以其他方式選擇查 詢建議,和/或用戶可以繼續(xù)編輯查詢輸入500中的查詢??梢杂刹樵兘ㄗh引擎120將查 詢列表520中的查詢建議提供給用戶。在一些實現中,當編輯部分查詢時和/或當用戶暫 停預定時間量時,可以將查詢輸入500中的部分查詢提供給查詢建議引擎120。
[0101] 可以將部分查詢"bike shops in s"提供給查詢建議引擎120以及查詢建議引擎 120可以訪問內容數據庫,諸如內容數據庫130,來識別可以用來識別查詢建議的一個或多 個查詢模板??梢杂赡0迳善?15確定查詢模板并且將其存儲在內容數據庫130中。在 一些實現中,查詢建議引擎120可以從匹配查詢模板的一個或多個詞語的部分查詢識別一 個或多個詞語。例如,查詢建議引擎120可以基于部分查詢"bike shops in s"識別模板 "bike shops in [city],'
[0102] 查詢建議引擎120可以基于所選擇的模板中的類別的存在來識別[city]類別的 一個或多個實體。在一些實現中,查詢建議引擎120可以訪問與內容數據庫130共享一個 或多個特性的實體數據庫來識別一個或多個實體。查詢建議引擎120可以識別與這樣的所 識別的實體相關聯(lián)的實體的一個或多個別名。例如,查詢建議引擎120可以將"New York"、 "San Francisco"和"Detroit"識別為作為類別[city]的成員的實體的別名。
[0103] 在一些實現中,查詢建議引擎120可以將類別的實體的一個或多個別名確定為部 分查詢的詞語中的一個或多個的潛在完成。例如,查詢建議引擎120已經在查詢建議列表 520中提供潛在查詢完成的列表,以及每個查詢建議包括模板的詞語"bike shops in"以 及作為部分查詢的詞語的潛在匹配的實體類別[city]的成員。查詢建議引擎120已經提 供以字符"s"開始的城市的列表,包括附加到詞語"bike shops in"的"san Francisco"、 "San jose"、"saint Louis"和"salem"。在一些實現中,查詢建議引擎120可以利用一個 或多個方法來確定部分查詢的詞語和類別的成員的別名之間的潛在匹配,諸如基于前綴的 匹配和/或編輯距離。在一些實現中,查詢建議引擎120可以忽略無用詞和/或規(guī)范部分 查詢中的一個或多個詞語和/或類別的實體的別名。
[0104] 作為基于查詢模板來制定查詢建議的另一例子,查詢建議引擎120可以識別部分 查詢和確定被映射到來自部分查詢的一個或多個詞語的實體類別。例如,對于部分查詢 "snow white and the huntsman",能將詞語"snow white and the huntsman"識別為映射 到實體類別[films]。基于實體類別[films],可以識別包括實體類別[films]的一個或多個 查詢模板,諸如查詢模板" [film]actors"。然后,可以利用所識別的查詢模板來確定查詢建 議"snow white and the huntsman actors,'。
[0105] 圖8是示例性計算機系統(tǒng)810的框圖。計算機系統(tǒng)810典型地包括經由總線子 系統(tǒng)812與多個外圍設備通信的至少一個處理器814。這些外圍設備可以包括存儲子系統(tǒng) 824,包括例如內存子系統(tǒng)826和文件存儲子系統(tǒng)828、用戶接口輸入設備822、用戶接口輸 出設備820和網絡接口子系統(tǒng)816。輸入和輸出設備允許與計算機系統(tǒng)810的用戶交互。 網絡接口子系統(tǒng)816提供與外部網絡的接口,并且耦接到其他計算機系統(tǒng)中的相應接口設 備。
[0106] 用戶接口輸入設備822可以包括鍵盤、諸如鼠標、跟蹤球、觸控板或圖形輸入板的 指示設備、掃描儀、合并到顯示器中的觸摸屏、諸如語音識別系統(tǒng)、麥克風的音頻輸入設備 和/或其他類型的輸入設備。通常,使用術語"輸入設備"來旨在包括所有可能設備類型和 方式來將信息輸入到計算機系統(tǒng)810中或通信網絡上。
[0107] 用戶接口輸出設備820可以包括顯示子系統(tǒng)、打印機、傳真機或非可視顯示,諸如 音頻輸出設備。顯示子系統(tǒng)可以包括陰極射線管(CRT)、諸如液晶顯示器(LCD)的平板設 備、投影設備或用于產生可視圖像的某個其他機制。顯示子系統(tǒng)還可以提供非可視顯示,諸 如經由音頻輸出設備。通常,使用術語"輸出設備"旨在包括所有可能設備類型和方式來將 信息從計算機系統(tǒng)810輸出到用戶或另一機器或計算機系統(tǒng)。
[0108] 存儲子系統(tǒng)824存儲提供在此所述的模塊中的一些或全部的功能的編程和數據 結構。例如,存儲子系統(tǒng)824可以包括根據在此所述的一個或多個過程基于一個或多個查 詢和實體來確定和/或排名查詢模板的邏輯。
[0109] 這些軟件模塊通常由處理器814單獨或結合其他處理器來執(zhí)行。用在存儲子系統(tǒng) 中的內存826能包括多個存儲器,包括用于在程序執(zhí)行期間存儲指令和數據的主隨機存取 存儲器(RAM) 830和存儲固定指令的只讀存儲器(ROM) 832。文件存儲子系統(tǒng)828能提供用 于程序和數據文件的永久存儲,以及可以包括硬盤驅動、軟盤驅動以及相關聯(lián)的可移動介 質、CD-ROM驅動、光驅動或可移動介質盒。實現某些實現的功能的模塊可以由存儲子系統(tǒng) 824中的文件存儲子系統(tǒng)828存儲,或存儲在可由處理器814存取的其他機器中。
[0110] 總線子系統(tǒng)812提供用于根據需要使計算機系統(tǒng)810的各種組件和子系統(tǒng)彼此通 信的機制。盡管將總線子系統(tǒng)812示意性地示為單個總線,但總線子系統(tǒng)的替代實現可以 使用多個總線。
[0111] 計算機系統(tǒng)810能是可變類型,包括工作站、服務器、計算集群、刀片集群、服務器 群、或任何其他數據處理系統(tǒng)或計算設備。由于計算機和網絡的不斷改變的性質,圖8中所 述的計算機系統(tǒng)810的描述僅意指為了圖示一些實現的目的的具體例子。具有比圖8所示 的計算機系統(tǒng)更多或更少組件的計算機系統(tǒng)810的許多其他配置是可能的。
[0112] 盡管在此已經描述和圖示了若干發(fā)明實現,但本領域的普通技術人員將很容易想 到用于執(zhí)行功能和/或獲得結果和/或在此所述的一個或多個優(yōu)點的許多其他手段和/或 結構,以及這些變化和/或改進中的每一個被認為在此所述的發(fā)明實現的范圍內。一般來 說,本領域的技術人員將容易認識到在此所述的所有參數、尺寸、材料和配置是示例性的以 及實際參數、尺寸、材料和/或配置將由使用本發(fā)明教導的具體應用而定。本領域的技術人 員將會認識到或能夠僅使用常規(guī)實驗確定在此所述的具體發(fā)明實現的許多等效。因此,應 理解到,前述實現僅以示例的方式提供,并且在所附權利要求及其等效的范圍內,發(fā)明實現 可以以除具體描述和所要求保護之外的方式實踐。本公開的發(fā)明實現針對在此所述的每個 單獨的特征、系統(tǒng)、物品、材料、套件和/或方法。此外,如果這樣的特征、系統(tǒng)、物品、材料、 套件和/或方法沒有相互不一致,則兩個或以上這樣的特征、系統(tǒng)、物品、材料、套件和/或 方法的任意組合包括在本公開的發(fā)明范圍內。
[0113] 如在此定義和使用的所有定義應當被理解為控制在字典定義、以引用方式并入的 文檔中的定義和/或所定義的詞語的一般含義之上。
[0114] 除非明確地相反指示,如在本說明書和權利要求中所使用的不定冠詞"一"和"一 個"應當被理解為意指"至少一個"。
[0115] 如在本說明書和權利要求中所使用的短語"和/或"應當被理解為意指如此連接 的元件(即在一些情況下連續(xù)地出現和在其它情況下分離地出現的元件)的"任一個或兩 者"。用"和/或"列出的多個元件應當以相同的方式來解釋,即如此連接的元件的"一個或 多個"。除了由"和/或"子句特別地標識的元件外,無論與那些特別地標識的元件有關還 是無關,其它元件可以可選地存在。因此,作為非限制性示例,當結合諸如"包括"的開放式 語言使用時,對"A和/或B"的引用在一個實現中可僅指的是A(可選地包括除了 B之外的 元件);在另一個實現中,可僅指的是B(可選地包括除了 A之外的元件);在又一個實現中, 可指的是A和B兩者(可選地包括其它元件)等等。
[0116] 如在本說明書和權利要求中所使用的,"或者"應當被理解為具有與上面定義的 "和/或"相同的含義。例如,當分開列表中的項時,"或者"或"和/或"應被解釋為包括 的,即包括至少一個,但是也包括許多元素或元素列表中的超過一個元素,以及可選地附加 的未列出的項。只有明確地相反指示的詞語,例如"僅僅其中一個"或"恰好其中一個"、或 者在權利要求中使用時的"由…組成"將是指包括許多元素或元素列表中的恰好一個元素。 通常,當有諸如"任一個"、"其中一個"、"僅僅其中一個"或者"恰好其中一個"的排他性術語 居前時,如在此所使用的術語"或者"應僅僅解釋為指示排他性替選(即"一個或另一個, 而不是二者")。當在權利要求中使用時,"基本上由…組成"應具有其如在專利法領域中所 使用的普通含義。
[0117] 如在本說明書和權利要求中所使用的,在對一個或多個元件的列表的引用中的短 語"至少一個"應當被理解為意指選自該元件列表中的元件中的任何一個或多個的至少一 個元件,但是不一定包括該元件列表內具體地列出的每一個元件中的至少一個并且不排除 該元件列表中的元件的任何組合。該定義還允許除短語"至少一個"所指的元件列表內具 體標識的元件外,元件可以可選地存在,不管其與具體地標識的那些元件有關還是無關。因 此,作為非限制性示例,"A和B中的至少一個"(或者,等效地,"A或B中的至少一個",或 者,等效地"A和/或B中的至少一個")在一個實現中可以是指至少一個A,可選地包括超 過一個A,其中B不存在(并且可選地包括B以外的元件);在另一個實現中可以是指至少 一個B,可選地包括超過一個B,其中A不存在(并且可選地包括A以外的元件);在又一個 實施例中可以是指至少一個A,可選地包括超過一個A,以及至少一個B,可選地包括超過一 個B (并且可選地包括其它元件)等等。
[0118] 還應當理解到,除非明確地相反指示,在包括多于一個步驟或動作的在此所要求 保護的任何方法中,該方法的步驟或動作的順序不一定限于該方法的步驟或動作所記載的 順序。
【權利要求】
1. 一種方法,包括: 識別實體類別,其中所述實體類別是共同共享一個或多個方面的實體的分組; 識別實體別名,所述實體別名中的每一個與所述實體類別中的實體中的至少一個相關 聯(lián); 識別查詢模板,其中所述查詢模板包括一個或多個模板詞語和所述實體類別的標識 符; 確定符合所述查詢模板的查詢組,其中所述查詢組中的每個查詢包括所識別的實體別 名中的一個和匹配所述模板詞語的一個或多個詞語;以及 確定所述查詢模板的排名,其中所述排名至少基于符合所述查詢模板的所述查詢組中 所述實體類別的實體中的一個或多個的出現計數。
2. 如權利要求1所述的方法,進一步包括基于所述排名是否滿足閾值來確定所述查詢 模板是否有效。
3. 如權利要求1所述的方法,其中,符合所述查詢模板的所述查詢組中所述實體類別 的實體中的一個或多個的出現計數基于符合的實體類別成員的數量,其中,所述符合的實 體類別成員是在所述實體類別中并且存在于符合所述查詢模板的所述查詢組中的實體。
4. 如權利要求3所述的方法,其中,確定所述查詢模板的排名包括: 將符合的實體類別成員的數量與實體類別成員的數量進行比較,其中實體類別成員的 數量基于在所述實體類別中的實體的數量。
5. 如權利要求1所述的方法,其中,符合所述查詢模板的所述查詢組中所述實體類別 的實體中的一個或多個的出現計數基于多個所述實體的相容出現頻率,其中,每個相容出 現頻率基于符合所述查詢模板的所述查詢組中的實體中的一個的出現頻率。
6. 如權利要求5所述的方法,其中,確定所述查詢模板的排名包括: 將所述相容出現頻率與另外的查詢組中的所述實體類別的多個實體的出現頻率進行 比較,所述另外的查詢組包括不符合所述查詢模板的查詢。
7. 如權利要求1所述的方法,其中,所述出現計數基于符合所述查詢模板的過去查詢 的數量。
8. 如權利要求1所述的方法,其中,所述排名進一步基于所述實體類別的實體的成員 之間的相似性來確定。
9. 如權利要求1所述的方法,其中,類別詞語是所述查詢模板的前綴。
10. 如權利要求1所述的方法,其中,與所述模板詞語匹配的一個或多個詞語包括不存 在于所述查詢模板中的一個或多個詞語。
11. 一種方法,包括: 識別部分查詢; 基于所述部分查詢來識別查詢模板,其中所述查詢模板包括一個或多個模板詞語和實 體類別的標識符,以及其中所述實體類別是共同共享一個或多個方面的實體的分組;以及 基于所述查詢模板來提供至少一個查詢建議,其中所提供的查詢建議包括所述一個或 多個模板詞語和所述實體中的一個的實體別名。
12. 如權利要求11所述的方法,其中,所述實體別名是基于所述部分查詢來識別的。
13. 如權利要求11所述的方法,其中,所述實體別名是基于所述用戶的位置來識別的。
14. 如權利要求11所述的方法,其中,所述查詢建議是基于與和所述實體別名相關聯(lián) 的所述實體相關聯(lián)的流行性度量來識別的。
15. 如權利要求11所述的方法,其中,識別所述查詢模板包括確定所述部分查詢中的 一個或多個詞語是否匹配所述查詢模板中的一個或多個詞語。
16. 如權利要求11所述的方法,其中,所述查詢模板是基于所述查詢模板的排名來識 別的。
17. 如權利要求11所述的方法,其中,識別所述查詢模板包括: 基于所述部分查詢來確定實體類別;以及 基于所確定的實體類別來確定所述查詢模板。
18. 如權利要求17所述的方法,其中,基于所述部分查詢來確定所述實體類別包括: 基于所述部分查詢的一個或多個部分查詢詞語來確定部分查詢實體;以及 基于所述部分查詢實體來確定所述實體類別。
19. 如權利要求18所述的方法,進一步包括: 確定所述部分查詢中的除用來確定所述部分查詢實體的所述部分查詢詞語外的另外 字符,其中確定所述查詢模板進一步基于所述另外字符。
20. 如權利要求11所述的方法,進一步包括基于與和所述實體別名相關聯(lián)的實體相關 聯(lián)的流行性度量來確定所述查詢建議的排名。
21. 如權利要求11所述的方法,進一步包括基于與所述實體模板相關聯(lián)的排名來確定 所述查詢建議的排名。
22. -種系統(tǒng),包括存儲器和能執(zhí)行在所述存儲器中存儲的指令的一個或多個處理器, 包括用于以下的指令: 識別實體類別,其中所述實體類別是共同共享一個或多個方面的實體的分組; 識別實體別名,所述實體別名中的每一個與所述實體類別中的實體中的至少一個相關 聯(lián); 識別查詢模板,其中所述查詢模板包括一個或多個模板詞語和所述實體類別的標識 符; 確定符合所述查詢模板的查詢組,其中所述查詢組中的每個查詢包括所識別的實體別 名中的一個和匹配所述模板詞語的一個或多個詞語;以及 確定所述查詢模板的排名,其中所述排名至少基于符合所述查詢模板的所述查詢組中 所述實體類別的實體中的一個或多個的出現計數。
【文檔編號】G06F17/30GK104216942SQ201410241761
【公開日】2014年12月17日 申請日期:2014年6月3日 優(yōu)先權日:2013年6月3日
【發(fā)明者】尼汀·古普塔, 王任慎, 曼格史·古普特 申請人:谷歌公司