基于距離的搜索排名降級的制作方法
【技術領域】
[0001 ]本說明書涉及處理本地搜索結果。
【背景技術】
[0002]互聯(lián)網提供對諸如視頻或音頻文件、用于特定主題的網頁、書籍文章或新聞文章的大量資源的訪問。搜索系統(tǒng)能夠響應于包括一個或多個搜索短語(即一個或多個詞)的搜索查詢而識別資源。搜索系統(tǒng)基于資源與搜索查詢的相關性以及資源的質量度量來對資源排名并且提供鏈接到所識別的資源的搜索結果。通常根據排名來排序搜索結果以便查看。
[0003]—些搜索系統(tǒng)能夠獲得或推斷從其接收搜索查詢的用戶設備的位置并且包括響應于搜索查詢的本地搜索結果。本地搜索結果是引用本地文檔的搜索結果。本地文檔進而是已經被分類為對用戶設備的特定位置具有本地意義的文檔。因此,如果與本地文檔相關聯(lián)的位置在用戶設備的位置附近,本地文檔可以接收查詢的搜索分值“提升”。例如,響應于對于“咖啡店”的搜索查詢,搜索系統(tǒng)可以提供引用在用戶設備的位置附近的用于咖啡店的網頁的本地搜索結果。不同地理區(qū)域的許多用戶很可能對響應搜索查詢“咖啡店”而接收咖啡店的本地結果滿意,因為很可能提交查詢“咖啡店”的用戶對用戶位置本地的咖啡店的搜索結果感興趣。
[0004]然而,一些本地結果可能具有與本地評分提升無關的非常高的分值。由于在包括本地結果的位置的區(qū)域外的人們對該文檔感興趣,也稱為“位置無關分值”的該分值可能會高。例如,飯店可能具有非常獨特的名字,以及可能是全國著名的飯店。因此,盡管飯店具有本地意義,但全國的用戶仍然非常感興趣。由此,考慮搜索業(yè)務和查詢日志數(shù)據的搜索算法可能將用于該飯店的文檔(例如網頁)排名非常高。
[0005]如另一例子,以ThomasEdison命名的電力公司在大州可能具有非常繁重的本地業(yè)務。由此,由于其許多客戶對網頁的大量工作或業(yè)務,考慮搜索業(yè)務和查詢日志數(shù)據的搜索算法也會將用于該電力公司的文檔排名非常高。然而,幾個州遠的用戶對電力公司網頁幾乎不感興趣。例如,用戶可能期望了解Thomas Edison,而不是標有其名稱的電力公司。然而,由于電力公司網頁的大業(yè)務量,該網頁可能被排名得高于有關該人的網頁,而輸入查詢“Edison”的用戶對后者更可能感興趣。
【發(fā)明內容】
[0006]通常,能以方法體現(xiàn)在本說明書中描述的主題的一個創(chuàng)新方面,該方法包括下述動作:接收指定搜索查詢的數(shù)據以及從其接收搜索查詢的用戶設備的位置;接收指定被確定為與搜索查詢相關的文檔集的數(shù)據,該數(shù)據對于每一文檔指定指示文檔與查詢的相關度的相應的搜索分值以及基于搜索分值根據第一順序的文檔的排名,以及其中,文檔的適當子集是本地文檔,其中,本地文檔中的每一個是被指定為具有用戶設備的地理位置的本地含義的文檔;確定本地文檔的適當子集中的第一本地文檔符合調整其相應的搜索分值來降級第一順序中的第一本地文檔的排名的降級操作,該確定至少部分地基于接近度量,該接近度量基于用戶設備的地理位置和對第一本地文檔指定的地理位置;以及響應于確定:對于本地文檔的適當子集中的每個第二本地文檔,確定基于用戶設備的地理位置和對第二本地文檔指定的地理位置的接近度量;以及當接近度量中的至少一個指示相應的第二本地文檔具有在用戶設備的地理位置的閾值距離內的特定地理位置,調整第一本地文檔的搜索分值以降級其在第一順序中的排名。該方面的其他實施例包括相應的系統(tǒng)、裝置和編碼在計算機存儲介質上的被配置為執(zhí)行方法的動作的計算機程序。
[0007]這些和其他實施例每個能夠可選地包括以下特征中的一個或多個。該方法能進一步包括響應于確定本地文檔的適當子集中的第一本地文檔符合降級操作,確定文檔集中的不是本地文檔的至少一個文檔具有滿足遠距離文檔降級閾值的搜索分值,并且作為響應,調整第一本地文檔的搜索分值以降級其在第一順序中的排名,使得相對于至少一個文檔的排名來降低第一本地文檔的排名。
[0008]調整第一本地文檔的搜索分值以降級其在第一順序中的排名,使得相對于至少一個文檔的排名來降低第一本地文檔的排名能包括:調整第一本地文檔的搜索分值來降級其在第一順序中的排名,使得至少一個文檔的排名大于第一本地文檔的排名。
[0009]確定至少部分地基于接近度量并且接近度量基于用戶設備的地理位置和對第一本地文檔指定的地理位置能包括:確定接近度量指示用戶設備的地理位置與對第一本地文檔指定的地理位置之間的距離超出最大距離。
[0010]確定至少部分地基于接近度量并且接近度量基于用戶設備的地理位置和對第一本地文檔指定的地理位置能夠包括:確定接近度量指示用戶設備的地理位置和對第一本地文檔指定的地理位置不在由政治性邊界限定的同一地區(qū)內。
[0011 ]搜索查詢能夠是不包括明確指定地理位置的位置短語的搜索查詢,以及指定搜索查詢的數(shù)據能夠包括是用于搜索查詢的本地意圖的度量的本地意圖度量。
[0012]確定本地文檔的適當子集中的第一本地文檔符合降級操作能夠進一步包括至少部分地基于滿足閾值的本地意圖度量來確定第一本地文檔符合降級。
[0013]指定搜索查詢的數(shù)據能夠包括作為用于搜索查詢的本地意圖的度量的本地意圖度量,并且調整第一本地文檔的搜索分值來降級其在第一順序中的排名使得相對于至少一個文檔的排名來降低第一本地文檔的排名能夠包括與搜索查詢的本地意圖度量成反比地調整第一本地文檔的搜索分值。
[0014]確定本地文檔的適當子集中的第一本地文檔符合降級操作能夠進一步包括僅在第一本地文檔具有不滿足遠距離文檔保持閾值的位置無關搜索分值分量的情況下第一本地文檔才符合降級。
[0015]能實現(xiàn)在本說明書中描述的主題的特定實施例以便實現(xiàn)以下優(yōu)點中的一個或多個。當確定一般搜索查詢?yōu)橛糜谔囟ㄓ脩粑恢玫谋镜赜行阉鞑樵?,并且特定用戶位置與和本地搜索結果相關聯(lián)的位置的距離滿足距離要求時,數(shù)據處理裝置能通過降級本地搜索結果,響應于接收隱含本地意圖的單個一般搜索查詢,提供更相關的搜索結果。然而,如果本地結果具有相對高的位置無關搜索分值,不降級用于遠處位置的本地結果,由此,不會因疏忽而降級另外的信息豐富的文檔。此外,如果沒有附近本地結果,或如果沒有具有相對高的位置無關搜索分值的其他結果,也不會降級用于遠處位置的本地結果。由此,如果其余文檔看起來不相關,將不降級用于遠處位置的本地文檔。
[0016]在附圖和下述描述中,將闡述在本說明書中描述的主題的一個或多個實施例的細節(jié)。從說明書、附圖和權利要求,該主題的其他特征、方面和優(yōu)點將變得顯而易見。
【附圖說明】
[0017]圖1是搜索系統(tǒng)提供本地搜索結果的示例性環(huán)境的框圖。
[0018]圖2是用于降級具有遠處位置的本地搜索結果的示例性過程的流程圖。
[0019]圖3是圖示基于查詢的本地意圖度量的降級分量的S形(sigmoid)的圖。
[0020]圖4是用于確定本地搜索結果是否是符合降級的本地搜索結果的示例性過程的流程圖。
[0021]各個圖中相同的參考數(shù)字和名稱指示相同的元素。
【具體實施方式】
[0022]處理搜索結果文檔集中的搜索結果來確定搜索結果文檔中的哪些(如果有的話)是本地搜索結果文檔。如果識別了本地搜索結果文檔,并且進一步識別為“遠距離”搜索結果文檔,則符合降級。當確定與本地搜索結果文檔相關聯(lián)的位置不滿足接近閾值時,本地搜索結果文檔為“遠距離”搜索結果文檔。例如,當本地搜索結果文檔的位置和用戶設備的位置在同一地理區(qū)域(例如同一州)內或在閾值距離(例如100英里)內時,滿足接近閾值。
[0023]當搜索查詢具有本地意圖,并且存在下述中的一個:a)具有在用戶設備的位置的閾值距離內的位置的另一本地搜索結果文檔;或b)不是本地搜索結果文檔并且具有足夠高的搜索分值的搜索結果文檔時,發(fā)生本地搜索結果文檔的降級。最后,如果其搜索分值的位置無關分量滿足保持閾值,則可以排除降級遠距離搜索結果文檔。在后一情況下,遠距離搜索結果文檔可能與查詢足夠相關,與位置無關,使得降級將不利于滿足用戶的信息需要。
[0024]下面更詳細地描述這些特征和另外的特征。
[0025]圖1是示例性環(huán)境100的框圖,其中,搜索系統(tǒng)110提供本地搜索結果。示例性環(huán)境100包括網絡102,諸如互聯(lián)網,并且連接發(fā)布者網站104、用戶設備106和搜索系統(tǒng)110。每一網站104是與域名相關聯(lián)并且由一個或多個服務器托管的一個或多個資源105的集合。示例性網站是以能夠包含文本、圖像、多媒體內容和編程元素(例如腳本)的超文本標記語言(HTML)格式化的網頁的集合。每一網站104由發(fā)布者(例如管理和/或擁有網站的實體)維護。
[0026]資源105是能夠在網絡102上由網站104提供并且與資源地址相關聯(lián)的任何數(shù)據。舉例來說,資源105包括HTML頁面、字處理文檔和可移植文檔格式(PDF)文檔、圖像、視頻和饋送源。資源能夠包括內容,例如詞、短語、圖像和聲音并且可以包括嵌入式信息(例如元信息和超鏈接)和/或嵌入式指令(例如腳本)。
[0027]用戶設備106是在用戶的控制下并且能夠通過網絡102請求和接收資源的電子設備。示例性用戶設備106包括個人計算機、移動通信設備和能夠通過網絡102發(fā)送和接收數(shù)據的其他設備。用戶設備106通常包括用戶應用,例如Web瀏覽器,來便于通過網絡102發(fā)送和接收數(shù)據。
[0028]為了便于搜索資源105,搜索系統(tǒng)110通過抓取和索引資