專利名稱:根據(jù)地理關(guān)聯(lián)索引文檔的制作方法
根據(jù)地理關(guān)聯(lián)索引文檔技術(shù)領(lǐng)域在此所述的實(shí)現(xiàn)涉及搜索引擎,以及更具體地說(shuō),涉及局部搜索 引擎能有效地檢索與地理區(qū)域相關(guān)的文檔的技術(shù)。
背景技術(shù):
萬(wàn)維網(wǎng)("Web")包含大量信息。然而,定位信息的所需部分 是困難的。由于環(huán)球網(wǎng)上的信息量以及環(huán)球網(wǎng)搜索不熟練的新用戶的 數(shù)量日益快速增加,使這一問(wèn)題更加復(fù)雜。搜索引擎試圖返回指向用戶感興趣網(wǎng)頁(yè)的超鏈接。通常,搜索引 擎根據(jù)用戶輸入的搜索詞語(yǔ)(稱為搜索查詢)來(lái)確定用戶的興趣。搜 索引擎的目標(biāo)是基于搜索查詢向用戶提供高質(zhì)量的相關(guān)結(jié)果(例如, 網(wǎng)頁(yè))。通常,搜索査詢通過(guò)將搜索査詢中的詞語(yǔ)與預(yù)先存儲(chǔ)的網(wǎng)頁(yè) 語(yǔ)料庫(kù)相匹配來(lái)實(shí)現(xiàn)這一目標(biāo)。包含用戶搜索詞語(yǔ)的網(wǎng)頁(yè)是"命中頁(yè)" 并作為鏈接返回給用戶。為了提高返回給用戶的網(wǎng)頁(yè)的相關(guān)性和質(zhì)量,搜索引擎可能嘗試 排序命中頁(yè)的列表,使得最相關(guān)和/或最高質(zhì)量的頁(yè)位于返回給用戶的 命中頁(yè)列表的最上部。例如,搜索引擎可以對(duì)每一命中頁(yè)指定等級(jí)或 分值,其中,將分值設(shè)計(jì)成對(duì)應(yīng)于網(wǎng)頁(yè)的相關(guān)性或重要性。局部搜索引擎是嘗試返回在指定地理區(qū)域內(nèi)的相關(guān)網(wǎng)頁(yè)和/或企 業(yè)登記信息的搜索引擎。對(duì)局部搜索,用戶可以輸入搜索查詢并指定 將執(zhí)行搜索査詢的地理區(qū)域。局部搜索引擎可以向用戶返回相關(guān)結(jié)果, 諸如屬于該該地理區(qū)域的相關(guān)網(wǎng)頁(yè)或該地理區(qū)域中的企業(yè)登記信息。 對(duì)于一些局部搜索引擎,感興趣的局部地理區(qū)域是由離起始位置 特定距離或半徑范圍內(nèi)地區(qū)域,諸如離郵政編碼區(qū)或街道地址幾英里 限定的區(qū)域。理想地,局部搜索引擎應(yīng)當(dāng)有效地定位和返回在期望地 理區(qū)域中的相關(guān)結(jié)果。發(fā)明內(nèi)容本發(fā)明的一個(gè)方面是針對(duì)索引文檔的方法。該方法包括確定與文 檔相關(guān)的位置,確定環(huán)繞與該文檔有關(guān)的該位置的位置集,以及索引該文檔使得包括對(duì)該位置和位置集的引用(reference)。本發(fā)明的另一方面針對(duì)索引文檔的另一方法。該方法包括識(shí)別與 第一地理區(qū)域有關(guān)的文檔,確定環(huán)繞第一地理區(qū)域的地理區(qū)域集,將 對(duì)第一地理區(qū)域和地理區(qū)域集的引用與文檔關(guān)聯(lián),以及利用相關(guān)的引 用索引該文檔。本發(fā)明的另一方面針對(duì)執(zhí)行搜索的方法。該方法包括接收與地理 區(qū)域有關(guān)的搜索查詢,確定與地理區(qū)域有關(guān)的位置標(biāo)識(shí)符,以及基于 搜索查詢和位置標(biāo)識(shí)符與文檔索引的比較,執(zhí)行與該搜索査詢有關(guān)的 文檔的搜索。
包含并構(gòu)成該說(shuō)明書的一部分的附圖示例說(shuō)明本發(fā)明的實(shí)施例, 并結(jié)合該說(shuō)明書說(shuō)明本發(fā)明。在圖中圖1是可以實(shí)現(xiàn)符合本發(fā)明的原理的系統(tǒng)和方法的網(wǎng)絡(luò)的示例圖;圖2是圖1所示的客戶機(jī)或服務(wù)器的示例圖; 圖3A和3B是示例說(shuō)明分層三角網(wǎng)格(HTM)的圖; 圖4是示例說(shuō)明符合用于索引具有地理相關(guān)性的文檔的本發(fā)明的 方面的示例性操作的流程圖;圖5是示例說(shuō)明圖4所示的操作的圖6A和6B示例說(shuō)明具有地理相關(guān)性的示例性文檔。圖7是示例說(shuō)明具有地理相關(guān)性的另一示例性文檔的圖。圖8是示例說(shuō)明根據(jù)符合本發(fā)明各方面的實(shí)現(xiàn),在處理局部搜索査詢中的搜索引擎的示例性操作的流程圖;圖9是示例說(shuō)明在根據(jù)符合本發(fā)明各方面的另一實(shí)現(xiàn),處理局部搜索查詢中的搜索引擎的示例性操作的流程圖;圖10是用來(lái)示例說(shuō)明圖9所示的動(dòng)作的示例性HTM網(wǎng)格(grid)的圖;以及圖11和12是可以呈現(xiàn)給用戶的局部搜索用戶界面的示例圖。
具體實(shí)施方式
本發(fā)明的下文的詳細(xì)描述參考附圖。詳細(xì)描述不限制本發(fā)明。 概述局部搜索引擎可以對(duì)局部搜索查詢生成限制到期望地理區(qū)域的結(jié) 果。例如可以通過(guò)距指定點(diǎn)或地區(qū)的某一距離(例如20英里)限定地 理區(qū)域。通過(guò)基于文檔的內(nèi)容以及基于多個(gè)位置標(biāo)識(shí)符來(lái)索引地理相 關(guān)文檔,從而有效地生成搜索結(jié)果。在一個(gè)實(shí)現(xiàn)中,位置標(biāo)識(shí)符定義 規(guī)則間隔的地理區(qū)域,并且索引文檔以使得選擇對(duì)每一文檔索引的多 個(gè)位置標(biāo)識(shí)符,從而定義與該文檔有關(guān)的區(qū)域周圍的預(yù)定范圍。這種 文檔索引技術(shù)允許按地理區(qū)域有效地搜索。示例性網(wǎng)絡(luò)概述圖1是可以實(shí)現(xiàn)與本發(fā)明的原理一致的系統(tǒng)和方法的網(wǎng)絡(luò)100的 示例圖。網(wǎng)絡(luò)100可以包括經(jīng)網(wǎng)絡(luò)140,連接到服務(wù)器120的客戶機(jī) 110。網(wǎng)絡(luò)140可以包括局域網(wǎng)(LAN)、廣域網(wǎng)(WAN)、電話網(wǎng)絡(luò), 諸如公用交換電話網(wǎng)(PSTN)、內(nèi)聯(lián)網(wǎng)、互聯(lián)網(wǎng)或網(wǎng)絡(luò)的組合。為簡(jiǎn) 化起見,將兩個(gè)客戶機(jī)IIO和一個(gè)服務(wù)器120示例為連接到網(wǎng)絡(luò)140。 實(shí)際上,可以有更多客戶機(jī)和/或服務(wù)器。同時(shí),在一些實(shí)例中,客戶 機(jī)可以執(zhí)行服務(wù)器的功能以及服務(wù)器可以執(zhí)行客戶機(jī)的功能。客戶機(jī)U0可以包括設(shè)備,諸如無(wú)線電話、個(gè)人計(jì)算機(jī)、個(gè)人數(shù)字助理(PDA)、膝上型計(jì)算機(jī)或另一類型的計(jì)算或通信設(shè)備、在這 些設(shè)備的一個(gè)上運(yùn)行的線程或進(jìn)程和/或可由這些設(shè)備的一個(gè)執(zhí)行的對(duì) 象。服務(wù)器120可以包括處理、搜索和/或維護(hù)文檔的服務(wù)器設(shè)備???戶機(jī)IIO和服務(wù)器120可以經(jīng)有線、無(wú)線或光學(xué)連接,連接到網(wǎng)絡(luò)140。服務(wù)器120可以包括可由客戶機(jī)110使用的搜索引擎125。搜索 引擎125可以是基于査詢的文檔搜索引擎??梢詫⑺阉饕?25特別 地設(shè)計(jì)成返回地理區(qū)域局部的結(jié)果。搜索引擎125可以基于在數(shù)據(jù)庫(kù) 135中存儲(chǔ)的文檔來(lái)響應(yīng)用戶搜索査詢。在數(shù)據(jù)庫(kù)135中存儲(chǔ)的文檔通 ??梢园ù_定為與特定地理區(qū)域有關(guān)的文檔。這些文檔可以包括例 如位于特定地址的企業(yè)的企業(yè)登記信息或以某些方式與地理區(qū)域有關(guān) 的Web文檔(例如,提供局部餐館評(píng)論的Web文檔)。文檔(document),作為在此所使用的詞語(yǔ),廣義地解釋為包括 任何機(jī)器可讀和機(jī)器可存儲(chǔ)工作產(chǎn)品。文檔可以是電子郵件、企業(yè)登 記信息、Web站點(diǎn)、文件、文件組合、嵌有至其他文件的鏈接的一個(gè) 或多個(gè)文件、新聞組帖子等等。在互聯(lián)網(wǎng)的環(huán)境下,常見文檔是網(wǎng)頁(yè)。 網(wǎng)頁(yè)通常包括內(nèi)容以及可以包括嵌入信息(諸如元信息、超級(jí)鏈接等 等)和/或嵌入指令(諸如Javascript等等)。示例性客戶機(jī)/服務(wù)器體系結(jié)構(gòu)圖2是根據(jù)與本發(fā)明的原理一致的實(shí)現(xiàn)、稱為計(jì)算設(shè)備200的客 戶機(jī)100或服務(wù)器120的示例圖。計(jì)算設(shè)備200可以包括總線210、處 理器220、主存儲(chǔ)器230、只讀存儲(chǔ)器(ROM) 240、存儲(chǔ)設(shè)備250、 輸入設(shè)備260、輸出設(shè)備270和通信接口 280。總線210可以包括允許 計(jì)算設(shè)備200的部件間的通信的路徑。處理器220可以包括可以解釋和執(zhí)行指令的任何類型的傳統(tǒng)處理
器、微處理器或處理邏輯。主存儲(chǔ)器230可以包括隨機(jī)存取存儲(chǔ)器(RAM)或存儲(chǔ)用于由處理器220執(zhí)行的信息和指令的另一類型的動(dòng) 態(tài)存儲(chǔ)設(shè)備。ROM 240可以包括傳統(tǒng)的ROM設(shè)備或存儲(chǔ)由處理器220 使用的靜態(tài)信息和指令的另一類型的靜態(tài)存儲(chǔ)設(shè)備。存儲(chǔ)設(shè)備250可 以包括磁性和/或光記錄介質(zhì)及其相應(yīng)的驅(qū)動(dòng)器。輸入設(shè)備260可以包括允許用戶將信息輸入到計(jì)算設(shè)備200的傳 統(tǒng)機(jī)制,諸如鍵盤、鼠標(biāo)、輸入筆、語(yǔ)音識(shí)別和/或生物識(shí)別機(jī)制等等。 輸出設(shè)備270可以包括將信息輸出給用戶的傳統(tǒng)的機(jī)制,包括顯示器、 打印機(jī)、揚(yáng)聲器等等。通信接口 280可以包括允許計(jì)算設(shè)備200與其 他設(shè)備和/或系統(tǒng)通信的任何收發(fā)信機(jī)型機(jī)制。例如,通信接口 280可 以包括用于經(jīng)網(wǎng)絡(luò),諸如網(wǎng)絡(luò)140與另一設(shè)備或系統(tǒng)通信的機(jī)制。搜索引擎125可以存儲(chǔ)在計(jì)算機(jī)可讀介質(zhì),諸如存儲(chǔ)器230中。 計(jì)算機(jī)可讀介質(zhì)可以定義為一個(gè)或多個(gè)物理或邏輯存儲(chǔ)器設(shè)備和/或載 波。定義搜索引擎125的軟件指令可以從另一計(jì)算機(jī)可讀介質(zhì)(諸如 存儲(chǔ)器設(shè)備250),或經(jīng)通信接口 280,從另一設(shè)備讀入存儲(chǔ)器230。 包含在存儲(chǔ)器230中的軟件指令使處理器220執(zhí)行稍后所述的過(guò)程。 另外,代替和/或組合軟件指令,可以使用硬布線電路以便實(shí)現(xiàn)與本發(fā) 明一致的過(guò)程。因此,與本發(fā)明的原理一致的實(shí)現(xiàn)可以不限于硬件電 路和軟件的任何特定組合。位置標(biāo)識(shí)符數(shù)據(jù)庫(kù)135中的文檔可以分別與地理區(qū)域關(guān)聯(lián)。地理區(qū)域可以由 與該文檔相關(guān)聯(lián)的位置標(biāo)識(shí)符指定。在一種實(shí)現(xiàn)中,使用分層網(wǎng)絡(luò), 諸如非常公知的分層三角網(wǎng)格(HTM)模型,從地表的模型導(dǎo)出位置 標(biāo)識(shí)符。為讀者方便,現(xiàn)在簡(jiǎn)單地描述HTM模型。分層三角網(wǎng)格(HTM)是將球體,諸如地球的表面劃分成球面三 角的劃分方案。這種分層方案和細(xì)分不是精確、而是粗略的等面積。
圖3A是示例說(shuō)明將球體300 (例如地表)初始細(xì)分成八個(gè)區(qū)并標(biāo)識(shí)為 區(qū)域NO, Nl, N2, N3和S0, Sl, S2, S3的圖示。在圖3A中,僅標(biāo) 記區(qū)域NO, Nl, S0和S1。其他區(qū)域?qū)?yīng)于球體的"后半部分"。這 些細(xì)分是八個(gè)最大的等大小的球面三角形。通過(guò)連接相鄰邊的邊中點(diǎn), 每一細(xì)分可以進(jìn)一步細(xì)分成三角形。圖3B是示例說(shuō)明下一細(xì)分等級(jí)的 圖。如圖3B所示,細(xì)分NO進(jìn)一步細(xì)分成四個(gè)細(xì)分,標(biāo)記為細(xì)分NOO、 NOl、 N02和N03。盡管通過(guò)球體上的弧實(shí)際形成每一細(xì)分,為簡(jiǎn)化起 見,圖3B中的細(xì)分示為三角形的線段。隨著細(xì)分的尺度減小,每一細(xì) 分將在形狀方面更接近三角形。細(xì)分克看作具有八個(gè)根節(jié)點(diǎn)(NO, Nl, N2, N3, SO, Sl, S2和 S3)的樹結(jié)構(gòu)中的子節(jié)點(diǎn),以及其中,每一根節(jié)點(diǎn)可以具有四個(gè)子節(jié) 點(diǎn)。細(xì)分可以持續(xù)到任何等級(jí)。在所示的命名方案中,對(duì)每一后續(xù)級(jí), 通過(guò)將另外的字符添加到細(xì)分標(biāo)簽上來(lái)命名細(xì)分。例如,假定節(jié)點(diǎn) N201102。其中N2是指根名,以及五個(gè)后繼的數(shù)字(01102)表示在每 一級(jí)選擇哪一三角形。這些細(xì)分標(biāo)簽可以用作數(shù)據(jù)庫(kù)135中與地理相 關(guān)文檔有關(guān)的位置標(biāo)識(shí)符。本領(lǐng)域的普通技術(shù)人員知道,不同于HTM的地球表面建模技術(shù), 或HTM的不同實(shí)現(xiàn)克用來(lái)實(shí)現(xiàn)數(shù)據(jù)庫(kù)135中存儲(chǔ)的位置標(biāo)識(shí)符。例如, 能另外使用的其他可能的細(xì)分建模技術(shù)包括HEALPix (分層等面積同 緯度像素化)、C-Keys、 UTM (通用橫軸墨卡托)和其他各種區(qū)域網(wǎng) 格(諸如英國(guó)國(guó)家網(wǎng)格)。數(shù)據(jù)庫(kù)135的索引圖4是符合本發(fā)明各方面的用于索引具有地理相關(guān)性的文檔示例 性操作的流程圖。如所述,數(shù)據(jù)庫(kù)135可以包括文檔的索引,諸如地理相關(guān)Web文 檔和企業(yè)登記信息。索引可以是在文檔中找到的詞語(yǔ)的索引以及可以 形成為倒排索引結(jié)構(gòu),用來(lái)對(duì)每一詞語(yǔ)存儲(chǔ)包含該詞語(yǔ)的所有文檔的 列表??梢宰R(shí)別地理相關(guān)文檔(動(dòng)作401)。地理相關(guān)文檔,如在此所 使用的,通常是指以某些方式被確定為與地理位置有特定關(guān)聯(lián)的任何 文檔。例如,企業(yè)登記信息,諸如黃頁(yè)登記信息,可以分別視為與由企業(yè)的地址定義的地理區(qū)域有關(guān)的地理相關(guān)文檔。其他文檔,諸如Web文檔可以具有特定地理相關(guān)性。例如,企業(yè)可以具有主頁(yè),可以是談 論或評(píng)論該企業(yè)的文檔的主題,或可以由按一些其他方式與企業(yè)關(guān)聯(lián) 的網(wǎng)頁(yè)提及。以各種方式,諸如由郵政地址或由其他地理信號(hào)確定文 檔有關(guān)的特定地理位置。接著,與地理相關(guān)文檔有關(guān)的地理區(qū)域可以映射到其相應(yīng)的位置標(biāo)識(shí)符(動(dòng)作402)。換句話說(shuō),確定與該文檔有關(guān)的HTM標(biāo)識(shí)符(例 如N201102)。可以在例如將郵政地址位置(或緯度/經(jīng)度特定位置) 與適當(dāng)?shù)腍TM標(biāo)識(shí)符對(duì)應(yīng)的預(yù)定査找表中查找文檔的郵政地址或緯度 /經(jīng)度位置,執(zhí)行該映射??梢源_定用于該文檔的另外的位置標(biāo)識(shí)符。特別地,也可以確定 預(yù)定范圍內(nèi)對(duì)應(yīng)于周圍區(qū)域的位置標(biāo)識(shí)符(動(dòng)作403)。圖5是示例說(shuō) 明動(dòng)作403的示例性實(shí)現(xiàn)的圖。在該例子中,假定將預(yù)定范圍選擇為1 英里,由圓圈530所示。網(wǎng)格500表示在特定網(wǎng)格級(jí),諸如每一三角 區(qū)表示HTM網(wǎng)格中近似1平方英里的網(wǎng)格級(jí)的一部分。假定文檔與三 角地理區(qū)域510內(nèi)的企業(yè)505有關(guān)。如由圓圈530所示,區(qū)域520-1 至520-12至少部分落在區(qū)域510的一英里范圍內(nèi)。因此,在區(qū)域510 的中心的約一英里內(nèi)的地理區(qū)域包括由各區(qū)域510和520限定的地理 區(qū)域(在圖5中用粗體表示)。返回到圖4,搜索引擎125可以索引每一地理相關(guān)文檔,就象該 文檔包括與該文檔的區(qū)域和在動(dòng)作403中識(shí)別的周圍區(qū)域的位置標(biāo)識(shí)
符(動(dòng)作404)。在圖5的例子中,例如,可以索引文檔以使得用于所 有區(qū)域510和520-1至520-12的HTM標(biāo)識(shí)符包括在該文檔的索引中。 在一種實(shí)現(xiàn)中,位置標(biāo)識(shí)符可以與用來(lái)指示它們不是原始文檔文本的 一部分的數(shù)據(jù)庫(kù)135中的特定標(biāo)簽相關(guān)聯(lián)。圖6A和6B是示例說(shuō)明克使用圖4所示的操作在數(shù)據(jù)庫(kù)135中進(jìn) 行索引的示例性文檔的圖。圖6A示例說(shuō)明用于假想的餐館"Gino's Pizza"的企業(yè)登記信息605。搜索引擎125可以索引文檔605的文本以 及位置標(biāo)識(shí)符,還可以索引與該文檔有關(guān)的其他信息。在該例子中, 可以通過(guò)該文檔索引類別信息610和位置標(biāo)識(shí)符615。第一位置標(biāo)識(shí)符, HTM區(qū)域N201301可以指Gino,s Pizza所位于的特定地理區(qū)域(例如 圖5的例子中的區(qū)域510),而其余位置標(biāo)識(shí)符可以指N201301周圍 的地理區(qū)域(例如圖5的例子中的各區(qū)域520)。圖6B示例說(shuō)明包括Ginp's Pizza的評(píng)論的假想網(wǎng)頁(yè)620。網(wǎng)頁(yè)620 可以被確定為地理相關(guān)的,因?yàn)樗饕c特定地理位置的企業(yè)有關(guān)。 因此,網(wǎng)頁(yè)620也可以與Gino,s Pizza相同的地理區(qū)域關(guān)聯(lián)。因此,按 照與企業(yè)登記信息605關(guān)聯(lián)并由其索引的位置標(biāo)識(shí)符615類似的方式, 位置標(biāo)識(shí)符625可以與網(wǎng)頁(yè)620關(guān)聯(lián)并由其索引,從而可以將多個(gè)位 置標(biāo)識(shí)符與文檔620關(guān)聯(lián)。為便于說(shuō)明,圖5、 6A和6B所示的示例性HTM區(qū)域指第五級(jí)子 節(jié)點(diǎn)。實(shí)際上,指適合于提供局部搜索結(jié)果的區(qū)域的HTM區(qū)域?qū)A向 于處于更低節(jié)點(diǎn)級(jí)。圖7是示例說(shuō)明使用圖4所示的操作來(lái)索引另一示例性文檔的圖。 除了不是僅使用一個(gè)集合而是確定對(duì)應(yīng)于兩個(gè)不同預(yù)定范圍的兩個(gè)位 置標(biāo)識(shí)符集,圖7的文檔與圖6的文檔是相同的。在該例子中,位置 標(biāo)識(shí)符710可以是當(dāng)預(yù)定范圍為1英里時(shí)確定的位置標(biāo)識(shí)符的集合。 可以基于用于預(yù)定范圍的另一值,諸如五英里,選擇被標(biāo)記為位置標(biāo)識(shí)符720的位置標(biāo)識(shí)符的第二集合。因此,存在除710外的更多位置 標(biāo)識(shí)符720,并且位置標(biāo)識(shí)符710是位置標(biāo)識(shí)符720的子集??梢酝ㄟ^(guò) 該文檔獨(dú)立地索引兩個(gè)位置標(biāo)識(shí)符的集合。在一種實(shí)現(xiàn)中,在索引期間,通過(guò)將標(biāo)簽追加到兩個(gè)位置標(biāo)識(shí)符 的集合,可以相互區(qū)分集合710和720中的位置標(biāo)識(shí)符。在該例子中, 標(biāo)簽追加到位置標(biāo)識(shí)符710來(lái)表示它們對(duì)應(yīng)于1英里標(biāo)識(shí)符以及 將標(biāo)簽":5"追加到位置標(biāo)識(shí)符720來(lái)表示它們對(duì)應(yīng)于五英里標(biāo)識(shí)符。搜索引擎的操作圖8是示例說(shuō)明在處理局部搜索查詢中,搜索引擎125的示例性 操作的流程圖。搜索引擎125可以從用戶接收搜索査詢(動(dòng)作801)。 搜索查詢可以是局部査詢以及可以與地理區(qū)域有關(guān)。例如,用戶可以 搜索"咖啡店"并指定位置是"Poughkeepsie,NY"區(qū)域。搜索引擎125 可以將由用戶輸入的區(qū)域轉(zhuǎn)換成具有當(dāng)創(chuàng)建在數(shù)據(jù)庫(kù)135中存儲(chǔ)的文 檔索引時(shí)使用的位置標(biāo)識(shí)符格式的一個(gè)或多個(gè)位置標(biāo)識(shí)符(例如HTM 標(biāo)識(shí)符)。接著,位置標(biāo)識(shí)符可以追加到搜索查詢(動(dòng)作802)。例如, 如果搜索查詢是"咖啡店"以及將相應(yīng)的位置標(biāo)識(shí)符確定為N03013, 修改的搜索査詢可以是"咖啡店N03013"。在基于不同預(yù)定范圍識(shí)別 不同位置標(biāo)識(shí)符集的實(shí)現(xiàn)中,修改的搜索查詢可以包括對(duì)應(yīng)于將搜索 的范圍的位置標(biāo)識(shí)符。例如,修改的搜索查詢"咖啡店N03013: 5" 可以用于五英里半徑內(nèi)的局部搜索。然后,以傳統(tǒng)的方式,可以使用修改的搜索查詢來(lái)獲得搜索結(jié)果 (動(dòng)作803)。例如,搜索引擎125可以從包含搜索査詢中詞語(yǔ)的文檔 索引識(shí)別文檔?;蛘?,搜索引擎125可以識(shí)別包含搜索詞語(yǔ)的同義詞 的文檔。因?yàn)樾薷牡乃阉鞑樵儼▽?duì)應(yīng)于搜索區(qū)中心的位置標(biāo)識(shí)符, 并且索引地理相關(guān)文檔以包括在預(yù)定范圍內(nèi)的所有區(qū)域的位置標(biāo)識(shí) 符,搜索結(jié)果將限于預(yù)定搜索范圍內(nèi)的文檔。因此,對(duì)示例性搜索"咖 啡店N03013: 5",搜索結(jié)果將是Poughkeepsie,NY的五英里內(nèi)、與咖
啡店有關(guān)的文檔,諸如咖啡店企業(yè)登記信息。然后,可以將在動(dòng)作803中獲得的搜索結(jié)果返回到用戶(動(dòng)作804)。在一個(gè)實(shí)現(xiàn)中,該結(jié)果可以顯示為與用戶查詢有關(guān)的企業(yè)登記信息的排名的列表。每一登記信息可以包含信息,諸如用于與企業(yè)登 記信息有關(guān)的企業(yè)的地址信息、該企業(yè)的電話號(hào)碼、企業(yè)更多信息的鏈接、企業(yè)方位的鏈接和/或一個(gè)或多個(gè)提及該企業(yè)的Web文檔的鏈接。圖9是示例說(shuō)明當(dāng)所選擇的搜索范圍與預(yù)定索引范圍不匹配時(shí), 在處理局部搜索查詢中,搜索引擎125的示例性操作的流程圖。搜索 引擎125可以從用戶接收搜索查詢(動(dòng)作901)。搜索查詢可以是局部 搜索,以及可以與地理區(qū)域有關(guān),以及包括用戶想搜索的范圍的表示。 例如,用戶可以搜索"咖啡店",指定其位置是"Poughkeepsie,NY" 區(qū),以及指定用戶希望三英里的搜索半徑。假定由用戶選擇的三英里搜索范圍不是數(shù)據(jù)庫(kù)135中特有索引的 范圍??梢源_定最接近但不是大于用戶所選擇范圍的預(yù)索引范圍(動(dòng) 作902)。假定在該例子中,最接近預(yù)索引范圍為l英里。即,將位置 標(biāo)識(shí)符集合添加到用于1英里范圍的索引。接著,搜索引擎125可以 定位在與該搜索有關(guān)的地理區(qū)域的二英里(三英里-一英里)內(nèi)的區(qū)域 集(動(dòng)作903)。圖10是示例說(shuō)明動(dòng)作902和903的示例性HTM網(wǎng)格 1000的圖。假定區(qū)域1010是與該搜索有關(guān)的區(qū)域,內(nèi)虛線圈表示一英 里半徑,以及外虛線圈表示兩英里半徑。因此,對(duì)該例子,在動(dòng)作903 中,搜索引擎125可以定位包括在外圈內(nèi)的區(qū)域集。然后,可以通過(guò)把在動(dòng)作903中識(shí)別的位置標(biāo)識(shí)符追加到搜索査 詢,作為邏輯OR操作,以此修改搜索査詢(動(dòng)作904)。在上述例子 中,其中,初始搜索查詢是"咖啡店",修改的搜索查詢可以是"咖 啡店"加上對(duì)應(yīng)于落在圖IO中的外虛線圈內(nèi)的三角形區(qū)域的所有位置 標(biāo)識(shí)符的邏輯OR列表。然后,使用該修改的搜索查詢,將搜索查詢應(yīng)
用于在動(dòng)作902中確定的預(yù)索引位置標(biāo)識(shí)符的傳統(tǒng)的方式獲得搜索結(jié)果(動(dòng)作905)。由此,可以將上述"咖啡店"搜索應(yīng)用于一英里預(yù)索引位置標(biāo)識(shí)符。然后,將在動(dòng)作905中獲得的搜索結(jié)果返回到用戶(動(dòng)作906)。 在一種實(shí)現(xiàn)中,可以將該結(jié)果顯示為與用戶查詢有關(guān)的企業(yè)登記信息 的排名列表。作為圖9所示的技術(shù)的另一可能變形,代替具有多個(gè)位置標(biāo)識(shí)符 的預(yù)索引文檔,可以僅通過(guò)與文檔有關(guān)的位置標(biāo)識(shí)符來(lái)索引每一文檔。 然后,如在動(dòng)作903中執(zhí)行的,可以規(guī)范化搜索査詢,其中,該范圍 在整個(gè)搜索區(qū)內(nèi)。即,該搜索可以包括搜索范圍內(nèi)的所有位置標(biāo)識(shí)符 的邏輯OR連接。這種變形減少索引大小以及可以允許在査詢時(shí),更靈 活選擇區(qū)域大小和形狀,但增加?xùn)嗽儚?fù)雜度。示例性用戶界面圖11和12是根據(jù)符合本發(fā)明的原理的實(shí)現(xiàn)可以呈現(xiàn)給用戶的局 部搜索用戶界面的示例圖。如圖ll所示,可以呈現(xiàn)與局部搜索有關(guān)的 用戶界面。局部搜索用戶界面可以允許用戶搜索特定位置的企業(yè)登記 信息。為幫助用戶搜索,用戶界面可以提供"What"字段和"Where" 字段。例如,用戶可以在"What"字段中輸入企業(yè)名稱(例如"Pizza Hut") 或企業(yè)類型(例如Pizza餐館)。用戶可以在"Where"字段中輸入位 置名稱(例如Albany,NY)。假定該例子,用戶在該用戶界面的What 字段中輸入"孕婦裝"以及在Where字段中輸入"Fairfax,VA"。用上述方式,搜索引擎125可以基于搜索詞語(yǔ)"孕婦裝"和 "Fairfax,VA"執(zhí)行搜索以便識(shí)別與涉及"Fairfax,VA"位置中的搜索 詞語(yǔ)"孕婦裝"有關(guān)的企業(yè)有關(guān)的文檔以及在搜索結(jié)果的列表中包括 所識(shí)別的文檔??梢詮呐c特定地理區(qū)域,諸如離在"Where"字段中輸 入的位置的估計(jì)中心15英里的默認(rèn)區(qū)域有關(guān)的文檔選擇所識(shí)別的文檔。如圖12進(jìn)一步所示,局部搜索用戶界面可以向用戶呈現(xiàn)搜索結(jié)果。用戶可以通過(guò)從范圍1205選擇不同搜索范圍,修改所搜索的區(qū)域。選擇不同范圍可以導(dǎo)致使用被選范圍執(zhí)行另一搜索。 結(jié)論局部搜索引擎通過(guò)對(duì)每一文檔索引共同定義總的地理區(qū)域的多個(gè) 位置標(biāo)識(shí)符,有效地索引與地理區(qū)域有關(guān)的文檔。當(dāng)使用該索引來(lái)響 應(yīng)單個(gè)搜索査詢時(shí),可以僅通過(guò)將位置標(biāo)識(shí)符添加到搜索査詢,可有 效地搜索總的地理區(qū)域。對(duì)于本領(lǐng)域的普通技術(shù)人員而言,很顯然,如上所述,在圖中所 示的實(shí)現(xiàn)中,本發(fā)明可以用軟件、固件、硬件的許多不同形式實(shí)現(xiàn)。 用來(lái)實(shí)現(xiàn)符合本發(fā)明各方面的實(shí)際軟件代碼或?qū)S每刂朴布幌拗票?發(fā)明。因此,在沒(méi)有提及專用軟件代碼的情況下,描述這些方面的操 作和屬性-應(yīng)理解到本領(lǐng)域的普通技術(shù)人員能根據(jù)在此的描述,設(shè)計(jì)軟 件和控制硬件來(lái)實(shí)現(xiàn)這些方面。本發(fā)明的優(yōu)選實(shí)施例的上述描述提供示例說(shuō)明和描述,但不意在 窮舉或?qū)⒈景l(fā)明限制到在此公開的具體形式。根據(jù)上述教導(dǎo)的啟示,改進(jìn)和改型是可能的,或可以從本發(fā)明的實(shí)施中獲得改進(jìn)和改型。例如,盡管按特定順序描述了上述許多操作,但可以同時(shí)或以不同順序執(zhí)行許多操作。另外,本發(fā)明的某些部分描述為執(zhí)行一個(gè)或多個(gè)功能的"引擎"。 引擎可以包括硬件,諸如專用集成電路或現(xiàn)場(chǎng)可編程門陣列、軟件或 硬件和軟件的組合。不應(yīng)當(dāng)將本申請(qǐng)中的元件、動(dòng)作或指令視為本發(fā)明的關(guān)鍵或必要特征,除非明確地那樣描述。同時(shí),如在此所使用的,不加數(shù)量限制 的項(xiàng)表示一個(gè)或多個(gè)項(xiàng)。在僅期望一項(xiàng)的情況下,使用詞語(yǔ)"一個(gè)" 或類似的語(yǔ)言。另外,短語(yǔ)"基于"意圖是指"至少部分基于",除 非明確地表述。本發(fā)明的范圍由權(quán)利要求及其等效描述限定。
權(quán)利要求
1.一種用于索引文檔的方法,包括確定與該文檔相關(guān)聯(lián)的位置;確定在與該文檔相關(guān)聯(lián)的該位置周圍的多個(gè)位置;以及索引該文檔使得包括對(duì)所述位置和該位置周圍的所述多個(gè)位置的引用。
2. 如權(quán)利要求l所述的方法,其中,通過(guò)定義網(wǎng)格中地理區(qū)域的 位置標(biāo)識(shí)符來(lái)指定對(duì)所述位置和該位置周圍的所述多個(gè)位置的引用。
3. 如權(quán)利要求2所述的方法, 層三角網(wǎng)格中的節(jié)點(diǎn)的標(biāo)簽。
4. 如權(quán)利要求l所述的方法,
5. 如權(quán)利要求l所述的方法, 文檔。其中,所述位置標(biāo)識(shí)符包括用于分其中,所述文檔是企業(yè)登記信息。 其中,所述文檔是地理相關(guān)性網(wǎng)頁(yè)
6. 如權(quán)利要求l所述的方法,其中,在所述位置周圍的所述多個(gè) 位置包括在與該文檔相關(guān)聯(lián)的該位置的預(yù)定距離范圍內(nèi)的地理區(qū)域。
7. 如權(quán)利要求l所述的方法,其中,通過(guò)位置標(biāo)識(shí)符引用在該位 置周圍的所述多個(gè)位置,該方法進(jìn)一步包括-確定多個(gè)位置標(biāo)識(shí)符集,每一所述集與不同大小的地理區(qū)域相關(guān)聯(lián)。
8. —種搜索引擎,包括用于存儲(chǔ)文檔索引的裝置;用于確定與文檔相關(guān)聯(lián)的位置的裝置; 用于確定在與該文檔相關(guān)聯(lián)的該位置周圍的多個(gè)位置的裝置;以及用于索引該文檔以使得在該文檔索引中包括對(duì)所述位置和所述多 個(gè)位置的引用的裝置。
9. 一種用于索引文檔的方法,包括 識(shí)別具有與第一地理區(qū)域的相關(guān)性的文檔; 確定在該第一地理區(qū)域周圍的地理區(qū)域集;以及 將對(duì)所述第一地理區(qū)域和所述地理區(qū)域集的引用與該文檔相關(guān)聯(lián);以及利用所述相關(guān)聯(lián)的引用來(lái)索引文檔。
10. 如權(quán)利要求9所述的方法,進(jìn)一步包括 把對(duì)所述第一地理區(qū)域和所述地理區(qū)域集的引用確定為對(duì)應(yīng)于分層三角網(wǎng)格中的節(jié)點(diǎn)的位置標(biāo)識(shí)符。
11. 如權(quán)利要求9所述的方法,進(jìn)一步包括 把在該第一地理區(qū)域周圍的地理區(qū)域集確定為該第一地理區(qū)域的預(yù)定范圍內(nèi)的所述地理區(qū)域集。
12. 如權(quán)利要求ll所述的方法,進(jìn)一步包括把在該第一地理區(qū)域周圍的第二地理區(qū)域集確定為該第一地理區(qū) 域的第二預(yù)定范圍內(nèi)的所述地理區(qū)域集。
13. 如權(quán)利要求12所述的方法,進(jìn)一步包括 把對(duì)所述第二地理區(qū)域集的引用與該文檔相關(guān)聯(lián)。
14. 如權(quán)利要求9所述的方法,進(jìn)一步包括通過(guò)將所述引用插入索引中來(lái)索引該文檔,就象所述引用是該文 檔中的詞語(yǔ)一樣。
15. 如權(quán)利要求9所述的方法,其中,該文檔是企業(yè)登記信息。
16. 如權(quán)利要求9所述的方法,其中,該文檔是地理相關(guān)網(wǎng)頁(yè)文檔。
17. —種計(jì)算機(jī)可讀介質(zhì),包含由處理器執(zhí)行的編程指令,該計(jì) 算機(jī)可讀介質(zhì)包括用于識(shí)別具有與第一地理區(qū)域的相關(guān)性的文檔的編程指令; 用于確定在該第一地理區(qū)域周圍的地理區(qū)域集的編程指令;以及 用于把對(duì)該第一地理區(qū)域和該地理區(qū)域集的引用與包括該文檔的 詞語(yǔ)的索引相關(guān)聯(lián)的編程指令。
18. —種執(zhí)行搜索的方法,包括 接收與地理區(qū)域相關(guān)聯(lián)的搜索査詢; 確定與該地理區(qū)域相關(guān)聯(lián)的位置標(biāo)識(shí)符;以及 基于所述搜索査詢和所述位置標(biāo)識(shí)符與文檔索引的比較,執(zhí)行與該搜索査詢有關(guān)的文檔搜索。
19. 如權(quán)利要求18所述的方法,進(jìn)一步包括 把通過(guò)該搜索確定的相關(guān)文檔傳送給用戶。
20. 如權(quán)利要求18所述的方法,其中,所述文檔標(biāo)識(shí)符引用分層 三角網(wǎng)格中的節(jié)點(diǎn)。
21. 如權(quán)利要求18所述的方法,其中,接收所述搜索查詢包括接 收由用戶輸入的搜索詞語(yǔ)和地理描述詞語(yǔ)。
22. 如權(quán)利要求18所述的方法,進(jìn)一步包括 接收期望搜索區(qū)的表示; 確定該期望搜索區(qū)和以前索引的搜索區(qū)之間的差異; 基于該差異,確定位置標(biāo)識(shí)符的集合;以及基于所述搜索查詢和所述位置標(biāo)識(shí)符的集合,執(zhí)行該搜索。
23. —種搜索系統(tǒng),包括 搜索引擎,用于接收包括搜索詞語(yǔ)和期望地理區(qū)域的表示的搜索査詢;確定與該期望地理區(qū)域相關(guān)聯(lián)的位置標(biāo)識(shí)符;通過(guò)將所述位置標(biāo)識(shí)符追加到所述搜索查詢來(lái)修改該搜索査詢;以及基于所修改的搜索查詢與將多個(gè)位置標(biāo)識(shí)符與索引中的每一地理 相關(guān)文檔關(guān)聯(lián)的文檔索引的比較,執(zhí)行與該搜索查詢有關(guān)的文檔的搜 索。
24. 如權(quán)利要求23所述的搜索系統(tǒng),其中,與所述索引中的每一 地理相關(guān)文檔有關(guān)的多個(gè)位置標(biāo)識(shí)符定義了相應(yīng)的地理區(qū)域。
全文摘要
局部搜索引擎通過(guò)對(duì)每一文檔,索引共同定義總的地理區(qū)域的多個(gè)位置標(biāo)識(shí)符,有效地索引與地理區(qū)域有關(guān)的文檔。當(dāng)創(chuàng)建該索引時(shí),搜索引擎可以確定在與文檔有關(guān)的地理區(qū)域周圍的地理區(qū)域的集合以及將地理區(qū)域的集合的坐標(biāo)與文檔索引關(guān)聯(lián)。
文檔編號(hào)G06F17/30GK101128823SQ200580048650
公開日2008年2月20日 申請(qǐng)日期2005年12月30日 優(yōu)先權(quán)日2004年12月30日
發(fā)明者丹尼爾·艾尼奧 申請(qǐng)人:谷歌公司