專利名稱:跨語言搜索的制作方法
技術(shù)領(lǐng)域:
本公開涉及跨語言搜索。
背景技術(shù):
以某些語言(例如,英語)寫的網(wǎng)頁的數(shù)量可能遠大于以其它語言寫的網(wǎng)頁的數(shù) 量。這種差異在很大程度上應(yīng)歸于說某些語言的人的數(shù)量以及在說那些語言的國家中技術(shù) 的寬泛可用性。此外,與其它語言的頁面相比,這樣的頁面通常被更好地維護,并且能夠提 供與許多主題有關(guān)的更精確和最新的信息。因此,說在web上未廣泛使用的語言的人仍然 可能對在其它語言(例如,英語)可用的網(wǎng)頁上找到的信息感興趣。因此,由于相關(guān)結(jié)果甚 至可能不存在于搜索者的語言中,所以搜索以用來提交搜索查詢的語言寫的網(wǎng)頁可能不一 定滿足搜索者的查詢。例如,在埃及的人有時對與到中東以外的地方旅游、在國外大學(xué)學(xué)習(xí)或了解著名 的非埃及的人有關(guān)的信息感興趣。然而,可能沒有多少以用來提交查詢的語言的即用戶的 本國語的與這些主題有關(guān)的頁面。此外,由于頁面的作者對這樣的主題可能沒有充足的訪 問,所以以用戶的本國語的頁面可能是相對低質(zhì)量的。額外地,由于用戶不會說另一種語 言,所以這樣的用戶可能不能以另一種語言發(fā)出查詢。因此,這些用戶可能不能找到相關(guān)和 /或優(yōu)質(zhì)內(nèi)容。
發(fā)明內(nèi)容
總的來說,在本說明書中描述的主題的一個方面可以被實現(xiàn)在包括輸入模塊、評 估模塊和輸出模塊的系統(tǒng)中。輸入模塊可以接收第一語言的原始搜索查詢,原始搜索查詢 是對與原始搜索相關(guān)的文檔的請求。評估模塊可以接收與來自原始搜索查詢的結(jié)果相關(guān)聯(lián) 的相關(guān)性分值的第一集合和與來自第二語言的翻譯的搜索查詢的結(jié)果相關(guān)聯(lián)的相關(guān)性分 值的第二集合。評估模塊可以對相關(guān)性分值的第一和第二集合進行比較以確定是原始搜 索查詢還是翻譯的搜索查詢產(chǎn)生最相關(guān)的結(jié)果。輸出模塊可以基于是原始搜索查詢還是翻 譯的查詢具有最相關(guān)的結(jié)果,向用戶提供包括來自原始搜索查詢的結(jié)果或來自翻譯的搜索 查詢的結(jié)果中的一個或兩者中的至少部分的搜索結(jié)果。本方面的其它實施例包括對應(yīng)的方 法、裝置和計算機程序產(chǎn)品。用于執(zhí)行跨語言搜索的示例方法可以包括接收第一語言的原始搜索查詢;獲取 與原始搜索查詢相關(guān)聯(lián)的翻譯的搜索查詢,翻譯的搜索查詢以第二語言形式;基于與翻譯 的搜索查詢的結(jié)果相關(guān)聯(lián)的相關(guān)性分值、與翻譯相關(guān)聯(lián)的翻譯置信分值、或包括與第一或 第二語言相關(guān)聯(lián)的實體的搜索查詢,評估翻譯的搜索查詢來確定翻譯的搜索查詢是否是用于跨語言搜索的候選;以及基于評估的結(jié)果來派發(fā)搜索結(jié)果頁面。將在下面的附圖和描述中闡述本說明書中描述的主題的一個或多個實施例的細節(jié)。主題的其它特征、方面和優(yōu)勢從描述、附圖和權(quán)利要求中將變得顯而易見。
圖IA是描述跨語言搜索系統(tǒng)的體系結(jié)構(gòu)的框圖。圖IB是圖示示例跨語言搜索系統(tǒng)的框圖。圖IC是圖示查詢評估模塊的示例實施方式的框圖。圖2是圖示查詢評估模塊的框圖。圖3是圖示另一個示例跨語言搜索系統(tǒng)的框圖。圖4-7是圖示評估模塊的一些實施方式的框圖。圖8-10是圖示提供跨語言搜索的示例過程的流程圖。在各附圖中相同的參考數(shù)字和符號指示相同的元素。
具體實施例方式在本說明書的一些實施方式中,實現(xiàn)從客戶端設(shè)備接收搜索查詢并且確定外語的 網(wǎng)頁是否是對查詢的良好匹配的系統(tǒng)和方法。例如,如果在埃及的用戶輸入關(guān)于諸如美式 足球的主題的阿拉伯語的查詢,則可能沒有多少查詢語言的為該查詢提供相關(guān)結(jié)果的網(wǎng) 頁。然而,可能存在其它語言的相關(guān)頁面。例如,可以將來自先前示例的阿拉伯語的查詢翻 譯成英語的查詢,并且與網(wǎng)頁的英語索引進行比較。如果在該示例中存在在英語的網(wǎng)頁中 找到的更相關(guān)的結(jié)果,則相關(guān)頁面的列表可以被翻譯并且提供給用戶。在一些實施方式中, 基于用戶從相關(guān)頁面的列表中選擇網(wǎng)頁,相關(guān)網(wǎng)頁可以被翻譯并且提供給用戶。在一些實 施方式中,相關(guān)結(jié)果的列表可以包括翻譯的結(jié)果和未翻譯的結(jié)果兩者。圖IA是描述跨語言搜索系統(tǒng)100的體系結(jié)構(gòu)的框圖??缯Z言搜索系統(tǒng)100可以 接收第一語言的搜索查詢(Q)10a。在一些實施方式中,第一語言(例如,搜索語言)可以 基于與客戶端設(shè)備相關(guān)聯(lián)的輸入模式來識別。在其它實施方式中,第一語言可以基于正被 訪問的特定國家代碼頂級域名來識別。例如,加州山景城的谷歌向許多不同的國家提供許 多不同的網(wǎng)頁,以及國家代碼頂級域名可以被用來識別客戶端期望接收來自何種語言(或 哪些語言)的輸入。在這樣的示例中,如果用戶正在訪問“google.ru”國家代碼頂級域名, 則客戶端期望接收俄語的輸入。在又一些實施方式中,用戶可以使用客戶端來指定第一語 言。例如,用戶可以使用下拉菜單來選擇多個所支持的語言中的一個,其中用戶意欲以該語 言輸入搜索查詢。在一些實施方式中,跨語言搜索系統(tǒng)100可以將搜索查詢發(fā)送到搜索引擎20。搜 索引擎20可以接收查詢并且識別搜索結(jié)果。例如,搜索引擎20可以從文檔的索引(例如, 從網(wǎng)頁的索引)檢索相關(guān)搜索結(jié)果。搜索結(jié)果可以包括例如網(wǎng)頁標(biāo)題的列表、從那些網(wǎng) 頁提取的文本的摘錄以及指向那些網(wǎng)頁的超文本鏈接,以及可以被分組成預(yù)定數(shù)量(例如 10)的搜索結(jié)果。在一些實施方式中,搜索引擎20可以將搜索查詢(Q)IOa解析成組分標(biāo)志(Q1, Q2.....Qn) 10b。在一些實施方式中,標(biāo)志是形成查詢的單詞(或單詞組,其中單詞組形成單個概念,諸如“New YorkCity”)。組分標(biāo)志(Q1A2.....Qn) IOb可以被用來識別第一語言
的與搜索查詢(Q) IOa相關(guān)的網(wǎng)頁。在一些實施方式中,相關(guān)網(wǎng)頁是第一語言的包括多于組
分標(biāo)志(QpQ2.....Qn) IOb中的一個的那些網(wǎng)頁。這樣的網(wǎng)頁可以例如在被限制在第一語
言的網(wǎng)頁的索引30中找到。在一些實施方式中,搜索引擎20可以導(dǎo)出與最相關(guān)頁面相關(guān) 聯(lián)的相關(guān)性分值。在又一些實施方式中,搜索引擎20可以導(dǎo)出與如由鏈接到頁面的其它站 點的數(shù)量測量的網(wǎng)頁的質(zhì)量相關(guān)聯(lián)的頁面排名分值。搜索引擎20還可以導(dǎo)出與搜索結(jié)果 有關(guān)的分值(例如,信息檢索(IR)分值)。在一些實施方式中,IR分值可以從例如與查詢 和文檔相關(guān)性相對應(yīng)的特征向量的點積、頁面排名分值和/或IR分值和頁面排名分值的組 合等來計算ο在一些實施方式中,跨語言搜索系統(tǒng)100確定組分標(biāo)志(Q^ Q2.....Qn) IOb中
的任何一些是否是本地實體40,并且從跨語言搜索中排除包括本地實體的任何搜索查詢 (Q) IOa0實體是識別人、地方或事物的那些單詞或詞組。本地實體是與輸入查詢的語言相 關(guān)聯(lián)的那些實體,并且人、地方或事物指示其中主要說該語言的發(fā)源地??梢源嬖谄渲兄饕?說該語言的發(fā)源地的物理指示、發(fā)源地的邏輯指示或發(fā)源地的歷史指示。例如,埃菲爾鐵塔 位于法國,因此查詢“l(fā)a Tour Eiffel”是關(guān)于法語的本地實體。在另一個示例中,大陸軍 在美國具有發(fā)源地的邏輯和歷史指示兩者,因此其是關(guān)于英語的本地實體。在又一些示例 中,由于詞語“Mo c κ B a ”識別位于俄羅斯的城市莫斯科,所以其是關(guān)于俄語的本地實 體。這樣的實體的列表可以從百科全書、位置服務(wù)器、公共歸檔等導(dǎo)出,或可以從第三 方提供。本地實體的列表典型地排除單獨的通用詞語,即使通用詞語是在商標(biāo)名稱中的構(gòu) 成單詞。然而,包括通用詞語的多單詞商標(biāo)名稱可以被包括在本地實體的列表中(例如, "AuburnUniversity (奧本大學(xué)),,)。本地實體的列表還典型地排除包括外來實體。在一個實施方式中,外來實體是對 于輸入查詢的語言不是本地實體的那些實體。在其它實施方式中,外來實體可以是對于另 一種語言是本地的實體和那些實體的翻譯。實體對于一種語言可以是本地的,而對于另一 種語言可以是外來的。例如,標(biāo)志“Vladimir Putin”定義了俄語的本地實體,而相同的標(biāo)志 將定義英語的外來實體。因此,如果俄羅斯用戶將(俄語的)“Vladimir Putin”作為搜索 查詢20a的一部分輸入,則將在俄語的本地實體中找到實體“Vladimir Putin”,并且可以 將搜索排除在執(zhí)行跨語言搜索之外。在另一個示例中,“Mo c κ B a”(例如“莫斯科”) 是俄語的本地實體。在一些實施方式中,包括與本地實體相匹配的標(biāo)志的搜索查詢不適合跨語言搜 索,因此搜索可以以用來提交搜索查詢的語言提供。例如,如果接收搜索“Al-Qahira”(例 如,與埃及實體“Cairo”相互關(guān)聯(lián)),則由于標(biāo)志“Al-Qahira”與阿拉伯語的本地實體相匹 配,所以可以從阿拉伯語的網(wǎng)頁的索引提供搜索查詢。因此,可以假設(shè)與以另一種語言寫的 網(wǎng)頁(例如,翻譯的英語搜索查詢“Cairo”產(chǎn)生的網(wǎng)頁)相比,以阿拉伯語創(chuàng)作的網(wǎng)頁與搜 索查詢更相關(guān)。此外,以另一種語言寫的網(wǎng)頁在翻譯后可能很難理解。例如,與以阿拉伯語 寫的網(wǎng)頁相比,被翻譯成阿拉伯語的以英語寫的網(wǎng)頁對于天生說阿拉伯語的人來說可能更 難閱讀。在一些實施方式中,可以將組分標(biāo)志(Qp Q2.....Qn) IOb與本地實體40進行比較來確定組分標(biāo)志(QpQ2.....Qn) IOb的集合與本地實體40的聚集的任何相交的程度。在組 分標(biāo)志IOb和本地實體40的聚集之間相交的程度可以被用來確定是否執(zhí)行跨語言搜索。在其它實施方式中,可以將搜索查詢的子集(例如,η元)與本地實體40的聚集 進行比較。在這樣的實施方式中,跨語言搜索系統(tǒng)100可以將搜索查詢的子集中的每一個 與本地實體40的聚集進行比較以確定包括在搜索查詢中的子集中的任何子集是否與來自 本地實體60的聚集的本地實體相匹配。例如,如果跨語言搜索系統(tǒng)100接收了搜索查詢 "vacation homes finger lakes”,則跨語言搜索系統(tǒng)100可以對本地實體40的聚集搜索包 括以下任何集合“vacationvacation homes">"vacation homes finger“vacation homes finger lakes,,、"homes,,、"homes finger,,、‘‘homes finger lakes,,、"finger,,以及 "finger lakes”。在一些實施方式中,如果子部分字符串的第一單詞不包含在本地實體40 的聚集中的匹配,則跨語言搜索系統(tǒng)100可以停止搜索子部分字符串。在額外的實施方式 中,跨語言搜索系統(tǒng)100可以在找到與來自本地實體40的聚集的實體相匹配的子集后中 止搜索。例如,如果跨語言搜索系統(tǒng)100接收了查詢"Manhattan gourmet restaurants”, 則跨語言搜索系統(tǒng)100可能立即找到與來自本地實體40的聚集的本地實體相匹配的詞語 ‘‘Manhattan”。因此,可以認為搜索進一步匹配是不必要的。在待執(zhí)行跨語言搜索的那些情況下,跨語言搜索系統(tǒng)100可以將搜索查詢(Q) IOa 發(fā)送到翻譯器25。翻譯器25使用搜索查詢(Q) IOa來導(dǎo)出第二語言的翻譯的搜索查詢 (Q’)50a。在一些實施方式中,翻譯器可以是可操作來接收第一語言的搜索查詢(Q) IOa并 且輸出第二語言的翻譯的查詢(Q’ )50a的自動機器翻譯器。翻譯的搜索查詢(Q’)50a可以由搜索引擎20分成組分標(biāo)志(Q/、Q2’.....
Qn’)50b。在一些實施方式中,搜索引擎20或跨語言搜索系統(tǒng)100可以將組分標(biāo)志(Q/、
Q2'.....Qn' )50b與外來實體60的聚集進行比較。外來實體60的聚集可以包括與第二
語言相關(guān)聯(lián)的那些實體。例如,如果第二語言是俄語,則外來實體可以包括位置(例如,紅 場、克里姆林宮、莫斯科或西伯利亞)以及人(例如,列寧、斯大林、戈爾巴喬夫或葉利欽)、
或與俄語相關(guān)聯(lián)的俄羅斯商標(biāo)名稱、產(chǎn)品和公司。在第二語言的組分標(biāo)志(Q1’、Q2’.....
Qn') 50b的集合包括與外來實體60的一些相交的那些情況下,翻譯的查詢(Q’)50a可以被 認為是執(zhí)行跨語言搜索的良好候選。在其它實施方式中,翻譯的查詢(Q’)可以被分成子集 并且與外來實體60的聚集中的實體進行比較以確定包括在搜索查詢中的詞語是否與外來 實體相匹配。在又一些實施方式中,翻譯器可以產(chǎn)生與翻譯的搜索查詢(Q’)50a相關(guān)聯(lián)的翻譯 置信分值70。與翻譯的查詢(Q’)50a相關(guān)聯(lián)的翻譯置信分值70可以被用來確定翻譯是否 可能產(chǎn)生相關(guān)結(jié)果。在這樣的實施方式中,可以將翻譯置信70與翻譯置信閾值進行比較以 確定翻譯的查詢(Q’)50a是否是用于跨語言搜索的候選。例如,搜索查詢(Q) IOa可以潛在 地具有一百或更多的翻譯。更大數(shù)量的潛在翻譯關(guān)于從可能的翻譯中選擇的翻譯的搜索查 詢(Q’)可以產(chǎn)生更大的不確定性。因此,存在下述的某種可能性所選擇的翻譯是不正確 的;使用這樣的搜索查詢生成的任何結(jié)果將與原始搜索查詢IOa不相關(guān)。因此,翻譯置信分 值70不滿足翻譯置信閾值的翻譯的搜索查詢(Q’)50a可以被認為是用于執(zhí)行跨語言搜索 的不良候選。在一些實施方式中,翻譯器25基于超過翻譯置信閾值的多個翻譯可以將多個翻譯提供給搜索引擎20。在其它實施方式中,翻譯器25可以將單個翻譯(例如,翻譯的搜索 查詢(Q’)50a)提供給跨語言搜索系統(tǒng)100,并且跨語言系統(tǒng)可以確定與該翻譯的搜索查詢 (Q’)50a相關(guān)聯(lián)的翻譯置信分值是否滿足翻譯置信閾值。從跨語言搜索排除不滿足翻譯置 信閾值的翻譯的搜索查詢(Q’)50a。如果翻譯的搜索查詢(Q’ )滿足置信閾值,則可以將翻譯的搜索查詢(Q’)50a發(fā) 送給搜索引擎20以搜索與翻譯的搜索查詢(Q’)50a相關(guān)的文檔(例如,網(wǎng)頁)。搜索引擎
20可以使用翻譯的搜索查詢(Q’)50a的組分標(biāo)志(Q’ 1、Q’ 2.....Q’ η) 50b來找尋第二語
言的相關(guān)網(wǎng)頁80。如前所述,搜索引擎20可以向跨語言搜索系統(tǒng)100提供與第二語言的相 關(guān)網(wǎng)頁相關(guān)聯(lián)的IR分值。在一些實施方式中,可以將與翻譯的搜索查詢(Q’ )50a的結(jié)果相關(guān)聯(lián)的相應(yīng)相關(guān) 性分值與相關(guān)性分值閾值進行比較以確定是否將翻譯的網(wǎng)頁用作為搜索查詢(Q) 20a的結(jié) 果。例如,在一些情況下,翻譯的查詢(Q’)50a的結(jié)果可能具有如此低的相關(guān)性分值,使得 其不會被派發(fā)給搜索者,即使翻譯的搜索查詢(Q’)50a的結(jié)果具有比搜索查詢(Q) 20a的結(jié) 果更高的相關(guān)性分值。在一些實施方式中,可以將用于翻譯的搜索查詢(Q’ )50a的結(jié)果的相關(guān)性分值與 用于搜索查詢(Q) IOa的結(jié)果的相關(guān)性分值進行比較??梢詫⒏嚓P(guān)的結(jié)果作為結(jié)果90派 發(fā)給用戶。在翻譯的搜索查詢(Q’)50a的結(jié)果具有比搜索查詢(Q) IOa的結(jié)果的相關(guān)性分 值更高的相關(guān)性分值的那些情況下,第二語言的相關(guān)網(wǎng)頁可以被翻譯成第一語言并且作為 結(jié)果90派發(fā)。在一些實施方式中,基于翻譯的網(wǎng)頁比以第一語言原始創(chuàng)作的網(wǎng)頁更難閱讀 的可能性,相關(guān)性分值可以偏向于喜好來自搜索查詢(Q) IOa的結(jié)果。在一些實施方式中,翻譯的搜索查詢的翻譯的網(wǎng)頁結(jié)果可以包括翻譯置信分值。 在這樣的實施方式中,可以將與翻譯的網(wǎng)頁的翻譯相關(guān)聯(lián)的翻譯置信分值或質(zhì)量與翻譯置 信閾值進行比較以確定是否應(yīng)當(dāng)將翻譯的網(wǎng)頁用作為搜索查詢IOa的結(jié)果90。例如,在一 些情況下,可以確定第二語言的相關(guān)網(wǎng)頁或相關(guān)聯(lián)的部分或摘錄的翻譯對于搜索者來說幾 乎是不可閱讀的。在這樣的示例中,跨語言搜索系統(tǒng)100可能僅派發(fā)比本地結(jié)果更相關(guān)并 且滿足翻譯置信閾值的那些結(jié)果。圖IB是圖示示例跨語言搜索系統(tǒng)100的框圖。在一些實施方式中,系統(tǒng)100可以 包括輸入模塊110、查詢評估模塊120、實體數(shù)據(jù)存儲130以及輸出模塊140。輸入模塊110 可以從客戶端設(shè)備接收搜索查詢。在一些實施方式中,輸入模塊110可以包括提供給例如 計算機設(shè)備的用戶設(shè)備的搜索引擎網(wǎng)頁代碼,其在用戶設(shè)備上呈現(xiàn)使用戶能夠輸入搜索查 詢的網(wǎng)頁。在其它實施方式中,輸入模塊110可以包括使系統(tǒng)能夠從客戶端設(shè)備接收查詢 的通信接口。在一些實施方式中,查詢評估模塊120可以從輸入模塊110接收搜索查詢,并且可 以評估搜索查詢以確定搜索查詢是否是用于執(zhí)行跨語言搜索的候選。在這些實施方式中, 查詢評估模塊120可以過濾搜索查詢以識別那些查詢與在以用來輸入查詢的語言創(chuàng)作的 網(wǎng)頁上找到的相比,更可能具有來自另一種語言的網(wǎng)頁的更相關(guān)的結(jié)果。在一些實施方式中,查詢評估模塊120可以與翻譯服務(wù)122通信。翻譯服務(wù)122 可以接收第一語言的搜索查詢,以及可以將搜索查詢翻譯成第二語言并且生成與翻譯的搜 索查詢相關(guān)聯(lián)的翻譯置信分值??梢詫⒎g的搜索查詢和翻譯置信分值提供給查詢評估模塊 120。
在一些實施方式中,來自搜索查詢的同與第一語言(例如,搜索查詢語言)相關(guān)聯(lián) 的實體(例如,本地實體)相匹配的標(biāo)志可以由查詢評估模塊120協(xié)同實體數(shù)據(jù)存儲130 識別。在一些實施方式中,本地實體可以是與對于用來輸入搜索查詢的語言是本地的區(qū)域 相關(guān)聯(lián)的專有名詞(例如,城市、地方等)。在其它實施方式中,包括與本地實體相匹配的標(biāo)志的搜索查詢基于第一語言的網(wǎng) 頁的相關(guān)性可以仍然適合跨語言搜索。在這樣的實施方式中,在搜索查詢包括與本地實體 相匹配的標(biāo)志時,可以將查詢的語言的與本地實體相關(guān)聯(lián)的結(jié)果與閾值相關(guān)性分值進行比 較以確定第一語言的結(jié)果是否是劣質(zhì)的。例如,搜索查詢可能包括與本地實體相匹配的標(biāo) 志;然而,與該本地實體相關(guān)聯(lián)的語言的網(wǎng)頁可能是稀少的。因此,確定另一種語言的網(wǎng)頁 是否可能具有更相關(guān)的結(jié)果可以是有用的。在一些實施方式中,跨語言搜索系統(tǒng)100可以識別何時來自翻譯的搜索查詢的標(biāo) 志匹配外來實體。外來實體是與除第一語言外的語言相關(guān)聯(lián)的任何實體(例如,“Cairo, Egypt”是英語的外來實體)。在一些示例中,用于第一或第二語言的百科全書可以被用來 確定翻譯的查詢是否是用于跨語言搜索的良好候選。在這些示例中,包括在搜索查詢或翻 譯的搜索查詢中的與實體(例如,本地或外來)相匹配的標(biāo)志可以分別使用與第一語言或 第二語言相關(guān)聯(lián)的百科全書網(wǎng)站來識別。在其它示例中,位置服務(wù)器可以被用來識別與搜 索查詢或翻譯的搜索查詢相關(guān)聯(lián)的位置。在一些實施方式中,在編輯實體數(shù)據(jù)存儲130時,通用單詞可以被識別并且從實 體數(shù)據(jù)存儲130移除,即使在單詞表示與第一或第二語言相關(guān)聯(lián)的商標(biāo)或城市的情況下。 例如,通用單詞是與該語言不具有任何特定關(guān)聯(lián)的那些單詞。還使城市或商標(biāo)與之相關(guān)聯(lián) 的通用單詞的一個示例是“auburn”。在一些情況下,“auburn”通常是指顏色,在其它情 況下,其可以指城市亞拉巴馬州奧本或商標(biāo)“AuburnUniversity”。在另一個示例中,詞語 “apple”通??梢灾杆?,而在其它情況下其可以指公司。由于如果用戶正試圖輸入通用詞 語,而不是城市或商標(biāo),則這些單詞可以導(dǎo)致不相關(guān)的結(jié)果,所以從實體數(shù)據(jù)存儲130移除 這些單詞。在一些實施方式中,查詢評估模塊120可以檢索與包括在百科全書中的實體有關(guān) 的歷史統(tǒng)計?;谂c實體相關(guān)聯(lián)的統(tǒng)計,查詢評估模塊120可以確定與實體的在先前接收 的搜索查詢中的包括相關(guān)聯(lián)的頻率。例如,實體在搜索查詢中出現(xiàn)越頻繁,與該實體有關(guān)的 主題越受歡迎。由于如由用戶查詢所指示的興趣通常由來自發(fā)布者的興趣反映,所以更受 歡迎的主題更可能具有與主題相關(guān)聯(lián)的相關(guān)網(wǎng)頁。此外,當(dāng)不存在關(guān)于查詢的相關(guān)內(nèi)容時, 由于該查詢沒有產(chǎn)生相關(guān)結(jié)果,所以該查詢可以變得不受歡迎。以閾值頻率查詢的實體可 以被包括在實體數(shù)據(jù)存儲130中,因為可以假設(shè)這樣的實體具有在相關(guān)聯(lián)的網(wǎng)頁方面的相 關(guān)主題語料庫。在又一些實施方式中,查詢評估模塊120可以確定搜索查詢的翻譯的質(zhì)量。翻譯 的質(zhì)量可以被用來確定搜索查詢是否是用于跨語言搜索的良好候選。例如,如果翻譯是低 劣的,例如翻譯置信指示該翻譯具有為不正確的相對高的可能性,則來自低劣翻譯的查詢 的結(jié)果也可能是低劣的,或可能與原始搜索查詢完全不相關(guān)。各種翻譯服務(wù)為翻譯提供置 信分值以確定慣用法最可能涉及哪個單詞。在一些實施方式中,翻譯服務(wù)可以基于與搜索查詢中的每一個單詞的翻譯相關(guān)聯(lián)的置信來為搜索查詢的整體翻譯提供置信分值。因此,搜索查詢可能很難精確翻譯,以及置信值或質(zhì)量值可以被用來過濾使用這樣的單詞的搜索 查詢而不被用于跨語言搜索。例如,特定單詞可能具有翻譯成外語的多個翻譯或可能根本 不具有翻譯。這樣的單詞很難翻譯,并且導(dǎo)致與翻譯有關(guān)的較低置信分值。在一些實施方式中,可以測試翻譯的搜索查詢以確定翻譯的搜索查詢是否產(chǎn)生相 關(guān)網(wǎng)頁匹配。在這樣的實施方式中,查詢評估模塊120可以將翻譯的搜索查詢發(fā)送到搜索 引擎124。搜索引擎124可以使用翻譯的搜索查詢來識別文檔語料庫126(例如,第二語言 的索引)中的相關(guān)文檔。所識別的文檔和翻譯的搜索查詢可以被用來導(dǎo)出與翻譯的搜索查 詢的結(jié)果相關(guān)聯(lián)的相關(guān)性分值。在一些實施方式中,相關(guān)性分值可以包括相關(guān)性組分和質(zhì) 量組分兩者。在接收與從搜索引擎124接收的來自翻譯的搜索查詢的結(jié)果相關(guān)聯(lián)的相關(guān)性 分值后,查詢評估模塊120可以將與搜索查詢的結(jié)果相關(guān)聯(lián)的相關(guān)性分值與相關(guān)性閾值進 行比較以確定翻譯的搜索查詢是否可能與搜索查詢相關(guān)。例如,在一些情況下,來自翻譯的 搜索查詢的結(jié)果可能如此不相關(guān),使得甚至不向搜索者提供所述結(jié)果。在又一些實施方式中,用戶關(guān)于與翻譯的查詢相匹配的先前查詢的結(jié)果的活動可 以被用來確定來自相似查詢的結(jié)果對于其他用戶來說是否是滿意的,從而指示相似搜索查 詢產(chǎn)生了相關(guān)結(jié)果。例如,搜索引擎124可以在客戶端設(shè)備請求結(jié)果,例如在搜索結(jié)果上點 擊并且到達與該結(jié)果相關(guān)聯(lián)的登陸頁面時記入日志。如果客戶端設(shè)備在訪問登陸頁面后立 即返回到搜索頁面來輸入新的查詢,則結(jié)果可能是不相關(guān)的。相反,如果客戶端設(shè)備駐留在 結(jié)果頁面中的一個或多個上一段時間,則結(jié)果更可能與搜索查詢相關(guān)。因此,查詢評估模塊 120可以基于使用與翻譯的查詢相匹配的搜索查詢的其他用戶的活動,來確定翻譯的搜索 查詢是否可能產(chǎn)生優(yōu)質(zhì)結(jié)果。在又一些實施方式中,查詢評估模塊120可以確定第一語言的搜索查詢是否比第 二語言的翻譯的搜索查詢具有更相關(guān)的結(jié)果。在這樣的實施方式中,查詢評估模塊120可 以將搜索查詢和翻譯的搜索查詢兩者發(fā)送到搜索引擎124。搜索引擎124可以導(dǎo)出與來自 原始搜索查詢的結(jié)果的第一集合相關(guān)聯(lián)的相關(guān)性分值的第一集合,以及與來自翻譯的搜索 查詢的結(jié)果的第二集合相關(guān)聯(lián)的相關(guān)性分值的第二集合。在一些實施方式中,如果如分別 由第一和第二相關(guān)性分值所指示的,搜索查詢產(chǎn)生比來自翻譯的搜索查詢的結(jié)果中的任何 結(jié)果更好的結(jié)果,則可以將來自搜索查詢的結(jié)果派發(fā)給搜索者。替選地,如果如由各自相關(guān) 性分值所指示的,來自翻譯的搜索查詢的結(jié)果比來自搜索查詢的結(jié)果更相關(guān),則可以將來 自翻譯的搜索查詢的結(jié)果派發(fā)給搜索者。這樣的比較假設(shè)對不同語言的相關(guān)性測量跨各個 語料庫是可公度的。在一些實施方式中,可以對第二語言的網(wǎng)頁(或多個網(wǎng)頁)進行翻譯以產(chǎn)生該第 一語言的網(wǎng)頁的翻譯版本。例如,可以將第一語言的網(wǎng)頁的翻譯版本與第一語言的搜索查 詢進行比較以導(dǎo)出相關(guān)性分值。例如,可以將接收的西班牙語的搜索查詢翻譯成英語。如 果與最高排名的西班牙語的網(wǎng)頁與西班牙語的查詢的相關(guān)程度相比,最高排名的英語的網(wǎng) 頁與翻譯的英語查詢更相關(guān),則可以將英語網(wǎng)頁翻譯成西班牙語。在該示例中,在將英語 網(wǎng)頁翻譯成西班牙語后,可以將西班牙語查詢與翻譯的英語網(wǎng)頁進行比較。如果與西班牙 語網(wǎng)頁與西班牙語查詢的相關(guān)程度相比,翻譯的英語網(wǎng)頁與西班牙語查詢?nèi)匀桓嚓P(guān),則 可以將翻譯的英語網(wǎng)頁作為結(jié)果提供。如果與西班牙語網(wǎng)頁與西班牙語查詢的相關(guān)程度相比,翻譯的英語網(wǎng)頁與西班牙語查詢不更相關(guān),則可以將西班牙語網(wǎng)頁作為結(jié)果提供給搜 索者。因此,可以將翻譯的搜索頁面對于原始查詢的相關(guān)性分值與以第一語言寫的網(wǎng)頁對 于原始搜索查詢的相關(guān)性分值進行比較。在一些實施方式中,基于與相應(yīng)結(jié)果相關(guān)聯(lián)的相關(guān)性分值,派發(fā)給客戶端設(shè)備的 結(jié)果可以包括翻譯的網(wǎng)頁和以第一語言寫的網(wǎng)頁兩者。例如,如果來自英語查詢的結(jié)果具 有10、9和2的相關(guān)性分值,而來自西班牙語查詢的結(jié)果具有8、8和6的相關(guān)性分值,則跨 語言搜索系統(tǒng)可以提供來自英語查詢的兩個最相關(guān)的結(jié)果,后跟西班牙語查詢的結(jié)果,并 且以來自英語查詢的最不相關(guān)的結(jié)果結(jié)束。在其它實施方式中,可以將原始搜索查詢的結(jié) 果的相關(guān)性分值聚合來產(chǎn)生第一聚合相關(guān)性分值,以及可以將原始搜索查詢的相關(guān)性分值 聚合來產(chǎn)生第二聚合相關(guān)性分值。在一些實施方式中,聚合可以包括對相應(yīng)相關(guān)性分值求 和來產(chǎn)生第一和第二聚合相關(guān)性分值??梢詫⒌谝痪酆舷嚓P(guān)性分值與第二聚合相關(guān)性分值 進行比較以確定是否派發(fā)與翻譯的搜索查詢相關(guān)聯(lián)的結(jié)果。輸出模塊140可操作來從查詢評估模塊120接收結(jié)果并且將結(jié)果派發(fā)給客戶端設(shè) 備。在一些實施方式中,輸出模塊140可以調(diào)集包含搜索結(jié)果的網(wǎng)頁用于傳送到客戶端設(shè) 備。在其它實施方式中,輸出模塊140可以將結(jié)果派發(fā)到可操作來將結(jié)果格式化并傳送到 客戶端設(shè)備的另一個模塊。圖IC是圖示查詢評估模塊120的示例實施方式的框圖。查詢評估模塊120可以接 收第一語言的搜索查詢(Q)。查詢評估模塊120可以將搜索查詢(Q)發(fā)送給搜索引擎124。 搜索引擎124可以基于搜索查詢(Q)執(zhí)行對與第一語言相關(guān)聯(lián)的文檔語料庫126的搜索以 產(chǎn)生搜索結(jié)果(RQ)的集合。查詢評估模塊120還可以將接收的搜索查詢提供給實體過濾器154。實體過濾器 154可以將標(biāo)志(例如,形成單個概念的單詞或單詞組)與本地實體數(shù)據(jù)存儲156中的實體 以及與外來實體數(shù)據(jù)存儲158中的實體進行比較。如果實體過濾器154確定搜索查詢(Q) 包括與來自本地實體數(shù)據(jù)存儲156的實體相匹配的標(biāo)志,則查詢評估模塊120可以確定搜 索查詢(Q)不適合跨語言搜索。因此,僅向搜索者派發(fā)搜索結(jié)果(RQ) 152的集合。如果搜索查詢(Q)不包括與來自本地實體數(shù)據(jù)存儲156的實體相匹配的標(biāo)志,則 可以將來自搜索查詢(Q)的標(biāo)志與外來實體數(shù)據(jù)存儲158中的外來實體的列表進行比較。 如果實體過濾器154確定搜索查詢(Q)包括與外來實體相匹配的標(biāo)志,則查詢評估模塊120 可以如由路徑159和163所指示的使用翻譯服務(wù)122和搜索引擎124來以來自翻譯的搜索 查詢(Q’ ) 162的結(jié)果對接收的搜索查詢(Q)作出響應(yīng),從而避免查詢評估過濾器120進一 步評估。然而,如果實體過濾器154確定搜索查詢(Q)不包括與來自外來實體數(shù)據(jù)存儲158 的外來實體相匹配的標(biāo)志,則實體過濾器154可以確定查詢應(yīng)當(dāng)經(jīng)歷進一步評估并且指示 翻譯服務(wù)122翻譯搜索查詢(Q)以產(chǎn)生翻譯的搜索查詢(Q’ )。雖然本申請描述本地實體的列表從百科全書以及其它參考源導(dǎo)出,并且排除某些 通用詞語以及對其它語言而言是本地的詞語,但是本地實體的列表和外來實體的列表在一 些實施方式中可以由另一個系統(tǒng)生成,并且可以被提供給跨語言搜索系統(tǒng)以在確定搜索詞 語是否包括與來自由這樣的其它系統(tǒng)提供的列表的本地或外來實體相匹配的標(biāo)志時使用。 翻譯評估過濾器160可以從翻譯服務(wù)122接收翻譯的搜索查詢(Q’ )。翻譯評估 過濾器160還可以從翻譯服務(wù)122接收翻譯置信分值。翻譯評估過濾器160可以將來自翻譯服務(wù)122的翻譯置信分值與閾值置信分值進行比較以確定翻譯是否是足夠高質(zhì)量來成 為用于執(zhí)行跨語言搜索的良好候選。如果翻譯的搜索查詢(Q’)滿足置信閾值,則翻譯評估 過濾器160可以將翻譯的搜索查詢(Q’)傳送給搜索引擎124。在一些實施方式中,可以將 原始搜索查詢的最可能的翻譯返回給查詢評估模塊120,并且可以將與該翻譯相關(guān)聯(lián)的翻 譯置信分值與翻譯置信閾值進行比較。在其它實施方式中,可以將超過翻譯置信閾值的原 始搜索查詢的所有翻譯返回給查詢評估模塊120。 搜索引擎124可以基于翻譯的搜索查詢(Q’ )執(zhí)行對與第二語言相關(guān)聯(lián)的文檔語 料庫126的搜索以產(chǎn)生第二語言的搜索結(jié)果(RQ’)162的集合。搜索引擎124可以將翻譯 的搜索查詢(Q’)的結(jié)果(RQ’)162提供給相關(guān)性結(jié)果過濾器164。搜索引擎124還可以將 與翻譯的搜索查詢(Q’ )的結(jié)果(RQ’)162相關(guān)聯(lián)的相關(guān)性分值(例如,IR分值)提供給 相關(guān)性結(jié)果過濾器164。相關(guān)性結(jié)果過濾器164可以確定翻譯的搜索查詢(Q’ )的結(jié)果(RQ’ ) 162是否相 關(guān)得足以被派發(fā)給搜索者。相關(guān)性結(jié)果過濾器164可以將翻譯的搜索查詢(Q’)的結(jié)果 (RQ’)162與閾值相關(guān)性進行比較以確保翻譯的搜索查詢(Q’ )的結(jié)果(RQ’)162相關(guān)得 足以被派發(fā)給搜索者。在其它示例中,相關(guān)性結(jié)果過濾器164可以檢索與翻譯的搜索查詢 (Q’)相關(guān)聯(lián)的統(tǒng)計并且基于與結(jié)果(RQ’)162相關(guān)聯(lián)的點擊分析來確定結(jié)果的相關(guān)性。在 確定結(jié)果(RQ’)162不滿足閾值相關(guān)性的那些情況下,僅向搜索者派發(fā)原始查詢(Q)的結(jié)果 (RQ) 152。如果確定翻譯的搜索查詢(Q’ )的結(jié)果(RQ’)162滿足閾值相關(guān)性,則將翻譯的 搜索查詢(Q’ )的結(jié)果(RQ’)162提供給相關(guān)性比較過濾器168。相關(guān)性比較過濾器168可以接收原始搜索查詢(Q)的結(jié)果(RQ) 152和翻譯的搜索 查詢(Q’)的結(jié)果(RQ’)162。相關(guān)性比較過濾器168還可以接收原始搜索查詢(Q)的結(jié)果 (RQ) 152的第一相關(guān)性分值(例如,IR分值)和翻譯的搜索查詢(Q,)的結(jié)果(RQ,) 162的 第二相關(guān)性分值。相關(guān)性比較過濾器168可以比較第一和第二相關(guān)性分值以確定是否派發(fā) 原始搜索查詢的結(jié)果(RQ) 152和/或翻譯的搜索查詢的結(jié)果(RQ’)162。例如,如果翻譯的 搜索查詢(Q’ )的結(jié)果(RQ’)162具有比原始搜索查詢的結(jié)果(RQ) 152更高的聚合相關(guān)性 分值,則可以將翻譯的搜索查詢的結(jié)果(RQ’)162作為搜索結(jié)果170提供給搜索者。否則, 將原始搜索查詢的結(jié)果(RQ) 152作為搜索結(jié)果170派發(fā)給用戶。也可以使用基于相關(guān)性的 其它派發(fā)方案??梢砸愿鞣N方式將搜索結(jié)果170派發(fā)給客戶端。在一些實施方式中,如果查詢評 估模塊120執(zhí)行了跨語言搜索,則搜索結(jié)果170可以包括指向由查詢評估模塊120識別的 替選結(jié)果頁面(例如,包括翻譯的網(wǎng)頁結(jié)果)的鏈接。在其它實施方式中,搜索結(jié)果170可 以包括由查詢評估模塊120識別的結(jié)果的聚合。例如,搜索結(jié)果170可以包括原始搜索查 詢(Q)的結(jié)果(RQ) 152和翻譯的搜索查詢(Q’ )的結(jié)果(RQ’)162兩者。在又其它實施方 式中,搜索結(jié)果170可以包括分割的結(jié)果176。例如,搜索結(jié)果170可以僅包括原始搜索查 詢的結(jié)果(RQ) 152或翻譯的搜索查詢的結(jié)果(RQ’)162、或指向來自展示另一個的頁面的結(jié) 果的一個集合的鏈接。在又一些實施方式中,搜索結(jié)果170可以包括翻譯的結(jié)果178。例 如,如果搜索結(jié)果170包括翻譯的查詢的結(jié)果(RQ’)162,則結(jié)果(RQ’ )可以在向搜索者展 示之前被翻譯。圖2是圖示查詢評估模塊120的框圖。在一些實施方式中,查詢評估模塊120可以包括本地實體過濾器210。本地實體過濾器210可以確定搜索查詢是否與本地實體有關(guān)。 本地實體過濾器210可以將包括在搜索查詢中的標(biāo)志與本地實體數(shù)據(jù)存儲130a進行比較 以確定搜索查詢是否與本地實體有關(guān)(例如,包括與本地實體相匹配的標(biāo)志)。在搜索查詢 與本地實體有關(guān)的那些情況下,可能的是,來自以第一語言寫的網(wǎng)頁的結(jié)果將與搜索查詢 相關(guān)。在這樣的情況下,查詢評估模塊120可以從跨語言搜索排除該搜索查詢。 在一些實施方式中,查詢評估模塊120可以包括外來實體過濾器220。外來實體過 濾器220可以確定搜索查詢或翻譯的搜索查詢是否與外來實體有關(guān)(例如,包括與外來實 體相匹配的標(biāo)志)。在一些實施方式中,外來實體過濾器220可以包括外來實體的數(shù)據(jù)庫, 可以將與搜索查詢或翻譯的查詢相關(guān)聯(lián)的標(biāo)志與該外來實體的數(shù)據(jù)庫進行比較。在搜索查 詢與外來實體有關(guān)(例如,包括與外來實體相匹配的標(biāo)志)的那些情況下,可能的是,來自 以第二語言寫的網(wǎng)頁的結(jié)果將與搜索查詢相關(guān)。在這樣的情況下,查詢評估模塊120可以 基于來自與原始搜索查詢相關(guān)聯(lián)的翻譯的搜索查詢的搜索引擎結(jié)果124來派發(fā)搜索結(jié)果。在一些示例中,本地實體數(shù)據(jù)存儲130a和外來實體數(shù)據(jù)存儲130b可以被編輯來 包括分別與第一語言(例如,查詢語言)或第二語言(例如,翻譯的查詢語言)相關(guān)聯(lián)的專 有名詞。例如,本地實體和外來實體可以包括在相應(yīng)語言中使用的商標(biāo)名稱、與語言相關(guān)聯(lián) 的位置、名人、電視節(jié)目、產(chǎn)品等。可以假設(shè)這樣的實體在其相應(yīng)語言中具有比這樣的實體 在另一種語言中具有更好的結(jié)果。在一些實施方式中,例如可以使用百科全書(例如,電子 百科全書)和/或諸如用來提供地圖的那些的位置服務(wù)器,來編輯本地實體數(shù)據(jù)存儲130a 和外來實體數(shù)據(jù)存儲130b。在一些實施方式中,可以從本地實體數(shù)據(jù)存儲130a和/或外來 實體數(shù)據(jù)存儲130b移除對于用來提交查詢的語言而言是本地的通用詞語和/或位置。在一些實施方式中,可以將包括在數(shù)據(jù)庫中的外來和本地實體與查詢統(tǒng)計(例 如,實體先前被查詢過多少次)進行比較以確保來自百科全書的每一個外來或本地實體應(yīng) 當(dāng)被包括在實體的列表中。例如,基于如果沒有搜索者對實體感興趣,則同樣極少有發(fā)布者 對該實體感興趣的暗示,在許多先前查詢中沒有出現(xiàn)的實體可能不會致使找到相關(guān)網(wǎng)頁。 替選地,實體在許多先前查詢中沒有出現(xiàn)的事實可以是對該實體是拼寫或語法錯誤并且應(yīng) 當(dāng)從考慮中排除的指示。在一些實施方式中,可以將查詢評估模塊120耦接到翻譯服務(wù)122。在一些示例 中,翻譯服務(wù)122可以接收搜索查詢并且翻譯搜索查詢以產(chǎn)生翻譯的搜索查詢。在一些實 施方式中,翻譯服務(wù)122還可以產(chǎn)生與翻譯的查詢相關(guān)聯(lián)的置信值。例如,置信值可以提供 與搜索查詢的翻譯相關(guān)聯(lián)的置信。在一些實施方式中,查詢評估模塊120可以包括翻譯質(zhì)量過濾器230。翻譯質(zhì)量過 濾器230可以確定翻譯的搜索查詢是否被精確翻譯的可能性。例如,如果第一語言(例如, 查詢語言)的單詞具有第二語言的許多翻譯,則可能很難確定多個單詞中的哪個是在翻譯 中使用的適當(dāng)單詞。與單詞相關(guān)聯(lián)的潛在翻譯越多,所選擇的翻譯是正確的可能越小。因 此,在翻譯的web查詢不滿足置信/質(zhì)量閾值的那些情況下,翻譯質(zhì)量過濾器230可以確定 從翻譯服務(wù)122接收的翻譯的搜索查詢不會產(chǎn)生關(guān)于原始查詢的相關(guān)結(jié)果。在這樣的情況 下,查詢評估模塊120可以將翻譯的搜索查詢排除于適合跨語言搜索之外,并且派發(fā)原始 搜索查詢的結(jié)果。在一些實施方式中,查詢評估模塊120可以包括閾值相關(guān)性過濾器240。閾值相關(guān)性過濾器240可以將翻譯的搜索查詢發(fā)送給搜索引擎124。搜索引擎可以從文檔語料庫 126識別相關(guān)網(wǎng)頁,并且提供相關(guān)網(wǎng)頁和與相關(guān)網(wǎng)頁相關(guān)聯(lián)的相關(guān)性分值。閾值相關(guān)性過 濾器240可以將從搜索引擎124接收的與翻譯的搜索查詢相關(guān)聯(lián)的結(jié)果的相關(guān)性分值與閾 值相關(guān)性分值進行比較以確定翻譯的搜索查詢是否產(chǎn)生相關(guān)得足以向用戶派發(fā)的結(jié)果。例 如,用戶可以輸入德語搜索查詢??梢苑g該德語搜索查詢以產(chǎn)生英語搜索查詢。英語搜 索查詢可以被用來基于與英語網(wǎng)頁中的每一個相關(guān)聯(lián)的相關(guān)性分值,識別與英語搜索查詢 有關(guān)的英語網(wǎng)頁。可以將英語網(wǎng)頁的相關(guān)性分值與閾值相關(guān)性分值進行比較以確定英語網(wǎng) 頁是否相關(guān)得足以向搜索者返回。例如,如果英語頁面相對不相關(guān),則不會翻譯英語頁面來 作為德語搜索查詢的結(jié)果展示。在與英語網(wǎng)頁相關(guān)聯(lián)的相關(guān)性分值不滿足閾值相關(guān)性分值 的那些情況下,可以將產(chǎn)生自德語搜索查詢的德語網(wǎng)頁派發(fā)給搜索者。在一些實施方式中,查詢評估模塊120可以包括相關(guān)性比較過濾器250。相關(guān)性比 較過濾器250將原始搜索查詢和翻譯的查詢傳送給搜索引擎124。搜索引擎124可以從文 檔語料庫126識別相關(guān)網(wǎng)頁,并且提供針對搜索查詢和翻譯的搜索查詢的相關(guān)網(wǎng)頁。搜索 引擎124還可以提供與原始搜索查詢的相關(guān)網(wǎng)頁相關(guān)聯(lián)的第一相關(guān)性分值和與翻譯的搜 索查詢的相關(guān)網(wǎng)頁相關(guān)聯(lián)的第二相關(guān)性分值。在一些實施方式中,相關(guān)性比較過濾器250 可以將第一相關(guān)性分值與第二相關(guān)性分值進行比較。如果第二相關(guān)性分值高于第一相關(guān)性 分值,則可以使用翻譯的搜索查詢。否則,可以使用原始搜索查詢。在一些實施方式中,可 以不考慮與來自翻譯的搜索查詢的結(jié)果相關(guān)聯(lián)的第二相關(guān)性分值。例如,可以將英語的網(wǎng) 頁翻譯成德語,但是其可能很難閱讀。因此,在這些實施方式中,可以在比較時考慮與翻譯 的網(wǎng)頁相關(guān)聯(lián)的可讀性因素,因而喜好提交搜索查詢的語言的網(wǎng)頁。
在一些實施方式中,諸如圖2中所示,對于適合跨語言搜索的搜索查詢,必須滿足 過濾器中的每一個。在其它實施方式中,對于適合跨語言搜索的搜索查詢,可以滿足過濾器 中的任何過濾器。也可以使用除圖IA-C和2的實施方式外的其它實施方式來幫助跨語言搜索。例 如,圖3-7概述其中只有單個過濾器可以被包括在查詢評估模塊中的不同的實施方式。也 可以使用過濾器的任何子集的組合。圖3是圖示另一個示例跨語言搜索系統(tǒng)300的框圖。在圖3的實施方式中,實體 數(shù)據(jù)庫340、350可以由遠離跨語言搜索系統(tǒng)300的系統(tǒng)提供??缯Z言搜索系統(tǒng)300可以包 括輸入模塊310。輸入模塊310可以可操作來接收搜索查詢。在一些實施方式中,輸入模 塊310可以從客戶端設(shè)備接收搜索查詢。在其它實施方式中,輸入模塊310可以通過搜索 引擎接口接收搜索查詢??缯Z言搜索系統(tǒng)300與翻譯服務(wù)320通信。翻譯服務(wù)320可以從輸入模塊310接 收搜索查詢。在一些實施方式中,翻譯服務(wù)320可以翻譯來自第一語言的搜索查詢以產(chǎn)生 第二語言的翻譯搜索查詢。在一些實施方式中,翻譯模塊可以翻譯搜索查詢以產(chǎn)生可以被 用來執(zhí)行跨語言搜索的多個翻譯的搜索查詢。在一些實施方式中,翻譯模塊320還可以產(chǎn) 生與翻譯相關(guān)聯(lián)的翻譯置信分值。翻譯置信分值可以識別與翻譯的搜索查詢相關(guān)聯(lián)的置
fn °在一些實施方式中,跨語言搜索系統(tǒng)可以包括查詢評估模塊330。查詢評估模塊 330可以評估搜索查詢以確定搜索查詢是否是用于執(zhí)行跨語言搜索的候選。在一些實施方式中,查詢評估模塊可以識別在翻譯成語言時會產(chǎn)生相關(guān)結(jié)果的那些查詢。例如,查詢評 估模塊330可以將與翻譯相關(guān)聯(lián)的置信分值與閾值置信分值進行比較。在這樣的示例中, 由于翻譯置信分值低于閾值的翻譯的搜索查詢可能不會產(chǎn)生相關(guān)結(jié)果,所以查詢評估模塊 330可以從跨語言搜索排除具有低于閾值的置信分值的翻譯的搜索查詢。在其它示例中,查詢評估模塊330可以確定翻譯的搜索查詢是否與對于與翻譯的搜索查詢相關(guān)聯(lián)的語言是本地的實體相關(guān)聯(lián)。在這樣的示例中,用戶可能輸入“Al Qahira”,以及查詢評估模塊可以確定“Al Qahira”是阿拉伯語的本地實體。因此,查詢評 估模塊可以確定阿拉伯語的結(jié)果可能比來自英語網(wǎng)頁的結(jié)果與搜索查詢更相關(guān)。在又一些示例中,查詢評估模塊330可以確定來自翻譯的搜索查詢的結(jié)果是否滿 足最小相關(guān)性閾值。在這樣的示例中,查詢評估模塊330可以將翻譯的搜索查詢傳送給搜 索服務(wù)360。搜索服務(wù)360可以向查詢評估模塊330提供與翻譯的搜索查詢相關(guān)的結(jié)果和 與來自翻譯的搜索查詢的結(jié)果相關(guān)聯(lián)的相關(guān)性分值。在一些示例中,查詢評估模塊330可以將原始搜索查詢和翻譯的搜索查詢傳送給 搜索服務(wù)360。搜索服務(wù)360可以將與原始搜索查詢相關(guān)的結(jié)果的第一集合和與翻譯的搜 索查詢相關(guān)的結(jié)果的第二集合提供給查詢評估模塊360。搜索服務(wù)360還可以提供與結(jié)果 的第一集合相關(guān)聯(lián)的第一相關(guān)性分值和與結(jié)果的第二集合相關(guān)聯(lián)的第二相關(guān)性分值。查詢 評估模塊可以確定第一相關(guān)性分值是否高于第二相關(guān)性分值。在一些實施方式中,可以相 似地計算第一相關(guān)性分值和第二相關(guān)性分值,使得來自不同語言的相似相對結(jié)果的分值是 可比較的。在其它實施方式中,第一相關(guān)性分值或第二相關(guān)性分值可以經(jīng)歷到統(tǒng)一相關(guān)性 標(biāo)度的變換。圖4是圖示查詢評估模塊330a的實施方式的框圖。在一些實施方式中,查詢評估 模塊330a可以包括本地實體過濾器模塊410,其可操作來確定原始搜索查詢是否與對于原 始搜索查詢的語言是本地的實體有關(guān)。在這些實施方式中,本地實體過濾器模塊410可以 確定包括在原始搜索查詢中的標(biāo)志中的任何標(biāo)志是否與包括在本地實體數(shù)據(jù)存儲340中 的任何實體相匹配。如果搜索查詢的標(biāo)志中的一個或多個對于原始搜索查詢的語言是本地 的,則查詢評估模塊可以將原始搜索查詢(和/或來自原始搜索查詢的結(jié)果)發(fā)送給輸出 模塊(例如,圖3的輸出模塊370)。替選地,在一些實施方式中,如果原始搜索查詢的標(biāo)志對于原始搜索查詢的語言 不是本地的,則查詢評估模塊可以包括外來實體過濾器模塊430。外來實體過濾器模塊430 可以確定搜索查詢是否與外來實體(例如,對于原始搜索查詢的語言是外來的實體)有關(guān)。 例如,如果搜索者輸入了阿拉伯語的“Yankee Stadium"的等價物,則可以假設(shè)來自英語網(wǎng) 頁的結(jié)果比來自阿拉伯語網(wǎng)頁的結(jié)果與搜索查詢更相關(guān)。在這些實施方式中,外來實體過 濾器模塊430可以識別包括在搜索查詢中的標(biāo)志中的任何標(biāo)志是否與包括在外來實體數(shù) 據(jù)存儲350中的實體中的任何實體相匹配。在一些實施方式中,如果搜索查詢不與包括在 外來實體數(shù)據(jù)庫440中的外來實體中的任何外來實體有關(guān),則可以將原始搜索查詢傳送給 輸出模塊(例如,圖3的輸出模塊370)。在其它實施方式中,如果搜索查詢不與本地實體 340中的任何本地實體有關(guān)并且搜索查詢不與外來實體350中的任何外來實體有關(guān),則查 詢評估模塊330可以執(zhí)行對搜索查詢和/或翻譯的搜索查詢的進一步評估。在一些實施方式中,在搜索查詢與外來實體350中的一個相關(guān)聯(lián)時,查詢評估模塊330a可以包括查詢頻率模塊450,其可操作來確定翻譯的搜索查詢是否使用頻繁得足以 可能產(chǎn)生相關(guān)結(jié)果。例如,如果翻譯的搜索查詢不以某一頻率被使用,則可能搜索者或發(fā)布 者對主題沒有什么興趣。因此,可能不存在許多與翻譯的搜索查詢相關(guān)的網(wǎng)頁,以及翻譯的 搜索查詢不可能產(chǎn)生比原始搜索查詢更好的結(jié)果。在一些實施方式中,查詢頻率模塊450 可以基于從搜索服務(wù)360檢索的查詢統(tǒng)計來導(dǎo)出搜索查詢的受歡迎度。查詢統(tǒng)計可以包括 搜索查詢由客戶端先前發(fā)出的次數(shù)。如果與翻譯的搜索查詢相關(guān)聯(lián)的查詢統(tǒng)計滿足閾值頻 率,則可以將翻譯的搜索查詢發(fā)送給輸出模塊(例如,圖3的輸出模塊370)。如果與翻譯的 搜索查詢相關(guān)聯(lián)的查詢統(tǒng)計不滿足閾值頻率,則可以將原始搜索查詢發(fā)送給輸出模塊。在 其它實施方式中,如果查詢頻率模塊450沒有找到閾值頻率,則查詢評估模塊330a可以執(zhí) 行對搜索查詢和/或翻譯的搜索查詢的進一步評估。 圖5是圖示另一個查詢評估模塊330b的實施方式的框圖。在一些實施方式中,查 詢評估模塊330b可以包括翻譯評估模塊510。翻譯評估模塊510可以從翻譯服務(wù)320接收 與翻譯的搜索查詢相關(guān)聯(lián)的置信分值。翻譯服務(wù)320可以基于與翻譯相關(guān)聯(lián)的置信來導(dǎo)出 翻譯置信分值。置信可以基于翻譯是正確的可能性,例如,基于可用于搜索查詢的替選翻譯 的數(shù)量。在一些實施方式中,翻譯評估模塊510可以將與翻譯的搜索查詢相關(guān)聯(lián)的置信分 值與閾值置信分值進行比較。在這樣的實施方式中,閾值置信分值可以識別與可能產(chǎn)生相 關(guān)結(jié)果的翻譯的搜索查詢相關(guān)聯(lián)的最小置信。如果翻譯置信分值低于閾值置信分值,則可 以將原始搜索查詢發(fā)送給輸出模塊(例如,圖3的輸出模塊370)。否則可以將翻譯的搜索 查詢發(fā)送給輸出模塊。圖6是圖示另一個查詢評估模塊330c的實施方式的框圖。在一些實施方式中,查 詢評估模塊330c可以包括相關(guān)性模塊610,其可操作來將翻譯的搜索查詢傳送給搜索引擎 360。搜索引擎360可以導(dǎo)出與識別與翻譯的搜索查詢相關(guān)的網(wǎng)頁的結(jié)果相關(guān)聯(lián)的相關(guān)性 分值并且將結(jié)果的相關(guān)性分值提供給相關(guān)性模塊610。在一些實施方式中,查詢評估模塊330c可以包括比較模塊620,其可操作來將通 過相關(guān)性模塊610從搜索引擎360接收的相關(guān)性分值與閾值相關(guān)性分值進行比較。閾值相 關(guān)性分值可以是對可能產(chǎn)生搜索者感興趣的結(jié)果的翻譯的搜索查詢的最小相關(guān)性的測量。 如果與翻譯的查詢相關(guān)聯(lián)的相關(guān)性分值低于閾值相關(guān)性分值,則查詢評估模塊330c可以 將原始搜索查詢發(fā)送給輸出模塊(例如,圖3的輸出模塊370)。替選地,如果與翻譯的搜索 查詢的相關(guān)聯(lián)的相關(guān)性分值高于閾值相關(guān)性分值,則查詢評估模塊330c可以將翻譯的搜 索查詢發(fā)送給輸出模塊。圖7是圖示另一個查詢評估模塊330d的實施方式的框圖。在一些實施方式中,查 詢評估模塊330d可以包括第一相關(guān)性模塊710和第二相關(guān)性模塊720。第一相關(guān)性模塊 710可以將原始搜索查詢發(fā)送給搜索服務(wù)360。搜索服務(wù)360可以識別與原始搜索查詢相 關(guān)聯(lián)的相關(guān)性分值的第一集合并且將相關(guān)性分值的第一集合和包括第一語言的相關(guān)網(wǎng)頁 的結(jié)果的第一集合提供給第一相關(guān)性模塊710。第二相關(guān)性模塊720可以將翻譯的搜索查詢傳送給搜索服務(wù)360。搜索服務(wù)360可 以識別與翻譯的搜索查詢相關(guān)聯(lián)的相關(guān)性分值的第二集合。搜索服務(wù)360可以將相關(guān)性分 值的第二集合和包括第二語言的相關(guān)網(wǎng)頁的結(jié)果的第二集合提供給第二相關(guān)性模塊720。
在一些實施方式中,查詢評估模塊330d可以包括比較模塊730。比較模塊730可 以比較相關(guān)性分值的第一集合和第二相關(guān)性分值以確定是原始搜索查詢還是翻譯的搜索 查詢產(chǎn)生更相關(guān)的搜索結(jié)果。在一些實施方式中,如果第一相關(guān)性分值高于第二相關(guān)性分 值,則可以將與原始搜索查詢相關(guān)聯(lián)的結(jié)果的第一集合發(fā)送給輸出模塊(例如,圖3的輸出 模塊370)。如果第二相關(guān)性分值高于第一相關(guān)性分值,則可以將與翻譯的搜索查詢相關(guān)聯(lián) 的結(jié)果的第二集合發(fā)送給輸出模塊。在一些實施方式中,如果第二相關(guān)性分值不顯著高于 第一相關(guān)性分值,則比較模塊可以偏向于選擇與原始搜索查詢相關(guān)聯(lián)的結(jié)果。在一些實施方式中,關(guān)于圖4-7公開的查詢評估模塊330a_d的實施方式中的任何 實施方式可以與其它查詢評估模塊330a_d中的任何一個或多個組合。圖8是圖示提供跨語言搜索的示例過程800的流程圖。過程800接收搜索查詢 (805)。搜索查詢可以例如由輸入模塊(例如,圖IB的輸入模塊110)接收。在一些實施方 式中,搜索查詢可以從搜索引擎接收。例如,跨語言搜索系統(tǒng)可以是可操作來通過應(yīng)用編程 接口(API)接收搜索查詢的外接式組件或第三方搜索組件。在其它實施方式中,跨語言搜 索系統(tǒng)可以被集成到搜索引擎中,使得輸入模塊為搜索引擎接口網(wǎng)頁。在又一些實施方式 中,輸入模塊可以包括在客戶端設(shè)備上操作的客戶端軟件組件,其可操作來截取搜索查詢。過程獲取翻譯的搜索查詢(810)。翻譯的搜索查詢可以例如由查詢評估模塊(例 如,圖IB的查詢評估模塊120)從翻譯服務(wù)(例如,圖IB的翻譯服務(wù)122)獲取。在一些實 施方式中,翻譯服務(wù)可以產(chǎn)生翻譯的搜索查詢和與翻譯的搜索查詢相關(guān)聯(lián)的置信分值。置 信分值可以指示翻譯是正確的置信。過程將搜索查詢和翻譯的搜索查詢傳送給搜索引擎(815)。搜索查詢和翻譯的搜 索查詢可以例如由查詢評估模塊(例如,圖IB的查詢評估模塊120)傳送給搜索引擎。在 一些實施方式中,翻譯的搜索查詢可以包括原始搜索查詢的多個翻譯,其中每一個是原始 搜索查詢的不同翻譯(例如,同一語言或不同語言的)。過程接收結(jié)果和相關(guān)性分值(820)。結(jié)果和相關(guān)性分值可以例如由查詢評估模塊 (例如,圖IB的查詢評估模塊120)從搜索引擎(例如,圖IB的搜索引擎124)接收。結(jié)果 和相關(guān)性分值可以包括與原始搜索查詢相關(guān)聯(lián)的結(jié)果的第一集合和相關(guān)性分值的第一集 合。結(jié)果和相關(guān)性分值還可以包括與翻譯的搜索查詢相關(guān)聯(lián)的結(jié)果的第二集合和相關(guān)性分 值的第二集合。過程評估來自搜索查詢和翻譯的搜索查詢的結(jié)果和相關(guān)性分值(825)。結(jié)果和相 關(guān)性分值可以例如由查詢評估模塊(例如,圖IB的查詢評估模塊120)評估。在一些實施 方式中,可以將搜索查詢與本地和外來實體的列 表進行比較、可以使用置信分值來測試翻 譯質(zhì)量、可以針對最小相關(guān)性閾值測試翻譯的搜索查詢結(jié)果的相關(guān)性分值、和/或可以基 于分別與查詢的結(jié)果相關(guān)聯(lián)的第一和第二相關(guān)性分值將原始搜索查詢結(jié)果與來自翻譯的 搜索查詢的結(jié)果進行比較。過程基于評估的結(jié)果來派發(fā)結(jié)果(830)。結(jié)果可以例如由輸出模塊(例如,圖IB 的輸出模塊140)派發(fā)。在一些實施方式中,結(jié)果可以包括來自原始搜索查詢和/或翻譯的 搜索查詢的結(jié)果。在其它實施方式中,結(jié)果可以包括與原始搜索查詢或與翻譯的搜索查詢 最相關(guān)的網(wǎng)頁的列表。圖9是圖示提供跨語言搜索的示例過程900的流程圖。過程接收搜索查詢(905)。搜索查詢可以例如由輸入模塊(例如,圖IB的輸入模塊110)接收。在一些實施方式中,搜 索查詢可以從搜索引擎接口接收。例如,跨語言搜索系統(tǒng)可以是可操作來從搜索引擎接口 接收搜索查詢的外接式組件或第三方搜索組件。在其它實施方式中,跨語言搜索系統(tǒng)可以 被集成到搜索引擎中,使得輸入模塊為搜索引擎接口網(wǎng)頁。在又一些實施方式中,輸入模塊 可以包括在客戶端設(shè)備上操作的客戶端軟件組件,其可操作來截取搜索查詢。過程獲取翻譯的搜索查詢(910)。翻譯的搜索查詢可以例如由查詢評估模塊(例 如,圖IB的查詢評估模塊120)從翻譯服務(wù)(例如,圖IB的翻譯服務(wù)122)獲取。在一些實 施方式中,翻譯服務(wù)可以產(chǎn)生翻譯的搜索查詢和與翻譯的搜索查詢相關(guān)聯(lián)的置信分值。置 信分值可以指示翻譯是正確的置信。過程獲取來自原始搜索查詢和翻譯的搜索查詢的結(jié)果的相關(guān)性分值(915)。對于 原始搜索查詢和翻譯的搜索查詢結(jié)果的相關(guān)性分值可以例如由查詢評估模塊(例如,圖IB 的查詢評估模塊120)從搜索引擎(例如,圖IB的搜索引擎124)獲取。在一些實施方式中, 可以將原始搜索查詢和翻譯的搜索查詢傳送給搜索引擎。搜索引擎可以提供與原始搜索查 詢相關(guān)聯(lián)的結(jié)果的第一集合和相關(guān)性分值的第一集合,以及與翻譯的搜索查詢相關(guān)聯(lián)的結(jié) 果的第二集合和相關(guān)性分值的第二集合。過程可以比較搜索查詢和翻譯的搜索查詢的結(jié)果(920)。搜索查詢和翻譯的搜索 查詢的結(jié)果可以例如由查詢評估模塊(例如,圖IB的查詢評估模塊120)比較。在一些實 施方式中,比較原始搜索查詢和翻譯的搜索查詢的結(jié)果可以包括將相關(guān)性分值的第一集合 與相關(guān)性分值的第二集合進行比較。在一些實施方式中,可以比較相關(guān)性分值的第一集合 與相關(guān)性分值的第二集合以基于如由相應(yīng)的相關(guān)性分值所指示的哪個搜索查詢具有更相 關(guān)的結(jié)果來確定是使用原始搜索查詢還是翻譯的搜索查詢。如果過程確定原始搜索查詢產(chǎn)生更相關(guān)的結(jié)果,則過程派發(fā)原始搜索查詢的結(jié)果 (925)。原始搜索查詢結(jié)果可以例如由輸出模塊(例如,圖IB的輸出模塊140)協(xié)同查詢評 估模塊(例如,圖IB的查詢評估模塊120)來派發(fā)。在一些實施方式中,可以將搜索查詢的 結(jié)果派發(fā)給提交該搜索查詢的客戶端設(shè)備。如果過程確定翻譯的搜索查詢產(chǎn)生更相關(guān)的結(jié)果,則過程派發(fā)翻譯的搜索查詢的 結(jié)果(930)。翻譯的搜索查詢結(jié)果可以例如由輸出模塊(例如,圖IB的輸出模塊140)協(xié)同 查詢評估模塊(例如,圖IB的查詢評估模塊120)來派發(fā)。在一些實施方式中,可以將翻譯 的搜索查詢的結(jié)果派發(fā)給提交搜索查詢的客戶端設(shè)備。圖10是圖示提供跨語言搜索的另一個示例方法的流程圖。過程接收搜索查詢 (1005)。搜索查詢可以例如由輸入模塊(例如,圖IB的輸入模塊110)接收。在一些實施 方式中,搜索查詢可以從搜索引擎接口接收。例如,跨語言搜索系統(tǒng)可以是可操作來從搜索 引擎接口接收搜索查詢的外接式組件或第三方搜索組件。在其它實施方式中,跨語言搜索 系統(tǒng)可以被集成到搜索引擎中,使得輸入模塊為搜索引擎接口網(wǎng)頁。在又一些實施方式中, 輸入模塊可以包括在客戶端設(shè)備上操作的客戶端軟件組件,其可操作來截取搜索查詢。過程獲取翻譯的 搜索查詢(1010)。翻譯的搜索查詢可以例如由查詢評估模塊(例 如,圖IB的查詢評估模塊120)從翻譯模塊(例如,圖IB的翻譯服務(wù)122)獲取。在一些實 施方式中,翻譯服務(wù)可以提供翻譯的搜索查詢和與翻譯的搜索查詢相關(guān)聯(lián)的置信分值。置 信分值可以指示翻譯是正確的置信。
過程獲取來自翻譯的搜索查詢的結(jié)果(1015)。翻譯的搜索查詢結(jié)果可以例如由查 詢評估模塊(例如,圖IB的查詢評估模塊120)獲取。在一些實施方式中,可以將翻譯的搜 索查詢傳送給搜索引擎(例如,圖IB的搜索引擎124)。搜索引擎可以識別與翻譯的搜索查 詢相關(guān)的網(wǎng)頁的集合以及與相關(guān)網(wǎng)頁的集合相關(guān)聯(lián)的相關(guān)性分值的集合。搜索引擎可以將 結(jié)果(例如,相關(guān)網(wǎng)頁和相關(guān)聯(lián)的相關(guān)性分值)提供給查詢評估模塊。過程確定翻譯的搜索查詢的結(jié)果是否是令人滿意的(1020)。對翻譯的搜索查詢結(jié) 果是否是令人滿意的確定例如可以由查詢評估模塊(例如,圖IB的查詢評估模塊120)執(zhí) 行。在一些實施方式中,對來自翻譯的搜索查詢的結(jié)果是否是令人滿意的確定可以基于相 關(guān)性分值的集合(例如,單個地或聚合地)滿足最小相關(guān)性分值閾值、與翻譯的搜索查詢相 關(guān)聯(lián)的結(jié)果的相關(guān)性分值好于與原始搜索查詢相關(guān)聯(lián)的結(jié)果的相關(guān)性分值、與翻譯的搜索 查詢相關(guān)聯(lián)的翻譯置信分值滿足最小置信閾值、或來自搜索查詢或翻譯的搜索查詢的標(biāo)志 與來自實體數(shù)據(jù)存儲的實體相匹配。如果過程確定翻譯的搜索查詢的結(jié)果不是令人滿意的,則過程派發(fā)原始搜索查詢 的結(jié)果(1025)。原始搜索查詢的結(jié)果可以例如由查詢評估模塊(例如,圖IB的查詢評估模 塊120)協(xié)同輸出模塊(例如,圖IB的輸出模塊140)來派發(fā)。在一些實施方式中,可以將 搜索查詢的結(jié)果派發(fā)給提交該搜索查詢的客戶端設(shè)備。
如果過程確定翻譯的搜索查詢的結(jié)果是令人滿意的,則過程派發(fā)翻譯的搜索查詢 的結(jié)果(1030)。翻譯的搜索查詢的結(jié)果可以例如由查詢評估模塊(例如,圖IB的查詢評估 模塊120)協(xié)同輸出模塊(例如,圖IB的輸出模塊140)來派發(fā)。在一些實施方式中,可以 將翻譯的搜索查詢的結(jié)果派發(fā)給提交搜索查詢的客戶端設(shè)備。在本說明書中描述的主題和功能性操作的實施例可以在數(shù)字電子電路,或者在計 算機軟件、固件或硬件,包括在本說明書中公開的結(jié)構(gòu)以及其結(jié)構(gòu)等價物,或者在以上的一 個或多個的組合中實現(xiàn)??梢詫⒃诒菊f明書中描述的主題的實施例實現(xiàn)為一個或多個計算 機程序產(chǎn)品,即編碼在有形的程序載體上的、由數(shù)據(jù)處理裝置執(zhí)行或控制數(shù)據(jù)處理裝置的 操作的計算機程序指令的一個或多個模塊。有形的程序載體可以是傳播信號或計算機可讀 介質(zhì)。傳播信號是非自然生成的信號,例如機器生成的電的、光學(xué)或電磁的信號,其被生成 以編碼用于傳輸?shù)竭m當(dāng)接收器裝置的信息以供計算機執(zhí)行。計算機可讀介質(zhì)可以是機器可 讀存儲設(shè)備、機器可讀存儲基片、存儲器設(shè)備、形成機器可讀傳播信號的物質(zhì)成分或以上的 一個或多個的組合。術(shù)語“數(shù)據(jù)處理裝置”包含用于處理數(shù)據(jù)的所有裝置、設(shè)備以及機器,包括例如可 編程處理器、計算機或多個處理器或計算機。除硬件外所述裝置可以包括創(chuàng)建用于討論中 的計算機程序的執(zhí)行環(huán)境的代碼,例如構(gòu)成處理器固件、協(xié)議堆棧、數(shù)據(jù)庫管理系統(tǒng)、操作 系統(tǒng)或以上一個或多個的組合的代碼。計算機程序(也稱作程序、軟件、軟件應(yīng)用、腳本或代碼)可以以任何形式的編程 語言編寫,所述編程語言包括編譯或解釋語言,或者說明性或過程性語言,并且其可以以任 何形式部署,包括作為獨立程序或作為模塊、組件、子程序或適于在計算環(huán)境中使用的其它 單元。計算機程序沒有必要對應(yīng)于文件系統(tǒng)中的文件。程序可以被存儲在保持其它程序或 數(shù)據(jù)的文件(例如,存儲在標(biāo)記語言文檔中的一個或多個腳本)的一部分、專用于討論中的 程序的單個文件或者多個協(xié)調(diào)文件(例如,存儲一個或多個模塊、子程序或部分代碼的文件)中。計算機程序可以被部署為在一個計算機上或者在位于一個地點或跨多個地點分布 并且由通信網(wǎng)絡(luò)互連的多個計算機上執(zhí)行。在本說明書中描述的過程和邏輯流可以由執(zhí)行一個或多個計算機程序的一個或 多個可編程處理器執(zhí)行以通過操作輸入數(shù)據(jù)并生成輸出來執(zhí)行功能。過程和邏輯流還可 以通過專用邏輯電路執(zhí)行,以及裝置還可以被實現(xiàn)為專用邏輯電路,專用邏輯電路例如 FPGA (場可編程門陣列)或ASIC (專用集成電路)。
適于執(zhí)行計算機程序的處理器包括例如通用和專用微處理器兩者,以及任何類型 的數(shù)字計算機的任何一個或多個處理器。通常,處理器將從只讀存儲器或隨機存取存儲器 或兩者接收指令和數(shù)據(jù)。計算機的主要元件是用于執(zhí)行指令的處理器和用于存儲指令和數(shù) 據(jù)的一個或多個存儲器設(shè)備。通常,計算機還包括用于存儲數(shù)據(jù)的一個或多個海量存儲設(shè) 備,例如磁盤、磁光盤或光盤,或可操作地耦接到所述一個或多個海量存儲設(shè)備以從其接收 數(shù)據(jù)或向其傳送數(shù)據(jù),或者兩者。然而,計算機不必具有這樣的設(shè)備。此外,計算機能夠被 嵌入另一個設(shè)備中,所述設(shè)備例如移動電話、個人數(shù)字助理(PDA)、移動音頻或視頻播放器、 游戲控制臺、全球定位系統(tǒng)(GPS)接收器,僅列出一些。適于存儲計算機程序指令和數(shù)據(jù)的計算機可讀介質(zhì)包括所有形式的非易失性存 儲器、媒體和存儲器設(shè)備,例如包括半導(dǎo)體存儲器設(shè)備,例如EPROM、EEPROM和閃存設(shè)備; 磁盤,例如內(nèi)部硬盤或活動盤;磁光盤;以及⑶ROM和DVD ROM盤。處理器和存儲器可以由 專用邏輯電路補充,或合并入專用邏輯電路。為了提供與用戶的交互,本說明書中描述的主題的實施例可以在具有下述的計算 機上實現(xiàn)用于向用戶顯示信息的顯示設(shè)備,例如CRT(陰極射線管)或LCD(液晶顯示)監(jiān) 視器,以及用戶通過其可以向計算機提供輸入的鍵盤和指示設(shè)備,例如鼠標(biāo)或跟蹤球。也可 以使用其它類型的設(shè)備來提供與用戶的交互;例如,提供給用戶的反饋可以是任何形式的 感知反饋,例如視覺反饋、聽覺反饋或觸覺反饋;以及可以以任何形式,包括聲學(xué)的、話語或 觸覺的輸入,接收來自用戶的輸入。本說明書中描述的主題的實施例可以在包括例如作為數(shù)據(jù)服務(wù)器的后端組件、或 包括例如應(yīng)用服務(wù)器的中間件組件、或包括例如具有用戶通過其可以與在本說明書中描述 的主題的實施方式交互的圖形用戶界面或Web瀏覽器的客戶端計算機的前端組件、或者一 個或多個這樣的后端、中間件或前端組件的任何組合的計算系統(tǒng)中實現(xiàn)。系統(tǒng)的組件可以 通過例如通信網(wǎng)絡(luò)的任何形式或介質(zhì)的數(shù)字數(shù)據(jù)通信互連。通信網(wǎng)絡(luò)的示例包括局域網(wǎng) (“LAN")和例如因特網(wǎng)的廣域網(wǎng)(“WAN")。計算系統(tǒng)可以包括客戶端和服務(wù)器??蛻舳撕头?wù)器通常彼此遠離并且典型地 通過通信網(wǎng)絡(luò)交互??蛻舳撕头?wù)器的關(guān)系依靠在各個計算機上運行并且彼此具有客戶 端_服務(wù)器關(guān)系的計算機程序產(chǎn)生。雖然本說明書包含許多具體實施方式
細節(jié),但是這些細節(jié)不應(yīng)當(dāng)被解釋為對任何 發(fā)明或者所主張的內(nèi)容的范圍的限定,而應(yīng)當(dāng)被解釋為針對特定發(fā)明的特定實施例的特征 的描述。在本說明書中在分離的實施例的語境中描述的某些特征也可以在以單個實施例的 組合中實現(xiàn)。相反地,在單個實施例的語境中描述的各種特征也可以分離地在多個實施例 中實現(xiàn)或者在任何適當(dāng)?shù)淖咏M合中實現(xiàn)。此外,盡管特征可能在上面被描述為在某些組合 中起作用,甚至最初主張如此,但是來自所主張的組合的一個或多個特征在一些情況下可以從組合中刪去,并且所主張的組合可以指向子組合或者子組合的變體。類似地,雖然在附圖中以特定順序描述了操作,但是不應(yīng)當(dāng)理解為需要這樣的操 作以所示的特定順序被執(zhí)行或者以連續(xù)順序被執(zhí)行、或者需要全部圖示的操作均被執(zhí)行才 能實現(xiàn)所期望的結(jié)果。在某些環(huán)境中,多任務(wù)以及并行處理可以是有利的。此外,在如上所 述實施例中的各種系統(tǒng)組件的分離不應(yīng)當(dāng)被理解為在全部實施例中均需要這樣的分離,而 應(yīng)當(dāng)理解的是,描述的程序組件和系統(tǒng)通??梢员患傻揭黄鸪蔀閱蝹€軟件產(chǎn)品或封裝為 多個軟件產(chǎn)品。已描述了本說明書中描述的主題的特定實 施例。其它實施例在所附權(quán)利要求的范 圍內(nèi)。例如,權(quán)利要求中記載的行為可以以不同的順序來執(zhí)行并且仍然實現(xiàn)所期望的結(jié)果。 作為一個示例,在附圖中描述的過程不必需要所示出的特定順序或者連續(xù)順序才能實現(xiàn)所 期望的結(jié)果。在某些實施方式中,多任務(wù)以及并行處理可以是有利的。
權(quán)利要求
一種計算機實現(xiàn)的方法,包括從客戶端設(shè)備接收搜索查詢,所述搜索查詢是以第一語言提交的;獲取翻譯的搜索查詢,所述翻譯的搜索查詢是所述搜索查詢到第二語言的翻譯;接收對所述搜索查詢作出響應(yīng)的結(jié)果的第一集合以及對所述翻譯的搜索查詢作出響應(yīng)的結(jié)果的第二集合,所述結(jié)果的第一集合包括網(wǎng)頁的第一集合和相關(guān)性分值的第一集合以及所述結(jié)果的第二集合包括網(wǎng)頁的第二集合和相關(guān)性分值的第二集合;將所述相關(guān)性分值的第一集合與所述相關(guān)性分值的第二集合進行比較;以及響應(yīng)于對所述相關(guān)性分值的第一集合與所述相關(guān)性分值的第二集合的所述比較,派發(fā)包括所述結(jié)果的第一集合或所述結(jié)果的第二集合中的一個或兩者的至少部分的結(jié)果頁面。
2.如權(quán)利要求1所述的計算機實現(xiàn)的方法,進一步包括使用與所述網(wǎng)頁的第一集合 的第一部分和所述網(wǎng)頁的第二集合的第二部分相關(guān)聯(lián)的所述相關(guān)性分值,派發(fā)所述第一部 分和所述第二部分,所述第一部分和所述第二部分包括最相關(guān)的結(jié)果。
3.如權(quán)利要求1所述的計算機實現(xiàn)的方法,其中將所述相關(guān)性分值的第一集合與所述 相關(guān)性分值的第二集合進行比較包括聚合所述相關(guān)性分值的第一集合; 聚合所述相關(guān)性分值的第二集合;將所述相關(guān)性分值的第二集合的所述聚合與所述相關(guān)性分值的第一集合的所述聚合 進行比較;其中,如果所述相關(guān)性分值的第二集合的所述聚合大于所述相關(guān)性分值的第一集合的 所述聚合,則派發(fā)來自所述結(jié)果的第二集合的結(jié)果,否則派發(fā)來自所述搜索結(jié)果的第一集 合的結(jié)果。
4.如權(quán)利要求1所述的計算機實現(xiàn)的方法,進一步包括如果對所述相關(guān)性分值的第 一集合和所述相關(guān)性分值的第二集合的所述比較識別所述相關(guān)性分值的第二集合更相關(guān), 則獲取翻譯的網(wǎng)頁,并且基于從所述客戶端設(shè)備接收對所述網(wǎng)頁的選擇來派發(fā)所述翻譯的 網(wǎng)頁。
5.如權(quán)利要求1所述的計算機實現(xiàn)的方法,進一步包括將來自所述相關(guān)性分值的第二集合的相關(guān)性分值的聚合與閾值相關(guān)性分值進行比較;以及如果所述相關(guān)性分值的聚合超過所述閾值相關(guān)性分值,則派發(fā)搜索結(jié)果。
6.如權(quán)利要求1所述的計算機實現(xiàn)的方法,進一步包括 獲取與所述翻譯的搜索查詢相對應(yīng)的先前查詢的數(shù)量; 將所述先前查詢的數(shù)量與查詢的閾值數(shù)量進行比較;以及其中,基于對所述先前查詢的數(shù)量與所述查詢的閾值數(shù)量的所述比較來派發(fā)所述結(jié)果 的第二集合。
7.如權(quán)利要求1所述的計算機實現(xiàn)的方法,其中所述相關(guān)性分值的第一集合和所述相 關(guān)性分值的第二集合每一個包括相關(guān)性因素和排名因素,所述相關(guān)性因素測量來自所述搜 索查詢或所述翻譯的搜索查詢的所述結(jié)果與所述搜索查詢相匹配的程度,以及所述排名因 素測量網(wǎng)頁被其它網(wǎng)頁鏈接的頻率。
8.如權(quán)利要求1所述的計算機實現(xiàn)的方法,其中所述相關(guān)性分值的第一集合基于對來自所述第一搜索查詢的結(jié)果的第一點進率的分析,以及所述相關(guān)性分值的第二集合基于對 來自所述翻譯的搜索查詢的結(jié)果的第二點進率的分析。
9.一種存儲在一個或多個計算機可讀介質(zhì)中并且包括由處理系統(tǒng)可執(zhí)行以及在被執(zhí) 行后促使所述處理系統(tǒng)執(zhí)行操作的指令的軟件,所述操作包括從客戶端設(shè)備接收搜索查詢,所述搜索查詢是以第一語言提交的;獲取翻譯的搜索查詢,所述翻譯的搜索查詢是所述搜索查詢到第二語言的翻譯;接收對所述搜索查詢作出響應(yīng)的結(jié)果的第一集合以及對所述翻譯的搜索查詢作出響 應(yīng)的結(jié)果的第二集合,所述結(jié)果的第一集合包括網(wǎng)頁的第一集合和相關(guān)性分值的第一集合 以及所述結(jié)果的第二集合包括網(wǎng)頁的第二集合和相關(guān)性分值的第二集合;將所述相關(guān)性分值的第一集合與所述相關(guān)性分值的第二集合進行比較;以及基于對所述相關(guān)性分值的第一集合與所述相關(guān)性分值的第二集合的所述比較,派發(fā)包 括所述結(jié)果的第一集合或所述結(jié)果的第二集合中的一個或兩者的至少部分的結(jié)果頁面。
10.如權(quán)利要求9所述的軟件,其中所述指令可被進一步操作來促使所述處理系統(tǒng)執(zhí) 行操作,所述操作包括使用與所述網(wǎng)頁的第一集合的第一部分和所述網(wǎng)頁的第二集合的 第二部分相關(guān)聯(lián)的所述相關(guān)性分值,派發(fā)所述第一部分和所述第二部分,所述第一部分和 所述第二部分包括最相關(guān)的結(jié)果。
11.如權(quán)利要求9所述的軟件,其中所述指令可被進一步操作來促使所述處理系統(tǒng)執(zhí) 行操作,所述操作包括如果對所述相關(guān)性分值的第一集合和所述相關(guān)性分值的第二集合 的所述比較識別所述相關(guān)性分值的第二集合更相關(guān),則獲取翻譯的網(wǎng)頁,并且基于從所述 客戶端設(shè)備接收對所述網(wǎng)頁的選擇來派發(fā)所述翻譯的網(wǎng)頁。
12.如權(quán)利要求9所述的軟件,其中所述指令可被進一步操作來促使所述處理系統(tǒng)執(zhí) 行操作,所述操作包括將來自所述相關(guān)性分值的第二集合的相關(guān)性分值的聚合與閾值相關(guān)性分值進行比較;以及如果所述相關(guān)性分值的聚合超過所述閾值相關(guān)性分值,則派發(fā)搜索結(jié)果。
13.如權(quán)利要求9所述的軟件,其中所述指令可被進一步操作來促使所述處理系統(tǒng)執(zhí) 行操作,所述操作包括獲取與所述翻譯的搜索查詢相對應(yīng)的先前查詢的數(shù)量;將所述先前查詢的數(shù)量與查詢的閾值數(shù)量進行比較;以及其中,基于對所述先前查詢的數(shù)量與所述查詢的閾值數(shù)量的所述比較來派發(fā)所述結(jié)果 的第二集合。
14.如權(quán)利要求9所述的軟件,其中所述相關(guān)性分值的第一集合和所述相關(guān)性分值的 第二集合每一個包括相關(guān)性因素和排名因素,所述相關(guān)性因素測量來自所述搜索查詢或所 述翻譯的搜索查詢的所述結(jié)果與所述搜索查詢相匹配的程度,以及所述排名因素測量網(wǎng)頁 被其它網(wǎng)頁鏈接的頻率。
15.如權(quán)利要求9所述的軟件,其中所述相關(guān)性分值的第一集合基于對來自所述第一 搜索查詢的結(jié)果的第一點進率的分析,以及所述相關(guān)性分值的第二集合基于對來自所述翻 譯的搜索查詢的結(jié)果的第二點進率的分析。
16.一種計算機實現(xiàn)的方法,包括從客戶端設(shè)備接收搜索查詢,所述搜索查詢是以第一語言提交的; 獲取翻譯的搜索查詢,所述翻譯的搜索查詢是所述搜索查詢到第二語言的翻譯; 接收對所述搜索查詢作出響應(yīng)的第一結(jié)果,所述第一結(jié)果包括具有第一相關(guān)性分值的 第一網(wǎng)頁;接收對所述翻譯的搜索查詢作出響應(yīng)的第二結(jié)果,所述第二結(jié)果包括具有第二相關(guān)性 分值的第二網(wǎng)頁;將所述結(jié)果的第一集合和所述結(jié)果的第二集合組合成搜索結(jié)果的有序列表; 從所述第一和第二相關(guān)性分值導(dǎo)出最相關(guān)到最少相關(guān)的順序,所述順序包括所述搜索 結(jié)果的有序列表的所述順序;派發(fā)包括所述搜索結(jié)果的有序列表的指定數(shù)量的結(jié)果頁面。
17.如權(quán)利要求16所述的計算機實現(xiàn)的方法,進一步包括如果所述結(jié)果頁面包括來 自所述搜索結(jié)果的第二集合的網(wǎng)頁,則獲取翻譯的網(wǎng)頁。
18.如權(quán)利要求16所述的計算機實現(xiàn)的方法,進一步包括將來自所述搜索結(jié)果的有序列表的相應(yīng)相關(guān)性分值與閾值相關(guān)性分值進行比較;以及 如果相應(yīng)相關(guān)性分值沒有超過所述閾值相關(guān)性分值,則從所述搜索結(jié)果的有序列表排 除所述結(jié)果。
19.如權(quán)利要求16所述的計算機實現(xiàn)的方法,進一步包括 獲取與所述翻譯的搜索查詢相對應(yīng)的先前查詢的數(shù)量;將所述先前查詢的數(shù)量與查詢的閾值數(shù)量進行比較;以及其中,如果關(guān)于所述翻譯的搜索查詢的所述先前查詢的數(shù)量超過所述查詢的閾值數(shù) 量,則將來自所述搜索結(jié)果的第二集合的結(jié)果包括在所述搜索結(jié)果的有序列表中。
20.如權(quán)利要求16所述的計算機實現(xiàn)的方法,其中所述相關(guān)性分值的第一集合基于對 來自所述第一搜索查詢的結(jié)果的第一點進率的分析,以及所述相關(guān)性分值的第二集合基于 對來自所述翻譯的搜索查詢的結(jié)果的第二點進率的分析。
21.一種計算機實現(xiàn)的方法,包括從客戶端設(shè)備接收搜索查詢,所述搜索查詢是以第一語言提交的; 獲取翻譯的搜索查詢,所述翻譯的搜索查詢是所述搜索查詢到第二語言的翻譯; 接收對所述搜索查詢作出響應(yīng)的第一結(jié)果,所述第一結(jié)果包括具有第一相關(guān)性分值的 第一網(wǎng)頁;接收對所述翻譯的搜索查詢作出響應(yīng)的第二結(jié)果,所述第二結(jié)果包括具有第二相關(guān)性 分值的第二網(wǎng)頁;將所述第一相關(guān)性分值與所述第二相關(guān)性分值進行比較;以及 如果所述第一相關(guān)性分值超過所述第二相關(guān)性分值,則派發(fā)包括所述第一結(jié)果的結(jié)果 頁面,如果所述第二相關(guān)性分值超過所述第一相關(guān)性分值,則派發(fā)包括所述第二結(jié)果的所 述結(jié)果頁面。
22.—種計算機實現(xiàn)的方法,包括 接收第一語言的原始搜索查詢;獲取與所述原始搜索查詢相關(guān)聯(lián)的翻譯的搜索查詢,所述翻譯的搜索查詢?yōu)榈诙Z評估所述翻譯的搜索查詢以確定所述翻譯的搜索查詢是否是用于跨語言搜索的候選;以及如果確定所述翻譯的搜索查詢是用于跨語言搜索的候選,則生成與所述翻譯的搜索查 詢相關(guān)的搜索結(jié)果。
23.如權(quán)利要求22所述的計算機實現(xiàn)的方法,其中評估所述翻譯的搜索查詢以確定所 述翻譯的搜索查詢是否是用于跨語言搜索的候選基于與所述翻譯相關(guān)聯(lián)的翻譯置信分值;或者 搜索查詢包括與所述第一或第二語言相關(guān)聯(lián)的實體。
24.如權(quán)利要求22所述的計算機實現(xiàn)的方法,進一步包括如果要派發(fā)與所述翻譯的搜索查詢相關(guān)的搜索結(jié)果,則獲取產(chǎn)生自所述翻譯的搜索查 詢的網(wǎng)頁的翻譯的摘錄;以及派發(fā)包括所述產(chǎn)生自所述翻譯的搜索查詢的網(wǎng)頁的翻譯的摘錄的搜索結(jié)果頁面。
25.如權(quán)利要求22所述的計算機實現(xiàn)的方法,其中基于搜索查詢包括與所述第一或第 二語言相關(guān)聯(lián)的實體來評估所述翻譯的搜索查詢以確定所述翻譯的搜索查詢是否是用于 跨語言搜索的候選包括確定所述搜索查詢是否包括來自對所述第一語言為本地的實體的列表的實體;以及 如果所述原始搜索查詢包括來自所述對所述第一語言為本地的實體的列表的實體,則 生成關(guān)于所述原始搜索查詢的所述搜索結(jié)果。
26.如權(quán)利要求22所述的計算機實現(xiàn)的方法,其中基于搜索查詢包括與所述第一或第 二語言相關(guān)聯(lián)的實體來評估所述翻譯的搜索查詢以確定所述翻譯的搜索查詢是否是用于 跨語言搜索的候選包括確定所述翻譯的搜索查詢是否包括來自外來實體的列表的實體;以及 如果所述翻譯的搜索查詢包括來自與所述第二語言有關(guān)的所述外來實體的列表的外 來實體,則生成關(guān)于所述翻譯的搜索查詢的所述搜索結(jié)果。
27.如權(quán)利要求26所述的計算機實現(xiàn)的方法,其中評估所述翻譯的搜索查詢以確定所 述翻譯的搜索查詢是否是用于跨語言搜索的候選包括 識別包括來自所述外來實體的所述實體的先前查詢的數(shù)量; 將所述包括所述外來實體的先前查詢的數(shù)量與查詢的閾值數(shù)量進行比較;以及 如果超過所述查詢的閾值數(shù)量,則確定包括所述外來實體的所述翻譯的搜索查詢是候選;其中,如果確定所述翻譯的搜索查詢是候選,則生成與所述翻譯的搜索查詢相關(guān)聯(lián)的結(jié)果。
28.如權(quán)利要求22所述的計算機實現(xiàn)的方法,其中評估所述翻譯的搜索查詢以確定所 述翻譯的搜索查詢是否是用于跨語言搜索的候選包括接收與所述翻譯的搜索查詢相關(guān)聯(lián)的翻譯置信分值,所述翻譯置信分值測量與所述翻 譯的搜索查詢的翻譯相關(guān)聯(lián)的置信度;將所述翻譯置信分值與閾值置信分值進行比較;以及如果所述翻譯置信分值超過所述閾值置信分值,則確定所述翻譯的搜索查詢是用于跨 語言搜索的候選。
29.如權(quán)利要求22所述的計算機實現(xiàn)的方法,其中評估所述翻譯的搜索查詢以確定所 述翻譯的搜索查詢是否是用于跨語言搜索的候選包括識別對所述翻譯的搜索查詢作出響應(yīng)的網(wǎng)頁的集合以及關(guān)于所述網(wǎng)頁的第二集合的 相關(guān)性分值的集合;將所述相關(guān)性分值與閾值相關(guān)性分值進行比較;以及如果所述相關(guān)性分值超過所述閾值相關(guān)性分值,則確定所述翻譯的搜索查詢是用于跨 語言搜索的候選。
30.如權(quán)利要求22所述的計算機實現(xiàn)的方法,其中評估所述翻譯的搜索查詢以確定所 述翻譯的搜索查詢是否是用于跨語言搜索的候選包括獲取與所述翻譯的搜索查詢相對應(yīng)的先前查詢的數(shù)量; 將所述先前查詢的數(shù)量與查詢的閾值數(shù)量進行比較;以及如果所述先前查詢的數(shù)量超過所述查詢的閾值數(shù)量,則確定所述翻譯的搜索查詢是用 于跨語言搜索的候選。
31.一種存儲在一個或多個計算機可讀介質(zhì)中并且包括由處理系統(tǒng)可執(zhí)行以及在被這 樣執(zhí)行后促使所述處理系統(tǒng)執(zhí)行操作的指令的軟件,所述操作包括接收第一語言的原始搜索查詢;獲取與所述原始搜索查詢相關(guān)聯(lián)的翻譯的搜索查詢,所述翻譯的搜索查詢?yōu)榈诙ZH ;評估所述翻譯的搜索查詢以確定所述翻譯的搜索查詢是否是用于跨語言搜索的候選;以及如果確定所述翻譯的搜索查詢是用于跨語言搜索的候選,則生成與所述翻譯的搜索查 詢相關(guān)的搜索結(jié)果。
32.如權(quán)利要求31所述的軟件,其中評估所述翻譯的搜索查詢以確定所述翻譯的搜索 查詢是否是用于跨語言搜索的候選基于與所述翻譯相關(guān)聯(lián)的翻譯置信分值;或者 搜索查詢包括與所述第一或第二語言相關(guān)聯(lián)的實體。
33.如權(quán)利要求31所述的軟件,可進一步操作來促使所述處理系統(tǒng)執(zhí)行操作,所述操 作包括如果與所述翻譯的搜索查詢相關(guān)的搜索結(jié)果待被派發(fā),則獲取產(chǎn)生自所述翻譯的搜索 查詢的網(wǎng)頁的翻譯的摘錄;以及派發(fā)包括所述產(chǎn)生自所述翻譯的搜索查詢的網(wǎng)頁的翻譯的摘錄的搜索結(jié)果頁面。
34.如權(quán)利要求31所述的軟件,其中基于搜索查詢包括與所述第一或第二語言相關(guān)聯(lián) 的實體來評估所述翻譯的搜索查詢以確定所述翻譯的搜索查詢是否是用于跨語言搜索的 候選包括確定所述搜索查詢是否包括來自對所述第一語言為本地的實體的列表的實體;以及 如果所述原始搜索查詢包括來自所述對所述第一語言為本地的實體的列表的實體,則 生成關(guān)于所述原始搜索查詢的所述搜索結(jié)果。
35.如權(quán)利要求31所述的軟件,其中基于搜索查詢包括與所述第一或第二語言相關(guān)聯(lián) 的實體來評估所述翻譯的搜索查詢以確定所述翻譯的搜索查詢是否是用于跨語言搜索的候選包括確定所述翻譯的搜索查詢是否包括來自外來實體的列表的實體;以及 如果所述翻譯的搜索查詢包括來自與所述第二語言有關(guān)的所述外來實體的列表的外 來實體,則生成關(guān)于所述翻譯的搜索查詢的所述搜索結(jié)果。
36.如權(quán)利要求35所述的軟件,其中評估所述翻譯的搜索查詢以確定所述翻譯的搜索 查詢是否是用于跨語言搜索的候選包括識別包括來自所述外來實體的所述實體的先前查詢的數(shù)量; 將所述包括所述外來實體的先前查詢的數(shù)量與查詢的閾值數(shù)量進行比較;以及 如果超過所述查詢的閾值數(shù)量,則確定包括所述外來實體的所述翻譯的搜索查詢是候選;其中,如果確定所述翻譯的搜索查詢是候選,則生成與所述翻譯的搜索查詢相關(guān)聯(lián)的結(jié)果。
37.如權(quán)利要求31所述的軟件,其中評估所述翻譯的搜索查詢以確定所述翻譯的搜索 查詢是否是用于跨語言搜索的候選包括接收與所述翻譯的搜索查詢相關(guān)聯(lián)的翻譯置信分值,所述翻譯置信分值測量與所述翻 譯的搜索查詢的翻譯相關(guān)聯(lián)的置信度;將所述翻譯置信分值與閾值置信分值進行比較;以及如果所述翻譯置信分值超過所述閾值置信分值,則確定所述翻譯的搜索查詢是用于跨 語言搜索的候選。
38.如權(quán)利要求31所述的軟件,其中評估所述翻譯的搜索查詢以確定所述翻譯的搜索 查詢是否是用于跨語言搜索的候選包括識別對所述翻譯的搜索查詢作出響應(yīng)的網(wǎng)頁的集合以及關(guān)于所述網(wǎng)頁的第二集合的 相關(guān)性分值的集合;將所述相關(guān)性分值與閾值相關(guān)性分值進行比較;以及如果所述相關(guān)性分值超過所述閾值相關(guān)性分值,則確定所述翻譯的搜索查詢是用于跨 語言搜索的候選。
39.如權(quán)利要求31所述的軟件,其中評估所述翻譯的搜索查詢以確定所述翻譯的搜索 查詢是否是用于跨語言搜索的候選包括獲取與所述翻譯的搜索查詢相對應(yīng)的先前查詢的數(shù)量; 將所述先前查詢的數(shù)量與查詢的閾值數(shù)量進行比較;以及如果所述先前查詢的數(shù)量超過所述查詢的閾值數(shù)量,則確定所述翻譯的搜索查詢是用 于跨語言搜索的候選。
40.一種系統(tǒng),包括輸入模塊,所述輸入模塊可操作來從用戶接收第一語言的原始搜索查詢; 查詢評估模塊,所述查詢評估模塊可操作來評估包括所述原始搜索查詢到第二語言的 翻譯的翻譯的搜索查詢,所述查詢評估模塊可操作來確定與所述翻譯的搜索查詢的結(jié)果相 關(guān)聯(lián)的相關(guān)性分值、獲取與所述翻譯相關(guān)聯(lián)的翻譯置信分值或識別所述翻譯的搜索查詢中 的包括與所述第二語言相關(guān)聯(lián)的實體的一個或多個詞語;以及輸出模塊,所述輸出模塊可操作來將包括對所述查詢評估模塊作出響應(yīng)的產(chǎn)生自所述原始搜索查詢或所述翻譯的搜索查詢的頁面的列表的結(jié)果頁面派發(fā)給所述用戶。
41.如權(quán)利要求40所述的系統(tǒng),其中,如果所述搜索結(jié)果包括來自所述翻譯的搜索查 詢的結(jié)果,則所述輸出模塊可操作來獲取產(chǎn)生自所述翻譯的搜索查詢的網(wǎng)頁的翻譯的摘 錄,并且其中所述搜索結(jié)果頁面包括產(chǎn)生自所述翻譯的搜索查詢的所述網(wǎng)頁的所述翻譯的 摘錄。
42.一種計算機實現(xiàn)的方法,包括 接收第一語言的原始搜索查詢;獲取與所述原始搜索查詢相關(guān)聯(lián)的翻譯的搜索查詢,所述翻譯的搜索查詢?yōu)榈诙ZH ;評估所述翻譯的搜索查詢以確定所述翻譯的搜索查詢是否是用于跨語言搜索的候選;以及如果所述翻譯的搜索查詢是用于所述跨語言搜索的候選,則 接收對所述搜索查詢作出響應(yīng)的結(jié)果的第一集合以及對所述翻譯的搜索查詢作出響 應(yīng)的結(jié)果的第二集合,所述結(jié)果的第一集合包括網(wǎng)頁的第一集合和相關(guān)性分值的第一集合 以及所述結(jié)果的第二集合包括網(wǎng)頁的第二集合和相關(guān)性分值的第二集合;將所述相關(guān)性分值的第一集合與所述相關(guān)性分值的第二集合進行比較;以及 響應(yīng)于對所述相關(guān)性分值的第一集合與所述相關(guān)性分值的第二集合的所述比較,派發(fā) 包括所述結(jié)果的第一集合或所述結(jié)果的第二集合中的一個或兩者的至少部分的結(jié)果頁面; 以及如果所述翻譯的搜索查詢不是用于所述跨語言搜索的候選,則派發(fā)關(guān)于所述原始搜索 查詢的搜索結(jié)果。
全文摘要
在其中可以執(zhí)行跨語言搜索的方法、系統(tǒng)和裝置,包括計算機程序產(chǎn)品??梢詸z查搜索查詢以確定其是否是用于跨語言搜索的候選。在識別候選后,可以使用與搜索查詢相關(guān)聯(lián)的翻譯的搜索查詢來執(zhí)行搜索??梢詫⒎g的搜索查詢的結(jié)果派發(fā)給提交搜索查詢的客戶端設(shè)備。
文檔編號G06F17/30GK101868797SQ200880117083
公開日2010年10月20日 申請日期2008年9月22日 優(yōu)先權(quán)日2007年9月21日
發(fā)明者亞歷山德拉·科約烏霍夫, 檀慧, 沙-梅恩·特赫, 秦家豪, 莫琳·海曼斯 申請人:谷歌公司