欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

將異源的搜索引擎結(jié)果混合為一個(gè)搜索結(jié)果的方法與系統(tǒng)的制作方法

文檔序號(hào):6487281閱讀:116來(lái)源:國(guó)知局
專利名稱:將異源的搜索引擎結(jié)果混合為一個(gè)搜索結(jié)果的方法與系統(tǒng)的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及在文檔集合中定位文檔的搜索引擎領(lǐng)域,所述文檔例如是在耦合到因特網(wǎng)或內(nèi)聯(lián)網(wǎng)的服務(wù)器上存儲(chǔ)的文檔,具體而言,本發(fā)明涉及用于混合來(lái)自多個(gè)搜索引擎源的相應(yīng)多個(gè)搜索引擎結(jié)果以產(chǎn)生混合搜索引擎結(jié)果的方法與系統(tǒng)。
背景技術(shù)
因特網(wǎng)是個(gè)大的計(jì)算機(jī)網(wǎng)絡(luò),它包括大量客戶設(shè)備和服務(wù)器設(shè)備。在眾多功能中,服務(wù)器設(shè)備有時(shí)響應(yīng)于客戶通過(guò)網(wǎng)絡(luò)發(fā)出的請(qǐng)求而通過(guò)網(wǎng)絡(luò)向客戶設(shè)備提供文檔。請(qǐng)求一般包括文檔的地址。在因特網(wǎng)上,通常使用統(tǒng)一資源定位符(URL)來(lái)指定文檔的地址,URL同時(shí)標(biāo)識(shí)服務(wù)器以及客戶請(qǐng)求的該服務(wù)器上的特定文檔。該文檔可以是能夠通過(guò)網(wǎng)絡(luò)傳輸?shù)娜我舛囝愋托畔⒅械囊环N信息,包括文本文件、文字處理文件、音頻片斷、視頻片斷、以及任何其它類型的電子數(shù)據(jù)。通過(guò)被通稱為萬(wàn)維網(wǎng)(“Web”)的方式,文檔集合對(duì)在因特網(wǎng)上的客戶計(jì)算機(jī)可用。
連接到因特網(wǎng)的計(jì)算機(jī)可以是客戶設(shè)備、服務(wù)器設(shè)備或者兼為兩者。因特網(wǎng)上一種特殊類型的服務(wù)器設(shè)備被稱為搜索引擎系統(tǒng)。搜索引擎系統(tǒng)還存在于因特網(wǎng)之外的網(wǎng)絡(luò)上,例如在企業(yè)內(nèi)聯(lián)網(wǎng)上。想要從萬(wàn)維網(wǎng)獲取信息的客戶設(shè)備的用戶,在不確定任何或所有相關(guān)文檔的URL的情況下,一般向搜索引擎提交請(qǐng)求(被稱作查詢)。查詢包括用于描述客戶設(shè)備的用戶感興趣的信息的類型的一個(gè)或多個(gè)項(xiàng)目。搜索引擎一般維護(hù)萬(wàn)維網(wǎng)上的文檔數(shù)據(jù)庫(kù)。每個(gè)數(shù)據(jù)庫(kù)可以包括關(guān)鍵字項(xiàng)目和包含該關(guān)鍵字項(xiàng)目的文檔的對(duì)應(yīng)URL,其中關(guān)鍵字項(xiàng)目可以是單詞或任意類型的電子可存儲(chǔ)數(shù)據(jù)。一般而言,作為關(guān)鍵字項(xiàng)目的替代或除了關(guān)鍵字項(xiàng)目之外,數(shù)據(jù)庫(kù)可以存儲(chǔ)文檔的特征。一些特征是直接代表文檔屬性的值,特征的一個(gè)示例是文檔的長(zhǎng)度。其它特征使得能夠在文檔和查詢之間進(jìn)行某些類型的比較,查詢中的給定項(xiàng)目在文檔中出現(xiàn)的頻率可以作為這種比較的一個(gè)示例。
響應(yīng)于客戶設(shè)備的用戶所提交的查詢,搜索引擎一般基于其數(shù)據(jù)庫(kù)來(lái)確定索引中與查詢相關(guān)的文檔子集。此外,搜索引擎系統(tǒng)一般包括排名函數(shù),該排名函數(shù)估計(jì)子集中的每個(gè)文檔與所述查詢的相關(guān)性,為子集中的每個(gè)文檔產(chǎn)生相對(duì)于所述查詢的“相關(guān)性分?jǐn)?shù)”。最后,排名函數(shù)創(chuàng)建搜索引擎結(jié)果,該搜索引擎結(jié)果包括有序的條目列表。每個(gè)條目對(duì)應(yīng)于文檔子集中的一個(gè)文檔。條目包括對(duì)應(yīng)文檔的URL(從而用戶可以從萬(wàn)維網(wǎng)請(qǐng)求文檔)以及該條目在列表中的位置。列表被排序,使得位置靠近列表起點(diǎn)的文檔(即,具有數(shù)值上較低位置的文檔)具有較高的相關(guān)性分?jǐn)?shù)(即,在從列表的起點(diǎn)向其終點(diǎn)移動(dòng)時(shí),相關(guān)性分?jǐn)?shù)單調(diào)下降)。
準(zhǔn)確代表萬(wàn)維網(wǎng)上的文檔內(nèi)容的文檔數(shù)據(jù)庫(kù)的創(chuàng)建是一個(gè)困難的問(wèn)題。首先,在萬(wàn)維網(wǎng)上有大量的文檔;文檔數(shù)量的估計(jì)值目前以十億計(jì)。這為創(chuàng)建能夠同時(shí)存儲(chǔ)與所有文檔有關(guān)的信息并在需要時(shí)快速獲取信息的單個(gè)數(shù)據(jù)庫(kù)制造了困難。其次,萬(wàn)維網(wǎng)上文檔的內(nèi)容十分不同。文檔是由具有不同技巧的作者(從專業(yè)記者到兒童)制作的,是以多種語(yǔ)言寫成的(有時(shí)采用不同的字母表及其電子編碼方案),并且被用于多種目的(從娛樂(lè)用途到電子商務(wù))。這使得確定數(shù)據(jù)庫(kù)中包括文檔的哪些關(guān)鍵字項(xiàng)目和特征成為一個(gè)困難的問(wèn)題。最后,萬(wàn)維網(wǎng)上文檔的內(nèi)容以及文檔自身的位置頻繁地改變。已經(jīng)采取了多種“爬行搜索(crawling)”策略來(lái)緩解這一困難,每種策略都具有其各自的優(yōu)點(diǎn)和缺點(diǎn)。因此,在搜索引擎系統(tǒng)中使用多于一個(gè)數(shù)據(jù)庫(kù)以應(yīng)對(duì)大量的、多種的、以及隨時(shí)間變化的文檔的集合(例如萬(wàn)維網(wǎng)上的文檔的集合)會(huì)是有利的。
即使開發(fā)了能夠準(zhǔn)確有效表征萬(wàn)維網(wǎng)上可用的文檔的單個(gè)數(shù)據(jù)庫(kù),確定數(shù)據(jù)庫(kù)中的特定文檔相對(duì)于查詢的相關(guān)性分?jǐn)?shù)也將是個(gè)困難的問(wèn)題。文檔的相關(guān)性分?jǐn)?shù)被用于確定對(duì)應(yīng)條目在搜索引擎結(jié)果中的位置。用戶一般僅檢查搜索引擎結(jié)果中的最初三個(gè)或四個(gè)條目,因此在用戶對(duì)搜索引擎結(jié)果的滿意度方面,(至少對(duì)于高度相關(guān)文件的)準(zhǔn)確的相關(guān)性分?jǐn)?shù)確定是一個(gè)重要的因素。用戶對(duì)特定文檔與查詢的相關(guān)性的感知很難利用用于確定相關(guān)性分?jǐn)?shù)的單個(gè)算法來(lái)準(zhǔn)確復(fù)制。因此,搜索引擎系統(tǒng)中需要不只一種可以用來(lái)確定相關(guān)性分?jǐn)?shù)的方法。例如,一種方法可能非常適于確定以單種語(yǔ)言(例如,英語(yǔ))所寫的文檔的相關(guān)性分?jǐn)?shù),而第二種方法最適于確定第二種語(yǔ)言(例如,漢語(yǔ))的文檔的相關(guān)性分?jǐn)?shù)。然而,當(dāng)數(shù)據(jù)庫(kù)中的文檔含有兩種語(yǔ)言的內(nèi)容時(shí),將難以決定使用哪種排名函數(shù)。作為另一示例,搜索引擎系統(tǒng)可能包括不只一個(gè)數(shù)據(jù)庫(kù),并且具有用于每個(gè)數(shù)據(jù)庫(kù)的獨(dú)立排名函數(shù)。這樣,各個(gè)排名函數(shù)可以被優(yōu)化用于確定來(lái)自它們相應(yīng)數(shù)據(jù)庫(kù)的文檔的相關(guān)性分?jǐn)?shù)。越來(lái)越多地使用統(tǒng)計(jì)與機(jī)器學(xué)習(xí)技術(shù)來(lái)執(zhí)行這類優(yōu)化。因此,需要一種方法與系統(tǒng)來(lái)混合來(lái)自不只一個(gè)排名函數(shù)的搜索引擎結(jié)果。
基于上述背景,希望設(shè)計(jì)一種用于組合來(lái)自一個(gè)或多個(gè)搜索源的搜索引擎結(jié)果的方法與系統(tǒng),每個(gè)搜索源可能使用不同的數(shù)據(jù)庫(kù)或排名函數(shù)或兼用兩者。具體而言,希望設(shè)計(jì)一種方法,該方法能夠以下述方式來(lái)確定混合搜索引擎結(jié)果即,與用戶對(duì)來(lái)自任何個(gè)別搜索源的最高三個(gè)文檔的相關(guān)性的感知相比,用戶對(duì)混合搜索引擎中的最高三個(gè)文檔的相關(guān)性的感知是較好的,或者至少不差。

發(fā)明內(nèi)容
一些實(shí)施例提供了一種用于將來(lái)自多個(gè)搜索源的相應(yīng)多個(gè)搜索引擎結(jié)果混合成一個(gè)搜索引擎結(jié)果的方法。首先,從每個(gè)搜索源接收相應(yīng)的條目結(jié)果列表。條目結(jié)果列表對(duì)于列表上的每個(gè)條目來(lái)說(shuō)包括條目位置、文檔地址以及文檔的相關(guān)性分?jǐn)?shù)。然后,確定的變換被應(yīng)用于至少一個(gè)所接收結(jié)果列表中的至少一個(gè)文檔子集的相關(guān)性分?jǐn)?shù),進(jìn)而產(chǎn)生經(jīng)變換的分?jǐn)?shù)。最后,相應(yīng)結(jié)果列表的多個(gè)部分被組合在一起以產(chǎn)生混合搜索引擎結(jié)果。該混合搜索引擎結(jié)果包括混合的條目列表。作為組合相應(yīng)結(jié)果列表的一部分,混合條目列表中的條目是至少部分基于經(jīng)變換的分?jǐn)?shù)而排序的。
一些實(shí)施例還提供了一種確定用于多個(gè)搜索源的第一搜索源的變換的方法。首先,為至少第一搜索源和第二搜索源測(cè)量并存儲(chǔ)點(diǎn)擊率統(tǒng)計(jì)信息。然后,為第一和第二搜索源中的每個(gè)確定品質(zhì)因數(shù)(figure ofmerit)。品質(zhì)因數(shù)是至少部分由所測(cè)量并存儲(chǔ)的統(tǒng)計(jì)信息確定的。最后,基于第一和第二搜索源的品質(zhì)因數(shù)確定系數(shù)集。這些系數(shù)定義用于第一搜索源的相關(guān)性分?jǐn)?shù)變換。
一些實(shí)施例提供了一種搜索引擎系統(tǒng)。該搜索引擎系統(tǒng)包括多個(gè)搜索源。此外,該搜索引擎系統(tǒng)具有至少一個(gè)用于接收查詢并發(fā)送搜索結(jié)果的接口。該搜索引擎系統(tǒng)還包括至少一個(gè)耦合到所述多個(gè)搜索源的搜索引擎。所述至少一個(gè)搜索引擎被配置從每個(gè)搜索源接收與所接收的查詢相對(duì)應(yīng)的相應(yīng)條目結(jié)果列表。每個(gè)相應(yīng)的結(jié)果列表對(duì)于列表中的每個(gè)條目來(lái)說(shuō)至少包括條目的位置、文檔的地址、以及該文檔與所接收查詢相關(guān)的相關(guān)性分?jǐn)?shù)。該搜索引擎系統(tǒng)還包括混合模塊,混合模塊被配置將確定的變換應(yīng)用于至少一個(gè)所接收結(jié)果列表中的至少一個(gè)條目子集的相關(guān)性分?jǐn)?shù),進(jìn)而產(chǎn)生經(jīng)變換的分?jǐn)?shù)。該混合模塊還被配置組合所述相應(yīng)結(jié)果列表的至少多個(gè)部分,以產(chǎn)生包括混合條目列表的混合搜索引擎結(jié)果,其中包括對(duì)混合條目列表排序。對(duì)混合條目列表的排序是至少部分由經(jīng)變換的分?jǐn)?shù)來(lái)確定的。
在一些實(shí)施例中,該搜索引擎系統(tǒng)還包括變換確定模塊。變換確定模塊被配置確定用于所述多個(gè)搜索源的第一搜索源的變換。首先,變換確定模塊為第一搜索源和第二搜索源中的每個(gè)測(cè)量并存儲(chǔ)點(diǎn)擊率。然后,變換確定模塊為第一和第二搜索源中的每個(gè)確定品質(zhì)因數(shù)。對(duì)品質(zhì)因數(shù)的確定是至少部分基于所測(cè)量并存儲(chǔ)的統(tǒng)計(jì)信息的。最后,變換確定模塊基于第一和第二搜索源的品質(zhì)因數(shù)為第一搜索源確定系數(shù)集。如此確定的該系數(shù)集定義了用于第一搜索源的變換。
在一些實(shí)施例中,搜索引擎系統(tǒng)還被配置為第一搜索源和第二搜索源測(cè)量并存儲(chǔ)點(diǎn)擊率統(tǒng)計(jì)信息。搜索引擎還被配置從用戶接收查詢,將混合結(jié)果返回給用戶,所述混合結(jié)果包括條目列表。變換確定模塊還被配置記錄條目列表中的哪個(gè)項(xiàng)目(如果有的話)被用戶選擇。搜索引擎系統(tǒng)還被配置重復(fù)所述接收、返回和記錄,直到達(dá)到終止條件。


當(dāng)結(jié)合附圖對(duì)本發(fā)明的優(yōu)選實(shí)施例進(jìn)行詳細(xì)說(shuō)明時(shí),本發(fā)明的前述特征和優(yōu)點(diǎn)及其附加特征和優(yōu)點(diǎn)將在下文被更清楚地理解。
圖1A圖示了使用所公開的方法和系統(tǒng)的可能場(chǎng)景,包括網(wǎng)絡(luò)、一個(gè)或多個(gè)客戶計(jì)算機(jī)、萬(wàn)維網(wǎng)、以及搜索引擎系統(tǒng)。
圖1B圖示了搜索引擎結(jié)果,搜索引擎結(jié)果包括條目列表以及與每個(gè)條目相關(guān)聯(lián)的對(duì)應(yīng)文檔的位置、地址、對(duì)應(yīng)文檔的說(shuō)明以及相關(guān)性分?jǐn)?shù)。
圖2A圖示了來(lái)自第一搜索源的第一條目列表、來(lái)自第二搜索源的第二條目列表、通過(guò)將變換應(yīng)用于第一條目列表的相關(guān)性分?jǐn)?shù)而獲得的經(jīng)變換的分?jǐn)?shù)、以及混合搜索引擎結(jié)果。
圖2B是搜索引擎系統(tǒng)的框圖,包括混合模塊、變換確定模塊、多個(gè)搜索源、搜索引擎和接口。
圖3圖示了確定變換的方法。
圖4圖示了對(duì)混合搜索引擎結(jié)果中的條目列表中的哪個(gè)項(xiàng)目已被用戶選擇進(jìn)行的匿名記錄。
圖5圖示了能夠?qū)崿F(xiàn)所公開的搜索引擎系統(tǒng)和方法的計(jì)算機(jī)系統(tǒng)。
在附圖的若干示圖中,相似的標(biāo)號(hào)指示對(duì)應(yīng)的部分。
具體實(shí)施例方式
參考圖1A,在連網(wǎng)環(huán)境100中,網(wǎng)絡(luò)105連接一個(gè)或多個(gè)客戶計(jì)算機(jī)104、搜索引擎系統(tǒng)106以及文檔103的集合(在這種情況下是萬(wàn)維網(wǎng)102)??蛻粲?jì)算機(jī)104-1通過(guò)網(wǎng)絡(luò)105提交查詢112,并且查詢112被搜索引擎系統(tǒng)106接收。搜索引擎系統(tǒng)106通過(guò)經(jīng)由網(wǎng)絡(luò)105向客戶計(jì)算機(jī)140-1提供混合搜索引擎結(jié)果114來(lái)作出響應(yīng)。
已經(jīng)描述了使用搜索引擎系統(tǒng)106的可能場(chǎng)景,將進(jìn)一步描述混合搜索引擎結(jié)果114。參考圖1B,混合搜索引擎結(jié)果114包括條目130的列表。每個(gè)條目130與網(wǎng)絡(luò)上的對(duì)應(yīng)文檔相關(guān)聯(lián)。一般而言,響應(yīng)于查詢112(圖1A),搜索引擎系統(tǒng)將提供與和查詢112高度相關(guān)的文檔相關(guān)聯(lián)的條目130(作為混合結(jié)果114的一部分)。為了幫助用戶定位和獲取文檔,每個(gè)條目130有時(shí)包括文檔的URL 122。由于例如URL作為超文本標(biāo)記語(yǔ)言(HTML)錨定標(biāo)簽被提供給用戶,因而URL 122可能對(duì)客戶計(jì)算機(jī)104的用戶不可見。作為URL 122的替代或者除URL 122之外,在其它實(shí)施例中條目130可以包括與條目相關(guān)聯(lián)的文檔的其它形式的地址信息。為了幫助用戶評(píng)價(jià)相關(guān)聯(lián)文檔的相關(guān)性,每個(gè)條目130可以包含該文檔的簡(jiǎn)要說(shuō)明128。例如,條目130可以包含在與該條目相關(guān)聯(lián)的文檔中找到的最初幾行文檔。
混合搜索引擎結(jié)果114中的條目列表中的每個(gè)條目130(及其關(guān)聯(lián)文檔)具有列表中的位置120和混合相關(guān)性分?jǐn)?shù)124兩者。位置120可以明確地包括在搜索引擎結(jié)果中,也可以沒(méi)有被明確包括在搜索引擎結(jié)果中。如果位置沒(méi)有被明確包括,則可以基于條目相對(duì)于列表上其它條目的位置來(lái)確定位置。搜索引擎系統(tǒng)使用混合相關(guān)性分?jǐn)?shù)124來(lái)確定條目130的位置120。文檔的混合相關(guān)性分?jǐn)?shù)124一般采取范圍在0至1之間或等同地范圍在0%至100%之間的數(shù)字值。盡管圖1B中僅描述了10個(gè)條目,但是在混合搜索引擎結(jié)果114中可以顯示更多或更少的條目。
搜索引擎結(jié)果114的視覺(jué)描述被呈現(xiàn)給客戶計(jì)算機(jī)104-1(圖1A)的用戶,并且該用戶可以通過(guò)將光標(biāo)126置于條目130上(即,置于客戶計(jì)算機(jī)顯示器的相關(guān)區(qū)域上)并點(diǎn)擊它來(lái)點(diǎn)擊與文檔相關(guān)聯(lián)的條目130,進(jìn)而選擇用于瀏覽的文檔。作為混合搜索引擎結(jié)果的一部分的條目被呈現(xiàn)給的用戶已經(jīng)具有對(duì)該條目的“印象”。當(dāng)用戶點(diǎn)擊該條目時(shí),發(fā)生該條目的“點(diǎn)擊進(jìn)入”。
已經(jīng)描述了混合搜索引擎結(jié)果,現(xiàn)在描述將來(lái)自多個(gè)搜索源的相應(yīng)多個(gè)搜索引擎結(jié)果混合為單個(gè)混合搜索引擎結(jié)果114的過(guò)程。參考圖2A,在優(yōu)選實(shí)施例中,接收到兩個(gè)搜索引擎結(jié)果集260(這里也被稱為結(jié)果列表或簡(jiǎn)稱為“結(jié)果”),它們分別來(lái)自兩個(gè)搜索源。從第一搜索源接收的搜索引擎結(jié)果集260-1包括條目262的列表。每個(gè)條目262進(jìn)一步包括位置264、文檔在第一搜索源的數(shù)據(jù)庫(kù)中的地址266、以及相關(guān)性分?jǐn)?shù)268。類似地,來(lái)自第二搜索源的搜索引擎結(jié)果集260-2也包括條目270的列表。每個(gè)條目270包括相關(guān)性分?jǐn)?shù)274。
將搜索引擎結(jié)果集260混合為單個(gè)混合搜索引擎結(jié)果114的一個(gè)目標(biāo)是,從結(jié)果集260的多個(gè)條目中產(chǎn)生包含最高度相關(guān)條目(如用戶所判斷的那樣)的結(jié)果114中的條目列表。此外,希望結(jié)果114中的條目列表被排序,使得隨著列表上的位置增加,用戶感知的與該條目對(duì)應(yīng)的文檔的相關(guān)性降低,或者至少不增加(即,當(dāng)沿著列表向下前進(jìn)時(shí),相關(guān)性單調(diào)下降)。原則上,第一結(jié)果集260-1的相關(guān)性分?jǐn)?shù)268和第二結(jié)果集260-2的相關(guān)性分?jǐn)?shù)274可以被直接用來(lái)對(duì)來(lái)自兩個(gè)結(jié)果集260的條目進(jìn)行排名。例如,可以選擇兩個(gè)結(jié)果集中具有最高相關(guān)性分?jǐn)?shù)的條目,將其加入混合結(jié)果,并且將其從其初始結(jié)果集中去除。該過(guò)程可以一直重復(fù)到混合結(jié)果包含了預(yù)定數(shù)量的條目。然而,在產(chǎn)生按照用戶感知的相關(guān)性排序的條目列表方面,這可能不是很有效。例如,相關(guān)性分?jǐn)?shù)268和相關(guān)性分?jǐn)?shù)270可能不具有可比擬的比例,一個(gè)可能采取范圍在0至1之間的值,而另一個(gè)可能采取范圍在4-100之間的值。而且,分?jǐn)?shù)可能是由在確定相關(guān)性過(guò)程中采用不同標(biāo)準(zhǔn)的排名函數(shù)來(lái)確定的,因而不是直接可比的。
為了解決這個(gè)問(wèn)題,搜索引擎系統(tǒng)的實(shí)施例將確定的變換280(變換的確定在下文結(jié)合圖3進(jìn)行描述)應(yīng)用于第一結(jié)果集260-1中的條目262的相關(guān)性分?jǐn)?shù)268。例如,變換280取得條目262-1的相關(guān)性分?jǐn)?shù)(具有值0.85),并且產(chǎn)生經(jīng)變換的分?jǐn)?shù)272-1,經(jīng)變換的分?jǐn)?shù)272-1具有值0.99。類似地,變換280被應(yīng)用于其它相關(guān)性分?jǐn)?shù)268,產(chǎn)生經(jīng)變換的分?jǐn)?shù)272的集合。
接下來(lái),基于第一結(jié)果集260-1的經(jīng)變換分?jǐn)?shù)272和第二結(jié)果集260-2的相關(guān)性分?jǐn)?shù)274來(lái)組合來(lái)自結(jié)果集260-1和結(jié)果集260-2的條目。一些實(shí)施例首先從第一結(jié)果的經(jīng)變換分?jǐn)?shù)和第二結(jié)果的相關(guān)性分?jǐn)?shù)中選擇具有最大分?jǐn)?shù)的條目。例如,在圖2A中,為混合結(jié)果114中的第一位置選擇條目262-1,因?yàn)闂l目262-1的對(duì)應(yīng)的經(jīng)變換分?jǐn)?shù)272-2(值為0.99)高于所有相關(guān)性分?jǐn)?shù)274以及所有其它的經(jīng)變換分?jǐn)?shù)272。條目262-1被置于混合結(jié)果114的第一位置處。選擇依次具有較低分?jǐn)?shù)的條目并將這些條目置于結(jié)果集114中,直到結(jié)果集114包含了預(yù)定數(shù)量的條目(在本例中是10個(gè))。或者,第一和第二集260中的所有條目被選擇并且根據(jù)結(jié)果集260-1的經(jīng)變換分?jǐn)?shù)272和結(jié)果集260-2的相關(guān)性分?jǐn)?shù)274被置于結(jié)果集114中。例如,條目270-1被置于結(jié)果114的第二位置處,因?yàn)閷?duì)應(yīng)的相關(guān)性分?jǐn)?shù)274-1(值為0.97)高于所有其它相關(guān)性分?jǐn)?shù)274以及除經(jīng)變換分?jǐn)?shù)272-1之外的所有經(jīng)變換分?jǐn)?shù)272。類似地,條目262-2被置于結(jié)果114的第三位置處。
盡管已經(jīng)結(jié)合圖2B描述了對(duì)來(lái)自兩個(gè)搜索源的搜索引擎結(jié)果的混合,但是在其它實(shí)施例中可以從相對(duì)較大數(shù)量的搜索源接收更多搜索引擎結(jié)果。例如,在一個(gè)實(shí)施例,可從五個(gè)搜索源接收五個(gè)搜索引擎結(jié)果。在一些實(shí)施例中,變換被應(yīng)用于所有結(jié)果集而非一個(gè)結(jié)果集的相關(guān)性分?jǐn)?shù),之后結(jié)果集根據(jù)它們的經(jīng)變換的相關(guān)性分?jǐn)?shù)而被合并。相應(yīng)地,每個(gè)結(jié)果260可以包含少于或多于10個(gè)條目。類似地,在其它實(shí)施例中,混合搜索結(jié)果114包含多于或少于10個(gè)條目?;旌辖Y(jié)果114中的條目數(shù)量不需要與任何結(jié)果260中的條目數(shù)量相同。類似地,結(jié)果260可以具有各自不同數(shù)量的條目。
已經(jīng)描述了產(chǎn)生混合搜索引擎結(jié)果114的過(guò)程,現(xiàn)在描述能夠產(chǎn)生混合搜索引擎結(jié)果的搜索引擎系統(tǒng)。參考圖2B,示出了根據(jù)一個(gè)實(shí)施例的搜索引擎系統(tǒng)106。搜索引擎系統(tǒng)106包括兩個(gè)或更多搜索源208。每個(gè)搜索源208具有關(guān)聯(lián)的排名功能塊204和數(shù)據(jù)庫(kù)206。系統(tǒng)106還包括用于接收查詢以及發(fā)送混合搜索引擎結(jié)果114的接口214。系統(tǒng)106還包括耦合到所述兩個(gè)或更多搜索源208的搜索引擎220。當(dāng)搜索引擎220經(jīng)由接口214接收查詢時(shí),搜索引擎220將對(duì)應(yīng)的查詢210發(fā)送到搜索源208中的一個(gè)或多個(gè)。在一些實(shí)施例中,查詢210可以與引擎220接收到的查詢相同。在其它實(shí)施例中,引擎220可能僅將接收到的查詢發(fā)送到具有與該查詢相關(guān)的合適數(shù)據(jù)庫(kù)206的源208。例如,在一些實(shí)施例中,如果搜索引擎系統(tǒng)106接收含有特定語(yǔ)言(例如,漢語(yǔ))項(xiàng)目的查詢,則引擎220僅將該查詢發(fā)送到具有以該語(yǔ)言對(duì)文檔作索引的數(shù)據(jù)庫(kù)(例如,206-2)的源(例如,208-2)。類似地,如果系統(tǒng)106接收到含有第二語(yǔ)言項(xiàng)目的查詢,則引擎220僅將查詢傳送到具有以第二語(yǔ)言對(duì)文檔作索引的數(shù)據(jù)庫(kù)206的源208。在其它實(shí)施例中,引擎220可以發(fā)送查詢210到源208,查詢210不同于系統(tǒng)106接收到的查詢。例如,原始查詢可以被搜索引擎220重構(gòu),以便適當(dāng)呈現(xiàn)為特定源208的查詢210。
搜索引擎220耦合到搜索源208,從而它可以從每個(gè)源208接收相應(yīng)的結(jié)果列表260。結(jié)果列表260包括條目列表,每個(gè)條目具有列表上的關(guān)聯(lián)位置、對(duì)應(yīng)文檔在列表的搜索源208的數(shù)據(jù)庫(kù)中的地址、以及對(duì)應(yīng)文檔與查詢210相關(guān)的相關(guān)性分?jǐn)?shù)。結(jié)合上文圖2A的討論圖示了一般結(jié)果列表260。
搜索引擎系統(tǒng)106還包括混合模塊202?;旌夏K202被配置將確定的變換應(yīng)用于至少一個(gè)接收到的結(jié)果列表260中的至少一個(gè)條目子集的相關(guān)性分?jǐn)?shù),從而產(chǎn)生經(jīng)變換的分?jǐn)?shù)?;旌夏K202還被配置組合相應(yīng)結(jié)果列表260的至少多個(gè)部分,以產(chǎn)生包括混合條目列表的混合搜索引擎結(jié)果,同時(shí)包括至少部分基于經(jīng)變換的分?jǐn)?shù)來(lái)對(duì)混合條目列表進(jìn)行排序。然后,經(jīng)由接口214提供混合條目列表以作為部分或全部混合搜索引擎結(jié)果。上文結(jié)合圖2A的討論詳細(xì)討論了應(yīng)用確定的變換、組合結(jié)果列表260的多個(gè)部分、以及形成混合搜索引擎結(jié)果的過(guò)程。
搜索引擎系統(tǒng)106可選地包括變換確定模塊216。變換確定模塊216被配置確定用于一個(gè)或多個(gè)搜索源208的一個(gè)或多個(gè)變換。下文結(jié)合圖3的討論來(lái)討論對(duì)用于搜索源的變換的確定。變換一旦被確定,就被提供給混合模塊202。在一些實(shí)施例中,混合模塊202和變換確定模塊216都被包括在搜索引擎220中。在其它實(shí)施例中,混合模塊202和/或可選的變換確定模塊216可以是搜索引擎系統(tǒng)106中包括的其它系統(tǒng)的一部分。在一些實(shí)施例中,搜索源208和搜索引擎220在不同的計(jì)算機(jī)上實(shí)現(xiàn)。在這些實(shí)施例中,例如通過(guò)網(wǎng)絡(luò)105(圖1A)來(lái)執(zhí)行對(duì)查詢210和相應(yīng)結(jié)果列表260的傳送。
已經(jīng)描述了搜索引擎系統(tǒng),現(xiàn)在描述確定變換的方法(在一些實(shí)施例中,該方法由圖2A的變換確定模塊216使用)。參考圖3,在用于確定變換的方法300的優(yōu)選實(shí)施例中,在步驟302中,首先測(cè)量并存儲(chǔ)第一搜索源和第二搜索源的點(diǎn)擊率統(tǒng)計(jì)信息。參考圖4,在一些實(shí)施例中,用戶點(diǎn)擊混合搜索引擎結(jié)果114(例如,如圖1B所示)中的一個(gè)條目的事件被搜索引擎系統(tǒng)106(圖2B)所記錄。當(dāng)用戶點(diǎn)擊混合搜索引擎結(jié)果114的一個(gè)條目時(shí),請(qǐng)求401被發(fā)送到搜索引擎系統(tǒng)106(例如,發(fā)送到搜索引擎220的變換確定模塊216)。請(qǐng)求401包含關(guān)于所選條目在混合搜索引擎結(jié)果114中的位置的信息。為了使用戶點(diǎn)擊導(dǎo)致請(qǐng)求401被發(fā)送到搜索引擎系統(tǒng)106,與結(jié)果列表中的每個(gè)項(xiàng)目相關(guān)聯(lián)的URL被改變,從而對(duì)所述項(xiàng)目的選擇引起http消息(即,請(qǐng)求401)被發(fā)送到搜索引擎服務(wù)器而沒(méi)有發(fā)送到存儲(chǔ)用戶所選擇的文檔的服務(wù)器。http消息(請(qǐng)求)401包括與所選文檔相關(guān)聯(lián)的URL以及所選項(xiàng)目在結(jié)果列表中的位置。
響應(yīng)于對(duì)該請(qǐng)求的接收,搜索引擎220記錄所選條目在混合結(jié)果114中的位置。此外,當(dāng)兩個(gè)或更多結(jié)果列表(例如,圖2B中的260-1和260-2)被組合來(lái)產(chǎn)生混合結(jié)果114時(shí),搜索引擎220記錄從其獲得所選條目的搜索源。此外,搜索引擎220記錄搜索源和所有未被選擇的條目在混合結(jié)果114中的位置。該存儲(chǔ)行為可以例如由變換確定模塊216(圖2B)來(lái)完成。在優(yōu)選實(shí)施例中,當(dāng)被呈現(xiàn)給用戶的結(jié)果列表被發(fā)送給用戶時(shí),關(guān)于該結(jié)果列表的信息被記錄在日志記錄中。關(guān)于用戶所選擇的項(xiàng)目的信息被記錄在第二日志記錄中。第二日志記錄可以包括對(duì)第一日志記錄的引用或指針。
仍舊參考圖4,需要客戶計(jì)算機(jī)104-1的用戶接收與從搜索引擎結(jié)果114中選擇的條目相對(duì)應(yīng)的文檔。為了實(shí)現(xiàn)此目的,搜索引擎系統(tǒng)106發(fā)送“http重定向”響應(yīng)402到客戶計(jì)算機(jī)104-1,用于指定所請(qǐng)求文檔的URL。http重定向402使客戶計(jì)算機(jī)104-1下載并顯示與該URL相對(duì)應(yīng)的文檔。在另一實(shí)施例中,搜索引擎系統(tǒng)106可以下載所請(qǐng)求的文檔,然后將該文檔發(fā)送到客戶計(jì)算機(jī)104-1。
不需要在每次客戶計(jì)算機(jī)104的用戶從混合結(jié)果選擇條目時(shí)都記錄關(guān)于混合結(jié)果114的條目的信息。那么,在一些實(shí)施例中,只針對(duì)所選的混合結(jié)果114記錄用戶從混合結(jié)果中的選擇,所選的混合結(jié)果114可以是隨機(jī)選擇的或者以其它方式選擇的。這樣,系統(tǒng)104不因處理由用戶從混合結(jié)果中選擇條目而產(chǎn)生的每個(gè)請(qǐng)求導(dǎo)致超負(fù)載。例如,系統(tǒng)106可以產(chǎn)生混合結(jié)果114,從而當(dāng)用戶選擇條目時(shí),每110個(gè)結(jié)果中僅有一個(gè)結(jié)果產(chǎn)生請(qǐng)求401。
在一些實(shí)施例中,響應(yīng)于用戶從混合搜索引擎結(jié)果中選擇條目,記錄了所選條目的位置和搜索源。此外,還記錄了沒(méi)有被選擇但是在混合結(jié)果中呈現(xiàn)了的條目的位置和源。隨后希望從這些數(shù)據(jù)確定要被應(yīng)用于由一個(gè)或多個(gè)搜索源產(chǎn)生的相關(guān)性分?jǐn)?shù)的變換。在一些實(shí)施例中,對(duì)于混合搜索結(jié)果中的每個(gè)搜索源h和每個(gè)位置i,確定相對(duì)點(diǎn)擊率。在一些實(shí)施例中,源h和位置i的相對(duì)點(diǎn)擊率(RCR)根據(jù)下述公式來(lái)確定RCR(i,h)=CRS(i,h)CR(i)]]>其中CR(i)是與源無(wú)關(guān)的位置i處的結(jié)果的點(diǎn)擊進(jìn)入率CR(i)=clickthroughs(i)impressions(i)]]>其中“clickthroughs(i)”是在測(cè)量間隔期間(例如,一天或幾天的周期)所記錄的在位置i處用戶點(diǎn)擊進(jìn)入的總數(shù),“impressions(i)”是在相同測(cè)量間隔期間含有位置i處的條目的混合結(jié)果被呈現(xiàn)給用戶的總的次數(shù)(并且其中結(jié)果被配置以便通知服務(wù)器哪個(gè)項(xiàng)目(如果有的話)被用戶選擇)。在上面的等式中,CRS(i)是當(dāng)位置i處的結(jié)果是來(lái)自源h時(shí)的位置i處的結(jié)果的點(diǎn)擊進(jìn)入率CRS(i)=clickthroughs(i,h)impressions(i,h)]]>其中“clickthroughs(i,h)”是用戶從混合搜索結(jié)果中選擇位置i處的條目的次數(shù),其中位置i處的條目最初是從搜索源h獲得的,“impressions(h)”是含有位置i處的來(lái)自源h的條目的混合結(jié)果被呈現(xiàn)給用戶的總的次數(shù)(并且其中結(jié)果被配置以便通知服務(wù)器哪個(gè)項(xiàng)目(如果有的話)被用戶選擇)。因此,RCR實(shí)質(zhì)是來(lái)自特定源的條目被從混合結(jié)果中的特定位置選擇的相對(duì)頻率的代理(proxy)。
參考圖3,在確定變換的方法300中,為至少第一源和第二源確定品質(zhì)因數(shù)。在一個(gè)實(shí)施例中,源h的品質(zhì)因數(shù)根據(jù)下述公式來(lái)確定F(h)=Σi=110P(i,h)RCR(i,h)]]>其中P(i,h)指的是混合結(jié)果中的位置i和源h的印象率(impressionrate)。盡管上面表達(dá)式的求和是從位置1到10的,但是其它實(shí)施例中的求和可以從位置1到低于或高于位置10的最終位置。印象率P(i,h)根據(jù)下述公式來(lái)確定P(i,h)=Impressions(i,h)ΣiImpressions(i,h)]]>其中Impressions(i,h)是混合結(jié)果位置i處含有來(lái)自源h的條目的次數(shù)。如果源208(圖2B)向混合結(jié)果提供條目,但是這些條目很少被用戶選擇(相對(duì)于用戶選擇來(lái)自其它源的條目的頻率來(lái)說(shuō)),則品質(zhì)因數(shù)F(h)將具有接近零的值。相反,如果源向混合結(jié)果提供條目,并且這些條目被用戶頻繁選擇,則品質(zhì)因數(shù)F(h)將具有大于或等于1的值。大于1的值指示用戶選擇的比率大于平均數(shù),小于1的值指示用戶選擇的比率小于平均數(shù)。因此,源h的品質(zhì)因數(shù)F(h)用作下述用戶感知的代理,所述用戶感知即為來(lái)自所述源的條目已經(jīng)被正確置于混合結(jié)果的位置中。
最后,在確定變換的方法300中,在步驟306中,基于源的品質(zhì)因數(shù)來(lái)確定一個(gè)或多個(gè)系數(shù)集。對(duì)于特定源,系數(shù)集被用來(lái)定義要被應(yīng)用于來(lái)自該源的相關(guān)性分?jǐn)?shù)的變換。例如,所述變換可以是移位變換,其中根據(jù)下述公式來(lái)執(zhí)行變換TransformedScore=RelevanceScore+b,其中僅有一個(gè)系數(shù)b被用于定義該變換。當(dāng)相關(guān)性分?jǐn)?shù)在近似0.0至1.0之間時(shí),該移位系數(shù)的典型值在從-0.04至0.04的范圍內(nèi)。其它可能的變換包括比例(scaling)變換,其中根據(jù)下述公式來(lái)執(zhí)行該變換TransformedScore=a*RelevanceScore,其中又是僅有一個(gè)系數(shù)a被用于定義該變換。當(dāng)相關(guān)性分?jǐn)?shù)在近似0.0至1.0之間時(shí),該比例系數(shù)的典型值在從0.9至1.1的范圍內(nèi)。其它可能的變換包括仿射(affine)變換,其中根據(jù)下述公式來(lái)執(zhí)行該變換TransformedScore=a*RelevanceScore+b,其中兩個(gè)系數(shù)(比例系數(shù)a和移位系數(shù)b)被用于定義該變換。當(dāng)相關(guān)性分?jǐn)?shù)在近似0.0至1.0之間時(shí),比例系數(shù)a的典型值在從0.9至1.1的范圍內(nèi),并且移位系數(shù)b的典型值在從-0.04至0.04的范圍內(nèi)。
確定被應(yīng)用于一個(gè)或多個(gè)源的相關(guān)性分?jǐn)?shù)的變換的系數(shù)的一個(gè)目標(biāo)是均衡所有源的品質(zhì)因數(shù)。在一些實(shí)施例中,基于源的品質(zhì)因數(shù),應(yīng)用啟發(fā)式規(guī)則集來(lái)確定變換的系數(shù)。一種類型的啟發(fā)式規(guī)則要求當(dāng)?shù)谝黄焚|(zhì)因數(shù)與第二品質(zhì)因數(shù)的比率在預(yù)定義的值范圍內(nèi)時(shí),要被應(yīng)用于第一源的相關(guān)性分?jǐn)?shù)的變換的系數(shù)采用預(yù)定義的系數(shù)值。例如,規(guī)則可以要求當(dāng)?shù)谝辉吹钠焚|(zhì)因數(shù)與第二源的品質(zhì)因數(shù)的比率(F(1)/F(2))在0.2和0.4之間時(shí),在第二源的相關(guān)性分?jǐn)?shù)的移位變換中的移位系數(shù)的值采取值0.04。另一規(guī)則可以要求當(dāng)F(1)/F(2)在0.4和0.6之間時(shí),在第二源的相關(guān)性分?jǐn)?shù)的移位變換中的移位系數(shù)的值采取值0.02。這樣,第一源的相關(guān)性分?jǐn)?shù)的變換將以如下方式確定第一和第二源的品質(zhì)因數(shù)趨向于均衡而沒(méi)有不需要的過(guò)調(diào)節(jié)。
在其它實(shí)施例中,所使用的變換函數(shù)可以是上述的移位、比例和仿射函數(shù)之外的函數(shù)。具體而言,其它實(shí)施例可以使用混合變換函數(shù),這些混合變換函數(shù)是來(lái)自其它源的結(jié)果和可用分?jǐn)?shù)(來(lái)自相關(guān)性分?jǐn)?shù)正被變換的搜索源)兩者的函數(shù)。換句話說(shuō),應(yīng)用于來(lái)自源A的結(jié)果的變換函數(shù)可以是復(fù)雜的函數(shù),其涉及來(lái)自其它源或與其它源相關(guān)聯(lián)的參數(shù),而不僅涉及與源A相關(guān)聯(lián)的固定系數(shù)。
在優(yōu)選實(shí)施例中,搜索引擎系統(tǒng)106是使用一個(gè)或多個(gè)計(jì)算機(jī)系統(tǒng)實(shí)現(xiàn)的,如圖5簡(jiǎn)要示出的那樣。如本領(lǐng)域普通技術(shù)人員將會(huì)理解的那樣,被設(shè)計(jì)用來(lái)處理大量查詢的搜索引擎系統(tǒng)可以使用比圖5所示更復(fù)雜的計(jì)算機(jī)體系結(jié)構(gòu)。例如,前端服務(wù)器集可以被用來(lái)接收查詢并在后端服務(wù)器集中分發(fā)查詢,其中后端服務(wù)器集實(shí)際處理所述查詢。在這種系統(tǒng)中,圖5所示的系統(tǒng)106將是一個(gè)后端服務(wù)器。
計(jì)算機(jī)系統(tǒng)一般將具有一個(gè)或多個(gè)中央處理單元(CPU)504、網(wǎng)絡(luò)或其它通信接口506、主與輔存儲(chǔ)設(shè)備510、以及一個(gè)或多個(gè)用于互連這些組件的通信總線508。主與輔存儲(chǔ)設(shè)備510可以包括高速隨機(jī)存取存儲(chǔ)器,并且還可以包括非易失性存儲(chǔ)器,例如一個(gè)或多個(gè)磁盤存儲(chǔ)設(shè)備(未示出)。主與輔存儲(chǔ)設(shè)備510可以包括距離(一個(gè)或多個(gè))中央處理單元504很遠(yuǎn)的海量存儲(chǔ)設(shè)備。主與輔存儲(chǔ)設(shè)備510優(yōu)選地存儲(chǔ)·操作系統(tǒng)512,操作系統(tǒng)512包括用于處理各種基本系統(tǒng)服務(wù)并執(zhí)行硬件相關(guān)任務(wù)的程序;
·網(wǎng)絡(luò)通信模塊514,網(wǎng)絡(luò)通信模塊514被用于將系統(tǒng)106經(jīng)由一個(gè)或多個(gè)通信網(wǎng)絡(luò)(例如因特網(wǎng)、其它廣域網(wǎng)、局域網(wǎng)(例如,可以將客戶計(jì)算機(jī)104連接到系統(tǒng)106的本地?zé)o線網(wǎng)絡(luò))、城域網(wǎng)等)連接到多種客戶計(jì)算機(jī)104(圖1A)并可以連接到其它服務(wù)器或計(jì)算機(jī);·搜索引擎220,用于接收來(lái)自客戶計(jì)算機(jī)104的查詢112,以及從一個(gè)或多個(gè)搜索源產(chǎn)生(或接收)一個(gè)或多個(gè)結(jié)果列表;搜索引擎(或者具有搜索源的搜索引擎)搜索搜索源數(shù)據(jù)庫(kù)以找到與查詢112有關(guān)的文檔,并且確定與該查詢有關(guān)的文檔的相關(guān)性分?jǐn)?shù);·混合模塊202,用于實(shí)現(xiàn)本發(fā)明的許多方面;以及·變換確定模塊216,用于實(shí)現(xiàn)本發(fā)明的許多方面。
混合模塊202可以包括可執(zhí)行過(guò)程、子模塊、表和其它數(shù)據(jù)結(jié)構(gòu)。在一個(gè)實(shí)施例中,混合模塊202包括用于組合由一個(gè)或多個(gè)搜索源所提供的結(jié)果列表的混合函數(shù)530。
變換確定模塊216可以在與混合模塊不同的服務(wù)器上實(shí)現(xiàn),由于它的角色是收集隨著時(shí)間而被平均的點(diǎn)擊進(jìn)入數(shù)據(jù)。新的變換函數(shù)系數(shù)被周期性確定,這比處理查詢的頻率要小得多。例如,新的變換函數(shù)系數(shù)可以被計(jì)算并且每天一次被分發(fā)到(一個(gè)或多個(gè))混合模塊,或者可能是每幾天一次。變換確定模塊216可以包括可執(zhí)行過(guò)程、子模塊、表和其它數(shù)據(jù)結(jié)構(gòu)。在一個(gè)實(shí)施例中,變換確定模塊216包括·數(shù)據(jù)結(jié)構(gòu)532,用于存儲(chǔ)所測(cè)量的點(diǎn)擊率統(tǒng)計(jì)信息;·確定函數(shù)536,用于確定系數(shù)集,該確定函數(shù)可以包括一個(gè)或多個(gè)啟發(fā)式規(guī)則;以及·一個(gè)或多個(gè)數(shù)據(jù)結(jié)構(gòu)620,用于存儲(chǔ)確定的系數(shù)集。
在替代性實(shí)施例中,為每個(gè)搜索源定義變換函數(shù),并且每個(gè)變換函數(shù)被初始分配了與一致變換(unity transformation,一種沒(méi)有改變?cè)吹姆謹(jǐn)?shù)的變換)相關(guān)聯(lián)的一個(gè)或多個(gè)系數(shù)值。然后如上所述,基于變換定義模塊收集的信息來(lái)分配用于多個(gè)變換函數(shù)的系數(shù)值。在一些實(shí)現(xiàn)中,所有的變換函數(shù)都可以被分配系數(shù),從而對(duì)每個(gè)搜索源的分?jǐn)?shù)執(zhí)行非一致變換。然而,如上文所解釋的那樣,當(dāng)混合來(lái)自N個(gè)搜索源的結(jié)果時(shí),一般至多N-1個(gè)搜索源將需要非一致變換。
為了解釋的目的,前面的說(shuō)明使用了具體的術(shù)語(yǔ)以提供對(duì)本發(fā)明的完整理解。然而,本領(lǐng)域普通技術(shù)人員將很容易認(rèn)識(shí)到,這些具體的細(xì)節(jié)不是實(shí)現(xiàn)本發(fā)明所要求的。被選出并描述的實(shí)施例是為了最好地解釋本發(fā)明的原理及其實(shí)際應(yīng)用,進(jìn)而使本領(lǐng)域技術(shù)人員能夠最優(yōu)地使用本發(fā)明以及具有多種修改的多種實(shí)施例,所述多種修改是為適用于具體使用而設(shè)計(jì)的。因此,前面公開的內(nèi)容不是窮盡性的,也不是想要將本發(fā)明限制為所公開的具體形式。在前述教導(dǎo)的啟示下,可以作出許多修改和變化形式。
本發(fā)明的范圍由權(quán)利要求及其等同物來(lái)定義。
權(quán)利要求
1.一種用于將來(lái)自多個(gè)搜索源的相應(yīng)多個(gè)搜索引擎結(jié)果混合成一個(gè)搜索引擎結(jié)果的方法,包括從每個(gè)搜索源接收相應(yīng)的條目結(jié)果列表,所述相應(yīng)結(jié)果列表對(duì)于列表上的每個(gè)條目來(lái)說(shuō)至少包括條目的位置、文檔的地址以及文檔的相關(guān)性分?jǐn)?shù);將確定的變換應(yīng)用于至少一個(gè)接收到的結(jié)果列表中的至少一個(gè)文檔子集的相關(guān)性分?jǐn)?shù),以便產(chǎn)生經(jīng)變換的分?jǐn)?shù);以及組合所述相應(yīng)結(jié)果列表的至少多個(gè)部分以產(chǎn)生包括混合條目列表的混合搜索引擎結(jié)果,其中包括至少部分基于所述文檔的經(jīng)變換分?jǐn)?shù)來(lái)對(duì)所述混合條目列表排序。
2.如權(quán)利要求1所述的方法,包括通過(guò)下述步驟來(lái)確定用于所述多個(gè)搜索源的第一搜索源的變換測(cè)量并存儲(chǔ)第一搜索源和第二搜索源的點(diǎn)擊率統(tǒng)計(jì)信息;確定第一搜索源和第二搜索源中的每個(gè)的品質(zhì)因數(shù),所述品質(zhì)因數(shù)是至少部分由所測(cè)量并存儲(chǔ)的統(tǒng)計(jì)信息來(lái)確定的;以及對(duì)于第一搜索源,基于第一搜索源和第二搜索源的品質(zhì)因數(shù)來(lái)確定系數(shù)集,其中所述系數(shù)集定義了用于第一搜索源的變換。
3.如權(quán)利要求2所述的方法,包括通過(guò)應(yīng)用啟發(fā)式規(guī)則集來(lái)確定所述系數(shù)集,所述啟發(fā)式規(guī)則中的一個(gè)或多個(gè)要求當(dāng)?shù)谝黄焚|(zhì)因數(shù)和第二品質(zhì)因數(shù)的比率在預(yù)定義的值范圍之內(nèi)時(shí),所述變換的系數(shù)采用預(yù)定義的系數(shù)值。
4.如權(quán)利要求1所述的方法,其中所述變換是由兩個(gè)系數(shù)確定的仿射變換。
5.如權(quán)利要求1所述的方法,其中所述變換是由一個(gè)系數(shù)確定的比例變換。
6.如權(quán)利要求5所述的方法,其中所述系數(shù)采用0.9至1.1范圍內(nèi)的值。
7.如權(quán)利要求1所述的方法,其中所述變換是由一個(gè)系數(shù)確定的移位變換。
8.如權(quán)利要求7所述的方法,其中所述系數(shù)采用來(lái)自從-0.04至0.04范圍內(nèi)的值。
9.如權(quán)利要求2所述的方法,其中測(cè)量并存儲(chǔ)點(diǎn)擊率統(tǒng)計(jì)信息包括接收來(lái)自用戶的查詢;將混合結(jié)果返回給用戶,所述混合結(jié)果包括條目列表;記錄所述條目列表中的哪個(gè)列表被用戶選擇;以及重復(fù)所述接收、返回和記錄,直到達(dá)到了終止條件。
10.如權(quán)利要求9所述的方法,其中記錄包括記錄用戶是否沒(méi)有從所述條目列表中選擇任何項(xiàng)目。
11.如權(quán)利要求9所述的方法,其中測(cè)量并存儲(chǔ)點(diǎn)擊率統(tǒng)計(jì)信息還包括記錄所述混合結(jié)果中與所選條目相關(guān)聯(lián)的位置以及搜索源,所選條目是由用戶選擇的;以及記錄所述混合結(jié)果中與未被用戶選擇的條目相關(guān)聯(lián)的位置以及搜索源。
12.如權(quán)利要求11所述的方法,其中確定第一搜索源的品質(zhì)因數(shù)包括對(duì)于所述多個(gè)搜索源中的每個(gè)搜索源,確定對(duì)所述混合結(jié)果中的多個(gè)位置的相應(yīng)多個(gè)印象數(shù);對(duì)于第一搜索源,確定用戶選擇所述混合結(jié)果中的位置中與第一搜索源相關(guān)聯(lián)的條目的第一次數(shù);以及至少部分基于所述第一次數(shù)和所述多個(gè)印象數(shù),確定第一搜索源的品質(zhì)因數(shù)。
13.一種搜索引擎系統(tǒng),包括多個(gè)搜索源;至少一個(gè)接口,用于接收查詢以及發(fā)送搜索結(jié)果;耦合到所述多個(gè)搜索源的至少一個(gè)搜索引擎,用于從每個(gè)搜索源接收與所接收的查詢相對(duì)應(yīng)的相應(yīng)條目結(jié)果列表,所述相應(yīng)結(jié)果列表對(duì)于列表上的每個(gè)條目來(lái)說(shuō)至少包括條目的位置、文檔的地址、以及文檔與所接收的查詢相關(guān)的相關(guān)性分?jǐn)?shù);以及混合模塊,被配置將確定的變換應(yīng)用于至少一個(gè)接收到的結(jié)果列表中的至少一個(gè)文檔子集的相關(guān)性分?jǐn)?shù),以便產(chǎn)生經(jīng)變換的分?jǐn)?shù),并且還被配置組合所述相應(yīng)結(jié)果列表的至少多個(gè)部分以產(chǎn)生包括混合條目列表的混合搜索引擎結(jié)果,其中包括至少部分基于所述經(jīng)變換分?jǐn)?shù)來(lái)對(duì)所述混合條目列表排序。
14.如權(quán)利要求13所述的搜索引擎系統(tǒng),其中所述至少一個(gè)搜索引擎包括所述混合模塊。
15.如權(quán)利要求13所述的搜索引擎系統(tǒng),還包括變換確定模塊,其中所述變換確定模塊還被配置通過(guò)下述步驟來(lái)確定用于所述多個(gè)搜索源的第一搜索源的變換測(cè)量并存儲(chǔ)第一搜索源和第二搜索源的點(diǎn)擊率統(tǒng)計(jì)信息;確定第一搜索源和第二搜索源中的每個(gè)的品質(zhì)因數(shù),所述品質(zhì)因數(shù)是至少部分由所測(cè)量并存儲(chǔ)的統(tǒng)計(jì)信息來(lái)確定的;以及對(duì)于第一搜索源,基于第一搜索源和第二搜索源的品質(zhì)因數(shù)來(lái)確定系數(shù)集,其中所述系數(shù)集定義了用于第一搜索源的變換。
16.如權(quán)利要求15所述的搜索引擎系統(tǒng),其中所述至少一個(gè)搜索引擎包括所述變換確定模塊。
17.如權(quán)利要求15所述的搜索引擎系統(tǒng),其中所述變換確定模塊還被配置通過(guò)應(yīng)用啟發(fā)式規(guī)則集來(lái)確定所述系數(shù)集,所述啟發(fā)式規(guī)則中的一個(gè)或多個(gè)要求當(dāng)?shù)谝黄焚|(zhì)因數(shù)和第二品質(zhì)因數(shù)的比率在預(yù)定義的值范圍之內(nèi)時(shí),所述變換的系數(shù)采用預(yù)定義的系數(shù)值。
18.如權(quán)利要求15所述的搜索引擎系統(tǒng),其中所述變換是由兩個(gè)系數(shù)確定的仿射變換。
19.如權(quán)利要求15所述的搜索引擎系統(tǒng),其中所述變換是由一個(gè)系數(shù)確定的比例變換。
20.如權(quán)利要求15所述的搜索引擎系統(tǒng),其中所述系數(shù)采用0.9至1.1范圍內(nèi)的值。
21.如權(quán)利要求15所述的搜索引擎系統(tǒng),其中所述變換是由一個(gè)系數(shù)確定的移位變換。
22.如權(quán)利要求15所述的搜索引擎系統(tǒng),其中所述系數(shù)采用來(lái)自從-0.04至0.04范圍內(nèi)的值。
23.如權(quán)利要求15所述的搜索引擎系統(tǒng),其中所述搜索引擎系統(tǒng)還被配置測(cè)量并存儲(chǔ)第一搜索源和第二搜索源的點(diǎn)擊率統(tǒng)計(jì)信息,所述配置包括所述搜索引擎還被配置接收來(lái)自用戶的查詢;所述搜索引擎還被配置將混合結(jié)果返回給用戶,所述混合結(jié)果包括條目列表;所述變換確定模塊還被配置記錄所述條目列表中的哪個(gè)列表被用戶選擇;所述搜索引擎系統(tǒng)還被配置重復(fù)所述接收、返回和記錄,直到達(dá)到了終止條件。
24.如權(quán)利要求23所述的搜索引擎系統(tǒng),其中所述變換模塊還被配置記錄用戶是否沒(méi)有從所述條目列表中選擇任何條目。
25.如權(quán)利要求23所述的搜索引擎系統(tǒng),其中所述變換模塊還被配置記錄所述混合結(jié)果中與所選條目相關(guān)聯(lián)的位置以及搜索源,所選條目是由用戶選擇的;以及記錄所述混合結(jié)果中與未被用戶選擇的條目相關(guān)聯(lián)的位置以及搜索源。
26.如權(quán)利要求25所述的搜索引擎系統(tǒng),其中所述變換確定模塊還被配置通過(guò)下述步驟來(lái)確定第一搜索源的品質(zhì)因數(shù)對(duì)于所述多個(gè)搜索源中的每個(gè)搜索源,確定對(duì)所述混合結(jié)果中的多個(gè)位置的相應(yīng)多個(gè)印象數(shù);對(duì)于第一搜索源,確定用戶選擇所述混合結(jié)果中的位置中與第一搜索源相關(guān)聯(lián)的條目的第一次數(shù);以及至少部分基于所述第一次數(shù)和所述多個(gè)印象數(shù),確定用于第一搜索源的品質(zhì)因數(shù)。
全文摘要
本發(fā)明提供了一種用于將來(lái)自多個(gè)搜索源的相應(yīng)多個(gè)搜索引擎結(jié)果混合為一個(gè)搜索引擎結(jié)果的方法與系統(tǒng)。從每個(gè)搜索源接收條目結(jié)果列表。每個(gè)結(jié)果列表對(duì)于列表上的每個(gè)條目來(lái)說(shuō)至少包括條目的位置、文檔的地址、以及文檔的相關(guān)性分?jǐn)?shù)。確定的變換被應(yīng)用于至少一個(gè)接收到的結(jié)果列表中的至少一個(gè)文檔子集的相關(guān)性分?jǐn)?shù),以便產(chǎn)生經(jīng)變換的分?jǐn)?shù)。最后,相應(yīng)結(jié)果列表的多個(gè)部分被組合以產(chǎn)生包括混合條目列表的混合搜索引擎結(jié)果。所述混合條目列表的排序至少部分基于文檔的經(jīng)變換分?jǐn)?shù)。
文檔編號(hào)G06F7/00GK1809803SQ200480017467
公開日2006年7月26日 申請(qǐng)日期2004年4月23日 優(yōu)先權(quán)日2003年4月25日
發(fā)明者羅伯特·L·小特拉維斯 申請(qǐng)人:奧弗圖爾服務(wù)公司
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
化德县| 禄劝| 金川县| 友谊县| 永川市| 麟游县| 旬邑县| 丰县| 抚远县| 田东县| 镇沅| 家居| 甘孜| 金溪县| 新龙县| 奉新县| 遵义县| 昭平县| 明水县| 合水县| 日土县| 津市市| 广昌县| 龙陵县| 沐川县| 文成县| 绥宁县| 宁陕县| 宣化县| 剑川县| 安义县| 沽源县| 英吉沙县| 塔河县| 梨树县| 台中市| 忻城县| 当涂县| 榆树市| 宜州市| 高陵县|