專利名稱:用于在搜索結(jié)果中包括集合項目的技術(shù)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及搜索,更具體地涉及提供包括集合項目(collection item)的搜索結(jié)果。
背景技術(shù):
搜索引擎通常對同質(zhì)的一組項目執(zhí)行搜索。取決于搜索引擎,同質(zhì)的一組項目可以是web頁、圖像、文件、歌曲、視頻、商品等。被執(zhí)行搜索的項目類型在此被稱為搜索的"基本類型"。屬于搜索基本類型的項目在此被稱為"基本項目"。
代表基本項目的集合的對象在此被稱為"集合項目"。在一些情形中,集合項目木身是基本項目。例如,"文件夾"本身^文件,但^也可以包含其它文件。類似地,web頁可以包含其它web貞的列表。作為基本項1—1的集合項H在此被稱為"基本集合項目"。
當(dāng)搜索弓1擎針對特定基本類型執(zhí)行搜索時,搜索結(jié)果可以包括基木狼合項目以及不是集合的基本項目。例如,對在特定日期創(chuàng)建的文件的搜索結(jié)果可以包括在指定日期創(chuàng)建的文件夾以及其它文件。炎似地,對。'"經(jīng)哈頓酒店"相關(guān)的web頁的搜索結(jié)果可以包括具體曼哈頓酒店的web貞,以及列出曼哈頓酒店的web頁的來自旅行服務(wù)站點的web災(zāi)。
但是,對搜索者有用的集合項目不僅僅是這樣的基本集合項目。在昨多情況下,在本身不是基本項目的對象中已經(jīng)指明基本項ll的集合。例如,用戶的一組"書簽"對應(yīng)于一組網(wǎng)頁,但是書簽組本身不是web頁。因此,書簽組未被列在對web頁執(zhí)行的搜索結(jié)果中。類似地,用戶的播放列表對應(yīng)于一組歌曲,但是播放列表本身不是歌曲。因此,播放列農(nóng)未被列在對歌曲執(zhí)行的搜索的搜索結(jié)果中。
本身不是基本項目的集合項目在此被稱為"非基本集合項[T'。在一些情況下,對相關(guān)非基本集合項目的識別對搜索者而言可能比對相關(guān)基本項目的識別更有用。在其它情況下,對相關(guān)非基本集合項目的識別可能沒有對相關(guān)基本項目的識別那么有用。因此,希望向搜索者提供關(guān)于(a)相關(guān)基本項目、(b)相關(guān)基本集合項目、和(C)相關(guān)非基本集合項目的信息,并以允許搜索者確定各個項目的相對相關(guān)性的方式來呈現(xiàn)信息。
在本章節(jié)中描述的方法是可以實行的方法,但并不必然是已經(jīng)在先前
構(gòu)想出或?qū)嵭械姆椒?。因此,除非另有指示,不?yīng)當(dāng)僅僅由于包括在此章節(jié)中,就將在本章節(jié)中描述的任何方法設(shè)想為現(xiàn)有技術(shù)。
通過示例而非通過限制在附圖的示圖中例示了本發(fā)明,在附圖中,相似標號指的是相似元件,并且其中
圖1是圖示出根據(jù)本發(fā)明一個實施例用于對搜索查詢作出應(yīng)答的歩驟的流程圖;以及
圖2是可在其屮實施木發(fā)明的實施例的計算機系統(tǒng)的框圖。
具體實施例方式
在以下描述中,為了說明的目的,闡述了許多具體細節(jié)以提供對木發(fā)明的完整理解。但是,應(yīng)當(dāng)清楚,在沒有這些具體細節(jié)的情況下也可以實施本發(fā)明。在其它情形中,以框圖形式示出公知的結(jié)構(gòu)和設(shè)備以避免不必要地模糊本發(fā)明。
提供了用于在響應(yīng)于搜索查詢而返回給用戶的-組己排序的搜索結(jié)果中包括集合項目的技術(shù)。為了在該組已排序的搜索結(jié)果中返回非基本集合項目,搜索引擎針對基本項目和非基本集合項H兩者都運行杳詢。在'3A
詢相匹配的基本項n和非基本集合項目被識別之后,搜索引擊確定基本項
n和非基本集合項目兩者的相關(guān)分數(shù)。通過在包括匹配基本項n的同-組已排序的搜索結(jié)果中包括匹配非基本集合項目,用戶能夠更容易地確定非
7基本集合項目包含用戶將感興趣的基本項目的可能性。另外,當(dāng)非基本集合項目在一組整合的已排序的搜索結(jié)果中的排名很高而不是與基本項目排名相分離地呈現(xiàn)時,用戶更可能使用非基本集合項目來找到他們正在尋找的〈言息。
還提供了集合評分技術(shù),用于以與為不是集合的基本項目生成相關(guān)分數(shù)不同的方式為集合項目生成相關(guān)分數(shù)。集合評分技術(shù)可被應(yīng)用于非基本集合項目、基本集合項目或者兩者。
在一個實施例中,集合評分技術(shù)基于各種因素,包括屬于集合項目的基本項目的特性和集合項目本身的特性。用于確定集合項目的相關(guān)分數(shù)的基本項目的特性可以是與用于確定各個基本項目自身的相關(guān)性的特性相同的特性。可用于確定集合項目的相關(guān)分數(shù)的集合項目特性例如包括與集合
項目的創(chuàng)建者相關(guān)聯(lián)的信息、集合項目的普及性(populanty)等。
當(dāng)被應(yīng)用于基本集合項目時,集合評分技術(shù)可以產(chǎn)生與通過對基本集合項目應(yīng)用標準基本項目評分將產(chǎn)生的相關(guān)性排序不同的相關(guān)性排序。例如,可以至少部分基于由基本集合項目表示的基本項目的相關(guān)分數(shù)來牛:成特定基本集合項H的相關(guān)分數(shù)。這樣產(chǎn)生的相關(guān)分數(shù)可以高于或低于在沒有考慮基本集合項目代表集合的情況下通過對基本集合項H評分將產(chǎn)74-:的相關(guān)分數(shù)。
集合項H
以下應(yīng)當(dāng)描述用于在針對各種類型的基本項M運行的搜索的搜索結(jié)果
中包括集合項目的各種技術(shù)。這些技術(shù)不限于任何特定類型的搜索,或者任何特定類型的集合項目。非基本集合項目的以下列表被提供用于例不的目的,而不應(yīng)當(dāng)是窮盡性的。
標簽(tag)——每一個標簽代表已被標上給定標簽的項目的集合。標簽可被應(yīng)用于任何類型的基本項目,包括web頁、事件記錄、歌曲、視頻等。
搜索一--每一個搜索代表屬于在執(zhí)行搜索時產(chǎn)生的搜索結(jié)果的項目的集合??舍槍θ魏晤愋偷幕卷椖繄?zhí)行搜索。給定搜索代農(nóng)具有被執(zhí)行搜索的基本類型的基本項目的集合。例如,針對與圖像相關(guān)聯(lián)的元數(shù)據(jù)執(zhí)行的搜索代表通過執(zhí)行該搜索將產(chǎn)生的圖像的集合。
書簽組一一每一個書簽組代表書簽組具有其書簽的項目的集合。例
如,如果特定用戶對該用戶最喜歡的web頁創(chuàng)建了書簽,則該用戶所創(chuàng)建的書簽組代表那些web頁的集合。
還參見——"還參見"列表代表在邏輯上與給定項目相關(guān)的項目的集
合。例如,電子百科全書可以具有描述特定話題的web頁,并且"還參見"列表鏈接到包含相關(guān)話題的百科全書內(nèi)容的web頁。"還參見"列表本身不是web頁,但是其代表包含那些相關(guān)話題的web頁的集合。
播放列表——播放列表代表屬于該播放列表的可播放媒體項目(例如,歌曲、視頻)的集合。
愿望列表(wish list)——愿望列表代表己被置于愿望列表中的可購買項目的集合。
目錄——目錄代表已被指派給與該目錄相對應(yīng)的類別的項目的集合。各種項H己被歸類到目錄。例如,各種公司已經(jīng)創(chuàng)建web站點的詳盡冃錄以幫助用戶找至U他們尋求的信息。
旅行路線一一旅行路線代表旅行項Ll的集合。旅行項1=1可以包括例如??扛?、航班、汽車租賃、觀光等。
基本集合項目的示例包括但不限于文件夾(能夠包含其它文件的文件)和集合web頁(代表其它web頁的集合的web頁)。
登記集合項目
為了在搜索結(jié)果中包括集合項目,被執(zhí)行搜索的索引必須包括關(guān)于集合項目的信息以及關(guān)于基本項目的信息。下面將更詳細描述,針對評分成呈現(xiàn),搜索引擎并不是以與基本項目相同的方式來對待集合項目。W此,搜索索引包括對哪些項目是基本項目而哪些項目是集合項目的指示。在支持多種類型的集合項目的索引中,該索引包括標識索引所表示的每一種集合項目的類型的數(shù)據(jù)。
通常將不得不使用與用來收集關(guān)于基本項目的信息的機制分離的機制來獲得關(guān)于集合項目的信息。例如,用于獲得關(guān)于web頁的信息的一種技術(shù)涉及通過跟隨web頁之間的鏈接來"抓取web" ( "crawling theweb")。但是,傳統(tǒng)的web抓取器(web crawler)不是設(shè)計用來獲得關(guān)于用戶為了訪問他們最喜歡的web頁而創(chuàng)建的書簽組的信息。因此,必須使用不同機制來搜集關(guān)于書簽組的信息,以使得書簽組可以被包括在web頁搜索的已排序結(jié)果中。
可以使用各種類型的機制來獲得關(guān)于非基本集合項目的信息。本發(fā)明不限于任何特定類型的非基本集合項目發(fā)現(xiàn)機制。例如,可以通過與用來創(chuàng)建非基本集合項目的機制相同的機制向搜索引擎顯式登記非基本集合項目。因此,允許用戶創(chuàng)建和共享書簽組的web服務(wù)可以向web頁搜索引擎登記這樣的書簽組。類似地,允許用戶向愿望列表添加項目的貿(mào)易web站點可以向商品搜索引擎登記那些愿望列表。作為又一個示例,允許用戶定義和共享歌曲播放列表的媒體回放軟件可被設(shè)計為向音樂搜索引擎登記那些播放列表。
非基本集合項目向搜索引擎的顯式登記可以是向動的,或?f按照創(chuàng)迚非基本集合項目的用戶的意愿來執(zhí)行。例如,允許用戶創(chuàng)讓和共享書簽組的web站點可以提供用戶接口控件,用戶通過該用戶接口控件指明是否應(yīng)當(dāng)向搜索引擎登記這些書簽組。此外,即使當(dāng)用戶已經(jīng)允許將非基木免合項目登記到搜索引擎時,登記機制也可以應(yīng)用另外的標準來確定是否應(yīng)4登記非基本集合項目。例如,允許用戶創(chuàng)建和共享書簽組的站點也可以上L有用于確定哪些書簽組最有用的評分機制。在這些惜形下,站點nj以僅向搜索引擎登記與超過給定閾值的有用分數(shù)相關(guān)聯(lián)的那些書簽組。
取代顯式登記機制,或者除了顯式登記機制之外,還n]-以隱式登記t
基本集合項目。例如,可以使用發(fā)現(xiàn)機制來挖掘i—q錄系統(tǒng)的ki錄,然后向
web頁搜索引擎登記這樣發(fā)現(xiàn)的目錄。
作為另一個不例,可以針對文件倉庫運行發(fā)現(xiàn)機制以IR別與播放列表
相對應(yīng)的文件,然后將以這種方式發(fā)現(xiàn)的任何播放列表登記到-rr樂搜索引擎。
在非基本集合項目本身是搜索的實施例中,用于執(zhí)行web頁搜索的投
10索引擎可以登記滿足特定標準的所有搜索。例如,搜索引擎可以登記以超過特定閾值的頻率提交給搜索引擎的所有搜索。
登記元數(shù)據(jù)
當(dāng)向搜索引擎登記非基本集合項目時,登記包括向搜索引擎提供以下關(guān)于非基本集合項目的信息所述信息使得搜索引擎能夠(a)確定該非
基本集合項目是否與為基本項目指定的搜索標準相匹配,以及(b)為非基本集合項目生成相關(guān)分數(shù),通過該相關(guān)分數(shù)可以相對于匹配基本項目對該非基本集合項目排序。
在登記非基本集合項目期間提供給搜索引擎的信息在此被稱為該非基本集合項目的"登記元數(shù)據(jù)"。在登記元數(shù)據(jù)中包含的實際信息可以因?qū)嵤┓绞讲煌煌⑶铱梢曰谡坏怯浀姆腔炯享椖康念愋?。登記元?shù)據(jù)的示例包括但不限于
O標識由非基本集合項目表示的集合中的基本項目的信息;O關(guān)于非基木集合項目的創(chuàng)建者的信息,例如對創(chuàng)建齊的聲望的指不、對創(chuàng)建者的興趣的指示、對創(chuàng)建者的專門技能的指示、對創(chuàng)建者的教TT竹
景的指小、對創(chuàng)建者的從屬關(guān)系(affilmtion)的指小等。o關(guān)于非基本集合項目的信息,例如被指派給非基木集合項目的名稱、己被指派給非基本集合項目的標簽、對非基本集合項t:l的呰及性的指示、對非基本集合項目所屬于的類別的指示(例如,關(guān)于播放列表是針對鄉(xiāng)
村音樂的、愿望列表充滿了設(shè)立終極家庭影院所需的項n等的節(jié)實)。
對集合項目評分
以下應(yīng)3描述用于與非集合項目不同地對集合項目評分的各種lf分技術(shù)。集合評分技術(shù)可被應(yīng)用于基本集合項目和非基本集合項M兩者。
為集合項0生成的相關(guān)分數(shù)可以基于各種因素,包括與集合項n相關(guān)
聯(lián)的登記元數(shù)據(jù)的任意一個或全部。這樣的因素可以包括但不限于(1)集合中的基本項目的特性,(2)集合本身的特性,和(3)集合創(chuàng)建者的特性。以下將更洋細地描述每一種類型的因素?;趯儆诩系幕卷椖康奶匦赃M行集合評分在一個實施例中,登記元數(shù)據(jù)包括標識由集合項目表示的集合中的基本項目的信息。因為登記元數(shù)據(jù)標識了屬于該集合的基本項目,所以搜索引擎能夠在對集合項目評分時考慮這些基本項目的特性。例如,可用來對集合評分的基本項目的特性是基本項目的各自的相關(guān)分數(shù)。例如,在一個實施例中,生成集合項目的相關(guān)分數(shù)包括(O使用傳統(tǒng)的基本項目評分技術(shù)生成屬于集合的每一個基本項目的相關(guān)分數(shù),(2)確定屬于該集合的基本項目的平均相關(guān)分數(shù),以及(3)至少部分基于屬于該集合的基本項目的平均相關(guān)分數(shù)來生成集合的相關(guān)分數(shù)。
使集合項目的相關(guān)分數(shù)基于屬于該集合項目的基本項目的特性的其它示例包括
o基于被指派給播放列表中的歌曲的用戶評估來確定該播放列表的相關(guān)分數(shù);
o基于播放列表中的歌曲的下載頻率米確定該播放列表的相關(guān)分數(shù);o基于播放列表中的歌曲的平均持續(xù)時間來確定該播放列農(nóng)的相關(guān)分數(shù);o基于處在愿望列表屮的每:--個項目的銷售數(shù)目來確定該愿望列農(nóng)的相關(guān)分數(shù);
o基于與愿望列表中的每一個項目相關(guān)聯(lián)的質(zhì)量評估來確定該愿望列表的相關(guān)分數(shù);
o基于有多少人已經(jīng)指示他們計劃參加已經(jīng)被指派標簽的每一個,件,確
定已經(jīng)被指派給這些事件的標簽的相關(guān)性。o基于與路線中包括的國家相關(guān)聯(lián)的安全評估來確定該路線的相關(guān)分數(shù);o基于路線上的旅行項目的普及性來確定該路線的相關(guān)分數(shù);以及o基于與文件夾屮的項目相關(guān)聯(lián)的修改日期來確定該文件夾的相關(guān)分數(shù)。這些示例僅僅例示了集合項目的相關(guān)分數(shù)如何能基于屬T該集合項I 1
的基本項y的特性。在確定集合項目的分數(shù)時考慮的基木項n的具休特忡
將因?qū)嵤┓绞讲煌煌@部分基于屬于該集合的基本項y的本性?;诩系奶匦赃M行集合評分
取代考慮屬于集合的基本項目的特性,或者除了考慮屬于集合的基本項目的特性之外,還可以至少部分基于集合項目的特性來生成集合項目的相關(guān)分數(shù)。這樣的特性可以包括被顯式地指派給集合的元數(shù)據(jù)(例如,名稱、標簽等)、集合的內(nèi)在特性(例如,集合中的項目數(shù)目、播放列表的總持續(xù)時間、愿望列表中的項目的總成本等)、以及基于與集合相關(guān)的用戶行為生成的元數(shù)據(jù)(例如,普及性、評估等)兩者。例如,特定書簽組可能從書簽組用戶收到高有用性評估。對書簽組的有用性評估可以包括在書簽組的登記元數(shù)據(jù)中,并且可以由搜索引擎在對書簽組生成相關(guān)分數(shù)時使用。因此,高有用性評估將增加書簽組的相關(guān)分數(shù),而低有用性評估將降低書簽組的相關(guān)分數(shù)。
使集合項目的相關(guān)分數(shù)基于集合項目的特性的其它示例包括o基于播放列表的普及性確定播放列表的相關(guān)分數(shù);
o基于有多少人向他們的個人愿望列表添加了愿望列表的內(nèi)容來確定該愿
望列表的相關(guān)分數(shù);o基于文件火的修改數(shù)據(jù)來確定文件夾的相關(guān)分數(shù);
o基于標簽有多頻繁地被指派給事件來確定己經(jīng)被指派給^件的標簽的相關(guān)性;以及
o基于書簽組已經(jīng)被指派的類別來確定書簽組的相關(guān)性。
這些示例僅僅例示了集合項目的相關(guān)分數(shù)如何能基于該集合項「I的特性。在確定集合項目的分數(shù)時考慮的集合項目的具體特性將因?qū)嵤┓绞讲煌煌?,這部分基于集合項目的本性。
基于集合創(chuàng)建者的特性進行集合評分取代考慮或者除了考慮屬于集合的基本項目的特性和集合項0的特性
之外,可以至少部分基于集合項目的創(chuàng)建者的特性來生成該集合項n的相
關(guān)分數(shù)。例如,特定用戶可能已經(jīng)創(chuàng)建許多共享書簽組。其它用戶可能已經(jīng)給予那些書簽組很高的"有用性"評估。因此,用戶可能已經(jīng)被15簽組web站點授予"權(quán)威"等級。書簽組的創(chuàng)建者已經(jīng)被標明"權(quán)威"的—,實可以用來增加用戶所創(chuàng)建的書簽組的相關(guān)分數(shù),即使當(dāng)該分數(shù)被應(yīng)用于未接收到高有用性評估的書簽組時也是如此。
集合項目的特性和集合項目的創(chuàng)建者的特性可被存儲在搜索引擎索引內(nèi),或者在搜索引擎正在處理查詢時被動態(tài)確定。例如,響應(yīng)于確定特定書簽組與查詢相匹配,搜索引擎可以(1)識別書簽組的擁有者,并且(2)基于與用戶相關(guān)聯(lián)的當(dāng)前信息動態(tài)地生成用于該創(chuàng)建者的聲望度量。類似地,可以在搜索査詢正被處理時動態(tài)地生成諸如書簽組之類的集合項目的普及性度量。通過在搜索查詢被處理時動態(tài)地生成特性,對集合的評分可以考慮從集合項目被登記到搜索引擎起已經(jīng)發(fā)生的事件。例如,書簽組的普及性或者書簽組創(chuàng)建者的聲望可能在書簽組被登記到搜索引擎之時和書簽組被選擇作為搜索查詢的匹配項目之時之間極大地改變。
使集合項目的相關(guān)分數(shù)基于集合項目的創(chuàng)建者的特性的其它示例包
括
o基于播放列表的創(chuàng)建者的年齡確定播放列表的相關(guān)分數(shù)(例如,創(chuàng)建者的年齡與搜索者的年齡之差越小,則被指派給播放列表的相關(guān)分數(shù)越
o基于愿望列表的創(chuàng)建者的收入水平確定愿望列表的相關(guān)分數(shù);
o基于文件夾的創(chuàng)建者在公司內(nèi)所處的位置確定文件夾的相關(guān)分數(shù);
o基于標簽的創(chuàng)建者是否也是張貼被標上該標簽的事件的人,確定已被指
派給這些事件的標簽的相關(guān)性;o基于書簽組的創(chuàng)建者是否已被識別為電子垃圾(spam)的源,確定該
書簽組的相關(guān)性;
o基于對書簽組的創(chuàng)建者的專門技能的度量來確定該書簽組的相關(guān)性;o基于對書簽組的創(chuàng)建者的聲望的度量來確定書簽組的相關(guān)性(其中,聲
望度量可以至少部分基于創(chuàng)建者在多早的時間制作后來被確定為有川的
項目的書簽來確定);以及o基于書簽組的創(chuàng)建者的家庭狀態(tài)(home-state)來確定書簽組的相關(guān)性。
這些示例僅僅例示了集合項目的相關(guān)分數(shù)如何能基于集合項目的創(chuàng)建
14者的特性。在確定集合項目的分數(shù)時考慮的集合項目創(chuàng)建者的具體特性將因?qū)嵤┓绞讲煌煌?,這部分基于集合項目的本性。
包括集合項目的結(jié)果組根據(jù)一個實施例,在搜索引擎已經(jīng)識別出與搜索相匹配的基本項目和集合項目之后,搜索引擎為每一個匹配項目生成相關(guān)分數(shù)??梢曰趥鹘y(tǒng)的評分技術(shù)來生成基本項目的相關(guān)分數(shù),同時基于以上描述的一個或多個因素來生成集合項目的相關(guān)分數(shù)。 一旦己經(jīng)為匹配項目生成分數(shù),就基于它們各自的相關(guān)分數(shù)對匹配項目排序,并將其返回作為單個已排序的匹配項目列表。使用這里描述的技術(shù),該已排序的列表可以包括基本項目、基本集合項目、和非基本集合項目。因為基本項目、基本集合項目和非基本集合項目都被包括在同一已排序組中,所以用戶可以很容易地確定這些基本項目、基本集合項目和非基本集合項目的相對相關(guān)性。
在搜索結(jié)果中呈現(xiàn)集合項目一旦用戶己經(jīng)被呈現(xiàn)包括集合項目的己排序的一組搜^結(jié)果,川戶就可能希望從該組中選擇集合項目。根據(jù)一個實施例,當(dāng)用戶從搜索結(jié)果屮
選擇集合項目列表時,用戶被呈現(xiàn)以web頁,該web頁包括用于訪問M于集合項目的各個項目的控件。在一些情況下,這樣的web頁將在集合項0
被登記到搜索引擎吋存在。在那樣的情形下,針對該集合項n的搜索結(jié)果
列表可以包含到該預(yù)先存在的web頁的鏈接。
但是,在其它情況下,在集合被登記到搜索引擎吋將不會存在這樣的web頁。例如,在播放列表被登記到搜索引擎時,可能沒有與該播放列農(nóng)相關(guān)聯(lián)的web頁。類似地,在書簽組、路線或愿望列表被登記到搜索引擎時,可能沒有與集合項目相對應(yīng)的web頁??梢允褂酶鞣N技術(shù)來使能搜索引擎在那些情形下列出并呈現(xiàn)集合項目web頁。
根據(jù)一種技術(shù),在集合項目被登記到搜索引擎吋,如果該集合項目不具有其自身的web頁,則搜索引擎為該集合項目生成web頁。當(dāng)這樣的集
合項目被列出在搜索結(jié)果中時,搜索結(jié)果列表包括一種鏈接,該鏈接在被選擇時取回由搜索引擎創(chuàng)建的web頁。
根據(jù)另一種技術(shù),在集合項目被登記到搜索引擎時,沒有為該集合項
目生成web頁。而是,搜索引擎在搜索結(jié)果列表中包括一種鏈接,該鏈接在被選擇時使得搜索引擎為所選擇的集合項目動態(tài)地生成web頁。
搜索引擎可被設(shè)計為在集合項目被登記時為特定類型的集合項目生成
web頁,并在從搜索結(jié)果列表中選擇集合項目時為其它類型的集合項目動態(tài)地構(gòu)建web頁。因此,使用這里所描述的技術(shù)生成的搜索結(jié)果列表可以
包括以下各項的任意組合
o到與基本項目相關(guān)聯(lián)的web頁的鏈接;
o到與集合項目相關(guān)聯(lián)的預(yù)先存在的web頁的鏈接;
o到由搜索引擎為集合項目創(chuàng)建的靜態(tài)web頁的鏈接;以及
o在被選擇時使得由搜索弓I擎為集合項目動態(tài)生成web頁的鏈接。
根據(jù)一個實施例,在搜索結(jié)果中與基本項目不同地顯示集合項目。具
體而言,搜索引擎可以利用以下事實與關(guān)于基本項目知道的信息相比,
關(guān)于集合可以知道更多信息和更多類型的信息。例如,如果集合項目足書簽組,則搜索引擎可以知道該書簽組的創(chuàng)建者以及該書簽組的冇用性評估。因此,搜索引擎可以在該書簽組的搜索結(jié)果列表條目屮包括對有用性評估的指示、創(chuàng)建者的名字、創(chuàng)建者的照片、對創(chuàng)建者聲望度量的指小
圖1是圖示出根據(jù)本發(fā)明一個實施例用于對搜索査詢作出響應(yīng)的歩驟
的框圖。在歩驟100,搜索引擎接收到查詢。在歩驟102,搜索引擎將搜索查詢和與基本項目、基本集合項目和非基本集合項11相關(guān)聯(lián)的兀數(shù)據(jù)相比較以識別匹配項tl。在步驟104,使用一種評分技術(shù)向匹配基本項[l指派相關(guān)分數(shù),并使用與用于對匹配基本項目評分的技術(shù)不同的集合評分技術(shù)來對匹配基本集合項目和匹配非基本集合項H指派相關(guān)分數(shù)。在歩驟106,單個已排序的搜索結(jié)果列表被生成,并被提供作為搜索查詢的結(jié)果。該己排序的列表可以包括基本項目、基本集合項目和非基本集合項
示例處現(xiàn)
16目,這些項目被根據(jù)它們各自的相關(guān)分數(shù)來排序。如上所述,針對非基本
集合項目的列表條目可以包括到預(yù)先存在的web頁、靜態(tài)web頁的鏈接,或者將使得為非基本集合項目動態(tài)生成web頁的鏈接。
硬件概況
圖2是圖示出可以在其上實施本發(fā)明的實施例的計算機系統(tǒng)200的框圖。計算機系統(tǒng)200包括總線202或者用于傳遞信息的其它通信機構(gòu)、和與總線202耦合用于處理信息的處理器204。計算機系統(tǒng)200還包括諸如隨機訪問存儲器(RAM)或其它動態(tài)存儲設(shè)備之類的主存儲器206,其與總線202耦合,用于存儲信息和由處理器204執(zhí)行的指令。主存儲器206還可用于在要由處理器204執(zhí)行的指令執(zhí)行期間存儲臨時變量或其它中間信息。計算機系統(tǒng)200還包括只讀存儲器(ROM) 208或其它靜態(tài)存儲設(shè)備,其與總線202耦合,用于存儲靜態(tài)信息和用于處理器204的指令。諸如磁盤或光盤之類的存儲設(shè)備210被提供并與總線202耦合以用于存儲信息和指令。
計算機系統(tǒng)200可以經(jīng)由總線202耦合到諸如陰極射線管(CRT)之類的用于向計算機用戶顯示信息的顯示器212。包括字母數(shù)字鍵和其它鍵的輸入設(shè)備214與總線202耦合,用于向處理器204傳遞信息和命令選擇。另一種類型的用戶輸入設(shè)備是諸如鼠標、軌跡球、或光標方向鍵之類的光標控制216,用于向處理器204傳遞方向信息和命令選擇并用丁控制顯示器212上的光標移動。這種輸入設(shè)備通常具有兩個軸(第一軸(例如x軸)和第二軸(例如y軸))上的兩個自由度,這種自由度允許設(shè)備指定平面上的位置。
本發(fā)明涉及使用計算機系統(tǒng)200來實施這里所描述的技術(shù)。根據(jù)本發(fā)明- -個實施例,那些技術(shù)由計算機系統(tǒng)200響應(yīng)于處理器204執(zhí)行包含在主存儲器206中的一個或多個指令的一個或多個序列而被執(zhí)行。這樣的指令可被從諸如存儲設(shè)備210之類的另一個機器可讀介質(zhì)讀到主存儲器206中。在主存儲器206中包含的指令序列的執(zhí)行使得處理器204執(zhí)行這里所描述的處理步驟。在替代實施例中,可以取代或者結(jié)合軟件指令使用硬接線電路來實施本發(fā)明。因此,本發(fā)明的實施例不限于硬件電路和軟件的任何具體組合。
這里所使用的術(shù)語"機器可讀介質(zhì)"指的是參與提供使得機器以特定形式操作的數(shù)據(jù)的任何介質(zhì)。在使用計算機系統(tǒng)200實施的實施例中,各
種機器可讀介質(zhì)例如涉及向處理器204提供指令用于執(zhí)行。這樣的介質(zhì)可
以采取許多形式,包括但不限于非易失性介質(zhì)、易失性介質(zhì)和傳輸介質(zhì)。
非易失性介質(zhì)例如包括光盤或磁盤,例如存儲設(shè)備210。易失性介質(zhì)包括動態(tài)存儲器,例如主存儲器206。傳輸介質(zhì)包括同軸電纜、銅導(dǎo)線和光纖,包括含有總線202的導(dǎo)線。傳輸介質(zhì)還可以采取聲波或光波的形式,例如,在無線電波和紅外線數(shù)據(jù)通信期間生成的那些。所有這樣的介質(zhì)必須是有形的,以使得由該介質(zhì)承載的指令能夠通過將指令讀取到機器的物理機制而被檢測到。
機器可讀介質(zhì)的常見形式例如包括軟盤、柔性盤、硬盤、磁帶、或者任何其它磁性介質(zhì)、CD-ROM、任何其它光介質(zhì)、穿孔卡、紙帶、任何其它具有孔圖案的物理介質(zhì)、RAM 、 PROM 、禾n EPROM 、 FLASH-EPROM、任何其它存儲芯片或卡帶、如以下描述的載波、或者計筧機可以讀取的任何其它介質(zhì)。
各種形式的機器可讀介質(zhì)可以涉及將一個或多個指令的一個或多個序列承載到處理器204用于執(zhí)行。例如,指令起初可以承載在遠程計算機的磁盤上。遠程計算機可以將指令載入到其動態(tài)存儲器,并使用調(diào)制解調(diào)器經(jīng)由電話線路來發(fā)送指令。在計算機系統(tǒng)200本地的調(diào)制解調(diào)器可以接收電話線路上的數(shù)據(jù),并使用紅外線發(fā)射機將數(shù)據(jù)轉(zhuǎn)換為紅外線信y-。紅外線檢測器可以接收在紅外線信號上承載的數(shù)據(jù),并且適當(dāng)電路可以將該數(shù)據(jù)置于總線202上??偩€202將數(shù)據(jù)承載到主存儲器206,處理器204從主存儲器206取回并執(zhí)行指令。主存儲器206所接收的指令可以可選地在由處理器204執(zhí)行之前或之后被存儲在存儲設(shè)備210上。
計算機系統(tǒng)200還包括與總線202耦合的通信接U 218。通信接口218提供耦合到網(wǎng)絡(luò)鏈路220的雙向數(shù)據(jù)通信,網(wǎng)絡(luò)鏈路220與本地網(wǎng)絡(luò)222相連接。例如,通信接口 218可以是綜合服務(wù)數(shù)字網(wǎng)絡(luò)(ISDN)卡或者調(diào)制解調(diào)器,用以提供到相應(yīng)類型的電話線路的數(shù)據(jù)通信連接。作為另
一個示例,通信接口 218可以是局域網(wǎng)(LAN)卡,用以提供到兼容LAN 的數(shù)據(jù)通信連接。無線鏈路也可被實施。在任意這樣的實施方式中,通信 接口 218發(fā)送和接收電、電磁或光信號,這些電、電磁或光信號承載了表 示各種類型的信息的數(shù)字數(shù)據(jù)流。
網(wǎng)絡(luò)鏈路220通常提供通過一個或多個網(wǎng)絡(luò)到其它數(shù)據(jù)設(shè)備的數(shù)據(jù)通 信。例如,網(wǎng)絡(luò)鏈路220可以提供通過本地網(wǎng)絡(luò)222到主機計算機224或 者到由因特網(wǎng)服務(wù)提供商(ISP) 226操作的數(shù)據(jù)設(shè)備的連接。ISP 226又 通過萬維分組數(shù)據(jù)通信網(wǎng)絡(luò)(現(xiàn)在通常稱為"因特網(wǎng)"228)提供數(shù)據(jù)通 信服務(wù)。本地網(wǎng)絡(luò)222和因特網(wǎng)228都使用承載數(shù)字數(shù)據(jù)流的電、電磁或 光信號。通過各種網(wǎng)絡(luò)的信號和在網(wǎng)絡(luò)鏈路220上并通過通信接口 218的 信號(這些信號承載去往和來自計算機系統(tǒng)200的數(shù)字數(shù)據(jù))是傳送信息 的載波的示例形式。
計算機系統(tǒng)200能夠通過一個或多個網(wǎng)絡(luò)、網(wǎng)絡(luò)鏈路220和通信接n 218發(fā)送消總和接收包括程序代碼的數(shù)據(jù)。在因特網(wǎng)示例屮,服務(wù)器230 可以通過因特網(wǎng)228、 ISP 226、本地網(wǎng)絡(luò)222和通信接口 218發(fā)射針對應(yīng) 用程序所請求的代碼。
所接收的代碼可以由處理器204在其被接收時執(zhí)行,和/或存儲在存儲 設(shè)備210或其它非易失性存儲裝置中以待以后執(zhí)行。這樣,計算機系統(tǒng) 200可以獲得載波形式的應(yīng)用程序代碼。
在前面的說明書中,己經(jīng)參考可能因?qū)嵤┓绞讲煌煌脑S多丄i休 細節(jié)描述了本發(fā)明的實施例。因此,對本發(fā)明是什么以及申請人想要什么 成為本發(fā)明的唯一且排他的指示是從本申請以權(quán)利要求發(fā)出的具體形式發(fā) 出的 -組權(quán)利要求,包括任何后續(xù)校正。在此針對這樣的權(quán)利要求屮包含 的術(shù)語清楚地闡明的任何定義應(yīng)當(dāng)決定這樣的術(shù)語在權(quán)利要求屮使.W的含 義。因此,權(quán)利要求未清楚記載的元素、特性、特征、優(yōu)點或?qū)傩圆粦?yīng)當(dāng) 以任何方式限制該權(quán)利要求的范圍。因此,要從例示的角度而非限制的角 度看待說明書和附圖。
權(quán)利要求
1.一種方法,包括執(zhí)行涉及指令的機器執(zhí)行操作,其中,所述指令是在由一個或多個處理器執(zhí)行時使得所述一個或多個處理器執(zhí)行特定步驟的指令,所述特定步驟包括響應(yīng)于接收到搜索查詢,識別匹配項目組,其中,所述組包括一個或多個基本項目和一個或多個非基本集合項目;通過為所述組中的每一個匹配項目生成相關(guān)分數(shù),確定所述組中的每一個匹配項目相對于所述組中的所有其它匹配項目的相關(guān)性排序;以及通過基于所述匹配項目組和所述相關(guān)性排序提供搜索結(jié)果,對所述搜索查詢作出應(yīng)答;其中,所述機器執(zhí)行操作是以下各項的至少一個(a)經(jīng)由傳輸介質(zhì)發(fā)送所述指令,(b)經(jīng)由傳輸介質(zhì)接收所述指令,(c)將所述指令存儲到機器可讀存儲介質(zhì)上,和(d)執(zhí)行所述指令。
2. 根據(jù)權(quán)利要求1所述的方法,其屮,提供搜索結(jié)果的歩驟包括提供來自所述組的匹配項目的己排序列表,其中,所述已排序列友足芘于所述相關(guān)性排序來排序的。
3. 根據(jù)權(quán)利要求1所述的方法,其中,所述基本項目是web貞,并且所述非基本集合項目是書簽組。
4. 根據(jù)權(quán)利要求1所述的方法,其中,所述基本項目是web頁,并且所述非基本集合項目是搜索。
5. 根據(jù)權(quán)利要求1所述的方法,其中,所述基木項gj^ web貝-,并且所述非基本集合項目是替代搜索査詢。
6. 根據(jù)權(quán)利要求1所述的方法,其中,所述基木項目是音頻文件,并且所述非基本集合項目是播放列表。
7. 根據(jù)權(quán)利要求1所述的方法,其中,所述基本項目是商品,并且所述非基本集合項目是愿望列表。
8. 根據(jù)權(quán)利要求1所述的方法,其中,所述基本項目是web貞,并且所述非基本集合項目是目錄。
9. 根據(jù)權(quán)利要求1所述的方法,其中,所述基本項目是旅行相關(guān)項目,并且所述非基本集合項目是路線。
10. 根據(jù)權(quán)利要求1所述的方法,其中,所述基本項目是標簽項目,并且所述非基本集合項目是標簽。
11. 一種方法,包括執(zhí)行涉及指令的機器執(zhí)行操作,其中,所述指令是在由一個或多個處理器執(zhí)行時使得所述一個或多個處理器執(zhí)行特定歩驟的指令,所述特定步驟包括響應(yīng)于接收到搜索查詢,識別匹配項目組;其中,所述組包括第一項目和第二項目;其中,所述第一項目是集合項目,并且所述第二項目是不是集合項目的基本項目;使用第一評分技術(shù)確定所述第一項目的第一相關(guān)分數(shù);使用與所述第一評分技術(shù)不同的第二評分技術(shù),確定所述第二項目的第二相關(guān)分數(shù);以及通過提供包括所述第一項目和所述第二項目的己排序的一組搜索結(jié)果,對所述搜索査詢作出應(yīng)答;其中,所述第一項目和所述第二項目各自被基于所述第-一相關(guān)分數(shù)和所述第二相關(guān)分數(shù)在所述已排序的組內(nèi)被排序;其中,所述機器執(zhí)行操作是以下各項的至少一個(a)經(jīng)由傳輸介質(zhì)發(fā)送所述指令,(b)經(jīng)由傳輸介質(zhì)接收所述指令,(c)將所述指令存儲到機器可讀存儲介質(zhì)上,和(d)執(zhí)行所述指令。
12. 根據(jù)權(quán)利要求11所述的方法,其中,所述第- 項目是基本集合項目。
13. 根據(jù)權(quán)利要求11所述的方法,其中,所述第一項目是非基本集合項目。
14. 根據(jù)權(quán)利要求11所述的方法,其中,所述第一評分技術(shù)至少部分基于為屬于由所述第一項目表示的集合的基本項目生成的相關(guān)分數(shù),確定所述第一相關(guān)分數(shù)。
15. 根據(jù)權(quán)利要求11所述的方法,其中,所述第一評分技術(shù)節(jié)少部分基于關(guān)于所述第一項目的創(chuàng)建者的信息,確定所述第一相關(guān)分數(shù)。
16. 根據(jù)權(quán)利要求13所述的方法,其中,所述第一評分技術(shù)至少部分基于與所述非基本集合項目相關(guān)聯(lián)的普及性度量,確定所述第一相關(guān)分數(shù)。
17. 根據(jù)權(quán)利要求14所述的方法,其中,所述第一評分技術(shù)至少部分基于屬于由所述第一項目表示的集合的基本項目的平均相關(guān)分數(shù),確定所述第一相關(guān)分數(shù)。
18. 根據(jù)權(quán)利要求ll所述的方法,其中提供己排序的一組搜索結(jié)果的步驟包括提供具有針對所述第一項目的鏈接的web頁;并且所述特定步驟包括響應(yīng)于對所述鏈接的選擇,動態(tài)地生成包括用于訪問屬于所述第一項目的基本項目的控件的web頁。
19. 根據(jù)權(quán)利要求ll所述的方法,其中提供已排序的一組搜索結(jié)果的步驟包括提供具有針對所述第一項目的鏈接的web頁;并且所述特定步驟包括響應(yīng)于對所述鏈接的選擇,傳遞在所述第一項H被登記到搜索引擎時由所述搜索引擎創(chuàng)建的web頁;所述web頁包括用于訪問屬于所述第一項目的基本項目的控件。
20. —種方法,包括執(zhí)行涉及指令的機器執(zhí)行操作,其屮,所述指令是在由一個或多個處理器執(zhí)行時使得所述一個或多個處理器執(zhí)行特定歩驟的指令,所述特定步驟包括響應(yīng)于接收到搜索査詢,識別匹配項目組;通過為所述組中的每一個匹配項目生成相關(guān)分數(shù),確定所述組中的每一個匹配項目相對于所述組中的所有其它匹配項卩:l的相關(guān)性排序;其中,至少一個匹配項目的相關(guān)分數(shù)是至少部分基于所述至少一個匹配項目的創(chuàng)建者的特性來生成的;以及通過基于所述匹配項目組和所述相關(guān)性排序提供搜索結(jié)果,對所述搜索查詢作出應(yīng)答;其中,所述機器執(zhí)行操作是以下各項的至少一個(a)經(jīng)由傳輸介質(zhì)發(fā)送所述指令,(b)經(jīng)由傳輸介質(zhì)接收所述指令,(C)將所述指令存儲到機器可讀存儲介質(zhì)上,和(d)執(zhí)行所述指令。
21. 根據(jù)權(quán)利要求20所述的方法,其中,所述特性是對所述至少一個匹配項目的創(chuàng)建者的聲望的度量。
22. 根據(jù)權(quán)利要求20所述的方法,其中,所述至少一個匹配項目是集合項目。
23. 根據(jù)權(quán)利要求22所述的方法,其中所述集合項目是書簽組;所述特性是對所述書簽組的創(chuàng)建者的聲望的度量;并且所述度量是至少部分基于所述創(chuàng)建者在多早時間制作后來被確定為有用的項目的書簽來確定的。
全文摘要
提供了用于在響應(yīng)于搜索查詢而返回給用戶的一組已排序的搜索結(jié)果中包括集合項目的技術(shù)。還提供了集合評分技術(shù),用于以與為不是集合的基本項目生成相關(guān)分數(shù)的方式不同的方式生成集合項目的相關(guān)分數(shù)。集合評分技術(shù)可被應(yīng)用于非基本集合項目、基本集合項目、或者兩者。包括基本項目和集合項目的與搜索查詢匹配的項目被基于它們各自的相關(guān)分數(shù)以統(tǒng)一排序方式排序,從而允許搜索很容易地確定匹配集合項目相對于匹配基本項目的相關(guān)性排序。
文檔編號G06F17/30GK101563691SQ200780047262
公開日2009年10月21日 申請日期2007年12月14日 優(yōu)先權(quán)日2006年12月19日
發(fā)明者喬舒亞·E·斯沙徹爾 申請人:雅虎公司