專利名稱:用于瞄準(zhǔn)用戶行為的內(nèi)容管理系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明一般地涉及內(nèi)容管理,更具體而言,涉及用于將用戶行為和與 該用戶行為相關(guān)的內(nèi)容相關(guān)聯(lián)以向用戶呈現(xiàn)相關(guān)內(nèi)容的方法和裝置。
背景技術(shù):
在典型的內(nèi)容管理系統(tǒng)中,用戶發(fā)出對基本內(nèi)容的請求,并接收帶有 附加內(nèi)容的基本內(nèi)容,該附加內(nèi)容與用戶可能相關(guān),也可能不相關(guān)。基本 內(nèi)容可能包括用戶訪問的網(wǎng)頁,并且可能以搜索引擎提供的一組搜索結(jié)果 的形式提供到用戶的客戶端系統(tǒng)。附加內(nèi)容可能包括被廣告服務(wù)器等放置 在被訪問的網(wǎng)頁上的廣告等等。附加內(nèi)容通常以通欄標(biāo)題廣告的形式被顯 示在被訪問的頁面上,該通欄標(biāo)題廣告包括到廣告商的網(wǎng)站的鏈接。
被配置用來提供基本內(nèi)容和附加內(nèi)容的內(nèi)容管理系統(tǒng)是常用的。當(dāng)今 一種常用的內(nèi)容管理系統(tǒng)被稱為因特網(wǎng),這是一種全球性互聯(lián)網(wǎng)絡(luò),其中
網(wǎng)絡(luò)節(jié)點向可能響應(yīng)以用戶請求的基本內(nèi)容并附帶附加內(nèi)容的其他節(jié)點發(fā) 送請求。 一種內(nèi)容管理系統(tǒng)可用的協(xié)議是超文本傳輸協(xié)議(HTTP),其 中諸如瀏覽器之類的HTTP客戶端針對統(tǒng)一資源定位符(URL)定位的基 本內(nèi)容發(fā)出請求,并且HTTP服務(wù)器通過發(fā)送URL指定的內(nèi)容來響應(yīng)請
求。當(dāng)然,這只是一個非常普通的示例,內(nèi)容檢索并不局限于此。
例如,除因特網(wǎng)之外的網(wǎng)絡(luò)可能被使用,例如令牌環(huán)、WAP (無線應(yīng) 用協(xié)議)網(wǎng)絡(luò)、疊加網(wǎng)絡(luò)、點對點網(wǎng)絡(luò)、專用網(wǎng)絡(luò)等等。除了 HTTP之外 的協(xié)議可被用來請求和傳輸內(nèi)容,例如SMTP (簡單郵件傳輸協(xié)議)、 FTP (文件傳輸協(xié)議)等等,并且內(nèi)容可能被URL之外的其他標(biāo)識所指 定。本發(fā)明的某些部分是參考因特網(wǎng)(一種當(dāng)今常用于各種應(yīng)用的全球性 互聯(lián)網(wǎng)絡(luò))來描述的,但是應(yīng)該理解,對因特網(wǎng)的參考可以被改為參考因 特網(wǎng)基本概念的變體(例如內(nèi)聯(lián)網(wǎng)、虛擬專用網(wǎng)、嵌入式TCP/IP (enclosed TCP/IP)網(wǎng)絡(luò)等等)以及其他形式的網(wǎng)絡(luò)。還應(yīng)用理解,本發(fā) 明可能完全在一臺計算機或一個計算機集合中操作,從而避免對網(wǎng)絡(luò)的需 求。
被請求的基本內(nèi)容和相關(guān)內(nèi)容可能具有很多形式。例如, 一些內(nèi)容可 以是文本、圖像、視頻、音頻、動畫、程序代碼、數(shù)據(jù)結(jié)構(gòu)、格式化文本 等等。基本內(nèi)容和相關(guān)內(nèi)容可能在網(wǎng)頁上提供,并且可能根據(jù)多種網(wǎng)頁協(xié) 議中的任意一種被格式化,所述網(wǎng)頁協(xié)議例如是超文本標(biāo)記語言 (HTML)、可擴展標(biāo)記語言(XML)、標(biāo)準(zhǔn)通用標(biāo)記語言(SGML)或 現(xiàn)在適用的其他語言。
HTML是一種從HTTP服務(wù)器提供的頁面或其他內(nèi)容常用的格式。以 HTML格式化的內(nèi)容可能包括到其他HTML內(nèi)容的鏈接,并且定位其他內(nèi) 容的內(nèi)容的集合可以被看作一個文檔web,因此賦予以HTML格式化的內(nèi) 容集合的一個示例一個名稱"萬維網(wǎng)"或"WWW"。因為這是一種公 知結(jié)構(gòu),因此其在這里被用于很多示例,但是應(yīng)該理解,除非另外指定, 否則這些示例所描述的概念并不局限于WWW、 HTML、 HTTP、因特網(wǎng) 等等。
基本內(nèi)容的提供者可以確定基本內(nèi)容的主題和/或用戶的興趣所在,并 提供與基本內(nèi)容和/或用戶興趣相關(guān)的附加內(nèi)容。在確定相關(guān)內(nèi)容時,基本 內(nèi)容提供者可以例如通過提供該用戶可能感興趣的廣告并且從廣告商處收 取顯示該廣告商的廣告的費用來使利潤最大化。準(zhǔn)確地確定與用戶相關(guān)的 內(nèi)容是一個持續(xù)而昂貴的問題。 一種用來確定和提供與用戶相關(guān)的內(nèi)容的
10 方法是在用戶的用戶配置文件(profile)和相關(guān)內(nèi)容之間手工建立預(yù)定關(guān) 聯(lián)。通常,預(yù)定關(guān)聯(lián)是由瀏覽內(nèi)容和用戶配置文件以確定相關(guān)關(guān)聯(lián)的人來 手工生成的。這種在用戶和相關(guān)內(nèi)容之間生成關(guān)聯(lián)的方法包括許多問題, 因為用戶通常不愿意并且抗拒提供個人信息,用戶害怕他或她的個人信息 被可能不謹(jǐn)慎地使用該個人信息的人所享有(或出售)。即使在用戶確實 提供了個人信息時,該信息也只能提供一時的靜態(tài)用戶興趣。該信息一般 不涉及用戶變化的興趣,除非通過繁重的工作(對于信息請求者和用戶來 說都很繁重)來周期性地請求和提供新的個人信息才可能獲得用戶變化的 興趣。
另一種用于將相關(guān)內(nèi)容與用戶相關(guān)聯(lián)的常用方法是使用瞄準(zhǔn)用戶的使 用人口統(tǒng)計信息,這種方法通常伴隨著不精確性。雖然人口統(tǒng)計瞄準(zhǔn)可能 提供稍微相關(guān)的通用信息,但是該信息針對用戶的人口統(tǒng)計中依個人而定 的瞄準(zhǔn)的廣告可能還不夠精細(xì)。像用戶提供的配置文件一樣, 一旦人口研 究結(jié)束,人口統(tǒng)計信息也會遭受變得過時的命運,因為生成的人口統(tǒng)計數(shù) 據(jù)一般不隨用戶興趣的改變而改變。這對于逐天改變或甚至逐小時改變的 興趣而言尤其如此。
需要一種改進(jìn)的用于生成用戶配置文件的內(nèi)容管理系統(tǒng),所述用戶配 置文件隨用戶變化的興趣而保持最新,并將興趣與及時提供給用戶的相關(guān) 內(nèi)容相關(guān)聯(lián)。
發(fā)明內(nèi)容
根據(jù)本發(fā)明實施例的內(nèi)容管理系統(tǒng)關(guān)聯(lián)基本內(nèi)容和相關(guān)內(nèi)容。如果相 關(guān)內(nèi)容與用戶相關(guān),或者更具體而言,如果用戶配置文件中由一個或多個
關(guān)鍵字構(gòu)成的單元和與相關(guān)內(nèi)容相關(guān)聯(lián)的單元匹配,則基本內(nèi)容可以與相 關(guān)內(nèi)容一道被提供給用戶瀏覽器。
根據(jù)一個實施例, 一種內(nèi)容管理系統(tǒng)被配置為基于用戶配置文件和相 關(guān)內(nèi)容的關(guān)聯(lián)向用戶系統(tǒng)提供基本內(nèi)容和相關(guān)內(nèi)容,其中相關(guān)內(nèi)容與用戶 相關(guān)。該系統(tǒng)包括多個web服務(wù)器,被配置為向所述用戶系統(tǒng)提供所述 基本內(nèi)容和所述相關(guān)內(nèi)容; 一組附加內(nèi)容服務(wù)器,被配置為如果所述用戶
配置文件中的單元匹配與所述相關(guān)內(nèi)容相關(guān)聯(lián)的單元,則向所述web服務(wù) 器提供所述相關(guān)內(nèi)容;解析服務(wù)器,被配置為從所述用戶請求的所述基本 內(nèi)容中提取出所述用戶配置文件中的單元并生成所述用戶配置文件中的單 元的分級列表;以及單元匹配模塊,被配置為如果所述用戶請求所述基本 內(nèi)容,則判斷所述用戶配置文件中的單元是否匹配與所述相關(guān)內(nèi)容相關(guān)聯(lián) 的單元,其中所述web服務(wù)器被配置為如果所述用戶配置文件中的單元匹 配與所述相關(guān)內(nèi)容相關(guān)聯(lián)的單元,則提供所述基本內(nèi)容和所述相關(guān)內(nèi)容。 根據(jù)特定實施例,解析服務(wù)器包括解析模塊,被配置為解析所述基本內(nèi) 容以生成經(jīng)解析的基本內(nèi)容;單元提取模塊,被配置為從所述經(jīng)解析的基 本內(nèi)容中提取出所述用戶配置文件中的單元;以及單元分級模塊,被配置 為生成所述用戶配置文件中的單元的分級列表?;緝?nèi)容可以包括至少- 個網(wǎng)頁的內(nèi)容。
根據(jù)另一實施例,系統(tǒng)被配置為將用戶配置文件與相關(guān)內(nèi)容相關(guān)聯(lián)。 該系統(tǒng)包括解析模塊,被配置為解析用戶請求的基本內(nèi)容并且生成經(jīng)解 析的基本內(nèi)容;單元字典模塊,包括多個單元;單元提取模塊,被配置為 從所述經(jīng)解析的基本內(nèi)容中提取出包括在所述單元字典中的單元,從所述 經(jīng)解析的基本內(nèi)容中提取出的單元被稱為提取單元;單元分級模塊,被配 置為基于分別關(guān)聯(lián)于所述提取單元的相關(guān)性得分和收入生成量中的至少--種來對所述提取單元分級,并生成提取單元的分級列表;與用戶相關(guān)聯(lián)并 包括所述分級列表的用戶配置文件;以及單元匹配模塊,被配置為如果所 述分級列表中的提取單元和與所述相關(guān)內(nèi)容相關(guān)聯(lián)的單元匹配,則生成所 述用戶配置文件和所述相關(guān)內(nèi)容之間的關(guān)聯(lián)。所述單元匹配模塊可被配置 為如果最高分級的提取單元和與所述相關(guān)內(nèi)容相關(guān)聯(lián)的單元中的至少一個 匹配或處于同一相關(guān)單元集合中,則生成所述基本內(nèi)容和所述相關(guān)內(nèi)容之 間的關(guān)聯(lián)。相關(guān)內(nèi)容可以包括廣告,或者可以被一組鏈接所指向。所述鏈 接可以包括贊助商鏈接、集成鏈接和內(nèi)部鏈接中的至少-個。
根據(jù)另一實施例,系統(tǒng)被配置為將基本內(nèi)容與相關(guān)內(nèi)容一起提供給用 戶系統(tǒng),以使相關(guān)內(nèi)容與用戶相關(guān)。該系統(tǒng)包括多個web服務(wù)器,被配 置為提供基本內(nèi)容和相關(guān)內(nèi)容;解析服務(wù)器,被配置為基于用戶請求的基
本內(nèi)容生成單元的用戶配置文件;單元匹配模塊,被配置為如果所述用戶 配置文件中的至少一個單元和與所述相關(guān)內(nèi)容相關(guān)聯(lián)的單元匹配,則在所
述用戶配置文件和所述相關(guān)內(nèi)容之間生成關(guān)聯(lián);以及用戶系統(tǒng),被配置為
接收由至少一個web服務(wù)器提供的基本內(nèi)容和相關(guān)內(nèi)容,并基于所述關(guān)聯(lián)
在網(wǎng)頁上公布所述基本內(nèi)容和所述相關(guān)內(nèi)容。
根據(jù)本發(fā)明另一實施例,提供了一種用于提供與用戶相關(guān)的相關(guān)內(nèi)容
和web內(nèi)容的方法,該方法包括從計算機網(wǎng)絡(luò)請求基本內(nèi)容;從所述基
本內(nèi)容中提取一組單元,所述單元被稱為提取單元;給所述提取單元分別
分配相關(guān)性得分和收入生成量;基于所述相關(guān)性得分和所述收入生成量中 的至少一個對所述提取單元分級;以及形成用戶配置文件,該用戶配置文
件包括提取單元的分級列表、所述相關(guān)性得分和所述收入生成量。根據(jù)特 定實施例,該方法還包括解析所述基本內(nèi)容來生成經(jīng)解析的基本內(nèi)容,其 中所述從基本內(nèi)容中提取一組單元的步驟包括從所述經(jīng)解析的基本內(nèi)容中 提取這組單元。根據(jù)特定實施例,該方法還包括將用戶配置文件存儲在用 戶行為數(shù)據(jù)庫中。
根據(jù)另一實施例,提供了一種用于提供與用戶相關(guān)的相關(guān)內(nèi)容和web 內(nèi)容的方法。該方法包括從計算機網(wǎng)絡(luò)請求基本內(nèi)容;以及如果用戶配 置文件中的至少一個單元和與相關(guān)內(nèi)容相關(guān)聯(lián)的至少一個單元匹配并且如 果用戶請求web內(nèi)容,則將web內(nèi)容與相關(guān)內(nèi)容一起提供。Web內(nèi)容包括 私有內(nèi)容和公共內(nèi)容。私有內(nèi)容可以包括email和聊天室討論中的至少一 種。
根據(jù)以下詳細(xì)描述和附圖,可以明白本發(fā)明的其他特征和優(yōu)點。
圖1是包括根據(jù)本發(fā)明實施例的客戶端系統(tǒng)的信息檢索和通信網(wǎng)絡(luò)的 圖示。
圖2是根據(jù)本發(fā)明實施例的內(nèi)容管理系統(tǒng)的圖示。 圖3是根據(jù)本發(fā)明一個實施例的可能由單元分級(unit-ranking)模塊 生成并被存儲在用戶行為數(shù)據(jù)庫中的示例性用戶配置文件。
圖4A是根據(jù)本發(fā)明另一實施例的可能由單元分級模塊生成并被存儲
在用戶行為數(shù)據(jù)庫中的示例性用戶配置文件。
圖4B是根據(jù)本發(fā)明另一實施例的可能由單元分級模塊生成并被存儲 在用戶行為數(shù)據(jù)庫中的用戶配置文件的示例。
圖5是根據(jù)本發(fā)明一個實施例的可能被公布在客戶選系統(tǒng)的顯示器上 并且包括基本內(nèi)容和相關(guān)內(nèi)容的示例性網(wǎng)頁。
圖6是根據(jù)本發(fā)明一個實施例的高級流程圖,其具有用于基于用戶查 看的網(wǎng)頁來形成用戶配置文件的步驟。
圖7是根據(jù)本發(fā)明另一實施例的高級流程圖,其具有用于基于用戶査 看的網(wǎng)頁來提供web內(nèi)容和與用戶相關(guān)的相關(guān)內(nèi)容的步驟。
圖8是根據(jù)本發(fā)明一個實施例的包括單元分類(unit-taxonomy)方案 的內(nèi)容管理系統(tǒng)的簡化圖示。
圖9是單元分類系統(tǒng)的"樹"結(jié)構(gòu)的簡化圖示。
圖IO是根據(jù)本發(fā)明另一實施例的內(nèi)容管理系統(tǒng)的圖示。
具體實施例方式
現(xiàn)在將以示例方式而非限制方式來描述本發(fā)明的實施例。將會理解, 本發(fā)明具有廣闊的實用性并可被用在很多不同的上下文中。
本發(fā)明的實施例經(jīng)由用戶的客戶端系統(tǒng)向用戶提供基本內(nèi)容,并且與 基本內(nèi)容一起,還提供與用戶相關(guān)的附加內(nèi)容?;緝?nèi)容一般包括用戶請 求的內(nèi)容,并且可以經(jīng)由用戶的客戶端系統(tǒng)在用戶訪問的網(wǎng)頁上被提供。 基本內(nèi)容還可能包括公布出所請求的內(nèi)容的網(wǎng)頁。附加內(nèi)容可能包括廣告 和/或到放置在被訪問的網(wǎng)頁上的內(nèi)容的鏈接。如果附加內(nèi)容基本類似于 與用戶相關(guān)聯(lián)的用戶配置文件的屬性,則附加內(nèi)容可被看作與用戶相關(guān)。 所述屬性可以包括用戶用于查詢返回給用戶的文檔集錦和搜索結(jié)果的査詢 中標(biāo)識的關(guān)鍵字、單元、類別等等。如果附加內(nèi)容包括與用戶配置文件中 包括的相同或類似的關(guān)鍵字、單元、類別等等或與它們相關(guān)聯(lián),附加內(nèi)容 則可能基本類似于用戶配置文件。下面將更詳細(xì)描述本發(fā)明的這些和其他 實施例。為了方便,被配置用于關(guān)聯(lián)基本內(nèi)容和與用戶相關(guān)的附加內(nèi)容
(有時簡稱為相關(guān)內(nèi)容)的裝置先被描述,隨后再描述用于將基本內(nèi)容和 與用戶相關(guān)的附加內(nèi)容相關(guān)聯(lián)的方法。
圖1是根據(jù)本發(fā)明實施例包括客戶端系統(tǒng)20的信息檢索和通信網(wǎng)絡(luò) 10的簡化圖示。在通信網(wǎng)絡(luò)10中,客戶端系統(tǒng)20通過網(wǎng)絡(luò)30 (例如因 特網(wǎng)或內(nèi)聯(lián)網(wǎng)(例如LAN或WAN))被耦合到任意多個服務(wù)器系統(tǒng)40, 到40N。如這里所述,客戶端系統(tǒng)20根據(jù)本發(fā)明被配置為與服務(wù)器系統(tǒng) 4C^到4(^中的任意一個通信,以例如訪問、接收、檢索和顯示網(wǎng)頁形式 的基本內(nèi)容和相關(guān)聯(lián)的相關(guān)內(nèi)容。
圖1所示系統(tǒng)中的若干元件包括傳統(tǒng)的公知元件,這里無需詳細(xì)說 明。例如,客戶端系統(tǒng)20可以包括桌上型個人計算機、工作站、膝上型 電腦、PDA、蜂窩電話、任意無線應(yīng)用協(xié)議(WAP)使能的設(shè)備,或能 夠直接或間接接口到因特網(wǎng)的任意其他計算設(shè)備??蛻舳讼到y(tǒng)20通常運 行瀏覽程序,例如Microsoft的Internet Explorer 瀏覽器、Netscape Navigator 瀏覽器、Mozilla 瀏覽器、Opera 瀏覽器、在蜂窩電話、 PDA或其他無線設(shè)備情況下的WAP使能瀏覽器,從而允許客戶端系統(tǒng)20 的用戶訪問、處理和査看通過網(wǎng)絡(luò)30來自服務(wù)器系統(tǒng)40,到40n的其可用 的內(nèi)容??蛻舳讼到y(tǒng)20還可能包括一個或多個用戶接口設(shè)備22,例如鍵 盤、鼠標(biāo)、軌跡球、觸摸屏、手寫筆等等,用于與由服務(wù)器系統(tǒng)40,到 40w或其他服務(wù)器提供的頁面、表格和其他信息協(xié)作來與顯示器(例如監(jiān) 視屏幕、LCD顯示器等等)上的瀏覽器提供的圖形用戶界面(GUI)交 互。本發(fā)明適合用于因特網(wǎng)(指一種特定全球性互聯(lián)網(wǎng)絡(luò))。但是,應(yīng)該 理解,可以使用其它網(wǎng)絡(luò)來替代因特網(wǎng)或與因特網(wǎng)一起使用,例如內(nèi)聯(lián) 網(wǎng)、外聯(lián)網(wǎng)、虛擬專用網(wǎng)(VPN)、基于非TCP/IP的網(wǎng)絡(luò)、任意LAN或 WAN等等。
根據(jù)一個實施例,客戶端系統(tǒng)20和系統(tǒng)服務(wù)器40,到40N以及它們各 自的組件是可使用包括使用一個或多個中央處理單元(例如由Intd、 AMD等制造的中央處理單元)運行的計算機代碼的應(yīng)用來配置的操作 器。用于操作和配置客戶端系統(tǒng)20以傳輸、處理和顯示這里所述的基本 內(nèi)容和與基本內(nèi)容相關(guān)的內(nèi)容的計算機代碼優(yōu)選地被下載并存儲在硬盤
上,但是整個程序代碼或其某些部分也可被存儲在任意其他公知的易失性
或非易失性存儲介質(zhì)或設(shè)備(例如ROM或RAM)上,或被提供在任意 能夠存儲程序代碼的介質(zhì)上,例如壓縮盤(CD)介質(zhì)、數(shù)字多功能盤 (DVD)介質(zhì)、軟盤等等。另外,整個程序代碼或其某些部分可以從軟 件源發(fā)送和下載,例如使用通信介質(zhì)和協(xié)議(例如TCP/IP、 HTTP、 HTTPS、以太網(wǎng)或其他傳統(tǒng)介質(zhì)和協(xié)議)通過網(wǎng)絡(luò)30從服務(wù)器系統(tǒng)40, 到4(^之一發(fā)送和下載到客戶端系統(tǒng)20。這里所稱服務(wù)器系統(tǒng)可以包括單 個服務(wù)器計算機或多個服務(wù)器計算機。
應(yīng)該意識到,用于實現(xiàn)本發(fā)明各個方面的計算機代碼可以是C、 C++、 HTML、 XML、 Java、 JavaScript等代碼,或任意其他合適的腳本語 言(例如VBScript),或任意其他可在客戶端系統(tǒng)20和/或服務(wù)器40i到 4(^上執(zhí)行或被編譯以在客戶端系統(tǒng)20和/或服務(wù)器4(^到40w上執(zhí)行的合 適的編程語言。在某些實施例中,沒有代碼被下載到客戶端系統(tǒng)20,并 且所需代碼由服務(wù)器執(zhí)行,或執(zhí)行已經(jīng)存在于客戶端系統(tǒng)20上的代碼。
圖2是根據(jù)本發(fā)明實施例的內(nèi)容管理系統(tǒng)200的簡化圖示。內(nèi)容管理 系統(tǒng)的各個部分可以駐留于一個或多個服務(wù)器(例如服務(wù)器40,到40N) 中和/或一個或多個客戶端系統(tǒng)(例如客戶端系統(tǒng)20)中。內(nèi)容管理系統(tǒng) 的模塊可通過網(wǎng)絡(luò)(例如網(wǎng)絡(luò)30)在一個或多個服務(wù)器和客戶端系統(tǒng)之 間傳送以用于執(zhí)行。根據(jù)一個實施例,內(nèi)容管理系統(tǒng)200包括多個web服 務(wù)器205、解析服務(wù)器210、 一組附加內(nèi)容服務(wù)器215和用戶行為數(shù)據(jù)庫 220。這里所稱一組包括一個或多個成員。
根據(jù)一個實施例,內(nèi)容管理系統(tǒng)200被配置為生成用戶的用戶配置文 件225,并將用戶配置文件和與用戶相關(guān)的附加內(nèi)容230相關(guān)聯(lián),該附加 內(nèi)容230與諸如基本內(nèi)容235、 email、聊天室討論等之類的一條內(nèi)容一起
被提供給用戶。用戶配置文件可以基于用戶請求的網(wǎng)頁、用于識別網(wǎng)頁的 査詢等等來生成。用戶配置文件可以包括從這些頁面和/或査詢中提取出
的單元(由一個或多個關(guān)鍵字構(gòu)成,隨后將詳細(xì)描述)并且可以包括用來 對這些單元分類的類別信息。用戶配置文件可能基于用戶配置文件中包括 的單元是否與附加內(nèi)容中包括的單元相同或相似,或者基于用來分類這些
單元的類別是否相同或相似來與一條附加內(nèi)容相關(guān)聯(lián)。如果用戶配置文件 中的單元與附加內(nèi)容基本匹配或處于相同的單元類別中,用戶配置文件則 可能與附加內(nèi)容相關(guān)聯(lián)。用戶配置文件和附加內(nèi)容之間的關(guān)聯(lián)可能響應(yīng)于 用戶對基本內(nèi)容的請求或響應(yīng)于另一觸發(fā)事件而形成。如果形成關(guān)聯(lián),附 加內(nèi)容則可能與基本內(nèi)容一起被提供。
為了方便,下面首先描述用戶配置文件的生成,然后再將用戶配置文 件與附加內(nèi)容的關(guān)聯(lián)和將附加內(nèi)容與一條基本內(nèi)容或其他內(nèi)容一起提供的 方面一道描述。用戶配置文件可以基于跟蹤和解析用戶請求的基本內(nèi)容來 生成。單元可以被從基本內(nèi)容中提取出并被放置在用戶配置文件中以建立 配置文件。可以放置在用戶配置文件中的單元也可以從用戶例如使用
Overture 執(zhí)行的搜索查詢中提取。單元還可以從與主要內(nèi)容相關(guān)聯(lián)的 "關(guān)聯(lián)"內(nèi)容中收集。主要內(nèi)容可以是用戶主要感興趣的一條基本內(nèi)容, 例如音樂、新聞、TV列表、書籍、藝術(shù)等等。關(guān)聯(lián)內(nèi)容可能基于其他用 戶的動作或基于邏輯關(guān)聯(lián)而與主要內(nèi)容相關(guān)聯(lián)。例如,在搜索中,用戶可 能正在搜索一個給定藝術(shù)家的音樂。這個給定藝術(shù)家可以是主要主題,或 者這個給定藝術(shù)家的音樂可以是主要主題?;蛟S已知,購買了該給定藝術(shù) 家的音樂的用戶還購買了另一藝術(shù)家的幾首特定音樂。這另一藝術(shù)家的音 樂是關(guān)聯(lián)內(nèi)容的一個示例,因為它與給定藝術(shù)家(例如是主要內(nèi)容)的音 樂(例如也是主要內(nèi)容)的購買相關(guān)聯(lián)。與另一藝術(shù)家的音樂相關(guān)聯(lián)的單 元(例如名稱)和/或這另一藝術(shù)家的音樂(例如音樂標(biāo)題、CD標(biāo)題等 等)可被包括在用戶配置文件中。
基本內(nèi)容235可以包括由一個或多個web服務(wù)器205或其他服務(wù)器提 供給客戶端系統(tǒng)20的網(wǎng)頁。網(wǎng)頁可以根據(jù)多種基于web的協(xié)議來提供, 例如TCP/IP、 HTTP、 HTTPS或當(dāng)今使用的其他協(xié)議。服務(wù)器系統(tǒng)40,到 40N可被配置為提供網(wǎng)頁并且可以包括web服務(wù)器205。 Web服務(wù)器可以 包括Yahoo!實體(property )服務(wù)器,例如Yahoo!Launch 、 Yahoo!Finance 、Yahoo!Movies 、Yahoo!Health 、Yahoo!News 、 Yahoo!Sports、 Yahoo!Music、 Yahoo!Weather或其ft!l web月艮務(wù)器。web月艮 務(wù)器可以駐留于單個服務(wù)器計算機上,或者駐留于多個服務(wù)器計算機上。 基本內(nèi)容235還可以包括網(wǎng)頁上的內(nèi)容,例如文本、圖像、視頻、音頻、
動畫、程序代碼、數(shù)據(jù)結(jié)構(gòu)、格式化文本等等。例如,由新聞服務(wù)器(例
如Yahoo!News)提供的基本內(nèi)容可能包括新聞故事(文本)和附帶的圖 像?;緝?nèi)容可以根據(jù)超文本標(biāo)記語言(HTML)、可擴展標(biāo)記語言 (XML)、標(biāo)準(zhǔn)通用標(biāo)記語言(SGML)或其他當(dāng)今使用的格式來格式 化。
根據(jù)一個實施例,由用戶請求的基本內(nèi)容235由web服務(wù)器205中的 至少一個提供給解析服務(wù)器210。可替換地,web服務(wù)器可以向解析服務(wù) 器提供URL; URL的目標(biāo)可以是被請求的基本內(nèi)容。解析服務(wù)器可被配 置為使用URL檢索URL指向的基本內(nèi)容。基本內(nèi)容可以以HTML頁 面、XML頁面或當(dāng)今使用的其他格式的形式被提供到解析服務(wù)器。web 服務(wù)器205還可以將一個或多個配置文件240提供到解析服務(wù)器。每個配 置文件240包括一組規(guī)則,網(wǎng)頁解析器245使用這組規(guī)則來設(shè)置基本內(nèi)容 解析的優(yōu)先級。每個配置文件可以包括唯一的一組解析規(guī)則,這組解析規(guī) 則與提供規(guī)則的web服務(wù)器相關(guān)聯(lián)。例如,新聞實體(例如Yahoo!News 實體)可以提供用于解析新聞文章標(biāo)題的規(guī)則,而音樂實體(例如 Yahoo!Music實體)不能提供用于解析新聞文章標(biāo)題的規(guī)則??商鎿Q地, 音樂實體可以包括用于解析CD標(biāo)題的規(guī)則,對音樂實體而言,CD標(biāo)題 比新聞文章標(biāo)題更相關(guān)。 一組示例性解析規(guī)則(例如針對新聞實體)可以 包括解析標(biāo)題、元數(shù)據(jù)關(guān)鍵字、元數(shù)據(jù)描述、粗體文本、斜體文本、適當(dāng) 名詞、錨文本、主體文本和被表征為重要文本的文本。在解析過程期間, 所有HTML標(biāo)簽等和其他不想要的信息可以從一條基本內(nèi)容和從該基本 內(nèi)容中解析出的在先文本類別中刪除。例如,主體文本解析規(guī)則可以提供 對文章第一段或前兩段的解析,并且可以規(guī)定隨后的段落不被解析。根據(jù) 另一示例,將從網(wǎng)頁中解析出的被表征為重要文本的文本可以依web服務(wù) 器(例如實體服務(wù)器)而定。例如,諸如Yahoo!Sports實體之類的體育實 體可以包括將體育隊伍的名字看作重要文本的規(guī)則,而電影實體可以包括 將電影標(biāo)題看作重要文本的規(guī)則。對于沒有提供以配置文件的基本內(nèi)容, 例如Yahoo!實體服務(wù)器未提供的基本內(nèi)容,該基本內(nèi)容可以根據(jù)可以本
地存儲在網(wǎng)頁解析器245中的一組或多組默認(rèn)規(guī)則來解析。
根據(jù)一個實施例,在解析基本內(nèi)容之后,提取模塊250從解析出的基 本內(nèi)容中提取出單元。單元可以包括一個或多個關(guān)鍵字并且一般代表單個 概念,例如對人類思維來說完整的單個概念。就是說, 一個單元中的關(guān)鍵 字將代表一個概念,而不是這些關(guān)鍵字單獨地或在不同的組中可能代表的 若干個概念。。例如,三個關(guān)鍵字"New" 、 "York"和"City"可以構(gòu) 成單元"New York City",其中該單元沒有被視為三個分開的關(guān)鍵字 (并且可能是三個或更多個不同的概念),而是被視為例如代表單個概念 的單個關(guān)鍵字,或"單元"。單元"New York City"的概念一般比分開 考慮的三個關(guān)鍵字的概念更貼近自然的思考過程。例如,分開考慮的關(guān)鍵 字York可能與Great Britain的York鎮(zhèn)相關(guān)聯(lián),或者一起考慮的關(guān)鍵字 New York可能與New York州而非一定與New York城相關(guān)聯(lián)。
單元可以由提取模塊250基于單元字典模塊255中的一組單元而從被 解析的文本中提取出。單元字典模塊255可以包括可能從被解析的文本中 提取出的所有單元的列表。單元字典模塊中的單元可以包括一個或多個關(guān) 鍵字。單元字典模塊可以由查詢處理引擎260提供。査詢處理引擎260可 被配置為接收多個關(guān)鍵字并從關(guān)鍵字形成單元。查詢處理引擎可被配置為 這樣認(rèn)知單個關(guān)鍵字本身可以是一個單元,而無需與其他關(guān)鍵字組合來 形成一個單元。雖然査詢處理引擎在圖2中被示為未包括在解析服務(wù)器 210中的模塊,但是根據(jù)某些實施例,查詢處理引擎可以被包括在解析服 務(wù)器中。為了更詳細(xì)地理解查詢處理引擎260,可以參見2003年11月12 日遞交的題為"System and Methods for Generating Concept Units from Search Queries"的美國專利申請No. 10/713,576,該專利申請由本發(fā)明的 所有人擁有并通過引用被結(jié)合于此,以用于所有目的。
例如在單元和/或關(guān)鍵字被出售給廣告商和/或贊助人時,單元可被周 期性地添加到單元字典模塊或從單元字典模塊中刪除。例如,如果一個或 多個特定單元處于一條基本內(nèi)容中,廣告商則可能希望他們的廣告與這條 基本內(nèi)容一起顯示?;蛘?,如果一個或多個特定單元處于一條基本內(nèi)容 中,贊助商可能希望到他們的網(wǎng)站的鏈接與這條基本內(nèi)容一起顯示。廣告
商、贊助商等隨后可能"購買"單元,以在網(wǎng)頁上將廣告或贊助商鏈接與 基本內(nèi)容放置在一起。此外,廣告商、贊助商等可能甚至在該單元每次出 現(xiàn)在一條基本內(nèi)容中并且廣告商的廣告或贊助商的鏈接與基本內(nèi)容一起顯 示時支付費用。如果用戶選擇(或"點擊")廣告或贊助商鏈接,則可能 還要向廣告商或贊助商收取額外費用。
例如,可以由實體服務(wù)器(例如Yahoo!實體服務(wù)器)向提取模塊提 供附加的單元提取規(guī)則。這些單元提取規(guī)則可以規(guī)定提取未包括在單元字 典模塊中的單元,或者可以規(guī)定雖然某些給定單元處于單元字典模塊中, 但是這些給定單元不應(yīng)該被從解析的文本中提取出。單元提取規(guī)則可以包 括用于基于與一個單元相關(guān)聯(lián)的收入生成量來提取該單元的規(guī)則。例如, 如果包括在單元字典模塊中的一個單元尚未售出并且不具有相關(guān)的收入生 成量,單元提取規(guī)則則可以規(guī)定不從被解析的文本中提取該單元。根據(jù)另 一示例,收入生成規(guī)則可以規(guī)定提取具有最高收入生成量的單元。各種實 體服務(wù)器可能提供單元提取規(guī)則的不同集合。應(yīng)該理解,上述單元提取規(guī) 則是示例性的而非限制性的。本領(lǐng)域技術(shù)人員將意識到,--組單元提取規(guī) 則中可以包括其他有用的提取規(guī)則。
雖然前述實施例規(guī)定了從基本內(nèi)容提取單元,但是也可以基于一組關(guān) 鍵字提取規(guī)則從基本內(nèi)容中提取關(guān)鍵字。與單元提取規(guī)則類似,關(guān)鍵字提 取規(guī)則可被提供給一個或多個配置文件240中的解析模塊。關(guān)鍵字提取規(guī) 則可被一致地應(yīng)用到所有被解析的文本,或者這些規(guī)則可以被應(yīng)用到由一 個給定web服務(wù)器提供的基本內(nèi)容,并且可以不被應(yīng)用到由其他web服 務(wù)器提供的基本內(nèi)容。例如, 一組關(guān)鍵字提取規(guī)則可以被應(yīng)用到 Yahoo!Music實體提供的基本內(nèi)容,而另一組不同的提取規(guī)則可以被應(yīng)用 到Y(jié)ahoo!News實體提供的基本內(nèi)容。關(guān)鍵字提取規(guī)則可以包括多種規(guī) 則,例如在上面描述單元提取規(guī)則時描述的那些規(guī)則或者可以包含其他提 取規(guī)則。
在從被解析的基本文本中提取出單元265 (包括單個關(guān)鍵字單元或多 個關(guān)鍵字單元)之后,單元被傳送到單元分級模塊272,該單元分級模塊 272被配置用于給單元分級。單元可以基于多個標(biāo)準(zhǔn)來分級,標(biāo)準(zhǔn)例如包
括與單元相關(guān)聯(lián)的收入生成量和/或相關(guān)性得分。 一個單元生成的收入量 可能基于訂戶、廣告商、贊助商等希望(例如協(xié)定)為他們的與一條基本 內(nèi)容一道呈現(xiàn)給用戶的相關(guān)內(nèi)容支付的量。例如,輕型卡車制造商可以購
買/許可如下單元"truck" 、 "pick-up truck"禾P "light duty truck"。單 元"light-duty truck"可能與制造商生產(chǎn)的卡車的類型高度相關(guān),而單元
"pick-up truck"和"truck"可能相關(guān)性較低。因此,與為放置在具有單 元"pick-up truck"或"truck"的基本內(nèi)容旁邊的廣告所支付的費用相 比,制造商通常為他們的放在包括單元"light-duty truck"的基本內(nèi)容旁 邊的廣告(即相關(guān)內(nèi)容)支付更大費用。因此,單元"pick-up truck"和
"truck"的收入生成量低于單元"light-duty truck"的收入生成量。
相關(guān)性得分指示單元和用戶之間的相關(guān)程度。如果一個單元在--條被 請求的內(nèi)容中或在用戶用來定位內(nèi)容的査詢中出現(xiàn)的次數(shù)大于某個給定次 數(shù),則可以確定該單元對于用戶具有相對較高的相關(guān)性。例如,如果用戶 請求較大量的包括單元"light-duty truck"的新聞文章(例如具有關(guān)于新 頁面的文章的網(wǎng)頁),則可以確定單元"light-duty truck"與用戶高度相 關(guān)。可以推斷用戶對購買輕型卡車有興趣。因此,該單元的相關(guān)性得分對 于該用戶可能相對較高。
單元的相關(guān)性得分也可以基于其他標(biāo)準(zhǔn),例如一個單元在一條基本內(nèi) 容中的出現(xiàn)次數(shù)。如果一個單元在一條基本內(nèi)容中的出現(xiàn)次數(shù)大于等于某 個給定次數(shù),則相對較高的相關(guān)性得分可以與該單元相關(guān)聯(lián)。此外,如果 某個給定單元處于基本內(nèi)容中的次數(shù)大于其他單元處于基本內(nèi)容中的次 數(shù),則該給定單元可以具有比其他單元更高的相關(guān)性得分。
此外,相關(guān)性得分可以基于一個單元在一條基本內(nèi)容中的位置,如與 配置文件240 —起提供的規(guī)則或包括在基本內(nèi)容中的指示符所規(guī)定的。例 如,如果一個單元處于標(biāo)題、元數(shù)據(jù)關(guān)鍵字、元數(shù)據(jù)描述、錨文本、主體 文本中,并根據(jù)與配置文件240 —起提供的規(guī)則或根據(jù)包括在基本內(nèi)容中 的指示符,通過格式編排被指定為例如粗體、斜體和/或被表征為重要文 本的文本,則該單元可能具有高相關(guān)性得分。 一個作為適當(dāng)名詞的單元可 以被視為重要文本,并且可被分配相對較高的相關(guān)性得分。被視為重要單
元的單元可能取決于向解析模塊提供基本內(nèi)容和配置文件的特定實體服務(wù) 器而有所不同。例如,包括體育隊名稱的單元可能被視為對體育實體而言 的重要單元,但是可能不會被視為對電影實體而言的重要單元。
根據(jù)一個實施例,與搜索項(例如査詢)相關(guān)聯(lián)的單元和搜索結(jié)果
270被傳送到解析服務(wù)器210并由單元分級模塊272分配相關(guān)性得分。如 上所述,這些單元可以包括用戶在搜索引擎中輸入以定位信息的單元。這 些單元可能由單元分級模塊根據(jù)相關(guān)性得分、收入生成量和/或總相關(guān)性 得分(隨后將詳細(xì)描述)中的至少一個來進(jìn)行分級。與搜索相關(guān)聯(lián)的單元 的相關(guān)性得分可能基于使用該單元執(zhí)行搜索的次數(shù),或者可以基于來自用 戶選擇使用(例如査看、監(jiān)聽等等)的網(wǎng)頁的網(wǎng)頁內(nèi)容(例如單元處于該 內(nèi)容中的次數(shù))。例如,如果該單元在一次或多次搜索中被使用相對較多 的次數(shù),則可以向該單元分配相對較高的相關(guān)性得分。
根據(jù)另一實施例,來自關(guān)聯(lián)內(nèi)容280 (例如產(chǎn)品相關(guān)內(nèi)容)的單元被 傳送到解析服務(wù)器210。來自關(guān)聯(lián)內(nèi)容280的單元可以被傳送到解析服務(wù) 器,并被單元分級模塊272分配相關(guān)性得分。這些單元還可以由上述單元 分級模塊進(jìn)行分級。這些單元的相關(guān)性得分可以基于內(nèi)容管理系統(tǒng)200的 提供者是否從與關(guān)聯(lián)內(nèi)容相關(guān)聯(lián)的銷售(例如銷售與用戶購買的其他音樂 相關(guān)聯(lián)的音樂)中獲利。例如,如果可以產(chǎn)生相對較大利潤,這些單元則 可被分配相對較高的相關(guān)性得分,或者如果將從關(guān)聯(lián)內(nèi)容中得到相對較少 利潤或沒有利潤,則可以分配相對較低的相關(guān)性得分??商鎿Q地,這些單 元的相關(guān)性得分可以基于內(nèi)容管理系統(tǒng)200的提供者是否從用戶點擊啟動 與關(guān)聯(lián)內(nèi)容相關(guān)聯(lián)的銷售站點或用于顯示銷售站點的鏈接中獲利。這些相 關(guān)性得分對于贊助商鏈接可能基于類似標(biāo)準(zhǔn)以及贊助商鏈接是否被顯示、 選擇和提供或者是否從到贊助商站點的鏈接產(chǎn)生了銷售??商鎿Q地,這些 相關(guān)性得分可以基于購買了與關(guān)聯(lián)內(nèi)容相關(guān)聯(lián)的產(chǎn)品的多個其他用戶。前 述相關(guān)性得分確定技術(shù)是出于示例性目的而描述的,本領(lǐng)域技術(shù)人員將想 到其他有用的技術(shù)來產(chǎn)生這些單元的相關(guān)性得分。
根據(jù)一個實施例,相關(guān)性得分是作為時間的函數(shù)變化的。例如,相關(guān) 性得分可能隨時間降低。具體而言,基于從單元被傳送到解析服務(wù)器時起
已經(jīng)經(jīng)過的時間量,單元的相關(guān)性得分可能降低。相關(guān)性得分可以逐步降 低或連續(xù)降低,并且可以在給定時間量后被設(shè)置為零。相關(guān)性得分隨時間 降低的量對于不同單元可能不同。例如,與汽車相關(guān)聯(lián)的單元的相關(guān)性得 分可以從解析服務(wù)器接收到單元的時間起在大約一個月的時間內(nèi)線性降低
到零,而與假期相關(guān)聯(lián)的單元可以在更長的時間段中(例如2到6個月)
以更低速率降低。例如,從市場調(diào)查中可以得知,搜索汽車的用戶通常在 其最初搜索的大約一個月內(nèi)購買汽車。并且可以得知,用戶在購買度假旅
行包之前,通?;ㄙM更多個月的時間(例如2到6個月)為度假采購。
圖3是根據(jù)本發(fā)明一個實施例的示例性用戶配置文件,它可以由單元 分級模塊272 (或其他模塊)產(chǎn)生并且可以被存儲在用戶行為數(shù)據(jù)庫285 中。用戶配置文件包括與用戶相關(guān)聯(lián)的單元并且包括每個單元的相關(guān)性得 分和包括每個單元的收入生成量。收入生成量可以是美元值或指數(shù)值,并 且相關(guān)性得分可以具有從0到1 (包括0和1)的范圍(或其他有用的范 圍)。在圖3的特定示例中,單元"light-duty truck"具有相對較高的收 入生成量(或美元值)以及相對較高的相關(guān)性得分,而單元"pick-up truck" 、 "truck"和"car"具有相對較低的收入生成量和相對較低的相 關(guān)性得分。
圖4A是根據(jù)本發(fā)明另一實施例的示例性用戶配置文件,它可以由單 元分級模塊272 (或其他模塊)產(chǎn)生并且可以被存儲在用戶行為數(shù)據(jù)庫 285中。該用戶配置文件包括與用戶相關(guān)聯(lián)的單元、每個單元的相關(guān)性得 分、每個單元的收入生成量以及每個單元的總相關(guān)性得分??傁嚓P(guān)性得分 是一個單元對用戶的相關(guān)性的量度,并且可能基于多個因素,例如收入生 成量、相關(guān)性得分或其他量度。例如,總相關(guān)性得分可能基于收入生成量 和相關(guān)性得分的加權(quán)線性組合。用于計算單元的總相關(guān)性得分的公式如下 所述
ORS = W * RGA + (l-W)承RS 其中,ORS是總相關(guān)性得分,W是加權(quán)因子,RGA是收入生成量并且RS 是相關(guān)性得分。加權(quán)因子可以由提供基本內(nèi)容的web服務(wù)器提供。例如, 加權(quán)因子可在配置文件240中被提供給內(nèi)容管理系統(tǒng)。每個web服務(wù)器可
以提供不同的加權(quán)因子。例如,新聞實體可能提供這樣的加權(quán)因子,該加 權(quán)因子對相關(guān)性得分比對收入生成量給予相對更大的強調(diào)。這樣的強調(diào)被 給予相關(guān)性得分是因為新聞實體的用戶可能對獲得相關(guān)的新聞文章比對査 看廣告和基于新聞文章的內(nèi)容進(jìn)行購買更感興趣??商鎿Q地,音樂實體或
電影實體可能提供這樣的加權(quán)因子,該加權(quán)因子對收入生成量比對相關(guān)性 得分給予相對更大的強調(diào)。例如,音樂實體和電影實體的用戶更可能購買 與關(guān)于音樂或電影的文章相關(guān)的音樂或電影。根據(jù)一個實施例,單元分級
模塊272被配置為在例如基于上述ORS公式的用戶配置文件中的每個單 元生成總相關(guān)性得分。
圖4B是根據(jù)本發(fā)明另一實施例的用戶配置文件的示例,它可以由單 元分級模塊272 (或其他模塊)產(chǎn)生并且可以被存儲在用戶行為數(shù)據(jù)庫 285中。該用戶配置文件包括與用戶相關(guān)聯(lián)的單元、每個單元和與該單元 相關(guān)聯(lián)的那條附加內(nèi)容的每次點擊價格(PPC)、每個單元和與該單元相 關(guān)聯(lián)的那條附加內(nèi)容的點擊率(CTR),以及每個單元的相關(guān)性得分。具 體而言,PPC包括用戶選擇(或點擊)查看的每條附加內(nèi)容的收入生成 量,其中每條附加內(nèi)容與用戶配置文件中的一個單元相關(guān)聯(lián)。此外,點擊 率包括用戶査看一條附加內(nèi)容(廣告、鏈接等),選擇(或點擊)這條附 加內(nèi)容以査看與這條附加內(nèi)容相關(guān)聯(lián)的頁面或站點(例如包括在這條附加 內(nèi)容中的鏈接(例如超鏈接)指向的頁面或站點)的預(yù)測比率。用戶配置 文件還可以包括每個單元的收入生成量(RGA)及其相關(guān)聯(lián)的那條附加內(nèi) 容。RGA可以是CTR和PPC的函數(shù)。例如,RGA可以是CRT乘以PPC (即RGA = CRT * PPC)。前述用于計算RGA的方法規(guī)定,雖然一個單 元及其相關(guān)的一條附加內(nèi)容具有相對較高的PPC,但是如果這條附加內(nèi)容 不具有高點擊率,則RGA可能相對較低,從而提供相對較低的ORS = W*RGA+(1-W)*RS??商鎿Q地,如果一個單元及其相關(guān)的一條附加內(nèi)容 具有相對較低的PPC,但是具有相對較高的CTR,則RGA可能相對較 高,從而提供相對較高的ORS = W*RGA+(1-W)*RS。因此,收入生成量 可以被相對優(yōu)化,同時向用戶提供相關(guān)的附加內(nèi)容。CTR和RGA量可以 基于對與一條附加內(nèi)容相關(guān)聯(lián)的頁面或站點的統(tǒng)計上大量的頁面訪問(pageview)(例如1000個頁面訪問)。圖4B所示用戶配置文件還可以 包括總相關(guān)性得分。
根據(jù)一個實施例,用戶配置文件可以根據(jù)用戶標(biāo)識號290在用戶行為 數(shù)據(jù)庫285中被索引。可以給每個用戶分配一個唯一的用戶標(biāo)識號,該用 戶標(biāo)識號可以隨機地產(chǎn)生。用戶標(biāo)識號290可被存儲在客戶端瀏覽器20 上的bcookie 295中。根據(jù)一個實施例,在每次用戶經(jīng)由客戶端瀏覽器請 求一條基本內(nèi)容(例如網(wǎng)頁)時,bcookie被從客戶端瀏覽器20傳送(例 如在URL中)到一個或多個web服務(wù)器205,并被進(jìn)一步傳送到解析服 務(wù)器。與bcookie —起提供的用戶標(biāo)識號可以被解析模塊210或其他模塊 附加到用戶配置文件(參見圖3和4),以在用戶配置文件被存儲在用戶 行為數(shù)據(jù)庫中時供用戶配置文件索引之用。如果在基本內(nèi)容被請求時, bcookie沒有被從客戶端瀏覽器傳送到web服務(wù)器,則在基本內(nèi)容被請求 時, 一個或多個web服務(wù)器可以產(chǎn)生客戶端瀏覽器的用戶標(biāo)識號并將該用 戶標(biāo)識號放在用戶的客戶端瀏覽器上的bcookie中。
根據(jù)一個實施例,與用戶相關(guān)的附加內(nèi)容230被一個或多個附加內(nèi)容 服務(wù)器215所提供。例如,附加內(nèi)容可以由廣告服務(wù)器300、贊助商鏈接 服務(wù)器305、集成鏈接服務(wù)器310、內(nèi)部鏈接服務(wù)器315或其他服務(wù)器提 供。由廣告服務(wù)器提供的附加內(nèi)容可以具有廣告(例如條幅廣告)或指向 廣告的鏈接的形式。由贊助商鏈接服務(wù)器、集成鏈接服務(wù)器和內(nèi)部鏈接服 務(wù)器提供的附加內(nèi)容可以具有到附加內(nèi)容的鏈接的形式。鏈接可以包括 URL,其中URL的目標(biāo)指向要由這些服務(wù)器提供的附加內(nèi)容。
更具體而言,贊助商鏈接服務(wù)器可以提供到贊助商站點和贊助商頁面 的贊助商鏈接。鏈接可以包括具有包括了贊助商的網(wǎng)頁的目標(biāo)的URL。 贊助商(和廣告商)通常購買這樣的單元在購買的單元處于用戶配置文 件中時,這些單元觸發(fā)內(nèi)容管理系統(tǒng)(例如web服務(wù)器)以請求將贊助商 鏈接與web內(nèi)容(例如基本內(nèi)容、email等等) 一起公布。集成鏈接服務(wù) 器可以提供到處于外部服務(wù)器的相關(guān)內(nèi)容或者與內(nèi)容管理系統(tǒng)的提供者相 關(guān)聯(lián)的服務(wù)器上的相關(guān)內(nèi)容的集成鏈接。集成鏈接可以不與收入生成相關(guān) 聯(lián)。例如,為了在頁面上布置集成鏈接,觸發(fā)頁面上集成鏈接的布置的單元可以不被出售或許可。外部服務(wù)器可能不隸屬于內(nèi)容管理服務(wù)器200的 提供者。例如,內(nèi)容管理系統(tǒng)200的提供者可能是Yahoo!,而外部服務(wù) 器可能是向Yahoo!提供新聞內(nèi)容等的獨立新聞代理的服務(wù)器。外部服務(wù) 器可以被爬取(cmwl)以建立相關(guān)內(nèi)容和它們的單元的索引或數(shù)據(jù)庫。 內(nèi)部鏈接服務(wù)器可以包括到與內(nèi)容管理系統(tǒng)200的提供者(例如 Yahoo!)相關(guān)聯(lián)的web服務(wù)器205 (例如Yahoo!實體服務(wù)器)的內(nèi)部鏈 接。Web服務(wù)器例如可以包括Yahoo!Launch 、 Yahoo!Finance 、 Yahoo!Movies 、Yahoo!Health 、Yahoo!News 、Yahoo!Sports 、 Yahoo!Music、 Yahoo!Weather或其他實體服務(wù)器。
根據(jù)一個實施例,每條附加內(nèi)容230 (從其識別相關(guān)內(nèi)容)與至少一 個單元相關(guān)聯(lián)。例如,由廣告服務(wù)器提供的每個廣告、與贊助商鏈接相關(guān) 聯(lián)的每條內(nèi)容、集成鏈接和內(nèi)部鏈接都與至少一個單元相關(guān)聯(lián)??梢詫⒏?加內(nèi)容與一個或多個單元一起提供到解析傳感器210,或者可以從附加內(nèi) 容或與附加內(nèi)容相關(guān)聯(lián)的信息中提取出單元。例如,廣告商可以將單元和 他們的廣告一起提供以確??赡艹霈F(xiàn)在用戶配置文件中的購買的單元與同 廣告商的廣告一起提供的單元匹配。沒有同單元一起提供的附加內(nèi)容可以 被爬取以提取出單元。另外,鏈接的著陸頁面可以被爬取以找出單元。而 且,廣告的著陸頁面可以被爬取以找出單元。與廣告相關(guān)聯(lián)的歸屬頁面也 可以被爬取以找出單元。另外,用于廣告和鏈接的URL可以被解析并且 單元被從解析的URL中提取出。單元可以被索引和緩存在與各個附加內(nèi) 容服務(wù)器相關(guān)聯(lián)的存儲器或其他存儲器中。根據(jù)一個實施例,解析服務(wù)器 210或可以與附加內(nèi)容服務(wù)器相關(guān)聯(lián)的另一解析服務(wù)器可以被配置為從附 加內(nèi)容中提取出單元。附加內(nèi)容服務(wù)器可以調(diào)度與解析服務(wù)器之間的指 定,以使其附加內(nèi)容被爬取以找出單元。調(diào)度可以是周期性的,或者可以 在附加內(nèi)容服務(wù)器生成新內(nèi)容時被建立。
現(xiàn)在詳細(xì)描述提供相關(guān)內(nèi)容以及web內(nèi)容,例如公共內(nèi)容(例如基本 內(nèi)容)和/或私有內(nèi)容(例如email、聊天室討論等等)。圖5是根據(jù)本發(fā) 明一個實施例可能公布在客戶端系統(tǒng)20的顯示器上的示例性網(wǎng)頁,并且 包括基本內(nèi)容235和相關(guān)內(nèi)容230?;緝?nèi)容可以包括新聞文章,例如關(guān) 于音樂組合的新聞文章?;緝?nèi)容可以由實體服務(wù)器提供,例如
Yahoo!News或Yahoo!Music。相關(guān)內(nèi)容可以包括一個或多個廣告、贊助 商鏈接、內(nèi)部鏈接、集成鏈接等等。應(yīng)該理解,圖5所示網(wǎng)頁僅僅是出于 示例性目的而示出的,并且網(wǎng)頁可以包括以各種格式(例如視頻、音頻、 圖片、文本等等)呈現(xiàn)在網(wǎng)頁上的其他相關(guān)內(nèi)容。
根據(jù)一個實施例,相關(guān)內(nèi)容與用戶相關(guān)聯(lián),或更具體而言,與用戶請 求一條基本內(nèi)容時或之前的用戶配置文件相關(guān)聯(lián)。相關(guān)內(nèi)容和用戶配置文
件之間的關(guān)聯(lián)可以由單元匹配模塊320生成。關(guān)聯(lián)將用戶配置文件鏈接到 一條相關(guān)內(nèi)容。關(guān)聯(lián)可以是作為指向用戶配置文件和相關(guān)內(nèi)容的URL的 數(shù)據(jù)基本鏈接。如果用戶配置文件中的單元匹配與一條相關(guān)內(nèi)容相關(guān)聯(lián)的 單元,則可以形成用戶配置文件和這條相關(guān)內(nèi)容之間的關(guān)聯(lián)。例如,單元 "light-duty truck"可能處于用戶配置文件中并且可能與廣告和一個或多 個鏈接相關(guān)聯(lián)。因為單元"light-duty truck"對用戶配置文件和相關(guān)內(nèi)容 是公共的,因此在用戶配置文件和相關(guān)內(nèi)容之間建立了關(guān)聯(lián)。根據(jù)另一實 施例,如果用戶配置文件和相關(guān)內(nèi)容的單元處于相關(guān)單元的相同集合中, 則在用戶配置文件和相關(guān)內(nèi)容之間形成關(guān)聯(lián)。例如, 一組相關(guān)單元可以包 括單元"light-duty truck" 、 "pick-up truck"禾Q "truck"。關(guān)聯(lián)可以形成 在包括單元"light-duty truck"的用戶配置文件和包括單元"pick-up truck"的廣告之間,因為這些單元處于同一相關(guān)單元集合中。關(guān)聯(lián)可被實 時使用以提供web內(nèi)容和相關(guān)內(nèi)容??商鎿Q地,用戶配置文件和相關(guān)內(nèi)容 之間的關(guān)聯(lián)可被緩存在用戶行為數(shù)據(jù)庫或其他存儲器中,以用于向用戶提 供相關(guān)內(nèi)容的快速檢索。緩存的關(guān)聯(lián)可被加蓋創(chuàng)建日期和/或期滿曰期 戳。上述一種或兩種日期可被用作指示應(yīng)在何時不再使用關(guān)聯(lián)的指示符。
根據(jù)一個實施例,用戶配置文件中的一個或多個單元被和與相關(guān)內(nèi)容 相關(guān)聯(lián)的單元相比較,以確定這些單元是否匹配。例如,具有最高總相關(guān) 性得分的單元可以和與相關(guān)內(nèi)容相關(guān)聯(lián)的單元相比較。或者,用戶配置文 件中具有大于等于閾值得分的總相關(guān)性得分的多個單元可以和與相關(guān)內(nèi)容 相關(guān)聯(lián)的單元相比較,以確定這些單元之間是否存在匹配。提供具有相對 較高相關(guān)性得分的單元的比較可以使得用戶接收具有相對較高用戶相關(guān)性 并且可能生成廣告商和/或贊助商的銷售的廣告。提供這樣的比較還可以 使得為服務(wù)提供商優(yōu)化利潤,因為具有相對較高用戶相關(guān)性和相對較高收 入生成量的廣告被提供給用戶。例如,收入生成量可以被大大優(yōu)化,因為 具有最高收入生成量或相對較高生成量但是具有相對較低用戶相關(guān)性的廣 告不會被提供給用戶。就是說,無論與廣告相關(guān)聯(lián)的收入生成量如何,具 有高收入生成量,但是與用戶不相關(guān)的廣告可能不被選送用戶,并且對于
系統(tǒng)200 (圖2)的提供者不會生成收入。
根據(jù)一個實施例,針對與基本內(nèi)容一起提供的相關(guān)內(nèi)容累積點擊率, 并且基于點擊率來改變基本內(nèi)容和相關(guān)內(nèi)容的網(wǎng)頁呈現(xiàn)情況。這里所述點 擊率是在考慮到一條相關(guān)內(nèi)容被提供給用戶的次數(shù)的情況下,用戶選擇使 用這條相關(guān)內(nèi)容的次數(shù)。如果一條給定相關(guān)內(nèi)容具有比另一條相關(guān)內(nèi)容更 高的點擊率,則在隨后公布的網(wǎng)頁上,可以將這條給定的相關(guān)內(nèi)容公布在 更明顯的位置上。例如,這條給定的相關(guān)內(nèi)容可以在列表中被放在比其他 相關(guān)內(nèi)容更高的位置上。可替換地,當(dāng)網(wǎng)頁被公布時,這條給定的相關(guān)內(nèi) 容可以替換掉其他相關(guān)內(nèi)容。
圖6是根據(jù)本發(fā)明實施例用于基于用戶査看的網(wǎng)頁形成用戶配置文件
的步驟的高級流程圖。該高級流程圖僅例示包含本發(fā)明的實施例,而非限 制由權(quán)利要求書敘述的本發(fā)明的范圍。本領(lǐng)域普通技術(shù)人員將想到包含所
示實施例的精神和范圍的變化、修改和替換。在600,例如使用客戶端瀏 覽器的用戶從web服務(wù)器請求一條基本內(nèi)容。根據(jù)該請求,用戶標(biāo)識號被 從存儲在用戶瀏覽器上的bcookie獲取并在例如URL等中被傳送到web 服務(wù)器。如果bcookie不被傳送到web服務(wù)器,web服務(wù)器中的一個或多 個則在客戶端瀏覽器上放置bcookie,以使bcookie包括分配給客戶端瀏覽 器的唯一的用戶標(biāo)識號。在605,用戶請求的基本內(nèi)容被解析,以生成經(jīng) 解析的基本內(nèi)容并且從經(jīng)解析的基本內(nèi)容中提取出單元。單元可以基于一 組單元提取規(guī)則和/或可能包括可能從解析的文本中提取出的單元的單元 字典模塊而被提取出。
在610,從經(jīng)解析的基本內(nèi)容中提取出的單元例如根據(jù)相關(guān)性得分 (例如單元與用戶相關(guān)性的量度)和/或收入生成量被分級。相關(guān)性得分
可以根據(jù)一個或多個公式與收入生成量相比較,以向用戶提供與用戶相關(guān) 的附加內(nèi)容,從而無論附加內(nèi)容是否與最高可能的收入生成量或相對較高 的收入生成量相關(guān)聯(lián),都可能生成收入。想法是這樣的,由于缺乏相關(guān)性 而未被用戶選擇的附加內(nèi)容可能生成很少的收入或不生成收入,無論附加 內(nèi)容是否與最高或相對較高的收入生成量相關(guān)聯(lián)。此外,提供與用戶高度 相關(guān)但具有很小或沒有收入生成值的附加內(nèi)容也可能生成很少或不生成收 入。 一種大大優(yōu)化收入的方法包括生成收入生成量與相關(guān)性得分的乘積, 并且如果乘積在預(yù)定的窗口內(nèi),則提供附加內(nèi)容??杀挥糜诖蟠髢?yōu)化收入 生成量的其他公式包括加權(quán)求和公式等等(如上所述)。本領(lǐng)域技術(shù)人員 將知道用于優(yōu)化收入生成的多種方法并且被考慮在本發(fā)明的范圍和精神 內(nèi)。
根據(jù)某些實施例,單元根據(jù)總相關(guān)性得分被分級,總相關(guān)性得分可以
是相關(guān)性得分與收入生成量的函數(shù)。在615,單元和它們的相關(guān)聯(lián)的相關(guān)
性得分和收入生成量被存儲在用戶行為數(shù)據(jù)庫中的用戶配置文件中。根據(jù) 一個實施例,總相關(guān)性得分也被存儲在用戶配置文件中。用戶配置文件可
以基于從用戶的bcookie提供到web服務(wù)器的用戶標(biāo)識號在用戶行為數(shù)據(jù) 庫中被索引。根據(jù)一個實施例,除了從基本內(nèi)容中提取出單元之外(或者 可以不從基本內(nèi)容提取單元),例如可以使用搜索引擎從用戶搜索中收集 單元,并且可以從與用戶請求的主要內(nèi)容相關(guān)聯(lián)的相關(guān)內(nèi)容中收集單元。
圖7是根據(jù)本發(fā)明另一實施例用于基于用戶査看的網(wǎng)頁提供與用戶相 關(guān)的web內(nèi)容和相關(guān)內(nèi)容的步驟的高級流程圖。該高級流程圖僅示出包含 本發(fā)明的實施例,而非限制由權(quán)利要求書敘述的本發(fā)明的范圍。本領(lǐng)域普 通技術(shù)人員將想到包含所示實施例的精神和范圍的變化、修改和替換。
在700,例如使用客戶端瀏覽器的用戶從一個或多個web服務(wù)器請求 一條內(nèi)容。被請求的內(nèi)容可包括公共內(nèi)容或私有內(nèi)容。公共內(nèi)容可能包括 例如無需密碼保護(hù)、費用支付等而可由公眾訪問的web內(nèi)容,例如網(wǎng)頁等 等。私有內(nèi)容可包括帶有個人性質(zhì)的web內(nèi)容(例如網(wǎng)頁等等)并且可以 通過密碼、加密、付費訪問來保護(hù),或者可能處于"聊天室""討論組" 中,這些web內(nèi)容可能是帶有私有性質(zhì)的VOIP (因特網(wǎng)協(xié)議語音)、
email發(fā)送、存儲和/或接收或其他網(wǎng)絡(luò)(例如因特網(wǎng))使用。在705, 一 個或多個web服務(wù)器向一個或多個附加內(nèi)容服務(wù)器(例如廣告服務(wù)器、贊 助商服務(wù)器、集成服務(wù)器、內(nèi)部服務(wù)器等等)發(fā)布請求(例如以URL或 其他格式),以向web服務(wù)器提供附加內(nèi)容(例如廣告、贊助商鏈接、集 成鏈接、內(nèi)部鏈接等等),從而使附加內(nèi)容可以與請求內(nèi)容的用戶相關(guān)。
在710,附加內(nèi)容服務(wù)器中的一個或多個向單元匹配模塊發(fā)布請求以 識別與用戶相關(guān)的附加內(nèi)容。在715,單元匹配模塊被配置為將用戶配置 文件中的單元和與附加內(nèi)容相關(guān)聯(lián)的單元相比較,并且判斷是否有任何單 元匹配。根據(jù)一個實施例,單元匹配模塊被配置為比較來自用戶配置文件 的具有最高總相關(guān)性得分的單元,或比較來自用戶配置文件的具有大于等 于閾值得分的總相關(guān)性得分的一個或多個單元。附加內(nèi)容可以包括廣告數(shù) 據(jù)庫服務(wù)器提供的廣告、贊助商服務(wù)器提供的贊助商內(nèi)容、集成服務(wù)器提 供的集成內(nèi)容和/或內(nèi)部服務(wù)器提供的內(nèi)部內(nèi)容。贊助商服務(wù)器提供的贊 助商內(nèi)容、集成服務(wù)器提供的集成內(nèi)容和/或內(nèi)部服務(wù)器提供的內(nèi)部內(nèi)容 可以被鏈接(例如URL,其目標(biāo)是內(nèi)容)指向。如果用戶配置文件中的 單元與附加內(nèi)容中的單元匹配或基本類似(例如分配給一個共同集合), 則將附加內(nèi)容視為與用戶相關(guān)的相關(guān)內(nèi)容。 一個或多個關(guān)聯(lián)(例如數(shù)據(jù)庫 鏈接、URL等等)可被形成在用戶配置文件和相關(guān)內(nèi)容之間。形成的關(guān) 聯(lián)可以被用來向用戶(例如使用客戶端瀏覽器20的人類用戶)提供相關(guān) 內(nèi)容。
在720,相關(guān)內(nèi)容被與可能包括公共內(nèi)容和/或私有內(nèi)容的其他內(nèi)容一 起提供到用戶。附加內(nèi)容服務(wù)器可將附加內(nèi)容提供到被配置為向用戶的客 戶端瀏覽器提供相關(guān)內(nèi)容的一個或多個web服務(wù)器。相關(guān)內(nèi)容可以根據(jù)可 用于內(nèi)容管理系統(tǒng)的協(xié)議(例如超文本傳輸協(xié)議(HTTP)或現(xiàn)在使用的 其他協(xié)議)被提供到web服務(wù)器和客戶端瀏覽器。在任意給定時刻,web 服務(wù)器、解析服務(wù)器和附加內(nèi)容服務(wù)器可以表現(xiàn)為HTTP客戶端或HTTP 服務(wù)器,并且可以發(fā)送統(tǒng)一資源定位符(URL)來以HTTP或其他協(xié)議請 求內(nèi)容和接收內(nèi)容。
先前在圖6和圖7中描述的步驟可以在用戶請求基本內(nèi)容時被實時執(zhí)
行。就是說,內(nèi)容管理系統(tǒng)200可以在用戶請求基本內(nèi)容時,在用戶配置
文件和相關(guān)內(nèi)容之間實時生成關(guān)聯(lián),并且相關(guān)內(nèi)容和基本內(nèi)容可以被提供 到用戶的客戶端瀏覽器。可替換地,步驟可以被異步執(zhí)行。就是說,內(nèi)容
管理系統(tǒng)200可以在用戶內(nèi)容和相關(guān)內(nèi)容之間生成關(guān)聯(lián),并在接收用戶對 基本內(nèi)容的請求之前緩存關(guān)聯(lián)。緩存的關(guān)聯(lián)隨后可在用戶請求web內(nèi)容 (例如基本內(nèi)容、email內(nèi)容等等)時被用來向用戶提供相關(guān)內(nèi)容。緩存 的關(guān)聯(lián)可在用戶配置文件中被保存在用戶行為數(shù)據(jù)庫中或其他數(shù)據(jù)庫中。
根據(jù)一個實施例,用戶的用戶配置文件中的每個單元與包括用于這些 單元的類別信息的單元分類系統(tǒng)825 (圖8)相關(guān)聯(lián)。類別信息(例如類 名)標(biāo)識出單元被分配到的單元分類系統(tǒng)中的類別。單元分類系統(tǒng)中的類 別可被組織成"樹"結(jié)構(gòu)(圖9),其中較高級類別833可以包括一個或 多個較低級類別835的集合。單元在單元分類系統(tǒng)中可被分配到多個類 別。例如,分配到較低級類別837的單元可被說成是被分配到任意包括該 較低級類別的較高級類別833。單元分類系統(tǒng)可以是預(yù)定的系統(tǒng),該預(yù)定 系統(tǒng)可能是計算機生成的,人類生成的或其組合。單元可以由上述計算 機、人或其組合以邏輯方式預(yù)先分配到類別。
解析服務(wù)器210 (例如包含在解析服務(wù)器中的單元提取模塊250)等 被配置為將用戶配置文件中的單元與分配給單元分類系統(tǒng)中的類別的單元 相比較。如果用戶配置文件中的單元與給定類別中的單元匹配或基本類似 (例如同義詞、派生詞等等),則經(jīng)由用戶配置文件將用于該給定類別的 類別信息與用戶相關(guān)聯(lián)。例如,該類別信息(例如類名)可以被存儲在用 戶配置文件中。具體而言,解析服務(wù)器被配置為確定包括用戶配置文件中 的單元的"最低"級類別。最低級類別是單元分類系統(tǒng)的樹結(jié)構(gòu)中包括特 定單元的分支上的最低類別。任意其他可能包括在最低級類別中的類別不 包括該特定單元。例如,單元"light-duty truck"被分配到類別837 (即最 低級類別),因此也被分配到類別833,但是未被分配到包括在類別837 中的類別839a-839d。
根據(jù)一個實施例,從附加內(nèi)容230中提取出的單元或以其他方式與附 加內(nèi)容230相關(guān)聯(lián)的單元被與單元分類系統(tǒng)中的類別中的單元相比較。如果一個類別包括與一條附加內(nèi)容(例如廣告、贊助商鏈接、集成鏈接和/ 或內(nèi)部鏈接)相關(guān)聯(lián)的單元,則該類別與該條附加內(nèi)容相關(guān)聯(lián)。
根據(jù)一個實施例,被用來標(biāo)識類別的類別信息可以被放在內(nèi)容元數(shù)據(jù) 中或以其他方式與內(nèi)容相關(guān)聯(lián)。根據(jù)某些實施例,附加內(nèi)容被預(yù)先與一個 或多個類別相關(guān)聯(lián)。預(yù)先關(guān)聯(lián)可以由計算機系統(tǒng)或人類生成。
根據(jù)一個實施例,單元匹配模塊320或其他模塊被配置為將存儲在用 戶配置文件225中的類別信息與用于多條附加內(nèi)容的類別信息相比較。如 果用戶配置文件中的一個或多個類別與附加內(nèi)容匹配,則附加內(nèi)容被視為 與用戶相關(guān),并且可以與用戶請求的一條基本內(nèi)容一起提供。因此,即使 用戶配置文件中的單元和/或關(guān)鍵字不匹配與附加內(nèi)容相關(guān)聯(lián)的單元和/或 關(guān)鍵字,但是這些單元和/或關(guān)鍵字經(jīng)由單元分類系統(tǒng)(更具體而言經(jīng)由 類別分配)彼此相關(guān)聯(lián),則附加內(nèi)容仍舊可被標(biāo)識為與用戶相關(guān)并且可以 被提供給用戶。
分配給用戶配置文件的類別可被分配相關(guān)性得分并且從而被分級為與 分配給用戶配置文件的單元相類似的用戶相關(guān)性(如上所述)。例如,分 配給單元的相關(guān)性得分可以被分配給包括單元的類別??商鎿Q地,如果用 戶配置文件中的類別包括多個單元,用于該類別的相關(guān)性得分則可以是這 些單元的相關(guān)性得分的函數(shù)(例如平均值)。如果用戶配置文件中的一個 或多個類別匹配附加內(nèi)容的一個或多個類別,則可以使用最高分級(例如 最高相關(guān)性得分)類別來選擇提供給用戶的附加內(nèi)容。
收入生成量可被分配給與附加內(nèi)容相關(guān)聯(lián)的類別。單元匹配模塊可以 識別用戶配置文件的匹配類別以及其類別具有最高收入量的附加內(nèi)容。根 據(jù)替換實施例,單元匹配模塊可以使用考慮到用戶配置文件中的類別的相 關(guān)性得分和附加內(nèi)容的類別的收入生成量兩者的公式來向用戶提供附加內(nèi) 容,以使收入生成針對與用戶具有相對較高相關(guān)性的類別被大大優(yōu)化。就 是說,與用戶具有相對較低相關(guān)性的附加內(nèi)容不會僅因為該附加內(nèi)容具有 高收入生成量就被提供給用戶。最終,如果用戶對附加內(nèi)容不感興趣,則 無論該附加內(nèi)容是否具有相對較高的收入生成量,用戶都可能不點擊該附 加內(nèi)容,并且將可能從該附加內(nèi)容生成很少收入或沒有收入。
將會理解,上述示例和實施例僅僅出于示例性目的,并且將向本領(lǐng)域 技術(shù)人員建議各種修改或變化,這些修改或變化將被包括在本申請的精神 和范圍內(nèi)以及所附權(quán)利要求書的范圍內(nèi)。例如,雖然這里描述的內(nèi)容管理 系統(tǒng)的實施例被表征為包括査詢處理引擎提供的單元字典,但是可以從其 它源提供單元。另外,關(guān)鍵字和/或單元可被用于本發(fā)明的實施例,例如 從基本內(nèi)容中提取出關(guān)鍵字以生成用戶配置文件,并且從相關(guān)內(nèi)容中提取 出關(guān)鍵字以用于關(guān)鍵字匹配模塊的比較。例如參見圖10,其示出內(nèi)容管
理系統(tǒng)200",與上述被配置為使用單元的實施例相比,該內(nèi)容管理系統(tǒng) 200"包括關(guān)鍵字提取模塊、關(guān)鍵字匹配模塊、關(guān)鍵字字典模塊和關(guān)鍵字匹 配模塊。
此外,雖然用戶在這里被一般地描述為與處理對基本內(nèi)容的請求的計 算機的用戶接口交互的人類用戶,但是用戶也可能是通過編程來生成對基 本內(nèi)容的請求的計算機進(jìn)程或計算機系統(tǒng)。在后一情況下,發(fā)起請求的用 戶還可能通過編程處理對基本內(nèi)容的請求結(jié)果,但是也可能由計算機進(jìn)程 和/或計算機系統(tǒng)發(fā)出對基本內(nèi)容的請求,而人類用戶是內(nèi)容的最終接收 者。因此,以上描述不應(yīng)被視為限制由權(quán)利要求書限定的本發(fā)明的范圍。
權(quán)利要求
1.一種被配置為基于用戶配置文件和相關(guān)內(nèi)容的關(guān)聯(lián)向用戶系統(tǒng)提供基本內(nèi)容和相關(guān)內(nèi)容,以使所述相關(guān)內(nèi)容與用戶相關(guān)的系統(tǒng),該系統(tǒng)包括多個web服務(wù)器,被配置為向所述用戶系統(tǒng)提供所述基本內(nèi)容和所述相關(guān)內(nèi)容;一組附加內(nèi)容服務(wù)器,被配置為如果所述用戶配置文件中的單元匹配與所述相關(guān)內(nèi)容相關(guān)聯(lián)的單元,則向所述web服務(wù)器提供所述相關(guān)內(nèi)容;解析服務(wù)器,被配置為從所述用戶請求的所述基本內(nèi)容中提取出所述用戶配置文件中的單元并生成所述用戶配置文件中的單元的分級列表;以及單元匹配模塊,被配置為如果所述用戶請求所述基本內(nèi)容,則判斷所述用戶配置文件中的單元是否匹配與所述相關(guān)內(nèi)容相關(guān)聯(lián)的單元,其中所述web服務(wù)器被配置為如果所述用戶配置文件中的單元匹配與所述相關(guān)內(nèi)容相關(guān)聯(lián)的單元,則提供所述基本內(nèi)容和所述相關(guān)內(nèi)容。
2. 如權(quán)利要求1所述的系統(tǒng),其中所述解析服務(wù)器包括 解析模塊,被配置為解析所述基本內(nèi)容以生成經(jīng)解析的基本內(nèi)容; 單元提取模塊,被配置為從所述經(jīng)解析的基本內(nèi)容中提取出所述用戶配置文件中的單元;以及單元分級模塊,被配置為生成所述用戶配置文件中的單元的分級列表。
3. 如權(quán)利要求1所述的系統(tǒng),其中所述web服務(wù)器被配置為將與主要 內(nèi)容相關(guān)聯(lián)的相關(guān)聯(lián)的內(nèi)容的單元傳送到所述解析模塊。
4. 如權(quán)利要求3所述的系統(tǒng),其中所述主要內(nèi)容包括所述基本內(nèi)容, 并且所述web服務(wù)器被配置為將所述相關(guān)內(nèi)容與私有內(nèi)容一起提供。
5. 如權(quán)利要求4所述的系統(tǒng),其中所述私有內(nèi)容包括email和聊天室 討論中的至少一個。
6. 如權(quán)利要求l所述的系統(tǒng),其中 所述分級列表包括所述用戶配置文件中的每個單元的相關(guān)性得分,以及所述用戶配置文件中的每個單元的收入生成量,并且所述用戶配置文件中的單元基于所述相關(guān)性得分和所述收入生成量中 的至少一個被分級。
7. 如權(quán)利要求6所述的系統(tǒng),其中所述解析服務(wù)器被配置為基于所述 相關(guān)性得分和所述收入生成量來計算所述用戶配置文件中的單元的總相關(guān) 性得分。
8. 如權(quán)利要求7所述的系統(tǒng),其中所述解析服務(wù)器被配置為將所述用 戶配置文件中具有大于等于閾值得分的總相關(guān)性得分的單元和與所述相關(guān) 內(nèi)容相關(guān)聯(lián)的單元相比較。
9. 如權(quán)利要求7所述的系統(tǒng),其中所述總相關(guān)性得分是根據(jù)以下公式 生成的ORS = W * RGA + (1—W) * RS其中,ORS是總相關(guān)性得分,W是加權(quán)因子,RGA是收入生成量, RS是相關(guān)性得分。
10. 如權(quán)利要求9所述的系統(tǒng),其中所述RGA基于所述相關(guān)內(nèi)容的點 擊率(CTR)和每次點擊價格(PPC)。
11. 如權(quán)利要求IO所述的系統(tǒng),其中所述10}八=0^* 0:。
12. 如權(quán)利要求1所述的系統(tǒng),其中所述單元匹配模塊被配置為如果 所述用戶配置文件中的單元匹配與所述相關(guān)內(nèi)容相關(guān)聯(lián)的單元,則生成所 述用戶配置文件和所述相關(guān)內(nèi)容之間的關(guān)聯(lián)。
13. 如權(quán)利要求1所述的系統(tǒng),還包括數(shù)據(jù)庫,被配置為存儲所述用戶配置文件,其中所述用戶配置文件通 過用戶標(biāo)識號在所述數(shù)據(jù)庫中被索引;以及bcookie,被配置為被存儲在所述用戶系統(tǒng)上并被配置為存儲所述用戶 標(biāo)識號。
14. 如權(quán)利要求1所述的系統(tǒng),其中所述web服務(wù)器被配置為如果所 述用戶配置文件中的單元匹配與所述相關(guān)內(nèi)容相關(guān)聯(lián)的單元,或者如果所 述用戶配置文件中的單元和與所述相關(guān)內(nèi)容相關(guān)聯(lián)的單元處于同一單元集 合中,則提供所述基本內(nèi)容和所述相關(guān)內(nèi)容。
15. 如權(quán)利要求1所述的系統(tǒng),還包括單元字典模塊,被配置為包括 可從所述基本內(nèi)容中提取出的所有單元的列表。
16. —種被配置為將用戶配置文件與相關(guān)內(nèi)容相關(guān)聯(lián)的系統(tǒng),該系統(tǒng)包括解析模塊,被配置為解析用戶請求的基本內(nèi)容并且生成經(jīng)解析的基本內(nèi)容;單元字典模塊,包括多個單元;單元提取模塊,被配置為從所述經(jīng)解析的基本內(nèi)容中提取出包括在所 述單元字典中的單元,從所述經(jīng)解析的基本內(nèi)容中提取出的單元被稱為提 取單元;單元分級模塊,被配置為基于分別與所述提取單元相關(guān)聯(lián)的相關(guān)性得 分和收入生成量中的至少一種來對所述提取單元分級,并生成提取單元的 分級列表;與用戶相關(guān)聯(lián)并包括所述分級列表的用戶配置文件;以及 單元匹配模塊,被配置為如果所述分級列表中的提取單元和與所述相關(guān)內(nèi)容相關(guān)聯(lián)的單元匹配,則生成所述用戶配置文件和所述相關(guān)內(nèi)容之間的關(guān)聯(lián)。
17. 如權(quán)利要求16所述的系統(tǒng),其中所述單元匹配模塊被配置為如果 最高分級的提取單元和與所述相關(guān)內(nèi)容相關(guān)聯(lián)的單元中的至少一個匹配或 處于同一相關(guān)單元集合中,則生成所述基本內(nèi)容和所述相關(guān)內(nèi)容之間的關(guān) 聯(lián)。
18. 如權(quán)利要求16所述的系統(tǒng),還包括多個web服務(wù)器,被配置為基 于所述關(guān)聯(lián)向客戶端瀏覽器提供所述基本內(nèi)容和所述相關(guān)內(nèi)容。
19. 如權(quán)利要求18所述的系統(tǒng),其中所述基本內(nèi)容和所述相關(guān)內(nèi)容被 配置為被提供在客戶端瀏覽器的網(wǎng)頁上。
20. 如權(quán)利要求16所述的系統(tǒng),其中所述相關(guān)內(nèi)容包括廣告和/或被--組鏈接所指向,所述這組鏈接被配置為與所述基本內(nèi)容一起提供,并且所 述這組鏈接包括贊助商鏈接、集成鏈接和內(nèi)部鏈接中的至少一種。
21. 如權(quán)利要求16所述的系統(tǒng),還包括至少一個被配置為向所述解析 模塊提供配置文件的web服務(wù)器,其中所述配置文件包括一組用于解析基 本內(nèi)容的解析規(guī)則。
22. 如權(quán)利要求21所述的系統(tǒng),其中所述配置文件包括用于所述相關(guān) 性得分和所述收入生成量的加權(quán)因子。
23. 如權(quán)利要求21所述的系統(tǒng),其中所述解析規(guī)則用于解析標(biāo)題、元 數(shù)據(jù)關(guān)鍵字、元數(shù)據(jù)描述、錨文本、主體文本、專有名詞、格式化文本中 的至少一種。
24. 如權(quán)利要求23所述的系統(tǒng),其中所述格式化文本包括粗體文本和 斜體文本中的至少一種。
25. 如權(quán)利要求23所述的系統(tǒng),其中所述解析規(guī)則還用于解析被所述 基本內(nèi)容中的指示表征為重要文本的文本。
26. 如權(quán)利要求16所述的系統(tǒng),其中所述單元分級模塊被配置為基于 所述收入生成量和所述相關(guān)性得分來計算所述提取單元的總相關(guān)性得分。
27. 如權(quán)利要求26所述的系統(tǒng),其中所述單元匹配模塊被配置為判斷 具有大于等于閾值得分的總相關(guān)性得分的提取單元是否和與所述相關(guān)內(nèi)容 相關(guān)聯(lián)的單元中的至少一個匹配。
28. —種被配置為將基本內(nèi)容和相關(guān)內(nèi)容一起提供到用戶系統(tǒng)以使所 述相關(guān)內(nèi)容與用戶相關(guān)的系統(tǒng),該系統(tǒng)包括多個web服務(wù)器,被配置為提供基本內(nèi)容和相關(guān)內(nèi)容; 解析服務(wù)器,被配置為基于用戶請求的基本內(nèi)容生成單元的用戶配置 文件;單元匹配模塊,被配置為如果所述用戶配置文件中的至少一個單元和 與所述相關(guān)內(nèi)容相關(guān)聯(lián)的單元匹配,則在所述用戶配置文件和所述相關(guān)內(nèi) 容之間生成關(guān)聯(lián);以及用戶系統(tǒng),被配置為接收由至少一個web服務(wù)器提供的基本內(nèi)容和相 關(guān)內(nèi)容,并基于所述關(guān)聯(lián)在網(wǎng)頁上公布所述基本內(nèi)容和所述相關(guān)內(nèi)容。
29. 如權(quán)利要求28所述的系統(tǒng),其中如果所述用戶配置文件中的單元 匹配與所述相關(guān)內(nèi)容相關(guān)聯(lián)的單元,則所述相關(guān)內(nèi)容與所述用戶相關(guān)。
30. 如權(quán)利要求28所述的系統(tǒng),其中如果所述用戶請求所述基本內(nèi) 容,則所述相關(guān)內(nèi)容和所述基本內(nèi)容基于所述關(guān)聯(lián)被提供到所述用戶系 統(tǒng)。
31. 如權(quán)利要求28所述的系統(tǒng),其中所述相關(guān)內(nèi)容包括廣告和/或被一 組鏈接所指向,所述這組鏈接與所述基本內(nèi)容一起提供,并且所述這組鏈 接包括贊助商鏈接、集成鏈接和內(nèi)部鏈接中的至少一種。
32. 如權(quán)利要求28所述的系統(tǒng),其中所述單元分級模塊被配置為基于 與所述用戶配置文件相關(guān)聯(lián)的單元的收入生成量和相關(guān)性得分來計算與所 述用戶配置文件相關(guān)聯(lián)的單元的總相關(guān)性得分。
33. 如權(quán)利要求32所述的系統(tǒng),其中所述總相關(guān)性得分是根據(jù)以下公 式生成的ORS = W * RGA + (1—W) * RS其中,ORS是總相關(guān)性得分,W是加權(quán)因子,RGA是收入生成量, RS是相關(guān)性得分。
34. 如權(quán)利要求33所述的系統(tǒng),其中所述RGA基于所述相關(guān)內(nèi)容的 點擊率(CTR)和每次點擊價格(PPC)。
35. 如權(quán)利要求34所述的系統(tǒng),其中所述RGA = CTR * PPC。
36. —種用于提供與用戶相關(guān)的相關(guān)內(nèi)容和web內(nèi)容的方法,該方法 包括從計算機網(wǎng)絡(luò)請求基本內(nèi)容;從所述基本內(nèi)容中提取一組單元,所述單元被稱為提取單元; 給所述提取單元分別分配相關(guān)性得分和收入生成量; 基于所述相關(guān)性得分和所述收入生成量中的至少一個對所述提取單元 分級;以及形成用戶配置文件,該用戶配置文件包括提取單元的分級列表、所述 相關(guān)性得分和所述收入生成量。
37. 如權(quán)利要求36所述的方法,還包括解析所述基本內(nèi)容來生成經(jīng)解 析的基本內(nèi)容,其中所述從所述基本內(nèi)容中提取一組單元的步驟包括從所 述經(jīng)解析的基本內(nèi)容中提取這組單元。
38. 如權(quán)利要求36所述的方法,還包括將所述用戶配置文件存儲在用 戶行為數(shù)據(jù)庫中。
39. 如權(quán)利要求38所述的方法,還包括如果所述用戶請求web內(nèi)容,則從所述用戶行為數(shù)據(jù)庫獲取所述用戶 配置文件;并且然后如果所述提取單元中的至少一個和與所述相關(guān)內(nèi)容相關(guān)聯(lián)的單元中的 至少一個匹配,則將所述web內(nèi)容和所述相關(guān)內(nèi)容一起提供。
40. 如權(quán)利要求36所述的方法,還包括如果所述提取單元中的至少一個和與所述相關(guān)單元相關(guān)聯(lián)的單元中的 至少一個匹配,則在所述用戶配置文件和所述相關(guān)內(nèi)容之間形成至少一個 關(guān)聯(lián);將所述關(guān)聯(lián)緩存在存儲器中;如果所述用戶請求web內(nèi)容,則從所述存儲器獲取所述關(guān)聯(lián);以及然后將所述基本內(nèi)容和所述相關(guān)內(nèi)容一起提供。
41. 如權(quán)利要求36所述的方法,其中所述web內(nèi)容包括私有內(nèi)容和公 共內(nèi)容。
42. 如權(quán)利要求41所述的方法,其中所述私有內(nèi)容包括email和聊天 室討論中的至少一種。
43. 如權(quán)利要求41所述的方法,其中所述公共內(nèi)容包括網(wǎng)頁內(nèi)容。
44. 如權(quán)利要求36所述的方法,還包括基于單元字典模塊中的一組單 元,從所述基本內(nèi)容中提取所述提取單元。
45. 如權(quán)利要求36所述的方法,其中所述相關(guān)內(nèi)容包括廣告。
46. 如權(quán)利要求36所述的方法,其中所述相關(guān)內(nèi)容被一組與所述基本 內(nèi)容一起提供的鏈接所指向。
47. 如權(quán)利要求46所述的方法,其中所述這組鏈接包括贊助商鏈接、 集成鏈接和內(nèi)部鏈接中的至少一種。
48. 如權(quán)利要求36所述的方法,其中所述分級步驟包括基于所述收入 生成量和所述相關(guān)性得分計算所述用戶配置文件中的單元的總相關(guān)性得 分。
49. 如權(quán)利要求48所述的方法,其中所述分級步驟包括判斷所述用戶 配置文件中具有最高總相關(guān)性得分的單元是否和與所述相關(guān)內(nèi)容相關(guān)聯(lián)的 單元中的至少一個相匹配。
50. —種用于提供與用戶相關(guān)的相關(guān)內(nèi)容和web內(nèi)容的方法,該方法 包括從計算機網(wǎng)絡(luò)請求web內(nèi)容;以及如果用戶配置文件中的至少一個單元和與所述相關(guān)內(nèi)容相關(guān)聯(lián)的至少 一個單元匹配,則將所述web內(nèi)容與所述相關(guān)內(nèi)容一起提供。
51. —種被配置為基于用戶配置文件和相關(guān)內(nèi)容之間的關(guān)聯(lián)向用戶系 統(tǒng)提供基本內(nèi)容和相關(guān)內(nèi)容,以使所述相關(guān)內(nèi)容與用戶相關(guān)的系統(tǒng),該系 統(tǒng)包括多個web服務(wù)器,被配置為向所述用戶系統(tǒng)提供所述基本內(nèi)容和所述 相關(guān)內(nèi)容;一組附加內(nèi)容服務(wù)器,被配置為如果所述用戶配置文件中的單元的類 別與所述相關(guān)內(nèi)容的單元的類別匹配,則向所述web服務(wù)器提供所述相關(guān) 內(nèi)容;以及單元匹配模塊,被配置為判斷所述用戶配置文件中的類別是否與所述 附加內(nèi)容的類別匹配,其中所述web服務(wù)器被配置為如果這些類別中的一 個或多個匹配,則將所述相關(guān)內(nèi)容和所述基本內(nèi)容一起提供。
全文摘要
一種系統(tǒng)包括多個web服務(wù)器,被配置為向用戶系統(tǒng)提供基本內(nèi)容和相關(guān)內(nèi)容;一組附加內(nèi)容服務(wù)器,被配置為如果用戶配置文件中的單元匹配與相關(guān)內(nèi)容相關(guān)聯(lián)的單元,則將相關(guān)內(nèi)容提供到web服務(wù)器;解析服務(wù)器,被配置為從用戶請求的基本內(nèi)容中提取用戶配置文件中的單元,并生成用戶配置文件中的單元的分級列表;以及單元匹配模塊,被配置為如果用戶請求基本內(nèi)容,則判斷用戶配置文件中的單元是否匹配與相關(guān)內(nèi)容相關(guān)聯(lián)的單元,其中web服務(wù)器被配置為如果用戶配置文件中的單元匹配與相關(guān)內(nèi)容相關(guān)聯(lián)的單元,則將基本內(nèi)容與相關(guān)內(nèi)容一起提供。
文檔編號G06F17/30GK101099150SQ200580018049
公開日2008年1月2日 申請日期2005年6月2日 優(yōu)先權(quán)日2004年6月2日
發(fā)明者安那德·馬達(dá)萬, 洪徹·劉 申請人:雅虎公司