欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

用于內(nèi)容推薦的設(shè)備、方法和計算機程序以及記錄介質(zhì)的制作方法

文檔序號:6580293閱讀:128來源:國知局
專利名稱:用于內(nèi)容推薦的設(shè)備、方法和計算機程序以及記錄介質(zhì)的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及用于推薦內(nèi)容的設(shè)備、方法、計算M序和記錄介質(zhì),尤其涉及用于以適當(dāng)?shù)胤从硨τ脩舻闹匾潭?諸如用戶偏好的每個屬性和分量)的方式向用戶推薦內(nèi)容的設(shè)備、方法、計算枳4呈序和記錄介質(zhì)。
背景技術(shù)
已經(jīng)開發(fā)出了向用戶推薦內(nèi)容(諸如記錄下的廣播節(jié)目)的技術(shù)。基于通過在以內(nèi)容元數(shù)據(jù)中所包含的屬性作為分量的向量和形成為包含數(shù)
量與所述元數(shù)據(jù)向量的分量相同的分量的向量的用戶偏好信息之間的匹配過程所計算出的相似度來進行內(nèi)#薦。
曰本未審查專利申請2007-200339號^^艮7>開了 一項技術(shù)。纟艮據(jù)所>^開的技術(shù),接收電子節(jié)目指南(EPG)數(shù)據(jù),從EPG數(shù)據(jù)中提取元數(shù)據(jù),并對元數(shù)據(jù)中所包含的標(biāo)題和內(nèi)容進行語素分析并將其分解成單詞。一項向量化以生成節(jié)目向量。基于所提供的元數(shù)據(jù)的節(jié)目類型提取效果向量。將所生成的節(jié)目向量映射到效果向量。

發(fā)明內(nèi)容
在用戶偏好信息和節(jié)目向量之間的相似度計算中曾使用與個體無關(guān)的公共固定值作為效果和權(quán)重。然而,在實際中,被認(rèn)為是很重要的屬性因用戶而異,并且所述公共固定值不能對個體差異進行補償。即使使用作為公共固定值的所述效果和權(quán)重來計算所^目似度從而推薦項目,也不一定能推薦出與用戶偏好真正匹配的項目。
例如,可以允許用戶輸入重要屬性并響應(yīng)于所述輸入結(jié)果個別地調(diào)節(jié)權(quán)重。采用這種方法,能夠補償所述個體差異。
用戶偏好是一個非常抽象的概念,甚至用戶也難以表達(dá)其自己的偏好。用戶或許不能容易地發(fā)現(xiàn)重要的屬性。用戶偏好可以隨時間而發(fā)生變化。例如,在觀看了包括廣播節(jié)目和
DVD的大量內(nèi)^4L后,用戶或許發(fā)現(xiàn)某個屬性比原先i人為重要的那個屬性更重要。
因此希望提供用于以反映對用戶的重要程度(諸如用戶偏好的每個屬性和分量)的方式向用戶推薦內(nèi)容的設(shè)備、方法、計算M序和記錄介質(zhì)。
根據(jù)本發(fā)明的一個實施例,推薦i殳備包括調(diào)節(jié)信息存儲裝置,用于生成并存儲調(diào)節(jié)信息,所述調(diào)節(jié)信息把通過將用戶偏好信息中的分量與項目偏好信息中的分量之間的分量相似度乘上權(quán)重系數(shù)而得到的值映射到響應(yīng)于用戶對項目進行的^作的類型而確定的評伯、值的目標(biāo),所述用戶偏好信息表示所述用戶的偏好,并且被構(gòu)造成包含多個分量的向量,所述項目偏好信息基于作為推薦目標(biāo)的每個項目的元信息而生成,并且包含數(shù)目與所述用戶偏好信息的分量數(shù)目相同的分量;多元回歸分析裝置,用于基于多個調(diào)節(jié)信息通過多元回歸分析逐個用戶地計算每個權(quán)重系數(shù),所述用戶偏好信息的每個分量都乘上各自的權(quán)重系數(shù);權(quán)重系數(shù)存儲裝置,用于逐個用戶地存儲所計算的權(quán)重系數(shù),在所述評價值的計算中,所述用戶偏好信息的每個分量都乘上各自的計算出的權(quán)重系數(shù);以及推薦項目識別裝置,用于基于所述用戶偏好信息和所述項目偏好信息的每個分量以及基于與所述分量相應(yīng)的所述權(quán)重系數(shù)計算出的評價值來識別要向所述用戶推薦的項目。
在預(yù)定時間段內(nèi)生成的調(diào)節(jié)信息可以作為所述多元回歸分析的目標(biāo)。
在每個預(yù)定的周期生成并存儲所述調(diào)節(jié)信息。逐個用戶地計算所i1^重系數(shù)。逐個用戶M儲計算出的權(quán)重系數(shù)。在所述評價值的計算中,用戶偏好信息的每個分量都乘上各自的計算出的權(quán)重系數(shù)。
所述推薦設(shè)備可以進一步包括調(diào)節(jié)信息刪除裝置,用于刪除在所述多元回歸分析中使用的調(diào)節(jié)信息。
所述調(diào)節(jié)信息刪除裝置可以按照從舊到新的生成順序刪除預(yù)定百分比的調(diào)節(jié)信息。
調(diào)節(jié)信息可以包含由所述用戶操作的類型確定的使用數(shù),以及調(diào)節(jié)信息刪除裝置可以刪除在所述多元回歸分析中使用了所述使用數(shù)的調(diào)節(jié)信息。
根據(jù)本發(fā)明的一個實施例, 一種推薦方法,包括步驟生成并存自節(jié)信息,所述調(diào)節(jié)信息把通過將用戶偏好信息中的分量與項目偏好信息中的分量之間的分量相似度乘上權(quán)重系數(shù)而得到的值映射到響應(yīng)于用戶對項目進行的操作的類型而確定的評價值的目標(biāo),所述用戶偏好信息表示所述用戶的偏好,并且被構(gòu)造成包含多個分量的向量,所述項目偏好信息基于作為推薦目標(biāo)的每個項目的元信息而生成,并且包含數(shù)目與所述用戶偏
好信息的分量數(shù)目相同的分量;基于多個調(diào)節(jié)信息通過多元回歸分析逐個用戶地計算每個權(quán)重系數(shù),用戶偏好信息的每個分量都乘上各自的權(quán)重系數(shù);逐個用戶地存儲所計算出的權(quán)重系數(shù),在所述評價值的計算中,所述用戶偏好信息的每個分量都乘上各自的計算出的權(quán)重系數(shù);以及基于所述用戶偏好信息和所述項目偏好信息的每個分量以及基于與所述分量相應(yīng)的所述權(quán)重系數(shù)計算出的所述評價值來識別要向所述用戶推薦的項目。
根據(jù)本發(fā)明的一個實施例, 一種計算^i^呈序,用于使計算機執(zhí)行步驟生成并存儲調(diào)節(jié)信息,所述調(diào)節(jié)信息把通過將用戶偏好信息中的分量與項目偏好信息中的分量之間的分量相似度乘上權(quán)重系數(shù)而得到的值映射到響應(yīng)于用戶對項目進行的^Mt的類型而確定的評^Hi的目標(biāo),所述用戶偏好信息表示所述用戶的偏好,并且被構(gòu)造成包含多個分量的向量,所述項目偏好信息基于作為推薦目標(biāo)的每個項目的元信息而生成,并且包含數(shù)目與所述用戶偏好信息的分量數(shù)目相同的分量;基于多個調(diào)節(jié)信息通過多元回歸分析逐個用戶地計算每個權(quán)重系數(shù),所述用戶偏好信息的每個分量都乘上各自的權(quán)重系數(shù);逐個用戶地存儲所計算出的權(quán)重系數(shù),在所述評價值的計算中,所述用戶偏好信息的每個分量都乘上各自的計算出的權(quán)重系數(shù);以及基于所述用戶偏好信息和所述項目偏好信息的每個分量以及基于與所述分量相應(yīng)的所述權(quán)重系數(shù)計算出的所述評價值來識別要向所述用戶推薦的項目。
根據(jù)本發(fā)明的各實施例,生成并存儲調(diào)節(jié)信息。所述調(diào)節(jié)信息把通過將用戶偏好信息中的分量與項目偏好信息中的分量之間的分量相似度乘上權(quán)重系數(shù)而得到的值映射到根據(jù)用戶對項目進行的操作的類型而確定的評價值的目標(biāo)。所述用戶偏好信息表示所述用戶的偏好,并且被構(gòu)造成包含多個分量的向量,所述項目偏好信息基于作為推薦目標(biāo)的每個項目的元信息而生成,并且包含數(shù)目與所述用戶偏好信息的分量數(shù)目同樣多的分量?;诙鄠€調(diào)節(jié)信息通過多元回歸分析逐個用戶地計算每個權(quán)重系數(shù),其中所述用戶偏好信息的每個分量都乘上所述各自的權(quán)重系數(shù)。逐個用戶地存儲所述計算出來的權(quán)重系數(shù),其中在所述評價值的計算中,所述用戶偏好信息的每個分量都乘上各自的計算出的權(quán)重系數(shù)?;谒鲇脩羝眯畔⒑退鲰椖科眯畔⒌拿總€分量以及基于與所述分量相應(yīng)的權(quán)重系數(shù)計算出來的評價值來識別要向所述用戶推薦的項目。
根據(jù)本發(fā)明的各實施例,以適當(dāng)?shù)胤从硨τ脩舻闹匾潭?諸如用戶偏好的每個屬性和分量)的方式來進行內(nèi)容推薦。


圖l是根據(jù)本發(fā)明一個實施例的推薦系統(tǒng)的框圖2示出圖l所示的^Mt日志lt據(jù)庫(DB)的結(jié)構(gòu);
圖3示出項目元信息的例子;
圖4示出圖l所示的項目元數(shù)據(jù)庫;
圖5示出圖l所示的用戶偏好數(shù)據(jù)庫;
圖6是示出圖1所示的推薦系統(tǒng)的推薦列表生成過程的流程圖7是示出匹配過禾呈的流程圖8是示出根據(jù)本發(fā)明一個實施例的另一個推薦系統(tǒng)的框圖9示出圖8所示的屬性權(quán)重數(shù)據(jù)庫;
圖10示出圖8所示的屬性權(quán)重調(diào)節(jié)數(shù)據(jù)庫;
圖11是示出屬性權(quán)重調(diào)節(jié)數(shù)據(jù)庫生成過程的流程圖12是示出屬性權(quán)重計算過程的流程圖13是示出屬性權(quán)重調(diào)節(jié)數(shù)據(jù)庫管理過程的流程圖14示出圖8所示屬性權(quán)重調(diào)節(jié)婆:據(jù)庫的另一個例子;
圖15是示出另一個屬性權(quán)重調(diào)節(jié)數(shù)據(jù)庫管理過程的流程圖;以及
圖16是示出個人計算機的結(jié)構(gòu)的沖匡圖。
具體實施例方式
下面將參考附圖來描述本發(fā)明的實施例。
圖1是示出根據(jù)本發(fā)明一個實施例的推薦系統(tǒng)10的結(jié)構(gòu)的框圖。推薦系統(tǒng)IO旨在向用戶推薦由諸如視頻和音頻的數(shù)據(jù)構(gòu)成的項目。例如,
所述項目包含諸如廣播節(jié)目的內(nèi)容、通過對數(shù)字通用盤(DVD )上所記
錄的電影進行復(fù)制而獲得的內(nèi)容等。圖l所示的推薦系統(tǒng)10包括終端21、操作日志數(shù)據(jù)庫(DB) 22、項目元數(shù)據(jù)庫(metaDB) 23、偏好提取引擎24、用戶偏好數(shù)據(jù)庫25、推薦引擎26、基分量/逆分量(base/inversion component)提取器27、成熟度計算引擎28。操作日志數(shù)據(jù)庫22到成熟度計算引擎28可以由至少一個計算機(服務(wù)器)構(gòu)成,以作為推薦設(shè)備,并經(jīng)由網(wǎng)絡(luò)與終端21互連。
由此,終端21與由操作日志數(shù)據(jù)庫22到成熟度計算引擎28所構(gòu)成的推薦設(shè)備分開安置?;蛘?,可以使用至少一個計算機來設(shè)置整個推薦系統(tǒng)10。
在推薦系統(tǒng)10中,所述推薦設(shè)^^皮設(shè)計為響應(yīng)于來自終端21的請求向終端21發(fā)送推薦項目列表。例如,推薦系統(tǒng)10基于每個項目的元信息推薦與用戶偏好相匹配的項目。后面將^^描述,推薦系統(tǒng)10響應(yīng)于來自終端21的請求有意地向用戶推薦會4吏用戶驚訝的項目。
如圖1所示,用戶通過對作為記錄在終端21上的項目的內(nèi)容數(shù)據(jù)進行再現(xiàn)來觀看所述項目。通iW"終端21進行操作,用戶可以記錄項目,諸如廣播節(jié)目。用戶也可以將終端21上存儲的內(nèi)容數(shù)據(jù)發(fā)送到移動終端。用戶也可以從終端21刪除內(nèi)容數(shù)據(jù)。通過對終端21進行操作,用戶就這樣來對項目進行各種處理。
與終端21的涉及每個項目的各種類型的操作相關(guān)的信息被作為操作日志輸出,基于所述操作日志而產(chǎn)生的記錄被存儲在操作日志數(shù)據(jù)庫22上。圖2示出存儲在操作曰志數(shù)據(jù)庫22上的數(shù)據(jù)。
如圖2所示,每行所列數(shù)據(jù)對應(yīng)著操作日志數(shù)據(jù)庫22上的各個記錄。操作日志數(shù)據(jù)庫22的每個記錄包含四個字段"項目Id"、"成員Id"、"曰志類型"和"日志時間"。
"項目Id"字段存儲標(biāo)識在相應(yīng)操作中被處理的目標(biāo)項目的項目Id的值。在這種情形中,值"1001"、 "1003"、 "1009"…被存儲在各個記錄的"項目Id"字段中。
"成員Id"字段存儲標(biāo)識執(zhí)行了所述操作的用戶的用戶(成員)ID的值。值"1"、 "3"、 "1"...被存儲在各個記錄的"成員Id"字段中。
"曰志類型"字段存儲標(biāo)識所述操作的類型的信息。在這種情形中,"保留"、"細(xì)節(jié)"、"好"…被存儲在各個記錄的"曰志類型"字段中。"曰志類型"字段中所存儲的信息是根據(jù)預(yù)定方法將所述操作類型(諸如觀 所述項目或記錄所述項目)轉(zhuǎn)換成的字符串。"日志時間,,字段存儲標(biāo)識執(zhí)行所述操作的日期和時間的信息。在本
例中,在"日志時間"字段中存儲著信息"2007-12-05 08:39:44 (表示2007年12月5日8點:39分:44秒)。
與附到每個項目的元信息有關(guān)的信息被存儲在項目元數(shù)據(jù)庫23上。例如,從電子節(jié)目指南(EPG)獲得所述元信息。所述元信息包含所述項目(內(nèi)容)的諸如類型、表演者、關(guān)鍵字等信息。
圖3示出附到給定項目(內(nèi)容)的項目元信息。所述項目元信息包含屬性、值和得分。所述項目元信息的屬性包括"類型"、"人員(諸如所述內(nèi)容中的表演者)"、"關(guān)鍵字"...。所述項目元信息的值指示每個屬性的組成部分(segment)。屬性"類型"中所包含的值為"戲劇"、"新聞"、"紀(jì)錄片"...。所述項目元信息的得分是附到每個值的得分。在本例中,值"戲劇"的得分為"5",值"新聞"的得分為"0",值"紀(jì)錄片"的得
分為"r。
與圖3的例子中的項目元信息相對應(yīng)的項目接近于戲劇,但還包含紀(jì)錄片的元素。
屬性"人員"的值列出了 "ABC"、 "DEF"、 "GHI"…。在本例中,值"ABC"的得分為"1",值"DEF"的得分為"1",值"GHI"的得分為"1"…。
與圖3中的項目元信息相對應(yīng)的項目包含"ABC"、 "DEF"、和"GHI"(虛構(gòu)的名字)作為其表演者。
圖3中的屬性"關(guān)鍵字"的值包含"美食家"、"旅游"、"音樂"...。值"美食家"的得分為"3",值"旅游"的得分為"5",值"音樂"的得分為'T,...。屬性"關(guān)鍵字"的值是介紹某個項目(諸如廣播節(jié)目)的消息(諸如EPG中的節(jié)目描述)中所包含的預(yù)定詞。例如,從EPG中的節(jié)目的介紹性句子中檢測到諸如"美食家"、"旅游"和"音樂"的預(yù)定詞,并且響應(yīng)于每個詞的檢測數(shù)來設(shè)置其得分。
與圖3中的項目元信息相對應(yīng)的項目是與"美食家"、"旅游"和"音樂"相關(guān)的內(nèi)容,特別是與"旅游"密切相關(guān)的內(nèi)容。
項目元數(shù)據(jù)庫23存儲根據(jù)值劃分每個項目的項目元信息而成的記錄。圖4示出項目元數(shù)據(jù)庫23上所存儲的數(shù)據(jù)的例子。
參考圖4,每行中所列的數(shù)據(jù)對應(yīng)著項目元數(shù)據(jù)庫23上的每個記錄。項目元數(shù)據(jù)庫23上的每個記錄包含5個字段"項目Id"、"屬性Id"、"值Id"、"次數(shù)"以及"得分"。
"項目Id"字段存儲標(biāo)識所述記錄的項目的項目ID值。在本例中,在各個記錄的"項目Id"字段中存儲著值"2000114789142"、"200019580489"、 "100024316163"…。
"屬性Id"字段存儲標(biāo)識所述記錄的屬性的屬性ID值。值"1"被存儲在每個記錄的"屬性Id"字段中。"屬性Id"字段中所存儲的值"1"對應(yīng)著屬性"類型","屬性Id"字段中所存儲的值"2"對應(yīng)著屬性"人員"...。這樣,"屬性Id"字段中的值確定了每個記錄的屬性。在本例中,"屬性Id,,字段中的所有值均為"1"。在實際中,項目元翁:據(jù)庫23也包含在"屬性Id"字段中具有值"2"、 "3"…的記錄。
"值Id"字^1存儲標(biāo)識記錄的值的值ID的值。在本例中,值"153144"被存儲在每個記錄的"值Id"字段中。例如,存儲在"值Id"字段中的值"153144"對應(yīng)著值"戲劇",存儲在"值Id"字段中的值"153145"對應(yīng)著值"新聞,,...。所述記錄的值由"值Id"字段中的值來標(biāo)識。在本例中,"值Id"字段中的所有的值都為"153144"。在實際中,項目元數(shù)據(jù)庫23也存儲具有"值Id"字段中值"153145"、 "153146"…的記錄。
"次數(shù)"字段存儲標(biāo)識記錄的更新數(shù)目的值。"次數(shù),,字段可以被省略。
"得分"字段存儲標(biāo)識記錄的值的得分的值。圖3中的得分的值^:存
儲在"得分"字段中。例如,圖4中的頂部的記錄具有項目ID為"2000114789142"的項目的項目元信息的值"戲劇"(在"值Id"字段中具有值"153144")的得分。
如上所述來構(gòu)造項目元數(shù)據(jù)庫23。通過獲取能夠成為終端21的操作目標(biāo)的每個項目的內(nèi)容的元數(shù)據(jù)來預(yù)先生成項目元數(shù)據(jù)庫23。
返回到圖1,偏好提取引擎24基于操作日志數(shù)據(jù)庫22的記錄和項目元數(shù)據(jù)庫23的記錄使用戶偏好數(shù)據(jù)庫25存儲數(shù)據(jù)。
響應(yīng)于操作日志數(shù)據(jù)庫22的記錄,偏好提取引擎24識別用戶通過操作終端21而處理了的項目的項目ID,并識別所述^Mt的類型。響應(yīng)于所識別的項目ID,偏好提取引擎24搜索項目元數(shù)據(jù)庫23上的記錄,由此識別具有所識別的項目ID的項目的項目元信息的屬性、值和得分。
然后,偏好提取引擎24生成將所識別的屬性、值和得分映射到用戶的成員ID的記錄。然后,偏好提取引擎24將所述得分的值乘上響應(yīng)于所述操作的類型預(yù)先設(shè)定的系數(shù)。例如,如果響應(yīng)于操作日志數(shù)據(jù)庫22的記錄識別的操作類型為記錄項目,那么,基于項目元數(shù)據(jù)庫23的記錄識別的得分的值就乘上系數(shù)3。如果響應(yīng)于操作日志數(shù)據(jù)庫22的記錄識別的操作內(nèi)容為觀看項目,那么,基于項目元數(shù)據(jù)庫23的記錄而識別的得分的值就乘上系數(shù)2。
這樣生成的記錄變成用戶偏好數(shù)據(jù)庫25的記錄。圖5示出用戶偏好數(shù)據(jù)庫25的例子。
參考圖5,每行所列的數(shù)據(jù)對應(yīng)著用戶偏好數(shù)據(jù)庫25的記錄。用戶偏好數(shù)據(jù)庫25的每個記錄包含4個字段"成員Id"、"屬性Id"、"值Id"和"得分"。
如前面參考圖2所示的操作日志數(shù)據(jù)庫22所說明的那樣,"成員Id"字段標(biāo)識圖5中的用戶。如前面參考圖4的項目元數(shù)據(jù)庫23所說明的那樣,圖5中所示的"屬性Id"字段、"值Id"字段和"得分"字段也標(biāo)識所述屬性、值和得分。
圖5所示的用戶偏好數(shù)據(jù)庫25基于值來生成。具體說,對于由一個人員所進行的一個操作產(chǎn)生多個記錄。所產(chǎn)生的記錄的數(shù)目等于作為操作目標(biāo)的項目的項目元信息的值的數(shù)目。
每次由用戶進行了 ^Mt時,所述記錄被存儲在用戶偏好數(shù)據(jù)庫25上。具體說,響應(yīng)于一個操作所產(chǎn)生的記錄的數(shù)目等于作為操作目標(biāo)的項目的項目元信息的值的數(shù)目。
返回圖1,推薦引擎26基于用戶偏好數(shù)據(jù)庫25的記錄來產(chǎn)生用戶偏好信息。推薦引擎26也基于項目元數(shù)據(jù)庫23的記錄來產(chǎn)生項目偏好信息。所述用戶偏好信息和項目偏好信息各自都是向量,每一個都具有與屬性數(shù)目同樣多的分量數(shù)目。例如,如果項目偏好信息的屬性之和為100,那么,用戶偏好信息和項目偏好信息中的每一個都是100維向量(有100個分量)。
所述用戶偏好信息的每個分量的值被確定如下。推薦引擎26檢查圖5的用戶偏好數(shù)據(jù)庫25的記錄,并獲WA:映射到用戶的成員ID的所有記錄。推薦引擎26根據(jù)"屬性Id"字段的值來排序所述記錄。如果多個記錄具有同樣的"屬性Id"字段的值,那么,推薦引擎26將這些記錄的"得分"字段中的值加起來作為總數(shù)。在所述用戶偏好信息向量中與屬 "類型"(在"屬性Id"字段中為1)相應(yīng)的分量的值為值"戲劇"、"新聞"、"紀(jì)錄片"...的得分之和。這樣就產(chǎn)生了所述用戶偏好信息,其中,屬性的得分之和為每個分量的值。
項目偏好信息的每個分量的值的獲得與用戶偏好信息的值的獲得方
式相同。在生成項目偏好信息時,推薦引擎26基于圖4所示的項目元數(shù)據(jù)庫23的記錄來計算所述向量的每個分量的值。 一個項目偏好信息向量響應(yīng)于一個項目ID來生成。
基分量/逆分量提取器27從用戶偏好信息向量和項目偏好信息向量中4C取基分量和逆分量。所4分量有力地反映用戶的偏好,而所述逆分量有力地反映使用戶產(chǎn)生的驚異?;至?逆分量提取器27按下述方式:R取所i^分量和逆分量。
基分量/逆分量提取器27計算通過將用戶偏好信息向量的每個分量乘上在后面要說明的方程(1)中所表達(dá)的權(quán)重wa來確定的值的占有率(occ叩ancyrate)。為了說明簡單起見,設(shè)用戶偏好信息為三維向量,并且用戶的用戶偏好信息為向量(1, 2, 3 )。通過將用戶偏好信息的分量的原始值乘上方程(1)的權(quán)重wa來產(chǎn)生向量(1, 2, 3)。如后面要描述的,所述權(quán)重wa是預(yù)先為所述向量的每個分量確定的系數(shù)?,F(xiàn)在預(yù)定了權(quán)重wl到w3。如果原始的用戶偏好信息為向量(x, y, z),那么,滿足關(guān)系x ■ wl=l, y w2=2以及z w3=3。
在這種情形中,第一分量的占有率祁^據(jù)下面的等式來計算
1/(1+2+3)=0.1666 17%
第二分量的占有率^^據(jù)下面的等式來計算
2/(1+2+3)=0.3333 33%
第三分量的占有率才艮據(jù)下面的等式來計算
3/(1+2+3)=0.5000 50%
基分量/逆分量提取器27基于這樣計算出來的占有率來提取基分量和逆分量。例如,在所述用戶偏好信息向量的各分量中,具有最高占有率的分量為所述基分量,而具有第二高占有率的分量則為所述逆分量。在下面的i兌明中,所述用戶偏好信息向量為n維向量。
基分量/逆分量提取器27提取具有第三高占有率的分量、具有第四高占有率的分量...,直到提取出來作為基分量的分量的占有率以及隨后提取出來的分量的占有率之和達(dá)到預(yù)定值(例如,50%)為止。然后,基分量/逆分量提取器27將這些分量i殳置為基分量。
這里所設(shè)置的值(例如50% )依據(jù)后面要說明的成熟度計算引擎28所計算出的成熟度來確定。
例如,當(dāng)提取具有第五高占有率的分量時,提取出來作為基分量的分量的占有率之和可以達(dá)到所述預(yù)定值。然后,基分量/逆分量提取器27提
取具有第六高占有率的分量、具有第七高占有率的分量.....具有第N
高占有率的分量。包括提取出來作為第一逆分量的這些分量被設(shè)置為逆分量。因此,就提取出來了基分量和逆分量。
上il^分量和逆分量的^^方法只是一個例子。也可以通過其它方法來提取所述基分量和逆分量。
基分量/逆分量提取器27向推薦引擎26通知與提取出來作為基分量的每個分量相應(yīng)的"屬性Id"字段的值,以作為基分量ID?;至?逆分量提取器27也向推薦引擎26通知與提取出來作為逆分量的每個分量相應(yīng)的"屬性Id"字段的值,以作為逆分量ID。
推薦引擎26響應(yīng)于基分量ID來識別用戶偏好信息向量中的基分量,并識別項目偏好信息向量中的基分量。推薦引擎26也從用戶偏好信息向量和項目偏好信息向量的每一個中提取基分量。這樣就生成了用戶偏好信息的基向量和項目偏好信息的基向量。
響應(yīng)于逆分量ID,推薦引擎26識別用戶偏好信息向量中的逆分量,以及項目偏好信息向量中的逆分量。然后,推薦引擎26從用戶偏好信息向量和項目偏好信息向量的每一個中提取逆分量。這樣就生成了用戶偏好信息的反轉(zhuǎn)向量和項目偏好信息的反轉(zhuǎn)向量。
推薦引擎26進行匹配處理來對照根據(jù)項目元數(shù)據(jù)庫23產(chǎn)生的每個項目的項目偏好信息的基向量檢查已經(jīng)請求項目推薦的用戶的用戶偏好信息的基向量??梢允褂糜嬎阆蛄績?nèi)積的方法、計算余弦相似度的方法、計算歐幾里德距離的方法等來進行所述匹配過程。
如果4吏用計算向量內(nèi)積的方法作為所述匹配過程,那么,作為所述匹配過程結(jié)果而得到的向量X和Y之間的相似度sim(X, Y)就用方程(1)來表達(dá)
sim(X,Y) - I!(|Xa'Ya|xWa) ' ' . (1)集合A中包含的一個分量。"Xa"和"Ya"分別表示向量X和向量Y中的分量"a"的值,而"wa"表示分量a所乘的系數(shù),它也被稱作權(quán)重。權(quán)重wa可以是為每個分量預(yù)定的值,或也可以為每個用戶而設(shè)定。
各權(quán)重wa是所述向量的分量各自所乘的系數(shù)。在實際中,與用戶偏好信息(項目偏好信息)的分量相應(yīng)的系lbl存在的。如果用戶偏好信息是具有N個分量的向量,那么,權(quán)重wa就^^示為N維向量。
具體說,如果用戶偏好信息(項目偏好信息)有100個分量,那么,這些分量就對應(yīng)著第一個屬性到第一百個屬性。在這種情形中,權(quán)重wa是與所述第一到第一百個屬性相對應(yīng)的系數(shù)的集合。設(shè)Wn表示第n個屬性的權(quán)重,則權(quán)重wa^示為如下包含100個分量的向量
(w^ w2, w3,…,w100)
在上逸基向量的匹配過程中,如果分量a為第5分量,那么,以(Wi,W2,W3,…,Wk)。)中的ws替換方程(1)中的wa,并計算相似度。
推薦引擎26計算用戶的用戶偏好信息的基向量和每個項目的項目偏好信息的基向量之間的相似度。然后,推薦引擎26將所計算出的相似度作為勤目似度(basic similarity )存儲起來,其中每個項目(諸如項目ID)被映射到基相似度。
所計算出的斜目似度越高,項目就與用戶偏好越匹配。
推薦引擎26提取預(yù)定數(shù)目的具有高的勤目似度的項目,并將所提取的項目設(shè)置為候選項目。然后,推薦引擎26如下述那樣對每個候選項目計算逆相似度(inversion similarity )。
推薦引擎26根據(jù)方程(1)計算用戶的用戶偏好信息的反轉(zhuǎn)向量和候選項目的項目偏好信息的反轉(zhuǎn)向量之間的相似度。然后,所計算出的相似度被存儲起來,以作為逆相似度,其中每個項目被映射到逆相似度上。
所計算出的逆相似度越高,項目與用戶偏好就越可能相匹配。
推薦引擎26基于上i^目似度和逆相似度計算每個項目的驚異推薦估計值。所述驚異推薦估計值表示用戶對所推薦的項目以正面的方式感到驚異的可能性。
例如,根據(jù)下面的等式響應(yīng)于項目A的逆相似度Hanten(A)來計算所述項目A的驚異推薦估計值igaiDegree(A):igaiDegree(A)=l - Hanten(A)
所述項目A的逆相似度越小,所述項目A的驚異推薦估計值越大。
可以根據(jù)下述等式使用項目A的Jjt目似度Base(A)來計算所述項目A的驚異推薦估計值。
igaiDegree(A)= oc Base(A) - P Hanten(A)
在上述等式中,oc和p分別為預(yù)定的系數(shù)。
推薦引擎26按驚異推薦估計值從高到低的順序推薦預(yù)定數(shù)目的項目。例如,推薦引擎26從具有最高驚異推薦估計值的項目開始識別預(yù)定數(shù)目的項目,然后生成列出這些項目的推薦列表。推薦引擎26將所述推薦列4iL送給終端21。
根據(jù)本發(fā)明的一個實施例,根據(jù)勤目似度來縮減候選項目,然后基于逆相似度來計算驚異推薦估計值。由此就識別了要推薦的項目。
圖1所示的成熟度計算引擎28計算用戶偏好信息的成熟度。成熟度被如下計算成熟度計算引擎28從最新記錄開始按從新到舊的順序提取存儲在用戶偏好數(shù)據(jù)庫25上的用戶的預(yù)定數(shù)目的記錄。例如,提取響應(yīng)于由用戶對終端21進行的三個最新操作而產(chǎn)生的記錄。
成熟度計算引擎28檢查所提取的記錄的"值Id"字段,并存儲指示"值Id"字段的值的類型的數(shù)目的值xvn。例如,按照存在時間(age)
順序提取用戶的三個最新記錄。如果這三個記錄的"值Id"字段的值為"11"、 "22"和"33",那么xvn-3。如果這三個記錄的"值Id"字段的
值為"11"、 "22"和"11",那么,xvn=2。
成熟度計算引擎28確定指示用戶偏好數(shù)據(jù)庫25上現(xiàn)有的"值Id"字段的值的類型的總和的值yvn,并根據(jù)下面的等式來計算成熟度M:
M=l-(xvn/yvn)
其中,xvn的值是響應(yīng)于由用戶對終端21進行的一個操作的記錄的"值Id"字段的值的類型的數(shù)目的平均值。
具體說,成熟度計算引擎28基于與用戶偏好信息的最新操作相應(yīng)的更新程度來計算成熟度M。
與用戶偏好信息的最新操作相應(yīng)的更新程度越高,即,(xvn/yvn)的值越大,就認(rèn)為用戶偏好的改變越大。如果在最新操作中用戶偏好發(fā)生了4艮大的改變,那么看來所述用戶的用戶偏好信息就還有待成熟。這種用戶偏好信息可能在之后的操作中發(fā)生很大的改變。
如果用戶偏好信息在最近的操作中沒有發(fā)生很大的改變,那么,就認(rèn)為所述用戶的用戶偏好信息是成熟的。這種用戶偏好信息在之后的操作中不太可能發(fā)生^f艮大的改變。
例如,在用戶的成員ID的記錄在用戶偏好數(shù)據(jù)庫25上第一次生成之后的預(yù)定時間內(nèi),可以因為用戶偏好信息的不成熟而將成熟度M的值設(shè)置為零。如果所述用戶的操作的數(shù)目少于預(yù)定的閾值,那么因為^人為用戶偏好信息是不成熟的,所以可以將成熟度M的值設(shè)置為零。
已經(jīng)描述的成熟度M的計算方法只用于示范性目的,在成熟度M的計算中可以使用其它方法。
基于由成熟度計算引擎28計算出的成熟度M,在基分量/逆分量提取器27的基分量提取中,設(shè)置包括提取出來作為第一基分量的分量的占有率的占有率之和。如前所述,在所述占有率的計算中,用戶偏好信息的每個原始分量的值乘上了各自的權(quán)重wa。
例如,如果成熟度M落入0%到40%的范圍內(nèi),那么,就認(rèn)為用戶偏好信息是不成熟的,并將基分量的占有率之和設(shè)置為80%。從所述不成熟的用戶偏好信息中提取出來的逆分量被認(rèn)為是不太可靠的。
如果成熟度M落入41。/。到70%的范圍內(nèi),那么,就i人為用戶偏好信息有一些成熟,并將基分量的占有率之和設(shè)置為65%。
如果成熟度M落入71%到100%的范圍內(nèi),那么,就認(rèn)為用戶偏好信息是成熟的,并將基分量的占有率之和設(shè)置為50%。從所述成熟的用戶偏好信息中提取出來的逆分量就被認(rèn)為是高度可靠的。
基于用戶偏好信息的成熟度M把所述基向量和反轉(zhuǎn)向量的分量定下來。
根據(jù)本發(fā)明的一個實施例,根據(jù)具有基于用戶偏好信息的成熟度M定下來的分量的基向量和反轉(zhuǎn)向量來計算相似度。首先,基于^目似度來縮減候選項目。然后,基于逆相似度來計算驚異推薦估計值,以便識別要推薦的項目。這樣,可以向用戶推薦可能會使用戶從正面感到驚異的項目。
如果某內(nèi)容與用戶通常所看到的項目有這樣或那樣的輕微不同,但同時另一方面用戶仍然基本上覺得對該內(nèi)容比較熟悉,那么,該用戶就可能會享受該內(nèi)容所帶來的驚異。例如,如果推薦了與用戶偏好不匹配的內(nèi)容,那么,用戶自然不會滿意該內(nèi)容。
根據(jù)相關(guān)領(lǐng)域中的一種技術(shù),通過改變屬性的權(quán)重來增加該屬性對匹配結(jié)果的貢獻(xiàn)。這種技術(shù)未必以一種容易理解的方式向用戶推薦用戶覺得有關(guān)聯(lián)的內(nèi)容。
即使在改變每個屬性的權(quán)重的技術(shù)中將用戶偏好信息的特定屬性的權(quán)重設(shè)置得高,所述內(nèi)容的元數(shù)據(jù)中所包含的屬性的值也可以是小的,并且該內(nèi)M推薦的可能性保持為低。另一方面,即4吏將用戶偏好信息的特定屬性的權(quán)重設(shè)置得低,所述內(nèi)容的元數(shù)據(jù)中所包含的屬性的值也可以是
大的,并且該內(nèi)^L推薦的可能性保持為高。
根據(jù)相關(guān)技術(shù),能夠推薦與用戶通常觀看的內(nèi)容類型不同的內(nèi)容,并且所述用戶對所述內(nèi)容感到驚異。然而,仍然不確定的是用戶能愉快地接受這才羊的驚異。
根據(jù)本發(fā)明的實施例,基于勤目似度來縮減候選項目,并基于逆相似度來計算驚異推薦估計值,以便識別要推薦的項目。
勤目似度和逆相似度均表示用戶偏好信息和項目偏好信息之間的相似度。勤目似度和逆相似度的每一個的值越高,項目與用戶偏好相匹配的可能性就越高。另一方面,勤目似度和逆相似度的每一個的值越低,項目與用戶偏好相匹配的可能性就越低。
例如,如果推薦了具有較^^目似度的項目,那么,用戶肯定對該項目感到驚異。這樣的項目不與用戶偏好相匹配,用戶也不能將其作為愉快的驚異而接受。
根據(jù)本發(fā)明的一個實施例,用戶偏好信息向量被分成用戶偏好信息的基向量和反轉(zhuǎn)向量。具有基于基向量的高相似度(勤目似度)的項目被縮減,然后,具有基于反轉(zhuǎn)向量的低相似度(逆相似度)的項目被選擇。采用根據(jù)本發(fā)明實施例的布置,可靠地推薦能被用戶作為愉快的驚異而接受的項目。
下面將參考圖6所示的流程圖來描述圖1所示的推薦系統(tǒng)10的推薦列表生成過程。當(dāng)發(fā)出了向用戶推薦旨在使用戶感到驚異的項目的請求時,就執(zhí)行所述推薦列表生成過程。
在步驟Sll中,成熟度計算引擎28計算成熟度M在步驟S12中,基分量/逆分量提取器27基于步驟S11中所計算出來的成熟度M來設(shè)置基分量與逆分量之比。例如,將成熟度M的值與預(yù)定的閾值進行比較,并確定用戶偏好信息的成熟度M的水平(例如,不成熟、不太成熟、以及成熟)。響應(yīng)于成熟度M的水平來設(shè)置所a分量與逆分量之比。例如,將占有率之和設(shè)置為80%、 65%、 50%等。
在步驟S13中,基分量/逆分量提取器27和推薦引擎26執(zhí)行后面參考圖7說明的匹配過程。對用戶偏好信息和項目偏好信息的基向量和反轉(zhuǎn)向量執(zhí)行匹配過程。計算每個項目的勤目似度和逆相似度,并將其存^ft起來。因此,步驟S13中的操作識別候選項目,作為要被推薦的候選。
在步驟S14中,推薦引擎26為步驟S13中所識別的每個候選項目計算驚異推薦估計值。如前所述,根據(jù)下面的等式基于項目A的逆相似度Hanten(A)來計算項目A的驚異推薦估計值igaiDegree(A):
igaiDegree(A)=l-Hanten(A)
可以根據(jù)下述等式基于項目A的基相似度Base(A)來計算所述項目A的驚異推薦估計值igaiDegree(A):
igaiDegree(A)= oc Base(A)畫P Hanten(A)
在步驟S15中,推薦引擎26識別要推薦的項目。在這種情形中,從候選項目中識別預(yù)定數(shù)目的具有高的驚異推薦估計值的項目。
在步驟S16中,推薦引擎26生成推薦列表的數(shù)據(jù),推薦列表被構(gòu)造為在步驟S15中被識別為要推薦的項目的列表。將這里所生成的推薦列表數(shù)據(jù)發(fā)送到終端21。然后,將所述推薦列表顯示在終端21的顯示器上,向用戶推薦所述項目。
因此就執(zhí)行了所述推薦列表生成過程。這樣,推薦了為用戶提供愉快的驚異的項目。
下面將參考圖7所示的流程圖來詳細(xì)描述圖6所示的步驟S13中的匹配過程。
在步驟S31中,基分量/逆分量提取器27從用戶偏好信息中提取基分量。
如前所述,基分量/逆分量提取器27通過將用戶偏好信息向量的每個分量乘上方程(1)的每個權(quán)重來計算值的占有率。例如,用戶偏好信息向量的各分量中具有最高占有率的分量被設(shè)置為基分量,而具有第二高占
19有率的分量不被設(shè)置為基分量。提取具有第三高、第四高…占有率的分量,
直到包括所述第一分量的所4C取的分量的占有率之和達(dá)到在步驟S12中所處理的值為止。這些分量被設(shè)置為基分量?;谒崛〉幕至康?屬性Id"字段的值從所述用戶偏好信息中提取所述基分量。
在步驟S32中,基分量/逆分量提取器27從項目偏好信息中提取基分量。在這種情形中,從所述項目偏好信息中提取與在步驟S31中所提取的基分量相對應(yīng)的分量。
在步驟S33中,推薦引擎26計算由步驟S31中所提取出來的基分量所構(gòu)成的用戶偏好信息的基向量和由步驟S32中所提取出來的基分量所構(gòu)成的項目偏好信息的基向量之間的相似度。例如,使用方程(1)來計算所i^目似度。計算與要推薦的項目的數(shù)目相等的數(shù)目的相似度。這些相似度變成了與所述項目相對應(yīng)的勤目似度。
在步驟S34中,推薦引擎26按步驟S33所計算出的相似度從高到低的順序識別預(yù)定數(shù)目的項目,作為候選項目。
在步驟S35中,推薦引擎26將步驟S33中計算出來的勤目似度存儲起來,其中在步驟S34中所識別的候選項目被映射到勤目似度上。
在步驟S36中,基分量/逆分量提取器27從用戶偏好信息中提取逆分量。在這種情形中,例如,在步驟S31中沒有被提取為基分量的分量被提取為逆分量。
在步驟S37中,基分量/逆分量提取器27從項目偏好信息中提取逆分量。在這種情形中,從所述項目偏好信息中提取與在步驟S36中所提取的逆分量相對應(yīng)的分量。
在步驟S38中,推薦引擎26計算由步驟S36中所提取出來的逆分量所構(gòu)成的用戶偏好信息的反轉(zhuǎn)向量和由步驟S37中所提取出來的逆分量所構(gòu)成的項目偏好信息的反轉(zhuǎn)向量之間的相似度。例如,使用方程(l)來計算所述相似度。計算與要推薦的項目的數(shù)目相等的數(shù)目的相似度。這
些相似度變成與所述項目相對應(yīng)的逆相似度。
在步驟S39中,推薦引擎26將步驟S38中計算出來的逆相似度存儲起來,其中在步驟S34中所識別的候選項目被映射到逆相似度上。
就這樣來進行所述匹配過程。
在上面的說明中,推薦系統(tǒng)10推薦旨在使用戶驚異的項目。也可以推薦不旨在使用戶驚異的項目。如果推薦系統(tǒng)10推薦不旨在^f吏用戶驚異的項目,那么,推薦引擎26就對用戶偏好信息和項目偏好信息直M行匹配過程,并計算所i^目似度。對具有高的計算出的相似度的項目進行推薦。
方程(1)的權(quán)重wa可以是為每個分量預(yù)定的權(quán)重,也可以是為每個用戶預(yù)置的權(quán)重。
當(dāng)計算用戶偏好信息和項目偏好信息之間的相似度時,在相關(guān)技術(shù)中使用不依賴于個體的固定權(quán)重。然而,在實際中,被認(rèn)為是重要的屬性對于不同的用戶來說是不同的,普通的固定值不能夠?qū)€體差異進行補償。即使使用作為普通固定值的權(quán)重來計算所^f目似度從而推薦項目,也不一定能推薦出與用戶偏好真正匹配的項目。
例如,可以允許用戶輸入重要的屬性,并可以響應(yīng)于輸入結(jié)果單獨調(diào)節(jié)所a重。采用這種布置,能夠補償個體差異。
用戶偏好是非常抽象的概念,甚至用戶難以表達(dá)其自己的偏好。用戶或許不能容易地發(fā)現(xiàn)重要的屬性。
用戶偏好可以隨時間而發(fā)生變化。例如,在觀看了包括廣播節(jié)目和DVD的大量內(nèi)R后,用戶可能發(fā)現(xiàn)某個屬性比最初認(rèn)為很重要的那個屬性更重要。
根據(jù)本發(fā)明的一個實施例,可以自動調(diào)節(jié)每個用戶的最佳權(quán)重。
圖8是示出允許將所述權(quán)重自動調(diào)節(jié)為對用戶最佳的權(quán)重的推薦系統(tǒng)100的框圖。
圖8所示的推薦系統(tǒng)100包括終端121、 ^Mt日志數(shù)據(jù)庫122、內(nèi)容元數(shù)據(jù)庫123、用戶偏好數(shù)據(jù)庫125、推薦引擎126、屬性權(quán)重調(diào)節(jié)引擎129、屬性權(quán)重數(shù)據(jù)庫131以及屬性權(quán)重調(diào)節(jié)數(shù)據(jù)庫132??梢詫D8所示的操作日志數(shù)據(jù)庫122到屬性權(quán)重調(diào)節(jié)數(shù)據(jù)庫132構(gòu)造成包括至少一個服務(wù)器,經(jīng)由網(wǎng)絡(luò)連接到終端121的推薦設(shè)備。
因此,終端121與由操作日志數(shù)據(jù)庫122到屬性權(quán)重調(diào)節(jié)翁:據(jù)庫132所構(gòu)成的推薦設(shè)備分開布置?;蛘撸麄€推薦系統(tǒng)100可以使用至少一個計算機來布置。
圖8所示的終端121、操作日志數(shù)據(jù)庫122、內(nèi)容元數(shù)據(jù)庫123以及用戶偏好數(shù)據(jù)庫125分別與圖l所示的終端21、操作日志數(shù)據(jù)庫22、項
21目元數(shù)據(jù)庫23以及用戶偏好數(shù)據(jù)庫25相同,這里省略其詳細(xì)說明。操作 曰志數(shù)據(jù)庫122由前面參考圖2所說明的記錄構(gòu)成。內(nèi)容元數(shù)據(jù)庫123也 由前面參考圖4所說明的記錄構(gòu)成。用戶偏好數(shù)據(jù)庫125由前面參考圖5 所說明的記錄構(gòu)成。圖8沒有示出與圖1所示的偏好提取引擎24相對應(yīng) 的功能塊。如前面參考圖l所述,生成用戶偏好數(shù)據(jù)庫125的記錄。
圖9示出屬性權(quán)重數(shù)據(jù)庫131。如圖9所示,每行上的數(shù)據(jù)對應(yīng)著屬 性權(quán)重數(shù)據(jù)庫131的記錄。在這種情形中,屬性權(quán)重數(shù)據(jù)庫131的每個記 錄包括4個字段"成員Id"字段、"屬性Id"字段、"權(quán)重"字段和"默 i人權(quán)重"字段。
"成員Id"字教:存儲標(biāo)識用戶的信息,如參考圖2所示的^^作曰志 數(shù)據(jù)庫22所說明的。"屬性Id"字段存儲標(biāo)識屬性的信息,如參考圖4 所示的項目元數(shù)據(jù)庫23所說明的。
"權(quán)重"字段存儲由"成員Id"字段所標(biāo)識的用戶的權(quán)重的值。如 上所述,所a重是逐個屬性進行設(shè)置的,"權(quán)重"字段存儲與"屬性Id" 字段的值相對應(yīng)的屬性的權(quán)重的值。
"默認(rèn)權(quán)重"字段存儲由"成員Id"字段所標(biāo)識的用戶的權(quán)重的默 認(rèn)值。所述權(quán)重的默認(rèn)值可以是預(yù)定的值,也可以是為每個用戶預(yù)置的值。 在自動調(diào)節(jié)用戶的權(quán)重之前,"權(quán)重"字段存儲"默iUl重"字段處的值。
如圖9所示,"成員Id"字段處的值為"1"或"2"的記錄^1逐個屬 性進行存儲的。如所列出的那樣,每個記錄在"權(quán)重"字段處存儲"默認(rèn) 權(quán)重,,字段的值,并且用戶的權(quán)重還沒有被自動調(diào)節(jié)。
圖8所示的屬性權(quán)重調(diào)節(jié)引擎129基于操作日志數(shù)據(jù)庫122上所存儲 的記錄來生成屬性權(quán)重調(diào)節(jié)數(shù)據(jù)庫132的記錄。屬性權(quán)重調(diào)節(jié)數(shù)據(jù)庫132 存儲用來計算為預(yù)定用戶進行調(diào)節(jié)的權(quán)重的信息。
圖10示出屬性權(quán)重調(diào)節(jié)數(shù)據(jù)庫132的例子。參考圖10,每行的數(shù)據(jù) 對應(yīng)著屬性權(quán)重調(diào)節(jié)數(shù)據(jù)庫132的每個記錄。屬性權(quán)重調(diào)節(jié)數(shù)據(jù)庫132 的每個記錄包括4個字段"成員Id"字段、"目標(biāo)得分"字段、"屬性得 分"字段和"更新時間"字段。
圖IO所示的"成員Id"字段存儲標(biāo)識用戶的信息,如參考圖2中的 操作日志數(shù)據(jù)庫22所說明的。
如圖IO所示,"目標(biāo)得分"字段和"屬性得分"字段存儲如下面所述 那樣獲得的信息。屬性權(quán)重調(diào)節(jié)引擎129檢查操作日志數(shù)據(jù)庫122上的每個記錄的"曰 志類型"字段中所存儲的信息。如前所述,操作日志數(shù)據(jù)庫122的記錄中 的"日志類型"字段存儲"保留"、"細(xì)節(jié)"、"好"…。"日志類型"字 段中所存儲的信息可以是根據(jù)預(yù)設(shè)方法將所述操作類型(諸如觀看項目或 記錄項目)轉(zhuǎn)換成的字符串。
屬性權(quán)重調(diào)節(jié)引擎129獲取要存儲在"日志類型"字段中的信息與預(yù) 置信息相同的記錄,作為用來生成屬性權(quán)重調(diào)節(jié)數(shù)據(jù)庫132的記錄的記 錄。用來生成屬性權(quán)重調(diào)節(jié)數(shù)據(jù)庫132的記錄的記錄是響應(yīng)于允許對涉及 目標(biāo)項目的用戶的評價進行估計的操作而生成的記錄。
例如,如果用戶,見看或記錄某個項目,那么,該項目就看來是受到了 用戶的正面評價。另一方面,如果用戶刪除了與某個項目相對應(yīng)的內(nèi)^lt 據(jù),那么該項目就看來是受到了用戶的負(fù)面評價。
操作日志數(shù)據(jù)庫122的每個記錄的"日志類型"字段中所存儲的信息 用按照預(yù)設(shè)方法所轉(zhuǎn)換成的字符串來表示,從而對涉;sj^作類型的用戶評 價進行估計。例如,用戶可以,見看或記錄某個項目。響應(yīng)于所述JMt所生 成的記錄的"日志類型"字段中所存儲的信息為"好"。例如,用戶可以 刪除某個項目的內(nèi)^lt據(jù)。響應(yīng)于所述IMt所生成的記錄的"日志類型" 字段中所存儲的信息為"壞"。
屬性權(quán)重調(diào)節(jié)引擎129獲取"日志類型"字段中所存儲的信息為"好" 或"壞"的記錄,作為用來生成屬性權(quán)重調(diào)節(jié)數(shù)據(jù)庫132的記錄的信息。
響應(yīng)于這樣獲取的記錄的"項目Id"字段的值,屬性權(quán)重調(diào)節(jié)引擎 129識別已用作IMt目標(biāo)的項目,并4吏推薦引擎126生成該項目的項目偏 好信息。如前所述,項目偏好信息是向量,其所包含的分量的數(shù)目與屬性 數(shù)目同樣多,它是基于內(nèi)容元數(shù)據(jù)庫123的記錄而生成的。響應(yīng)于這樣所 獲取的記錄的"成員Id"字段的值,屬性權(quán)重調(diào)節(jié)引擎129識別已執(zhí)行 所述操作的用戶,并基于用戶偏好數(shù)據(jù)庫125的記錄來生成所述用戶的用 戶偏好信息。
屬性權(quán)重調(diào)節(jié)引擎129使推薦引擎126對所述項目偏好信息和用戶偏 好信息執(zhí)行匹配過程。例如,執(zhí)行用方程(1)所表達(dá)的計算。屬性權(quán)重 調(diào)節(jié)引擎129從推薦引擎126獲得方程(1)中的IXa'Yal的值,作為屬性 "a"的相似度,并生成4^個屬性的相似度映射到屬性ID的信息。該信 息要被存儲到"屬性得分"字段中。在圖10中的第一條記錄的"屬性得分"字段中所描述的是 "&1={6265.430664}&6={9245.234375}&7={255.272858}...,,所述第一條
記錄的"屬性得分"字段的意思是屬性ID為"1"的屬性其相似度為 "6265.430664",屬性ID為"6"的屬性其相似度為"9245.234375",以
及屬性ID為"7"的屬性其相似度為"255.272858"。
基于"日志類型"字段中所存儲的信息而確定的相似度的目標(biāo)值被存 儲在"目標(biāo)得分"字段中。所W目似度的目標(biāo)值是項目偏好信息和用戶偏 好信息之間的目標(biāo)值,它對應(yīng)著方程(l)中的sim(X,Y)的值。例如,如 果用來生成屬性權(quán)重調(diào)節(jié)數(shù)據(jù)庫132的記錄的記錄的"日志類型"字段中 所存儲的信息為"好",那么,"100.0"就被存儲在"目標(biāo)得分"字段中。 如果用來生成屬性權(quán)重調(diào)節(jié)數(shù)據(jù)庫132的記錄的記錄的"日志類型"字段 中所存儲的信息為"壞",那么,"-100.0"就被存儲在"目標(biāo)得分"字段 中。預(yù)先確定與"好"相對應(yīng)的相似度的目標(biāo)值(這里為"100.0")和與 "壞"相對應(yīng)的相似度的目標(biāo)值(這里為"-100.0")。
識別記錄生成的日期和時間的信息^L存儲在圖10所示的"更新時間" 字段中。
以這種方法來生成屬性權(quán)重調(diào)節(jié)數(shù)據(jù)庫132的記錄。具體說,基于作 為要用來生成屬性權(quán)重調(diào)節(jié)數(shù)據(jù)庫132的記錄的記錄而獲取的記錄的數(shù) 目、操作日志數(shù)據(jù)庫122的記錄的輸出來確定要生成的屬性權(quán)重調(diào)節(jié)數(shù)據(jù) 庫132的記錄的數(shù)目。
屬性權(quán)重調(diào)節(jié)引擎129基于屬性權(quán)重調(diào)節(jié)數(shù)據(jù)庫132的記錄來調(diào)節(jié)每 個用戶的權(quán)重。通過多元回歸分析來進行所a重調(diào)節(jié),其中所述多元回 歸分析使用從屬性權(quán)重調(diào)節(jié)數(shù)據(jù)庫132的記錄的"目標(biāo)得分"字段獲得的 相似度的目標(biāo)值(下文中稱作目標(biāo)相似度)以及從屬性權(quán)重調(diào)節(jié)數(shù)據(jù)庫 132的記錄的"屬性得分"字段所獲得的每個屬性的相似度。
屬性權(quán)重調(diào)節(jié)引擎129執(zhí)行所述多元回歸分析,其中所述目標(biāo)相似度 為因變量,而每個屬性的相似度為說明變量(explanatory variable),這 樣,屬性權(quán)重調(diào)節(jié)引擎129就預(yù)測了每個屬性的權(quán)重的最佳值。
就這樣基于每個分量(屬性)確定了權(quán)重wa。例如,下面的線性方 程由圖IO所示的第一條記錄得出
100.0=6265.430664 x w"9245.234375 x w6+255.272858 x w7+...
下面的線性方程由圖IO所示的第二條記錄得出<formula>formula see original document page 25</formula>
上述線性方程基于屬性權(quán)重調(diào)節(jié)數(shù)據(jù)庫132的記錄中的成員ID為 "1"的記錄來產(chǎn)生。通過概括這些方程的左側(cè)和右側(cè)來產(chǎn)生行列式。利 用最小二乘法來確定解(Wh w6, w7,...)。這樣就進行了所述多元回歸分析。
利用(wb w6, w7,...)來表示所a重。如果屬性權(quán)重調(diào)節(jié)數(shù)據(jù)庫132
的記錄的數(shù)目足夠大,那么,也可以確定權(quán)重W2、 W3、 W4、 " 。 在獲得
了足夠大數(shù)目的記錄的情況下,用戶偏好數(shù)據(jù)庫125進行多元回歸分析, 其中所述目標(biāo)相似度為因變量,而每個屬性的相似度為說明變量。這樣, 屬性權(quán)重調(diào)節(jié)引擎129就確定了方程(1)的權(quán)重wa。例如,如果用戶偏 好信息的100個分量都存在,那么,通過所述多元回歸分析來計算 w2、 w3、…、w100。
屬性權(quán)重調(diào)節(jié)引擎129確定每個屬性的權(quán)重的最佳值。基于這樣確定 的權(quán)重來計算方程(l)以便確定所勤目似度。"日志類型"字段中所存儲 的信息為"好"的項目導(dǎo)致與項目偏好信息接近"100.0"的相似度。"日 志類型"字段中所存儲的信息為"壞"的項目導(dǎo)致與項目偏好信息接近 "-100.0"的相似度。具體說,用戶高度評價的項目的相似度變高,用戶 沒有高度評價的項目的相似度變低。
屬性權(quán)重調(diào)節(jié)引擎129在屬性權(quán)重數(shù)據(jù)庫131的記錄的"權(quán)重"字段 中存儲上述經(jīng)調(diào)節(jié)的每個權(quán)重值。這里,屬性權(quán)重數(shù)據(jù)庫131的記錄是逐 個屬性地生成的與用戶的成員ID相應(yīng)的記錄。
為了識別要推薦給用戶的項目,推薦引擎126使用屬性權(quán)重數(shù)據(jù)庫 131的記錄的"權(quán)重"字段中所存儲的值來計算用戶的用戶偏好信息和每 個項目的項目偏好信息之間的相似度。在相似度sim(X, Y)的計算中,使 用基于屬性權(quán)重數(shù)據(jù)庫131的記錄所識別的與每個用戶的屬性相應(yīng)的權(quán) 重的值作為方程(1)中的wa。
推薦引擎126從具有這樣計算出來的最高相似度的項目開始推薦預(yù) 定數(shù)目的項目。例如,推薦引擎126從高相似度到^^目似度識別預(yù)定數(shù)目 的項目,然后,生成由一列項目構(gòu)成的推薦列表。然后,推薦引擎126 將所述推薦列表發(fā)送到終端121。
這樣,推薦系統(tǒng)100向用戶推薦項目。由于重要的屬性因用戶而異, 如果基于是公共固定值的權(quán)重來計算所^目似度從而推薦項目,那么,不 一定能推薦出與用戶偏好真正匹配的項目。用戶偏好是非常抽象的概念,甚至用戶也難以表達(dá)其自己的偏好。此 夕卜,用戶或許不能容易地發(fā)現(xiàn)重要的屬性,并且用戶偏好可以隨時間而發(fā) 生變化。
根據(jù)本發(fā)明的一個實施例,基于所述操作日志數(shù)據(jù)庫來估計用戶對項
目的評價,并設(shè)置屬性權(quán)重調(diào)節(jié)數(shù)據(jù)庫132的記錄的目標(biāo)相似度?;谒?述目標(biāo)相似度和每個屬性的相似度來進行多元回歸分析。確定每個用戶的 屬性權(quán)重。自動設(shè)置對每個用戶最佳的權(quán)重。
下面參考圖11所示的流程圖來描述圖8所示的推薦系統(tǒng)100的屬性 權(quán)重調(diào)節(jié)數(shù)據(jù)庫生成過程。當(dāng)生成屬性權(quán)重調(diào)節(jié)數(shù)據(jù)庫132的記錄時就執(zhí) 行該過程。
在步驟S101中,屬性權(quán)重調(diào)節(jié)引擎129設(shè)置操作日志數(shù)據(jù)庫122的 分析范圍。所述分析范圍被設(shè)置為表示日期和時間的信息。所述分析范圍 內(nèi)的記錄是操作日志數(shù)據(jù)庫122的記錄中從指定日期和時間到當(dāng)前時間 的范圍內(nèi)的那些記錄。
在步驟S102中,屬性權(quán)重調(diào)節(jié)引擎129獲取在步驟S101中所設(shè)置 的分析范圍內(nèi)的記錄。基于操作日志數(shù)據(jù)庫122的記錄的"日志時間"字 段中所描述的信息來確定記錄是否在所述分析范圍內(nèi)。
在步驟S103中,屬性權(quán)重調(diào)節(jié)引擎129確定在步驟S102中所獲得 的記錄是否是具有預(yù)定日志類型的記錄。例如,屬性權(quán)重調(diào)節(jié)引擎129 確定記錄的"日志類型"字段中所存儲的信息是否是要用來生成屬性權(quán)重 調(diào)節(jié)數(shù)據(jù)庫132的記錄的預(yù)定類型。例如,"日志類型"字段中所存儲的 信息為"好"或"壞",處理過程前進到步驟S104。
在步驟S104中,屬性權(quán)重調(diào)節(jié)引擎129識別記錄的成員ID和項目ID。
在步驟S105中,屬性權(quán)重調(diào)節(jié)引擎129使推薦引擎126在與步驟S104 中所識別的成員ID相應(yīng)的用戶偏好信息和與所識別的項目ID相應(yīng)的項 目偏好信息之間執(zhí)行匹配過程。在這種情形中,計算方程(l)。在步驟 S105中,屬性權(quán)重調(diào)節(jié)引擎129從推薦引擎126中獲取方程(1)中的 |Xa Yal的值,作為屬性"a"的相似度,并生成#^個屬性的相似度映射 到屬性ID的信息。這樣就逐個屬性地計算了相似度。如前所述,##個 屬性的相似度映射到屬性ID的信息是屬性權(quán)重調(diào)節(jié)數(shù)據(jù)庫132的記錄的 "屬性得分"字段中所存儲的信息。
26在步驟S106中,屬性權(quán)重調(diào)節(jié)引擎129將步驟S105中所獲得的信 息映射到相似度的目標(biāo)值,從而生成如上參考圖IO所描述的屬性權(quán)重調(diào) 節(jié)數(shù)據(jù)庫132的記錄。然后,屬性權(quán)重調(diào)節(jié)引擎129將所述記錄寄存到屬 性權(quán)重調(diào)節(jié)數(shù)據(jù)庫132上。
如上所述,如果用來生成屬性權(quán)重調(diào)節(jié)數(shù)據(jù)庫132的記錄的記錄的 "日志類型"字段中所存儲的信息為"好",那么,所述目標(biāo)相似度就為 "100.0"。另夕卜,如果用來生成屬性權(quán)重調(diào)節(jié)數(shù)據(jù)庫132的記錄的記錄的 "日志類型"字段中所存儲的信息為"壞",那么,所述目標(biāo)相似度就為 "一 100.0"。
如果在步驟S103中確定在步驟S102中所獲得的記錄不是具有預(yù)定 日志類型的記錄,那么,就跳過步驟S104-S106。
在步驟S107中,確定是否檢查過所述分析范圍內(nèi)的所有記錄。如果 在步驟S107中確定在所述分析范圍內(nèi)并非所有的記錄都^^檢查過,那么, 處理返回步驟S102。
重復(fù)步驟S102-S107,直到在步驟S107中確定所述分析范圍內(nèi)的所 有記錄都已^fc檢查過為止。
這樣就執(zhí)行了屬性權(quán)重調(diào)節(jié)數(shù)據(jù)庫生成過程。
下面將參考圖12所示的流程圖來描述圖8所示的推薦系統(tǒng)100的屬 性權(quán)重計算過程。該過程是對終端121的每個用戶以預(yù)定的間隔重復(fù)地進 行的。具體說,首先對用戶A進行所述屬性權(quán)重計算過程,然后,在距 離第一定時預(yù)定天數(shù)之后的下一定時再次執(zhí)行所述過程。在距離所述第二 定時所述預(yù)定天數(shù)之后再次對用戶A執(zhí)行所述屬性權(quán)重計算過程,等等。
或者,所述屬性權(quán)重計算過程可以在用戶每次發(fā)布執(zhí)行命令時執(zhí)行。
在步驟S121中,屬性權(quán)重調(diào)節(jié)引擎129識別成員ID。在從現(xiàn)在起要 執(zhí)行的過程中,計算與步驟S121中所識別的成員ID相應(yīng)的用戶的屬性 的權(quán)重。
在步驟S122中,屬性權(quán)重調(diào)節(jié)引擎129在屬性權(quán)重調(diào)節(jié)數(shù)據(jù)庫132 上所存儲的記錄中檢查具有步驟S121中所識別的成員ID的記錄。
在步驟S123中,屬性權(quán)重調(diào)節(jié)引擎129確定在步驟S122中所檢查 的記錄的數(shù)目是否為N或大于N。這里,N為預(yù)定數(shù)目,它作為一個閾 值,根據(jù)這個閾值來確定存在足夠數(shù)目的記錄來執(zhí)行多元回歸分析。如果在步驟S123中確定為存在N個或更多的記錄,那么,處理過程 就前進到步驟S124.
在步驟S124中,屬性權(quán)重調(diào)節(jié)引擎129基于在步驟S122中所檢查 的屬性權(quán)重調(diào)節(jié)數(shù)據(jù)庫132的記錄來調(diào)節(jié)用戶的權(quán)重。所i^L重調(diào)節(jié)基于 屬性權(quán)重調(diào)節(jié)數(shù)據(jù)庫132的記錄的"目標(biāo)得分"字段中的目標(biāo)相似度和屬 性權(quán)重調(diào)節(jié)數(shù)據(jù)庫132的記錄的"屬性得分"字段中的每個屬性的相似度 通過多元回歸分析來進行。
在步驟S125中,屬性權(quán)重調(diào)節(jié)引擎129將步驟S124所產(chǎn)生的權(quán)重 識別為步驟S121中所識別的用戶的每個屬性的權(quán)重。
在步驟S126中,屬性權(quán)重調(diào)節(jié)引擎129更新屬性權(quán)重數(shù)據(jù)庫131以 反映在步驟S125中所識別的用戶的屬性權(quán)重。具體說,從圖9所示的屬 性權(quán)重數(shù)據(jù)庫131的記錄中獲取具有步驟S121中所識別的成員ID的記 錄,并且檢查這些記錄的"屬性Id"字段的值。在步驟S125中所識別的 用戶的屬性權(quán)重將"屬性Id"字段中的值表示該屬性的記錄的"權(quán)重" 字段中的值覆寫。屬性的數(shù)目等于用戶偏好信息的分量的數(shù)目。例如,如 果有100個用戶偏好信息分量,那么,屬性權(quán)重數(shù)據(jù)庫131的100個記錄 的"權(quán)重"字段的值就 _寫。
在步驟S126之后,屬性權(quán)重調(diào)節(jié)引擎129在步驟S127中執(zhí)行屬性 權(quán)重調(diào)節(jié)數(shù)據(jù)庫管理過程。在所述屬性權(quán)重調(diào)節(jié)數(shù)據(jù)庫管理過程中,不必 要的記錄被從屬性權(quán)重調(diào)節(jié)數(shù)據(jù)庫132中刪除。后面將參考圖13-15描述 所述屬性權(quán)重調(diào)節(jié)^t據(jù)庫管理過程的細(xì)節(jié)。
這樣就執(zhí)行了屬性權(quán)重計算過程。
根據(jù)本發(fā)明的一個實施例,基于每個用戶的操作日志數(shù)據(jù)庫來估計項 目的用戶評價,并設(shè)置屬性權(quán)重調(diào)節(jié)數(shù)據(jù)庫132的記錄的目標(biāo)相似度,如 前面參考圖ll所說明的。如前面參考圖12所說明的,使用所述目標(biāo)相似 度和每個屬性的相似度來進行多元回歸分析。這樣就確定了用戶的屬性權(quán) 重。自動設(shè)置對每個用戶最佳的權(quán)重。
下面將參考圖13的流程圖來描述圖12的步驟S127中的屬性權(quán)重調(diào) 節(jié)數(shù)據(jù)庫管理過程。
在步驟S141中,屬性權(quán)重調(diào)節(jié)引擎129在屬性權(quán)重調(diào)節(jié)lt據(jù)庫132 的記錄中檢查具有步驟S121中所識別的成員ID的每個記錄的數(shù)據(jù)和生 成時間。例如,屬性權(quán)重調(diào)節(jié)引擎129檢查識別圖IO所示的"更新時間"字段處的日期和時間的信息。
在步驟S142中,屬性權(quán)重調(diào)節(jié)引擎129按步驟S141中所檢查的生 成日期和時間的順序從舊到新來識別記錄的X。/。。在這種情形中,識別具 有步驟S121中所識別的成員ID的記錄的總數(shù)的X% (例如,50%)。 X 的值^1預(yù)定的。
在步驟S143中,屬性權(quán)重調(diào)節(jié)引擎129刪除在步驟S142中所識別 的屬性權(quán)重調(diào)節(jié)數(shù)據(jù)庫132的記錄。
這樣就執(zhí)行了屬性權(quán)重調(diào)節(jié)數(shù)據(jù)庫管理過程。通過刪除舊的記錄,能 夠調(diào)節(jié)用戶的每個屬性的權(quán)重,以響應(yīng)用戶偏好的變化。
屬性權(quán)重調(diào)節(jié)數(shù)據(jù)庫132中的記錄基于操作日志數(shù)據(jù)庫122的記錄來 生成。響應(yīng)于用戶在終端121上所進行的舊操作而生成的屬性權(quán)重調(diào)節(jié)數(shù) 據(jù)庫132的記錄具有舊的生成日期和時間。響應(yīng)于用戶在終端121上所進 行的新^作而生成的屬性權(quán)重調(diào)節(jié)數(shù)據(jù)庫132的記錄具有新的生成曰期 和時間。
用戶的操作在對用戶偏好的重要性上彼此不同。例如,用戶可以防止 給定內(nèi)容的數(shù)據(jù)被刪除,或者,可以將給定內(nèi)容寄存在"最愛"文件夾中。 這種操作可以被理解為用戶對內(nèi)容(項目)的正面評價,表明對該內(nèi)容的 強烈偏好。這種操作清楚地顯示了正面評價。
盡管用戶對給定內(nèi)容的數(shù)據(jù)進行再現(xiàn)和,贈表明了對該內(nèi)容(項目) 的正面評價,但這種操作不一定確保用戶對該內(nèi)容有強烈偏好。用戶可能 簡單地看一下所記錄內(nèi)容的數(shù)據(jù),只是為了檢查的目的。
因此,用戶的操作在對用戶偏好的重要性上是彼此不同的。如果不注 意用戶操作的類型就自動刪除了舊數(shù)據(jù),那么,可能就不能在認(rèn)識到用戶 偏好的情況下恰當(dāng)?shù)剡M行權(quán)重調(diào)節(jié)。
在圖12的步驟S127中的屬性權(quán)重調(diào)節(jié)數(shù)據(jù)庫管理過程中,也考慮操 作的類型。在圖12的步驟S127中的屬性權(quán)重調(diào)節(jié)數(shù)據(jù)庫管理過程中如下 述那樣考慮用戶操作的類型。
圖14示出屬性權(quán)重調(diào)節(jié)數(shù)據(jù)庫132的另一個例子。每行上的數(shù)據(jù)對 應(yīng)著屬性權(quán)重調(diào)節(jié)數(shù)據(jù)庫132的每個記錄,如前面參考圖10所說明的。 屬性權(quán)重調(diào)節(jié)數(shù)據(jù)庫132的每個記錄包括5個字段"成員Id"字段、"目 標(biāo)得分"字段、"屬性得分"字段、"更新時間"字段和"允許使用數(shù)"字 段。圖14中"成員Id"字段、"目標(biāo)得分"字段、"屬性得分"字段和"更 新時間"字段與圖10中的對應(yīng)字段相同,這里省略其說明。
圖14中的"允許使用數(shù)"字段存儲表示在屬性權(quán)重計算過程中記錄 可以使用多少次的數(shù)字值。所述"允許使用數(shù)"字段中所存儲的是在生成 記錄時響應(yīng)于由操作日志數(shù)據(jù)庫122的記錄標(biāo)識的操作類型來確定的值。
如果用戶進行清楚地表明用戶對項目的正面評價的操作,那么,操作 日志數(shù)據(jù)庫122中的記錄的"日志類型"字段中所存儲的信息為"好3"。 例如,如果用戶進行暗示出用戶對所述項目的正面評價的操作,那么,所 述"日志類型"字段中所存儲的信息可以為"好2"或"好1"。
如果用戶刪除了與某個項目相應(yīng)的內(nèi)容的數(shù)據(jù),或者如果用戶i^行清 楚地表明用戶的負(fù)面評價的操作,那么,所述"日志類型"字段中所存儲 的信息為"壞3"。如果用戶進行暗示出用戶的負(fù)面評價的操作,那么, 所述"日志類型"字段中所存儲的信息可以為"壞2"或"壞1"。
當(dāng)生成屬性權(quán)重調(diào)節(jié)數(shù)據(jù)庫132的記錄時,操作日志數(shù)據(jù)庫122的記 錄的"日志類型"字段中所存儲的信息可以為"好3"。在這種情形中,"3" 被存儲在"允許使用數(shù)"字段中。當(dāng)生成屬性權(quán)重調(diào)節(jié)數(shù)據(jù)庫132的記錄 時,操作日志數(shù)據(jù)庫122的記錄的"日志類型"字段中所存儲的信息可以 為"好2"或"好1"。在這種情形中,"2"或'T,被存儲在"允許使用 數(shù)"字段中。
當(dāng)生成屬性權(quán)重調(diào)節(jié)數(shù)據(jù)庫132的記錄時,操作日志數(shù)據(jù)庫122的記 錄的"日志類型"字段中所存儲的信息可以為"壞3"。在這種情形中,"3" 被存儲在"允許使用數(shù)"字段中。類似地,當(dāng)生成屬性權(quán)重調(diào)節(jié)數(shù)據(jù)庫 132的記錄時,操作日志數(shù)據(jù)庫122的記錄的"曰志類型"字段中所存儲 的信息可以為"壞2"或"壞1"。在這種情形中,"2"或"1"被存儲在 "允許使用數(shù)"字段中。
只為了i兌明的目的描述操作日志數(shù)據(jù)庫122的記錄的"日志類型"字 段中所存儲的信息"好3"、"好2"、"好1"、"壞3"、"壞2"和"壞1"。 實際存儲的信息可以是不同的。重要的是,"允許使用數(shù)"字段中所存儲 的值由操作類型來確定。
如果在屬性權(quán)重調(diào)節(jié)數(shù)據(jù)庫管理過程中考慮操作類型,那么,如圖 14所示來構(gòu)造屬性權(quán)重調(diào)節(jié)數(shù)據(jù)庫132。使用圖14所示的屬性權(quán)重調(diào)節(jié) 數(shù)據(jù)庫132來進行圖11和圖12所示的過程。下面參考圖15的流程圖來描述圖12的步驟S127中的屬性權(quán)重調(diào)節(jié) 數(shù)據(jù)庫管理過程的另一個例子。在所述屬性權(quán)重調(diào)節(jié)數(shù)據(jù)庫管理過程中, 考慮操作類型。
在步驟S161中,屬性權(quán)重調(diào)節(jié)引擎129在屬性權(quán)重調(diào)節(jié)數(shù)據(jù)庫132 的記錄中更新具有步驟121中所識別的成員ID的每個記錄的允許使用數(shù)。 例如,將具有步驟S121中所識別的成員ID的所有記錄的每個記錄的如 圖14所示的"允許使用數(shù)"字段中所存儲的值減少"1"。
在步驟S162中,屬性權(quán)重調(diào)節(jié)引擎129識別在步驟S161中所更新 的允許使用數(shù)為"0"的記錄。例如,在圖14的第三行中的記錄,其當(dāng)前 的允許使用數(shù)為值"2",而在步驟S161中所進行的更新使所述允許使用 數(shù)的值成為"1"。例如,在圖14所示的第四行中的記錄,其當(dāng)前的允許 使用數(shù)為值"3",而在步驟S161中所進行的更新使所述允許使用數(shù)的值 成為"2"。
在第二、第五和第六行的記錄,其當(dāng)前的允許使用數(shù)為值"1",而在 步驟S161中所進行的更新使所述允許使用數(shù)的值成為"0"。在步驟S162 中,所述第二、第五和第六行的記錄被識別為具有允許使用數(shù)"0"。
在步驟S163中,屬性權(quán)重調(diào)節(jié)引擎129刪除在步驟S162中所識別 的允許使用數(shù)為"0"的記錄。
這樣就執(zhí)行了屬性權(quán)重調(diào)節(jié)數(shù)據(jù)庫管理過程。由于是否刪除記錄M 于響應(yīng)于操作類型而確定的允許使用數(shù)的值來確定的,所以,在屬性權(quán)重
調(diào)節(jié)數(shù)據(jù)庫管理過程中考慮^Mt類型。這樣就構(gòu)造出恰當(dāng)?shù)胤从沉擞脩羝?好的屬性權(quán)重調(diào)節(jié)數(shù)據(jù)庫132。恰當(dāng)?shù)貙τ脩舻拿總€屬性的權(quán)重進行了調(diào)節(jié)。
上述一系列過程步驟可以使用硬件或軟件來執(zhí)行。如果該一系列過程
步驟使用軟件來執(zhí)行,那么,可以從記錄^h質(zhì)或經(jīng)由網(wǎng)絡(luò)將形成所述軟件
的程序安裝到包含在特定硬件中的計算機上,或安裝在諸如圖16所示的 安裝有各種程序、能夠執(zhí)行各種功能的通用個人計算機700的計算機上。
圖16中的中央處理單元(CPU) 701在只讀存儲器(ROM) 702上 所存儲的程序或在從存儲單元708加載到隨M取存儲器(RAM) 703 的程序的控制下執(zhí)行各種處理。RAM 703也存儲CPU 701在執(zhí)行所述過 程時所使用的數(shù)據(jù)。
CPU 701、 ROM 702和RAM 703經(jīng)由總線704彼此互聯(lián)。輸入-輸200
出接口 705連接到總線704。
輸入-輸出接口 705還連接到包括M、鼠標(biāo)等的輸入單元706,包 括諸如陰極射線管(CRT)或液晶顯示器(LCD)的顯示器、揚聲器等 的輸出單元707,包括硬盤等的存儲單元708,包括諸如調(diào)制解調(diào)器或LAN 卡等網(wǎng)絡(luò)接口的通信單元709。通信單元709經(jīng)由包括因特網(wǎng)的網(wǎng),行 通信過程。
需要的話,將驅(qū)動器710連接到輸入-輸出接口 705??梢苿咏橘|(zhì)711 (諸如磁盤、光盤、磁光盤或半導(dǎo)*儲器)被恰當(dāng)?shù)丶虞d到驅(qū)動器710 上。從可移動介質(zhì)711讀取的計算M序被安裝在存儲單元708上。
如果上述過程步驟使用軟件來執(zhí)行,那么,所述軟件的計算;^序從 諸如因特網(wǎng)的網(wǎng)絡(luò)或從諸如可移動介質(zhì)711的記錄介質(zhì)進行安裝。
所述記錄介質(zhì)包括加載了程序的可移動介質(zhì)711,該介質(zhì)與圖16所 示的計算機分開提供,以將計算M序分發(fā)給用戶??梢苿咏橘|(zhì)711可以 是磁盤(諸如軟盤(注冊商標(biāo)))、光盤(諸如致密盤只讀存儲器 (CD-ROM)、或數(shù)字通用盤(DVD))、磁光盤(MD (Mini盤)(注冊 商標(biāo)))以及半導(dǎo)體存儲器之一。所述記錄介質(zhì)也包括ROM 702以及存 儲單元708中所包含的^it,這些記錄介質(zhì)中每種介質(zhì)都被置于所述計算 機中并在其上存儲有所述計算M序。
所述計算機程序可以按本說明書中所描述的過程步驟的時間順序來 執(zhí)行,也可以并行執(zhí)行,或以任啊時序來執(zhí)行。
本申請包含了與2008年9月8日在日本專利局提交的日本優(yōu)先權(quán)專 利申請JP2008-229313中所公開的主題相關(guān)的主題,其全部內(nèi)容通過引用 包含于此。
本領(lǐng)域技術(shù)人員應(yīng)該理解可以依據(jù)設(shè)計要求和其它因素進行各種變 型、結(jié)合、子結(jié)合和改變,只要它們在所附權(quán)利要求書或其等同物得范圍 內(nèi)即可。
權(quán)利要求
1.一種推薦設(shè)備,包括調(diào)節(jié)信息存儲裝置,用于生成并存儲調(diào)節(jié)信息,所述調(diào)節(jié)信息把通過將用戶偏好信息中的分量與項目偏好信息中的分量之間的分量相似度乘上權(quán)重系數(shù)而得到的值映射到響應(yīng)于用戶對項目進行的操作的類型而確定的評價值的目標(biāo),所述用戶偏好信息表示所述用戶的偏好,并且被構(gòu)造成包含多個分量的向量,所述項目偏好信息基于作為推薦目標(biāo)的每個項目的元信息而生成,并且包含數(shù)目與所述用戶偏好信息的分量數(shù)目相同的分量;多元回歸分析裝置,用于基于多個調(diào)節(jié)信息通過多元回歸分析逐個用戶地計算每個權(quán)重系數(shù),所述用戶偏好信息的每個分量都乘上各自的權(quán)重系數(shù);權(quán)重系數(shù)存儲裝置,用于逐個用戶地存儲所計算的權(quán)重系數(shù),在所述評價值的計算中,所述用戶偏好信息的每個分量都乘上各自的計算出的權(quán)重系數(shù);以及推薦項目識別裝置,用于基于所述用戶偏好信息和所述項目偏好信息的每個分量以及基于與所述分量相應(yīng)的所述權(quán)重系數(shù)計算出的評價值來識別要向所述用戶推薦的項目。
2. 根據(jù)權(quán)利要求1所述的推薦設(shè)備,其中,在預(yù)定時間段內(nèi)生成的 調(diào)節(jié)信息作為所述多元回歸分析的目標(biāo)。
3. 根據(jù)權(quán)利要求2所述的推薦設(shè)備,其中,在每個預(yù)定的周期生成 并存儲所述調(diào)節(jié)信息,其中,逐個用戶地計算所a重系數(shù),并且逐個用 戶*儲計算出的權(quán)重系數(shù),在所述評價值的計算中,所述用戶偏好信息 的每個分量都乘上各自的計算出的權(quán)重系數(shù)。
4. 根據(jù)權(quán)利要求1所述的推薦設(shè)備,還包括調(diào)節(jié)信息刪除裝置,用 于刪除在所述多元回歸分析中使用的所述調(diào)節(jié)信息。
5. 根據(jù)權(quán)利要求4所述的推薦設(shè)備,其中,所述調(diào)節(jié)信息刪除裝置 按照從舊到新的生成順序刪除預(yù)定百分比的調(diào)節(jié)信息。
6. 根據(jù)權(quán)利要求4所述的推薦設(shè)備,其中,所述調(diào)節(jié)信息包括由所 述用戶操作的類型所確定的4吏用數(shù),以及所述調(diào)節(jié)信息刪除裝置刪除在所述多元回歸分析中使用了所述使用數(shù)的所述調(diào)節(jié)信息。
7. —種推薦方法,包括步驟生成并存儲調(diào)節(jié)信息,所述調(diào)節(jié)信息把通過將用戶偏好信息中的分量 與項目偏好信息中的分量之間的分量相似度乘上權(quán)重系數(shù)而得到的值映 射到響應(yīng)于用戶對項目進行的^作的類型而確定的評價值的目標(biāo),所述用 戶偏好信息表示所述用戶的偏好,并且被構(gòu)造成包含多個分量的向量,所 述項目偏好信息基于作為推薦目標(biāo)的每個項目的元信息而生成,并且包含 數(shù)目與所述用戶偏好信息的分量數(shù)目相同的分量;基于多個調(diào)節(jié)信息通過多元回歸分析逐個用戶地計算每個權(quán)重系數(shù), 所述用戶偏好信息的每個分量都乘上各自的權(quán)重系數(shù);逐個用戶M儲所計算出的權(quán)重系數(shù),在所述評價值的計算中,所述 用戶偏好信息的每個分量都乘上各自的計算出的權(quán)重系數(shù);以及基于所述用戶偏好信息和所述項目偏好信息的每個分量以及基于與 所述分量相應(yīng)的所述權(quán)重系數(shù)計算出的所述評價值來識別要向所述用戶 推薦的項目。
8. —種計算M序,用于使計算機執(zhí)行步驟生成并存儲調(diào)節(jié)信息,所述調(diào)節(jié)信息把通過將用戶偏好信息中的分量 與項目偏好信息中的分量之間的分量相似度乘上權(quán)重系數(shù)而得到的值映 射到響應(yīng)于用戶對項目進行的^Mt的類型而確定的評價值的目標(biāo),所述用 戶偏好信息表示所述用戶的偏好,并且被構(gòu)造成包含多個分量的向量,所 述項目偏好信息基于作為推薦目標(biāo)的每個項目的元信息而生成,并且包含 數(shù)目與所述用戶偏好信息的分量數(shù)目相同的分量;基于多個調(diào)節(jié)信息通過多元回歸分析逐個用戶地計算每個權(quán)重系數(shù), 所述用戶偏好信息的每個分量都乘上各自的權(quán)重系數(shù);逐個用戶地存儲所計算出的權(quán)重系數(shù),在所述評價值的計算中,所述 用戶偏好信息的每個分量都乘上各自的計算出的權(quán)重系數(shù);以及基于所述用戶偏好信息和所述項目偏好信息的每個分量以及基于與 所述分量相應(yīng)的所述權(quán)重系數(shù)計算出的所述評價值來識別要向所述用戶 推薦的項目。
9. 一種記錄介質(zhì),存儲根據(jù)權(quán)利要求8所述的計算機程序。
10. —種推薦i殳備,包括調(diào)節(jié)信息存儲單元,其生成并存儲調(diào)節(jié)信息,所述調(diào)節(jié)信息把通過將 用戶偏好信息中的分量與項目偏好信息中的分量之間的分量相似度乘上的評價值的目標(biāo),所述用戶偏好信息表示所述用戶的偏好,并且被構(gòu)造成 包含多個分量的向量,所述項目偏好信息基于作為推薦目標(biāo)的每個項目的 元信息而生成,并且包含與所述用戶偏好信息的分量數(shù)目相同數(shù)目的分量;多元回歸分析單元,其基于多個調(diào)節(jié)信息通過多元回歸分析逐個用戶 地計算每個權(quán)重系數(shù),所述用戶偏好信息的每個分量都乘上各自的權(quán)重系數(shù);權(quán)重系數(shù)存儲單元,其逐個用戶地存儲所計算的權(quán)重系數(shù),在所述評 價值的計算中,所述用戶偏好信息的每個分量都乘上各自的計算出的權(quán)重 系數(shù);以及推薦項目識別單元,其基于所述用戶偏好信息和所述項目偏好信息的 每個分量以及基于與所述分量相應(yīng)的所述權(quán)重系數(shù)計算出的評價值來識 別要向所述用戶推薦的項目。
全文摘要
一種用于內(nèi)容推薦的設(shè)備、方法和計算機程序以及記錄介質(zhì)。屬性權(quán)重調(diào)節(jié)引擎根據(jù)屬性權(quán)重調(diào)節(jié)數(shù)據(jù)庫的記錄中的具有所識別的成員ID的記錄來調(diào)節(jié)用戶的權(quán)重。基于所述屬性權(quán)重調(diào)節(jié)數(shù)據(jù)庫的記錄所產(chǎn)生的目標(biāo)相似度和所述屬性權(quán)重調(diào)節(jié)數(shù)據(jù)庫的每個屬性的相似度通過多元回歸分析來進行所述權(quán)重調(diào)節(jié)。所得到的權(quán)重被識別為所識別的用戶的每個屬性的權(quán)重。為了反映所述用戶的每個屬性的權(quán)重,更新屬性權(quán)重數(shù)據(jù)庫,并從所述屬性權(quán)重調(diào)節(jié)數(shù)據(jù)庫中刪除不想要的記錄。
文檔編號G06F17/30GK101674458SQ20091017179
公開日2010年3月17日 申請日期2009年9月8日 優(yōu)先權(quán)日2008年9月8日
發(fā)明者上前田直樹, 增田弘之, 萩原丈博 申請人:索尼株式會社
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
呼伦贝尔市| 株洲市| 西丰县| 介休市| 元氏县| 新化县| 陵川县| 江油市| 莎车县| 始兴县| 咸阳市| 饶平县| 宁阳县| 遂川县| 杭锦旗| 丰宁| 特克斯县| 松溪县| 望都县| 漳浦县| 淅川县| 昌乐县| 温泉县| 西青区| 兰溪市| 沅陵县| 金堂县| 高雄市| 仁寿县| 册亨县| 湄潭县| 中方县| 新闻| 巫山县| 南投县| 祁阳县| 安龙县| 安岳县| 青海省| 巴彦淖尔市| 遂平县|