專(zhuān)利名稱(chēng)::基于屬性描述的個(gè)性化影片推薦系統(tǒng)及方法
技術(shù)領(lǐng)域:
:本發(fā)明涉及網(wǎng)絡(luò)媒體服務(wù)領(lǐng)域,特別涉及一種影片個(gè)性化推薦系統(tǒng)及方法。
背景技術(shù):
:隨著計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)和視頻壓縮技術(shù)的發(fā)展,視頻應(yīng)用得到了廣泛的應(yīng)用。視頻業(yè)務(wù)的發(fā)展來(lái)源于豐富視頻內(nèi)容的推動(dòng),也勢(shì)必會(huì)引起視頻數(shù)量的增加和內(nèi)容的多樣化。針對(duì)個(gè)人用戶(hù),豐富的影片內(nèi)容一方面增加了用戶(hù)的選擇,另一方面卻加大了用戶(hù)觀(guān)看影片選擇的難度。通常情況下,不同的人具有各自的興趣范圍,每個(gè)人的選擇標(biāo)準(zhǔn)和方式不同,而且隨著觀(guān)看內(nèi)容和時(shí)間的推移這種興趣也會(huì)發(fā)生變化。因此,現(xiàn)代視頻業(yè)務(wù)除了提供豐富的視頻內(nèi)容外,還應(yīng)針對(duì)個(gè)人實(shí)現(xiàn)個(gè)性化的信息提取服務(wù),從而智能化地幫助用戶(hù)進(jìn)行選擇。在輔助用戶(hù)選擇影片上,大多數(shù)已有的業(yè)務(wù)系統(tǒng)提供了"收藏"功能,但它只能對(duì)用戶(hù)已經(jīng)確定感興趣的影片進(jìn)行收藏,然后再必要時(shí)進(jìn)行快速檢索,而無(wú)法判斷用戶(hù)對(duì)新影片的感興趣程度。另一種手段是現(xiàn)在網(wǎng)絡(luò)上使用的"搜索,,功能,它根據(jù)用戶(hù)提供的關(guān)鍵詞進(jìn)行相關(guān)性匹配,檢索出用戶(hù)可能比較感興趣的內(nèi)容,然而,這種方式需要用戶(hù)自己提供關(guān)鍵詞,需要很多的經(jīng)驗(yàn)和技巧,不能自動(dòng)定位用戶(hù)的興趣焦點(diǎn)。信息檢索技術(shù)滿(mǎn)足了人們一定的需要,但由于其通用的性質(zhì),仍不能滿(mǎn)足不同背景、不同目的和不同時(shí)期的查詢(xún)請(qǐng)求。個(gè)性化服務(wù)技術(shù)就是針對(duì)這個(gè)問(wèn)題而提出的,它通過(guò)收集和分析用戶(hù)信息來(lái)學(xué)習(xí)用戶(hù)的興趣和行為,從而實(shí)現(xiàn)主動(dòng)推薦的目的,吸引更多的訪(fǎng)問(wèn)者。針對(duì)影片觀(guān)看,用戶(hù)的興趣偏好在平時(shí)的觀(guān)看行為上已經(jīng)有所體現(xiàn),通過(guò)挖掘這種用戶(hù)行為就能夠自動(dòng)挖取用戶(hù)的潛在興趣點(diǎn)并判斷用戶(hù)是否對(duì)新影片內(nèi)容感興趣,從而完成影片的個(gè)性化推薦。現(xiàn)有的個(gè)性化推薦方法,根據(jù)其所采用的推薦技術(shù)可分為兩種基于規(guī)則的系統(tǒng)和信息過(guò)濾系統(tǒng),其中的信息過(guò)濾系統(tǒng)又可分為基于內(nèi)容過(guò)濾的系統(tǒng)和協(xié)作過(guò)濾系統(tǒng)?;谝?guī)則的系統(tǒng)具有簡(jiǎn)單、直接的優(yōu)點(diǎn),但規(guī)則質(zhì)量很難保證,且不能動(dòng)態(tài)更新,此外,隨著規(guī)則的數(shù)量增多,系統(tǒng)將變得越來(lái)越難管理。協(xié)作過(guò)濾系統(tǒng)利用用戶(hù)之間的相似性來(lái)過(guò)濾信息,它能夠?yàn)橛脩?hù)發(fā)現(xiàn)新的感興趣的信息,但存在稀疏性和擴(kuò)展性方面的問(wèn)題。在系統(tǒng)使用初期,由于系統(tǒng)資源還未獲得足夠多的評(píng)價(jià),系統(tǒng)很難利用這些評(píng)價(jià)來(lái)發(fā)現(xiàn)相似的用戶(hù),此外,隨著系統(tǒng)用戶(hù)和資源的增多,系統(tǒng)的性能會(huì)越來(lái)越低。在家庭網(wǎng)絡(luò)媒體服務(wù)應(yīng)用中,可以看作只有單個(gè)用戶(hù)觀(guān)看影片并使用個(gè)性化推薦,協(xié)作過(guò)濾系統(tǒng)無(wú)法正常工作,因此,一種更好的方式是采用基于內(nèi)容過(guò)濾的方式進(jìn)行推薦,它利用影片資源與用戶(hù)興趣的相似性來(lái)過(guò)濾信息,能夠簡(jiǎn)單、有效地完成影片內(nèi)容的推薦。在基于影片內(nèi)容的推薦方法中,關(guān)鍵字匹配方法的推薦結(jié)果準(zhǔn)確度不高,無(wú)法感知用戶(hù)興趣熱點(diǎn);采用本體論描述方法因視頻語(yǔ)義信息量大、結(jié)構(gòu)復(fù)雜,目前尚無(wú)確定的抽象描述形式,很難提取影片特征。因此,需要一種方法解決上述問(wèn)題。
發(fā)明內(nèi)容本發(fā)明的目的旨在至少解決上述技術(shù)缺陷之一,特別是解決個(gè)人用戶(hù)難以從大量的影片內(nèi)容中選擇真正感興趣的影片的缺陷。為達(dá)到上述目的,本發(fā)明一方面提出一種基于屬性描述的個(gè)性化影片推薦系統(tǒng),包括候選影片數(shù)據(jù)庫(kù)、觀(guān)看記錄數(shù)據(jù)庫(kù)、用戶(hù)興趣偏好模型計(jì)算模塊和影片推薦模塊。所述候選影片數(shù)據(jù)庫(kù),用于存儲(chǔ)完整影片屬性描述信息;所述觀(guān)看記錄數(shù)據(jù)庫(kù),用于存儲(chǔ)用戶(hù)觀(guān)看影片信息記錄;所述用戶(hù)興趣偏好模型計(jì)算模塊,用于根據(jù)所述用戶(hù)觀(guān)看影片信息記錄計(jì)算用戶(hù)興趣偏好模型;所述影片推薦模塊,用于根據(jù)所述用戶(hù)興趣偏好模型對(duì)所述候選影片數(shù)據(jù)庫(kù)中還未觀(guān)看的新影片進(jìn)行打分,獲取標(biāo)量推薦分值并排序,推薦前N部所述推薦分值最大的影片。作為本發(fā)明的一個(gè)實(shí)施例,所述候選影片數(shù)據(jù)庫(kù)中的存儲(chǔ)內(nèi)容包括曾經(jīng)看過(guò)的舊影片信息和沒(méi)有觀(guān)看過(guò)的新影片信息,其中,影片屬性描述信息包括影片標(biāo)識(shí)、題材類(lèi)型、主演、導(dǎo)演、制片人、出品年份、出品公司、國(guó)家地區(qū)、背景、獲獎(jiǎng)記錄、語(yǔ)言類(lèi)型和影片時(shí)長(zhǎng)。這些類(lèi)別屬性可看作影片不同層次的描述,構(gòu)成完整影片描述信息的分層結(jié)構(gòu),即影片模型。針對(duì)每個(gè)類(lèi)別層次,可包括0個(gè)、l個(gè)或多個(gè)(屬性,屬性值)對(duì)。作為本發(fā)明的一個(gè)實(shí)施例,所述觀(guān)看記錄數(shù)據(jù)庫(kù)中的每條記錄包括影片標(biāo)識(shí)、觀(guān)看日期、觀(guān)看時(shí)的操作及其對(duì)應(yīng)的時(shí)間和個(gè)人評(píng)價(jià)打分等觀(guān)看動(dòng)態(tài)信息。作為發(fā)明的一個(gè)實(shí)施例,所述用戶(hù)興趣偏好模型在用戶(hù)請(qǐng)求影片推薦時(shí)實(shí)時(shí)建立,包括以下步驟根據(jù)請(qǐng)求的用戶(hù)標(biāo)識(shí)從所述觀(guān)看記錄數(shù)據(jù)庫(kù)中提取所述用戶(hù)在指定時(shí)間窗口內(nèi)的所有所述用戶(hù)觀(guān)看影片信息記錄,并根據(jù)記錄中的所述影片標(biāo)識(shí)從所述候選影片數(shù)據(jù)庫(kù)中檢索出觀(guān)看影片的所述完整影片描述信息;將所述完整影片描述信息依據(jù)影片權(quán)值進(jìn)行線(xiàn)性疊加,獲得用戶(hù)歷史疊加模型;針對(duì)所述用戶(hù)歷史疊加模型中的每個(gè)層次,根據(jù)各個(gè)所述影片屬性的屬性值大小計(jì)算該層的集中度參數(shù),作為該層在所述用戶(hù)興趣偏好模型中的權(quán)值,即層次權(quán)值;根據(jù)設(shè)定的閾值把所述層次權(quán)值小的層次和各層次中所述屬性值小的屬性過(guò)濾掉,獲取剪裁后的用戶(hù)興趣偏好模型。作為本發(fā)明的一個(gè)實(shí)施例,所述影片推薦模塊采用所述影片模型與所述用戶(hù)興趣偏好模型的模型匹配算法進(jìn)行打分,包括以下步驟針對(duì)所述用戶(hù)興趣偏好模型中的每層,獲取所述影片模型中對(duì)應(yīng)層次所有屬性的屬性值,將所述影片模型和用戶(hù)興趣偏好模型中該層次具有相同屬性的屬性值相乘,再將相乘后的屬性值直接線(xiàn)性相加,獲得層次匹配分值;針對(duì)所獲得所述影片標(biāo)量推薦分值。作為本發(fā)明的一個(gè)實(shí)施例,所述基于屬性描述的個(gè)性化影片推薦系統(tǒng),還包括影片信息收集接口、用戶(hù)觀(guān)看影片信息記錄收集接口和請(qǐng)求推薦接口。所述影片收集接口,用于向所述候選影片數(shù)據(jù)庫(kù)中添加具有完整屬性描述的影片記錄,由所述候選影片數(shù)據(jù)庫(kù)直接對(duì)外提供,接口參數(shù)為影片的所有屬性描述信息;所述用戶(hù)觀(guān)看影片信息記錄收集接口,用于當(dāng)用戶(hù)觀(guān)看完一個(gè)影片時(shí)自動(dòng)向所述推薦系統(tǒng)提交此次觀(guān)看的記錄信息,由所述觀(guān)看記錄數(shù)據(jù)庫(kù)直接對(duì)外提供,接口參數(shù)為用戶(hù)觀(guān)看影片的動(dòng)態(tài)信息;所述請(qǐng)求推薦接口,用于接收用戶(hù)的影片推薦請(qǐng)求,所述影片推薦請(qǐng)求包括用戶(hù)標(biāo)識(shí)和請(qǐng)求推薦時(shí)間參數(shù),接收完成后返回由影片標(biāo)識(shí)和影片名稱(chēng)構(gòu)成的推薦結(jié)果列表,由所述影片推薦模塊直接對(duì)外提供。本發(fā)明另一方面還提出一種基于屬性描述的個(gè)性化影片推薦方法,包括以下步驟根據(jù)用戶(hù)標(biāo)識(shí)從所述觀(guān)看記錄數(shù)據(jù)庫(kù)中獲取指定窗口長(zhǎng)度的用戶(hù)觀(guān)看影片信息記錄;從所述候選影片數(shù)據(jù)庫(kù)中獲取全部觀(guān)看影片模型,即完整影片描述信息;計(jì)算用戶(hù)興趣偏好模型;依次從候選影片數(shù)據(jù)庫(kù)中獲取各影片的完整影片描述信息;根據(jù)推薦算法計(jì)算所述影片模型與用戶(hù)興趣偏好模型的匹配標(biāo)量推薦分值;根據(jù)所述標(biāo)量推薦分值排列影片順序,并提供前N部影片的信息用于推薦。本發(fā)明采用屬性描述代表影片特征并按類(lèi)型進(jìn)行分層,通過(guò)分析不同層次的集中度聚焦用戶(hù)興趣熱點(diǎn),并采用時(shí)間遺忘因子和影片模型的線(xiàn)性疊加方法跟蹤用戶(hù)興趣變化,實(shí)時(shí)響應(yīng)用戶(hù)對(duì)影片的反饋,調(diào)整用戶(hù)興趣偏好模型,提高了影片推薦的準(zhǔn)確度和適應(yīng)性。本發(fā)明附加方面的方面和優(yōu)點(diǎn)將在下面的描述中部分給出,部分將從下面的描述中變得明顯,或通過(guò)本發(fā)明的實(shí)踐了解到。本發(fā)明上述的和/或附加的方面和優(yōu)點(diǎn)從下面結(jié)合附圖對(duì)實(shí)施例的描述中將變得明顯和容易理解,其中圖1為本發(fā)明實(shí)施例的基于屬性描述的個(gè)性化影片推薦系統(tǒng)的結(jié)構(gòu)示意圖2為本發(fā)明實(shí)施例的影片模型的層次說(shuō)明圖3為本發(fā)明實(shí)施例的用戶(hù)興趣偏好模型的建立流程圖4為本發(fā)明實(shí)施例的影片模型轉(zhuǎn)換到用戶(hù)興趣偏好模型的原理示意具體實(shí)施例方式下面詳細(xì)描述本發(fā)明的實(shí)施例,所述實(shí)施例的示例在附圖中示出,其中自始至終相同或類(lèi)似的標(biāo)號(hào)表示相同或類(lèi)似的元件或具有相同或類(lèi)似功能的元件。下面通過(guò)參考附圖描述的實(shí)施例是示例性的,僅用于解釋本發(fā)明,而不能解釋為對(duì)本發(fā)明的限制。本發(fā)明主要在于采用屬性描述代表影片特征并按類(lèi)型進(jìn)行分層,通過(guò)分析不同層次的集中度聚焦用戶(hù)興趣熱點(diǎn),并采用時(shí)間遺忘因子和影片模型的線(xiàn)性疊加方法跟蹤用戶(hù)興趣變化,實(shí)時(shí)響應(yīng)用戶(hù)對(duì)影片的反饋,調(diào)整用戶(hù)興趣偏好模型,提高影片推薦的準(zhǔn)確度和適應(yīng)性。如圖1所示為本發(fā)明實(shí)施例的基于屬性描述的個(gè)性化影片推薦系統(tǒng)的結(jié)構(gòu)圖,包括候選影片數(shù)據(jù)庫(kù)110、觀(guān)看記錄數(shù)據(jù)庫(kù)120、用戶(hù)興趣偏好模型計(jì)算模塊130和影片推薦模塊140。其中,候選影片數(shù)據(jù)庫(kù)110將存儲(chǔ)的影片詳細(xì)信息輸入到用戶(hù)興趣偏好模型計(jì)算模塊130,觀(guān)看記錄數(shù)據(jù)庫(kù)120將存儲(chǔ)的用戶(hù)觀(guān)看影片信息記錄輸入到用戶(hù)興趣偏好模型計(jì)算模塊130,用戶(hù)興趣偏好模型計(jì)算模塊130根據(jù)輸入的個(gè)人的用戶(hù)觀(guān)看影片信息記錄和記錄中相應(yīng)影片在候選影片數(shù)據(jù)庫(kù)110中的完整影片屬性描述信息計(jì)算個(gè)人用戶(hù)興趣偏好模型,然后輸入到影片推薦模塊140,影片推薦模塊140根據(jù)計(jì)算所得的用戶(hù)興趣偏好模型和候選影片數(shù)據(jù)庫(kù)IIO輸入的影片記錄進(jìn)行興趣排名,并推薦前N部影片。作為本發(fā)明的一個(gè)實(shí)施例,候選影片數(shù)據(jù)庫(kù)110中存儲(chǔ)了所有影片的屬性描述信息,包括用戶(hù)觀(guān)看過(guò)的影片、沒(méi)有觀(guān)看過(guò)的影片和新收集的影片信息。針對(duì)每個(gè)影片,存儲(chǔ)一條記錄,用影片ID標(biāo)識(shí)進(jìn)行標(biāo)注?,F(xiàn)在的影片內(nèi)容主要包括視頻內(nèi)容和音頻內(nèi)容,視頻內(nèi)容可用內(nèi)部特征和/或外部特征描述,其中內(nèi)部特征代表視頻圖像表達(dá)的內(nèi)容,如圖像紋理、清晰度和圖像對(duì)象等,外部特征代表影片本身的屬性,包括客觀(guān)屬性如導(dǎo)演、演員等和主觀(guān)屬性如題材類(lèi)型、主題等。在本發(fā)明實(shí)施例中,采用視頻內(nèi)容的外部特征描述方式建立影片描述,即基于屬性描述的影片模型。作為本發(fā)明的一個(gè)實(shí)施例,影片模型包括多個(gè)屬性類(lèi)型,如影片標(biāo)識(shí)、ii題材類(lèi)型、主演、導(dǎo)演、制片人、出品年份、出品公司、國(guó)家地區(qū)、背景、獲獎(jiǎng)記錄、語(yǔ)言類(lèi)型和影片時(shí)長(zhǎng)等,其中影片標(biāo)識(shí)為由推薦系統(tǒng)自動(dòng)計(jì)算的唯一的影片索引值。每個(gè)屬性類(lèi)型還可包括多個(gè)不同的屬性及其屬性值,其中屬性值代表該屬性在該類(lèi)型中的比例。如圖2所示為本發(fā)明實(shí)施例的個(gè)性化影片推薦系統(tǒng)針對(duì)單個(gè)影片的分層影片模型,其中每個(gè)屬性類(lèi)型是一個(gè)層次,每個(gè)層次有1個(gè)或多個(gè)(屬性,屬性值)對(duì)。如果影片某個(gè)屬性層次沒(méi)有任何屬性,也可不包含任何屬性,即有0個(gè)(屬性,屬性值)對(duì),系統(tǒng)處理時(shí)刻直接跳過(guò)該屬性層次。作為本發(fā)明的一個(gè)實(shí)施例,以下表中的《霸王別姬》影片為例,描述影片的屬性層次構(gòu)成。<table>tableseeoriginaldocumentpage12</column></row><table>其中,每個(gè)屬性層次中的屬性具有對(duì)應(yīng)的屬性值。所有的屬性值都在范圍內(nèi),通常情況下可由專(zhuān)家系統(tǒng)打分。在本發(fā)明實(shí)施例中,為了反映影片屬性對(duì)個(gè)人用戶(hù)興趣的表達(dá),屬性值可由用戶(hù)打分評(píng)定,也可根據(jù)不同屬性的排名由系統(tǒng)按照默認(rèn)策略打分。下表為《霸王別姬》影片"題材類(lèi)型"屬性層次中的所有(屬性,屬性值)對(duì)。<table>tableseeoriginaldocumentpage12</column></row><table>如表中所示,《霸王別姬》的類(lèi)型中,愛(ài)情、劇情、傳奇和歷史的比重分別為0.9、0.7、0.5和0.2,可見(jiàn),愛(ài)情為該影片最重要的元素。作為本發(fā)明的一個(gè)實(shí)施例,觀(guān)看記錄數(shù)據(jù)庫(kù)120僅僅記錄用戶(hù)觀(guān)看影片時(shí)的原始操作記錄。而不做任何處理。每條記錄包括影片標(biāo)識(shí)、觀(guān)看曰期、觀(guān)看時(shí)的操作及操作對(duì)應(yīng)的時(shí)間、個(gè)人評(píng)價(jià)打分等信息,并以觀(guān)看日期的時(shí)間順序進(jìn)行存儲(chǔ)。其中,影片標(biāo)識(shí)對(duì)觀(guān)看的影片信息進(jìn)行標(biāo)記,以此為關(guān)鍵字可從候選影片數(shù)據(jù)庫(kù)110中,檢測(cè)出該影片的所有屬性描述信息;觀(guān)看時(shí)的操作包括播放、暫停、前跳、后跳、快進(jìn)、快退、終止等,其中,播放、前跳、后跳操作后是正常倍速播放,快進(jìn)、快退操作后是快速播放,兩者都為播放狀態(tài),每種播放的周期為連續(xù)兩個(gè)操作之間的時(shí)間差。作為本發(fā)明的一個(gè)實(shí)施例,用戶(hù)興趣偏好模型計(jì)算模塊130根據(jù)觀(guān)看記錄數(shù)據(jù)庫(kù)120提供的個(gè)人用戶(hù)觀(guān)看影片信息記錄和記錄中相應(yīng)影片在候選影片數(shù)據(jù)庫(kù)110中的完整影片屬性描述信息,計(jì)算個(gè)人用戶(hù)興趣偏好模型。用戶(hù)興趣偏好模型表達(dá)了用戶(hù)當(dāng)前對(duì)影片不同層次屬性的興趣點(diǎn),它可能會(huì)隨時(shí)間發(fā)生變化,因此,本發(fā)明實(shí)施例在用戶(hù)請(qǐng)求影片推薦時(shí)才實(shí)時(shí)建立用戶(hù)興趣偏好模型,具體地,包括以下步驟步驟S301,根據(jù)請(qǐng)求的用戶(hù)標(biāo)識(shí)從觀(guān)看記錄數(shù)據(jù)庫(kù)120中提取該用戶(hù)的觀(guān)看影片信息記錄,設(shè)定一個(gè)有效的時(shí)間窗口,認(rèn)為只有在此時(shí)間內(nèi)的用戶(hù)觀(guān)看記錄才反應(yīng)用戶(hù)興趣,因此,只使用在該指定時(shí)間窗口內(nèi)的影片記錄。根據(jù)記錄中的影片標(biāo)識(shí)從候選影片數(shù)據(jù)庫(kù)110中檢索出觀(guān)看影片的完整影片描述信息Vi=l,2,...m。s,代表影片i的模型,包括所有的屬性層次及其(屬性,屬性值)對(duì)。步驟S302,將用戶(hù)觀(guān)看的完整影片描述信息s,依據(jù)影片權(quán)值進(jìn)行線(xiàn)性疊加,獲得用戶(hù)歷史疊加模型S。具體地,本發(fā)明提出的可能的疊加方式如下,當(dāng)然本領(lǐng)域技術(shù)人員還能夠根據(jù)下述方案提出其他修改或變化,這些修改或變化均應(yīng)包含在本發(fā)明的包含范圍之內(nèi)。作為本發(fā)明的一個(gè)實(shí)施例,采用對(duì)同一屬性層次相同屬性的屬性值進(jìn)行加權(quán)求和的方式獲得用戶(hù)歷史疊加模型S,即5=|,。其中,<為影片權(quán)值,表示影片s,對(duì)用戶(hù)興趣偏好模型的貢獻(xiàn)程度。作為本發(fā)明的一個(gè)實(shí)施例,為了精確地反映影片對(duì)用戶(hù)興趣的反映程度,考慮以下三個(gè)參數(shù)對(duì)影片權(quán)值w"的影響,包括用戶(hù)評(píng)價(jià)分?jǐn)?shù)、影片觀(guān)看時(shí)間和用戶(hù)觀(guān)看周期。作為本發(fā)明的一個(gè)實(shí)施例,用戶(hù)評(píng)價(jià)分?jǐn)?shù)直接表現(xiàn)了用戶(hù)觀(guān)看影片時(shí)對(duì)影片整體興趣的表達(dá),可為正值也可為負(fù)值。在本實(shí)施例中,用戶(hù)評(píng)分范圍為(-100,100),分值越高,表示用戶(hù)越喜歡該影片。設(shè)。為用戶(hù)分值,則歸一化后的參數(shù)c,/100為影片權(quán)值<的一個(gè)乘子。作為本發(fā)明的一個(gè)實(shí)施例,影片觀(guān)看時(shí)間為用戶(hù)觀(guān)看該影片時(shí)的有效觀(guān)看時(shí)間,包括用戶(hù)正常速度播放和快進(jìn)速度播放兩種形式,其中正常速度播放在用戶(hù)完成播放、前跳、后跳等操作后開(kāi)始,在下一操作開(kāi)始時(shí)結(jié)束;快進(jìn)速度播放在用戶(hù)快進(jìn)操作后開(kāi)始,在下一操作開(kāi)始時(shí)結(jié)束。用戶(hù)觀(guān)看影片的有效時(shí)間可根據(jù)觀(guān)看記錄數(shù)據(jù)庫(kù)120中用戶(hù)觀(guān)看影片時(shí)的操作和對(duì)應(yīng)時(shí)間點(diǎn)計(jì)算獲得,是整個(gè)觀(guān)看過(guò)程中播放時(shí)間的累加,包括用戶(hù)正常播放影片時(shí)長(zhǎng)和用戶(hù)快進(jìn)播放時(shí)長(zhǎng)的加權(quán)求和,其中的權(quán)值為影片播放速度的倒數(shù),如正常播放的權(quán)值為1,二倍速播放的權(quán)值為0.5。因此,設(shè)媒體服務(wù)系統(tǒng)允許的快進(jìn)倍速集合為V,正常播放和快速播放的起始時(shí)間分別為/,"和f;',結(jié)束時(shí)間分別為^+1和,;'+1,則針對(duì)任意播放速度v,er,用戶(hù)觀(guān)看該影片的有效時(shí)間為~=—,")+Z^-^。進(jìn)一步地,若用戶(hù)觀(guān)看影片的有效時(shí)間為Q,該影片的總時(shí)長(zhǎng)為",則兩者的比值~〃,。為影片權(quán)值<的一個(gè)乘子。值得注意的是,該比值可大于l,表示用戶(hù)重復(fù)觀(guān)看了該影片的一些內(nèi)容。作為本發(fā)明的一個(gè)實(shí)施例,用戶(hù)觀(guān)看周期為用戶(hù)觀(guān)看影片時(shí)間與當(dāng)前請(qǐng)求推薦時(shí)間的差值,代表用戶(hù)觀(guān)看影片時(shí)間到最新推薦時(shí)間的一個(gè)周期,反應(yīng)用戶(hù)興趣在時(shí)間上的變化。在本實(shí)施例中,以天的粒度,即影片觀(guān)看到推薦請(qǐng)求時(shí)的天數(shù)D,表達(dá)這種時(shí)間周期,并采用時(shí)間遺忘因子e;的方式反映到影片權(quán)值<中。遺忘因子e;與A成反比,隨著A的增大,影片屬性對(duì)用戶(hù)興趣偏好的反映程度越低,當(dāng)超過(guò)一定的窗口時(shí),則表示該影片不能反映任何用戶(hù)興趣偏好。通過(guò)這種方式,可跟蹤用戶(hù)的影片興趣偏好變化。在本實(shí)施例中,不失一般性地采用指數(shù)遺忘因子形式,即e;-".exp(-叢)。應(yīng)理解,上述用戶(hù)觀(guān)看周期的實(shí)施例僅是示意性的實(shí)施例,并不限制本發(fā)明的范圍。綜合考慮上面三個(gè)參數(shù),本發(fā)明實(shí)施例的影片權(quán)值<可表示為<=i.k.e;。獲取了設(shè)定時(shí)間窗口內(nèi)所有影片的影片權(quán)值w「后,就可根iooc據(jù)影片模型計(jì)算出用戶(hù)歷史疊加模型。如圖4所示,為本發(fā)明實(shí)施例的影片模型疊加方式的形象描述,可見(jiàn),這種用戶(hù)興趣的疊加模型與影片模型具有相同的表達(dá)形式。步驟S303,針對(duì)用戶(hù)歷史疊加模型中的每一個(gè)層次,根據(jù)各個(gè)屬性的屬性值大小計(jì)算該層的集中度參數(shù),并將該集中度參數(shù)作為該層在用戶(hù)興趣偏好模型中的權(quán)值,即層次權(quán)值vt';。用戶(hù)歷史疊加模型與影片模型一樣,不同屬性層次具有等同的地位,但實(shí)際上,不同用戶(hù)對(duì)影片的不同類(lèi)型屬性方面具有不同的敏感程度,如有的看中導(dǎo)演、有的看中主演等,這些不同的焦點(diǎn)在用戶(hù)觀(guān)看影片記錄中都有潛在的反映。因此,在本發(fā)明實(shí)施例中,采用層次權(quán)值w;表達(dá)用戶(hù)對(duì)不同屬性的敏感度。具體地,本發(fā)明提出的可能的層次權(quán)值vv;的表達(dá)方式如下,當(dāng)然本領(lǐng)域技術(shù)人員還能夠根據(jù)下述表達(dá)方式提出其他修改或變化,這些修改或變化應(yīng)包含在本發(fā)明的包含范圍之內(nèi)。在本實(shí)施例中,使用屬性層次中屬性的集中度參數(shù)表示層次權(quán)值<。集中度越高的屬性層次,用戶(hù)的敏感度越高,相應(yīng)的層次權(quán)值w也就越大。在計(jì)算過(guò)程中,認(rèn)為屬性值過(guò)小(小于設(shè)定閾值)的屬性是屬性層次的干擾,直接過(guò)濾掉。然后,根據(jù)剩余屬性的屬性值,計(jì)算它們的集中度,即層次權(quán)值。在本實(shí)施例中,采用各屬性值的方差表示,即性值,5表示第j屬性層次的平均屬性值,即^;=^^。步驟S304,對(duì)包含層次權(quán)值w;的用戶(hù)興趣偏好模型進(jìn)行裁剪。根據(jù)設(shè)定的閾值把層次權(quán)值w;小的屬性層次剪裁過(guò)濾掉。這是因?yàn)?,用?hù)對(duì)這些屬性層次的屬性感興趣程度比較平均,不敏感,因此,在影片推薦時(shí)不使用這行屬性層次。。其中,/7力,表示用戶(hù)在第j個(gè)屬性層次第i個(gè)屬性的作為本發(fā)明的一個(gè)實(shí)施例,影片推薦模塊140根據(jù)用戶(hù)興趣偏好模型計(jì)算模塊130建立的用戶(hù)興趣偏好模型對(duì)候選影片數(shù)據(jù)庫(kù)110中還沒(méi)有觀(guān)看過(guò)的新影片進(jìn)行排序,推薦前N部標(biāo)量推薦分值最大的影片。其中,標(biāo)量推薦分值采用影片模型與用戶(hù)興趣偏好模型的模型匹配方法進(jìn)行打分的方式獲取,作為影片推薦的依據(jù)。具體地,本發(fā)明提出的可能的模型匹配算法如下,當(dāng)然本領(lǐng)域技術(shù)人員還能夠根據(jù)下述方案提出其他修改或變化,這些修改或變化均應(yīng)包含在本發(fā)明的包含范圍之內(nèi)。在本實(shí)施例中,所述模型匹配算法采用線(xiàn)性運(yùn)算獲取影片標(biāo)量推薦分值,包括層次分配分值的計(jì)算和最終的標(biāo)量推薦分值的計(jì)算兩步首先,針對(duì)用戶(hù)興趣偏好模型中的每一屬性層次,獲取影片模型中對(duì)應(yīng)層次所有屬性的屬性值。設(shè)《,和分別表示用戶(hù)興趣偏好模型和影片模型中第j個(gè)屬性層次的屬性值,則該屬性層次的匹配分值巧為巧=5>7,/^,/^,。其中,6,^{0,1}表示用戶(hù)興趣偏好模型中第j屬性層次的第i屬性在影片模型中是否存在,如果存在,則^,取1,否則直接忽略該屬性,即6,,取0。逐個(gè)遍歷用戶(hù)興趣偏好模型中的各屬性層次后,獲得每一層次的匹配分值巧,j=l,2,…,k。然后,利用計(jì)算好的層次匹配分值&和用戶(hù)興趣偏好模型中各屬性層次的層次權(quán)值w;,通過(guò)加權(quán)平均獲取用戶(hù)對(duì)該影片的標(biāo)量推薦分值p,/^—/V可看出,標(biāo)量推薦分值主要由用戶(hù)興趣比較敏感的類(lèi)型層次決定,并能夠跟蹤用戶(hù)興趣的時(shí)間變化,同時(shí)通過(guò)用戶(hù)反饋打分的方式可影響影片推薦的結(jié)果。作為本發(fā)明的一個(gè)實(shí)施例,為了完成本發(fā)明的推薦功能,本發(fā)明實(shí)施例的基于屬性描述的個(gè)性化影片推薦系統(tǒng)還對(duì)外提供三個(gè)基本接口,包括影片信息收集接口、用戶(hù)觀(guān)看影片信息記錄收集接口和請(qǐng)求推薦接口。其中,影片信息收集接口,用于向候選影片數(shù)據(jù)庫(kù)110中添加具有完整屬性描述的影片記錄,候選影片數(shù)據(jù)庫(kù)110直接對(duì)外提供,接口參數(shù)為影片的所有屬性描述信息;用戶(hù)觀(guān)看影片信息記錄收集接口,由用戶(hù)觀(guān)看記錄數(shù)據(jù)庫(kù)120直接對(duì)外提供,接口參數(shù)為用戶(hù)觀(guān)看影片的動(dòng)態(tài)信息,當(dāng)用戶(hù)觀(guān)看完一個(gè)影片時(shí)自動(dòng)向影片推薦系統(tǒng)提交此次觀(guān)看的記錄信息;請(qǐng)求推薦接口,由影片推薦模塊140直接對(duì)外提供,用于接收用戶(hù)的影片推薦請(qǐng)求,包括用戶(hù)標(biāo)識(shí)和請(qǐng)求推薦時(shí)間參數(shù),完成后返回由影片標(biāo)識(shí)和影片名稱(chēng)構(gòu)成的推薦結(jié)果列表。應(yīng)該理解,除了上述三個(gè)滿(mǎn)足基本功能的接口外,本發(fā)明實(shí)施例還可提供其它數(shù)據(jù)操作接口,如完整影片描述信息的刪除和修改接口、用戶(hù)觀(guān)看影片信息記錄的刪除和修改接口、以及其他數(shù)據(jù)庫(kù)操作等。本發(fā)明采用屬性描述代表影片特征并按類(lèi)型進(jìn)行分層,通過(guò)分析不同層次的集中度聚焦用戶(hù)興趣熱點(diǎn),并采用時(shí)間遺忘因子和影片模型的線(xiàn)性疊加方法跟蹤用戶(hù)興趣變化,實(shí)時(shí)響應(yīng)用戶(hù)對(duì)影片的反饋,調(diào)整用戶(hù)興趣偏好模型,提高了影片推薦的準(zhǔn)確度和適應(yīng)性,具有較高的實(shí)用價(jià)值。盡管已經(jīng)示出和描述了本發(fā)明的實(shí)施例,對(duì)于本領(lǐng)域的普通技術(shù)人員而言,可以理解在不脫離本發(fā)明的原理和精神的情況下可以對(duì)這些實(shí)施例進(jìn)行多種變化、修改、替換和變型,本發(fā)明的范圍由所附權(quán)利要求及其等同限定。權(quán)利要求1、一種基于屬性描述的個(gè)性化影片推薦系統(tǒng),其特征在于,包括候選影片數(shù)據(jù)庫(kù)、觀(guān)看記錄數(shù)據(jù)庫(kù)、用戶(hù)興趣偏好模型計(jì)算模塊和影片推薦模塊,所述候選影片數(shù)據(jù)庫(kù),用于存儲(chǔ)完整影片屬性描述信息;所述觀(guān)看記錄數(shù)據(jù)庫(kù),用于存儲(chǔ)用戶(hù)觀(guān)看影片信息記錄;所述用戶(hù)興趣偏好模型計(jì)算模塊,用于根據(jù)所述用戶(hù)觀(guān)看影片信息記錄計(jì)算用戶(hù)興趣偏好模型;所述影片推薦模塊,用于根據(jù)所述用戶(hù)興趣偏好模型對(duì)所述候選影片數(shù)據(jù)庫(kù)中還未觀(guān)看的新影片進(jìn)行打分,獲取標(biāo)量推薦分值并排序,推薦前N部所述推薦分值最大的影片。2、如權(quán)利要求l所述的基于屬性描述的個(gè)性化影片推薦系統(tǒng),其特征在于,所述候選影片數(shù)據(jù)庫(kù)中的存儲(chǔ)內(nèi)容包括用戶(hù)曾經(jīng)看過(guò)的舊影片信息和沒(méi)有觀(guān)看過(guò)的新影片信息。3、如權(quán)利要求1所述的基于屬性描述的個(gè)性化影片推薦系統(tǒng),其特征在于,所述影片屬性描述信息包括影片標(biāo)識(shí)、題材類(lèi)型、主演、導(dǎo)演、制片人、出品年份、出品公司、國(guó)家地區(qū)、背景、獲獎(jiǎng)記錄、語(yǔ)言類(lèi)型和影片時(shí)長(zhǎng)。4、如權(quán)利要求1所述的基于屬性描述的個(gè)性化影片推薦系統(tǒng),其特征在于,所述影片屬性描述信息可包括0個(gè)、1個(gè)或多個(gè)(屬性,屬性值)對(duì)。5、如權(quán)利要求1所述的基于屬性描述的個(gè)性化影片推薦系統(tǒng),其特征在于,所述影片屬性描述信息的屬性值在[O,l]間,可由專(zhuān)家評(píng)分、用戶(hù)評(píng)定和系統(tǒng)默認(rèn)策略確定。6、如權(quán)利要求1所述的基于屬性描述的個(gè)性化影片推薦系統(tǒng),其特征在于,所述影片屬性描述信息分成不同層次的描述,構(gòu)成影片模型。7、如權(quán)利要求1所述的基于屬性描述的個(gè)性化影片推薦系統(tǒng),其特征在于,所述觀(guān)看記錄數(shù)據(jù)庫(kù),其特征在于,每條所述用戶(hù)觀(guān)看影片信息記錄包括影片標(biāo)識(shí)、觀(guān)看日期、觀(guān)看時(shí)的操作及其對(duì)應(yīng)的時(shí)間和個(gè)人評(píng)價(jià)打分。8、如權(quán)利要求1所述的基于屬性描述的個(gè)性化影片推薦系統(tǒng),其特征在于,所述用戶(hù)興趣偏好模型在用戶(hù)請(qǐng)求影片推薦時(shí)實(shí)時(shí)建立,包括以下步驟根據(jù)請(qǐng)求的用戶(hù)標(biāo)識(shí)從所述觀(guān)看記錄數(shù)據(jù)庫(kù)中提取所述用戶(hù)在指定時(shí)間窗口內(nèi)的所有所述用戶(hù)觀(guān)看影片信息記錄,并根據(jù)記錄中的所述影片標(biāo)識(shí)從所述候選影片數(shù)據(jù)庫(kù)中檢索出觀(guān)看影片的所述完整影片描述信息;將所述完整影片描述信息依據(jù)影片權(quán)值進(jìn)行線(xiàn)性疊加,獲得用戶(hù)歷史疊加模型;針對(duì)所述用戶(hù)歷史疊加模型中的每個(gè)層次,根據(jù)各個(gè)所述影片屬性的屬性值大小計(jì)算該層的集中度參數(shù),作為該層在所述用戶(hù)興趣偏好模型中的權(quán)值,即層次權(quán)值;根據(jù)設(shè)定的閾值把所述層次權(quán)值小的層次和各層次中所述屬性值小的屬性過(guò)濾掉,獲取剪裁后的用戶(hù)興趣偏好模型。9、如權(quán)利要求1所述的基于屬性描述的個(gè)性化影片推薦系統(tǒng),其特征在于,所述影片權(quán)值表示影片對(duì)所述用戶(hù)興趣偏好模型的貢獻(xiàn)程度,與用戶(hù)評(píng)價(jià)分?jǐn)?shù)、影片觀(guān)看時(shí)間比例和遺忘因子<相關(guān)。10、如權(quán)利要求1所述的基于屬性描述的個(gè)性化影片推薦系統(tǒng),其特征在于,所述用戶(hù)評(píng)價(jià)分?jǐn)?shù)為用戶(hù)觀(guān)看影片時(shí)對(duì)影片整體興趣的表達(dá),可為正值和負(fù)值。11、如權(quán)利要求1所述的基于屬性描述的個(gè)性化影片推薦系統(tǒng),其特征在于,所述影片觀(guān)看時(shí)間比例為用戶(hù)觀(guān)看影片的有效時(shí)間與影片時(shí)長(zhǎng)的比值。12、如權(quán)利要求1所述的基于屬性描述的個(gè)性化影片推薦系統(tǒng),其特征在于,所述用戶(hù)觀(guān)看影片的有效時(shí)間為整個(gè)觀(guān)看過(guò)程中播放時(shí)間的累加,包括用戶(hù)正常播放影片時(shí)長(zhǎng)和用戶(hù)快進(jìn)播放時(shí)長(zhǎng)的加權(quán)求和,其中權(quán)值為影片播放速度的倒數(shù)。13、如權(quán)利要求1所述的基于屬性描述的個(gè)性化影片推薦系統(tǒng),其特征在于,所述遺忘因子e;與用戶(hù)觀(guān)看周期D,成反比,e;=".exp(—&)。A14、如權(quán)利要求1所述的基于屬性描述的個(gè)性化影片推薦系統(tǒng),其特征在于,所述用戶(hù)觀(guān)看周期D,為影片觀(guān)看到推薦請(qǐng)求時(shí)的天數(shù)。15、如權(quán)利要求1所述的基于屬性描述的個(gè)性化影片推薦系統(tǒng),其特征在于,所述層次權(quán)值表示用戶(hù)對(duì)不同類(lèi)型屬性的敏感度,使用屬性層次中屬性的集中度參數(shù)表示。16、如權(quán)利要求1所述的基于屬性描述的個(gè)性化影片推薦系統(tǒng),其特征在于,所述集中度為各屬性值的方差。17、如權(quán)利要求1所述的基于屬性描述的個(gè)性化影片推薦系統(tǒng),其特征在于,所述影片推薦模塊采用所述影片模型與所述用戶(hù)興趣偏好模型的模型匹配算法進(jìn)行打分。18、如權(quán)利要求1所述的基于屬性描述的個(gè)性化影片推薦系統(tǒng),其特征在于,所述模型匹配算法包括以下步驟針對(duì)所述用戶(hù)興趣偏好模型中的每層,獲取所述影片模型中對(duì)應(yīng)層次所有屬性的屬性值,將所述影片模型和用戶(hù)興趣偏好模型中該層次具有相同屬性的屬性值相乘,再將相乘后的屬性值直接線(xiàn)性相加,獲得層次匹配分值;加權(quán)求和,獲得所述影片標(biāo)量推薦分值。19、如權(quán)利要求1所述的基于屬性描述的個(gè)性化影片推薦系統(tǒng),其特征在于,還包括影片信息收集接口、用戶(hù)觀(guān)看影片信息記錄收集接口和請(qǐng)求推薦接口,所述影片收集接口,用于向所述候選影片數(shù)據(jù)庫(kù)中添加具有完整屬性描述的影片記錄,由所述候選影片數(shù)據(jù)庫(kù)直接對(duì)外提供,接口參數(shù)為影片的所有屬性描述信息;所述用戶(hù)觀(guān)看影片信息記錄收集接口,用于當(dāng)用戶(hù)觀(guān)看完一個(gè)影片時(shí)自動(dòng)向所述推薦系統(tǒng)提交此次觀(guān)看的記錄信息,由所述觀(guān)看記錄數(shù)據(jù)庫(kù)直接對(duì)外提供,接口參數(shù)為用戶(hù)觀(guān)看影片的動(dòng)態(tài)信息;所述請(qǐng)求推薦接口,用于接收用戶(hù)的影片推薦請(qǐng)求,所述影片推薦請(qǐng)求包括用戶(hù)標(biāo)識(shí)和請(qǐng)求推薦時(shí)間參數(shù),接收完成后返回由影片標(biāo)識(shí)和影片名稱(chēng)構(gòu)成的推薦結(jié)果列表,由所述影片推薦模塊直接對(duì)外提供。20、一種基于屬性描述的個(gè)性化影片推薦方法,其特征在于,包括以下步驟根據(jù)用戶(hù)標(biāo)識(shí)從所述觀(guān)看記錄數(shù)據(jù)庫(kù)中獲取指定窗口長(zhǎng)度的用戶(hù)觀(guān)看影片信息記錄;從所述候選影片數(shù)據(jù)庫(kù)中獲取全部觀(guān)看影片模型,即完整影片描述信息;計(jì)算用戶(hù)興趣偏好模型;依次從候選影片數(shù)據(jù)庫(kù)中獲取各影片的完整影片描述信息;根據(jù)推薦算法計(jì)算所述影片模型與用戶(hù)興趣偏好模型的匹配標(biāo)量推薦分值;根據(jù)所述標(biāo)量推薦分值排列影片順序,并提供前N部影片的信息用于推薦。21、如權(quán)利要求20所述的基于屬性描述的個(gè)性化影片推薦方法,其特征在于,所述計(jì)算用戶(hù)興趣偏好模型,包括以下步驟將所述完整影片描述信息依據(jù)影片權(quán)值進(jìn)行線(xiàn)性疊加,獲得用戶(hù)歷史疊加模型;針對(duì)所述用戶(hù)歷史疊加模型中的每個(gè)層次,根據(jù)各個(gè)所述影片屬性的屬性值大小計(jì)算該層的集中度參數(shù),作為該層在所述用戶(hù)興趣偏好模型中的權(quán)值,即層次權(quán)值;根據(jù)設(shè)定的閾值把所述層次權(quán)值小的層次和各層次中所述屬性值小的屬性過(guò)濾掉,獲取剪裁后的用戶(hù)興趣偏好模型。22、如權(quán)利要求20所述的基于屬性描述的個(gè)性化影片推薦方法,其特征在于,所述根據(jù)推薦算法計(jì)算所述影片模型與用戶(hù)偏好模型的匹配標(biāo)量推薦分值,包括以下步驟針對(duì)所述用戶(hù)興趣偏好模型中的每層,獲取所述影片模型中對(duì)應(yīng)層次所有屬性的屬性值,將所述影片模型和用戶(hù)興趣偏好模型中該層次具有相同屬性的屬性值相乘,再將相乘后的屬性值直接線(xiàn)性相加,獲得層次匹配分值;加權(quán)求和,獲得所述影片標(biāo)量推薦分值。全文摘要本發(fā)明一種基于屬性描述的個(gè)性化影片推薦系統(tǒng),包括候選影片數(shù)據(jù)庫(kù)、觀(guān)看記錄數(shù)據(jù)庫(kù)、用戶(hù)興趣偏好模型計(jì)算模塊和影片推薦模塊。本發(fā)明通過(guò)采用屬性描述代表影片特征并按類(lèi)型進(jìn)行分層,分析不同層次的集中度聚焦用戶(hù)興趣熱點(diǎn),并采用時(shí)間遺忘因子和影片模型的線(xiàn)性疊加方法跟蹤用戶(hù)興趣變化,實(shí)時(shí)響應(yīng)用戶(hù)對(duì)影片的反饋,調(diào)整用戶(hù)興趣偏好模型,提高了影片推薦的準(zhǔn)確度和適應(yīng)性。文檔編號(hào)G06F17/30GK101551825SQ20091014045公開(kāi)日2009年10月7日申請(qǐng)日期2009年5月15日優(yōu)先權(quán)日2009年5月15日發(fā)明者剛吳,奚宏生,俊李,寧李,王子磊申請(qǐng)人:中國(guó)科學(xué)技術(shù)大學(xué)