專利名稱:為用戶推薦視頻的裝置及方法
技術領域:
本發(fā)明涉及一種為用戶推薦視頻的裝置及方法。
背景技術:
目前,一些視頻網(wǎng)站推出了視頻推薦服務,建議用戶在瀏覽某一視頻后,再去瀏覽和其有所關聯(lián)的一些視頻。視頻推薦技術主要是在協(xié)同過濾系統(tǒng)中使用顯式的評分來對結(jié)果進行處理。用戶顯示評分所造成的評分矩陣過分稀疏,以及推薦計算模型中忽略了時間因素,往往造成了推薦結(jié)果偏離實際。基于關聯(lián)規(guī)則推薦算法在模式挖掘階段未考慮用戶行為的先后順序,在推薦階段未充分考慮推薦項目重要程度,導致推薦準確性不高。序列模式挖掘是分析時間序列數(shù)據(jù),從而發(fā)現(xiàn)隱藏其中的有趣模式。用戶訪問模式在視頻推薦中是對協(xié)同過濾的有效補充。由于訪問視頻的時間是有先后順序的,而序列·模式中應用最廣泛的Apriori算法則沒有考慮到時間的先后對規(guī)則挖掘的影響,并不適合進行基于視頻訪問記錄的關聯(lián)規(guī)則挖掘。以上這些有關訪問模式的挖掘都是基于網(wǎng)頁進行的,而視頻具有一些特別的屬性如時間長、數(shù)據(jù)量大等,因此先前的算法并不一定全部適合視頻的推薦?,F(xiàn)有技術中公開了一種為用戶推薦視頻的裝置,其根據(jù)用戶觀看前一視頻的名稱、視頻的發(fā)布人等視頻信息關鍵字,從視頻網(wǎng)站的所有的視頻資源中尋找與前一視頻有關聯(lián)的候選視頻,向用戶推薦。這種方案沒有考慮到用戶瀏覽完前一視頻后瀏覽下一視頻的概率、用戶對下一視頻的喜好程度等符合人的思維連續(xù)性或發(fā)散性的因素,因而往往不符合用戶的習慣和偏好。因此,業(yè)界期望獲得一種為用戶推薦視頻的裝置及方法,其能將用戶瀏覽完前一視頻后再瀏覽下一視頻的概率、用戶對下一視頻的喜好程度等因素考慮在內(nèi),從而使視頻推薦服務更符合用戶的習慣和偏好。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種符合用戶的習慣和偏好的為用戶推薦視頻的裝置。為實現(xiàn)上述目的,本發(fā)明的技術方案如下一種為用戶推薦視頻的裝置,包括關系矩陣構建單元,其基于所有用戶的視頻瀏覽記錄,定義一個虛擬用戶在瀏覽第一視頻后再瀏覽第二視頻的權重并以該權重作為元素形成一個關系矩陣,第二視頻為用戶瀏覽第一視頻之后瀏覽的視頻;瀏覽記錄單元,用于記錄當前用戶最近瀏覽過的至少一個第一視頻的信息;和推薦單元,用于向當前用戶推薦供瀏覽的候選視頻組;推薦單元根據(jù)瀏覽記錄單元記錄的當前用戶最近瀏覽過的至少一個第一視頻的信息,分別在關系矩陣中尋找權重值最大的至少一個元素,再分別以該元素所對應的第二視頻形成候選視頻組向當前用戶推薦以供瀏覽。優(yōu)選地關系矩陣中的每個元素的權重與瀏覽完第一視頻后再瀏覽第二視頻的用戶數(shù)量成正比關系。
優(yōu)選地,關系矩陣構建單元包括一觀看質(zhì)量修正單元,其根據(jù)虛擬用戶瀏覽第二視頻的時間占該第二視頻時間長度的比例,為關系矩陣中的每個元素乘上一個第一權重修正因子。優(yōu)選地,關系矩陣構建單元還包括一瀏覽次數(shù)修正單元,其根據(jù)虛擬用戶重復瀏覽第二視頻的次數(shù),為關系矩陣中的每個元素乘上一個第二權重修正因子。優(yōu)選地,關系矩陣構建單元還包括一連續(xù)觀看修正單元,其根據(jù)虛擬用戶瀏覽第一視頻后緊接著瀏覽第二視頻的概率,為關系矩陣中的每個元素乘上一個第三權重修正因子。優(yōu)選地,關系矩陣構建單元還包括一相隔時間修正單元,其根據(jù)虛擬用戶瀏覽第一視頻和第二視頻之間間隔時間的長短程度,為關系矩陣中的每個元素乘上一個第四權重修正因子?!?yōu)選地,該裝置設置在視頻瀏覽終端一側(cè),與視頻服務器端通過網(wǎng)絡連接,該裝置從視頻服務器端獲取所有用戶的視頻瀏覽記錄。本發(fā)明還公開了一種為用戶推薦視頻的方法,包括如下步驟a)、記錄所有用戶的視頻瀏覽記錄;b)、根據(jù)所有用戶的視頻瀏覽記錄,定義一個虛擬用戶在瀏覽第一視頻后再瀏覽第二視頻的權重并以該權重作為元素形成一個關系矩陣,其中第二視頻為用戶瀏覽第一視頻之后瀏覽的視頻;c)、記錄當前用戶最近瀏覽過的至少一個第一視頻的信息;d)、根據(jù)當前用戶最近瀏覽過的至少一個第一視頻的信息,分別在關系矩陣中尋找權重值最大的至少一個元素,再分別以該元素所對應的第二視頻形成候選視頻組向當前用戶推薦以供瀏覽。本發(fā)明提供的為用戶推薦視頻的裝置及方法,將用戶瀏覽完前一視頻后接著瀏覽下一視頻的概率、用戶對下一視頻的喜好程度等因素考慮在內(nèi),從而使視頻推薦服務更貼近人的思維連續(xù)性或發(fā)散性、更符合用戶的習慣和偏好。
圖I示出本發(fā)明一實施例提供的為用戶推薦視頻的裝置的結(jié)構示意圖;圖2示出本發(fā)明一改進實施例提供的為用戶推薦視頻的裝置的結(jié)構示意圖;圖3示出本發(fā)明一實施例提供的為用戶推薦視頻的裝置與視頻服務器端及瀏覽終端連接關系示意圖。
具體實施例方式下面結(jié)合附圖,對本發(fā)明的具體實施方式
作進一步的詳細說明。需要說明的是,在本發(fā)明的實施例中,第一視頻和第二視頻并不特指某一視頻,而僅用于表征視頻瀏覽的前后順序關系。如圖I所示,本發(fā)明公開的一種為用戶推薦視頻的裝置1,其包括關系矩陣構建單元11、瀏覽記錄單元12和推薦單元13,其基于接收視頻瀏覽服務的所有用戶的視頻瀏覽記錄,定義一個虛擬用戶在瀏覽第一視頻后再瀏覽第二視頻的權重并以該權重作為元素形成一個關系矩陣,其中第二視頻指任意一不特定的用戶瀏覽第一視頻之后瀏覽的視頻。瀏覽記錄單元12,用于記錄當前用戶最近瀏覽過的至少一個第一視頻的信息;和推薦單元13,用于向當前用戶推薦供瀏覽的候選視頻組。為根據(jù)接收視頻瀏覽服務的所有用戶的視頻瀏覽記錄來表征任意一不特定的用戶瀏覽完第一視頻后接著瀏覽第二視頻的概率、及對第二視頻的喜好程度等因素,本發(fā)明引入了虛擬用戶的概念。該虛擬用戶瀏覽視頻的偏好習慣取決于對接收視頻瀏覽服務的所有用戶瀏覽視頻的偏好習慣的數(shù)理統(tǒng)計。所以虛擬用戶雖然是一個不真實的用戶,但它對某一視頻的喜好程度也代表了大部分用戶對該視頻的喜好程度,它在瀏覽第一視頻后對第二視頻的選擇也代表了大部分用戶對第二視頻的選擇。關系矩陣中的每個元素為虛擬用戶在瀏覽第一視頻后再瀏覽第二視頻的權重,關系矩陣中的行標為第一視頻的編號,縱標為第二視頻的編號。為使視頻推薦服務更貼近人的思維連續(xù)性或發(fā)散性、更符合用戶的習慣和偏好,該裝置I中的推薦單元13根據(jù)瀏覽記錄單元12記錄的當前用戶最近瀏覽過的一個第一視頻的信息,在關系矩陣中尋找權重值最大的元素,再以該元素所對應的第二視頻形成候選視頻組向當前用戶推薦以供瀏覽。在本實施例中,候選視頻組僅包含了一項候選視頻。 顯然,瀏覽記錄單元12可以記錄多項(例如4項)當前用戶最近瀏覽過的視頻,推薦單元13針對每項視頻的信息,分別在關系矩陣中尋找權重值最大的元素,再分別以這4個元素各自對應的第二視頻形成候選視頻組向當前用戶推薦以供瀏覽。瀏覽記錄單元12可以記錄多項(例如4項)當前用戶最近瀏覽過的視頻,推薦單元13可以針對每項視頻的信息,分別在關系矩陣中尋找尋找權重值最大的多個元素(例如3個),從而選出了 12個元素,再分別以這12個元素各自對應的第二視頻形成候選視頻組向當前用戶推薦以供瀏覽。根據(jù)本發(fā)明的改進實施例,在定義虛擬用戶在瀏覽第一視頻后再瀏覽第二視頻的權重并作為關系矩陣的元素時,可以采用如下的方案關系矩陣中的每個元素的權重與瀏覽完所述第一視頻后再瀏覽第二視頻的用戶數(shù)量成正比關系。假設,第一視頻的編號為i,第二視頻的編號為j,則關系矩陣中橫標為i、縱標為j的元素,其權重與選擇先瀏覽i編號視頻再瀏覽j編號視頻的用戶數(shù)成正比關系;其中,先瀏覽i編號視頻再瀏覽j編號視頻的用戶數(shù)可以根據(jù)所有用戶的視頻瀏覽記錄而得到。圖2示出了根據(jù)本發(fā)明一改進實施例的為用戶推薦視頻的裝置的結(jié)構示意圖。其中,關系矩陣構建單元11包括了 4個從屬單元觀看質(zhì)量修正單元111、瀏覽次數(shù)修正單元112、連續(xù)觀看修正單元113和相隔時間修正單元114。其中,觀看質(zhì)量修正單元111根據(jù)虛擬用戶瀏覽第一視頻(例如編號為i)后再瀏覽第二視頻(例如編號為j)的時間占該第二視頻時間長度的比例,為關系矩陣中對應的每個元素(橫標為i、縱標為j)乘上一個第一權重修正因子,并替換關系矩陣中的該元素。虛擬用戶瀏覽第二視頻的時間占該第二視頻時間長度的比例,是經(jīng)過對所有瀏覽該第二視頻(在瀏覽第一視頻之后)用戶的瀏覽時間作出數(shù)理統(tǒng)計而得出。第一權重修正因子為一百分比數(shù)值,其表征了虛擬用戶對該第二視頻的興趣程度。瀏覽次數(shù)修正單元112根據(jù)虛擬用戶瀏覽第一視頻(例如編號為i)后反復瀏覽第二視頻(例如編號為j)的次數(shù),為關系矩陣中對應的每個元素(橫標為i、縱標為j)乘上一個第二權重修正因子,并替換關系矩陣中的該元素。虛擬用戶反復瀏覽第二視頻的次數(shù),是經(jīng)過對所有瀏覽該第二視頻(在瀏覽第一視頻之后)用戶的反復瀏覽次數(shù)作出數(shù)理統(tǒng)計而得出。第二權重因子為一百分比數(shù)值,其表征了虛擬用戶對該第二視頻的喜好程度。連續(xù)觀看修正單元113根據(jù)虛擬用戶瀏覽第一視頻(例如編號為i)后緊接著(中間沒有瀏覽其他視頻)瀏覽第二視頻(例如編號為j)的概率,為關系矩陣中對應的每個元素(橫標為i、縱標為j)乘上一個第三權重修正因子,并替換關系矩陣中的該元素。虛擬用戶緊接著瀏覽該第二視頻的概率,是根據(jù)對所有瀏覽該第一視頻之后緊接著即瀏覽第二視頻的用戶數(shù)占總用戶數(shù)的比例而得出。第三權重因子為一百分比數(shù)值,其表征了第一視頻和第二視頻關聯(lián)的程度。相隔時間修正單元114根據(jù)虛擬用戶在瀏覽第一視頻(例如編號為i)和第二視頻(例如編號為j)之間間隔時間的長短程度,為關系矩陣中對應的每個元素(橫標為i、縱標為j)乘上一個第四權重修正因子,并替換關系矩陣中的該元素。虛擬用戶在瀏覽第一視頻(例如編號為i)和第二視頻(例如編號為j)之間間隔時間的長短程度,是根據(jù)所有先
瀏覽該第一視頻再瀏覽該第二視頻的用戶在此之間的間隔時間作出數(shù)理統(tǒng)計而得出。第四權重因子為一百分比數(shù)值,其也表征了第一視頻和第二視頻關聯(lián)的程度。本領域技術人員理解,關系矩陣構建單元11可以包括觀看質(zhì)量修正單元111、瀏覽次數(shù)修正單元112、連續(xù)觀看修正單元113和相隔時間修正單元114的全部,也可以僅包括其中的任意一個或幾個,均不會對本發(fā)明的實施造成影響。當包括了上述全部4個修正單元111、112、113和114時,視頻推薦服務更能貼近人的思維連續(xù)性或發(fā)散性、從而更符合用戶的習慣和偏好,從而可以作為本發(fā)明的較佳實施方式。如圖3所示,本發(fā)明上述為用戶推薦視頻的裝置I可以設置在視頻瀏覽終端2(即用戶)一側(cè),與視頻服務器端3通過網(wǎng)絡連接,該裝置I從視頻服務器端3獲取所有用戶的視頻瀏覽記錄,進而作出數(shù)理統(tǒng)計并形成關系矩陣。視頻服務器3由視頻服務提供商或視頻網(wǎng)站架設,視頻瀏覽終端2由視頻瀏覽用戶所持有。根據(jù)本發(fā)明的一改進實施例,推薦單元13包括一支持度過濾單元,其為候選視頻組中的每個候選視頻計算支持度并設置一最小支持度閾值,將支持度低于該閾值的候選視頻從候選視頻組中排除。作為另一改進實施例,推薦單元13包括一置信度過濾單元,其為候選視頻組中的每個候選視頻計算置信度并設置一最小置信度閾值,將置信度低于該閾值的候選視頻從候選視頻組中排除。例如,在用戶瀏覽了視頻A之后,本發(fā)明提供的上述裝置向用戶推薦了視頻B,則候選視頻B的支持度為接下來選擇瀏覽視頻B的用戶數(shù)與全體用戶數(shù)的比例,其表征了虛擬用戶瀏覽視頻A之后再瀏覽視頻B的概率;候選視頻B的置信度為接下來選擇瀏覽視頻B的用戶數(shù)與瀏覽了視頻A的用戶數(shù)(不論其之后是否會瀏覽視頻B)的比例,其表征了虛擬用戶瀏覽視頻A之后再瀏覽視頻B的條件概率。支持度過濾單元和置信度過濾單元可以分別單獨設置于推薦單元13中,也可以一并設置在其中,均不脫離本發(fā)明的保護范圍。本發(fā)明公開的為用戶推薦視頻的方法,包括如下步驟a)、記錄所有用戶的視頻瀏覽記錄山)、根據(jù)所有用戶的視頻瀏覽記錄,定義一個虛擬用戶在瀏覽第一視頻后再瀏覽第二視頻的權重并以該權重作為元素形成一個關系矩陣,其中第二視頻為用戶瀏覽第一視頻之后瀏覽的視頻;c)、記錄當前用戶最近瀏覽過的至少一個第一視頻的信息;d)、根據(jù)當前用戶最近瀏覽過的至少一個第一視頻的信息,分別在關系矩陣中尋找權重值最大的至少一個元素,再分別以該元素所對應的第二視頻形成候選視頻組向當前用戶推薦以供瀏覽。根據(jù)本發(fā)明一實施例的上述為用戶推薦視頻的方法,具體包括如下步驟(I)、分析所有用戶的瀏覽記錄,生成關系矩陣M,定義矩陣中每一個元素M[i,j]表示一虛擬用戶在瀏覽視頻i后再瀏覽視頻j的權重,將該權重值初步設定為先訪問視頻i再訪問視頻j的用戶的數(shù)量;(2)、根據(jù)虛擬用戶瀏覽第二視頻的時間占該第二視頻時間長度的比例,為所述關系矩陣中的每個元素乘上一個第一權重修正因子;(3)、根據(jù)虛擬用戶重復瀏覽第二視頻的次數(shù),為所述關系矩陣中的每個元素乘上 一個第二權重修正因子;(4)、根據(jù)虛擬用戶瀏覽第一視頻后緊接著瀏覽第二視頻的概率,為所述關系矩陣中的每個元素乘上一個第三權重修正因子;(5)、根據(jù)虛擬用戶瀏覽第一視頻和第二視頻之間間隔時間的長短程度,為所述關系矩陣中的每個元素乘上一個第四權重修正因子;(6)、分析當前用戶的瀏覽記錄,記錄下當前用戶最近瀏覽過的3個視頻;(7)、根據(jù)當前用戶最近的瀏覽記錄和M矩陣,得到當前用戶最后瀏覽的視頻之后可能瀏覽的視頻,組成候選集;(8)、計算候選集中視頻的置信度和支持度;(9)、在所有候選集中,選出置信度和支持度滿足閾值并且值最大的幾個視頻,為當前用戶進行推薦。其中,第一、第二、第三及第四權重修正因子的定義及表征與之前所述實施例相同。以上所述的僅為本發(fā)明的優(yōu)選實施例,所述實施例并非用以限制本發(fā)明的專利保護范圍,因此凡是運用本發(fā)明的說明書及附圖內(nèi)容所作的等同結(jié)構變化,同理均應包含在本發(fā)明的保護范圍內(nèi)。
權利要求
1.一種為用戶推薦視頻的裝置,包括 關系矩陣構建單元,其基于所有用戶的視頻瀏覽記錄,定義一個虛擬用戶在瀏覽第一視頻后再瀏覽第二視頻的權重并以所述權重作為元素形成一個關系矩陣,所述第二視頻為用戶瀏覽第一視頻之后瀏覽的視頻; 瀏覽記錄單元,用于記錄當前用戶最近瀏覽過的至少一個第一視頻的信息;和 推薦單元,用于向當前用戶推薦供瀏覽的候選視頻組; 其中,所述推薦單元根據(jù)所述瀏覽記錄單元記錄的當前用戶最近瀏覽過的至少一個第一視頻的信息,分別在所述關系矩陣中尋找權重值最大的至少一個元素,再分別以該元素所對應的第二視頻形成所述候選視頻組向當前用戶推薦以供瀏覽。
2.如權利要求I所述的為用戶推薦視頻的裝置,其特征在于,所述關系矩陣中的每個元素的權重與瀏覽完所述第一視頻后再瀏覽第二視頻的用戶數(shù)量成正比關系。
3.如權利要求2所述的為用戶推薦視頻的裝置,其特征在于,所述關系矩陣構建單元包括一觀看質(zhì)量修正單元,其根據(jù)所述虛擬用戶瀏覽所述第二視頻的時間占該第二視頻時間長度的比例,為所述關系矩陣中的每個元素乘上一個第一權重修正因子。
4.如權利要求3所述的為用戶推薦視頻的裝置,其特征在于,所述關系矩陣構建單元還包括一瀏覽次數(shù)修正單元,其根據(jù)所述虛擬用戶重復瀏覽所述第二視頻的次數(shù),為所述關系矩陣中的每個元素乘上一個第二權重修正因子。
5.如權利要求4所述的為用戶推薦視頻的裝置,其特征在于,所述關系矩陣構建單元還包括一連續(xù)觀看修正單元,其根據(jù)所述虛擬用戶瀏覽所述第一視頻后緊接著瀏覽第二視頻的概率,為所述關系矩陣中的每個元素乘上一個第三權重修正因子。
6.如權利要求5所述的為用戶推薦視頻的裝置,其特征在于,所述關系矩陣構建單元還包括一相隔時間修正單元,其根據(jù)所述虛擬用戶瀏覽所述第一視頻和第二視頻之間間隔時間的長短程度,為所述關系矩陣中的每個元素乘上一個第四權重修正因子。
7.如權利要求I至6中任一項所述的為用戶推薦視頻的裝置,其特征在于,該裝置設置在視頻瀏覽終端一側(cè),與視頻服務器端通過網(wǎng)絡連接,該裝置從所述視頻服務器端獲取所述所有用戶的視頻瀏覽記錄。
8.如權利要求7所述的為用戶推薦視頻的裝置,其特征在于,所述推薦單元包括一支持度過濾單元,其為所述候選視頻組中的每個候選視頻計算支持度并設置一最小支持度閾值,將支持度低于該閾值的候選視頻從所述候選視頻組中排除。
9.如權利要求7所述的為用戶推薦視頻的裝置,其特征在于,所述推薦單元包括一置信度過濾單元,其為所述候選視頻組中的每個候選視頻計算置信度并設置一最小置信度閾值,將置信度低于該閾值的候選視頻從所述候選視頻組中排除。
10.如權利要求7所述的為用戶推薦視頻的裝置,其特征在于,所述推薦單元包括一支持度過濾單元和一置信度過濾單元,所述支持度過濾單元為所述候選視頻組中的每個候選視頻計算支持度并設置一最小支持度閾值,所述置信度過濾單元為所述候選視頻組中的每個候選視頻計算置信度并設置一最小置信度閾值,所述推薦單元將支持度低于該最小支持度閾值或置信度低于該最小置信度閾值的候選視頻從所述候選視頻組中排除。
11.一種利用如權利要求I中所述的裝置為用戶推薦視頻的方法,包括如下步驟 a)、記錄所有用戶的視頻瀏覽記錄;b)、根據(jù)所述所有用戶的視頻瀏覽記錄,定義一個虛擬用戶在瀏覽第一視頻后再瀏覽第二視頻的權重并以該權重作為元素形成一個關系矩陣,其中第二視頻為用戶瀏覽第一視頻之后瀏覽的視頻; C)、記錄當前用戶最近瀏覽過的至少一個第一視頻的信息; d)、根據(jù)所述當前用戶最近瀏覽過的至少一個第一視頻的信息,分別在所述關系矩陣中尋找權重值最大的至少一個元素,再分別以該元素所對應的第二視頻形成候選視頻組向當前用戶推薦以供瀏覽。
全文摘要
一種為用戶推薦視頻的裝置,包括關系矩陣構建單元,其基于所有用戶的視頻瀏覽記錄,定義一個虛擬用戶在瀏覽第一視頻后再瀏覽第二視頻的權重并以該權重作為元素形成一個關系矩陣,第二視頻為瀏覽第一視頻之后瀏覽的視頻;瀏覽記錄單元,用于記錄當前用戶最近瀏覽過的至少一個第一視頻的信息;和推薦單元,用于向當前用戶推薦供瀏覽的候選視頻組;推薦單元根據(jù)瀏覽記錄單元記錄的當前用戶最近瀏覽過的至少一個第一視頻的信息,分別在關系矩陣中尋找權重值最大的至少一個元素,再分別以該元素所對應的第二視頻形成候選視頻組向當前用戶推薦以供瀏覽。該裝置使視頻推薦服務更符合用戶的習慣和偏好。
文檔編號H04N21/466GK102957949SQ20121016258
公開日2013年3月6日 申請日期2012年5月18日 優(yōu)先權日2012年5月18日
發(fā)明者賀樑, 范娜, 吳雯, 洪磊, 張波, 吳奔斌, 霍曉駿, 王偉杰, 宋樹彬, 楊燕 申請人:華東師范大學