本發(fā)明涉及視頻推薦技術(shù)領(lǐng)域,特別是涉及一種基于用戶觀影行為的視頻評分方法、裝置及視頻系統(tǒng)。
背景技術(shù):
雖然目前主流網(wǎng)站都會有用戶對所觀看視頻進行打分的設計,但是國內(nèi)大部分人并沒有養(yǎng)成觀看完視頻,對視頻進行打分評價的習慣。基本都是通過用戶對視頻的隱式操作獲取評,這就導致視頻網(wǎng)站無法精確獲取用戶對視頻喜好程度的有效信息,而且,現(xiàn)有的隱式操作評價機制因為每次都是統(tǒng)計一段時間范圍內(nèi)的觀看視頻,這些觀看視頻可能只占所有視頻的一部分,評分系統(tǒng)無法覆蓋的全部視頻,導致為用戶設計的個性化推薦效果會大打折扣。
技術(shù)實現(xiàn)要素:
本發(fā)明的目的是針對現(xiàn)有技術(shù)中存在的技術(shù)缺陷,而提供一種基于用戶觀影行為的視頻評分方法及其裝置,其綜合利用用戶的隱式行為,例如觀看次數(shù)、觀看時長、是否收藏、是否分享、是否頂踩等因素,然后根據(jù)視頻所屬專輯、視頻的出品人有效打分以進一步對未被點擊的視頻或新視頻進行參考打分。
為實現(xiàn)本發(fā)明的目的所采用的技術(shù)方案是:
一種基于用戶觀影行為的視頻評分方法,包括,
統(tǒng)計預定時間內(nèi)所有視頻的相關(guān)指標,
清洗相關(guān)指標數(shù)據(jù)并分別進行映射轉(zhuǎn)換;
按預定權(quán)重獲取每個視頻的評分,
按該視頻的評分計算同一歸屬類別下所有統(tǒng)計范圍內(nèi)視頻的平均分值作為其有效分值,根據(jù)歸屬類別計算統(tǒng)計范圍外未被點擊視頻的有效分值。
所述的視頻相關(guān)指標包括獨立訪客數(shù)、訪客的訪問次數(shù)、視頻的有效播放時長、視頻被收藏數(shù)、視頻分享次數(shù)、被頂?shù)拇螖?shù)和被踩的次數(shù)。
所述的歸屬分類包括所屬專輯和出品人,所述的有效分值按權(quán)重根據(jù)所屬專輯和出品人兩個歸屬分類的平均分值計算所得。
所述的映射轉(zhuǎn)換包括獨立訪客數(shù)和訪客的訪問次數(shù)的范圍區(qū)間映射,視頻的有效播放時長占據(jù)該視頻物理時長的比例的范圍區(qū)間映射,視頻被收藏數(shù)和視頻分享次數(shù)分別乘以映射分值后的平均分值計算,被頂?shù)拇螖?shù)和被踩的次數(shù)的分值計算。
所述的相關(guān)指標數(shù)據(jù)存儲在分布式存儲系統(tǒng)上。
一種基于用戶觀影行為的視頻評分裝置,包括,
統(tǒng)計模塊,用以統(tǒng)計預定時間內(nèi)所有視頻的相關(guān)指標,
清洗映射模塊,用以清洗相關(guān)指標數(shù)據(jù)并分別進行映射轉(zhuǎn)換;
評分計算模塊,用以按預定權(quán)重獲取每個視頻的評分,
賦值模塊,用以按該視頻的評分計算同一歸屬類別下所有統(tǒng)計范圍內(nèi)視頻的平均分值作為其有效分值,然后根據(jù)歸屬類別計算統(tǒng)計范圍外未被點擊視頻的有效分值。
所述的視頻相關(guān)指標包括獨立訪客數(shù)、訪客的訪問次數(shù)、視頻的有效播放時長、視頻被收藏數(shù)、視頻分享次數(shù)、被頂?shù)拇螖?shù)和被踩的次數(shù)。
所述的歸屬分類包括所屬專輯和出品人,所述的有效分值為所屬專輯和出品人兩個歸屬分類的平均值。
清洗映射模塊包括
訪問次數(shù)類映射子模塊,用以將獨立訪客數(shù)和訪客的訪問次數(shù)進行對應的范圍區(qū)間映射,
播放時長映射子模塊,用以將視頻的有效播放時長占據(jù)該視頻物理時長的比例進行對應的范圍區(qū)間映射,
交互類指標映射子模塊,用以根據(jù)視頻被收藏數(shù)和視頻分享次數(shù)分別乘以行為映射分值后的平均分值計算,
評價類指標映射子模塊,用以根據(jù)行為映射分值計算被頂?shù)拇螖?shù)和被踩的次數(shù)對應的分值。
一種具有所述的基于用戶觀影行為的視頻評分裝置的視頻系統(tǒng)。
與現(xiàn)有技術(shù)相比,本發(fā)明的有益效果是:
本發(fā)明首先充分利用了用戶對視頻的各種隱式喜好操作,例如點擊、收藏、分享、頂踩等數(shù)據(jù)指標,利用這些指標,設計公式有效地對一段時間內(nèi)被點擊視頻進行了評分,這些評分從側(cè)面反映出了用戶的喜好程度。進而由被點擊視頻評分對視頻所屬專輯、出品人進行了評價打分,最后再利用專輯、出品人分值,對一定時間內(nèi)未被點擊的視頻也賦予一定的分值,從而為全部視頻進行打分。借助專輯、出品人的視頻關(guān)聯(lián)性,利用客戶對演員、出品人、導演等的喜好特征,提高了評分的準確性,提高后續(xù)推薦系統(tǒng)的精準度。
附圖說明
圖1所示為本發(fā)明的基于用戶觀影行為的視頻評分方法及其裝置的流程示意圖。
具體實施方式
以下結(jié)合附圖和具體實施例對本發(fā)明作進一步詳細說明。應當理解,此處所描述的具體實施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。
本發(fā)明旨在對未被點擊的視頻進行預評分,同時也發(fā)現(xiàn)并解決了新上傳視頻的評分冷啟動問題,即由于視頻剛剛被上傳,假如簡單的給其評分賦值為0的話,很可能在后期的內(nèi)部排序或者其它規(guī)則的推薦上,對其造成不利影響。因為這些新上傳的視頻,其內(nèi)容很可能對用戶是有吸引力的,僅僅是沒有及時的展示給用戶而已。
本發(fā)明基于用戶觀影行為的視頻評分方法,包括,
步驟101,統(tǒng)計預定時間內(nèi)所有視頻的相關(guān)指標,所述的視頻相關(guān)指標包括UV、VV、PT、KC、SC、DC和DD。其中,UV:Unique Vistor,獨立訪客數(shù),指一天內(nèi)觀看某視頻的人數(shù)。同一個視頻被同一個人多次觀看記為一次。
VV:Visit View,訪客的訪問次數(shù)。每訪問一次計做一次。
PT:Play Time,視頻的有效播放時長。
KC:Kepp Count,視頻被收藏數(shù)。
S C:Share Count,視頻分享次數(shù)。
DC:Digg Up,視頻頂踩功能中,用戶明確表示喜歡的次數(shù)。
DD:Digg Down,視頻頂踩功能中,用戶明確表示不喜歡的次數(shù)
統(tǒng)計預定時間如10天內(nèi),所有視頻的相關(guān)指標,能有效保證數(shù)據(jù)的豐富性,提高后續(xù)預評分的準確性,同時,若數(shù)據(jù)量較大的話,一般會選擇將數(shù)據(jù)存儲在分布式存儲系統(tǒng)如HDFS上。
步驟102,清洗相關(guān)指標數(shù)據(jù)并分別進行映射轉(zhuǎn)換;
該步驟中,清洗數(shù)據(jù)主要包括了數(shù)據(jù)格式清洗、刷量作弊清洗等。具體的映射轉(zhuǎn)換包括:
(1)將次數(shù)類指標如UV、VV按照不同范圍的次數(shù)映射到不同的值;例如次數(shù)count<1000時,對應分值為1,1000<=count<=5000時,分值為2,此類指標映射分值范圍為[1,5];
(2)時間類指標PT,按照每個用戶觀看時長占據(jù)視頻物理時長的比例,映射為不同的分值。如一個用戶的(觀看時長)/(物理時長)<=10%,則將分值映射為1,10%<=(觀看時長)/(物理時長)<=30%,score為2。此類指標映射分值范圍[1,5];
(3)收藏指標KC,視頻每被收藏一次,分值為5,最后用(5*KC)/UV,求出平均收藏分值;
(4)分享指標SC,視頻每被分享一次,分值為4,最后用(4*SC)/UV,求出平均分享分值;
(5)頂踩數(shù)比例(DC/DD),將其映射為不同分值,映射值為DCD。
將不同的指標采用不同的規(guī)則進行映射,綜合考慮了普遍性和個人行為的影響,保證最終分值的合理性,具體分值等可根據(jù)視頻類型的不同進行調(diào)整。
步驟103,按預定權(quán)重獲取每個視頻的評分,
Score1=Wvv*VV+Wuv*UV+Wpt*PT
Score2=Wkc*KC+Wsc*SC+Wdcd*DCD
vidscore=Score1+Score2
上式中的VV、UV、PT、KC、SC、DCD分別為經(jīng)過映射處理后的分值,而Wvv,Wuv,Wpt,Wkc,Wsc,Wdcd分別為對應分值的權(quán)重,利用第三個公式計算10天內(nèi)被點擊視頻的評分。其中,各權(quán)重類指標可根據(jù)視頻類型或者當前流行等進行具體調(diào)整。
步驟104,按該視頻的評分計算同一歸屬類別下所有統(tǒng)計范圍內(nèi)視頻的平均分值作為其有效分值,根據(jù)歸屬類別計算統(tǒng)計范圍外未被點擊視頻的有效分值。
所述的歸屬分類包括所屬專輯和出品人,所述的有效分值按權(quán)重根據(jù)所屬專輯和出品人兩個歸屬分類的平均分值計算所得,當然,歸屬分類還可包括導演、演員等,在具體有效分值計算時可進行按權(quán)重計算。
通常一個出品人會上傳多個視頻,而多個視頻又會根據(jù)其視頻內(nèi)容被劃分到不同專輯下,所以可以計算專輯或出品人下包含多個視頻的分數(shù)均值,作為專輯或者出品人的有效分值,如下述計算公式:
albumscore=(vid1score+vid2score+…+vidkscore)/(vidnumber1)
userscore=(vid1score+vid2score+…+Vidnscore)/(vidnumber2)
其中vid:視頻id,album:視頻所屬專輯,user:視頻所屬出品人,vidnumberl,vidnumber2分別為專輯、出品人下包含視頻的個數(shù)。
當視頻數(shù)量很大時,10天內(nèi)被點擊的視頻只能是全部視頻的一部分,那些未被點擊的視頻,尤其是新上傳的視頻,則根據(jù)所屬專輯和出品人兩個歸屬分類的平均分值計算按權(quán)重計算得到,如用其對應專輯和出品人分值的均值作為此類視頻的有效分值。
(vid_noclick)score=(albumscore+userscore)/2
上式中的vid_noclick為10天內(nèi)未被點擊的視頻,albumscore和userscore為該視頻對應的專輯和出品人。
本發(fā)明首先充分利用了用戶對視頻的各種隱式喜好操作,例如點擊、收藏、分享、頂踩等數(shù)據(jù)指標,利用這些指標,設計公式有效地對一段時間內(nèi)被點擊視頻進行了評分,這些評分從側(cè)面反映出了用戶的喜好程度。進而由被點擊視頻評分對視頻所屬專輯、出品人進行了評價打分,最后再利用專輯、出品人分值,對一定時間內(nèi)未被點擊的視頻也賦予一定的分值,從而為全部視頻進行打分。借助專輯、出品人的視頻關(guān)聯(lián)性,利用客戶對演員等的喜好特征,提高了評分的準確性,提高后續(xù)推薦系統(tǒng)的精準度。
同時,本發(fā)明還公開了一種基于用戶觀影行為的視頻評分裝置,包括,
統(tǒng)計模塊,用以統(tǒng)計預定時間內(nèi)所有視頻的相關(guān)指標,所述的視頻相關(guān)指標包括UV、VV、PT、KC、SC、DC和DD。
清洗映射模塊,用以清洗相關(guān)指標數(shù)據(jù)并分別進行映射轉(zhuǎn)換;其包括,
訪問次數(shù)類映射子模塊,用以將獨立訪客數(shù)和訪客的訪問次數(shù)進行對應的范圍區(qū)間映射,
播放時長映射子模塊,用以將視頻的有效播放時長占據(jù)該視頻物理時長的比例進行對應的范圍區(qū)間映射,
交互類指標映射子模塊,用以根據(jù)視頻被收藏數(shù)和視頻分享次數(shù)分別乘以行為映射分值后的平均分值計算,
評價類指標映射子模塊,用以根據(jù)行為映射分值計算被頂?shù)拇螖?shù)和被踩的次數(shù)對應的分值。
評分計算模塊,用以按預定權(quán)重獲取每個視頻的評分,
賦值模塊,用以按該視頻的評分計算同一歸屬類別下所有統(tǒng)計范圍內(nèi)視頻的平均分值作為其有效分值,完后根據(jù)歸屬類別計算統(tǒng)計范圍外未被點擊視頻的有效分值。所述的歸屬分類包括所屬專輯和出品人,所述的有效分值為所屬專輯和出品人兩個歸屬分類的平均值。
通過模塊間的有效數(shù)據(jù)處理,實現(xiàn)了對一定周期內(nèi)未點擊視頻的打分且保證其時效性,提高了客戶有后臺視頻庫的交互性,使視頻能感受到當前流行趨勢,為后臺進行有效精準推薦奠定基礎(chǔ)。
同時,本發(fā)明還公開了一種具有所述的基于用戶觀影行為的視頻評分裝置的視頻系統(tǒng),該視頻系統(tǒng)內(nèi)的所有視頻能進行有效打分,能提高在一定時間周期內(nèi)未點擊視頻的推薦分值有效更新,保證后臺推薦系統(tǒng)的精準度,改善個性化推薦效果,提高用戶感受。
以上所述僅是本發(fā)明的優(yōu)選實施方式,應當指出的是,對于本技術(shù)領(lǐng)域的普通技術(shù)人員來說,在不脫離本發(fā)明原理的前提下,還可以做出若干改進和潤飾,這些改進和潤飾也應視為本發(fā)明的保護范圍。