欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種基于混合語義矩陣的視頻推薦方法

文檔序號:8512538閱讀:264來源:國知局
一種基于混合語義矩陣的視頻推薦方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于視頻檢索技術(shù)、視頻推薦技術(shù)領(lǐng)域,具體涉及一種基于混合語義矩陣 的視頻推薦方法。
【背景技術(shù)】
[0002] 隨著互聯(lián)網(wǎng)日益快速的發(fā)展,充斥在各個網(wǎng)站上的內(nèi)容急劇增加,用戶在獲得豐 富信息的同時也被大量無關(guān)信息所淹沒,為了應(yīng)對這個難題,出現(xiàn)了以搜索引擎為代表的 信息檢索技術(shù),可以按照資源相關(guān)度排序給出搜索結(jié)果。然而對視頻服務(wù)來說,只提供搜索 服務(wù)顯然不能很好地滿足用戶需求,因?yàn)樵诙鄶?shù)情況下,用戶不會確切知道自己想要觀看 視頻的名字,甚至沒有特別強(qiáng)烈的想要繼續(xù)瀏覽視頻網(wǎng)站的意愿,因此視頻推薦系統(tǒng)應(yīng)運(yùn) 而生,它根據(jù)用戶的喜好,個性化地為用戶推薦他可能喜歡的視頻內(nèi)容,提升用戶體驗(yàn)的同 時也增加了視頻網(wǎng)站的瀏覽量。
[0003] -般認(rèn)為推薦系統(tǒng)的方法可以按照數(shù)據(jù)和模型兩個維度進(jìn)行分類。從使用的數(shù)據(jù) 上來看,推薦系統(tǒng)可以分為協(xié)同過濾系統(tǒng)、內(nèi)容過濾系統(tǒng)和社會化過濾系統(tǒng)等;從使用的模 型來看可分為基于鄰域的模型、矩陣分解模型和圖模型等。其中最常用的還是協(xié)同過濾系 統(tǒng)和內(nèi)容過濾系統(tǒng)。
[0004] 協(xié)同過濾(Collaborative Filtering)主要通過用戶的歷史行為分析出用戶的興 趣并給用戶做出推薦。它的基本假設(shè)就是用戶會喜歡跟自己之前喜歡視頻比較類似的視 頻;或者用戶會喜歡跟自己有相同興趣的用戶喜歡的視頻。因此在給這個用戶做推薦的時 候,需要先找到與其有相似興趣的用戶或者找到某個無評分項(xiàng)目的相似項(xiàng)目,并根據(jù)相似 性進(jìn)行推薦。協(xié)同過濾準(zhǔn)確度比較高。
[0005] 內(nèi)容過濾(Content Filtering)的基本思想是給用戶推薦和他們之前喜歡的視頻 在內(nèi)容上相似的其他視頻。該方法的基本策略是:首先根據(jù)歷史數(shù)據(jù),將所有項(xiàng)目和目標(biāo)用 戶都用一套興趣模板來表示,再根據(jù)該用戶過去的喜好記錄,得到該用戶的興趣模板,進(jìn)而 計(jì)算所有影片和該用戶興趣模板的相似度,選擇相似度高的影片進(jìn)行推薦。該方法的關(guān)鍵 在于抽取出關(guān)鍵詞,然后確定這些關(guān)鍵詞的權(quán)重,從而得到視頻的向量模型。雖然現(xiàn)在已經(jīng) 出現(xiàn)類似Jinni的專家標(biāo)注系統(tǒng),可以為視頻標(biāo)注標(biāo)簽統(tǒng)一的參考標(biāo)準(zhǔn),但是由于專家標(biāo) 注的工作量非常大又沒有公認(rèn)的收益,因此專家標(biāo)注在實(shí)際中并沒有大規(guī)模使用。內(nèi)容過 濾方法雖然存在抽取關(guān)鍵詞、分配標(biāo)簽權(quán)重的問題,但是比照協(xié)同過濾方法,該方法沒有冷 啟動項(xiàng)目的問題;同時,該方法完全不需要目標(biāo)用戶以外其他用戶的興趣特征,從而大大減 少了算法的處理代價,簡單、高效。
[0006] 協(xié)同過濾所存在的缺陷是:該方法必須維護(hù)一個龐大的用戶-項(xiàng)目矩陣,需要很 大的計(jì)算量,且該方法不能冷啟動,也就是對于新加入的視頻或者用戶都不能做出推薦。內(nèi) 容過濾所存在的缺陷是:由于該方法中的特征抽取和特征權(quán)重分配環(huán)節(jié)多是依靠專家經(jīng) 驗(yàn),不十分準(zhǔn)確,所以影響了該方法的準(zhǔn)確率。

【發(fā)明內(nèi)容】

[0007] 本發(fā)明針對上述問題,提出一種基于混合語義矩陣的視頻推薦方法,在內(nèi)容過濾 推薦方法的基礎(chǔ)上作出改進(jìn),利用Word2 VeC將視頻標(biāo)簽向量化,并利用熵化方法得到標(biāo)簽 權(quán)重,進(jìn)而得到用戶個性化語義矩陣進(jìn)行視頻推薦,能夠有效提高視頻推薦的準(zhǔn)確率。
[0008] 本發(fā)明采用的技術(shù)方案如下:
[0009] -種基于混合語義矩陣的視頻推薦方法,其步驟包括:
[0010] 1)對視頻描述信息進(jìn)行分詞,根據(jù)詞頻提取關(guān)鍵詞作為視頻描述標(biāo)簽;
[0011] 2)通過Word2vec工具對包含所述視頻描述標(biāo)簽在內(nèi)的各視頻標(biāo)簽進(jìn)行向量化;
[0012] 3)采用熵化法得到各視頻標(biāo)簽的權(quán)重,并構(gòu)建具有權(quán)重的混合語義矩陣,通過所 述混合語義矩陣表示視頻與其標(biāo)簽之間的對應(yīng)關(guān)系;
[0013] 4)根據(jù)所述混合語義矩陣,將視頻的相似性計(jì)算轉(zhuǎn)化為向量的相似度計(jì)算,實(shí)現(xiàn) 對用戶的個性化視頻推薦。
[0014] 進(jìn)一步地,步驟1)對視頻描述信息進(jìn)行分詞后,按照詞頻排序提取描述詞匯中的 Top5作為視頻描述信息的關(guān)鍵詞。
[0015] 進(jìn)一步地,步驟2)所述視頻標(biāo)簽,除所述視頻描述標(biāo)簽外,還包括下列中的一種 或多種:演員、導(dǎo)演、年代、地區(qū)、類型。
[0016] 進(jìn)一步地,步驟3)所述混合語義矩陣的行代表不同視頻對象,列代表不同視頻標(biāo) 簽,行與列的交叉點(diǎn)代表該視頻標(biāo)簽表示該視頻對象的準(zhǔn)確程度。
[0017] 進(jìn)一步地,步驟4)根據(jù)所述混合語義矩陣,使用內(nèi)容過濾方法對用戶進(jìn)行個性化 視頻推薦。
[0018] 本發(fā)明的關(guān)鍵點(diǎn)是:a)通過米用株度學(xué)習(xí)工具Word2vec對視頻標(biāo)簽進(jìn)彳丁提取和 向量化;b)通過使用熵化法的方式來進(jìn)行混合語義矩陣計(jì)算;c)構(gòu)建具有權(quán)重的混合語義 矩陣。本發(fā)明在繼承內(nèi)容過濾推薦算法簡單、高效的特點(diǎn)的同時,也實(shí)現(xiàn)了智能特征提取和 標(biāo)簽量化、權(quán)重分配,避免了這個過程中的專家參與,提高了視頻推薦的準(zhǔn)確率。
【附圖說明】
[0019] 圖1是基于混合語義矩陣的視頻推薦方法的流程圖。
[0020] 圖2是語義網(wǎng)絡(luò)示例圖。
[0021] 圖3是語義網(wǎng)絡(luò)轉(zhuǎn)化示例圖。
【具體實(shí)施方式】
[0022] 為使本發(fā)明的上述目的、特征和優(yōu)點(diǎn)能夠更加明顯易懂,下面通過具體實(shí)施例和 附圖,對本發(fā)明做進(jìn)一步說明。
[0023] 圖1是本發(fā)明方法的流程圖,該方法首先對視頻描述信息進(jìn)行分詞,并根據(jù)詞頻 提取其中top5作為視頻描述標(biāo)簽,加上視頻的演員、導(dǎo)演等標(biāo)簽項(xiàng),組成視頻描述向量。進(jìn) 而通過word2vec算法對文字化的視頻特征向量進(jìn)行量化,從而在不依賴主觀專家知識的 情況下將視頻特征向量量化,再針對個性化推薦目標(biāo)用戶,利用其用戶評分記錄,使用熵化 法訓(xùn)練得到每個描述標(biāo)簽的權(quán)值,進(jìn)而形成用戶個性化語義矩陣,使用內(nèi)容過濾方法對該 用戶進(jìn)行個性化視頻推薦。
[0024] 1.基于word2vec的視頻標(biāo)簽提取
[0025] 在內(nèi)容過濾視頻推薦系統(tǒng)中,最基礎(chǔ)的就是抽取出特征,以及如何通過這些特征 計(jì)算視頻之間的相似度。本發(fā)明中,首先利用分詞技術(shù)將視頻的描述信息轉(zhuǎn)化為一系列詞 匯,再根據(jù)詞頻排序,提取視頻描述信息中的關(guān)鍵詞Top5,以這些關(guān)鍵詞和演員、導(dǎo)演、年代 等視頻信息作為視頻的特征向量,用來描述一個視頻。為了便于計(jì)算視頻之間的相似性,本 發(fā)明利用word2vec技術(shù)將特征向量中的詞匯量化,從而將視頻之間的相似性轉(zhuǎn)化為向量 之間相似性的計(jì)算。
[0026] 1)視頻標(biāo)簽提取
[0027] 本發(fā)明中,先將視頻的描述信息進(jìn)行分詞,并剔除其中的虛詞(包括助詞、副詞 等),再按照詞頻排序,提取描述詞匯中的Top5作為視頻描述信息的關(guān)鍵詞(也可以選取其 它數(shù)量的關(guān)鍵詞)。比如一個視頻的信息如下表1所示;
[0028] 表1視頻信息示例表
【主權(quán)項(xiàng)】
1. 一種基于混合語義矩陣的視頻推薦方法,其步驟包括: 1) 對視頻描述信息進(jìn)行分詞,根據(jù)詞頻提取關(guān)鍵詞作為視頻描述標(biāo)簽; 2) 通過Word2vec工具對包含所述視頻描述標(biāo)簽在內(nèi)的各視頻標(biāo)簽進(jìn)行向量化; 3) 采用熵化法得到各視頻標(biāo)簽的權(quán)重,并構(gòu)建具有權(quán)重的混合語義矩陣,通過所述混 合語義矩陣表示視頻與其標(biāo)簽之間的對應(yīng)關(guān)系; 4) 根據(jù)所述混合語義矩陣,將視頻的相似性計(jì)算轉(zhuǎn)化為向量的相似度計(jì)算,實(shí)現(xiàn)對用 戶的個性化視頻推薦。
2. 如權(quán)利要求1所述的方法,其特征在于:步驟1)對視頻描述信息進(jìn)行分詞后,按照 詞頻排序提取描述詞匯中的Top5作為視頻描述信息的關(guān)鍵詞。
3. 如權(quán)利要求1所述的方法,其特征在于:步驟2)所述視頻標(biāo)簽,除所述視頻描述標(biāo) 簽外,還包括下列中的一種或多種:演員、導(dǎo)演、年代、地區(qū)、類型。
4. 如權(quán)利要求1所述的方法,其特征在于:步驟3)采用熵化法得到各視頻標(biāo)簽的權(quán)重 的方法是: a) 根據(jù)用戶歷史評價得到用戶喜好向量,進(jìn)而得到用戶喜好矩陣,所述用戶喜好矩陣 中每一行代表一個用戶的喜好,每一列代表一個視頻標(biāo)簽維度; b) 統(tǒng)計(jì)各個標(biāo)簽t在各個喜好向量中出現(xiàn)的詞頻f(t,ci),其中ci表示用戶,并計(jì)算 每個用戶ci的詞頻總數(shù)f (ci) = sum (f (t, ci)),由此得到每個標(biāo)簽的j:商值; c) 根據(jù)步驟b)統(tǒng)計(jì)的詞頻數(shù),計(jì)算各個標(biāo)簽在訓(xùn)練數(shù)據(jù)集中的熵值: η Entropy (t) = [ p(t, c^logipCtjCi)), i-0 其中p (t, Ci) Zf(Lci) A(Ci), n為標(biāo)簽的總數(shù)目; d) 根據(jù)各個標(biāo)簽的熵值,采用邏輯斯蒂方程計(jì)算各個特征的分類貢獻(xiàn)度: Weight (t) - ^ ^ ^entropy(t)-threshold 其中threshold是歸一化閾值。
5. 如權(quán)利要求1所述的方法,其特征在于:步驟3)所述混合語義矩陣的行代表不同視 頻對象,列代表不同視頻標(biāo)簽,行與列的交叉點(diǎn)代表該視頻標(biāo)簽表示該視頻對象的準(zhǔn)確程 度。
6. 如權(quán)利要求1所述的方法,其特征在于:步驟4)根據(jù)所述混合語義矩陣,使用內(nèi)容 過濾方法對用戶進(jìn)行個性化視頻推薦。
【專利摘要】本發(fā)明涉及一種基于混合語義矩陣的視頻推薦方法,其步驟包括:1)對視頻描述信息進(jìn)行分詞,根據(jù)詞頻提取關(guān)鍵詞作為視頻描述標(biāo)簽;2)通過Word2vec工具對包含所述視頻描述標(biāo)簽在內(nèi)的各視頻標(biāo)簽進(jìn)行向量化;3)采用熵化法得到各視頻標(biāo)簽的權(quán)重,并構(gòu)建具有權(quán)重的混合語義矩陣,通過所述混合語義矩陣表示視頻與其標(biāo)簽之間的對應(yīng)關(guān)系;4)根據(jù)所述混合語義矩陣,將視頻的相似性計(jì)算轉(zhuǎn)化為向量的相似度計(jì)算,實(shí)現(xiàn)對用戶的個性化視頻推薦。本發(fā)明在繼承內(nèi)容過濾推薦算法簡單、高效的特點(diǎn)的同時,實(shí)現(xiàn)了智能特征提取和標(biāo)簽量化、權(quán)重分配,避免了這個過程中的專家參與,提高了視頻推薦的準(zhǔn)確率。
【IPC分類】G06F17-30
【公開號】CN104834686
【申請?zhí)枴緾N201510184876
【發(fā)明人】毛志, 牛溫佳, 趙衛(wèi)中, 張博, 敖吉, 管洋洋, 譚建龍, 郭莉
【申請人】中國科學(xué)院信息工程研究所
【公開日】2015年8月12日
【申請日】2015年4月17日
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1
柳河县| 新平| 库车县| 桃源县| 鲁山县| 南安市| 来凤县| 手游| 平原县| 财经| 沂源县| 治多县| 沅江市| 镇赉县| 正镶白旗| 梧州市| 万盛区| 革吉县| 广东省| 梓潼县| 中山市| 分宜县| 滁州市| 灵璧县| 来宾市| 噶尔县| 泽库县| 新民市| 平潭县| 长子县| 梓潼县| 泾阳县| 蛟河市| 游戏| 黔南| 商洛市| 遵化市| 商城县| 山东| 南澳县| 新密市|