欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

文件推薦方法和裝置制造方法

文檔序號:7779330閱讀:209來源:國知局
文件推薦方法和裝置制造方法
【專利摘要】本發(fā)明公開了一種文件推薦方法和裝置,屬于網(wǎng)絡(luò)【技術(shù)領(lǐng)域】。所述方法包括:根據(jù)歷史播放記錄所包含的用戶標(biāo)識與文件標(biāo)識,以用戶標(biāo)識作為第一維度,以文件標(biāo)識作為第二維度,構(gòu)造二維矩陣;根據(jù)用戶標(biāo)識與文件標(biāo)識之間的對應(yīng)關(guān)系,向所述二維矩陣的元素位置填充元素,并進行矩陣分解,得到指定矩陣;基于按照所述第一維度劃分得到的特征向量,對所述每個用戶標(biāo)識進行聚類處理,得到至少一個用戶群;基于所述至少一個用戶群,進行文件推薦。本發(fā)明通過根據(jù)歷史播放記錄包括的用戶標(biāo)識與文件標(biāo)識之間的對應(yīng)關(guān)系得到用戶群,將喜好類似的用戶標(biāo)識劃分至同一用戶群,能夠基于當(dāng)前用戶標(biāo)識所屬的指定用戶群進行推薦,提高了推薦效率和推薦成功率。
【專利說明】文件推薦方法和裝置

【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及網(wǎng)絡(luò)【技術(shù)領(lǐng)域】,特別涉及一種文件推薦方法和裝置。

【背景技術(shù)】
[0002]在日常的線上活動中,用戶時時刻刻都在面對著各種各樣的信息,但卻很難從中篩選出自己真正感興趣的信息。為了便于用戶的篩選,服務(wù)器可以根據(jù)用戶的瀏覽記錄、興趣愛好等,為用戶推薦其可能感興趣的信息。
[0003]以視頻為例,終端在播放視頻時,將其他用戶在觀看該當(dāng)前播放視頻時點擊最多的視頻推薦給當(dāng)前用戶,即通過將其他用戶的喜好類比當(dāng)前用戶的喜好,為當(dāng)前用戶推薦視頻。
[0004]但這種方式并未考慮到當(dāng)前用戶與其他用戶的喜好不同的情況,在當(dāng)前用戶與其他用戶的喜好不同時,推薦成功率很低。


【發(fā)明內(nèi)容】

[0005]為了解決現(xiàn)有技術(shù)的問題,本發(fā)明實施例提供了一種文件推薦方法和裝置。所述技術(shù)方案如下:
[0006]第一方面,提供了一種文件推薦方法,所述方法包括:
[0007]根據(jù)歷史播放記錄所包含的用戶標(biāo)識與文件標(biāo)識,以用戶標(biāo)識作為矩陣的第一維度,以文件標(biāo)識作為矩陣的第二維度,構(gòu)造二維矩陣;
[0008]根據(jù)所述歷史播放記錄中用戶標(biāo)識與文件標(biāo)識之間的對應(yīng)關(guān)系,向所述二維矩陣中與所述對應(yīng)關(guān)系相應(yīng)的元素位置填充元素;
[0009]對填充后的二維矩陣進行矩陣分解,得到指定矩陣;
[0010]按照所述第一維度對所述指定矩陣進行劃分,得到每個用戶標(biāo)識對應(yīng)的特征向量;
[0011]基于所述每個用戶標(biāo)識對應(yīng)的特征向量,對所述每個用戶標(biāo)識進行聚類處理,得到至少一個用戶群,每個用戶群包括至少一個用戶標(biāo)識;
[0012]基于所述至少一個用戶群,進行文件推薦。
[0013]第二方面,提供了一種文件推薦裝置,所述裝置包括:
[0014]矩陣構(gòu)造模塊,用于根據(jù)歷史播放記錄所包含的用戶標(biāo)識與文件標(biāo)識,以用戶標(biāo)識作為矩陣的第一維度,以文件標(biāo)識作為矩陣的第二維度,構(gòu)造二維矩陣;
[0015]填充模塊,用于根據(jù)所述歷史播放記錄中用戶標(biāo)識與文件標(biāo)識之間的對應(yīng)關(guān)系,向所述二維矩陣中與所述對應(yīng)關(guān)系相應(yīng)的元素位置填充元素;
[0016]矩陣分解模塊,用于對填充后的二維矩陣進行矩陣分解,得到指定矩陣;
[0017]向量劃分模塊,用于按照所述第一維度對所述指定矩陣進行劃分,得到每個用戶標(biāo)識對應(yīng)的特征向量;
[0018]聚類模塊,用于基于所述每個用戶標(biāo)識對應(yīng)的特征向量,對所述每個用戶標(biāo)識進行聚類處理,得到至少一個用戶群,每個用戶群包括至少一個用戶標(biāo)識;
[0019]推薦模塊,用于基于所述至少一個用戶群,進行文件推薦。
[0020]本發(fā)明實施例提供的技術(shù)方案帶來的有益效果是:
[0021]本發(fā)明實施例提供的方法和裝置,通過根據(jù)歷史播放記錄包括的用戶標(biāo)識與文件標(biāo)識之間的對應(yīng)關(guān)系得到用戶群,能夠?qū)⑾埠妙愃频挠脩魳?biāo)識劃分至同一用戶群,使得在為當(dāng)前用戶標(biāo)識推薦文件時,能夠基于該當(dāng)前用戶標(biāo)識所屬的用戶群進行推薦,而無需基于所有的用戶標(biāo)識進行推薦,考慮到了當(dāng)前用戶標(biāo)識與其他用戶標(biāo)識的喜好,提高了推薦效率和推薦成功率。

【專利附圖】

【附圖說明】
[0022]為了更清楚地說明本發(fā)明實施例中的技術(shù)方案,下面將對實施例描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
[0023]圖1是本發(fā)明實施例提供的一種文件推薦方法的流程圖;
[0024]圖2是本發(fā)明實施例提供的一種文件推薦方法的流程圖;
[0025]圖3是本發(fā)明實施例提供的一種文件推薦裝置結(jié)構(gòu)示意圖;
[0026]圖4是本發(fā)明實施例提供的一種服務(wù)器結(jié)構(gòu)示意圖。

【具體實施方式】
[0027]下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進行清楚、完整地描述,顯然,所描述的實施例是本發(fā)明一部分實施例,而不是全部的實施例。基于本發(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。
[0028]圖1是本發(fā)明實施例提供的一種文件推薦方法的流程圖。該發(fā)明實施例的執(zhí)行主體為服務(wù)器,參見圖1,所述方法包括:
[0029]101、根據(jù)歷史播放記錄所包含的用戶標(biāo)識與文件標(biāo)識,以用戶標(biāo)識作為矩陣的第一維度,以文件標(biāo)識作為矩陣的第二維度,構(gòu)造二維矩陣。
[0030]102、根據(jù)該歷史播放記錄中用戶標(biāo)識與文件標(biāo)識之間的對應(yīng)關(guān)系,向該二維矩陣中與該對應(yīng)關(guān)系相應(yīng)的元素位置填充元素。
[0031]103、對填充后的二維矩陣進行矩陣分解,得到指定矩陣。
[0032]104、按照該第一維度對該指定矩陣進行劃分,得到每個用戶標(biāo)識對應(yīng)的特征向量。
[0033]105、基于該每個用戶標(biāo)識對應(yīng)的特征向量,對該每個用戶標(biāo)識進行聚類處理,得到至少一個用戶群,每個用戶群包括至少一個用戶標(biāo)識。
[0034]106、基于該至少一個用戶群,進行文件推薦。
[0035]本發(fā)明實施例提供的方法,通過根據(jù)歷史播放記錄包括的用戶標(biāo)識與文件標(biāo)識之間的對應(yīng)關(guān)系得到用戶群,能夠?qū)⑾埠妙愃频挠脩魳?biāo)識劃分至同一用戶群,使得在為當(dāng)前用戶標(biāo)識推薦文件時,能夠基于該當(dāng)前用戶標(biāo)識所屬的用戶群進行推薦,而無需基于所有的用戶標(biāo)識進行推薦,考慮到了當(dāng)前用戶標(biāo)識與其他用戶標(biāo)識的喜好,提高了推薦效率和推薦成功率。
[0036]可選地,基于該至少一個用戶群,進行文件推薦包括:
[0037]接收打開文件的指令,該打開文件的指令攜帶當(dāng)前用戶標(biāo)識和當(dāng)前文件標(biāo)識;
[0038]根據(jù)每個用戶群包括的用戶標(biāo)識,確定該當(dāng)前用戶標(biāo)識所屬的指定用戶群,該每個用戶群根據(jù)歷史播放記錄包括的用戶標(biāo)識與文件標(biāo)識之間的對應(yīng)關(guān)系得到;
[0039]根據(jù)該用戶標(biāo)識與文件標(biāo)識之間的對應(yīng)關(guān)系以及該指定用戶群,確定待推薦的文件標(biāo)識;
[0040]推薦確定的文件標(biāo)識所指示的文件。
[0041]可選地,根據(jù)歷史播放記錄所包含的用戶標(biāo)識與文件標(biāo)識,以用戶標(biāo)識作為矩陣的第一維度,以文件標(biāo)識作為矩陣的第二維度,構(gòu)造二維矩陣包括:
[0042]對于該歷史播放記錄中的每個用戶標(biāo)識,獲取該用戶標(biāo)識對應(yīng)的文件標(biāo)識的數(shù)目;
[0043]當(dāng)該用戶標(biāo)識對應(yīng)的文件標(biāo)識的數(shù)目超過預(yù)設(shè)數(shù)目時,將該用戶標(biāo)識獲取為樣本用戶標(biāo)識;
[0044]根據(jù)該歷史播放記錄所包含的樣本用戶標(biāo)識與文件標(biāo)識,以樣本用戶標(biāo)識作為矩陣的第一維度,以文件標(biāo)識作為矩陣的第二維度,構(gòu)造二維矩陣。
[0045]可選地,根據(jù)該歷史播放記錄中用戶標(biāo)識與文件標(biāo)識之間的對應(yīng)關(guān)系,向該二維矩陣中與該對應(yīng)關(guān)系相應(yīng)的元素位置填充元素包括:
[0046]對于一個樣本用戶標(biāo)識和一個文件標(biāo)識,當(dāng)該歷史播放記錄中保存有該樣本用戶標(biāo)識與該文件標(biāo)識之間的對應(yīng)關(guān)系時,以用戶標(biāo)識作為矩陣的第一維度,以文件標(biāo)識作為矩陣的第二維度,向該二維矩陣中,與該樣本用戶標(biāo)識和該文件標(biāo)識相應(yīng)的元素位置填充第一預(yù)設(shè)閾值;
[0047]當(dāng)向該歷史播放記錄中保存的所有樣本用戶標(biāo)識和文件標(biāo)識相應(yīng)的元素位置均填充完成時,隨機從該二維矩陣剩余的元素位置中選取與已填充第一預(yù)設(shè)閾值的元素位置相等數(shù)目的元素位置,向選取的元素位置填充第二預(yù)設(shè)閾值。
[0048]可選地,對填充后的二維矩陣進行矩陣分解,得到指定矩陣包括:
[0049]將已填充第一預(yù)設(shè)閾值的元素位置的權(quán)重確定為第一權(quán)重,將已填充該第二預(yù)設(shè)閾值的元素位置的權(quán)重確定為第二權(quán)重;
[0050]根據(jù)該第一權(quán)重和該第二權(quán)重,采用隨機梯度下降算法S⑶,對該二維矩陣進行奇異值分解SVD,得到U矩陣;
[0051]將該U矩陣作為該指定矩陣。
[0052]可選地,根據(jù)該第一權(quán)重和該第二權(quán)重,采用隨機梯度下降算法S⑶,對該二維矩陣進行奇異值分解SVD,得到U矩陣之后,該方法還包括:
[0053]根據(jù)預(yù)設(shè)保留維數(shù),對該U矩陣的第二維度進行降維,將降維后的U矩陣作為該指定矩陣。
[0054]可選地,根據(jù)該用戶標(biāo)識與文件標(biāo)識之間的對應(yīng)關(guān)系以及該指定用戶群,確定待推薦的文件標(biāo)識包括:
[0055]根據(jù)該用戶標(biāo)識與文件標(biāo)識之間的對應(yīng)關(guān)系,確定每個文件標(biāo)識在該指定用戶群中所對應(yīng)的用戶標(biāo)識的數(shù)目;
[0056]按照該確定的數(shù)目從大到小的順序,確定預(yù)設(shè)數(shù)目的文件標(biāo)識。
[0057]可選地,根據(jù)該用戶標(biāo)識與文件標(biāo)識之間的對應(yīng)關(guān)系以及該指定用戶群,確定待推薦的文件標(biāo)識包括:
[0058]根據(jù)該指定用戶群中的每個用戶標(biāo)識的特征向量,計算該指定用戶群中除該當(dāng)前用戶標(biāo)識之外的每個用戶標(biāo)識與該當(dāng)前用戶標(biāo)識的相似度;
[0059]確定與該當(dāng)前用戶標(biāo)識相似度最高的用戶標(biāo)識;
[0060]根據(jù)該用戶標(biāo)識與文件標(biāo)識之間的對應(yīng)關(guān)系,確定該相似度最高的用戶標(biāo)識所對應(yīng)的文件標(biāo)識。
[0061]可選地,該第一預(yù)設(shè)閾值為1,該第二預(yù)設(shè)閾值為0,且該第一權(quán)重大于該第二權(quán)重。
[0062]上述所有可選技術(shù)方案,可以采用任意結(jié)合形成本發(fā)明的可選實施例,在此不再
--贅述。
[0063]圖2是本發(fā)明實施例提供的一種文件推薦方法的流程圖。該發(fā)明實施例的執(zhí)行主體為服務(wù)器,參見圖2,所述方法包括:
[0064]201、對于歷史播放記錄中的每個用戶標(biāo)識,該服務(wù)器獲取該用戶標(biāo)識對應(yīng)的文件標(biāo)識的數(shù)目,該歷史播放記錄包括用戶標(biāo)識與文件標(biāo)識之間的對應(yīng)關(guān)系。
[0065]本發(fā)明實施例應(yīng)用于該服務(wù)器基于根據(jù)該歷史播放記錄對用戶標(biāo)識進行分群后得到的用戶群推薦文件的場景下。其中,該服務(wù)器可以為與該當(dāng)前文件標(biāo)識關(guān)聯(lián)的服務(wù)器,或者為與該當(dāng)前文件標(biāo)識關(guān)聯(lián)的服務(wù)器中的功能模塊,本發(fā)明實施例對此不做限定。
[0066]在本發(fā)明實施例中,該服務(wù)器記錄每個用戶標(biāo)識打開的文件,一旦某一用戶標(biāo)識打開了某一文件時,該服務(wù)器在該歷史播放記錄中建立該用戶標(biāo)識與所打開的文件標(biāo)識之間的對應(yīng)關(guān)系。進一步地,該歷史播放記錄可以為該服務(wù)器保存的預(yù)設(shè)時長內(nèi)的歷史播放記錄,也即是,當(dāng)該歷史播放記錄中任一條對應(yīng)關(guān)系保留的時長已超過該預(yù)設(shè)時長時,將該保留的時長已超過該預(yù)設(shè)時長的對應(yīng)關(guān)系刪除。其中,該文件可以為服務(wù)器所提供的視頻文件、音頻文件或者文本文件等,如視頻網(wǎng)站服務(wù)器提供的網(wǎng)絡(luò)視頻文件、音頻網(wǎng)站提供的音頻文件或文檔共享服務(wù)器所提供的網(wǎng)絡(luò)文檔等,本發(fā)明實施例對此不做限定。
[0067]其中,該用戶標(biāo)識可以為用戶賬號或者終端標(biāo)識等,該文件標(biāo)識可以為文件名稱或者文件編號等,該文件標(biāo)識所指示的文件可以為視頻文件、音頻文件、文本文件等多種類型的文件,相應(yīng)的,該歷史播放記錄可以包括用戶標(biāo)識與多種類型的文件標(biāo)識之間的對應(yīng)關(guān)系,本發(fā)明實施例對此均不做限定。
[0068]在本發(fā)明實施例中,對于服務(wù)器上可以提供多種類型的文件的情況下,該服務(wù)器還可以對不同類型的文件維護對應(yīng)的歷史播放記錄,如記錄用戶標(biāo)識與視頻文件標(biāo)識之間的對應(yīng)關(guān)系、另外記錄用戶標(biāo)識與音頻文件標(biāo)識之間的對應(yīng)關(guān)系等等。對于某一指定類型來說,該服務(wù)器根據(jù)該指定類型對應(yīng)的歷史播放記錄,對用戶標(biāo)識進行分群,得到多個用戶群,則在當(dāng)前用戶標(biāo)識打開了該指定類型的文件時,該服務(wù)器即可基于該多個用戶群推薦指定類型的文件。其中,該多個用戶群是根據(jù)指定類型的文件的歷史播放記錄劃分得到的,與根據(jù)所有類型的文件的歷史播放記錄劃分的用戶群相比,該指定類型對應(yīng)的多個用戶群更能體現(xiàn)用戶對指定類型的文件的喜好,在推薦指定類型的文件時能夠進一步提高推薦成功率。
[0069]在本發(fā)明實施例中,對于該歷史播放記錄包括的一個用戶標(biāo)識來說,如果該用戶標(biāo)識打開過的文件標(biāo)識數(shù)目很小,則該用戶標(biāo)識與文件標(biāo)識之間的對應(yīng)關(guān)系并不能準(zhǔn)確地體現(xiàn)該用戶的喜好,該用戶標(biāo)識會對劃分用戶群的準(zhǔn)確性造成影響。為了保證分群的準(zhǔn)確性,該服務(wù)器可以根據(jù)用戶標(biāo)識對應(yīng)的文件標(biāo)識的數(shù)目選取樣本用戶標(biāo)識,根據(jù)選取的樣本用戶標(biāo)識進行分群,則該服務(wù)器先獲取該歷史播放記錄中每個用戶標(biāo)識對應(yīng)的文件標(biāo)識的數(shù)目。
[0070]202、當(dāng)該用戶標(biāo)識對應(yīng)的文件標(biāo)識的數(shù)目超過預(yù)設(shè)數(shù)目時,該服務(wù)器將該用戶標(biāo)識獲取為樣本用戶標(biāo)識。
[0071]具體地,該服務(wù)器在獲取到該歷史播放記錄中每個用戶標(biāo)識對應(yīng)的文件標(biāo)識的數(shù)目時,判斷每個用戶標(biāo)識對應(yīng)的文件標(biāo)識的數(shù)目是否超過預(yù)設(shè)數(shù)目,當(dāng)任一用戶標(biāo)識對應(yīng)的文件標(biāo)識的數(shù)目超過該預(yù)設(shè)數(shù)目時,將該對應(yīng)的文件標(biāo)識的數(shù)目超過該預(yù)設(shè)數(shù)目的用戶標(biāo)識作為樣本用戶標(biāo)識。當(dāng)任一用戶標(biāo)識對應(yīng)的文件標(biāo)識的數(shù)目小于或等于該預(yù)設(shè)數(shù)目時,該服務(wù)器可以丟棄該用戶標(biāo)識,或者暫時忽略該用戶標(biāo)識,等待該用戶標(biāo)識對應(yīng)的文件數(shù)目超過該預(yù)設(shè)數(shù)目時,再將該用戶標(biāo)識作為樣本用戶標(biāo)識。
[0072]其中,該用戶標(biāo)識對應(yīng)的文件標(biāo)識的數(shù)目即是指該用戶標(biāo)識打開過的文件的數(shù)目,當(dāng)該數(shù)目超過該預(yù)設(shè)數(shù)目時,可以認(rèn)為該用戶標(biāo)識與文件標(biāo)識之間的對應(yīng)關(guān)系能夠體現(xiàn)該用戶的喜好,可以用于進行分群。
[0073]例如,該歷史播放記錄中,用戶標(biāo)識A對應(yīng)的文件標(biāo)識數(shù)目為3,用戶標(biāo)識B對應(yīng)的文件標(biāo)識數(shù)目為25,假設(shè)該預(yù)設(shè)數(shù)目為10,則該服務(wù)器將用戶標(biāo)識B作為樣本用戶標(biāo)識,而不考慮用戶標(biāo)識A。
[0074]在本發(fā)明實施例中,該預(yù)設(shè)數(shù)目可以由技術(shù)人員預(yù)先設(shè)定,或者由該服務(wù)器根據(jù)該歷史播放記錄中每個用戶標(biāo)識對應(yīng)的文件標(biāo)識的數(shù)目確定,本發(fā)明實施例對此不做限定。
[0075]需要說明的是,該步驟201和步驟202為可選步驟,該服務(wù)器還可以將該歷史播放記錄包括的所有用戶標(biāo)識均作為樣本標(biāo)識,直接執(zhí)行后續(xù)步驟203,本發(fā)明實施例對此不做限定。
[0076]203、對于一個樣本用戶標(biāo)識和一個文件標(biāo)識,當(dāng)該歷史播放記錄中保存有該樣本用戶標(biāo)識與該文件標(biāo)識之間的對應(yīng)關(guān)系時,該服務(wù)器以用戶標(biāo)識作為矩陣的第一維度,以文件標(biāo)識作為矩陣的第二維度,構(gòu)造二維矩陣,向該二維矩陣中,與該樣本用戶標(biāo)識和該文件標(biāo)識相應(yīng)的元素位置填充第一預(yù)設(shè)閾值。
[0077]具體地,該待生成的二維矩陣以用戶標(biāo)識為第一維度,以文件標(biāo)識為第二維度,且該二維矩陣中的各個元素根據(jù)該用戶標(biāo)識與文件標(biāo)識之間的對應(yīng)關(guān)系確定。對于該歷史播放記錄中的一個樣本用戶標(biāo)識和一個文件標(biāo)識來說,當(dāng)該歷史播放記錄中保存有該樣本用戶標(biāo)識與該文件標(biāo)識之間的對應(yīng)關(guān)系時,表明該用戶標(biāo)識曾打開過該文件標(biāo)識所指示的文件,則向該二維矩陣中,與該用戶標(biāo)識和該文件標(biāo)識相應(yīng)的元素位置填充第一預(yù)設(shè)閾值;當(dāng)該歷史播放記錄中未保存該樣本用戶標(biāo)識與該文件標(biāo)識之間的對應(yīng)關(guān)系時,表明該用戶標(biāo)識未打開過該文件標(biāo)識所指示的文件,則暫時不向與該用戶標(biāo)識和該文件標(biāo)識相應(yīng)的元素位置填充元素。
[0078]可選地,該第一維度為行、該第二維度為列,即該二維矩陣以用戶標(biāo)識為行、以文件標(biāo)識為列;或者該第一維度為列、該第二維度為行,即該二維矩陣以用戶標(biāo)識為列、以文件標(biāo)識為行。本發(fā)明實施例對該第一維度和該第二維度不做限定。
[0079]進一步可選地,該第一預(yù)設(shè)閾值為I。
[0080]例如,該歷史播放記錄中用戶標(biāo)識與文件標(biāo)識之間的對應(yīng)關(guān)系如表1所示,“ V ”表示用戶標(biāo)識與文件標(biāo)識建立有對應(yīng)關(guān)系。
[0081]表1
[0082]

【權(quán)利要求】
1.一種文件推薦方法,其特征在于,所述方法包括: 根據(jù)歷史播放記錄所包含的用戶標(biāo)識與文件標(biāo)識,以用戶標(biāo)識作為矩陣的第一維度,以文件標(biāo)識作為矩陣的第二維度,構(gòu)造二維矩陣; 根據(jù)所述歷史播放記錄中用戶標(biāo)識與文件標(biāo)識之間的對應(yīng)關(guān)系,向所述二維矩陣中與所述對應(yīng)關(guān)系相應(yīng)的元素位置填充元素; 對填充后的二維矩陣進行矩陣分解,得到指定矩陣; 按照所述第一維度對所述指定矩陣進行劃分,得到每個用戶標(biāo)識對應(yīng)的特征向量;基于所述每個用戶標(biāo)識對應(yīng)的特征向量,對所述每個用戶標(biāo)識進行聚類處理,得到至少一個用戶群,每個用戶群包括至少一個用戶標(biāo)識; 基于所述至少一個用戶群,進行文件推薦。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,基于所述至少一個用戶群,進行文件推薦包括: 接收打開文件的指令,所述打開文件的指令攜帶當(dāng)前用戶標(biāo)識和當(dāng)前文件標(biāo)識; 根據(jù)每個用戶群包括的用戶標(biāo)識,確定所述當(dāng)前用戶標(biāo)識所屬的指定用戶群,所述每個用戶群根據(jù)歷史播放記錄包括的用戶標(biāo)識與文件標(biāo)識之間的對應(yīng)關(guān)系得到; 根據(jù)所述用戶標(biāo)識與文件標(biāo)識之間的對應(yīng)關(guān)系以及所述指定用戶群,確定待推薦的文件標(biāo)識; 推薦確定的文件標(biāo)識所指示的文件。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,根據(jù)歷史播放記錄所包含的用戶標(biāo)識與文件標(biāo)識,以用戶標(biāo)識作為矩陣的第一維度,以文件標(biāo)識作為矩陣的第二維度,構(gòu)造二維矩陣包括: 對于所述歷史播放記錄中的每個用戶標(biāo)識,獲取所述用戶標(biāo)識對應(yīng)的文件標(biāo)識的數(shù)目; 當(dāng)所述用戶標(biāo)識對應(yīng)的文件標(biāo)識的數(shù)目超過預(yù)設(shè)數(shù)目時,將所述用戶標(biāo)識獲取為樣本用戶標(biāo)識; 根據(jù)所述歷史播放記錄所包含的樣本用戶標(biāo)識與文件標(biāo)識,以樣本用戶標(biāo)識作為矩陣的第一維度,以文件標(biāo)識作為矩陣的第二維度,構(gòu)造二維矩陣。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,根據(jù)所述歷史播放記錄中用戶標(biāo)識與文件標(biāo)識之間的對應(yīng)關(guān)系,向所述二維矩陣中與所述對應(yīng)關(guān)系相應(yīng)的元素位置填充元素包括: 對于一個樣本用戶標(biāo)識和一個文件標(biāo)識,當(dāng)所述歷史播放記錄中保存有所述樣本用戶標(biāo)識與所述文件標(biāo)識之間的對應(yīng)關(guān)系時,以用戶標(biāo)識作為矩陣的第一維度,以文件標(biāo)識作為矩陣的第二維度,向所述二維矩陣中,與所述樣本用戶標(biāo)識和所述文件標(biāo)識相應(yīng)的元素位置填充第一預(yù)設(shè)閾值; 當(dāng)向所述歷史播放記錄中保存的所有樣本用戶標(biāo)識和文件標(biāo)識相應(yīng)的元素位置均填充完成時,隨機從所述二維矩陣剩余的元素位置中選取與已填充第一預(yù)設(shè)閾值的元素位置相等數(shù)目的元素位置,向選取的元素位置填充第二預(yù)設(shè)閾值。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,對填充后的二維矩陣進行矩陣分解,得到指定矩陣包括:將已填充第一預(yù)設(shè)閾值的元素位置的權(quán)重確定為第一權(quán)重,將已填充所述第二預(yù)設(shè)閾值的元素位置的權(quán)重確定為第二權(quán)重; 根據(jù)所述第一權(quán)重和所述第二權(quán)重,采用隨機梯度下降算法SGD,對所述二維矩陣進行奇異值分解SVD,得到U矩陣; 將所述U矩陣作為所述指定矩陣。
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,根據(jù)所述第一權(quán)重和所述第二權(quán)重,采用隨機梯度下降算法SGD,對所述二維矩陣進行奇異值分解SVD,得到U矩陣之后,所述方法還包括: 根據(jù)預(yù)設(shè)保留維數(shù),對所述U矩陣的第二維度進行降維,將降維后的U矩陣作為所述指定矩陣。
7.根據(jù)權(quán)利要求2所述的方法,其特征在于,根據(jù)所述用戶標(biāo)識與文件標(biāo)識之間的對應(yīng)關(guān)系以及所述指定用戶群,確定待推薦的文件標(biāo)識包括: 根據(jù)所述用戶標(biāo)識與文件標(biāo)識之間的對應(yīng)關(guān)系,確定每個文件標(biāo)識在該指定用戶群中所對應(yīng)的用戶標(biāo)識的數(shù)目; 按照所述確定的數(shù)目從大到小的順序,確定預(yù)設(shè)數(shù)目的文件標(biāo)識。
8.根據(jù)權(quán)利要求2所述的方法,其特征在于,根據(jù)所述用戶標(biāo)識與文件標(biāo)識之間的對應(yīng)關(guān)系以及所述指 定用戶群,確定待推薦的文件標(biāo)識包括: 根據(jù)所述指定用戶群中每個用戶標(biāo)識的特征向量,計算所述指定用戶群中除所述當(dāng)前用戶標(biāo)識之外的每個用戶標(biāo)識與所述當(dāng)前用戶標(biāo)識的相似度; 確定與所述當(dāng)前用戶標(biāo)識相似度最高的用戶標(biāo)識; 根據(jù)所述用戶標(biāo)識與文件標(biāo)識之間的對應(yīng)關(guān)系,確定所述相似度最高的用戶標(biāo)識所對應(yīng)的文件標(biāo)識。
9.根據(jù)權(quán)利要求1-8任一項所述的方法,其特征在于,所述第一預(yù)設(shè)閾值為1,所述第二預(yù)設(shè)閾值為O,且所述第一權(quán)重大于所述第二權(quán)重。
10.一種文件推薦裝置,其特征在于,所述裝置包括: 矩陣構(gòu)造模塊,用于根據(jù)歷史播放記錄所包含的用戶標(biāo)識與文件標(biāo)識,以用戶標(biāo)識作為矩陣的第一維度,以文件標(biāo)識作為矩陣的第二維度,構(gòu)造二維矩陣; 填充模塊,用于根據(jù)所述歷史播放記錄中用戶標(biāo)識與文件標(biāo)識之間的對應(yīng)關(guān)系,向所述二維矩陣中與所述對應(yīng)關(guān)系相應(yīng)的元素位置填充元素; 矩陣分解模塊,用于對填充后的二維矩陣進行矩陣分解,得到指定矩陣; 向量劃分模塊,用于按照所述第一維度對所述指定矩陣進行劃分,得到每個用戶標(biāo)識對應(yīng)的特征向量; 聚類模塊,用于基于所述每個用戶標(biāo)識對應(yīng)的特征向量,對所述每個用戶標(biāo)識進行聚類處理,得到至少一個用戶群,每個用戶群包括至少一個用戶標(biāo)識; 推薦模塊,用于基于所述至少一個用戶群,進行文件推薦。
11.根據(jù)權(quán)利要求10所述的裝置,其特征在于,所述推薦模塊包括: 指令接收單元,用于接收打開文件的指令,所述打開文件的指令攜帶當(dāng)前用戶標(biāo)識和當(dāng)前文件標(biāo)識; 指定群確定單元,用于根據(jù)每個用戶群包括的用戶標(biāo)識,確定所述當(dāng)前用戶標(biāo)識所屬的指定用戶群,所述每個用戶群根據(jù)歷史播放記錄包括的用戶標(biāo)識與文件標(biāo)識之間的對應(yīng)關(guān)系得到; 文件標(biāo)識確定單元,用于根據(jù)所述用戶標(biāo)識與文件標(biāo)識之間的對應(yīng)關(guān)系以及所述指定用戶群,確定待推薦的文件標(biāo)識; 推薦單元,用于推薦確定的文件標(biāo)識所指示的文件。
12.根據(jù)權(quán)利要求10所述的裝置,其特征在于,所述矩陣構(gòu)造模塊包括: 數(shù)目獲取單元,用于對于所述歷史播放記錄中的每個用戶標(biāo)識,獲取所述用戶標(biāo)識對應(yīng)的文件標(biāo)識的數(shù)目; 樣本獲取單元,用于當(dāng)所述用戶標(biāo)識對應(yīng)的文件標(biāo)識的數(shù)目超過預(yù)設(shè)數(shù)目時,將所述用戶標(biāo)識獲取為樣本用戶標(biāo)識; 矩陣構(gòu)造單元,用于根據(jù)所述歷史播放記錄所包含的樣本用戶標(biāo)識與文件標(biāo)識,以樣本用戶標(biāo)識作為矩陣的第一維度,以文件標(biāo)識作為矩陣的第二維度,構(gòu)造二維矩陣。
13.根據(jù)權(quán)利要求12所述的裝置,其特征在于,所述填充模塊包括: 第一填充單元,用于對于一個樣本用戶標(biāo)識和一個文件標(biāo)識,當(dāng)所述歷史播放記錄中保存有所述樣本用戶標(biāo)識與所述文件標(biāo)識之間的對應(yīng)關(guān)系時,以用戶標(biāo)識作為矩陣的第一維度,以文件標(biāo)識作為矩陣的第二維度,向所述二維矩陣中,與所述樣本用戶標(biāo)識和所述文件標(biāo)識相應(yīng)的元素位置 填充第一預(yù)設(shè)閾值; 第二填充單元,用于當(dāng)向所述歷史播放記錄中保存的所有樣本用戶標(biāo)識和文件標(biāo)識相應(yīng)的元素位置均填充完成時,隨機從所述二維矩陣剩余的元素位置中選取與已填充第一預(yù)設(shè)閾值的元素位置相等數(shù)目的元素位置,向選取的元素位置填充第二預(yù)設(shè)閾值。
14.根據(jù)權(quán)利要求13所述的裝置,其特征在于,所述矩陣分解模塊包括: 權(quán)重確定單元,用于將已填充第一預(yù)設(shè)閾值的元素位置的權(quán)重確定為第一權(quán)重,將已填充所述第二預(yù)設(shè)閾值的元素位置的權(quán)重確定為第二權(quán)重; 分解單元,用于根據(jù)所述第一權(quán)重和所述第二權(quán)重,采用隨機梯度下降算法SGD,對所述二維矩陣進行奇異值分解SVD,得到U矩陣; 指定矩陣單元,用于將所述U矩陣作為所述指定矩陣。
15.根據(jù)權(quán)利要求14所述的裝置,其特征在于,所述裝置還包括: 降維模塊,用于根據(jù)預(yù)設(shè)保留維數(shù),對所述U矩陣的第二維度進行降維,將降維后的U矩陣作為所述指定矩陣。
16.根據(jù)權(quán)利要求11所述的裝置,其特征在于,所述文件標(biāo)識確定單元包括: 用戶數(shù)目確定子單元,用于根據(jù)所述用戶標(biāo)識與文件標(biāo)識之間的對應(yīng)關(guān)系,確定每個文件標(biāo)識在該指定用戶群中所對應(yīng)的用戶標(biāo)識的數(shù)目; 第一標(biāo)識確定子單元,用于按照所述確定的數(shù)目從大到小的順序,確定預(yù)設(shè)數(shù)目的文件標(biāo)識。
17.根據(jù)權(quán)利要求11所述的裝置,其特征在于,所述文件標(biāo)識確定單元包括: 相似度計算子單元,用于根據(jù)所述指定用戶群中每個用戶標(biāo)識的特征向量,計算所述指定用戶群中除所述當(dāng)前用戶標(biāo)識之外的每個用戶標(biāo)識與所述當(dāng)前用戶標(biāo)識的相似度;用戶標(biāo)識確定子單元,用于確定與所述當(dāng)前用戶標(biāo)識相似度最高的用戶標(biāo)識; 第二標(biāo)識確定子單元,用于根據(jù)所述用戶標(biāo)識與文件標(biāo)識之間的對應(yīng)關(guān)系,確定所述相似度最聞的用戶標(biāo)識所對應(yīng)的文件標(biāo)識。
18.根據(jù)權(quán)利要求10-17任一項所述的裝置,其特征在于,所述第一預(yù)設(shè)閾值為1,所述第二預(yù)設(shè)閾值為0,且所 述第一權(quán)重大于所述第二權(quán)重。
【文檔編號】H04N21/258GK104079960SQ201310653411
【公開日】2014年10月1日 申請日期:2013年12月5日 優(yōu)先權(quán)日:2013年12月5日
【發(fā)明者】尹程果 申請人:深圳市騰訊計算機系統(tǒng)有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
马公市| 同仁县| 岳池县| 神农架林区| 乌拉特前旗| 调兵山市| 绵阳市| 伊宁市| 阳信县| 城步| 丹寨县| 滕州市| 阳江市| 隆子县| 多伦县| 三江| 吉木乃县| 乐昌市| 剑阁县| 重庆市| 龙泉市| 吐鲁番市| 海门市| 托里县| 左权县| 涞源县| 于都县| 若尔盖县| 平罗县| 石棉县| 新龙县| 岳阳市| 湘潭县| 武乡县| 蓬溪县| 于田县| 亳州市| 九龙城区| 大石桥市| 江陵县| 乌拉特后旗|