一種產(chǎn)品信息過(guò)濾推薦方法和裝置制造方法
【專(zhuān)利摘要】本發(fā)明提出了一種產(chǎn)品信息過(guò)濾推薦方法和裝置,該方法包括步驟:預(yù)先獲取用戶(hù)對(duì)產(chǎn)品的多種評(píng)價(jià)數(shù)據(jù);根據(jù)評(píng)價(jià)數(shù)據(jù),訓(xùn)練推薦模型;輸入用戶(hù)的多種評(píng)價(jià)數(shù)據(jù),應(yīng)用訓(xùn)練后的推薦模型計(jì)算用戶(hù)對(duì)產(chǎn)品的評(píng)分預(yù)測(cè)值,將評(píng)分預(yù)測(cè)值滿(mǎn)足預(yù)設(shè)要求的產(chǎn)品添加到推薦列表。本發(fā)明還提供一種產(chǎn)品信息過(guò)濾推薦裝置,包括數(shù)據(jù)庫(kù)、模型訓(xùn)練模塊和模型應(yīng)用模塊;數(shù)據(jù)庫(kù),用于預(yù)先獲取用戶(hù)對(duì)產(chǎn)品的多種評(píng)價(jià)數(shù)據(jù);模型訓(xùn)練模塊,用于根據(jù)評(píng)價(jià)數(shù)據(jù),訓(xùn)練推薦模型;模型應(yīng)用模塊,用于輸入當(dāng)前用戶(hù)的多種評(píng)價(jià)數(shù)據(jù),應(yīng)用訓(xùn)練后的推薦模型計(jì)算用戶(hù)對(duì)產(chǎn)品的評(píng)分預(yù)測(cè)值,將評(píng)分預(yù)測(cè)值滿(mǎn)足預(yù)設(shè)要求的產(chǎn)品添加到推薦列表。該方法和裝置,能夠提高產(chǎn)品信息過(guò)濾推薦的準(zhǔn)確度。
【專(zhuān)利說(shuō)明】一種產(chǎn)品信息過(guò)濾推薦方法和裝置
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及網(wǎng)絡(luò)信息【技術(shù)領(lǐng)域】,尤其是涉及一種產(chǎn)品信息過(guò)濾推薦方法和裝置。
【背景技術(shù)】
[0002] 隨著互聯(lián)網(wǎng)技術(shù)的不斷發(fā)展,越來(lái)越多的產(chǎn)品信息通過(guò)網(wǎng)絡(luò)這一媒體進(jìn)行傳播, 大量產(chǎn)品信息存在于網(wǎng)絡(luò)當(dāng)中。當(dāng)用戶(hù)面臨大量的物品,難以找到或選擇適合自己的物品 時(shí),推薦技術(shù)根據(jù)大量的歷史數(shù)據(jù)和當(dāng)前實(shí)時(shí)數(shù)據(jù)分析計(jì)算用戶(hù)偏好,預(yù)測(cè)用戶(hù)對(duì)物品的 喜好程度,從而幫助用戶(hù)找到適合的物品。例如,圖書(shū)推薦系統(tǒng)可以幫助用戶(hù)選擇合適的書(shū) 來(lái)閱讀,而在線電影租賃網(wǎng)站可以推薦合適的電影提高用戶(hù)滿(mǎn)意度。推薦模型的數(shù)據(jù)來(lái)源 是用戶(hù)和物品的相關(guān)屬性和用戶(hù)對(duì)物品的行為數(shù)據(jù),比如用戶(hù)的人口統(tǒng)計(jì)學(xué)屬性、用戶(hù)的 答題數(shù)據(jù)、用戶(hù)對(duì)物品的評(píng)分、用戶(hù)對(duì)物品的收藏、用戶(hù)對(duì)物品的轉(zhuǎn)發(fā)、用戶(hù)購(gòu)買(mǎi)記錄等數(shù) 據(jù)。
[0003] 其中,現(xiàn)有技術(shù)中,一種應(yīng)用較為廣泛的推薦技術(shù),是協(xié)同過(guò)濾推薦。協(xié)同過(guò)濾推 薦,也就是給定某用戶(hù),將和該用戶(hù)具有相似偏好的用戶(hù)群喜好的物品推薦給他。兩個(gè)用戶(hù) 之間的偏好相似度是基于他們對(duì)物品的評(píng)分記錄。協(xié)同過(guò)濾推薦的算法中的一種是基于模 型的算法。而基于模型的算法是假設(shè)數(shù)據(jù)符合某種特定的模型,然后用歷史數(shù)據(jù)對(duì)模型進(jìn) 行訓(xùn)練,訓(xùn)練結(jié)果再用于推薦?;谀P偷耐扑]算法中最著名的"矩陣因子化"算法。該算 法將用戶(hù)對(duì)物品的評(píng)分?jǐn)?shù)據(jù)投射到一個(gè)共同的有限維實(shí)數(shù)空間,在該空間中將每個(gè)用戶(hù)和 每個(gè)物品分別對(duì)應(yīng)到一個(gè)向量?;谶@些向量,可以計(jì)算用戶(hù)的推薦。
[0004] 傳統(tǒng)的協(xié)同過(guò)濾算法,只考慮用戶(hù)對(duì)物品的評(píng)分?jǐn)?shù)據(jù),由于評(píng)分?jǐn)?shù)據(jù)僅能從一個(gè) 角度反應(yīng)用戶(hù)的意向,但是不能夠全面反應(yīng),較為片面,因此,通過(guò)傳統(tǒng)的協(xié)同過(guò)濾算法推 薦的產(chǎn)品信息往往具有較大的局限性。
【發(fā)明內(nèi)容】
[0005] 本發(fā)明提出了一種產(chǎn)品信息過(guò)濾推薦方法和裝置,以解決上述問(wèn)題。
[0006] 為了達(dá)到上述目的,本發(fā)明的技術(shù)方案是這樣實(shí)現(xiàn)的:
[0007] 本發(fā)明提供一種產(chǎn)品信息過(guò)濾推薦方法,包括步驟:
[0008] 步驟A,預(yù)先獲取用戶(hù)對(duì)產(chǎn)品的多種評(píng)價(jià)數(shù)據(jù);
[0009] 步驟B,根據(jù)多種所述評(píng)價(jià)數(shù)據(jù),訓(xùn)練推薦模型;
[0010] 步驟C,輸入當(dāng)前用戶(hù)的多種評(píng)價(jià)數(shù)據(jù),應(yīng)用訓(xùn)練后的推薦模型計(jì)算用戶(hù)對(duì)產(chǎn)品的 評(píng)分預(yù)測(cè)值,將評(píng)分預(yù)測(cè)值滿(mǎn)足預(yù)設(shè)要求的產(chǎn)品添加到推薦列表。
[0011] 其中,所述評(píng)價(jià)數(shù)據(jù),包括評(píng)分?jǐn)?shù)據(jù)、收藏?cái)?shù)據(jù)、轉(zhuǎn)發(fā)數(shù)據(jù)和反饋數(shù)據(jù);
[0012] 所述評(píng)分?jǐn)?shù)據(jù)包括用戶(hù)代號(hào)、項(xiàng)代號(hào)、評(píng)分值、評(píng)分時(shí)間;
[0013] 所述收藏?cái)?shù)據(jù)包括用戶(hù)代號(hào)、項(xiàng)代號(hào)、收藏時(shí)間;
[0014] 所述轉(zhuǎn)發(fā)數(shù)據(jù)包括用戶(hù)代號(hào)、項(xiàng)代號(hào)、轉(zhuǎn)發(fā)時(shí)間;
[0015] 所述反饋數(shù)據(jù)包括用戶(hù)代號(hào)、題號(hào)、用戶(hù)選擇的答案項(xiàng)代號(hào)、答題時(shí)間。
[0016] 其中,所述步驟B包括步驟:
[0017] 步驟B1,進(jìn)行推薦模型設(shè)定,設(shè)定的推薦模型如下:
[0018]
【權(quán)利要求】
1. 一種產(chǎn)品信息過(guò)濾推薦方法,其特征在于,包括步驟: 步驟A,預(yù)先獲取用戶(hù)對(duì)產(chǎn)品的多種評(píng)價(jià)數(shù)據(jù); 步驟B,根據(jù)多種所述評(píng)價(jià)數(shù)據(jù),訓(xùn)練推薦模型; 步驟C,輸入當(dāng)前用戶(hù)的多種評(píng)價(jià)數(shù)據(jù),應(yīng)用訓(xùn)練后的推薦模型計(jì)算用戶(hù)對(duì)產(chǎn)品的評(píng)分 預(yù)測(cè)值,將評(píng)分預(yù)測(cè)值滿(mǎn)足預(yù)設(shè)要求的產(chǎn)品添加到推薦列表。
2. 根據(jù)權(quán)利要求1所述的產(chǎn)品信息過(guò)濾推薦方法,其特征在于,所述評(píng)價(jià)數(shù)據(jù),包括評(píng) 分?jǐn)?shù)據(jù)、收藏?cái)?shù)據(jù)、轉(zhuǎn)發(fā)數(shù)據(jù)和反饋數(shù)據(jù); 所述評(píng)分?jǐn)?shù)據(jù)包括用戶(hù)代號(hào)、項(xiàng)代號(hào)、評(píng)分值、評(píng)分時(shí)間; 所述收藏?cái)?shù)據(jù)包括用戶(hù)代號(hào)、項(xiàng)代號(hào)、收藏時(shí)間; 所述轉(zhuǎn)發(fā)數(shù)據(jù)包括用戶(hù)代號(hào)、項(xiàng)代號(hào)、轉(zhuǎn)發(fā)時(shí)間; 所述反饋數(shù)據(jù)包括用戶(hù)代號(hào)、題號(hào)、用戶(hù)選擇的答案項(xiàng)代號(hào)、答題時(shí)間。
3. 根據(jù)權(quán)利要求2所述的產(chǎn)品信息過(guò)濾推薦方法,其特征在于,所述步驟B包括步驟: 步驟B1,進(jìn)行推薦模型設(shè)定,設(shè)定的推薦模型如下:
其中,U為當(dāng)前用戶(hù),i為當(dāng)前項(xiàng),在為用戶(hù)U對(duì)項(xiàng)i的預(yù)測(cè)評(píng)分,早為全部評(píng)分的平均 值,bu為用戶(hù)U的基準(zhǔn)評(píng)分偏移,bi為項(xiàng)i的基準(zhǔn)評(píng)分偏移,q,X,yW,y?,S均為項(xiàng)i的因 子向量,R(u)為用戶(hù)u已經(jīng)評(píng)分的項(xiàng)集合,rw為用戶(hù)u對(duì)項(xiàng)i的實(shí)際評(píng)分,弓為預(yù)計(jì)算的項(xiàng) i的基準(zhǔn)評(píng)分偏移,為預(yù)計(jì)算的用戶(hù)U的基準(zhǔn)評(píng)分偏移,5^,.為預(yù)計(jì)算的基準(zhǔn)評(píng)分預(yù)測(cè),nW (u)、N?(u)為隱性評(píng)分,(1)代表收藏,(2)代表轉(zhuǎn)發(fā),A(u)為用戶(hù)反饋問(wèn)題數(shù)據(jù)的代號(hào)集 合; 步驟B2,根據(jù)多種所述評(píng)價(jià)數(shù)據(jù),計(jì)算出所述推薦模型中的未知參數(shù)。
4. 根據(jù)權(quán)利要求3所述的產(chǎn)品信息過(guò)濾推薦方法,其特征在于,所述B2包括步驟: 輸入歷史評(píng)分?jǐn)?shù)據(jù)集合s^。,一巧因子的秩f(wàn) ; 對(duì)每個(gè)項(xiàng)i,計(jì)算Qi,Xi ; 設(shè)定循環(huán)次數(shù)為 20,參數(shù)? << 0. 002, 1 << 0. 04, I2 << 25, I3 << 10 ;
計(jì)算總平均:
預(yù)計(jì)算基準(zhǔn)評(píng)分預(yù)測(cè):
初始化模型參數(shù); 計(jì)算和項(xiàng)i無(wú)關(guān)的部分:
若i R(u),則是,11車(chē)卸々/ A,e山I在立' 為Xi梯度步累加信息,/皿Cw g; 對(duì)如bu,bi進(jìn)行梯度步:
若j R(u)則對(duì)Xj.進(jìn)行梯度步:
若j nW (U)則對(duì)收藏?cái)?shù)據(jù)yW進(jìn)行梯度步:
若j N? (U)則對(duì)轉(zhuǎn)發(fā)數(shù)據(jù)y?進(jìn)行梯度步:
若j A(u)則對(duì)答題數(shù)據(jù)S進(jìn)行梯度步:
返回參數(shù)"F點(diǎn)是,與,卸,X,/>,y2),--,公的值。
5. 根據(jù)權(quán)利要求1所述的產(chǎn)品信息過(guò)濾推薦方法,其特征在于,所述步驟B中訓(xùn)練推薦 模型為按照預(yù)設(shè)頻率在預(yù)設(shè)時(shí)間段進(jìn)行訓(xùn)練。
6. 根據(jù)權(quán)利要求4所述的產(chǎn)品信息過(guò)濾推薦方法,其特征在于,所述步驟C包括步驟: 實(shí)時(shí)計(jì)算用戶(hù)U對(duì)項(xiàng)i的評(píng)分預(yù)測(cè)值心?,輸入用戶(hù)U,項(xiàng)i,根據(jù) 聲….《^ b" bi Qi Pu 輸出u對(duì)項(xiàng)i的評(píng)分預(yù)測(cè)值元 計(jì)算項(xiàng)之間的相似性,輸入項(xiàng)il和項(xiàng)i2,根據(jù)
輸出項(xiàng)il和項(xiàng)i2的相似性; 計(jì)算用戶(hù)i和用戶(hù)j之間的相似性,輸入用戶(hù)Ui和用戶(hù)U2,根據(jù)
輸出用戶(hù)Ui和用戶(hù)U2的相似性。
7. 根據(jù)權(quán)利要求6所述的產(chǎn)品信息過(guò)濾推薦方法,其特征在于,所述步驟C還包括步 驟: 給定用戶(hù),計(jì)算該用戶(hù)和所有其他用戶(hù)的相似性,選出相似性為正數(shù),且排名最靠前的 前第一預(yù)設(shè)數(shù)值個(gè)添加到相似的用戶(hù)列表; 給定項(xiàng),計(jì)算該項(xiàng)和所有其他項(xiàng)的相似性,選出相似性為正數(shù),且排名最靠前的前第二 預(yù)設(shè)數(shù)值個(gè)添加到相似的項(xiàng)列表; 給定用戶(hù)U,計(jì)算該用戶(hù)對(duì)所有項(xiàng)的評(píng)分預(yù)測(cè),選出評(píng)分大于早bu的前第H預(yù)設(shè)數(shù)值個(gè) 添加到項(xiàng)推薦列表。
8. 根據(jù)權(quán)利要求7所述的產(chǎn)品信息過(guò)濾推薦方法,其特征在于,所述步驟C之后還包括 步驟: 用戶(hù)U登錄后,當(dāng)監(jiān)測(cè)到該用戶(hù)有評(píng)分、收藏、轉(zhuǎn)發(fā)行為時(shí),則更新當(dāng)前用戶(hù)的各種評(píng) 價(jià)數(shù)據(jù),并更新該用戶(hù)的項(xiàng)推薦列表和用戶(hù)推薦列表。
9. 一種產(chǎn)品信息過(guò)濾推薦裝置,其特征在于,包括數(shù)據(jù)庫(kù)、模型訓(xùn)練模塊和模型應(yīng)用模 塊; 所述數(shù)據(jù)庫(kù),用于預(yù)先獲取用戶(hù)對(duì)產(chǎn)品的多種評(píng)價(jià)數(shù)據(jù); 所述模型訓(xùn)練模塊,用于根據(jù)多種所述評(píng)價(jià)數(shù)據(jù),訓(xùn)練推薦模型; 所述模型應(yīng)用模塊,用于輸入當(dāng)前用戶(hù)的多種評(píng)價(jià)數(shù)據(jù),應(yīng)用訓(xùn)練后的推薦模型計(jì)算 用戶(hù)對(duì)產(chǎn)品的評(píng)分預(yù)測(cè)值,將評(píng)分預(yù)測(cè)值滿(mǎn)足預(yù)設(shè)要求的產(chǎn)品添加到推薦列表。
10. 根據(jù)權(quán)利要求8所述的產(chǎn)品信息過(guò)濾推薦裝置,其特征在于,所述子模型訓(xùn)練模 塊,用于: 進(jìn)行推薦模型設(shè)定,設(shè)定的推薦模型如下:
其中,U為當(dāng)前用戶(hù),i為當(dāng)前項(xiàng),;;,為用戶(hù)u對(duì)項(xiàng)i的預(yù)測(cè)評(píng)分,為全部評(píng)分的平均 值,bu為用戶(hù)U的基準(zhǔn)評(píng)分偏移,bi為項(xiàng)i的基準(zhǔn)評(píng)分偏移,q,X,yW,y?,S均為項(xiàng)i的因 子向量,R(u)為用戶(hù)u已經(jīng)評(píng)分的項(xiàng)集合,rw為用戶(hù)u對(duì)項(xiàng)i的實(shí)際評(píng)分,&為預(yù)計(jì)算的項(xiàng) i的基準(zhǔn)評(píng)分偏移,4為預(yù)計(jì)算的用戶(hù)U的基準(zhǔn)評(píng)分偏移,gw為預(yù)計(jì)算的基準(zhǔn)評(píng)分預(yù)測(cè),N<" (u)、N?(u)為隱性評(píng)分,(1)代表收藏,(2)代表轉(zhuǎn)發(fā),A(u)為用戶(hù)反饋問(wèn)題數(shù)據(jù)的代號(hào)集 合; 根據(jù)多種所述評(píng)價(jià)數(shù)據(jù),計(jì)算出所述推薦模型中的未知參數(shù)。
【文檔編號(hào)】G06F17/30GK104424247SQ201310380269
【公開(kāi)日】2015年3月18日 申請(qǐng)日期:2013年8月28日 優(yōu)先權(quán)日:2013年8月28日
【發(fā)明者】康友三 申請(qǐng)人:北京鬧米科技有限公司