基于卡爾曼濾波的混合推薦系統(tǒng)及方法
【專利摘要】本發(fā)明公開了一種基于卡爾曼濾波的混合推薦系統(tǒng)及方法,本發(fā)明采用選擇性加權(quán)的混合推薦方式,首先得到內(nèi)容過濾和基于物品的協(xié)同過濾推薦得到的候選結(jié)果,并利用卡爾曼濾波算法對(duì)權(quán)重進(jìn)行最優(yōu)估計(jì),再將初步的推薦結(jié)果進(jìn)行加權(quán)混合來產(chǎn)生新的推薦結(jié)果。與現(xiàn)有技術(shù)相比,本發(fā)明能夠?qū)崟r(shí)動(dòng)態(tài)更新各推薦組件的權(quán)重,并對(duì)其進(jìn)行最優(yōu)無偏估計(jì);根據(jù)系統(tǒng)的反饋優(yōu)化,持續(xù)調(diào)整系統(tǒng)狀態(tài);顯著提高推薦系統(tǒng)的準(zhǔn)確率、召回率和覆蓋率,有效提高推薦質(zhì)量,具有推廣使用的價(jià)值。
【專利說明】
基于卡爾曼濾波的混合推薦系統(tǒng)及方法
技術(shù)領(lǐng)域
[0001] 本發(fā)明設(shè)及一種新的加權(quán)混合推薦方法,尤其設(shè)及一種基于卡爾曼濾波的混合推 薦系統(tǒng)及方法。
【背景技術(shù)】
[0002] 隨著當(dāng)代網(wǎng)絡(luò)技術(shù)和互聯(lián)網(wǎng)應(yīng)用的飛速發(fā)展,信息過載已經(jīng)成為無法避免的問 題,如何幫助用戶過濾無用信息,發(fā)現(xiàn)有價(jià)值的信息越來越受到技術(shù)人員的關(guān)注。無疑個(gè)性 化推薦技術(shù)已經(jīng)成為目前解決信息過載問題的有效技術(shù)。主要的推薦算法包括:協(xié)同過濾 算法、基于內(nèi)容過濾算法、基于標(biāo)簽的推薦算法、基于隱語義模型的推薦算法等等。但每個(gè) 算法都有其長(zhǎng)處和短處,單一算法難W適應(yīng)眾多用戶的個(gè)性化需求。比如基于物品的協(xié)同 過濾推薦算法是通過用戶的歷史偏好數(shù)據(jù)計(jì)算物品之間的相似性,然后將與用戶歷史興趣 近似的物品推薦給該用戶。其具有冷啟動(dòng)、物品稀疏性等問題。基于內(nèi)容的推薦算法是給用 戶推薦他之前喜歡的物品相類似的其他物品?;趦?nèi)容的推薦算法難W發(fā)現(xiàn)用戶的潛在興 趣,推薦的物品缺乏新穎性。
[0003] 有些系統(tǒng)采用加權(quán)方式的混合推薦技術(shù),將協(xié)同過濾和基于內(nèi)容的推薦算法結(jié)合 使用來提升推薦結(jié)果的質(zhì)量。在動(dòng)態(tài)權(quán)重研究方面,考慮到狀態(tài)存儲(chǔ)等方面的原因,目前的 加權(quán)混合算法一般僅根據(jù)上一次的推薦結(jié)果的反饋來優(yōu)化權(quán)重,并沒有考慮結(jié)果反饋的持 續(xù)影響。運(yùn)會(huì)導(dǎo)致權(quán)重狀態(tài)波動(dòng)幅度大,系統(tǒng)不穩(wěn)定,不能很好地解決反應(yīng)推薦策略的分配 問題。
【發(fā)明內(nèi)容】
[0004] 本發(fā)明的目的就在于為了解決上述問題而提供一種基于卡爾曼濾波的混合推薦 系統(tǒng)及方法。
[0005] 本發(fā)明通過W下技術(shù)方案來實(shí)現(xiàn)上述目的:
[0006] 本發(fā)明一種基于卡爾曼濾波的混合推薦系統(tǒng),包括數(shù)據(jù)預(yù)處理模塊、協(xié)同過濾推 薦模塊、內(nèi)容推薦模塊、卡爾曼濾波模塊、推薦結(jié)果整合模塊和反饋優(yōu)化模塊,所述數(shù)據(jù)預(yù) 處理模塊的兩個(gè)數(shù)據(jù)輸出端分別通過所述協(xié)同過濾推薦模塊和內(nèi)容推薦模塊與所述推薦 結(jié)果整合模塊的輸入端連接,所述推薦結(jié)果整合模塊的數(shù)據(jù)輸出端與所述反饋優(yōu)化模塊的 數(shù)據(jù)輸入端連接,所述反饋優(yōu)化模塊的數(shù)據(jù)輸出端通過所述卡爾曼濾波模塊與所述推薦結(jié) 果整合模塊連接。
[0007] 本發(fā)明一種基于卡爾曼濾波的混合推薦方法,包括W下步驟:
[000引1)卡爾曼濾波
[0009] 卡爾曼濾波主要用于估測(cè)離散控制系統(tǒng)的狀態(tài),運(yùn)個(gè)系統(tǒng)過程可W用隨機(jī)差分方 程表示:
[0010] 化= Axk-i+Buk+wk-i [00川觀ii方程為:
[0012] zk = Hxk+vk
[OOU] 上面兩式中,X讀示k時(shí)刻的系統(tǒng)狀態(tài),uk是系統(tǒng)k時(shí)刻的控制量,A和B是系統(tǒng)參數(shù), zk表示k時(shí)刻系統(tǒng)的測(cè)量值,Η為測(cè)量系統(tǒng)的參數(shù),wk/vk是過程/測(cè)量的噪聲,p(v)~N(0,R), p(w)~N(0,Q),
[0014] 2)建立混合推薦模型
[001引對(duì)于用戶U,在第i次推薦中,設(shè)ItemCF和CB的權(quán)重分別citem(i,u)和ccB(i,u),其比 值
為方便,接下來的闡述中,本文將省去U,
[0016]假定x(i)與x(i-l)之間存在線性關(guān)系f:
[0017] x(i) = x(i-l)+av(i-l)
[0018] v(i) =x(i-l)-x(i-2)
[0019] 其中α為系統(tǒng)參數(shù),由實(shí)驗(yàn)得到,為了增強(qiáng)或減緩比值X的變化;
[0020] 卡爾曼濾波中的系統(tǒng)狀態(tài)變量可表示為:
[0021] xk= [X化),v(k) ]τ
[0022] 將上一次的后驗(yàn)狀態(tài)值;嫁~1作為第Κ次的觀測(cè)量zk:
[0023]
[0024] 模型參數(shù)A、H可由線性關(guān)系f推出:
[0025]
[0026] 因?yàn)橄到y(tǒng)和測(cè)量噪聲的初始值對(duì)卡爾曼濾波算法的最終結(jié)果影響很小,只會(huì)影響 算法結(jié)果收斂的速度,本文將系統(tǒng)和測(cè)量噪聲的協(xié)方差矩陣根據(jù)粗略實(shí)驗(yàn)分別設(shè)為:
[0027]
[0028] 3)算法過程:
[0029] (1)數(shù)據(jù)預(yù)處理,得到結(jié)構(gòu)化數(shù)據(jù);
[0030] (2)進(jìn)行基于物品的協(xié)同過濾推薦(ItemCF)和基于內(nèi)容的推薦(CB)過程,得到各 個(gè)模塊的初步推薦結(jié)果PltrmCF和PCB ;
[0031] (3)進(jìn)行卡爾曼濾波過程,預(yù)測(cè)權(quán)重比值Xi;
[0032] 卡爾曼濾波包括預(yù)測(cè)和更新兩個(gè)過程:
[0033] a預(yù)測(cè):
[0034] 初步權(quán)值預(yù)測(cè):
[0035]
[0036] 先驗(yàn)誤差協(xié)方差預(yù)測(cè):
[0037]
[0038] b更新修正:
[0039] 卡爾曼濾波增益Kk修正:
[0040]
[0041] 更新權(quán)值預(yù)測(cè):
[0042]
[0043] 后驗(yàn)誤差協(xié)方差矩陣更新:
[0044]
[0045] (4)根據(jù)修正后的估測(cè)比值,計(jì)算得到ItemCF和CB算法的權(quán)重,并計(jì)算最終的推薦 結(jié)果;
[0046] (5)驗(yàn)證推薦結(jié)果:根據(jù)反饋計(jì)算ItemCF和CB推薦的商品在用戶真正購(gòu)買的物品 中所占的比重,將其比值作為下一次的觀測(cè)變量Zk+l。
[0047] 本發(fā)明利用基于內(nèi)容推薦和基于物品的協(xié)同過濾推薦產(chǎn)生初步的推薦列表,利用 卡爾曼模型的回歸優(yōu)化特性,計(jì)算出兩個(gè)推薦算法的權(quán)重比值,再進(jìn)一步計(jì)算它們各自的 權(quán)重,通過加權(quán)混合的方式,合成最終的推薦結(jié)果,通過用戶的反饋和優(yōu)化,對(duì)系統(tǒng)狀態(tài)進(jìn) 行更新,修正權(quán)重值。
[004引本發(fā)明的有益效果在于:
[0049] 本發(fā)明是一種基于卡爾曼濾波的混合推薦系統(tǒng)及方法,與現(xiàn)有技術(shù)相比,本發(fā)明 能夠?qū)崟r(shí)動(dòng)態(tài)更新各推薦組件的權(quán)重,并對(duì)其進(jìn)行最優(yōu)無偏估計(jì);根據(jù)系統(tǒng)的反饋優(yōu)化,持 續(xù)調(diào)整系統(tǒng)狀態(tài);顯著提高推薦系統(tǒng)的準(zhǔn)確率、召回率和覆蓋率,有效提高推薦質(zhì)量,具有 推廣使用的價(jià)值。
【附圖說明】
[0050] 圖1本發(fā)明的系統(tǒng)模塊圖;
[0051 ]圖2本發(fā)明所使用的算法流程圖;
[0052] 圖3本發(fā)明混合推薦中的權(quán)重更新過程圖。
【具體實(shí)施方式】
[0053] 下面結(jié)合附圖對(duì)本發(fā)明作進(jìn)一步說明:
[0054] 如圖1所示:本發(fā)明一種基于卡爾曼濾波的混合推薦系統(tǒng),包括數(shù)據(jù)預(yù)處理模塊、 協(xié)同過濾推薦模塊、內(nèi)容推薦模塊、卡爾曼濾波模塊、推薦結(jié)果整合模塊和反饋優(yōu)化模塊, 所述數(shù)據(jù)預(yù)處理模塊的兩個(gè)數(shù)據(jù)輸出端分別通過所述協(xié)同過濾推薦模塊和內(nèi)容推薦模塊 與所述推薦結(jié)果整合模塊的輸入端連接,所述推薦結(jié)果整合模塊的數(shù)據(jù)輸出端與所述反饋 優(yōu)化模塊的數(shù)據(jù)輸入端連接,所述反饋優(yōu)化模塊的數(shù)據(jù)輸出端通過所述卡爾曼濾波模塊與 所述推薦結(jié)果整合模塊連接。本發(fā)明采用選擇性加權(quán)的混合推薦方式,將基于內(nèi)容過濾和 基于物品的協(xié)同過濾推薦得到的候選結(jié)果進(jìn)行加權(quán)混合,來產(chǎn)生新的推薦結(jié)果。加權(quán)混合 推薦方式的關(guān)鍵就是準(zhǔn)確預(yù)測(cè)各推薦算法的權(quán)重。卡爾曼濾波算法的核屯、正是根據(jù)觀測(cè)的 數(shù)據(jù),對(duì)系統(tǒng)狀態(tài)進(jìn)行無偏估計(jì)。本算法使用卡爾曼濾波來預(yù)測(cè)并修正各個(gè)推薦算法的權(quán) 重。
[0055] 本發(fā)明提出一種基于卡爾曼濾波的混合推薦方法,包括W下步驟:
[0056] 1卡爾曼濾波
[0057] 卡爾曼濾波主要用于估測(cè)離散控制系統(tǒng)的狀態(tài),運(yùn)個(gè)系統(tǒng)過程可W用隨機(jī)差分方 程表示:
[0化引 化= Axk-i+Buk+wk-i
[0059] 觀測(cè)方程為:
[0060] zk = Hxk+vk
[0061 ] 上面兩式中,xk表示k時(shí)刻的系統(tǒng)狀態(tài),Uk是系統(tǒng)k時(shí)刻的控制量,A和B是系統(tǒng)參數(shù), zk表示k時(shí)刻系統(tǒng)的測(cè)量值,Η為測(cè)量系統(tǒng)的參數(shù),wk/vk是過程/測(cè)量的噪聲,p(v)~N(0,R), p(w)~N(0,Q),
[0062] 2建立混合推薦模型
[00創(chuàng)對(duì)于用戶U,在第i次推薦中,設(shè)ItemCF和CB的權(quán)重分別citem(i,u)和ccB(i,u),其比 值
%方便,接下來的闡述中,本文將省去U,
[0064]假定x(i)與x(i-l)之間存在線性關(guān)系f:
[00化]x(i) =x(i-l)+av(i-l)
[0066] v(i) =x(i-l)-x(i-2)
[0067] 其中α為系統(tǒng)參數(shù),由實(shí)驗(yàn)得到,為了增強(qiáng)或減緩比值X的變化;
[0068] 卡爾曼濾波中的系統(tǒng)狀態(tài)變量可表示為:
[0069] xk= [X化),v(k) ]τ
[0070] 將上一次的后驗(yàn)狀態(tài)值;咕.V作為第Κ次的觀測(cè)量zk:
[0071]
[0072] 模型參數(shù)A、H可由線性關(guān)系f推出:
[0073]
[0074] 因?yàn)橄到y(tǒng)和測(cè)量噪聲的初始值對(duì)卡爾曼濾波算法的最終結(jié)果影響很小,只會(huì)影響 算法結(jié)果收斂的速度,本文將系統(tǒng)和測(cè)量噪聲的協(xié)方差矩陣根據(jù)粗略實(shí)驗(yàn)分別設(shè)為:
[0075]
[0076] 3算法過程(如圖2所示):
[0077] (1)數(shù)據(jù)預(yù)處理,得到結(jié)構(gòu)化數(shù)據(jù);
[0078] (2)進(jìn)行基于物品的協(xié)同過濾推薦(ItemCF)和基于內(nèi)容的推薦(CB)過程,得到各 個(gè)模塊的初步推薦結(jié)果PltemCF和PCB ;
[0079] (3)進(jìn)行卡爾曼濾波過程,預(yù)測(cè)權(quán)重比值xi;
[0080] 卡爾曼濾波包括預(yù)測(cè)和更新兩個(gè)過程:
[00川 a預(yù)測(cè):
[0082] 初步權(quán)值預(yù)測(cè):
[0083]
[0084] 先驗(yàn)誤差協(xié)方差預(yù)測(cè):
[0085]
[00化]b更新修正:
[0087] 卡爾曼濾波增益Kk修正:
[008引 Kk ^滬;'滬巧巧滬今巧)-.3
[0089] 更新權(quán)值預(yù)測(cè):
[0090] 穿》-餐專&如…怒棄;.)
[0091 ]后驗(yàn)誤差協(xié)方差矩陣更新:
[0092] ^ & 孩 K'V
[0093] (4)根據(jù)修正后的估測(cè)比值,計(jì)算得到ItemCF和CB算法的權(quán)重,并計(jì)算最終的推薦 結(jié)果;
[0094] (5)驗(yàn)證推薦結(jié)果:根據(jù)反饋計(jì)算ItemCF和CB推薦的商品在用戶真正購(gòu)買的物品 中所占的比重,將其比值作為下一次的觀測(cè)變量Zk+l。
[00M]通過上述步驟,隨著推薦次數(shù)的增多,根據(jù)卡爾曼濾波算法收斂和自回歸優(yōu)化的 特性,系統(tǒng)模型會(huì)不斷迭代循環(huán)優(yōu)化(如圖3所示),就能有效地對(duì)兩種推薦算法的結(jié)果進(jìn)行 選擇性加權(quán),對(duì)模塊的權(quán)重進(jìn)行無偏估計(jì)。因此,可W有效提高推薦系統(tǒng)的準(zhǔn)確率和召回 率,顯著提高推薦質(zhì)量。
[0096] W上顯示和描述了本發(fā)明的基本原理和主要特征及本發(fā)明的優(yōu)點(diǎn)。本行業(yè)的技術(shù) 人員應(yīng)該了解,本發(fā)明不受上述實(shí)施例的限制,上述實(shí)施例和說明書中描述的只是說明本 發(fā)明的原理,在不脫離本發(fā)明精神和范圍的前提下,本發(fā)明還會(huì)有各種變化和改進(jìn),運(yùn)些變 化和改進(jìn)都落入要求保護(hù)的本發(fā)明范圍內(nèi)。本發(fā)明要求保護(hù)范圍由所附的權(quán)利要求書及其 等效物界定。
【主權(quán)項(xiàng)】
1. 一種基于卡爾曼濾波的混合推薦系統(tǒng),其特征在于:包括數(shù)據(jù)預(yù)處理模塊、協(xié)同過濾 推薦模塊、內(nèi)容推薦模塊、卡爾曼濾波模塊、推薦結(jié)果整合模塊和反饋優(yōu)化模塊,所述數(shù)據(jù) 預(yù)處理模塊的兩個(gè)數(shù)據(jù)輸出端分別通過所述協(xié)同過濾推薦模塊和內(nèi)容推薦模塊與所述推 薦結(jié)果整合模塊的輸入端連接,所述推薦結(jié)果整合模塊的數(shù)據(jù)輸出端與所述反饋優(yōu)化模塊 的數(shù)據(jù)輸入端連接,所述反饋優(yōu)化模塊的數(shù)據(jù)輸出端通過所述卡爾曼濾波模塊與所述推薦 結(jié)果整合模塊連接。2. -種基于卡爾曼濾波的混合推薦方法,其特征在于,包括以下步驟: 1) 卡爾曼濾波 卡爾曼濾波主要用于估測(cè)離散控制系統(tǒng)的狀態(tài),這個(gè)系統(tǒng)過程可以用隨機(jī)差分方程表 示: Xk - Axk-1+Blik+Wk-1 觀測(cè)方程為: Zk - Hxk+Vk 上面兩式中,xk表不k時(shí)刻的系統(tǒng)狀態(tài),Uk是系統(tǒng)k時(shí)刻的控制量,A和B是系統(tǒng)參數(shù),zk表 示k時(shí)刻系統(tǒng)的測(cè)量值,Η為測(cè)量系統(tǒng)的參數(shù),Wk/vk是過程/測(cè)量的噪聲,p(v)~N(0,R),p(w) ~N(0,Q), 2) 建立混合推薦模型 對(duì)于用戶u,在第i次推薦中,設(shè)ItemCF和CB的權(quán)重分別cItem(i,u)和cCB(i,u),其比值.為方便,接下來的闡述中,本文將省去u, 假定x(i)與x(i-l)之間存在線性關(guān)系f: x(i)=x(i-l)+av(i-l) v(i)=x(i_l)_x(i_2) 其中a為系統(tǒng)參數(shù),由實(shí)驗(yàn)得到,為了增強(qiáng)或減緩比值x的變化; 卡爾曼濾波中的系統(tǒng)狀態(tài)變量可表示為: xk=[x(k) ,v(k)]T 將上一次的后驗(yàn)狀態(tài)值作為第K次的觀測(cè)量zk: ?W SAAA 七、- Η 模型參數(shù)Α、Η可由線性關(guān)系f推出:因?yàn)橄到y(tǒng)和測(cè)量噪聲的初始值對(duì)卡爾曼濾波算法的最終結(jié)果影響很小,只會(huì)影響算法 結(jié)果收斂的速度,本文將系統(tǒng)和測(cè)量噪聲的協(xié)方差矩陣根據(jù)粗略實(shí)驗(yàn)分別設(shè)為:3) 算法過程: (1)數(shù)據(jù)預(yù)處理,得到結(jié)構(gòu)化數(shù)據(jù); (2) 進(jìn)行基于物品的協(xié)同過濾推薦(ItemCF)和基于內(nèi)容的推薦(CB)過程,得到各個(gè)模 塊的初步推薦結(jié)果PltemCF和Pcb ; (3) 進(jìn)行卡爾曼濾波過程,預(yù)測(cè)權(quán)重比值Xl; 卡爾曼濾波包括預(yù)測(cè)和更新兩個(gè)過程:(4) 根據(jù)修正后的估測(cè)比值,計(jì)算得到ItemCF和CB算法的權(quán)重,并計(jì)算最終的推薦結(jié) 果; (5) 驗(yàn)證推薦結(jié)果:根據(jù)反饋計(jì)算ItemCF和CB推薦的商品在用戶真正購(gòu)買的物品中所 占的比重,將其比值作為下一次的觀測(cè)變量z k+1。
【文檔編號(hào)】G06F17/30GK105824897SQ201610143149
【公開日】2016年8月3日
【申請(qǐng)日】2016年3月14日
【發(fā)明人】謝曉赟, 陳浩
【申請(qǐng)人】湖南大學(xué), 湖南麓川信息科技有限公司