專利名稱:一種協(xié)同過濾推薦模型中調(diào)整學(xué)習(xí)速率的方法
技術(shù)領(lǐng)域:
本發(fā)明屬于數(shù)據(jù)挖掘和個性化推薦技術(shù)領(lǐng)域,特別是涉及一種協(xié)同過濾推薦模型中調(diào)整學(xué)習(xí)速率的方法。
背景技術(shù):
互聯(lián)網(wǎng)信息規(guī)模的爆炸性增長,帶來信息超載的問題,過量信息同時呈現(xiàn),使得用戶很難從中篩選出對個人有效的部分,信息利用率反而降低。個性化推薦技術(shù)是數(shù)據(jù)挖掘研究領(lǐng)域的重要分支,目標(biāo)是通過建立個性化推薦系統(tǒng)來提供“信息找人”的智能服務(wù),以從根本上解決信息超載。作為推薦產(chǎn)生源,推薦模型是個性化推薦系統(tǒng)中的核心組件,而基于矩陣因式分 解的推薦模型因其具備良好的推薦準(zhǔn)確率和可擴展性,是一類應(yīng)用廣泛的推薦模型,但是,基于矩陣因式分解的推薦模型的構(gòu)造過程依賴于學(xué)習(xí)速率,若學(xué)習(xí)速率過高,會降低推薦準(zhǔn)確率,如果學(xué)習(xí)速率過低,則會降低模型的訓(xùn)練收斂速度。目前,對基于矩陣因式分解的推薦模型,其訓(xùn)練過程的學(xué)習(xí)速率設(shè)置仍然是采用固定經(jīng)驗值的方法,根據(jù)以往的模型構(gòu)造經(jīng)驗,選取一個可能會達(dá)到推薦準(zhǔn)確率和訓(xùn)練收斂速度兩者之間較好平衡的值,作為固定不變的學(xué)習(xí)速率,該方法忽略了不同的訓(xùn)練數(shù)據(jù)和應(yīng)用環(huán)境對推薦模型的客觀要求,準(zhǔn)確率低且易造成推薦模型的訓(xùn)練收斂速度慢。因此在深入研究基于矩陣因式分解的推薦模型訓(xùn)練過程的基礎(chǔ)上,本領(lǐng)域技術(shù)人員致力于開發(fā)一種協(xié)同過濾推薦模型中調(diào)整學(xué)習(xí)速率的方法,能夠使推薦模型的準(zhǔn)確率及收斂速度達(dá)到一個較好的平衡狀態(tài)。
發(fā)明內(nèi)容
有鑒于現(xiàn)有技術(shù)的上述缺陷,本發(fā)明所要解決的技術(shù)問題是提供一種協(xié)同過濾推薦模型中調(diào)整學(xué)習(xí)速率的方法,使推薦模型的準(zhǔn)確率及收斂速度達(dá)到一個較好的平衡狀態(tài),使推薦模型的訓(xùn)練過程得到優(yōu)化。為實現(xiàn)上述目的,本發(fā)明提供了一種協(xié)同過濾推薦模型中調(diào)整學(xué)習(xí)速率的方法,按以下步驟進(jìn)行步驟一、定義并計算學(xué)習(xí)速率放大比例因子和縮小比例因子;建立學(xué)習(xí)速率與用戶隱特征向量的對應(yīng)關(guān)系、建立學(xué)習(xí)速率與項目隱特征向量的對應(yīng)關(guān)系;設(shè)定學(xué)習(xí)速率的放大比例因子a ;通過sigmoid函數(shù)定義0 —1 + i + eXp(_丨叫(.,)0
<n0 < I ;設(shè)定學(xué)習(xí)速率的縮小比例因子ee = ;設(shè)定用戶隱特征向量為P,P為mXf 的矩陣,m為用戶數(shù),f為隱特征向量空間的維數(shù),Pujk是P中第u行、第k列的元素;對于所有的pu,k{l彡u彡m,I彡k彡f}建立學(xué)習(xí)速率nu,k,初始化nu,k= n C^nuf均為正整數(shù);設(shè)定項目隱特征向量為Q,Q為nXf 的矩陣,n為項目數(shù),f為隱特征向量空間的維數(shù),Ik是Q中第i行、第k列的元素;對于所有的qi,k{l≤i≤n,l≤k≤f}建立學(xué)習(xí)速率nu,初始化ni,k= n。,!!為正整數(shù);步驟二、計算用戶隱特征向量或/和項目隱特征向量在訓(xùn)練時刻t的學(xué)習(xí)方向;對于用戶隱特征向量Pu,k和項目隱特征向量qi,k,其在訓(xùn)練時刻t對應(yīng)的訓(xùn)練數(shù)據(jù)為ru,i ;Pu,k在訓(xùn)練時刻t的學(xué)習(xí)方向為
權(quán)利要求
1.一種協(xié)同過濾推薦模型中調(diào)整學(xué)習(xí)速率的方法,其特征在于按以下步驟進(jìn)行 步驟一、定義并計算學(xué)習(xí)速率放大比例因子和縮小比例因子;建立學(xué)習(xí)速率與用戶隱特征向量的對應(yīng)關(guān)系、建立學(xué)習(xí)速率與項目隱特征向量的對應(yīng)關(guān)系; I 設(shè)定學(xué)習(xí)速率的放大比例因子a ;通過sigmoid函數(shù)定義以
2.如權(quán)利要求I所述的一種協(xié)同過濾推薦模型中調(diào)整學(xué)習(xí)速率的方法,其特征在于還包括對用戶隱特征向量或/和項目隱特征向量進(jìn)行更新的步驟;用戶隱特征向量在訓(xùn)練時刻t+i時為C1k,pn=p k+C1k .cj ; 項目隱特征向量在訓(xùn)練時刻t+l時為q!,+ik ,q,+1k =q|,。
3.如權(quán)利要求I所述的一種協(xié)同過濾推薦模型中調(diào)整學(xué)習(xí)速率的方法,其特征在于還包括在訓(xùn)練時刻t結(jié)束后,分別對和進(jìn)行緩存的步驟。
全文摘要
本發(fā)明公開了一種協(xié)同過濾推薦模型中調(diào)整學(xué)習(xí)速率的方法,屬于數(shù)據(jù)挖掘和個性化推薦技術(shù)領(lǐng)域,通過增大該隱特征向量對應(yīng)的學(xué)習(xí)速率來提高收斂速度,通過縮小該隱特征向量對應(yīng)的學(xué)習(xí)速率,從而提高推薦準(zhǔn)確率,本發(fā)明能夠使推薦模型的準(zhǔn)確率及收斂速度達(dá)到一個較好的平衡狀態(tài),使推薦模型的訓(xùn)練過程得到優(yōu)化。
文檔編號G06F17/30GK102722552SQ20121016875
公開日2012年10月10日 申請日期2012年5月28日 優(yōu)先權(quán)日2012年5月28日
發(fā)明者吳磊, 夏云霓, 楊瑞龍, 羅辛, 陳鵬 申請人:成都國科海博計算機系統(tǒng)有限公司, 重慶大學(xué)