一種基于支持向量機svm的電子商務推薦方法
【專利摘要】本發(fā)明公開了一種基于SVM的電子商務推薦方法,包括,建立基于SVM的用戶評價預測模型,基于機器學習進行含語義的文本特征提取,把評價表示為多維特征向量,并對評價進行分類,支持向量機分類器對商品評價分為有用和無用兩類,實現(xiàn)評價的自動識別;根據(jù)分類器中的評價有用性分值,按照分值大小,通過訓練樣本預測評分的方法填充用戶項目矩陣;根據(jù)各個項目的重要性對核函數(shù)相應的分量賦予相應的權(quán)重,同時根據(jù)用戶過程行為,修正相應分量權(quán)重,以達到提高預測精度、產(chǎn)生理想的推薦效果目的。本發(fā)明利用統(tǒng)計學、機器學習、智能模式識別分類等技術(shù),分析客戶電子商務訪問行為和商品的評價,通過模型預測客戶興趣商品,產(chǎn)生推薦結(jié)果并推薦給客戶,幫助客戶及時快捷準確地發(fā)現(xiàn)真正需要的商品。
【專利說明】—種基于支持向量機SVM的電子向務推薦方法
【技術(shù)領域】
[0001]本發(fā)明設計一種電子商務的推薦方法,具體涉及一種基于支持向量機(SVM)的電子商務推薦方法。
【背景技術(shù)】
[0002]互聯(lián)網(wǎng)及電子商務的快速發(fā)展,電子商務在給用戶帶來無限的便利性的同時,隨著信息的急劇增長,信息過載也使得整個系統(tǒng)變得更為復雜,用戶無法順利找到需要查找的商品信息,電子商務推薦系統(tǒng)能夠有效地動態(tài)捕獲用戶需求及偏好,預測可能的用戶偏好,推薦其可能感興趣的商品,順利完成購物的整個過程。電子商務推薦系統(tǒng)具有良好的發(fā)展和應用前景,目前如亞馬遜、當當、eBay、淘寶等都不同程度的使用了電子商務推薦系統(tǒng),各種Web網(wǎng)站也支持推薦系統(tǒng)進行個性化的需求預測。
[0003]國內(nèi)外目前電子商務推薦算法可分為三大類,(I)、基于內(nèi)容的推薦算法?;趦?nèi)容的過濾是信息檢索推薦領域的重要研究內(nèi)容,基于內(nèi)容的推薦技術(shù)需要分析資源內(nèi)容信息,根據(jù)用戶興趣建立用戶檔案(Profile),用戶檔案中包含了用戶的偏好和需求信息,然后根據(jù)資源內(nèi)容與用戶檔案之間的相似性向用戶提供推薦服務。(2)、基于規(guī)則的推薦算法。隨著數(shù)據(jù)挖掘的興起,關(guān)聯(lián)規(guī)則被應用于推薦系統(tǒng),形成了 一種新的推薦技術(shù)基于規(guī)則的推薦技術(shù)?;谝?guī)則的推薦技術(shù)在評價表上挖掘項目間的關(guān)聯(lián)規(guī)則和用戶間的關(guān)聯(lián)規(guī)則為當前用戶進行推薦。使用項目關(guān)聯(lián)進行推薦時,每條項目關(guān)聯(lián)的前件相當于一個興趣組,而規(guī)則的后件則相當于這個興趣組的推薦(3)協(xié)同過濾的推薦算法。目前協(xié)同過濾推薦主要是以屬性或興趣相近的用戶經(jīng)驗與建議作為提供個性化推薦的基礎。透過協(xié)同過濾,有助于搜集具有類似偏好或?qū)傩缘挠脩?,并將其意見提供給同一集群中的用戶作為參考,以滿足人們通常在決策之前參考他人意見的心態(tài)。
[0004]電子商務推薦方法在理論和實踐中都得到較大發(fā)展,但電子商務推薦方法也面臨一系列的挑戰(zhàn),現(xiàn)有技術(shù)存在的問題如下:
(一)用戶數(shù)據(jù)稀疏性問題
協(xié)同過濾推薦是基于評分相似的最近鄰居向目標客戶產(chǎn)生推薦的一種算法,但隨著電子商務系統(tǒng)規(guī)模的擴大,用戶數(shù)目和商品數(shù)據(jù)急劇增加,一段時間內(nèi),一個用戶購買的商品是極其有限的,對購買的商品評價就更少,使得用戶項目矩陣的極端稀疏性,導致用戶最近鄰居和項目最近鄰居的計算準確性降低,使得推薦系統(tǒng)的推薦質(zhì)量急劇下降。
[0005](二)評價有效性和權(quán)重問題
傳統(tǒng)的協(xié)同過濾推薦技術(shù)對未評價商品和無效評價,因評分少或無效的數(shù)據(jù),存在推薦質(zhì)量低的問題,針對這種情況提出多種解決方法,其中包括矩陣填充、矩陣降維等技術(shù)。或簡單的將用戶對未評分項目的評分設為一個固定的缺省值,或設為其他用戶對該項目的平均評分。然而用戶對未評分項目的評分不可能完全相同,另外對于同一種商品,不同用戶評價的側(cè)重是不一樣的,有些關(guān)注產(chǎn)品的外觀,有些關(guān)注的是品牌,有些關(guān)注的是質(zhì)量,有些關(guān)注的是服務。
【發(fā)明內(nèi)容】
[0006]本發(fā)明所解決的技術(shù)問題是,提供一種基于SVM的電子商務推薦方法,解決了協(xié)同過濾模型中用戶數(shù)據(jù)稀疏性及用戶評價有效性和權(quán)重問題。
[0007]技術(shù)方案如下:
一種基于SVM的電子商務推薦方法,包括 建立SVM預測模型
首先設樣本集{Xi,yj, i=l,…,n, n為樣本總數(shù)。利用非線性映射K)到高維空間,則所構(gòu)成的最優(yōu)回歸函數(shù)為:f(x)=WT.φ(x)+b 式中,w為權(quán)向量,6為常數(shù),A為矢量Xi(Xi1, Xi2.., Xi1) °根據(jù)SRM準則,優(yōu)化目標
為
(2)
【權(quán)利要求】
1.一種基于支持向量機SVM的電子商務組合推薦方法,其特征在于,所述支持向量機SVM推薦方法包括如下步驟: 步驟一,提取商品的用戶評價信息,支持向量機分類器對商品評價分為有效和無效兩類; 步驟二,對有效評價,應用SVM把評價表示為多維特征向量,填充用戶項目矩陣; 步驟三,對無效評價,通過訓練樣本預測評分的方法填充用戶項目矩陣; 步驟四,根據(jù)各個項目的重要性對核函數(shù)相應的分量賦予相應的權(quán)重; 步驟五,結(jié)合用戶行為和支持向量機SVM評價預測方法進行組合預測; 步驟六,預測結(jié)果并進行推薦。
2.根據(jù)權(quán)利要求1中所述的方法,其特征在于,支持支持向量機分類器SVM,是基于統(tǒng)計學習理論的一種最優(yōu)判別函數(shù),并確定分類映射, ,其中
3.根據(jù)權(quán)利要求1中所述的方法,其特征在于,所述的用戶商品項目矩陣
4.根據(jù)權(quán)利要求1中所述的方法,其特征在于,所述的核函數(shù)在
5.根據(jù)權(quán)利要求1中所述的方法,其特征在于,所述項目的重要性包括外觀、品牌、質(zhì)量、服務等商品屬性值。
6.根據(jù)權(quán)利要求1中所述的方法,其特征在于,所述用戶行為,包括瀏覽商品、收藏商品、加入購入車、購買商品等。
【文檔編號】G06Q30/02GK103886486SQ201410107196
【公開日】2014年6月25日 申請日期:2014年3月21日 優(yōu)先權(quán)日:2014年3月21日
【發(fā)明者】楊正華, 曾愛華, 丁雷, 唐潔 申請人:吉首大學