一種基于大數(shù)據(jù)多標(biāo)記分類方法的電子商務(wù)商品推薦方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及計算機(jī)數(shù)據(jù)處理技術(shù)領(lǐng)域,具體地說是一種基于大數(shù)據(jù)多標(biāo)記分類方法的電子商務(wù)商品推薦方法。
【背景技術(shù)】
[0002]近年來,隨著信息技術(shù)和互聯(lián)網(wǎng)的不斷迅速發(fā)展,電子商務(wù)在社會和生活中的地位越來越顯著,電子商務(wù)系統(tǒng)為用戶提供越來越多的選擇。與此同時,電子商務(wù)規(guī)模的急劇擴(kuò)大使得用戶耗費(fèi)大量的時間瀏覽無關(guān)商品,對于銷售商而言,以最合適的方式將商品推薦給用戶是他們迫切希望的。隨著大數(shù)據(jù)時代的到來,電子商務(wù)網(wǎng)站的商品以指數(shù)速度增長,不論其數(shù)量上還是種類上都是人們難以想象的,這更增大了迅速準(zhǔn)確獲取自己想要商品的難度?;ヂ?lián)網(wǎng)猶如一把雙刃劍,雖然很大程度上它推動了電子商務(wù)的迅猛發(fā)展,使商家能夠通過電子商務(wù)平臺將自己的商品展示給消費(fèi)者,消費(fèi)者足不出戶便可對商品信息完全掌握,并與商家達(dá)成交易,雙方各取所需。但是,網(wǎng)絡(luò)用戶在得到便利消費(fèi)的同時一定程度上也陷入了前所未有的尷尬境地。所以商品的推薦功能是極為必要的,它能模擬實(shí)體店中的銷售員向客戶推薦他們感興趣的商品,使消費(fèi)者對商品有一定的認(rèn)知,從而提高商家的銷售額。
[0003]多標(biāo)記學(xué)習(xí)問題是國際機(jī)器學(xué)習(xí)領(lǐng)域的一個研究熱點(diǎn),它最初來源于文檔分類問題中所遇到的歧義性問題。在傳統(tǒng)監(jiān)督學(xué)習(xí)框架下,真實(shí)世界的對象與其概念標(biāo)記之間是一一對應(yīng)的關(guān)系,一般認(rèn)為,這樣的學(xué)習(xí)問題是沒有歧義性的,稱這類問題為單標(biāo)記分類問題,即一個樣例僅具有單一的標(biāo)記。然而,在真實(shí)世界的問題中,歧義性對象卻是廣泛存在的。由于歧義性問題的存在,一個樣例可能與多個標(biāo)記相關(guān)聯(lián),這類問題為多標(biāo)記分類問題。多標(biāo)記學(xué)習(xí)在現(xiàn)實(shí)生活中具有廣泛的應(yīng)用,像視頻自動標(biāo)注、生物信息學(xué)、Web挖掘、信息檢索、個性化推薦等現(xiàn)實(shí)應(yīng)用中。
[0004]關(guān)聯(lián)規(guī)則(Associat1n rule)是知識發(fā)現(xiàn)領(lǐng)域中最活躍的研究方法之一,是Agrawal等在1993年首先提出的,用于挖掘顧客交易數(shù)據(jù)庫中不同商品(項(xiàng))之間的關(guān)聯(lián)關(guān)系,這些規(guī)則反映了用戶購買行為模式。關(guān)聯(lián)規(guī)則挖掘的一個典型例子是購物籃分析。關(guān)聯(lián)規(guī)則研究有助于發(fā)現(xiàn)交易數(shù)據(jù)庫中不同商品(項(xiàng))之間的聯(lián)系,找出顧客購買行為模式,如購買了某一商品對購買其他商品的影響。分析結(jié)果可以應(yīng)用于商品貨架布局、貨存安排以及根據(jù)購買模式對用戶進(jìn)行分類。
【發(fā)明內(nèi)容】
[0005]本發(fā)明的技術(shù)任務(wù)是提供一種基于大數(shù)據(jù)多標(biāo)記分類方法的電子商務(wù)商品推薦方法。
[0006]本發(fā)明的技術(shù)任務(wù)是按以下方式實(shí)現(xiàn)的,該電子商務(wù)商品推薦方法是在系統(tǒng)中建立商品推薦模型,商品推薦模型由分類模型和傾向模型結(jié)合建立而成,通過商品推薦模型對用戶進(jìn)行商品推薦。
[0007]所述的電子商務(wù)商品推薦方法的操作步驟如下:
步驟1:數(shù)據(jù)獲取,獲取所有商品及其現(xiàn)有標(biāo)簽;
步驟2:數(shù)據(jù)處理,將獲取到的商品信息進(jìn)行轉(zhuǎn)換預(yù)處理,得到分類需要的訓(xùn)練樣例; 步驟3:建立分類模型,根據(jù)步驟2中的訓(xùn)練樣例進(jìn)行分類器學(xué)習(xí),最終建立分類模型;
步驟4:根據(jù)關(guān)聯(lián)規(guī)則挖掘用戶的購買傾向,獲取用戶的注冊信息與購買記錄和瀏覽記錄,根據(jù)購買記錄與瀏覽記錄相應(yīng)的權(quán)重獲得購買傾向模型;
步驟5:根據(jù)十折交叉驗(yàn)證方式多次訓(xùn)練分類模型與傾向模型,使得模型的性能更加穩(wěn)定;
步驟6:根據(jù)類別與購買傾向間的對應(yīng)關(guān)系.通過商品推薦模型對用戶進(jìn)行商品推薦。
[0008]所述的步驟3中對于未知的樣例,根據(jù)模型預(yù)測其可能具有的標(biāo)記,并根據(jù)可能性大小計算持有概率。
[0009]本發(fā)明的一種基于大數(shù)據(jù)多標(biāo)記分類方法的電子商務(wù)商品推薦方法和現(xiàn)有技術(shù)相比,能有效的引導(dǎo)用戶購物,滿足用戶購物體驗(yàn),在提高電子商務(wù)網(wǎng)站的點(diǎn)擊率和知名度方面具有非常重要的作用。
【附圖說明】
[0010]附圖1為一種基于大數(shù)據(jù)多標(biāo)記分類方法的電子商務(wù)商品推薦方法的流程框圖。
【具體實(shí)施方式】
[0011]實(shí)施例1:
該電子商務(wù)商品推薦方法是在系統(tǒng)中建立商品推薦模型,商品推薦模型由分類模型和傾向模型結(jié)合建立而成,通過商品推薦模型對用戶進(jìn)行商品推薦;
操作步驟如下:
步驟1:數(shù)據(jù)獲取,獲取所有商品及其現(xiàn)有標(biāo)簽;
步驟2:數(shù)據(jù)處理,將獲取到的商品信息進(jìn)行轉(zhuǎn)換預(yù)處理,得到分類需要的訓(xùn)練樣例; 步驟3:建立分類模型,根據(jù)步驟2中的訓(xùn)練樣例進(jìn)行分類器學(xué)習(xí),最終建立分類模型;
步驟4:根據(jù)關(guān)聯(lián)規(guī)則挖掘用戶的購買傾向,獲取用戶的注冊信息與購買記錄和瀏覽記錄,根據(jù)購買記錄與瀏覽記錄相應(yīng)的權(quán)重獲得購買傾向模型;
步驟5:根據(jù)十折交叉驗(yàn)證方式多次訓(xùn)練分類模型與傾向模型,使得模型的性能更加穩(wěn)定;
步驟6:根據(jù)類別與購買傾向間的對應(yīng)關(guān)系.通過商品推薦模型對用戶進(jìn)行商品推薦。
[0012]實(shí)施例2:
該電子商務(wù)商品推薦方法的操作步驟如下:
步驟1:數(shù)據(jù)獲取,獲取所有商品及其現(xiàn)有標(biāo)簽;
步驟2:數(shù)據(jù)處理,將獲取到的商品信息進(jìn)行轉(zhuǎn)換預(yù)處理,得到分類需要的訓(xùn)練樣例,表示為Xi= [Xii,Xi2, Xi3,…,Xto],對應(yīng)結(jié)果集Y=IL1, L2,…,Lj (標(biāo)記L取值為O或1,0表示樣例不具有該標(biāo)記,I表示樣例具有該標(biāo)記); 步驟3:建立分類模型,根據(jù)步驟2中的訓(xùn)練樣例進(jìn)行分類器學(xué)習(xí),最終建立分類模型Y=f (X),對于未知的樣例X,根據(jù)模型可預(yù)測其可能具有的標(biāo)記,并根據(jù)可能性大小計算持有概率;如新增商品,根據(jù)商品分類模型獲取其可能具有的標(biāo)記;
步驟4:根據(jù)關(guān)聯(lián)規(guī)則挖掘用戶的購買傾向,獲取用戶的注冊信息與購買記錄和瀏覽記錄,根據(jù)購買記錄與瀏覽記錄相應(yīng)的權(quán)重獲得購買傾向模型;若是新增用戶,根據(jù)注冊信息預(yù)測其可能存在的購買傾向;
步驟5:根據(jù)十折交叉驗(yàn)證方式多次訓(xùn)練分類模型與傾向模型,使得模型的性能更加穩(wěn)定;
步驟6:根據(jù)類別與購買傾向間的對應(yīng)關(guān)系.通過商品推薦模型對用戶進(jìn)行商品推薦。
[0013]通過上面【具體實(shí)施方式】,所述技術(shù)領(lǐng)域的技術(shù)人員可容易的實(shí)現(xiàn)本發(fā)明。但是應(yīng)當(dāng)理解,本發(fā)明并不限于上述的幾種【具體實(shí)施方式】。在公開的實(shí)施方式的基礎(chǔ)上,所述技術(shù)領(lǐng)域的技術(shù)人員可任意組合不同的技術(shù)特征,從而實(shí)現(xiàn)不同的技術(shù)方案。
【主權(quán)項(xiàng)】
1.一種基于大數(shù)據(jù)多標(biāo)記分類方法的電子商務(wù)商品推薦方法,其特征在于,該電子商務(wù)商品推薦方法是在系統(tǒng)中建立商品推薦模型,商品推薦模型由分類模型和傾向模型結(jié)合建立而成,通過商品推薦模型對用戶進(jìn)行商品推薦。
2.根據(jù)權(quán)利要求1所述的一種基于大數(shù)據(jù)多標(biāo)記分類方法的電子商務(wù)商品推薦方法,其特征在于,所述的電子商務(wù)商品推薦方法的操作步驟如下: 步驟1:數(shù)據(jù)獲取,獲取所有商品及其現(xiàn)有標(biāo)簽; 步驟2:數(shù)據(jù)處理,將獲取到的商品信息進(jìn)行轉(zhuǎn)換預(yù)處理,得到分類需要的訓(xùn)練樣例; 步驟3:建立分類模型,根據(jù)步驟2中的訓(xùn)練樣例進(jìn)行分類器學(xué)習(xí),最終建立分類模型; 步驟4:根據(jù)關(guān)聯(lián)規(guī)則挖掘用戶的購買傾向,獲取用戶的注冊信息與購買記錄和瀏覽記錄,根據(jù)購買記錄與瀏覽記錄相應(yīng)的權(quán)重獲得購買傾向模型; 步驟5:根據(jù)十折交叉驗(yàn)證方式多次訓(xùn)練分類模型與傾向模型,使得模型的性能更加穩(wěn)定; 步驟6:根據(jù)類別與購買傾向間的對應(yīng)關(guān)系.通過商品推薦模型對用戶進(jìn)行商品推薦。
3.根據(jù)權(quán)利要求1所述的一種基于大數(shù)據(jù)多標(biāo)記分類方法的電子商務(wù)商品推薦方法,其特征在于,所述的步驟3中對于未知的樣例,根據(jù)模型預(yù)測其可能具有的標(biāo)記,并根據(jù)可能性大小計算持有概率。
【專利摘要】本發(fā)明公開了一種基于大數(shù)據(jù)多標(biāo)記分類方法的電子商務(wù)商品推薦方法,該電子商務(wù)商品推薦方法是在系統(tǒng)中建立商品推薦模型,商品推薦模型由分類模型和傾向模型結(jié)合建立而成,通過商品推薦模型對用戶進(jìn)行商品推薦。本發(fā)明的一種基于大數(shù)據(jù)多標(biāo)記分類方法的電子商務(wù)商品推薦方法和現(xiàn)有技術(shù)相比,能有效的引導(dǎo)用戶購物,滿足用戶購物體驗(yàn),在提高電子商務(wù)網(wǎng)站的點(diǎn)擊率和知名度方面具有非常重要的作用。
【IPC分類】G06Q30-02, G06F17-30
【公開號】CN104616178
【申請?zhí)枴緾N201510099174
【發(fā)明人】邱繼釗, 徐宏偉, 王傳超
【申請人】浪潮集團(tuán)有限公司
【公開日】2015年5月13日
【申請日】2015年3月6日