1.基于單項(xiàng)缺失的負(fù)序列模式在商品推薦中的應(yīng)用,其特征在于,包括步驟如下:
(1)定義一個數(shù)據(jù)序列包含一個負(fù)序列
顧客原本要購買但沒有購買的商品為負(fù)項(xiàng),也稱為不發(fā)生行為;顧客的一次購物記錄為元素;包含至少一個負(fù)項(xiàng)的元素為負(fù)元素;顧客在一段時間內(nèi)的購物記錄稱之為數(shù)據(jù)序列,包含至少一個負(fù)元素的序列稱之為負(fù)序列;
MPSE是指一個顧客在一次購物記錄中的最大正子元素;
1-negMPSE是指負(fù)元素si的子元素,該子元素包括MPSE(si)和一個負(fù)項(xiàng)e,一個單項(xiàng)負(fù)元素的1-negMPSE是它本身;MPSE(si)是指負(fù)元素si的最大正子元素;
MPS(ns)是指一個由顧客購買的商品組成的負(fù)序列ns的最大正子序列,其由ns中包含的所有正項(xiàng)按照原順序組成;
NSI-MSE是指負(fù)序列ns的子序列,該子序列包括單項(xiàng)負(fù)元素si以及MPSE(si+1);
定義數(shù)據(jù)序列ds=<d1 d2 ... dt>包含負(fù)序列ns=<s1 s2 ... sm>;
(2)利用NegI-NSP算法對客戶的購物行為進(jìn)行分析,具體步驟包括:
A、使用正序列挖掘算法GSP挖掘得到所有的正序列模式,即在某一段時間內(nèi),客戶頻繁購買的商品;
B、基于步驟A挖掘得到的正序列模式,生成相應(yīng)的負(fù)候選序列,所述負(fù)候選序列用于判斷在某一段時間內(nèi),哪些商品客戶購買的多,哪些商品客戶沒有購買;
C、利用負(fù)候選序列對應(yīng)的正序列模式的支持度來計(jì)算負(fù)侯選序列的支持度;
D、從步驟B生成的負(fù)侯選序列中篩選出符合最小支持度要求的負(fù)序列模式,即:從步驟B生成的負(fù)侯選序列中篩選出大于用戶設(shè)定的最小支持度的負(fù)序列模式,利用這些篩選后的負(fù)序列模式對客戶的購買行為進(jìn)行分析。
2.根據(jù)權(quán)利要求1所述的基于單項(xiàng)缺失的負(fù)序列模式在商品推薦中的應(yīng)用,其特征在于,所述步驟B,基于步驟A挖掘得到的正序列模式,生成相應(yīng)的負(fù)候選序列,具體步驟包括:對于包含k個元素的正序列模式,其負(fù)侯選序列是通過改變正序列模式中任意m個負(fù)元素得到的;m為整數(shù)且1≤m≤k,當(dāng)正序列模式中沒有連續(xù)的長度為1的元素時,則m的最大值為k。
3.根據(jù)權(quán)利要求1所述的基于單項(xiàng)缺失的負(fù)序列模式在商品推薦中的應(yīng)用,其特征在于,所述步驟C,利用相關(guān)的正序列模式的支持度來計(jì)算負(fù)侯選序列的支持度,具體步驟包括:
①定義一個負(fù)侯選序列;
1-neglMSns是指負(fù)序列ns的子序列,并且該子序列是由MPS(ns)以及一個負(fù)項(xiàng)組成;
1-neglMSSns是指負(fù)序列ns中所有1-neglMSns組成的序列集合;
②一個含有m個元素并且其中含有n個負(fù)元素的負(fù)序列ns,對于1≤i≤n,在序列數(shù)據(jù)庫D中,負(fù)序列ns的支持度sup(ns)由式(i)、式(ii)計(jì)算得出:
負(fù)序列ns的支持度sup(ns)的計(jì)算方法如式(i)所示:
sup(ns)=|{MPS(ns)}-∪ni=1{p(1-neglMSi)}| (i)
采用式(i)獲得所有包含負(fù)序列ns的數(shù)據(jù)序列的sid,{MPS(ns)}是指所有包含MPS(ns)的數(shù)據(jù)序列的sid,∪ni=1{p(1-neglMSi)}是指所有{p(1-neglMSi)}組成的sid集合的并集;
當(dāng)負(fù)序列ns為時,負(fù)序列ns的支持度sup(ns)的計(jì)算方法如式(ii)所示: