1.一種為汽車行業(yè)尋找目標(biāo)用戶并匹配目標(biāo)產(chǎn)品的推薦方法,其特征在于,包括以下步驟:
a.數(shù)據(jù)預(yù)處理階段:收集用戶特征信息、搜索信息和汽車銷售信息,經(jīng)過預(yù)處理后存儲(chǔ)至目標(biāo)數(shù)據(jù)庫中;
b.預(yù)測階段:基于關(guān)聯(lián)規(guī)則選擇目標(biāo)用戶,基于協(xié)同過濾方法對(duì)用戶的偏好進(jìn)行預(yù)測;
c.評(píng)價(jià)及推薦階段:對(duì)預(yù)測結(jié)果進(jìn)行評(píng)價(jià),若用戶對(duì)評(píng)價(jià)結(jié)果滿意,則向用戶推薦預(yù)測的相應(yīng)類型車輛,若用戶對(duì)評(píng)價(jià)結(jié)果不滿意,則返回步驟b,給出其它預(yù)測結(jié)果,然后進(jìn)入步驟c,對(duì)預(yù)測結(jié)果進(jìn)行評(píng)價(jià)。
2.如權(quán)利要求1所述的一種為汽車行業(yè)尋找目標(biāo)用戶并匹配目標(biāo)產(chǎn)品的推薦方法,其特征在于,所述用戶特征信息、搜索信息和汽車銷售信息中包含的屬性指標(biāo)包括:用戶名稱、性別、職業(yè)、婚姻狀況、一天內(nèi)瀏覽汽車網(wǎng)站的次數(shù)、每天停留在汽車網(wǎng)站上的時(shí)間、在汽車網(wǎng)站上的搜索行為、每款汽車對(duì)應(yīng)的屬性信息、收入狀況、購車與否。
3.如權(quán)利要求1所述的一種為汽車行業(yè)尋找目標(biāo)用戶并匹配目標(biāo)產(chǎn)品的推薦方法,其特征在于,步驟a中,所述經(jīng)過預(yù)處理包括:利用深度學(xué)習(xí)的方法對(duì)缺失數(shù)據(jù)進(jìn)行填補(bǔ),對(duì)于類別型數(shù)據(jù)則可以直接將其映射為新的布爾型數(shù)據(jù);對(duì)于數(shù)值型數(shù)據(jù),采用C均值模糊分類法將其劃分為多個(gè)類,產(chǎn)生隸屬度矩陣。
4.如權(quán)利要求1所述的一種為汽車行業(yè)尋找目標(biāo)用戶并匹配目標(biāo)產(chǎn)品的推薦方法,其特征在于,步驟b中,所述基于關(guān)聯(lián)規(guī)則選擇目標(biāo)用戶,基于協(xié)同過濾對(duì)用戶的偏好進(jìn)行預(yù)測,具體包括:
基于目標(biāo)數(shù)據(jù)庫中的數(shù)據(jù),根據(jù)關(guān)聯(lián)規(guī)則發(fā)現(xiàn)具有購買意愿的用戶作為目標(biāo)用戶,然后通過獲取目標(biāo)用戶的網(wǎng)上檢索記錄挖掘目標(biāo)用戶相應(yīng)的屬性偏好或者通過問卷調(diào)查的方式了解目標(biāo)用戶相應(yīng)的屬性偏好,并構(gòu)建屬性向量,最后采用協(xié)同過濾算法利用用戶-屬性評(píng)分矩陣計(jì)算用戶之間的相似度,從而基于相似度給出預(yù)測結(jié)果。
5.如權(quán)利要求4所述的一種為汽車行業(yè)尋找目標(biāo)用戶并匹配目標(biāo)產(chǎn)品的推薦方法,其特征在于,步驟b中,所述根據(jù)關(guān)聯(lián)規(guī)則發(fā)現(xiàn)具有購買意愿的用戶作為目標(biāo)用戶,具體包括:首先檢索出目標(biāo)數(shù)據(jù)庫中的所有頻繁項(xiàng)集,然后利用頻繁項(xiàng)集構(gòu)造出滿足最小信任度的關(guān)聯(lián)規(guī)則,根據(jù)該關(guān)聯(lián)規(guī)則輸出具有購買意愿的目標(biāo)用戶。
6.如權(quán)利要求5所述的一種為汽車行業(yè)尋找目標(biāo)用戶并匹配目標(biāo)產(chǎn)品的推薦方法,其特征在于,步驟b中,采用協(xié)同過濾算法利用用戶-屬性評(píng)分矩陣計(jì)算用戶之間的相似度,從而基于相似度給出預(yù)測結(jié)果,具體包括:
首先構(gòu)建已購買汽車的用戶的用戶-屬性評(píng)分矩陣,然后利用皮爾森相關(guān)系數(shù)或者余弦相似度為活躍的目標(biāo)用戶找出k個(gè)最相似的用戶形成用戶鄰居集合,在相似度的計(jì)算過程中,每個(gè)用戶都被看成是一個(gè)n維向量,用戶之間的相似度通過向量之間的相似度表示。
7.如權(quán)利要求6所述的一種為汽車行業(yè)尋找目標(biāo)用戶并匹配目標(biāo)產(chǎn)品的推薦方法,其特征在于,所述用戶-屬性評(píng)分矩陣中確定的屬性包括:價(jià)格、品牌、級(jí)別、變速箱、軸距、排量、氣缸數(shù)、廠商品牌等參數(shù)。
8.如權(quán)利要求6所述的一種為汽車行業(yè)尋找目標(biāo)用戶并匹配目標(biāo)產(chǎn)品的推薦方法,其特征在于,步驟b中,所述基于相似度給出預(yù)測結(jié)果,具體包括:
基于計(jì)算出來的相似度,推薦與目標(biāo)用戶相似度最高的N位用戶購買的車型。
9.如權(quán)利要求8所述的一種為汽車行業(yè)尋找目標(biāo)用戶并匹配目標(biāo)產(chǎn)品的推薦方法,其特征在于,步驟c中,所述對(duì)預(yù)測結(jié)果進(jìn)行評(píng)價(jià)時(shí),采用預(yù)測準(zhǔn)確性評(píng)價(jià)指標(biāo)為平均絕對(duì)誤差MAE和根均方誤差RMSE,公式分別是:
其中,rui和分別是用戶u對(duì)項(xiàng)目i的實(shí)際評(píng)分和預(yù)測評(píng)分,n表示待預(yù)測項(xiàng)目的個(gè)數(shù);這兩項(xiàng)指標(biāo)的值越小表示預(yù)測的準(zhǔn)確性越高。
10.如權(quán)利要求9所述的一種為汽車行業(yè)尋找目標(biāo)用戶并匹配目標(biāo)產(chǎn)品的推薦方法,其特征在于,步驟c還包括:在向用戶推薦預(yù)測的相應(yīng)類型車輛后,通過推薦準(zhǔn)確性評(píng)價(jià)指標(biāo)來評(píng)價(jià)推薦的準(zhǔn)確性,所述推薦準(zhǔn)確性評(píng)價(jià)指標(biāo)包括準(zhǔn)確率Precision和召回率Recall,其中
計(jì)算的結(jié)果越大,則表示推薦的準(zhǔn)確性越高。