欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種基于聚類和余弦相似度的物流推薦方法與流程

文檔序號:12721745閱讀:503來源:國知局
一種基于聚類和余弦相似度的物流推薦方法與流程

本發(fā)明屬于聚類方法和推薦方法技術(shù)領(lǐng)域,特別涉及一種基于聚類和余弦相似度的物流推薦方法。



背景技術(shù):

物流推薦方法對物流領(lǐng)域貨物的運(yùn)輸效率的提高有重要的作用和意義,傳統(tǒng)的物流只是提供簡單的位移,現(xiàn)代物流則提供增值服務(wù),人工的挑選貨物或貨車已經(jīng)不能滿足物流領(lǐng)域的需求。近年來針對不同的推薦系統(tǒng)的需求,研究者提出了相應(yīng)的個性化推薦方案,如基于內(nèi)容推薦,協(xié)同過濾,關(guān)聯(lián)規(guī)則,效用推薦,組合推薦等。

朱全銀等人已有的研究基礎(chǔ)包括:朱全銀,潘祿,劉文儒,等.Web科技新聞分類抽取算法[J].淮陰工學(xué)院學(xué)報,2015,24(5):18-24;李翔,朱全銀.聯(lián)合聚類和評分矩陣共享的協(xié)同過濾推薦[J].計算機(jī)科學(xué)與探索,2014,8(6):751-759;Quanyin Zhu,Sunqun Cao.A Novel Classifier-independent Feature Selection Algorithm for Imbalanced Datasets.2009,p:77-82;Quanyin Zhu,Yunyang Yan,Jin Ding,Jin Qian.The Case Study for Price Extracting of Mobile Phone Sell Online.2011,p:282-285;Quanyin Zhu,Suqun Cao,Pei Zhou,Yunyang Yan,Hong Zhou.Integrated Price Forecast based on Dichotomy Backfilling and Disturbance Factor Algorithm.International Review on Computers and Software,2011,Vol.6(6):1089-1093;朱全銀等人申請、公開與授權(quán)的相關(guān)專利:朱全銀,胡蓉靜,何蘇群,周培等.一種基于線性插補(bǔ)與自適應(yīng)滑動窗口的商品價格預(yù)測方法.中國專利:ZL 2011 1 0423015.5,2015.07.01;朱全銀,曹蘇群,嚴(yán)云洋,胡蓉靜等,一種基于二分?jǐn)?shù)據(jù)修補(bǔ)與擾亂因子的商品價格預(yù)測方法.中國專利:ZL 2011 1 0422274.6,2013.01.02;朱全銀,尹永華,嚴(yán)云洋,曹蘇群等,一種基于神經(jīng)網(wǎng)絡(luò)的多品種商品價格預(yù)測的數(shù)據(jù)預(yù)處理方法.中國專利:ZL 2012 1 0325368.6;李翔,朱全銀,胡榮林,周泓.一種基于譜聚類的冷鏈物流配載智能推薦方法.中國專利公開號:CN105654267A,2016.06.08;曹蘇群,朱全銀,左曉明,高尚兵等人,一種用于模式分類的特征選擇方法.中國專利公開號:CN 103425994 A,2013.12.04;朱全銀,嚴(yán)云洋,李翔,張永軍等人,一種用于文本分類和圖像深度挖掘的科技情報獲取與推送方法.中國專利公開號:CN 104035997 A,2014.09.10;朱全銀,辛誠,李翔,許康等人,一種基于K means和LDA雙向驗證的網(wǎng)絡(luò)行為習(xí)慣聚類方法.中國專利公開號:CN 106202480 A,2016.12.07。

AP聚類方法:

Affinity Propagation聚類簡稱AP,是一種在2007年發(fā)表在Science上的新的聚類方法。

AP方法的基本思想是將全部樣本看作網(wǎng)絡(luò)的節(jié)點(diǎn),然后通過網(wǎng)絡(luò)中各條邊的消息傳遞計算出各樣本的聚類中心。聚類過程中,共有兩種消息在各節(jié)點(diǎn)間傳遞,分別是吸引度(responsibility)和歸屬度(availability)。AP方法通過迭代過程不斷更新每一個點(diǎn)的吸引度和歸屬度值,直到產(chǎn)生m個高質(zhì)量的樣本,同時將其余的數(shù)據(jù)點(diǎn)分配到相應(yīng)的聚類中。

SDbw聚類效果衡量方法:

SDbw是一種基于密度的指標(biāo),它通過對比類內(nèi)的緊密度和類間的密度來評估聚類的有效性,當(dāng)該指標(biāo)達(dá)到最小時的聚類是最優(yōu)聚類,而且聚類結(jié)果與方法無關(guān)。

K-means聚類方法:

K-means聚類方法是硬聚類方法,是典型的基于原型的目標(biāo)函數(shù)聚類方法的代表,它是數(shù)據(jù)點(diǎn)到原型的某種距離作為優(yōu)化的目標(biāo)函數(shù),利用函數(shù)求極值的方法得到迭代運(yùn)算的調(diào)整規(guī)則。K-means以歐式距離作為相似度測度,它是求對應(yīng)某一初始聚類中心向量V最優(yōu)分類,使得評價指標(biāo)J最小。該方法采用誤差平方和準(zhǔn)則函數(shù)作為聚類準(zhǔn)則函數(shù)。

余弦相似度:

余弦相似度,又稱為余弦相似性。通過計算兩個向量的夾角余弦值來評估他們的相似度。

傳統(tǒng)的方法在用于物流推薦時需要在整個數(shù)據(jù)集上搜索目標(biāo)用戶的最近鄰居,隨著電子商務(wù)系統(tǒng)規(guī)模越來越大,用戶數(shù)量和項目數(shù)量的急劇增加,在整個數(shù)據(jù)集上搜索目標(biāo)用戶的最近鄰居非常耗時,越來越難以滿足推薦系統(tǒng)的實(shí)時性要求。因此,需要找到一種在不影響推薦效果的前提下,提高推薦算法運(yùn)行效率的方法。



技術(shù)實(shí)現(xiàn)要素:

發(fā)明目的:針對現(xiàn)有技術(shù)中存在的問題,本發(fā)明提供一種通過對貨車和貨物的數(shù)據(jù)處理然后聚類,再將貨主和車主的信息處理,給貨主推薦運(yùn)輸車輛,給車主推薦運(yùn)輸貨物,最終達(dá)到提高物流運(yùn)輸效率目的的基于聚類和余弦相似度的物流推薦方法。

技術(shù)方案:為解決上述技術(shù)問題,本發(fā)明提供一種基于聚類和余弦相似度的物流推薦方法,包括如下步驟:

步驟一:對貨物數(shù)據(jù)集和貨車數(shù)據(jù)集進(jìn)行預(yù)處理,并使用AP聚類方法、SDbw聚類衡量方法和K-means聚類方法確定貨物數(shù)據(jù)集和貨車數(shù)據(jù)集的聚類個數(shù)最佳K值;

步驟二:根據(jù)步驟一中確定的最佳聚類個數(shù),對貨物數(shù)據(jù)集和貨車數(shù)據(jù)集使用K-means聚類,并分別使用貨物數(shù)據(jù)集和貨車數(shù)據(jù)集聚類得到的結(jié)果訓(xùn)練出兩個分類器;

步驟三:需要貨車推薦的貨主輸入貨物信息,貨物信息經(jīng)過歸一化處理,使用步驟二中貨車數(shù)據(jù)集訓(xùn)練出的分類器分類,需要貨物推薦的車主輸入車輛信息,車輛信息經(jīng)過歸一化處理,使用步驟二中車輛數(shù)據(jù)集訓(xùn)練出的分類器分類;

步驟四:使用余弦相似度方法計算步驟三中貨主或車主經(jīng)過歸一化處理的數(shù)據(jù)與分類器分得的類中所有元素的相似度對貨物數(shù)據(jù)集或貨車數(shù)據(jù)集根據(jù)相似度從高到低排列,向用戶推薦。

進(jìn)一步的,所述步驟一中使用AP聚類方法、SDbw聚類衡量方法和K-means聚類方法確定貨物數(shù)據(jù)集和貨車數(shù)據(jù)集的聚類個數(shù)最佳K值的步驟如下:

步驟1.1:定義貨車和貨物數(shù)據(jù)集、對貨車和貨物數(shù)據(jù)集進(jìn)行預(yù)處理;

步驟1.2:對貨車和貨物數(shù)據(jù)集使用AP聚類方法,得到類別數(shù)量;

步驟1.3:對貨車和貨物數(shù)據(jù)集使用K-means聚類方法,設(shè)定K值從2到步驟1.2得到的數(shù)值,使用SDbw聚類衡量方法衡量聚類效果,得到貨車和貨物數(shù)據(jù)的聚類最佳K值。

進(jìn)一步的,所述步驟二中分別使用貨物數(shù)據(jù)集和貨車數(shù)據(jù)集聚類得到的結(jié)果訓(xùn)練出兩個分類器的步驟如下:

步驟2.1:使用樸素貝葉斯分類器訓(xùn)練模型ModelA,訓(xùn)練數(shù)據(jù)為使用K-means聚類方法對貨車數(shù)據(jù)聚類的結(jié)果,K值為步驟2確定的貨車數(shù)據(jù)最佳聚類K值;

步驟2.2:使用樸素貝葉斯分類器訓(xùn)練模型ModelB,訓(xùn)練數(shù)據(jù)為使用K-means聚類方法對貨物數(shù)據(jù)聚類的結(jié)果,K值為步驟2確定的貨物數(shù)據(jù)最佳聚類K值。

進(jìn)一步的,所述步驟三中分別使用貨車數(shù)據(jù)集訓(xùn)練出的分類器和車輛數(shù)據(jù)集訓(xùn)練出的分類器進(jìn)行分類的步驟如下:

步驟3.1:需要貨車推薦的貨主輸入貨物信息,將貨物信息歸一化處理后,使用分類器ModelA對貨物信息分類,得到分類標(biāo)簽;

步驟3.2:需要貨物推薦的車主輸入車輛信息,將車輛信息歸一化處理后,使用分類器ModelB對車輛信息分類,得到分類標(biāo)簽。

進(jìn)一步的,所述步驟四中使用余弦相似度方法計算貨主或車主經(jīng)過歸一化處理的數(shù)據(jù)與分類器分得的類中所有元素的相似度對貨物數(shù)據(jù)集或貨車數(shù)據(jù)集根據(jù)相似度從高到低排列,向用戶推薦的步驟如下:

步驟4.1:使用余弦相似度方法,計算貨主經(jīng)過處理的信息與車輛數(shù)據(jù)集中與貨物信息具有相同標(biāo)簽的信息的相似度,根據(jù)相似度從大到小進(jìn)行推薦;

步驟4.2:使用余弦相似度方法,計算車主經(jīng)過處理的信息與貨物數(shù)據(jù)集中與車輛信息具有相同標(biāo)簽的信息的相似度,根據(jù)相似度從大到小進(jìn)行推薦。

再進(jìn)一步的,所述步驟一中使用AP聚類方法、SDbw聚類衡量方法和K-means聚類方法確定貨物數(shù)據(jù)集和貨車數(shù)據(jù)集的聚類個數(shù)最佳K值的詳細(xì)步驟如下:

步驟101:設(shè)貨車數(shù)據(jù)量為N條,貨車數(shù)據(jù)的維度為M,建立貨車數(shù)據(jù)集Crecords={C1,C2,…,CM},Crecords的元素Cm={c1,c2,c3,c4,c5}表示貨車m的數(shù)據(jù),c1,c2,c3,c4,c5,為Cm的五個維度,m∈[1,M],其中,c1表示車主希望的運(yùn)輸價格,c2表示貨車剩余載重,c3表示貨車的出發(fā)地,c4表示貨車的目的地,c5表示貨車運(yùn)送的時間;

步驟102:定義循環(huán)變量為t,并賦初值t=1;

步驟103:當(dāng)t<=M執(zhí)行步驟204,否則執(zhí)行步驟207;

步驟104:定義臨時變量dis表示出發(fā)地和目的地間的距離,定義臨時變量time表示從出發(fā)地到目的地需要的時間;

步驟105:調(diào)用高德api計算Ct中從出發(fā)地c3到目的地c4的距離和時間,并分別賦值給dis和time,并用dis和time代替原Ct中的c3和c4;

步驟106:t=t+1,繼續(xù)執(zhí)行步驟203;

步驟107:對得到數(shù)據(jù)集SCrecords進(jìn)行中心化和標(biāo)準(zhǔn)化處理,得到數(shù)據(jù)集SCrecords={SC1,SC2,…,SCM};

步驟108:使用PCA降維方法對數(shù)據(jù)集SCrecords進(jìn)行降維,得到降維后的數(shù)據(jù)集Precord={P1,P2,…,PM};

步驟109:對降維后的數(shù)據(jù)使用AP聚類方法,得到類別標(biāo)簽Labels={L1,L2,…,LM},類別數(shù)量賦值給NUM;

步驟110:設(shè)定循環(huán)變量為n,并賦予初值n=2;

步驟111:當(dāng)n<=NUM執(zhí)行步驟212,否則執(zhí)行步驟215;

步驟112:使用K-means聚類方法對數(shù)據(jù)集Precord進(jìn)行聚類,得到貨車類別標(biāo)簽Labels={L1,L2,…,LM};

步驟113:使用SDbw聚類衡量方法衡量本次聚類效果,得到的值賦予SDk;

步驟114:n=n+1,繼續(xù)執(zhí)行步驟211;

步驟115:設(shè)SD2,SD3,…,SDNUM中的最小值為SDmin;

步驟116:min即為貨車數(shù)據(jù)集使用K-means聚類方法的最佳K值;

步驟117:設(shè)貨物數(shù)據(jù)量為N條,貨物數(shù)據(jù)的維度為M,建立貨物數(shù)據(jù)集Trecords={T1,T2,…,TM},Trecords的元素Tm={t1,t2,t3,t4,t5}表示車輛m的數(shù)據(jù),t1,t2,t3,t4,t5,為Tm的五個維度,m∈[1,M],其中,t1表示貨物的運(yùn)輸價格,t2表示貨物的重量,t3表示貨物的出發(fā)地,t4表示貨物的目的地,t5表示貨物運(yùn)送的時間;

步驟118:定義循環(huán)變量為t,并賦初值t=1;

步驟119:當(dāng)t<=M執(zhí)行步驟220,否則執(zhí)行步驟223;

步驟120:定義臨時變量dis表示出發(fā)地和目的地間的距離,定義臨時變量time表示從出發(fā)地到目的地需要的時間;

步驟121:調(diào)用高德api計算Tt中從出發(fā)地t3到目的地t4的距離和時間,并分別賦值給dis和time,并用dis和time代替原Tt中的t3和t4;

步驟122:t=t+1,繼續(xù)執(zhí)行步驟219;

步驟123:對得到數(shù)據(jù)集Trecords進(jìn)行中心化和標(biāo)準(zhǔn)化處理,得到數(shù)據(jù)集STrecords={ST1,ST2,…,STM};

步驟124:使用PCA降維方法對數(shù)據(jù)集Srecords進(jìn)行降維,得到降維后的數(shù)據(jù)集Precord={P1,P2,…,PM};

步驟125:對降維后的數(shù)據(jù)使用AP聚類方法,得到類別標(biāo)簽Labels={L1,L2,…,LM},類別數(shù)量賦值給NUM;

步驟126:設(shè)定循環(huán)變量為n,并賦予初值n=2;

步驟127:當(dāng)n<=NUM執(zhí)行步驟228,否則執(zhí)行步驟231;

步驟128:使用K-means聚類方法對數(shù)據(jù)集Precord進(jìn)行聚類,得到貨物類別標(biāo)簽Labels={L1,L2,…,LM};

步驟129:使用SDbw聚類衡量方法衡量本次聚類效果,得到的值賦予SDk;

步驟130:n=n+1,繼續(xù)執(zhí)行步驟227;

步驟131:設(shè)SD2,SD3,…,SDNUM中的最小值為SDmin;

步驟132:min即為貨物數(shù)據(jù)集使用K-means聚類方法的最佳K值。

再進(jìn)一步的,所述步驟二中分別使用貨物數(shù)據(jù)集和貨車數(shù)據(jù)集聚類得到的結(jié)果訓(xùn)練出兩個分類器的詳細(xì)步驟如下:

步驟201:貨車數(shù)據(jù)集Crecords經(jīng)過中心化和標(biāo)準(zhǔn)化處理得到數(shù)據(jù)集SCrecords={SC1,SC2,…,SCM};

步驟202:使用K-means聚類方法對數(shù)據(jù)集SCrecords={SC1,SC2,…,SCM}進(jìn)行聚類,K為步驟216得到的最佳K值,得到貨車類別標(biāo)簽Labels={L1,L2,…,LM};

步驟203:使用樸素貝葉斯分類器,訓(xùn)練數(shù)據(jù)集為SCrecords={SC1,SC2,…,SCM},類別標(biāo)簽為Labels={L1,L2,…,LM},得到分類器ModelA;

步驟204:貨物數(shù)據(jù)集Trecords經(jīng)過中心化和標(biāo)準(zhǔn)化處理得到數(shù)據(jù)集STrecords={ST1,ST2,…,STM};

步驟205:使用K-means聚類方法對數(shù)據(jù)集STrecords={ST1,ST2,…,STM}進(jìn)行聚類,K為步驟232得到的最佳K值,得到貨車類別標(biāo)簽Labels={L1,L2,…,LM};

步驟206:使用樸素貝葉斯分類器,訓(xùn)練數(shù)據(jù)集為STrecords={ST1,ST2,…,STM},類別標(biāo)簽為Labels={L1,L2,…,LM},得到分類器ModelB。

再進(jìn)一步的,所述步驟三中分別使用貨車數(shù)據(jù)集訓(xùn)練出的分類器和車輛數(shù)據(jù)集訓(xùn)練出的分類器進(jìn)行分類的詳細(xì)步驟如下:

步驟301:推薦內(nèi)容選擇;

步驟302:當(dāng)選擇推薦貨物時執(zhí)行步驟407,否則執(zhí)行步驟403;

步驟303:輸入貨物信息Trecord={t1,t2,t3,t4,t5},t1表示貨物運(yùn)輸價格,t2表示貨物重量,t3表示貨物出發(fā)地,t4表示貨物目的地,t5表示貨物發(fā)車時間;

步驟304:定義臨時變量dis表示出發(fā)地到目的地間的距離,定義臨時變量time表示從出發(fā)地到目的地需要的時間,調(diào)用高德api計算從出發(fā)地t3到目的地t4的經(jīng)過的距離和花費(fèi)的時間,并分別賦值給dis和time,然后用dis和time代替Trecord中的t3和t4;

步驟305:對貨物信息Trecord進(jìn)行中心和和標(biāo)準(zhǔn)化處理,得到數(shù)據(jù)STrecord={ST1,ST2,ST3,ST4,ST5};

步驟306:使用步驟303得到的分類器ModelA對數(shù)據(jù)STrecord分類,得到類別標(biāo)簽Tlabel;

步驟307:輸入貨車信息c1表示車主希望的運(yùn)輸價格,c2表示貨車剩余載重,c3表示貨車出發(fā)地,c4表示貨車目的地,c5表示貨車發(fā)車時間;

步驟308:定義臨時變量dis表示出發(fā)地到目的地間的距離,定義臨時變量time表示從出發(fā)地到目的地需要的時間,調(diào)用高德api計算從出發(fā)地c3到目的地c4的經(jīng)過的距離和花費(fèi)的時間,并分別賦值給dis和time,然后用dis和time代替Crecord中的c3和c4;

步驟309:對貨車信息Crecord進(jìn)行中心和和標(biāo)準(zhǔn)化處理,得到數(shù)據(jù)SCrecord={SC1,SC2,SC3,SC4,SC5};

步驟310:使用步驟306得到的分類器ModelB對數(shù)據(jù)SCrecord分類,得到類別標(biāo)簽Clabel。

再進(jìn)一步的,所述步驟四中使用余弦相似度方法計算貨主或車主經(jīng)過歸一化處理的數(shù)據(jù)與分類器分得的類中所有元素的相似度對貨物數(shù)據(jù)集或貨車數(shù)據(jù)集根據(jù)相似度從高到低排列,向用戶推薦的詳細(xì)步驟如下:

步驟401:根據(jù)步驟305得到的標(biāo)簽,從數(shù)據(jù)集STrecords={ST1,ST2,…,STM}中抽取類別標(biāo)簽為Tlabel的數(shù)據(jù)組成新的數(shù)據(jù)集TTrecord={TT1,TT2,…,TTN};

步驟402:設(shè)定循環(huán)變量為n,并賦予初值n=1;

步驟403:當(dāng)n<=N執(zhí)行步驟504,否則執(zhí)行506;

步驟404:使用余弦相似度方法,計算貨車信息SCrecord={SC1,SC2,SC3,SC4,SC5}和貨物數(shù)據(jù)集TTrecord={TT1,TT2,…,TTN}中的TTn相似度,并將值賦給SIMn;

步驟405:n=n+1繼續(xù)執(zhí)行步驟503;

步驟406:對數(shù)據(jù)集TTrecord={TT1,TT2,…,TTN}根據(jù)相似度值SIM從大大小進(jìn)行排序;

步驟407:將經(jīng)過排序的TTrecord從前往后推薦給車主;

步驟408:根據(jù)步驟302得到的標(biāo)簽,數(shù)據(jù)集SCrecords={SC1,SC2,…,SCM}中抽取類別標(biāo)簽為Clabel的數(shù)據(jù)組成新的數(shù)據(jù)集SSrecords={SS1,SS2,…,SSN};

步驟409:設(shè)定循環(huán)變量為n,并賦予初值n=1;

步驟410:當(dāng)n<=N執(zhí)行步驟511,否則執(zhí)行步驟513;

步驟411:使用余弦相似度方法,計算貨物信息STrecord={ST1,ST2,ST3,ST4,ST5}和貨車數(shù)據(jù)集SSrecords={SS1,SS2,…,SSN}中的Ssn相似度,并將值賦給SIMn;

步驟412:n=n+1繼續(xù)執(zhí)行步驟510;

步驟413:對數(shù)據(jù)集SSrecords={SS1,SS2,…,SSN}根據(jù)相似度值SIM從大大小進(jìn)行排序;

步驟414:將經(jīng)過排序的SSrecords從前往后推薦給貨主。

與現(xiàn)有技術(shù)相比,本發(fā)明的優(yōu)點(diǎn)在于:

本發(fā)明相比現(xiàn)有的推薦方法本發(fā)明創(chuàng)造性的提出了一種將貨車數(shù)據(jù)和貨物數(shù)據(jù)通過AP聚類方法、SDbw聚類衡量方法和K-means聚類方法結(jié)合,得到了數(shù)據(jù)集的最佳聚類K值,再將數(shù)據(jù)根據(jù)K值聚類,訓(xùn)練分類器,然后將用戶輸入的信息分類,最終進(jìn)行推薦的方法,本方法彌補(bǔ)了現(xiàn)有的推薦方法在整個數(shù)據(jù)集上搜索目標(biāo)用戶的最近鄰居非常耗時的局限性,有效地提高了推薦方法的實(shí)時響應(yīng)速度。

附圖說明

圖1為本發(fā)明的總體流程圖;

圖2為圖1中確定貨車數(shù)據(jù)集最佳K值的流程圖;

圖3為圖1中確定貨物數(shù)據(jù)集最佳K值的流程圖;

圖4為圖1中訓(xùn)練貨車分類模型的流程圖;

圖5為圖1中訓(xùn)練貨物分類模型的流程圖;

圖6為圖1中用戶輸入信息分類方法的流程圖;

圖7為圖1中貨物推薦方法的流程圖;

圖8為圖1中貨車推薦方法的流程圖。

具體實(shí)施方式

下面結(jié)合附圖和具體實(shí)施方式,進(jìn)一步闡明本發(fā)明。

如圖1所示,本發(fā)明包括如下步驟:

步驟101:對貨物數(shù)據(jù)集和貨車數(shù)據(jù)集進(jìn)行預(yù)處理,并使用AP聚類方法、SDbw聚類衡量方法和K-means聚類方法確定貨物數(shù)據(jù)集和貨車數(shù)據(jù)集的最佳K值;

步驟102:根據(jù)計算出的最佳K值對貨物數(shù)據(jù)集和貨車數(shù)據(jù)集聚類,并使用樸素貝葉斯分類器根據(jù)貨物數(shù)據(jù)集聚類得到的結(jié)果和貨車數(shù)據(jù)集聚類得到的結(jié)果訓(xùn)練出兩個分類器;

步驟103:需要貨車推薦的貨主輸入貨物信息,貨物信息經(jīng)過歸一化處理,使用貨車數(shù)據(jù)集訓(xùn)練出的分類器分類,需要貨物推薦的車主輸入車輛信息,車輛信息經(jīng)過歸一化處理,使用車輛數(shù)據(jù)集訓(xùn)練出的分類器分類;

步驟104:使用余弦相似度方法計算貨主或車主經(jīng)過歸一化處理的數(shù)據(jù)與分類器分得的類中所有元素的相似度對貨物數(shù)據(jù)集或貨車數(shù)據(jù)集根據(jù)相似度從高到低排列,向用戶推薦。

如附圖2附圖3,計算出最佳K值方法步驟101從步驟201到步驟232:

步驟201:設(shè)貨車數(shù)據(jù)量為N條,貨車數(shù)據(jù)的維度為M,建立貨車數(shù)據(jù)集Crecords={C1,C2,…,CM},Crecords的元素Cm={c1,c2,c3,c4,c5}表示貨車m的數(shù)據(jù),c1,c2,c3,c4,c5,為Cm的五個維度,m∈[1,M],其中,c1表示車主希望的運(yùn)輸價格,c2表示貨車剩余載重,c3表示貨車的出發(fā)地,c4表示貨車的目的地,c5表示貨車運(yùn)送的時間;

步驟202:定義循環(huán)變量為t,并賦初值t=1;

步驟203:當(dāng)t<=M執(zhí)行步驟204,否則執(zhí)行步驟207;

步驟204:定義臨時變量dis表示出發(fā)地和目的地間的距離,定義臨時變量time表示從出發(fā)地到目的地需要的時間;

步驟205:調(diào)用高德api計算Ct中從出發(fā)地c3到目的地c4的距離和時間,并分別賦值給dis和time,并用dis和time代替原Ct中的c3和c4;

步驟206:t=t+1,繼續(xù)執(zhí)行步驟203;

步驟207:對得到數(shù)據(jù)集SCrecords進(jìn)行中心化和標(biāo)準(zhǔn)化處理,得到數(shù)據(jù)集SCrecords={SC1,SC2,…,SCM};

步驟208:使用PCA降維方法對數(shù)據(jù)集SCrecords進(jìn)行降維,得到降維后的數(shù)據(jù)集Precord={P1,P2,…,PM};

步驟209:對降維后的數(shù)據(jù)使用AP聚類方法,得到類別標(biāo)簽Labels={L1,L2,…,LM},類別數(shù)量賦值給NUM;

步驟210:設(shè)定循環(huán)變量為n,并賦予初值n=2;

步驟211:當(dāng)n<=NUM執(zhí)行步驟212,否則執(zhí)行步驟215;

步驟212:使用K-means聚類方法對數(shù)據(jù)集Precord進(jìn)行聚類,得到貨車類別標(biāo)簽Labels={L1,L2,…,LM};

步驟213:使用SDbw聚類衡量方法衡量本次聚類效果,得到的值賦予SDk;

步驟214:n=n+1,繼續(xù)執(zhí)行步驟211;

步驟215:設(shè)SD2,SD3,…,SDNUM中的最小值為SDmin;

步驟216:min即為貨車數(shù)據(jù)集使用K-means聚類方法的最佳K值;

步驟217:設(shè)貨物數(shù)據(jù)量為N條,貨物數(shù)據(jù)的維度為M,建立貨物數(shù)據(jù)集Trecords={T1,T2,…,TM},Trecords的元素Tm={t1,t2,t3,t4,t5}表示車輛m的數(shù)據(jù),t1,t2,t3,t4,t5,為Tm的五個維度,m∈[1,M],其中,t1表示貨物的運(yùn)輸價格,t2表示貨物的重量,t3表示貨物的出發(fā)地,t4表示貨物的目的地,t5表示貨物運(yùn)送的時間;

步驟218:定義循環(huán)變量為t,并賦初值t=1;

步驟219:當(dāng)t<=M執(zhí)行步驟220,否則執(zhí)行步驟223;

步驟220:定義臨時變量dis表示出發(fā)地和目的地間的距離,定義臨時變量time表示從出發(fā)地到目的地需要的時間;

步驟221:調(diào)用高德api計算Tt中從出發(fā)地t3到目的地t4的距離和時間,并分別賦值給dis和time,并用dis和time代替原Tt中的t3和t4;

步驟222:t=t+1,繼續(xù)執(zhí)行步驟219;

步驟223:對得到數(shù)據(jù)集Trecords進(jìn)行中心化和標(biāo)準(zhǔn)化處理,得到數(shù)據(jù)集STrecords={ST1,ST2,…,STM};

步驟224:使用PCA降維方法對數(shù)據(jù)集Srecords進(jìn)行降維,得到降維后的數(shù)據(jù)集Precord={P1,P2,…,PM};

步驟225:對降維后的數(shù)據(jù)使用AP聚類方法,得到類別標(biāo)簽Labels={L1,L2,…,LM},類別數(shù)量賦值給NUM;

步驟226:設(shè)定循環(huán)變量為n,并賦予初值n=2;

步驟227:當(dāng)n<=NUM執(zhí)行步驟228,否則執(zhí)行步驟231;

步驟228:使用K-means聚類方法對數(shù)據(jù)集Precord進(jìn)行聚類,得到貨物類別標(biāo)簽Labels={L1,L2,…,LM};

步驟229:使用SDbw聚類衡量方法衡量本次聚類效果,得到的值賦予SDk;

步驟230:n=n+1,繼續(xù)執(zhí)行步驟227;

步驟231:設(shè)SD2,SD3,…,SDNUM中的最小值為SDmin;

步驟232:min即為貨物數(shù)據(jù)集使用K-means聚類方法的最佳K值;

如附圖4附圖5,根據(jù)最佳K值聚類并使用聚類結(jié)果訓(xùn)練分類器步驟102從步驟301到步驟306:

步驟301:貨車數(shù)據(jù)集Crecords經(jīng)過中心化和標(biāo)準(zhǔn)化處理得到數(shù)據(jù)集SCrecords={SC1,SC2,…,SCM};

步驟302:使用K-means聚類方法對數(shù)據(jù)集SCrecords={SC1,SC2,…,SCM}進(jìn)行聚類,K為步驟216得到的最佳K值,得到貨車類別標(biāo)簽Labels={L1,L2,…,LM};

步驟303:使用樸素貝葉斯分類器,訓(xùn)練數(shù)據(jù)集為SCrecords={SC1,SC2,…,SCM},類別標(biāo)簽為Labels={L1,L2,…,LM},得到分類器ModelA;

步驟304:貨物數(shù)據(jù)集Trecords經(jīng)過中心化和標(biāo)準(zhǔn)化處理得到數(shù)據(jù)集STrecords={ST1,ST2,…,STM};

步驟305:使用K-means聚類方法對數(shù)據(jù)集STrecords={ST1,ST2,…,STM}進(jìn)行聚類,K為步驟232得到的最佳K值,得到貨車類別標(biāo)簽Labels={L1,L2,…,LM};

步驟306:使用樸素貝葉斯分類器,訓(xùn)練數(shù)據(jù)集為STrecords={ST1,ST2,…,STM},類別標(biāo)簽為Labels={L1,L2,…,LM},得到分類器ModelB;

如附圖6,將輸入的貨物或貨車數(shù)據(jù)分類流程步驟103從步驟401到步驟410:

步驟401:推薦內(nèi)容選擇;

步驟402:當(dāng)選擇推薦貨物時執(zhí)行步驟407,否則執(zhí)行步驟403;

步驟403:輸入貨物信息Trecord={t1,t2,t3,t4,t5},t1表示貨物運(yùn)輸價格,t2表示貨物重量,t3表示貨物出發(fā)地,t4表示貨物目的地,t5表示貨物發(fā)車時間;

步驟404:定義臨時變量dis表示出發(fā)地到目的地間的距離,定義臨時變量time表示從出發(fā)地到目的地需要的時間,調(diào)用高德api計算從出發(fā)地t3到目的地t4的經(jīng)過的距離和花費(fèi)的時間,并分別賦值給dis和time,然后用dis和time代替Trecord中的t3和t4;

步驟405:對貨物信息Trecord進(jìn)行中心和和標(biāo)準(zhǔn)化處理,得到數(shù)據(jù)STrecord={ST1,ST2,ST3,ST4,ST5};

步驟406:使用步驟303得到的分類器ModelA對數(shù)據(jù)STrecord分類,得到類別標(biāo)簽Tlabel;

步驟407:輸入貨車信息c1表示車主希望的運(yùn)輸價格,c2表示貨車剩余載重,c3表示貨車出發(fā)地,c4表示貨車目的地,c5表示貨車發(fā)車時間;

步驟408:定義臨時變量dis表示出發(fā)地到目的地間的距離,定義臨時變量time表示從出發(fā)地到目的地需要的時間,調(diào)用高德api計算從出發(fā)地c3到目的地c4的經(jīng)過的距離和花費(fèi)的時間,并分別賦值給dis和time,然后用dis和time代替Crecord中的c3和c4;

步驟409:對貨車信息Crecord進(jìn)行中心和和標(biāo)準(zhǔn)化處理,得到數(shù)據(jù)SCrecord={SC1,SC2,SC3,SC4,SC5};

步驟410:使用步驟306得到的分類器ModelB對數(shù)據(jù)SCrecord分類,得到類別標(biāo)簽Clabel;

如附圖7附圖8,根據(jù)分類得到結(jié)果計算余弦聚類并推薦步驟104從步驟501到步驟514:

步驟501:根據(jù)步驟305得到的標(biāo)簽,從數(shù)據(jù)集STrecords={ST1,ST2,…,STM}中抽取類別標(biāo)簽為Tlabel的數(shù)據(jù)組成新的數(shù)據(jù)集TTrecord={TT1,TT2,…,TTN};

步驟502:設(shè)定循環(huán)變量為n,并賦予初值n=1;

步驟503:當(dāng)n<=N執(zhí)行步驟504,否則執(zhí)行506;

步驟504:使用余弦相似度方法,計算貨車信息SCrecord={SC1,SC2,SC3,SC4,SC5}和貨物數(shù)據(jù)集TTrecord={TT1,TT2,…,TTN}中的TTn相似度,并將值賦給SIMn;

步驟505:n=n+1繼續(xù)執(zhí)行步驟503;

步驟506:對數(shù)據(jù)集TTrecord={TT1,TT2,…,TTN}根據(jù)相似度值SIM從大大小進(jìn)行排序;

步驟507:將經(jīng)過排序的TTrecord從前往后推薦給車主;

步驟508:根據(jù)步驟302得到的標(biāo)簽,數(shù)據(jù)集SCrecords={SC1,SC2,…,SCM}中抽取類別標(biāo)簽為Clabel的數(shù)據(jù)組成新的數(shù)據(jù)集SSrecords={SS1,SS2,…,SSN};

步驟509:設(shè)定循環(huán)變量為n,并賦予初值n=1;

步驟510:當(dāng)n<=N執(zhí)行步驟511,否則執(zhí)行步驟513;

步驟511:使用余弦相似度方法,計算貨物信息STrecord={ST1,ST2,ST3,ST4,ST5}和貨車數(shù)據(jù)集SSrecords={SS1,SS2,…,SSN}中的Ssn相似度,并將值賦給SIMn;

步驟512:n=n+1繼續(xù)執(zhí)行步驟510;

步驟513:對數(shù)據(jù)集SSrecords={SS1,SS2,…,SSN}根據(jù)相似度值SIM從大大小進(jìn)行排序;

步驟514:將經(jīng)過排序的SSrecords從前往后推薦給貨主。

為了更好的說明本方法的有效性,通過對14998條物流數(shù)據(jù)進(jìn)行聚類,得到數(shù)據(jù)集的最佳K值為3,設(shè)定K為3再使用K-means聚類方法對數(shù)據(jù)集聚類,得到待推薦數(shù)據(jù)集,采用余弦相似度計算得到最佳的前一百條推薦數(shù)據(jù),再和傳統(tǒng)的余弦相似度得到的前一百條推薦數(shù)據(jù)相比相似度達(dá)到95%,十次實(shí)驗中,本方法最高提升效率為84.9%,最低提升效率為26.5%,平均提升效率為59.5%。

本發(fā)明可與計算機(jī)系統(tǒng)結(jié)合,從而自動完成物流領(lǐng)域中貨物和貨車的雙向推薦。

本發(fā)明創(chuàng)造性的提出了一種將貨車數(shù)據(jù)和貨物數(shù)據(jù)通過AP聚類方法、SDbw聚類衡量方法和K-means聚類方法結(jié)合,得到了數(shù)據(jù)集的最佳聚類K值,再將數(shù)據(jù)根據(jù)K值聚類,訓(xùn)練分類器,然后將用戶輸入的信息分類,最終進(jìn)行推薦的方法。

本發(fā)明提出的一種基于聚類和余弦相似度的物流推薦方法不但可以用于物流領(lǐng)域的貨物貨車推薦,也可以用于其他消費(fèi)類商品的推薦。

以上所述僅為本發(fā)明的實(shí)施例子而已,并不用于限制本發(fā)明。凡在本發(fā)明的原則之內(nèi),所作的等同替換,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。本發(fā)明未作詳細(xì)闡述的內(nèi)容屬于本專業(yè)領(lǐng)域技術(shù)人員公知的已有技術(shù)。

當(dāng)前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1
杨浦区| 井冈山市| 长治市| 英超| 余姚市| 赫章县| 阿尔山市| 临澧县| 天水市| 金坛市| 东阿县| 章丘市| 长子县| 开远市| 临武县| 咸丰县| 宝清县| 澄江县| 衡南县| 瓮安县| 宜兰市| 宣威市| 宜兰县| 永德县| 新乐市| 九台市| 庄河市| 葫芦岛市| 新宾| 曲松县| 夹江县| 永和县| 开阳县| 乌兰浩特市| 海淀区| 宜良县| 平顶山市| 长沙县| 东海县| 昆山市| 买车|