本發(fā)明涉及網(wǎng)絡(luò)通信技術(shù)領(lǐng)域,具體涉及一種挖掘潛在客戶(hù)的方法和裝置。
背景技術(shù):
隨著網(wǎng)絡(luò)通信技術(shù)的發(fā)展,越來(lái)越多的商家通過(guò)網(wǎng)上商城售賣(mài)貨品,在商家進(jìn)行促銷(xiāo)的過(guò)程中,十分關(guān)心的一個(gè)問(wèn)題是:如何根據(jù)商家現(xiàn)在已擁有的客戶(hù)的信息(比如客戶(hù)的年齡、性別、家庭地址等信息),挖掘出潛在的客戶(hù),實(shí)現(xiàn)客戶(hù)的精準(zhǔn)觸達(dá)。我們的技術(shù)就是解決這個(gè)問(wèn)題,根據(jù)商家現(xiàn)有會(huì)員數(shù)據(jù),挖掘出其會(huì)員的社群特征,并根據(jù)這些特征從淘寶客中篩選出商家的潛在會(huì)員。
目前,挖掘潛在客戶(hù)的方法如下:獲得商家的樣本客戶(hù)的各個(gè)屬性標(biāo)簽;統(tǒng)計(jì)樣本客戶(hù)的各個(gè)屬性標(biāo)簽的分布特征;運(yùn)用貝葉斯無(wú)向圖網(wǎng)絡(luò),獲得樣本客戶(hù)的各個(gè)屬性標(biāo)簽的聯(lián)合概率分布函數(shù);運(yùn)用梯度下降法得到對(duì)于樣本客戶(hù)擬合度最好的屬性標(biāo)簽的權(quán)重,以及屬性標(biāo)簽組合的權(quán)重;運(yùn)用屬性標(biāo)簽的權(quán)重,屬性標(biāo)簽組合的權(quán)重,計(jì)算新客戶(hù)成為商家的潛在客戶(hù)的概率;根據(jù)新客戶(hù)成為商家的潛在客戶(hù)的概率,確定新客戶(hù)是否是商家的潛在客戶(hù)。
然而,現(xiàn)有挖掘潛在客戶(hù)的方法,需要將樣本客戶(hù)的各個(gè)屬性標(biāo)簽進(jìn)行組合,需要遍歷各種組合情況,計(jì)算復(fù)雜,浪費(fèi)時(shí)間。
技術(shù)實(shí)現(xiàn)要素:
為了解決現(xiàn)有技術(shù)的問(wèn)題,本發(fā)明提供了一種挖掘潛在客戶(hù)的方法和裝置,不需要將樣本客戶(hù)的各個(gè)屬性標(biāo)簽進(jìn)行組合,不需要遍歷各種組合情況,計(jì)算簡(jiǎn)單快捷,可以節(jié)約時(shí)間。
為了解決上述問(wèn)題,本發(fā)明公開(kāi)了一種挖掘潛在客戶(hù)的方法,所述方法包括:
獲取商家的樣本客戶(hù)的各個(gè)屬性標(biāo)簽,并計(jì)算所述樣本客戶(hù)的各個(gè)屬性標(biāo)簽的集中度,以及所述樣本客戶(hù)的各個(gè)屬性標(biāo)簽的屬性值域的權(quán)重;
將所述樣本客戶(hù)的各個(gè)屬性標(biāo)簽按照預(yù)設(shè)組合標(biāo)準(zhǔn)進(jìn)行組合,得到多個(gè)屬性標(biāo)簽組合,計(jì)算每個(gè)所述屬性標(biāo)簽組合的集中度;
根據(jù)每個(gè)所述屬性標(biāo)簽組合的集中度,以及組成每個(gè)所述屬性標(biāo)簽組合的屬性標(biāo)簽的集中度,從多個(gè)所述屬性標(biāo)簽組合中選擇所述樣本客戶(hù)的挖掘?qū)傩詷?biāo)簽,并計(jì)算所述樣本客戶(hù)的各個(gè)所述挖掘?qū)傩詷?biāo)簽的屬性值域的權(quán)重;
根據(jù)所述樣本客戶(hù)的各個(gè)屬性標(biāo)簽的屬性值域的權(quán)重、所述樣本客戶(hù)的各個(gè)挖掘?qū)傩詷?biāo)簽的屬性值域的權(quán)重,采用圖聚類(lèi)方法對(duì)所述樣本客戶(hù)進(jìn)行社群劃分,得到多個(gè)客戶(hù)社群;
獲取新客戶(hù)的各個(gè)屬性標(biāo)簽,并根據(jù)所述新客戶(hù)的各個(gè)屬性標(biāo)簽的屬性值、每個(gè)所述客戶(hù)社群中的所述樣本客戶(hù)的各個(gè)屬性標(biāo)簽的屬性值、各個(gè)挖掘?qū)傩詷?biāo)簽的屬性值,按照預(yù)設(shè)概率公式計(jì)算得到所述新客戶(hù)屬于每個(gè)所述客戶(hù)社群的概率;
當(dāng)所述新客戶(hù)屬于每個(gè)所述客戶(hù)社群的概率中存在一概率大于預(yù)設(shè)概率閾值時(shí),則確定所述新客戶(hù)是所述商家的潛在客戶(hù)。
進(jìn)一步地,所述屬性值域的權(quán)重包括:屬性值的權(quán)重或?qū)傩灾殿?lèi)區(qū)間的權(quán)重。
進(jìn)一步地,計(jì)算所述樣本客戶(hù)的各個(gè)屬性標(biāo)簽的屬性值的權(quán)重或?qū)傩灾殿?lèi)區(qū)間的權(quán)重,包括:
判斷所述樣本客戶(hù)的各個(gè)屬性標(biāo)簽的類(lèi)別;
如果所述樣本客戶(hù)的某屬性標(biāo)簽是文本類(lèi),則按照預(yù)設(shè)權(quán)重計(jì)算公式計(jì)算所述樣本客戶(hù)的文本類(lèi)的某屬性標(biāo)簽的各個(gè)屬性值的權(quán)重;
如果所述樣本客戶(hù)的某屬性標(biāo)簽的屬性值是數(shù)字類(lèi),則采用動(dòng)態(tài)聚類(lèi)方法對(duì)所述樣本客戶(hù)的數(shù)字類(lèi)的某屬性標(biāo)簽的各個(gè)屬性值進(jìn)行數(shù)據(jù)區(qū)間統(tǒng)計(jì), 得到多個(gè)屬性值類(lèi)區(qū)間,按照預(yù)設(shè)權(quán)重計(jì)算公式計(jì)算所述樣本客戶(hù)的數(shù)字類(lèi)的某屬性標(biāo)簽的各個(gè)屬性值類(lèi)區(qū)間的權(quán)重。
進(jìn)一步地,所述預(yù)設(shè)權(quán)重計(jì)算公式為:
其中,對(duì)于文本類(lèi)的某屬性標(biāo)簽:xi表示文本類(lèi)的某屬性標(biāo)簽的屬性值是xi,w(xi)表示文本類(lèi)的某屬性標(biāo)簽的屬性值xi的權(quán)重,CRn表示文本類(lèi)的某屬性標(biāo)簽的集中度,c(xi)表示文本類(lèi)的某屬性標(biāo)簽的屬性值xi的個(gè)數(shù),c(X)表示文本類(lèi)的某屬性標(biāo)簽的所有屬性值的總個(gè)數(shù);對(duì)于數(shù)字類(lèi)的某屬性標(biāo)簽:xi表示數(shù)字類(lèi)的某屬性標(biāo)簽的屬性值類(lèi)區(qū)間是xi,w(xi)表示數(shù)字類(lèi)的某屬性標(biāo)簽的屬性值類(lèi)區(qū)間的權(quán)重,CRn表示數(shù)字類(lèi)的某屬性標(biāo)簽的集中度,c(xi)表示數(shù)字類(lèi)的某屬性標(biāo)簽的屬性值類(lèi)區(qū)間中元素的個(gè)數(shù),c(X)表示數(shù)字類(lèi)的某屬性標(biāo)簽的所有屬性值類(lèi)區(qū)間中元素的總個(gè)數(shù)。
進(jìn)一步地,將所述樣本客戶(hù)的各個(gè)屬性標(biāo)簽按照預(yù)設(shè)組合標(biāo)準(zhǔn)進(jìn)行組合,得到多個(gè)屬性標(biāo)簽組合,包括:
將所述樣本客戶(hù)的各個(gè)屬性標(biāo)簽的屬性值的權(quán)重或?qū)傩灾殿?lèi)區(qū)間的權(quán)重,與預(yù)設(shè)權(quán)重閾值進(jìn)行比較,得到所述樣本客戶(hù)的屬性標(biāo)簽的屬性值的權(quán)重或?qū)傩灾殿?lèi)區(qū)間的權(quán)重小于所述預(yù)設(shè)權(quán)重閾值的多個(gè)屬性標(biāo)簽;
將所述樣本客戶(hù)的小于所述預(yù)設(shè)權(quán)重閾值的多個(gè)屬性標(biāo)簽進(jìn)行二二組合,得到多個(gè)所述屬性標(biāo)簽組合。
進(jìn)一步地,計(jì)算所述樣本客戶(hù)的各個(gè)挖掘?qū)傩詷?biāo)簽的屬性值的權(quán)重或?qū)傩灾殿?lèi)區(qū)間的權(quán)重,包括:
判斷組成所述樣本客戶(hù)的各個(gè)所述挖掘?qū)傩詷?biāo)簽的二個(gè)屬性標(biāo)簽的類(lèi)別;
如果組成所述樣本客戶(hù)的某所述挖掘?qū)傩詷?biāo)簽的二個(gè)屬性標(biāo)簽的類(lèi)別均是文本類(lèi),則按照所述預(yù)設(shè)權(quán)重計(jì)算公式計(jì)算所述樣本客戶(hù)的某所述挖掘?qū)傩詷?biāo)簽的各個(gè)屬性值的權(quán)重;
如果組成所述樣本客戶(hù)的某所述挖掘?qū)傩詷?biāo)簽的二個(gè)屬性標(biāo)簽的類(lèi)別一個(gè)是文本類(lèi)、一個(gè)是數(shù)字類(lèi),則采用動(dòng)態(tài)聚類(lèi)方法對(duì)所述樣本客戶(hù)的某所 述挖掘?qū)傩詷?biāo)簽的各個(gè)屬性值進(jìn)行數(shù)據(jù)區(qū)間統(tǒng)計(jì),得到多個(gè)屬性值類(lèi)區(qū)間,按照所述預(yù)設(shè)權(quán)重計(jì)算公式計(jì)算所述樣本客戶(hù)的某所述挖掘?qū)傩詷?biāo)簽的各個(gè)屬性值類(lèi)區(qū)間的權(quán)重;
如果組成所述樣本客戶(hù)的某所述挖掘?qū)傩詷?biāo)簽的二個(gè)屬性標(biāo)簽的類(lèi)別均是數(shù)字類(lèi),則采用自組織映射SOM聚類(lèi)方法對(duì)所述樣本客戶(hù)的某所述挖掘?qū)傩詷?biāo)簽的各個(gè)屬性值進(jìn)行數(shù)據(jù)區(qū)間統(tǒng)計(jì),得到多個(gè)屬性值類(lèi)區(qū)間,按照所述預(yù)設(shè)權(quán)重計(jì)算公式計(jì)算所述樣本客戶(hù)的某所述挖掘?qū)傩詷?biāo)簽的各個(gè)屬性值類(lèi)區(qū)間的權(quán)重。
進(jìn)一步地,根據(jù)每個(gè)所述屬性標(biāo)簽組合的集中度,以及組成每個(gè)所述屬性標(biāo)簽組合的屬性標(biāo)簽的集中度,確定每個(gè)所述屬性標(biāo)簽組合是否能夠作為所述樣本客戶(hù)的挖掘?qū)傩詷?biāo)簽,包括:
將每個(gè)所述屬性標(biāo)簽組合的集中度,分別與組成每個(gè)所述屬性標(biāo)簽組合的屬性標(biāo)簽的集中度進(jìn)行比較;
如果某個(gè)所述屬性標(biāo)簽組合的集中度大于組成某個(gè)所述屬性標(biāo)簽組合的所有屬性標(biāo)簽的集中度,則確定某個(gè)所述屬性標(biāo)簽組合能夠作為所述樣本客戶(hù)的所述挖掘?qū)傩詷?biāo)簽;
如果某個(gè)所述屬性標(biāo)簽組合的集中度小于等于組成某個(gè)所述屬性標(biāo)簽組合的任一屬性標(biāo)簽的集中度,則確定某個(gè)所述屬性標(biāo)簽組合不能夠作為所述樣本客戶(hù)的所述挖掘?qū)傩詷?biāo)簽。
進(jìn)一步地,根據(jù)所述樣本客戶(hù)的各個(gè)屬性標(biāo)簽的屬性值的權(quán)重或?qū)傩灾殿?lèi)區(qū)間的權(quán)重、所述樣本客戶(hù)的各個(gè)挖掘?qū)傩詷?biāo)簽的屬性值的權(quán)重或?qū)傩灾殿?lèi)區(qū)間的權(quán)重,采用圖聚類(lèi)方法對(duì)所述樣本客戶(hù)進(jìn)行社群劃分,得到多個(gè)客戶(hù)社群,包括:
從所有的所述樣本客戶(hù)中隨機(jī)選擇一個(gè)所述樣本客戶(hù),根據(jù)所述樣本客戶(hù)的各個(gè)屬性標(biāo)簽的屬性值的權(quán)重或?qū)傩灾殿?lèi)區(qū)間的權(quán)重、所述樣本客戶(hù)的各個(gè)挖掘?qū)傩詷?biāo)簽的屬性值的權(quán)重或?qū)傩灾殿?lèi)區(qū)間的權(quán)重,按照預(yù)設(shè)最大連接權(quán)重選擇公式,從隨機(jī)選擇的所述樣本客戶(hù)與其他各個(gè)所述樣本客戶(hù)之間的連接權(quán)重中,選擇連接權(quán)重最大的一個(gè)其他所述樣本客戶(hù),并將連接權(quán)重最大的一個(gè)其他所述樣本客戶(hù)與隨機(jī)選擇的所述樣本客戶(hù)組成待定客戶(hù)社 群;
根據(jù)預(yù)設(shè)聚合公式,計(jì)算所述待定客戶(hù)社群之外的其他所述樣本客戶(hù)與所述待定客戶(hù)社群的聚合效應(yīng),根據(jù)所述待定客戶(hù)社群之外的其他所述樣本客戶(hù)與待定客戶(hù)社群的聚合效應(yīng),確定是否將所述待定客戶(hù)社群之外的其他所述樣本客戶(hù)添加到所述待定客戶(hù)社群組成所述客戶(hù)社群;
從所述客戶(hù)社群之外的所述樣本客戶(hù)中隨機(jī)選擇一個(gè)所述樣本客戶(hù),然后執(zhí)行計(jì)算隨機(jī)選擇的所述樣本客戶(hù)與其他各個(gè)所述樣本客戶(hù)之間的連接權(quán)重的步驟。
進(jìn)一步地,所述預(yù)設(shè)最大連接權(quán)重選擇公式如下:
其中,v*表示與隨機(jī)選擇的所述樣本客戶(hù)v的連接權(quán)重最大的一個(gè)其他所述樣本客戶(hù),Ev-connect表示隨機(jī)選擇的所述樣本客戶(hù)v與隨機(jī)選擇的所述樣本客戶(hù)v有共同屬性值的任一所述樣本客戶(hù)的連接權(quán)重。
進(jìn)一步地,所述預(yù)設(shè)聚合公式如下:
其中,當(dāng)w(Sin)表示隨機(jī)選擇的所述樣本客戶(hù)v與所述待定客戶(hù)社群中的其他所述樣本客戶(hù)的連接權(quán)重、w(Sout)表示隨機(jī)選擇的所述樣本客戶(hù)v與所述待定客戶(hù)社群之外的其他所述樣本客戶(hù)的連接權(quán)重時(shí),Condensity(gi)表示所述待定客戶(hù)社群的聚合效應(yīng)值;當(dāng)w(Sin)表示隨機(jī)選擇的所述樣本客戶(hù)v與所述客戶(hù)社群中的其他所述樣本客戶(hù)的連接權(quán)重、w(Sout)表示隨機(jī)選擇的所述樣本客戶(hù)v與所述客戶(hù)社群之外的其他所述樣本客戶(hù)的連接權(quán)重時(shí),Condensity(gi)表示所述客戶(hù)社群的聚合效應(yīng)值。
進(jìn)一步地,根據(jù)所述待定客戶(hù)社群之外的其他所述樣本客戶(hù)與所述待定客戶(hù)社群的聚合效應(yīng),確定是否將所述待定客戶(hù)社群之外的其他所述樣本客戶(hù)添加到所述待定客戶(hù)社群組成所述客戶(hù)社群,包括:
將所述待定客戶(hù)社群的聚合效應(yīng)值與所述客戶(hù)社群的聚合效應(yīng)值進(jìn)行比較;
如果所述客戶(hù)社群的聚合效應(yīng)值大于所述待定客戶(hù)社群的聚合效應(yīng)值,則確定將所述待定客戶(hù)社群之外的其他所述樣本客戶(hù)添加到所述待定客戶(hù)社群組成所述客戶(hù)社群;
如果所述客戶(hù)社群的聚合效應(yīng)值小于等于所述待定客戶(hù)社群的聚合效應(yīng)值,則確定不將所述待定客戶(hù)社群之外的其他所述樣本客戶(hù)添加到所述待定客戶(hù)社群組成所述客戶(hù)社群。
進(jìn)一步地,按照預(yù)設(shè)概率公式計(jì)算得到所述新客戶(hù)屬于每個(gè)所述客戶(hù)社群的概率之后,還包括:
將所述新客戶(hù)屬于每個(gè)所述客戶(hù)社群的概率進(jìn)行比較,得到所述新客戶(hù)屬于所述客戶(hù)社群的最大概率;
確定所述新客戶(hù)屬于最大概率對(duì)應(yīng)的所述客戶(hù)社群;
更新所述樣本客戶(hù)的各個(gè)屬性標(biāo)簽的屬性值的權(quán)重或?qū)傩灾殿?lèi)區(qū)間的權(quán)重。
進(jìn)一步地,所述預(yù)設(shè)概率公式如下:
其中,Y表示所述新客戶(hù)的屬性標(biāo)簽,yi表示所述新客戶(hù)的屬性標(biāo)簽的第i個(gè)屬性值,n表示所述新客戶(hù)的屬性標(biāo)簽有n個(gè)屬性值,B表示任一所述客戶(hù)社群。
進(jìn)一步地,確定所述新客戶(hù)是所述商家的潛在客戶(hù)之后,還包括:
獲取所述商家的反饋信息;其中,所述反饋信息包括確定的某所述新客戶(hù)是所述商家的潛在客戶(hù)不正確、和/或原來(lái)的某所述樣本客戶(hù)當(dāng)前不符合所述商家的客戶(hù)標(biāo)準(zhǔn);
根據(jù)所述商家的反饋信息,按照預(yù)設(shè)權(quán)重矯正公式對(duì)所述樣本客戶(hù)或所述新客戶(hù)的各個(gè)屬性標(biāo)簽的屬性值的權(quán)重或?qū)傩灾殿?lèi)區(qū)間的權(quán)重進(jìn)行矯正,并根據(jù)所述商家的反饋信息,對(duì)所述客戶(hù)社群進(jìn)行矯正。
進(jìn)一步地,所述預(yù)設(shè)權(quán)重矯正公式如下:
其中,表示所述樣本客戶(hù)或所述新客戶(hù)的矯正后的屬性標(biāo)簽A的屬性值或?qū)傩灾殿?lèi)區(qū)間在矯正后的所述客戶(hù)社群中的權(quán)重;表示所述樣本客戶(hù)或所述新客戶(hù)的矯正前的屬性標(biāo)簽A的屬性值或?qū)傩灾殿?lèi)區(qū)間在矯正后的所述客戶(hù)社群中的權(quán)重;表示所述樣本客戶(hù)或所述新客戶(hù)的矯正后的屬性標(biāo)簽A在矯正前的所述客戶(hù)社群中的權(quán)重。
為了解決上述問(wèn)題,本發(fā)明還公開(kāi)了一種挖掘潛在客戶(hù)的裝置,所述裝置包括:
獲取模塊,用于獲取商家的樣本客戶(hù)的各個(gè)屬性標(biāo)簽,并計(jì)算所述樣本客戶(hù)的各個(gè)屬性標(biāo)簽的集中度,以及所述樣本客戶(hù)的各個(gè)屬性標(biāo)簽的屬性值域的權(quán)重;
組合計(jì)算模塊,用于將所述樣本客戶(hù)的各個(gè)屬性標(biāo)簽按照預(yù)設(shè)組合標(biāo)準(zhǔn)進(jìn)行組合,得到多個(gè)屬性標(biāo)簽組合,計(jì)算每個(gè)所述屬性標(biāo)簽組合的集中度;
確定計(jì)算模塊,用于根據(jù)每個(gè)所述屬性標(biāo)簽組合的集中度,以及組成每個(gè)所述屬性標(biāo)簽組合的屬性標(biāo)簽的集中度,從多個(gè)所述屬性標(biāo)簽組合中選擇所述樣本客戶(hù)的挖掘?qū)傩詷?biāo)簽,并計(jì)算所述樣本客戶(hù)的各個(gè)所述挖掘?qū)傩詷?biāo)簽的屬性值域的權(quán)重;
劃分模塊,用于根據(jù)所述樣本客戶(hù)的各個(gè)屬性標(biāo)簽的屬性值域的權(quán)重、所述樣本客戶(hù)的各個(gè)挖掘?qū)傩詷?biāo)簽的屬性值域的權(quán)重,采用圖聚類(lèi)方法對(duì)所述樣本客戶(hù)進(jìn)行社群劃分,得到多個(gè)客戶(hù)社群;
概率計(jì)算模塊,用于獲取新客戶(hù)的各個(gè)屬性標(biāo)簽,并根據(jù)所述新客戶(hù)的各個(gè)屬性標(biāo)簽的屬性值、每個(gè)所述客戶(hù)社群中的所述樣本客戶(hù)的各個(gè)屬性標(biāo)簽的屬性值、各個(gè)挖掘?qū)傩詷?biāo)簽的屬性值,按照預(yù)設(shè)概率公式計(jì)算得到所述新客戶(hù)屬于每個(gè)所述客戶(hù)社群的概率;
潛在客戶(hù)確定模塊,用于當(dāng)所述新客戶(hù)屬于每個(gè)所述客戶(hù)社群的概率中存在一概率大于預(yù)設(shè)概率閾值時(shí),則確定所述新客戶(hù)是所述商家的潛在客戶(hù)。
進(jìn)一步地,所述屬性值域的權(quán)重包括:屬性值的權(quán)重或?qū)傩灾殿?lèi)區(qū)間的權(quán)重。
進(jìn)一步地,所述獲取模塊包括:
第一判斷單元,用于判斷所述樣本客戶(hù)的各個(gè)屬性標(biāo)簽的類(lèi)別;
第一計(jì)算單元,用于如果所述樣本客戶(hù)的某屬性標(biāo)簽是文本類(lèi),則按照預(yù)設(shè)權(quán)重計(jì)算公式計(jì)算所述樣本客戶(hù)的文本類(lèi)的某屬性標(biāo)簽的各個(gè)屬性值的權(quán)重;
第二計(jì)算單元,用于如果所述樣本客戶(hù)的某屬性標(biāo)簽的屬性值是數(shù)字類(lèi),則采用動(dòng)態(tài)聚類(lèi)裝置對(duì)所述樣本客戶(hù)的數(shù)字類(lèi)的某屬性標(biāo)簽的各個(gè)屬性值進(jìn)行數(shù)據(jù)區(qū)間統(tǒng)計(jì),得到多個(gè)屬性值類(lèi)區(qū)間,按照預(yù)設(shè)權(quán)重計(jì)算公式計(jì)算所述樣本客戶(hù)的數(shù)字類(lèi)的某屬性標(biāo)簽的各個(gè)屬性值類(lèi)區(qū)間的權(quán)重。
進(jìn)一步地,所述預(yù)設(shè)權(quán)重計(jì)算公式為:
其中,對(duì)于文本類(lèi)的某屬性標(biāo)簽:xi表示文本類(lèi)的某屬性標(biāo)簽的屬性值是xi,w(xi)表示文本類(lèi)的某屬性標(biāo)簽的屬性值xi的權(quán)重,CRn表示文本類(lèi)的某屬性標(biāo)簽的集中度,c(xi)表示文本類(lèi)的某屬性標(biāo)簽的屬性值xi的個(gè)數(shù),c(X)表示文本類(lèi)的某屬性標(biāo)簽的所有屬性值的總個(gè)數(shù);對(duì)于數(shù)字類(lèi)的某屬性標(biāo)簽:xi表示數(shù)字類(lèi)的某屬性標(biāo)簽的屬性值類(lèi)區(qū)間是xi,w(xi)表示數(shù)字類(lèi)的某屬性標(biāo)簽的屬性值類(lèi)區(qū)間的權(quán)重,CRn表示數(shù)字類(lèi)的某屬性標(biāo)簽的集中度,c(xi)表示數(shù)字類(lèi)的某屬性標(biāo)簽的屬性值類(lèi)區(qū)間中元素的個(gè)數(shù),c(X)表示數(shù)字類(lèi)的某屬性標(biāo)簽的所有屬性值類(lèi)區(qū)間中元素的總個(gè)數(shù)。
進(jìn)一步地,所述組合計(jì)算模塊包括:
第一比較單元,用于將所述樣本客戶(hù)的各個(gè)屬性標(biāo)簽的屬性值的權(quán)重或?qū)傩灾殿?lèi)區(qū)間的權(quán)重,與預(yù)設(shè)權(quán)重閾值進(jìn)行比較,得到所述樣本客戶(hù)的屬性標(biāo)簽的屬性值的權(quán)重或?qū)傩灾殿?lèi)區(qū)間的權(quán)重小于所述預(yù)設(shè)權(quán)重閾值的多個(gè)屬性標(biāo)簽;
組合單元,用于將所述樣本客戶(hù)的小于所述預(yù)設(shè)權(quán)重閾值的多個(gè)屬性標(biāo)簽進(jìn)行二二組合,得到多個(gè)所述屬性標(biāo)簽組合。
進(jìn)一步地,所述確定計(jì)算模塊還包括:
第二判斷單元,用于判斷組成所述樣本客戶(hù)的各個(gè)所述挖掘?qū)傩詷?biāo)簽的二個(gè)屬性標(biāo)簽的類(lèi)別;
第三計(jì)算單元,用于如果組成所述樣本客戶(hù)的某所述挖掘?qū)傩詷?biāo)簽的二個(gè)屬性標(biāo)簽的類(lèi)別均是文本類(lèi),則按照所述預(yù)設(shè)權(quán)重計(jì)算公式計(jì)算所述樣本客戶(hù)的某所述挖掘?qū)傩詷?biāo)簽的各個(gè)屬性值的權(quán)重;
第四計(jì)算單元,用于如果組成所述樣本客戶(hù)的某所述挖掘?qū)傩詷?biāo)簽的二個(gè)屬性標(biāo)簽的類(lèi)別一個(gè)是文本類(lèi)、一個(gè)是數(shù)字類(lèi),則采用動(dòng)態(tài)聚類(lèi)裝置對(duì)所述樣本客戶(hù)的某所述挖掘?qū)傩詷?biāo)簽的各個(gè)屬性值進(jìn)行數(shù)據(jù)區(qū)間統(tǒng)計(jì),得到多個(gè)屬性值類(lèi)區(qū)間,按照所述預(yù)設(shè)權(quán)重計(jì)算公式計(jì)算所述樣本客戶(hù)的某所述挖掘?qū)傩詷?biāo)簽的各個(gè)屬性值類(lèi)區(qū)間的權(quán)重;
第五計(jì)算單元,用于如果組成所述樣本客戶(hù)的某所述挖掘?qū)傩詷?biāo)簽的二個(gè)屬性標(biāo)簽的類(lèi)別均是數(shù)字類(lèi),則采用自組織映射SOM聚類(lèi)裝置對(duì)所述樣本客戶(hù)的某所述挖掘?qū)傩詷?biāo)簽的各個(gè)屬性值進(jìn)行數(shù)據(jù)區(qū)間統(tǒng)計(jì),得到多個(gè)屬性值類(lèi)區(qū)間,按照所述預(yù)設(shè)權(quán)重計(jì)算公式計(jì)算所述樣本客戶(hù)的某所述挖掘?qū)傩詷?biāo)簽的各個(gè)屬性值類(lèi)區(qū)間的權(quán)重。
進(jìn)一步地,所述確定計(jì)算模塊包括:
第二比較單元,用于將每個(gè)所述屬性標(biāo)簽組合的集中度,分別與組成每個(gè)所述屬性標(biāo)簽組合的屬性標(biāo)簽的集中度進(jìn)行比較;
第一確定單元,用于如果某個(gè)所述屬性標(biāo)簽組合的集中度大于組成某個(gè)所述屬性標(biāo)簽組合的所有屬性標(biāo)簽的集中度,則確定某個(gè)所述屬性標(biāo)簽組合能夠作為所述樣本客戶(hù)的所述挖掘?qū)傩詷?biāo)簽;
第二確定單元,用于如果某個(gè)所述屬性標(biāo)簽組合的集中度小于等于組成某個(gè)所述屬性標(biāo)簽組合的任一屬性標(biāo)簽的集中度,則確定某個(gè)所述屬性標(biāo)簽組合不能夠作為所述樣本客戶(hù)的所述挖掘?qū)傩詷?biāo)簽。
進(jìn)一步地,所述劃分模塊包括:
選擇單元,用于從所有的所述樣本客戶(hù)中隨機(jī)選擇一個(gè)所述樣本客戶(hù),根據(jù)所述樣本客戶(hù)的各個(gè)屬性標(biāo)簽的屬性值的權(quán)重或?qū)傩灾殿?lèi)區(qū)間的權(quán)重、 所述樣本客戶(hù)的各個(gè)挖掘?qū)傩詷?biāo)簽的屬性值的權(quán)重或?qū)傩灾殿?lèi)區(qū)間的權(quán)重,按照預(yù)設(shè)最大連接權(quán)重選擇公式,從隨機(jī)選擇的所述樣本客戶(hù)與其他各個(gè)所述樣本客戶(hù)之間的連接權(quán)重中,選擇連接權(quán)重最大的一個(gè)其他所述樣本客戶(hù),并將連接權(quán)重最大的一個(gè)其他所述樣本客戶(hù)與隨機(jī)選擇的所述樣本客戶(hù)組成待定客戶(hù)社群;
第三確定單元,用于根據(jù)預(yù)設(shè)聚合公式,計(jì)算所述待定客戶(hù)社群之外的其他所述樣本客戶(hù)與所述待定客戶(hù)社群的聚合效應(yīng),根據(jù)所述待定客戶(hù)社群之外的其他所述樣本客戶(hù)與待定客戶(hù)社群的聚合效應(yīng),確定是否將所述待定客戶(hù)社群之外的其他所述樣本客戶(hù)添加到所述待定客戶(hù)社群組成所述客戶(hù)社群;
通知單元,用于從所述客戶(hù)社群之外的所述樣本客戶(hù)中隨機(jī)選擇一個(gè)所述樣本客戶(hù),然后通知所述選擇單元執(zhí)行計(jì)算隨機(jī)選擇的所述樣本客戶(hù)與其他各個(gè)所述樣本客戶(hù)之間的連接權(quán)重的步驟。
進(jìn)一步地,所述預(yù)設(shè)最大連接權(quán)重選擇公式如下:
其中,v*表示與隨機(jī)選擇的所述樣本客戶(hù)v的連接權(quán)重最大的一個(gè)其他所述樣本客戶(hù),Ev-connect表示隨機(jī)選擇的所述樣本客戶(hù)v與隨機(jī)選擇的所述樣本客戶(hù)v有共同屬性值的任一所述樣本客戶(hù)的連接權(quán)重。
進(jìn)一步地,所述預(yù)設(shè)聚合公式如下:
其中,當(dāng)w(Sin)表示隨機(jī)選擇的所述樣本客戶(hù)v與所述待定客戶(hù)社群中的其他所述樣本客戶(hù)的連接權(quán)重、w(Sout)表示隨機(jī)選擇的所述樣本客戶(hù)v與所述待定客戶(hù)社群之外的其他所述樣本客戶(hù)的連接權(quán)重時(shí),Condensity(gi)表示所述待定客戶(hù)社群的聚合效應(yīng)值;當(dāng)w(Sin)表示隨機(jī)選擇的所述樣本客戶(hù)v與所述客戶(hù)社群中的其他所述樣本客戶(hù)的連接權(quán)重、w(Sout)表示隨機(jī)選擇的所述樣本客戶(hù)v與所述客戶(hù)社群之外的其他所述樣本客戶(hù)的連接權(quán)重時(shí),Condensity(gi)表示所述客戶(hù)社群的聚合效應(yīng)值。
進(jìn)一步地,所述第三確定單元包括:
比較子單元,用于將所述待定客戶(hù)社群的聚合效應(yīng)值與所述客戶(hù)社群的聚合效應(yīng)值進(jìn)行比較;
第一確定子單元,用于如果所述客戶(hù)社群的聚合效應(yīng)值大于所述待定客戶(hù)社群的聚合效應(yīng)值,則確定將所述待定客戶(hù)社群之外的其他所述樣本客戶(hù)添加到所述待定客戶(hù)社群組成所述客戶(hù)社群;
第二確定子單元,用于如果所述客戶(hù)社群的聚合效應(yīng)值小于等于所述待定客戶(hù)社群的聚合效應(yīng)值,則確定不將所述待定客戶(hù)社群之外的其他所述樣本客戶(hù)添加到所述待定客戶(hù)社群組成所述客戶(hù)社群。
進(jìn)一步地,所述裝置還包括:
比較模塊,用于按照預(yù)設(shè)概率公式計(jì)算得到所述新客戶(hù)屬于每個(gè)所述客戶(hù)社群的概率之后,將所述新客戶(hù)屬于每個(gè)所述客戶(hù)社群的概率進(jìn)行比較,得到所述新客戶(hù)屬于所述客戶(hù)社群的最大概率;
確定模塊,用于確定所述新客戶(hù)屬于最大概率對(duì)應(yīng)的所述客戶(hù)社群;
更新模塊,用于更新所述樣本客戶(hù)的各個(gè)屬性標(biāo)簽的屬性值的權(quán)重或?qū)傩灾殿?lèi)區(qū)間的權(quán)重。
進(jìn)一步地,所述預(yù)設(shè)概率公式如下:
其中,Y表示所述新客戶(hù)的屬性標(biāo)簽,yi表示所述新客戶(hù)的屬性標(biāo)簽的第i個(gè)屬性值,n表示所述新客戶(hù)的屬性標(biāo)簽有n個(gè)屬性值,B表示任一所述客戶(hù)社群。
進(jìn)一步地,所述裝置還包括:
反饋模塊,用于確定所述新客戶(hù)是所述商家的潛在客戶(hù)之后,獲取所述商家的反饋信息;其中,所述反饋信息包括確定的某所述新客戶(hù)是所述商家的潛在客戶(hù)不正確、和/或原來(lái)的某所述樣本客戶(hù)當(dāng)前不符合所述商家的客戶(hù)標(biāo)準(zhǔn);
矯正模塊,用于根據(jù)所述商家的反饋信息,按照預(yù)設(shè)權(quán)重矯正公式對(duì)所述樣本客戶(hù)或所述新客戶(hù)的各個(gè)屬性標(biāo)簽的屬性值的權(quán)重或?qū)傩灾殿?lèi)區(qū)間 的權(quán)重進(jìn)行矯正,并根據(jù)所述商家的反饋信息,對(duì)所述客戶(hù)社群進(jìn)行矯正。
進(jìn)一步地,所述預(yù)設(shè)權(quán)重矯正公式如下:
其中,表示所述樣本客戶(hù)或所述新客戶(hù)的矯正后的屬性標(biāo)簽A的屬性值或?qū)傩灾殿?lèi)區(qū)間在矯正后的所述客戶(hù)社群中的權(quán)重;表示所述樣本客戶(hù)或所述新客戶(hù)的矯正前的屬性標(biāo)簽A的屬性值或?qū)傩灾殿?lèi)區(qū)間在矯正后的所述客戶(hù)社群中的權(quán)重;表示所述樣本客戶(hù)或所述新客戶(hù)的矯正后的屬性標(biāo)簽A在矯正前的所述客戶(hù)社群中的權(quán)重。
與現(xiàn)有技術(shù)相比,本發(fā)明可以獲得包括以下技術(shù)效果:
1)根據(jù)每個(gè)屬性標(biāo)簽組合的集中度,以及組成每個(gè)屬性標(biāo)簽組合的屬性標(biāo)簽的集中度,選擇樣本客戶(hù)的挖掘?qū)傩詷?biāo)簽,根據(jù)樣本客戶(hù)的各個(gè)屬性標(biāo)簽的屬性值域的權(quán)重、樣本客戶(hù)的各個(gè)挖掘?qū)傩詷?biāo)簽的屬性值域的權(quán)重,采用圖聚類(lèi)方法對(duì)樣本客戶(hù)進(jìn)行社群劃分,得到多個(gè)客戶(hù)社群,當(dāng)新客戶(hù)屬于每個(gè)客戶(hù)社群的概率中存在一概率大于預(yù)設(shè)概率閾值時(shí),則確定新客戶(hù)是商家的潛在客戶(hù),不需要將樣本客戶(hù)的各個(gè)屬性標(biāo)簽進(jìn)行組合,不需要遍歷各種組合情況,計(jì)算簡(jiǎn)單快捷,可以節(jié)約時(shí)間。
2)按照預(yù)設(shè)概率公式計(jì)算得到新客戶(hù)屬于每個(gè)客戶(hù)社群的概率,通過(guò)概率確定新客戶(hù)是不是商家的潛在客戶(hù),而不需要采用梯度下降法求全局最優(yōu)結(jié)果,大大提高了運(yùn)算速度。
3)預(yù)設(shè)權(quán)重計(jì)算公式通過(guò)運(yùn)用屬性標(biāo)簽的集中度,能夠適應(yīng)更復(fù)雜的數(shù)據(jù)結(jié)構(gòu),能夠更有效的反應(yīng)數(shù)據(jù)的分布規(guī)律。
4)根據(jù)商家的反饋信息,按照預(yù)設(shè)權(quán)重矯正公式對(duì)樣本客戶(hù)或新客戶(hù)的各個(gè)屬性標(biāo)簽的屬性值的權(quán)重或?qū)傩灾殿?lèi)區(qū)間的權(quán)重進(jìn)行矯正,預(yù)設(shè)權(quán)重矯正公式不僅考慮了屬性標(biāo)簽所包含的樣本量因素,還針對(duì)權(quán)重本身進(jìn)行懲罰或者獎(jiǎng)勵(lì),這樣不僅加快了效果反饋速度,同時(shí)還使得權(quán)重的變化更加穩(wěn)健,不會(huì)出現(xiàn)異常的增加或者減少,并且會(huì)隨著樣本客戶(hù)數(shù)量的增加,準(zhǔn)確度也會(huì)越來(lái)越高。
當(dāng)然,實(shí)施本發(fā)明的任一產(chǎn)品必不一定需要同時(shí)達(dá)到以上所述的所有技術(shù)效果。
附圖說(shuō)明
此處所說(shuō)明的附圖用來(lái)提供對(duì)本發(fā)明的進(jìn)一步理解,構(gòu)成本發(fā)明的一部分,本發(fā)明的示意性實(shí)施例及其說(shuō)明用于解釋本發(fā)明,并不構(gòu)成對(duì)本發(fā)明的不當(dāng)限定。在附圖中:
圖1是本發(fā)明實(shí)施例的第一種挖掘潛在客戶(hù)的方法流程圖;
圖2是本發(fā)明實(shí)施例的屬性值類(lèi)區(qū)間對(duì)應(yīng)的波峰示意圖;
圖3是本發(fā)明實(shí)施例的對(duì)于文本類(lèi)的屬性標(biāo)簽的屬性值X和文本類(lèi)的屬性標(biāo)簽的屬性值Y的屬性標(biāo)簽組合的計(jì)算示意圖;
圖4是本發(fā)明實(shí)施例的文本類(lèi)的屬性值下的數(shù)字類(lèi)的屬性值的分布規(guī)律示意圖;
圖5是本發(fā)明實(shí)施例的不同數(shù)字類(lèi)的屬性值的分布規(guī)律示意圖;
圖6是本發(fā)明實(shí)施例的第二種挖掘潛在客戶(hù)的方法流程圖;
圖7是本發(fā)明實(shí)施例的第三種挖掘潛在客戶(hù)的方法流程圖;
圖8是本發(fā)明實(shí)施例的第四種挖掘潛在客戶(hù)的方法流程圖;
圖9是本發(fā)明實(shí)施例的采用圖聚類(lèi)方法依次對(duì)樣本客戶(hù)進(jìn)行社群劃分,得到多個(gè)客戶(hù)社群的示意圖;
圖10是本發(fā)明實(shí)施例的第五種挖掘潛在客戶(hù)的方法流程圖;
圖11是本發(fā)明實(shí)施例的第六種挖掘潛在客戶(hù)的方法流程圖;
圖12是本發(fā)明實(shí)施例的第一種挖掘潛在客戶(hù)的裝置結(jié)構(gòu)示意圖;
圖13是本發(fā)明實(shí)施例的第二種挖掘潛在客戶(hù)的裝置結(jié)構(gòu)示意圖;
圖14是本發(fā)明實(shí)施例的第三種挖掘潛在客戶(hù)的裝置結(jié)構(gòu)示意圖。
具體實(shí)施方式
以下將配合附圖及實(shí)施例來(lái)詳細(xì)說(shuō)明本發(fā)明的實(shí)施方式,藉此對(duì)本發(fā)明 如何應(yīng)用技術(shù)手段來(lái)解決技術(shù)問(wèn)題并達(dá)成技術(shù)功效的實(shí)現(xiàn)過(guò)程能充分理解并據(jù)以實(shí)施。
在一個(gè)典型的配置中,計(jì)算設(shè)備包括一個(gè)或多個(gè)處理器(CPU)、輸入/輸出接口、網(wǎng)絡(luò)接口和內(nèi)存。
內(nèi)存可能包括計(jì)算機(jī)可讀介質(zhì)中的非永久性存儲(chǔ)器,隨機(jī)存取存儲(chǔ)器(RAM)和/或非易失性?xún)?nèi)存等形式,如只讀存儲(chǔ)器(ROM)或閃存(flash RAM)。內(nèi)存是計(jì)算機(jī)可讀介質(zhì)的示例。
計(jì)算機(jī)可讀介質(zhì)包括永久性和非永久性、可移動(dòng)和非可移動(dòng)媒體可以由任何方法或技術(shù)來(lái)實(shí)現(xiàn)信息存儲(chǔ)。信息可以是計(jì)算機(jī)可讀指令、數(shù)據(jù)結(jié)構(gòu)、程序的模塊或其他數(shù)據(jù)。計(jì)算機(jī)的存儲(chǔ)介質(zhì)的例子包括,但不限于相變內(nèi)存(PRAM)、靜態(tài)隨機(jī)存取存儲(chǔ)器(SRAM)、動(dòng)態(tài)隨機(jī)存取存儲(chǔ)器(DRAM)、其他類(lèi)型的隨機(jī)存取存儲(chǔ)器(RAM)、只讀存儲(chǔ)器(ROM)、電可擦除可編程只讀存儲(chǔ)器(EEPROM)、快閃記憶體或其他內(nèi)存技術(shù)、只讀光盤(pán)只讀存儲(chǔ)器(CD-ROM)、數(shù)字多功能光盤(pán)(DVD)或其他光學(xué)存儲(chǔ)、磁盒式磁帶,磁帶磁磁盤(pán)存儲(chǔ)或其他磁性存儲(chǔ)設(shè)備或任何其他非傳輸介質(zhì),可用于存儲(chǔ)可以被計(jì)算設(shè)備訪(fǎng)問(wèn)的信息。按照本文中的界定,計(jì)算機(jī)可讀介質(zhì)不包括非暫存電腦可讀媒體(transitory media),如調(diào)制的數(shù)據(jù)信號(hào)和載波。
如在說(shuō)明書(shū)及權(quán)利要求當(dāng)中使用了某些詞匯來(lái)指稱(chēng)特定組件。本領(lǐng)域技術(shù)人員應(yīng)可理解,硬件制造商可能會(huì)用不同名詞來(lái)稱(chēng)呼同一個(gè)組件。本說(shuō)明書(shū)及權(quán)利要求并不以名稱(chēng)的差異來(lái)作為區(qū)分組件的方式,而是以組件在功能上的差異來(lái)作為區(qū)分的準(zhǔn)則。如在通篇說(shuō)明書(shū)及權(quán)利要求當(dāng)中所提及的“包含”為一開(kāi)放式用語(yǔ),故應(yīng)解釋成“包含但不限定于”?!按笾隆笔侵冈诳山邮盏恼`差范圍內(nèi),本領(lǐng)域技術(shù)人員能夠在一定誤差范圍內(nèi)解決所述技術(shù)問(wèn)題,基本達(dá)到所述技術(shù)效果。此外,“耦接”一詞在此包含任何直接及間接的電性耦接手段。因此,若文中描述一第一裝置耦接于一第二裝置,則代表所述第一裝置可直接電性耦接于所述第二裝置,或通過(guò)其他裝置或耦接手段間接地電性耦接至所述第二裝置。說(shuō)明書(shū)后續(xù)描述為實(shí)施本發(fā)明的較佳實(shí)施方式,然所述描述乃以說(shuō)明本發(fā)明的一般原則為目的,并非用以限定本發(fā)明的范圍。本發(fā)明的保護(hù)范圍當(dāng)視所附權(quán)利要求所界定者為準(zhǔn)。
還需要說(shuō)明的是,術(shù)語(yǔ)“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的商品或者系統(tǒng)不僅包括那些要素,而且還包括沒(méi)有明確列出的其他要素,或者是還包括為這種商品或者系統(tǒng)所固有的要素。在沒(méi)有更多限制的情況下,由語(yǔ)句“包括一個(gè)……”限定的要素,并不排除在包括所述要素的商品或者系統(tǒng)中還存在另外的相同要素。
實(shí)施例描述
下面以一實(shí)施例對(duì)本發(fā)明方法的實(shí)現(xiàn)作進(jìn)一步說(shuō)明。如圖1所示,為本發(fā)明實(shí)施例的一種挖掘潛在客戶(hù)的方法流程圖,該方法包括:
S101:獲取商家的樣本客戶(hù)的各個(gè)屬性標(biāo)簽,并計(jì)算樣本客戶(hù)的各個(gè)屬性標(biāo)簽的集中度,以及樣本客戶(hù)的各個(gè)屬性標(biāo)簽的屬性值域的權(quán)重;其中,屬性值域的權(quán)重包括屬性值的權(quán)重或?qū)傩灾殿?lèi)區(qū)間的權(quán)重。
具體地,可以獲取商家的會(huì)員信息,將商家的各個(gè)會(huì)員作為樣本客戶(hù)。
其中,屬性標(biāo)簽例如可以是性別、年齡、地域、消費(fèi)金額等。屬性標(biāo)簽的屬性值例如:對(duì)于性別其屬性值是男或女;對(duì)于年齡其屬性值是18、20、30等;對(duì)于地域其屬性值是上海、北京等;對(duì)于消費(fèi)金額其屬性值是10、、20、100等。
需要說(shuō)明的是,對(duì)于年齡、地域等屬性標(biāo)簽,其對(duì)應(yīng)的屬性值一般通過(guò)文本(如男、女、上海、北京等)來(lái)表示,其屬性值的個(gè)數(shù)一般是有限的幾個(gè),可以直接求屬性值的權(quán)重。而對(duì)于年齡、消費(fèi)金額等屬性標(biāo)簽,其對(duì)應(yīng)的屬性值一般通過(guò)數(shù)字(如18、20、30等)來(lái)表示,其屬性值的個(gè)數(shù)一般可以有很多個(gè),需要通過(guò)動(dòng)態(tài)聚類(lèi)方法將屬性值歸類(lèi)為屬性值類(lèi)區(qū)間,求屬性值類(lèi)區(qū)間的權(quán)重,參見(jiàn)圖2,將屬性值歸類(lèi)為屬性值類(lèi)區(qū)間是為了找到如圖2所示的波峰,再計(jì)算屬性值類(lèi)區(qū)間的集中度。
具體地,計(jì)算樣本客戶(hù)的各個(gè)屬性標(biāo)簽的集中度CRn的公式如下:
其中,對(duì)于文本類(lèi)的屬性標(biāo)簽:xi表示屬性標(biāo)簽的屬性值是xi,c(xi)表示屬性標(biāo)簽的屬性值xi的個(gè)數(shù),c(X)表示屬性標(biāo)簽的所有屬性值的總個(gè)數(shù),n 表示選取屬性標(biāo)簽的屬性值的個(gè)數(shù)的排名在前n的屬性值;對(duì)于數(shù)字類(lèi)的屬性標(biāo)簽:xi表示屬性標(biāo)簽的屬性值類(lèi)區(qū)間是xi,c(xi)表示屬性標(biāo)簽的屬性值類(lèi)區(qū)間xi中元素的個(gè)數(shù),c(X)表示屬性標(biāo)簽的所有屬性值類(lèi)區(qū)間中元素的總個(gè)數(shù),n表示選取屬性標(biāo)簽的屬性值類(lèi)區(qū)間中元素的個(gè)數(shù)的排名在前n的屬性值。n的取值可以是2、4、5等,可以根據(jù)實(shí)際應(yīng)用狀況進(jìn)行選取,本實(shí)施例中優(yōu)選選取n=4。
S102:將樣本客戶(hù)的各個(gè)屬性標(biāo)簽按照預(yù)設(shè)組合標(biāo)準(zhǔn)進(jìn)行組合,得到多個(gè)屬性標(biāo)簽組合,計(jì)算每個(gè)屬性標(biāo)簽組合的集中度。
具體地,可以將屬性標(biāo)簽進(jìn)行兩兩、三三等進(jìn)行組合,本實(shí)施例中優(yōu)選進(jìn)行兩兩組合,例如:將性別、年齡組合,將年齡、地域組合等。
具體地,將樣本客戶(hù)的各個(gè)屬性標(biāo)簽按照預(yù)設(shè)組合標(biāo)準(zhǔn)進(jìn)行組合,得到多個(gè)屬性標(biāo)簽組合,包括:
將樣本客戶(hù)的各個(gè)屬性標(biāo)簽的屬性值的權(quán)重或?qū)傩灾殿?lèi)區(qū)間的權(quán)重,與預(yù)設(shè)權(quán)重閾值進(jìn)行比較,得到樣本客戶(hù)的屬性標(biāo)簽的屬性值的權(quán)重或?qū)傩灾殿?lèi)區(qū)間的權(quán)重小于預(yù)設(shè)權(quán)重閾值的多個(gè)屬性標(biāo)簽;
將樣本客戶(hù)的小于預(yù)設(shè)權(quán)重閾值的多個(gè)屬性標(biāo)簽進(jìn)行二二組合,得到多個(gè)屬性標(biāo)簽組合。
具體地,計(jì)算每個(gè)屬性標(biāo)簽組合的集中度,包括:
當(dāng)組成每個(gè)屬性標(biāo)簽組合的二個(gè)屬性標(biāo)簽的類(lèi)別均是文本類(lèi)時(shí),分別計(jì)算各個(gè)文本類(lèi)的屬性標(biāo)簽的屬性值的分布,參見(jiàn)圖3,對(duì)于文本類(lèi)的屬性標(biāo)簽的屬性值X和文本類(lèi)的屬性標(biāo)簽的屬性值Y的屬性標(biāo)簽組合中,當(dāng)Y取值為D時(shí),分別計(jì)算X中的前m個(gè)屬性值(此處為3,可以分別設(shè)為a、b、c)的集中度,分別為0.4、0.3、0.1,從而對(duì)應(yīng)的屬性標(biāo)簽組合的集中度為0.4+0.3+0.1=0.8。
當(dāng)組成每個(gè)屬性標(biāo)簽組合的二個(gè)屬性標(biāo)簽的類(lèi)別一個(gè)是文本類(lèi)、一個(gè)是數(shù)字類(lèi)時(shí),獲得各個(gè)文本類(lèi)的屬性值下的數(shù)字類(lèi)的屬性值的分布規(guī)律,如參見(jiàn)圖4,在不同的文本類(lèi)的屬性值X的區(qū)間,數(shù)字類(lèi)的屬性值Y都有不一樣的分布規(guī)律,從而將X劃分成一個(gè)個(gè)離散的區(qū)間,那么Y就會(huì)在每個(gè)區(qū)間內(nèi)是呈現(xiàn)單一分布的情況,計(jì)算各個(gè)單一分布的集中度,然后將各個(gè)單一分 布的集中度相加即得到對(duì)應(yīng)的屬性標(biāo)簽組合的集中度。
當(dāng)組成每個(gè)屬性標(biāo)簽組合的二個(gè)屬性標(biāo)簽的類(lèi)別均是數(shù)字類(lèi)時(shí),識(shí)別出不同數(shù)字類(lèi)的屬性值的分布規(guī)律,如參見(jiàn)圖5,3種線(xiàn)型分別代表不同的分布情況,計(jì)算各個(gè)分布的集中度,然后將各個(gè)分布的集中度相加即得到對(duì)應(yīng)的屬性標(biāo)簽組合的集中度。
S103:根據(jù)每個(gè)屬性標(biāo)簽組合的集中度,以及組成每個(gè)屬性標(biāo)簽組合的屬性標(biāo)簽的集中度,從多個(gè)屬性標(biāo)簽組合中選擇樣本客戶(hù)的挖掘?qū)傩詷?biāo)簽,并計(jì)算樣本客戶(hù)的各個(gè)挖掘?qū)傩詷?biāo)簽的屬性值域的權(quán)重。
其中,挖掘?qū)傩詷?biāo)簽即在對(duì)新客戶(hù)進(jìn)行判斷驗(yàn)證其是否是商家的潛在客戶(hù)時(shí)用于參考使用的屬性標(biāo)簽組合。從多個(gè)屬性標(biāo)簽組合中選擇樣本客戶(hù)的挖掘?qū)傩詷?biāo)簽即從多個(gè)屬性標(biāo)簽組合中選擇能夠作為樣本客戶(hù)的挖掘?qū)傩詷?biāo)簽的屬性標(biāo)簽組合。
具體地,根據(jù)每個(gè)屬性標(biāo)簽組合的集中度,以及組成每個(gè)屬性標(biāo)簽組合的屬性標(biāo)簽的集中度,從多個(gè)屬性標(biāo)簽組合中選擇樣本客戶(hù)的挖掘?qū)傩詷?biāo)簽,包括:
將每個(gè)屬性標(biāo)簽組合的集中度,分別與組成每個(gè)屬性標(biāo)簽組合的屬性標(biāo)簽的集中度進(jìn)行比較;
如果某個(gè)屬性標(biāo)簽組合的集中度大于組成某個(gè)屬性標(biāo)簽組合的所有屬性標(biāo)簽的集中度,則確定某個(gè)屬性標(biāo)簽組合能夠作為樣本客戶(hù)的挖掘?qū)傩詷?biāo)簽;
如果某個(gè)屬性標(biāo)簽組合的集中度小于等于組成某個(gè)屬性標(biāo)簽組合的任一屬性標(biāo)簽的集中度,則確定某個(gè)屬性標(biāo)簽組合不能夠作為樣本客戶(hù)的挖掘?qū)傩詷?biāo)簽。
S104:根據(jù)樣本客戶(hù)的各個(gè)屬性標(biāo)簽的屬性值的權(quán)重或?qū)傩灾殿?lèi)區(qū)間的權(quán)重、樣本客戶(hù)的各個(gè)挖掘?qū)傩詷?biāo)簽的屬性值的權(quán)重或?qū)傩灾殿?lèi)區(qū)間的權(quán)重,采用圖聚類(lèi)方法對(duì)樣本客戶(hù)進(jìn)行社群劃分,得到多個(gè)客戶(hù)社群。
S105:獲取新客戶(hù)的各個(gè)屬性標(biāo)簽,并根據(jù)新客戶(hù)的各個(gè)屬性標(biāo)簽的屬性值、每個(gè)客戶(hù)社群中的樣本客戶(hù)的各個(gè)屬性標(biāo)簽的屬性值、各個(gè)挖掘?qū)傩? 標(biāo)簽的屬性值,按照預(yù)設(shè)概率公式計(jì)算得到新客戶(hù)屬于每個(gè)客戶(hù)社群的概率。
其中,預(yù)設(shè)概率公式如下:
其中,Y表示新客戶(hù)的屬性標(biāo)簽,yi表示新客戶(hù)的屬性標(biāo)簽的第i個(gè)屬性值,m表示新客戶(hù)的屬性標(biāo)簽有m個(gè)屬性值,B表示任一客戶(hù)社群。
S106:當(dāng)新客戶(hù)屬于每個(gè)客戶(hù)社群的概率中存在一概率大于預(yù)設(shè)概率閾值時(shí),則確定新客戶(hù)是商家的潛在客戶(hù)。
其中,預(yù)設(shè)概率閾值可以是0.4、0.6、0.7等,可以根據(jù)實(shí)際應(yīng)用狀況進(jìn)行設(shè)置,對(duì)此不做限定。
在本實(shí)施例的一優(yōu)選實(shí)施例中,參見(jiàn)圖6,S101中的計(jì)算樣本客戶(hù)的各個(gè)屬性標(biāo)簽的屬性值的權(quán)重或?qū)傩灾殿?lèi)區(qū)間的權(quán)重,包括:
S101a:判斷樣本客戶(hù)的各個(gè)屬性標(biāo)簽的類(lèi)別,如果樣本客戶(hù)的某屬性標(biāo)簽是文本類(lèi),則執(zhí)行S101b;如果樣本客戶(hù)的某屬性標(biāo)簽的屬性值是數(shù)字類(lèi),則執(zhí)行S101c。
其中,文本類(lèi)也可以稱(chēng)為離散類(lèi),數(shù)字類(lèi)也可以稱(chēng)為連續(xù)類(lèi)。
S101b:按照預(yù)設(shè)權(quán)重計(jì)算公式計(jì)算樣本客戶(hù)的文本類(lèi)的某屬性標(biāo)簽的各個(gè)屬性值的權(quán)重,然后執(zhí)行S102。
其中,預(yù)設(shè)權(quán)重計(jì)算公式w(xi)為:
對(duì)于文本類(lèi)的某屬性標(biāo)簽:xi表示文本類(lèi)的某屬性標(biāo)簽的屬性值是xi,w(xi)表示文本類(lèi)的某屬性標(biāo)簽的屬性值xi的權(quán)重,CRn表示文本類(lèi)的某屬性標(biāo)簽的集中度,c(xi)表示文本類(lèi)的某屬性標(biāo)簽的屬性值xi的個(gè)數(shù),c(X)表示文本類(lèi)的某屬性標(biāo)簽的屬性值xi的總個(gè)數(shù)。
S101c:采用動(dòng)態(tài)聚類(lèi)方法對(duì)樣本客戶(hù)的數(shù)字類(lèi)的某屬性標(biāo)簽的各個(gè)屬 性值進(jìn)行數(shù)據(jù)區(qū)間統(tǒng)計(jì),得到多個(gè)屬性值類(lèi)區(qū)間,按照預(yù)設(shè)權(quán)重計(jì)算公式計(jì)算樣本客戶(hù)的數(shù)字類(lèi)的某屬性標(biāo)簽的各個(gè)屬性值類(lèi)區(qū)間的權(quán)重,然后執(zhí)行S102。
其中,預(yù)設(shè)權(quán)重計(jì)算公式w(xi)為:
對(duì)于數(shù)字類(lèi)的某屬性標(biāo)簽:xi表示數(shù)字類(lèi)的某屬性標(biāo)簽的屬性值類(lèi)區(qū)間是xi,w(xi)表示數(shù)字類(lèi)的某屬性標(biāo)簽的屬性值類(lèi)區(qū)間的權(quán)重,CRn表示數(shù)字類(lèi)的某屬性標(biāo)簽的集中度,c(xi)表示數(shù)字類(lèi)的某屬性標(biāo)簽的屬性值類(lèi)區(qū)間中元素的個(gè)數(shù),c(X)表示數(shù)字類(lèi)的某屬性標(biāo)簽的所有屬性值類(lèi)區(qū)間中元素的總個(gè)數(shù)。
在本實(shí)施例的一優(yōu)選實(shí)施例中,參見(jiàn)圖7,S103中的計(jì)算樣本客戶(hù)的各個(gè)挖掘?qū)傩詷?biāo)簽的屬性值的權(quán)重或?qū)傩灾殿?lèi)區(qū)間的權(quán)重,包括:
S103a:判斷組成樣本客戶(hù)的各個(gè)挖掘?qū)傩詷?biāo)簽的二個(gè)屬性標(biāo)簽的類(lèi)別,如果組成樣本客戶(hù)的某挖掘?qū)傩詷?biāo)簽的二個(gè)屬性標(biāo)簽的類(lèi)別均是文本類(lèi),則執(zhí)行S103b;如果組成樣本客戶(hù)的某挖掘?qū)傩詷?biāo)簽的二個(gè)屬性標(biāo)簽的類(lèi)別一個(gè)是文本類(lèi)、一個(gè)是數(shù)字類(lèi),則執(zhí)行S103c;如果組成樣本客戶(hù)的某挖掘?qū)傩詷?biāo)簽的二個(gè)屬性標(biāo)簽的類(lèi)別均是數(shù)字類(lèi),則執(zhí)行S103d。
S103b:按照預(yù)設(shè)權(quán)重計(jì)算公式計(jì)算樣本客戶(hù)的某挖掘?qū)傩詷?biāo)簽的各個(gè)屬性值的權(quán)重,然后執(zhí)行104。
其中,預(yù)設(shè)權(quán)重計(jì)算公式w(xi)為:
對(duì)于某挖掘?qū)傩詷?biāo)簽的二個(gè)屬性標(biāo)簽的類(lèi)別均是文本類(lèi):xi表示某挖掘?qū)傩詷?biāo)簽的屬性值是xi,w(xi)表示某挖掘?qū)傩詷?biāo)簽的屬性值xi的權(quán)重,CRn表示某挖掘?qū)傩詷?biāo)簽的集中度,c(xi)表示某挖掘?qū)傩詷?biāo)簽的屬性值xi的個(gè)數(shù),c(X)表示某挖掘?qū)傩詷?biāo)簽的屬性值xi的總個(gè)數(shù)。
需要說(shuō)明的是,由于挖掘?qū)傩詷?biāo)簽是由二個(gè)屬性標(biāo)簽組合得到的,所以 挖掘?qū)傩詷?biāo)簽的屬性值也是由二個(gè)屬性標(biāo)簽的屬性值組合得到的。
S103c:采用動(dòng)態(tài)聚類(lèi)方法對(duì)樣本客戶(hù)的某挖掘?qū)傩詷?biāo)簽的各個(gè)屬性值進(jìn)行數(shù)據(jù)區(qū)間統(tǒng)計(jì),得到多個(gè)屬性值類(lèi)區(qū)間,按照預(yù)設(shè)權(quán)重計(jì)算公式計(jì)算樣本客戶(hù)的某挖掘?qū)傩詷?biāo)簽的各個(gè)屬性值類(lèi)區(qū)間的權(quán)重,然后執(zhí)行104。
S103d:采用自組織映射SOM(self-organization map)聚類(lèi)方法對(duì)樣本客戶(hù)的某挖掘?qū)傩詷?biāo)簽的各個(gè)屬性值進(jìn)行數(shù)據(jù)區(qū)間統(tǒng)計(jì),得到多個(gè)屬性值類(lèi)區(qū)間,按照預(yù)設(shè)權(quán)重計(jì)算公式計(jì)算樣本客戶(hù)的某挖掘?qū)傩詷?biāo)簽的各個(gè)屬性值類(lèi)區(qū)間的權(quán)重,然后執(zhí)行104。
在本實(shí)施例的一優(yōu)選實(shí)施例中,參見(jiàn)圖8,S104根據(jù)樣本客戶(hù)的各個(gè)屬性標(biāo)簽的屬性值的權(quán)重或?qū)傩灾殿?lèi)區(qū)間的權(quán)重、樣本客戶(hù)的各個(gè)挖掘?qū)傩詷?biāo)簽的屬性值的權(quán)重或?qū)傩灾殿?lèi)區(qū)間的權(quán)重,采用圖聚類(lèi)方法對(duì)樣本客戶(hù)進(jìn)行社群劃分,得到多個(gè)客戶(hù)社群,包括:
S104a:從所有的樣本客戶(hù)中隨機(jī)選擇一個(gè)樣本客戶(hù),根據(jù)樣本客戶(hù)的各個(gè)屬性標(biāo)簽的屬性值的權(quán)重或?qū)傩灾殿?lèi)區(qū)間的權(quán)重、樣本客戶(hù)的各個(gè)挖掘?qū)傩詷?biāo)簽的屬性值的權(quán)重或?qū)傩灾殿?lèi)區(qū)間的權(quán)重,按照預(yù)設(shè)最大連接權(quán)重選擇公式,從隨機(jī)選擇的樣本客戶(hù)與其他各個(gè)樣本客戶(hù)之間的連接權(quán)重中,選擇連接權(quán)重最大的一個(gè)其他樣本客戶(hù),并將連接權(quán)重最大的一個(gè)其他樣本客戶(hù)與隨機(jī)選擇的樣本客戶(hù)組成待定客戶(hù)社群。
其中,預(yù)設(shè)最大連接權(quán)重選擇公式如下:
其中,v*表示與隨機(jī)選擇的樣本客戶(hù)v的連接權(quán)重最大的一個(gè)其他樣本客戶(hù),Ev-connect表示隨機(jī)選擇的樣本客戶(hù)v與隨機(jī)選擇的樣本客戶(hù)v有共同屬性值的任一樣本客戶(hù)的連接權(quán)重。
其中,待定客戶(hù)社群即該客戶(hù)社群中包含的樣本客戶(hù)還沒(méi)有最好定下來(lái),可能還有其他樣本客戶(hù)屬于該客戶(hù)社群,需要遍歷其他所有樣本客戶(hù)后再確定。
例如:從所有的樣本客戶(hù)中隨機(jī)選擇一個(gè)樣本客戶(hù)v1,按照預(yù)設(shè)最大連 接權(quán)重選擇公式,從隨機(jī)選擇的樣本客戶(hù)與其他各個(gè)樣本客戶(hù)之間的連接權(quán)重中,選擇連接權(quán)重最大的一個(gè)其他樣本客戶(hù)為v2,v1和v2組成第一個(gè)客戶(hù)社群g1(暫時(shí)為待定客戶(hù)社群)。
S104b:根據(jù)預(yù)設(shè)聚合公式,計(jì)算待定客戶(hù)社群之外的其他樣本客戶(hù)與待定客戶(hù)社群的聚合效應(yīng),根據(jù)待定客戶(hù)社群之外的其他樣本客戶(hù)與待定客戶(hù)社群的聚合效應(yīng),確定是否將待定客戶(hù)社群之外的其他樣本客戶(hù)添加到待定客戶(hù)社群組成客戶(hù)社群。
其中,預(yù)設(shè)聚合公式如下:
其中,當(dāng)w(Sin)表示隨機(jī)選擇的樣本客戶(hù)v與待定客戶(hù)社群中的其他樣本客戶(hù)的連接權(quán)重、w(Sout)表示隨機(jī)選擇的樣本客戶(hù)v與待定客戶(hù)社群之外的其他樣本客戶(hù)的連接權(quán)重時(shí),Condensity(gi)表示待定客戶(hù)社群的聚合效應(yīng)值;當(dāng)w(Sin)表示隨機(jī)選擇的樣本客戶(hù)v與客戶(hù)社群中的其他樣本客戶(hù)的連接權(quán)重、w(Sout)表示隨機(jī)選擇的樣本客戶(hù)v與客戶(hù)社群之外的其他樣本客戶(hù)的連接權(quán)重時(shí),Condensity(gi)表示客戶(hù)社群的聚合效應(yīng)值。
相應(yīng)地,根據(jù)待定客戶(hù)社群之外的其他樣本客戶(hù)與待定客戶(hù)社群的聚合效應(yīng),確定是否將待定客戶(hù)社群之外的其他樣本客戶(hù)添加到待定客戶(hù)社群組成客戶(hù)社群,包括:
將待定客戶(hù)社群的聚合效應(yīng)值與客戶(hù)社群的聚合效應(yīng)值進(jìn)行比較;
如果客戶(hù)社群的聚合效應(yīng)值大于待定客戶(hù)社群的聚合效應(yīng)值,則確定將待定客戶(hù)社群之外的其他樣本客戶(hù)添加到待定客戶(hù)社群組成客戶(hù)社群;
如果客戶(hù)社群的聚合效應(yīng)值小于等于待定客戶(hù)社群的聚合效應(yīng)值,則確定不將待定客戶(hù)社群之外的其他樣本客戶(hù)添加到待定客戶(hù)社群組成客戶(hù)社群。
例如:假設(shè)待定客戶(hù)社群g2是將樣本客戶(hù)v3擴(kuò)充進(jìn)入g1后形成的新的待定客戶(hù)社群,根據(jù)預(yù)設(shè)聚合公式分別計(jì)算得到Condensity(g2)、Condensity(g1),如果Condensity(g2)大于Condensity(g1),則確定能夠?qū)颖究蛻?hù)v3擴(kuò)充進(jìn)入g1,如果Condensity(g2)小于等于Condensity(g1),則確定不能夠?qū)颖究蛻?hù)v3擴(kuò)充進(jìn)入g1。
S104c:判斷客戶(hù)社群之外是否還有樣本客戶(hù),如果有,則執(zhí)行S104d;否則,結(jié)束。
S104d:從客戶(hù)社群之外的樣本客戶(hù)中隨機(jī)選擇一個(gè)樣本客戶(hù),然后執(zhí)行104a中的計(jì)算隨機(jī)選擇的樣本客戶(hù)與其他各個(gè)樣本客戶(hù)之間的連接權(quán)重的步驟。
具體地,參見(jiàn)圖9,按照S104a-S104d采用圖聚類(lèi)方法依次對(duì)樣本客戶(hù)進(jìn)行社群劃分,得到多個(gè)客戶(hù)社群(例如:第一客戶(hù)社群、第二客戶(hù)社群、第三客戶(hù)社群等)。需要說(shuō)明的是,得到多個(gè)客戶(hù)社群,并不用分辨這個(gè)客戶(hù)社群到底是屬于什么性質(zhì)的社群(例如是運(yùn)動(dòng)客戶(hù)社群、工作客戶(hù)社群等),只需要通過(guò)標(biāo)識(shí)區(qū)分開(kāi)每個(gè)社群即可。
在本實(shí)施例的一優(yōu)選實(shí)施例中,參見(jiàn)圖10,按照預(yù)設(shè)概率公式計(jì)算得到新客戶(hù)屬于每個(gè)客戶(hù)社群的概率之后,還包括:
S107:將新客戶(hù)屬于每個(gè)客戶(hù)社群的概率進(jìn)行比較,得到新客戶(hù)屬于客戶(hù)社群的最大概率。
其中,預(yù)設(shè)概率公式如下:
其中,Y表示新客戶(hù)的屬性標(biāo)簽,yi表示新客戶(hù)的屬性標(biāo)簽的第i個(gè)屬性值,n表示新客戶(hù)的屬性標(biāo)簽有n個(gè)屬性值,B表示任一客戶(hù)社群。
S108:確定新客戶(hù)屬于最大概率對(duì)應(yīng)的客戶(hù)社群。
具體地,確定新客戶(hù)屬于最大概率對(duì)應(yīng)的客戶(hù)社群。對(duì)于具體類(lèi)別的劃分,采用改進(jìn)的貝葉斯網(wǎng)絡(luò),這里不再限定其為有向無(wú)環(huán)圖,而是對(duì)屬性標(biāo)簽進(jìn)行無(wú)序排列。
S109:更新樣本客戶(hù)的各個(gè)屬性標(biāo)簽的屬性值的權(quán)重或?qū)傩灾殿?lèi)區(qū)間的權(quán)重。
具體地,確定新客戶(hù)屬于最大概率對(duì)應(yīng)的客戶(hù)社群后,將新客戶(hù)擴(kuò)充進(jìn)入最大概率對(duì)應(yīng)的客戶(hù)社群,樣本客戶(hù)的數(shù)量發(fā)生了變化,需要更新樣本客 戶(hù)的各個(gè)屬性標(biāo)簽的屬性值的權(quán)重或?qū)傩灾殿?lèi)區(qū)間的權(quán)重。更新樣本客戶(hù)的各個(gè)屬性標(biāo)簽的屬性值的權(quán)重或?qū)傩灾殿?lèi)區(qū)間的權(quán)重的過(guò)程是按照上述權(quán)重計(jì)算公式重新進(jìn)行計(jì)算。
在本實(shí)施例的一優(yōu)選實(shí)施例中,參見(jiàn)圖11,確定新客戶(hù)是商家的潛在客戶(hù)之后,還包括:
S110:獲取商家的反饋信息;其中,反饋信息包括確定的某新客戶(hù)是商家的潛在客戶(hù)不正確、和/或原來(lái)的某樣本客戶(hù)當(dāng)前不符合商家的客戶(hù)標(biāo)準(zhǔn)。
具體地,當(dāng)確定新客戶(hù)是商家的潛在客戶(hù)后,可以將新客戶(hù)的信息反饋給商家,然后商家判斷該新客戶(hù)是否是其需要的潛在客戶(hù),如果不是,則可以反饋確定的某新客戶(hù)是商家的潛在客戶(hù)不正確?;蛘呱碳乙部梢愿鶕?jù)當(dāng)前的情況,確定原來(lái)的某樣本客戶(hù)當(dāng)前不符合商家的客戶(hù)標(biāo)準(zhǔn),然后反饋原來(lái)的某樣本客戶(hù)當(dāng)前不符合商家的客戶(hù)標(biāo)準(zhǔn)。
S111:根據(jù)商家的反饋信息,按照預(yù)設(shè)權(quán)重矯正公式對(duì)樣本客戶(hù)或新客戶(hù)的各個(gè)屬性標(biāo)簽的屬性值的權(quán)重或?qū)傩灾殿?lèi)區(qū)間的權(quán)重進(jìn)行矯正,并根據(jù)商家的反饋信息,對(duì)客戶(hù)社群進(jìn)行矯正。
其中,預(yù)設(shè)權(quán)重矯正公式如下:
其中,表示樣本客戶(hù)或新客戶(hù)的矯正后的屬性標(biāo)簽A的屬性值或?qū)傩灾殿?lèi)區(qū)間在矯正后的客戶(hù)社群中的權(quán)重;表示樣本客戶(hù)或新客戶(hù)的矯正前的屬性標(biāo)簽A的屬性值或?qū)傩灾殿?lèi)區(qū)間在矯正后的客戶(hù)社群中的權(quán)重;表示樣本客戶(hù)或新客戶(hù)的矯正后的屬性標(biāo)簽A在矯正前的客戶(hù)社群中的權(quán)重;表示矯正后的屬性標(biāo)簽A的屬性值在矯正前的客戶(hù)社群中的總個(gè)數(shù);表示矯正前的屬性標(biāo)簽A的屬性值在矯正后的客戶(hù)社群中的總個(gè)數(shù)。
本實(shí)施例所述的挖掘潛在客戶(hù)的方法,根據(jù)每個(gè)屬性標(biāo)簽組合的集中度,以及組成每個(gè)屬性標(biāo)簽組合的屬性標(biāo)簽的集中度,選擇樣本客戶(hù)的挖掘 屬性標(biāo)簽,根據(jù)樣本客戶(hù)的各個(gè)屬性標(biāo)簽的屬性值域的權(quán)重、樣本客戶(hù)的各個(gè)挖掘?qū)傩詷?biāo)簽的屬性值域的權(quán)重,采用圖聚類(lèi)方法對(duì)樣本客戶(hù)進(jìn)行社群劃分,得到多個(gè)客戶(hù)社群,當(dāng)新客戶(hù)屬于每個(gè)客戶(hù)社群的概率中存在一概率大于預(yù)設(shè)概率閾值時(shí),則確定新客戶(hù)是商家的潛在客戶(hù),不需要將樣本客戶(hù)的各個(gè)屬性標(biāo)簽進(jìn)行組合,不需要遍歷各種組合情況,計(jì)算簡(jiǎn)單快捷,可以節(jié)約時(shí)間。按照預(yù)設(shè)概率公式計(jì)算得到新客戶(hù)屬于每個(gè)客戶(hù)社群的概率,通過(guò)概率確定新客戶(hù)是不是商家的潛在客戶(hù),而不需要采用梯度下降法求全局最優(yōu)結(jié)果,大大提高了運(yùn)算速度。預(yù)設(shè)權(quán)重計(jì)算公式通過(guò)運(yùn)用屬性標(biāo)簽的集中度,能夠適應(yīng)更復(fù)雜的數(shù)據(jù)結(jié)構(gòu),能夠更有效的反應(yīng)數(shù)據(jù)的分布規(guī)律。根據(jù)商家的反饋信息,按照預(yù)設(shè)權(quán)重矯正公式對(duì)樣本客戶(hù)或新客戶(hù)的各個(gè)屬性標(biāo)簽的屬性值的權(quán)重或?qū)傩灾殿?lèi)區(qū)間的權(quán)重進(jìn)行矯正,預(yù)設(shè)權(quán)重矯正公式不僅考慮了屬性標(biāo)簽所包含的樣本量因素,還針對(duì)權(quán)重本身進(jìn)行懲罰或者獎(jiǎng)勵(lì),這樣不僅加快了效果反饋速度,同時(shí)還使得權(quán)重的變化更加穩(wěn)健,不會(huì)出現(xiàn)異常的增加或者減少,并且會(huì)隨著樣本客戶(hù)數(shù)量的增加,準(zhǔn)確度也會(huì)越來(lái)越高。
如圖12所示,是本發(fā)明實(shí)施例的一種挖掘潛在客戶(hù)的裝置結(jié)構(gòu)圖,該裝置包括:
獲取模塊201,用于獲取商家的樣本客戶(hù)的各個(gè)屬性標(biāo)簽,并計(jì)算樣本客戶(hù)的各個(gè)屬性標(biāo)簽的集中度,以及樣本客戶(hù)的各個(gè)屬性標(biāo)簽的屬性值域的權(quán)重;
組合計(jì)算模塊202,用于將樣本客戶(hù)的各個(gè)屬性標(biāo)簽按照預(yù)設(shè)組合標(biāo)準(zhǔn)進(jìn)行組合,得到多個(gè)屬性標(biāo)簽組合,計(jì)算每個(gè)屬性標(biāo)簽組合的集中度;
確定計(jì)算模塊203,用于根據(jù)每個(gè)屬性標(biāo)簽組合的集中度,以及組成每個(gè)屬性標(biāo)簽組合的屬性標(biāo)簽的集中度,從多個(gè)屬性標(biāo)簽組合中選擇樣本客戶(hù)的挖掘?qū)傩詷?biāo)簽,并計(jì)算樣本客戶(hù)的各個(gè)挖掘?qū)傩詷?biāo)簽的屬性值域的權(quán)重;
劃分模塊204,用于根據(jù)樣本客戶(hù)的各個(gè)屬性標(biāo)簽的屬性值域的權(quán)重、樣本客戶(hù)的各個(gè)挖掘?qū)傩詷?biāo)簽的屬性值域的權(quán)重,采用圖聚類(lèi)裝置對(duì)樣本客戶(hù)進(jìn)行社群劃分,得到多個(gè)客戶(hù)社群;
概率計(jì)算模塊205,用于獲取新客戶(hù)的各個(gè)屬性標(biāo)簽,并根據(jù)新客戶(hù)的各個(gè)屬性標(biāo)簽的屬性值、每個(gè)客戶(hù)社群中的樣本客戶(hù)的各個(gè)屬性標(biāo)簽的屬性值、各個(gè)挖掘?qū)傩詷?biāo)簽的屬性值,按照預(yù)設(shè)概率公式計(jì)算得到新客戶(hù)屬于每個(gè)客戶(hù)社群的概率;
潛在客戶(hù)確定模塊206,用于當(dāng)新客戶(hù)屬于每個(gè)客戶(hù)社群的概率中存在一概率大于預(yù)設(shè)概率閾值時(shí),則確定新客戶(hù)是商家的潛在客戶(hù)。
進(jìn)一步地,屬性值域的權(quán)重包括:屬性值的權(quán)重或?qū)傩灾殿?lèi)區(qū)間的權(quán)重。
進(jìn)一步地,獲取模塊201包括:
第一判斷單元,用于判斷樣本客戶(hù)的各個(gè)屬性標(biāo)簽的類(lèi)別;
第一計(jì)算單元,用于如果樣本客戶(hù)的某屬性標(biāo)簽是文本類(lèi),則按照預(yù)設(shè)權(quán)重計(jì)算公式計(jì)算樣本客戶(hù)的文本類(lèi)的某屬性標(biāo)簽的各個(gè)屬性值的權(quán)重;
第二計(jì)算單元,用于如果樣本客戶(hù)的某屬性標(biāo)簽的屬性值是數(shù)字類(lèi),則采用動(dòng)態(tài)聚類(lèi)裝置對(duì)樣本客戶(hù)的數(shù)字類(lèi)的某屬性標(biāo)簽的各個(gè)屬性值進(jìn)行數(shù)據(jù)區(qū)間統(tǒng)計(jì),得到多個(gè)屬性值類(lèi)區(qū)間,按照預(yù)設(shè)權(quán)重計(jì)算公式計(jì)算樣本客戶(hù)的數(shù)字類(lèi)的某屬性標(biāo)簽的各個(gè)屬性值類(lèi)區(qū)間的權(quán)重。
進(jìn)一步地,預(yù)設(shè)權(quán)重計(jì)算公式為:
其中,對(duì)于文本類(lèi)的某屬性標(biāo)簽:xi表示文本類(lèi)的某屬性標(biāo)簽的屬性值是xi,w(xi)表示文本類(lèi)的某屬性標(biāo)簽的屬性值xi的權(quán)重,CRn表示文本類(lèi)的某屬性標(biāo)簽的集中度,c(xi)表示文本類(lèi)的某屬性標(biāo)簽的屬性值xi的個(gè)數(shù),c(X)表示文本類(lèi)的某屬性標(biāo)簽的所有屬性值的總個(gè)數(shù);對(duì)于數(shù)字類(lèi)的某屬性標(biāo)簽:xi表示數(shù)字類(lèi)的某屬性標(biāo)簽的屬性值類(lèi)區(qū)間是xi,w(xi)表示數(shù)字類(lèi)的某屬性標(biāo)簽的屬性值類(lèi)區(qū)間的權(quán)重,CRn表示數(shù)字類(lèi)的某屬性標(biāo)簽的集中度,c(xi)表示數(shù)字類(lèi)的某屬性標(biāo)簽的屬性值類(lèi)區(qū)間中元素的個(gè)數(shù),c(X)表示數(shù)字類(lèi)的某屬性標(biāo)簽的所有屬性值類(lèi)區(qū)間中元素的總個(gè)數(shù)。
進(jìn)一步地,組合計(jì)算模塊202包括:
第一比較單元,用于將樣本客戶(hù)的各個(gè)屬性標(biāo)簽的屬性值的權(quán)重或?qū)傩? 值類(lèi)區(qū)間的權(quán)重,與預(yù)設(shè)權(quán)重閾值進(jìn)行比較,得到樣本客戶(hù)的屬性標(biāo)簽的屬性值的權(quán)重或?qū)傩灾殿?lèi)區(qū)間的權(quán)重小于預(yù)設(shè)權(quán)重閾值的多個(gè)屬性標(biāo)簽;
組合單元,用于將樣本客戶(hù)的小于預(yù)設(shè)權(quán)重閾值的多個(gè)屬性標(biāo)簽進(jìn)行二二組合,得到多個(gè)屬性標(biāo)簽組合。
進(jìn)一步地,確定計(jì)算模塊204還包括:
第二判斷單元,用于判斷組成樣本客戶(hù)的各個(gè)挖掘?qū)傩詷?biāo)簽的二個(gè)屬性標(biāo)簽的類(lèi)別;
第三計(jì)算單元,用于如果組成樣本客戶(hù)的某挖掘?qū)傩詷?biāo)簽的二個(gè)屬性標(biāo)簽的類(lèi)別均是文本類(lèi),則按照預(yù)設(shè)權(quán)重計(jì)算公式計(jì)算樣本客戶(hù)的某挖掘?qū)傩詷?biāo)簽的各個(gè)屬性值的權(quán)重;
第四計(jì)算單元,用于如果組成樣本客戶(hù)的某挖掘?qū)傩詷?biāo)簽的二個(gè)屬性標(biāo)簽的類(lèi)別一個(gè)是文本類(lèi)、一個(gè)是數(shù)字類(lèi),則采用動(dòng)態(tài)聚類(lèi)裝置對(duì)樣本客戶(hù)的某挖掘?qū)傩詷?biāo)簽的各個(gè)屬性值進(jìn)行數(shù)據(jù)區(qū)間統(tǒng)計(jì),得到多個(gè)屬性值類(lèi)區(qū)間,按照預(yù)設(shè)權(quán)重計(jì)算公式計(jì)算樣本客戶(hù)的某挖掘?qū)傩詷?biāo)簽的各個(gè)屬性值類(lèi)區(qū)間的權(quán)重;
第五計(jì)算單元,用于如果組成樣本客戶(hù)的某挖掘?qū)傩詷?biāo)簽的二個(gè)屬性標(biāo)簽的類(lèi)別均是數(shù)字類(lèi),則采用自組織映射SOM聚類(lèi)裝置對(duì)樣本客戶(hù)的某挖掘?qū)傩詷?biāo)簽的各個(gè)屬性值進(jìn)行數(shù)據(jù)區(qū)間統(tǒng)計(jì),得到多個(gè)屬性值類(lèi)區(qū)間,按照預(yù)設(shè)權(quán)重計(jì)算公式計(jì)算樣本客戶(hù)的某挖掘?qū)傩詷?biāo)簽的各個(gè)屬性值類(lèi)區(qū)間的權(quán)重。
進(jìn)一步地,確定計(jì)算模塊203包括:
第二比較單元,用于將每個(gè)屬性標(biāo)簽組合的集中度,分別與組成每個(gè)屬性標(biāo)簽組合的屬性標(biāo)簽的集中度進(jìn)行比較;
第一確定單元,用于如果某個(gè)屬性標(biāo)簽組合的集中度大于組成某個(gè)屬性標(biāo)簽組合的所有屬性標(biāo)簽的集中度,則確定某個(gè)屬性標(biāo)簽組合能夠作為樣本客戶(hù)的挖掘?qū)傩詷?biāo)簽;
第二確定單元,用于如果某個(gè)屬性標(biāo)簽組合的集中度小于等于組成某個(gè)屬性標(biāo)簽組合的任一屬性標(biāo)簽的集中度,則確定某個(gè)屬性標(biāo)簽組合不能夠作 為樣本客戶(hù)的挖掘?qū)傩詷?biāo)簽。
進(jìn)一步地,劃分模塊204包括:
選擇單元,用于從所有的樣本客戶(hù)中隨機(jī)選擇一個(gè)樣本客戶(hù),根據(jù)樣本客戶(hù)的各個(gè)屬性標(biāo)簽的屬性值的權(quán)重或?qū)傩灾殿?lèi)區(qū)間的權(quán)重、樣本客戶(hù)的各個(gè)挖掘?qū)傩詷?biāo)簽的屬性值的權(quán)重或?qū)傩灾殿?lèi)區(qū)間的權(quán)重,按照預(yù)設(shè)最大連接權(quán)重選擇公式,從隨機(jī)選擇的樣本客戶(hù)與其他各個(gè)樣本客戶(hù)之間的連接權(quán)重中,選擇連接權(quán)重最大的一個(gè)其他樣本客戶(hù),并將連接權(quán)重最大的一個(gè)其他樣本客戶(hù)與隨機(jī)選擇的樣本客戶(hù)組成待定客戶(hù)社群;
第三確定單元,用于根據(jù)預(yù)設(shè)聚合公式,計(jì)算待定客戶(hù)社群之外的其他樣本客戶(hù)與待定客戶(hù)社群的聚合效應(yīng),根據(jù)待定客戶(hù)社群之外的其他樣本客戶(hù)與待定客戶(hù)社群的聚合效應(yīng),確定是否將待定客戶(hù)社群之外的其他樣本客戶(hù)添加到待定客戶(hù)社群組成客戶(hù)社群;
通知單元,用于從客戶(hù)社群之外的樣本客戶(hù)中隨機(jī)選擇一個(gè)樣本客戶(hù),然后通知選擇單元執(zhí)行計(jì)算隨機(jī)選擇的樣本客戶(hù)與其他各個(gè)樣本客戶(hù)之間的連接權(quán)重的步驟。
進(jìn)一步地,預(yù)設(shè)最大連接權(quán)重選擇公式如下:
其中,v*表示與隨機(jī)選擇的樣本客戶(hù)v的連接權(quán)重最大的一個(gè)其他樣本客戶(hù),Ev-connect表示隨機(jī)選擇的樣本客戶(hù)v與隨機(jī)選擇的樣本客戶(hù)v有共同屬性值的任一樣本客戶(hù)的連接權(quán)重。
進(jìn)一步地,預(yù)設(shè)聚合公式如下:
其中,當(dāng)w(Sin)表示隨機(jī)選擇的樣本客戶(hù)v與待定客戶(hù)社群中的其他樣本客戶(hù)的連接權(quán)重、w(Sout)表示隨機(jī)選擇的樣本客戶(hù)v與待定客戶(hù)社群之外的其他樣本客戶(hù)的連接權(quán)重時(shí),Condensity(gi)表示待定客戶(hù)社群的聚合效應(yīng)值;當(dāng)w(Sin)表示隨機(jī)選擇的樣本客戶(hù)v與客戶(hù)社群中的其他樣本客戶(hù)的連接權(quán)重、w(Sout)表示隨機(jī)選擇的樣本客戶(hù)v與客戶(hù)社群之外的其他樣本客戶(hù)的連接權(quán)重時(shí),Condensity(gi)表示客戶(hù)社群的聚合效應(yīng)值。
進(jìn)一步地,第三確定單元包括:
比較子單元,用于將待定客戶(hù)社群的聚合效應(yīng)值與客戶(hù)社群的聚合效應(yīng)值進(jìn)行比較;
第一確定子單元,用于如果客戶(hù)社群的聚合效應(yīng)值大于待定客戶(hù)社群的聚合效應(yīng)值,則確定將待定客戶(hù)社群之外的其他樣本客戶(hù)添加到待定客戶(hù)社群組成客戶(hù)社群;
第二確定子單元,用于如果客戶(hù)社群的聚合效應(yīng)值小于等于待定客戶(hù)社群的聚合效應(yīng)值,則確定不將待定客戶(hù)社群之外的其他樣本客戶(hù)添加到待定客戶(hù)社群組成客戶(hù)社群。
進(jìn)一步地,參見(jiàn)圖13,該裝置還包括:
比較模塊207,用于按照預(yù)設(shè)概率公式計(jì)算得到新客戶(hù)屬于每個(gè)客戶(hù)社群的概率之后,將新客戶(hù)屬于每個(gè)客戶(hù)社群的概率進(jìn)行比較,得到新客戶(hù)屬于客戶(hù)社群的最大概率;
確定模塊208,用于確定新客戶(hù)屬于最大概率對(duì)應(yīng)的客戶(hù)社群;
更新模塊209,用于更新樣本客戶(hù)的各個(gè)屬性標(biāo)簽的屬性值的權(quán)重或?qū)傩灾殿?lèi)區(qū)間的權(quán)重。
進(jìn)一步地,預(yù)設(shè)概率公式如下:
其中,Y表示新客戶(hù)的屬性標(biāo)簽,yi表示新客戶(hù)的屬性標(biāo)簽的第i個(gè)屬性值,n表示新客戶(hù)的屬性標(biāo)簽有n個(gè)屬性值,B表示任一客戶(hù)社群。
進(jìn)一步地,參見(jiàn)圖14,該裝置還包括:
反饋模塊210,用于確定新客戶(hù)是商家的潛在客戶(hù)之后,獲取商家的反饋信息;其中,反饋信息包括確定的某新客戶(hù)是商家的潛在客戶(hù)不正確、和/或原來(lái)的某樣本客戶(hù)當(dāng)前不符合商家的客戶(hù)標(biāo)準(zhǔn);
矯正模塊211,用于根據(jù)商家的反饋信息,按照預(yù)設(shè)權(quán)重矯正公式對(duì)樣本客戶(hù)或新客戶(hù)的各個(gè)屬性標(biāo)簽的屬性值的權(quán)重或?qū)傩灾殿?lèi)區(qū)間的權(quán)重進(jìn)行矯正,并根據(jù)商家的反饋信息,對(duì)客戶(hù)社群進(jìn)行矯正。
進(jìn)一步地,預(yù)設(shè)權(quán)重矯正公式如下:
其中,表示樣本客戶(hù)或新客戶(hù)的矯正后的屬性標(biāo)簽A的屬性值或?qū)傩灾殿?lèi)區(qū)間在矯正后的客戶(hù)社群中的權(quán)重;表示樣本客戶(hù)或新客戶(hù)的矯正前的屬性標(biāo)簽A的屬性值或?qū)傩灾殿?lèi)區(qū)間在矯正后的客戶(hù)社群中的權(quán)重;表示樣本客戶(hù)或新客戶(hù)的矯正后的屬性標(biāo)簽A在矯正前的客戶(hù)社群中的權(quán)重。
本實(shí)施例所述的挖掘潛在客戶(hù)的裝置,根據(jù)每個(gè)屬性標(biāo)簽組合的集中度,以及組成每個(gè)屬性標(biāo)簽組合的屬性標(biāo)簽的集中度,選擇樣本客戶(hù)的挖掘?qū)傩詷?biāo)簽,根據(jù)樣本客戶(hù)的各個(gè)屬性標(biāo)簽的屬性值域的權(quán)重、樣本客戶(hù)的各個(gè)挖掘?qū)傩詷?biāo)簽的屬性值域的權(quán)重,采用圖聚類(lèi)方法對(duì)樣本客戶(hù)進(jìn)行社群劃分,得到多個(gè)客戶(hù)社群,當(dāng)新客戶(hù)屬于每個(gè)客戶(hù)社群的概率中存在一概率大于預(yù)設(shè)概率閾值時(shí),則確定新客戶(hù)是商家的潛在客戶(hù),不需要將樣本客戶(hù)的各個(gè)屬性標(biāo)簽進(jìn)行組合,不需要遍歷各種組合情況,計(jì)算簡(jiǎn)單快捷,可以節(jié)約時(shí)間。按照預(yù)設(shè)概率公式計(jì)算得到新客戶(hù)屬于每個(gè)客戶(hù)社群的概率,通過(guò)概率確定新客戶(hù)是不是商家的潛在客戶(hù),而不需要采用梯度下降法求全局最優(yōu)結(jié)果,大大提高了運(yùn)算速度。預(yù)設(shè)權(quán)重計(jì)算公式通過(guò)運(yùn)用屬性標(biāo)簽的集中度,能夠適應(yīng)更復(fù)雜的數(shù)據(jù)結(jié)構(gòu),能夠更有效的反應(yīng)數(shù)據(jù)的分布規(guī)律。根據(jù)商家的反饋信息,按照預(yù)設(shè)權(quán)重矯正公式對(duì)樣本客戶(hù)或新客戶(hù)的各個(gè)屬性標(biāo)簽的屬性值的權(quán)重或?qū)傩灾殿?lèi)區(qū)間的權(quán)重進(jìn)行矯正,預(yù)設(shè)權(quán)重矯正公式不僅考慮了屬性標(biāo)簽所包含的樣本量因素,還針對(duì)權(quán)重本身進(jìn)行懲罰或者獎(jiǎng)勵(lì),這樣不僅加快了效果反饋速度,同時(shí)還使得權(quán)重的變化更加穩(wěn)健,不會(huì)出現(xiàn)異常的增加或者減少,并且會(huì)隨著樣本客戶(hù)數(shù)量的增加,準(zhǔn)確度也會(huì)越來(lái)越高。
所述裝置與前述的方法流程描述對(duì)應(yīng),不足之處參考上述方法流程的敘述,不再一一贅述。
上述說(shuō)明示出并描述了本發(fā)明的若干優(yōu)選實(shí)施例,但如前所述,應(yīng)當(dāng)理 解本發(fā)明并非局限于本文所披露的形式,不應(yīng)看作是對(duì)其他實(shí)施例的排除,而可用于各種其他組合、修改和環(huán)境,并能夠在本文所述發(fā)明構(gòu)想范圍內(nèi),通過(guò)上述教導(dǎo)或相關(guān)領(lǐng)域的技術(shù)或知識(shí)進(jìn)行改動(dòng)。而本領(lǐng)域人員所進(jìn)行的改動(dòng)和變化不脫離本發(fā)明的精神和范圍,則都應(yīng)在本發(fā)明所附權(quán)利要求的保護(hù)范圍內(nèi)。