客戶分類的處理方法和裝置的制造方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及分類算法技術(shù)領(lǐng)域,尤其涉及客戶分類的處理方法和裝置。
【背景技術(shù)】
[0002] 在產(chǎn)品銷售過程中經(jīng)常會遇到送種情況;需要根據(jù)與客戶交流結(jié)果判斷該客戶是 否為潛在客戶,若是則需要通過銷售技巧來提高成交的可能性,W達到提高銷量。其中上述 判斷過程屬于一個客戶分類的過程。
[0003] 在各種技術(shù)領(lǐng)域中都或多或少涉及到一些客戶分類的事件,現(xiàn)有技術(shù)常見的方式 是首先建立一個客戶模型,然后采用樸素貝葉斯分類算法對客戶類型進行分類。但是現(xiàn)有 的樸素貝葉斯分類算法存在鑒別器不相關(guān)性和兀余性的特點,算法復雜度較高,同時容易 導致客戶分類不夠精確。
【發(fā)明內(nèi)容】
[0004] 本發(fā)明的主要目的在于解決傳統(tǒng)樸素貝葉斯分類算法復雜度高、客戶分類不夠精 確的技術(shù)問題。
[0005] 為實現(xiàn)上述目的,本發(fā)明提供的一種客戶分類的處理方法,包括:
[0006] 步驟S1、建立實際客戶模型,確定該實際客戶模型中客戶類別C ;
[0007] 步驟S2、建立用于判斷客戶特征屬性的鑒別器;
[0008] 步驟S3、計算所述實際客戶模型中每種客戶類別C的頻率、每種客戶類別C對應(yīng)的 每個特征屬性對應(yīng)的頻率、W及每個鑒別器條件下其他鑒別器的頻率;
[0009] 步驟S4、根據(jù)步驟S3計算所得的數(shù)據(jù)計算每兩個鑒別器之間、每個鑒別器與客戶 類別C之間的對稱不確定性值;
[0010] 步驟S5、根據(jù)步驟S4計算結(jié)果查找待刪除的鑒別器,并執(zhí)行待刪除鑒別器的刪除 操作,保留相互之間獨立性強的鑒別器;
[0011] 步驟S6、采集客戶數(shù)據(jù),通過步驟S5保留的鑒別器根據(jù)所述客戶數(shù)據(jù)對所述客戶 進行樸素貝葉斯分類。
[0012] 優(yōu)選地,所述根據(jù)計算結(jié)果查找待刪除的鑒別器,并執(zhí)行待刪除鑒別器的刪除操 作具體包括:
[0013] 步驟S51、查找與客戶類別C之間的對稱不確定性值最大的鑒別器Ap ;
[0014] 步驟S52、刪除與其他鑒別器之間的對稱不確定性值大于所述最大對稱不確定性 值S化,C的鑒別器,保留其他鑒別器。
[0015] 優(yōu)選地,所述步驟S52具體為:循環(huán)執(zhí)行當不同于Ap的一鑒別器Aq與至少一個其 他鑒別器之間的對稱不確定性值SUi,q大于或等于所述最大對稱不確定性值SUp,。,則刪除所 述鑒別器Aq的操作,直至鑒別器之間對稱不確定性值均小于所述最大對稱不確定性值SUp, c〇
[0016] 優(yōu)選地,所述步驟S51之前還包括:
[0017] 步驟S511、將每個鑒別器與客戶類別之間的對稱不確定性值與預設(shè)的對稱不確定 闊值進行比較;
[0018] 步驟S512、刪除與客戶類別之間的對稱不確定性值大于或等于所述對稱不確定闊 值的鑒別器。
[0019] 優(yōu)選地,所述步驟S2中的建立的鑒別器至少為3個、每個鑒別器至少包括兩個客 戶特征屬性。
[0020] 此外,為實現(xiàn)上述目的,本發(fā)明還提供一種客戶分類的處理裝置,包括:
[0021] 模型建立模塊,用于建立實際客戶模型,確定該實際客戶模型中客戶類別C ;
[0022] 鑒別器建立模塊,用于建立用于判斷客戶特征屬性的鑒別器;
[0023] 計算模塊,用于計算所述實際客戶模型中每種客戶類別C的頻率、每種客戶類別C 對應(yīng)的每個特征屬性對應(yīng)的頻率、W及每個鑒別器條件下其他鑒別器的頻率;
[0024] 鑒別器過濾模塊,用于根據(jù)計算模塊計算所得的數(shù)據(jù)計算每兩個鑒別器之間、每 個鑒別器與客戶類別C之間的對稱不確定性值,并根據(jù)計算結(jié)果查找待刪除的鑒別器,并 執(zhí)行待刪除鑒別器的刪除操作,保留合理的鑒別器;
[0025] 客戶分類模塊,用于采集客戶數(shù)據(jù),通過保留的鑒別器根據(jù)所述客戶數(shù)據(jù)對所述 客戶進行樸素貝葉斯分類。
[0026] 優(yōu)選地,所述鑒別器過濾模塊,包括:
[0027] 查找單元,用于查找與客戶類別C之間的對稱不確定性值最大的鑒別器Ap ;
[0028] 第一刪除單元,用于刪除與其他鑒別器之間的對稱不確定性值大于所述最大對稱 不確定性值S化,C的鑒別器,保留其他鑒別器。
[0029] 優(yōu)選地,所述第一刪除單元,具體用于循環(huán)執(zhí)行當不同于Ap的一鑒別器Aq與至少 一個其他鑒別器之間的對稱不確定性值SUi,q大于或等于所述最大對稱不確定性值SUp,。,則 刪除所述鑒別器Aq的操作,直至鑒別器之間對稱不確定性值均小于所述最大對稱不確定 性值 Slip,。。
[0030] 優(yōu)選地,所述鑒別器過濾模塊還包括:
[0031] 比較單元,用于在查找單元查找與客戶類別C之間的對稱不確定性值最大的鑒別 器Ap之前,將每個鑒別器與客戶類別之間的對稱不確定性值與預設(shè)的對稱不確定闊值進 行比較;
[0032] 第二刪除單元,用于刪除與客戶類別之間的對稱不確定性值大于或等于所述對稱 不確定闊值的鑒別器。
[0033] 優(yōu)選地,所述建立的鑒別器至少為3個、每個鑒別器至少包括兩個客戶特征屬性。
[0034] 本發(fā)明所提供的客戶分類的處理方法和裝置,通過建立實際客戶模型,確定該實 際客戶模型中客戶類別C ;建立用于判斷客戶特征屬性的鑒別器;計算所述實際客戶模型 中每個客戶類別C的頻率、每種客戶類別C對應(yīng)的每個特征屬性對應(yīng)的頻率、W及每個鑒別 器條件下其他鑒別器的頻率;根據(jù)計算所得的數(shù)據(jù)計算每兩個鑒別器之間、每個鑒別器與 客戶類別C之間的對稱不確定性值;根據(jù)計算結(jié)果查找待刪除的鑒別器,并執(zhí)行待刪除鑒 別器的刪除操作的方式,保留相互之間獨立性強的鑒別器,采集客戶數(shù)據(jù),通過保留的鑒別 器根據(jù)所述客戶數(shù)據(jù)對所述客戶進行樸素貝葉斯分類的方式,降低了鑒別器相互之間的相 關(guān)度和兀余度,相互之間獨立性強,在客戶類型分類計算中,由于鑒別器數(shù)量減少,從而可 w減少客戶分類計算過程中計算量和計算復雜度,同時由于鑒別器相互之間獨立性強,客 戶分類計算的準確率更高。
【附圖說明】
[0035] 圖1是本發(fā)明的客戶分類的方法一實施例的流程圖;
[0036] 圖2是圖1中步驟S5的具體細化流程圖;
[0037] 圖3是圖1中步驟S5的另一細化流程圖;
[0038] 圖4是本發(fā)明的客戶分類的處理裝置一實施例的功能模塊示意圖;
[0039] 圖5是圖4中鑒別器過濾模塊的細化功能模塊示意圖;
[0040] 圖6是圖4中鑒別器過濾模塊的另一細化功能模塊示意圖。
[0041] 本發(fā)明目的的實現(xiàn)、功能特點及優(yōu)點將結(jié)合實施例,參照附圖做進一步說明。
【具體實施方式】
[0042] 應(yīng)當理解,此處所描述的具體實施例僅僅用W解釋本發(fā)明,并不用于限定本發(fā)明。
[0043] 本發(fā)明提供一種客戶分類的方法。參見圖1,圖1是本發(fā)明的客戶分類的方法一實 施例的流程圖。在一實施例中,所述客戶分類的方法包括:
[0044] 步驟S10、建立實際客戶分類模型,確定該實際客戶分類模型中客戶類別C。
[0045] 本步驟中建立的實際客戶分類模型的大小可W根據(jù)實際需要進行調(diào)整,例如可W 建立一個客戶數(shù)為1000的的實際客戶分類模型。該建立的實際客戶分類模型中,記錄有每 個客戶的相關(guān)數(shù)據(jù)信息,為后續(xù)步驟的計算提供數(shù)據(jù)支持。
[0046] 步驟S20、建立用于判斷客戶特征屬性的鑒別器。
[0047] 本步驟S20中,所述建立的鑒別器至少為3個,所述建立的每個鑒別器至少包括兩 個客戶特征屬性。
[0048] 步驟S30、計算所述實際客戶模型中每種客戶類別C的頻率、每種客戶類別C對應(yīng) 的每個特征屬性對應(yīng)的頻率、W及每個鑒別器條件下其他鑒別器的頻率。
[0049] 步驟S40、根據(jù)步驟S3計算所得的數(shù)據(jù)計算每兩個鑒別器之間、每個鑒別器與客 戶類別C之間的對稱不確定性值。
[0050] 步驟S50、根據(jù)步驟S40計算結(jié)果查找待刪除的鑒別器,并執(zhí)行待刪除鑒別器的刪 除操作,保留相互之間獨立性強的鑒別器。
[0051] 步驟S60、采集客戶數(shù)據(jù),通過保留的鑒別器根據(jù)所述客戶數(shù)據(jù)對所述客戶進行樸 素貝葉斯分類。
[0052] 參見圖2,圖2是圖1中步驟S50的具體細化流程圖。所述步驟S50具體包括:
[0053] 步驟S501、查找與客戶類別C之間的對稱不確定性值最大的鑒別器Ap。
[0054] 步驟S502、刪除與其他鑒別器之間的對稱不確定性值大于所述最大對稱不確定性 值S化,C的鑒別器,保留其他鑒別器。
[0055] 本實施例中,對稱不確定性值是指鑒別器與鑒別器之間的相關(guān)程度,或者鑒別器 與類之間的相關(guān)程度,其取值范圍是[0,1]。其中取值越小表明二者的相關(guān)程度越大,取值 越大則表明二者的相關(guān)程度小,相互間獨立性強。例如鑒別器1與鑒別器2之間的對稱不 確定性值為0時,表示二者之間是相互獨立的。通過查找與客戶類別C之間的對稱不確定 性值最大的鑒別器Ap,刪除與其他鑒別器之間的對稱不確定性值大于所述最大對稱不確定 性值S化,C的鑒別器,是為了將與其他鑒別器相關(guān)性大,具有兀余的鑒別器過濾掉,確定保 留下來的鑒別器相互之間獨立性強,W提高后續(xù)客戶分類的準確率,同時降低后續(xù)客戶分 類計算的復雜度和計算量。
[0056] 本實施例中,所述步驟S502具體操作如下:循環(huán)執(zhí)行當不同于Ap的一鑒別器Aq 與至少一個其他鑒別器之間的對稱不確定性值SUi, q大于或等于所述最大對稱不確定性值 SUp,