客戶流失預測方法以及裝置的制造方法
【技術領域】
[0001]本發(fā)明涉及人工智能領域,尤其涉及一種客戶流失預測方法以及裝置。
【背景技術】
[0002]隨著網(wǎng)絡游戲行業(yè)的迅速發(fā)展,各個游戲研發(fā)商和發(fā)行商競爭激烈,游戲玩家容易流失,帶來游戲研發(fā)商和發(fā)行商經濟上的損失,挫傷游戲研發(fā)商和發(fā)行商的開發(fā)網(wǎng)絡游戲的積極性,長此以往,會造成文化產業(yè)的損失。所以,游戲玩家流失的預警對于游戲研發(fā)商和發(fā)行商來說十分重要。
[0003]但是,在現(xiàn)有技術下,只能通過人工篩選的方法來尋找可能會流失的游戲玩家。人工篩選的一個缺點是效率低,由于人工篩選的效率低,所以經常在錯失預警的最佳時間后才尋找到準備流失的游戲玩家(下面簡稱準流失玩家),此時,對準流失玩家的挽留工作難度會急劇變大。甚至,最嚴重的是,在游戲玩家徹底流失而不再登錄游戲平臺后,才尋找到已經流失的游戲玩家,此時,已無法再聯(lián)系游戲玩家進行挽留工作,導致?lián)p失無法挽回。人工篩選的另一個缺點是準確性差,由于人工篩選時只能通過單一的篩選規(guī)則進行篩選,所以經常會出現(xiàn)誤判。例如,人工篩選規(guī)則通常定義為最近一周內的充值次數(shù)小于2次且充值金額小于1000元的游戲玩家被預測為準流失玩家,但是,對于上升期的玩家,盡管充值次數(shù)不多,金額也小于1000元,卻不應該被認為為準流失玩家,對于高級游戲玩家,盡管充值次數(shù)大于兩次或者充值金額大于1000元,也極有可能是準流失玩家等等。對非準流失玩家的誤判而實施挽留工作會造成資源的浪費,而對事實為準流失玩家的誤判而沒有實施挽留工作會導致?lián)p失無法挽回。
【發(fā)明內容】
[0004]本發(fā)明實施例所要解決的技術問題在于,提供一種客戶流失預測方法以及裝置,能夠快速、準確地預測具有流失傾向的客戶。
[0005]本發(fā)明提供了一種客戶流失預測方法,包括如下步驟:根據(jù)采集到的客戶的歷史數(shù)據(jù)對所述客戶進行分組以獲得多個對應預測模型的客戶類型;建立多個預測模型,其中,不同的客戶類型對應不同的預測模型;通過流失規(guī)則從同一客戶類型的客戶中識別出流失客戶和未知客戶以獲得訓練樣本,其中,不同的客戶類型對應不同的流失規(guī)則;使用所述訓練樣本對對應的預測模型進行訓練;根據(jù)所述未知客戶的現(xiàn)時數(shù)據(jù)以及對應的預測模型預測所述未知客戶是否有流失傾向。
[0006]可選地,所述客戶的歷史數(shù)據(jù)包括所述客戶的基礎信息以及所述客戶的行為信息,所述客戶的基礎信息包括年齡、性別、注冊地、等級、客戶端登陸狀況中的任意一種或者多種的組合,所述客戶的行為信息包括登陸信息、充值信息、消費信息、事件信息中的任意一種或者多種的組合。
[0007]可選地,所述登陸信息包括統(tǒng)計日前i天登陸游戲大廳的次數(shù)、登陸游戲大廳的天數(shù)、登陸游戲大廳的時長、登陸游戲大廳的趨勢、登陸游戲的次數(shù)、登陸游戲的天數(shù)、登陸游戲的時長、登陸游戲的趨勢中的任意一種或者多種的組合;所述充值信息包括統(tǒng)計日前i天游戲大廳的充值的次數(shù)、游戲大廳的充值的天數(shù)、游戲大廳的充值的金額、游戲大廳的充值的趨勢、游戲的充值的次數(shù)、游戲的充值的天數(shù)、游戲的充值的金額、游戲的充值的趨勢中的任意一種或者多種的組合;所述消費信息包括統(tǒng)計日前i天游戲大廳的消費的次數(shù)、游戲大廳的消費的天數(shù)、游戲大廳的消費的金額、游戲大廳的消費的趨勢、游戲的消費的次數(shù)、游戲的消費的天數(shù)、游戲的消費的金額、游戲的消費的趨勢中的任意一種或者多種的組合;所述事件信息包括統(tǒng)計日前i天客戶參與的游戲總類數(shù)量、客戶參與的游戲風格占比,客戶參與的游戲題材占比、過關失敗次數(shù)、使用道具數(shù)、游戲風格、游戲題材中的任意一種或者多種的組合,其中,i為大于零的正整數(shù)。
[0008]可選地,根據(jù)采集到的客戶的歷史數(shù)據(jù)對所述客戶進行分類以獲得多個客戶類型具體為:根據(jù)采集到的客戶的歷史數(shù)據(jù)并通過聚類算法對所述客戶進行分類以獲得多個客戶類型。
[0009]可選地,所述聚類算法為k-means聚類算法、K-Medoids聚類算法、PCA聚類算法、DBSCAN聚類算法中的任意一種。
[0010]可選地,所述預測模型為支持向量機分類器、樸素貝葉斯分類器、決策樹分類器、人工神經網(wǎng)絡中的任意一種。
[0011]可選地,根據(jù)所述未知客戶的現(xiàn)時數(shù)據(jù)以及對應的預測模型預測所述未知客戶是否有流失傾向之后還包括:對需求文本進行中文分詞,并對中文分詞后的單詞進行統(tǒng)計以獲得高頻詞以獲得客戶的需求類別,其中,所述需求文本為客服人員對預測為有流失傾向的未知客戶進行采訪記錄得到的反饋文本;根據(jù)所述需求類別的關鍵詞對所述需求文本進行匹配,以獲得所述需求類別對應的所述需求文本的數(shù)量,其中,所述關鍵詞為所述需求類別對應的高頻詞或者高頻詞的同義詞。
[0012]可選地,根據(jù)所述未知客戶的現(xiàn)時數(shù)據(jù)以及對應的預測模型預測所述未知客戶是否有流失傾向之后還包括:對預測為有流失傾向的未知客戶的登陸信息、充值信息、消費信息中的任意一種或者多種的組合進行跟蹤。
[0013]本發(fā)明還提供了一種客戶流失預測裝置,包括:分組模塊,用于根據(jù)采集到的客戶的歷史數(shù)據(jù)對所述客戶進行分組以獲得多個客戶類型;建模模塊,用于建立多個預測模型,其中,不同的客戶類型對應不同的預測模型;識別模塊,用于通過流失規(guī)則從同一客戶類型的客戶中識別出流失客戶和未知客戶以獲得對應預測模型的訓練樣本,其中,不同的客戶類型對應不同的流失規(guī)則;訓練模塊,用于使用所述訓練樣本對對應的預測模型進行訓練;預測模塊,用于根據(jù)所述未知客戶的現(xiàn)時數(shù)據(jù)以及對應的預測模型預測所述未知客戶是否有流失傾向。
[0014]可選地,所述客戶的歷史數(shù)據(jù)包括所述客戶的基礎信息以及所述客戶的行為信息,所述客戶的基礎信息包括年齡、性別、注冊地、等級、客戶端登陸狀況中的任意一種或者多種的組合,所述客戶的行為信息包括登陸信息、充值信息、消費信息、事件信息中的任意一種或者多種的組合。
[0015]可選地,所述登陸信息包括統(tǒng)計日前i天登陸游戲大廳的次數(shù)、登陸游戲大廳的天數(shù)、登陸游戲大廳的時長、登陸游戲大廳的趨勢、登陸游戲的次數(shù)、登陸游戲的天數(shù)、登陸游戲的時長、登陸游戲的趨勢中的任意一種或者多種的組合;所述充值信息包括統(tǒng)計日前i天游戲大廳的充值的次數(shù)、游戲大廳的充值的天數(shù)、游戲大廳的充值的金額、游戲大廳的充值的趨勢、游戲的充值的次數(shù)、游戲的充值的天數(shù)、游戲的充值的金額、游戲的充值的趨勢中的任意一種或者多種的組合;所述消費信息包括統(tǒng)計日前i天游戲大廳的消費的次數(shù)、游戲大廳的消費的天數(shù)、游戲大廳的消費的金額、游戲大廳的消費的趨勢、游戲的消費的次數(shù)、游戲的消費的天數(shù)、游戲的消費的金額、游戲的消費的趨勢中的任意一種或者多種的組合;所述事件信息包括統(tǒng)計日前i天客戶參與的游戲總類數(shù)量、客戶參與的游戲風格占比,客戶參與的游戲題材占比、過關失敗次數(shù)、使用道具數(shù)、游戲風格、游戲題材中的任意一種或者多種的組合,其中,i為大于零的正整數(shù)。
[0016]可選地,所述分組模塊還用于根據(jù)采集到的客戶的數(shù)據(jù)并通過聚類算法對所述客戶進行分類以獲得多個客戶類型。
[0017]可選地,所述聚類算法為k-means聚類算法、K-Medoids聚類算法、PCA聚類算法、DBSCAN聚類算法中的任意一種。
[0018]可選地,所述預測模型為支持向量機分類器、樸素貝葉斯分類器、決策樹分類器、人工神經網(wǎng)絡中的任意一種。
[0019]可選地,所述裝置還包括:分詞模塊、統(tǒng)計模塊以及匹配模塊,所述分詞模塊用于對需求文本進行中文分詞,其中,所述需求文本為客服人員對預測為有流失傾向的未知客戶進行采訪記錄得到的反饋文本;所述統(tǒng)計模塊用于對中文分詞后的單詞進行統(tǒng)計得到高頻詞以獲得客戶的需求類別;所述匹配模塊用于根據(jù)所述需求類別的關鍵詞對所述需求文本進行匹配,以獲得所述需求類別對應的所述需求文本的數(shù)量,其中,所述關鍵詞為所述需求類別對應的高頻詞或者高頻詞的同義詞。
[0020]可選地,所述裝置還包括跟蹤模塊,所述跟蹤模塊用于對預測為有流失傾向的未知客戶的登陸信息、充值信息、消費信息中的任意一種或者多種的組合進行跟蹤。
[0021]通過實施本發(fā)明實施例,能夠通過計算機來完成采集客戶的數(shù)據(jù)、建立預測模塊、對預測模型進行訓練以及根據(jù)預測模型進行預測等工作,比人工逐個進行篩選的速度快,效率高。而且,本發(fā)明對不同的客戶進行了分組,針對每種客戶類型的客戶建立屬于自己的預測模型進行預測,比起人工對所有的客戶采用單一的規(guī)則進行預測來說,提高了預測的準確性。
【附圖說明】
[0022]為了更