本發(fā)明涉及互聯(lián)網(wǎng)技術(shù)領(lǐng)域,尤其涉及一種數(shù)據(jù)下載處理方法和裝置。
背景技術(shù):
近年來,隨著互聯(lián)網(wǎng)技術(shù)的快速發(fā)展,各式各樣的網(wǎng)絡(luò)游戲也得以迅速發(fā)展。在這些網(wǎng)絡(luò)游戲中,大多數(shù)的網(wǎng)絡(luò)游戲均可幫助用戶鍛煉腦力和提升敏捷能力,因此,這些網(wǎng)絡(luò)游戲日漸受到了越來越多的用戶的青睞。在這個虛擬的游戲世界中,由于這些用戶滲透在社會中的各個行業(yè)以及各個階層,因此,彼此之間的網(wǎng)速情況和游戲熱愛程度等因素也就存在一定的差異,而這些差異的因素也會影響到游戲的下載情況。
比如,對于一些網(wǎng)速較慢的用戶或?qū)τ谝恍┬逻M的用戶,若整個游戲的下載進度偏慢(例如,普遍在10分鐘內(nèi)僅完成了整個進度的5%),則這些用戶就很有可能在該游戲的下載期間取消對該游戲的下載。因此,若存在較多網(wǎng)速較慢的用戶和較多新進的用戶,則可能會導(dǎo)致過多用戶自主取消對游戲的下載,進而嚴重降低對游戲的業(yè)務(wù)轉(zhuǎn)換率。
技術(shù)實現(xiàn)要素:
本發(fā)明實施例提供一種數(shù)據(jù)下載處理方法和裝置,可提升下載業(yè)務(wù)的業(yè)務(wù)轉(zhuǎn)換率。
本發(fā)明第一方面提供了一種數(shù)據(jù)下載處理方法,包括:
響應(yīng)客戶端發(fā)送的應(yīng)用下載請求;
獲取所述客戶端在下載業(yè)務(wù)期間內(nèi)的與至少一個關(guān)鍵下載特征類型分別對應(yīng)的目標特征值;
基于已訓(xùn)練的svm模型計算所述目標特征值對應(yīng)的下載取消概率;所述svm模型是根據(jù)多個歷史用戶分別對應(yīng)的關(guān)鍵歷史下載數(shù)據(jù)訓(xùn)練得到,各關(guān)鍵歷史下載數(shù)據(jù)均包括下載狀態(tài)以及各關(guān)鍵下載特征類型分別對應(yīng)的歷史特征值;
若所述下載取消概率大于預(yù)設(shè)概率閾值,則向所述客戶端推送與所述客戶端的用戶信息對應(yīng)的業(yè)務(wù)數(shù)據(jù)包。
可選地,在所述響應(yīng)客戶端發(fā)送的應(yīng)用下載請求之前,還包括:
獲取多個歷史用戶分別對應(yīng)的原始歷史下載數(shù)據(jù),并在各原始歷史下載數(shù)據(jù)所涉及的多個下載特征類型中篩選至少一個關(guān)鍵下載特征類型;每個原始歷史下載數(shù)據(jù)均包括下載狀態(tài)以及所述多個下載特征類型分別對應(yīng)的歷史特征值;
將所述各原始歷史下載數(shù)據(jù)中的下載狀態(tài)以及與各關(guān)鍵下載特征類型分別對應(yīng)的歷史特征值,確定為各歷史用戶分別對應(yīng)的關(guān)鍵歷史下載數(shù)據(jù);
根據(jù)所述各關(guān)鍵歷史下載數(shù)據(jù)訓(xùn)練支持向量機svm模型。
其中,所述下載狀態(tài)包括下載取消狀態(tài)和下載完成狀態(tài),所述根據(jù)所述各關(guān)鍵歷史下載數(shù)據(jù)訓(xùn)練支持向量機svm模型,包括:
將所述各關(guān)鍵歷史下載數(shù)據(jù)中的與各關(guān)鍵下載特征類型分別對應(yīng)的歷史特征值確定為所述svm模型的訓(xùn)練輸入值,并將所述各關(guān)鍵歷史下載數(shù)據(jù)中的下載狀態(tài)確定為所述svm模型的訓(xùn)練輸出值;
根據(jù)所述訓(xùn)練輸入值和所述訓(xùn)練輸出值,計算所述svm模型中的分類超平面對應(yīng)的超平面參數(shù);所述分類超平面是用于對具有所述下載完成狀態(tài)的關(guān)鍵歷史下載數(shù)據(jù)和具有所述下載取消狀態(tài)的關(guān)鍵歷史下載數(shù)據(jù)進行分類;所述超平面參數(shù)包括:法向量和位移項值。
其中,所述基于已訓(xùn)練的svm模型計算所述目標特征值對應(yīng)的下載取消概率,包括:
將所述目標特征值作為所述svm模型的輸入向量,并將所述輸入向量和所述法向量進行相乘,并將相乘后的值與所述位移項值進行相加,并將相加后的值與所述法向量的模值進行相除,得到所述輸入向量到所述分類超平面之間的目標距離;
基于所述svm模型中的概率轉(zhuǎn)換函數(shù),計算所述目標距離對應(yīng)的下載取消概率。
可選地,所述方法還包括:
若所述客戶端處于下載完成狀態(tài)或下載取消狀態(tài),則將所述客戶端對應(yīng)的用戶信息確定為歷史用戶,并將所述目標特征值與所述客戶端對應(yīng)的下載狀態(tài)確定為關(guān)鍵歷史下載數(shù)據(jù)。
可選地,所述方法還包括:
若模型待更新時長達到預(yù)設(shè)的周期時長,則獲取所述周期時長內(nèi)所記錄的新增的關(guān)鍵歷史下載數(shù)據(jù),并根據(jù)在所述周期時長之前所記錄的關(guān)鍵歷史下載數(shù)據(jù)和所述新增的關(guān)鍵歷史下載數(shù)據(jù),更新所述svm模型的超平面參數(shù),并將所述模型待更新時長清零。
其中,所述獲取多個歷史用戶分別對應(yīng)的原始歷史下載數(shù)據(jù),并在各原始歷史下載數(shù)據(jù)所涉及的多個下載特征類型中篩選至少一個關(guān)鍵下載特征類型,包括:
獲取多個歷史用戶分別對應(yīng)的原始歷史下載數(shù)據(jù),并提取各原始歷史下載數(shù)據(jù)所涉及的多個下載特征類型;
根據(jù)所述多個下載特征類型生成多個待處理特征集合,并計算各待處理特征集合分別對應(yīng)的信息熵增益,并在所述各待處理特征集合分別對應(yīng)的信息熵增益中選擇最大信息熵增益,并將具有所述最大信息熵增益的待處理特征集合中的下載特征類型確定為關(guān)鍵下載特征類型;所述各待處理特征集合包括至少一個下載特征類型。
其中,所述根據(jù)所述多個下載特征類型生成多個待處理特征集合,并計算各待處理特征集合分別對應(yīng)的信息熵增益,并在所述各待處理特征集合分別對應(yīng)的信息熵增益中選擇最大信息熵增益,并將具有所述最大信息熵增益的待處理特征集合中的下載特征類型確定為關(guān)鍵下載特征類型,包括:
將各下載特征類型分別添加到對應(yīng)的待處理特征集合,并計算各待處理特征集合分別對應(yīng)的信息熵增益,并在所述各待處理特征集合分別對應(yīng)的信息熵增益中選擇最大信息熵增益,并將具有所述最大信息熵增益的待處理特征集合中的所有下載特征類型確定為最優(yōu)特征類型;
將所述最優(yōu)特征類型分別添加至剩余的下載特征類型分別對應(yīng)的待處理特征集合,得到多個新的待處理特征集合;所述剩余的下載特征類型是指所述多個下載特征類型中除了所述最優(yōu)特征類型以外的下載特征類型;
當存在至少一個新的待處理特征集合不滿足預(yù)設(shè)的最優(yōu)特征收斂條件時,繼續(xù)在所述多個新的待處理特征集合中確定出新的最優(yōu)特征類型,并繼續(xù)對所述新的最優(yōu)特征類型進行添加處理;
當所述多個新的待處理特征集合均滿足預(yù)設(shè)的最優(yōu)特征收斂條件時,將已確定出的所述最優(yōu)特征類型確定為關(guān)鍵下載特征類型。
其中,還包括:
將所述多個新的待處理特征集合分別對應(yīng)的信息熵增益中的最大信息熵增益,確定為第一信息熵增益;
獲取所述多個新的待處理特征集合對應(yīng)的多個更新前的待處理特征集合,并將所述多個更新前的待處理特征集合分別對應(yīng)的信息熵增益中的最大信息熵增益,確定為第二信息熵增益;
判斷所述第一信息熵增益是否小于所述第二信息熵增益;
若判斷為是,則確定所述多個新的待處理特征集合均滿足預(yù)設(shè)的最優(yōu)特征收斂條件;
若判斷為否,則確定存在至少一個新的待處理特征集合不滿足預(yù)設(shè)的最優(yōu)特征收斂條件。
本發(fā)明第二方面提供了一種數(shù)據(jù)下載處理裝置,包括:
響應(yīng)模塊,用于響應(yīng)客戶端發(fā)送的應(yīng)用下載請求;
特征值獲取模塊,用于獲取所述客戶端在下載業(yè)務(wù)期間內(nèi)的與至少一個關(guān)鍵下載特征類型分別對應(yīng)的目標特征值;
取消概率計算模塊,用于基于已訓(xùn)練的svm模型計算所述目標特征值對應(yīng)的下載取消概率;所述svm模型是根據(jù)多個歷史用戶分別對應(yīng)的關(guān)鍵歷史下載數(shù)據(jù)訓(xùn)練得到,各關(guān)鍵歷史下載數(shù)據(jù)均包括下載狀態(tài)以及各關(guān)鍵下載特征類型分別對應(yīng)的歷史特征值;
數(shù)據(jù)包發(fā)送模塊,用于若所述下載取消概率大于預(yù)設(shè)概率閾值,則向所述客戶端推送與所述客戶端的用戶信息對應(yīng)的業(yè)務(wù)數(shù)據(jù)包。
可選地,所述裝置還包括:
關(guān)鍵類型篩選模塊,用于獲取多個歷史用戶分別對應(yīng)的原始歷史下載數(shù)據(jù),并在各原始歷史下載數(shù)據(jù)所涉及的多個下載特征類型中篩選至少一個關(guān)鍵下載特征類型;每個原始歷史下載數(shù)據(jù)均包括下載狀態(tài)以及所述多個下載特征類型分別對應(yīng)的歷史特征值;
關(guān)鍵數(shù)據(jù)確定模塊,用于將所述各原始歷史下載數(shù)據(jù)中的下載狀態(tài)以及與各關(guān)鍵下載特征類型分別對應(yīng)的歷史特征值,確定為各歷史用戶分別對應(yīng)的關(guān)鍵歷史下載數(shù)據(jù);
模型訓(xùn)練模塊,用于根據(jù)所述各關(guān)鍵歷史下載數(shù)據(jù)訓(xùn)練支持向量機svm模型。
其中,所述關(guān)鍵類型篩選模塊包括:
獲取提取單元,用于獲取多個歷史用戶分別對應(yīng)的原始歷史下載數(shù)據(jù),并提取各原始歷史下載數(shù)據(jù)所涉及的多個下載特征類型;
選擇確定單元,用于根據(jù)所述多個下載特征類型生成多個待處理特征集合,并計算各待處理特征集合分別對應(yīng)的信息熵增益,并在所述各待處理特征集合分別對應(yīng)的信息熵增益中選擇最大信息熵增益,并將具有所述最大信息熵增益的待處理特征集合中的下載特征類型確定為關(guān)鍵下載特征類型;所述各待處理特征集合包括至少一個下載特征類型。
其中,所述選擇確定單元包括:
第一確定子單元,用于將各下載特征類型分別添加到對應(yīng)的待處理特征集合,并計算各待處理特征集合分別對應(yīng)的信息熵增益,并在所述各待處理特征集合分別對應(yīng)的信息熵增益中選擇最大信息熵增益,并將具有所述最大信息熵增益的待處理特征集合中的所有下載特征類型確定為最優(yōu)特征類型;
添加子單元,用于將所述最優(yōu)特征類型分別添加至剩余的下載特征類型分別對應(yīng)的待處理特征集合,得到多個新的待處理特征集合;所述剩余的下載特征類型是指所述多個下載特征類型中除了所述最優(yōu)特征類型以外的下載特征類型;
通知子單元,用于當存在至少一個新的待處理特征集合不滿足預(yù)設(shè)的最優(yōu)特征收斂條件時,通知所述第一確定子單元繼續(xù)在所述多個新的待處理特征集合中確定出新的最優(yōu)特征類型,并通知所述添加子單元繼續(xù)對所述新的待處理特征集合進行添加處理;
第二確定子單元,用于當所述多個新的待處理特征集合均滿足預(yù)設(shè)的最優(yōu)特征收斂條件時,將已確定出的所述最優(yōu)特征類型確定為關(guān)鍵下載特征類型。
其中,所述選擇確定單元還包括:
第三確定子單元,用于將所述多個新的待處理特征集合分別對應(yīng)的信息熵增益中的最大信息熵增益,確定為第一信息熵增益;
所述第三確定子單元,還用于獲取所述多個新的待處理特征集合對應(yīng)的多個更新前的待處理特征集合,并將所述多個更新前的待處理特征集合分別對應(yīng)的信息熵增益中的最大信息熵增益,確定為第二信息熵增益;
判斷子單元,用于判斷所述第一信息熵增益是否小于所述第二信息熵增益;
所述第三確定子單元,還用于若所述判斷子單元判斷為是,則確定所述多個新的待處理特征集合均滿足預(yù)設(shè)的最優(yōu)特征收斂條件;
所述第三確定子單元,還用于若所述判斷子單元判斷為否,則確定存在至少一個新的待處理特征集合不滿足預(yù)設(shè)的最優(yōu)特征收斂條件。
其中,所述下載狀態(tài)包括下載取消狀態(tài)和下載完成狀態(tài),所述模型訓(xùn)練模塊包括:
輸入輸出確定單元,用于所述各關(guān)鍵歷史下載數(shù)據(jù)中的與各關(guān)鍵下載特征類型分別對應(yīng)的歷史特征值確定為所述svm模型的訓(xùn)練輸入值,并將所述各關(guān)鍵歷史下載數(shù)據(jù)中的下載狀態(tài)確定為所述svm模型的訓(xùn)練輸出值;
參數(shù)計算單元,用于根據(jù)所述訓(xùn)練輸入值和所述訓(xùn)練輸出值,計算所述svm模型中的分類超平面對應(yīng)的超平面參數(shù);所述分類超平面是用于對具有所述下載完成狀態(tài)的關(guān)鍵歷史下載數(shù)據(jù)和具有所述下載取消狀態(tài)的關(guān)鍵歷史下載數(shù)據(jù)進行分類;所述超平面參數(shù)包括:法向量和位移項值。
其中,所述取消概率計算模塊包括:
目標距離計算單元,用于將所述目標特征值作為所述svm模型的輸入向量,并將所述輸入向量和所述法向量進行相乘,并將相乘后的值與所述位移項值進行相加,并將相加后的值與所述法向量的模值進行相除,得到所述輸入向量到所述分類超平面之間的目標距離;
轉(zhuǎn)換計算單元,用于基于所述svm模型中的概率轉(zhuǎn)換函數(shù),計算所述目標距離對應(yīng)的下載取消概率。
可選地,所述裝置還包括:
歷史數(shù)據(jù)更新模塊,用于若所述客戶端處于下載完成狀態(tài)或下載取消狀態(tài),則將所述客戶端對應(yīng)的用戶信息確定為歷史用戶,并將所述目標特征值與所述客戶端對應(yīng)的下載狀態(tài)確定為關(guān)鍵歷史下載數(shù)據(jù)。
可選地,所述裝置還包括:
模型參數(shù)更新模塊,用于若模型待更新時長達到預(yù)設(shè)的周期時長,則獲取所述周期時長內(nèi)所記錄的新增的關(guān)鍵歷史下載數(shù)據(jù),并根據(jù)在所述周期時長之前所記錄的關(guān)鍵歷史下載數(shù)據(jù)和所述新增的關(guān)鍵歷史下載數(shù)據(jù),更新所述svm模型的超平面參數(shù),并將所述模型待更新時長清零。
本發(fā)明第三方面提供了一種數(shù)據(jù)下載處理裝置,包括:處理器、網(wǎng)絡(luò)接口、存儲器;
所述處理器分別與網(wǎng)絡(luò)接口、存儲器相連,其中,所述網(wǎng)絡(luò)接口用于與客戶端通信,所述存儲器用于存儲程序代碼,所述處理器用于調(diào)用所述程序代碼,以執(zhí)行以下操作:
響應(yīng)客戶端發(fā)送的應(yīng)用下載請求;
獲取所述客戶端在下載業(yè)務(wù)期間內(nèi)的與至少一個關(guān)鍵下載特征類型分別對應(yīng)的目標特征值;
基于已訓(xùn)練的svm模型計算所述目標特征值對應(yīng)的下載取消概率;所述svm模型是根據(jù)多個歷史用戶分別對應(yīng)的關(guān)鍵歷史下載數(shù)據(jù)訓(xùn)練得到,各關(guān)鍵歷史下載數(shù)據(jù)均包括下載狀態(tài)以及各關(guān)鍵下載特征類型分別對應(yīng)的歷史特征值;
若所述下載取消概率大于預(yù)設(shè)概率閾值,則向所述客戶端推送與所述客戶端的用戶信息對應(yīng)的業(yè)務(wù)數(shù)據(jù)包。
本發(fā)明實施例第四方面提供了一種計算機存儲介質(zhì),所述計算機存儲介質(zhì)存儲有計算機程序,所述計算機程序包括程序指令,所述程序指令當被處理器執(zhí)行時執(zhí)行本發(fā)明實施例中第一方面中的方法。
本發(fā)明實施例通過在響應(yīng)客戶端發(fā)送的應(yīng)用下載請求時,獲取所述客戶端在下載業(yè)務(wù)期間內(nèi)的與至少一個關(guān)鍵下載特征類型分別對應(yīng)的目標特征值;基于已訓(xùn)練的svm模型計算所述目標特征值對應(yīng)的下載取消概率;所述svm模型是根據(jù)多個歷史用戶分別對應(yīng)的關(guān)鍵歷史下載數(shù)據(jù)訓(xùn)練得到,各關(guān)鍵歷史下載數(shù)據(jù)均包括下載狀態(tài)以及各關(guān)鍵下載特征類型分別對應(yīng)的歷史特征值;若所述下載取消概率大于預(yù)設(shè)概率閾值,則向所述客戶端推送與所述客戶端的用戶信息對應(yīng)的業(yè)務(wù)數(shù)據(jù)包。由此可見,本發(fā)明通過已訓(xùn)練的svm模型對下載業(yè)務(wù)期間內(nèi)的各關(guān)鍵下載特征類型分別對應(yīng)的目標特征值進行計算,可得到所述客戶端的下載取消概率,從而可進一步對該下載業(yè)務(wù)期間內(nèi)的下載情況進行干預(yù),以提升業(yè)務(wù)轉(zhuǎn)換率。
附圖說明
為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1是本發(fā)明實施例提供的一種網(wǎng)絡(luò)架構(gòu)的結(jié)構(gòu)示意圖;
圖2是本發(fā)明實施例提供的一種數(shù)據(jù)下載處理方法的流程示意圖;
圖3是本發(fā)明實施例提供的一種下載界面的示意圖;
圖4是本發(fā)明實施例提供的另一種數(shù)據(jù)下載處理方法的流程示意圖;
圖5是本發(fā)明實施例提供的一種篩選關(guān)鍵下載特征類型的流程示意圖;
圖6是本發(fā)明實施例提供的一種下載數(shù)據(jù)交互圖;
圖7是本發(fā)明實施例提供的一種數(shù)據(jù)下載處理裝置的結(jié)構(gòu)示意圖;
圖8是本發(fā)明實施例提供的另一種數(shù)據(jù)下載處理裝置的結(jié)構(gòu)示意圖;
圖9是本發(fā)明實施例提供的一種模型訓(xùn)練模塊的結(jié)構(gòu)示意圖;
圖10是本發(fā)明實施例提供的一種取消概率計算模塊的結(jié)構(gòu)示意圖;
圖11是本發(fā)明實施例提供的一種關(guān)鍵類型篩選模塊的結(jié)構(gòu)示意圖;
圖12是本發(fā)明實施例提供的一種選擇確定單元的結(jié)構(gòu)示意圖;
圖13是本發(fā)明實施例提供的又一種數(shù)據(jù)下載處理裝置的結(jié)構(gòu)示意圖。
具體實施方式
下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。
請參見圖1,是本發(fā)明實施例提供的一種網(wǎng)絡(luò)架構(gòu)的結(jié)構(gòu)示意圖。如圖1所示,所述網(wǎng)絡(luò)架構(gòu)可以包括服務(wù)器2000以及客戶端集群;所述客戶端集群可以包括多個客戶端,如圖1所示,具體包括客戶端3000a、客戶端3000b、…、客戶端3000n;
其中,客戶端3000a、客戶端3000b、…、客戶端3000n可以分別與所述服務(wù)器2000進行網(wǎng)絡(luò)連接。
如圖1所示,所述客戶端集群可為多個歷史用戶分別持有的終端設(shè)備,用于分別向所述服務(wù)器上報原始歷史下載數(shù)據(jù);其中,各客戶端分別上報的原始歷史下載數(shù)據(jù)均包括下載狀態(tài)以及多個下載特征類型分別對應(yīng)的歷史特征值。所述服務(wù)器2000可記錄各歷史用戶分別對應(yīng)的原始歷史下載數(shù)據(jù),并提取各原始歷史下載數(shù)據(jù)所涉及的多個下載特征類型,所述多個下載特征類型可以包括下載速度、下載時長、下載完成比例、玩家在游戲內(nèi)的等級、玩家是否新進、玩家是否回流等下載特征類型。由于在這些下載特征類型中,存在部分下載特征類型與取消下載原因無關(guān)。因此,所述服務(wù)器2000為了避免維數(shù)災(zāi)難,可以先在所述多個下載特征類型中選擇出至少一個關(guān)鍵下載特征類型,進而可以根據(jù)所述述各原始歷史下載數(shù)據(jù)中的下載狀態(tài)(下載取消狀態(tài)或下載完成狀態(tài))以及與各關(guān)鍵下載特征類型分別對應(yīng)的歷史特征值,訓(xùn)練svm(supportvectormachine,支持向量機)模型。后續(xù)若有新的客戶端發(fā)送應(yīng)用下載請求,則所述服務(wù)器2000可以在新的客戶端所處的下載業(yè)務(wù)期間內(nèi)基于已訓(xùn)練的svm模型計算新的客戶端對應(yīng)的下載取消概率,并在所述下載取消概率大于預(yù)設(shè)概率閾值時向新的客戶端推送與新的客戶端的用戶信息對應(yīng)的業(yè)務(wù)數(shù)據(jù)包。
其中,所述服務(wù)器2000篩選關(guān)鍵下載特征類型、訓(xùn)練svm模型、計算下載取消概率的具體過程可以參見如下圖2至圖5對應(yīng)的實施例。
請參見圖2,是本發(fā)明實施例提供的一種數(shù)據(jù)下載處理方法的流程示意圖。如圖2所示,所述方法可以包括:
s101,響應(yīng)客戶端發(fā)送的應(yīng)用下載請求;
s102,獲取所述客戶端在下載業(yè)務(wù)期間內(nèi)的與至少一個關(guān)鍵下載特征類型分別對應(yīng)的目標特征值;
具體的,服務(wù)器在接收到客戶端發(fā)送的應(yīng)用下載請求時,可對所述應(yīng)用下載請求做出響應(yīng),此后,所述服務(wù)器可獲取所述客戶端在下載業(yè)務(wù)期間內(nèi)主動上報的與至少一個關(guān)鍵下載特征類型分別對應(yīng)的目標特征值,可選地,也可在下載業(yè)務(wù)期間內(nèi)通知所述客戶端上報與至少一個關(guān)鍵下載特征類型分別對應(yīng)的目標特征值。
其中,所述客戶端可以包括個人電腦、平板電腦、筆記本電腦等具有網(wǎng)絡(luò)連接功能的終端設(shè)備;
其中,所述服務(wù)器可以為上述圖1對應(yīng)實施例中的服務(wù)器2000,所述關(guān)鍵下載特征類型可以為所述服務(wù)器預(yù)先在多個歷史用戶(多個歷史玩家)分別對應(yīng)的原始歷史下載數(shù)據(jù)所涉及的多個下載特征類型中篩選出來,所述關(guān)鍵特征是指在所述多個下載特征類型中能影響玩家取消下載的主要因素的特征。例如,所述多個下載特征類型包括下載速度、下載時長、下載完成比例、玩家在游戲內(nèi)的等級、玩家是否新進、玩家是否回流等特征類型,所述服務(wù)器從所述多個下載特征類型中篩選出的關(guān)鍵下載特征類型可以包括下載時長、下載速度、下載完成比例。
其中,所述目標特征值可為最近預(yù)設(shè)時間段內(nèi)(如一分鐘內(nèi))所統(tǒng)計到的各關(guān)鍵下載特征類型分別對應(yīng)的數(shù)值,比如,以下載速度為例,所述服務(wù)器可統(tǒng)計到所述客戶端在一分鐘內(nèi)的下載平均速度為120比特每秒,且在一分鐘內(nèi)的下載完成比例為45%。
其中,所述原始歷史下載數(shù)據(jù)均可以包括下載狀態(tài)以及所述多個下載特征類型分別對應(yīng)的歷史特征值;所述下載狀態(tài)可以包括下載完成狀態(tài)和下載取消狀態(tài)。
其中,所述服務(wù)器獲取所述原始歷史下載數(shù)據(jù)的具體過程可以參見上述圖1對應(yīng)實施例中對服務(wù)器2000和運營客戶端集群的描述,這里不再進行贅述。
步驟s103,基于已訓(xùn)練的svm模型計算所述目標特征值對應(yīng)的下載取消概率;
具體的,所述服務(wù)器可將所述目標特征值作為已訓(xùn)練的svm模型的輸入向量,并將所述輸入向量和分類超平面對應(yīng)的法向量進行相乘,并將相乘后的值與分類超平面對應(yīng)的位移項值進行相加,并將相加后的值與所述法向量的模值進行相除,得到所述輸入向量到所述分類超平面之間的目標距離,并基于所述svm模型中的概率轉(zhuǎn)換函數(shù),計算所述目標距離對應(yīng)的下載取消概率。
其中,所述svm模型是根據(jù)多個歷史用戶分別對應(yīng)的關(guān)鍵歷史下載數(shù)據(jù)訓(xùn)練得到,同樣地,各關(guān)鍵歷史下載數(shù)據(jù)均包括下載狀態(tài)以及各關(guān)鍵下載特征類型分別對應(yīng)的歷史特征值;所述下載狀態(tài)包括下載完成狀態(tài)和下載取消狀態(tài)。
其中,所述分類超平面是用于對具有所述下載完成狀態(tài)的關(guān)鍵歷史下載數(shù)據(jù)和具有所述下載取消狀態(tài)的關(guān)鍵歷史下載數(shù)據(jù)進行分類;所述超平面參數(shù)包括:法向量(w)和位移項值(b)。
其中,若下載速度為關(guān)鍵下載特征類型,則每個歷史用戶對應(yīng)的關(guān)鍵歷史下載數(shù)據(jù)中的下載速度的歷史特征值,為各自的下載速度平均值。若下載時長為關(guān)鍵下載特征類型,則每個歷史用戶對應(yīng)的關(guān)鍵歷史下載數(shù)據(jù)中的下載時長的歷史特征值,為各自從下載開始到下載結(jié)束(包括下載完成和下載取消兩種情況)所用總時長。若下載完成比例為關(guān)鍵下載特征類型,則每個歷史用戶對應(yīng)的關(guān)鍵歷史下載數(shù)據(jù)中的下載完成比例的歷史特征值,為各自下載結(jié)束時刻(包括下載完成時刻和下載取消時刻)對應(yīng)的下載進度。
其中,所述概率轉(zhuǎn)換函數(shù)是利用libsvm(libraryforsupportvectormachines,支持向量機庫)中集成的函數(shù)來實現(xiàn)svm模型中距離值和概率值之間的轉(zhuǎn)換。其中,所述libsvm是svm模式識別與回歸的軟件包。
步驟s104,若所述下載取消概率大于預(yù)設(shè)概率閾值,則向所述客戶端推送與所述客戶端的用戶信息對應(yīng)的業(yè)務(wù)數(shù)據(jù)包。
具體的,所述服務(wù)器可獲取所述客戶端中的用戶信息,所述用戶信息可為提取到的客戶端的用戶標識碼(例如,手機終端的手機號碼,電腦終端的ip地址等),并根據(jù)所述用戶標識碼識別所用戶信息是否為新進用戶信息,若所述用戶信息為新進用戶信息,則在所述服務(wù)器檢測到所述下載取消概率大于預(yù)設(shè)概率閾值時,立即向所述客戶端推送與所述新進用戶信息對應(yīng)的業(yè)務(wù)數(shù)據(jù)包;可選地,若所述用戶信息為回流用戶信息,則獲取所述用戶信息的用戶等級、并在所述服務(wù)器檢測到所述下載取消概率大于預(yù)設(shè)概率閾值時,根據(jù)所述用戶等級向所述客戶端推送與所述回流用戶信息對應(yīng)的業(yè)務(wù)數(shù)據(jù)包。
進一步地,請一并參見圖3,是本發(fā)明實施例提供的一種下載界面的示意圖。如圖3所示,所述下載界面100中包含用于下載某網(wǎng)絡(luò)游戲的下載按鈕,還包含在該網(wǎng)絡(luò)游戲的下載業(yè)務(wù)期間,用于顯示下載情況的下載進度條。所述服務(wù)器可以獲取所述客戶端(如圖3所示的手機a)中的用戶信息(例如,該手機a的手機號碼),且所述服務(wù)器可進一步在數(shù)據(jù)庫中查找是否存在與該用戶信息相匹配的歷史用戶信息;若存在,則可將所述用戶信息確定為回流用戶信息,并可進一步獲取所述用戶信息的用戶等級。若手機a在如圖3所示的當前下載進度時向服務(wù)器上報最近一分鐘內(nèi)的平均下載速度(如15kb/s)和該一分鐘內(nèi)的下載完成比例(2%)(其中,平均下載速度和下載完成比例均為關(guān)鍵下載特征類型,15kb/s和2%分別為對應(yīng)的目標特征值),則所述服務(wù)器可以根據(jù)已訓(xùn)練的svm模型計算該目標特征值(即15kb/s和2%)對應(yīng)的下載取消概率為85%。若預(yù)設(shè)概率閾值為80%,則所述下載取消概率大于所述預(yù)設(shè)概率閾值,所述服務(wù)器可以進一步向該手機a推送與所述用戶信息的用戶等級對應(yīng)的業(yè)務(wù)數(shù)據(jù)包,且該業(yè)務(wù)數(shù)據(jù)包可以被展示在如圖3所示的下載進度條上,當下載進度條從當前下載進度加載到業(yè)務(wù)數(shù)據(jù)包所在位置時,用戶即可獲得該業(yè)務(wù)數(shù)據(jù)包中的數(shù)據(jù)內(nèi)容,從而可以降低用戶取消下載的可能性,進而提升業(yè)務(wù)轉(zhuǎn)換率。若預(yù)設(shè)概率閾值為90%,則所述下載取消概率小于所述預(yù)設(shè)概率閾值,此時,所述服務(wù)器不會向手機a推送業(yè)務(wù)數(shù)據(jù)包。
可見,通過提取到的所述客戶端中的用戶標識碼,可將玩家智能地進行歸類,即可將玩家大致分為新進玩家和回流玩家,于是,所述服務(wù)器可為新進玩家和回流玩家分別分配不同的業(yè)務(wù)數(shù)據(jù)包,比如,對于回流玩家,可為玩家推送個性化的輔助下載禮包(例如,藍鉆下載禮包),以有效地引導(dǎo)玩家完成下載,從而提升游戲的業(yè)務(wù)轉(zhuǎn)換率。
本發(fā)明實施例通過在響應(yīng)客戶端發(fā)送的應(yīng)用下載請求時,獲取所述客戶端在下載業(yè)務(wù)期間內(nèi)的與至少一個關(guān)鍵下載特征類型分別對應(yīng)的目標特征值;基于已訓(xùn)練的svm模型計算所述目標特征值對應(yīng)的下載取消概率;所述svm模型是根據(jù)多個歷史用戶分別對應(yīng)的關(guān)鍵歷史下載數(shù)據(jù)訓(xùn)練得到,各關(guān)鍵歷史下載數(shù)據(jù)均包括下載狀態(tài)以及各關(guān)鍵下載特征類型分別對應(yīng)的歷史特征值;若所述下載取消概率大于預(yù)設(shè)概率閾值,則向所述客戶端推送與所述客戶端的用戶信息對應(yīng)的業(yè)務(wù)數(shù)據(jù)包。由此可見,本發(fā)明通過已訓(xùn)練的svm模型對下載業(yè)務(wù)期間內(nèi)的各關(guān)鍵下載特征類型分別對應(yīng)的目標特征值進行計算,可得到所述客戶端的下載取消概率,從而可進一步對該下載業(yè)務(wù)期間內(nèi)的下載情況進行干預(yù),以提升業(yè)務(wù)轉(zhuǎn)換率。
進一步地,請參見圖4,是本發(fā)明實施例提供的另一種數(shù)據(jù)下載處理方法的流程示意圖。如圖4所示,所述方法可以包括:
步驟s201,獲取多個歷史用戶分別對應(yīng)的原始歷史下載數(shù)據(jù),并在各原始歷史下載數(shù)據(jù)所涉及的多個下載特征類型中篩選至少一個關(guān)鍵下載特征類型;
具體的,所述服務(wù)器獲取多個歷史用戶分別對應(yīng)的原始歷史下載數(shù)據(jù),并提取各原始歷史下載數(shù)據(jù)所涉及的多個下載特征類型,并根據(jù)所述多個下載特征類型生成多個待處理特征集合,并計算各待處理特征集合分別對應(yīng)的信息熵增益,并在所述各待處理特征集合分別對應(yīng)的信息熵增益中選擇最大信息熵增益,并將具有所述最大信息熵增益的待處理特征集合中的下載特征類型確定為關(guān)鍵下載特征類型;
其中,所述服務(wù)器可以為上述圖1對應(yīng)實施例中的服務(wù)器2000,且所述服務(wù)器獲取所述原始歷史下載數(shù)據(jù)的具體過程可以參見上述圖1對應(yīng)實施例中對服務(wù)器2000和運營客戶端集群的描述,這里不再進行贅述。
其中,每個原始歷史下載數(shù)據(jù)均包括下載狀態(tài)以及所述多個下載特征類型分別對應(yīng)的歷史特征值;
其中,所述多個下載特征類型可為上述圖1所涉及的下載速度、下載時長、下載完成比例、玩家在游戲內(nèi)的等級、玩家當前進行的視頻播放操作、玩家是否新進、玩家是否回流等特征類型;
其中,所述各待處理特征集合包括至少一個下載特征類型。
進一步地,請參見圖5,是本發(fā)明實施例提供的一種篩選關(guān)鍵下載特征類型的流程示意圖。如圖5所示,所述篩選關(guān)鍵下載特征類型的具體過程包括如下步驟s301-步驟s305,且所述步驟s301-步驟s305是所述步驟s201的一個具體實施例;
步驟s301,獲取多個歷史用戶分別對應(yīng)的原始歷史下載數(shù)據(jù),并提取各原始歷史下載數(shù)據(jù)所涉及的多個下載特征類型;
步驟s302,將各下載特征類型分別添加到對應(yīng)的待處理特征集合,并計算各待處理特征集合分別對應(yīng)的信息熵增益,并在所述各待處理特征集合分別對應(yīng)的信息熵增益中選擇最大信息熵增益,并將具有所述最大信息熵增益的待處理特征集合中的所有下載特征類型確定為最優(yōu)特征類型;
其中,所述各待處理特征集中僅包含一個下載特征類型;
其中,所述信息熵增益的計算公式如下:
其中,所述信息熵定義如公式(1.2)所示:
其中,對于給定數(shù)據(jù)集d(數(shù)據(jù)集d即為多個歷史用戶分別對應(yīng)的原始歷史下載數(shù)據(jù)),假定d中第i類樣本所占的比例為pi(i=1,2),其中第1類樣本是指具有下載完成狀態(tài)的原始歷史下載數(shù)據(jù),第2類樣本是指具有下載取消狀態(tài)的原始歷史下載數(shù)據(jù)。對于待處理特征集合f,可以根據(jù)f中的下載特征類型對應(yīng)的歷史用戶分布情況將d分成了v個子集{d1,d2,…,dv}(例如,若f中的下載特征類型為下載速度,且v為3,則可以將d1確定為下載速度0至20kb/s的子集,將d2確定為下載速度21至100kb/s的子集,d3確定為下載速度大于100kb/s的子集),進而可以計算待處理特征集合f的信息熵增益。
步驟s303,將所述最優(yōu)特征類型分別添加至剩余的下載特征類型分別對應(yīng)的待處理特征集合,得到多個新的待處理特征集合;
其中,所述剩余的下載特征類型是指所述多個下載特征類型中除了所述最優(yōu)特征類型以外的下載特征類型;
s304,當存在至少一個新的待處理特征集合不滿足預(yù)設(shè)的最優(yōu)特征收斂條件時,繼續(xù)在所述多個新的待處理特征集合中確定出新的最優(yōu)特征類型,并繼續(xù)執(zhí)行步驟s303(即對所述新的最優(yōu)特征類型進行添加處理);
具體的,所述服務(wù)器在得到所述多個新的待處理特征集合后,可以進一步將所述多個新的待處理特征集合分別對應(yīng)的信息熵增益中的最大信息熵增益,確定為第一信息熵增益;獲取所述多個新的待處理特征集合對應(yīng)的多個更新前的待處理特征集合,并將所述多個更新前的待處理特征集合分別對應(yīng)的信息熵增益中的最大信息熵增益,確定為第二信息熵增益;判斷所述第一信息熵增益是否小于所述第二信息熵增益;若判斷為是,則確定所述多個新的待處理特征集合均滿足預(yù)設(shè)的最優(yōu)特征收斂條件;若判斷為否,則確定存在至少一個新的待處理特征集合不滿足預(yù)設(shè)的最優(yōu)特征收斂條件。
其中,步驟s303-s304可以重復(fù)執(zhí)行,即每次確定出新的最優(yōu)特征類型后,可將新的最優(yōu)特征類型分別添加至剩余的下載特征類型分別對應(yīng)的待處理特征集合,以生成新的待處理特征集合。比如,以5個下載特征類型(f1,f2,f3,f4,f5)為例,首先可以將5個下載特征類型分別添加到對應(yīng)的待處理特征集合,得到第一輪中的5個待處理特征集合({f1},{f2},{f3},{f4},{f5}),并計算5個待處理特征集合分別對應(yīng)的信息熵增益,若待處理特征集合{f1}對應(yīng)的信息熵增益最大,則第一輪確定的最優(yōu)特征類型為待處理特征集合{f1}中的下載特征類型f1,則可將所述最優(yōu)下載特征類型f1分別添加至剩余的下載特征類型分別對應(yīng)的待處理特征集合,以得到4個新的待處理特征集合{f1,f2},{f1,f3},{f1,f4},{f1,f5}。此時,所述服務(wù)器可進一步根據(jù)上述步驟s302中的信息熵增益的計算公式(1.1)計算這4個新的待處理特征集合分別對應(yīng)的信息熵增益,并在獲得的4個信息熵增益中選擇最大信息熵增益。若在第二輪的4個新的待處理特征集合分別對應(yīng)的信息熵增益中,新的待處理特征集合{f1,f2}對應(yīng)的信息熵增益最大,則可以判斷所述第二輪得到的新的待處理特征集合{f1,f2}的信息熵增益是否小于第一輪得到的待處理特征集合{f1}的信息熵增益;若所述第二輪得到的新的待處理特征集合{f1,f2}的信息熵增益小于所述第一輪得到的待處理特征集合{f1}的信息熵增益(即說明第二輪的4個新的待處理特征集合均滿足預(yù)設(shè)的最優(yōu)特征收斂條件),則所述服務(wù)器可進一步執(zhí)行步驟s305,即將已確定為最優(yōu)特征類型的f1確定為關(guān)鍵下載特征類型;若所述第二輪得到的新的待處理特征集合{f1,f2}的信息熵增益大于或等于所述第一輪得到的待處理特征集合{f1}的信息熵增益(即說明第二輪中存在至少一個新的待處理特征集合不滿足預(yù)設(shè)的最優(yōu)特征收斂條件),則將第二輪中具有最大信息熵增益的新的待處理特征集合{f1,f2}中的下載特征類型f1和f2確定為最優(yōu)特征類型,并基于f1和f2重新執(zhí)行步驟s303,以得到新的待處理集合{f1,f2,f3},{f1,f2,f4},{f1,f2,f5},以此類推,直至多個新的待處理特征集合均滿足預(yù)設(shè)的最優(yōu)特征收斂條件,即下一輪的新的待處理特征集合中的最大信息熵增益小于上一輪的待處理特征集合中的最大信息熵增益。
步驟s305,當所述多個新的待處理特征集合均滿足預(yù)設(shè)的最優(yōu)特征收斂條件時,將已確定出的所述最優(yōu)特征類型確定為關(guān)鍵下載特征類型;
比如,當影響玩家在游戲下載過程中取消下載的因素比較多時,所述服務(wù)器可先將所述多個下載特征類型中的每一個特征類型分別作為一個待處理特征集合,換言之,此時,若所述原始歷史下載數(shù)據(jù)所涉及的多個下載特征類型中有n個下載特征類型,則可形成n個待處理特征集合(例如,{f1},{f2},…,{fn})。此時,所述服務(wù)器可進一步計算這n個待處理特征集合分別對應(yīng)的信息熵增益(所述信息熵增益用于評價各待處理特征集合中的所有下載特征類型是否為最優(yōu)下載特征類型,即信息熵增益越大,則所述待處理特征集合中包含的有助于分類的信息就越有用)。然后所述服務(wù)器可在這n個待處理特征集合分別對應(yīng)的信息熵增益中選擇最大信息熵增益,并將具有所述最大信息熵增益的待處理特征集合中的下載特征類型確定為最優(yōu)下載特征類型(例如{ft},其中,1≤t≤n);隨后,再將所述最優(yōu)下載特征類型分別添加至剩下的n-1個下載特征類型分別對應(yīng)的待處理特征集合,得到可以包含兩個下載特征類型的新的待處理特征集合(此時,所述新的待處理特征集合(例如,{ft,fm},其中,1≤m≤n)的個數(shù)為n-1個),因此,可重復(fù)執(zhí)行上述步驟中對各新的待處理特征集合所對應(yīng)的信息熵增益的計算以及在這n-1個信息熵增益中選擇新的最大熵增益,從而可進一步確定出新的最優(yōu)特征類型(例如,{ft,fs},其中,1≤s≤n)。
鑒于此,當該最優(yōu)特征類型的選擇執(zhí)行到第k+1輪時,且第k+1輪所對應(yīng)的新的待處理特征集合對應(yīng)的最大信息熵增益小于第k輪的新的待處理特征集合對應(yīng)的最大信息熵增益時,所述服務(wù)器將不再繼續(xù)生成新的待處理特征集合,即所述服務(wù)器在篩選到第k+1輪時,可確定在第k+1輪的所述多個新的待處理特征集合已均滿足預(yù)設(shè)的最優(yōu)特征收斂條件,因此,可將第k輪的具有最大信息熵增益的新的待處理特征集合中的所有下載特征類型確定為關(guān)鍵下載特征類型。
步驟s202,將所述各原始歷史下載數(shù)據(jù)中的下載狀態(tài)以及與各關(guān)鍵下載特征類型分別對應(yīng)的歷史特征值,確定為各歷史用戶分別對應(yīng)的關(guān)鍵歷史下載數(shù)據(jù);
其中,所述關(guān)鍵歷史下載數(shù)據(jù)中的各關(guān)鍵下載特征類型是確定不變的,比如,一旦確定下載速度和下載時長為關(guān)鍵下載特征類型,則可將各歷史用戶分別對應(yīng)的各下載速度和下載時長分別對應(yīng)的歷史特征值以及相應(yīng)的下載狀態(tài)確定為關(guān)鍵歷史下載數(shù)據(jù),以便于后續(xù)根據(jù)所述各歷史特征值和下載狀態(tài)訓(xùn)練svm模型;
其中,所述下載狀態(tài)包括下載取消狀態(tài)和下載完成狀態(tài)。
步驟s203,根據(jù)所述各關(guān)鍵歷史下載數(shù)據(jù)訓(xùn)練支持向量機svm模型。
具體的,所述服務(wù)器可將所述各關(guān)鍵歷史下載數(shù)據(jù)中的與各關(guān)鍵下載特征類型分別對應(yīng)的歷史特征值確定為所述svm模型的訓(xùn)練輸入值,并將所述各關(guān)鍵歷史下載數(shù)據(jù)中的下載狀態(tài)確定為所述svm模型的訓(xùn)練輸出值,并根據(jù)所述訓(xùn)練輸入值和所述訓(xùn)練輸出值,計算所述svm模型中的分類超平面對應(yīng)的超平面參數(shù);
其中,所述分類超平面是用于對具有所述下載完成狀態(tài)的關(guān)鍵歷史下載數(shù)據(jù)和具有所述下載取消狀態(tài)的關(guān)鍵歷史下載數(shù)據(jù)進行分類;所述超平面參數(shù)包括:法向量和位移項值。
其中,所述分類超平面的線性方程可以為:
wtx+b=0(1.3)
其中,w=(w1,w2,w3,...,wd)為法向量,決定了所述分類超平面的方向,b為位移項,決定了所述分類超平面與原點之間的距離,顯然,如果確定了ω和b,也就能唯一確定分類超平面,這里用(ω,b)表示這一分類超平面。
其中,獲取所述法向量和位移項值的具體過程可以為:假設(shè)分類超平面(w,b)能將訓(xùn)練樣本正確分類,即對于樣本空間中的任意一個歷史用戶而言,有確定的歷史特征值xi(xi具體為關(guān)鍵歷史下載數(shù)據(jù)中的歷史特征值),以及確定的下載狀態(tài)yi(其中,yi=+1表明歷史用戶為下載完成狀態(tài),相對地,yi=-1表明歷史用戶為下載取消狀態(tài)),因此有(xi,yi)∈d(d為歷史用戶樣本集),且若yi=+1(正類樣本),則有wtxi+b>0;可選地,若yi=-1(負類樣本),則有wtxi+b<0。令
在訓(xùn)練過程中,我們保證距離超平面最近的這幾個訓(xùn)練樣本使式(1.4的等號成立,他們被稱為“支持向量”(supportvertor),兩個異類(正反兩類)支持向量到超平面的距離之和為:
其中,公式(1.5)被稱為“間隔”。
svm的核心思想是找到具有“最大間隔”的劃分超平面,也就是說要找到能滿足公式(1.4)中約束的超平面參數(shù)(w,b),使得公式(1.5)達到最大值,即:
顯然,最大化
公式(1.7)就是svm的基本模型。
對公式(1.7)使用拉格朗日乘子法可得到其“對偶問題”(dualproblem),具體來說,對公式(1.7)的每條約束添加拉格朗日乘子δi≥0,則該問題的拉格朗日函數(shù)可寫為:
對公式(1.8)求解,即得到分類超平面(w,b),具體求解過程可以先轉(zhuǎn)換為其對偶問題,然后采用smo算法求解。
步驟s204,響應(yīng)客戶端發(fā)送的應(yīng)用下載請求;
步驟s205,獲取所述客戶端在下載業(yè)務(wù)期間內(nèi)的與至少一個關(guān)鍵下載特征類型分別對應(yīng)的目標特征值;
步驟s206,基于已訓(xùn)練的svm模型計算所述目標特征值對應(yīng)的下載取消概率;
其中,在所述svm模型中,所述目標距離r的計算公式為:
r=|wtx+b|/|w||;(1.9)
其中,法向量w=(w1,w2,w3,...,wd),且wt為所述法向量的轉(zhuǎn)置向量,另外,所述目標特征值為所述svm模型的輸入向量,即所述客戶端上報的各關(guān)鍵下載特征類型分別對應(yīng)的目標特征值x可作為所述svm模型的輸入向量,于是,可計算所述客戶端的目標特征值到所述分類超平面的目標距離r;隨后,在得到所述目標距離后,可根據(jù)所述svm模型中的概率轉(zhuǎn)換函數(shù),將目標距離轉(zhuǎn)換為對應(yīng)的下載取消概率;
其中,所述概率轉(zhuǎn)換函數(shù),是利用libsvm中集成的函數(shù)來實現(xiàn)svm模型中距離值和概率值之間的轉(zhuǎn)換。其中,所述libsvm是svm模式識別與回歸的軟件包。
步驟s207,若所述下載取消概率大于預(yù)設(shè)概率閾值,則向所述客戶端推送與所述客戶端的用戶信息對應(yīng)的業(yè)務(wù)數(shù)據(jù)包。
其中,所述步驟s204-步驟s207的具體實現(xiàn)方式可參見上述圖2所對應(yīng)實施例中對步驟s101-步驟s104的描述,這里將不再進行贅述。
可選地,在執(zhí)行完步驟s207之后,所述服務(wù)器還可進一步在所述客戶端處于下載完成狀態(tài)或下載取消狀態(tài)時,將所述客戶端對應(yīng)的用戶信息確定為歷史用戶,并將所述目標特征值與所述客戶端對應(yīng)的下載狀態(tài)確定為關(guān)鍵歷史下載數(shù)據(jù)。
比如,以關(guān)鍵下載特征類型為下載速度為例,當用戶a通過客戶端b在3分鐘內(nèi)完成對某網(wǎng)絡(luò)游戲的下載時,可將該客戶端b對應(yīng)的用戶a確定為歷史用戶,并將該客戶端b在整個下載業(yè)務(wù)期間內(nèi)的下載速度平均值作為歷史特征值,隨后,所述服務(wù)器可進一步將客戶端b對應(yīng)的下載完成狀態(tài)和下載速度平均值確定為該歷史用戶的關(guān)鍵歷史下載數(shù)據(jù)。
可選地,所述服務(wù)器還可在模型待更新時長達到預(yù)設(shè)的周期時長時,獲取所述周期時長內(nèi)所記錄的新增的關(guān)鍵歷史下載數(shù)據(jù),并根據(jù)在所述周期時長之前所記錄的關(guān)鍵歷史下載數(shù)據(jù)和所述新增的關(guān)鍵歷史下載數(shù)據(jù),更新所述svm模型的超平面參數(shù),并將所述模型待更新時長清零。
例如,所述svm模型的可以每間隔1天更新一次(即所述周期時長為1天),且所述服務(wù)器統(tǒng)計到所述周期時長內(nèi)(如今天內(nèi))新增了的3個歷史用戶(例如,用戶b、用戶c和用戶d)所對應(yīng)的關(guān)鍵歷史下載數(shù)據(jù),所述服務(wù)器可進一步將所述周期時長之前所記錄的各歷史用戶(例如,100個歷史用戶)分別對應(yīng)的關(guān)鍵歷史下載數(shù)據(jù)和今天新增的3個關(guān)鍵歷史下載數(shù)據(jù)添加到svm模型的樣本計算空間中,即有103個歷史用戶所對應(yīng)的下載狀態(tài)作為所述svm的訓(xùn)練輸出值,且對應(yīng)的有103個歷史用戶所對應(yīng)的歷史特征值作為所述svm模型的訓(xùn)練輸入值,從而可對所述svm模型的超平面參數(shù)進行更新,并在更新完成后即可開始重新統(tǒng)計所述模型待更新時長。
進一步地,請參見圖6,是本發(fā)明實施例提供的一種下載數(shù)據(jù)交互圖。如圖6所示,所述下載數(shù)據(jù)的交互過程主要發(fā)生在如圖6所示的下載器(所述下載器可以位于用戶終端側(cè))和服務(wù)器之間,其中,所述服務(wù)器可以包括數(shù)據(jù)采集器200,預(yù)測模型300,數(shù)據(jù)存儲庫500和禮包下發(fā)器400。其中,如圖6所示,所述下載器可用于實時上報用戶的下載信息數(shù)據(jù)(所述下載信息數(shù)據(jù)為與所述至少一個關(guān)鍵下載特征類型分別對應(yīng)的目標特征值)給所述數(shù)據(jù)采集器200;所述數(shù)據(jù)采集器200可用于接收至少一個下載器分別上傳的下載信息數(shù)據(jù),并將這些下載信息數(shù)據(jù)發(fā)送給預(yù)測模型300,隨后,所述預(yù)測模型300可以基于svm模型計算所述下載信息數(shù)據(jù)對應(yīng)的下載取消概率,并在所述下載取消概率大于預(yù)設(shè)概率閾值時,觸發(fā)所述禮包下發(fā)器400向所述下載器推送禮包。與此同時,所述數(shù)據(jù)采集器200還可同時將處于下載完成狀態(tài)或者下載取消狀態(tài)的用戶的下載信息數(shù)據(jù)確定為關(guān)鍵歷史下載數(shù)據(jù),并將所確定的關(guān)鍵歷史下載數(shù)據(jù)存儲到數(shù)據(jù)存儲庫500,以便于在檢測到模型待更新時長達到所述預(yù)設(shè)的周期時長時,根據(jù)所述數(shù)據(jù)存儲庫500中的所有關(guān)鍵歷史下載數(shù)據(jù),更新所述預(yù)測模型300中的svm模型。
比如,當所述服務(wù)器接收到新的客戶端的下載器所發(fā)送的應(yīng)用下載請求時,可對所述應(yīng)用下載請求做出響應(yīng),此后,所述數(shù)據(jù)采集器200可獲取所述下載器在下載業(yè)務(wù)期間內(nèi)上報的與至少一個關(guān)鍵下載特征類型(例如,下載速度和下載時長)分別對應(yīng)的目標特征值(例如,最近一分鐘內(nèi)的平均下載速度為8kb/s,其中,1分鐘和8kb/s分別為對應(yīng)的目標特征值),因此,所述數(shù)據(jù)采集器200可將最近一分鐘內(nèi)下載速度為8kb/s的目標特征值作為所述預(yù)測模型300中的svm模型的輸入值,從而使得所述預(yù)測模型300基于已訓(xùn)練的svm模型進一步計算該目標特征值(即1分鐘和8kb/s)對應(yīng)的下載取消概率(例如,90%),此時,所述預(yù)測模型300可進一步在所述下載取消概率大于所述預(yù)設(shè)概率閾值(80%)時,通知所述禮包下發(fā)器400向所述下載器推送與所述用戶信息對應(yīng)的業(yè)務(wù)數(shù)據(jù)包。此外,若在所述下載業(yè)務(wù)期間內(nèi),所述下載器接收到用戶對下載界面執(zhí)行的下載取消操作時,所述下載器則可根據(jù)所述下載取消操作關(guān)閉當前下載界面,并將當前下載狀態(tài)調(diào)整為下載取消狀態(tài),并將所述下載取消狀態(tài)上報給所述數(shù)據(jù)采集器200,此時,所述數(shù)據(jù)采集器200可將整個下載業(yè)務(wù)期間內(nèi)的各關(guān)鍵下載特征類型分別對應(yīng)的目標特征值確定為歷史特征值(例如,總共下載了5分鐘,且5分鐘內(nèi)的平均下載速度為6kb/s;其中,5分鐘和6kb/s分別為對應(yīng)的歷史特征值),并將所述下載器對應(yīng)的下載取消狀態(tài)和歷史特征值作為關(guān)鍵歷史下載數(shù)據(jù)存儲至所述存儲數(shù)據(jù)庫500,以便于在檢測到模型待更新時長達到所述預(yù)設(shè)的周期時長時,根據(jù)所述數(shù)據(jù)存儲庫500中的所有關(guān)鍵歷史下載數(shù)據(jù),更新所述預(yù)測模型300中的svm模型。
本發(fā)明實施例通過在響應(yīng)客戶端發(fā)送的應(yīng)用下載請求時,獲取所述客戶端在下載業(yè)務(wù)期間內(nèi)的與至少一個關(guān)鍵下載特征類型分別對應(yīng)的目標特征值;基于已訓(xùn)練的svm模型計算所述目標特征值對應(yīng)的下載取消概率;所述svm模型是根據(jù)多個歷史用戶分別對應(yīng)的關(guān)鍵歷史下載數(shù)據(jù)訓(xùn)練得到,各關(guān)鍵歷史下載數(shù)據(jù)均包括下載狀態(tài)以及各關(guān)鍵下載特征類型分別對應(yīng)的歷史特征值;若所述下載取消概率大于預(yù)設(shè)概率閾值,則向所述客戶端推送與所述客戶端的用戶信息對應(yīng)的業(yè)務(wù)數(shù)據(jù)包。由此可見,本發(fā)明通過已訓(xùn)練的svm模型對下載業(yè)務(wù)期間內(nèi)的各關(guān)鍵下載特征類型分別對應(yīng)的目標特征值進行計算,可得到所述客戶端的下載取消概率,從而可進一步對該下載業(yè)務(wù)期間內(nèi)的下載情況進行干預(yù),以提升業(yè)務(wù)轉(zhuǎn)換率。此外,為避免svm模型的維數(shù)災(zāi)難,在計算下載取消概率的過程中,僅需對該下載業(yè)務(wù)期間內(nèi)的各關(guān)鍵下載特征類型所對應(yīng)的目標特征值進行計算,以最大化的簡化計算量,從而可提高對下載取消概率的計算效率。
進一步地,請參見圖7,是本發(fā)明實施例提供的一種數(shù)據(jù)下載處理裝置的結(jié)構(gòu)示意圖。如圖7所示,所述數(shù)據(jù)下載處理裝置1可應(yīng)用于上述圖1所對應(yīng)實施例中的服務(wù)器2000,所述數(shù)據(jù)下載處理裝置1可以包括:響應(yīng)模塊90,特征值獲取模塊10,取消概率計算模塊20和數(shù)據(jù)包發(fā)送模塊30;
所述響應(yīng)模塊90,用于響應(yīng)客戶端發(fā)送的應(yīng)用下載請求;
所述特征值獲取模塊10,用于若獲取所述客戶端在下載業(yè)務(wù)期間內(nèi)的與至少一個關(guān)鍵下載特征類型分別對應(yīng)的目標特征值;
所述取消概率計算模塊20,用于基于已訓(xùn)練的svm模型計算所述目標特征值對應(yīng)的下載取消概率;所述svm模型是根據(jù)多個歷史用戶分別對應(yīng)的關(guān)鍵歷史下載數(shù)據(jù)訓(xùn)練得到,各關(guān)鍵歷史下載數(shù)據(jù)均包括下載狀態(tài)以及各關(guān)鍵下載特征類型分別對應(yīng)的歷史特征值;
所述數(shù)據(jù)包發(fā)送模塊30,用于若所述下載取消概率大于預(yù)設(shè)概率閾值,則向所述客戶端推送與所述客戶端的用戶信息對應(yīng)的業(yè)務(wù)數(shù)據(jù)包。
其中,所述響應(yīng)模塊90,特征值獲取模塊10,取消概率計算模塊20和數(shù)據(jù)包發(fā)送模塊30的具體實現(xiàn)方式可參見上述圖2所對應(yīng)實施例中對步驟s101-步驟s104的描述,這里將不再進行贅述。
本發(fā)明實施例通過在響應(yīng)客戶端發(fā)送的應(yīng)用下載請求時,獲取所述客戶端在下載業(yè)務(wù)期間內(nèi)的與至少一個關(guān)鍵下載特征類型分別對應(yīng)的目標特征值;基于已訓(xùn)練的svm模型計算所述目標特征值對應(yīng)的下載取消概率;所述svm模型是根據(jù)多個歷史用戶分別對應(yīng)的關(guān)鍵歷史下載數(shù)據(jù)訓(xùn)練得到,各關(guān)鍵歷史下載數(shù)據(jù)均包括下載狀態(tài)以及各關(guān)鍵下載特征類型分別對應(yīng)的歷史特征值;若所述下載取消概率大于預(yù)設(shè)概率閾值,則向所述客戶端推送與所述客戶端的用戶信息對應(yīng)的業(yè)務(wù)數(shù)據(jù)包。由此可見,本發(fā)明通過已訓(xùn)練的svm模型對下載業(yè)務(wù)期間內(nèi)的各關(guān)鍵下載特征類型分別對應(yīng)的目標特征值進行計算,可得到所述客戶端的下載取消概率,從而可進一步對該下載業(yè)務(wù)期間內(nèi)的下載情況進行干預(yù),以提升業(yè)務(wù)轉(zhuǎn)換率。
進一步地,請參見圖8,是本發(fā)明實施例提供的另一種數(shù)據(jù)下載處理裝置的結(jié)構(gòu)示意圖。如圖8所示,所述數(shù)據(jù)下載處理裝置1可應(yīng)用于上述圖1所對應(yīng)實施例中的服務(wù)器2000,所述數(shù)據(jù)下載處理裝置1可以包括上述圖7所對應(yīng)實施例中的所述響應(yīng)模塊90,特征值獲取模塊10,取消概率計算模塊20和數(shù)據(jù)包發(fā)送模塊30,進一步地,所述數(shù)據(jù)下載處理裝置1還可以包括;關(guān)鍵類型篩選模塊40,關(guān)鍵數(shù)據(jù)確定模塊50,模型訓(xùn)練模塊60,歷史數(shù)據(jù)更新模塊70和模型參數(shù)更新模塊80;
所述關(guān)鍵類型篩選模塊40,用于獲取多個歷史用戶分別對應(yīng)的原始歷史下載數(shù)據(jù),并在各原始歷史下載數(shù)據(jù)所涉及的多個下載特征類型中篩選至少一個關(guān)鍵下載特征類型;每個原始歷史下載數(shù)據(jù)均包括下載狀態(tài)以及所述多個下載特征類型分別對應(yīng)的歷史特征值;
所述關(guān)鍵數(shù)據(jù)確定模塊50,用于將所述各原始歷史下載數(shù)據(jù)中的下載狀態(tài)以及與各關(guān)鍵下載特征類型分別對應(yīng)的歷史特征值,確定為各歷史用戶分別對應(yīng)的關(guān)鍵歷史下載數(shù)據(jù);
所述模型訓(xùn)練模塊60,用于根據(jù)所述各關(guān)鍵歷史下載數(shù)據(jù)訓(xùn)練支持向量機svm模型;
其中,所述關(guān)鍵類型篩選模塊40,關(guān)鍵數(shù)據(jù)確定模塊50,模型訓(xùn)練模塊60的具體實現(xiàn)方式可參見上述圖4所對應(yīng)實施例中對步驟s201-步驟s203的描述,這里將不再繼續(xù)進行贅述。
所述歷史數(shù)據(jù)更新模塊70,用于若所述客戶端處于下載完成狀態(tài)或下載取消狀態(tài),則將所述客戶端對應(yīng)的用戶信息確定為歷史用戶,并將所述目標特征值與所述客戶端對應(yīng)的下載狀態(tài)確定為關(guān)鍵歷史下載數(shù)據(jù);
其中,所述歷史數(shù)據(jù)更新模塊70的具體實現(xiàn)方式可參見上述圖4所對應(yīng)實施例中對所述客戶端對應(yīng)的用戶信息的描述,這里將不再繼續(xù)進行贅述。
所述模型參數(shù)更新模塊80,用于若模型待更新時長達到預(yù)設(shè)的周期時長,則獲取所述周期時長內(nèi)所記錄的新增的關(guān)鍵歷史下載數(shù)據(jù),并根據(jù)在所述周期時長之前所記錄的關(guān)鍵歷史下載數(shù)據(jù)和所述新增的關(guān)鍵歷史下載數(shù)據(jù),更新所述svm模型的超平面參數(shù),并將所述模型待更新時長清零;
其中,所述模型參數(shù)更新模塊80的具體實現(xiàn)方式可參見上述圖4所對應(yīng)實施例中對所述新增的關(guān)鍵歷史下載數(shù)據(jù)描述,這里將不再繼續(xù)進行贅述。
進一步地,請參見圖9,是本發(fā)明實施例提供的一種模型訓(xùn)練模塊的結(jié)構(gòu)示意圖。其中,所述下載狀態(tài)包括下載取消狀態(tài)和下載完成狀態(tài)。如圖9所示,所述模型訓(xùn)練模塊60包括:輸入輸出確定單元601和參數(shù)計算單元602;
所述輸入輸出確定單元601,用于所述各關(guān)鍵歷史下載數(shù)據(jù)中的與各關(guān)鍵下載特征類型分別對應(yīng)的歷史特征值確定為所述svm模型的訓(xùn)練輸入值,并將所述各關(guān)鍵歷史下載數(shù)據(jù)中的下載狀態(tài)確定為所述svm模型的訓(xùn)練輸出值;
所述參數(shù)計算單元602,用于根據(jù)所述訓(xùn)練輸入值和所述訓(xùn)練輸出值,計算所述svm模型中的分類超平面對應(yīng)的超平面參數(shù);所述分類超平面是用于對具有所述下載完成狀態(tài)的關(guān)鍵歷史下載數(shù)據(jù)和具有所述下載取消狀態(tài)的關(guān)鍵歷史下載數(shù)據(jù)進行分類;所述超平面參數(shù)包括:法向量和位移項值;
其中,所述輸入輸出確定單元601和參數(shù)計算單元602的具體實現(xiàn)方式可參見上述圖4所對應(yīng)實施例中對步驟s203的描述,這里將不再進行贅述。
進一步地,請參見圖10,是本發(fā)明實施例提供的一種取消概率計算模塊的結(jié)構(gòu)示意圖。如圖10所示,所述取消概率計算模塊20包括:目標距離計算單元201和轉(zhuǎn)換計算單元202;
所述目標距離計算單元201,用于將所述目標特征值作為所述svm模型的輸入向量,并將所述輸入向量和所述法向量進行相乘,并將相乘后的值與所述位移項值進行相加,并將相加后的值與所述法向量的模值進行相除,得到所述輸入向量到所述分類超平面之間的目標距離;
所述轉(zhuǎn)換計算單元202,用于基于所述svm模型中的概率轉(zhuǎn)換函數(shù),計算所述目標距離對應(yīng)的下載取消概率;
其中,所述目標距離計算單元201和轉(zhuǎn)換計算單元202的具體實現(xiàn)方式可參見上述圖2所對應(yīng)實施例中對步驟s103的描述,這里將不再繼續(xù)進行贅述。
進一步地,請參見圖11,是本發(fā)明實施例提供的一種關(guān)鍵類型篩選模塊的結(jié)構(gòu)示意圖。如圖11所示,所述關(guān)鍵類型篩選模塊40包括:獲取提取單元401和選擇確定單元402;
所述獲取提取單元401,用于獲取多個歷史用戶分別對應(yīng)的原始歷史下載數(shù)據(jù),并提取各原始歷史下載數(shù)據(jù)所涉及的多個下載特征類型;
所述選擇確定單元402,用于根據(jù)所述多個下載特征類型生成多個待處理特征集合,并計算各待處理特征集合分別對應(yīng)的信息熵增益,并在所述各待處理特征集合分別對應(yīng)的信息熵增益中選擇最大信息熵增益,并將具有所述最大信息熵增益的待處理特征集合中的下載特征類型確定為關(guān)鍵下載特征類型;所述各待處理特征集合包括至少一個下載特征類型。
其中,所述獲取提取單元401和選擇確定單元402的具體實現(xiàn)方式可參見上述圖4所對應(yīng)實施例中對步驟s201的描述,這里將不再進行贅述。
進一步地,請參見圖12,是本發(fā)明實施例提供的一種選擇確定單元的結(jié)構(gòu)示意圖。如圖12所示,所述選擇確定單元402包括:第一確定子單元4021、添加子單元4022、第三確定子單元4023、判斷子單元4024、通知子單元4025、第二確定子單元4026;
所述第一確定子單元4021,用于將各下載特征類型分別添加到對應(yīng)的待處理特征集合,并計算各待處理特征集合分別對應(yīng)的信息熵增益,并在所述各待處理特征集合分別對應(yīng)的信息熵增益中選擇最大信息熵增益,并將具有所述最大信息熵增益的待處理特征集合中的所有下載特征類型確定為最優(yōu)特征類型;
所述添加子單元4022,用于將所述最優(yōu)特征類型分別添加至剩余的下載特征類型分別對應(yīng)的待處理特征集合,得到多個新的待處理特征集合;所述剩余的下載特征類型是指所述多個下載特征類型中除了所述最優(yōu)特征類型以外的下載特征類型;
所述第三確定子單元4023,用于將所述多個新的待處理特征集合分別對應(yīng)的信息熵增益中的最大信息熵增益,確定為第一信息熵增益;
所述第三確定子單元4023,還用于獲取所述多個新的待處理特征集合對應(yīng)的多個更新前的待處理特征集合,并將所述多個更新前的待處理特征集合分別對應(yīng)的信息熵增益中的最大信息熵增益,確定為第二信息熵增益;
所述判斷子單元4024,用于判斷所述第一信息熵增益是否小于所述第二信息熵增益;
所述第三確定子單元4023,還用于若所述判斷子單元4024判斷為是,則確定所述多個新的待處理特征集合均滿足預(yù)設(shè)的最優(yōu)特征收斂條件;
所述第三確定子單元4023,還用于若所述判斷子單元4024判斷為否,則確定存在至少一個新的待處理特征集合不滿足預(yù)設(shè)的最優(yōu)特征收斂條件。
所述通知子單元4025,用于當存在至少一個新的待處理特征集合不滿足預(yù)設(shè)的最優(yōu)特征收斂條件時,通知所述第一確定子單元4021繼續(xù)在所述多個新的待處理特征集合中確定出新的最優(yōu)特征類型,并通知所述添加子單元4022繼續(xù)對所述新的待處理特征集合進行添加處理;
所述第二確定子單元4026,用于當所述多個新的待處理特征集合均滿足預(yù)設(shè)的最優(yōu)特征收斂條件時,將已確定出的所述最優(yōu)特征類型確定為關(guān)鍵下載特征類型。
其中,所述第一確定子單元4021、所述添加子單元4022、所述第三確定子單元4023、所述判斷子單元4024、所述通知子單元4025、所述第二確定子單元4026的具體實現(xiàn)方式可參見上述圖5所對應(yīng)實施例中對步驟s302-步驟s305的描述,這里將不再繼續(xù)進行贅述。
本發(fā)明實施例通過在響應(yīng)客戶端發(fā)送的應(yīng)用下載請求時,獲取所述客戶端在下載業(yè)務(wù)期間內(nèi)的與至少一個關(guān)鍵下載特征類型分別對應(yīng)的目標特征值;基于已訓(xùn)練的svm模型計算所述目標特征值對應(yīng)的下載取消概率;所述svm模型是根據(jù)多個歷史用戶分別對應(yīng)的關(guān)鍵歷史下載數(shù)據(jù)訓(xùn)練得到,各關(guān)鍵歷史下載數(shù)據(jù)均包括下載狀態(tài)以及各關(guān)鍵下載特征類型分別對應(yīng)的歷史特征值;若所述下載取消概率大于預(yù)設(shè)概率閾值,則向所述客戶端推送與所述客戶端的用戶信息對應(yīng)的業(yè)務(wù)數(shù)據(jù)包。由此可見,本發(fā)明通過已訓(xùn)練的svm模型對下載業(yè)務(wù)期間內(nèi)的各關(guān)鍵下載特征類型分別對應(yīng)的目標特征值進行計算,可得到所述客戶端的下載取消概率,從而可進一步對該下載業(yè)務(wù)期間內(nèi)的下載情況進行干預(yù),以提升業(yè)務(wù)轉(zhuǎn)換率。此外,為避免svm模型的維數(shù)災(zāi)難,在計算下載取消概率的過程中,僅需對該下載業(yè)務(wù)期間內(nèi)的各關(guān)鍵下載特征類型所對應(yīng)的目標特征值進行計算,以最大化的簡化計算量,從而可提高對下載取消概率的計算效率。
進一步地,請參見圖13,是本發(fā)明實施例提供的又一種數(shù)據(jù)下載處理裝置的結(jié)構(gòu)示意圖。如圖13所示,所述數(shù)據(jù)下載處理裝置1000可以應(yīng)用于上述圖1對應(yīng)實施例中的服務(wù)器2000,所述數(shù)據(jù)下載處理裝置1000可以包括:處理器1001,網(wǎng)絡(luò)接口1004和存儲器1004,此外,所述數(shù)據(jù)下載處理裝置1000還可以包括:用戶接口1003,和至少一個通信總線1002。其中,通信總線1002用于實現(xiàn)這些組件之間的連接通信。其中,用戶接口1003可以包括顯示屏(display)、鍵盤(keyboard),可選用戶接口1003還可以包括標準的有線接口、無線接口。網(wǎng)絡(luò)接口1004可選的可以包括標準的有線接口、無線接口(如wi-fi接口)。存儲器1004可以是高速ram存儲器,也可以是非不穩(wěn)定的存儲器(non-volatilememory),例如至少一個磁盤存儲器。存儲器1004可選的還可以是至少一個位于遠離前述處理器1001的存儲裝置。如圖13所示,作為一種計算機存儲介質(zhì)的存儲器1004中可以包括操作系統(tǒng)、網(wǎng)絡(luò)通信模塊、用戶接口模塊以及設(shè)備控制應(yīng)用程序。
在圖13所示的數(shù)據(jù)下載處理裝置1000中,網(wǎng)絡(luò)接口1004可提供網(wǎng)絡(luò)通訊功能;而用戶接口1003主要用于為用戶提供輸入的接口;而處理器1001可以用于調(diào)用存儲器1004中存儲的設(shè)備控制應(yīng)用程序,以實現(xiàn):
響應(yīng)客戶端發(fā)送的應(yīng)用下載請求;
獲取所述客戶端在下載業(yè)務(wù)期間內(nèi)的與至少一個關(guān)鍵下載特征類型分別對應(yīng)的目標特征值;
基于已訓(xùn)練的svm模型計算所述目標特征值對應(yīng)的下載取消概率;所述svm模型是根據(jù)多個歷史用戶分別對應(yīng)的關(guān)鍵歷史下載數(shù)據(jù)訓(xùn)練得到,各關(guān)鍵歷史下載數(shù)據(jù)均包括下載狀態(tài)以及各關(guān)鍵下載特征類型分別對應(yīng)的歷史特征值;
若所述下載取消概率大于預(yù)設(shè)概率閾值,則向所述客戶端推送與所述客戶端的用戶信息對應(yīng)的業(yè)務(wù)數(shù)據(jù)包。
在一個實施例中,所述處理器1001在執(zhí)行所述響應(yīng)客戶端發(fā)送的應(yīng)用下載請求之前,還執(zhí)行以下步驟:
獲取多個歷史用戶分別對應(yīng)的原始歷史下載數(shù)據(jù),并在各原始歷史下載數(shù)據(jù)所涉及的多個下載特征類型中篩選至少一個關(guān)鍵下載特征類型;每個原始歷史下載數(shù)據(jù)均包括下載狀態(tài)以及所述多個下載特征類型分別對應(yīng)的歷史特征值;
將所述各原始歷史下載數(shù)據(jù)中的下載狀態(tài)以及與各關(guān)鍵下載特征類型分別對應(yīng)的歷史特征值,確定為各歷史用戶分別對應(yīng)的關(guān)鍵歷史下載數(shù)據(jù);
根據(jù)所述各關(guān)鍵歷史下載數(shù)據(jù)訓(xùn)練支持向量機svm模型。
在一個實施例中,所述下載狀態(tài)包括下載取消狀態(tài)和下載完成狀態(tài),所述處理器1001在執(zhí)行所述根據(jù)所述各關(guān)鍵歷史下載數(shù)據(jù)訓(xùn)練支持向量機svm模型時,具體執(zhí)行以下步驟:
將所述各關(guān)鍵歷史下載數(shù)據(jù)中的與各關(guān)鍵下載特征類型分別對應(yīng)的歷史特征值確定為所述svm模型的訓(xùn)練輸入值,并將所述各關(guān)鍵歷史下載數(shù)據(jù)中的下載狀態(tài)確定為所述svm模型的訓(xùn)練輸出值;
根據(jù)所述訓(xùn)練輸入值和所述訓(xùn)練輸出值,計算所述svm模型中的分類超平面對應(yīng)的超平面參數(shù);所述分類超平面是用于對具有所述下載完成狀態(tài)的關(guān)鍵歷史下載數(shù)據(jù)和具有所述下載取消狀態(tài)的關(guān)鍵歷史下載數(shù)據(jù)進行分類;所述超平面參數(shù)包括:法向量和位移項值。
在一個實施例中,所述處理器1001在執(zhí)行所述基于已訓(xùn)練的svm模型計算所述目標特征值對應(yīng)的下載取消概率時,具體執(zhí)行以下步驟:
將所述目標特征值作為所述svm模型的輸入向量,并將所述輸入向量和所述法向量進行相乘,并將相乘后的值與所述位移項值進行相加,并將相加后的值與所述法向量的模值進行相除,得到所述輸入向量到所述分類超平面之間的目標距離;
基于所述svm模型中的概率轉(zhuǎn)換函數(shù),計算所述目標距離對應(yīng)的下載取消概率。
在一個實施例中,所述處理器1001,還執(zhí)行以下步驟:
若所述客戶端處于下載完成狀態(tài)或下載取消狀態(tài),則將所述客戶端對應(yīng)的用戶信息確定為歷史用戶,并將所述目標特征值與所述客戶端對應(yīng)的下載狀態(tài)確定為關(guān)鍵歷史下載數(shù)據(jù)。
在一個實施例中,所述處理器1001,還執(zhí)行以下步驟:
若模型待更新時長達到預(yù)設(shè)的周期時長,則獲取所述周期時長內(nèi)所記錄的新增的關(guān)鍵歷史下載數(shù)據(jù),并根據(jù)在所述周期時長之前所記錄的關(guān)鍵歷史下載數(shù)據(jù)和所述新增的關(guān)鍵歷史下載數(shù)據(jù),更新所述svm模型的超平面參數(shù),并將所述模型待更新時長清零。
在一個實施例中,所述處理器1001在執(zhí)行所述獲取多個歷史用戶分別對應(yīng)的原始歷史下載數(shù)據(jù),并在各原始歷史下載數(shù)據(jù)所涉及的多個下載特征類型中篩選至少一個關(guān)鍵下載特征類型時,具體執(zhí)行以下步驟:
獲取多個歷史用戶分別對應(yīng)的原始歷史下載數(shù)據(jù),并提取各原始歷史下載數(shù)據(jù)所涉及的多個下載特征類型;
根據(jù)所述多個下載特征類型生成多個待處理特征集合,并計算各待處理特征集合分別對應(yīng)的信息熵增益,并在所述各待處理特征集合分別對應(yīng)的信息熵增益中選擇最大信息熵增益,并將具有所述最大信息熵增益的待處理特征集合中的下載特征類型確定為關(guān)鍵下載特征類型;所述各待處理特征集合包括至少一個下載特征類型。
在一個實施例中,所述處理器1001在執(zhí)行所述根據(jù)所述多個下載特征類型生成多個待處理特征集合,并計算各待處理特征集合分別對應(yīng)的信息熵增益,并在所述各待處理特征集合分別對應(yīng)的信息熵增益中選擇最大信息熵增益,并將具有所述最大信息熵增益的待處理特征集合中的下載特征類型確定為關(guān)鍵下載特征類型時,具體執(zhí)行以下步驟:
將各下載特征類型分別添加到對應(yīng)的待處理特征集合,并計算各待處理特征集合分別對應(yīng)的信息熵增益,并在所述各待處理特征集合分別對應(yīng)的信息熵增益中選擇最大信息熵增益,并將具有所述最大信息熵增益的待處理特征集合中的所有下載特征類型確定為最優(yōu)特征類型;
將所述最優(yōu)特征類型分別添加至剩余的下載特征類型分別對應(yīng)的待處理特征集合,得到多個新的待處理特征集合;所述剩余的下載特征類型是指所述多個下載特征類型中除了所述最優(yōu)特征類型以外的下載特征類型;
當存在至少一個新的待處理特征集合不滿足預(yù)設(shè)的最優(yōu)特征收斂條件時,繼續(xù)在所述多個新的待處理特征集合中確定出新的最優(yōu)特征類型,并繼續(xù)對所述新的最優(yōu)特征類型進行添加處理;
當所述多個新的待處理特征集合均滿足預(yù)設(shè)的最優(yōu)特征收斂條件時,將已確定出的所述最優(yōu)特征類型確定為關(guān)鍵下載特征類型。
在一個實施例中,所述處理器1001還可以執(zhí)行以下步驟:
將所述多個新的待處理特征集合分別對應(yīng)的信息熵增益中的最大信息熵增益,確定為第一信息熵增益;
獲取所述多個新的待處理特征集合對應(yīng)的多個更新前的待處理特征集合,并將所述多個更新前的待處理特征集合分別對應(yīng)的信息熵增益中的最大信息熵增益,確定為第二信息熵增益;
判斷所述第一信息熵增益是否小于所述第二信息熵增益;
若判斷為是,則確定所述多個新的待處理特征集合均滿足預(yù)設(shè)的最優(yōu)特征收斂條件;
若判斷為否,則確定存在至少一個新的待處理特征集合不滿足預(yù)設(shè)的最優(yōu)特征收斂條件。
本發(fā)明實施例通過在響應(yīng)客戶端發(fā)送的應(yīng)用下載請求時,獲取所述客戶端在下載業(yè)務(wù)期間內(nèi)的與至少一個關(guān)鍵下載特征類型分別對應(yīng)的目標特征值;基于已訓(xùn)練的svm模型計算所述目標特征值對應(yīng)的下載取消概率;所述svm模型是根據(jù)多個歷史用戶分別對應(yīng)的關(guān)鍵歷史下載數(shù)據(jù)訓(xùn)練得到,各關(guān)鍵歷史下載數(shù)據(jù)均包括下載狀態(tài)以及各關(guān)鍵下載特征類型分別對應(yīng)的歷史特征值;若所述下載取消概率大于預(yù)設(shè)概率閾值,則向所述客戶端推送與所述客戶端的用戶信息對應(yīng)的業(yè)務(wù)數(shù)據(jù)包。由此可見,本發(fā)明通過已訓(xùn)練的svm模型對下載業(yè)務(wù)期間內(nèi)的各關(guān)鍵下載特征類型分別對應(yīng)的目標特征值進行計算,可得到所述客戶端的下載取消概率,從而可進一步對該下載業(yè)務(wù)期間內(nèi)的下載情況進行干預(yù),以提升業(yè)務(wù)轉(zhuǎn)換率,與此同時,在下載取消概率的計算過程中,僅需對該下載業(yè)務(wù)期間內(nèi)的各關(guān)鍵下載特征類型進行計算,可最大化的簡化計算量,從而可提高對下載取消概率的計算效率。
此外,這里需要指出的是:本發(fā)明實施例還提供了一種計算機存儲介質(zhì),且所述計算機存儲介質(zhì)中存儲有前文提及的數(shù)據(jù)下載處理裝置1所執(zhí)行的計算機程序,且所述計算機程序包括程序指令,當所述處理器執(zhí)行所述程序指令時,能夠執(zhí)行前文圖2或圖4所對應(yīng)實施例中對所述數(shù)據(jù)下載處理方法的描述,因此,這里將不再進行贅述。另外,對采用相同方法的有益效果描述,也不再進行贅述。對于本發(fā)明所涉及的計算機存儲介質(zhì)實施例中未披露的技術(shù)細節(jié),請參照本發(fā)明方法實施例的描述。
本領(lǐng)域普通技術(shù)人員可以理解實現(xiàn)上述實施例方法中的全部或部分流程,是可以通過計算機程序來指令相關(guān)的硬件來完成,所述的程序可存儲于一計算機可讀取存儲介質(zhì)中,該程序在執(zhí)行時,可包括如上述各方法的實施例的流程。其中,所述的存儲介質(zhì)可為磁碟、光盤、只讀存儲記憶體(read-onlymemory,rom)或隨機存儲記憶體(randomaccessmemory,ram)等。
以上所揭露的僅為本發(fā)明較佳實施例而已,當然不能以此來限定本發(fā)明之權(quán)利范圍,因此依本發(fā)明權(quán)利要求所作的等同變化,仍屬本發(fā)明所涵蓋的范圍。