本發(fā)明涉及通信技術(shù)領(lǐng)域,具體的,涉及一種用戶感知評估方法,以及應(yīng)用該方法的裝置。
背景技術(shù):
隨著移動互聯(lián)網(wǎng)的迅猛發(fā)展,網(wǎng)絡(luò)和業(yè)務(wù)的進(jìn)一步分離,傳統(tǒng)的網(wǎng)絡(luò)kpi指標(biāo)已經(jīng)不能很好的反映客戶真實(shí)感知問題,且往往要通過用戶投訴,才知道網(wǎng)絡(luò)存在4g用戶感知差的情況,如何快速分析出用戶遇到的問題并解決,或在用戶投訴之前就能提前發(fā)現(xiàn)并解決問題。如何建立一套用戶感知評估體系,來實(shí)時掌握用戶的真實(shí)感知情況,成為如今通信網(wǎng)絡(luò)急需解決的問題。
現(xiàn)有的用戶感知評估方法通常采用的信令跟蹤分析、話務(wù)統(tǒng)計分析、測試分析及用戶投訴分析等方法進(jìn)行,沒有綜合性的分析,而且單一的評估方法也都存在效率較低、手段缺失、缺少前瞻性等弊端,不能主動預(yù)測投訴用戶,導(dǎo)致信息反饋慢,用戶體驗(yàn)不佳。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的主要目的是提供一種具有較高的用戶投訴預(yù)測準(zhǔn)確率,并可提高用戶體驗(yàn)度的用戶感知評估方法。
本發(fā)明的另一目的是提供一種具有較高的用戶投訴預(yù)測準(zhǔn)確率,并可提高用戶體驗(yàn)度的用戶感知評估裝置。
為了實(shí)現(xiàn)上述主要目的,本發(fā)明提供的用戶感知評估方法包括:獲取全網(wǎng)用戶的全量運(yùn)營數(shù)據(jù),根據(jù)全量運(yùn)營數(shù)據(jù)對每一個感知事件進(jìn)行預(yù)測建模,獲得每一個感知事件的最佳預(yù)測模型;獲取待評估用戶預(yù)設(shè)時間段內(nèi)的全量運(yùn)營數(shù)據(jù),利用每一個最佳預(yù)測模型對待評估用戶的全量運(yùn)營數(shù)據(jù)進(jìn)行分類預(yù)測,獲得待評估用戶的分類信息。
由上述方案可見,本發(fā)明通過對影響用戶通信體驗(yàn)的感知事件進(jìn)行預(yù)測建模,獲得每一個感知事件對應(yīng)的最佳預(yù)測模型,利用最佳模型對待評估用戶進(jìn)行投訴預(yù)測,獲得待評估用戶的分類信息,即待評估用戶是投訴用戶或非投訴用的的相關(guān)信息。通過用戶感知的評估及用戶投訴的預(yù)測,可以發(fā)現(xiàn)全網(wǎng)中多少用戶存在感知不好及不良可能性,發(fā)現(xiàn)多少基站存在感知問題,可以根據(jù)存在的問題做到對用戶的主動關(guān)懷,對問題基站進(jìn)行網(wǎng)絡(luò)優(yōu)化,提升網(wǎng)絡(luò)質(zhì)量,提升用戶的感知體驗(yàn)。
進(jìn)一步的方案中,獲取全網(wǎng)用戶的全量運(yùn)營數(shù)據(jù),根據(jù)全量運(yùn)營數(shù)據(jù)對每一個感知事件進(jìn)行預(yù)測建模,獲得每一個感知事件的最佳預(yù)測模型,包括:根據(jù)全網(wǎng)用戶的全量運(yùn)營數(shù)據(jù)獲得每一個感知事件所對應(yīng)的所有特征數(shù)據(jù);對每一個感知事件所對應(yīng)的所有特征數(shù)據(jù)進(jìn)行平衡處理及缺省值處理,獲得預(yù)處理后的特征數(shù)據(jù);根據(jù)預(yù)處理后的特征數(shù)據(jù)進(jìn)行模型訓(xùn)練,獲得每一個感知事件的最佳預(yù)測模型。
由此可見,在對感知事件進(jìn)行預(yù)測模型的建立時,通過采用機(jī)器學(xué)習(xí)的方式,從全量的運(yùn)營數(shù)據(jù)中挖掘評估用戶感知,通過對事件及相關(guān)聯(lián)的網(wǎng)絡(luò)指標(biāo)進(jìn)行綜合、全面分析,獲取到最佳的預(yù)測模型,從而提升用戶感知評估的準(zhǔn)確性。
進(jìn)一步的方案中,根據(jù)全網(wǎng)用戶的全量運(yùn)營數(shù)據(jù)獲得每一個感知事件所對應(yīng)的所有特征數(shù)據(jù),包括:以預(yù)設(shè)方式對每一個感知事件進(jìn)行特征數(shù)據(jù)的匯聚。
由此可見,在獲取感知事件所對應(yīng)的特征數(shù)據(jù)時,由于獲取的數(shù)據(jù)大多屬于原始數(shù)據(jù),不能夠直接獲得建立預(yù)測模型的直接變量數(shù)據(jù),需要經(jīng)過處理后才可獲得需要的特征數(shù)據(jù),作為建立預(yù)測模型的直接變量數(shù)據(jù)。
進(jìn)一步的方案中,對每一個感知事件所對應(yīng)的所有特征數(shù)據(jù)進(jìn)行平衡處理及缺省值處理,包括:利用smote算法對特征數(shù)據(jù)進(jìn)行平衡處理;利用平均值填充法對特征數(shù)據(jù)進(jìn)行缺省值處理。
由此可見,由于在預(yù)測模型建立時獲取的特征數(shù)據(jù)中包含了投訴用戶數(shù)據(jù)和非投訴用戶數(shù)據(jù),投訴用戶數(shù)據(jù)占少數(shù),非投訴用戶數(shù)據(jù)占大多數(shù),數(shù)據(jù)間存在較大的差別,使得數(shù)據(jù)極度不平衡,同時存在大量的缺省值。因此,需要對特征數(shù)據(jù)進(jìn)行平衡處理以及缺省值處理,提高數(shù)據(jù)評估的效果。同時,使用smote算法對數(shù)據(jù)進(jìn)行數(shù)據(jù)平衡處理,利用平均值填充法對特征數(shù)據(jù)進(jìn)行缺省值處理,效果更佳。
進(jìn)一步的方案中,獲取待評估用戶預(yù)設(shè)時間段內(nèi)的全量運(yùn)營數(shù)據(jù),利用每一個最佳預(yù)測模型對待評估用戶的全量運(yùn)營數(shù)據(jù)進(jìn)行分類預(yù)測,獲得待評估用戶的分類信息,包括:根據(jù)待評估用戶的全量運(yùn)營數(shù)據(jù)獲取待評估用戶每一個感知事件所對應(yīng)的待評估特征數(shù)據(jù);利用每一個最佳預(yù)測模型對相應(yīng)的感知事件的待評估特征數(shù)據(jù)進(jìn)行評估,獲得待評估用戶的分類信息。
由此可見,利用經(jīng)過驗(yàn)證的最佳預(yù)測模型對待評估用戶進(jìn)行預(yù)測,預(yù)測的準(zhǔn)確性可得到保證,同時利用預(yù)測模型中經(jīng)過優(yōu)化選擇的數(shù)據(jù)處理方式,可提高數(shù)據(jù)的處理速度。
為了實(shí)現(xiàn)上述另一目的,本發(fā)明提供的用戶感知評估裝置包括:模型建立模塊,獲取全網(wǎng)用戶的全量運(yùn)營數(shù)據(jù),根據(jù)全量運(yùn)營數(shù)據(jù)對每一個感知事件進(jìn)行預(yù)測建模,獲得每一個感知事件的最佳預(yù)測模型;預(yù)測模塊,獲取待評估用戶預(yù)設(shè)時間段內(nèi)的全量運(yùn)營數(shù)據(jù),利用每一個最佳預(yù)測模型對待評估用戶的全量運(yùn)營數(shù)據(jù)進(jìn)行分類預(yù)測,獲得待評估用戶的分類信息。
由上述方案可見,本發(fā)明通過對影響用戶通信體驗(yàn)的感知事件進(jìn)行預(yù)測建模,獲得每一個感知事件對應(yīng)的最佳預(yù)測模型,利用最佳模型對待評估用戶進(jìn)行投訴預(yù)測,獲得待評估用戶的分類信息,即待評估用戶是投訴用戶或非投訴用的的相關(guān)信息。通過用戶感知的評估及用戶投訴的預(yù)測,可以發(fā)現(xiàn)全網(wǎng)中多少用戶存在感知不好及不良可能性,發(fā)現(xiàn)多少基站存在感知問題,可以根據(jù)存在的問題做到對用戶的主動關(guān)懷,對問題基站進(jìn)行網(wǎng)絡(luò)優(yōu)化,提升網(wǎng)絡(luò)質(zhì)量,提升用戶的感知體驗(yàn)。
附圖說明
圖1是本發(fā)明用戶感知評估方法實(shí)施例的流程圖。
圖2是本發(fā)明用戶感知評估方法實(shí)施例中獲得每一個感知事件的最佳預(yù)測模型步驟的流程圖。
圖3是本發(fā)明用戶感知評估裝置實(shí)施例的結(jié)構(gòu)框圖。
以下結(jié)合附圖及實(shí)施例對本發(fā)明作進(jìn)一步說明。
具體實(shí)施方式
本發(fā)明的用戶感知評估方法是應(yīng)用于計算機(jī)中的軟件程序,利用4g網(wǎng)絡(luò)用戶的全量運(yùn)營數(shù)據(jù)進(jìn)行建模并預(yù)測待評估用戶的投訴概率,獲得用戶投訴的概率,主動預(yù)測用戶投訴的可能性,便于改善網(wǎng)絡(luò)質(zhì)量,提高提高用戶體驗(yàn)度。其中,本發(fā)明用戶感知評估裝置用于實(shí)現(xiàn)本發(fā)明用戶感知評估方法。
用戶感知評估方法實(shí)施例:
如圖1所示,本發(fā)明的用戶感知評估方法在進(jìn)行用戶投訴預(yù)測時,首先執(zhí)行步驟s1,獲取全網(wǎng)用戶的全量運(yùn)營數(shù)據(jù),根據(jù)全量運(yùn)營數(shù)據(jù)對每一個感知事件進(jìn)行預(yù)測建模,獲得每一個感知事件的最佳預(yù)測模型。其中,感知事件為用戶使用通信網(wǎng)絡(luò)時,會影響用戶感知的一些具體事件或具體現(xiàn)象,本實(shí)施例中,感知事件包括“無信號或信號弱”、“網(wǎng)速慢”、“有信號無法使用”、“掉線”、“應(yīng)用打不開”等感知事件。
獲得每一個感知事件的最佳預(yù)測模型時,先執(zhí)行步驟s11,根據(jù)全網(wǎng)用戶的全量運(yùn)營數(shù)據(jù)獲得每一個感知事件所對應(yīng)的所有特征數(shù)據(jù)。其中,根據(jù)全網(wǎng)用戶的全量運(yùn)營數(shù)據(jù)獲得每一個感知事件所對應(yīng)的所有特征數(shù)據(jù),包括:以預(yù)設(shè)方式對感知事件進(jìn)行特征數(shù)據(jù)的匯聚。預(yù)設(shè)方式是指根據(jù)數(shù)據(jù)類型的不同所采用的不同數(shù)據(jù)處理方式。本實(shí)施例中,在獲取特征數(shù)據(jù)時,預(yù)設(shè)方式是使用均值、方差、分位值、百分比、百分比區(qū)間、topn以及變異系數(shù)等7個維度對用戶全量運(yùn)營數(shù)據(jù)分別處理,以獲得各感知事件對應(yīng)的特征數(shù)據(jù)。
每一個感知事件均有對應(yīng)的特征數(shù)據(jù),特征數(shù)據(jù)可從全網(wǎng)用戶的全量運(yùn)營數(shù)據(jù)中匯聚得到。本實(shí)施例中,用戶的全量運(yùn)營數(shù)據(jù)包含無線測量報告(mr,measurementreport)、無線呼叫詳細(xì)記錄(cdr,calldetailrecord)、無線基礎(chǔ)、計費(fèi)話單、核心網(wǎng)呼叫歷史記錄(chr,callhistoryrecord)和業(yè)務(wù)深度包檢測(dpi,deeppacketinspection)等數(shù)據(jù)。用戶的全量運(yùn)營數(shù)據(jù)中的數(shù)據(jù)為原始數(shù)據(jù),需要根據(jù)特征數(shù)據(jù)的各自的特性獲取特征數(shù)據(jù),使特征數(shù)據(jù)可用于預(yù)測模型的建立。其中,獲取的特征數(shù)據(jù)中包括來自投訴用戶的特征數(shù)據(jù)和非投訴用戶的特征數(shù)據(jù),在獲取的全量運(yùn)營數(shù)據(jù)中,可分別對投訴用戶和非投訴用戶進(jìn)行標(biāo)記,可獲知投訴用戶的特征數(shù)據(jù)和非投訴用戶的特征數(shù)據(jù),有利于在機(jī)器學(xué)習(xí)時進(jìn)行驗(yàn)證。投訴用戶是指已經(jīng)作出投訴通信網(wǎng)絡(luò)的用戶,非投訴用戶是指沒有作出投訴通信網(wǎng)絡(luò)的用戶。
本實(shí)施例中,在獲取“無信號及信號弱”感知事件的特征數(shù)據(jù)時,如下表所示(變量對應(yīng)于感知事件的特征):
在獲得“網(wǎng)速慢”感知事件的特征數(shù)據(jù)時,如下表所示:
在獲得“有信號無法使用”感知事件的特征數(shù)據(jù)時,如下表所示:
在獲得“掉線”感知事件的特征數(shù)據(jù)時,如下表所示:
在獲得“應(yīng)用打不開”感知事件的特征數(shù)據(jù)時,如下表所示:
獲取每一個感知事件所對應(yīng)的特征數(shù)據(jù)后,執(zhí)行步驟s12,對每一個感知事件所對應(yīng)的所有特征數(shù)據(jù)進(jìn)行平衡處理及缺省值處理,獲得預(yù)處理后的特征數(shù)據(jù)。優(yōu)選的,對每一個感知事件所對應(yīng)的所有特征數(shù)據(jù)進(jìn)行平衡處理及缺省值處理,包括:利用smote算法對特征數(shù)據(jù)進(jìn)行平衡處理;利用平均值填充法對特征數(shù)據(jù)進(jìn)行缺省值處理。由于特征數(shù)據(jù)中來自投訴用戶的特征數(shù)據(jù)占少數(shù),非投訴用戶的特征數(shù)據(jù)占大多數(shù),兩者之間數(shù)據(jù)不平衡,同時存在大量的缺省值,不利于預(yù)測模型的構(gòu)建,因此需要進(jìn)行平衡處理以及進(jìn)行缺省值處理。本實(shí)施例中,先對特征數(shù)據(jù)進(jìn)行平衡處理,再對平衡處理后的特征數(shù)據(jù)進(jìn)行缺省值處理。smote算法可以看作是一種特殊的過采樣技術(shù),即把每個樣本看成高維空間的一個點(diǎn),然后用線段連接這個點(diǎn)到某個鄰近的點(diǎn),取線段上的某點(diǎn)作為合成的一個新的點(diǎn)。smote算法通過增加樣本數(shù)據(jù),使得樣本數(shù)據(jù)更加平衡。利用smote算法進(jìn)行數(shù)據(jù)的平衡處理以及利用平均數(shù)填充法進(jìn)行數(shù)據(jù)的缺省值處理是已知的技術(shù),在此不再贅述。
獲得預(yù)處理后的特征數(shù)據(jù)后,執(zhí)行步驟s13,根據(jù)預(yù)處理后的特征數(shù)據(jù)進(jìn)行模型訓(xùn)練,獲得每一個感知事件的最佳預(yù)測模型。獲得預(yù)處理的特征數(shù)據(jù)后,將特征數(shù)據(jù)隨機(jī)分成兩份,一份特征數(shù)據(jù)輸入模型,用來訓(xùn)練模型參數(shù);另一份特征數(shù)據(jù)作為測試集,用來測試訓(xùn)練模型的準(zhǔn)確率。在訓(xùn)練模型參數(shù)時,利用多種分類預(yù)測算法對特征數(shù)據(jù)進(jìn)行訓(xùn)練,獲得最優(yōu)的算法進(jìn)行模型構(gòu)建,從而獲得最佳的預(yù)測模型,其中,最佳預(yù)測模型即最優(yōu)的分類預(yù)測算法。
本實(shí)施例中,根據(jù)特征數(shù)據(jù)的特點(diǎn),分類預(yù)測算法包括邏輯回歸算法、決策樹算法、隨機(jī)森林算法、adaboost算法和k鄰近算法。邏輯回歸算法、決策樹算法、隨機(jī)森林算法、adaboost算法和k鄰近算法是已知算法,在此不再贅述。每一個感知事件對應(yīng)的特征數(shù)據(jù)均需要分別利用上述五種分類預(yù)測算法進(jìn)行分類預(yù)測學(xué)習(xí),從中獲取最優(yōu)的分類預(yù)測算法。通過每一個算法對特征數(shù)據(jù)進(jìn)行分類預(yù)測,獲得預(yù)測分類的數(shù)據(jù),預(yù)測分類的數(shù)據(jù)中存在實(shí)際投訴用戶的數(shù)據(jù)和實(shí)際不投訴用戶的數(shù)據(jù),因此,通過算法分類預(yù)測后獲得的各類別的數(shù)量,如下表所示:
其中,tn表示預(yù)測不投訴且實(shí)際不投訴的用戶數(shù)量;fp表示預(yù)測投訴但實(shí)際不投訴的用戶數(shù)量;fn表示預(yù)測不投訴但實(shí)際投訴的用戶數(shù)量;tp表示預(yù)測投訴且實(shí)際投訴的用戶數(shù)量。
對特征數(shù)據(jù)分類后,分別對每一算法的的分類結(jié)果進(jìn)行分類評估。評估的指標(biāo)包括:精確率、召回率以及綜合評價。精確率是指算法分類預(yù)測出的用戶中實(shí)際投訴用戶的比例,計算公式如下:p=tp/(tp+fp);召回率是指所有實(shí)際投訴用戶被算法預(yù)測出來的比例,計算公式如下:r=tp/(tp+fn);綜合評價是精確率和召回率的調(diào)和均值,計算公式如下:f1=2pr/(p+r)。由于精確率和召回率各自含有的信息都很少,它們對算法的分類效果的觀察角度不同,精確率和召回率均不能單獨(dú)作為評估一種算法分類預(yù)測優(yōu)劣,因此需要加入綜合評價進(jìn)行評估,將綜合評價指標(biāo)最優(yōu)的算法作為最佳的分類預(yù)測算法,進(jìn)而得到最佳預(yù)測模型。獲得最佳預(yù)測模型需要通過分類預(yù)測算法對特征數(shù)據(jù)不斷的學(xué)習(xí)以及驗(yàn)證獲得,最終獲得每一個感知事件的最佳預(yù)測模型。
獲得最佳預(yù)測模型后,執(zhí)行步驟s2,獲取待評估用戶預(yù)設(shè)時間段內(nèi)的全量運(yùn)營數(shù)據(jù),利用每一個最佳預(yù)測模型對待評估用戶的全量運(yùn)營數(shù)據(jù)進(jìn)行分類預(yù)測,獲得待評估用戶的分類信息。其中,預(yù)設(shè)時間段以一周的時間為周期,即獲取預(yù)測日期前一周的全量運(yùn)營數(shù)據(jù)。
獲取待評估用戶預(yù)設(shè)時間段內(nèi)的全量運(yùn)營數(shù)據(jù),利用每一個最佳預(yù)測模型對待評估用戶的全量運(yùn)營數(shù)據(jù)進(jìn)行分類預(yù)測,獲得待評估用戶的分類信息,包括:根據(jù)待評估用戶的全量運(yùn)營數(shù)據(jù)獲取待評估用戶每一個感知事件所對應(yīng)的待評估特征數(shù)據(jù);利用每一個最佳預(yù)測模型對相應(yīng)的感知事件的待評估特征數(shù)據(jù)進(jìn)行評估,獲得待評估用戶的分類信息。
在獲取待評估特征數(shù)據(jù)以及對待評估特征數(shù)據(jù)進(jìn)行平衡處理時,處理的方式可采用構(gòu)建預(yù)測模型時獲取特征數(shù)據(jù)。獲得待評估特征數(shù)據(jù)后,利用最佳預(yù)測模型對待評估用戶進(jìn)行分類預(yù)測,從而獲得待評估用戶的每一個感知事件對應(yīng)的分類信息,從而獲得待評估用戶全部的分類信息。其中,分類信息包括用于表明用戶是否會對該感知事件進(jìn)行投訴的信息。
通過用戶感知的評估及用戶投訴的預(yù)測,可以發(fā)現(xiàn)全網(wǎng)中多少用戶存在感知不好及不良可能性,發(fā)現(xiàn)多少基站存在感知問題,可以根據(jù)存在的問題對用戶的主動關(guān)懷,對問題基站進(jìn)行網(wǎng)絡(luò)優(yōu)化,提升網(wǎng)絡(luò)質(zhì)量,提升用戶感知。
用戶感知評估方裝置實(shí)施例:
如圖2所示,本發(fā)明的用戶感知評估方裝置包括模型建立模塊1和預(yù)測模塊2。
模型建立模塊1用于獲取全網(wǎng)用戶的全量運(yùn)營數(shù)據(jù),根據(jù)全量運(yùn)營數(shù)據(jù)對每一個感知事件進(jìn)行預(yù)測建模,獲得每一個感知事件的最佳預(yù)測模型。其中,感知事件為用戶使用通信網(wǎng)絡(luò)時,會影響用戶感知的一些具體事件或具體現(xiàn)象,本實(shí)施例中,感知事件包括“無信號或信號弱”、“網(wǎng)速慢”、“有信號無法使用”、“掉線”、“應(yīng)用打不開”等感知事件。
模型建立模塊1獲取全網(wǎng)用戶的全量運(yùn)營數(shù)據(jù),根據(jù)全量運(yùn)營數(shù)據(jù)對每一個感知事件進(jìn)行預(yù)測建模,獲得每一個感知事件的最佳預(yù)測模型,包括:根據(jù)全網(wǎng)用戶的全量運(yùn)營數(shù)據(jù)獲得每一個感知事件所對應(yīng)的所有特征數(shù)據(jù);對每一個感知事件所對應(yīng)的所有特征數(shù)據(jù)進(jìn)行平衡處理及缺省值處理,獲得預(yù)處理后的特征數(shù)據(jù);根據(jù)預(yù)處理后的特征數(shù)據(jù)進(jìn)行模型訓(xùn)練,獲得每一個感知事件的最佳預(yù)測模型。
其中,模型建立模塊1根據(jù)全網(wǎng)用戶的全量運(yùn)營數(shù)據(jù)獲得每一個感知事件所對應(yīng)的所有特征數(shù)據(jù),包括:以預(yù)設(shè)方式對感知事件進(jìn)行特征數(shù)據(jù)的匯聚。本實(shí)施例中,在獲取特征數(shù)據(jù)時,預(yù)設(shè)方式是使用均值、方差、分位值、百分比、百分比區(qū)間、topn、以及變異系數(shù)等7個維度對用戶全量運(yùn)營數(shù)據(jù)分別處理,以獲得各感知事件對應(yīng)的特征數(shù)據(jù)。
每一個感知事件均有對應(yīng)的特征數(shù)據(jù),特征數(shù)據(jù)可從全網(wǎng)用戶的全量運(yùn)營數(shù)據(jù)中匯聚得到。本實(shí)施例中,用戶的全量運(yùn)營數(shù)據(jù)包含無線測量報告(mr,measurementreport)、無線呼叫詳細(xì)記錄(cdr,calldetailrecord)、無線基礎(chǔ)、計費(fèi)話單、核心網(wǎng)呼叫歷史記錄(chr,callhistoryrecord)和業(yè)務(wù)深度包檢測(dpi,deeppacketinspection)等數(shù)據(jù)。用戶的全量運(yùn)營數(shù)據(jù)中的數(shù)據(jù)為原始數(shù)據(jù),需要根據(jù)特征數(shù)據(jù)的各自的特性獲取特征數(shù)據(jù),使特征數(shù)據(jù)變量可用于預(yù)測模型的建立。其中,獲取的特征數(shù)據(jù)中包括來自投訴用戶的特征數(shù)據(jù)和非投訴用戶的特征數(shù)據(jù),在獲取的全量運(yùn)營數(shù)據(jù)中,可分別對投訴用戶和非投訴用戶進(jìn)行標(biāo)記,可獲知投訴用戶的特征數(shù)據(jù)和非投訴用戶的特征數(shù)據(jù),有利于在機(jī)器學(xué)習(xí)時進(jìn)行驗(yàn)證。
模型建立模塊1對每一個感知事件所對應(yīng)的所有特征數(shù)據(jù)進(jìn)行平衡處理及缺省值處理,獲得預(yù)處理后的特征數(shù)據(jù)。優(yōu)選的,對每一個感知事件所對應(yīng)的所有特征數(shù)據(jù)進(jìn)行平衡處理及缺省值處理,包括:利用smote算法對特征數(shù)據(jù)進(jìn)行平衡處理;利用平均值填充法對特征數(shù)據(jù)進(jìn)行缺省值處理。由于特征數(shù)據(jù)中來自投訴用戶的特征數(shù)據(jù)占少數(shù),非投訴用戶的特征數(shù)據(jù)占大多數(shù),兩者之間數(shù)據(jù)不平衡,同時存在大量的缺省值,不利于預(yù)測模型的構(gòu)建,因此需要進(jìn)行平衡處理以及進(jìn)行缺省值處理。本實(shí)施例中,先對特征數(shù)據(jù)進(jìn)行平衡處理,再對平衡處理后的特征數(shù)據(jù)進(jìn)行缺省值處理。smote算法可以看作是一種特殊的過采樣技術(shù),即把每個樣本看成高維空間的一個點(diǎn),然后用線段連接這個點(diǎn)到某個鄰近的點(diǎn),取線段上的某點(diǎn)作為合成的一個新的點(diǎn)。smote算法通過增加樣本數(shù)據(jù),使得樣本數(shù)據(jù)更加平衡。通過對特征數(shù)據(jù)的平衡處理,獲得每一個感知事件所對應(yīng)的經(jīng)過平衡處理的特征數(shù)據(jù)。
模型建立模塊1根據(jù)根據(jù)預(yù)處理后的特征數(shù)據(jù)進(jìn)行模型訓(xùn)練,獲得每一個感知事件的最佳預(yù)測模型。模型建立模塊1獲得預(yù)處理的特征數(shù)據(jù)后,將特征數(shù)據(jù)隨機(jī)分成兩份,一份特征數(shù)據(jù)輸入模型,用來訓(xùn)練模型參數(shù);另一份特征數(shù)據(jù)作為測試集,用來測試訓(xùn)練模型的準(zhǔn)確率。模型建立模塊1在獲取訓(xùn)練模型參數(shù)時,利用多種分類預(yù)測算法對特征數(shù)據(jù)進(jìn)行訓(xùn)練,獲得最優(yōu)的算法進(jìn)行模型構(gòu)建,從而獲得最佳的預(yù)測模型,其中,最佳預(yù)測模型即最優(yōu)的分類預(yù)測算法。
本實(shí)施例中,根據(jù)特征數(shù)據(jù)的特點(diǎn),分類預(yù)測算法包括邏輯回歸算法、決策樹算法、隨機(jī)森林算法、adaboost算法和k鄰近算法。每一個感知事件對應(yīng)的特征數(shù)據(jù)均需要分別利用上述五種分類預(yù)測算法進(jìn)行分類預(yù)測學(xué)習(xí),從中獲取最優(yōu)的分類預(yù)測算法。通過每一個算法對特征數(shù)據(jù)進(jìn)行分類預(yù)測,獲得預(yù)測分類的數(shù)據(jù),預(yù)測分類的數(shù)據(jù)中存在實(shí)際投訴用戶的數(shù)據(jù)和實(shí)際不投訴用戶的數(shù)據(jù),因此,通過算法分類預(yù)測后獲得的各類別的數(shù)量,如下表所示:
其中,tn表示預(yù)測不投訴且實(shí)際不投訴的用戶數(shù)量;fp表示預(yù)測投訴但實(shí)際不投訴的用戶數(shù)量;fn表示預(yù)測不投訴但實(shí)際投訴的用戶數(shù)量;tp表示預(yù)測投訴且實(shí)際投訴的用戶數(shù)量。
對特征數(shù)據(jù)分類后,分別對每一算法的的分類結(jié)果進(jìn)行分類評估。評估的指標(biāo)包括:精確率、召回率以及綜合評價。精確率是指算法分類預(yù)測出的用戶中實(shí)際投訴用戶的比例,計算公式如下:p=tp/(tp+fp);召回率是指所有實(shí)際投訴用戶被算法預(yù)測出來的比例,計算公式如下:r=tp/(tp+fn);綜合評價是精確率和召回率的調(diào)和均值,計算公式如下:f1=2pr/(p+r)。由于精確率和召回率各自含有的信息都很少,它們對算法的分類效果的觀察角度不同,精確率和召回率均不能單獨(dú)作為評估一種算法分類預(yù)測優(yōu)劣,因此需要加入綜合評價進(jìn)行評估,將綜合評價指標(biāo)最優(yōu)的算法作為最佳的分類預(yù)測算法,進(jìn)而得到最佳預(yù)測模型。獲得最佳預(yù)測模型需要通過分類預(yù)測算法對特征數(shù)據(jù)不斷的學(xué)習(xí)以及驗(yàn)證獲得,最終獲得每一個感知事件的最佳預(yù)測模型
預(yù)測模塊2用于獲取待評估用戶預(yù)設(shè)時間段內(nèi)的全量運(yùn)營數(shù)據(jù),利用每一個最佳預(yù)測模型對待評估用戶的全量運(yùn)營數(shù)據(jù)進(jìn)行分類預(yù)測,獲得待評估用戶的分類信息。預(yù)測模塊2獲取待評估用戶預(yù)設(shè)時間段內(nèi)的全量運(yùn)營數(shù)據(jù),利用每一個最佳預(yù)測模型對待評估用戶的全量運(yùn)營數(shù)據(jù)進(jìn)行分類預(yù)測,獲得待評估用戶的分類信息,包括:根據(jù)待評估用戶的全量運(yùn)營數(shù)據(jù)獲取待評估用戶每一個感知事件所對應(yīng)的待評估特征數(shù)據(jù);利用每一個最佳預(yù)測模型對相應(yīng)的感知事件的待評估特征數(shù)據(jù)進(jìn)行評估,獲得待評估用戶的分類信息。
預(yù)測模塊2在獲取待評估特征數(shù)據(jù)以及對待評估特征數(shù)據(jù)進(jìn)行平衡處理時,處理的方式可采用構(gòu)建預(yù)測模型時獲取特征數(shù)據(jù)以及對特征數(shù)據(jù)進(jìn)行平衡處理的方式進(jìn)行處理。獲得平衡處理后的待評估特征數(shù)據(jù)后,利用最佳預(yù)測模型對待評估用戶進(jìn)行分類預(yù)測,從而獲得待評估用戶的每一個感知事件對應(yīng)的分類信息,從而獲得待評估用戶全部的分類信息。其中,分類信息包括用于表明用戶是否會對該感知事件進(jìn)行投訴的信息。
由上述可知,本發(fā)明通過對影響用戶通信體驗(yàn)的感知事件進(jìn)行預(yù)測建模,獲得每一個感知事件對應(yīng)的最佳預(yù)測模型,利用最佳模型對待評估用戶進(jìn)行投訴預(yù)測,獲得待評估用戶的分類信息。通過用戶感知的評估及用戶投訴的預(yù)測,可以發(fā)現(xiàn)全網(wǎng)中多少用戶存在感知不好及不良可能性,發(fā)現(xiàn)多少基站存在感知問題,可以根據(jù)存在的問題做到對用戶的主動關(guān)懷,對問題基站進(jìn)行網(wǎng)絡(luò)優(yōu)化,提升網(wǎng)絡(luò)質(zhì)量,提升用戶的感知體驗(yàn)。
需要說明的是,以上僅為本發(fā)明的優(yōu)選實(shí)施例,但發(fā)明的設(shè)計構(gòu)思并不局限于此,凡利用此構(gòu)思對本發(fā)明做出的非實(shí)質(zhì)性修改,也均落入本發(fā)明的保護(hù)范圍之內(nèi)。