本發(fā)明屬通信技術(shù)領(lǐng)域,尤其是涉及一種評估高速鐵路移動用戶使用lte服務(wù)質(zhì)量的方法和系統(tǒng)。
背景技術(shù):
在過去幾年中,lte無線網(wǎng)絡(luò)已經(jīng)越來越普遍,并且引起了專項基礎(chǔ)設(shè)施的大量增加。截至2016年底,全球用戶數(shù)量已達(dá)9.15億,亞洲具有重要推動力。同時,中國高鐵近年來得到高速發(fā)展:2003年第一條線路開通并實現(xiàn)商業(yè)化運(yùn)營,2017年高速鐵路線已建成并投入使用的已達(dá)到二千多公里,占世界總量的三分之一。在2016年運(yùn)送旅客達(dá)15億,使中國成為世界上最繁忙的鐵路網(wǎng)絡(luò)。考慮到這種特殊環(huán)境(高速且特定路線),移動運(yùn)營商為高鐵沿線配置了專網(wǎng)小區(qū)(高鐵小區(qū))來保障高速移動用戶的通信體驗。
通過提供在任何地點(diǎn)和任何時間訪問網(wǎng)絡(luò)的可能性,lte無線網(wǎng)絡(luò)的發(fā)展為客戶提供了新的通信方式。由于過去幾年的投資,網(wǎng)絡(luò)已經(jīng)實現(xiàn)普及性。運(yùn)營商提供了一些專門的基礎(chǔ)設(shè)施來滿足用戶的特殊需求。其中一個需求是當(dāng)用戶乘坐高速移動的高鐵上時,可以不掉話、不掉網(wǎng)的在通信世界遨游。在這種特殊環(huán)境下,運(yùn)營商必須建立特殊的小區(qū)以保障良好的信號質(zhì)量。小區(qū)數(shù)量可根據(jù)高鐵客運(yùn)量及高鐵線長度按需分配,隨之而來的一個關(guān)鍵問題是評估高鐵小區(qū)的使用情況。
在中國專利文獻(xiàn)cn105636104a中,公開了移動通信網(wǎng)絡(luò)中高速移動用戶通話識別的方法,該方法包括:根據(jù)高速移動用戶組服務(wù)小區(qū)列表小區(qū),確定高鐵/高速/國道/城市環(huán)路/城市高架沿線非服務(wù)小區(qū)列表小區(qū)的范圍;過濾用戶信令數(shù)據(jù),保留屬于高速移動用戶組服務(wù)小區(qū)列表小區(qū)及高鐵/高速/國道/城市環(huán)路/城市高架沿線非服務(wù)小區(qū)列表小區(qū)的用戶信令數(shù)據(jù);對過濾后的用戶信令數(shù)據(jù)進(jìn)行分析,確定所述用戶信令數(shù)據(jù)對應(yīng)的用戶是否屬于高速移動用戶。
上述專利文獻(xiàn)中公開的方案并不能有效監(jiān)測高鐵小區(qū)的服務(wù)質(zhì)量。該網(wǎng)絡(luò)質(zhì)量評估的方法是分析使用該高鐵小區(qū)網(wǎng)絡(luò)的用戶網(wǎng)絡(luò)質(zhì)量指標(biāo),并不區(qū)分用戶的類型。而在高鐵沿線小區(qū)的情況下,該方法不能正確的評估出網(wǎng)絡(luò)質(zhì)量,因為存在著高鐵用戶使用大網(wǎng)小區(qū),大網(wǎng)用戶使用高鐵小區(qū)的情況。
技術(shù)實現(xiàn)要素:
本發(fā)明要解決的問題是提供一種有效區(qū)分使用高鐵小區(qū)網(wǎng)絡(luò)的大網(wǎng)用戶和使用大網(wǎng)小區(qū)網(wǎng)絡(luò)的高鐵用戶,進(jìn)而可以有效監(jiān)控高鐵沿線的高鐵小區(qū)和大網(wǎng)小區(qū),評估高速鐵路移動用戶使用lte服務(wù)質(zhì)量的方法。
為解決上述技術(shù)方案,本發(fā)明采用的技術(shù)方案是:該評估高速鐵路移動用戶使用lte服務(wù)質(zhì)量的方法,包括以下步驟:
步驟(1):收集高鐵線路周邊的高鐵小區(qū)信息,根據(jù)獲得的高鐵小區(qū)信息得到附近1公里范圍內(nèi)的大網(wǎng)小區(qū);同時,收集用戶信令切換數(shù)據(jù);
步驟(2):針對收集到用戶信令切換數(shù)據(jù)進(jìn)行分類,區(qū)分高鐵用戶和大網(wǎng)用戶;
步驟(3):針對每個用戶的信令切換數(shù)據(jù)進(jìn)行提取特征指標(biāo),建立模型;
步驟(4):將得到的新用戶信令切換數(shù)據(jù)導(dǎo)入所述步驟(3)建立的模型中,進(jìn)行判定該新用戶的分類。
在本發(fā)明中,需要特別解釋的是,高鐵小區(qū)是指移動運(yùn)營商在高鐵沿線專門用于高鐵用戶使用的小區(qū);大網(wǎng)小區(qū)是指非高鐵小區(qū)的其他小區(qū),通常為大網(wǎng)用戶即非高鐵用戶提供服務(wù)。同樣的,高鐵用戶是乘坐高鐵的用戶,而大網(wǎng)用戶則是指網(wǎng)絡(luò)中的任何其他客戶。
在步驟(1)中,對于小區(qū)信息數(shù)據(jù),首先收集位于當(dāng)前高鐵線路周邊的高鐵小區(qū),對于每個高鐵小區(qū),可以獲得小區(qū)的經(jīng)緯度,接著根據(jù)經(jīng)緯度得到附近1公里內(nèi)的大網(wǎng)小區(qū),這樣就獲得了目標(biāo)小區(qū)信息,每個小區(qū)包含經(jīng)緯度以及標(biāo)記為是否高鐵小區(qū)的二元變量;對于用戶信令切換數(shù)據(jù),需確定特定日期下連接目標(biāo)小區(qū)的所有用戶,通過imsi(國際移動用戶身份)和imei(國際移動設(shè)備身份識別碼)唯一化用戶,這樣就得到了用戶使用小區(qū)網(wǎng)絡(luò)的列表,時間精確到秒,由于連接網(wǎng)絡(luò)的不規(guī)則性,收集到的數(shù)據(jù)也不會固定在某個特定時間內(nèi),用戶信令切換數(shù)據(jù)包含用戶信令切換信息以及相應(yīng)的時間標(biāo)識;在步驟(2)中,針對收集到用戶信令切換數(shù)據(jù)進(jìn)行分類,目的是為了得到一些樣本數(shù)據(jù)的明確標(biāo)簽:高鐵用戶或大網(wǎng)用戶;這是非常重要的,鑒別出使用高鐵小區(qū)網(wǎng)絡(luò)的大網(wǎng)用戶,這部分人的比例應(yīng)該足夠低以防止高鐵小區(qū)的超負(fù)荷連接,鑒別出使用大網(wǎng)小區(qū)網(wǎng)絡(luò)的高鐵用戶,這種情況會導(dǎo)致高鐵用戶上網(wǎng)體驗的下降,這種下降是由高鐵小區(qū)和大網(wǎng)小區(qū)信號的快速切換導(dǎo)致的,此外,需要注意的是,步驟(2)中的將數(shù)據(jù)進(jìn)行分類,是從原始數(shù)據(jù)中抽取出部分用戶數(shù)據(jù)進(jìn)行人為分類;依據(jù)步驟(3)創(chuàng)建提取相關(guān)指標(biāo)后,使用分類算法對樣本數(shù)據(jù)進(jìn)行分析建模,提取能夠顯著區(qū)分高鐵用戶和大網(wǎng)用戶的特征指標(biāo);模型結(jié)果用于預(yù)測每個用戶的分類。通過鑒別用戶中的高鐵用戶,可以有效監(jiān)控高鐵沿線的高鐵小區(qū)和大網(wǎng)小區(qū),一旦模型訓(xùn)練好后將自動執(zhí)行。因此,移動運(yùn)營商可以為每種類型的小區(qū)制定調(diào)整和開發(fā)的策略。以這種方式,可以顯著提高高鐵沿線小區(qū)的服務(wù)性能。
優(yōu)選的,在所述步驟(2)中,將分類的數(shù)據(jù)集分成兩部分,隨機(jī)抽取80%用戶為訓(xùn)練集,剩下的20%用戶為驗證集;在所述步驟(3)中的模型建立后,采用訓(xùn)練集對模型進(jìn)行訓(xùn)練,接著在訓(xùn)練集和驗證集上同時測試。
結(jié)果顯示,該模型可以高效的區(qū)分出高鐵用戶及大網(wǎng)用戶:在訓(xùn)練集上,準(zhǔn)確率達(dá)到99%;在驗證集上,準(zhǔn)確率為98%;每個新用戶可以通過該模型提取的重要特征指標(biāo)進(jìn)行分類;上述操作確保結(jié)果的可靠性。
優(yōu)選的,在所述步驟(3)中,所述特征指標(biāo)包括用戶的移動速度。
優(yōu)選的,在所述步驟(3)中,所述特征指標(biāo)還包括有用戶高鐵小區(qū)與大網(wǎng)小區(qū)切換信息、移動距離、連接大網(wǎng)小區(qū)的總次數(shù)、連接高鐵小區(qū)的總次數(shù)、高鐵小區(qū)連接次數(shù)占比和用戶連接到大網(wǎng)小區(qū)的數(shù)目。
優(yōu)選的,該方法還包括有步驟(5),匯總出包含高鐵用戶連接的高鐵小區(qū)以及連接的時間;匯總出包含大網(wǎng)用戶占用高鐵小區(qū)網(wǎng)絡(luò)以及時間;匯總出高鐵用戶從高鐵小區(qū)切換到大網(wǎng)小區(qū)信息,其中,包含連接小區(qū)的類型以及時間;匯總出大網(wǎng)用戶從大網(wǎng)小區(qū)到高鐵小區(qū)的切換;匯總出每天大網(wǎng)小區(qū)和高鐵小區(qū)的信息。
對于匯總出高鐵用戶從高鐵小區(qū)切換到大網(wǎng)小區(qū)信息,其中,包含連接小區(qū)的類型以及時間,切換較頻繁的高鐵小區(qū),需要對小區(qū)進(jìn)行天線調(diào)整或者增加高鐵小區(qū)的建立;匯總出每天大網(wǎng)小區(qū)和高鐵小區(qū)的信息包括高鐵專網(wǎng)用戶的數(shù)量、高鐵用戶至少連接到一個大網(wǎng)小區(qū)的比例、大網(wǎng)用戶連接至少一個高鐵小區(qū)的比例,強(qiáng)調(diào)了服務(wù)性能的演變,反映了季節(jié)性變化和全網(wǎng)的改善。
本發(fā)明要解決的另一個問題是,提供一種評估高速鐵路移動用戶使用lte服務(wù)質(zhì)量的系統(tǒng)。
該估高速鐵路移動用戶使用lte服務(wù)質(zhì)量的系統(tǒng)包括有數(shù)據(jù)收集模塊、數(shù)據(jù)分類模塊、數(shù)據(jù)處理模塊和結(jié)果導(dǎo)出模塊;
其中,所述數(shù)據(jù)收集模塊:用于接收高鐵線路周邊的高鐵小區(qū)信息,并根據(jù)獲得的高鐵小區(qū)信息得到附近1公里范圍內(nèi)的大網(wǎng)小區(qū);同時,收集高鐵用戶和大網(wǎng)用戶的信令切換數(shù)據(jù);
數(shù)據(jù)分類模塊:用于將數(shù)據(jù)收集模塊中收集到的部分用戶信息加以人工分類,區(qū)分出哪些用戶是高鐵用戶,哪些用戶是大網(wǎng)用戶,并提取特征指標(biāo),建立分類模型;
數(shù)據(jù)處理模塊:將得到的新用戶信令切換數(shù)據(jù)導(dǎo)入,進(jìn)行判定該新用戶的分類;
優(yōu)選的,該系統(tǒng)還包括有數(shù)據(jù)結(jié)果導(dǎo)出模塊,用于展示高鐵小區(qū)或大網(wǎng)小區(qū)服務(wù)質(zhì)量的量化指標(biāo)。
附圖說明
下面結(jié)合附圖和本發(fā)明的實施方式進(jìn)一步詳細(xì)說明:
圖1為本發(fā)明評估高速鐵路移動用戶使用lte服務(wù)質(zhì)量的系統(tǒng)的模型訓(xùn)練流程圖;
圖2為本發(fā)明評估高速鐵路移動用戶使用lte服務(wù)質(zhì)量的系統(tǒng)的產(chǎn)品化的流程圖;
圖3顯示了高鐵沿線分布的高鐵小區(qū)及非高鐵小區(qū),基于經(jīng)緯度的小區(qū)打點(diǎn);
圖4a、4b、4c和4d說明了用戶在一定時間內(nèi)使用高鐵沿線的專網(wǎng)大網(wǎng)小區(qū)情況,其中,圖4a顯示出了高鐵用戶僅連接到專網(wǎng)小區(qū)的示例圖,圖4b顯示出了高鐵用戶連接到一些大網(wǎng)小區(qū)的示例圖,圖4c顯示出了非高鐵用戶連接到大網(wǎng)小區(qū)的示例圖,圖4d顯示出了非高鐵用戶連接到高鐵小區(qū)的示例圖;
圖5是本發(fā)明評估高速鐵路移動用戶使用lte服務(wù)質(zhì)量的系統(tǒng)結(jié)構(gòu)示意圖;
圖6是本發(fā)明評估高速鐵路移動用戶使用lte服務(wù)質(zhì)量的方法的流程圖。
具體實施方式
本發(fā)明實施例的評估高速鐵路移動用戶使用lte服務(wù)質(zhì)量的方法,如圖6所示,包括以下步驟:
步驟(1):收集高鐵線路周邊的高鐵小區(qū)信息,根據(jù)獲得的高鐵小區(qū)信息得到附近1公里范圍內(nèi)的大網(wǎng)小區(qū);同時,收集用戶信令切換數(shù)據(jù);
步驟(2):針對收集到用戶信令切換數(shù)據(jù)進(jìn)行分類,區(qū)分高鐵用戶和大網(wǎng)用戶;
步驟(3):針對每個用戶的信令切換數(shù)據(jù)進(jìn)行提取特征指標(biāo),建立模型;
步驟(4):將得到的新用戶信令切換數(shù)據(jù)導(dǎo)入所述步驟(3)建立的模型中,進(jìn)行判定該新用戶的分類。
在所述步驟(2)中,將分類的數(shù)據(jù)集分成兩部分,隨機(jī)抽取80%用戶為訓(xùn)練集,剩下的20%用戶為驗證集;在所述步驟(3)中的模型建立后,采用訓(xùn)練集對模型進(jìn)行訓(xùn)練,接著在訓(xùn)練集和驗證集上同時測試。
在所述步驟(3)中,所述特征指標(biāo)包括用戶的移動速度。
在所述步驟(3)中,所述特征指標(biāo)還包括有用戶高鐵小區(qū)與大網(wǎng)小區(qū)切換信息、移動距離、連接大網(wǎng)小區(qū)的總次數(shù)、連接高鐵小區(qū)的總次數(shù)、高鐵小區(qū)連接次數(shù)占比和用戶連接到大網(wǎng)小區(qū)的數(shù)目。
該方法還包括有步驟(5),匯總出包含高鐵用戶連接的高鐵小區(qū)以及連接的時間;匯總出包含大網(wǎng)用戶占用高鐵小區(qū)網(wǎng)絡(luò)以及時間;匯總出高鐵用戶從高鐵小區(qū)切換到大網(wǎng)小區(qū)信息,其中,包含連接小區(qū)的類型以及時間;匯總出大網(wǎng)用戶從大網(wǎng)小區(qū)到高鐵小區(qū)的切換;匯總出每天大網(wǎng)小區(qū)和高鐵小區(qū)的信息。
評估高速鐵路移動用戶使用lte服務(wù)質(zhì)量的方法主要目的是從高鐵小區(qū)基站收集的信令切換數(shù)據(jù)中對高鐵專網(wǎng)用戶和大網(wǎng)用戶進(jìn)行分類,進(jìn)而從該分類中評估高鐵小區(qū)服務(wù)質(zhì)量。有兩點(diǎn)很重要:1、需要鑒別出使用高鐵小區(qū)網(wǎng)絡(luò)的大網(wǎng)用戶,這部分人的比例應(yīng)該足夠低以防止高鐵小區(qū)的超負(fù)荷連接;2、鑒別出使用大網(wǎng)小區(qū)網(wǎng)絡(luò)的高鐵用戶,這種情況會導(dǎo)致高鐵用戶上網(wǎng)體驗的下降,這種下降是由高鐵小區(qū)和大網(wǎng)小區(qū)信號的快速切換導(dǎo)致的。
基于高鐵小區(qū)及距離高鐵沿線1公里內(nèi)的大網(wǎng)小區(qū)的信令數(shù)據(jù),利用各小區(qū)經(jīng)緯度信息提取用戶級指標(biāo),運(yùn)用分類算法得到高鐵用戶及非高鐵用戶。
具體過程有兩個主要階段:模型訓(xùn)練階段和產(chǎn)品化階段。
模型訓(xùn)練階段主要是建立分類模型,該階段可詳見圖1。簡而言之,我們首先收集有關(guān)高鐵線路周圍的小區(qū)的信息。從這些信息中可得到高鐵線路圖。同時,收集用戶的信令切換數(shù)據(jù),該數(shù)據(jù)可推出高鐵用戶及高鐵周邊大網(wǎng)用戶的網(wǎng)絡(luò)連接行為,樣例圖詳見4a,4b,4c和4d;在做分類模型前,需要手動的區(qū)分高鐵用戶和大網(wǎng)用戶,創(chuàng)建信號切換速度等行為特征指標(biāo)。最后,選擇合適的分類算法鑒別兩種用戶。
產(chǎn)品階段(生產(chǎn)階段)的目的是實現(xiàn)代碼運(yùn)行及結(jié)果輸出的自動化,流程圖詳見圖2。對于訓(xùn)練階段,從數(shù)據(jù)中提取用戶行為特征指標(biāo)。,利用分類算法區(qū)分高鐵用戶和大網(wǎng)用戶,最后,通過總結(jié)用戶使用小區(qū)網(wǎng)絡(luò)的情況來評估小區(qū)的服務(wù)質(zhì)量。
下面詳細(xì)闡述流程圖:
由于整個過程是對相關(guān)數(shù)據(jù)進(jìn)行分析挖掘,因此第一步是要得到原始數(shù)據(jù)。首先確定高鐵線和日期。接著收集兩份數(shù)據(jù),一份是小區(qū)信息數(shù)據(jù):該線路高鐵小區(qū)及1公里內(nèi)的大網(wǎng)小區(qū)數(shù)據(jù),另一份是用戶數(shù)據(jù):包含使用這些小區(qū)網(wǎng)絡(luò)用戶的信令切換數(shù)據(jù)。
對于小區(qū)信息數(shù)據(jù),首先收集位于當(dāng)前高鐵線的高鐵小區(qū),對于每個高鐵小區(qū),可以獲得小區(qū)的經(jīng)緯度。接著根據(jù)經(jīng)緯度得到附近1公里內(nèi)的大網(wǎng)小區(qū)。這樣就獲得了目標(biāo)小區(qū)信息,每個小區(qū)包含經(jīng)緯度以及標(biāo)記為是否高鐵小區(qū)的二元變量。
對于用戶數(shù)據(jù),需確定特定日期下連接目標(biāo)小區(qū)的所有用戶,通過imsi(國際移動用戶身份)和imei(國際移動設(shè)備身份識別碼)唯一化用戶。這樣就得到了用戶使用小區(qū)網(wǎng)絡(luò)的列表,時間精確到秒。由于連接網(wǎng)絡(luò)的不規(guī)則性,收集到的數(shù)據(jù)也不會固定在某個特定時間內(nèi)。用戶數(shù)據(jù)包含用戶信令切換信息以及相應(yīng)的時間標(biāo)識。
舉例說明數(shù)據(jù)量大小,例如:一個高鐵線上的高鐵小區(qū)有50個,1公里范圍內(nèi)的大網(wǎng)小區(qū)有450個。連接這些網(wǎng)絡(luò)的用戶數(shù)量可達(dá)到100萬,280萬條信令切換信息。
第二步旨在根據(jù)高鐵小區(qū)經(jīng)緯度信息刻畫出高鐵線。利用主成分分析方法對小區(qū)經(jīng)緯度信息進(jìn)行合適的旋轉(zhuǎn),接著通過廣義加性模型(gam)刻畫出高鐵線路。當(dāng)列車線呈現(xiàn)垂直方向,即從北向南或南向北時,空間的旋轉(zhuǎn)是必要的。該過程的示例結(jié)果詳見圖3。紅點(diǎn)表示高鐵小區(qū);黑色曲線代表高鐵路線;藍(lán)點(diǎn)表示距高鐵小區(qū)1公里內(nèi)的大網(wǎng)小區(qū)。從高鐵線路可推測出每個小區(qū)之間和高鐵線路距離,進(jìn)而推導(dǎo)出目標(biāo)小區(qū)和高鐵出發(fā)站之間的距離。
第三步是創(chuàng)建模型數(shù)據(jù)集。該數(shù)據(jù)集是在用戶數(shù)據(jù)的基礎(chǔ)上增加了兩列數(shù)據(jù):第一列是標(biāo)記小區(qū)是高鐵小區(qū)還是大網(wǎng)小區(qū);第二列是對應(yīng)小區(qū)離高鐵出發(fā)站的距離(單位:公里)。
在模型訓(xùn)練階段,需要對用戶當(dāng)天在高鐵線小區(qū)的時間及小區(qū)距離進(jìn)行可視化呈現(xiàn)。實踐中,只畫出了部分用戶的信息圖。圖4a,4b,4c,4d是4個典型用戶的小區(qū)移動圖。每個點(diǎn)表示用戶和小區(qū)之間發(fā)生網(wǎng)絡(luò)連接,紅色為高鐵小區(qū),黑色為大網(wǎng)小區(qū)。
在模型訓(xùn)練階段需要人工對用戶分類,目的是為了得到一些樣本數(shù)據(jù)的明確標(biāo)簽:高鐵用戶或大網(wǎng)用戶。創(chuàng)建提取相關(guān)指標(biāo)后,使用分類算法對樣本數(shù)據(jù)進(jìn)行分析建模,提取能夠顯著區(qū)分高鐵用戶和大網(wǎng)用戶的特征指標(biāo)。用戶的人工分類依據(jù)如下圖形表現(xiàn):若用戶快速的從一個基站移動到另一個基站,則標(biāo)記為高鐵用戶(圖4a,4b),反之標(biāo)記為大網(wǎng)用戶(圖4c,4d)。對用戶人工分類可以把一切可能影響分類結(jié)果的情形考慮在內(nèi)。
例如,從100萬個用戶中選擇4000個用戶進(jìn)行人工分類。
特征提取是模型訓(xùn)練階段和產(chǎn)品階段共同的一個環(huán)節(jié)。在做此步驟之前,每個用戶都會有信令切換時間及切換小區(qū)離高鐵出發(fā)站的距離信息,且時間是不規(guī)則的。做完特征提取后,每個用戶的小區(qū)切換信息、移動速度、移動距離都可以用固定的時間來表達(dá)。
其中特征較重要的是用戶的移動速度,移動速度根據(jù)小區(qū)離高鐵出發(fā)站距離及切換至該小區(qū)網(wǎng)絡(luò)的時間與出發(fā)時間計算所得。但若計算瞬時速度的話可達(dá)600km/h,詳見圖4c(12點(diǎn)前)。為了避免這種情況發(fā)生,考慮計算用戶在不同時間段的平均速度。具體可以計算一天內(nèi)特定持續(xù)時間段(例如30分鐘)的用戶最大移動距離。在本系統(tǒng)中,用如下時間段來計算最大移動距離:1秒,5秒,25秒,2分鐘,10分鐘,15分鐘,20分鐘,25分鐘,30分鐘,35分鐘,40分鐘,45分鐘,50分鐘,55分鐘,1小時,4小時,24小時。
對于每個用戶,還可以創(chuàng)建跟小區(qū)數(shù)相關(guān)的特征變量,這些附加特征包括但不限于:(a)連接小區(qū)的總次數(shù);(b)連接到高鐵小區(qū)的總次數(shù);(c)定義高鐵小區(qū)連接次數(shù)占比(a)/(b);(d)用戶連接到小區(qū)的數(shù)目(1個小區(qū)有多次連接只計數(shù)一次)。
提取所有特征指標(biāo)后,每個用戶有21個特征指標(biāo)。
接下來的步驟專注于建立模型(該步驟僅在模型訓(xùn)練階段中執(zhí)行)。該模型需在特征指標(biāo)基礎(chǔ)上預(yù)測用戶是高鐵用戶還是大網(wǎng)用戶。而這一問題是典型的分類問題,實現(xiàn)流程是:(1)特征提?。缓?2)用戶是高鐵用戶還是大網(wǎng)用戶。這個流程適合人工分類后的數(shù)據(jù)集,模型可在該數(shù)據(jù)集上進(jìn)行訓(xùn)練。在機(jī)器學(xué)習(xí)領(lǐng)域,已有很多成熟的分類算法,其中一個較簡單的算法是隨機(jī)森林,可以在分類的同時提取出重要的特征變量。
為了確保結(jié)果的可靠性,將人工分類的數(shù)據(jù)集分成兩部分:隨機(jī)抽取80%用戶為訓(xùn)練集;剩下的20%用戶為驗證集。用訓(xùn)練集對模型進(jìn)行訓(xùn)練,接著在訓(xùn)練集和驗證集上同時測試。結(jié)果顯示,該模型可以高效的區(qū)分出高鐵用戶及大網(wǎng)用戶:在訓(xùn)練集上,準(zhǔn)確率達(dá)到99%;在驗證集上,準(zhǔn)確率為98%。每個新用戶可以通過該模型提取的重要特征指標(biāo)進(jìn)行分類。
在產(chǎn)品化階段,模型結(jié)果用于預(yù)測每個用戶的分類。如模型訓(xùn)練階段,需要獲取小區(qū)信息數(shù)據(jù)以及用戶數(shù)據(jù),接著創(chuàng)建特征指標(biāo),利用模型篩選出的重要特征指標(biāo)預(yù)測用戶是高鐵用戶還是大網(wǎng)用戶。
最后一步是得到5個匯總表格。每個表格能夠得到小區(qū)服務(wù)質(zhì)量的關(guān)鍵指標(biāo)。這些表每天都會更新。
表一用于評估高鐵小區(qū)的服務(wù)質(zhì)量。該表包含高鐵用戶連接的高鐵小區(qū)(以及連接的時間);第二個表含有大網(wǎng)用戶占用高鐵小區(qū)網(wǎng)絡(luò)以及時間;表三和表四主要展示高鐵小區(qū)和大網(wǎng)小區(qū)的切換情形。第三張表是高鐵用戶連接網(wǎng)絡(luò)的情況,每一行包含高鐵用戶從高鐵小區(qū)切換到大網(wǎng)小區(qū)信息,包含連接小區(qū)的類型以及時間。對于切換較頻繁的高鐵小區(qū),需要對小區(qū)進(jìn)行天線調(diào)整或者增加高鐵小區(qū)的建立。第四張表列出了大網(wǎng)用戶從大網(wǎng)小區(qū)到高鐵專網(wǎng)小區(qū)的切換;表五粗略的給出了每天小區(qū)的匯總信息:高鐵專網(wǎng)用戶的數(shù)量;高鐵用戶至少連接到一個大網(wǎng)小區(qū)的比例;大網(wǎng)用戶連接至少一個高鐵小區(qū)的比例。該表強(qiáng)調(diào)了服務(wù)性能的演變,反映了季節(jié)性變化和全網(wǎng)的改善。
如圖5所示,評估高速鐵路移動用戶使用lte服務(wù)質(zhì)量的系統(tǒng)包括有數(shù)據(jù)收集模塊、數(shù)據(jù)分類模塊、數(shù)據(jù)處理模塊;
其中,所述數(shù)據(jù)收集模塊:用于接收高鐵線路周邊的高鐵小區(qū)信息,并根據(jù)獲得的高鐵小區(qū)信息得到附近1公里范圍內(nèi)的大網(wǎng)小區(qū);同時,收集高鐵用戶和大網(wǎng)用戶的信令切換數(shù)據(jù);
數(shù)據(jù)分類模塊:用于將數(shù)據(jù)收集模塊中收集到的部分用戶信息加以人工分類,區(qū)分出哪些用戶是高鐵用戶,哪些用戶是大網(wǎng)用戶,并提取特征指標(biāo),建立分類模型;
數(shù)據(jù)處理模塊:將得到的新用戶信令切換數(shù)據(jù)導(dǎo)入,進(jìn)行判定該新用戶的分類;
該系統(tǒng)還包括有數(shù)據(jù)結(jié)果導(dǎo)出模塊,用于展示高鐵小區(qū)或大網(wǎng)小區(qū)服務(wù)質(zhì)量的量化指標(biāo)。
總體而言,該系統(tǒng)對高鐵專網(wǎng)小區(qū)的lte的服務(wù)性能進(jìn)行了穩(wěn)定的評估。通過鑒別用戶中的高鐵用戶,可以有效監(jiān)控高鐵沿線的高鐵小區(qū)和大網(wǎng)小區(qū)。采用機(jī)器學(xué)習(xí)算法可以有效地區(qū)分高鐵用戶和大網(wǎng)用戶。整個產(chǎn)品過程完全是數(shù)據(jù)驅(qū)動的,一旦模型訓(xùn)練好后將自動執(zhí)行。因此,移動運(yùn)營商可以為每種類型的小區(qū)制定調(diào)整和開發(fā)的策略。以這種方式,可以顯著提高高鐵沿線小區(qū)的服務(wù)性能。
以上所述的具體實施例,對本發(fā)明的目的、技術(shù)方案和有益效果進(jìn)行了進(jìn)一步詳細(xì)說明,所應(yīng)理解的是,以上所述僅為本發(fā)明的具體實施例而已,并不用于限制本發(fā)明;凡在本發(fā)明的精神和原則之內(nèi),所做的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。