基于大數據統(tǒng)計模型的無線網絡話務量預測方法
【專利摘要】本發(fā)明公開了一種基于大數據統(tǒng)計模型的無線網絡話務量預測方法,在無線網絡中給定的一個小區(qū)中,無線網絡話務量的預測可以通過將每一個話務測量值根據網絡話務特征和移動用戶行為特征分解為相應的趨勢分量T(t)、季節(jié)性分量S(t)、突發(fā)分量B以及隨機誤差分量R,對各自分量的內在特征進行解析,各自預測后,最后通過公式X(t)=(1+B(t))×(T(t)+S(t)+R(t))重新組合還原成整體的預測值。本發(fā)明利用大數據的真實樣本剖析出每個話務測量值的組成部分,將傳統(tǒng)話務預測的測量值進行了更小粒度的分解,從而揭示了每個話務歷史測量值分解過后的子特征,利用大數據技術,將海量歷史數據利用合適的數據挖掘和機器學習算法,挖掘出無線網絡的話務特征,從而為網絡話務評估和預測提供了一整套系統(tǒng)化,準確率高的解決方案體系。
【專利說明】基于大數據統(tǒng)計模型的無線網絡話務量預測方法
【技術領域】
[0001]本發(fā)明屬于移動通訊領域,特別涉及一種基于大數據統(tǒng)計模型的無線網絡話務量預測方法。
【背景技術】
[0002]移動數據業(yè)務和智能終端的指數增長給移動運營商帶來了大量的新用戶和收入。然而,眾所周知的是,無線網絡容量是一種有限的資源,其面臨著流量和服務需求增長兩大挑戰(zhàn)。如今,數據海嘯和信令風暴正以壓倒性地趨勢吞噬著無線網絡資源。為了防止資源被無限制的消耗,這就需要運營商適當地調整容量管理策略來滿足不斷增加的網絡容量需求。無線網絡的容量是指滿足所有的語音、數據和信令流量的各種資源。無線網絡容量管理是一種保證無線網絡被正確地分配從而滿足流量需求和盡可能的以一種最有效的方式來利用網絡資源的過程。網絡容量管理需要考慮現有和未來的需求,如網絡運營商的商業(yè)運營目標、網絡KP1、服務質量,及最終網絡提供的應用和服務的盈利能力。
[0003]由于移動數據海嘯,在過去幾年中移動運營商在不同程度上都出現了網絡負荷過載的現象。然而,移動運營商不可能無限投資去擴大網絡規(guī)模。傳統(tǒng)的基于業(yè)務流量增長的網絡資源規(guī)劃方法,并沒有解決擴大網絡容量和資本支出之間的矛盾。在智能手機出現之前,網絡應用只有語音和簡單的數據服務,設備運行在一個相對單一的模式下。在這單一的服務模式下,網絡在一段時間內是穩(wěn)定的。在預測網絡容量時,移動運營商通常專注于無線網絡中的總流量,同時也考慮覆蓋和干擾的問題。盡管如此,智能終端帶來了大量無法預測的變化,如無法簡單量化的信令流量、并發(fā)連接進行的各種新的應用或每一個數據應用連接所產生的數據流量變化。
[0004]傳統(tǒng)的無線容量規(guī)劃方法只考慮到一個主要因素——用戶數量。用一個通用的函數來表示的話,就是未來需求的容量=目前容量+正比于用戶增長產生的容量。由于多元化業(yè)務模式的智能手機和用戶行為,未來需求的容量需考慮增加用戶識別和服務多樣性等因素。因此,引進一種新維度的公式,未來需求的容量=目前容量+正比于用戶增長產生的容量+多元化的智能手機行為和業(yè)務增長的容量。
[0005]因此,運營商需要一個科學的方法來預測網絡資源和規(guī)劃網絡容量。該方法需要考慮到流量模型中的動態(tài)變化,即用戶數量變化、智能手機用戶行為和服務模式。本文介紹了一種基于業(yè)務測量和服務趨勢的數據分析和建模評估LTE網絡容量的系統(tǒng)方法。該方法目的在于解決兩個主要問題:
首先,這種方法能夠預測流量模型中由于多元化的服務模式和用戶行為引起的動態(tài)變化。這種動態(tài)變化會引起網絡流量變化,最終影響網絡容量。此外,容量在端到端的網絡設備資源支持下,其物理閾值(上限和下限)是由不同業(yè)務多樣化的服務和設備有效利用網絡軟、硬件的能力所決定的?;谙嚓P參數的流量模型可以代表網絡流量的統(tǒng)計特征和網絡資源。智能手機上多種服務給流量模型帶來了動態(tài)變化,這將最終影響3G和LTE網絡容量評估的精確性。如果不能準確計算的網絡閾值可能會導致網絡中斷或服務性能下降。[0006]第二,該方法能以自動調優(yōu)的辦法來計算網絡容量,反映業(yè)務模型中的動態(tài)變化。該方法應該是一個持續(xù)循環(huán)式的學習過程,以識別網絡容量管理的弊端,并執(zhí)行精確的網絡規(guī)劃。該模型基本上回答了兩個問題:什么時候網絡容量需要被增加?如何用節(jié)約成本的方式實現擴容?
無線網絡性能、服務質量和容量管理在學術界和工業(yè)界已被許多人做了研究。2G、3G或LTE網絡的現有研究都是由各種模擬方法執(zhí)行的。
[0007]基于模擬的方法研究3GUMTS網絡性能和服務質量在學術界得到了公認。Shiao-LiTsaoet.Al.(2002)利用模擬的方法設計和評估了三種可能的UMTS-WLAN互通策略。即移動IP方法、網關方法和基于當前UMTS、WLAN和移動IP規(guī)格的模擬方法。SZlovencsak(2002)提出了一個類樹型的UMTS地面網,他們開發(fā)了兩種類型的啟發(fā)式算法,以確保在這種網絡拓撲中較低的流量損失。其中一個算法通過修改樹的拓撲結構解決了這個問題,而另一個通過插入額外鏈接拓展網絡。他們的方法展示了如何在現實網絡場景中找到一個折衷的方法來實現拓撲結構優(yōu)化和網絡擴展。Khan et.al.(2012)提出了一種新的用于低比特率和分辨率(QCIF)的H.264編碼的視頻,這種基于內容的、非侵入式的質量體驗預測模型,同樣適應UMTS網絡。他們認為視頻應用在UMTS網絡下的成功很大程度上取決于滿足用戶的QoE要求。因此用它來預測并控制視頻質量來滿足用戶的QoE要求是非??扇〉?。在研究中,他們通過NS2進行了仿真驗證了該自適應方案的有效性,特別是在UMTS接入網絡中,這是一個瓶頸。Navaie, K.和Sharafat,A.(2003)進行了一種在上行和下行空中接口容量的分析。他們定義一個服務的最大并發(fā)用戶數為公認容量,并以此和并發(fā)用戶數定義出網絡總負荷的函數。大量案例研究將上述方案輸出的結果和網絡仿真的結果進行了比較,比較結果證明了在網絡設計和規(guī)劃中此方案的準確性和實用性。
[0008]從UMTS到LTE,模擬仿真被認為是最典型的研究網絡性能、質量和容量相關問題的平滑過渡的方法。下 面是一些基于仿真的算法和工具來探討LTE網絡性能、服務質量和容量使用的研究。例如,Ikuno J.C.et Al。(2010)進行了系統(tǒng)級LTE網絡仿真。LTE系統(tǒng)級模擬器在Matlab中提供了評估LTE SISO下行共享信道,和使用了開環(huán)空間復用的MMO網絡以及傳輸多樣性模式。Ouyang, Ye (2012)在LTE網絡的SI接口上進行仿真分析研究了吞吐量的行為,其網絡結構和拓撲是通過Opnet連接的。一些不同的流量場景被仿真去探索SI接口的流量行為。Engels,A.(2013)提出了一個關于LTE多層網絡優(yōu)化的自適應權衡性能指標的方法。其引入低干擾近似模型,這些相關優(yōu)化問題被編碼成混合整型線性程序并嵌入到一個自組織網絡操作和優(yōu)化框架中。這個優(yōu)化過程考慮了時變優(yōu)化參數自動適應對網絡的變化?;诖硇苑抡娴难芯空撟C了我們整體概念的適應性和潛在價值。Amzallag, D.et.al.(2013)研究LTE小區(qū)選擇流程來確定小區(qū)向每個移動臺提供服務。他們提出了兩種不同的小區(qū)選擇的算法,第一個算法給出(Ι-r)近似解,一個移動臺可以被多個基站同時覆蓋。第二個算法給出了 l_r / 2 近似解,而每一個移動臺最多被一個基站覆蓋。仿真結果表明,相比當前小區(qū)選擇算法,該算法提升近20%的網絡使用能力。
[0009]據上所述,事實證明,這一領域大多采用仿真建模進行研究分析。然而,由于大數據方法變得可用,它提供了一個機會從另一個方面去研究這個問題,而不再是模擬仿真。
[0010]首先仿真建模在無線網絡問題分析,大數據分析至少有兩大優(yōu)勢。
[0011]大數據分析利用真實的測量數據而不是模擬仿真數據或假設場景來研究無線網絡的一個特定的問題。測量數據從網絡側或用戶側真實量化反映了網絡和用戶的行為,一旦有個合適的分析算法能夠描述這個抽象的網絡現象,我們就有理由相信這個分析結果更加可靠和值得信賴。這些測量的數據中還隱藏著許多未知的無線網絡問題。電信大數據數據分析的目標是挖掘無線網絡的數據關系,揭示隱藏的數據背后的事實。
[0012]大數據分析通常是監(jiān)督學習(也可以非監(jiān)督式)或后學習過程,使用實測數據來推斷數據背后的某種模式,以合理的方式來揭示出未見過情況。大數據分析方法與傳統(tǒng)仿真方法相比,最大區(qū)別是大數據分析方法采用真實數據來揭示無線網絡隱藏的問題,而不是假設場景模擬。我們也承認有時模擬仿真也應用真實數據來分析抽象網絡問題,但這并不能完全替代上述大數據分析方法在研究網絡性能、容量、服務質量問題中的兩大優(yōu)勢。
【發(fā)明內容】
[0013]本發(fā)明的目的是提供一種基于大數據統(tǒng)計模型的無線網絡話務量預測方法。
[0014]為了實現上述目的,本發(fā)明采用以下技術方案:一種基于大數據統(tǒng)計模型的無線網絡話務量預測方法,在無線網絡中給定的一個小區(qū)中,無線網絡話務量的預測方法包括以下步驟:
1)趨勢分量T(t)的預測:
11)建立趨勢分量T(t)預測模型:
將獲取的無線網絡話務量歷史數據的測量時間序列分成m份,每段長度為η天,取置信度為95%,如果趨勢分量歷史數據呈現正態(tài)分布,確定其邊界為u-2o和u + 2σ,來排除離群異常值;分段考慮每段上的數據,將每一段的起始無線網絡話務量歷史數據Xk和斜率Slopek擬合為一條直線,在擬合過程中,保證每相鄰兩條擬合曲線首尾連續(xù),將無線網絡話務量歷史數據作為訓練樣本進行建模,獲得趨勢分量T (t)預測模型:
_ =(I);
12)斜率Slopek的修正:
如果最近連續(xù)N個斜率不小于零,那么第Ν+1的斜率不應小于零,修正后斜率由下式表示:
K = Max\Kr+i , y min (Aj.,Aj-_2, ^y-λ'+ιΒ (2),
其中Z是可調節(jié)的,直到一個最佳常數時候使得真實值與擬合值的差距達到最??;
13)趨勢分量的預測:
采用趨勢分量的預測模型獲得趨勢分量的預測值;
2)季節(jié)性分量S(t)的預測:
21)確定周期長度1:
設L是獲取的無線網絡話務量歷史數據的時間序列長度,周期長度i=l~L/2,i分為j份,對于i=l,2...L/2,按下式計算出各i值下關于j的方差和值:
σ? m麵=53(3);
M
對于i=l,2,3…L/2,假設P為i內每段的采樣點數目,定義p=L/i,構建P個樣本數據集,每個樣本數據集包含P中相同位置q上的所有樣本,按下式計算出每個P的方差的和:
【權利要求】
1.一種基于大數據統(tǒng)計模型的無線網絡話務量預測方法,其特征在于在無線網絡中給定的一個小區(qū)中,無線網絡話務量的預測方法包括以下步驟: 1)趨勢分量T(t)的預測: 11)建立趨勢分量T(t)預測模型: 將獲取的無線網絡話務量歷史數據的測量時間序列分成m份,每段長度為η天,取置信度為95%,如果趨勢分量歷史數據呈現正態(tài)分布,確定其邊界為u-2o和u + 2σ,來排除離群異常值;分段考慮每段上的數據,將每一段的起始無線網絡話務量歷史數據Xk和斜率Slopek擬合為一條直線,在擬合過程中,保證每相鄰兩條擬合曲線首尾連續(xù),將無線網絡話務量歷史數據作為訓練樣本進行建模,獲得趨勢分量T (t)預測模型:
2.根據權利要求1所述的基于大數據統(tǒng)計模型的無線網絡話務量預測方法,其特征在于:所述建立趨勢分量T (t)預測模型中異常值的排除,首先判斷歷史數據樣本集是否呈現正態(tài)分布,如果通過正態(tài)分布的檢驗,采用正態(tài)分布的邊界來排除異常值;如果時間序列不符合正態(tài)分布,采用四分位差法排除異常值。
【文檔編號】H04W16/22GK103987056SQ201410238066
【公開日】2014年8月13日 申請日期:2014年5月30日 優(yōu)先權日:2014年5月30日
【發(fā)明者】吳冬華, 程艷云, 閆興秀 申請人:南京華蘇科技有限公司