本發(fā)明屬于無線通信網(wǎng)絡技術領域,涉及一種用戶分布的空域流量特征提取方法。
背景技術:
在無線蜂窩網(wǎng)絡中,SINR統(tǒng)計量對網(wǎng)絡性能相關的研究至關重要,接收信號和干擾的強度非常依賴網(wǎng)絡的集合特性,即發(fā)送方和接收方的相對位置,因此,空間中的流量特性對網(wǎng)絡性能產(chǎn)生著直接的影響。
在無線蜂窩網(wǎng)絡中,時域的流量建模已經(jīng)開展過很多研究,而對空域中的流量建模研究較少,空域中的流量主要反映為用戶的空間分布。已有研究將從運營上處獲得的基站分布和用戶的數(shù)據(jù)進行擬合,通過分析擬合后的閉合表達式,發(fā)現(xiàn)現(xiàn)實部署的基站和用戶在一定程度上服從泊松分布。因此,結合隨機幾何和泊松過程對用戶分布進行流量建模具有一定的合理性。
有研究指出時域中的流量模型可以看作空域中的流量模型在一維空間中的一個特例。空域中的流量模型與時域中的流量模型具有一定相似性,以時域一維過程為例:若采用“區(qū)間技術”的方法,將整個時域或空域劃分為一個個小窗口,對每個小窗口中的點進行計數(shù),理論上窗口內(nèi)點的個數(shù)都應該服從泊松分布,這是一種基于密度的指標,找到合適的窗口大小對流量的準確建模是十分重要的。若采用時域內(nèi)兩個鄰居節(jié)點的距離進行建模也是一種可行的方案。而在空域中,由于各點之間沒有類似于時域內(nèi)各點之間的明確順序關系。因此針對空域內(nèi)這種基于距離的建模方法還有待探索??沼蛄髁拷5那疤崾菍沼蛄髁繕颖镜奶卣魈崛?,用合理的特征來區(qū)分不同的空間流量形態(tài)。
技術實現(xiàn)要素:
本發(fā)明的目的在于提出一種考慮用戶分布的空域流量特征提取方法,旨在有效地捕捉用戶在空間中成簇分布的特征,在保證計算復雜度低的同時提高特征提取的準確性,為流量形態(tài)分類任務提供前期保證。
為實現(xiàn)上述技術目的,本發(fā)明的技術方案是,
一種考慮用戶分布的空域流量特征提取方法,包括以下步驟:
S1基于已有的流量形態(tài)分布建立XOY二維平面坐標系,獲取1600*1600平面區(qū)域內(nèi)的用戶坐標。
S2采用網(wǎng)格劃分的方法對1600*1600平面區(qū)域進行N*N區(qū)域劃分,統(tǒng)計每個網(wǎng)格區(qū)間內(nèi)的用戶個數(shù),并將其存入矩陣a(N,N)。
S3對矩陣a(N,N)內(nèi)各參數(shù)采用滑動窗口進行單位重疊滑動提取特征,并將新的特征存入矩陣b(N-1,N-1)。
S4將更新的矩陣b(N-1,N-1)內(nèi)各參數(shù)作為每個樣例新的流量形態(tài)分布特征,并對所有樣例進行無監(jiān)督分類。
S5取各類的類中心表征一類流量模式,獲取基站部署狀態(tài),并將其帶入到各類類內(nèi)所有樣例中,測試每個樣例的用戶覆蓋率。
優(yōu)選地,本發(fā)明S2的具體方法為:對1600*1600平面區(qū)域進行N*N網(wǎng)格劃分,則單位網(wǎng)格寬度為1600/N;將每個用戶的X、Y坐標同時除以1600/N并進行向上取整;基于取整后的X,Y坐標統(tǒng)計位于第i行第j列網(wǎng)格的用戶個數(shù),并將其存入矩陣a(N,N)中的a(i,j)中,矩陣a(N,N)的大小為N*N,則矩陣a(N,N)內(nèi)各參數(shù)直觀反映了用戶流量形態(tài)的空域分布特征。
優(yōu)選地,本發(fā)明S3中采用滑動窗口進行單位重疊滑動提取特征按如下步驟進行:首先,采用2*2的單元滑動窗口對矩陣a(N,N)統(tǒng)計的用戶分布的空域流量特征進行單位重疊滑動,再對單元滑動窗口內(nèi)的用戶總數(shù)進行求和計數(shù),并將其存于矩陣b(N-1,N-1),該過程可通過以下運算實現(xiàn):
b(i,j)=a(i,j)+a(i+1,j)+a(i,j+1)+a(i+1,j+1)
顯然,經(jīng)滑動窗口提取的特征數(shù)較直接經(jīng)單元網(wǎng)格提取的特征數(shù)要少2N-1個。
優(yōu)選地,本發(fā)明S4中采用經(jīng)典的K均值算法對所有樣例進行無監(jiān)督分類,具體通過如下步驟實現(xiàn):
S41為確定最佳聚類數(shù),對代價函數(shù)J(K)進行統(tǒng)計分析,并根據(jù)肘部法則,找到代價函數(shù)曲線的拐點即為最佳聚類個數(shù)。其中,代價函數(shù)J(K)表示每個樣例到其所屬類內(nèi)質(zhì)心的距離平方和。
本發(fā)明主要目的為了測試特征提取方法的優(yōu)效性,為了使得測試數(shù)據(jù)更加全面準確,本發(fā)明選取的最佳K值是拐點處的某個區(qū)間,這里使得K={6,8,10,12}。
S42在確定的最佳K值區(qū)間下,采用滑動窗口提取的流量分布空域特征表征訓練樣例,再對訓練樣例進行K均值聚類。其實現(xiàn)原理主要是根據(jù)訓練樣例到規(guī)定的K個類中心的距離和最小來進行樣例歸類。
優(yōu)選地,本發(fā)明S5通過如下步驟實現(xiàn):
S51對所有訓練樣例進行K均值聚類后,獲取每個聚類的類中心空域特征;
S52將類中心樣例的流量分布空域特征進行1600*1600平面區(qū)域內(nèi)用戶流量分布還原,獲取每類類中心用戶流量分布情況下的基站狀態(tài),同時使用這些基站狀態(tài)表征所屬類內(nèi)所有樣例的基站狀態(tài);
S53基于類中心流量分布表征的基站狀態(tài),測試每個類內(nèi)所有樣例的用戶覆蓋率。
本發(fā)明的有益效果是:
本發(fā)明在直接進行單位網(wǎng)格提取用戶流量分布空域特征的基礎上,采用2*2滑動窗口對用戶流量分布空域特征進行單位重疊滑動實現(xiàn)特征的再提取,雖然該特征提取方法明顯較直接網(wǎng)格提取的特征減少了2N-1個特征數(shù),但可以很好地保留空間用戶流量分布的邊緣細節(jié)信息,且在一定程度上減小了計算復雜度,測試結果也表明該特征提取方法甚至比直接網(wǎng)格提取特征方法具有更高的準確性,更利于對所有樣例進行高準確度無監(jiān)督分類。
本發(fā)明提出了一種基于滑動窗口重疊提取用戶分布的空域流量特征提取方法,所設計的特征向量有效保留了用戶成簇分布的信息,能夠有效地對空間流量形態(tài)進行模式識別,特性維數(shù)小且計算復雜度低,有利于處理高密度的用戶分布場景,進而指導基站的部署規(guī)劃。
附圖說明
圖1為本發(fā)明的流程圖;
圖2本發(fā)明用戶流量分布的空域特征網(wǎng)格提取示意圖;
圖3基于本發(fā)明提取的空域特征進行無監(jiān)督聚類分析,尋找最佳聚類數(shù)目的示意圖;
圖4基于本發(fā)明在固有聚類數(shù)目和網(wǎng)格劃分情況下所有樣例的用戶覆蓋率示意圖;
圖5基于本發(fā)明對所有樣例在覆蓋率為[0,0.9],[0.9,0.98],[0.98,1]的范圍內(nèi)進行頻數(shù)統(tǒng)計的統(tǒng)計圖;
圖6基于本發(fā)明對比平滑窗口及單位網(wǎng)格兩種提取特征方法的用戶覆蓋率對比圖。
具體實施方式
為使本發(fā)明的目的、技術方案和優(yōu)點更加清楚,下面將結合附圖對本發(fā)明實施方式作進一步地詳細描述。
圖1是本發(fā)明特征提取及用于流量形態(tài)分類的流程圖。
S1基于已有的流量形態(tài)分布建立XOY二維平面坐標系,獲取劃定平面區(qū)域內(nèi)的用戶坐標。
本實施例中:對1600*1600平面區(qū)域進行N*N網(wǎng)格劃分,則單位網(wǎng)格寬度為1600/N。將每個用戶的X、Y坐標同時除以1600/N并進行向上取整?;谌≌蟮腦,Y坐標統(tǒng)計位于第i行第j列網(wǎng)格的用戶個數(shù),并將其存入矩陣a(N,N)中的a(i,j)中,矩陣a(N,N)的大小為N*N,則矩陣a(N,N)內(nèi)各參數(shù)直觀反映了用戶流量形態(tài)的空域分布特征。
S2采用網(wǎng)格劃分的方法對劃定平面區(qū)域進行N*N區(qū)域劃分,統(tǒng)計每個網(wǎng)格區(qū)間內(nèi)的用戶個數(shù),并將其存入矩陣a(N,N),作為某樣例的流量分布特征。
對1600*1600平面區(qū)域進行N*N網(wǎng)格劃分,則單位網(wǎng)格寬度為1600/N;將每個用戶的X、Y坐標同時除以1600/N并進行向上取整;基于取整后的X,Y坐標統(tǒng)計位于第i行第j列網(wǎng)格的用戶個數(shù),并將其存入矩陣a(N,N)中的a(i,j)中,矩陣a(N,N)的大小為N*N,則矩陣a(N,N)內(nèi)各參數(shù)直觀反映了用戶流量形態(tài)的空域分布特征。
S3對矩陣a(N,N)內(nèi)各參數(shù)采用滑動窗口進行單位重疊滑動提取特征,并將新的特征存入矩陣b(N-1,N-1),作為再提取的新的流量分布特征。
采用2*2的單元滑動窗口對矩陣a(N,N)統(tǒng)計的用戶分布的空域流量特征進行單位重疊滑動,再對單元滑動窗口內(nèi)的用戶總數(shù)進行求和計數(shù),并將其存于矩陣b(N-1,N-1),該過程可通過以下運算實現(xiàn):
b(i,j)=a(i,j)+a(i+1,j)+a(i,j+1)+a(i+1,j+1)
顯然,經(jīng)滑動窗口提取的特征數(shù)較直接經(jīng)單元網(wǎng)格提取的特征數(shù)要少2N-1個。
S4將更新的矩陣b(N-1,N-1)內(nèi)各參數(shù)作為每個樣例新的流量形態(tài)分布特征,并對所有樣例進行無監(jiān)督分類。
S41本發(fā)明主要基于滑動窗口提取的流量分布空域特征采用經(jīng)典的K均值算法對所有樣例進行無監(jiān)督分類,為確定最佳聚類數(shù),對代價函數(shù)J(K)進行統(tǒng)計分析,并根據(jù)肘部法則,找到代價函數(shù)曲線的拐點即為最佳聚類個數(shù),本發(fā)明主要目的為了測試特征提取方法的優(yōu)效性,為了使得測試數(shù)據(jù)更加全面準確,本發(fā)明選取的最佳K值是拐點處的某個區(qū)間,這里使得K={6,8,10,12}。其中,代價函數(shù)J(K)表示每個樣例到其所屬類內(nèi)質(zhì)心的距離平方和。
S42在確定的最佳K值區(qū)間下,采用滑動窗口提取的流量分布空域特征表征訓練樣例,再對訓練樣例進行K均值聚類。其實現(xiàn)原理主要是根據(jù)訓練樣例到規(guī)定的K個類中心的距離和最小來進行樣例歸類。
S5取各類的類中心表征一類流量模式,獲取基站部署狀態(tài),并將其帶入到各類類內(nèi)所有樣例中,測試每個樣例的用戶覆蓋率。
S51對所有訓練樣例進行K均值聚類后,獲取每個聚類的類中心空域特征。
S52將類中心樣例的流量分布空域特征進行1600*1600平面區(qū)域內(nèi)用戶流量分布還原,獲取每類類中心用戶流量分布情況下的基站狀態(tài),同時使用這些基站狀態(tài)表征所屬類內(nèi)所有樣例的基站狀態(tài)。
S53基于類中心流量分布表征的基站狀態(tài),測試每個類內(nèi)所有樣例的用戶覆蓋率。
圖2是本發(fā)明用戶流量分布的空域特征網(wǎng)格提取方法。本實施例主要是對劃定平面區(qū)域進行N*N網(wǎng)格劃分后得到的用戶流量特征進行滑動窗口的特征單元重疊提取的過程,這里總共進行了4組測試,N值分別為{4,8,16,32}。
圖3是基于本發(fā)明提取的空域特征進行無監(jiān)督聚類分析,找最佳聚類數(shù)目。實施例中,取k=1~30,基于4組網(wǎng)格{4*4,8*8,16*16,32*32}劃分方式提取的樣例特征對所有樣例進行K均值分類,并計算每個樣例到其所屬類內(nèi)質(zhì)心的距離平方和J(k),作出J-k曲線,根據(jù)肘部法則可以找到曲線拐點K為9,事實上本發(fā)明選取的最佳K值是拐點處的某個區(qū)間,這里使得K={6,8,10,12}。
圖4是基于本發(fā)明在固有聚類數(shù)目和網(wǎng)格劃分情況下所有樣例的用戶覆蓋率。實施例采用控制變量法測量聚類數(shù)和網(wǎng)格劃分對樣例用戶覆蓋率的影響,這里的用戶覆蓋率是指在類中心基站部署狀態(tài)的前提下所屬類類內(nèi)的各樣例的所有用戶被服務的比率。由實驗結果可以看到,K對用戶覆蓋率的影響并不顯著;而網(wǎng)格劃分對用戶覆蓋率的影響較明顯,當網(wǎng)格劃分得越細,所提取的樣本特征越多,分類準確性提高,且所有樣例用戶覆蓋率更高。
圖5是基于本發(fā)明對所有樣例的覆蓋率進行頻數(shù)統(tǒng)計的結果。實施例對圖4中的用戶服務情況在[0,0.9],[0.9,0.98],[0.98,1]的區(qū)間范圍內(nèi)進行頻數(shù)統(tǒng)計,本發(fā)明設定用戶覆蓋率為0.98以上時,其基站開啟狀態(tài)最佳。由圖5可知,隨著網(wǎng)格劃分越細,所獲得的用戶覆蓋率越高,當K為8和10時,網(wǎng)格對用戶覆蓋率的影響十分明顯呈梯狀分布,當K為6和12時,網(wǎng)格為4*4和8*8的用戶覆蓋情況區(qū)分度不是非常明顯,這也間接證實了最佳聚類數(shù)在9左右徘徊的結論。
圖6是基于本發(fā)明對比平滑窗口及單位網(wǎng)格兩種提取特征方法的用戶覆蓋率。實施例對采用平滑窗口和單位網(wǎng)格進行特征提取進行了對比試驗,其結論可以發(fā)現(xiàn):采用平滑窗口進行特征提取相對于直接采用網(wǎng)格進行特征提取,仍然可以獲得與N2個特征相近甚至更好的分類結果,所得到的用戶覆蓋率更高,此外,理論上分析,平滑窗口進行特征提取可將樣本特征減少2N-1,一定程度上減少了計算復雜度。綜上,采用平滑窗口對用戶流量分布進行空域特征提取是一種準確且高效的方法。
以上包含了本發(fā)明優(yōu)選實施例的說明,這是為了詳細說明本發(fā)明的技術特征,并不是想要將發(fā)明內(nèi)容限制在實施例所描述的具體形式中,依據(jù)本發(fā)明內(nèi)容主旨進行的其他修改和變型也受本專利保護。本發(fā)明內(nèi)容的主旨是由權利要求書所界定,而非由實施例的具體描述所界定。