欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種話務(wù)量預(yù)測方法

文檔序號:7803842閱讀:274來源:國知局
一種話務(wù)量預(yù)測方法
【專利摘要】本發(fā)明公開了一種話務(wù)量預(yù)測方法,首先計算每個小區(qū)的話務(wù)統(tǒng)計特征,并對統(tǒng)計特征進行分組,將話務(wù)統(tǒng)計特征中的均值和中間值分為集中組特征,將方差、標(biāo)準(zhǔn)差、最大值和最小值分為離散組特征;之后對所選擇的所有話務(wù)小區(qū)的均值和標(biāo)準(zhǔn)差分別進行聚類,根據(jù)聚類結(jié)果劃分出小區(qū)類型;再對聚類結(jié)果建立分類模型,根據(jù)分類模型得到不同類型小區(qū)的界定規(guī)則;最后根據(jù)所述的界定規(guī)則識別出小區(qū)類型,并對同一類型的小區(qū)建立差分自回歸移動平均模型,根據(jù)模型進行話務(wù)量預(yù)測。采用該方法進行話務(wù)量預(yù)測,能有效提升聚類劃分小區(qū)的質(zhì)量,從而提升話務(wù)量預(yù)測精度,且采用該方法的分類模型識別聚類結(jié)果能固化到算法,提高話務(wù)量預(yù)測的效率。
【專利說明】一種話務(wù)量預(yù)測方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及移動通信【技術(shù)領(lǐng)域】,具體涉及一種話務(wù)量預(yù)測方法。
【背景技術(shù)】
[0002]在現(xiàn)有的話務(wù)量預(yù)測方法中,主要是采用基于聚類和ARIMA模型(Autoregressive Integrated Moving Average Model差分自回歸移動平均模型)的話務(wù)量預(yù)測方法,這種方法的流程主要包括:一、按照先驗知識將話務(wù)小區(qū)劃分為四種類型:交通主干線、繁華商業(yè)區(qū)、高等院校和居民住宅區(qū);二、預(yù)處理,獲取每個話務(wù)小區(qū)的聚類特征,所述聚類特征包括相關(guān)系數(shù)、方差、最大值、中間值、平均值、最小值、出現(xiàn)頻率最高的值和標(biāo)準(zhǔn)差;三、根據(jù)每個話務(wù)小區(qū)的聚類特征,并采用K-MEANS聚類算法進行聚類,形成細化話務(wù)小區(qū)類型;四、采用ARIMA模型進行話務(wù)量預(yù)測,同一類型的細化話務(wù)小區(qū)選擇相同的建模參數(shù)。
[0003]采用上述方式進行話務(wù)預(yù)測時,根據(jù)專家的歷史經(jīng)驗對話務(wù)小區(qū)進行劃分的方式帶有很大的主觀性、劃分不準(zhǔn)確的問題。同時還存在以下問題:
[0004]1.聚類的結(jié)果業(yè)務(wù)解釋性較差:該方法采用相關(guān)系數(shù)、方差、最大值、中間值、平均值、最小值、出現(xiàn)頻率最高的值和標(biāo)準(zhǔn)差建立聚類模型,相關(guān)系數(shù)是反映數(shù)據(jù)之間的相關(guān)性,均值、中間值和出現(xiàn)頻率最高的值是數(shù)據(jù)中心值的測量,而方差、標(biāo)準(zhǔn)差、最大值和最小值是數(shù)據(jù)離散程度的測量,均值相近的小區(qū),標(biāo)準(zhǔn)差可能差別很大,而標(biāo)準(zhǔn)差相近的小區(qū),均值的差別會相差更大,而且均值和標(biāo)準(zhǔn)差的權(quán)重也是不一樣的。聚類的計算原理是計算每個變量之間距離和相似性,各個變量都會計算,由于不同的變量是分別反映數(shù)據(jù)的離散程度、集中程度和相關(guān)性的,對于不同的變量采用相同的方式建立聚類模型,導(dǎo)致聚類的結(jié)果業(yè)務(wù)解釋性較差。
[0005]2.聚類的結(jié)果不能固化到話務(wù)預(yù)測算法。聚類的過程需要反復(fù)調(diào)整,而且需要業(yè)務(wù)解釋,如果業(yè)務(wù)解釋較好,才能應(yīng)用模型。由于聚類模型是計算相似度的過程,模型的結(jié)果沒有規(guī)則邊界,聚類的結(jié)果也不能固化到預(yù)測算法。

【發(fā)明內(nèi)容】

[0006]針對現(xiàn)有技術(shù)中存在的缺陷,本發(fā)明的目的在于提供一種話務(wù)量預(yù)測方法,提高小區(qū)話務(wù)量預(yù)測的精度。
[0007]為實現(xiàn)上述目的,本發(fā)明采用的技術(shù)方案如下:
[0008]一種話務(wù)量預(yù)測方法,包括以下步驟:
[0009](I)獲取所選取的每個話務(wù)小區(qū)的通話數(shù)據(jù),計算每個小區(qū)的話務(wù)統(tǒng)計特征;所述的話務(wù)統(tǒng)計特征包括小區(qū)設(shè)定時間段內(nèi)話務(wù)量的均值、方差、標(biāo)準(zhǔn)差、中間值、最大值和最小值;
[0010](2)對統(tǒng)計特征進行分組,將均值和中間值分為集中組特征,將方差、標(biāo)準(zhǔn)差、最大值和最小值分為離散組特征;[0011](3)對所選取的所有話務(wù)小區(qū)的集中組特征中的均值和離散組特征中的標(biāo)準(zhǔn)差分別進行聚類,并根據(jù)聚類結(jié)果劃分出小區(qū)類型;
[0012](4)對聚類結(jié)果建立分類模型,根據(jù)分類模型得到不同類型小區(qū)的界定規(guī)則;
[0013](5)根據(jù)所述的界定規(guī)則判斷待識別小區(qū)出小區(qū)類型,并對同一類型的小區(qū)建立差分自回歸移動平均模型,根據(jù)差分自回歸移動平均模型進行話務(wù)量預(yù)測。
[0014]進一步,如上所述的一種話務(wù)量預(yù)測方法,步驟(3)中,對均值和標(biāo)準(zhǔn)差進行聚類,根據(jù)聚類結(jié)果劃分出小區(qū)類型的具體方式為:
[0015]采用聚類算法對所選取的所有話務(wù)小區(qū)的均值和標(biāo)準(zhǔn)差分別進行聚類,將均值聚類后的結(jié)果自動分成兩組A和B,將標(biāo)準(zhǔn)差聚類后的結(jié)果自動分成兩組C和D ;
[0016]分別計算A組和B組的均值,將計算后均值高的一組定義為高均值組,均值低的一組定義為低均值組;
[0017]分別計算C組和D組的均值,將計算后均值高的一組定義為高離散組,低均值的一組定義為低離散組;
[0018]將所述的高均值組、低均值組、高離散組和低離散組進行交叉,根據(jù)小區(qū)所在的組別將小區(qū)劃分成高均值-高離散、高均值-低離散、低均值-高離散和低均值-低離散四種類型。
[0019]進一步,如上所述的一種話務(wù)量預(yù)測方法,采用two-step聚類算法對所選取的所有話務(wù)小區(qū)的均值和標(biāo)準(zhǔn)值分別進行聚類。
[0020]進一步,如上所述的一種話務(wù)量預(yù)測方法,采用C5.0決策樹算法對聚類結(jié)果建立分類模型。
[0021]進一步,如上所述的一種話務(wù)量預(yù)測方法,步驟(4)中,采用C5.0決策樹算法對聚類結(jié)果建立分類模型時,模型輸入的值為小區(qū)的均值和標(biāo)準(zhǔn)差,輸出的變量為小區(qū)的類型。
[0022]再進一步,如上所述的一種話務(wù)量預(yù)測方法,所述界定規(guī)則是指用于識別小區(qū)類型的規(guī)則,包括均值和標(biāo)準(zhǔn)差的界定參數(shù)。
[0023]更進一步,如上所述的一種話務(wù)量預(yù)測方法,步驟(5)中,根據(jù)差分自回歸移動平均模型進行話務(wù)量預(yù)測時,對于相同類型的小區(qū)采用相同的差分自回歸移動平均模型參數(shù)進行話務(wù)量預(yù)測。
[0024]本發(fā)明的有益效果在于:
[0025]1.本技術(shù)方案相對于現(xiàn)有技術(shù)方案有效提升聚類劃分小區(qū)的質(zhì)量,從而提升話務(wù)量預(yù)測精度?,F(xiàn)有的技術(shù)方案把中心值的相關(guān)數(shù)據(jù)和離散程度的相關(guān)數(shù)據(jù)放在一起聚類,聚類后同類別用戶的聚類指標(biāo)的均值和方差都較大。分組聚類同類別小區(qū)指標(biāo)的均值和方差相比原有技術(shù)方案分別明顯下降,能有效提升聚類的質(zhì)量。
[0026]2.分類模型識別聚類結(jié)果,能固化到算法?,F(xiàn)有的技術(shù)方案聚類的過程和結(jié)果都不能固化到話務(wù)預(yù)測算法,本發(fā)明能準(zhǔn)確識別聚類后細分小區(qū)的邊界,邊界的規(guī)則能完全固化到預(yù)測的算法,自動運行。
【專利附圖】

【附圖說明】
[0027]圖1為本發(fā)明【具體實施方式】中一種話務(wù)量預(yù)測方法的流程圖;
[0028]圖2-圖5為【具體實施方式】中采用本發(fā)明方法對四種類型小區(qū)進行話務(wù)量預(yù)測時,四種類型小區(qū)的的話務(wù)量預(yù)測擬合曲線和實際話務(wù)量曲線的比對示意圖。
【具體實施方式】
[0029]下面結(jié)合說明書附圖與【具體實施方式】對本發(fā)明做進一步的詳細說明。
[0030]圖1示出了本發(fā)明具體實施方法中一種話務(wù)量預(yù)測方法的流程圖,該方法主要包括以下步驟:
[0031]步驟Sll:計算每個話務(wù)小區(qū)的話務(wù)統(tǒng)計特征;
[0032]獲取所選取的每個話務(wù)小區(qū)的通話數(shù)據(jù),計算每個小區(qū)的話務(wù)統(tǒng)計特征;所述的話務(wù)統(tǒng)計特征包括小區(qū)設(shè)定時間段內(nèi)話務(wù)量的均值、方差、標(biāo)準(zhǔn)差、中間值、最大值和最小值。
[0033]本實施方式中計算小區(qū)的話務(wù)統(tǒng)計特征具體方式如下:
[0034]1、均值
[0035]以Xl,X2, X3...xn(n< = 31)為某小區(qū)某月每日話務(wù)量,x為算數(shù)平均值,簡稱均值:X = (X^X2+...+xn) /η ;
[0036]2、方差
[0037]s"2 = [ (X1-X)'2+(x2-x)'2+......(xn-x) ~2]/n (x 為平均數(shù))
[0038]3、標(biāo)準(zhǔn)差
[0039]s = sqrt (((x「x) '2+ (χ2-χ) '2+......(χη-χ) '2) / (η)))
[0040]4、中間值
[0041]對X1, χ2, χ3...Xn進行排序,處于排序中間位置上的數(shù)的值為中間值
[0042]5、最大值和最小值即為X1, X2, x3...Xn中的最大值和最小值
[0043]步驟S12:對統(tǒng)計特征進行分組;
[0044]對統(tǒng)計特征進行分組,將均值和中間值分為集中組特征,將方差、標(biāo)準(zhǔn)差、最大值和最小值分為離散組特征。
[0045]在步驟Sll中計算的小區(qū)的話務(wù)統(tǒng)計特征中,均值和中間值是在一定程度上標(biāo)識小區(qū)話務(wù)量集中程度的特征,方差、標(biāo)準(zhǔn)差、最大值和最小值是一定程度上標(biāo)識小區(qū)話務(wù)量離散程度的特征,本實施方式中根據(jù)各統(tǒng)計特征對小區(qū)話務(wù)量的影響,將統(tǒng)計特征中的均值和中間值分為集中組特征,將方差、標(biāo)準(zhǔn)差、最大值和最小值分為離散組特征。
[0046]步驟S13:對統(tǒng)計特征進行分組聚類,根據(jù)聚類結(jié)果劃分出小區(qū)類型;
[0047]聚類的原理是計算每個變量之間距離和相似性。在對話務(wù)量預(yù)測分析過程中,由于不同的話務(wù)統(tǒng)計特征變量是分別反映數(shù)據(jù)的離散程度、集中程度和相關(guān)性的,對小區(qū)的話務(wù)統(tǒng)計特征聚類后,均值相近的小區(qū),標(biāo)準(zhǔn)差可能差別很大,而標(biāo)準(zhǔn)差相近的小區(qū),均值的差別可能差別很大,如果把所有的話務(wù)統(tǒng)計特征放在一起進行聚類,就會導(dǎo)致聚類的結(jié)果較差。
[0048]為了克服上述問題,本發(fā)明采用步驟S12的方式將小區(qū)的話務(wù)統(tǒng)計特征分為了集中組特征和離散組特征,并通過對集中組特征和離散組特征分別進行聚類的得到話務(wù)量集中維度聚類結(jié)果和話務(wù)量離散程度的聚類結(jié)果。
[0049] 將指標(biāo)(話務(wù)統(tǒng)計特征)分組后對聚類指標(biāo)的選擇是探索的過程,對均值、方差、標(biāo)準(zhǔn)差、中間值、最大值和最小值等特征分別進行單指標(biāo)和多指標(biāo)聚類后,通過觀察聚類的結(jié)果和解釋性,發(fā)現(xiàn)選擇對集中組特征中的均值和離散組特征中的標(biāo)準(zhǔn)差分別進行聚類,可以得到較好的聚類效果。因此,本實施方式中最后是分別采用均值和標(biāo)準(zhǔn)差進行聚類,其他的統(tǒng)計特征用于描述聚類后特征,也就是說通過其他統(tǒng)計特征的分析判斷均值和標(biāo)準(zhǔn)差聚類后的聚類質(zhì)量,例如對于中間值這一統(tǒng)計特征,可以通過計算所有小區(qū)的中間值的均值和標(biāo)準(zhǔn)差來描述聚類特征和評價分析聚類結(jié)果的好壞。
[0050]本實施方式中采用two-step聚類算法對所選取的所有話務(wù)小區(qū)的均值和標(biāo)準(zhǔn)值分別進行聚類,并根據(jù)聚類結(jié)果將小區(qū)劃分成高均值-高離散、高均值-低離散、低均值-高離散和低均值-低離散四種類型。對均值和標(biāo)準(zhǔn)差進行聚類,根據(jù)聚類結(jié)果劃分出小區(qū)類型的具體方式為:
[0051]采用聚類算法對所選取的所有話務(wù)小區(qū)的均值和標(biāo)準(zhǔn)差分別進行聚類,將均值聚類后的結(jié)果自動分成兩組A和B,將標(biāo)準(zhǔn)差聚類后的結(jié)果自動分成兩組C和D ;
[0052]分別計算A組和B組的均值,將計算后均值高的一組定義為高均值組,均值低的一組定義為低均值組;
[0053]分別計算C組和D組的均值,將計算后均值高的一組定義為高離散組,低均值的一組定義為低離散組;
[0054]將所述的高均值組、低均值組、高離散組和低離散組進行交叉,根據(jù)小區(qū)所在的組別將所選取的小區(qū)劃分成高均值-高離散、高均值-低離散、低均值-高離散和低均值-低離散四種類型。
[0055]本實施方式中選取了 827個小區(qū)4月2周的話務(wù)數(shù)據(jù)進行聚類,采用two-step聚類算法對均值聚類后,均值聚類結(jié)果自動分成兩組,A組和B組,然后再分別計算A組和B組的所有數(shù)據(jù)的均值,得到A組的所有數(shù)據(jù)的均值為0.48,B組的所有數(shù)據(jù)的均值為1.83,那么A組為高均值組,B組為低均值組。同樣的方法根據(jù)標(biāo)準(zhǔn)差可得到高離散組和低離散組。將兩個均值組和兩個離散組交叉后得到四個組,將小區(qū)劃分為四個類型小區(qū),如一個小區(qū)的均值和標(biāo)準(zhǔn)差分別屬于高均值組和低離散值組,那么該小區(qū)的類型為高均值-低離散類型。
[0056]本實施方式中使用的建模工具為modeler, two-step聚類算法為現(xiàn)有方法,采用該算法進行均值和標(biāo)準(zhǔn)差的聚類,聚類后的結(jié)果會自動分為高、低兩組。對均值和標(biāo)準(zhǔn)差進行聚類得到的聚類的平均輪廓值為0.7,聚類的質(zhì)量好。
[0057]步驟S14:對聚類結(jié)果建立分類模型,根據(jù)分類模型得到不同類型小區(qū)的界定規(guī)則;
[0058]所述界定規(guī)則是指用于識別小區(qū)類型的規(guī)則,包括均值和平均值的界定參數(shù)。本實施方式中采用C5.0決策樹算法對聚類結(jié)果建立分類模型,識別出不同類型小區(qū)的界定規(guī)則。
[0059]在步驟S13中已經(jīng)得到高均值-高離散、高均值-低離散、低均值-高離散和低均值-低離散四種類型小區(qū)的情況下,將所選取的話務(wù)小區(qū)按這四種類型分為四組,并以四組為樣本,建立分類模型,得到四組的分類規(guī)則。分類算法采用C5.0算法,輸入的值為四組所有小區(qū)的均值和標(biāo)準(zhǔn)差,輸出的變量為類別(四組的類型)。通過C5.0算法建立決策樹模型,便可以得到每個類型小區(qū)的界定規(guī)則。本實施方式中使用的建模工具為modeler,C5.0決策樹算法為現(xiàn)有技術(shù)。[0060]本【具體實施方式】中,采用modeler建模工具和C5.0決策樹算法對步驟S13中所選
取的827個小區(qū)的聚類結(jié)果建立分類模型后,得到的不同類型小區(qū)的界定規(guī)則如下:
[0061]
【權(quán)利要求】
1.一種話務(wù)量預(yù)測方法,包括以下步驟: (1)獲取所選取的每個話務(wù)小區(qū)的通話數(shù)據(jù),計算每個小區(qū)的話務(wù)統(tǒng)計特征;所述的話務(wù)統(tǒng)計特征包括小區(qū)設(shè)定時間段內(nèi)話務(wù)量的均值、方差、標(biāo)準(zhǔn)差、中間值、最大值和最小值; (2)對統(tǒng)計特征進行分組,將均值和中間值分為集中組特征,將方差、標(biāo)準(zhǔn)差、最大值和最小值分為離散組特征; (3)對所選取的所有話務(wù)小區(qū)的集中組特征中的均值和離散組特征中的標(biāo)準(zhǔn)差分別進行聚類,并根據(jù)聚類結(jié)果將所選取的小區(qū)劃分出小區(qū)類型; (4)對聚類結(jié)果建立分類模型,根據(jù)分類模型得到不同類型小區(qū)的界定規(guī)則; (5)根據(jù)所述的界定規(guī)則判斷待識別小區(qū)出小區(qū)類型,并對同一類型的小區(qū)建立差分自回歸移動平均模型,根據(jù)差分自回歸移動平均模型進行話務(wù)量預(yù)測。
2.如權(quán)利要求1所述的一種話務(wù)量預(yù)測方法,其特征在于:步驟(3)中,對均值和標(biāo)準(zhǔn)差進行聚類,根據(jù)聚類結(jié)果劃分出小區(qū)類型的具體方式為: 采用聚類算法對所選取的所有話務(wù)小區(qū)的均值和標(biāo)準(zhǔn)差分別進行聚類,將均值聚類后的結(jié)果自動分成兩組A和B,將標(biāo)準(zhǔn)差聚類后的結(jié)果自動分成兩組C和D ; 分別計算A組和B組的均值,將計算后均值高的一組定義為高均值組,均值低的一組定義為低均值組; 分別計算C組和D組的均值,將計算后均值高的一組定義為高離散組,低均值的一組定義為低離散組; 將所述的高均值組、低均值組、高離散組和低離散組進行交叉,根據(jù)小區(qū)所在的組別將小區(qū)劃分成高均值-高離散、高均值-低離散、低均值-高離散和低均值-低離散四種類型。
3.如權(quán)利要求1或2所述的一種話務(wù)量預(yù)測方法,其特征在于:采用two-step聚類算法對所選取的所有話務(wù)小區(qū)的均值和標(biāo)準(zhǔn)值分別進行聚類。
4.如權(quán)利要求1所述的一種話務(wù)量預(yù)測方法,其特征在于:步驟(4)中,采用C5.0決策樹算法對聚類結(jié)果建立分類模型。
5.如權(quán)利要求4所述的一種話務(wù)量預(yù)測方法,其特征在于:步驟(4)中,采用C5.0決策樹算法對聚類結(jié)果建立分類模型時,模型輸入的值為小區(qū)的均值和標(biāo)準(zhǔn)差,輸出的變量為小區(qū)的類型。
6.如權(quán)利要求1所述的一種話務(wù)量預(yù)測方法,其特征在于:步驟(4)中,所述界定規(guī)則是指用于識別小區(qū)類型的規(guī)則,包括均值和標(biāo)準(zhǔn)差的界定參數(shù)。
7.如權(quán)利要求1所述的一種話務(wù)量預(yù)測方法,其特征在于:步驟(5)中,根據(jù)差分自回歸移動平均模型進行話務(wù)量預(yù)測時,對于相同類型的小區(qū)采用相同的差分自回歸移動平均模型參數(shù)進行話務(wù)量預(yù)測。
【文檔編號】H04W24/06GK104023351SQ201410204692
【公開日】2014年9月3日 申請日期:2014年5月15日 優(yōu)先權(quán)日:2014年5月15日
【發(fā)明者】曾立平, 成立立, 于笑博 申請人:北京融信匯智科技有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
托里县| 开远市| 舞钢市| 闵行区| 东乡族自治县| 阿拉善左旗| 满洲里市| 英超| 邢台县| 抚顺县| 柏乡县| 上栗县| 彭山县| 彭阳县| 于田县| 罗山县| 徐州市| 响水县| 双峰县| 广东省| 祁阳县| 金华市| 凌源市| 墨竹工卡县| 延庆县| 大英县| 河西区| 平阴县| 浙江省| 哈尔滨市| 博兴县| 裕民县| 绵竹市| 安泽县| 富顺县| 青阳县| 扎赉特旗| 突泉县| 中方县| 偃师市| 长春市|