本發(fā)明涉及本發(fā)明涉及數(shù)據(jù)處理技術(shù)領(lǐng)域,尤其涉及一種基于網(wǎng)站用戶的信息預(yù)測方法。
背景技術(shù):
隨著進入移動互聯(lián)網(wǎng)時代的到來,信息更新迭代的時間逐漸縮短,要想在行業(yè)中處于不敗之地必須有把握市場方向的能力,即預(yù)測能力。古人在當(dāng)時科學(xué)依據(jù)較少的情況下,以經(jīng)驗來對某一個即將發(fā)生的事情進行預(yù)判斷,但是這種完全憑借經(jīng)驗的判斷很難稱其為“預(yù)測”,因為其完全沒有一個相對標準的依據(jù)。比如現(xiàn)在從事網(wǎng)站運營業(yè)務(wù)的團隊,不能有效的預(yù)測未來一段時間新用戶注冊量,就很難掌握網(wǎng)站運營的業(yè)務(wù)方向,一旦行業(yè)方向發(fā)生轉(zhuǎn)向,運營團隊再去改變運營方向,就很難再跟上行業(yè)的發(fā)展,甚至被整個行業(yè)拋棄。但是現(xiàn)在市場上公開的準確度較高并且操作相對簡單的預(yù)測模型基本上沒有。本發(fā)明不僅很好的解決了預(yù)測問題,而且填補了預(yù)測網(wǎng)站用戶注冊量的空白。
技術(shù)實現(xiàn)要素:
下面描述的一種預(yù)測網(wǎng)站新增用戶數(shù)的模型有效的解決了上面所述的問題。
本發(fā)明公開一種基于網(wǎng)站用戶的信息預(yù)測方法。包括:
步驟1:通過控制單元設(shè)定:客觀事件邊界、主觀事件邊界、事件發(fā)生時間間隔、事件影響持續(xù)時間。
步驟2:基于控制單元獲取客觀事件和用戶新增數(shù)據(jù)表;
步驟3:基于控制單元獲取主觀事件和用戶新增數(shù)據(jù)表;
步驟4:通過數(shù)據(jù)處理單元分別建立:1、客觀事件和用戶新增關(guān)系的模型;2、建立主觀事件和用戶新增關(guān)系的模型;
步驟5:通過數(shù)據(jù)預(yù)測單元建立以客觀事件和用戶新增關(guān)系、主觀事件和用戶新增關(guān)系為因子的預(yù)測模型,基于模型預(yù)測網(wǎng)站新增用戶數(shù)。
步驟6:通過數(shù)據(jù)分析單元對比網(wǎng)站預(yù)測增長的用戶數(shù)和實際增長的用戶數(shù),基于對比結(jié)果,排除干擾預(yù)測的客觀事件和主觀事件,并且實時調(diào)整對應(yīng)的事件發(fā)生時間間隔、事件影響持續(xù)時間等設(shè)置,進而實現(xiàn)模型的自我優(yōu)化和更新。
其中,步驟1所述的控制單元為本裝置的基礎(chǔ)單元,控制單元通過定義相關(guān)等參數(shù)等操作控制預(yù)測裝置的實際運行,具體包含:
101:定義客觀事件邊界:即定義影響網(wǎng)站用戶增長的客觀事件發(fā)生列表,并且基于網(wǎng)站運營隨時保持更新(本發(fā)明所指的客觀事件均為影響本網(wǎng)站的客觀事件,如果事件發(fā)生時間間隔內(nèi)沒有任何外部客觀事件發(fā)生也算一種客觀事件,如:網(wǎng)站服務(wù)群體是否放假、影響網(wǎng)站業(yè)務(wù)的政策發(fā)布更新等);
102:定義主觀事件邊界:即定義影響網(wǎng)站注冊的主觀事件發(fā)生列表(本發(fā)明所指的主觀事件均為影響本網(wǎng)站的主觀事件,如:網(wǎng)站版本更新、網(wǎng)站內(nèi)容模塊更新、網(wǎng)站業(yè)務(wù)信息推送等事件);
103:定義事件發(fā)生時間間隔:即如果長時間沒有發(fā)生外部客觀事件,定義多長時間算一個事件發(fā)生的時間間隔,也就是這段時間內(nèi),基于時間間隔,可以確認這個時間段內(nèi)有幾個客觀事件發(fā)生。
104:定義事件影響持續(xù)時間:即定義事件發(fā)生后,截止到什么時間,來計算用戶增長的數(shù)量。
步驟2所述的獲取客觀事件和用戶新增數(shù)據(jù)表具體包含:
步驟201:基于控制單元獲取每一個客觀事件發(fā)生后,事件影響持續(xù)時間內(nèi)的新增用戶數(shù);
步驟202:生成客觀事件和新增用戶數(shù)的關(guān)系列表。
步驟3所述的獲取主觀事件和用戶新年增數(shù)據(jù)表具體包含:
步驟301:基于控制單元獲取每一個主觀事件發(fā)生后,事件影響持續(xù)時間內(nèi)的新增用戶數(shù);
步驟302:生成主觀事件和新增用戶數(shù)的關(guān)系列表。
步驟4所述數(shù)據(jù)處理單元主要包含對兩個事件列表的邏輯處理,具體處理方法如下:
步驟401:對于每個客觀事件,當(dāng)此事件發(fā)生后,把事件影響持續(xù)時間內(nèi)新增用戶數(shù)量構(gòu)成一個變量Xm。其中,m是客觀事件發(fā)生的次數(shù);
步驟402:對于每個主觀事件,當(dāng)此事件發(fā)生后,把事件影響持續(xù)時間內(nèi)新增用戶數(shù)量構(gòu)成一個變量Xn。其中,n是客觀事件發(fā)生的次數(shù);
步驟403:假設(shè)新增用戶數(shù)Yi,和以上兩個有如下關(guān)系:
Yi=a+bXm+cXn。
利用上述m和n維參數(shù)對此式進行線性回歸,利用最小二乘法估計出模型參數(shù)a、b和c。
針對未來用戶新增數(shù)用上述二元線性回歸方程預(yù)測。
本發(fā)明的關(guān)鍵點:
1、本發(fā)明基于線性回歸的模型相比于其他(德爾菲法預(yù)測模型、灰色預(yù)測模型等)預(yù)測模型更具有可操作性和高效性;
2、算法創(chuàng)造性的把客觀事件影主觀時間影響分類處理,區(qū)分為兩個因子,符合實際情況,增加了預(yù)測的準確性;
3、由于主觀和客觀事件的列表是積累更新的,所以可以實現(xiàn)對算法預(yù)測的同步實時更新;
4、通過控制單元人為的設(shè)定相關(guān)參數(shù),并且通過數(shù)據(jù)分析單元動態(tài)更新,提升了預(yù)測系統(tǒng)的準確性。
附圖說明
圖1是本發(fā)明的基于網(wǎng)站用戶的信息預(yù)測方法流程圖。
圖2是控制單元參數(shù)設(shè)定步驟圖。
圖3是在系統(tǒng)中獲取預(yù)先設(shè)定的客觀事件和新增用戶關(guān)系的數(shù)據(jù)表信息圖。
圖4是在系統(tǒng)中獲取預(yù)先設(shè)定的主觀事件和新增用戶關(guān)系的數(shù)據(jù)表信息圖。
圖5是用戶預(yù)測模型圖。
具體實施方式
下面結(jié)合具體實施例對本發(fā)明所述的預(yù)測網(wǎng)站新增用戶數(shù)的方法做進一步詳細說明,但是本發(fā)明的保護范圍并不限于此。
本發(fā)明的整體思路是通過獲取客觀事件發(fā)生后,事件影響持續(xù)時間內(nèi)新增用戶的關(guān)系;主觀事件發(fā)生后,事件影響持續(xù)時間內(nèi)新增用戶數(shù)的關(guān)系為二元線性回歸方程的兩個因子,通過計算線性回歸方程的參數(shù),得到預(yù)測一定時間內(nèi)用戶新增數(shù)量的模型。進而預(yù)測在一定時間段內(nèi)相應(yīng)事件發(fā)生后,網(wǎng)站用戶新增數(shù),如圖1。
下面結(jié)合附圖說明本發(fā)明的實現(xiàn)方式,具體實施步驟如下:
步驟1:在系統(tǒng)中設(shè)定關(guān)鍵參數(shù),并且基于數(shù)據(jù)分析單元實時調(diào)整相應(yīng)參數(shù),如圖2所示;
步驟2:在系統(tǒng)中獲取預(yù)先設(shè)定的客觀事件和新增用戶關(guān)系的數(shù)據(jù)表信息,如圖3所示;
其中,對同一客觀事件多次發(fā)生后用戶新增數(shù)量求平均值計入此關(guān)系數(shù)據(jù)表,
步驟3:在系統(tǒng)中獲取預(yù)先設(shè)定的主觀事件和新增用戶關(guān)系的數(shù)據(jù)表信息,如圖4所示;
其中,對同一事件多次發(fā)生后用戶新增數(shù)量求平均值計入此關(guān)系數(shù)據(jù)表,
步驟4:基于以上數(shù)據(jù)表,將每一個客觀事件發(fā)生后,事件影響持續(xù)時間內(nèi)新增用戶數(shù)量,建立一個變量Xm;
Xm=[OeU1,OeU2,OeU3,......,OeUk,......,OeUm],其中,OeUk為客觀事件Oe發(fā)生后新增的用戶數(shù)量Uk;
步驟5:基于以上關(guān)系表,將每一個主觀事件發(fā)生后,事件影響持續(xù)時間內(nèi)新增用戶數(shù)量,建立一個向量Xn;
Xn=[SeU1,SeU2,SeU3,......,SeUk,......,SeUn],其中,SeUk為主觀事件Se發(fā)生后新增的用戶數(shù)量Uk;
步驟6:假設(shè)新增用戶數(shù)Yi和Xm、Xn存在如下關(guān)系,如圖5:
Yi=a+bXm+cXn;
利用上述m和n參數(shù)對此式進行線性回歸,利用最小二乘法估計出模型參數(shù)a、b和c。
以誤差平方和最小作為確定回歸系數(shù)的準則,我們得到以下數(shù)據(jù)模型:
模型1:
其中,當(dāng)滿足時,Q有最小值。
通過數(shù)據(jù)預(yù)測單元基于最小二乘法計算參數(shù)a、b和c的值,得出以下模型:
模型2:其中,
通過求解方程,得出最終的用戶模型。
預(yù)測模型:
通過以上模型實現(xiàn)用戶新增數(shù)量的預(yù)測。
步驟6:基于數(shù)據(jù)分析單元通過預(yù)測模型預(yù)測出的用戶增長數(shù)據(jù)和網(wǎng)站實際增長的數(shù)據(jù)進行對比確認,排除干擾預(yù)測的客觀事件和主觀事件,并且動態(tài)調(diào)整控制單元的控制參數(shù),優(yōu)化預(yù)測模型。
可以理解的是,以上實施方式僅僅是為了說明本發(fā)明的原理而采用的示例性實施方式,然而本發(fā)明并不局限于此。對于本領(lǐng)域內(nèi)的普通技術(shù)人員而言,在不脫離本發(fā)明的精神和實質(zhì)的情況下,可以做出各種變型和改進,這些變型和改進也視為本發(fā)明的保護范圍。