專利名稱:一種確定訪問頁面的終端數(shù)量的方法及裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及互聯(lián)網(wǎng)技術(shù)領(lǐng)域和計算機技術(shù)領(lǐng)域,尤其涉及一種確定訪問頁面的終端數(shù)量的方法及裝置。
背景技術(shù):
在目前的互聯(lián)網(wǎng)應(yīng)用中,為了有針對性的對網(wǎng)站進行管理,經(jīng)常需要統(tǒng)計網(wǎng)站被用戶訪問時,訪問網(wǎng)站的用戶量,也即訪問網(wǎng)站的終端數(shù)量,也可以統(tǒng)計訪問網(wǎng)站頁面的終
端數(shù)量。現(xiàn)有技術(shù)中,當(dāng)終端訪問某一網(wǎng)站的頁面時,網(wǎng)站服務(wù)器會記錄訪問日志,日志中可以包括該終端的標識,如IP地址,C00KIE,該終端使用的操作系統(tǒng),該終端上安裝的瀏覽器的版本,訪問時間,以及該終端瀏覽的上一個頁面的域名等信息,終端瀏覽的上一個頁面也可以稱作是頁面本次被訪問時的來源頁面。在記錄的訪問日志所包括的信息中,IP和COOKIE屬于能夠辨別終端身份的主要信息,具有唯一性。鑒于其唯一性,IP或COOKIE作為終端標識信息,可以用來統(tǒng)計訪問網(wǎng)站的終端數(shù)量,即基于每條訪問日志中記錄的終端標識信息,可以統(tǒng)計一段時間內(nèi)訪問一個網(wǎng)站的終端數(shù)量,也可以統(tǒng)計一段時間內(nèi)訪問一個或多個頁面的終端的數(shù)量。然而,在用戶通過終端訪問網(wǎng)站時,經(jīng)常會在短時間內(nèi)多次訪問一個頁面或同一網(wǎng)站的多個頁面,此時在統(tǒng)計訪問網(wǎng)站的終端數(shù)量時,如果僅僅是根據(jù)訪問日志中的終端標識信息進行簡單疊加進行統(tǒng)計,顯然是不準確的,而是需要對訪問日志中的終端標識信息進行比對,以及對相同的終端標識信息進行排重,才能夠得到準確的統(tǒng)計結(jié)果。然而,對于一些訪問量很大的網(wǎng)站,例如,每天數(shù)十億次的頁面訪問,在基于對終端標識信息的比對和排重處理,對訪問網(wǎng)站的終端數(shù)量進行統(tǒng)計時,需要消耗大量的處理資源,且由于數(shù)據(jù)量較大仍然需要很長的時間才能得到統(tǒng)計結(jié)果,實際中,往往需要數(shù)組服務(wù)器共同運算數(shù)十小時才能得到結(jié)果。
發(fā)明內(nèi)容
本發(fā)明實施例提供一種確定訪問頁面的終端數(shù)量的方法及裝置,用以解決現(xiàn)有技術(shù)中存在的確定訪問頁面的終端數(shù)量所消耗的處理資源較多,效率較低的問題。本發(fā)明實施例提供一種確定訪問頁面的終端數(shù)量的方法,包括:獲取歷史時間段內(nèi)訪問頁面集合中的頁面的終端數(shù)量,以及所述歷史時間段內(nèi)所述頁面集合中的頁面被訪問的次數(shù);確定所述終端數(shù)量與所述次數(shù)的比值;基于所述比值,根據(jù)統(tǒng)計的評估時間段內(nèi)所述頁面集合中的頁面被訪問的次數(shù),確定所述評估時間段內(nèi)訪問所述頁面集合中的頁面的終端數(shù)量。本發(fā)明實施例還提供一種確定訪問頁面的終端數(shù)量的裝置,包括:獲取單元,用于獲取歷史時間段內(nèi)訪問頁面集合中的頁面的終端數(shù)量,以及所述歷史時間段內(nèi)所述頁面集合中的頁面被訪問的次數(shù);第一確定單元,用于確定所述終端數(shù)量與所述次數(shù)的比值;第二確定單元,用于基于所述比值,根據(jù)統(tǒng)計的評估時間段內(nèi)所述頁面集合中的頁面被訪問的次數(shù),確定所述評估時間段內(nèi)訪問所述頁面集合中的頁面的終端數(shù)量。本發(fā)明有益效果包括:本發(fā)明實施例提供的方法中,在確定訪問頁面的終端數(shù)量時,首先獲取歷史時間段內(nèi)訪問頁面集合中的頁面的終端數(shù)量,以及該歷史時間段內(nèi)該頁面集合中的頁面被訪問的次數(shù),然后確定獲取的該終端數(shù)量與該次數(shù)的比值,并基于確定的該比值,根據(jù)統(tǒng)計的評估時間段內(nèi)該頁面集合中的頁面被訪問的次數(shù),確定該評估時間段內(nèi)訪問該頁面集合中的頁面的終端數(shù)量。本發(fā)明實施例提供的方案中,不再需要對訪問日志中記錄的終端標識信息進行比對和排重處理,只需要統(tǒng)計頁面被訪問的次數(shù),并基于通過歷史統(tǒng)計結(jié)果得到的訪問頁面的終端數(shù)量與頁面被訪問的次數(shù)的比值,即可以確定評估時間段內(nèi)訪問頁面的終端數(shù)量,從而減少了處理資源的消耗,并且提高了處理效率。本申請的其它特征和優(yōu)點將在隨后的說明書中闡述,并且,部分地從說明書中變得顯而易見,或者通過實施本申請而了解。本申請的目的和其他優(yōu)點可通過在所寫的說明書、權(quán)利要求書、以及附圖中所特別指出的結(jié)構(gòu)來實現(xiàn)和獲得。
附圖用來提供對本發(fā)明的進一步理解,并且構(gòu)成說明書的一部分,與本發(fā)明實施例一起用于解釋本發(fā)明,并不構(gòu)成對本發(fā)明的限制。在附圖中:圖1為本發(fā)明實施例提供的確定訪問頁面的終端數(shù)量的方法的流程圖;圖2為本發(fā)明實施例1提供的確定訪問頁面的終端數(shù)量的方法的流程圖;圖3為本發(fā)明實施例2提供的確定訪問頁面的終端數(shù)量的方法的流程圖;圖4為本發(fā)明實施例3提供的確定訪問頁面的終端數(shù)量的裝置的結(jié)構(gòu)示意圖。
具體實施例方式為了給出減少確定訪問頁面的終端數(shù)量時消耗的處理資源,以及提高處理效率的實現(xiàn)方案,本發(fā)明實施例提供了一種確定訪問頁面的終端數(shù)量的方法及裝置,以下結(jié)合說明書附圖對本發(fā)明的優(yōu)選實施例進行說明,應(yīng)當(dāng)理解,此處所描述的優(yōu)選實施例僅用于說明和解釋本發(fā)明,并不用于限定本發(fā)明。并且在不沖突的情況下,本申請中的實施例及實施例中的特征可以相互組合。本發(fā)明實施例提供一種確定訪問頁面的終端數(shù)量的方法,如圖1所示,包括:步驟101、獲取歷史時間段內(nèi)訪問頁面集合中的頁面的終端數(shù)量,以及該歷史時間段內(nèi)該頁面集合中的頁面被訪問的次數(shù)。步驟102、確定獲取的該終端數(shù)量與該次數(shù)的比值。步驟103、基于確定的該比值,根據(jù)統(tǒng)計的評估時間段內(nèi)該頁面集合中的頁面被訪問的次數(shù),確定該評估時間段內(nèi)訪問該頁面集合中的頁面的終端數(shù)量。其中,在上述步驟101中,可以獲取多個歷史時間段內(nèi)訪問頁面集合中的頁面的終端數(shù)量,以及該歷史時間段內(nèi)該頁面集合中的頁面被訪問的次數(shù),后續(xù)可以基于獲取的多個終端數(shù)量和多個次數(shù)確定后續(xù)步驟103中使用的比值,基于獲取的多個歷史訪問結(jié)果確定比值,能夠進一步提高最終所確定的訪問頁面的終端數(shù)量的準確性。本發(fā)明實施例中,也可以針對作為來源頁面的指定頁面,獲取歷史時間段內(nèi)從該指定頁面出發(fā)訪問頁面集合中的頁面的終端數(shù)量,以及該歷史時間段內(nèi)從該指定頁面出發(fā)該頁面集合中的頁面被訪問的次數(shù),從而后續(xù)也可以針對該指定頁面,根據(jù)統(tǒng)計的評估時間段內(nèi)從該指定頁面出發(fā)該頁面集合中的頁面被訪問的次數(shù),確定該評估時間段內(nèi)從該指定頁面出發(fā)訪問該頁面集合中的頁面的終端數(shù)量,進而使得所確定的訪問頁面的終端數(shù)量更有針對性。下面結(jié)合附圖,用具體實施例對本發(fā)明提供的方法及裝置進行詳細描述。實施例1:圖2為本發(fā)明實施例1中提供的確定訪問頁面的終端數(shù)量的方法的流程圖,具體包括如下處理步驟:步驟201、獲取歷史時間段內(nèi)訪問頁面集合中的頁面的終端數(shù)量。優(yōu)選的,本步驟中可以獲取多個歷史時間段內(nèi)訪問頁面集合中的頁面的終端數(shù)量,例如,獲取η個時間段內(nèi)訪問頁面集合中的頁面的終端數(shù)量,η的取值可以根據(jù)實際需要進行靈活設(shè)置,η個時間段可以為時間長度相同的時間段,如每個時間段的時間長度為一天24小時。本步驟中所獲取的歷史時間段內(nèi)訪問頁面集合中的頁面的終端數(shù)量,可以是按照現(xiàn)有技術(shù)基于該歷史時間段內(nèi)的訪問日志進行統(tǒng)計得到的統(tǒng)計結(jié)果,也可以是按照本發(fā)明實施例提供的方法所確定的終端數(shù)量。本發(fā)明實施例1中,頁面集合中所包括的頁面可以是一個,也可以是多個,可以根據(jù)實際需要進行靈活設(shè)置,例如,可以設(shè)置為一個網(wǎng)站所包括的所有頁面,也可以設(shè)置為一個網(wǎng)站的主頁面,也可以設(shè)置為一個網(wǎng)站的某一個欄目所對應(yīng)的多個頁面。步驟202、獲取該歷史時間段內(nèi)該頁面集合中的頁面被訪問的次數(shù)。優(yōu)選的,當(dāng)上述步驟201中,獲取了多個歷史時間段內(nèi)訪問頁面集合中的頁面的終端數(shù)量時,相應(yīng)的,本步驟中也可以獲取該多個歷史時間段內(nèi)該頁面集合中的頁面被訪問的次數(shù)。本步驟中所獲取的該歷史時間段內(nèi)該頁面集合中的頁面被訪問的次數(shù),可以是基于該歷史時間段內(nèi)的訪問日志進行統(tǒng)計得到的統(tǒng)計結(jié)果,在統(tǒng)計該次數(shù)時,只需要針對該頁面集合中的頁面,對訪問的次數(shù)進行簡單疊加即可,不需要進行對比和排重處理。步驟203、確定獲取的終端數(shù)量與次數(shù)的比值。該比值可以是終端數(shù)量除以次數(shù)得到的比值,也可以是次數(shù)除以終端數(shù)量得到的比值。優(yōu)選的,當(dāng)上述步驟201和步驟202中,分別獲取了多個歷史時間段內(nèi)訪問頁面集合中的頁面的終端數(shù)量,以及該多個歷史時間段內(nèi)該頁面集合中的頁面被訪問的次數(shù)時,本步驟中,可以依次針對該多個歷史時間段中的每個歷史時間段,確定該歷史時間段內(nèi)訪問該頁面集合中的頁面的終端數(shù)量,與該歷史時間段內(nèi)該頁面集合中的頁面被訪問的次數(shù)的比值,然后,確定針對該多個歷史時間段分別確定的各比值的平均值,具體見如下公式:
權(quán)利要求
1.種確定訪問頁面的終端數(shù)量的方法,其特征在于,包括: 獲取歷史時間段內(nèi)訪問頁面集合中的頁面的終端數(shù)量,以及所述歷史時間段內(nèi)所述頁面集合中的頁面被訪問的次數(shù); 確定所述終端數(shù)量與所述次數(shù)的比值; 基于所述比值,根據(jù)統(tǒng)計的評估時間段內(nèi)所述頁面集合中的頁面被訪問的次數(shù),確定所述評估時間段內(nèi)訪問所述頁面集合中的頁面的終端數(shù)量。
2.權(quán)利要求1所述的方法,其特征在于,獲取歷史時間段內(nèi)訪問頁面集合中的頁面的終端數(shù)量,以及所述歷史時間段內(nèi)所述頁面集合中的頁面被訪問的次數(shù),具體包括: 獲取多個歷史時間段內(nèi)訪問頁面集合中的頁面的終端數(shù)量,以及所述多個歷史時間段內(nèi)所述頁面集合中的頁面被訪問的次數(shù); 確定所述終端數(shù)量與所述次數(shù)的比值,具體包括: 依次針對所述多個歷史時間段中的每個歷史時間段,確定該歷史時間段內(nèi)訪問所述頁面集合中的頁面的終端數(shù)量,與該歷史時間段內(nèi)所述頁面集合中的頁面被訪問的次數(shù)的比值; 確定針對所述多個歷史時間段分別確定的各比值的平均值。
3.權(quán)利要求1所述的方法,其特征在于,獲取歷史時間段內(nèi)訪問頁面集合中的頁面的終端數(shù)量,以及所述歷史時間段內(nèi)所述頁面集合中的頁面被訪問的次數(shù),具體包括: 獲取歷史時間段內(nèi)從指定頁面出發(fā)訪問頁面集合中的頁面的終端數(shù)量,以及所述歷史時間段內(nèi)從所述指定頁面出 發(fā)所述頁面集合中的頁面被訪問的次數(shù); 基于所述比值,根據(jù)統(tǒng)計的評估時間段內(nèi)所述頁面集合中的頁面被訪問的次數(shù),確定所述評估時間段內(nèi)訪問所述頁面集合中的頁面的終端數(shù)量,具體為: 基于所述比值,根據(jù)統(tǒng)計的評估時間段內(nèi)從所述指定頁面出發(fā)所述頁面集合中的頁面被訪問的次數(shù),確定所述評估時間段內(nèi)從所述指定頁面出發(fā)訪問所述頁面集合中的頁面的終端數(shù)量。
4.權(quán)利要求3所述的方法,其特征在于,獲取歷史時間段內(nèi)從指定頁面出發(fā)訪問頁面集合中的頁面的終端數(shù)量,以及所述歷史時間段內(nèi)從所述指定頁面出發(fā)所述頁面集合中的頁面被訪問的次數(shù),具體包括: 獲取多個歷史時間段內(nèi)從指定頁面出發(fā)訪問頁面集合中的頁面的終端數(shù)量,以及所述多個歷史時間段內(nèi)從所述指定頁面出發(fā)所述頁面集合中的頁面被訪問的次數(shù); 確定所述終端數(shù)量與所述次數(shù)的比值,具體包括: 依次針對所述多個歷史時間段中的每個歷史時間段,確定該歷史時間段內(nèi)從指定頁面出發(fā)訪問所述頁面集合中的頁面的終端數(shù)量,與該歷史時間段內(nèi)從所述指定頁面出發(fā)所述頁面集合中的頁面被訪問的次數(shù)的比值; 確定針對所述多個歷史時間段分別確定的各比值的平均值。
5.權(quán)利要求3或4所述的方法,其特征在于,還包括: 確定所述歷史時間段內(nèi)頁面集合中的頁面被訪問時的各來源頁面; 將所述各來源頁面之一作為所述指定頁面,并記錄所述評估時間段內(nèi)從該來源頁面出發(fā)訪問所述頁面集合中的頁面的終端數(shù)量;或者,依次將所述各來源頁面中的每個來源頁面作為所述指定頁面,并針對每個來源頁面記錄所述評估時間段內(nèi)從該來源頁面出發(fā)訪問所述頁面集合中的頁面的終端數(shù)量。
6.種確定訪問頁面的終端數(shù)量的裝置,其特征在于,包括: 獲取單元,用于獲取歷史時間段內(nèi)訪問頁面集合中的頁面的終端數(shù)量,以及所述歷史時間段內(nèi)所述頁面集合中的頁面被訪問的次數(shù); 第一確定單元,用于確定所述終端數(shù)量與所述次數(shù)的比值; 第二確定單元,用于基于所述比值,根據(jù)統(tǒng)計的評估時間段內(nèi)所述頁面集合中的頁面被訪問的次數(shù),確定所述評估時間段內(nèi)訪問所述頁面集合中的頁面的終端數(shù)量。
7.權(quán)利要求6所述的裝置,其特征在于,所述獲取單元,具體用于獲取多個歷史時間段內(nèi)訪問頁面集合中的頁面的終端數(shù)量,以及所述多個歷史時間段內(nèi)所述頁面集合中的頁面被訪問的次數(shù); 所述第一確定單元,具體用于依次針對所述多個歷史時間段中的每個歷史時間段,確定該歷史時間段內(nèi)訪問所述頁面集合中的頁面的終端數(shù)量,與該歷史時間段內(nèi)所述頁面集合中的頁面被訪問的次數(shù)的比值;并確定針對所述多個歷史時間段分別確定的各比值的平均值。
8.權(quán)利要求6所述的裝置,其特征在于,所述獲取單元,具體用于獲取歷史時間段內(nèi)從指定頁面出發(fā)訪問頁面集合中的頁面的終端數(shù)量,以及所述歷史時間段內(nèi)從所述指定頁面出發(fā)所述頁面集合中的頁面被訪問的次數(shù); 所述第二確定單元,具體用于基于所述比值,根據(jù)統(tǒng)計的評估時間段內(nèi)從所述指定頁面出發(fā)所述頁面集合中的頁面被訪問的次數(shù),確定所述評估時間段內(nèi)從所述指定頁面出發(fā)訪問所述頁面集合中的頁面的終端數(shù)量。
9.權(quán)利要求8所述的裝置,其 特征在于,所述獲取單元,具體用于獲取多個歷史時間段內(nèi)從指定頁面出發(fā)訪問頁面集合中的頁面的終端數(shù)量,以及所述多個歷史時間段內(nèi)從所述指定頁面出發(fā)所述頁面集合中的頁面被訪問的次數(shù); 所述第一確定單元,具體用于依次針對所述多個歷史時間段中的每個歷史時間段,確定該歷史時間段內(nèi)從指定頁面出發(fā)訪問所述頁面集合中的頁面的終端數(shù)量,與該歷史時間段內(nèi)從所述指定頁面出發(fā)所述頁面集合中的頁面被訪問的次數(shù)的比值;并確定針對所述多個歷史時間段分別確定的各比值的平均值。
10.權(quán)利要求8或9所述的裝置,其特征在于,還包括: 頁面確定單元,用于確定所述歷史時間段內(nèi)頁面集合中的頁面被訪問時的各來源頁面; 記錄單元,用于將所述各來源頁面之一作為所述指定頁面,并記錄所述評估時間段內(nèi)從該來源頁面出發(fā)訪問所述頁面集合中的頁面的終端數(shù)量;或者,依次將所述各來源頁面中的每個來源頁面作為所述指定頁面,并針對每個來源頁面記錄所述評估時間段內(nèi)從該來源頁面出發(fā)訪問所述頁面集合中的頁面的終端數(shù)量。
全文摘要
本發(fā)明公開了一種確定訪問頁面的終端數(shù)量的方法及裝置,包括獲取歷史時間段內(nèi)訪問頁面集合中的頁面的終端數(shù)量,以及該歷史時間段內(nèi)該頁面集合中的頁面被訪問的次數(shù);并確定獲取的該終端數(shù)量與該次數(shù)的比值;以及基于確定的該比值,根據(jù)統(tǒng)計的評估時間段內(nèi)該頁面集合中的頁面被訪問的次數(shù),確定該評估時間段內(nèi)訪問該頁面集合中的頁面的終端數(shù)量。采用本發(fā)明實施例提供的方案,減少了確定訪問頁面的終端數(shù)量時消耗的處理資源,并提高了處理效率。
文檔編號H04L29/08GK103095820SQ20131000145
公開日2013年5月8日 申請日期2013年1月4日 優(yōu)先權(quán)日2013年1月4日
發(fā)明者劉洋 申請人:新浪網(wǎng)技術(shù)(中國)有限公司