一種發(fā)送采集數(shù)據(jù)的系統(tǒng)和方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及到互聯(lián)網(wǎng)中的數(shù)據(jù)采集領(lǐng)域,更具體地涉及到一種發(fā)送采集數(shù)據(jù)的系統(tǒng)和方法。
【背景技術(shù)】
[0002]網(wǎng)站分析是依據(jù)采集到的網(wǎng)站的PV(page view,網(wǎng)頁瀏覽量)日志,網(wǎng)站的點擊(或者稱事件)日志,網(wǎng)站的效果日志(包括登錄,訂單等)等數(shù)據(jù),分析訪客在網(wǎng)站上的行為,例如PV行為包括訪客的訪問量和流失率等。其中,網(wǎng)站的點擊行為包括用戶是否下載文件,是否訪問社交按鈕,是否點擊廣告等,網(wǎng)站的效果行為包括訪客是否登錄、投放廣告或下單信息等。
[0003]目前業(yè)界一般使用Javascript來采集這些數(shù)據(jù),但采集到的數(shù)據(jù)需要發(fā)送給數(shù)據(jù)服務(wù)器進行供分析。
[0004]為此,網(wǎng)站會在網(wǎng)頁中埋入相關(guān)的JS (腳本),通過JS去抓取用戶的相關(guān)信息并通過構(gòu)造一個一像素大小的圖片將數(shù)據(jù)返回數(shù)據(jù)服務(wù)器。在一般的情況下,如果直接去構(gòu)造一個一像素的圖片,并將所采集的數(shù)據(jù)作為其參數(shù),其可能會因為命中緩存或因為GC(垃圾回收機制)的影響,而導(dǎo)致部分數(shù)據(jù)不能有效的發(fā)送到后臺的數(shù)據(jù)服務(wù)器。
[0005]因此,確有必要提供一種新的數(shù)據(jù)采集的系統(tǒng)和方法,以解決上述問題。
【發(fā)明內(nèi)容】
[0006]針對上述問題,本發(fā)明提出了
[0007]—種發(fā)送采集數(shù)據(jù)的系統(tǒng),所述系統(tǒng)包括網(wǎng)頁前端服務(wù)器、網(wǎng)頁瀏覽客戶端和數(shù)據(jù)收集服務(wù)器,其特征在于,
[0008]所述網(wǎng)頁前端服務(wù)器提供需要做數(shù)據(jù)采集的網(wǎng)頁,在該網(wǎng)頁中設(shè)置有數(shù)據(jù)采集工具和采集數(shù)據(jù)的發(fā)送工具;
[0009]所述網(wǎng)頁瀏覽客戶端下載所述網(wǎng)頁以及其中所設(shè)置的數(shù)據(jù)采集工具和采集數(shù)據(jù)的發(fā)送工具,當所述數(shù)據(jù)采集工具完成數(shù)據(jù)采集后,所述采集數(shù)據(jù)的發(fā)送工具構(gòu)造一個地址指向數(shù)據(jù)收集服務(wù)器的一個圖片的圖片對象,并將所采集的數(shù)據(jù)作為訪問所述圖片的參數(shù),同時,所述采集數(shù)據(jù)的發(fā)送工具還構(gòu)造了一個隨機串,作為訪問所述圖片的另外一個參數(shù),之后,所述采集數(shù)據(jù)的發(fā)送工具以上述地址和參數(shù)向數(shù)據(jù)收集服務(wù)器發(fā)送訪問所述圖片的請求;
[0010]所述數(shù)據(jù)收集服務(wù)器接收上述訪問圖片請求后,解析并記錄作為所述圖片的訪問參數(shù)的采集數(shù)據(jù)。
[0011]優(yōu)選地,在所述發(fā)送采集數(shù)據(jù)的系統(tǒng)中,所述圖片僅有一個像素。
[0012]優(yōu)選地,在所述發(fā)送采集數(shù)據(jù)的系統(tǒng)中,所述采集數(shù)據(jù)的發(fā)送工具所構(gòu)造的隨機串包括當前時間和一個隨機數(shù)。
[0013]優(yōu)選地,在所述發(fā)送采集數(shù)據(jù)的系統(tǒng)中,所述發(fā)送采集數(shù)據(jù)的系統(tǒng)所在的網(wǎng)絡(luò)環(huán)境中有緩存。
[0014]優(yōu)選地,在所述發(fā)送采集數(shù)據(jù)的系統(tǒng)中,所述采集數(shù)據(jù)的發(fā)送工具以javascript編寫。
[0015]本發(fā)明的另外一方面,提供了一種利用權(quán)利要求1所述系統(tǒng)發(fā)送采集數(shù)據(jù)的方法,所述方法包括如下步驟:
[0016]所述網(wǎng)頁瀏覽客戶端下載所述網(wǎng)頁以及其中所設(shè)置的數(shù)據(jù)采集工具和采集數(shù)據(jù)的發(fā)送工具;
[0017]所述數(shù)據(jù)采集工具完成數(shù)據(jù)采集;
[0018]所述采集數(shù)據(jù)的發(fā)送工具構(gòu)造一個地址指向數(shù)據(jù)收集服務(wù)器的圖片的圖片對象,將所采集的數(shù)據(jù)作為訪問所述圖片的參數(shù),構(gòu)造了一個隨機串,作為訪問所述圖片的另外一個參數(shù);
[0019]所述采集數(shù)據(jù)的發(fā)送工具以上述地址和參數(shù)向數(shù)據(jù)收集服務(wù)器發(fā)送訪問所述圖片的請求;
[0020]所述數(shù)據(jù)收集服務(wù)器接收上述訪問圖片請求后,解析并記錄作為所述圖片的訪問參數(shù)的采集數(shù)據(jù)。
[0021]優(yōu)選地,在上述發(fā)送采集數(shù)據(jù)的方法中,所述圖片僅有一個像素。
[0022]優(yōu)選地,在上述發(fā)送采集數(shù)據(jù)的方法中,所述采集數(shù)據(jù)的發(fā)送工具所構(gòu)造的隨機串包括當前時間和一個隨機數(shù)。
[0023]優(yōu)選地,在上述發(fā)送采集數(shù)據(jù)的方法中,所述發(fā)送采集數(shù)據(jù)的方法所在的網(wǎng)絡(luò)環(huán)境中有緩存。
[0024]優(yōu)選地,在上述發(fā)送采集數(shù)據(jù)的方法中,所述采集數(shù)據(jù)的發(fā)送工具以javascript編寫。
[0025]上述發(fā)送采集數(shù)據(jù)的系統(tǒng)和方法由于在所構(gòu)造的圖片中加入了隨機串,使得其可以不被緩存或GC(垃圾回收機制)的影響,將采集的數(shù)據(jù)有效地發(fā)送給數(shù)據(jù)收集服務(wù)器。
【附圖說明】
[0026]圖1為本發(fā)明所述的發(fā)送采集數(shù)據(jù)的系統(tǒng)的示意圖;
[0027]圖2為本發(fā)明所述的發(fā)送采集數(shù)據(jù)的方法的執(zhí)行步驟。
【具體實施方式】
[0028]下面將結(jié)合具體實施例對本發(fā)明進行詳細說明,但應(yīng)該明白的是,這些實施例僅用來說明本發(fā)明,并不構(gòu)成對本發(fā)明的限定。
[0029]參考圖1,根據(jù)本發(fā)明的一個實施例,所述發(fā)送采集數(shù)據(jù)的系統(tǒng)包括網(wǎng)頁前端服務(wù)器1、網(wǎng)頁瀏覽客戶端2和數(shù)據(jù)收集服務(wù)器3。
[0030]所述網(wǎng)頁前端服務(wù)器1提供需要做數(shù)據(jù)采集的網(wǎng)頁,在該網(wǎng)頁中設(shè)置有數(shù)據(jù)采集工具和采集數(shù)據(jù)的發(fā)送工具;例如在一個網(wǎng)頁中包含有如下標簽:
[0031]〈script type = "text/javascripi/'src = "collect.js^X/script)
[0032]〈script type = "text/javascripi/'src = "dataSend.js^X/script)
[0033]其中collect, js是以javascript編寫的數(shù)據(jù)采集工具,dataSend.js是以javascript編寫的采集數(shù)據(jù)的發(fā)送工具。當然,如本領(lǐng)域技術(shù)人員所公知的,上述兩個工具也可以合并在一個js包中。
[0034]網(wǎng)頁瀏覽客戶端2在打開上述網(wǎng)頁時,會下載數(shù)據(jù)采集工具collect, js和采集數(shù)據(jù)的發(fā)送工具dataSend.js。根據(jù)數(shù)據(jù)采集的要求,數(shù)據(jù)采集工具執(zhí)行collect, js中的數(shù)據(jù)采集方法onCollectO來完成數(shù)據(jù)的采集。
[0035]當數(shù)據(jù)采集完成后,需要將所采集的數(shù)據(jù)發(fā)送給數(shù)據(jù)收集服務(wù)器3,在本實施例中,該發(fā)送過程由采集數(shù)據(jù)的發(fā)送工具dataSend.js中的方法onSendO方法完成,該方法首先構(gòu)造一個圖片對象,并將所述圖片對象賦值給window的一個全局對象,該圖片對象的源地址指向數(shù)據(jù)收集服務(wù)器3上的一個圖片,例如:
[0036]<image src = ^dataSever/img/1.jpg^X/image)
[0037]其中,dataSever/img/1.jpg為數(shù)據(jù)收集服務(wù)器3上的一個圖片地址。
[0038]為了將采集的數(shù)據(jù)發(fā)送到數(shù)據(jù)收集服務(wù)器3,可以將采集到的數(shù)據(jù)組織為一個串,并作為上述圖片對象源地址后的一個參數(shù),例如:
[0039]<image src = "dataSever/img/1