專利名稱::一種基于js腳本的web行為數(shù)據(jù)采集模型的制作方法
技術(shù)領(lǐng)域:
:本發(fā)明涉及互聯(lián)網(wǎng)WEB分析相關(guān)領(lǐng)域。
背景技術(shù):
:隨著互聯(lián)網(wǎng)的發(fā)展,WEB分析已經(jīng)成為很多企業(yè)采用的營銷服務(wù)之一。而在企業(yè)網(wǎng)站訪客的行為數(shù)據(jù)采集的環(huán)節(jié)上,還缺少一些成型的數(shù)據(jù)模型作為支撐,對訪客的WEB行為進行定義,并做適當(dāng)?shù)囊?guī)范和約束是非常必要的。目前市場上的WEB分析工具在數(shù)據(jù)采集模型上缺少完整的解決方案。
發(fā)明內(nèi)容為了解決上述存在的問題,本發(fā)明公開了一種基于JS腳本的WEB行為數(shù)據(jù)采集模型,即利用javascript行為采集技術(shù),按照采集參數(shù)規(guī)范表,詳細記錄在企業(yè)網(wǎng)站上進行瀏覽上的訪客的行為日志,并存入企業(yè)的訪客行為數(shù)據(jù)庫。本發(fā)明可應(yīng)用于互聯(lián)網(wǎng)WEB分析等領(lǐng)域。核心思想是(1)將javascript(簡稱JS)行為采集腳本嵌入到企業(yè)網(wǎng)站的WEB頁面中;(2)JS腳本按照采集參數(shù)規(guī)范表,對訪客的各類行為進行詳細記錄,形成行為日志;(3)將這些行為日志存入企業(yè)的訪客行為數(shù)據(jù)庫。上述"WEB頁面"指WEB分析中的WEB頁面。上述"WEB頁面"是指可以在瀏覽器中瀏覽、査看的靜態(tài)HTML頁面和程序編寫的動態(tài)頁面。上述"采集參數(shù)規(guī)范表"是指本發(fā)明中提到的《采集參數(shù)規(guī)范表1、系統(tǒng)自主探測的數(shù)據(jù)》和《采集參數(shù)規(guī)范表2、用戶可定制的數(shù)據(jù)》。上述"訪客行為"是指互聯(lián)網(wǎng)訪客在WEB頁面上的所有動作,包括訪問、瀏覽、點擊、停留、離開等。本發(fā)明填補了WEB分析領(lǐng)域在數(shù)據(jù)采集環(huán)節(jié)上的一項空白。具體實施例方式本發(fā)明采用的技術(shù)方案是通過在WEB頁面源碼中嵌入JS腳本來采集WEB行為信息,JS腳本按照《采集參數(shù)規(guī)范表l》和《采集參數(shù)規(guī)范表2》中定義的參數(shù)進行編寫;在行為數(shù)據(jù)發(fā)生時,JS腳本按照《采集參數(shù)規(guī)范表1》和《采集參數(shù)規(guī)范表2》中的詳細規(guī)定的行為數(shù)據(jù)予以全面記錄;記錄下的行為數(shù)據(jù)按照隊列方式均勻?qū)懭霐?shù)據(jù)庫。具體工作流程如下(1)、首先將同一段javascript采集腳本嵌入到待監(jiān)測的頁面的源碼中;(2)、javascript腳本能夠自動工作,采集到每一次的訪問行為數(shù)據(jù),艮P:《采集參數(shù)規(guī)范表》中規(guī)定的各類行為字段的數(shù)據(jù);(3)、這些行為數(shù)據(jù)寫入數(shù)據(jù)庫;(4)、針對該數(shù)據(jù)庫,可以進行數(shù)據(jù)分析與挖掘。JS數(shù)據(jù)采集技術(shù)在具體實現(xiàn)時,可以參考以下JS腳本的編寫方式和具體的應(yīng)用實例<!DOCTYPEhtmlPUBLIC'V/W3C//DTDXHTML1.0Transitional//EN""http:〃www.w3.org/TR/xhtml1/DTD/xhtml1-transitional,dtd"〉〈htmlxmlns^"http:〃www.w3.org/1999/xhtml"><head><metahttp-equiv="Content-Type"content="text/html;charset=gb2312"/><title>SomeTitle</title></hsad><body><Z—/51盟謝艦韻—><Z-微紐微/微薪萬糸-><Scrij^妙e:〃/cx咖msmW〉妙《='toc咖而m》U^^C/w)^W從.<'-微^主資層,麟JT—></-,貌娜微湖->〃斜辦微能乂體,;//濕#蘿徵/</A"C尸ag函附erG/^導(dǎo)應(yīng)議"六//^^名#^.5"£/7^|^丄<^1'0|/17及£廣'/冶^:/6:/^/^/^/"六//^^;^奪邀龍Aflj"f/^P"^W/"e「汰W」,v/^"^"每沃i^游份澄〃冶譜多鄉(xiāng)靜微體^ff.7>"cAEO>/Yifeff"卵2W,'W《"22T,2,79V'^0""人v/史l^^欽^,廢/M叛識顆^"_#,^欽</層謹^戶^定劍微薪絲—><.'—7S屋鍵麟扇—></body></html>以上加粗斜體部分就是用于采集JS腳本,一般放在〈/body〉之前。應(yīng)該理解,對于本領(lǐng)域技術(shù)人員來說很明顯可以對根據(jù)本發(fā)明權(quán)利要求中描述的方法,并結(jié)合以上范例做出多種修改和變更,甚至尋求其他編程手段而不脫離本發(fā)明的精神和范圍。本發(fā)明意在覆蓋在所附權(quán)利要求及其等效物范圍內(nèi)提供的本發(fā)明的修改和變型。表1描述的是系統(tǒng)自主探測的數(shù)據(jù)字段。'表2描述的是用戶可定制的數(shù)據(jù)字段。<table>tableseeoriginaldocumentpage8</column></row><table><table>tableseeoriginaldocumentpage9</column></row><table><table>tableseeoriginaldocumentpage10</column></row><table><table>tableseeoriginaldocumentpage11</column></row><table><table>tableseeoriginaldocumentpage12</column></row><table><table>tableseeoriginaldocumentpage13</column></row><table><table>tableseeoriginaldocumentpage14</column></row><table>權(quán)利要求1.本發(fā)明公開了一種基于JS腳本的WEB行為數(shù)據(jù)采集模型,即利用javascript行為采集技術(shù),按照采集參數(shù)規(guī)范表,詳細記錄在企業(yè)網(wǎng)站上進行瀏覽上的訪客的行為日志,并存入企業(yè)的訪客行為數(shù)據(jù)庫。本發(fā)明可應(yīng)用于互聯(lián)網(wǎng)WEB分析等領(lǐng)域。核心思想是(1)將javascript(簡稱JS)行為采集腳本嵌入到企業(yè)網(wǎng)站的WEB頁面中;(2)JS腳本按照采集參數(shù)規(guī)范表,對訪客的各類行為進行詳細記錄,形成行為日志;(3)將這些行為日志存入企業(yè)的訪客行為數(shù)據(jù)庫。上述“WEB頁面”是指可以在瀏覽器中瀏覽、查看的靜態(tài)HTML頁面和程序編寫的動態(tài)頁面。上述“采集參數(shù)規(guī)范表”是指本發(fā)明中提到的《采集參數(shù)規(guī)范表1》和《采集參數(shù)規(guī)范表2》。上述“訪客行為”是指互聯(lián)網(wǎng)訪客在WEB頁面上的所有動作,包括訪問、瀏覽、點擊、停留、離開等。2.根據(jù)權(quán)利1要求所述的一種基于JS腳本的WEB行為數(shù)據(jù)采集模型,其特征在于所述行為采集方法的特征是基于javascript腳本(簡稱JS)。3.根據(jù)權(quán)利1要求所述的一種基于JS腳本的WEB行為數(shù)據(jù)采集模型,其特征在于所述JS腳本采集的規(guī)范是《采集參數(shù)規(guī)范表l》和《采集參數(shù)規(guī)范表2》(詳見)。4.根據(jù)權(quán)利1要求所述的一種基于JS腳本的WEB行為數(shù)據(jù)采集模型,其特征在于所述采集參數(shù)規(guī)范表包括系統(tǒng)自主探測的數(shù)據(jù)和定制數(shù)據(jù),其中系統(tǒng)自主探測的數(shù)據(jù)是指JS腳本能夠采集到的行為數(shù)據(jù),而定制數(shù)據(jù)則是指與企業(yè)的營銷活動、應(yīng)用相關(guān)的定制參數(shù)。5.根據(jù)權(quán)利1要求所述的一種基于JS腳本的WEB行為數(shù)據(jù)采集模型,其特征在于所述采集參數(shù)規(guī)范表中系統(tǒng)自主探測的數(shù)據(jù)包括但不限于《采集參數(shù)規(guī)范表1-系統(tǒng)自主探測的數(shù)據(jù)》(詳見)中的所提及的所有字段。6.根據(jù)權(quán)利1要求所述的一種基于JS腳本的WEB行為數(shù)據(jù)采集模型,其特征在于所述采集參數(shù)規(guī)范表中定制數(shù)據(jù)包括但不限于《采集參數(shù)規(guī)范表2-定制數(shù)據(jù)》(詳見)中的所提及的所有字段。全文摘要本發(fā)明公開了一種基于JS腳本的WEB行為數(shù)據(jù)采集模型,即利用javascript行為采集技術(shù),按照采集參數(shù)規(guī)范表,詳細記錄在企業(yè)網(wǎng)站上進行瀏覽上的訪客的行為日志,并存入企業(yè)的訪客行為數(shù)據(jù)庫。本發(fā)明可應(yīng)用于互聯(lián)網(wǎng)WEB分析等領(lǐng)域。核心思想是(1)將javascript(簡稱JS)行為采集腳本嵌入到企業(yè)網(wǎng)站的WEB頁面中;(2)JS腳本按照采集參數(shù)規(guī)范表,對訪客的各類行為進行詳細記錄,形成行為日志;(3)將這些行為日志存入企業(yè)的訪客行為數(shù)據(jù)庫。文檔編號G06F17/30GK101620630SQ200910148548公開日2010年1月6日申請日期2009年6月29日優(yōu)先權(quán)日2009年6月29日發(fā)明者傅海波,李存剛,凱王,魯雪林申請人:北京黑米天成科技有限公司