專利名稱:全網(wǎng)通址企業(yè)個性化搜索營銷平臺系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種全網(wǎng)通址企業(yè)個性化搜索營銷平臺系統(tǒng)領(lǐng)域
背景技術(shù):
因為手機配置較低,手機上網(wǎng)具有很大的局限性,大多數(shù)手機不能訪問傳統(tǒng)互聯(lián)網(wǎng)(web頁面)。這主要是因為以下原因I、大多數(shù)手機瀏覽器為單純的wap瀏覽器,不支持訪問傳統(tǒng)web頁面;2、傳統(tǒng)互聯(lián)網(wǎng)頁面信息量大,一般一個頁面容量達(dá)到幾百K,而手機單機處理傳統(tǒng)頁面時壓力很大、速度較慢甚至不能處理;3、傳統(tǒng)互聯(lián)網(wǎng)頁面是針對pc終端設(shè)計,對手機終端小屏幕而言,頁面效果差,可 讀性很不好。
發(fā)明內(nèi)容
本發(fā)明為可克服上述缺點,而提供一種全網(wǎng)通址企業(yè)個性化搜索營銷平臺系統(tǒng)。具體實現(xiàn)為基于用戶行為分析模型、網(wǎng)頁特征分析模型、動態(tài)變量分析模型等模型的基礎(chǔ)上,自主開發(fā)了 “改進型pagerank搜索算法”,提供以用戶為中心的個性化手機搜索服務(wù),顯著提高了手機搜索結(jié)果滿意率。包括如下步驟。1,基于傳統(tǒng)搜索引擎技術(shù)建立數(shù)據(jù)源庫,就是首先以客觀、公正的網(wǎng)頁重要性對網(wǎng)頁進數(shù)據(jù)分析處理;2,引入“網(wǎng)頁特征分析模型”“網(wǎng)頁特征分析模型”是通過對網(wǎng)頁大量分析后,用一組具有特征描述的關(guān)鍵詞組成多維陣列,如“所屬行業(yè)”可以作為一個網(wǎng)頁一級特征,而“旅游”、“汽車”都可以看作這一特征下的子級描述,網(wǎng)頁特征的判斷和各級特征之間的邏輯關(guān)系都符合固定規(guī)則和算法。3,引入“用戶行為分析模型”每個用戶都有自己的行為特征,反映在網(wǎng)絡(luò)上就是他們會有不同的操作習(xí)慣和網(wǎng)頁訪問習(xí)慣。我們通過對用戶較長時間操作行為進行記錄,通過數(shù)據(jù)挖掘中“神經(jīng)網(wǎng)絡(luò)聚類分析方法”對用戶的行為進行分析,建立“用戶行為分析模型”。這個模型反映了一個用戶較長時期的行為習(xí)慣,且這種行為習(xí)慣具有連續(xù)性和慣性。4,引入“動態(tài)因素分析模型”“動態(tài)因素”主要是采集分析某時間段內(nèi)的變量,如最近十分鐘內(nèi)用戶的搜索關(guān)鍵詞、武漢的手機號碼目前出現(xiàn)在杭州等。動態(tài)因素發(fā)生是在短期內(nèi)的,是變化的,但是“動態(tài)因素分析模型”則是根據(jù)對眾多“動態(tài)因素”分析,運用數(shù)據(jù)挖掘中“神經(jīng)網(wǎng)絡(luò)聚”中的分類(Classification)、估值(Estimation)、預(yù)言(Prediction)等算法推演出“動態(tài)因素”導(dǎo)致的變化趨勢。對用戶某一個“動態(tài)因素”,可以通過“動態(tài)因素分析模型”分析其行為的最大可能性。
本發(fā)明有益的結(jié)果是1,更符合用戶需求通過對用戶行為模型的分析,考慮用戶“移動”的特性,提供更符合用戶習(xí)慣和需求的搜索結(jié)果。2,成長性“用戶行為分析模型”需要長期記錄、分析用戶的行為習(xí)慣,隨著時間的增加,“用戶行為分析模型”將更有權(quán)威性,更接近真實。3,兼容性改進手機搜索實在傳統(tǒng)pc搜索的基礎(chǔ)上發(fā)展而來,與傳統(tǒng)搜索兼容。
圖I實施例中本發(fā)明方法得以實現(xiàn)的原理流程2實施例中功能效果圖
圖3實施例中手機頁面截4實施例中手機手機搜索結(jié)果截圖
具體實施例方式目前手機訪問傳統(tǒng)互聯(lián)網(wǎng)一直存在較大障礙,只有少數(shù)高端手機才能夠自主訪問。這里邊的主要障礙包括基于手機終端的無線搜索是“面向3G網(wǎng)絡(luò)的手機上網(wǎng)和搜索的支持系統(tǒng)”中最重要的應(yīng)用功能,我們在對以google、baidu為代表的傳統(tǒng)pc搜索引擎技術(shù)進行深入研究后,認(rèn)為目前的搜索技術(shù)直接移植到無線搜索領(lǐng)域有較大局限性I,目前的搜索原理主要是基于PageRank算法,pagerank根據(jù)網(wǎng)站的外部鏈接和內(nèi)部鏈接的數(shù)量和質(zhì)量來衡量網(wǎng)站的價值,它對網(wǎng)頁主要評價標(biāo)準(zhǔn)就是“重要性”(PR值),但是對網(wǎng)頁自身文本的語義邏輯重視不夠,這就相當(dāng)于了解一個人主要聽第三方的介紹而沒有直接與本人溝通;2,客觀、公正是pagerank為代表的傳統(tǒng)pc搜索算法的特點和優(yōu)點,但是這種排名在某種角度考慮就是死板、生硬。比如對不同人搜索同一個關(guān)鍵詞的搜索結(jié)果是固定的,從簡單邏輯角度分析,我們就知道有人對這個結(jié)果排序比較滿意,肯定也有人不太滿意,這就說明客觀、公正的pagerank算法忽略了 “人”這一動態(tài)變量在搜索中的影響;3,目前搜索追求的是搜索的速度和數(shù)量,一個關(guān)鍵詞搜索結(jié)果常常數(shù)十萬數(shù)百萬條,而人們可能會看的往往是前幾頁的搜索結(jié)果。對以手機終端的無線搜索來說,因為屏幕單頁顯示數(shù)量有限(一般不超過5條搜索結(jié)果)而且翻頁不便,更追求搜索結(jié)果的首頁命中率,也就是在前5條搜索結(jié)果中找到需要的鏈接。4,手機終端有其特性,如私密性(一部手機只有一個用戶)、移動性、可監(jiān)控(獲取手機號碼)等,在搜索上需要更獨特的設(shè)計。針對以上傳統(tǒng)pc搜索引擎的不足,基于用戶行為分析模型、網(wǎng)頁特征分析模型、動態(tài)變量分析模型等模型的基礎(chǔ)上,自主開發(fā)了 “改進型pagerank搜索算法”,改進算法主要有以下特征5,基于傳統(tǒng)搜索引擎技術(shù)建立數(shù)據(jù)源庫,就是首先以客觀、公正的網(wǎng)頁重要性對網(wǎng)頁進數(shù)據(jù)分析處理;6,引入“網(wǎng)頁特征分析模型”“網(wǎng)頁特征分析模型”是通過對網(wǎng)頁大量分析后,用一組具有特征描述的關(guān)鍵詞組成多維陣列,如“所屬行業(yè)”可以作為一個網(wǎng)頁一級特征,而“旅游”、“汽車”都可以看作這一特征下的子級描述,網(wǎng)頁特征的判斷和各級特征之間的邏輯關(guān)系都符合固定規(guī)則和算法。對網(wǎng)頁進行分析時,除了根據(jù)網(wǎng)站的外部鏈接和內(nèi)部鏈接的數(shù)量和質(zhì)量來來對網(wǎng)頁評值外,還對網(wǎng)頁文本內(nèi)容從語義邏輯上進行分析,為網(wǎng)頁賦予新的特征,如該網(wǎng)頁被多家旅游網(wǎng)站索引,且在文中多次出現(xiàn)“黃鶴樓”關(guān)鍵字,通過對“網(wǎng)頁特征分析模型”查詢,“旅游”就是本網(wǎng)頁的特征值之一。7,引入“用戶行為分析模型”每個用戶都有自己的行為特征,反映在網(wǎng)絡(luò)上就是他們會有不同的操作習(xí)慣和網(wǎng)頁訪問習(xí)慣。我們通過對用戶較長時間操作行為進行記錄,通過數(shù)據(jù)挖掘中“神經(jīng)網(wǎng)絡(luò)聚類分析方法”對用戶的行為進行分析,建立“用戶行為分析模型”。這個模型反映了一個用戶較長時期的行為習(xí)慣,且這種行為習(xí)慣具有連續(xù)性和慣性。8,引入“動態(tài)因素分析模型”“動態(tài)因素”主要是采集分析某時間段內(nèi)的變量,如最近十分鐘內(nèi)用戶的搜索關(guān)鍵 詞、武漢的手機號碼目前出現(xiàn)在杭州等。動態(tài)因素發(fā)生是在短期內(nèi)的,是變化的,但是“動態(tài)因素分析模型”則是根據(jù)對眾多“動態(tài)因素”分析,運用數(shù)據(jù)挖掘中“神經(jīng)網(wǎng)絡(luò)聚”中的分類(Classification)、估值(Estimation)、預(yù)言(Prediction)等算法推演出“動態(tài)因素”導(dǎo)致的變化趨勢。對用戶某一個“動態(tài)因素”,可以通過“動態(tài)因素分析模型”分析其行為的最大可能性。其中網(wǎng)頁分析數(shù)據(jù)包含了而代搜索里的網(wǎng)頁“重要性排序”(pagerank算法),也包括了網(wǎng)頁特征值。改進型pagerank算法手機搜索具有以下特性I、兼容性改進手機搜索實在傳統(tǒng)pc搜索的基礎(chǔ)上發(fā)展而來,它首先承認(rèn)包容傳統(tǒng)PC搜索排名的價值,這保證改進手機搜索的效果不低于傳統(tǒng)pc搜索結(jié)果排名。2、成長性“用戶行為分析模型”需要長期記錄、分析用戶的行為習(xí)慣,隨著時間的增加,“用戶行為分析模型”將更有權(quán)威性,更接近真實。3、尤其適合于無線搜索,很多用戶行為和動態(tài)變量在傳統(tǒng)pc搜索中無法獲得,而在手機作為搜索終端的無線搜索領(lǐng)域則可以獲取。4,效果更好根據(jù)我們手機用戶搜索調(diào)查,各階段就分析效果基本可以達(dá)到下圖所示。
權(quán)利要求
1.一種全網(wǎng)通址企業(yè)個性化搜索營銷平臺系統(tǒng),其特征在于,該方法包括如下步驟 基于用戶行為分析模型、網(wǎng)頁特征分析模型、動態(tài)變量分析模型等模型的基礎(chǔ)上,自主開發(fā)了“改進型pagerank搜索算法”,提供以用戶為中心的個性化手機搜索服務(wù),顯著提高了手機搜索結(jié)果滿意率。包括如下步驟。
1,基于傳統(tǒng)搜索引擎技術(shù)建立數(shù)據(jù)源庫,就是首先以客觀、公正的網(wǎng)頁重要性對網(wǎng)頁進數(shù)據(jù)分析處理; 2,引入“網(wǎng)頁特征分析模型” “網(wǎng)頁特征分析模型”是通過對網(wǎng)頁大量分析后,用一組具有特征描述的關(guān)鍵詞組成多維陣列,如“所屬行業(yè)”可以作為一個網(wǎng)頁一級特征,而“旅游”、“汽車”都可以看作這一特征下的子級描述,網(wǎng)頁特征的判斷和各級特征之間的邏輯關(guān)系都符合固定規(guī)則和算法。
3,引入“用戶行為分析模型” 每個用戶都有自己的行為特征,反映在網(wǎng)絡(luò)上就是他們會有不同的操作習(xí)慣和網(wǎng)頁訪問習(xí)慣。我們通過對用戶較長時間操作行為進行記錄,通過數(shù)據(jù)挖掘中“神經(jīng)網(wǎng)絡(luò)聚類分析方法”對用戶的行為進行分析,建立“用戶行為分析模型”。這個模型反映了一個用戶較長時期的行為習(xí)慣,且這種行為習(xí)慣具有連續(xù)性和慣性。
4,引入“動態(tài)因素分析模型” “動態(tài)因素”主要是采集分析某時間段內(nèi)的變量,如最近十分鐘內(nèi)用戶的搜索關(guān)鍵詞、武漢的手機號碼目前出現(xiàn)在杭州等。動態(tài)因素發(fā)生是在短期內(nèi)的,是變化的,但是“動態(tài)因素分析模型”則是根據(jù)對眾多“動態(tài)因素”分析,運用數(shù)據(jù)挖掘中“神經(jīng)網(wǎng)絡(luò)聚”中的分類(Classification)、估值(Estimation)、預(yù)言(Prediction)等算法推演出“動態(tài)因素”導(dǎo)致的變化趨勢。對用戶某一個“動態(tài)因素”,可以通過“動態(tài)因素分析模型”分析其行為的最大可能性。
2.根據(jù)權(quán)利要求I所述的一種全網(wǎng)通址企業(yè)個性化搜索營銷平臺系統(tǒng),其特征在于基于用戶行為分析模型、網(wǎng)頁特征分析模型、動態(tài)變量分析模型等模型的基礎(chǔ)上,自主開發(fā)了“改進型pagerank搜索算法”,提供以用戶為中心的個性化手機搜索服務(wù),顯著提高了手機搜索結(jié)果滿意率。
全文摘要
本發(fā)明涉及一種全網(wǎng)通址企業(yè)個性化搜索營銷平臺系統(tǒng),該系統(tǒng)基于用戶行為分析模型、網(wǎng)頁特征分析模型、動態(tài)變量分析模型等模型的基礎(chǔ)上,自主開發(fā)了“改進型pagerank搜索算法”,提供以用戶為中心的個性化手機搜索服務(wù),顯著提高了手機搜索結(jié)果滿意率。本發(fā)明有益的效果是1,更符合用戶需求通過對用戶行為模型的分析,考慮用戶“移動”的特性,提供更符合用戶習(xí)慣和需求的搜索結(jié)果。2,成長性 “用戶行為分析模型”需要長期記錄、分析用戶的行為習(xí)慣,隨著時間的增加,“用戶行為分析模型”將更有權(quán)威性,更接近真實。3,兼容性 改進手機搜索實在傳統(tǒng)pc搜索的基礎(chǔ)上發(fā)展而來,與傳統(tǒng)搜索兼容。
文檔編號G06F17/30GK102810106SQ201110151358
公開日2012年12月5日 申請日期2011年6月2日 優(yōu)先權(quán)日2011年6月2日
發(fā)明者徐斌, 何慶, 榮紅軍 申請人:杭州手趣科技有限公司