欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

提供下載鏈接的方法及系統(tǒng)的制作方法

文檔序號:6515237閱讀:200來源:國知局
提供下載鏈接的方法及系統(tǒng)的制作方法
【專利摘要】本發(fā)明公開了提供下載鏈接的方法及系統(tǒng),其中提供下載鏈接的方法包括:獲取用戶從搜索結(jié)果網(wǎng)頁跳轉(zhuǎn)到目標網(wǎng)頁的過程中,所述搜索結(jié)果網(wǎng)頁的網(wǎng)址;獲取所述搜索結(jié)果網(wǎng)頁的網(wǎng)址中包括的查詢詞和/或所述目標網(wǎng)頁的標題作為查詢信息;以所述查詢信息查詢預(yù)置的下載鏈接庫,獲取與所述查詢信息相匹配的下載鏈接;提供所述相匹配的下載鏈接。能夠根據(jù)用戶進行網(wǎng)頁瀏覽的跳轉(zhuǎn)過程,更高效和準確地提供下載鏈接,使所提供的下載鏈接更準確地用戶的真實需求,提高用戶下載資源的效率。
【專利說明】提供下載鏈接的方法及系統(tǒng)
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及計算機網(wǎng)絡(luò)【技術(shù)領(lǐng)域】,具體涉及提供下載鏈接的方法及系統(tǒng)。
【背景技術(shù)】
[0002]隨著計算機應(yīng)用的普及和互聯(lián)網(wǎng)的快速發(fā)展,網(wǎng)絡(luò)下載逐漸成為用戶獲取網(wǎng)絡(luò)資源的主要手段。為了更好滿足用戶不斷提高的下載需求,出現(xiàn)了許多提供資源下載服務(wù)的web站點,包括很多門戶網(wǎng)站在內(nèi)的web提供網(wǎng)絡(luò)資源的下載服務(wù)為廣大用戶尋找網(wǎng)絡(luò)資源提供了便利。
[0003]用戶在互聯(lián)網(wǎng)上尋找網(wǎng)絡(luò)資源時,需要首先定位到目標網(wǎng)絡(luò)資源,然后根據(jù)網(wǎng)絡(luò)資源的網(wǎng)絡(luò)位置進行下載。通常的網(wǎng)絡(luò)資源定位手段包括,使用搜索引擎,以資源關(guān)鍵詞或站點的信息進行檢索,通過搜索引擎提供的結(jié)果列表到達資源下載頁面;輸入地址訪問下載站點或者下載頁面等。但在資源下載頁面中,存在需要通過輸入驗證碼或需要登錄才能獲取的資源下載鏈接的情況;還有的將下載鏈接設(shè)計在了當(dāng)前頁面的下級子頁面中;甚至為了推廣產(chǎn)品等目的,有的下載頁面中包含虛假的資源下載鏈接誤導(dǎo)用戶點擊;這些都給用戶從下載頁面中獲取真實有效的資源下載鏈接造成了不便。此外,針對不同的類別的網(wǎng)絡(luò)資源,用戶對的下載鏈接有不同的精準度需求,現(xiàn)有技術(shù)針對整個互聯(lián)網(wǎng)進行推薦,沒有考慮用戶對不同垂直類別的精準度需求。
[0004]綜上,迫切需要本領(lǐng)域技術(shù)人員解決的問題就在于,如何更高效和準確地提供下載鏈接,使所提供的下載鏈接更準確地用戶的真實需求,提高用戶下載資源的效率。

【發(fā)明內(nèi)容】

[0005]鑒于上述問題,提出了本發(fā)明以便提供一種克服上述問題或者至少部分地解決上述問題的提供下載鏈接的系統(tǒng)和相應(yīng)的提供下載鏈接的方法。
[0006]依據(jù)本發(fā)明的一個方面,提供了 一種提供下載鏈接的方法,其特征在于,包括:
[0007]獲取用戶從搜索結(jié)果網(wǎng)頁跳轉(zhuǎn)到目標網(wǎng)頁的過程中,所述搜索結(jié)果網(wǎng)頁的網(wǎng)址;
[0008]獲取所述搜索結(jié)果網(wǎng)頁的網(wǎng)址中包括的查詢詞和/或所述目標網(wǎng)頁的標題作為查詢信息;
[0009]以所述查詢信息查詢預(yù)置的下載鏈接庫,獲取與所述查詢信息相匹配的下載鏈接;
[0010]提供所述相匹配的下載鏈接。
[0011]可選的,所述獲取用戶從搜索結(jié)果網(wǎng)頁跳轉(zhuǎn)到目標網(wǎng)頁的過程中,所述搜索結(jié)果網(wǎng)頁的網(wǎng)址,包括:
[0012]獲取用戶以網(wǎng)頁跳轉(zhuǎn)的方式訪問頁面的跳轉(zhuǎn)行為;
[0013]從所述跳轉(zhuǎn)行為中,過濾出用戶從搜索結(jié)果網(wǎng)頁跳轉(zhuǎn)到目標網(wǎng)頁的訪問行為,并獲取所訪問的搜索結(jié)果網(wǎng)頁的網(wǎng)址。
[0014]可選的,所述獲取用戶以網(wǎng)頁跳轉(zhuǎn)的方式訪問頁面的跳轉(zhuǎn)行為,包括:[0015]獲取用戶以網(wǎng)頁跳轉(zhuǎn)的方式訪問頁面的過程中,用戶的標識信息,所訪問的網(wǎng)頁的網(wǎng)址,訪問各網(wǎng)頁的時間;
[0016]所述從所述跳轉(zhuǎn)行為中,過濾出用戶從搜索結(jié)果網(wǎng)頁跳轉(zhuǎn)到目標網(wǎng)頁的訪問行為,并獲取所訪問的搜索結(jié)果網(wǎng)頁的網(wǎng)址,包括:
[0017]根據(jù)獲取到的所述用戶的標識信息,所訪問的網(wǎng)頁的網(wǎng)址,訪問各網(wǎng)頁的時間,還原用戶的跳轉(zhuǎn)行為,并從還原出的所述跳轉(zhuǎn)行為中過濾出用戶從搜索結(jié)果網(wǎng)頁跳轉(zhuǎn)到目標網(wǎng)頁的訪問行為,并獲取所訪問的搜索結(jié)果網(wǎng)頁的網(wǎng)址。
[0018]可選的,所述獲取用戶以網(wǎng)頁跳轉(zhuǎn)的方式訪問頁面的過程中,用戶的標識信息,所訪問的網(wǎng)頁的網(wǎng)址,訪問各網(wǎng)頁的時間,包括:
[0019]通過瀏覽器或瀏覽器插件獲取用戶以網(wǎng)頁跳轉(zhuǎn)的方式訪問頁面的過程中,用戶的標識信息,所訪問的網(wǎng)頁的網(wǎng)址,訪問各網(wǎng)頁的時間,并記錄為日志,將所述日志發(fā)送至所述服務(wù)器端;
[0020]所述從所述跳轉(zhuǎn)行為中,過濾出用戶從搜索結(jié)果網(wǎng)頁跳轉(zhuǎn)到目標網(wǎng)頁的訪問行為,并獲取所訪問的搜索結(jié)果網(wǎng)頁的網(wǎng)址,包括:
[0021]由所述服務(wù)器端,根據(jù)接收到的所述日志中包含的信息,還原用戶的跳轉(zhuǎn)行為,并從還原出的所述跳轉(zhuǎn)行為中過濾出用戶從搜索結(jié)果網(wǎng)頁跳轉(zhuǎn)到目標網(wǎng)頁的訪問行為,并獲取所訪問的搜索結(jié)果網(wǎng)頁的網(wǎng)址。
[0022]可選的,所述從所述跳轉(zhuǎn)行為中,過濾出用戶從搜索結(jié)果網(wǎng)頁跳轉(zhuǎn)到目標網(wǎng)頁的訪問行為,并獲取所訪問的搜索結(jié)果網(wǎng)頁的網(wǎng)址,包括:
[0023]從所述跳轉(zhuǎn)行為中,過濾出用戶從搜索結(jié)果網(wǎng)頁,經(jīng)過預(yù)置閾值次數(shù)的跳轉(zhuǎn)到達目標網(wǎng)頁的訪問行為,并獲取所訪問的搜索結(jié)果網(wǎng)頁的網(wǎng)址。
[0024]可選的,所述從所述跳轉(zhuǎn)行為中,過濾出用戶從搜索結(jié)果網(wǎng)頁跳轉(zhuǎn)到目標網(wǎng)頁的訪問行為,包括:
[0025]利用預(yù)置的正則表達式,從所述跳轉(zhuǎn)行為中,過濾出用戶從搜索結(jié)果網(wǎng)頁跳轉(zhuǎn)到目標網(wǎng)頁的訪問行為。
[0026]可選的,所述獲取所述搜索結(jié)果網(wǎng)頁的網(wǎng)址中包括的查詢詞作為查詢信息,包括:
[0027]獲取所述搜索結(jié)果網(wǎng)頁的網(wǎng)址中包含的查詢詞,并對所述查詢詞進行分詞,去停用詞處理;將處理后得到的查詢詞作為所述查詢信息;
[0028]所述以所述查詢信息查詢預(yù)置的下載鏈接庫,獲取與所述查詢信息相匹配的下載鏈接,包括:
[0029]以所述處理后得到的查詢詞查詢預(yù)置的下載鏈接庫,獲取所述目標頁面與下載鏈接的共享詞;
[0030]根據(jù)所述各共享詞在各所述搜索結(jié)果網(wǎng)頁中的搜索次數(shù)比,以及各共享詞在該下載鏈接中的搜索詞占比,確定下載鏈接的綜合權(quán)值;
[0031]比較所述綜合權(quán)值與預(yù)置的權(quán)值閾值,將綜合權(quán)值大于所述權(quán)值閾值的下載鏈接確定為相匹配的下載鏈接。
[0032]可選的,所述獲取所述目標網(wǎng)頁的標題作為查詢信息,包括:
[0033]獲取所述目標網(wǎng)頁的標題,并對所述目標網(wǎng)頁的標題進行分詞和過濾處理,將分詞和過濾處理后得到的標題關(guān)鍵詞作為所述查詢信息;其中所述過濾處理包括:對所述標題進行降噪,去除標題中的無用信息;
[0034]所述以所述查詢信息查詢預(yù)置的下載鏈接庫,獲取與所述查詢信息相匹配的下載鏈接,包括:
[0035]以所述標題關(guān)鍵詞查詢預(yù)置的下載鏈接庫,獲取所述標題關(guān)鍵詞與下載鏈接庫中的下載鏈接的匹配度;
[0036]比較所述匹配度與預(yù)置的匹配閾值,將匹配度大于所述預(yù)置的匹配閾值的下載鏈接確定為與所述查詢信息相匹配的下載鏈接。
[0037]可選的,所述預(yù)置的匹配閾值根據(jù)下載鏈接的資源類別的不同而不同,所述方法還包括:
[0038]確定所述下載鏈接的資源類別;
[0039]所述比較所述匹配度與預(yù)置的匹配閾值,將匹配度大于所述預(yù)置的匹配閾值的下載鏈接確定為與所述查詢信息相匹配的下載鏈接,包括:
[0040]比較所述匹配度與該下載鏈接的資源類別對應(yīng)的匹配閾值,將匹配度大于所述與該下載鏈接的資源類別對應(yīng)的匹配閾值的下載鏈接確定為與所述查詢信息相匹配的下載鏈接。
[0041]可選的,所述提供所述相匹配的下載鏈接,包括:
[0042]將所述相匹配的下載鏈接以操作系統(tǒng)彈出窗口、或瀏覽器彈出子窗口、或系統(tǒng)托盤彈出窗口、或瀏覽器窗口內(nèi)的抽屜式彈窗的方式提供。
[0043]根據(jù)本發(fā)明的另一方面,提供了一種提供下載鏈接的系統(tǒng),其特征在于,包括:
[0044]網(wǎng)址獲取單元,用于獲取用戶從搜索結(jié)果網(wǎng)頁跳轉(zhuǎn)到目標網(wǎng)頁的過程中,所述搜索結(jié)果網(wǎng)頁的網(wǎng)址;
[0045]查詢信息獲取單元,用于獲取所述搜索結(jié)果網(wǎng)頁的網(wǎng)址中包括的查詢詞和/或所述目標網(wǎng)頁的標題作為查詢信息;
[0046]下載鏈接獲取單元,用于以所述查詢信息查詢預(yù)置的下載鏈接庫,獲取與所述查詢信息相匹配的下載鏈接;
[0047]鏈接提供單元,用于提供所述相匹配的下載鏈接。
[0048]可選的,所述網(wǎng)址獲取單元,包括:
[0049]跳轉(zhuǎn)行為獲取子單元,用于獲取用戶以網(wǎng)頁跳轉(zhuǎn)的方式訪問頁面的跳轉(zhuǎn)行為;
[0050]過濾子單元,用于從所述跳轉(zhuǎn)行為中,過濾出用戶從搜索結(jié)果網(wǎng)頁跳轉(zhuǎn)到目標網(wǎng)頁的訪問行為,并獲取所訪問的搜索結(jié)果網(wǎng)頁的網(wǎng)址。
[0051]可選的,所述跳轉(zhuǎn)行為獲取子單元,具體用于:
[0052]獲取用戶以網(wǎng)頁跳轉(zhuǎn)的方式訪問頁面的過程中,用戶的標識信息,所訪問的網(wǎng)頁的網(wǎng)址,訪問各網(wǎng)頁的時間;
[0053]所述過濾子單元,具體用于:
[0054]根據(jù)獲取到的所述用戶的標識信息,所訪問的網(wǎng)頁的網(wǎng)址,訪問各網(wǎng)頁的時間,還原用戶的跳轉(zhuǎn)行為,并從還原出的所述跳轉(zhuǎn)行為中過濾出用戶從搜索結(jié)果網(wǎng)頁跳轉(zhuǎn)到目標網(wǎng)頁的訪問行為,并獲取所訪問的搜索結(jié)果網(wǎng)頁的網(wǎng)址。
[0055]可選的,所述跳轉(zhuǎn)行為獲取子單元,具體用于:[0056]通過瀏覽器或瀏覽器插件獲取用戶以網(wǎng)頁跳轉(zhuǎn)的方式訪問頁面的過程中,用戶的標識信息,所訪問的網(wǎng)頁的網(wǎng)址,訪問各網(wǎng)頁的時間,并記錄為日志,將所述日志發(fā)送至所述服務(wù)器端;
[0057]所述過濾子單元位于服務(wù)器端,具體用于:
[0058]接收所述日志,并根據(jù)接收到的所述日志中包含的信息,還原用戶的跳轉(zhuǎn)行為,并從還原出的所述跳轉(zhuǎn)行為中過濾出用戶從搜索結(jié)果網(wǎng)頁跳轉(zhuǎn)到目標網(wǎng)頁的訪問行為,并獲取所訪問的搜索結(jié)果網(wǎng)頁的網(wǎng)址。
[0059]可選的,所述過濾子單元,具體用于:
[0060]從所述跳轉(zhuǎn)行為中,過濾出用戶從搜索結(jié)果網(wǎng)頁,經(jīng)過預(yù)置閾值次數(shù)的跳轉(zhuǎn)到達目標網(wǎng)頁的訪問行為,并獲取所訪問的搜索結(jié)果網(wǎng)頁的網(wǎng)址。
[0061]可選的,所述過濾子單元,具體用于:
[0062]利用預(yù)置的正則表達式,從所述跳轉(zhuǎn)行為中,過濾出用戶從搜索結(jié)果網(wǎng)頁跳轉(zhuǎn)到目標網(wǎng)頁的訪問行為。
[0063]可選的,所述查詢信息獲取單元,包括:
[0064]第一查詢信息獲取子單元,用于獲取所述搜索結(jié)果網(wǎng)頁的網(wǎng)址中包含的查詢詞,并對所述查詢詞進行分詞,去停用詞處理;將處理后得到的查詢詞作為所述查詢信息;
[0065]所述下載鏈接獲取單元,包括:
[0066]共享詞獲取子單元,用于以所述處理后得到的查詢詞查詢預(yù)置的下載鏈接庫,獲取所述目標頁面與下載鏈接的共享詞;
[0067]綜合權(quán)值確定單元,用于根據(jù)所述各共享詞在各所述搜索結(jié)果網(wǎng)頁中的搜索次數(shù)t匕,以及各共享詞在該下載鏈接中的搜索詞占比,確定下載鏈接的綜合權(quán)值;
[0068]第一鏈接確定子單元,用于比較所述綜合權(quán)值與預(yù)置的權(quán)值閾值,將綜合權(quán)值大于所述權(quán)值閾值的下載鏈接確定為相匹配的下載鏈接。
[0069]可選的,所述查詢信息獲取單元,包括:
[0070]第二查詢信息獲取子單元,用于獲取所述目標網(wǎng)頁的標題,并對所述目標網(wǎng)頁的標題進行分詞和過濾處理,將分詞和過濾處理后得到的標題關(guān)鍵詞作為所述查詢信息;其中所述過濾處理包括:對所述標題進行降噪,去除標題中的無用信息;
[0071]所述下載鏈接獲取單元,包括:
[0072]匹配度獲取子單元,用于以所述標題關(guān)鍵詞查詢預(yù)置的下載鏈接庫,獲取所述標題關(guān)鍵詞與下載鏈接庫中的下載鏈接的匹配度;
[0073]第二鏈接確定子單元,用于比較所述匹配度與預(yù)置的匹配閾值,將匹配度大于所述預(yù)置的匹配閾值的下載鏈接確定為與所述查詢信息相匹配的下載鏈接。
[0074]可選的,所述預(yù)置的匹配閾值根據(jù)下載鏈接的資源類別的不同而不同,所述系統(tǒng)還包括:
[0075]類別確定子單元,用于確定所述下載鏈接的資源類別;
[0076]所述第二鏈接確定子單元,具體用于:
[0077]比較所述匹配度與該下載鏈接的資源類別對應(yīng)的匹配閾值,將匹配度大于所述與該下載鏈接的資源類別對應(yīng)的匹配閾值的下載鏈接確定為與所述查詢信息相匹配的下載鏈接。[0078]可選的,所述鏈接提供單元,具體用于:
[0079]將所述相匹配的下載鏈接以操作系統(tǒng)彈出窗口、或瀏覽器彈出子窗口、或系統(tǒng)托盤彈出窗口、或瀏覽器窗口內(nèi)的抽屜式彈窗的方式提供。
[0080]根據(jù)本發(fā)明的提供下載鏈接的方法,可以獲取用戶從搜索結(jié)果網(wǎng)頁跳轉(zhuǎn)到目標網(wǎng)頁的過程中,所訪問的搜索結(jié)果網(wǎng)頁的網(wǎng)址,進而獲取搜索結(jié)果網(wǎng)頁的網(wǎng)址中包括的查詢詞,目標網(wǎng)頁的標題作為查詢信息;以獲取到的查詢信息查詢預(yù)置的下載鏈接庫,獲取與所述查詢信息相匹配的下載鏈接;在所述目標頁面被訪問時,提供相應(yīng)的下載鏈接。在用戶要獲取某一資源的下載鏈接時,常常會使用搜索引擎獲取該資源相關(guān)的搜索結(jié)果網(wǎng)頁,而搜索結(jié)果網(wǎng)頁的網(wǎng)址中通常都包含了用戶所感興趣的內(nèi)容的關(guān)鍵詞。通過搜索結(jié)果到達目標頁面的過程,可以看作是一種通過搜索來訪問與下載資源有關(guān)的頁面的過程,通過對這個過程用戶所訪問的網(wǎng)頁進行分析,得到的查詢詞,以及目標頁面的標題,客觀上從一定程度上反映了用戶的實際需求,可以用于準確的判斷用戶的潛在需求,進一步通過使用這些信息查詢現(xiàn)在鏈接庫,向用戶提供相關(guān)的用戶的潛在需求資源的下載鏈接,所提供的下載鏈接與用戶的訪問過程以及目標頁面的內(nèi)容相關(guān),更能反映用戶的實際需求。由此取得了更高效和準確地提供下載鏈接,使所提供的下載鏈接更準確地用戶的真實需求,提高用戶下載資源的效率的有益效果。
[0081]進一步的,本發(fā)明以用戶通過網(wǎng)頁跳轉(zhuǎn)的方式訪問頁面的跳轉(zhuǎn)行為作為基礎(chǔ),所提供的下載鏈接可以由用戶各自的訪問過程,以及用戶所訪問的目標頁面來決定,所提供的下載鏈接更加符合用戶個性化需求。其中,目標網(wǎng)頁的標題是能夠比較直接的反應(yīng)用戶所感興趣的資源的信息,以目標網(wǎng)頁的標題作為查詢信息查詢到的相匹配的下載鏈接,可以得到更加符合用戶需求的下載資源的鏈接。
[0082]本發(fā)明還可以在以查詢信息查詢下載鏈接庫,獲取相匹配的下載鏈接時,針對不同類別的網(wǎng)絡(luò)資源的下載需求,采用不同的匹配策略,使得提供的下載鏈接能夠更加靈活的滿足用戶的多元化需求。
[0083]上述說明僅是本發(fā)明技術(shù)方案的概述,為了能夠更清楚了解本發(fā)明的技術(shù)手段,而可依照說明書的內(nèi)容予以實施,并且為了讓本發(fā)明的上述和其它目的、特征和優(yōu)點能夠更明顯易懂,以下特舉本發(fā)明的【具體實施方式】。
【專利附圖】

【附圖說明】
[0084]為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實施例中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。在附圖中:
[0085]圖1是根據(jù)本發(fā)明一個實施例的提供下載鏈接的方法流程圖;以及,
[0086]圖2是根據(jù)本發(fā)明一個實施例的提供下載鏈接的系統(tǒng)示意圖。
【具體實施方式】
[0087]下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例。基于本發(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。
[0088]請參見圖1,本發(fā)明實施例的提供下載鏈接的方法可以包括以下步驟:
[0089]SlOl:獲取用戶從搜索結(jié)果網(wǎng)頁跳轉(zhuǎn)到目標網(wǎng)頁的過程中,所述搜索結(jié)果網(wǎng)頁的網(wǎng)址;
[0090]用戶在獲取網(wǎng)絡(luò)資源的過程中,通常需要通過訪問一定的網(wǎng)頁來獲取網(wǎng)絡(luò)資源的下載地址,比如,下載服務(wù)站點的下載頁面;百科知識頁面;網(wǎng)絡(luò)資源對應(yīng)的官方網(wǎng)站的下載頁面等等;這些頁面這類頁面的共同特點是,通常會包括關(guān)于網(wǎng)絡(luò)資源的介紹信息,如對軟件類網(wǎng)絡(luò)資源的軟件功能、系統(tǒng)需求的介紹;對文學(xué)類資源的作者、章節(jié)信息、內(nèi)容概要的介紹等等。可以認為相對于其他頁面,當(dāng)用戶訪問上述的一類頁面時,更可能是在尋找相應(yīng)的網(wǎng)絡(luò)資源,通過訪問上述頁面,更可能直接或間接地觸發(fā)對相應(yīng)網(wǎng)絡(luò)資源的下載,在這里將上述的一類頁面稱之為目標網(wǎng)頁。目標頁面可以通過人工收集,或者網(wǎng)絡(luò)統(tǒng)計來獲取,如統(tǒng)計網(wǎng)絡(luò)中直接或間接觸發(fā)網(wǎng)絡(luò)資源下載的次數(shù)超過一定閾值的頁面作為目標頁面。
[0091]此外,用戶在通過網(wǎng)頁跳轉(zhuǎn)的方式訪問目標頁面,進而了解網(wǎng)絡(luò)資源的功用或內(nèi)容等信息,或?qū)ふ揖W(wǎng)絡(luò)資源的下載鏈接時,常會通過搜索來快速地到達目標頁面,在使用搜索到達目標頁面的過程中,還會經(jīng)過另外一種網(wǎng)頁一搜索結(jié)果網(wǎng)頁。用戶所使用的搜索可以包括專業(yè)的搜索引擎,下載站點提供的站內(nèi)搜索等等。這個過程類似于用戶使用搜索獲取搜索結(jié)果頁,再由搜索結(jié)果頁通過一次或多次跳轉(zhuǎn)到達目標頁面。其中,搜索結(jié)果頁的網(wǎng)址通常會根據(jù)用戶輸入的查詢詞來生成,如在使用搜狗搜索引擎同時以“pinyin”和“ime”兩個查詢詞進行搜索時,該搜索引擎返回的搜索結(jié)果網(wǎng)頁的網(wǎng)址為:
[0092]http://www.sogou.com/web?ie=utf8&query=pinyin+ime [0093]又如在某軟件下載站點的“站內(nèi)搜索”入口輸入“pdf ”、“doc”兩個查詢詞進行站內(nèi)搜索時,該站點返回的搜索結(jié)果網(wǎng)頁的網(wǎng)址為:
[0094]http://search.....com/search_list.php?searchsid=0&searchname=pdf+doc
[0095]可見,在用戶使用搜索時得到的搜索結(jié)果網(wǎng)頁的網(wǎng)址中,常常包含有用戶所輸入的查詢詞,而這些查詢詞正是用戶所需的或感興趣的網(wǎng)絡(luò)資源的關(guān)鍵詞。首先,可以獲取用戶從搜索結(jié)果網(wǎng)頁跳轉(zhuǎn)到目標網(wǎng)頁的過程中,搜索結(jié)果網(wǎng)頁的網(wǎng)址。
[0096]在獲取網(wǎng)絡(luò)資源的過程中,常常是通過網(wǎng)頁跳轉(zhuǎn)的方式實現(xiàn)的,即通過一系列的網(wǎng)頁跳轉(zhuǎn),最終到達包含網(wǎng)絡(luò)資源的下載鏈接的網(wǎng)頁,而隨著搜索技術(shù)的廣泛應(yīng)用,在這個過程中,通過搜索結(jié)果頁經(jīng)過跳轉(zhuǎn)到達目標頁面也是比較常見的訪問目標頁面的過程。具體在獲取搜索結(jié)果網(wǎng)頁的網(wǎng)址時,可以首先獲取用戶以網(wǎng)頁跳轉(zhuǎn)的方式訪問頁面的跳轉(zhuǎn)行為,從跳轉(zhuǎn)行為中,過濾出用戶從搜索結(jié)果網(wǎng)頁跳轉(zhuǎn)到目標網(wǎng)頁的訪問行為,并獲取所訪問的搜索結(jié)果網(wǎng)頁的網(wǎng)址,即收集所有以網(wǎng)頁跳轉(zhuǎn)的方式訪問頁面的跳轉(zhuǎn)行為,在從中過濾出通過搜索結(jié)果頁跳轉(zhuǎn)訪問目標網(wǎng)頁的訪問行為。
[0097]對以網(wǎng)頁跳轉(zhuǎn)的方式訪問頁面的跳轉(zhuǎn)行為獲取,可以通過具有信息收集功能的瀏覽器程序,來收集通過所有以網(wǎng)頁跳轉(zhuǎn)的方式訪問頁面的跳轉(zhuǎn)行為,也可以通過具有相關(guān)功能的瀏覽器插件,或者安裝在操作系統(tǒng)上的監(jiān)控程序來實現(xiàn)等等,具體實現(xiàn)獲取跳轉(zhuǎn)行為的手段可以有多種,本發(fā)明實施例對此并沒有限制。具體的,可以獲取用戶以網(wǎng)頁跳轉(zhuǎn)的方式訪問頁面的過程中,用戶的標識信息,所訪問的網(wǎng)頁的網(wǎng)址,訪問各網(wǎng)頁的時間等;進而根據(jù)獲取到的用戶的標識信息,所訪問的網(wǎng)頁的網(wǎng)址,訪問各網(wǎng)頁的時間,還原用戶的跳轉(zhuǎn)行為。其中,用戶標識信息用來區(qū)分不同的用戶,結(jié)合所訪問的網(wǎng)頁的網(wǎng)址,以及訪問各網(wǎng)頁的時間,就可以獲得哪些用戶在什么時候訪問了哪些網(wǎng)頁,即獲得了按時間順序訪問網(wǎng)頁的跳轉(zhuǎn)行為。從還原出的跳轉(zhuǎn)行為中過濾出用戶從搜索結(jié)果網(wǎng)頁跳轉(zhuǎn)到目標網(wǎng)頁的訪問行為,獲取所訪問的搜索結(jié)果網(wǎng)頁的網(wǎng)址,具體可以是先從所有跳轉(zhuǎn)行為中,過濾出以目標頁面為目的的跳轉(zhuǎn)行為,再利用預(yù)置的正則表達式,從跳轉(zhuǎn)行為中,過濾出用戶從搜索結(jié)果網(wǎng)頁跳轉(zhuǎn)到目標網(wǎng)頁的訪問行為,即以預(yù)置正則表達式作為搜索規(guī)則進行搜索,從跳轉(zhuǎn)行為中過濾出從搜索結(jié)果網(wǎng)頁跳轉(zhuǎn)到目標網(wǎng)頁的訪問行為。
[0098]獲取用戶以網(wǎng)頁跳轉(zhuǎn)的方式訪問頁面的跳轉(zhuǎn)行為,并過濾得到用戶從搜索結(jié)果網(wǎng)頁跳轉(zhuǎn)到目標網(wǎng)頁的訪問行為,獲取所訪問的搜索結(jié)果網(wǎng)頁的網(wǎng)址的整個過程,可以由客戶端程序(如瀏覽器或瀏覽器插件)與服務(wù)器端配合完成,具體的,可以是通過瀏覽器或瀏覽器插件獲取用戶以網(wǎng)頁跳轉(zhuǎn)的方式訪問頁面的過程中,用戶的標識信息,所訪問的網(wǎng)頁的網(wǎng)址,訪問各網(wǎng)頁的時間,并記錄為日志,將日志發(fā)送至所述服務(wù)器端;由服務(wù)器端,根據(jù)接收到的日志中包含的信息,還原用戶的跳轉(zhuǎn)行為,并從還原出的所述跳轉(zhuǎn)行為中過濾出用戶從搜索結(jié)果網(wǎng)頁跳轉(zhuǎn)到目標網(wǎng)頁的訪問行為,并獲取所訪問的搜索結(jié)果網(wǎng)頁的網(wǎng)址。這種方式下,可以利用服務(wù)器端更強大的性能和處理能力,對跳轉(zhuǎn)行為進行更加快速高效的過濾,獲得從搜索結(jié)果網(wǎng)頁跳轉(zhuǎn)到目標網(wǎng)頁的訪問行為,以及搜索結(jié)果網(wǎng)頁的網(wǎng)址。
[0099]此外在過濾時,可以僅從所述跳轉(zhuǎn)行為中,過濾出用戶從搜索結(jié)果網(wǎng)頁經(jīng)過預(yù)置閾值次數(shù)的跳轉(zhuǎn),到達目標網(wǎng)頁的訪問行為,并獲取所訪問的搜索結(jié)果網(wǎng)頁的網(wǎng)址。這是因為通過搜索結(jié)果網(wǎng)頁跳轉(zhuǎn)到目標網(wǎng)頁的過程中,所經(jīng)歷的跳轉(zhuǎn)次數(shù)越多,則搜索結(jié)果網(wǎng)頁與到達的目標網(wǎng)頁之間的聯(lián)系更傾向于越??;反之,所經(jīng)歷的跳轉(zhuǎn)次數(shù)越少,則搜索結(jié)果網(wǎng)頁與訪問的目標網(wǎng)頁之間的聯(lián)系更傾向于越緊密;如果從搜索結(jié)果網(wǎng)頁開始經(jīng)歷相當(dāng)多的次數(shù)跳轉(zhuǎn)才到達一個目標頁面,比如五十次,則可以認為搜索結(jié)果網(wǎng)頁與最終訪問的目標網(wǎng)頁之間已經(jīng)接近于沒有聯(lián)系了。所以可以僅過濾出用戶從搜索結(jié)果網(wǎng)頁經(jīng)過預(yù)置閾值次數(shù)的跳轉(zhuǎn),到達目標網(wǎng)頁的訪問行為,如過濾出用戶從搜索結(jié)果網(wǎng)頁經(jīng)過小于5次跳轉(zhuǎn),到達目標網(wǎng)頁的訪問行為。
[0100]S102:獲取所述搜索結(jié)果網(wǎng)頁的網(wǎng)址中包括的查詢詞和/或所述目標網(wǎng)頁的標題作為查詢信息;
[0101]如前所述,用戶從搜索結(jié)果網(wǎng)頁跳轉(zhuǎn)到目標網(wǎng)頁的過程中,搜索結(jié)果網(wǎng)頁的網(wǎng)址中常常包含有用戶輸入的查詢詞,因此,可以將搜索結(jié)果網(wǎng)頁的網(wǎng)址中包括的查詢詞提取出來,作為查詢信息來查詢預(yù)置的下載鏈接庫。此外,目標網(wǎng)頁的標題也常常含有網(wǎng)絡(luò)資源的關(guān)鍵詞信息,如網(wǎng)絡(luò)資源的下載頁面的標題,常常包含該資源的名稱等信息,百科知識頁面的標題也常常出現(xiàn)類似于“某某百科_ ‘網(wǎng)絡(luò)資源名’ ”等包含有網(wǎng)絡(luò)資源的名稱等信息的形式,即目標頁面的內(nèi)容也常常包含于網(wǎng)絡(luò)資源有關(guān)的信息,同樣可以作為查詢信息來查詢預(yù)置的下載鏈接庫。所以,可以獲取搜索結(jié)果網(wǎng)頁的網(wǎng)址中包括的查詢詞和/或目標網(wǎng)頁的標題作為查詢信息。
[0102]S103:以所述查詢信息查詢預(yù)置的下載鏈接庫,獲取與所述查詢信息相匹配的下載鏈接;
[0103]獲取到查詢信息后,可以根據(jù)獲取到的查詢信息查詢預(yù)置的下載鏈接庫,獲取與查詢信息相匹配的下載鏈接。在實際應(yīng)用中,可以根據(jù)獲取到查詢信息的不同,采取不同的查詢方式。
[0104]如果獲取到了目標網(wǎng)頁的標題,可以直接使用目標網(wǎng)頁的標題作為查詢信息,如目標網(wǎng)頁的標題為文學(xué)作品的名稱,或者軟件資源的名稱,就可以直接使用這些名稱查詢預(yù)置的下載鏈接庫,獲取相匹配的下載鏈接。在實際應(yīng)用中,目標網(wǎng)頁的標題往往不是以單純的關(guān)鍵詞的形式出現(xiàn),其間還會混合有對查詢造成干擾的無用信息。此時為了抽取其中的有效查詢信息,還可以根據(jù)網(wǎng)頁的標題,獲取網(wǎng)頁的特征性信息,如網(wǎng)頁標題中包括的資源名稱,軟件版本號,作者信息等,可以通過對目標網(wǎng)頁的標題進行分詞和過濾處理,經(jīng)過分詞和過濾處理后,可以得到目標網(wǎng)頁的標題中包含的標題關(guān)鍵詞,將分詞和過濾處理后得到的標題關(guān)鍵詞作為查詢信息。具體實現(xiàn)通過目標網(wǎng)頁標題獲得標題關(guān)鍵詞時,可以通過對不同網(wǎng)站預(yù)置的不同正則表達式,來抽取目標網(wǎng)頁標題中的標題關(guān)鍵詞的方式獲得。其中過濾處理可以包括:對獲取到的目標網(wǎng)頁的標題進行分詞并降噪,降噪過程和中去除標題中的無用信息,具體實現(xiàn)時,可以通過預(yù)置的降噪正則表達式來完成。當(dāng)然,在實際應(yīng)用中,對目標網(wǎng)頁標題進行分詞,抽取其中的標題關(guān)鍵詞,以及降噪的過程,也可以由合并在一起的一個正則表達式模板工具來完成,提高對目標網(wǎng)頁標題中的標題關(guān)鍵詞的抽取效率。然后以分詞和過濾處理后得到的標題關(guān)鍵詞查詢預(yù)置的下載鏈接庫,獲取過濾處理后得到的標題關(guān)鍵詞與下載鏈接庫中的下載鏈接的匹配度;將獲取到的匹配度與預(yù)置的匹配閾值相比較,將匹配度大于預(yù)置的匹配閾值的下載鏈接確定為與查詢信息相匹配的下載鏈接。
[0105]另外,預(yù)置的匹配閾值可以根據(jù)下載鏈接的資源類別的不同而不同,例如對于文學(xué)類資源的下載鏈接,可以設(shè)置比較高的匹配閾值進行嚴格的篩選,因為通常當(dāng)用戶查詢文學(xué)類資源時,更可能期望得到諸如作品名,作者等都相符的下載鏈接,如果有其中之一不相符,則對一個的資源很可能不是用戶所期望的資源,因此在實際應(yīng)用中,對于查詢信息包括文學(xué)作品名稱,作者等信息的情況,可以通過預(yù)置比較高的閾值,來篩選出文學(xué)作品名稱和作者都嚴格與查詢信息相符合的下載鏈接,作為與查詢信息相匹配的鏈接,來達到用戶對的期望。又比如對于軟件類資源,可以預(yù)置相對較低的閾值,如在查詢信息包括軟件名稱和軟件版本時,所查詢到的下載鏈接可能只滿足名稱相符,而版本則相對于查詢信息較高或較低,此時可以通過預(yù)置較低的預(yù)置,使得名稱相符版本相近的軟件類資源的下載鏈接被篩選出來,作為與查詢信息相匹配的下載鏈接。下載鏈接的資源類別,可以在預(yù)置的下載鏈接庫中與下載鏈接對應(yīng)保存,獲取到查詢信息后,在根據(jù)查詢信息查詢下載鏈接庫獲得相匹配的下載鏈接時,可以根據(jù)下載鏈接庫中保存的類別信息確定下載鏈接的資源類別,不同的資源類別預(yù)置了不同的匹配閾值,比較匹配度與該下載鏈接的資源類別對應(yīng)的匹配閾值,將匹配度大于與該下載鏈接的資源類別對應(yīng)的匹配閾值的下載鏈接,確定為與所述查詢信息相匹配的下載鏈接。
[0106]在另一種實現(xiàn)方式下,當(dāng)獲取的查詢信息包括從搜索結(jié)果網(wǎng)頁的網(wǎng)址中獲得的查詢詞時,可以根據(jù)獲取到的查詢詞查詢預(yù)置的下載鏈接庫。在查詢詞中同樣可能包含無效的詞匯,或者在用戶輸入的時,并沒有對輸入的內(nèi)容進行分詞,而是連續(xù)輸入了多個查詢詞,此時,可以對所述查詢詞進行分詞,去停用詞處理;將處理后得到的查詢詞作為查詢信息查詢預(yù)置的下載鏈接庫。具體實現(xiàn)時,可以得到的查詢詞查詢預(yù)置的下載鏈接庫,獲取目標頁面與下載鏈接的共享詞。根據(jù)各共享詞在各搜索結(jié)果網(wǎng)頁中的搜索次數(shù)比,以及各共享詞在該下載鏈接中的搜索詞占比,確定下載鏈接的綜合權(quán)值;比較所述綜合權(quán)值與預(yù)置的權(quán)值閾值,將綜合權(quán)值大于所述權(quán)值閾值的下載鏈接確定為相匹配的下載鏈接。這里的共享詞是指從搜索結(jié)果網(wǎng)頁的網(wǎng)址中獲得的查詢詞,與下載鏈接對應(yīng)的搜索詞的交集。下載鏈接的搜索詞,可以通過群體用戶對下載鏈接進行檢索的過程統(tǒng)計出來,所統(tǒng)計出來的下載鏈接的搜索詞,一般包括了與該下載鏈接有關(guān)的所有搜索詞,并且每個搜索詞都有對應(yīng)的搜索詞占比,例如對于下載鏈接:
[0107]http://xiaza1.….com/Soft/A/Absinthe_2.0.4_XiaZaiBa.zip
[0108]其搜索詞與對應(yīng)的搜索詞占比如表1所示:
[0109]表1
[0110]
【權(quán)利要求】
1.一種提供下載鏈接的方法,其特征在于,包括: 獲取用戶從搜索結(jié)果網(wǎng)頁跳轉(zhuǎn)到目標網(wǎng)頁的過程中,所述搜索結(jié)果網(wǎng)頁的網(wǎng)址; 獲取所述搜索結(jié)果網(wǎng)頁的網(wǎng)址中包括的查詢詞和/或所述目標網(wǎng)頁的標題作為查詢信息; 以所述查詢信息查詢預(yù)置的下載鏈接庫,獲取與所述查詢信息相匹配的下載鏈接; 提供所述相匹配的下載鏈接。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述獲取用戶從搜索結(jié)果網(wǎng)頁跳轉(zhuǎn)到目標網(wǎng)頁的過程中,所述搜索結(jié)果網(wǎng)頁的網(wǎng)址,包括: 獲取用戶以網(wǎng)頁跳轉(zhuǎn)的方式訪問頁面的跳轉(zhuǎn)行為; 從所述跳轉(zhuǎn)行為中,過濾出用戶從搜索結(jié)果網(wǎng)頁跳轉(zhuǎn)到目標網(wǎng)頁的訪問行為,并獲取所訪問的搜索結(jié)果網(wǎng)頁的網(wǎng)址。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述獲取用戶以網(wǎng)頁跳轉(zhuǎn)的方式訪問頁面的跳轉(zhuǎn)行為,包括: 獲取用戶以網(wǎng)頁跳轉(zhuǎn)的方式訪問頁面的過程中,用戶的標識信息,所訪問的網(wǎng)頁的網(wǎng)址,訪問各網(wǎng)頁的時間; 所述從所述跳轉(zhuǎn)行為中,過濾出用戶從搜索結(jié)果網(wǎng)頁跳轉(zhuǎn)到目標網(wǎng)頁的訪問行為,并獲取所訪問的搜索結(jié)果網(wǎng)頁的網(wǎng)址,包括:· 根據(jù)獲取到的所述用戶的標識信息,所訪問的網(wǎng)頁的網(wǎng)址,訪問各網(wǎng)頁的時間,還原用戶的跳轉(zhuǎn)行為,并從還原出的所述跳轉(zhuǎn)行為中過濾出用戶從搜索結(jié)果網(wǎng)頁跳轉(zhuǎn)到目標網(wǎng)頁的訪問行為,并獲取所訪問的搜索結(jié)果網(wǎng)頁的網(wǎng)址。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述獲取用戶以網(wǎng)頁跳轉(zhuǎn)的方式訪問頁面的過程中,用戶的標識信息,所訪問的網(wǎng)頁的網(wǎng)址,訪問各網(wǎng)頁的時間,包括: 通過瀏覽器或瀏覽器插件獲取用戶以網(wǎng)頁跳轉(zhuǎn)的方式訪問頁面的過程中,用戶的標識信息,所訪問的網(wǎng)頁的網(wǎng)址,訪問各網(wǎng)頁的時間,并記錄為日志,將所述日志發(fā)送至所述服務(wù)器端; 所述從所述跳轉(zhuǎn)行為中,過濾出用戶從搜索結(jié)果網(wǎng)頁跳轉(zhuǎn)到目標網(wǎng)頁的訪問行為,并獲取所訪問的搜索結(jié)果網(wǎng)頁的網(wǎng)址,包括: 由所述服務(wù)器端,根據(jù)接收到的所述日志中包含的信息,還原用戶的跳轉(zhuǎn)行為,并從還原出的所述跳轉(zhuǎn)行為中過濾出用戶從搜索結(jié)果網(wǎng)頁跳轉(zhuǎn)到目標網(wǎng)頁的訪問行為,并獲取所訪問的搜索結(jié)果網(wǎng)頁的網(wǎng)址。
5.根據(jù)權(quán)利要求2至4任一項所述的方法,其特征在于,所述從所述跳轉(zhuǎn)行為中,過濾出用戶從搜索結(jié)果網(wǎng)頁跳轉(zhuǎn)到目標網(wǎng)頁的訪問行為,并獲取所訪問的搜索結(jié)果網(wǎng)頁的網(wǎng)址,包括: 從所述跳轉(zhuǎn)行為中,過濾出用戶從搜索結(jié)果網(wǎng)頁,經(jīng)過預(yù)置閾值次數(shù)的跳轉(zhuǎn)到達目標網(wǎng)頁的訪問行為,并獲取所訪問的搜索結(jié)果網(wǎng)頁的網(wǎng)址。
6.根據(jù)權(quán)利要求2至4任一項所述的方法,其特征在于,所述從所述跳轉(zhuǎn)行為中,過濾出用戶從搜索結(jié)果網(wǎng)頁跳轉(zhuǎn)到目標網(wǎng)頁的訪問行為,包括: 利用預(yù)置的正則表達式,從所述跳轉(zhuǎn)行為中,過濾出用戶從搜索結(jié)果網(wǎng)頁跳轉(zhuǎn)到目標網(wǎng)頁的訪問行為。
7.根據(jù)權(quán)利要求1至4中任一項所述的方法,其特征在于,所述獲取所述搜索結(jié)果網(wǎng)頁的網(wǎng)址中包括的查詢詞作為查詢信息,包括: 獲取所述搜索結(jié)果網(wǎng)頁的網(wǎng)址中包含的查詢詞,并對所述查詢詞進行分詞,去停用詞處理;將處理后得到的查詢詞作為所述查詢信息; 所述以所述查詢信息查詢預(yù)置的下載鏈接庫,獲取與所述查詢信息相匹配的下載鏈接,包括: 以所述處理后得到的查詢詞查詢預(yù)置的下載鏈接庫,獲取所述目標頁面與下載鏈接的共享詞; 根據(jù)所述各共享詞在各所述搜索結(jié)果網(wǎng)頁中的搜索次數(shù)比,以及各共享詞在該下載鏈接中的搜索詞占比,確定下載鏈接的綜合權(quán)值; 比較所述綜合權(quán)值與預(yù)置的權(quán)值閾值,將綜合權(quán)值大于所述權(quán)值閾值的下載鏈接確定為相匹配的下載鏈接。
8.根據(jù)權(quán)利要求1至4任一項所述的方法,其特征在于,所述獲取所述目標網(wǎng)頁的標題作為查詢信息,包括: 獲取所述目標網(wǎng)頁的標 題,并對所述目標網(wǎng)頁的標題進行分詞和過濾處理,將分詞和過濾處理后得到的標題關(guān)鍵詞作為所述查詢信息;其中所述過濾處理包括:對所述標題進行降噪,去除標題中的無用信息; 所述以所述查詢信息查詢預(yù)置的下載鏈接庫,獲取與所述查詢信息相匹配的下載鏈接,包括: 以所述標題關(guān)鍵詞查詢預(yù)置的下載鏈接庫,獲取所述標題關(guān)鍵詞與下載鏈接庫中的下載鏈接的匹配度; 比較所述匹配度與預(yù)置的匹配閾值,將匹配度大于所述預(yù)置的匹配閾值的下載鏈接確定為與所述查詢信息相匹配的下載鏈接。
9.根據(jù)權(quán)利要求8所述的方法,其特征在于,所述預(yù)置的匹配閾值根據(jù)下載鏈接的資源類別的不同而不同,所述方法還包括: 確定所述下載鏈接的資源類別; 所述比較所述匹配度與預(yù)置的匹配閾值,將匹配度大于所述預(yù)置的匹配閾值的下載鏈接確定為與所述查詢信息相匹配的下載鏈接,包括: 比較所述匹配度與該下載鏈接的資源類別對應(yīng)的匹配閾值,將匹配度大于所述與該下載鏈接的資源類別對應(yīng)的匹配閾值的下載鏈接確定為與所述查詢信息相匹配的下載鏈接。
10.根據(jù)權(quán)利要求1至9任一項所述的方法,其特征在于,所述提供所述相匹配的下載鏈接,包括: 將所述相匹配的下載鏈接以操作系統(tǒng)彈出窗口、或瀏覽器彈出子窗口、或系統(tǒng)托盤彈出窗口、或瀏覽器窗口內(nèi)的抽屜式彈窗的方式提供。
11.一種提供下載鏈接的系統(tǒng),其特征在于,包括: 網(wǎng)址獲取單元,用于獲取用戶從搜索結(jié)果網(wǎng)頁跳轉(zhuǎn)到目標網(wǎng)頁的過程中,所述搜索結(jié)果網(wǎng)頁的網(wǎng)址; 查詢信息獲取單元,用于獲取所述搜索結(jié)果網(wǎng)頁的網(wǎng)址中包括的查詢詞和/或所述目標網(wǎng)頁的標題作為查詢信息;下載鏈接獲取單元,用于以所述查詢信息查詢預(yù)置的下載鏈接庫,獲取與所述查詢信息相匹配的下載鏈接; 鏈接提供單元,用于提供所述相匹配的下載鏈接。
12.根據(jù)權(quán)利要求11所述的系統(tǒng),其特征在于,所述網(wǎng)址獲取單元,包括: 跳轉(zhuǎn)行為獲取子單元,用于獲取用戶以網(wǎng)頁跳轉(zhuǎn)的方式訪問頁面的跳轉(zhuǎn)行為; 過濾子單元,用于從所述跳轉(zhuǎn)行為中,過濾出用戶從搜索結(jié)果網(wǎng)頁跳轉(zhuǎn)到目標網(wǎng)頁的訪問行為,并獲取所訪問的搜索結(jié)果網(wǎng)頁的網(wǎng)址。
13.根據(jù)權(quán)利要求12所述的系統(tǒng),其特征在于,所述跳轉(zhuǎn)行為獲取子單元,具體用于: 獲取用戶以網(wǎng)頁跳轉(zhuǎn)的方式訪問頁面的過程中,用戶的標識信息,所訪問的網(wǎng)頁的網(wǎng)址,訪問各網(wǎng)頁的時間; 所述過濾子單元,具體用于: 根據(jù)獲取到的所述用戶的標識信息,所訪問的網(wǎng)頁的網(wǎng)址,訪問各網(wǎng)頁的時間,還原用戶的跳轉(zhuǎn)行為,并從還原出的所述跳轉(zhuǎn)行為中過濾出用戶從搜索結(jié)果網(wǎng)頁跳轉(zhuǎn)到目標網(wǎng)頁的訪問行為,并獲取所訪問的搜索結(jié)果網(wǎng)頁的網(wǎng)址。
14.根據(jù)權(quán)利要求13所述的系統(tǒng),其特征在于,所述跳轉(zhuǎn)行為獲取子單元,具體用于: 通過瀏覽器或瀏覽器 插件獲取用戶以網(wǎng)頁跳轉(zhuǎn)的方式訪問頁面的過程中,用戶的標識信息,所訪問的網(wǎng)頁的網(wǎng)址,訪問各網(wǎng)頁的時間,并記錄為日志,將所述日志發(fā)送至所述服務(wù)器端; 所述過濾子單元位于服務(wù)器端,具體用于: 接收所述日志,并根據(jù)接收到的所述日志中包含的信息,還原用戶的跳轉(zhuǎn)行為,并從還原出的所述跳轉(zhuǎn)行為中過濾出用戶從搜索結(jié)果網(wǎng)頁跳轉(zhuǎn)到目標網(wǎng)頁的訪問行為,并獲取所訪問的搜索結(jié)果網(wǎng)頁的網(wǎng)址。
15.根據(jù)權(quán)利要求12至14任一項所述的系統(tǒng),其特征在于,所述過濾子單元,具體用于: 從所述跳轉(zhuǎn)行為中,過濾出用戶從搜索結(jié)果網(wǎng)頁,經(jīng)過預(yù)置閾值次數(shù)的跳轉(zhuǎn)到達目標網(wǎng)頁的訪問行為,并獲取所訪問的搜索結(jié)果網(wǎng)頁的網(wǎng)址。
16.根據(jù)權(quán)利要求12至14任一項所述的系統(tǒng),其特征在于,所述過濾子單元,具體用于: 利用預(yù)置的正則表達式,從所述跳轉(zhuǎn)行為中,過濾出用戶從搜索結(jié)果網(wǎng)頁跳轉(zhuǎn)到目標網(wǎng)頁的訪問行為。
17.根據(jù)權(quán)利要求11至14中任一項所述的系統(tǒng),其特征在于,所述查詢信息獲取單元,包括: 第一查詢信息獲取子單元,用于獲取所述搜索結(jié)果網(wǎng)頁的網(wǎng)址中包含的查詢詞,并對所述查詢詞進行分詞,去停用詞處理;將處理后得到的查詢詞作為所述查詢信息; 所述下載鏈接獲取單元,包括: 共享詞獲取子單元,用于以所述處理后得到的查詢詞查詢預(yù)置的下載鏈接庫,獲取所述目標頁面與下載鏈接的共享詞; 綜合權(quán)值確定單元,用于根據(jù)所述各共享詞在各所述搜索結(jié)果網(wǎng)頁中的搜索次數(shù)比,以及各共享詞在該下載鏈接中的搜索詞占比,確定下載鏈接的綜合權(quán)值;第一鏈接確定子單元,用于比較所述綜合權(quán)值與預(yù)置的權(quán)值閾值,將綜合權(quán)值大于所述權(quán)值閾值的下載鏈接確定為相匹配的下載鏈接。
18.根據(jù)權(quán)利要求11至14任一項所述的系統(tǒng),其特征在于,所述查詢信息獲取單元,包括: 第二查詢信息獲取子單元,用于獲取所述目標網(wǎng)頁的標題,并對所述目標網(wǎng)頁的標題進行分詞和過濾處理,將分詞和過濾處理后得到的標題關(guān)鍵詞作為所述查詢信息;其中所述過濾處理包括:對所述標題進行降噪,去除標題中的無用信息; 所述下載鏈接獲取單元,包括: 匹配度獲取子單元,用于以所述標題關(guān)鍵詞查詢預(yù)置的下載鏈接庫,獲取所述標題關(guān)鍵詞與下載鏈接庫中的下載鏈接的匹配度; 第二鏈接確定子單元,用于比較所述匹配度與預(yù)置的匹配閾值,將匹配度大于所述預(yù)置的匹配閾值的下載鏈接確定為與所述查詢信息相匹配的下載鏈接。
19.根據(jù)權(quán)利要求18所述的系統(tǒng),其特征在于,所述預(yù)置的匹配閾值根據(jù)下載鏈接的資源類別的不同而不同,所述系統(tǒng)還包括: 類別確定子單元,用于確定所述下載鏈接的資源類別; 所述第二鏈接確定子單元,具體用于: 比較所述匹配度與該下載鏈接的資源類別對應(yīng)的匹配閾值,將匹配度大于所述與該下載鏈接的資源類別對應(yīng)的匹·配閾值的下載鏈接確定為與所述查詢信息相匹配的下載鏈接。
20.根據(jù)權(quán)利要求11至19任一項所述的系統(tǒng),其特征在于,所述鏈接提供單元,具體用于: 將所述相匹配的下載鏈接以操作系統(tǒng)彈出窗口、或瀏覽器彈出子窗口、或系統(tǒng)托盤彈出窗口、或瀏覽器窗口內(nèi)的抽屜式彈窗的方式提供。
【文檔編號】G06F17/30GK103530364SQ201310476117
【公開日】2014年1月22日 申請日期:2013年10月12日 優(yōu)先權(quán)日:2013年10月12日
【發(fā)明者】田樂逍, 胡又歡, 肖鏡輝 申請人:北京搜狗信息服務(wù)有限公司, 北京搜狗科技發(fā)展有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
肥东县| 普兰店市| 肇州县| 广德县| 广州市| 罗定市| 三明市| 拉孜县| 杭锦后旗| 许昌县| 三明市| 靖边县| 灵宝市| 昔阳县| 西昌市| 米泉市| 肥西县| 丹阳市| 台北市| 赞皇县| 潍坊市| 禹城市| 隆子县| 阿图什市| 尚义县| 元氏县| 双江| 日喀则市| 石渠县| 甘孜| 兖州市| 平和县| 中卫市| 图们市| 双柏县| 化隆| 泗水县| 剑河县| 滦南县| 灌阳县| 衡南县|