欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

搜索站點(diǎn)的方法和裝置制造方法

文檔序號(hào):6493642閱讀:151來源:國知局
搜索站點(diǎn)的方法和裝置制造方法
【專利摘要】本發(fā)明公開了一種搜索站點(diǎn)的方法和裝置,屬于網(wǎng)絡(luò)通信領(lǐng)域。所述方法包括:根據(jù)用戶搜索網(wǎng)頁時(shí)產(chǎn)生的點(diǎn)擊日志,獲取站點(diǎn)、類別信息與網(wǎng)頁數(shù)量的對(duì)應(yīng)關(guān)系,從該對(duì)應(yīng)關(guān)系中獲取待搜索類別信息對(duì)應(yīng)的站點(diǎn)、該站點(diǎn)包括的待搜索類別信息對(duì)應(yīng)的網(wǎng)頁的網(wǎng)頁數(shù)量和站點(diǎn)包括的所有網(wǎng)頁的網(wǎng)頁數(shù)量,并根據(jù)站點(diǎn)包括的待搜索類別信息對(duì)應(yīng)的網(wǎng)頁的網(wǎng)頁數(shù)量和站點(diǎn)包括的所有網(wǎng)頁的網(wǎng)頁數(shù)量,從待搜索類別信息對(duì)應(yīng)的站點(diǎn)中選擇出站點(diǎn)。本發(fā)明通過對(duì)用戶點(diǎn)擊網(wǎng)頁時(shí)生成的點(diǎn)擊日志進(jìn)行分析,并根據(jù)分析結(jié)果將屬于一個(gè)類別的站點(diǎn)搜索出來,能夠快速生成任意類別的大量站點(diǎn),在搜索過程中避免了主觀因素,搜索出的站點(diǎn)更全面,更豐富,大大提高了搜索站點(diǎn)的效率。
【專利說明】搜索站點(diǎn)的方法和裝置
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及網(wǎng)絡(luò)通信領(lǐng)域,特別涉及一種搜索站點(diǎn)的方法和裝置。
【背景技術(shù)】
[0002]隨著互聯(lián)網(wǎng)的快速發(fā)展,越來越多的用戶在網(wǎng)上進(jìn)行工作和學(xué)習(xí),用戶往往需要搜索網(wǎng)址,尤其需要將某一類別的網(wǎng)址都搜索出來。站點(diǎn)site是指URUUniform ResourceLocator,統(tǒng)一資源定位符)的第二個(gè)斜杠和第三個(gè)斜杠之間的信息,即URL的第二個(gè)/和第三個(gè) / 之間的信息,如,對(duì)于 URL:http://bbs.bbicn.com/forum.php?mod=viewthread&tid=175289&extra=page%3Dl%26orderby%3Ddateline&page=2,該 URL 對(duì)應(yīng)的 site 是 “bbs.bbicn.com,,。
[0003]現(xiàn)有技術(shù)搜索某一類別的站點(diǎn)時(shí),需要用戶打開互聯(lián)網(wǎng),在導(dǎo)航站人工整理站點(diǎn)或根據(jù)用戶經(jīng)驗(yàn)搜索站點(diǎn)。
[0004]在實(shí)現(xiàn)本發(fā)明的過程中,發(fā)明人發(fā)現(xiàn)現(xiàn)有技術(shù)至少存在以下問題:搜索站點(diǎn)時(shí)的主觀因素較大,而且搜索出的網(wǎng)頁數(shù)量有限,不能獲得盡可能多的站點(diǎn)。

【發(fā)明內(nèi)容】

[0005]為了解決現(xiàn)有技術(shù)的問題,本發(fā)明實(shí)施例提供了一種搜索站點(diǎn)的方法和裝置。所述技術(shù)方案如下:
[0006]一方面,提供了一種搜索站點(diǎn)的方法,所述方法包括:
[0007]根據(jù)用戶搜索網(wǎng)頁時(shí)產(chǎn)生的點(diǎn)擊日志,獲取站點(diǎn)、類別信息與網(wǎng)頁數(shù)量的對(duì)應(yīng)關(guān)系,所述對(duì)應(yīng)關(guān)系用于存儲(chǔ)站點(diǎn),所述站點(diǎn)包括的類別信息以及所述類別信息對(duì)應(yīng)的網(wǎng)頁的網(wǎng)頁數(shù)量;
[0008]從所述站點(diǎn)、類別信息與網(wǎng)頁數(shù)量的對(duì)應(yīng)關(guān)系中獲取待搜索類別信息對(duì)應(yīng)的站點(diǎn)、所述站點(diǎn)包括的所述待搜索類別信息對(duì)應(yīng)的網(wǎng)頁的網(wǎng)頁數(shù)量和所述站點(diǎn)包括的所有網(wǎng)頁的網(wǎng)頁數(shù)量;
[0009]根據(jù)所述站點(diǎn)包括的所述待搜索類別信息對(duì)應(yīng)的網(wǎng)頁的網(wǎng)頁數(shù)量和所述站點(diǎn)包括的所有網(wǎng)頁的網(wǎng)頁數(shù)量,從所述待搜索類別信息對(duì)應(yīng)的站點(diǎn)中選擇出站點(diǎn)。
[0010]一方面,提供了一種搜索站點(diǎn)的裝置,所述裝置包括:
[0011]第一獲取模塊,用于根據(jù)用戶搜索網(wǎng)頁時(shí)產(chǎn)生的點(diǎn)擊日志,獲取站點(diǎn)、類別信息與網(wǎng)頁數(shù)量的對(duì)應(yīng)關(guān)系,所述對(duì)應(yīng)關(guān)系用于存儲(chǔ)站點(diǎn),所述站點(diǎn)包括的類別信息以及所述類別信息對(duì)應(yīng)的網(wǎng)頁的網(wǎng)頁數(shù)量;
[0012]第二獲取模塊,用于從所述第一獲取模塊獲取的所述站點(diǎn)、類別信息與網(wǎng)頁數(shù)量的對(duì)應(yīng)關(guān)系中獲取待搜索類別信息對(duì)應(yīng)的站點(diǎn)、所述站點(diǎn)包括的所述待搜索類別信息對(duì)應(yīng)的網(wǎng)頁的網(wǎng)頁數(shù)量和所述站點(diǎn) 包括的所有網(wǎng)頁的網(wǎng)頁數(shù)量;
[0013]選擇模塊,用于根據(jù)所述第二獲取模塊獲取的所述站點(diǎn)包括的所述待搜索類別信息對(duì)應(yīng)的網(wǎng)頁的網(wǎng)頁數(shù)量和所述站點(diǎn)包括的所有網(wǎng)頁的網(wǎng)頁數(shù)量,從所述待搜索類別信息對(duì)應(yīng)的站點(diǎn)中選擇出站點(diǎn)。
[0014]本發(fā)明實(shí)施例提供的技術(shù)方案帶來的有益效果是:
[0015]通過對(duì)用戶點(diǎn)擊網(wǎng)頁時(shí)生成的點(diǎn)擊日志進(jìn)行分析,并根據(jù)分析結(jié)果將屬于一個(gè)類別的站點(diǎn)搜索出來,能夠快速生成任意類別的大量站點(diǎn),在搜索過程中避免了主觀因素,搜索出的站點(diǎn)更全面,更豐富,大大提高了搜索站點(diǎn)的效率。
【專利附圖】

【附圖說明】
[0016]為了更清楚地說明本發(fā)明實(shí)施例中的技術(shù)方案,下面將對(duì)實(shí)施例描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
[0017]圖1是本發(fā)明實(shí)施例1提供的搜索站點(diǎn)的方法流程圖;
[0018]圖2是本發(fā)明實(shí)施例2提供的搜索站點(diǎn)的方法流程圖;
[0019]圖3是本發(fā)明實(shí)施例3提供的搜索站點(diǎn)的裝置結(jié)構(gòu)示意圖;
[0020]圖4是本發(fā)明實(shí)施例3提供的搜索站點(diǎn)的裝置的另一結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0021]為使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合附圖對(duì)本發(fā)明實(shí)施方式作進(jìn)一步地詳細(xì)描述。
[0022]實(shí)施例1
[0023]參見圖1,本發(fā)明實(shí)施例提供了一種搜索站點(diǎn)的方法,該方法包括:
[0024]101:根據(jù)用戶搜索網(wǎng)頁時(shí)產(chǎn)生的點(diǎn)擊日志,獲取站點(diǎn)、類別信息與網(wǎng)頁數(shù)量的對(duì)應(yīng)關(guān)系,對(duì)應(yīng)關(guān)系用于存儲(chǔ)站點(diǎn),站點(diǎn)包括的類別信息以及類別信息對(duì)應(yīng)的網(wǎng)頁的網(wǎng)頁數(shù)量;
[0025]102:從站點(diǎn)、類別信息與網(wǎng)頁數(shù)量的對(duì)應(yīng)關(guān)系中獲取待搜索類別信息對(duì)應(yīng)的站點(diǎn)、站點(diǎn)包括的待搜索類別信息對(duì)應(yīng)的網(wǎng)頁的網(wǎng)頁數(shù)量和站點(diǎn)包括的所有網(wǎng)頁的網(wǎng)頁數(shù)量;
[0026]103:根據(jù)站點(diǎn)包括的待搜索類別信息對(duì)應(yīng)的網(wǎng)頁的網(wǎng)頁數(shù)量和站點(diǎn)包括的所有網(wǎng)頁的網(wǎng)頁數(shù)量,從待搜索類別信息對(duì)應(yīng)的站點(diǎn)中選擇出站點(diǎn)。
[0027]本發(fā)明實(shí)施例提供的方法,通過對(duì)用戶點(diǎn)擊網(wǎng)頁時(shí)生成的點(diǎn)擊日志進(jìn)行分析,并根據(jù)分析結(jié)果將屬于一個(gè)類別的站點(diǎn)搜索出來,能夠快速生成任意類別的大量站點(diǎn),在搜索過程中避免了主觀因素,搜索出的站點(diǎn)更全面,更豐富,大大提高了搜索站點(diǎn)的效率。
[0028]實(shí)施例2
[0029]參見圖2,本發(fā)明實(shí)施例提供了一種搜索站點(diǎn)的方法,該方法包括:
[0030]201:獲取用戶搜索網(wǎng)頁時(shí)產(chǎn)生的點(diǎn)擊日志;
[0031]具體地,用戶通過互聯(lián)網(wǎng)搜索網(wǎng)頁信息時(shí),一般在搜索引擎中輸入查詢關(guān)鍵詞進(jìn)行搜索,搜索引擎根據(jù)輸入的查詢關(guān)鍵詞顯示出多個(gè)網(wǎng)頁,用戶點(diǎn)擊一個(gè)或多個(gè)網(wǎng)頁,以搜索到自己需要的網(wǎng)頁,此時(shí),后臺(tái)服務(wù)器生成點(diǎn)擊日志,該點(diǎn)擊日志是動(dòng)態(tài)變化的,該點(diǎn)擊日志記錄用戶輸入的查詢關(guān)鍵詞和用戶點(diǎn)擊的URL,一個(gè)查詢關(guān)鍵詞對(duì)應(yīng)一個(gè)或多個(gè)URL。[0032]其中,該步驟可以為預(yù)設(shè)步驟,如預(yù)設(shè)的數(shù)據(jù)庫中記錄有用戶搜索網(wǎng)頁產(chǎn)生的點(diǎn)擊日志,該預(yù)設(shè)的數(shù)據(jù)庫中記錄的用戶搜索網(wǎng)頁產(chǎn)生的點(diǎn)擊日志是動(dòng)態(tài)變化的,可以跳過該步驟,執(zhí)行如下操作。
[0033]202:根據(jù)點(diǎn)擊日志,統(tǒng)計(jì)出查詢關(guān)鍵詞、站點(diǎn)與網(wǎng)頁數(shù)量的對(duì)應(yīng)關(guān)系;
[0034]其中,站點(diǎn)site是指URL的第二個(gè)斜杠和第三個(gè)斜杠之間的信息,即URL的第二個(gè) / 和第三個(gè) / 之間的信息,如,對(duì)于 URL:http://bbs.bbicn.com/forum.php?mod=viewthread&tid= 175289&extra=page%3Dl%26orderby%3DdateIine&page=2,該 URL 對(duì)應(yīng)的 site 是“bbs.bbicn.com”。也就是說,一個(gè)URL對(duì)應(yīng)一個(gè)站點(diǎn),URL和站點(diǎn)都能表示用戶點(diǎn)擊網(wǎng)頁的情況。一個(gè)站點(diǎn)包括多個(gè)網(wǎng)頁,每個(gè)網(wǎng)頁均設(shè)置有網(wǎng)頁標(biāo)題。
[0035]實(shí)際應(yīng)用中,不同URL會(huì)對(duì)應(yīng)同一站點(diǎn),例如下面幾個(gè)不同的URL “http://bbs.bbicn.com/forum.php?mod=viewthread&tid=179283&extra=page%3Dl%26orderby%3Ddateline,,、“http://bbs.bbicn.com/forum.php?mod=forumdisplay&fid=34&page=l&orderby=dateline,,、“http://bbs.bbicn.com/forum.php?mod=viewthread&tid=l75289&extra=page%3Dl%26orderby%3Ddateline&page=2”均對(duì)應(yīng)同一站點(diǎn):“bbs.bbicn.com”。
[0036]其中,根據(jù)點(diǎn)擊日志中記錄的URL得到站點(diǎn),具體為截取URL第二個(gè)反斜杠和第三個(gè)反斜杠之間的信息得到站點(diǎn),對(duì)一個(gè)URL進(jìn)行處理得到一個(gè)站點(diǎn),從而根據(jù)點(diǎn)擊日志得到查詢關(guān)鍵詞與 站點(diǎn)的對(duì)應(yīng)關(guān)系。另外,由于每個(gè)站點(diǎn)包括多個(gè)網(wǎng)頁,該多個(gè)網(wǎng)頁在點(diǎn)擊日志中存儲(chǔ)的URL均不相同,存儲(chǔ)在點(diǎn)擊日志中的URL為不同的URL,但是根據(jù)這些ULR得到的站點(diǎn)為同一站點(diǎn),此時(shí)統(tǒng)計(jì)出這些網(wǎng)頁的網(wǎng)頁數(shù)量,得出該站點(diǎn)包括的網(wǎng)頁的網(wǎng)頁數(shù)量,從而統(tǒng)計(jì)出每個(gè)站點(diǎn)包括的網(wǎng)頁的網(wǎng)頁數(shù)量,得到查詢關(guān)鍵詞、站點(diǎn)與網(wǎng)頁數(shù)量的對(duì)應(yīng)關(guān)系,具體為一個(gè)查詢關(guān)鍵詞對(duì)應(yīng)一個(gè)或多個(gè)站點(diǎn),一個(gè)站點(diǎn)對(duì)應(yīng)一個(gè)或多個(gè)查詢關(guān)鍵詞,一個(gè)站點(diǎn)包括一個(gè)或多個(gè)網(wǎng)頁數(shù)量,如表1所示,查詢關(guān)鍵詞queryA對(duì)應(yīng)sitel和site2等,站點(diǎn) sitel 對(duì)應(yīng) queryA 和 queryB 等;站點(diǎn) sitel 對(duì)應(yīng) countAl 和 countBl 等。
【權(quán)利要求】
1.一種搜索站點(diǎn)的方法,其特征在于,所述方法包括: 根據(jù)用戶搜索網(wǎng)頁時(shí)產(chǎn)生的點(diǎn)擊日志,獲取站點(diǎn)、類別信息與網(wǎng)頁數(shù)量的對(duì)應(yīng)關(guān)系,所述對(duì)應(yīng)關(guān)系用于存儲(chǔ)站點(diǎn),所述站點(diǎn)包括的類別信息以及所述類別信息對(duì)應(yīng)的網(wǎng)頁的網(wǎng)頁數(shù)量; 從所述站點(diǎn)、類別信息與網(wǎng)頁數(shù)量的對(duì)應(yīng)關(guān)系中獲取待搜索類別信息對(duì)應(yīng)的站點(diǎn)、所述站點(diǎn)包括的所述待搜索類別信息對(duì)應(yīng)的網(wǎng)頁的網(wǎng)頁數(shù)量和所述站點(diǎn)包括的所有網(wǎng)頁的網(wǎng)頁數(shù)量; 根據(jù)所述站點(diǎn)包括的所述待搜索類別信息對(duì)應(yīng)的網(wǎng)頁的網(wǎng)頁數(shù)量和所述站點(diǎn)包括的所有網(wǎng)頁的網(wǎng)頁數(shù)量,從所述待搜索類別信息對(duì)應(yīng)的站點(diǎn)中選擇出站點(diǎn)。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)用戶搜索網(wǎng)頁時(shí)產(chǎn)生的點(diǎn)擊日志,獲取站點(diǎn)、類別信息與網(wǎng)頁數(shù)量的對(duì)應(yīng)關(guān)系,包括: 根據(jù)用戶搜索網(wǎng)頁時(shí)產(chǎn)生的點(diǎn)擊日志,統(tǒng)計(jì)出查詢關(guān)鍵詞、站點(diǎn)與網(wǎng)頁數(shù)量的對(duì)應(yīng)關(guān)系; 根據(jù)所述查詢關(guān)鍵詞、站點(diǎn)與網(wǎng)頁數(shù)量的對(duì)應(yīng)關(guān)系,及預(yù)設(shè)的所述查詢關(guān)鍵詞與類別信息的對(duì)應(yīng)關(guān)系,獲取站點(diǎn)、類別信息與網(wǎng)頁數(shù)量的對(duì)應(yīng)關(guān)系。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述從所述站點(diǎn)、類別信息與網(wǎng)頁數(shù)量的對(duì)應(yīng)關(guān)系中獲取待搜索類 別信息對(duì)應(yīng)的站點(diǎn)、所述站點(diǎn)包括的所述待搜索類別信息對(duì)應(yīng)的網(wǎng)頁的網(wǎng)頁數(shù)量和所述站點(diǎn)包括的所有網(wǎng)頁的網(wǎng)頁數(shù)量,包括: 從所述站點(diǎn)、類別信息與網(wǎng)頁數(shù)量的對(duì)應(yīng)關(guān)系中獲取待搜索類別信息對(duì)應(yīng)的站點(diǎn)和所述站點(diǎn)包括的所述待搜索類別信息對(duì)應(yīng)的網(wǎng)頁的網(wǎng)頁數(shù)量; 從所述站點(diǎn)、類別信息與網(wǎng)頁數(shù)量的對(duì)應(yīng)關(guān)系中獲取所述站點(diǎn)包括的每個(gè)類別信息對(duì)應(yīng)的網(wǎng)頁的網(wǎng)頁數(shù)量; 將所述站點(diǎn)包括的每個(gè)類別信息對(duì)應(yīng)的網(wǎng)頁的網(wǎng)頁數(shù)量進(jìn)行相加運(yùn)算,得到所述站點(diǎn)包括的所有網(wǎng)頁的網(wǎng)頁數(shù)量。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述站點(diǎn)包括的所述待搜索類別信息對(duì)應(yīng)的網(wǎng)頁的網(wǎng)頁數(shù)量和所述站點(diǎn)包括的所有網(wǎng)頁的網(wǎng)頁數(shù)量,從所述待搜索類別信息對(duì)應(yīng)的站點(diǎn)中選擇出站點(diǎn),包括: 根據(jù)所述站點(diǎn)包括的所述待搜索類別信息對(duì)應(yīng)的網(wǎng)頁的網(wǎng)頁數(shù)量和所述站點(diǎn)包括的所有網(wǎng)頁的網(wǎng)頁數(shù)量,計(jì)算出所述站點(diǎn)的比例信息; 從待搜索類別信息對(duì)應(yīng)的站點(diǎn)中選擇包括的所述待搜索類別信息對(duì)應(yīng)的網(wǎng)頁的網(wǎng)頁數(shù)量大于預(yù)設(shè)數(shù)值以及比例信息大于預(yù)設(shè)比例的站點(diǎn)。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述從所述待搜索類別信息對(duì)應(yīng)的站點(diǎn)中選擇出站點(diǎn)之后,所述方法還包括: 獲取所述選擇出的站點(diǎn)對(duì)應(yīng)的主頁面包括的網(wǎng)頁標(biāo)題; 根據(jù)所述網(wǎng)頁標(biāo)題從所述選擇出的站點(diǎn)中過濾出最終搜索出的站點(diǎn)。
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述根據(jù)所述網(wǎng)頁標(biāo)題從所述選擇出的站點(diǎn)中過濾出最終搜索出的站點(diǎn),包括: 獲取所述待搜索類別信息對(duì)應(yīng)的一個(gè)或多個(gè)關(guān)鍵詞; 逐一判斷所述網(wǎng)頁標(biāo)題中是否存在所述關(guān)鍵詞;當(dāng)判斷出所述網(wǎng)頁標(biāo)題不存在任何一個(gè)所述關(guān)鍵詞時(shí),則將所述網(wǎng)頁標(biāo)題所屬的站點(diǎn)從所述選擇出的站點(diǎn)中過濾掉,得到最終搜索出的站點(diǎn)。
7.一種搜索站點(diǎn)的裝置,其特征在于,所述裝置包括: 第一獲取模塊,用于根據(jù)用戶搜索網(wǎng)頁時(shí)產(chǎn)生的點(diǎn)擊日志,獲取站點(diǎn)、類別信息與網(wǎng)頁數(shù)量的對(duì)應(yīng)關(guān)系,所述對(duì)應(yīng)關(guān)系用于存儲(chǔ)站點(diǎn),所述站點(diǎn)包括的類別信息以及所述類別信息對(duì)應(yīng)的網(wǎng)頁的網(wǎng)頁數(shù)量; 第二獲取模塊,用于從所述第一獲取模塊獲取的所述站點(diǎn)、類別信息與網(wǎng)頁數(shù)量的對(duì)應(yīng)關(guān)系中獲取待搜索類別信息對(duì)應(yīng)的站點(diǎn)、所述站點(diǎn)包括的所述待搜索類別信息對(duì)應(yīng)的網(wǎng)頁的網(wǎng)頁數(shù)量和所述站點(diǎn) 包括的所有網(wǎng)頁的網(wǎng)頁數(shù)量; 選擇模塊,用于根據(jù)所述第二獲取模塊獲取的所述站點(diǎn)包括的所述待搜索類別信息對(duì)應(yīng)的網(wǎng)頁的網(wǎng)頁數(shù)量和所述站點(diǎn)包括的所有網(wǎng)頁的網(wǎng)頁數(shù)量,從所述待搜索類別信息對(duì)應(yīng)的站點(diǎn)中選擇出站點(diǎn)。
8.根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述第一獲取模塊包括: 統(tǒng)計(jì)單元,用于根據(jù)用戶搜索網(wǎng)頁時(shí)產(chǎn)生的點(diǎn)擊日志,統(tǒng)計(jì)出查詢關(guān)鍵詞、站點(diǎn)與網(wǎng)頁數(shù)量的對(duì)應(yīng)關(guān)系; 分類單元,用于根據(jù)預(yù)設(shè)的查詢關(guān)鍵詞與類別信息的對(duì)應(yīng)關(guān)系,對(duì)所述查詢關(guān)鍵詞進(jìn)行分類,得到查詢關(guān)鍵詞與類別信息的對(duì)應(yīng)關(guān)系; 獲取單元,用于根據(jù)所述查詢關(guān)鍵詞、站點(diǎn)與網(wǎng)頁數(shù)量的對(duì)應(yīng)關(guān)系,及所述查詢關(guān)鍵詞與類別信息的對(duì)應(yīng)關(guān)系,獲取站點(diǎn)、類別信息與網(wǎng)頁數(shù)量的對(duì)應(yīng)關(guān)系。
9.根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述第二獲取模塊包括: 第一獲取單元,用于從所述站點(diǎn)、類別信息與網(wǎng)頁數(shù)量的對(duì)應(yīng)關(guān)系中獲取待搜索類別信息對(duì)應(yīng)的站點(diǎn)和所述站點(diǎn)包括的所述待搜索類別信息對(duì)應(yīng)的網(wǎng)頁的網(wǎng)頁數(shù)量; 第二獲取單元,用于從所述站點(diǎn)、類別信息與網(wǎng)頁數(shù)量的對(duì)應(yīng)關(guān)系中獲取所述站點(diǎn)包括的每個(gè)類別信息對(duì)應(yīng)的網(wǎng)頁的網(wǎng)頁數(shù)量; 運(yùn)算單元,用于將所述站點(diǎn)包括的每個(gè)類別信息對(duì)應(yīng)的網(wǎng)頁的網(wǎng)頁數(shù)量進(jìn)行相加運(yùn)算,得到所述站點(diǎn)包括的所有網(wǎng)頁的網(wǎng)頁數(shù)量。
10.根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述選擇模塊包括: 計(jì)算單元,用于根據(jù)所述站點(diǎn)包括的所述待搜索類別信息對(duì)應(yīng)的網(wǎng)頁的網(wǎng)頁數(shù)量和所述站點(diǎn)包括的所有網(wǎng)頁的網(wǎng)頁數(shù)量,計(jì)算出所述站點(diǎn)的比例信息; 選擇單元,用于從待搜索類別信息對(duì)應(yīng)的站點(diǎn)中選擇包括的所述待搜索類別信息對(duì)應(yīng)的網(wǎng)頁的網(wǎng)頁數(shù)量大于預(yù)設(shè)數(shù)值以及比例信息大于預(yù)設(shè)比例的站點(diǎn)。
11.根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述裝置還包括過濾模塊,用于獲取所述選擇出的站點(diǎn)對(duì)應(yīng)的主頁面包括的網(wǎng)頁標(biāo)題,并根據(jù)所述網(wǎng)頁標(biāo)題從所述選擇出的站點(diǎn)中過濾出最終搜索出的站點(diǎn)。
12.根據(jù)權(quán)利要求11所述的裝置,其特征在于,所述過濾模塊包括: 獲取單元,用于獲取所述待搜索類別信息對(duì)應(yīng)的一個(gè)或多個(gè)關(guān)鍵詞; 判斷單元,用于逐一判斷所述網(wǎng)頁標(biāo)題中是否存在所述關(guān)鍵詞; 過濾單元,用于當(dāng)判斷出所述網(wǎng)頁標(biāo)題不存在任何一個(gè)所述關(guān)鍵詞時(shí),則將該所述網(wǎng)頁標(biāo)題所屬的站點(diǎn)從所述選擇出的站點(diǎn)中過濾掉,得到最終搜索出的站點(diǎn)。
【文檔編號(hào)】G06F17/30GK103902550SQ201210572419
【公開日】2014年7月2日 申請(qǐng)日期:2012年12月25日 優(yōu)先權(quán)日:2012年12月25日
【發(fā)明者】高健, 陳戈, 楊志峰 申請(qǐng)人:深圳市世紀(jì)光速信息技術(shù)有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
新晃| 天长市| 广州市| 永清县| 湄潭县| 深州市| 寿宁县| 秦安县| 长海县| 博湖县| 松原市| 米易县| 稻城县| 藁城市| 正镶白旗| 礼泉县| 上饶市| 金坛市| 伊宁市| 曲周县| 西峡县| 台湾省| 哈巴河县| 新昌县| 阿坝县| 元谋县| 吉安县| 和龙市| 勐海县| 贵南县| 高唐县| 宁陕县| 长泰县| 汤阴县| 甘泉县| 武强县| 南澳县| 元阳县| 台安县| 惠水县| 林芝县|