欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

獲取移動(dòng)站點(diǎn)鏈接地址的方法和裝置制造方法

文檔序號(hào):6639543閱讀:185來源:國(guó)知局
獲取移動(dòng)站點(diǎn)鏈接地址的方法和裝置制造方法
【專利摘要】本發(fā)明公開了一種獲取移動(dòng)站點(diǎn)鏈接地址的方法和裝置,其中,方法包括:獲取包含多個(gè)PC站點(diǎn)的PC站點(diǎn)鏈接地址列表;利用移動(dòng)用戶代理向PC站點(diǎn)鏈接地址列表中一個(gè)或多個(gè)PC站點(diǎn)分別發(fā)起頁面訪問請(qǐng)求;判斷頁面訪問請(qǐng)求的返回頁面類型是否為移動(dòng)網(wǎng)頁;若頁面訪問請(qǐng)求對(duì)應(yīng)的返回頁面類型為移動(dòng)網(wǎng)頁,獲取移動(dòng)網(wǎng)頁所屬站點(diǎn)的鏈接地址作為移動(dòng)站點(diǎn)。根據(jù)該方案,利用PC站點(diǎn)和移動(dòng)站點(diǎn)的相關(guān)性進(jìn)行移動(dòng)站點(diǎn)的挖掘,獲得了更高的移動(dòng)站點(diǎn)挖掘的召回率,并且挖掘結(jié)果準(zhǔn)確,全面。
【專利說明】獲取移動(dòng)站點(diǎn)鏈接地址的方法和裝置

【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及互聯(lián)網(wǎng)【技術(shù)領(lǐng)域】,具體涉及一種獲取移動(dòng)站點(diǎn)鏈接地址的方法和裝置。

【背景技術(shù)】
[0002]隨著移動(dòng)互聯(lián)網(wǎng)和無線通信的快速發(fā)展,越來越多的用戶使用智能手機(jī),平板電腦等移動(dòng)設(shè)備訪問網(wǎng)頁,請(qǐng)求互聯(lián)網(wǎng)資源,進(jìn)行搜索和查詢等。與傳統(tǒng)的PC訪問方式相比,移動(dòng)設(shè)備訪問方式更加方便,用戶能夠隨時(shí)隨地對(duì)互聯(lián)網(wǎng)進(jìn)行訪問。
[0003]然而,移動(dòng)設(shè)備與PC的配置不同,例如,移動(dòng)設(shè)備的顯示屏幕的尺寸一般遠(yuǎn)小于PC的顯示屏幕,比例也往往不一致。因此,在移動(dòng)設(shè)備上打開PC站點(diǎn),可能不利于用戶觀看。然而用戶使用移動(dòng)設(shè)備進(jìn)行搜索時(shí),搜索結(jié)果頁面中包含大量PC站點(diǎn)。因此,移動(dòng)搜索引擎應(yīng)該為用戶提供適于顯示的頁面,這就需要對(duì)移動(dòng)站點(diǎn)進(jìn)行挖掘,收錄移動(dòng)資源,盡可能在搜索結(jié)果中給出移動(dòng)站點(diǎn)。但現(xiàn)有技術(shù)中的移動(dòng)站點(diǎn)挖掘方法并不準(zhǔn)確,難以滿足召回率的要求。


【發(fā)明內(nèi)容】

[0004]鑒于上述問題,提出了本發(fā)明以便提供一種克服上述問題或者至少部分地解決上述問題的獲取移動(dòng)站點(diǎn)鏈接地址的方法和裝置。
[0005]根據(jù)本發(fā)明的一個(gè)方面,提供了一種獲取移動(dòng)站點(diǎn)鏈接地址的方法,包括:
[0006]獲取包含多個(gè)PC站點(diǎn)的PC站點(diǎn)鏈接地址列表;
[0007]利用移動(dòng)用戶代理向所述PC站點(diǎn)鏈接地址列表中一個(gè)或多個(gè)PC站點(diǎn)分別發(fā)起頁面訪問請(qǐng)求;
[0008]判斷所述頁面訪問請(qǐng)求的返回頁面類型是否為移動(dòng)網(wǎng)頁;
[0009]若所述頁面訪問請(qǐng)求對(duì)應(yīng)的返回頁面類型為移動(dòng)網(wǎng)頁,獲取所述移動(dòng)網(wǎng)頁所屬站點(diǎn)的鏈接地址作為移動(dòng)站點(diǎn)。
[0010]可選地,所述利用移動(dòng)用戶代理向所述PC站點(diǎn)鏈接地址列表中一個(gè)或多個(gè)PC站點(diǎn)分別發(fā)起頁面訪問請(qǐng)求進(jìn)一步為:向列表中的PC站點(diǎn)的首頁發(fā)起頁面訪問請(qǐng)求和/或向列表中PC站點(diǎn)下的隨機(jī)選取的網(wǎng)頁發(fā)起頁面訪問請(qǐng)求;
[0011]所述判斷頁面訪問請(qǐng)求的返回頁面類型是否為移動(dòng)網(wǎng)頁進(jìn)一步為:判斷PC站點(diǎn)返回的站點(diǎn)首頁的頁面類型是否為移動(dòng)網(wǎng)頁和/或該P(yáng)C站點(diǎn)下的隨機(jī)選取的網(wǎng)頁發(fā)起的頁面訪問請(qǐng)求的返回頁面類型是否者為移動(dòng)網(wǎng)頁;
[0012]若所述向各個(gè)PC站點(diǎn)的首頁和/或各個(gè)PC站點(diǎn)下的隨機(jī)選取的網(wǎng)頁發(fā)起的頁面訪問請(qǐng)求的返回頁面都為移動(dòng)網(wǎng)頁,判斷移動(dòng)網(wǎng)頁所屬的站點(diǎn)作為移動(dòng)站點(diǎn)。
[0013]可選地,所述判斷所述頁面訪問請(qǐng)求的返回頁面類型是否為移動(dòng)網(wǎng)頁進(jìn)一步包括:
[0014]判斷所述頁面訪問請(qǐng)求的返回頁面的URL是否具有移動(dòng)網(wǎng)頁的URL特征;
[0015]將具有移動(dòng)網(wǎng)頁的URL特征的返回頁面類型判斷為移動(dòng)網(wǎng)頁。
[0016]可選地,所述判斷所述頁面訪問請(qǐng)求的返回頁面類型是否為移動(dòng)網(wǎng)頁進(jìn)一步包括:
[0017]對(duì)所述頁面訪問請(qǐng)求的返回頁面進(jìn)行頁面解析以獲取頁面內(nèi)容;
[0018]根據(jù)所述頁面內(nèi)容判斷所述返回頁面是否適合移動(dòng)設(shè)備顯示,將適合移動(dòng)設(shè)備顯示的返回頁面類型判斷為移動(dòng)網(wǎng)頁。
[0019]可選地,所述獲取包含多個(gè)PC站點(diǎn)的PC站點(diǎn)鏈接地址列表進(jìn)一步為:
[0020]根據(jù)搜索引擎的索引庫(kù)中收錄的PC站點(diǎn)獲取所述PC站點(diǎn)鏈接地址列表。
[0021]可選地,所述方法還包括:將獲取的移動(dòng)站點(diǎn)收錄入移動(dòng)搜索引擎索引庫(kù)中。
[0022]可選地,所述方法還包括:接收客戶端發(fā)送的搜索請(qǐng)求;根據(jù)所述搜索請(qǐng)求中的用戶代理信息,判斷所述客戶端是否為移動(dòng)設(shè)備;若所述客戶端為移動(dòng)設(shè)備,將所述移動(dòng)搜索引擎索引庫(kù)中收錄的與所述搜索請(qǐng)求相關(guān)的移動(dòng)站點(diǎn)返回給所述客戶端。
[0023]根據(jù)本發(fā)明的另一方面,提供了一種獲取移動(dòng)站點(diǎn)鏈接地址的裝置,包括:
[0024]PC站點(diǎn)獲取模塊,適于獲取包含多個(gè)PC站點(diǎn)的PC站點(diǎn)鏈接地址列表;
[0025]請(qǐng)求模塊,適于利用移動(dòng)用戶代理向所述PC站點(diǎn)鏈接地址列表中一個(gè)或多個(gè)PC站點(diǎn)分別發(fā)起頁面訪問請(qǐng)求;
[0026]判斷模塊,適于判斷所述頁面訪問請(qǐng)求的返回頁面類型是否為移動(dòng)網(wǎng)頁;
[0027]移動(dòng)站點(diǎn)獲取模塊,適于在所述頁面訪問請(qǐng)求的返回頁面類型為移動(dòng)頁面時(shí),獲取所述移動(dòng)頁面所屬站點(diǎn)的鏈接地址作為移動(dòng)站點(diǎn)。
[0028]可選地,所述請(qǐng)求模塊進(jìn)一步適于:向列表中的PC站點(diǎn)的首頁發(fā)起頁面訪問請(qǐng)求和/或向列表中PC站點(diǎn)下的隨機(jī)選取的網(wǎng)頁發(fā)起頁面訪問請(qǐng)求;
[0029]所述判斷模塊進(jìn)一步適于:判斷PC站點(diǎn)返回的站點(diǎn)首頁的頁面類型是否為移動(dòng)網(wǎng)頁和/或該P(yáng)C站點(diǎn)下的隨機(jī)選取的網(wǎng)頁發(fā)起的頁面訪問請(qǐng)求的返回頁面類型是否者為移動(dòng)網(wǎng)頁;
[0030]若所述向各個(gè)PC站點(diǎn)的首頁和/或各個(gè)PC站點(diǎn)下的隨機(jī)選取的網(wǎng)頁發(fā)起的頁面訪問請(qǐng)求的返回頁面都為移動(dòng)網(wǎng)頁,判斷移動(dòng)網(wǎng)頁所屬的站點(diǎn)作為移動(dòng)站點(diǎn)。
[0031]可選地,所述判斷模塊進(jìn)一步適于:
[0032]判斷所述頁面訪問請(qǐng)求的返回頁面的URL是否具有移動(dòng)網(wǎng)頁的URL特征;
[0033]將具有移動(dòng)網(wǎng)頁的URL特征的返回頁面類型判斷為移動(dòng)網(wǎng)頁。
[0034]可選地,所述判斷模塊進(jìn)一步適于:對(duì)所述頁面訪問請(qǐng)求的返回頁面進(jìn)行頁面解析以獲取頁面內(nèi)容;根據(jù)所述頁面內(nèi)容判斷所述返回頁面是否適合移動(dòng)設(shè)備顯示,將適合移動(dòng)設(shè)備顯示的返回頁面類型判斷為移動(dòng)網(wǎng)頁。
[0035]可選地,所述PC站點(diǎn)獲取模塊進(jìn)一步適于:根據(jù)搜索引擎的索引庫(kù)中收錄的PC站點(diǎn)獲取所述PC站點(diǎn)鏈接地址列表。
[0036]可選地,所述裝置還包括:收錄模塊,適于將獲取的移動(dòng)站點(diǎn)收錄入移動(dòng)搜索引擎索引庫(kù)中。
[0037]可選地,所述裝置還包括:搜索處理模塊,適于:接收客戶端發(fā)送的搜索請(qǐng)求;根據(jù)所述搜索請(qǐng)求中的用戶代理信息,判斷所述客戶端是否為移動(dòng)設(shè)備;若所述客戶端為移動(dòng)設(shè)備,將所述移動(dòng)搜索引擎索引庫(kù)中收錄的與所述搜索請(qǐng)求相關(guān)的移動(dòng)站點(diǎn)返回給所述客戶端。
[0038]根據(jù)本發(fā)明的獲取移動(dòng)站點(diǎn)鏈接地址的方法和裝置,獲取PC站點(diǎn)鏈接地址列表,利用移動(dòng)用戶代理向PC站點(diǎn)鏈接地址列表中的PC站點(diǎn)發(fā)起頁面訪問請(qǐng)求,若返回的是移動(dòng)網(wǎng)頁,認(rèn)為該P(yáng)C站點(diǎn)具有相應(yīng)的移動(dòng)站點(diǎn),且返回的移動(dòng)站點(diǎn)就是該P(yáng)C站點(diǎn)對(duì)應(yīng)的移動(dòng)站點(diǎn),根據(jù)返回的移動(dòng)網(wǎng)頁確定移動(dòng)站點(diǎn)的鏈接地址。根據(jù)該方案,利用PC站點(diǎn)和移動(dòng)站點(diǎn)的相關(guān)性進(jìn)行移動(dòng)站點(diǎn)的挖掘,獲得了更高的移動(dòng)站點(diǎn)挖掘的召回率,并且挖掘結(jié)果準(zhǔn)確,全面。
[0039]上述說明僅是本發(fā)明技術(shù)方案的概述,為了能夠更清楚了解本發(fā)明的技術(shù)手段,而可依照說明書的內(nèi)容予以實(shí)施,并且為了讓本發(fā)明的上述和其它目的、特征和優(yōu)點(diǎn)能夠更明顯易懂,以下特舉本發(fā)明的【具體實(shí)施方式】。

【專利附圖】

【附圖說明】
[0040]通過閱讀下文優(yōu)選實(shí)施方式的詳細(xì)描述,各種其他的優(yōu)點(diǎn)和益處對(duì)于本領(lǐng)域普通技術(shù)人員將變得清楚明了。附圖僅用于示出優(yōu)選實(shí)施方式的目的,而并不認(rèn)為是對(duì)本發(fā)明的限制。而且在整個(gè)附圖中,用相同的參考符號(hào)表示相同的部件。在附圖中:
[0041]圖1示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的獲取移動(dòng)站點(diǎn)鏈接地址的方法的流程圖;
[0042]圖2示出了根據(jù)本發(fā)明另一個(gè)實(shí)施例的獲取移動(dòng)站點(diǎn)鏈接地址的方法的流程圖;
[0043]圖3示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的獲取移動(dòng)站點(diǎn)鏈接地址的裝置的結(jié)構(gòu)框圖;
[0044]圖4示出了根據(jù)本發(fā)明另一個(gè)實(shí)施例的獲取移動(dòng)站點(diǎn)鏈接地址的裝置的結(jié)構(gòu)框圖。

【具體實(shí)施方式】
[0045]下面將參照附圖更詳細(xì)地描述本公開的示例性實(shí)施例。雖然附圖中顯示了本公開的示例性實(shí)施例,然而應(yīng)當(dāng)理解,可以以各種形式實(shí)現(xiàn)本公開而不應(yīng)被這里闡述的實(shí)施例所限制。相反,提供這些實(shí)施例是為了能夠更透徹地理解本公開,并且能夠?qū)⒈竟_的范圍完整的傳達(dá)給本領(lǐng)域的技術(shù)人員。
[0046]圖1示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的獲取移動(dòng)站點(diǎn)鏈接地址的方法的流程圖,如圖1所示,方法包括如下步驟:
[0047]步驟SI 10,獲取包含多個(gè)PC站點(diǎn)的PC站點(diǎn)鏈接地址列表。
[0048]PC站點(diǎn)是指適合在普通電腦設(shè)備上顯示的站點(diǎn),移動(dòng)站點(diǎn)是指適合在移動(dòng)設(shè)備,例如手機(jī)、平板電腦上顯示的站點(diǎn)。PC站點(diǎn)鏈接地址列表可以來自搜索引擎的蜘蛛程序在爬行網(wǎng)頁時(shí)得到的部分PC站點(diǎn)的列表,或是已挖掘的PC站點(diǎn)。
[0049]PC站點(diǎn)鏈接地址列表中包括多個(gè)PC站點(diǎn)首頁的URL,例如,http://www.#,http://www.s0.com等。進(jìn)一步地,站點(diǎn)列表還可以包括在PC站點(diǎn)首頁上通過一次或多次鏈接訪問到的頁面,例如對(duì)其中的360站點(diǎn),鏈接地址列表中還包括首頁中“論壇”鏈接對(duì)應(yīng)的 URL:http://bbs.360safe.com/index, html 等。
[0050]本發(fā)明將獲取的PC站點(diǎn)列表用于移動(dòng)站點(diǎn)挖掘?,F(xiàn)有的挖掘移動(dòng)站點(diǎn)的方式都是根據(jù)移動(dòng)站點(diǎn)的URL特征完成的。很多移動(dòng)站點(diǎn)包括3g” “,mobileWap”等具有移動(dòng)特征的字符串,例如,3g.163.com等,若能從站點(diǎn)的域名中提取出上述字符串,該站點(diǎn)即為移動(dòng)站點(diǎn)。然而這種方式并不準(zhǔn)確。首先,不是所有的移動(dòng)站點(diǎn)都包含這些字符串;而且具有移動(dòng)特征的字符串難以羅列完整。另外特征字符串在URL中的位置也是多變的。特征字符串可能在站點(diǎn)URL的最前面,如移動(dòng)站點(diǎn)3g.163.com,但也可能在中間位置,例如,移動(dòng)站點(diǎn)cn.mobile, reuters.com等。因此,上述挖掘方法不夠準(zhǔn)確,同時(shí),挖掘過程中需要篩選掉大量的PC站點(diǎn),效率較低。
[0051]通過分析當(dāng)前互聯(lián)網(wǎng)站點(diǎn)的特點(diǎn),發(fā)現(xiàn)移動(dòng)站點(diǎn)一般具有對(duì)應(yīng)的PC站點(diǎn),并且移動(dòng)站點(diǎn)的URL與對(duì)應(yīng)的PC站點(diǎn)的URL相似,而帶有一定的移動(dòng)特征。本發(fā)明根據(jù)這一特點(diǎn),提供了一種利用PC站點(diǎn)挖掘移動(dòng)站點(diǎn)的方法。由于PC站點(diǎn)的挖掘已經(jīng)比較完善,根據(jù)PC站點(diǎn)的特性直接獲取移動(dòng)站點(diǎn)的方式更加快速,準(zhǔn)確。
[0052]步驟S120,利用移動(dòng)用戶代理向PC站點(diǎn)鏈接地址列表中一個(gè)或多個(gè)PC站點(diǎn)分別發(fā)起頁面訪問請(qǐng)求。
[0053]移動(dòng)終端或PC都是通過http協(xié)議訪問互聯(lián)網(wǎng)資源。http請(qǐng)求報(bào)文的首部中包括用戶代理(user-agent,簡(jiǎn)稱UA)字段。UA用于記錄發(fā)送http請(qǐng)求的終端的部分信息。
[0054]為了便于理解本發(fā)明,下面先簡(jiǎn)單介紹一下UA信息的具體內(nèi)容。UA是一個(gè)特殊的字符串頭,其中包含一系列有關(guān)終端的信息。例如,計(jì)算機(jī)終端使用的操作系統(tǒng)及版本、CPU類型、瀏覽器類型及版本、瀏覽器渲染引擎等。通常情況下,UA的標(biāo)準(zhǔn)格式為:瀏覽器標(biāo)識(shí);操作系統(tǒng)標(biāo)識(shí);加密等級(jí)標(biāo)識(shí);瀏覽器語言;渲染引擎標(biāo)識(shí);版本信息,其中,瀏覽器標(biāo)識(shí)是形如Mozilla/5.0或Opera/7.54等標(biāo)記瀏覽器產(chǎn)品的字串;常見的操作系統(tǒng)標(biāo)識(shí)包括:FressBSD, Linux, Mac, Solaris以及Windows等。瀏覽器版本信息中顯示瀏覽器的真實(shí)版本信息,格式為Vers1n/版本號(hào)。例如,Iphone用戶訪問網(wǎng)頁時(shí)發(fā)送白勺請(qǐng)求時(shí) User-agent 信息為 Mozilla/5.0 (iPhone ;CPU iPhone OS 5_01ike Mac OS X)AppleffebKit/534.46(KHTML,like Gecko)Vers1n/5.1Mobile/9A334Safari/755.48.3。
[0055]在UA包含的上述信息中,與本發(fā)明最相關(guān)的是能夠反映終端類型的信息,例如,操作系統(tǒng)標(biāo)識(shí)。移動(dòng)終端的操作系統(tǒng)標(biāo)識(shí)包括10S, Android, Symbian等。如果操作系統(tǒng)為上述幾種類型,則訪問站點(diǎn)能夠得知該請(qǐng)求來自移動(dòng)終端。
[0056]現(xiàn)有互聯(lián)網(wǎng)站點(diǎn)的另外一個(gè)特點(diǎn)是,能夠根據(jù)不同的訪問終端返回不同類型的網(wǎng)頁,其中,站點(diǎn)正是根據(jù)http請(qǐng)求中的UA字段判斷終端類型。例如,用戶通過手機(jī)訪問http://www.s0.com,站點(diǎn)接收該http請(qǐng)求,提取出UA字段,得知請(qǐng)求來自移動(dòng)終端,貝Ij向終端返回相應(yīng)的移動(dòng)網(wǎng)頁,例如http://m.s0.com,或通過自動(dòng)跳轉(zhuǎn)程序,將終端的頁面請(qǐng)求重定向至移動(dòng)頁面。
[0057]利用互聯(lián)網(wǎng)站點(diǎn)的這一特性以及UA信息,本發(fā)明中,執(zhí)行移動(dòng)站點(diǎn)挖掘的服務(wù)器程序?qū)姆?wù)器發(fā)出的http請(qǐng)求中的UA修改為移動(dòng)終端的形式。例如,原服務(wù)器的操作系統(tǒng)為Solaris,現(xiàn)在被修改為了 Android/4.0,或10S,然后向PC站點(diǎn)鏈接地址列表中的各PC站點(diǎn)分別發(fā)送這些經(jīng)過修改的http請(qǐng)求。通過這種方式,使站點(diǎn)判斷該http請(qǐng)求來自移動(dòng)終端,而返回相應(yīng)類型的頁面。
[0058]步驟S130,判斷頁面訪問請(qǐng)求的返回頁面類型是否為移動(dòng)網(wǎng)頁。
[0059]頁面類型包括移動(dòng)網(wǎng)頁和PC網(wǎng)頁。經(jīng)過步驟S120,站點(diǎn)接收的是UA表現(xiàn)為移動(dòng)終端特征的http請(qǐng)求。因此,如果該P(yáng)C站點(diǎn)具有對(duì)應(yīng)的移動(dòng)站點(diǎn),將向請(qǐng)求方返回移動(dòng)網(wǎng)頁或定向至移動(dòng)網(wǎng)頁。若PC站點(diǎn)沒有移動(dòng)站點(diǎn),仍然返回PC網(wǎng)頁。
[0060]頁面類型可通過站點(diǎn)返回頁面的URL特征判斷,若URL中帶有mobile, wap或3g等字樣,判斷頁面類型為移動(dòng)網(wǎng)頁?;蛘?,通過分析返回網(wǎng)頁的內(nèi)容是否適于移動(dòng)設(shè)備顯示等方式進(jìn)行判斷。
[0061]步驟S140,若頁面訪問請(qǐng)求對(duì)應(yīng)的返回頁面類型為移動(dòng)網(wǎng)頁,獲取移動(dòng)網(wǎng)頁所屬站點(diǎn)的鏈接地址作為移動(dòng)站點(diǎn)。
[0062]移動(dòng)站點(diǎn)與對(duì)應(yīng)的PC站點(diǎn)具有類似的URL,例如,移動(dòng)站點(diǎn)http://m.s0.com/對(duì)應(yīng)于 PC 站點(diǎn) http://www.s0.com/。類似地,還有移動(dòng)站點(diǎn) 3g.163.com, m.jd.com, wap.ganj1.com/Beijing/test等,分別都包含有與PC站點(diǎn)相同的二級(jí)域名特征so, 163, jd,ganji等。從返回的移動(dòng)網(wǎng)頁的URL提取出這種作為站點(diǎn)標(biāo)識(shí)的域名特征,得到站點(diǎn)所屬的鏈接地址。
[0063]根據(jù)本發(fā)明上述實(shí)施例提供的方法,獲取PC站點(diǎn)鏈接地址列表,利用移動(dòng)用戶代理向PC站點(diǎn)鏈接地址列表中的PC站點(diǎn)發(fā)起頁面訪問請(qǐng)求,若返回的是移動(dòng)網(wǎng)頁,認(rèn)為該P(yáng)C站點(diǎn)具有相應(yīng)的移動(dòng)站點(diǎn),且返回的移動(dòng)站點(diǎn)就是該P(yáng)C站點(diǎn)對(duì)應(yīng)的移動(dòng)站點(diǎn),根據(jù)返回的移動(dòng)網(wǎng)頁確定移動(dòng)站點(diǎn)的鏈接地址。根據(jù)該方案,利用PC站點(diǎn)和移動(dòng)站點(diǎn)的相關(guān)性進(jìn)行移動(dòng)站點(diǎn)的挖掘,獲得了更高的移動(dòng)站點(diǎn)挖掘的召回率,并且挖掘結(jié)果準(zhǔn)確,全面。
[0064]圖2示出了根據(jù)本發(fā)明另一個(gè)實(shí)施例的獲取移動(dòng)站點(diǎn)鏈接地址的方法的流程圖,如圖2所示,方法包括如下步驟:
[0065]步驟S210,根據(jù)搜索引擎的索引庫(kù)中收錄的PC站點(diǎn)獲取PC站點(diǎn)鏈接地址列表。
[0066]在本實(shí)施例中,將移動(dòng)站點(diǎn)挖掘的方法應(yīng)用于移動(dòng)搜索引擎。PC站點(diǎn)和對(duì)應(yīng)的移動(dòng)站點(diǎn)的內(nèi)容一般也是對(duì)應(yīng)的,本發(fā)明根據(jù)PC站點(diǎn)的按關(guān)鍵詞分類的索引庫(kù)獲取移動(dòng)站點(diǎn)的索引庫(kù),更加快速。
[0067]步驟S220,利用移動(dòng)用戶代理向PC站點(diǎn)鏈接地址列表中的一個(gè)PC站點(diǎn)發(fā)起頁面訪問請(qǐng)求。
[0068]該步驟包括向鏈接地址列表中的PC站點(diǎn)的首頁發(fā)起頁面訪問請(qǐng)求,或向鏈接地址列表中PC站點(diǎn)下的隨機(jī)選取的網(wǎng)頁發(fā)起頁面訪問請(qǐng)求,或以上的結(jié)合。隨機(jī)選取的網(wǎng)頁可以是隨機(jī)選取的PC站點(diǎn)首頁上的鏈接,這種方式用于提高判斷的準(zhǔn)確性。
[0069]步驟S230,判斷頁面訪問請(qǐng)求的返回頁面的URL是否具有移動(dòng)網(wǎng)頁的URL特征,將具有移動(dòng)網(wǎng)頁的URL特征的返回頁面類型判斷為移動(dòng)網(wǎng)頁。
[0070]具體地,判斷PC站點(diǎn)返回的站點(diǎn)首頁的頁面類型是否為移動(dòng)網(wǎng)頁和/或該P(yáng)C站點(diǎn)下的隨機(jī)選取的網(wǎng)頁發(fā)起的頁面訪問請(qǐng)求的返回頁面類型是否都為移動(dòng)網(wǎng)頁;若向各個(gè)PC站點(diǎn)的首頁和/或各個(gè)PC站點(diǎn)下的隨機(jī)選取的網(wǎng)頁發(fā)起的頁面訪問請(qǐng)求的返回頁面都為移動(dòng)網(wǎng)頁,判斷移動(dòng)網(wǎng)頁所屬的站點(diǎn)作為移動(dòng)站點(diǎn)。
[0071]頁面類型可通過站點(diǎn)返回頁面的URL特征判斷,若URL中帶有mobile, wap, 3g或m等字樣,判斷頁面類型為移動(dòng)網(wǎng)頁。例如,頁面http://m.51 job.com, http://wap.baidu.com都為移動(dòng)網(wǎng)頁。
[0072]部分移動(dòng)站點(diǎn)的URL與PC站點(diǎn)的URL —致,例如,PC站點(diǎn)的URL為http://www.baidu.com ;當(dāng)以移動(dòng)用戶代理請(qǐng)求時(shí),返回的URL仍然為http://www.baidu.com,但移動(dòng)網(wǎng)頁的內(nèi)容與PC網(wǎng)頁不同,適于在移動(dòng)終端顯示。
[0073]在本發(fā)明的一個(gè)實(shí)施例中,通過另一種方式判斷返回頁面類型。具體地,對(duì)頁面訪問請(qǐng)求的返回頁面進(jìn)行頁面解析以獲取頁面內(nèi)容;根據(jù)頁面內(nèi)容判斷返回頁面是否適合移動(dòng)設(shè)備顯示,將適合移動(dòng)設(shè)備顯示的返回頁面類型判斷為移動(dòng)網(wǎng)頁。一般地,移動(dòng)網(wǎng)頁與對(duì)應(yīng)的PC網(wǎng)頁相比,內(nèi)容較少,頁面尺寸網(wǎng)頁中各元素分布也有所不同。網(wǎng)頁內(nèi)容中還可能帶有“觸屏版”,“電腦版”等字樣,根據(jù)上述內(nèi)容進(jìn)行判斷。或者,同時(shí)以PC形式的User-agent發(fā)送請(qǐng)求,通過網(wǎng)頁內(nèi)容對(duì)比進(jìn)行判斷。
[0074]步驟S240,根據(jù)返回移動(dòng)網(wǎng)頁的URL獲取移動(dòng)站點(diǎn)的URL。
[0075]移動(dòng)站點(diǎn)與對(duì)應(yīng)的PC站點(diǎn)具有類似的URL,例如,移動(dòng)站點(diǎn)http://m.s0.com/對(duì)應(yīng)于 PC 站點(diǎn) http://www.s0.com/。類似地,還有移動(dòng)站點(diǎn) 3g.163.com, m.jd.com, wap.ganj1.com/Beijing/test等,分別都包含有與PC站點(diǎn)相同的二級(jí)域名特征so, 163, jd,ganji等。從移動(dòng)網(wǎng)頁的URL提取出這種作為站點(diǎn)標(biāo)識(shí)的域名特征,從而得到移動(dòng)站點(diǎn)的URL。
[0076]步驟S250,將獲取的移動(dòng)站點(diǎn)收錄入移動(dòng)搜索引擎索引庫(kù)中。
[0077]對(duì)于搜索關(guān)鍵詞,如果在PC站點(diǎn)中出現(xiàn),則相應(yīng)的移動(dòng)站點(diǎn)中一般也會(huì)包含該關(guān)鍵詞。具體地,該步驟根據(jù)相應(yīng)PC站點(diǎn)的關(guān)鍵詞分類,將該移動(dòng)站點(diǎn)收錄如移動(dòng)搜索索引庫(kù)的同一關(guān)鍵詞分類下。
[0078]步驟S260,接收客戶端發(fā)送的搜索請(qǐng)求。
[0079]客戶端發(fā)送的搜索請(qǐng)求中帶有關(guān)鍵字和客戶端的UA信息。
[0080]步驟S270,根據(jù)搜索請(qǐng)求中的用戶代理信息,判斷客戶端是否為移動(dòng)設(shè)備,若為移動(dòng)設(shè)備,執(zhí)行步驟S280。
[0081]對(duì)客戶端發(fā)送的http請(qǐng)求的UA字段進(jìn)行分析,UA字段信息中包括反映終端類型的信息,例如,操作系統(tǒng)標(biāo)識(shí)。移動(dòng)終端的操作系統(tǒng)標(biāo)識(shí)包括10S, Android, Symbian等。如果操作系統(tǒng)為上述幾種類型,則能夠得知該請(qǐng)求來自移動(dòng)終端。也可以通過UA中的終端類型標(biāo)識(shí)等進(jìn)行判斷。
[0082]步驟S280,將移動(dòng)搜索引擎索引庫(kù)中收錄的與搜索請(qǐng)求相關(guān)的移動(dòng)站點(diǎn)返回給客戶端。
[0083]通常移動(dòng)搜索引擎向用戶返回的搜索結(jié)果頁面中包含大量的PC網(wǎng)頁,這些PC網(wǎng)頁的尺寸,內(nèi)容可能不利于移動(dòng)終端顯示。
[0084]本發(fā)明實(shí)施例中,當(dāng)用戶使用移動(dòng)搜索時(shí),在搜索結(jié)果頁中,優(yōu)先列出與搜索有關(guān)的移動(dòng)頁面。
[0085]根據(jù)本發(fā)明上述實(shí)施例提供的方法,將獲取移動(dòng)站點(diǎn)鏈接地址的方法應(yīng)用于移動(dòng)搜索。根據(jù)搜索引擎的索引庫(kù)中收錄的PC站點(diǎn)獲取所述PC站點(diǎn)鏈接地址列表,利用移動(dòng)用戶代理向PC站點(diǎn)鏈接地址列表中的PC站點(diǎn)發(fā)起頁面訪問請(qǐng)求,根據(jù)返回的移動(dòng)網(wǎng)頁確定移動(dòng)站點(diǎn)的鏈接地址。對(duì)移動(dòng)站點(diǎn)進(jìn)行收錄。根據(jù)該方案,利用PC站點(diǎn)和移動(dòng)站點(diǎn)的相關(guān)性進(jìn)行移動(dòng)站點(diǎn)的挖掘,獲得了更高的移動(dòng)站點(diǎn)挖掘的召回率,并且挖掘結(jié)果準(zhǔn)確,全面。并且,當(dāng)用戶使用移動(dòng)搜索時(shí),優(yōu)先展現(xiàn)移動(dòng)站點(diǎn),利于用戶查看,并且索引庫(kù)的維護(hù)更加容易。
[0086]圖3示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的獲取移動(dòng)站點(diǎn)鏈接地址的裝置的結(jié)構(gòu)框圖,如圖3所示,裝置包括:
[0087]PC站點(diǎn)獲取模塊310,適于獲取包含多個(gè)PC站點(diǎn)的PC站點(diǎn)鏈接地址列表。
[0088]PC站點(diǎn)是指適合在普通電腦設(shè)備上顯示的站點(diǎn),移動(dòng)站點(diǎn)是指適合在移動(dòng)設(shè)備,例如手機(jī)、平板電腦上顯示的站點(diǎn)。PC站點(diǎn)鏈接地址列表可以來自搜索引擎的蜘蛛程序在爬行網(wǎng)頁時(shí)得到的部分PC站點(diǎn)的列表,或是已挖掘的PC站點(diǎn)。
[0089]PC站點(diǎn)鏈接地址列表中包括多個(gè)PC站點(diǎn)首頁的URL,例如,http://www.#,http://www.s0.com等。進(jìn)一步地,站點(diǎn)列表還可以包括在PC站點(diǎn)首頁上通過一次或多次鏈接訪問到的頁面,例如對(duì)其中的360站點(diǎn),鏈接地址列表中還包括首頁中“論壇”鏈接對(duì)應(yīng)的 URL:http://bbs.360safe.com/index, html 等。
[0090]本發(fā)明將獲取的PC站點(diǎn)列表用于移動(dòng)站點(diǎn)挖掘。通過分析當(dāng)前互聯(lián)網(wǎng)站點(diǎn)的特點(diǎn),發(fā)現(xiàn)移動(dòng)站點(diǎn)一般具有對(duì)應(yīng)的PC站點(diǎn),并且移動(dòng)站點(diǎn)的URL與對(duì)應(yīng)的PC站點(diǎn)的URL相似,而帶有一定的移動(dòng)特征。本發(fā)明根據(jù)這一特點(diǎn),提供了一種利用PC站點(diǎn)挖掘移動(dòng)站點(diǎn)的方法。由于PC站點(diǎn)的挖掘已經(jīng)比較完善,根據(jù)PC站點(diǎn)的特性直接獲取移動(dòng)站點(diǎn)的方式更加快速,準(zhǔn)確。
[0091]請(qǐng)求模塊320,適于利用移動(dòng)用戶代理向所述PC站點(diǎn)鏈接地址列表中一個(gè)或多個(gè)PC站點(diǎn)分別發(fā)起頁面訪問請(qǐng)求。
[0092]移動(dòng)終端或PC都是通過http協(xié)議訪問互聯(lián)網(wǎng)資源。http請(qǐng)求報(bào)文的首部中包括用戶代理(user-agent)字段。User-agent用于記錄發(fā)送http請(qǐng)求的終端的部分信息。
[0093]在User-agent包含的終端信息中,與本發(fā)明最相關(guān)的是能夠反映終端類型的信息,例如,操作系統(tǒng)標(biāo)識(shí)。移動(dòng)終端的操作系統(tǒng)標(biāo)識(shí)包括1S, Android, Symbian等。如果操作系統(tǒng)為上述幾種類型,則訪問站點(diǎn)能夠得知該請(qǐng)求來自移動(dòng)終端。
[0094]現(xiàn)有互聯(lián)網(wǎng)站點(diǎn)能夠根據(jù)不同的訪問終端返回不同類型的網(wǎng)頁。利用站點(diǎn)的這一特性。本發(fā)明實(shí)施例中,請(qǐng)求模塊320將從服務(wù)器發(fā)出的http請(qǐng)求中的User-agent修改為移動(dòng)終端的形式。例如,原服務(wù)器的操作系統(tǒng)為Solaris,現(xiàn)在被修改為了 Android/4.0,或10S,然后向PC站點(diǎn)鏈接地址列表中的各PC站點(diǎn)分別發(fā)送這些經(jīng)過修改的http請(qǐng)求。通過這種方式,使站點(diǎn)判斷該http請(qǐng)求來自移動(dòng)終端,而返回相應(yīng)類型的頁面。
[0095]判斷模塊330,適于判斷頁面訪問請(qǐng)求的返回頁面類型是否為移動(dòng)網(wǎng)頁。
[0096]頁面類型包括移動(dòng)網(wǎng)頁和PC網(wǎng)頁。站點(diǎn)接收的是User-agent表現(xiàn)為移動(dòng)終端特征的http請(qǐng)求。因此,如果該P(yáng)C站點(diǎn)具有對(duì)應(yīng)的移動(dòng)站點(diǎn),將向請(qǐng)求方返回移動(dòng)網(wǎng)頁或定向至移動(dòng)網(wǎng)頁。若PC站點(diǎn)沒有移動(dòng)站點(diǎn),仍然返回PC網(wǎng)頁。
[0097]具體地,判斷模塊330可通過站點(diǎn)返回頁面的URL特征判斷,若URL中帶有mobile,wap或3g等字樣,判斷頁面類型為移動(dòng)網(wǎng)頁。或者,判斷模塊330通過分析返回網(wǎng)頁的內(nèi)容是否適于移動(dòng)設(shè)備顯示等方式進(jìn)行判斷。具體地,判斷模塊330對(duì)頁面訪問請(qǐng)求的返回頁面進(jìn)行頁面解析以獲取頁面內(nèi)容;根據(jù)頁面內(nèi)容判斷返回頁面是否適合移動(dòng)設(shè)備顯示,將適合移動(dòng)設(shè)備顯示的返回頁面類型判斷為移動(dòng)網(wǎng)頁。
[0098]移動(dòng)站點(diǎn)獲取模塊340,適于在頁面訪問請(qǐng)求的返回頁面類型為移動(dòng)頁面時(shí),獲取移動(dòng)頁面所屬站點(diǎn)的鏈接地址作為移動(dòng)站點(diǎn)。
[0099]移動(dòng)站點(diǎn)與對(duì)應(yīng)的PC站點(diǎn)具有類似的URL,例如,移動(dòng)站點(diǎn)http://m.s0.com/對(duì)應(yīng)于 PC 站點(diǎn) http://www.s0.com/。類似地,還有移動(dòng)站點(diǎn) 3g.163.com, m.jd.com, wap.ganj1.com,分別都包含有與PC站點(diǎn)相同的二級(jí)域名特征so, 163, jd, ganji等。移動(dòng)站點(diǎn)獲取模塊340可以從移動(dòng)網(wǎng)頁的URL提取出這種作為站點(diǎn)標(biāo)識(shí)的域名特征,根據(jù)域名特征獲取移動(dòng)頁面站點(diǎn)的鏈接地址。
[0100]在本發(fā)明的一個(gè)實(shí)施例中,請(qǐng)求模塊320進(jìn)一步適于:向列表中的PC站點(diǎn)的首頁發(fā)起頁面訪問請(qǐng)求和/或向列表中PC站點(diǎn)下的隨機(jī)選取的網(wǎng)頁發(fā)起頁面訪問請(qǐng)求;判斷模塊330進(jìn)一步適于:判斷PC站點(diǎn)返回的站點(diǎn)首頁的頁面類型是否為移動(dòng)網(wǎng)頁和/或該P(yáng)C站點(diǎn)下的隨機(jī)選取的網(wǎng)頁發(fā)起的頁面訪問請(qǐng)求的返回頁面類型是否都為移動(dòng)網(wǎng)頁;若向各個(gè)PC站點(diǎn)的首頁和/或各個(gè)PC站點(diǎn)下的隨機(jī)選取的網(wǎng)頁發(fā)起的頁面訪問請(qǐng)求的返回頁面都為移動(dòng)網(wǎng)頁,判斷移動(dòng)網(wǎng)頁所屬的站點(diǎn)作為移動(dòng)站點(diǎn)。
[0101]圖4示出了根據(jù)本發(fā)明另一個(gè)實(shí)施例的獲取移動(dòng)站點(diǎn)鏈接地址的裝置的結(jié)構(gòu)框圖,如圖4所示,裝置包括:
[0102]PC站點(diǎn)獲取模塊410,適于獲取包含多個(gè)PC站點(diǎn)的PC站點(diǎn)鏈接地址列表。
[0103]請(qǐng)求模塊420,適于利用移動(dòng)用戶代理向PC站點(diǎn)鏈接地址列表中一個(gè)或多個(gè)PC站點(diǎn)分別發(fā)起頁面訪問請(qǐng)求。
[0104]判斷模塊430,適于判斷頁面訪問請(qǐng)求的返回頁面類型是否為移動(dòng)網(wǎng)頁。
[0105]移動(dòng)站點(diǎn)獲取模塊440,適于在頁面訪問請(qǐng)求的返回頁面類型為移動(dòng)頁面時(shí),獲取移動(dòng)頁面所屬站點(diǎn)的鏈接地址作為移動(dòng)站點(diǎn)。
[0106]可選地,PC站點(diǎn)獲取模塊410進(jìn)一步適于:根據(jù)搜索引擎的索引庫(kù)中收錄的PC站點(diǎn)獲取PC站點(diǎn)鏈接地址列表。
[0107]可選地,裝置還包括:收錄模塊450,適于將移動(dòng)站點(diǎn)獲取模塊440獲取的移動(dòng)站點(diǎn)收錄入移動(dòng)搜索引擎索引庫(kù)中。
[0108]可選地,裝置還包括:搜索處理模塊460,適于:接收客戶端發(fā)送的搜索請(qǐng)求;根據(jù)搜索請(qǐng)求中的用戶代理信息,判斷客戶端是否為移動(dòng)設(shè)備;若客戶端為移動(dòng)設(shè)備,將移動(dòng)搜索引擎索引庫(kù)中收錄的與搜索請(qǐng)求相關(guān)的移動(dòng)站點(diǎn)返回給客戶端。
[0109]根據(jù)本發(fā)明上述實(shí)施例提供的裝置,利用移動(dòng)用戶代理向PC站點(diǎn)鏈接地址列表中的PC站點(diǎn)發(fā)起頁面訪問請(qǐng)求,若返回的是移動(dòng)網(wǎng)頁,認(rèn)為該P(yáng)C站點(diǎn)具有相應(yīng)的移動(dòng)站點(diǎn),且返回的移動(dòng)站點(diǎn)就是該P(yáng)C站點(diǎn)對(duì)應(yīng)的移動(dòng)站點(diǎn),根據(jù)返回的移動(dòng)網(wǎng)頁確定移動(dòng)站點(diǎn)的鏈接地址。根據(jù)該方案,利用PC站點(diǎn)和移動(dòng)站點(diǎn)的相關(guān)性進(jìn)行移動(dòng)站點(diǎn)的挖掘,獲得了更高的移動(dòng)站點(diǎn)挖掘的召回率,并且挖掘結(jié)果準(zhǔn)確,全面。另外,將獲取移動(dòng)站點(diǎn)鏈接地址的方法應(yīng)用于移動(dòng)搜索,移動(dòng)索引庫(kù)的維護(hù)更加容易。
[0110]在此提供的算法和顯示不與任何特定計(jì)算機(jī)、虛擬系統(tǒng)或者其它設(shè)備固有相關(guān)。各種通用系統(tǒng)也可以與基于在此的示教一起使用。根據(jù)上面的描述,構(gòu)造這類系統(tǒng)所要求的結(jié)構(gòu)是顯而易見的。此外,本發(fā)明也不針對(duì)任何特定編程語言。應(yīng)當(dāng)明白,可以利用各種編程語言實(shí)現(xiàn)在此描述的本發(fā)明的內(nèi)容,并且上面對(duì)特定語言所做的描述是為了披露本發(fā)明的最佳實(shí)施方式。
[0111]在此處所提供的說明書中,說明了大量具體細(xì)節(jié)。然而,能夠理解,本發(fā)明的實(shí)施例可以在沒有這些具體細(xì)節(jié)的情況下實(shí)踐。在一些實(shí)例中,并未詳細(xì)示出公知的方法、結(jié)構(gòu)和技術(shù),以便不模糊對(duì)本說明書的理解。
[0112]類似地,應(yīng)當(dāng)理解,為了精簡(jiǎn)本公開并幫助理解各個(gè)發(fā)明方面中的一個(gè)或多個(gè),在上面對(duì)本發(fā)明的示例性實(shí)施例的描述中,本發(fā)明的各個(gè)特征有時(shí)被一起分組到單個(gè)實(shí)施例、圖、或者對(duì)其的描述中。然而,并不應(yīng)將該公開的方法解釋成反映如下意圖:即所要求保護(hù)的本發(fā)明要求比在每個(gè)權(quán)利要求中所明確記載的特征更多的特征。更確切地說,如下面的權(quán)利要求書所反映的那樣,發(fā)明方面在于少于前面公開的單個(gè)實(shí)施例的所有特征。因此,遵循【具體實(shí)施方式】的權(quán)利要求書由此明確地并入該【具體實(shí)施方式】,其中每個(gè)權(quán)利要求本身都作為本發(fā)明的單獨(dú)實(shí)施例。
[0113]本領(lǐng)域那些技術(shù)人員可以理解,可以對(duì)實(shí)施例中的設(shè)備中的模塊進(jìn)行自適應(yīng)性地改變并且把它們?cè)O(shè)置在與該實(shí)施例不同的一個(gè)或多個(gè)設(shè)備中??梢园褜?shí)施例中的模塊或單元或組件組合成一個(gè)模塊或單元或組件,以及此外可以把它們分成多個(gè)子模塊或子單元或子組件。除了這樣的特征和/或過程或者單元中的至少一些是相互排斥之外,可以采用任何組合對(duì)本說明書(包括伴隨的權(quán)利要求、摘要和附圖)中公開的所有特征以及如此公開的任何方法或者設(shè)備的所有過程或單元進(jìn)行組合。除非另外明確陳述,本說明書(包括伴隨的權(quán)利要求、摘要和附圖)中公開的每個(gè)特征可以由提供相同、等同或相似目的的替代特征來代替。
[0114]此外,本領(lǐng)域的技術(shù)人員能夠理解,盡管在此所述的一些實(shí)施例包括其它實(shí)施例中所包括的某些特征而不是其它特征,但是不同實(shí)施例的特征的組合意味著處于本發(fā)明的范圍之內(nèi)并且形成不同的實(shí)施例。例如,在下面的權(quán)利要求書中,所要求保護(hù)的實(shí)施例的任意之一都可以以任意的組合方式來使用。
[0115]本發(fā)明的各個(gè)部件實(shí)施例可以以硬件實(shí)現(xiàn),或者以在一個(gè)或者多個(gè)處理器上運(yùn)行的軟件模塊實(shí)現(xiàn),或者以它們的組合實(shí)現(xiàn)。本領(lǐng)域的技術(shù)人員應(yīng)當(dāng)理解,可以在實(shí)踐中使用微處理器或者數(shù)字信號(hào)處理器(DSP)來實(shí)現(xiàn)根據(jù)本發(fā)明實(shí)施例的獲取移動(dòng)站點(diǎn)鏈接地址的裝置中的一些或者全部部件的一些或者全部功能。本發(fā)明還可以實(shí)現(xiàn)為用于執(zhí)行這里所描述的方法的一部分或者全部的設(shè)備或者裝置程序(例如,計(jì)算機(jī)程序和計(jì)算機(jī)程序產(chǎn)品)。這樣的實(shí)現(xiàn)本發(fā)明的程序可以存儲(chǔ)在計(jì)算機(jī)可讀介質(zhì)上,或者可以具有一個(gè)或者多個(gè)信號(hào)的形式。這樣的信號(hào)可以從因特網(wǎng)網(wǎng)站上下載得到,或者在載體信號(hào)上提供,或者以任何其他形式提供。
[0116]應(yīng)該注意的是上述實(shí)施例對(duì)本發(fā)明進(jìn)行說明而不是對(duì)本發(fā)明進(jìn)行限制,并且本領(lǐng)域技術(shù)人員在不脫離所附權(quán)利要求的范圍的情況下可設(shè)計(jì)出替換實(shí)施例。在權(quán)利要求中,不應(yīng)將位于括號(hào)之間的任何參考符號(hào)構(gòu)造成對(duì)權(quán)利要求的限制。單詞“包含”不排除存在未列在權(quán)利要求中的元件或步驟。位于元件之前的單詞“一”或“一個(gè)”不排除存在多個(gè)這樣的元件。本發(fā)明可以借助于包括有若干不同元件的硬件以及借助于適當(dāng)編程的計(jì)算機(jī)來實(shí)現(xiàn)。在列舉了若干裝置的單元權(quán)利要求中,這些裝置中的若干個(gè)可以是通過同一個(gè)硬件項(xiàng)來具體體現(xiàn)。單詞第一、第二、以及第三等的使用不表示任何頁序??蓪⑦@些單詞解釋為名稱。
【權(quán)利要求】
1.一種獲取移動(dòng)站點(diǎn)鏈接地址的方法,包括: 獲取包含多個(gè)PC站點(diǎn)的PC站點(diǎn)鏈接地址列表; 利用移動(dòng)用戶代理向所述PC站點(diǎn)鏈接地址列表中一個(gè)或多個(gè)PC站點(diǎn)分別發(fā)起頁面訪問請(qǐng)求; 判斷所述頁面訪問請(qǐng)求的返回頁面類型是否為移動(dòng)網(wǎng)頁; 若所述頁面訪問請(qǐng)求對(duì)應(yīng)的返回頁面類型為移動(dòng)網(wǎng)頁,獲取所述移動(dòng)網(wǎng)頁所屬站點(diǎn)的鏈接地址作為移動(dòng)站點(diǎn)。
2.根據(jù)權(quán)利要求1所述的方法,其中,所述利用移動(dòng)用戶代理向所述PC站點(diǎn)鏈接地址列表中一個(gè)或多個(gè)PC站點(diǎn)分別發(fā)起頁面訪問請(qǐng)求進(jìn)一步為:向列表中的PC站點(diǎn)的首頁發(fā)起頁面訪問請(qǐng)求和/或向列表中PC站點(diǎn)下的隨機(jī)選取的網(wǎng)頁發(fā)起頁面訪問請(qǐng)求; 所述判斷頁面訪問請(qǐng)求的返回頁面類型是否為移動(dòng)網(wǎng)頁進(jìn)一步為:判斷PC站點(diǎn)返回的站點(diǎn)首頁的頁面類型是否為移動(dòng)網(wǎng)頁和/或該P(yáng)C站點(diǎn)下的隨機(jī)選取的網(wǎng)頁發(fā)起的頁面訪問請(qǐng)求的返回頁面類型是否者為移動(dòng)網(wǎng)頁; 若所述向各個(gè)PC站點(diǎn)的首頁和/或各個(gè)PC站點(diǎn)下的隨機(jī)選取的網(wǎng)頁發(fā)起的頁面訪問請(qǐng)求的返回頁面都為移動(dòng)網(wǎng)頁,判斷移動(dòng)網(wǎng)頁所屬的站點(diǎn)作為移動(dòng)站點(diǎn)。
3.根據(jù)權(quán)利要求1或2所述的方法,其中,所述判斷所述頁面訪問請(qǐng)求的返回頁面類型是否為移動(dòng)網(wǎng)頁進(jìn)一步包括: 判斷所述頁面訪問請(qǐng)求的返回頁面的URL是否具有移動(dòng)網(wǎng)頁的URL特征; 將具有移動(dòng)網(wǎng)頁的URL特征的返回頁面類型判斷為移動(dòng)網(wǎng)頁。
4.根據(jù)權(quán)利要求1-3任一項(xiàng)所述的方法,其中,所述判斷所述頁面訪問請(qǐng)求的返回頁面類型是否為移動(dòng)網(wǎng)頁進(jìn)一步包括: 對(duì)所述頁面訪問請(qǐng)求的返回頁面進(jìn)行頁面解析以獲取頁面內(nèi)容; 根據(jù)所述頁面內(nèi)容判斷所述返回頁面是否適合移動(dòng)設(shè)備顯示,將適合移動(dòng)設(shè)備顯示的返回頁面類型判斷為移動(dòng)網(wǎng)頁。
5.根據(jù)權(quán)利要求1-4任一項(xiàng)所述的方法,其中,所述獲取包含多個(gè)PC站點(diǎn)的PC站點(diǎn)鏈接地址列表進(jìn)一步為: 根據(jù)搜索引擎的索引庫(kù)中收錄的PC站點(diǎn)獲取所述PC站點(diǎn)鏈接地址列表。
6.根據(jù)權(quán)利要求1-5任一項(xiàng)所述的方法,其中,所述方法還包括:將獲取的移動(dòng)站點(diǎn)收錄入移動(dòng)搜索引擎索引庫(kù)中。
7.根據(jù)權(quán)利要求1-6任一項(xiàng)所述的方法,其中,所述方法還包括: 接收客戶端發(fā)送的搜索請(qǐng)求; 根據(jù)所述搜索請(qǐng)求中的用戶代理信息,判斷所述客戶端是否為移動(dòng)設(shè)備; 若所述客戶端為移動(dòng)設(shè)備,將所述移動(dòng)搜索引擎索引庫(kù)中收錄的與所述搜索請(qǐng)求相關(guān)的移動(dòng)站點(diǎn)返回給所述客戶端。
8.一種獲取移動(dòng)站點(diǎn)鏈接地址的裝置,包括: PC站點(diǎn)獲取模塊,適于獲取包含多個(gè)PC站點(diǎn)的PC站點(diǎn)鏈接地址列表; 請(qǐng)求模塊,適于利用移動(dòng)用戶代理向所述PC站點(diǎn)鏈接地址列表中一個(gè)或多個(gè)PC站點(diǎn)分別發(fā)起頁面訪問請(qǐng)求; 判斷模塊,適于判斷所述頁面訪問請(qǐng)求的返回頁面類型是否為移動(dòng)網(wǎng)頁; 移動(dòng)站點(diǎn)獲取模塊,適于在所述頁面訪問請(qǐng)求的返回頁面類型為移動(dòng)頁面時(shí),獲取所述移動(dòng)頁面所屬站點(diǎn)的鏈接地址作為移動(dòng)站點(diǎn)。
9.根據(jù)權(quán)利要求8所述的裝置,其中,所述請(qǐng)求模塊進(jìn)一步適于:向列表中的PC站點(diǎn)的首頁發(fā)起頁面訪問請(qǐng)求和/或向列表中PC站點(diǎn)下的隨機(jī)選取的網(wǎng)頁發(fā)起頁面訪問請(qǐng)求; 所述判斷模塊進(jìn)一步適于:判斷PC站點(diǎn)返回的站點(diǎn)首頁的頁面類型是否為移動(dòng)網(wǎng)頁和/或該P(yáng)C站點(diǎn)下的隨機(jī)選取的網(wǎng)頁發(fā)起的頁面訪問請(qǐng)求的返回頁面類型是否者為移動(dòng)網(wǎng)頁; 若所述向各個(gè)PC站點(diǎn)的首頁和/或各個(gè)PC站點(diǎn)下的隨機(jī)選取的網(wǎng)頁發(fā)起的頁面訪問請(qǐng)求的返回頁面都為移動(dòng)網(wǎng)頁,判斷移動(dòng)網(wǎng)頁所屬的站點(diǎn)作為移動(dòng)站點(diǎn)。
10.根據(jù)權(quán)利要求8或9所述的裝置,其中,所述判斷模塊進(jìn)一步適于: 判斷所述頁面訪問請(qǐng)求的返回頁面的URL是否具有移動(dòng)網(wǎng)頁的URL特征; 將具有移動(dòng)網(wǎng)頁的URL特征的返回頁面類型判斷為移動(dòng)網(wǎng)頁。
【文檔編號(hào)】G06F17/30GK104392009SQ201410800383
【公開日】2015年3月4日 申請(qǐng)日期:2014年12月19日 優(yōu)先權(quán)日:2014年12月19日
【發(fā)明者】王智廣, 魏少俊 申請(qǐng)人:北京奇虎科技有限公司, 奇智軟件(北京)有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
温泉县| 黎川县| 乌拉特前旗| 德庆县| 金门县| 晋宁县| 莱西市| 甘孜县| 沛县| 新沂市| 灵石县| 光泽县| 南华县| 兴和县| 家居| 邵阳市| 神池县| 金塔县| 德州市| 简阳市| 台湾省| 广州市| 石嘴山市| 柘城县| 特克斯县| 垣曲县| 班玛县| 雷山县| 济源市| 舞钢市| 景宁| 清新县| 菏泽市| 凌海市| 保靖县| 彰化县| 商城县| 南和县| 崇文区| 三穗县| 七台河市|