欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種用于對搜索結(jié)果進(jìn)行處理的方法和裝置與流程

文檔序號:12007850閱讀:195來源:國知局
一種用于對搜索結(jié)果進(jìn)行處理的方法和裝置與流程
本發(fā)明涉及計算機(jī)技術(shù)領(lǐng)域,尤其涉及一種用于對搜索結(jié)果進(jìn)行處理的方法和裝置。

背景技術(shù):
在現(xiàn)有技術(shù)所獲得的搜索結(jié)果中往往包含了許多重復(fù)的網(wǎng)頁地址信息,尤其是在當(dāng)前用戶終端日趨多樣化的情況下,許多網(wǎng)站為了方便用戶在不同用戶終端上的瀏覽體驗,會針對不同的用戶終端提供與該用戶終端相適應(yīng)的網(wǎng)頁,這些網(wǎng)頁在搜索結(jié)果中可能表現(xiàn)為不同的網(wǎng)頁地址鏈接,但其指向的網(wǎng)頁內(nèi)容則可能非常相似?,F(xiàn)有的搜索結(jié)果僅能將所有搜索到的內(nèi)容均呈現(xiàn)給用戶,看似搜索到的結(jié)果較多,實際上可能包含了大量的重復(fù)內(nèi)容。

技術(shù)實現(xiàn)要素:
本發(fā)明的目的在于提供一種用于對搜索結(jié)果進(jìn)行處理的方法和裝置。根據(jù)本發(fā)明的一個方面,提供一種用于對搜索結(jié)果進(jìn)行處理的方法,其中,所述搜索結(jié)果包括至少一個結(jié)果地址信息,其中,所述方法包括以下步驟:a獲取搜索結(jié)果中的一個或多個結(jié)果地址;b對所獲得的各個結(jié)果地址,模擬移動設(shè)備對所述各個結(jié)果地址信息發(fā)起訪問請求,以獲取與所述各個結(jié)果地址分別對應(yīng)的、并基于該移動設(shè)備進(jìn)行適配轉(zhuǎn)換后的網(wǎng)頁相關(guān)信息。根據(jù)本發(fā)明的一個方面,提供一種用于對搜索結(jié)果進(jìn)行處理的搜索處理裝置,其中,所述搜索結(jié)果包括至少一個結(jié)果地址信息,其中,所述搜索處理裝置包括:第一獲取裝置,用于獲取搜索結(jié)果中的一個或多個結(jié)果地址;第二獲取裝置,用于對所獲得的各個結(jié)果地址,模擬移動設(shè)備對所述各個結(jié)果地址信息發(fā)起訪問請求,以獲取與所述各個結(jié)果地址分別對應(yīng)的、并基于該移動設(shè)備進(jìn)行適配轉(zhuǎn)換后的網(wǎng)頁相關(guān)信息。本發(fā)明的優(yōu)點在于,能夠去除搜索結(jié)果中存在的大量重復(fù)的搜索內(nèi)容,從而在不影響搜索結(jié)果的全面性的情況下,精簡搜索結(jié)果,并且,能夠減少用戶設(shè)備的網(wǎng)絡(luò)流量負(fù)擔(dān)。附圖說明通過閱讀參照以下附圖所作的對非限制性實施例所作的詳細(xì)描述,本發(fā)明的其它特征、目的和優(yōu)點將會變得更明顯:圖1為根據(jù)本發(fā)明的一個方面的用于對搜索結(jié)果進(jìn)行處理的方法流程圖;圖2為根據(jù)本發(fā)明的一個方面的用于對搜索結(jié)果進(jìn)行處理的搜索處理裝置的結(jié)構(gòu)示意圖。附圖中相同或相似的附圖標(biāo)記代表相同或相似的部件。具體實施方式下面結(jié)合附圖對本發(fā)明作進(jìn)一步詳細(xì)描述。圖1示意出了根據(jù)本發(fā)明的一個方面的用于對搜索結(jié)果進(jìn)行處理的方法流程圖。其中,所述搜索結(jié)果包括至少一個結(jié)果地址信息。根據(jù)本發(fā)明的方法包括步驟S1和步驟S2。其中,根據(jù)本發(fā)明的方法通過可聯(lián)網(wǎng)的用戶設(shè)備實現(xiàn)。所述計算機(jī)設(shè)備包括一種能夠按照事先設(shè)定或存儲的指令,自動進(jìn)行數(shù)值計算和/或信息處理的電子設(shè)備,其硬件包括但不限于微處理器、專用集成電路(ASIC)、可編程門陣列(FPGA)、數(shù)字處理器(DSP)、嵌入式設(shè)備等。其中,所述計算機(jī)設(shè)備所處的網(wǎng)絡(luò)包括但不限于互聯(lián)網(wǎng)、廣域網(wǎng)、城域網(wǎng)、局域網(wǎng)、VPN網(wǎng)絡(luò)等。根據(jù)本發(fā)明的計算機(jī)設(shè)備可模擬移動設(shè)備發(fā)起訪問請求,其中,所述移動設(shè)備包括但不限于何一種可與用戶通過鍵盤、鼠標(biāo)、遙控器、觸摸板、或聲控設(shè)備等方式進(jìn)行人機(jī)交互的手持式電子產(chǎn)品。優(yōu)選地,所述移動設(shè)備包括但不限于平板電腦、智能手機(jī)、PDA、游戲機(jī)等。優(yōu)選地,所述計算機(jī)設(shè)備通過發(fā)送移動設(shè)備的設(shè)備相關(guān)信息來模擬移動設(shè)備發(fā)起請求。其中,所述設(shè)備相關(guān)信息包括但不限于以下任一項信息:1)移動設(shè)備型號;例如,NokiaN90、iPhone4s,又例如,iPad2、iPadmini等。2)移動設(shè)備所采用的操作系統(tǒng);例如,iOS、Android等。3)移動設(shè)備發(fā)起訪問請求所采用的瀏覽器;例如,safari,Opera,百度瀏覽器等。需要說明的是,所述計算機(jī)設(shè)備、移動設(shè)備以及網(wǎng)絡(luò)僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的用戶設(shè)備以及網(wǎng)絡(luò)如可適用于本發(fā)明,也應(yīng)包含在本發(fā)明保護(hù)范圍以內(nèi),并以引用方式包含于此。參照圖1,在步驟S1中,計算機(jī)設(shè)備獲取搜索結(jié)果中的一個或多個結(jié)果地址。具體地,所述計算機(jī)設(shè)備根據(jù)預(yù)定獲取規(guī)則,獲取搜索結(jié)果中的一個或多個結(jié)果地址。其中,所述結(jié)果地址包括用于定位網(wǎng)頁的鏈接地址信息,優(yōu)選地,所述結(jié)果地址包括同一資源定位符(URL,UniversalResourceLocation)。其中,所述預(yù)定獲取規(guī)則包括但不限于以下任一項:1)按照搜索結(jié)果中的結(jié)果地址的排序來預(yù)定個數(shù)的結(jié)果地址;例如,預(yù)定每次獲取排名前N的結(jié)果地址,其中,本領(lǐng)域技術(shù)人員可根據(jù)實際情況和需求來確定N的數(shù)值。2)根據(jù)搜索結(jié)果的呈現(xiàn)方式,獲取一個搜索結(jié)果網(wǎng)頁上呈現(xiàn)的多個結(jié)果地址。例如,搜索結(jié)果頁中每頁展示20個結(jié)果地址,則計算機(jī)設(shè)備獲取20個結(jié)果地址。3)隨機(jī)獲取預(yù)定個數(shù)的結(jié)果地址等。接著,在步驟S2中,計算機(jī)設(shè)備對所獲得的各個結(jié)果地址,模擬移動設(shè)備對所述各個結(jié)果地址信息發(fā)起訪問請求,以接收與所述各個結(jié)果地址分別對應(yīng)的、并與該移動設(shè)備相適應(yīng)的網(wǎng)頁相關(guān)信息。其中,所述網(wǎng)頁相關(guān)信息包括但不限于以下任一項;1)網(wǎng)頁地址信息;例如,URL等;2)網(wǎng)頁內(nèi)容信息,例如,所述結(jié)果地址對應(yīng)的網(wǎng)頁中所包含的文本內(nèi)容信息等。具體地,所述計算機(jī)設(shè)備對各個結(jié)果地址,模擬移動設(shè)備對各個結(jié)果地址發(fā)起訪問請求;則各個結(jié)果地址所對應(yīng)的第三方網(wǎng)站根據(jù)所述移動設(shè)備,對各個結(jié)果地址執(zhí)行相應(yīng)的適配轉(zhuǎn)換操作,以向所述計算機(jī)設(shè)備提供與其模擬的該移動設(shè)備相適應(yīng)的網(wǎng)頁相關(guān)信息。根據(jù)本發(fā)明的第一示例,計算機(jī)設(shè)備對步驟S1中所獲得的結(jié)果地址www.sohu.com,模擬iPhone手機(jī),對該結(jié)果地址發(fā)起訪問請求;則該結(jié)果地址所屬的第三方網(wǎng)站自動對該結(jié)果地址執(zhí)行適配轉(zhuǎn)換操作,并反饋與iPhone手機(jī)相適應(yīng)的網(wǎng)絡(luò)鏈接地址m.sohu.com,則計算機(jī)設(shè)備接收與所模擬的iPhone手機(jī)相適應(yīng)的網(wǎng)絡(luò)鏈接地址“m.sohu.com”。根據(jù)本發(fā)明的一個優(yōu)選實施例,根據(jù)本發(fā)明的方法還包括步驟S3(圖未示)。在步驟S3中,計算機(jī)設(shè)備根據(jù)所述一個或多個結(jié)果地址,以及所獲得的、與各個結(jié)果地址信息對應(yīng)的網(wǎng)頁相關(guān)信息,對所述搜索結(jié)果執(zhí)行去重操作。具體地,所述計算機(jī)設(shè)備根據(jù)所述一個或多個結(jié)果地址,以及所獲得的、與各個結(jié)果地址信息對應(yīng)的網(wǎng)頁相關(guān)信息,確定搜索結(jié)果中包含的與各個結(jié)果地址對應(yīng)的重復(fù)信息,并去除所述重復(fù)信息。作為本實施例的一個優(yōu)選方案,在根據(jù)本實施例的步驟S2中,計算機(jī)設(shè)備對所獲得的各個結(jié)果地址,分別模擬不同類型的移動設(shè)備對所述各個結(jié)果地址發(fā)起訪問請求,以獲取與所述各個結(jié)果地址分別對應(yīng)的、并基于該類型的移動設(shè)備進(jìn)行適配轉(zhuǎn)換后的網(wǎng)頁相關(guān)信息。其中,所述移動設(shè)備的類型基于以下任一種信息來確定:1)移動設(shè)備型號;2)移動設(shè)備所采用的操作系統(tǒng);3)移動設(shè)備發(fā)起訪問請求所采用的瀏覽器。接著,在根據(jù)本實施例的步驟S3中,計算機(jī)設(shè)備根據(jù)所述一個或多個結(jié)果地址信息以及與各個結(jié)果地址分別對應(yīng)的、并基于不同類型的移動設(shè)備進(jìn)行適配轉(zhuǎn)換后獲得的至少一個網(wǎng)頁相關(guān)信息,對所述搜索結(jié)果執(zhí)行去重操作。根據(jù)本實施例的又一優(yōu)選方案,所述網(wǎng)頁相關(guān)信息包括網(wǎng)頁地址信息,其中,所述步驟S3進(jìn)一步包括步驟S301(圖未示)和步驟S302(圖未示)。在步驟S301中,計算機(jī)設(shè)備根據(jù)所述一個或多個結(jié)果地址,以及所獲得的與各個結(jié)果地址信息分別對應(yīng)的網(wǎng)頁地址信息,來更新地址對應(yīng)表,其中,所述地址對應(yīng)表包含至少一個結(jié)果地址及其對應(yīng)的網(wǎng)頁地址信息。其中,所述地址對應(yīng)表中包含一組或多組地址信息,其中,各組地址信息中分別包含多個指向相同或相似網(wǎng)頁的地址信息。繼續(xù)對前述第一示例進(jìn)行說明,計算機(jī)設(shè)備根據(jù)所獲得的與結(jié)果地址“www.sohu.com”對應(yīng)的網(wǎng)頁地址信息“m.sohu.com”,在地址對應(yīng)表中分別查詢結(jié)果地址“www.sohu.com”以及網(wǎng)頁地址信息“m.sohu.com”,并獲得包含結(jié)果地址“www.sohu.com”的一組地址信息如下表1所示:表1序號地址信息1www.sohu.com2wap.sohu.com則計算機(jī)設(shè)備將與結(jié)果地址“www.sohu.com”對應(yīng)的網(wǎng)頁地址信息“m.sohu.com”添加至該組地址信息中,以獲得更新后的該組地址信息如下表2所示:表2序號地址信息1www.sohu.com2wap.sohu.com3m.sohu.com接著,在步驟S302中,計算機(jī)設(shè)備基于所述地址對應(yīng)表,對所述搜索結(jié)果執(zhí)行去重操作。具體地,計算機(jī)設(shè)備將搜索結(jié)果中的各個結(jié)果地址與地址對應(yīng)表中的各組地址信息進(jìn)行比較,當(dāng)搜索結(jié)果中包含多個屬于同一組地址信息的結(jié)果地址時,保留該多個結(jié)果地址中的一個結(jié)果地址,并由搜索結(jié)果中去除該多個結(jié)果地址中的其他結(jié)果地址。繼續(xù)對前述第一示例進(jìn)行說明,計算機(jī)設(shè)備將表2中的各個地址信息與搜索結(jié)果中的各個結(jié)果地址進(jìn)行比較,并確定搜索結(jié)果中包含結(jié)果地址“www.sohu.com”和結(jié)果地址信息“m.sohu.com”,則計算機(jī)設(shè)備保留最先匹配到的結(jié)果地址“www.sohu.com”,并去除搜索結(jié)果中的另一結(jié)果地址“m.sohu.com”。優(yōu)選地,根據(jù)本實施例的方案,在步驟S302之前還包括步驟S4(圖未示)和步驟S5(圖未示)。在步驟S4中,計算機(jī)設(shè)備檢測所述地址對應(yīng)表中的各個結(jié)果地址是否有效。接著,在步驟S5中,當(dāng)所檢測的結(jié)果地址無效時,計算機(jī)設(shè)備將該結(jié)果地址從所述地址對應(yīng)表中刪除。繼續(xù)對前述第一示例進(jìn)行說明,當(dāng)計算機(jī)設(shè)備獲得表2后,檢測地址對應(yīng)表中的各個地址信息是否有效,并確定表2中的地址信息“wap.sohu.com”已經(jīng)失效,則計算機(jī)設(shè)備將該地址信息從表2中刪除,則檢測后的該組地址信息如下表3所示:表3序號地址信息1www.sohu.com2m.sohu.com根據(jù)本實施例的又一個優(yōu)選方案,所述網(wǎng)頁相關(guān)信息包括網(wǎng)頁內(nèi)容信息,其中,所述步驟S3進(jìn)一步包括步驟S301′(圖未示)和步驟S302′(圖未示)。在步驟S301′中,計算機(jī)設(shè)備將所述一個或多個結(jié)果地址分別對應(yīng)的網(wǎng)頁內(nèi)容信息進(jìn)行兩兩比較,以獲得包含一組或多組結(jié)果地址,其中,各組結(jié)果地址中分別包含多個網(wǎng)頁內(nèi)容信息相似的結(jié)果地址。具體地,計算機(jī)設(shè)備將所述一個或多個結(jié)果地址分別對應(yīng)的網(wǎng)頁內(nèi)容信息進(jìn)行兩兩比較,以獲得包含一組或多組結(jié)果地址的方式包括但不限于以下任一種:1)計算機(jī)設(shè)備直接將所獲得的網(wǎng)頁內(nèi)容信息兩兩進(jìn)行比對。2)計算機(jī)設(shè)備根據(jù)與所述一個或多個結(jié)果地址分別對應(yīng)的網(wǎng)頁內(nèi)容信息,獲取各個網(wǎng)頁內(nèi)容信息所對應(yīng)的特征信息;接著,計算機(jī)設(shè)備將與所述一個或多個結(jié)果地址分別對應(yīng)的網(wǎng)頁內(nèi)容信息的特征信息進(jìn)行兩兩比較,以獲得所對應(yīng)的網(wǎng)頁內(nèi)容信息相似的多個結(jié)果地址。其中,所述特征信息包括但不限于各個網(wǎng)頁內(nèi)容信息中所包含的一個或多個關(guān)鍵詞。優(yōu)選地,所述特征信息中還包括與各個關(guān)鍵詞對應(yīng)的權(quán)重信息。其中,計算機(jī)設(shè)備獲取各個網(wǎng)頁內(nèi)容信息所對應(yīng)的特征信息的方式包括但不限于以下任一種:i)對所獲得的各個網(wǎng)頁內(nèi)容信息分別進(jìn)行切詞以獲得多個關(guān)鍵詞,并計算各個關(guān)鍵詞在其所屬網(wǎng)頁內(nèi)容信息中的權(quán)重信息,并將所獲得的關(guān)鍵詞及其權(quán)重信息作為相應(yīng)的網(wǎng)頁內(nèi)容信息的特征信息。優(yōu)選地,所述權(quán)重信息根據(jù)關(guān)鍵詞在其所述的網(wǎng)頁內(nèi)容信息中的出現(xiàn)頻次來確定。例如,將關(guān)鍵詞在其所述的網(wǎng)頁內(nèi)容信息中的詞頻逆文檔頻率(TF-IDF,termfrequency-inversedocumentfrequency)值作為權(quán)重值的方式等。ii)通過預(yù)建立的主題模型獲取與各個網(wǎng)頁內(nèi)容信息對應(yīng)的特征信息。其中,本領(lǐng)域技術(shù)人員應(yīng)能根據(jù)實際情況與需求來確定所采用的主題模型,此處不再贅述。其中,計算機(jī)設(shè)備將與所述一個或多個結(jié)果地址分別對應(yīng)的網(wǎng)頁內(nèi)容信息的特征信息進(jìn)行兩兩比較,以獲得所對應(yīng)的網(wǎng)頁內(nèi)容信息相似的多個結(jié)果地址的方式包括但不限于:采用向量計算等方式來獲取兩個網(wǎng)頁內(nèi)容信息之間的相似度,并當(dāng)相似度滿足預(yù)定閾值條件時,確定該兩個網(wǎng)頁內(nèi)容信息相似。例如,計算機(jī)設(shè)備在步驟S1中獲得20個結(jié)果地址URL_1至URL_2,并且,計算機(jī)設(shè)備在步驟S2中模擬移動設(shè)備對該20個結(jié)果地址分別發(fā)起訪問請求,以分別接收各個結(jié)果地址對應(yīng)的網(wǎng)頁的網(wǎng)頁內(nèi)容信息;接著,計算機(jī)設(shè)備通過預(yù)定的主題模型,獲得與該20個結(jié)果地址分別對應(yīng)的特征信息,并且,將結(jié)果地址URL_1對應(yīng)的特征信息分別與URL_2,URL_3,URL_4,...,URL_20這19個其余的結(jié)果地址各自對應(yīng)的特征信息進(jìn)行比較以獲得所有與URL_1相似的結(jié)果地址,接著,將URL_2與URL_3,URL_4,...,URL_20這18個余下的結(jié)果地址各自對應(yīng)的特征信息進(jìn)行比較,以獲得所有與URL_2相似的結(jié)果地址,如此重復(fù),直至所有結(jié)果地址之間均兩兩進(jìn)行了比較,并根據(jù)比較確定,確定URL1、URL3、URL5、URL6為相似的結(jié)果地址,URL2、URL4為相似的結(jié)果地址。接著,在步驟S302′中,計算機(jī)設(shè)備根據(jù)所獲得的一組或多組結(jié)果地址來對所述搜索結(jié)果執(zhí)行去重操作。具體地,計算機(jī)設(shè)備根據(jù)所獲得的一組或多組結(jié)果地址來對所述搜索結(jié)果執(zhí)行去重操作的方式包括但不限于以下任一種:1)計算機(jī)設(shè)備將搜索結(jié)果中的各個結(jié)果地址與根據(jù)步驟S301′中確定的一組或多組結(jié)果地址進(jìn)行比較,當(dāng)搜索結(jié)果中包含多個屬于同一組的結(jié)果地址時,保留該多個結(jié)果地址中的一個結(jié)果地址,并由搜索結(jié)果中去除該多個結(jié)果地址中的其他結(jié)果地址。2)計算機(jī)設(shè)備根據(jù)所獲得的一組或多組結(jié)果地址來更新內(nèi)容對應(yīng)表,其中,所述內(nèi)容對應(yīng)表中包含至少一組所對應(yīng)的網(wǎng)頁內(nèi)容信息相似的結(jié)果地址;接著,計算機(jī)設(shè)備根據(jù)所述內(nèi)容對應(yīng)表,對所述搜索結(jié)果執(zhí)行去重操作。其中,所述計算機(jī)設(shè)備根據(jù)所獲得的一組或多組結(jié)果地址來更新內(nèi)容對應(yīng)表的方式與前述計算機(jī)設(shè)備根據(jù)所述一個或多個結(jié)果地址,以及所獲得的與各個結(jié)果地址信息分別對應(yīng)的網(wǎng)頁地址信息,來更新地址對應(yīng)表的方式相同或相似,此處不再贅述。其中,計算機(jī)設(shè)備根據(jù)所述內(nèi)容對應(yīng)表,對所述搜索結(jié)果執(zhí)行去重操作的方式與前述計算機(jī)設(shè)備基于所述地址對應(yīng)表,對所述搜索結(jié)果執(zhí)行去重操作的方式相同或相似,此處不再贅述。優(yōu)選地,根據(jù)本實施例的方法還包括步驟S6(圖未示)和步驟S7(圖未示)。在步驟S6中,計算機(jī)設(shè)備檢測所述內(nèi)容對應(yīng)表中的各個結(jié)果地址是否有效。接著,在步驟S7中,當(dāng)所檢測的結(jié)果地址無效時,計算機(jī)設(shè)備將該結(jié)果地址從所述內(nèi)容對應(yīng)表中刪除。需要說明的是,所述步驟S6和步驟S7在計算機(jī)設(shè)備根據(jù)所述內(nèi)容對應(yīng)表,對所述搜索結(jié)果執(zhí)行去重操作之前執(zhí)行。根據(jù)本發(fā)明的方法,能夠有效地去除搜索結(jié)果中所包含的重復(fù)的結(jié)果地址,從而在保證搜索結(jié)果全面性的前提下,精簡了搜索結(jié)果的內(nèi)容,并且,減少了用戶設(shè)備的流量負(fù)擔(dān)。圖2示意出了根據(jù)本發(fā)明的一個方面的用于對搜索結(jié)果進(jìn)行處理的搜索處理裝置的結(jié)構(gòu)示意圖。其中,所述搜索結(jié)果包括至少一個結(jié)果地址信息。根據(jù)本發(fā)明的方法包括第一獲取裝置1和第二獲取裝置2。根據(jù)本發(fā)明的搜索處理裝置可模擬移動設(shè)備發(fā)起訪問請求,其中,所述移動設(shè)備包括但不限于何一種可與用戶通過鍵盤、鼠標(biāo)、遙控器、觸摸板、或聲控設(shè)備等方式進(jìn)行人機(jī)交互的手持式電子產(chǎn)品。優(yōu)選地,所述移動設(shè)備包括但不限于平板電腦、智能手機(jī)、PDA、游戲機(jī)等。優(yōu)選地,所述計算機(jī)設(shè)備通過發(fā)送移動設(shè)備的設(shè)備相關(guān)信息來模擬移動設(shè)備發(fā)起請求。其中,所述設(shè)備相關(guān)信息包括但不限于以下任一項信息:1)移動設(shè)備型號;例如,NokiaN90、iPhone4s,又例如,iPad2、iPadmini等。2)移動設(shè)備所采用的操作系統(tǒng);例如,iOS、Android等。3)移動設(shè)備發(fā)起訪問請求所采用的瀏覽器;例如,safari,Opera,百度瀏覽器等。需要說明的是,所述計算機(jī)設(shè)備、移動設(shè)備以及網(wǎng)絡(luò)僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的用戶設(shè)備以及網(wǎng)絡(luò)如可適用于本發(fā)明,也應(yīng)包含在本發(fā)明保護(hù)范圍以內(nèi),并以引用方式包含于此。參照圖2,第一獲取裝置1獲取搜索結(jié)果中的一個或多個結(jié)果地址。具體地,第一獲取裝置1根據(jù)預(yù)定獲取規(guī)則,獲取搜索結(jié)果中的一個或多個結(jié)果地址。其中,所述結(jié)果地址包括用于定位網(wǎng)頁的鏈接地址信息,優(yōu)選地,所述結(jié)果地址包括同一資源定位符(URL,UniversalResourceLocation)。其中,所述預(yù)定獲取規(guī)則包括但不限于以下任一項:1)按照搜索結(jié)果中的結(jié)果地址的排序來預(yù)定個數(shù)的結(jié)果地址;例如,預(yù)定每次獲取排名前N的結(jié)果地址,其中,本領(lǐng)域技術(shù)人員可根據(jù)實際情況和需求來確定N的數(shù)值。2)根據(jù)搜索結(jié)果的呈現(xiàn)方式,獲取一個搜索結(jié)果網(wǎng)頁上呈現(xiàn)的多個結(jié)果地址。例如,搜索結(jié)果頁中每頁展示20個結(jié)果地址,則計算機(jī)設(shè)備獲取20個結(jié)果地址。3)隨機(jī)獲取預(yù)定個數(shù)的結(jié)果地址等。接著,第二獲取裝置2對所獲得的各個結(jié)果地址,模擬移動設(shè)備對所述各個結(jié)果地址信息發(fā)起訪問請求,以接收與所述各個結(jié)果地址分別對應(yīng)的、并與該移動設(shè)備相適應(yīng)的網(wǎng)頁相關(guān)信息。其中,所述網(wǎng)頁相關(guān)信息包括但不限于以下任一項;1)網(wǎng)頁地址信息;例如,URL等;2)網(wǎng)頁內(nèi)容信息,例如,所述結(jié)果地址對應(yīng)的網(wǎng)頁中所包含的文本內(nèi)容信息等。具體地,第二獲取裝置2對各個結(jié)果地址,模擬移動設(shè)備對各個結(jié)果地址發(fā)起訪問請求;則各個結(jié)果地址所對應(yīng)的第三方網(wǎng)站根據(jù)所述移動設(shè)備,對各個結(jié)果地址執(zhí)行相應(yīng)的適配轉(zhuǎn)換操作,以向第二獲取裝置2提供與其模擬的該移動設(shè)備相適應(yīng)的網(wǎng)頁相關(guān)信息。根據(jù)本發(fā)明的第一示例,第一獲取裝置1獲得結(jié)果地址www.sohu.com,則第二獲取裝置2模擬iPhone手機(jī),對該結(jié)果地址發(fā)起訪問請求;該結(jié)果地址所屬的第三方網(wǎng)站自動對該結(jié)果地址執(zhí)行適配轉(zhuǎn)換操作,并反饋與iPhone手機(jī)相適應(yīng)的網(wǎng)絡(luò)鏈接地址m.sohu.com,則第二獲取裝置2接收與所模擬的iPhone手機(jī)相適應(yīng)的網(wǎng)絡(luò)鏈接地址“m.sohu.com”。根據(jù)本發(fā)明的一個優(yōu)選實施例,根據(jù)本實施例的搜索處理裝置還包括去重裝置(圖未示)。去重裝置根據(jù)所述一個或多個結(jié)果地址,以及所獲得的、與各個結(jié)果地址信息對應(yīng)的網(wǎng)頁相關(guān)信息,對所述搜索結(jié)果執(zhí)行去重操作。具體地,所述去重裝置根據(jù)所述一個或多個結(jié)果地址,以及所獲得的、與各個結(jié)果地址信息對應(yīng)的網(wǎng)頁相關(guān)信息,確定搜索結(jié)果中包含的與各個結(jié)果地址對應(yīng)的重復(fù)信息,并去除所述重復(fù)信息。作為本實施例的一個優(yōu)選方案,在根據(jù)本實施例第二獲取裝置2對所獲得的各個結(jié)果地址,分別模擬不同類型的移動設(shè)備對所述各個結(jié)果地址發(fā)起訪問請求,以獲取與所述各個結(jié)果地址分別對應(yīng)的、并基于該類型的移動設(shè)備進(jìn)行適配轉(zhuǎn)換后的網(wǎng)頁相關(guān)信息。其中,所述移動設(shè)備的類型基于以下任一種信息來確定:1)移動設(shè)備型號;2)移動設(shè)備所采用的操作系統(tǒng);3)移動設(shè)備發(fā)起訪問請求所采用的瀏覽器。接著,根本實施例的去重裝置根據(jù)所述一個或多個結(jié)果地址信息以及與各個結(jié)果地址分別對應(yīng)的、并基于不同類型的移動設(shè)備進(jìn)行適配轉(zhuǎn)換后獲得的至少一個網(wǎng)頁相關(guān)信息,對所述搜索結(jié)果執(zhí)行去重操作。根據(jù)本實施例的又一優(yōu)選方案,所述網(wǎng)頁相關(guān)信息包括網(wǎng)頁地址信息,其中,所述去重裝置進(jìn)一步包括第一更新裝置(圖未示)和第一子去重裝置(圖未示)。第一更新裝置根據(jù)所述一個或多個結(jié)果地址,以及所獲得的與各個結(jié)果地址信息分別對應(yīng)的網(wǎng)頁地址信息,來更新地址對應(yīng)表,其中,所述地址對應(yīng)表包含至少一個結(jié)果地址及其對應(yīng)的網(wǎng)頁地址信息。其中,所述地址對應(yīng)表中包含一組或多組地址信息,其中,各組地址信息中分別包含多個指向相同或相似網(wǎng)頁的地址信息。繼續(xù)對前述第一示例進(jìn)行說明,第一更新裝置根據(jù)所獲得的與結(jié)果地址“www.sohu.com”對應(yīng)的網(wǎng)頁地址信息“m.sohu.com”,在地址對應(yīng)表中分別查詢結(jié)果地址“www.sohu.com”以及網(wǎng)頁地址信息“m.sohu.com”,并獲得包含結(jié)果地址“www.sohu.com”的一組地址信息如下表4所示:表4序號地址信息1www.sohu.com2wap.sohu.com則第一更新裝置將與結(jié)果地址“www.sohu.com”對應(yīng)的網(wǎng)頁地址信息“m.sohu.com”添加至該組地址信息中,以獲得更新后的該組地址信息如下表5所示:表5序號地址信息1www.sohu.com2wap.sohu.com3m.sohu.com接著,第一子去重裝置基于所述地址對應(yīng)表,對所述搜索結(jié)果執(zhí)行去重操作。具體地,第一子去重裝置將搜索結(jié)果中的各個結(jié)果地址與地址對應(yīng)表中的各組地址信息進(jìn)行比較,當(dāng)搜索結(jié)果中包含多個屬于同一組地址信息的結(jié)果地址時,保留該多個結(jié)果地址中的一個結(jié)果地址,并由搜索結(jié)果中去除該多個結(jié)果地址中的其他結(jié)果地址。繼續(xù)對前述第一示例進(jìn)行說明,第一子去重裝置將表2中的各個地址信息與搜索結(jié)果中的各個結(jié)果地址進(jìn)行比較,并確定搜索結(jié)果中包含結(jié)果地址“www.sohu.com”和結(jié)果地址信息“m.sohu.com”,則第一子去重裝置保留最先匹配到的結(jié)果地址“www.sohu.com”,并去除搜索結(jié)果中的另一結(jié)果地址“m.sohu.com”。優(yōu)選地,根據(jù)本實施例的搜索處理裝置還包括第一檢測裝置(圖未示)和第一刪除裝置(圖未示)。第一檢測裝置檢測所述地址對應(yīng)表中的各個結(jié)果地址是否有效。接著,當(dāng)所檢測的結(jié)果地址無效時,第一刪除裝置將該結(jié)果地址從所述地址對應(yīng)表中刪除。繼續(xù)對前述第一示例進(jìn)行說明,第一檢測裝置檢測地址對應(yīng)表中的各個地址信息是否有效,并確定表2中的地址信息“wap.sohu.com”已經(jīng)失效,則第一刪除裝置將該地址信息從表2中刪除,則檢測后的該組地址信息如下表6所示:表6序號地址信息1www.sohu.com2m.sohu.com需要說明的是,第一檢測裝置和第一刪除裝置在第一子去重裝置之前執(zhí)行操作。根據(jù)本實施例的又一個優(yōu)選方案,所述網(wǎng)頁相關(guān)信息包括網(wǎng)頁內(nèi)容信息,其中,所述去重裝置進(jìn)一步包括第三獲取裝置(圖未示)和第二子去重裝置(圖未示)。第三獲取裝置將所述一個或多個結(jié)果地址分別對應(yīng)的網(wǎng)頁內(nèi)容信息進(jìn)行兩兩比較,以獲得包含一組或多組結(jié)果地址,其中,各組結(jié)果地址中分別包含多個網(wǎng)頁內(nèi)容信息相似的結(jié)果地址。具體地,第三獲取裝置將所述一個或多個結(jié)果地址分別對應(yīng)的網(wǎng)頁內(nèi)容信息進(jìn)行兩兩比較,以獲得包含一組或多組結(jié)果地址的方式包括但不限于以下任一種:1)第三獲取裝置直接將所獲得的網(wǎng)頁內(nèi)容信息兩兩進(jìn)行比對。2)第三獲取裝置中的第一子獲取裝置(圖未示)根據(jù)與所述一個或多個結(jié)果地址分別對應(yīng)的網(wǎng)頁內(nèi)容信息,獲取各個網(wǎng)頁內(nèi)容信息所對應(yīng)的特征信息;接著,第三獲取裝置中的第二子獲取裝置(圖未示)將與所述一個或多個結(jié)果地址分別對應(yīng)的網(wǎng)頁內(nèi)容信息的特征信息進(jìn)行兩兩比較,以獲得所對應(yīng)的網(wǎng)頁內(nèi)容信息相似的多個結(jié)果地址。其中,所述特征信息包括但不限于各個網(wǎng)頁內(nèi)容信息中所包含的一個或多個關(guān)鍵詞。優(yōu)選地,所述特征信息中還包括與各個關(guān)鍵詞對應(yīng)的權(quán)重信息。其中,第一子獲取裝置獲取各個網(wǎng)頁內(nèi)容信息所對應(yīng)的特征信息的方式包括但不限于以下任一種:i)對所獲得的各個網(wǎng)頁內(nèi)容信息分別進(jìn)行切詞以獲得多個關(guān)鍵詞,并計算各個關(guān)鍵詞在其所屬網(wǎng)頁內(nèi)容信息中的權(quán)重信息,并將所獲得的關(guān)鍵詞及其權(quán)重信息作為相應(yīng)的網(wǎng)頁內(nèi)容信息的特征信息。優(yōu)選地,所述權(quán)重信息根據(jù)關(guān)鍵詞在其所述的網(wǎng)頁內(nèi)容信息中的出現(xiàn)頻次來確定。例如,將關(guān)鍵詞在其所述的網(wǎng)頁內(nèi)容信息中的詞頻逆文檔頻率(TF-IDF,termfrequency-inversedocumentfrequency)值作為權(quán)重值的方式等。ii)通過預(yù)建立的主題模型獲取與各個網(wǎng)頁內(nèi)容信息對應(yīng)的特征信息。其中,本領(lǐng)域技術(shù)人員應(yīng)能根據(jù)實際情況與需求來確定所采用的主題模型,此處不再贅述。其中,第一子獲取裝置將與所述一個或多個結(jié)果地址分別對應(yīng)的網(wǎng)頁內(nèi)容信息的特征信息進(jìn)行兩兩比較,以獲得所對應(yīng)的網(wǎng)頁內(nèi)容信息相似的多個結(jié)果地址的方式包括但不限于:通過計算特征信息的向量夾角等方式來獲取兩個網(wǎng)頁內(nèi)容信息之間的相似度,并當(dāng)相似度滿足預(yù)定閾值條件時,確定該兩個網(wǎng)頁內(nèi)容信息相似。例如,第一獲取裝置1獲得20個結(jié)果地址URL_1至URL_2,第二獲取裝置2模擬移動設(shè)備對該20個結(jié)果地址分別發(fā)起訪問請求,以分別接收各個結(jié)果地址對應(yīng)的網(wǎng)頁的網(wǎng)頁內(nèi)容信息;接著,第一子獲取裝置通過預(yù)定的主題模型,獲得與該20個結(jié)果地址分別對應(yīng)的特征信息,并且,第二子獲取裝置將結(jié)果地址URL_1對應(yīng)的特征信息分別與URL_2,URL_3,URL_4,...,URL_20這19個其余的結(jié)果地址各自對應(yīng)的特征信息進(jìn)行比較以獲得所有與URL_1相似的結(jié)果地址,接著,將URL_2與URL_3,URL_4,...,URL_20這18個余下的結(jié)果地址各自對應(yīng)的特征信息進(jìn)行比較,以獲得所有與URL_2相似的結(jié)果地址,如此重復(fù),直至所有結(jié)果地址之間均兩兩進(jìn)行了比較,并根據(jù)比較確定,確定URL1、URL3、URL5、URL6為相似的結(jié)果地址,URL2、URL4為相似的結(jié)果地址。接著,第二子去重裝置根據(jù)所獲得的一組或多組結(jié)果地址來對所述搜索結(jié)果執(zhí)行去重操作。具體地,第二子去重裝置根據(jù)所獲得的一組或多組結(jié)果地址來對所述搜索結(jié)果執(zhí)行去重操作的方式包括但不限于以下任一種:1)計算機(jī)設(shè)備將搜索結(jié)果中的各個結(jié)果地址與第三獲取裝置所獲得的一組或多組結(jié)果地址進(jìn)行比較,當(dāng)搜索結(jié)果中包含多個屬于同一組的結(jié)果地址時,保留該多個結(jié)果地址中的一個結(jié)果地址,并由搜索結(jié)果中去除該多個結(jié)果地址中的其他結(jié)果地址。2)第二子去重裝置中的第二更新裝置(圖未示)根據(jù)所獲得的一組或多組結(jié)果地址來更新內(nèi)容對應(yīng)表,其中,所述內(nèi)容對應(yīng)表中包含至少一組所對應(yīng)的網(wǎng)頁內(nèi)容信息相似的結(jié)果地址;接著,第二子去重裝置中的第三子去重裝置(圖未示)根據(jù)所述內(nèi)容對應(yīng)表,對所述搜索結(jié)果執(zhí)行去重操作。其中,所述第二更新裝置根據(jù)所獲得的一組或多組結(jié)果地址來更新內(nèi)容對應(yīng)表的方式與前述第一更新裝置根據(jù)所述一個或多個結(jié)果地址,以及所獲得的與各個結(jié)果地址信息分別對應(yīng)的網(wǎng)頁地址信息,來更新地址對應(yīng)表的方式相同或相似,此處不再贅述。其中,第三子去重裝置根據(jù)所述內(nèi)容對應(yīng)表,對所述搜索結(jié)果執(zhí)行去重操作的方式與前述第一子去重裝置基于所述地址對應(yīng)表,對所述搜索結(jié)果執(zhí)行去重操作的方式相同或相似,此處不再贅述。優(yōu)選地,根據(jù)本實施例的搜索處理裝置還包括第二檢測裝置(圖未示)和第二刪除裝置(圖未示)。第二檢測裝置檢測所述內(nèi)容對應(yīng)表中的各個結(jié)果地址是否有效。接著,當(dāng)所檢測的結(jié)果地址無效時,第二刪除裝置將該結(jié)果地址從所述內(nèi)容對應(yīng)表中刪除。需要說明的是,所述第二檢測裝置和第二刪除裝置在第三子去重裝置之前執(zhí)行操作。根據(jù)本發(fā)明的方案,能夠有效地去除搜索結(jié)果中所包含的重復(fù)的結(jié)果地址,從而在保證搜索結(jié)果全面性的前提下,精簡了搜索結(jié)果的內(nèi)容,并且,減少了用戶設(shè)備的流量負(fù)擔(dān)。本發(fā)明的軟件程序可以通過處理器執(zhí)行以實現(xiàn)上文所述步驟或功能。同樣地,本發(fā)明的軟件程序(包括相關(guān)的數(shù)據(jù)結(jié)構(gòu))可以被存儲到計算機(jī)可讀記錄介質(zhì)中,例如,RAM存儲器,磁或光驅(qū)動器或軟磁盤及類似設(shè)備。另外,本發(fā)明的一些步驟或功能可采用硬件來實現(xiàn),例如,作為與處理器配合從而執(zhí)行各個功能或步驟的電路。另外,本發(fā)明的一部分可被應(yīng)用為計算機(jī)程序產(chǎn)品,例如計算機(jī)程序指令,當(dāng)其被計算機(jī)執(zhí)行時,通過該計算機(jī)的操作,可以調(diào)用或提供根據(jù)本發(fā)明的方法和/或技術(shù)方案。而調(diào)用本發(fā)明的方法的程序指令,可能被存儲在固定的或可移動的記錄介質(zhì)中,和/或通過廣播或其他信號承載媒體中的數(shù)據(jù)流而被傳輸,和/或被存儲在根據(jù)所述程序指令運行的計算機(jī)設(shè)備的工作存儲器中。在此,根據(jù)本發(fā)明的一個實施例包括一個裝置,該裝置包括用于存儲計算機(jī)程序指令的存儲器和用于執(zhí)行程序指令的處理器,其中,當(dāng)該計算機(jī)程序指令被該處理器執(zhí)行時,觸發(fā)該裝置運行基于前述根據(jù)本發(fā)明的多個實施例的方法和/或技術(shù)方案。對于本領(lǐng)域技術(shù)人員而言,顯然本發(fā)明不限于上述示范性實施例的細(xì)節(jié),而且在不背離本發(fā)明的精神或基本特征的情況下,能夠以其他的具體形式實現(xiàn)本發(fā)明。因此,無論從哪一點來看,均應(yīng)將實施例看作是示范性的,而且是非限制性的,本發(fā)明的范圍由所附權(quán)利要求而不是上述說明限定,因此旨在將落在權(quán)利要求的等同要件的含義和范圍內(nèi)的所有變化涵括在本發(fā)明內(nèi)。不應(yīng)將權(quán)利要求中的任何附圖標(biāo)記視為限制所涉及的權(quán)利要求。此外,顯然“包括”一詞不排除其他單元或步驟,單數(shù)不排除復(fù)數(shù)。系統(tǒng)權(quán)利要求中陳述的多個單元或裝置也可以由一個單元或裝置通過軟件或者硬件來實現(xiàn)。第一,第二等詞語用來表示名稱,而并不表示任何特定的順序。
當(dāng)前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
济宁市| 佳木斯市| 漠河县| 叙永县| 台前县| 新宁县| 汉川市| 黄浦区| 南乐县| 泽库县| 巴青县| 班戈县| 缙云县| 临泽县| 新丰县| 潼关县| 那坡县| 黔南| 新巴尔虎右旗| 河南省| 宜阳县| 平乡县| 龙海市| 海原县| 绥阳县| 长岛县| 耿马| 无为县| 东阳市| 定西市| 兴城市| 新和县| 沛县| 西华县| 仁化县| 贺兰县| 尚义县| 临沧市| 桦甸市| 平湖市| 衡阳县|