欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

提高網(wǎng)站站內(nèi)搜索效率的方法和裝置與流程

文檔序號:11063544閱讀:572來源:國知局
提高網(wǎng)站站內(nèi)搜索效率的方法和裝置與制造工藝

本申請涉及搜索領(lǐng)域,具體而言,涉及一種提高網(wǎng)站站內(nèi)搜索效率的方法和裝置。



背景技術(shù):

在以往網(wǎng)站建設(shè)、企業(yè)信息系統(tǒng)搭建過程中,由于信息結(jié)構(gòu)簡單、內(nèi)容稀缺,站內(nèi)搜索不是網(wǎng)站系統(tǒng)的必要裝備。但隨著Web2.0帶來的海量信息井噴式涌現(xiàn),企業(yè)自身對信息架構(gòu)、管理、發(fā)布的需求,以及用戶對信息的組織、查詢、可尋性的要求越來越高,于是站內(nèi)搜索出現(xiàn)了。

通常情況下,用戶在進(jìn)行網(wǎng)站站內(nèi)搜索時(shí),如果結(jié)果頁中沒有想要的結(jié)果,會(huì)通過改變搜索關(guān)鍵詞的方式繼續(xù)嘗試找到自己想要的結(jié)果。

在用戶找到想要的頁面之前,可能會(huì)經(jīng)歷數(shù)次無效的搜索,不能快速找到目標(biāo)頁面。

針對上述的問題,目前尚未提出有效的解決方案。



技術(shù)實(shí)現(xiàn)要素:

本申請實(shí)施例提供了一種提高網(wǎng)站站內(nèi)搜索效率的方法和裝置,以至少解決現(xiàn)有技術(shù)中用戶搜索效率比較低的技術(shù)問題。

根據(jù)本申請實(shí)施例的一個(gè)方面,提供了一種提高網(wǎng)站站內(nèi)搜索效率的方法,包括:從訪問目標(biāo)網(wǎng)站的訪問日志中,提取表示所述目標(biāo)網(wǎng)站的站內(nèi)搜索結(jié)果頁的統(tǒng)一資源定位符URL;根據(jù)所述目標(biāo)網(wǎng)站的站內(nèi)搜索結(jié)果頁的URL,確定用于匹配所述目標(biāo)網(wǎng)站的站內(nèi)搜索結(jié)果頁的匹配式;從所述訪問日志中提取第一關(guān)鍵詞、第二關(guān)鍵詞、第一搜索結(jié)果頁的URL、第一目標(biāo)頁面,其中,所述第一關(guān)鍵詞和所述第二關(guān)鍵詞均為用于在所述目標(biāo)網(wǎng)站進(jìn)行站內(nèi)搜索的關(guān)鍵詞,所述第一搜索結(jié)果頁為接收到所述第一關(guān)鍵詞后加載的頁面,所述第一目標(biāo)頁面為加載出的所述第一搜索結(jié)果頁中任一搜索結(jié)果表示的頁面,所述第二關(guān)鍵詞為在接收到所述第一關(guān)鍵詞之前接收到的關(guān)鍵詞,并且在接收到所述第二關(guān)鍵詞后,所述目標(biāo)網(wǎng)站未加載第二搜索結(jié)果頁中的任一搜索結(jié)果表示的頁面,所述第二搜索結(jié)果頁為接收到所述第二關(guān)鍵詞后加載的頁面;利用所述匹配式對所述第一搜索結(jié)果頁的URL進(jìn)行匹配;以及在所述匹配式與所述第一搜索 結(jié)果頁的URL匹配成功的情況下,關(guān)聯(lián)所述第二關(guān)鍵詞和所述第一目標(biāo)頁面。

進(jìn)一步地,關(guān)聯(lián)所述第二關(guān)鍵詞和所述第一目標(biāo)頁面包括:添加所述第二關(guān)鍵詞至所述第一目標(biāo)頁面的頁面標(biāo)簽。

進(jìn)一步地,所述匹配式為正則表達(dá)式,利用所述匹配式對所述第一搜索結(jié)果頁的URL進(jìn)行匹配包括:判斷所述第一搜索結(jié)果頁的URL中表示主機(jī)名的字段與所述正則表達(dá)式中表示域名的字段是否相同,其中,在所述第一搜索結(jié)果頁的URL中表示主機(jī)名的字段與所述正則表達(dá)式中表示域名的字段相同的情況下,確定所述匹配式與所述第一搜索結(jié)果頁的URL匹配成功。

進(jìn)一步地,在從訪問目標(biāo)網(wǎng)站的訪問日志中,提取表示所述目標(biāo)網(wǎng)站的站內(nèi)搜索結(jié)果頁的統(tǒng)一資源定位符URL之前,所述方法還包括:在所述目標(biāo)網(wǎng)站部署日志獲取程序;以及運(yùn)行所述日志獲取程序以獲取所述訪問日志。

進(jìn)一步地,從訪問目標(biāo)網(wǎng)站的訪問日志中,提取表示所述目標(biāo)網(wǎng)站的站內(nèi)搜索結(jié)果頁的統(tǒng)一資源定位符URL包括:從所述訪問日志中提取URL域名為所述目標(biāo)網(wǎng)站的域名的URL,得到所述目標(biāo)網(wǎng)站的站內(nèi)搜索結(jié)果頁的URL。

根據(jù)本申請實(shí)施例的另一方面,提供了一種提高網(wǎng)站站內(nèi)搜索效率的裝置,包括:第一提取單元,用于從訪問目標(biāo)網(wǎng)站的訪問日志中,提取表示所述目標(biāo)網(wǎng)站的站內(nèi)搜索結(jié)果頁的統(tǒng)一資源定位符URL;確定單元,用于根據(jù)所述目標(biāo)網(wǎng)站的站內(nèi)搜索結(jié)果頁的URL,確定用于匹配所述目標(biāo)網(wǎng)站的站內(nèi)搜索結(jié)果頁的匹配式;第二提取單元,用于從所述訪問日志中提取第一關(guān)鍵詞、第二關(guān)鍵詞、第一搜索結(jié)果頁的URL、第一目標(biāo)頁面,其中,所述第一關(guān)鍵詞和所述第二關(guān)鍵詞均為用于在所述目標(biāo)網(wǎng)站進(jìn)行站內(nèi)搜索的關(guān)鍵詞,所述第一搜索結(jié)果頁為接收到所述第一關(guān)鍵詞后加載的頁面,所述第一目標(biāo)頁面為加載出的所述第一搜索結(jié)果頁中任一搜索結(jié)果表示的頁面,所述第二關(guān)鍵詞為在接收到所述第一關(guān)鍵詞之前接收到的關(guān)鍵詞,并且在接收到所述第二關(guān)鍵詞后,所述目標(biāo)網(wǎng)站未加載第二搜索結(jié)果頁中的任一搜索結(jié)果表示的頁面,所述第二搜索結(jié)果頁為接收到所述第二關(guān)鍵詞后加載的頁面;匹配單元,用于利用所述匹配式對所述第一搜索結(jié)果頁的URL進(jìn)行匹配;以及關(guān)聯(lián)單元,用于在所述匹配式與所述第一搜索結(jié)果頁的URL匹配成功的情況下,關(guān)聯(lián)所述第二關(guān)鍵詞和所述第一目標(biāo)頁面。

進(jìn)一步地,所述關(guān)聯(lián)單元包括:添加子單元,用于添加所述第二關(guān)鍵詞至所述第一目標(biāo)頁面的頁面標(biāo)簽。

進(jìn)一步地,所述匹配式為正則表達(dá)式,所述匹配單元包括:判斷子單元,用于判斷所述第一搜索結(jié)果頁的URL中表示主機(jī)名的字段與所述正則表達(dá)式中表示域名的字 段是否相同,其中,在所述第一搜索結(jié)果頁的URL中表示主機(jī)名的字段與所述正則表達(dá)式中表示域名的字段相同的情況下,確定所述匹配式與所述第一搜索結(jié)果頁的URL匹配成功。

進(jìn)一步地,所述裝置包括:部署單元,用于在所述第一提取單元從訪問目標(biāo)網(wǎng)站的訪問日志中,提取表示所述目標(biāo)網(wǎng)站的站內(nèi)搜索結(jié)果頁的統(tǒng)一資源定位符URL之前,在所述目標(biāo)網(wǎng)站部署日志獲取程序;以及運(yùn)行單元,用于運(yùn)行所述日志獲取程序以獲取所述訪問日志。

進(jìn)一步地,所述第一提取單元包括:提取子單元,用于從所述訪問日志中提取URL域名為所述目標(biāo)網(wǎng)站的域名的URL,得到所述目標(biāo)網(wǎng)站的站內(nèi)搜索結(jié)果頁的URL。

在本申請實(shí)施例中,采用從訪問目標(biāo)網(wǎng)站的訪問日志中,提取表示目標(biāo)網(wǎng)站的站內(nèi)搜索結(jié)果頁的統(tǒng)一資源定位符URL,根據(jù)目標(biāo)網(wǎng)站的站內(nèi)搜索結(jié)果頁的URL,確定用于匹配目標(biāo)網(wǎng)站的站內(nèi)搜索結(jié)果頁的匹配式,從訪問日志中提取第一關(guān)鍵詞、第二關(guān)鍵詞、第一搜索結(jié)果頁的URL、第一目標(biāo)頁面,其中,第一關(guān)鍵詞和第二關(guān)鍵詞均為用于在目標(biāo)網(wǎng)站進(jìn)行站內(nèi)搜索的關(guān)鍵詞,第一搜索結(jié)果頁為接收到第一關(guān)鍵詞后加載的頁面,第一目標(biāo)頁面為加載出的第一搜索結(jié)果頁中任一搜索結(jié)果表示的頁面,第二關(guān)鍵詞為在接收到第一關(guān)鍵詞之前接收到的關(guān)鍵詞,并且在接收到第二關(guān)鍵詞后,目標(biāo)網(wǎng)站未加載第二搜索結(jié)果頁中的任一搜索結(jié)果表示的頁面,第二搜索結(jié)果頁為接收到第二關(guān)鍵詞后加載的頁面,利用匹配式對第一搜索結(jié)果頁的URL進(jìn)行匹配,以及在匹配式與第一搜索結(jié)果頁的URL匹配成功的情況下,關(guān)聯(lián)第二關(guān)鍵詞和第一目標(biāo)頁面。通過讀取用戶的訪問日志,得到用戶使用的關(guān)鍵詞、訪問過的頁面的URL,根據(jù)目標(biāo)網(wǎng)站的站內(nèi)搜索結(jié)果頁的URL,構(gòu)造能夠匹配目標(biāo)網(wǎng)站的站內(nèi)搜索結(jié)果頁的匹配式,使用匹配式對用戶的搜索結(jié)果頁進(jìn)行匹配,篩選出用戶進(jìn)行站內(nèi)搜索的搜索結(jié)果頁。把本次有效站內(nèi)搜索之前進(jìn)行的無效搜索的關(guān)鍵詞與本次有效站內(nèi)搜索所搜索出的目標(biāo)網(wǎng)站頁面進(jìn)行關(guān)聯(lián),使用戶輸入無效搜索關(guān)鍵詞后也能搜索出想要的頁面,解決了現(xiàn)有技術(shù)中網(wǎng)站站內(nèi)搜索效率低的技術(shù)問題,達(dá)到了提高網(wǎng)站站內(nèi)搜索效率的技術(shù)效果。

附圖說明

此處所說明的附圖用來提供對本申請的進(jìn)一步理解,構(gòu)成本申請的一部分,本申請的示意性實(shí)施例及其說明用于解釋本申請,并不構(gòu)成對本申請的不當(dāng)限定。在附圖中:

圖1是根據(jù)本申請實(shí)施例的一種提高網(wǎng)站站內(nèi)搜索效率的方法的流程圖;以及

圖2是根據(jù)本申請實(shí)施例的一種提高網(wǎng)站站內(nèi)搜索效率的裝置的示意圖。

具體實(shí)施方式

為了使本技術(shù)領(lǐng)域的人員更好地理解本申請方案,下面將結(jié)合本申請實(shí)施例中的附圖,對本申請實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本申請一部分的實(shí)施例,而不是全部的實(shí)施例?;诒旧暾堉械膶?shí)施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都應(yīng)當(dāng)屬于本申請保護(hù)的范圍。

需要說明的是,本申請的說明書和權(quán)利要求書及上述附圖中的術(shù)語“第一”、“第二”等是用于區(qū)別類似的對象,而不必用于描述特定的順序或先后次序。應(yīng)該理解這樣使用的數(shù)據(jù)在適當(dāng)情況下可以互換,以便這里描述的本申請的實(shí)施例能夠以除了在這里圖示或描述的那些以外的順序?qū)嵤?。此外,術(shù)語“包括”和“具有”以及他們的任何變形,意圖在于覆蓋不排他的包含,例如,包含了一系列步驟或單元的過程、方法、系統(tǒng)、產(chǎn)品或設(shè)備不必限于清楚地列出的那些步驟或單元,而是可包括沒有清楚地列出的或?qū)τ谶@些過程、方法、產(chǎn)品或設(shè)備固有的其它步驟或單元。

首先對本申請實(shí)施例所涉及的技術(shù)術(shù)語作如下解釋:

統(tǒng)一資源定位符(Uniform Resource Locator,簡稱,URL):統(tǒng)一資源定位符是對可以從互聯(lián)網(wǎng)上得到的資源的位置和訪問方法的一種簡潔的表示,是互聯(lián)網(wǎng)上標(biāo)準(zhǔn)資源的地址?;ヂ?lián)網(wǎng)上的每個(gè)文件都有一個(gè)唯一的URL,它包含的信息指出文件的位置以及瀏覽器應(yīng)該怎么處理它。

正則表達(dá)式:又稱正規(guī)表示法、常規(guī)表示法,是計(jì)算機(jī)科學(xué)的一個(gè)概念。正則表達(dá)式使用單個(gè)字符串來描述、匹配一系列符合某個(gè)句法規(guī)則的字符串。在很多文本編輯器里,正則表達(dá)式通常被用來檢索、替換那些符合某個(gè)模式的文本。

根據(jù)本申請實(shí)施例,提供了一種提高網(wǎng)站站內(nèi)搜索效率的方法的實(shí)施例,需要說明的是,在附圖的流程圖示出的步驟可以在諸如一組計(jì)算機(jī)可執(zhí)行指令的計(jì)算機(jī)系統(tǒng)中執(zhí)行,并且,雖然在流程圖中示出了邏輯順序,但是在某些情況下,可以以不同于此處的順序執(zhí)行所示出或描述的步驟。

圖1是根據(jù)本申請實(shí)施例的一種提高網(wǎng)站站內(nèi)搜索效率的方法的流程圖,如圖1所示,該方法包括如下步驟S102至步驟S110:

步驟S102,從訪問目標(biāo)網(wǎng)站的訪問日志中,提取表示目標(biāo)網(wǎng)站的站內(nèi)搜索結(jié)果頁的統(tǒng)一資源定位符URL,即從訪問日志中提取出目標(biāo)網(wǎng)站的站內(nèi)搜索結(jié)果頁的URL。

步驟S104,根據(jù)目標(biāo)網(wǎng)站的站內(nèi)搜索結(jié)果頁的URL,確定用于匹配目標(biāo)網(wǎng)站的站內(nèi)搜索結(jié)果頁的匹配式,即根據(jù)目標(biāo)網(wǎng)站站內(nèi)搜索結(jié)果頁的URL,確定出匹配式,該匹配式滿足的條件是:用它匹配目標(biāo)網(wǎng)站的站內(nèi)搜索結(jié)果頁URL時(shí),匹配成功,否則,匹配失敗。

步驟S106,從訪問日志中提取第一關(guān)鍵詞、第二關(guān)鍵詞、第一搜索結(jié)果頁的URL、第一目標(biāo)頁面,其中,第一關(guān)鍵詞和第二關(guān)鍵詞均為用于在目標(biāo)網(wǎng)站進(jìn)行站內(nèi)搜索的關(guān)鍵詞,第一搜索結(jié)果頁為接收到第一關(guān)鍵詞后加載的頁面,第一目標(biāo)頁面為加載出的第一搜索結(jié)果頁中任一搜索結(jié)果表示的頁面,第二關(guān)鍵詞為在接收到第一關(guān)鍵詞之前接收到的關(guān)鍵詞,并且在接收到第二關(guān)鍵詞后,目標(biāo)網(wǎng)站未加載第二搜索結(jié)果頁中的任一搜索結(jié)果表示的頁面,第二搜索結(jié)果頁為接收到第二關(guān)鍵詞后加載的頁面。即,從訪問日志中提取出用戶進(jìn)行搜索的關(guān)鍵詞、用戶輸入關(guān)鍵詞后加載出的頁面、該加載出來的頁面的搜索結(jié)果所指向的頁面中那些被用戶點(diǎn)擊過的頁面。其中,第一關(guān)鍵詞為用戶輸入之后,對其搜索結(jié)果頁的搜索結(jié)果指向的頁面又進(jìn)行了訪問的關(guān)鍵詞,也就是有效搜索關(guān)鍵詞。用戶輸入第一關(guān)鍵詞后,加載出來的頁面為第一搜索結(jié)果頁,第一搜索結(jié)果頁的搜索結(jié)果指向的多個(gè)頁面中那些被用戶訪問過的頁面為第一目標(biāo)頁面,第一目標(biāo)頁面可以為多個(gè)。第二關(guān)鍵詞為用戶輸入之后,對其搜索結(jié)果頁指向的頁面未進(jìn)行任何訪問的關(guān)鍵詞,也就是無效搜索關(guān)鍵詞。用戶輸入第二關(guān)鍵詞后,加載出來的頁面為第二搜索結(jié)果頁。

步驟S108,利用匹配式對第一搜索結(jié)果頁的URL進(jìn)行匹配。即,利用匹配式對第一搜索結(jié)果頁的URL進(jìn)行匹配,篩選出目標(biāo)網(wǎng)站站內(nèi)搜索的搜索結(jié)果頁。如果匹配成功,說明該第一搜索結(jié)果頁為目標(biāo)網(wǎng)站的站內(nèi)搜索的搜索結(jié)果頁,如果匹配失敗,說明該第一搜索結(jié)果頁不是目標(biāo)網(wǎng)站的站內(nèi)搜索的搜索結(jié)果頁。

步驟S110,在匹配式與第一搜索結(jié)果頁的URL匹配成功的情況下,關(guān)聯(lián)第二關(guān)鍵詞和第一目標(biāo)頁面。當(dāng)匹配式與第一搜索結(jié)果頁的URL匹配成功時(shí),說明該第一搜索結(jié)果頁是目標(biāo)網(wǎng)站站內(nèi)搜索的搜索結(jié)果頁。此時(shí),把第二關(guān)鍵詞和第一目標(biāo)頁面進(jìn)行關(guān)聯(lián),即,當(dāng)?shù)谝凰阉鹘Y(jié)果頁是目標(biāo)網(wǎng)站站內(nèi)搜索的搜索結(jié)果頁時(shí),把之前的無效搜索關(guān)鍵詞與第一目標(biāo)頁面進(jìn)行關(guān)聯(lián)。

需要注意的是,本申請實(shí)施例中的網(wǎng)站均只能提供站內(nèi)搜索功能,不能提供站外搜索功能。

例如,用戶在A網(wǎng)站輸入關(guān)鍵詞“國慶閱兵”,進(jìn)行站內(nèi)搜索,得到一個(gè)搜索結(jié)果頁,假設(shè)該搜索結(jié)果頁中某一條搜索結(jié)果為“國慶閱兵有七大不同”,在用戶點(diǎn)擊了該搜索結(jié)果后,得到了一個(gè)第一目標(biāo)頁面。另一條搜索結(jié)果為“新中國14次國慶閱兵| 海軍陸戰(zhàn)隊(duì)|步兵”,在用戶點(diǎn)擊了該搜索結(jié)果后,又得到了另一個(gè)第一目標(biāo)頁面。由于用戶對搜索結(jié)果頁中的搜索結(jié)果進(jìn)行了點(diǎn)擊(可以是點(diǎn)擊一個(gè)搜索結(jié)果,也可以是點(diǎn)擊多個(gè)搜索結(jié)果),所以該次搜索的關(guān)鍵詞“國慶閱兵”是第一關(guān)鍵詞,也稱為有效搜索關(guān)鍵詞。用戶輸入第一關(guān)鍵詞后加載出的頁面,為第一搜索結(jié)果頁,第一搜索結(jié)果頁所指向的頁面中那些被用戶點(diǎn)擊過的頁面為第一目標(biāo)頁面。

又例如,用戶在B網(wǎng)站輸入關(guān)鍵詞“國慶放假”,進(jìn)行站內(nèi)搜索,得到一個(gè)搜索結(jié)果頁。用戶對該搜索結(jié)果頁的各條搜索結(jié)果未進(jìn)行任何點(diǎn)擊,接著又輸入了關(guān)鍵詞“國慶放假游玩”,進(jìn)行站內(nèi)搜索,得到一個(gè)搜索結(jié)果頁。假設(shè)該搜索結(jié)果頁中某一條搜索結(jié)果為“‘十一’出境游進(jìn)入倒計(jì)時(shí)|游客|出游”,在用戶點(diǎn)擊了該搜索結(jié)果后,得到了一個(gè)第一目標(biāo)頁面。由于用戶使用關(guān)鍵詞“國慶放假”進(jìn)行搜索時(shí),對搜索結(jié)果頁的各條搜索結(jié)果未進(jìn)行任何點(diǎn)擊,所以關(guān)鍵詞“國慶放假”是第二關(guān)鍵詞,說明用戶沒有在搜索結(jié)果頁中找到想要的搜索結(jié)果,因此,關(guān)鍵詞“國慶放假”是無效搜索關(guān)鍵詞。用戶輸入第二關(guān)鍵詞后加載出來的頁面,為第二搜索結(jié)果頁。由于用戶使用關(guān)鍵詞“國慶放假出游”進(jìn)行搜索時(shí),對得到的站內(nèi)搜索結(jié)果頁中的搜索結(jié)果進(jìn)行了點(diǎn)擊,所以關(guān)鍵詞“國慶放假出游”是第一關(guān)鍵詞。用戶輸入第一關(guān)鍵詞后加載出的頁面,為第一搜索結(jié)果頁,第一搜索結(jié)果頁所指向的頁面中那些被用戶點(diǎn)擊過的頁面為第一目標(biāo)頁面。把關(guān)鍵詞“國慶放假”與用戶使用關(guān)鍵詞“國慶放假出游”進(jìn)行搜索得到的第一目標(biāo)頁面建立關(guān)聯(lián),這樣當(dāng)用戶使用關(guān)鍵詞“國慶放假”進(jìn)行搜索時(shí),也能搜索出該第一目標(biāo)頁面。

本申請實(shí)施例所提供的提高網(wǎng)站站內(nèi)搜索效率的方法,通過讀取用戶的訪問日志,得到用戶使用的關(guān)鍵詞、訪問過的頁面的URL,根據(jù)目標(biāo)網(wǎng)站的站內(nèi)搜索結(jié)果頁的URL,構(gòu)造能夠匹配目標(biāo)網(wǎng)站的站內(nèi)搜索結(jié)果頁的匹配式,使用匹配式對用戶的搜索結(jié)果頁進(jìn)行匹配,篩選出用戶進(jìn)行站內(nèi)搜索的搜索結(jié)果頁。把本次有效站內(nèi)搜索之前進(jìn)行的無效搜索的關(guān)鍵詞與本次有效站內(nèi)搜索所搜索出的目標(biāo)網(wǎng)站頁面進(jìn)行關(guān)聯(lián),使用戶輸入無效搜索關(guān)鍵詞后也能搜索出想要的頁面,解決了現(xiàn)有技術(shù)中網(wǎng)站站內(nèi)搜索效率低的技術(shù)問題,達(dá)到了提高網(wǎng)站站內(nèi)搜索效率的技術(shù)效果。

可選地,關(guān)聯(lián)第二關(guān)鍵詞和第一目標(biāo)頁面包括:添加第二關(guān)鍵詞至第一目標(biāo)頁面的頁面標(biāo)簽。即,通過把無效搜索的關(guān)鍵詞添加到第一目標(biāo)頁面的頁面標(biāo)簽中,使無效搜索的關(guān)鍵詞和第一目標(biāo)頁面建立關(guān)聯(lián),使用戶使用無效搜索關(guān)鍵詞也能搜索到想要的頁面。也就是說,關(guān)聯(lián)無效搜索關(guān)鍵詞和有效搜索關(guān)鍵詞所搜索出來的站內(nèi)頁面的方法,可以是把無效搜索關(guān)鍵詞添加到有效搜索關(guān)鍵詞所搜索出來的站內(nèi)頁面的頁面標(biāo)簽中。

例如,用戶一共進(jìn)行了5次站內(nèi)搜索。下面使用A、B、C、D、E表示用戶輸入的搜索關(guān)鍵詞。

用戶第一次站內(nèi)搜索輸入的搜索關(guān)鍵詞為A,加載出搜索結(jié)果頁,搜索結(jié)果頁用pageA表示,用戶點(diǎn)擊了搜索結(jié)果頁pageA的兩條搜索結(jié)果所指向的頁面,這兩個(gè)頁面分別用pageA1和pageA2表示。

用戶第二次站內(nèi)搜索輸入的搜索關(guān)鍵詞為B,加載出搜索結(jié)果頁,搜索結(jié)果頁用pageB表示,用戶點(diǎn)擊了搜索結(jié)果頁pageB的一條搜索結(jié)果所指向的頁面,這個(gè)頁面用pageB1表示。

用戶第三次站內(nèi)搜索輸入的搜索關(guān)鍵詞為C,加載出搜索結(jié)果頁,搜索結(jié)果頁用pageC表示,用戶未點(diǎn)擊搜索結(jié)果頁pageC的任何搜索結(jié)果所指向的頁面。

用戶第四次站內(nèi)搜索輸入的搜索關(guān)鍵詞為D,加載出搜索結(jié)果頁,搜索結(jié)果頁用pageD表示,用戶未點(diǎn)擊搜索結(jié)果頁pageD的任何搜索結(jié)果所指向的頁面。

用戶第五次站內(nèi)搜索輸入的搜索關(guān)鍵詞為E,加載出搜索結(jié)果頁,搜索結(jié)果頁用pageE表示,用戶點(diǎn)擊了搜索結(jié)果頁pageE的其中一條搜索結(jié)果所指向的頁面,這個(gè)頁面用pageE1表示。

用戶輸入關(guān)鍵詞A之后,對搜索結(jié)果頁的搜索結(jié)果所指向的頁面進(jìn)行了訪問,因此關(guān)鍵詞A是第一關(guān)鍵詞,也就是有效搜索關(guān)鍵詞,關(guān)鍵詞A的搜索結(jié)果頁pageA是第一搜索結(jié)果頁,頁面pageA1和pageA2為第一目標(biāo)頁面。

用戶輸入關(guān)鍵詞B之后,對搜索結(jié)果頁的搜索結(jié)果所指向的頁面進(jìn)行了訪問,因此關(guān)鍵詞B是第一關(guān)鍵詞,也就是有效搜索關(guān)鍵詞,關(guān)鍵詞B的搜索結(jié)果頁pageB是第一搜索結(jié)果頁,頁面pageB1為第一目標(biāo)頁面。

用戶輸入關(guān)鍵詞C之后,未點(diǎn)擊搜索結(jié)果頁的任何搜索結(jié)果所指向的頁面,因此,關(guān)鍵詞C是第二關(guān)鍵詞,也就是無效搜索關(guān)鍵詞,關(guān)鍵詞C的搜索結(jié)果頁pageC是第二搜索結(jié)果頁。

依此類推,關(guān)鍵詞D是第二關(guān)鍵詞,也就是無效搜索關(guān)鍵詞。關(guān)鍵詞D的搜索結(jié)果頁pageD是第二搜索結(jié)果頁。

關(guān)鍵詞E是第一關(guān)鍵詞,也就是有效搜索關(guān)鍵詞。關(guān)鍵詞E的搜索結(jié)果頁pageE是第一搜索結(jié)果頁。頁面pageE1為第一目標(biāo)頁面。

將第二關(guān)鍵詞C與第二關(guān)鍵詞D添加到第一目標(biāo)頁面pageE1的頁面標(biāo)簽中,使得 用戶在使用關(guān)鍵詞C和關(guān)鍵詞D進(jìn)行站內(nèi)搜索也能搜索出頁面pageE1。

可選地,匹配式為正則表達(dá)式,利用匹配式對第一搜索結(jié)果頁的URL進(jìn)行匹配包括:判斷第一搜索結(jié)果頁的URL中表示主機(jī)名的字段與正則表達(dá)式中表示域名的字段是否相同,其中,在第一搜索結(jié)果頁的URL中表示主機(jī)名的字段與正則表達(dá)式中表示域名的字段相同的情況下,確定匹配式與第一搜索結(jié)果頁的URL匹配成功。即,使用正則表達(dá)式對第一搜索結(jié)果頁進(jìn)行匹配,如果第一搜索結(jié)果頁的URL中表示主機(jī)名的字段與正則表達(dá)式中表示域名的字段相同,則匹配成功,說明該第一搜索結(jié)果頁是目標(biāo)網(wǎng)站站內(nèi)搜索結(jié)果頁。

正則表達(dá)式有很多用法,例如:替換指定內(nèi)容到行尾、數(shù)字替換、刪除每一行行尾的指定字符、匹配字符串,等等。

比如有兩個(gè)字符串:“123451265345”和“2345”,需要?jiǎng)h除每個(gè)字符串末尾的“345”。解決方法如下:在替換對話框中,啟用“正則表達(dá)式”復(fù)選框,在查找內(nèi)容里面輸入“345$”,其中,“$”表示從行尾匹配。

可以使用正則表達(dá)式作為匹配式,用于匹配URL的正則表達(dá)式可以為以下形式:“^http://([\\w-]+\.)+[\\w-]+(/[\\w-./?%&=]*)?$”。

在鳳凰網(wǎng)輸入搜索關(guān)鍵詞“天津爆炸”,選擇站內(nèi)搜索,搜索結(jié)果頁的搜索結(jié)果指向的部分頁面的URL為:

http://news.ifeng.com/a/20150814/44423078_0.shtml

http://news.ifeng.com/a/20150815/44433711_0.shtml

http://news.ifeng.com/a/20150813/44417356_0.shtml

http://news.ifeng.com/a/20150829/44546931_0.shtml

從上面幾條URL可以看出它們的域名都為news.ifeng.com,只是后面的路徑不同,因此可以通過判斷URL表示主機(jī)名的字段與正則表達(dá)式中表示域名的字段是否相同來判斷是否為目標(biāo)網(wǎng)站站內(nèi)頁面,如果URL表示主機(jī)名的字段與正則表達(dá)式中表示域名的字段相同,則該URL為目標(biāo)網(wǎng)站站內(nèi)頁面。

可選地,在從訪問目標(biāo)網(wǎng)站的訪問日志中,提取表示目標(biāo)網(wǎng)站的站內(nèi)搜索結(jié)果頁的統(tǒng)一資源定位符URL之前,方法包括:在目標(biāo)網(wǎng)站部署日志獲取程序;以及運(yùn)行日志獲取程序以獲取訪問日志。即,通過在目標(biāo)網(wǎng)站部署并運(yùn)行日志獲取程序來獲取用戶訪問日志。其中,用戶訪問日志記錄了用戶在目標(biāo)網(wǎng)站的訪問信息,可以包括用戶 輸入的搜索關(guān)鍵詞、點(diǎn)擊的頁面、在頁面的停留時(shí)間,等等。

可選地,從訪問目標(biāo)網(wǎng)站的訪問日志中,提取表示目標(biāo)網(wǎng)站的站內(nèi)搜索結(jié)果頁的統(tǒng)一資源定位符URL包括:從訪問日志中提取URL域名為目標(biāo)網(wǎng)站的域名的URL,得到目標(biāo)網(wǎng)站的站內(nèi)搜索結(jié)果頁的URL。即,如果某一個(gè)URL的域名與目標(biāo)網(wǎng)站的域名相同,則這個(gè)URL所表示的頁面是這個(gè)目標(biāo)網(wǎng)站的站內(nèi)頁面。

根據(jù)本申請實(shí)施例,還提供了一種提高網(wǎng)站站內(nèi)搜索效率的裝置。該提高網(wǎng)站站內(nèi)搜索效率的裝置可以執(zhí)行上述提高網(wǎng)站站內(nèi)搜索效率的方法,上述提高網(wǎng)站站內(nèi)搜索效率的方法也可以通過該提高網(wǎng)站站內(nèi)搜索效率的裝置實(shí)施。

圖2是根據(jù)本申請實(shí)施例的一種提高網(wǎng)站站內(nèi)搜索效率的裝置的示意圖。如圖2所示,該裝置包括第一提取單元20、確定單元22、第二提取單元24、匹配單元26和關(guān)聯(lián)單元28。

第一提取單元20,用于從訪問目標(biāo)網(wǎng)站的訪問日志中,提取表示目標(biāo)網(wǎng)站的站內(nèi)搜索結(jié)果頁的統(tǒng)一資源定位符URL。即從訪問日志中提取出目標(biāo)網(wǎng)站的站內(nèi)搜索結(jié)果頁的URL。

確定單元22,用于根據(jù)目標(biāo)網(wǎng)站的站內(nèi)搜索結(jié)果頁的URL,確定用于匹配目標(biāo)網(wǎng)站的站內(nèi)搜索結(jié)果頁的匹配式。即根據(jù)目標(biāo)網(wǎng)站站內(nèi)搜索結(jié)果頁的URL,確定出匹配式,該匹配式滿足的條件是:用它匹配目標(biāo)網(wǎng)站的站內(nèi)搜索結(jié)果頁URL時(shí),匹配成功,否則,匹配失敗。

第二提取單元24,用于從訪問日志中提取第一關(guān)鍵詞、第二關(guān)鍵詞、第一搜索結(jié)果頁的URL、第一目標(biāo)頁面,其中,第一關(guān)鍵詞和第二關(guān)鍵詞均為用于在目標(biāo)網(wǎng)站進(jìn)行站內(nèi)搜索的關(guān)鍵詞,第一搜索結(jié)果頁為接收到第一關(guān)鍵詞后加載的頁面,第一目標(biāo)頁面為加載出的第一搜索結(jié)果頁中任一搜索結(jié)果表示的頁面,第二關(guān)鍵詞為在接收到第一關(guān)鍵詞之前接收到的關(guān)鍵詞,并且在接收到第二關(guān)鍵詞后,目標(biāo)網(wǎng)站未加載第二搜索結(jié)果頁中的任一搜索結(jié)果表示的頁面,第二搜索結(jié)果頁為接收到第二關(guān)鍵詞后加載的頁面。即,從訪問日志中提取出用戶進(jìn)行搜索的關(guān)鍵詞、用戶輸入關(guān)鍵詞后加載出的頁面、該加載出來的頁面的搜索結(jié)果所指向的頁面中那些被用戶點(diǎn)擊過的頁面。其中,第一關(guān)鍵詞為用戶輸入之后,對其搜索結(jié)果頁的搜索結(jié)果指向的頁面又進(jìn)行了訪問的關(guān)鍵詞,也就是有效搜索關(guān)鍵詞。用戶輸入第一關(guān)鍵詞后,加載出來的頁面為第一搜索結(jié)果頁,第一搜索結(jié)果頁的搜索結(jié)果指向的多個(gè)頁面中那些被用戶訪問過的頁面為第一目標(biāo)頁面,第一目標(biāo)頁面可以為多個(gè)。第二關(guān)鍵詞為用戶輸入之后,對其搜索結(jié)果頁指向的頁面未進(jìn)行任何訪問的關(guān)鍵詞,也就是無效搜索關(guān)鍵詞。用戶輸入 第二關(guān)鍵詞后,加載出來的頁面為第二搜索結(jié)果頁。

匹配單元26,用于利用匹配式對第一搜索結(jié)果頁的URL進(jìn)行匹配。即,利用匹配式對第一搜索結(jié)果頁的URL進(jìn)行匹配,篩選出目標(biāo)網(wǎng)站站內(nèi)搜索的搜索結(jié)果頁。如果匹配成功,說明該第一搜索結(jié)果頁為目標(biāo)網(wǎng)站的站內(nèi)搜索的搜索結(jié)果頁,如果匹配失敗,說明該第一搜索結(jié)果頁不是目標(biāo)網(wǎng)站的站內(nèi)搜索的搜索結(jié)果頁。

關(guān)聯(lián)單元28,用于在匹配式與第一搜索結(jié)果頁的URL匹配成功的情況下,關(guān)聯(lián)第二關(guān)鍵詞和第一目標(biāo)頁面。即,當(dāng)?shù)谝凰阉鹘Y(jié)果頁是目標(biāo)網(wǎng)站站內(nèi)搜索的搜索結(jié)果頁時(shí),把之前的無效搜索關(guān)鍵詞與第一目標(biāo)頁面進(jìn)行關(guān)聯(lián)。

需要注意的是,本申請實(shí)施例中的網(wǎng)站均只能提供站內(nèi)搜索功能,不能提供站外搜索功能。

例如,用戶在A網(wǎng)站輸入關(guān)鍵詞“國慶閱兵”,進(jìn)行站內(nèi)搜索,得到一個(gè)搜索結(jié)果頁,假設(shè)該搜索結(jié)果頁中某一條搜索結(jié)果為“國慶閱兵有七大不同”,在用戶點(diǎn)擊了該搜索結(jié)果后,得到了一個(gè)第一目標(biāo)頁面。另一條搜索結(jié)果為“新中國14次國慶閱兵|海軍陸戰(zhàn)隊(duì)|步兵”,在用戶點(diǎn)擊了該搜索結(jié)果后,又得到了另一個(gè)第一目標(biāo)頁面。由于用戶對搜索結(jié)果頁中的搜索結(jié)果進(jìn)行了點(diǎn)擊(可以是點(diǎn)擊一個(gè)搜索結(jié)果,也可以是點(diǎn)擊多個(gè)搜索結(jié)果),所以該次搜索的關(guān)鍵詞“國慶閱兵”是第一關(guān)鍵詞,也稱為有效搜索關(guān)鍵詞。用戶輸入第一關(guān)鍵詞后加載出的頁面,為第一搜索結(jié)果頁,第一搜索結(jié)果頁所指向的頁面中那些被用戶點(diǎn)擊過的頁面為第一目標(biāo)頁面。

又例如,用戶在B網(wǎng)站輸入關(guān)鍵詞“國慶放假”,進(jìn)行站內(nèi)搜索,得到一個(gè)搜索結(jié)果頁。用戶對該搜索結(jié)果頁的各條搜索結(jié)果未進(jìn)行任何點(diǎn)擊,接著又輸入了關(guān)鍵詞“國慶放假游玩”,進(jìn)行站內(nèi)搜索,得到一個(gè)搜索結(jié)果頁。假設(shè)該搜索結(jié)果頁中某一條搜索結(jié)果為“‘十一’出境游進(jìn)入倒計(jì)時(shí)|游客|出游”,在用戶點(diǎn)擊了該搜索結(jié)果后,得到了一個(gè)第一目標(biāo)頁面。由于用戶使用關(guān)鍵詞“國慶放假”進(jìn)行搜索時(shí),對搜索結(jié)果頁的各條搜索結(jié)果未進(jìn)行任何點(diǎn)擊,所以關(guān)鍵詞“國慶放假”是第二關(guān)鍵詞,說明用戶沒有在搜索結(jié)果頁中找到想要的搜索結(jié)果,因此,關(guān)鍵詞“國慶放假”是無效搜索關(guān)鍵詞。用戶輸入第二關(guān)鍵詞后加載出來的頁面,為第二搜索結(jié)果頁。由于用戶使用關(guān)鍵詞“國慶放假出游”進(jìn)行搜索時(shí),對得到的站內(nèi)搜索結(jié)果頁中的搜索結(jié)果進(jìn)行了點(diǎn)擊,所以關(guān)鍵詞“國慶放假出游”是第一關(guān)鍵詞。用戶輸入第一關(guān)鍵詞后加載出的頁面,為第一搜索結(jié)果頁,第一搜索結(jié)果頁所指向的頁面中那些被用戶點(diǎn)擊過的頁面為第一目標(biāo)頁面。把關(guān)鍵詞“國慶放假”與用戶使用關(guān)鍵詞“國慶放假出游”進(jìn)行搜索得到的第一目標(biāo)頁面建立關(guān)聯(lián),這樣當(dāng)用戶使用關(guān)鍵詞“國慶放假”進(jìn)行搜索時(shí),也能搜索出該第一目標(biāo)頁面。

本申請實(shí)施例所提供的提高網(wǎng)站站內(nèi)搜索效率的裝置,通過讀取用戶的訪問日志,得到用戶使用的關(guān)鍵詞、訪問過的頁面的URL,根據(jù)目標(biāo)網(wǎng)站的站內(nèi)搜索結(jié)果頁的URL,構(gòu)造能夠匹配目標(biāo)網(wǎng)站的站內(nèi)搜索結(jié)果頁的匹配式,使用匹配式對用戶的搜索結(jié)果頁進(jìn)行匹配,篩選出用戶進(jìn)行站內(nèi)搜索的搜索結(jié)果頁。把本次有效站內(nèi)搜索之前進(jìn)行的無效搜索的關(guān)鍵詞與本次有效站內(nèi)搜索所搜索出的目標(biāo)網(wǎng)站頁面進(jìn)行關(guān)聯(lián),使用戶輸入無效搜索關(guān)鍵詞后也能搜索出想要的頁面,解決了現(xiàn)有技術(shù)中網(wǎng)站站內(nèi)搜索效率低的技術(shù)問題,達(dá)到了提高網(wǎng)站站內(nèi)搜索效率的技術(shù)效果。

可選地,關(guān)聯(lián)單元包括添加子單元。該添加子單元用于添加第二關(guān)鍵詞至第一目標(biāo)頁面的頁面標(biāo)簽。即,通過把無效搜索的關(guān)鍵詞添加到第一目標(biāo)頁面的頁面標(biāo)簽中,使無效搜索的關(guān)鍵詞和第一目標(biāo)頁面建立關(guān)聯(lián),使用戶使用無效搜索關(guān)鍵詞也能搜索到想要的頁面。也就是說,關(guān)聯(lián)無效搜索關(guān)鍵詞和有效搜索關(guān)鍵詞所搜索出來的站內(nèi)頁面的方法,可以是把無效搜索關(guān)鍵詞添加到有效搜索關(guān)鍵詞所搜索出來的站內(nèi)頁面的頁面標(biāo)簽中。

例如,用戶一共進(jìn)行了5次站內(nèi)搜索。下面使用A、B、C、D、E表示用戶輸入的搜索關(guān)鍵詞。

用戶第一次站內(nèi)搜索輸入的搜索關(guān)鍵詞為A,加載出搜索結(jié)果頁,搜索結(jié)果頁用pageA表示,用戶點(diǎn)擊了搜索結(jié)果頁pageA的兩條搜索結(jié)果所指向的頁面,這兩個(gè)頁面分別用pageA1和pageA2表示。

用戶第二次站內(nèi)搜索輸入的搜索關(guān)鍵詞為B,加載出搜索結(jié)果頁,搜索結(jié)果頁用pageB表示,用戶點(diǎn)擊了搜索結(jié)果頁pageB的一條搜索結(jié)果所指向的頁面,這個(gè)頁面用pageB1表示。

用戶第三次站內(nèi)搜索輸入的搜索關(guān)鍵詞為C,加載出搜索結(jié)果頁,搜索結(jié)果頁用pageC表示,用戶未點(diǎn)擊搜索結(jié)果頁pageC的任何搜索結(jié)果所指向的頁面。

用戶第四次站內(nèi)搜索輸入的搜索關(guān)鍵詞為D,加載出搜索結(jié)果頁,搜索結(jié)果頁用pageD表示,用戶未點(diǎn)擊搜索結(jié)果頁pageD的任何搜索結(jié)果所指向的頁面。

用戶第五次站內(nèi)搜索輸入的搜索關(guān)鍵詞為E,加載出搜索結(jié)果頁,搜索結(jié)果頁用pageE表示,用戶點(diǎn)擊了搜索結(jié)果頁pageE的其中一條搜索結(jié)果所指向的頁面,這個(gè)頁面用pageE1表示。

用戶輸入關(guān)鍵詞A之后,對搜索結(jié)果頁的搜索結(jié)果所指向的頁面進(jìn)行了訪問,因此關(guān)鍵詞A是第一關(guān)鍵詞,也就是有效搜索關(guān)鍵詞,關(guān)鍵詞A的搜索結(jié)果頁pageA是第一搜索結(jié)果頁,頁面pageA1和pageA2為第一目標(biāo)頁面。

用戶輸入關(guān)鍵詞B之后,對搜索結(jié)果頁的搜索結(jié)果所指向的頁面進(jìn)行了訪問,因此關(guān)鍵詞B是第一關(guān)鍵詞,也就是有效搜索關(guān)鍵詞,關(guān)鍵詞B的搜索結(jié)果頁pageB是第一搜索結(jié)果頁,頁面pageB1為第一目標(biāo)頁面。

用戶輸入關(guān)鍵詞C之后,未點(diǎn)擊搜索結(jié)果頁的任何搜索結(jié)果所指向的頁面,因此,關(guān)鍵詞C是第二關(guān)鍵詞,也就是無效搜索關(guān)鍵詞,關(guān)鍵詞C的搜索結(jié)果頁pageC是第二搜索結(jié)果頁。

依此類推,關(guān)鍵詞D是第二關(guān)鍵詞,也就是無效搜索關(guān)鍵詞。關(guān)鍵詞D的搜索結(jié)果頁pageD是第二搜索結(jié)果頁。

關(guān)鍵詞E是第一關(guān)鍵詞,也就是有效搜索關(guān)鍵詞。關(guān)鍵詞E的搜索結(jié)果頁pageE是第一搜索結(jié)果頁。頁面pageE1為第一目標(biāo)頁面。

將第二關(guān)鍵詞C與第二關(guān)鍵詞D添加到第一目標(biāo)頁面pageE1的頁面標(biāo)簽中,使得用戶在使用關(guān)鍵詞C和關(guān)鍵詞D進(jìn)行站內(nèi)搜索也能搜索出頁面pageE1。

可選地,匹配式為正則表達(dá)式,匹配單元包括判斷子單元。該判斷子單元用于判斷第一搜索結(jié)果頁的URL中表示主機(jī)名的字段與正則表達(dá)式中表示域名的字段是否相同,其中,在第一搜索結(jié)果頁的URL中表示主機(jī)名的字段與正則表達(dá)式中表示域名的字段相同的情況下,確定匹配式與第一搜索結(jié)果頁的URL匹配成功。即,使用正則表達(dá)式對第一搜索結(jié)果頁進(jìn)行匹配,如果第一搜索結(jié)果頁的URL中表示主機(jī)名的字段與正則表達(dá)式中表示域名的字段相同,則匹配成功,說明該第一搜索結(jié)果頁是目標(biāo)網(wǎng)站站內(nèi)搜索結(jié)果頁。

正則表達(dá)式有很多用法,例如:替換指定內(nèi)容到行尾、數(shù)字替換、刪除每一行行尾的指定字符、匹配字符串,等等。

比如有兩個(gè)字符串:“123451265345”和“2345”,需要?jiǎng)h除每個(gè)字符串末尾的“345”。解決方法如下:在替換對話框中,啟用“正則表達(dá)式”復(fù)選框,在查找內(nèi)容里面輸入“345$”,其中,“$”表示從行尾匹配。

可以使用正則表達(dá)式作為匹配式,用于匹配URL的正則表達(dá)式可以為以下形式:“^http://([\\w-]+\.)+[\\w-]+(/[\\w-./?%&=]*)?$”。

在鳳凰網(wǎng)輸入搜索關(guān)鍵詞“天津爆炸”,選擇站內(nèi)搜索,搜索結(jié)果頁的搜索結(jié)果指向的部分頁面的URL為:

http://news.ifeng.com/a/20150814/44423078_0.shtml

http://news.ifeng.com/a/20150815/44433711_0.shtml

http://news.ifeng.com/a/20150813/44417356_0.shtml

http://news.ifeng.com/a/20150829/44546931_0.shtml

從上面幾條URL可以看出它們的域名都為news.ifeng.com,只是后面的路徑不同,因此可以通過判斷URL表示主機(jī)名的字段與正則表達(dá)式中表示域名的字段是否相同來判斷是否為目標(biāo)網(wǎng)站站內(nèi)頁面,如果URL表示主機(jī)名的字段與正則表達(dá)式中表示域名的字段相同,則該URL為目標(biāo)網(wǎng)站站內(nèi)頁面。

可選地,裝置包括部署單元和運(yùn)行單元。部署單元用于在第一提取單元從訪問目標(biāo)網(wǎng)站的訪問日志中,提取表示目標(biāo)網(wǎng)站的站內(nèi)搜索結(jié)果頁的統(tǒng)一資源定位符URL之前,在目標(biāo)網(wǎng)站部署日志獲取程序。運(yùn)行單元,用于運(yùn)行日志獲取程序以獲取訪問日志。即,通過在目標(biāo)網(wǎng)站部署并運(yùn)行日志獲取程序來獲取用戶訪問日志。其中,用戶訪問日志記錄了用戶在目標(biāo)網(wǎng)站的訪問信息,可以包括用戶輸入的搜索關(guān)鍵詞、點(diǎn)擊的頁面、在頁面的停留時(shí)間,等等。

可選地,第一提取單元包括提取子單元。該提取子單元用于從訪問日志中提取URL域名為目標(biāo)網(wǎng)站的域名的URL,得到目標(biāo)網(wǎng)站的站內(nèi)搜索結(jié)果頁的URL。即,如果某一個(gè)URL的域名與目標(biāo)網(wǎng)站的域名相同,則這個(gè)URL所表示的頁面是這個(gè)目標(biāo)網(wǎng)站的站內(nèi)頁面。

所述提高網(wǎng)站站內(nèi)搜索效率的裝置包括處理器和存儲(chǔ)器,上述第一提取單元20、確定單元22、第二提取單元24、匹配單元26和關(guān)聯(lián)單元28等均作為程序單元存儲(chǔ)在存儲(chǔ)器中,由處理器執(zhí)行存儲(chǔ)在存儲(chǔ)器中的上述程序單元來實(shí)現(xiàn)相應(yīng)的功能。

處理器中包含內(nèi)核,由內(nèi)核去存儲(chǔ)器中調(diào)取相應(yīng)的程序單元。內(nèi)核可以設(shè)置一個(gè)或以上,通過調(diào)整內(nèi)核參數(shù)來在提高站內(nèi)搜索效率。

存儲(chǔ)器可能包括計(jì)算機(jī)可讀介質(zhì)中的非永久性存儲(chǔ)器,隨機(jī)存取存儲(chǔ)器(RAM)和/或非易失性內(nèi)存等形式,如只讀存儲(chǔ)器(ROM)或閃存(flash RAM),存儲(chǔ)器包括至少一個(gè)存儲(chǔ)芯片。

本申請還提供了一種計(jì)算機(jī)程序產(chǎn)品,當(dāng)在數(shù)據(jù)處理設(shè)備上執(zhí)行時(shí),適于執(zhí)行初始化有如下方法步驟的程序代碼:從訪問目標(biāo)網(wǎng)站的訪問日志中,提取表示目標(biāo)網(wǎng)站的站內(nèi)搜索結(jié)果頁的統(tǒng)一資源定位符URL,根據(jù)目標(biāo)網(wǎng)站的站內(nèi)搜索結(jié)果頁的URL,確定用于匹配目標(biāo)網(wǎng)站的站內(nèi)搜索結(jié)果頁的匹配式,從訪問日志中提取第一關(guān)鍵詞、第二關(guān)鍵詞、第一搜索結(jié)果頁的URL、第一目標(biāo)頁面,其中,第一關(guān)鍵詞和第二關(guān)鍵詞 均為用于在目標(biāo)網(wǎng)站進(jìn)行站內(nèi)搜索的關(guān)鍵詞,第一搜索結(jié)果頁為接收到第一關(guān)鍵詞后加載的頁面,第一目標(biāo)頁面為加載出的第一搜索結(jié)果頁中任一搜索結(jié)果表示的頁面,第二關(guān)鍵詞為在接收到第一關(guān)鍵詞之前接收到的關(guān)鍵詞,并且在接收到第二關(guān)鍵詞后,目標(biāo)網(wǎng)站未加載第二搜索結(jié)果頁中的任一搜索結(jié)果表示的頁面,第二搜索結(jié)果頁為接收到第二關(guān)鍵詞后加載的頁面,利用匹配式對第一搜索結(jié)果頁的URL進(jìn)行匹配,以及在匹配式與第一搜索結(jié)果頁的URL匹配成功的情況下,關(guān)聯(lián)第二關(guān)鍵詞和第一目標(biāo)頁面。

上述本申請實(shí)施例序號僅僅為了描述,不代表實(shí)施例的優(yōu)劣。

在本申請的上述實(shí)施例中,對各個(gè)實(shí)施例的描述都各有側(cè)重,某個(gè)實(shí)施例中沒有詳述的部分,可以參見其他實(shí)施例的相關(guān)描述。

在本申請所提供的幾個(gè)實(shí)施例中,應(yīng)該理解到,所揭露的技術(shù)內(nèi)容,可通過其它的方式實(shí)現(xiàn)。其中,以上所描述的裝置實(shí)施例僅僅是示意性的,例如所述單元的劃分,可以為一種邏輯功能劃分,實(shí)際實(shí)現(xiàn)時(shí)可以有另外的劃分方式,例如多個(gè)單元或組件可以結(jié)合或者可以集成到另一個(gè)系統(tǒng),或一些特征可以忽略,或不執(zhí)行。另一點(diǎn),所顯示或討論的相互之間的耦合或直接耦合或通信連接可以是通過一些接口,單元或模塊的間接耦合或通信連接,可以是電性或其它的形式。

所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個(gè)地方,或者也可以分布到多個(gè)單元上??梢愿鶕?jù)實(shí)際的需要選擇其中的部分或者全部單元來實(shí)現(xiàn)本實(shí)施例方案的目的。

另外,在本申請各個(gè)實(shí)施例中的各功能單元可以集成在一個(gè)處理單元中,也可以是各個(gè)單元單獨(dú)物理存在,也可以兩個(gè)或兩個(gè)以上單元集成在一個(gè)單元中。上述集成的單元既可以采用硬件的形式實(shí)現(xiàn),也可以采用軟件功能單元的形式實(shí)現(xiàn)。

所述集成的單元如果以軟件功能單元的形式實(shí)現(xiàn)并作為獨(dú)立的產(chǎn)品銷售或使用時(shí),可以存儲(chǔ)在一個(gè)計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中?;谶@樣的理解,本申請的技術(shù)方案本質(zhì)上或者說對現(xiàn)有技術(shù)做出貢獻(xiàn)的部分或者該技術(shù)方案的全部或部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計(jì)算機(jī)軟件產(chǎn)品存儲(chǔ)在一個(gè)存儲(chǔ)介質(zhì)中,包括若干指令用以使得一臺計(jì)算機(jī)設(shè)備(可為個(gè)人計(jì)算機(jī)、服務(wù)器或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本申請各個(gè)實(shí)施例所述方法的全部或部分步驟。而前述的存儲(chǔ)介質(zhì)包括:U盤、只讀存儲(chǔ)器(ROM,Read-Only Memory)、隨機(jī)存取存儲(chǔ)器(RAM,Random Access Memory)、移動(dòng)硬盤、磁碟或者光盤等各種可以存儲(chǔ)程序代碼的介質(zhì)。

以上所述僅是本申請的優(yōu)選實(shí)施方式,應(yīng)當(dāng)指出,對于本技術(shù)領(lǐng)域的普通技術(shù)人員來說,在不脫離本申請?jiān)淼那疤嵯?,還可以做出若干改進(jìn)和潤飾,這些改進(jìn)和潤飾也應(yīng)視為本申請的保護(hù)范圍。

當(dāng)前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會(huì)獲得點(diǎn)贊!
1
永川市| 洮南市| 淮北市| 灵山县| 延津县| 梅州市| 剑川县| 鹤壁市| 广河县| 新乐市| 海盐县| 天等县| 凤冈县| 丘北县| 环江| 乐清市| 无棣县| 松滋市| 祁阳县| 舞阳县| 崇阳县| 融水| 嘉善县| 河南省| 慈利县| 逊克县| 咸丰县| 邓州市| 常宁市| 松阳县| 偃师市| 诏安县| 南涧| 陇南市| 连江县| 广东省| 西畴县| 延川县| 屏山县| 舟曲县| 灵台县|