專利名稱:一種網(wǎng)頁搜索設備和方法
技術(shù)領域:
本發(fā)明涉及計算機領域,更具體地,涉及一種網(wǎng)頁搜索設備和方法。
背景技術(shù):
計算機用戶可以通過網(wǎng)頁瀏覽器來訪問互聯(lián)網(wǎng)網(wǎng)頁。隨著互聯(lián)網(wǎng)的高速發(fā)展,在互聯(lián)網(wǎng)上提供的信息數(shù)量也日益龐大,用戶很難記住提供信息網(wǎng)站的具體地址,因而常常依賴于搜索網(wǎng)站來查詢網(wǎng)絡上的相關信息。
搜索網(wǎng)站利用搜索引擎來從互聯(lián)網(wǎng)中提取各個網(wǎng)站或網(wǎng)頁的信息(以網(wǎng)頁文字為主),建立起數(shù)據(jù)庫。當用戶在搜索網(wǎng)站上進行查詢時,搜索引擎能檢索與用戶查詢條件相匹配的記錄,按一定的排列順序返回查詢結(jié)果。
然而,現(xiàn)有的搜索網(wǎng)站在提供搜索服務時,其通常要求用戶在搜索界面中輸入具體的查詢內(nèi)容即搜索詞。然后,當用戶通過敲擊鍵盤上的回車或者點擊搜索界面上的搜索圖標來發(fā)出搜索請求時,搜索引擎會根據(jù)用戶輸入的搜索詞進行檢索,并向用戶返回搜索結(jié)果。如果用戶沒有輸入搜索詞,搜索網(wǎng)站則會不進行任何搜索操作,有時還會提醒用戶應當輸入搜索詞。
本申請的發(fā)明人發(fā)現(xiàn),有些時候,用戶未在搜索網(wǎng)站上輸入搜索詞并不是因為忘記輸入,而是如同用戶在瀏覽各種信息網(wǎng)站一樣,并沒有明確的查詢目的,而是希望搜索引擎可以向用戶提供感興趣的搜索結(jié)果。
現(xiàn)有的搜索網(wǎng)站沒有充分考慮用戶沒有明確輸入搜索詞的原因,而是簡單地認為是用戶忘記輸入搜索詞了,因此沒有充分考慮到用戶期望搜索網(wǎng)站能夠提供自己最感興趣的搜索結(jié)果而不用任何輸入的潛在需求。發(fā)明內(nèi)容
本發(fā)明的一個目的是提供一種克服上述缺陷或者至少部分地緩解上述缺陷的一種網(wǎng)頁搜索設備和方法。
為了實現(xiàn)上述至少一個目的,按照本發(fā)明的一個方面,提供了一種網(wǎng)頁搜索設備, 該網(wǎng)頁搜索設備包括
術(shù)語提取器,其配置成從網(wǎng)頁中提取一個或多個術(shù)語;
搜索器,其配置成在用戶未輸入搜索詞時將一個或者多個術(shù)語中的至少一個術(shù)語作為搜索詞向搜索引擎發(fā)出搜索請求,并向用戶返回搜索結(jié)果。
在一個實施例中,網(wǎng)頁搜索設備還包括網(wǎng)址獲取器,其配置成獲取瀏覽器處的一個或多個用戶關注網(wǎng)址;其中,術(shù)語提取器從與一個或多個用戶關注網(wǎng)址相對應的網(wǎng)頁中提取術(shù)語。
可選地,術(shù)語提取器還配置成計算一個或多個術(shù)語的重要度值,重要度值用于標識術(shù)語在網(wǎng)頁中的重要度。
可選地,術(shù)語的重要度值根據(jù)術(shù)語分別在各個對應網(wǎng)頁的重要度值以及各個對應網(wǎng)頁的網(wǎng)頁權(quán)重值加權(quán)計算得到。
可選地,網(wǎng)頁權(quán)重值根據(jù)用戶瀏覽對應網(wǎng)頁的順序來確定,越新瀏覽的網(wǎng)頁的權(quán)重值越高。
可選地,搜索器設置成基于術(shù)語的重要度值選擇至少一個術(shù)語作為搜索詞,例如, 搜索器設置成將重要度值最高的術(shù)語選做搜索詞。
可選地,搜索器設置成當用戶未輸入搜索詞后對返回的搜索結(jié)果無瀏覽操作時, 則在用戶后續(xù)未輸入搜索詞進行搜索時,將之前沒有作為搜索詞使用過的術(shù)語作為備選的搜索詞。
可選地,網(wǎng)址獲取器配置成從下列網(wǎng)址中獲取用戶關注網(wǎng)址
瀏覽器中存儲的網(wǎng)頁瀏覽歷史;
瀏覽器的本地收藏夾中存儲的網(wǎng)頁的網(wǎng)址;和/或
用戶的網(wǎng)絡收藏夾中存儲的網(wǎng)頁的網(wǎng)址。
可選地,網(wǎng)址獲取器配置成排除與呈現(xiàn)搜索結(jié)果的網(wǎng)頁相對應的網(wǎng)址作為用戶關注網(wǎng)址。
在一個實施例中,網(wǎng)頁搜索設備還包括術(shù)語列表生成器,其配置成生成包含所提取的各術(shù)語的術(shù)語列表。
在一個實施例中,網(wǎng)頁搜索設備還包括術(shù)語更新器,其配置成更新用戶關注網(wǎng)址; 以及術(shù)語提取器從與更新的用戶關注網(wǎng)址相對應的網(wǎng)頁中提取術(shù)語。
可選地,搜索器配置成在用戶輸入搜索詞時,根據(jù)用戶輸入的搜索詞向搜索引擎發(fā)出搜索請求,并向用戶返回搜索結(jié)果。
按照本發(fā)明的另一方面,提供了一種網(wǎng)頁搜索方法,包括
術(shù)語提取步驟,用于從網(wǎng)頁中提取一個或多個術(shù)語;
搜索步驟,用于在用戶未輸入搜索詞時將一個或者多個術(shù)語中的至少一個術(shù)語作為搜索詞向搜索引擎發(fā)出搜索請求,并向用戶返回搜索結(jié)果。
在一個實施例中,網(wǎng)頁搜索方法還包括網(wǎng)址獲取步驟,用于獲取瀏覽器處的一個或多個用戶關注網(wǎng)址;其中,在術(shù)語提取步驟中,從與一個或多個用戶關注網(wǎng)址相對應的網(wǎng)頁中提取術(shù)語。
可選地,在術(shù)語提取步驟中還計算一個或多個術(shù)語的重要度值,重要度值用于標識術(shù)語在網(wǎng)頁中的重要度。
可選地,術(shù)語的重要度值根據(jù)術(shù)語分別在各個對應網(wǎng)頁的重要度值以及各個對應網(wǎng)頁的網(wǎng)頁權(quán)重值加權(quán)計算得到。
可選地,網(wǎng)頁權(quán)重值根據(jù)用戶瀏覽對應網(wǎng)頁的順序來確定,越新瀏覽的網(wǎng)頁的權(quán)重值越高。
在一個實施例中,網(wǎng)頁搜索方法還包括網(wǎng)頁權(quán)重生成步驟,用于根據(jù)瀏覽順序預先設定網(wǎng)頁權(quán)重值。
可選地,在搜索步驟中,基于術(shù)語的重要度值選擇至少一個術(shù)語作為搜索詞。
可選地,在搜索步驟中,將重要度值最高的術(shù)語選做搜索詞。
可選地,在搜索步驟中,當用戶未輸入搜索詞后對返回的搜索結(jié)果無瀏覽操作時, 則在用戶后續(xù)未輸入搜索詞進行搜索時,將之前沒有作為搜索詞使用過的術(shù)語作為備選的搜索詞。
可選地,在網(wǎng)址獲取步驟中,從下列網(wǎng)址中獲取用戶關注網(wǎng)址
瀏覽器中存儲的網(wǎng)頁瀏覽歷史;
瀏覽器的本地收藏夾中存儲的網(wǎng)頁的網(wǎng)址;和/或
用戶的網(wǎng)絡收藏夾中存儲的網(wǎng)頁的網(wǎng)址。
可選地,在網(wǎng)址獲取步驟中,排除與呈現(xiàn)搜索結(jié)果的網(wǎng)頁相對應的網(wǎng)址作為用戶關注網(wǎng)址。
在一個實施例中,網(wǎng)頁搜索方法還包括術(shù)語列表生成步驟,用于生成包含所提取的各術(shù)語的術(shù)語列表。
在一個實施例中,網(wǎng)頁搜索方法還包括術(shù)語更新步驟,用于判斷用戶關注網(wǎng)址是否有更新;如果有,則在術(shù)語提取步驟中,從與更新的用戶關注網(wǎng)址相對應的網(wǎng)頁中提取術(shù)語。
可選地,在搜索步驟中,在用戶輸入搜索詞時,根據(jù)用戶輸入的搜索詞向搜索引擎發(fā)出搜索請求,并向用戶返回搜索結(jié)果。
本發(fā)明可以在用戶未輸入搜索詞的情況下向搜索引擎提供推薦的搜索詞,以獲得用戶可能感興趣的搜索結(jié)果。這極大地提高了計算機的運行效率,并且改善了用戶的體驗和操作效率。
上述說明僅是本發(fā)明技術(shù)方案的概述,為了能夠更清楚了解本發(fā)明的技術(shù)手段, 而可依照說明書的內(nèi)容予以實施,并且為了讓本發(fā)明的上述和其它目的、特征和優(yōu)點能夠更明顯易懂,以下特舉本發(fā)明的具體實施方式
。
通過閱讀下文優(yōu)選實施方式的詳細描述,各種其他的優(yōu)點和益處對于本領域普通技術(shù)人員將變得清楚明了。附圖僅用于示出優(yōu)選實施方式的目的,而并不認為是對本發(fā)明的限制。而且在整個附圖中,用相同的參考符號表示相同的部件。在附圖中
圖I是按照本發(fā)明的網(wǎng)頁搜索設備的一個實施例的示意圖2是按照本發(fā)明的網(wǎng)頁搜索方法的一個實施例的流程圖。
具體實施方式
下面將參照附圖更詳細地描述本公開的示例性實施例。雖然附圖中顯示了本公開的示例性實施例,然而應當理解,可以以各種形式實現(xiàn)本公開而不應被這里闡述的實施例所限制。相反,提供這些實施例是為了能夠更透徹地理解本公開,并且能夠?qū)⒈竟_的范圍完整的傳達給本領域的技術(shù)人員。
圖I所示的網(wǎng)頁搜索設備100可以在計算機系統(tǒng)中實現(xiàn)。在一個實施例中,該網(wǎng)頁搜索設備100可以在計算機系統(tǒng)的瀏覽器客戶端處實現(xiàn)。如圖I所示,該網(wǎng)頁搜索設備 100可以包括網(wǎng)址獲取器102、術(shù)語提取器106、和搜索器112。另外,可選地,網(wǎng)頁搜索設備 100還可以包括術(shù)語更新器104、網(wǎng)頁權(quán)重生成器108和術(shù)語列表生成器110。
網(wǎng)址獲取器102可以配置成獲取瀏覽器處的一個或多個用戶關注網(wǎng)址。用戶關注網(wǎng)址可以來源于瀏覽器中存儲的網(wǎng)頁瀏覽歷史;瀏覽器的本地收藏夾中存儲的網(wǎng)頁的網(wǎng)址;和/或用戶的網(wǎng)絡收藏夾中存儲的網(wǎng)頁的網(wǎng)址。對于來自這些來源的用戶關注網(wǎng)址,用戶對其的瀏覽和/或收藏操作體現(xiàn)了用戶對該網(wǎng)址的關注。因此,用戶關注網(wǎng)址能夠至少部分地反映用戶對互聯(lián)網(wǎng)上的信息的關注點或者說興趣點。
術(shù)語提取器106可以配置成從由網(wǎng)址獲取器102所獲取的網(wǎng)頁中提取一個或多個術(shù)語或者說關鍵詞。在圖I的實施例中,該術(shù)語提取器106可以根據(jù)網(wǎng)址獲取器102所獲取的用戶關注網(wǎng)址從與用戶關注網(wǎng)址相對應的網(wǎng)頁中提取術(shù)語。
該術(shù)語提取器106最好還可以配置成能夠計算所提取的術(shù)語的重要度值,該重要度值可以用于標識所提取的術(shù)語在網(wǎng)頁中的重要度。在一個實施例中,術(shù)語提取器106可以米用現(xiàn)有技術(shù)中常用的基于 TF_IDF(term frequency-inverse document frequency,詞頻_反文檔頻率)的關鍵詞/術(shù)語提取方法來對每個網(wǎng)頁進行術(shù)語的提取。TF-IDF是一種用于信息檢索與文本挖掘的常用加權(quán)技術(shù)。TF-IDF作為一種統(tǒng)計方法,用以評估一術(shù)語對于一個文件集或一個語料庫中的其中一份文件的重要程度。TF-IDF的統(tǒng)計結(jié)果例如可以用一個key-value表來記錄,其中key是術(shù)語,value是該術(shù)語的TF與IDF的乘積,用來表示該術(shù)語的重要度值。然后可以按value值對該表進行排序,最后取重要度值排名靠前的幾個詞作為關鍵詞。這樣,術(shù)語提取器106可以對于每個用戶關注網(wǎng)址對應的網(wǎng)頁獲得一個 key-value 表。
可選地,術(shù)語提取器106還可以根據(jù)一個術(shù)語分別在各個對應網(wǎng)頁的重要度值以及各個對 應網(wǎng)頁的網(wǎng)頁權(quán)重值加權(quán)(例如加權(quán)求和)計算得到該術(shù)語在所有網(wǎng)頁中的重要度值,以反映該術(shù)語在所有用戶關注網(wǎng)址對應網(wǎng)頁中的重要性。為此,術(shù)語提取器106可以從網(wǎng)頁權(quán)重生成器108獲取相應網(wǎng)址的權(quán)重。
網(wǎng)頁權(quán)重生成器108中可以存儲有根據(jù)網(wǎng)頁瀏覽順序預先設定的網(wǎng)頁權(quán)重值。在一個實施例中,網(wǎng)頁權(quán)重值根據(jù)用戶瀏覽對應網(wǎng)頁的順序來確定,越新瀏覽的網(wǎng)頁的權(quán)重值越高。例如,可以選擇前5個網(wǎng)頁,每個網(wǎng)頁的權(quán)重為1、0. 6、0. 3、0. 2、0. 15,當然可以采用其他合適的權(quán)重分配。對于存儲在用戶的本地或網(wǎng)絡收藏夾中的網(wǎng)頁,可以作為一種具有特別瀏覽順序的網(wǎng)頁來處理,為其分配指定的權(quán)重,如O. 9、I或甚至更高如I. 2,等等。術(shù)語提取器106在計算加權(quán)的術(shù)語重要度值時,可以讀取網(wǎng)頁權(quán)重生成器108中的相應的網(wǎng)頁權(quán)重值。
可選地,術(shù)語列表生成器110可以配置成生成包含由術(shù)語提取器106所提取的各術(shù)語的術(shù)語列表,以供搜索器112選取。在一個實施例中,該術(shù)語列表生成器110可以將該術(shù)語提取器106提取的術(shù)語以及計算得到的加權(quán)的重要度值以術(shù)語列表的方式存儲??蛇x地,該術(shù)語列表以術(shù)語的重要度值進行排序,重要度值越大的術(shù)語的排列順序越靠前。
可選地,網(wǎng)頁搜索設備100還包括有術(shù)語更新器104。術(shù)語更新器104可以配置成更新用戶關注網(wǎng)址。當瀏覽器有新的網(wǎng)頁瀏覽操作或者網(wǎng)頁收藏操作時,網(wǎng)址獲取器102 中所獲取的用戶關注網(wǎng)址將會增加或者說更新。此時,術(shù)語更新器104會檢測這種更新,并僅將更新的用戶關注網(wǎng)址發(fā)送給術(shù)語提取器106,由術(shù)語提取器106從與更新的用戶關注網(wǎng)址相對應的網(wǎng)頁中提取術(shù)語。這樣可以避免術(shù)語提取器106每次都重新處理所有的用戶關注網(wǎng)址,以提聞計算機運行效率。
搜索器112可以配置成在用戶未輸入搜索詞時將術(shù)語提取器106所提取的術(shù)語中的至少一個術(shù)語作為搜索詞向搜索引擎200發(fā)出搜索請求,并向用戶返回搜索結(jié)果。這樣,當用戶未輸入搜索詞,但是卻通過敲擊鍵盤上的回車或者點擊搜索界面上的搜索圖標發(fā)出搜索請求時,搜索器112仍然可以獲得搜索結(jié)果。在圖I的實施例中,搜索器112可以從術(shù)語列表生成器110中基于術(shù)語的重要度值從高到低的順序選擇至少一個術(shù)語作為搜索詞。 當選擇多個術(shù)語作為搜索詞時,搜索器112可以以一定或預定的邏輯關系如“與”或“或”進行組合搜索。在一個實施例中,搜索器112可以將重要度值最高的術(shù)語選做搜索詞。
搜索器112最好還設置成當用戶未輸入搜索詞后對返回的搜索結(jié)果無瀏覽操作時,則在用戶后續(xù)未輸入搜索詞進行搜索時,將之前沒有作為搜索詞使用過的術(shù)語作為備選的搜索詞。這樣,當用戶進行一次未輸入搜索詞的搜索后,如果發(fā)現(xiàn)沒有其感興趣的網(wǎng)頁時,可以在不輸入搜索詞的情況下再次發(fā)送搜索請求,而搜索器112會從術(shù)語列表生成器 110中選擇新的術(shù)語作為搜索詞由搜索引擎200進行搜索。
顯然,搜索器112還可以設置成具有常規(guī)的搜索模式,即,當用戶輸入搜索詞時, 搜索器112根據(jù)用戶輸入的搜索詞向搜索引擎200發(fā)出搜索請求,并向用戶返回搜索結(jié)果。
需要注意的是,用戶通過搜索器112進行搜索操作后,不論是未輸入搜索詞還是有輸入搜索詞,搜索器112都會向用戶返回呈現(xiàn)搜索結(jié)果的網(wǎng)頁。這種呈現(xiàn)搜索結(jié)果的網(wǎng)頁的網(wǎng)址也會被存儲在瀏覽器的網(wǎng)頁瀏覽歷史中,但是這樣的網(wǎng)頁實際上并不能反映用戶關注點或興趣點(該網(wǎng)頁中列出的搜索結(jié)果有可能反映用戶的關注點或興趣點),因此,網(wǎng)址獲取器102最好配置成能夠排除這樣的網(wǎng)頁對應的網(wǎng)址作為用戶關注網(wǎng)址。
在其它實施例中,該網(wǎng)頁搜索設備100的各個組成部分在實現(xiàn)本發(fā)明基本功能的情況下可以進行各種拆分、組合或者省略。在一個示例性實施例中,術(shù)語提取器106僅獲取針對各個網(wǎng)頁的key-value表,各術(shù)語的加權(quán)的重要度值可以在術(shù)語列表生成器110中進行計算,并且由網(wǎng)頁權(quán)重生成器108向術(shù)語列表生成器110提供網(wǎng)頁權(quán)重值。在其它示例性實施例中,圖I中的網(wǎng)址獲取器102、術(shù)語更新器104、網(wǎng)頁權(quán)重生成器108和術(shù)語列表生成器110中的一個或多個可以與術(shù)語提取器106合并為新的術(shù)語提取器。在另一個實施例中,網(wǎng)址獲取器102每次僅獲取用戶最新瀏覽的網(wǎng)頁作為用戶關注網(wǎng)址,并由術(shù)語提取器 106提取術(shù)語,這樣就可以省略術(shù)語更新器104。
圖2示出了本發(fā)明的網(wǎng)頁搜索方法300的一個實施例的流程圖。圖2所示的網(wǎng)頁搜索方法300適于在下面結(jié)合圖I所示的網(wǎng)頁搜索設備100來描述本發(fā)明的網(wǎng)頁搜索方法 300中執(zhí)行。
該方法300可以始于網(wǎng)址獲取步驟S302。在該步驟S302中,可以獲取瀏覽器處的一個或多個用戶關注網(wǎng)址。如前所述,用戶關注網(wǎng)址可以來源于瀏覽器中存儲的網(wǎng)頁瀏覽歷史;瀏覽器的本地收藏夾中存儲的網(wǎng)頁的網(wǎng)址;和/或用戶的網(wǎng)絡收藏夾中存儲的網(wǎng)頁的網(wǎng)址。在步驟S302中,最好還排除與呈現(xiàn)搜索結(jié)果的網(wǎng)頁相對應的網(wǎng)址作為用戶關注網(wǎng)址。步驟S302可以由網(wǎng)址獲取器102來執(zhí)行。
隨后,該方法300進入術(shù)語提取步驟S306。在術(shù)語提取步驟S306中,可以從網(wǎng)頁中提取一個或多個術(shù)語。如果是該方法300首次運行,在術(shù)語提取步驟S306中會將在網(wǎng)址獲取步驟S302所獲取的所有用戶關注網(wǎng)址相對應的網(wǎng)頁進行術(shù)語提取,并在術(shù)語列表生成步驟S310生成術(shù)語列表。在該方法300的后續(xù)運行過程中,在術(shù)語提取步驟S306中可以僅對更新的用戶關注網(wǎng)址進行術(shù)語提取,并相應地更新術(shù)語列表。如前所述,在進行術(shù)語提取時,可以獲得首先獲得各網(wǎng)頁的key-value表,以得到各網(wǎng)頁的術(shù)語及術(shù)語在對應網(wǎng)頁中的重要度值;然后,可以根據(jù)各網(wǎng)頁的網(wǎng)頁權(quán)重值,獲得術(shù)語在所有網(wǎng)頁中的加權(quán)的重要度值。如前所述,網(wǎng)頁權(quán)重值可以根據(jù)用戶瀏覽所述對應網(wǎng)頁的順序來確定,越新瀏覽的網(wǎng)頁的權(quán)重值越高。這可以在本方法執(zhí)行前根據(jù)網(wǎng)頁瀏覽順序預先設定??蛇x地,步驟S306 可以由術(shù)語提取器106來執(zhí)行。
隨后,可選地,該方法300可以包括術(shù)語列表生成步驟S310。在術(shù)語列表生成步驟S310中,可以生成包含所提取的各術(shù)語的術(shù)語列表??蛇x地,該術(shù)語列表以術(shù)語的重要度值進行排序,重要度值越大的術(shù)語的排列順序越靠前。可選地,步驟S310可以由術(shù)語列表生成器Iio來執(zhí)行。
隨后,該方法300進入搜索步驟S312。在搜索步驟S312中,可以在用戶未輸入搜索詞時將術(shù)語列表中的至少一個術(shù)語作為搜索詞向搜索引擎發(fā)出搜索請求,并向用戶返回搜索結(jié)果??梢曰谛g(shù)語的重要度值來選擇至少一個術(shù)語作為搜索詞??蛇x地,可以將重要度值最高的術(shù)語選做搜索詞。這樣就可以實現(xiàn)用戶未輸入搜索詞時的搜索操作。當用戶未輸入搜索詞后對返回的搜索結(jié)果無瀏覽操作時,則在用戶后續(xù)未輸入搜索詞進行搜索時,可以將之前沒有作為搜索詞使用過的術(shù)語作為備選的搜索詞。在用戶輸入搜索詞時,可以根據(jù)用戶輸入的搜索詞向搜索引擎發(fā)出搜索請求,并向用戶返回搜索結(jié)果??蛇x地,步驟 S312可以由搜索器112來執(zhí)行。
可選地,在方法300中,還可以包括術(shù)語更新步驟S304。在術(shù)語更新步驟S304中, 可以判斷網(wǎng)址獲取步驟S302所獲取的用戶關注網(wǎng)址相比于之前所獲得的結(jié)果是否有更新,從而決定是否需要進行術(shù)語更新。如果用戶關注網(wǎng)址沒有更新,則不進行術(shù)語更新,返回到步驟S302,并保持之前獲得的術(shù)語列表。如果用戶關注網(wǎng)址有更新,則進行術(shù)語更新, 并僅針對更新的用戶關注網(wǎng)址進行術(shù)語提取步驟S306??蛇x地,步驟S304可以由術(shù)語更新器104來執(zhí)行。應當理解,圖2所示的網(wǎng)頁搜索方法300也可以由不同于圖I所示的設備來實現(xiàn)。還應當理解,在本發(fā)明的網(wǎng)頁搜索方法的其它實施例中,一個或多個步驟可以被省略、重復和/或以不同的順序執(zhí)行。因此,圖2中所示的步驟的特定排列不應當被解釋為對技術(shù)范圍的限制。
本發(fā)明的各個部件實施例可以以硬件實現(xiàn),或者以在一個或者多個處理器上運行的軟件模塊實現(xiàn),或者以它們的組合實現(xiàn)。本領域的技術(shù)人員應當理解,可以在實踐中使用微處理器或者數(shù)字信號處理器(DSP )來實現(xiàn)根據(jù)本發(fā)明實施例的網(wǎng)頁搜索設備中的一些或者全部部件的一些或者全部功能。本發(fā)明還可以實現(xiàn)為用于執(zhí)行這里所描述的方法的一部分或者全部的設備或者裝置程序(例如,計算機程序和計算機程序產(chǎn)品)。這樣的實現(xiàn)本發(fā)明的程序可以存儲在計算機可讀介質(zhì)上,或者可以具有一個或者多個信號的形式。這樣的信號可以從因特網(wǎng)網(wǎng)站上下載得到,或者在載體信號上提供,或者以任何其他形式提供。
上述本發(fā)明實施例中的方法和設備適用于各種網(wǎng)絡或者客戶端環(huán)境中,例如可以實現(xiàn)在諸如個人計算機設備之類的計算機設備中,或者可以實現(xiàn)在諸如移動電話、移動通信設備、個人數(shù)字助理(PDA)等其他便攜式電子設備或者非便攜式電子設備中。因此本領域技術(shù)人員要明確的是,本發(fā)明的保護范圍并不限于PC上運行瀏覽器中的網(wǎng)頁搜索功能, 僅是出于描述的簡潔和方便而在本發(fā)明實施例中采用了 PC上運行瀏覽器中的網(wǎng)頁搜索功能進行描述。
以上實施例僅用于說明本發(fā)明的技術(shù)方案,并不用于限制本發(fā)明的保護范圍。在不脫離本發(fā)明權(quán)利要求的精神和范圍的情況下,本領域技術(shù)人員可以對本發(fā)明的技術(shù)方案進行各種修改或者變型。
權(quán)利要求
1.一種網(wǎng)頁搜索設備,包括術(shù)語提取器,其配置成從網(wǎng)頁中提取一個或多個術(shù)語;搜索器,其配置成在用戶未輸入搜索詞時將所述一個或者多個術(shù)語中的至少一個術(shù)語作為搜索詞向搜索引擎發(fā)出搜索請求,并向用戶返回搜索結(jié)果。
2.根據(jù)權(quán)利要求I所述的網(wǎng)頁搜索設備,還包括網(wǎng)址獲取器,其配置成獲取瀏覽器處的一個或多個用戶關注網(wǎng)址;其中,所述術(shù)語提取器從與所述一個或多個用戶關注網(wǎng)址相對應的網(wǎng)頁中提取所述術(shù)語。
3.根據(jù)權(quán)利要求I或2所述的網(wǎng)頁搜索設備,其特征在于,所述術(shù)語提取器還配置成計算所述一個或多個術(shù)語的重要度值,所述重要度值用于標識所述術(shù)語在所述網(wǎng)頁中的重要度。
4.根據(jù)權(quán)利要求3所述的網(wǎng)頁搜索設備,其特征在于,所述術(shù)語的重要度值根據(jù)所述術(shù)語分別在各個對應網(wǎng)頁的重要度值以及各個對應網(wǎng)頁的網(wǎng)頁權(quán)重值加權(quán)計算得到。
5.根據(jù)權(quán)利要求4所述的網(wǎng)頁搜索設備,其特征在于,所述網(wǎng)頁權(quán)重值根據(jù)用戶瀏覽所述對應網(wǎng)頁的順序來確定,越新瀏覽的網(wǎng)頁的權(quán)重值越高。
6.根據(jù)權(quán)利要求4或5所述的網(wǎng)頁搜索設備,其特征在于,還包括網(wǎng)頁權(quán)重生成器,其配置成存儲根據(jù)瀏覽順序預先設定的網(wǎng)頁權(quán)重值。
7.根據(jù)權(quán)利要求3-6中任一項所述的網(wǎng)頁搜索設備,其特征在于,所述搜索器設置成基于術(shù)語的重要度值選擇至少一個術(shù)語作為搜索詞。
8.根據(jù)權(quán)利要求7所述的網(wǎng)頁搜索設備,其特征在于,所述搜索器設置成將重要度值最高的術(shù)語選做搜索詞。
9.根據(jù)權(quán)利要求1-8中任一項所述的網(wǎng)頁搜索設備,其特征在于,所述搜索器設置成 當用戶未輸入搜索詞后對返回的搜索結(jié)果無瀏覽操作時,則在用戶后續(xù)未輸入搜索詞進行搜索時,將之前沒有作為搜索詞使用過的術(shù)語作為備選的搜索詞。
10.根據(jù)權(quán)利要求2所述的網(wǎng)頁搜索設備,其特征在于,所述網(wǎng)址獲取器配置成從下列網(wǎng)址中獲取用戶關注網(wǎng)址所述瀏覽器中存儲的網(wǎng)頁瀏覽歷史;所述瀏覽器的本地收藏夾中存儲的網(wǎng)頁的網(wǎng)址;和/或用戶的網(wǎng)絡收藏夾中存儲的網(wǎng)頁的網(wǎng)址。
11.根據(jù)權(quán)利要求2或10所述的網(wǎng)頁搜索設備,其特征在于,所述網(wǎng)址獲取器配置成排除與呈現(xiàn)搜索結(jié)果的網(wǎng)頁相對應的網(wǎng)址作為用戶關注網(wǎng)址。
12.如權(quán)利要求I所述的網(wǎng)頁搜索設備,其特征在于,還包括術(shù)語列表生成器,其配置成生成包含所提取的各術(shù)語的術(shù)語列表。
13.根據(jù)權(quán)利要求2-12中任一項所述的網(wǎng)頁搜索設備,其特征在于,還包括術(shù)語更新器,其配置成更新所述用戶關注網(wǎng)址;以及所述術(shù)語提取器從與更新的用戶關注網(wǎng)址相對應的網(wǎng)頁中提取所述術(shù)語。
14.根據(jù)權(quán)利要求I所述的網(wǎng)頁搜索設備,其特征在于,所述搜索器配置成在用戶輸入搜索詞時,根據(jù)用戶輸入的搜索詞向搜索引擎發(fā)出搜索請求,并向用戶返回搜索結(jié)果。
15.一種網(wǎng)頁搜索方法,包括術(shù)語提取步驟,用于從網(wǎng)頁中提取一個或多個術(shù)語;搜索步驟,用于在用戶未輸入搜索詞時將所述一個或者多個術(shù)語中的至少一個術(shù)語作為搜索詞向搜索引擎發(fā)出搜索請求,并向用戶返回搜索結(jié)果。
16.根據(jù)權(quán)利要求14所述的網(wǎng)頁搜索方法,還包括網(wǎng)址獲取步驟,用于獲取瀏覽器處的一個或多個用戶關注網(wǎng)址;其中,在所述術(shù)語提取步驟中,從與所述一個或多個用戶關注網(wǎng)址相對應的網(wǎng)頁中提取所述術(shù)語。
17.根據(jù)權(quán)利要求15或16所述的網(wǎng)頁搜索方法,其特征在于,在所述術(shù)語提取步驟中還計算所述一個或多個術(shù)語的重要度值,所述重要度值用于標識所述術(shù)語在所述網(wǎng)頁中的重要度。
18.根據(jù)權(quán)利要求17所述的網(wǎng)頁搜索方法,其特征在于,所述術(shù)語的重要度值根據(jù)所述術(shù)語分別在各個對應網(wǎng)頁的重要度值以及各個對應網(wǎng)頁的網(wǎng)頁權(quán)重值加權(quán)計算得到。
19.根據(jù)權(quán)利要求18所述的網(wǎng)頁搜索方法,其特征在于,所述網(wǎng)頁權(quán)重值根據(jù)用戶瀏覽所述對應網(wǎng)頁的順序來確定,越新瀏覽的網(wǎng)頁的權(quán)重值越高。
20.根據(jù)權(quán)利要求18或19所述的網(wǎng)頁搜索方法,其特征在于,還包括網(wǎng)頁權(quán)重生成步驟,用于根據(jù)瀏覽順序預先設定網(wǎng)頁權(quán)重值。
21.根據(jù)權(quán)利要求17-20中任一項所述的網(wǎng)頁搜索方法,其特征在于,在所述搜索步驟中,基于術(shù)語的重要度值選擇至少一個術(shù)語作為搜索詞。
22.根據(jù)權(quán)利要求21所述的網(wǎng)頁搜索方法,其特征在于,在所述搜索步驟中,將重要度值最高的術(shù)語選做搜索詞。
23.根據(jù)權(quán)利要求15-22中任一項所述的網(wǎng)頁搜索方法,其特征在于,在所述搜索步驟中,當用戶未輸入搜索詞后對返回的搜索結(jié)果無瀏覽操作時,則在用戶后續(xù)未輸入搜索詞進行搜索時,將之前沒有作為搜索詞使用過的術(shù)語作為備選的搜索詞。
24.根據(jù)權(quán)利要求16所述的網(wǎng)頁搜索方法,其特征在于,在所述網(wǎng)址獲取步驟中,從下列網(wǎng)址中獲取用戶關注網(wǎng)址所述瀏覽器中存儲的網(wǎng)頁瀏覽歷史;所述瀏覽器的本地收藏夾中存儲的網(wǎng)頁的網(wǎng)址;和/或用戶的網(wǎng)絡收藏夾中存儲的網(wǎng)頁的網(wǎng)址。
25.根據(jù)權(quán)利要求16或24所述的網(wǎng)頁搜索方法,其特征在于,在所述網(wǎng)址獲取步驟中, 排除與呈現(xiàn)搜索結(jié)果的網(wǎng)頁相對應的網(wǎng)址作為用戶關注網(wǎng)址。
26.如權(quán)利要求15所述的網(wǎng)頁搜索方法,其特征在于,還包括術(shù)語列表生成步驟,用于生成包含所提取的各術(shù)語的術(shù)語列表。
27.根據(jù)權(quán)利要求16-26中任一項所述的網(wǎng)頁搜索方法,其特征在于,還包括術(shù)語更新步驟,用于判斷所述用戶關注網(wǎng)址是否有更新;如果有,則在所述術(shù)語提取步驟中,從與更新的用戶關注網(wǎng)址相對應的網(wǎng)頁中提取所述術(shù)語。
28.根據(jù)權(quán)利要求I所述的網(wǎng)頁搜索方法,其特征在于,在所述搜索步驟中,在用戶輸入搜索詞時,根據(jù)用戶輸入的搜索詞向搜索引擎發(fā)出搜索請求,并向用戶返回搜索結(jié)果。
全文摘要
本發(fā)明公開了一種網(wǎng)頁搜索設備和方法,其從網(wǎng)頁中提取一個或多個術(shù)語,并在用戶未輸入搜索詞時將所述一個或者多個術(shù)語中的至少一個術(shù)語作為搜索詞向搜索引擎發(fā)出搜索請求,并向用戶返回搜索結(jié)果。本發(fā)明可以在用戶未輸入搜索詞的情況下向搜索引擎提供推薦的搜索詞,以獲得用戶可能感興趣的搜索結(jié)果。這極大地提高了計算機的運行效率,并且改善了用戶的體驗和操作效率。
文檔編號G06F17/30GK102937975SQ201210395010
公開日2013年2月20日 申請日期2012年10月17日 優(yōu)先權(quán)日2012年10月17日
發(fā)明者張棟 申請人:北京奇虎科技有限公司