專利名稱:個性化網(wǎng)址導航方法和裝置的制作方法
技術(shù)領域:
本發(fā)明涉及瀏覽器技術(shù)領域,具體涉及個性化網(wǎng)址導航方法和裝置。
背景技術(shù):
隨著計算機技術(shù)的發(fā)展和互聯(lián)網(wǎng)用戶規(guī)模的不斷擴大,越來越多的互聯(lián)網(wǎng)用戶使用個人計算機通過互聯(lián)網(wǎng)獲得各種各樣所需的信息。同時,為互聯(lián)網(wǎng)用戶提供信息服務的網(wǎng)站也越來越多,互聯(lián)網(wǎng)網(wǎng)頁的數(shù)量每天都在以驚人的速度增長,互聯(lián)網(wǎng)信息呈現(xiàn)出爆發(fā)式的增長。對于用戶來說,經(jīng)常需要通過一定的手段,才能在浩如煙海的互聯(lián)網(wǎng)信息中迅速定位最適合自己需求的網(wǎng)站或者需要的信息,比如通過網(wǎng)址導航服務。網(wǎng)址導航是一個集合較多網(wǎng)址,并按一定條件進行分類的一種網(wǎng)址站,主要為用戶提供網(wǎng)址導航服務。網(wǎng)址導航可以使用戶不用記憶網(wǎng)站的網(wǎng)址,就能通過網(wǎng)址導航頁面提供的鏈接方便找到自己需要的網(wǎng)站進行瀏覽和信息檢索。同時,現(xiàn)有的網(wǎng)址導航有的還提供了一些比較實用的功能,如號碼查詢、郵箱登陸、熱點新聞、搜索引擎入口等,在一定程度上也為用戶的互聯(lián)網(wǎng)沖浪提供了便利。據(jù)統(tǒng)計,目前有相當比例的互聯(lián)網(wǎng)用戶將瀏覽器的主頁設置為網(wǎng)址導航頁面,從一個側(cè)面也說明了網(wǎng)址導航服務在實際應用中確實有著方便用戶瀏覽的作用,從而受到了許多用戶的歡迎。然而,在現(xiàn)有的網(wǎng)址導航服務技術(shù)中,導航內(nèi)容頁面大多是由網(wǎng)址導航產(chǎn)品的運營維護人員人工推薦的靜態(tài)頁面,雖然頁面內(nèi)容內(nèi)的導航網(wǎng)址可能涉及到許多門類,但相對于互聯(lián)網(wǎng)上數(shù)量巨大并且高速增長的信息量,網(wǎng)址導航內(nèi)容往往不能夠適應互聯(lián)網(wǎng)用戶的瀏覽需求。
發(fā)明內(nèi)容
鑒于上述問題,提出了本發(fā)明以便提供一種克服上述問題或者至少部分地解決上述問題的個性化網(wǎng)址導航方法和相應的裝置。依據(jù)本發(fā)明的一個方面,提供了一種個性化網(wǎng)址導航方法,包括獲取多臺基于客戶端設備的訪問事件的群體歷史行為數(shù)據(jù);根據(jù)所述群體歷史行為數(shù)據(jù)建立客戶端設備訪問方的群體興趣模型,所述興趣模型中保存有體現(xiàn)客戶端設備訪問方群體訪問興趣點的類別信息;根據(jù)單個客戶端設備的個體歷史行為數(shù)據(jù)以及所述群體興趣模型,建立客戶端設備訪問方的個體興趣模型,所述個體興趣模型中保存有體現(xiàn)客戶端設備訪問方個體訪問興趣點的類別信息;根據(jù)所述個體興趣模型確定在網(wǎng)址導航頁面中顯示的網(wǎng)址類別。可選地,所述根據(jù)單個客戶端設備的個體歷史行為數(shù)據(jù)以及所述群體興趣模型,建立客戶端設備訪問方的個體興趣模型,包括從所述個體歷史行為數(shù)據(jù)中提取特征詞;根據(jù)所述群體興趣模型中保存的類別信息,對各個特征詞進行分類,得到若干個特征類別;保存各個特征類別,得到所述個體興趣模型??蛇x地,所述個體興趣模型中還保存有各個特征類別的權(quán)重,所述權(quán)重用于體現(xiàn)客戶端設備訪問方個體對各個類別的感興趣程度,所述根據(jù)所述個體興趣模型確定在網(wǎng)址導航頁面中顯示的網(wǎng)址類別包括根據(jù)各個特征類別的權(quán)重對各個特征類別進行排序,根據(jù)排序結(jié)果確定在網(wǎng)址導航頁面中顯示的網(wǎng)址類別及排列順序。可選地,所述根據(jù)單個客戶端設備的個體歷史行為數(shù)據(jù)以及所述群體興趣模型,建立客戶端設備訪問方的個體興趣模型,包括從所述個體歷史行為數(shù)據(jù)中提取特征詞,并獲取各個特征詞在所述個體歷史行為數(shù)據(jù)中的出現(xiàn)頻度;根據(jù)所述群體興趣模型中保存的類別信息,對所述特征詞進行分類,得到若干個特征類別;根據(jù)各個特征類別中包含的各個特征詞的出現(xiàn)頻度,獲得各個特征類別的權(quán)重;保存各個特征類別以及對應的權(quán)重,得到所述個體興趣模型??蛇x地,所述群體興趣模型中的類別包括一級類別以及二級類別,每個一級類別下包括多個二級類別,并以二維矩陣的形式保存各個二級類別,其中,所述二維矩陣中的每一行對應每一一級類別下的各個二級類別,所述根據(jù)所述群體興趣模型中保存的類別信息,對所述特征詞進行分類,得到若干個特征類別包括根據(jù)所述群體興趣模型中保存的二級類別信息,對所述特征詞進行分類,得到若干個二級特征類別;所述保存各個特征類別以及對應的權(quán)重包括將各個二級特征類別的權(quán)重保存到所述二維矩陣對應的元素處;所述根據(jù)各個特征類別的權(quán)重對各個特征類別進行排序包括分別將所述二維矩陣中每一行的各個二級特征類別的權(quán)重相加,得到一級特征類別的權(quán)重;根據(jù)各個一級特征類別的權(quán)重對各個一級特征類別進行排序,并根據(jù)各個二級特征類別的權(quán)重,對各個二級特征類別進行排序。可選地,所述根據(jù)各個特征類別中包含的各個特征詞的出現(xiàn)頻度,獲得各個特征類別的權(quán)重包括分別對各個特征類別中包含的各個特征詞的出現(xiàn)頻度進行累加,得到各個特征類別的權(quán)重??蛇x地,所述根據(jù)各個特征類別中包含的各個特征詞的出現(xiàn)頻度,獲得各個特征類別的權(quán)重包括根據(jù)搜索引擎服務器統(tǒng)計的特征詞熱點信息,獲取各個特征詞的熱點程度信息;根據(jù)各個特征詞的出現(xiàn)頻度以及所述熱點程度信息計算各個特征詞的綜合頻度
信息;分別對各個特征類別中包含的各個特征詞的綜合頻度信息進行累加,得到各個特征類別的權(quán)重。
可選地,所述根據(jù)各個特征詞的出現(xiàn)頻度以及所述熱點程度信息計算各個特征詞的綜合頻度信息包括
將特征詞的熱點程度信息乘以一加權(quán)系數(shù),并與所述出現(xiàn)頻度進行相加,得到特征詞的綜合頻度信息;其中,所述加權(quán)系數(shù)小于I。
可選地,所述根據(jù)所述群體歷史行為數(shù)據(jù)建立客戶端設備訪問方的群體興趣模型包括
從所述群體歷史行為數(shù)據(jù)中提取特征詞;
對所述從所述群體歷史行為數(shù)據(jù)中提取的特征詞進行聚類,獲得多個類別標簽, 保存所述多個類別標簽,得到所述群體興趣模型。
可選地,所述對所述特征詞進行聚類,獲得多個類別標簽包括
對所述從所述群體歷史行為數(shù)據(jù)中提取的特征詞進行歸一化處理;
對歸一化處理后的特征詞進行聚類,獲得多個類別標簽。
根據(jù)本發(fā)明的另一方面,提供了一種個性化網(wǎng)址導航裝置,包括
數(shù)據(jù)獲取單元,用于獲取多臺基于客戶端設備的訪問事件的群體歷史行為數(shù)據(jù);
群體興趣模型建立單元,用于根據(jù)所述群體歷史行為數(shù)據(jù)建立客戶端設備訪問方的群體興趣模型,所述興趣模型中保存有體現(xiàn)客戶端設備訪問方群體訪問興趣點的類別信
個體興趣模型建立單元,用于根據(jù)單個客戶端設備的個體歷史行為數(shù)據(jù)以及所述群體興趣模型,建立客戶端設備訪問方的個體興趣模型,所述個體興趣模型中保存有體現(xiàn)客戶端設備訪問方個體訪問興趣點的類別信息;
類別確定單元,用于根據(jù)所述個體興趣模型確定在網(wǎng)址導航頁面中顯示的網(wǎng)址類別。
可選地,所述個體興趣模型建立單元包括
第一特征詞提取子單元,用于從所述個體歷史行為數(shù)據(jù)中提取特征詞;
第一分類子單元,用于根據(jù)所述群體興趣模型中保存的類別信息,對各個特征詞進行分類,得到若干個特征類別;
第一保存子單元,用于保存各個特征類別,得到所述個體興趣模型。
可選地,所述個體興趣模型中還保存有各個特征類別的權(quán)重,所述權(quán)重用于體現(xiàn)客戶端設備訪問方個體對各個類別的感興趣程度,所述類別確定單元包括
排序子單元,用于根據(jù)各個特征類別的權(quán)重對各個特征類別進行排序,根據(jù)排序結(jié)果確定在網(wǎng)址導航頁面中顯示的網(wǎng)址類別及排列順序。
可選地,所述個體興趣模型建立單元包括
頻度獲取子單元,用于從所述個體歷史行為數(shù)據(jù)中提取特征詞,并獲取各個特征詞在所述個體歷史行為數(shù)據(jù)中的出現(xiàn)頻度;
第二分類子單元,用于根據(jù)所述群體興趣模型中保存的類別信息,對所述特征詞進行分類,得到若干個特征類別;
權(quán)重獲得子單元,用于根據(jù)各個特征類別中包含的各個特征詞的出現(xiàn)頻度,獲得各個特征類別的權(quán)重;
第二保存子單元,用于保存各個特征類別以及對應的權(quán)重,得到所述個體興趣模型??蛇x地,所述群體興趣模型中的類別包括一級類別以及二級類別,每個一級類別下包括多個二級類別,并以二維矩陣的形式保存各個二級類別,其中,所述二維矩陣中的每一行對應每一一級類別下的各個二級類別,所述第二分類子單元具體用于根據(jù)所述群體興趣模型中保存的二級類別信息,對所述特征詞進行分類,得到若干個二級特征類別;所述第二保存子單元具體用于將各個二級特征類別的權(quán)重保存到所述二維矩陣對應的元素處;所述排序子單元具體用于分別將所述二維矩陣中每一行的各個二級特征類別的權(quán)重相加,得到一級特征類別的權(quán)重;根據(jù)各個一級特征類別的權(quán)重對各個一級特征類別進行排序,并根據(jù)各個二級特征類別的權(quán)重,對各個二級特征類別進行排序。可選地,所述權(quán)重獲得子單元包括第一累加子單元,用于分別對各個特征類別中包含的各個特征詞的出現(xiàn)頻度進行累加,得到各個特征類別的權(quán)重??蛇x地,所述權(quán)重獲得子單元包括熱點信息獲取子單元,用于根據(jù)搜索引擎服務器統(tǒng)計的特征詞熱點信息,獲取各個特征詞的熱點程度信息;綜合頻度計算子單元,用于根據(jù)各個特征詞的出現(xiàn)頻度以及所述熱點程度信息計算各個特征詞的綜合頻度信息;第二累加子單元,用于分別對各個特征類別中包含的各個特征詞的綜合頻度信息進行累加,得到各個特征類別的權(quán)重。可選地,所述綜合頻度計算子單元具體用于將特征詞的熱點程度信息乘以一加權(quán)系數(shù),并與所述出現(xiàn)頻度進行相加,得到特征詞的綜合頻度信息;其中,所述加權(quán)系數(shù)小于I。可選地,所述群體興趣模型建立單元包括第二特征詞提取子單元,用于從所述群體歷史行為數(shù)據(jù)中提取特征詞;聚類子單元,用于對所述從所述群體歷史行為數(shù)據(jù)中提取的特征詞進行聚類,獲得多個類別標簽,保存所述多個類別標簽,得到所述群體興趣模型??蛇x地,所述聚類子單元具體用于對所述從所述群體歷史行為數(shù)據(jù)中提取的特征詞進行歸一化處理;對歸一化處理后的特征詞進行聚類,獲得多個類別標簽。根據(jù)本發(fā)明的個性化網(wǎng)址導航方法和裝置,可以通過對來自多個客戶端設備的群體歷史行為數(shù)據(jù)進行統(tǒng)計,建立起客戶端設備訪問方的群體興趣模型,由此統(tǒng)計出,客戶端設備訪問方群體感興趣的類別有哪些;然后基于群體興趣模型以及來自單個客戶端設備的個體歷史行為數(shù)據(jù),可以建立起客戶端設備訪問方的個體興趣模型,用以保存各個客戶端設備訪問方分別感興趣的類別有哪些,這樣,在需要為某客戶端設備訪問方提供導航網(wǎng)站頁面時,就可以根據(jù)該客戶端設備訪問方對應的個體興趣模型,來選擇在導航網(wǎng)站頁面中顯示哪些網(wǎng)站類別,由此體現(xiàn)出基于不同客戶端設備訪問方在導航網(wǎng)站頁面顯示上的個性化差異,更符合客戶端設備訪問方的瀏覽需求,從而使得導航網(wǎng)站頁面中提供的信息的利用率得到提高。
上述說明僅是本發(fā)明技術(shù)方案的概述,為了能夠更清楚了解本發(fā)明的技術(shù)手段, 而可依照說明書的內(nèi)容予以實施,并且為了讓本發(fā)明的上述和其它目的、特征和優(yōu)點能夠更明顯易懂,以下特舉本發(fā)明的具體實施方式
。
通過閱讀下文優(yōu)選實施方式的詳細描述,各種其他的優(yōu)點和益處對于本領域普通技術(shù)人員將變得清楚明了。附圖僅用于示出優(yōu)選實施方式的目的,而并不認為是對本發(fā)明的限制。而且在整個附圖中,用相同的參考符號表示相同的部件。在附圖中
圖I示出了根據(jù)本發(fā)明一個實施例的方法的流程圖2示出了根據(jù)本發(fā)明一個實施例的裝置的示意圖3示出了根據(jù)本發(fā)明一個實施例的系統(tǒng)的示意圖;以及
圖4示出了根據(jù)本發(fā)明一個實施例的網(wǎng)址導航頁面的示意圖。
具體實施方式
下面將參照附圖更詳細地描述本公開的示例性實施例。雖然附圖中顯示了本公開的示例性實施例,然而應當理解,可以以各種形式實現(xiàn)本公開而不應被這里闡述的實施例所限制。相反,提供這些實施例是為了能夠更透徹地理解本公開,并且能夠?qū)⒈竟_的范圍完整的傳達給本領域的技術(shù)人員。
參見圖1,本發(fā)明實施例提供的個性化網(wǎng)址導航方法包括以下步驟
SlOl :獲取多臺基于客戶端設備的訪問事件的群體歷史行為數(shù)據(jù);
每一個用戶可以對應一個客戶端設備,用戶作為客戶端設備的訪問方,可以是客戶端設備的登錄者或輸入者,每個客戶端設備的訪問方可以被分配以一個和客戶端設備的訪問方對應的唯一性標識,以對不同的客戶端設備訪問方進行區(qū)分。多臺基于客戶端設備的訪問事件的歷史數(shù)據(jù)可以包括但不限于多個客戶端設備訪問方使用瀏覽器、輸入法等軟件在客戶端設備上進行網(wǎng)頁瀏覽、搜索、輸入等訪問時所產(chǎn)生的歷史行為數(shù)據(jù),以及訪問過的客戶端設備上的文檔信息等,例如客戶端設備訪問方訪問的網(wǎng)頁對應的統(tǒng)一資源定位符 URL,客戶端設備訪問方進行搜索時輸入的關鍵詞,客戶端設備訪問方使用輸入法輸入的字詞等。
多臺基于客戶端設備的訪問事件的歷史行為數(shù)據(jù)可以通過多種方法獲取,例如, 可以通過有客戶端設備訪問方歷史行為數(shù)據(jù)收集功能的瀏覽器、有客戶端設備訪問方歷史行為數(shù)據(jù)收集功能的瀏覽器插件、有客戶端設備訪問方歷史行為數(shù)據(jù)收集功能的其他應用軟件等,在客戶端設備訪問方訪問網(wǎng)頁時,可以通過這些程序來對客戶端設備訪問方歷史行為數(shù)據(jù)進行收集,具體可以是在客戶端設備訪問方使用瀏覽器瀏覽網(wǎng)頁時,瀏覽器向服務器發(fā)起請求后,由上述的這些程序?qū)⒖蛻舳嗽O備訪問方的這些數(shù)據(jù)收集起來。此外,在用戶訪問網(wǎng)頁時,也可以由提供網(wǎng)頁的服務器來收集客戶端設備訪問方的歷史行為數(shù)據(jù),諸如客戶端設備訪問方在服務器提供的網(wǎng)頁上進行點擊、搜索、輸入等操作時產(chǎn)生的行為數(shù)據(jù)。在獲取到多臺基于客戶端設備的訪問事件的歷史行為數(shù)據(jù)后,還可以對這些歷史行為數(shù)據(jù)進行整理或統(tǒng)計操作,例如對重復的網(wǎng)址進行去重操作,對同一 URL的訪問次數(shù)進行統(tǒng)計等。S102:根據(jù)所述群體歷史行為數(shù)據(jù)建立客戶端設備訪問方的群體興趣模型,所述興趣模型中保存有體現(xiàn)客戶端設備訪問方群體訪問興趣點的類別信息;為了更充分的公開本步驟的具體實現(xiàn),首先介紹一下客戶端設備訪問方的群體興趣模型的相關技術(shù)特征??蛻舳嗽O備訪問方的群體興趣模型是體現(xiàn)客戶端設備訪問方群體的訪問興趣的 一種數(shù)據(jù)模型,其中可以包括用于體現(xiàn)客戶端設備訪問方群體訪問興趣點的類別信息??蛻舳嗽O備訪問方的群體興趣模型的表現(xiàn)形式可以是多樣的,本發(fā)明實施例對客戶端設備訪問方的群體興趣模型的表現(xiàn)形式?jīng)]有限制,例如可以用集合的形式表示客戶端設備訪問方的群體興趣模型,下面是一個用集合的形式表示的客戶端設備訪問方的群體興趣模型的示例{新聞,體育,科技,娛樂,汽車,視頻,......,房產(chǎn),旅游,音樂,時尚,軍事,教育}集合中的各個元素可以代表體現(xiàn)客戶端設備訪問方群體訪問興趣點的類別信息,例如其中的新聞、體育、科技等類別。為了方便使用計算機設備對客戶端設備訪問方的群體興趣模型進行表示和加工,還可以將上述的集合形式表示的客戶端設備訪問方的群體興趣模型抽象為數(shù)據(jù)集合來表達,如上述以集合形式表示的客戶端設備訪問方的群體興趣模型
可以抽象為{aQ,B1, a2, a3, a4, a5,......, at,......}。此集合中,每一個數(shù)據(jù)元素可以與
前述集合中的各個元素相對應,例如%對應前述集合中的新聞類別,而則對應前述集合中的體育類別,以此類推。在以數(shù)據(jù)集合的形式表示客戶端設備訪問方的群體興趣模型時,集合中的每個元素可以對應一個體現(xiàn)客戶端設備訪問方群體訪問興趣點的類別,同時,集合中的每一個元素還可以被賦予一定的數(shù)值,所述對集合中的元素賦值的過程,也可以看作是對客戶端設備訪問方的群體興趣模型進行量化的過程,而元素被賦予的數(shù)值,用以體現(xiàn)群體用戶對對應的類別的感興趣程度,可以根據(jù)多臺基于客戶端設備的訪問事件的歷史行為數(shù)據(jù)獲得??蛻舳嗽O備訪問方的群體興趣模型還可以以二維矩陣的形式來表示,由于二維矩陣,由于二維矩陣有行和列兩個維度,用二維矩陣來可以更加細化地表示客戶端設備訪問方的群體興趣模型,還可以利用行或列與位于其上的元素之間的關系來表現(xiàn)更加豐富的信息內(nèi)容,下面是一個用二維矩陣的形式表示的客戶端設備訪問方的群體興趣模型的示例
-足球籃球網(wǎng)球游泳_
基金股票期貨黃金 R&B嘻哈古典搖滾 _貓狗脒鼠蛇 這個二維矩陣中的行或列中的每個元素可以代表體現(xiàn)客戶端設備訪問方群體訪問興趣點的類別信息,例如其中的足球、股票、搖滾等類別,同時,每一行又可以歸屬一個更大的類別,如這個二維矩陣中的第一行可以歸類為體育類別,第二行可以歸類為財經(jīng)類別等。當然在實際使用中可以對上述的二維矩陣進行轉(zhuǎn)置,可見,轉(zhuǎn)置后每一列上的列元素可以歸屬一個更大的類別。為了方便使用計算機設備對客戶端設備訪問方的群體興趣模型進行表示和加工,同樣可以將二維矩陣形式表示的客戶端設備訪問方的群體興趣模型抽象為數(shù)據(jù)形式的二維矩陣,如
權(quán)利要求
1.ー種個性化網(wǎng)址導航方法,包括 獲取多臺基于客戶端設備的訪問事件的群體歷史行為數(shù)據(jù); 根據(jù)所述群體歷史行為數(shù)據(jù)建立客戶端設備訪問方的群體興趣模型,所述興趣模型中保存有體現(xiàn)客戶端設備訪問方群體訪問興趣點的類別信息; 根據(jù)單個客戶端設備的個體歷史行為數(shù)據(jù)以及所述群體興趣模型,建立客戶端設備訪問方的個體興趣模型,所述個體興趣模型中保存有體現(xiàn)客戶端設備訪問方個體訪問興趣點的類別信息; 根據(jù)所述個體興趣模型確定在網(wǎng)址導航頁面中顯示的網(wǎng)址類別。
2.如權(quán)利要求I所述的方法,所述根據(jù)單個客戶端設備的個體歷史行為數(shù)據(jù)以及所述群體興趣模型,建立客戶端設備訪問方的個體興趣模型,包括 從所述個體歷史行為數(shù)據(jù)中提取特征詞; 根據(jù)所述群體興趣模型中保存的類別信息,對各個特征詞進行分類,得到若干個特征類別; 保存各個特征類別,得到所述個體興趣模型。
3.如權(quán)利要求I所述的方法,所述個體興趣模型中還保存有各個特征類別的權(quán)重,所述權(quán)重用于體現(xiàn)客戶端設備訪問方個體對各個類別的感興趣程度,所述根據(jù)所述個體興趣模型確定在網(wǎng)址導航頁面中顯示的網(wǎng)址類別包括 根據(jù)各個特征類別的權(quán)重對各個特征類別進行排序,根據(jù)排序結(jié)果確定在網(wǎng)址導航頁面中顯示的網(wǎng)址類別及排列順序。
4.如權(quán)利要求3所述的方法,所述根據(jù)單個客戶端設備的個體歷史行為數(shù)據(jù)以及所述群體興趣模型,建立客戶端設備訪問方的個體興趣模型,包括 從所述個體歷史行為數(shù)據(jù)中提取特征詞,并獲取各個特征詞在所述個體歷史行為數(shù)據(jù)中的出現(xiàn)頻度; 根據(jù)所述群體興趣模型中保存的類別信息,對所述特征詞進行分類,得到若干個特征類別; 根據(jù)各個特征類別中包含的各個特征詞的出現(xiàn)頻度,獲得各個特征類別的權(quán)重; 保存各個特征類別以及對應的權(quán)重,得到所述個體興趣模型。
5.如權(quán)利要求4所述的方法,所述群體興趣模型中的類別包括ー級類別以及ニ級類另IJ,每個ー級類別下包括多個ニ級類別,并以ニ維矩陣的形式保存各個ニ級類別,其中,所述ニ維矩陣中的每一行對應每一一級類別下的各個ニ級類別,所述根據(jù)所述群體興趣模型中保存的類別信息,對所述特征詞進行分類,得到若干個特征類別包括 根據(jù)所述群體興趣模型中保存的ニ級類別信息,對所述特征詞進行分類,得到若干個ニ級特征類別; 所述保存各個特征類別以及對應的權(quán)重包括 將各個ニ級特征類別的權(quán)重保存到所述ニ維矩陣對應的元素處; 所述根據(jù)各個特征類別的權(quán)重對各個特征類別進行排序包括 分別將所述ニ維矩陣中每一行的各個ニ級特征類別的權(quán)重相加,得到一級特征類別的權(quán)重; 根據(jù)各個ー級特征類別的權(quán)重對各個ー級特征類別進行排序,并根據(jù)各個ニ級特征類別的權(quán)重,對各個ニ級特征類別進行排序。
6.如權(quán)利要求4所述的方法,所述根據(jù)各個特征類別中包含的各個特征詞的出現(xiàn)頻度,獲得各個特征類別的權(quán)重包括 分別對各個特征類別中包含的各個特征詞的出現(xiàn)頻度進行累加,得到各個特征類別的權(quán)重。
7.如權(quán)利要求4所述的方法,所述根據(jù)各個特征類別中包含的各個特征詞的出現(xiàn)頻度,獲得各個特征類別的權(quán)重包括 根據(jù)搜索引擎服務器統(tǒng)計的特征詞熱點信息,獲取各個特征詞的熱點程度信息; 根據(jù)各個特征詞的出現(xiàn)頻度以及所述熱點程度信息計算各個特征詞的綜合頻度信息; 分別對各個特征類別中包含的各個特征詞的綜合頻度信息進行累加,得到各個特征類別的權(quán)重。
8.如權(quán)利要求7所述的方法,所述根據(jù)各個特征詞的出現(xiàn)頻度以及所述熱點程度信息計算各個特征詞的綜合頻度信息包括 將特征詞的熱點程度信息乘以ー加權(quán)系數(shù),并與所述出現(xiàn)頻度進行相加,得到特征詞的綜合頻度信息;其中,所述加權(quán)系數(shù)小于I。
9.如權(quán)利要求I所述的方法,所述根據(jù)所述群體歷史行為數(shù)據(jù)建立客戶端設備訪問方的群體興趣模型包括 從所述群體歷史行為數(shù)據(jù)中提取特征詞; 對所述從所述群體歷史行為數(shù)據(jù)中提取的特征詞進行聚類,獲得多個類別標簽,保存所述多個類別標簽,得到所述群體興趣模型。
10.如權(quán)利要求9所述的方法,所述對所述特征詞進行聚類,獲得多個類別標簽包括 對所述從所述群體歷史行為數(shù)據(jù)中提取的特征詞進行歸一化處理; 對歸ー化處理后的特征詞進行聚類,獲得多個類別標簽。
11.ー種個性化網(wǎng)址導航裝置,包括 數(shù)據(jù)獲取単元,用于獲取多臺基于客戶端設備的訪問事件的群體歷史行為數(shù)據(jù);群體興趣模型建立単元,用于根據(jù)所述群體歷史行為數(shù)據(jù)建立客戶端設備訪問方的群體興趣模型,所述興趣模型中保存有體現(xiàn)客戶端設備訪問方群體訪問興趣點的類別信息;個體興趣模型建立単元,用于根據(jù)單個客戶端設備的個體歷史行為數(shù)據(jù)以及所述群體興趣模型,建立客戶端設備訪問方的個體興趣模型,所述個體興趣模型中保存有體現(xiàn)客戶端設備訪問方個體訪問興趣點的類別信息; 類別確定單元,用于根據(jù)所述個體興趣模型確定在網(wǎng)址導航頁面中顯示的網(wǎng)址類別。
12.如權(quán)利要求11所述的裝置,所述個體興趣模型建立単元包括 第一特征詞提取子単元,用于從所述個體歷史行為數(shù)據(jù)中提取特征詞; 第一分類子單元,用于根據(jù)所述群體興趣模型中保存的類別信息,對各個特征詞進行分類,得到若干個特征類別; 第一保存子単元,用于保存各個特征類別,得到所述個體興趣模型。
13.如權(quán)利要求11所述的裝置,所述個體興趣模型中還保存有各個特征類別的權(quán)重,所述權(quán)重用于體現(xiàn)客戶端設備訪問方個體對各個類別的感興趣程度,所述類別確定單元包括 排序子単元,用于根據(jù)各個特征類別的權(quán)重對各個特征類別進行排序,根據(jù)排序結(jié)果確定在網(wǎng)址導航頁面中顯示的網(wǎng)址類別及排列順序。
14.如權(quán)利要求13所述的裝置,所述個體興趣模型建立単元包括 頻度獲取子単元,用于從所述個體歷史行為數(shù)據(jù)中提取特征詞,并獲取各個特征詞在所述個體歷史行為數(shù)據(jù)中的出現(xiàn)頻度; 第二分類子單元,用于根據(jù)所述群體興趣模型中保存的類別信息,對所述特征詞進行分類,得到若干個特征類別; 權(quán)重獲得子単元,用于根據(jù)各個特征類別中包含的各個特征詞的出現(xiàn)頻度,獲得各個特征類別的權(quán)重; 第二保存子単元,用于保存各個特征類別以及對應的權(quán)重,得到所述個體興趣模型。
15.如權(quán)利要求14所述的裝置,所述群體興趣模型中的類別包括ー級類別以及ニ級類另IJ,每個ー級類別下包括多個ニ級類別,并以ニ維矩陣的形式保存各個ニ級類別,其中,所述ニ維矩陣中的每一行對應每一一級類別下的各個ニ級類別,所述第二分類子單元具體用于 根據(jù)所述群體興趣模型中保存的ニ級類別信息,對所述特征詞進行分類,得到若干個ニ級特征類別; 所述第二保存子単元具體用于 將各個ニ級特征類別的權(quán)重保存到所述ニ維矩陣對應的元素處; 所述排序子単元具體用于 分別將所述ニ維矩陣中每一行的各個ニ級特征類別的權(quán)重相加,得到一級特征類別的權(quán)重; 根據(jù)各個ー級特征類別的權(quán)重對各個ー級特征類別進行排序,并根據(jù)各個ニ級特征類別的權(quán)重,對各個ニ級特征類別進行排序。
16.如權(quán)利要求14所述的裝置,所述權(quán)重獲得子単元包括 第一累加子単元,用于分別對各個特征類別中包含的各個特征詞的出現(xiàn)頻度進行累カロ,得到各個特征類別的權(quán)重。
17.如權(quán)利要求14所述的裝置,所述權(quán)重獲得子単元包括 熱點信息獲取子単元,用于根據(jù)搜索引擎服務器統(tǒng)計的特征詞熱點信息,獲取各個特征詞的熱點程度信息; 綜合頻度計算子単元,用于根據(jù)各個特征詞的出現(xiàn)頻度以及所述熱點程度信息計算各個特征詞的綜合頻度信息; 第二累加子単元,用于分別對各個特征類別中包含的各個特征詞的綜合頻度信息進行累加,得到各個特征類別的權(quán)重。
18.如權(quán)利要求17所述的裝置,所述綜合頻度計算子單元具體用于 將特征詞的熱點程度信息乘以ー加權(quán)系數(shù),并與所述出現(xiàn)頻度進行相加,得到特征詞的綜合頻度信息;其中,所述加權(quán)系數(shù)小于I。
19.如權(quán)利要求11所述的裝置,所述群體興趣模型建立単元包括 第二特征詞提取子単元,用于從所述群體歷史行為數(shù)據(jù)中提取特征詞;聚類子単元,用于對所述從所述群體歷史行為數(shù)據(jù)中提取的特征詞進行聚類,獲得多個類別標簽,保存所述多個類別標簽,得到所述群體興趣模型。
20.如權(quán)利要求19所述的裝置,所述聚類子単元具體用于 對所述從所述群體歷史行為數(shù)據(jù)中提取的特征詞進行歸一化處理;對歸ー化處理后的特征詞進行聚類,獲得多個類別標簽。
全文摘要
本發(fā)明公開了個性化網(wǎng)址導航方法和裝置,其中,所述方法包括獲取多臺基于客戶端設備的訪問事件的群體歷史行為數(shù)據(jù);根據(jù)所述群體歷史行為數(shù)據(jù)建立客戶端設備訪問方的群體興趣模型,所述興趣模型中保存有體現(xiàn)客戶端設備訪問方群體訪問興趣點的類別信息;根據(jù)單個客戶端設備的個體歷史行為數(shù)據(jù)以及所述群體興趣模型,建立客戶端設備訪問方的個體興趣模型,所述個體興趣模型中保存有體現(xiàn)客戶端設備訪問方個體訪問興趣點的類別信息;根據(jù)所述個體興趣模型確定在網(wǎng)址導航頁面中顯示的網(wǎng)址類別。通過本發(fā)明,能夠更符合客戶端設備訪問方的瀏覽需求,從而使得導航網(wǎng)站頁面中提供的信息的利用率得到提高。
文檔編號G06F17/30GK102982079SQ20121042628
公開日2013年3月20日 申請日期2012年10月30日 優(yōu)先權(quán)日2012年10月30日
發(fā)明者周浩, 鄧夏瑋 申請人:北京奇虎科技有限公司, 奇智軟件(北京)有限公司