技術編號:6622265
提示:您尚未登錄,請點 登 陸 后下載,如果您還沒有賬戶請點 注 冊 ,登陸完成后,請刷新本頁查看技術詳細信息。本發(fā)明公開了一種網(wǎng)絡搜索詞的聚類方法和聚類裝置,所述方法包括對相同URL的網(wǎng)絡搜索詞,根據(jù)URL抓取網(wǎng)頁相關內(nèi)容,生成短文本信息;對短文本信息提取關鍵詞,并根據(jù)關鍵詞獲取每條短文本信息對應的關鍵詞向量;判斷任兩個關鍵詞向量是否為相似的關鍵詞向量;當存在相似的兩個關鍵詞向量時,對相似的兩個關鍵詞向量進行合并,生成一個新的關鍵詞向量代替所述相似的兩個關鍵詞向量,并繼續(xù)判斷任兩個關鍵詞向量是否為相似的關鍵詞向量;當不存在相似的關鍵詞向量時,從互不相似的各關鍵詞向...
注意:該技術已申請專利,請尊重研發(fā)人員的辛勤研發(fā)付出,在未取得專利權人授權前,僅供技術研究參考不得用于商業(yè)用途。
該專利適合技術人員進行技術研發(fā)參考以及查看自身技術是否侵權,增加技術思路,做技術知識儲備,不適合論文引用。
請注意,此類技術沒有源代碼,用于學習研究技術思路。