技術(shù)總結(jié)
本發(fā)明公開了一種爬取電商網(wǎng)站關(guān)鍵詞品類信息的方法及裝置,涉及互聯(lián)網(wǎng)技術(shù)領(lǐng)域,主要目的在于提高爬取電商網(wǎng)站關(guān)鍵詞品類信息的效率。本發(fā)明的主要技術(shù)方案為:根據(jù)電商網(wǎng)站信息、爬取品類信息的關(guān)鍵詞構(gòu)造電商網(wǎng)站的搜索URL;訪問構(gòu)造的電商網(wǎng)站的搜索URL,獲取所述URL對應(yīng)的網(wǎng)頁的頁面信息;對所述網(wǎng)頁的頁面信息進(jìn)行解析,提取出所述頁面中描述電商網(wǎng)站關(guān)鍵詞品類的信息,得到電商網(wǎng)站關(guān)鍵詞品類信息。本發(fā)明主要用于爬取電商網(wǎng)站關(guān)鍵詞品類信息的過程中。
技術(shù)研發(fā)人員:郭秦龍
受保護(hù)的技術(shù)使用者:北京國雙科技有限公司
文檔號碼:201510719610
技術(shù)研發(fā)日:2015.10.29
技術(shù)公布日:2017.05.10