技術編號:6353155
提示:您尚未登錄,請點 登 陸 后下載,如果您還沒有賬戶請點 注 冊 ,登陸完成后,請刷新本頁查看技術詳細信息。本發(fā)明涉及的是一種網(wǎng)絡數(shù)據(jù)采集系統(tǒng)中爬蟲部分的構建方法,主要涉及主題網(wǎng) 絡爬蟲系統(tǒng)的構建方法。背景技術隨著信息時代的來臨和網(wǎng)絡的迅速發(fā)展,網(wǎng)絡上的信息量呈幾何級數(shù)增長。面對 網(wǎng)絡上海量的信息,用戶通常利用搜索引擎來定位自己需要的網(wǎng)絡數(shù)據(jù)。目前主流的搜索 引擎基本都是綜合性搜索引擎。因為綜合搜索引擎的爬蟲并不針對特定內(nèi)容進行專門爬 取,所以用戶使用綜合搜索引擎檢索出來的結果往往有很多與需求不相關或者相關度很 小,用戶需要瀏覽很多網(wǎng)頁的內(nèi)容才能獲取到有用的信息...
注意:該技術已申請專利,請尊重研發(fā)人員的辛勤研發(fā)付出,在未取得專利權人授權前,僅供技術研究參考不得用于商業(yè)用途。
該專利適合技術人員進行技術研發(fā)參考以及查看自身技術是否侵權,增加技術思路,做技術知識儲備,不適合論文引用。
請注意,此類技術沒有源代碼,用于學習研究技術思路。