技術(shù)編號(hào):7918916
提示:您尚未登錄,請(qǐng)點(diǎn) 登 陸 后下載,如果您還沒(méi)有賬戶請(qǐng)點(diǎn) 注 冊(cè) ,登陸完成后,請(qǐng)刷新本頁(yè)查看技術(shù)詳細(xì)信息。技術(shù)領(lǐng)域本發(fā)明屬于計(jì)算機(jī)技術(shù)領(lǐng)域,尤其涉及一種個(gè)性化定向采集系統(tǒng)。 背景技術(shù)定向采集系統(tǒng)是網(wǎng)絡(luò)蜘蛛的一種,它是網(wǎng)絡(luò)數(shù)據(jù)獲取系統(tǒng)的核心部分。它通過(guò)對(duì)互聯(lián)網(wǎng)上已知信息源(即網(wǎng)絡(luò)鏈接,URL Universal Resource Locator)的不斷抓取海量網(wǎng)頁(yè)內(nèi)容,獲取其中所有主題相關(guān)內(nèi)容。定向采集系統(tǒng)的優(yōu)劣集中體現(xiàn)在其抓取網(wǎng)頁(yè)內(nèi)容的速度、質(zhì)量以及抓取內(nèi)容和采集主題的匹配程度。目前,絕大多數(shù)的網(wǎng)絡(luò)蜘蛛都是單機(jī)版的,對(duì)于信息源和采集主題的管理相對(duì)比較簡(jiǎn)單,通常是由管理員在服務(wù)器端進(jìn)行簡(jiǎn)單配置,配置好后所有用戶均在此配置...
注意:該技術(shù)已申請(qǐng)專利,請(qǐng)尊重研發(fā)人員的辛勤研發(fā)付出,在未取得專利權(quán)人授權(quán)前,僅供技術(shù)研究參考不得用于商業(yè)用途。
該專利適合技術(shù)人員進(jìn)行技術(shù)研發(fā)參考以及查看自身技術(shù)是否侵權(quán),增加技術(shù)思路,做技術(shù)知識(shí)儲(chǔ)備,不適合論文引用。