技術(shù)編號:12271337
提示:您尚未登錄,請點 登 陸 后下載,如果您還沒有賬戶請點 注 冊 ,登陸完成后,請刷新本頁查看技術(shù)詳細信息。本發(fā)明涉及一種個性化的分布式數(shù)據(jù)抽取系統(tǒng),可以用于對互聯(lián)網(wǎng)上網(wǎng)站進行個性化挖掘。背景技術(shù)MicrosoftOffice系列已經(jīng)成為大眾通用的產(chǎn)品,用戶對其有著良好的用戶體驗,同時html文件格式成為所有網(wǎng)絡(luò)瀏覽器接受的格式,Java語言作為一種普遍的網(wǎng)絡(luò)編程語言為大眾所接受,所以本系統(tǒng)融合了以上三種背景技術(shù),創(chuàng)造出了該個性化的數(shù)據(jù)挖掘系統(tǒng)。發(fā)明內(nèi)容本發(fā)明包括五個模塊:中央控制模塊,目標(biāo)網(wǎng)站名單讀取模塊,結(jié)果文件生成模塊,目標(biāo)網(wǎng)站抽取并寫入結(jié)果文件模塊,數(shù)據(jù)清洗模塊。中央控制模塊,該模塊主要是生成...
注意:該技術(shù)已申請專利,請尊重研發(fā)人員的辛勤研發(fā)付出,在未取得專利權(quán)人授權(quán)前,僅供技術(shù)研究參考不得用于商業(yè)用途。
該專利適合技術(shù)人員進行技術(shù)研發(fā)參考以及查看自身技術(shù)是否侵權(quán),增加技術(shù)思路,做技術(shù)知識儲備,不適合論文引用。
請注意,此類技術(shù)沒有源代碼,用于學(xué)習(xí)研究技術(shù)思路。