技術編號:40545315
提示:您尚未登錄,請點 登 陸 后下載,如果您還沒有賬戶請點 注 冊 ,登陸完成后,請刷新本頁查看技術詳細信息。本申請涉及數(shù)據(jù)處理,具體涉及一種網(wǎng)站社區(qū)獲取方法、裝置、電子設備以及計算機可讀存儲介質(zhì)。背景技術、網(wǎng)站社區(qū)是指具有相同屬性的網(wǎng)站集合。在現(xiàn)有的網(wǎng)站社區(qū)獲取方案中,主要從網(wǎng)頁的html(hyper?text?markup?language,超文本標記語言)文件中提取出dom(documentobject?model,文檔對象模型)結(jié)構,通過dom結(jié)構之間的相似度匹配來進行網(wǎng)站社區(qū)發(fā)現(xiàn)。這種方案具有簡單快捷的優(yōu)點,對于靜態(tài)網(wǎng)站非常有效,但是也非常容易受到對抗,例如很多網(wǎng)站是通過動態(tài)嵌入網(wǎng)站來實現(xiàn)最...
注意:該技術已申請專利,請尊重研發(fā)人員的辛勤研發(fā)付出,在未取得專利權人授權前,僅供技術研究參考不得用于商業(yè)用途。
該專利適合技術人員進行技術研發(fā)參考以及查看自身技術是否侵權,增加技術思路,做技術知識儲備,不適合論文引用。
請注意,此類技術沒有源代碼,用于學習研究技術思路。