技術(shù)總結(jié)
本發(fā)明公開了一種基于多維度特征的不良網(wǎng)站檢測方法。本方法為:1)對網(wǎng)站訓(xùn)練集中每一網(wǎng)站,獲取該網(wǎng)站的多維度特征數(shù)據(jù);該多維度特征數(shù)據(jù)包括網(wǎng)站在注冊層面的特征數(shù)據(jù)、解析層面的特征數(shù)據(jù)和內(nèi)容特征數(shù)據(jù);其中,該網(wǎng)站訓(xùn)練集包括一不良網(wǎng)站訓(xùn)練集和一健康網(wǎng)站訓(xùn)練集;2)基于步驟1)得到的多維度特征數(shù)據(jù)進(jìn)行模型訓(xùn)練,得到一檢測模型;3)對于一待識別網(wǎng)站,該檢測模型根據(jù)該網(wǎng)站的多維度特征數(shù)據(jù),判斷該網(wǎng)站是否為不良網(wǎng)站。本發(fā)明可以更廣泛的應(yīng)用于不良網(wǎng)站的檢測,在檢測不良網(wǎng)站時更加精準(zhǔn),同時減少漏檢、錯檢情況。
技術(shù)研發(fā)人員:李曉東;田雙柱;陳勇;延志偉
受保護(hù)的技術(shù)使用者:中國互聯(lián)網(wǎng)絡(luò)信息中心
文檔號碼:201610739289
技術(shù)研發(fā)日:2016.08.26
技術(shù)公布日:2017.01.25