技術(shù)特征:
技術(shù)總結(jié)
本發(fā)明涉及一種面向微博數(shù)據(jù)的疑似水軍發(fā)現(xiàn)方法,屬于計(jì)算機(jī)應(yīng)用技術(shù)領(lǐng)域。本發(fā)明共分為以下六個(gè)步驟,分別為相關(guān)微博數(shù)據(jù)的采集;數(shù)據(jù)預(yù)處理;用戶特征提取;構(gòu)建訓(xùn)練集;訓(xùn)練水軍檢測(cè)模型;預(yù)測(cè)判別未標(biāo)注數(shù)據(jù)。對(duì)比現(xiàn)有技術(shù),本發(fā)明實(shí)現(xiàn)了數(shù)據(jù)的充分利用,方便快捷的進(jìn)行群體發(fā)現(xiàn)而不用建立復(fù)雜的分類(lèi)檢測(cè)模型,從而降低了算法的復(fù)雜度,并且算法的模塊性較高,可以投入大規(guī)模數(shù)據(jù)計(jì)算,具有較高的穩(wěn)定性;本發(fā)明除了可以對(duì)單一用戶進(jìn)行水軍檢測(cè),還可以對(duì)某一特定事件中的一批用戶進(jìn)行識(shí)別,該方法模塊性極強(qiáng),可以穩(wěn)定適用于大規(guī)模數(shù)據(jù)計(jì)算框架下。
技術(shù)研發(fā)人員:劉春陽(yáng);喬楊;趙志云;李雄;張華平;張旭;龐琳;王萌;商建云;王卿
受保護(hù)的技術(shù)使用者:國(guó)家計(jì)算機(jī)網(wǎng)絡(luò)與信息安全管理中心
技術(shù)研發(fā)日:2017.04.01
技術(shù)公布日:2017.07.11