1.一種改進(jìn)型基于計(jì)算機(jī)大數(shù)據(jù)的社交網(wǎng)絡(luò)中優(yōu)質(zhì)節(jié)點(diǎn)探測(cè)系統(tǒng),其特征在于,其包括如下單元:
監(jiān)控分詞單元,用于建立優(yōu)質(zhì)節(jié)點(diǎn)信息傳播監(jiān)控模型;
優(yōu)質(zhì)節(jié)點(diǎn)探測(cè)單元,用于從互聯(lián)網(wǎng)社交系統(tǒng)中探測(cè)優(yōu)質(zhì)節(jié)點(diǎn);
預(yù)警單元,用于利用優(yōu)質(zhì)節(jié)點(diǎn)信息傳播監(jiān)控模型對(duì)優(yōu)質(zhì)節(jié)點(diǎn)發(fā)布的信息進(jìn)行監(jiān)控,在監(jiān)控到敏感信息時(shí),將敏感信息以及發(fā)布敏感信息的優(yōu)質(zhì)節(jié)點(diǎn)信息發(fā)送到累加單元;
累加單元,用于根據(jù)敏感信息的權(quán)值選擇將敏感信息以及發(fā)布敏感信息的優(yōu)質(zhì)節(jié)點(diǎn)信息發(fā)送到網(wǎng)絡(luò)監(jiān)管中心;
累加單元包括:
權(quán)值設(shè)定子單元,用于預(yù)先存儲(chǔ)各類敏感信息的影響權(quán)值;
累加子單元,用于在接收到預(yù)警單元發(fā)送的敏感信息時(shí),判斷接收的敏感信息的權(quán)值,并將敏感信息的權(quán)值進(jìn)行累加;
閾值設(shè)定子單元,用于進(jìn)一步判斷累加后的權(quán)值是否超過報(bào)警閾值,在超過報(bào)警閾值時(shí),將敏感信息以及發(fā)布敏感信息的優(yōu)質(zhì)節(jié)點(diǎn)信息發(fā)送到網(wǎng)絡(luò)監(jiān)管中心。
2.如權(quán)利要求1所述的改進(jìn)型基于計(jì)算機(jī)大數(shù)據(jù)的社交網(wǎng)絡(luò)中優(yōu)質(zhì)節(jié)點(diǎn)探測(cè)系統(tǒng),其特征在于,
監(jiān)控分詞單元包括:
第一分詞子單元,用于將需要訓(xùn)練的網(wǎng)絡(luò)語(yǔ)言信息按照語(yǔ)言表達(dá)規(guī)律進(jìn)行分詞;
第二分詞子單元,用于判斷第一分詞子單元分詞后是否可以繼續(xù)進(jìn)行第一分詞子單元進(jìn)行分詞,如果不能繼續(xù)分詞,則進(jìn)行細(xì)粒度分詞,否則跳轉(zhuǎn)到第一分詞子單元按照語(yǔ)言表達(dá)規(guī)律進(jìn)行分詞;
敏感詞數(shù)據(jù)庫(kù),用于存儲(chǔ)需要監(jiān)控的敏感信息詞匯。
3.如權(quán)利要求2所述的改進(jìn)型基于計(jì)算機(jī)大數(shù)據(jù)的社交網(wǎng)絡(luò)中優(yōu)質(zhì)節(jié)點(diǎn)探測(cè)系統(tǒng),其特征在于,
所述優(yōu)質(zhì)節(jié)點(diǎn)探測(cè)單元包括:
集合確定子單元,用于提取需要探測(cè)的優(yōu)質(zhì)節(jié)點(diǎn)所在的社交網(wǎng)絡(luò)節(jié)點(diǎn)集合;
映射建立子單元,用于對(duì)社交網(wǎng)絡(luò)節(jié)點(diǎn)集合中的社交網(wǎng)絡(luò)節(jié)點(diǎn)建立社交網(wǎng)絡(luò)的節(jié)點(diǎn)映射關(guān)系;
模型建立子單元,用于根據(jù)優(yōu)質(zhì)節(jié)點(diǎn)的活動(dòng)規(guī)律提取探測(cè)優(yōu)質(zhì)節(jié)點(diǎn)特征;根據(jù)提取的優(yōu)質(zhì)節(jié)點(diǎn)特征建立優(yōu)質(zhì)節(jié)點(diǎn)探測(cè)的特征規(guī)則模型;
訓(xùn)練子單元,用于將社交網(wǎng)絡(luò)節(jié)點(diǎn)作為實(shí)驗(yàn)樣本進(jìn)行分組,然后進(jìn)行分組訓(xùn)練和節(jié)點(diǎn)分類;
修正子單元,用于對(duì)優(yōu)質(zhì)節(jié)點(diǎn)探測(cè)的結(jié)果進(jìn)行評(píng)估并反饋結(jié)果,并在反復(fù)地訓(xùn)練過程中將不符合探測(cè)優(yōu)質(zhì)節(jié)點(diǎn)特征的規(guī)則進(jìn)行校正,從而達(dá)到對(duì)模型進(jìn)行優(yōu)化的目的;
迭代子單元,用于將優(yōu)化后的模型再次回到訓(xùn)練子單元中節(jié)點(diǎn)訓(xùn)練與分類環(huán)節(jié)進(jìn)行優(yōu)質(zhì)節(jié)點(diǎn)探測(cè)以提高探測(cè)進(jìn)度,并進(jìn)行迭代運(yùn)算直到優(yōu)質(zhì)節(jié)點(diǎn)的探測(cè)進(jìn)度超過設(shè)定閾值從而完成整個(gè)社交網(wǎng)絡(luò)中優(yōu)質(zhì)節(jié)點(diǎn)探測(cè)過程。
4.如權(quán)利要求3所述的改進(jìn)型基于計(jì)算機(jī)大數(shù)據(jù)的社交網(wǎng)絡(luò)中優(yōu)質(zhì)節(jié)點(diǎn)探測(cè)系統(tǒng),其特征在于,所述預(yù)警單元包括:
數(shù)據(jù)獲取子單元,用于爬取優(yōu)質(zhì)節(jié)點(diǎn)發(fā)布的實(shí)時(shí)數(shù)據(jù)并寫入數(shù)據(jù)緩存庫(kù);
聚類子單元,用于按照預(yù)定算法對(duì)第一預(yù)定時(shí)間段內(nèi)的實(shí)時(shí)數(shù)據(jù)進(jìn)行排序,篩選出第一預(yù)定時(shí)間段內(nèi)的超過預(yù)設(shè)熱度值的信息;對(duì)第二預(yù)定時(shí)間段內(nèi)的由實(shí)時(shí)數(shù)據(jù)構(gòu)成的文本進(jìn)行突發(fā)詞抽取,進(jìn)而進(jìn)行向量化,對(duì)向量化的文本進(jìn)行聚類,選取各類中異常值最大實(shí)時(shí)數(shù)據(jù)作為監(jiān)測(cè)到的異常信息;根據(jù)預(yù)設(shè)閾值顯示相應(yīng)條數(shù)的預(yù)設(shè)熱度值的信息和異常信息;
判斷子單元,用于將預(yù)設(shè)熱度值的信息和異常信息發(fā)送到監(jiān)控分詞單元進(jìn)行篩選判斷是否存在敏感詞;在監(jiān)控到敏感詞時(shí),將敏感詞以及發(fā)布包含敏感詞信息的優(yōu)質(zhì)節(jié)點(diǎn)信息發(fā)送到累加單元。
5.如權(quán)利要求4所述的改進(jìn)型基于計(jì)算機(jī)大數(shù)據(jù)的社交網(wǎng)絡(luò)中優(yōu)質(zhì)節(jié)點(diǎn)探測(cè)系統(tǒng),其特征在于,
所述模型建立子單元中根據(jù)優(yōu)質(zhì)節(jié)點(diǎn)的活動(dòng)規(guī)律提取探測(cè)優(yōu)質(zhì)節(jié)點(diǎn)特征包括:
設(shè)置節(jié)點(diǎn)被判斷為優(yōu)秀節(jié)點(diǎn)的節(jié)點(diǎn)屬性,在某一節(jié)點(diǎn)具備優(yōu)秀節(jié)點(diǎn)的節(jié)點(diǎn)屬性時(shí),則該節(jié)點(diǎn)屬性具有高優(yōu)質(zhì)性的特征;
設(shè)置節(jié)點(diǎn)之間隨著時(shí)間的推移就應(yīng)具備頻繁的交互性,稱之為交互度Vinter;在社交網(wǎng)絡(luò)中,如節(jié)點(diǎn)具有核心節(jié)點(diǎn)的特征,且它們與周邊節(jié)點(diǎn)間存在連接邊;在這些連接邊中,將優(yōu)質(zhì)節(jié)點(diǎn)的主動(dòng)交互看作是出度Vout,出度為自身指向其它節(jié)點(diǎn)的邊,而被動(dòng)交互看作入度Vin,入度為其它節(jié)點(diǎn)指向自身的邊,則優(yōu)質(zhì)節(jié)點(diǎn)往往同時(shí)存在超過第一預(yù)設(shè)閾值的入度和出度,且出度入度比接近于1;
將同時(shí)存在超過預(yù)設(shè)值的入度和出度,且出度入度比大于1且大于第二預(yù)設(shè)閾值的節(jié)點(diǎn)作為非優(yōu)質(zhì)節(jié)點(diǎn)。
6.如權(quán)利要求5所述的改進(jìn)型基于計(jì)算機(jī)大數(shù)據(jù)的社交網(wǎng)絡(luò)中優(yōu)質(zhì)節(jié)點(diǎn)探測(cè)系統(tǒng),其特征在于,所述模型建立子單元中優(yōu)質(zhì)節(jié)點(diǎn)探測(cè)過程的矩陣表示如下:
映射矩陣為被探測(cè)對(duì)象的入度與出度之間的映射關(guān)系矩陣;其中,Min×out表示矩陣名稱,In表示節(jié)點(diǎn)的入度集合,Out表示節(jié)點(diǎn)的出度集合;Vi,in,i=1...n和Vj,out,j=1...m分別表示節(jié)點(diǎn)i的入度和節(jié)點(diǎn)j的出度;i=1...n,j=1...m表示節(jié)點(diǎn)i入度和節(jié)點(diǎn)j出度比值;當(dāng)i=j(luò)時(shí),可對(duì)優(yōu)質(zhì)節(jié)點(diǎn)和非優(yōu)質(zhì)節(jié)點(diǎn)進(jìn)行探測(cè),此時(shí)優(yōu)質(zhì)節(jié)點(diǎn)的Pij趨向于1,而非優(yōu)質(zhì)節(jié)點(diǎn)的Pij大于1且大于第二預(yù)設(shè)閾值或小于1且小于第三預(yù)設(shè)閾值;而當(dāng)i≠j時(shí),若Pij=0表明不同節(jié)點(diǎn)間不存在交互關(guān)系,否則節(jié)點(diǎn)間就存在交互關(guān)系。
7.如權(quán)利要求6所述的改進(jìn)型基于計(jì)算機(jī)大數(shù)據(jù)的社交網(wǎng)絡(luò)中優(yōu)質(zhì)節(jié)點(diǎn)探測(cè)系統(tǒng),其特征在于,所述修正子單元中還包括制定探測(cè)結(jié)果的召回率和準(zhǔn)確率,并對(duì)準(zhǔn)確率進(jìn)行閾值設(shè)定,以決定是否跳轉(zhuǎn)到迭代子單元進(jìn)行迭代運(yùn)算過程。