欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

輿情信息的告警方法及裝置的制造方法_3

文檔序號(hào):9579310閱讀:來(lái)源:國(guó)知局
檢測(cè)特征 字段在已告警的輿情信息對(duì)應(yīng)的特征字段中進(jìn)行查找,得到與每一個(gè)待檢測(cè)特征字段對(duì)應(yīng) 的特征集合;S2,按照預(yù)定的順序?qū)⒚恳粋€(gè)待檢測(cè)特征字段對(duì)應(yīng)的特征集合中的已告警的 輿情信息對(duì)應(yīng)的特征字段與待檢測(cè)輿情信息對(duì)應(yīng)的特征字段進(jìn)行比較,判斷已告警的輿情 信息對(duì)應(yīng)的特征字段與待檢測(cè)輿情信息對(duì)應(yīng)的特征字段的相似度是否小于等于第一預(yù)定 閾值;
[0068] 上述若查找到至少包括一條輿情信息對(duì)應(yīng)的特征字段與待檢測(cè)輿情信息對(duì)應(yīng)的 特征字段的相似度小于等于第一預(yù)定閾值,則判斷出待檢測(cè)輿情信息不滿足告警條件包 括:S1,只要查找到一條已告警的輿情信息對(duì)應(yīng)的特征字段與待檢測(cè)輿情信息對(duì)應(yīng)的特征 字段的相似度小于等于第一預(yù)定閾值,則可判斷出待檢測(cè)輿情信息為已告警的輿情信息, 待檢測(cè)輿情信息不滿足告警條件。
[0069] 具體結(jié)合以下示例進(jìn)行說(shuō)明,假設(shè)上述待檢測(cè)輿情信息對(duì)應(yīng)的特征字段為10101 111,01010011,01001010, 10101010, 10101010, 01110101,10111101,00001111,相似度用海 明距離標(biāo)識(shí),第一預(yù)定閾值為7,已告警的輿情信息對(duì)應(yīng)的特征字段包括但不限于以下字 段:
[0070] 1) 10101110, 01010000, 01001011,10101011,10101011,01110101,10111101,0000 1101 ;
[0071] 2) 10101001,01010101,01001010, 10101010, 10101010, 01000101,10110001,0110 1111 ;
[0072] 3)10101111,01010000, 01001010, 10101010, 10101010, 01110101,10100101,0011 0011 ;
[0073] 4)10101111,01010011,01010010, 10111010, 10101010, 01110101,10000110, 1111 0000 ;
[0074] 5) 10101111, 01010001, 01001010, 10101010, 10101010, 01110101, 10111101, 0000 1111。
[0075] 根據(jù)待檢測(cè)輿情信息的第一特征字段在已告警輿情信息集合(S集合)中查找,得 到與第一特征字段對(duì)應(yīng)的第一特征集合,其中,上述第一特征集合包括:
[0076] 3)10101111,01010000, 01001010, 10101010, 10101010, 01110101,10100101,0011 0011;(相似度為8)
[0077] 4)10101111,01010011,01010010, 10111010, 10101010, 01110101,10000110, 1111 0000;(相似度為12)
[0078] 5) 10101111,01010001,01001010, 10101010, 10101010, 01110101,10111101,0000 1111。(相似度為1)
[0079] 再將上述第一特征集合中每一個(gè)已告警的輿情信息對(duì)應(yīng)的特征字段與待檢測(cè)輿 情信息的特征字段進(jìn)行比較,判斷二者之間的相似度。經(jīng)判斷第五個(gè)特征字段與待檢測(cè)輿 情信息對(duì)應(yīng)的特征字段的相似度小于第一預(yù)定閾值7,則可判斷出上述待檢測(cè)輿情信息不 滿足告警條件,無(wú)需進(jìn)行告警。
[0080] 通過(guò)本申請(qǐng)?zhí)峁┑膶?shí)施例,通過(guò)分別根據(jù)不同的特征字段在已告警的輿情信息中 查找到相應(yīng)的特征集合,再按照預(yù)定的順序依次在各個(gè)特征集合中進(jìn)行相似度比較,當(dāng)查 找到一條輿情信息對(duì)應(yīng)的特征字段與待檢測(cè)輿情信息對(duì)應(yīng)的特征字段的相似度小于等于 第一預(yù)定閾值時(shí),則可得出上述待檢測(cè)輿情信息為已告警的輿情信息,并不滿足告警條件, 進(jìn)一步,無(wú)需繼續(xù)在已告警的輿情信息中進(jìn)行查找或相似度比較,從而實(shí)現(xiàn)及時(shí)對(duì)待檢測(cè) 輿情信息進(jìn)行判斷,縮短了輿情信息的告警周期。
[0081] 作為一種可選的方案,上述在未告警的輿情信息對(duì)應(yīng)的特征字段中查找與待檢測(cè) 輿情信息對(duì)應(yīng)的特征字段的相似度小于等于第二預(yù)定閾值的未告警的輿情信息的數(shù)量是 否大于第三預(yù)定閾值包括:S1,分別根據(jù)待檢測(cè)輿情信息對(duì)應(yīng)的特征字段多個(gè)特征字段中 的每一個(gè)待檢測(cè)特征字段在未告警的輿情信息對(duì)應(yīng)的特征字段中進(jìn)行查找,得到與每一個(gè) 待檢測(cè)特征字段對(duì)應(yīng)的特征集合;S2,按照預(yù)定的順序?qū)⒚恳粋€(gè)待檢測(cè)特征字段對(duì)應(yīng)的特 征集合中的未告警的輿情信息對(duì)應(yīng)的特征字段與待檢測(cè)輿情信息對(duì)應(yīng)的特征字段進(jìn)行比 較,判斷未告警的輿情信息對(duì)應(yīng)的特征字段與待檢測(cè)輿情信息對(duì)應(yīng)的特征字段的相似度是 否小于等于第二預(yù)定閾值;S3,將查找到的與待檢測(cè)輿情信息對(duì)應(yīng)的特征字段的相似度小 于等于第二預(yù)定閾值的未告警的輿情信息計(jì)數(shù);
[0082] 上述若滿足上述條件的未告警的輿情信息的數(shù)量大于等于第三預(yù)定閾值,則判斷 出待檢測(cè)輿情滿足告警條件,將對(duì)待檢測(cè)輿情信息進(jìn)行告警包括:S1,當(dāng)查找到與待檢測(cè)輿 情信息對(duì)應(yīng)的特征字段的相似度小于等于第二預(yù)定閾值的未告警的輿情信息的數(shù)量達(dá)到 第三預(yù)定閾值時(shí),則判斷出待檢測(cè)輿情信息滿足告警條件,將對(duì)待檢測(cè)輿情信息進(jìn)行告警。
[0083] 具體結(jié)合以下示例進(jìn)行說(shuō)明,假設(shè)上述待檢測(cè)輿情信息對(duì)應(yīng)的特征字段為10101 111,01010011,01001010, 10101010, 10101010, 01110101,10111101,00001111,相似度用海 明距離標(biāo)識(shí),第二預(yù)定閾值為7,第三預(yù)定閾值為2,未告警的輿情信息對(duì)應(yīng)的特征字段包 括但不限于以下字段 :
[0084] 1) 10101110, 01010000, 01001011,10101011,10101011,01110101,10111101,0000 1101 ;
[0085] 2) 10101111,01010011,01001010, 10101010, 10101010, 01110101,10111101,1100 1001 ;
[0086] 3)10101111,01010000, 01001010, 10101010, 10101010, 01110101,10100101,0011 0011 ;
[0087] 4)10101111,01010011,01010010, 10111010, 10101010, 01110101,10000110, 1111 0000 ;
[0088] 5) 10101111,01010001,01001010, 10101010, 10101010, 01110101,10111101,0000 1111。
[0089] 根據(jù)待檢測(cè)輿情信息的第一特征字段在未告警輿情信息集合(R集合)中查找,得 到與第一特征字段對(duì)應(yīng)的第一特征集合,其中,上述第一特征集合包括:
[0090] 2)10101111,01010011,01001010, 10101010, 10101010, 01110101,10111101,1100 1001 ;(相似度為4)
[0091] 3)10101111,01010000, 01001010, 10101010, 10101010, 01110101,10100101,0011 0011 ;(相似度為8)
[0092] 4)10101111,01010011,01010010, 10111010, 10101010, 01110101,10000110, 1111 0000 ;(相似度為12)
[0093] 5) 10101111,01010001,01001010, 10101010, 10101010, 01110101,10111101,0000 1111。(相似度為1)
[0094] 再將上述第一特征集合中每一個(gè)未告警的輿情信息對(duì)應(yīng)的特征字段與待檢測(cè)輿 情信息的特征字段進(jìn)行比較,判斷二者之間的相似度。經(jīng)判斷第2個(gè)特征字段及第5個(gè)特 征字段與待檢測(cè)輿情信息對(duì)應(yīng)的特征字段的相似度小于第二預(yù)定閾值7,上述相似度小于 等于第二預(yù)定閾值的未告警的輿情信息的數(shù)量已經(jīng)達(dá)到第三預(yù)定閾值2時(shí),則可以判斷出 上述待檢測(cè)輿情信息滿足告警條件,需要對(duì)上述待檢測(cè)輿情信息進(jìn)行告警。
[0095] 通過(guò)本申請(qǐng)?zhí)峁┑膶?shí)施例,通過(guò)分別根據(jù)不同的特征字段在未告警的輿情信息中 查找到相應(yīng)的特征集合,再按照預(yù)定的順序依次在各個(gè)特征集合中進(jìn)行相似度比較,當(dāng)查 找到與待檢測(cè)輿情信息對(duì)應(yīng)的特征字段的相似度小于等于第二預(yù)定閾值的未告警的輿情 信息的數(shù)量達(dá)到第三預(yù)定閾值時(shí),則需要對(duì)上述待檢測(cè)輿情信息進(jìn)行告警。進(jìn)一步,當(dāng)查找 到的未告警的輿情信息的數(shù)量達(dá)到第三預(yù)定閾值時(shí),無(wú)需繼續(xù)在未告警的輿情信息中進(jìn)行 查找或相似度比較,也可判斷出待檢測(cè)輿情信息需要進(jìn)行告警,從而實(shí)現(xiàn)及時(shí)對(duì)待檢測(cè)輿 情信息進(jìn)行告警,縮短了輿情信息的告警周期。
[0096] 作為一種可選的方案,所述對(duì)所述待檢測(cè)輿情信息進(jìn)行預(yù)處理,將預(yù)處理后的所 述待檢測(cè)輿情信息劃分為多個(gè)特征字段包括:
[0097]S1,提取待檢測(cè)輿情信息的主題;
[0098]S2,對(duì)主題進(jìn)行哈希轉(zhuǎn)碼操作得到預(yù)定碼長(zhǎng)的哈希碼;
[0099]S3,將哈希碼劃分為多個(gè)特征字段。
[0100] 可選地,在本實(shí)施例中,劃分為多個(gè)特征字段進(jìn)行查找的方式包括但不限于:假設(shè) 多個(gè)特征字段個(gè)數(shù)為N,則當(dāng)相似度比較的第一預(yù)定閾值為小于等于N-1時(shí),則當(dāng)上述相似 度(例如,海明距離)中不同的比特碼在不同的特征字段時(shí),至少還有一個(gè)特征字段中的比 特碼是與其他輿情信息對(duì)應(yīng)的特征字段完全相同的,則基于上述多個(gè)特征字段中的每一個(gè) 特征字段分別進(jìn)行查找,得到與上述每一個(gè)特征字段對(duì)應(yīng)的特征集合,再基于上述特征集 合進(jìn)行相似度比較時(shí),很大程度上減小了相似度比較的數(shù)量,從而提高輿情信息告警判斷 的效率,使得輿情信息告警更加及時(shí)有效。
[0101] 具體結(jié)合以下示例進(jìn)行說(shuō)明,例如,通過(guò)爬蟲抓取微博,對(duì)微博中帶有特殊符號(hào)標(biāo) 識(shí)"##"的話題進(jìn)行識(shí)別,得到待檢測(cè)輿情信息,然后將上述待檢測(cè)輿情信息進(jìn)行如圖3所 示的Simhash轉(zhuǎn)碼,得到一個(gè)64位二進(jìn)制碼。然后將上述二進(jìn)制碼劃分為如表1所示的8 段特征字段,并倒序存儲(chǔ),以用于之后的特征字段的相似度比較。
[0102] 通過(guò)本申請(qǐng)?zhí)峁┑膶?shí)施例,通過(guò)對(duì)待檢測(cè)輿情信息進(jìn)行提取、轉(zhuǎn)碼、劃分特征字段 的預(yù)處理后,得到用于查找的多個(gè)特征字段,利用與多個(gè)特征字段對(duì)應(yīng)的特征集合與待檢 測(cè)輿情信息的特征字段進(jìn)行相似度比較,達(dá)到及時(shí)對(duì)需要告警的輿情信息進(jìn)行準(zhǔn)確告警, 提供了告警的效率,縮短了輿情信息的告警周期。
[0103] 作為一種可選的方案,從網(wǎng)絡(luò)信息中識(shí)別出待檢測(cè)輿情信息包括以下至少之一:
[0104] 1)通過(guò)貝葉斯分類判斷識(shí)別出待檢測(cè)輿情信息;或者,
[0105] 2)通過(guò)支持向量機(jī)SVM分類判斷識(shí)別出待檢測(cè)輿情信息。
[0106] 具體結(jié)合以下示例進(jìn)行說(shuō)明,貝葉斯分類判斷識(shí)別可以以貝葉斯分類器為例。根 據(jù)貝葉斯公式:
[0107]P(A|B)=P(B|A)P(A)/P(B) (1)
[0108] 首先收集樣本數(shù)據(jù)(例如,網(wǎng)絡(luò)信息),然后對(duì)樣本數(shù)據(jù)進(jìn)行整理,得到模型數(shù)據(jù), 然后將需要分類的網(wǎng)絡(luò)信息,進(jìn)行預(yù)處理后,通過(guò)貝葉斯公式來(lái)判斷待檢測(cè)的輿情信息屬 于"負(fù)面輿情信息"還是"正面輿情信息",哪個(gè)概率大,則該待檢測(cè)輿情信息就屬于哪一類。
[0109] 具體結(jié)合以下示例進(jìn)行說(shuō)明,以支持向量機(jī)SVM為例。將待檢測(cè)輿情信息轉(zhuǎn)換為 一個(gè)η維向量,那么在η維空間中,找到一個(gè)超平面將所有η維向量一分為二,例如,"負(fù)面 輿情信息"對(duì)應(yīng)的第一空間或"正面輿情信息"對(duì)應(yīng)的第二空間,當(dāng)
當(dāng)前第3頁(yè)1 2 3 4 5 6 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
三原县| 大竹县| 灵寿县| 屏南县| 宝应县| 哈密市| 得荣县| 澎湖县| 普兰店市| 宜良县| 宁武县| 承德市| 高碑店市| 呼伦贝尔市| 旬阳县| 墨脱县| 溆浦县| 琼中| 黔江区| 盐山县| 玉环县| 河池市| 冀州市| 泰州市| 汪清县| 滕州市| 成武县| 长乐市| 英德市| 潍坊市| 德惠市| 康定县| 奉节县| 航空| 昌宁县| 武乡县| 文安县| 银川市| 通州区| 余干县| 辽中县|