專利名稱:一種垃圾短信監(jiān)控與處理的系統(tǒng)、裝置及方法
技術領域:
本發(fā)明涉及通信領域的短信處理技術,特別涉及一種垃圾短信監(jiān)控與處理的系統(tǒng)、裝置及方法。
背景技術:
隨著通信技術的發(fā)展,通信網(wǎng)絡運營商在通信網(wǎng)絡中提供多種多樣的應用業(yè)務, 其中之一就是短信。隨著使用短信的用戶越來越多,非法的垃圾短信也越來越多。通信網(wǎng)絡的網(wǎng)絡側(cè)如何監(jiān)控到這些垃圾短信并刪除,也成為了通信網(wǎng)絡側(cè)要解決的問題之一。目前,通信網(wǎng)絡側(cè)監(jiān)控垃圾短信并處理的方式主要通過關鍵詞過濾方式、流量控制方式和黑名單方式這三種,具體描述如下關鍵詞過濾方式在通信網(wǎng)絡側(cè)預先設置關鍵詞,通信網(wǎng)絡側(cè)在接收到短信未轉(zhuǎn)發(fā)之前,將設置的關鍵詞與短信內(nèi)容進行匹配,如果匹配成功,則確定該短信為垃圾短信, 則將該短信攔截并刪除;如果不匹配,則轉(zhuǎn)發(fā)給接收端;流量控制方式在通信網(wǎng)絡側(cè)設置針對一終端在設定時間內(nèi)發(fā)送的短信數(shù)量門限,如1小時200條,通信網(wǎng)絡側(cè)監(jiān)控同一發(fā)送端在設定時間內(nèi)發(fā)送的短信數(shù)量,如果超過設定時間內(nèi)發(fā)送的短信數(shù)量門限時,則攔截該發(fā)送端在后續(xù)發(fā)送的短信并刪除;如果沒有超過設定時間內(nèi)發(fā)送的短信數(shù)量門限,則將該發(fā)送端的短信轉(zhuǎn)發(fā)給接收端;黑名單方式在通信網(wǎng)絡側(cè)設置黑名單,通信網(wǎng)絡側(cè)在接收到短信未轉(zhuǎn)發(fā)之前,確定發(fā)送該短信的發(fā)送端是否在所設置的黑名單中,如果是,則將該短信攔截并刪除;如果不是,則轉(zhuǎn)發(fā)給接收端。在上述技術方案中,采用關鍵詞過濾方式對垃圾短信進行監(jiān)控與處理時,誤監(jiān)控及漏監(jiān)控較高。這是因為,對短信內(nèi)容與設置的關鍵詞進行匹配過程中,是基于中文關鍵詞匹配,比如設置的關鍵詞為“發(fā)票”等,當垃圾短信在發(fā)送時會規(guī)避所設置的關鍵詞,采用 “發(fā)*飄”、“發(fā)一飄”(中間為中文的“一”)、“廢票”、或“發(fā)鏢”等模糊化及拼接化詞語,即在垃圾短信加入非中文字符,且利用中文同音詞和同形字等手段來規(guī)避關所設置的關鍵詞監(jiān)控。通信網(wǎng)絡側(cè)設置的關鍵詞無法匹配上這些垃圾短信的內(nèi)容,但是對于接收端來說,聯(lián)系上這些垃圾短信的上下文,很容易理解這些垃圾短信。一個完整實例垃圾短信的內(nèi)容為“本公司代開各種正規(guī)廢票,有意請回復李先生 1391111111”,這時采用“發(fā)票”的關鍵詞就無法監(jiān)控到該垃圾短信。此外,還有一些具有將關鍵詞顛倒的內(nèi)容的垃圾短信,比如“票發(fā)”,無法采用關鍵詞過濾方式監(jiān)控到,但是對于接收端,聯(lián)系上下文,就很容易理解垃圾短信內(nèi)容。另一個完整實例垃圾短信的內(nèi)容為“機打正規(guī)票發(fā),有需要請聯(lián)系張小姐1581223333”,采用“發(fā)票”的關鍵詞就無法監(jiān)控到該垃圾短信,但是接收端就可以很容易理解該垃圾短信內(nèi)容。為了克服這些問題,對短信內(nèi)容與設置的關鍵詞進行匹配過程中,設置基于中文關鍵詞轉(zhuǎn)換的拼音進行匹配,這雖然可以避免使用同音詞為內(nèi)容的垃圾短信的規(guī)避關鍵詞匹配問題,但是對于使用同形詞或關鍵詞顛倒為內(nèi)容的垃圾短信,卻仍然可以規(guī)避關鍵詞匹配。
在上述技術方案中,所采用的流量控制方式進行垃圾短信的監(jiān)控與處理是事后性的,當監(jiān)控到同一發(fā)送端在設定時間內(nèi)發(fā)送的短信數(shù)量超過設定時間內(nèi)發(fā)送的短信數(shù)量門限,然后再攔截該發(fā)送端在后續(xù)發(fā)送的短信并刪除,該發(fā)送端前期發(fā)送的大量垃圾短信已經(jīng)被通信網(wǎng)絡側(cè)成功轉(zhuǎn)發(fā)給接收端。在上述方案中,所采用的黑名單方式進行垃圾短信的監(jiān)控與處理,建立黑名單的過程比較漫長,且主要還是在通信網(wǎng)絡側(cè)通過人工核查的方式進行。通信網(wǎng)絡側(cè)為了更有效地監(jiān)控與處理短信,常常將上述三種方式結(jié)合使用,結(jié)合使用時的技術方案主要有以下幾種第一種技術方案在通信網(wǎng)絡側(cè)同時設置黑名單、針對一終端在設定時間內(nèi)發(fā)送的短信數(shù)量門限及關鍵詞。通信網(wǎng)絡側(cè)在接收到短信時,首先確定發(fā)送該短信的發(fā)送端是否在黑名單中,如果是,則攔截該短信并刪除,如果不是,則監(jiān)控同一發(fā)送端在設定時間內(nèi)發(fā)送的短信數(shù)量,如果沒有超過,就轉(zhuǎn)發(fā)該短信,如果超過,將設置的關鍵詞與短信內(nèi)容進行匹配,如果匹配成功,則將發(fā)送該短信的發(fā)送端設置在黑名單中;如果不匹配,則轉(zhuǎn)發(fā)給接收端;第二種技術方案通信網(wǎng)絡側(cè)設置動態(tài)的黑名單,也就是通過人工分析及垃圾短信舉報信息,動態(tài)設置黑名單,通信網(wǎng)絡側(cè)在接收到短信未轉(zhuǎn)發(fā)之前,確定發(fā)送該短信的發(fā)送端是否在所設置的動態(tài)黑名單中,如果是,則將該短信攔截并刪除;如果不是,則轉(zhuǎn)發(fā)給接收端;第三種技術方案在通信網(wǎng)絡側(cè)同時設置黑名單、針對一終端在設定時間內(nèi)發(fā)送的短信數(shù)量門限及關鍵詞。通信網(wǎng)絡側(cè)在接收到短信時,首先確定發(fā)送該短信的發(fā)送端是否在黑名單中,如果是,攔截該短信并刪除,如果不是,監(jiān)控同一發(fā)送端在設定時間內(nèi)發(fā)送的短信數(shù)量,如果沒有超過,就轉(zhuǎn)發(fā)該短信,如果超過,將設置的關鍵詞與短信內(nèi)容進行匹配,如果匹配成功,攔截該短信并刪除該短信;如果不匹配,轉(zhuǎn)發(fā)給接收端。在上述結(jié)合方案監(jiān)控與處理垃圾短信中,對于第一種技術方案采用流量控制方式作為關鍵詞過濾的先決條件,導致在執(zhí)行關鍵詞過濾之前,一定數(shù)量的垃圾短信已經(jīng)下發(fā),且采用關鍵詞過濾方式時,誤判率及漏判率都較高;對于第二種技術方案,所設置的黑名單的建立過程漫長,也為事后處理機制;對于第三種技術方案,將三種方式分別獨立進行,并沒有克服三種方式已有的自身缺陷。
發(fā)明內(nèi)容
有鑒于此,本發(fā)明提供一種垃圾短信監(jiān)控與處理的系統(tǒng),該系統(tǒng)能夠在采用關鍵詞過濾方式監(jiān)控與處理時,降低誤監(jiān)控率及漏監(jiān)控率。本發(fā)明還提供一種垃圾短信監(jiān)控與處理的裝置,該裝置能夠在采用關鍵詞過濾方式監(jiān)控與處理時,降低誤監(jiān)控率及漏監(jiān)控率。本發(fā)明還提供一種垃圾短信監(jiān)控與處理的方法,該方法能夠在采用關鍵詞過濾方式監(jiān)控與處理時,降低誤監(jiān)控率及漏監(jiān)控率。為達到上述目的,本發(fā)明實施的技術方案具體是這樣實現(xiàn)的一種垃圾短信監(jiān)控與處理的系統(tǒng),該系統(tǒng)包括終端、短信中心/短信網(wǎng)關、垃圾短信處理裝置及營帳支撐系統(tǒng)BOSS,其中,CN 102547621 A終端,用于作為發(fā)送端向短信中心/短信網(wǎng)關發(fā)送短信,作為接收端從短信中心/ 短信網(wǎng)關接收短信;短信中心/短信網(wǎng)關,用于從作為發(fā)送端的終端接收到短信后,發(fā)送給垃圾短信處理裝置,從垃圾短信處理裝置中接收到非垃圾短信后,發(fā)送給作為接收端的終端;垃圾短信處理裝置,用于設置基本關鍵詞規(guī)則、關鍵詞衍生序列及垃圾短信疑似度,從短信中心/短信網(wǎng)關接收短信,采用基本關鍵詞規(guī)則匹配,如果匹配成功,將該短信作為垃圾短信刪除,將判決結(jié)果發(fā)送給BOSS,如果匹配不成功,采用關鍵詞衍生序列匹配并計算匹配的垃圾短信疑似值,如果計算的垃圾短信疑似值在所設置的垃圾短信疑似值范圍內(nèi),將該短信作為疑似垃圾短信,如果大于等于設置的垃圾短信疑似度上范圍,將該短信作為垃圾短信刪除,將判決結(jié)果發(fā)送給BOSS,如果小于等于設置的垃圾短信疑似度下范圍,將該短信作為非垃圾短信發(fā)送給短信中心/短信網(wǎng)關;BOSS,用于從垃圾短信處理裝置接收判決結(jié)果,對發(fā)送該垃圾短信的作為發(fā)送端的終端進行處理。所述垃圾短信處理裝置,還用于將疑似垃圾短信緩存,通過短信中心/短信網(wǎng)關對發(fā)送該疑似垃圾短信的作為發(fā)送端的終端監(jiān)控,確定其發(fā)送短信量在設定時間內(nèi)是否超過設定的門限值,如果是,刪除所緩存的疑似垃圾短信并刪除后續(xù)所緩存的該發(fā)送端通過短信中心/短信網(wǎng)關發(fā)送的疑似垃圾短信,如果否,將所緩存的疑似垃圾短信作為非垃圾短信發(fā)送給短信中心/短信網(wǎng)關,在監(jiān)控時間段內(nèi),繼續(xù)緩存通過短信中心/短信網(wǎng)關將從作為發(fā)送端的終端接收的被判定為疑似垃圾短信。所述垃圾短信處理裝置,還用于對還未認定為垃圾短信的短信進行黑名單方式過濾設置黑名單,如果發(fā)送該短信的作為發(fā)送端的終端在黑名單中,認為該短信為垃圾短信;否則,不是垃圾短信。一種垃圾短信監(jiān)控與處理的裝置,該裝置包括短信中心/短信網(wǎng)關接口模塊、過濾模塊及BOSS接口模塊,其中,短信中心/短信網(wǎng)關接口模塊,用于從短信中心/短信網(wǎng)關接收短信,將判定為非垃圾短信的短信發(fā)送給短信中心/短信網(wǎng)關;過濾模塊,用于設置基本關鍵詞規(guī)則、關鍵詞衍生序列及垃圾短信疑似度。從短信中心/短信網(wǎng)關接口模塊接收短信,采用基本關鍵詞規(guī)則匹配,如果匹配成功,將該短信作為垃圾短信并刪除,將判決結(jié)果發(fā)送給BOSS接口模塊,如果匹配不成功,采用關鍵詞衍生序列匹配并計算匹配的垃圾短信疑似值,如果計算的垃圾短信疑似值在所設置的垃圾短信疑似值范圍內(nèi),將該短信作為疑似垃圾短信,如果計算的垃圾短信疑似值大于等于設置的垃圾短信疑似度上范圍,將該短信作為垃圾短信并刪除,將判決結(jié)果發(fā)送給BOSS接口模塊,如果小于等于設置的垃圾短信疑似度下范圍,將該短信作為非垃圾短信發(fā)送給短信中心/短信網(wǎng)關接口模塊;BOSS接口模塊,用于從過濾模塊接收垃圾短信的判決結(jié)果。所述過濾模塊中包括關鍵詞過濾模塊及關鍵詞規(guī)則庫,其中,關鍵詞過濾模塊,用于從短信中心/短信網(wǎng)關接口模塊接收短信時,采用關鍵詞規(guī)則庫中的基本關鍵詞規(guī)則匹配,如果匹配成功,將該短信作為垃圾短信并刪除,將判決結(jié)果發(fā)送給BOSS接口模塊,如果匹配不成功,采用關鍵詞規(guī)則庫中的關鍵詞衍生序列匹配并=計算匹配的垃圾短信疑似值,如果計算的垃圾短信疑似值在所設置的垃圾短信疑似值范圍內(nèi),將該短信作為疑似垃圾短信,如果計算的垃圾短信疑似值大于等于設置的垃圾短信疑似度上范圍,將該短信作為垃圾短信并刪除,將判決結(jié)果發(fā)送給BOSS接口模塊,如果小于等于設置的垃圾短信疑似度下范圍,將該短信作為非垃圾短信發(fā)送給短信中心/短信網(wǎng)關接口模塊;關鍵詞規(guī)則庫,用于存儲設置的基本關鍵詞規(guī)則、關鍵詞衍生序列及垃圾短信疑似度。所述過濾模塊,還包括面向用戶的接口模塊,用于對關鍵詞規(guī)則庫中的基本關鍵詞規(guī)則、關鍵詞衍生序列及垃圾短信疑似度進行設置。所述過濾模塊還包括流量控制模塊,用于將疑似垃圾短信緩存,通過短信中心/ 短信網(wǎng)關接口對發(fā)送該疑似垃圾短信的作為發(fā)送端的終端監(jiān)控,確定其發(fā)送短信量在設定時間內(nèi)是否超過設定的門限值,如果是,刪除所緩存的疑似垃圾短信并刪除后續(xù)所緩存的該發(fā)送端通過短信中心/短信網(wǎng)關接口發(fā)送的疑似垃圾短信,如果否,將所緩存的疑似垃圾短信作為非垃圾短信發(fā)送給短信中心/短信網(wǎng)關接口,在監(jiān)控時間段內(nèi),繼續(xù)緩存通過短信中心/短信網(wǎng)關將從作為發(fā)送端的終端接收的被判定為疑似垃圾短信。所述過濾模塊還包括黑名單控制模塊,用于對還未認定為垃圾短信的短信進行黑名單方式過濾設置黑名單,如果發(fā)送該短信的作為發(fā)送端的終端在黑名單中,認為該短信為垃圾短信;否則,則不是垃圾短信?!N垃圾短信監(jiān)控與處理的方法,設置基本關鍵詞規(guī)則、關鍵詞衍生序列及垃圾短信疑似度,該方法包括接收短信,采用所設置的基本關鍵詞規(guī)則規(guī)則對短信內(nèi)容進行匹配,確定是否匹配成功,如果是,將該短信作為垃圾短信并刪除,上報判決結(jié)果;如果否,采用所設置的關鍵詞衍生序列對該短信內(nèi)容進行匹配并計算匹配的垃圾短信疑似值,如果計算的垃圾短信疑似值在所設置的垃圾短信疑似值范圍內(nèi),將該短信作為疑似垃圾短信,如果計算的垃圾短信疑似值大于等于設置的垃圾短信疑似度上范圍,將該短信作為垃圾短信并刪除,并上報判決結(jié)果,如果小于等于設置的垃圾短信疑似度下范圍,將該短信作為非垃圾短信發(fā)送。所述所設置的基本關鍵詞規(guī)則規(guī)則對短信內(nèi)容進行匹配之前,還包括將該短信的短信內(nèi)容中的非中文字符刪除。所述計算匹配的垃圾短信疑似值a、將關鍵詞衍生序列中的每個衍生字詞順序與該短信內(nèi)容匹配,如果成功,記錄匹配成功的衍生字詞對應的垃圾短信疑似值及匹配成功的短信內(nèi)容位置,轉(zhuǎn)入步驟b ;如果沒有匹配成功,進行下一個衍生字詞的匹配,直到關鍵詞衍生序列中的每個衍生字詞都被匹配過,轉(zhuǎn)入步驟C;b、將已匹配成功的衍生字詞進行匹配成功的短信內(nèi)容位置后的匹配,如果沒有成功,進行下一個衍生字詞的匹配;如果否,則記錄下一個匹配成功的短信內(nèi)容位置,計算該衍生字詞的垃圾短信疑似值為下一個垃圾短信疑似值除以下一個垃圾短信疑似值與匹配成功的短信內(nèi)容位置與下一匹配成功的短信內(nèi)容位置之差,繼續(xù)轉(zhuǎn)入步驟b進行匹配,直到該衍生字詞對該短信內(nèi)容都匹配完,進行下一個衍生字詞的匹配;
C、將所有得到的每個衍生字詞的垃圾短信疑似值相加,得到該短信的垃圾短信疑似值。在將該短信作為疑似垃圾短信之后,該方法還包括將該短信作為疑似垃圾短信緩存,對發(fā)送該疑似垃圾短信的發(fā)送端監(jiān)控,確定其發(fā)送短信量在設定時間內(nèi)是否超過設定的門限值,如果是,刪除所緩存的疑似垃圾短信并刪除后續(xù)所緩存的該發(fā)送端發(fā)送的疑似垃圾短信,如果否,將所緩存的疑似垃圾短信作為非垃圾短信轉(zhuǎn)發(fā),在監(jiān)控的時間段內(nèi),繼續(xù)緩存從發(fā)送端接收被判定為疑似垃圾短信。該方法還包括對被判定為非垃圾短信的短信采用所設置的黑名單過濾,進一步確定是否為非垃圾短信。由上述技術方案可見,本發(fā)明在采用關鍵詞過濾方式時,通信網(wǎng)絡側(cè)設置由相關聯(lián)的關鍵詞組成的基本關鍵詞規(guī)則、根據(jù)相關聯(lián)的關鍵詞按照諧音、同形或字形拆分原則得到的關鍵詞衍生序列及垃圾短信疑似度。當通信網(wǎng)絡側(cè)接收到短信時,首先采用基本關鍵詞規(guī)則匹配,如果匹配成功,將該短信作為垃圾短信,如果匹配不成功,進一步采用關鍵詞衍生序列進行匹配并計算匹配的垃圾短信疑似值,如果所計算的垃圾短信疑似值大于等于設置的垃圾短信疑似度上范圍,將該短信作為垃圾短信,如果小于等于設置的垃圾短信疑似度下范圍,則轉(zhuǎn)發(fā)該短信。由于本發(fā)明在采用關鍵詞過濾方式,重新設置了關鍵詞并引入了關鍵詞過濾算法,充分考慮了與關鍵詞諧音、同形及字形拆分的衍生關鍵詞,在監(jiān)控短信時,如果短信內(nèi)容中含有與關鍵詞諧音、同形及字形拆分的衍生關鍵詞,也會被監(jiān)控到, 因此,本發(fā)明提供的系統(tǒng)、裝置及方法可以在采用關鍵詞過濾方式監(jiān)控與處理時,降低誤監(jiān)控率及漏監(jiān)控率。更進一步地,設置的垃圾短信疑似度為一個范圍,當所計算的垃圾短信疑似值在該垃圾短信疑似度范圍之內(nèi)時,先不轉(zhuǎn)發(fā)該短信,而是作為疑似垃圾短信進一步采用流量控制方式進行監(jiān)控和處理緩存該疑似垃圾短信,然后再對發(fā)送該疑似垃圾短信的發(fā)送端監(jiān)控,確定其發(fā)送短信量在設定時間內(nèi)是否超過設定的門限值,如果是,則刪除所緩存的疑似垃圾短信并刪除后續(xù)所緩存的該發(fā)送端發(fā)送的疑似垃圾短信,如果否,則將所緩存的疑似垃圾短信轉(zhuǎn)發(fā)出去。在監(jiān)控的時間段內(nèi),繼續(xù)將從該發(fā)送端接收的被判定為疑似垃圾短信進行緩存。這樣,就可以防止該發(fā)送端前期發(fā)送的大量垃圾短信被通信網(wǎng)絡側(cè)轉(zhuǎn)發(fā),進一步提高垃圾短信的監(jiān)控率。
圖1為本發(fā)明提供的垃圾短信監(jiān)控與處理的系統(tǒng)示意圖;圖2為本發(fā)明提供的垃圾短信監(jiān)控與處理的裝置結(jié)構(gòu)示意圖;圖3為本發(fā)明提供的垃圾短信監(jiān)控與處理的方法流程圖;圖4為本發(fā)明提供的計算匹配的垃圾短信疑似值的方法流程圖;圖5為本發(fā)明提供的垃圾短信監(jiān)控與處理的方法實施例流程圖。
具體實施例方式為使本發(fā)明的目的、技術方案及優(yōu)點更加清楚明白,以下參照附圖并舉實施例,對本發(fā)明作進一步詳細說明。
從現(xiàn)有技術可以看出,在采用關鍵詞過濾方式對垃圾短信進行監(jiān)控與處理時,是基于中文關鍵詞匹配或中文關鍵詞轉(zhuǎn)換的拼音進行匹配,而沒用充分考慮與關鍵詞諧音、 同形及字形拆分的衍生關鍵詞進行匹配,所以對垃圾短信的誤監(jiān)控率及漏監(jiān)控率較高。本發(fā)明為了克服這個問題,采用了通信網(wǎng)絡側(cè)設置由相關聯(lián)的關鍵詞組成的基本關鍵詞規(guī)則、根據(jù)相關聯(lián)的關鍵詞按照諧音、同形或字形拆分原則得到的關鍵詞衍生序列及垃圾短信疑似度。當通信網(wǎng)絡側(cè)接收到短信時,首先采用基本關鍵詞規(guī)則匹配,如果匹配成功,則將該短信作為垃圾短信,如果匹配不成功,則進一步采用關鍵詞衍生序列進行匹配并計算匹配的垃圾短信疑似值,如果所計算的垃圾短信疑似值大于等于設置的垃圾短信疑似度, 將該短信作為垃圾短信,否則,轉(zhuǎn)發(fā)該短信。由于本發(fā)明在采用關鍵詞過濾方式,重新設置了關鍵詞并引入了關鍵詞過濾算法,充分考慮了與關鍵詞諧音、同形及字形拆分的衍生關鍵詞,在監(jiān)控短信時,如果短信內(nèi)容中含有與關鍵詞諧音、同形及字形拆分的衍生關鍵詞, 也會被監(jiān)控到,因此,本發(fā)明可以在采用關鍵詞過濾方式監(jiān)控與處理時,降低誤監(jiān)控率及漏監(jiān)控率。更進一步地,設置垃圾短信疑似度為一個范圍,當所計算的垃圾短信疑似值在該垃圾短信疑似度范圍之內(nèi)時,先不轉(zhuǎn)發(fā)該短信,而是作為疑似垃圾短信進一步采用流量控制方式進行監(jiān)控和處理緩存該疑似垃圾短信,然后再對發(fā)送該疑似垃圾短信的發(fā)送端監(jiān)控,確定其發(fā)送短信量在設定時間內(nèi)是否超過設定的門限值,如果是,則刪除所緩存的疑似垃圾短信并刪除后續(xù)所緩存的該發(fā)送端發(fā)送的疑似垃圾短信,如果否,則將所緩存的疑似垃圾短信轉(zhuǎn)發(fā)出去。在監(jiān)控的時間段內(nèi),繼續(xù)將從該發(fā)送端接收的被判定為疑似垃圾短信進行緩存。這樣,就可以防止該發(fā)送端前期發(fā)送的大量垃圾短信被通信網(wǎng)絡側(cè)轉(zhuǎn)發(fā),進一步提高垃圾短信的監(jiān)控率。以下對本發(fā)明提供的系統(tǒng)、裝置及方法進行詳細說明。圖1為本發(fā)明提供的垃圾短信監(jiān)控與處理的系統(tǒng)示意圖,該系統(tǒng)包括終端、短信中心/短信網(wǎng)關、垃圾短信處理裝置及營帳支撐系統(tǒng)(BOSS),其中,終端,用于作為發(fā)送端向短信中心/短信網(wǎng)關發(fā)送短信,作為接收端從短信中心/ 短信網(wǎng)關接收短信;短信中心/短信網(wǎng)關,用于從作為發(fā)送端的終端接收到短信后,發(fā)送給垃圾短信處理裝置,從垃圾短信處理裝置中接收到非垃圾短信后,發(fā)送給作為接收端的終端;垃圾短信處理裝置,用于設置由相關聯(lián)的關鍵詞組成的基本關鍵詞規(guī)則、根據(jù)相關聯(lián)的關鍵詞按照諧音、同形或字形拆分原則得到的關鍵詞衍生序列及垃圾短信疑似度。 從短信中心/短信網(wǎng)關接收短信時,采用基本關鍵詞規(guī)則匹配,如果匹配成功,則將該短信作為垃圾短信刪除,將判決結(jié)果發(fā)送給BOSS,如果匹配不成功,采用關鍵詞衍生序列進行匹配并計算匹配的垃圾短信疑似值,如果所計算的垃圾短信疑似值大于等于設置的垃圾短信疑似度上范圍,將該短信作為垃圾短信刪除,將判決結(jié)果發(fā)送給BOSS,如果小于等于設置的垃圾短信疑似度下范圍,將該短信作為非垃圾短信發(fā)送給短信中心/短信網(wǎng)關;BOSS,用于從垃圾短信處理裝置接收判決結(jié)果,對發(fā)送該垃圾短信的作為發(fā)送端的終端進行處理。在該系統(tǒng)中,垃圾短信處理裝置,還用于設置垃圾短信疑似度為一個范圍,當所計算的垃圾短信疑似值在該垃圾短信疑似度范圍之內(nèi)時,將該短信作為疑似垃圾短信進一步采用流量控制方式進行監(jiān)控和處理緩存該疑似垃圾短信,然后通過短信中心/短信網(wǎng)關對發(fā)送該疑似垃圾短信的作為發(fā)送端的終端監(jiān)控,確定其發(fā)送短信量在設定時間內(nèi)是否超過設定的門限值,如果是,刪除所緩存的疑似垃圾短信并刪除后續(xù)所緩存的該發(fā)送端通過短信中心/短信網(wǎng)關發(fā)送的疑似垃圾短信,如果否,將所緩存的疑似垃圾短信作為非垃圾短信發(fā)送給短信中心/短信網(wǎng)關,在監(jiān)控的時間段內(nèi),繼續(xù)通過短信中心/短信網(wǎng)關將從作為發(fā)送端的終端接收的被判定為疑似垃圾短信進行緩存。在該系統(tǒng)中,垃圾短信處理裝置在采用關鍵詞方式過濾之前,或采用流量控制方式之后,還包括對還未認定為垃圾短信的短信進行黑名單方式過濾設置黑名單,如果發(fā)送該短信的作為發(fā)送端的終端在黑名單中,則認為該短信為垃圾短信;否則,則不是垃圾短
信°在該系統(tǒng)中,短信中心/短信網(wǎng)關就是短信轉(zhuǎn)發(fā)處理的裝置,其中的“/”表示短信中心和短信網(wǎng)關可以集成在一個裝置中,也可以作為兩個獨立的裝置,短信中心用于控制短信網(wǎng)關的各個執(zhí)行,短信網(wǎng)關用于轉(zhuǎn)發(fā)短信。在該系統(tǒng)中,BOSS是通信網(wǎng)絡側(cè)中的控制終端各種業(yè)務的啟用和停止裝置,可以根據(jù)判決結(jié)果對發(fā)送該垃圾短信的作為發(fā)送端的終端進行短信業(yè)務的停止,在判決結(jié)果中具有發(fā)送垃圾短息的發(fā)送端信息。圖2為本發(fā)明提供的垃圾短信監(jiān)控與處理的裝置結(jié)構(gòu)示意圖,如圖所示,包括短信中心/短信網(wǎng)關接口模塊、過濾模塊及BOSS接口模塊,其中,短信中心/短信網(wǎng)關接口模塊,用于從短信中心/短信網(wǎng)關接收短信,將判定為非垃圾短信的短信發(fā)送給短信中心/短信網(wǎng)關;過濾模塊,用于設置由相關聯(lián)的關鍵詞組成的基本關鍵詞規(guī)則、根據(jù)相關聯(lián)的關鍵詞按照諧音、同形或字形拆分原則得到的關鍵詞衍生序列及垃圾短信疑似度。從短信中心/短信網(wǎng)關接口模塊接收短信,采用基本關鍵詞規(guī)則匹配,如果匹配成功,則將該短信作為垃圾短信并刪除,將判決結(jié)果發(fā)送給BOSS接口模塊,如果匹配不成功,采用關鍵詞衍生序列進行匹配并計算匹配的垃圾短信疑似值,如果所計算的垃圾短信疑似值大于等于設置的垃圾短信疑似度上范圍,將該短信作為垃圾短信并刪除,將判決結(jié)果發(fā)送給BOSS接口模塊,如果小于等于設置的垃圾短信疑似度下范圍,將該短信作為非垃圾短信發(fā)送給短信中心/短信網(wǎng)關接口模塊;BOSS接口模塊,用于從過濾模塊接收垃圾短信的判決結(jié)果。在該裝置的過濾模塊中,具體包括關鍵詞過濾模塊及關鍵詞規(guī)則庫,其中,關鍵詞過濾模塊,用于從短信中心/短信網(wǎng)關接口模塊接收短信時,采用關鍵詞規(guī)則庫中的基本關鍵詞規(guī)則匹配,如果匹配成功,將該短信作為垃圾短信并刪除,將判決結(jié)果發(fā)送給BOSS 接口模塊,如果匹配不成功,采用關鍵詞規(guī)則庫中的關鍵詞衍生序列進行匹配并計算匹配的垃圾短信疑似值,如果所計算的垃圾短信疑似值大于等于設置的垃圾短信疑似度上范圍,將該短信作為垃圾短信并刪除,將判決結(jié)果發(fā)送給BOSS接口模塊,如果小于等于設置的垃圾短信疑似度下范圍,將該短信作為非垃圾短信發(fā)送給短信中心/短信網(wǎng)關接口模塊;關鍵詞規(guī)則庫,用于存儲設置的基本關鍵詞規(guī)則、關鍵詞衍生序列及垃圾短信疑似度。
在該裝置中的過濾模塊中,還包括流量控制模塊,用于設置的垃圾短信疑似度為一個范圍時,所計算的垃圾短信疑似值在該垃圾短信疑似度范圍之內(nèi),將該短信作為疑似垃圾短信進一步采用流量控制方式進行監(jiān)控和處理緩存該疑似垃圾短信,然后通過短信中心/短信網(wǎng)關接口對發(fā)送該疑似垃圾短信的作為發(fā)送端的終端監(jiān)控,確定其發(fā)送短信量在設定時間內(nèi)是否超過設定的門限值,如果是,刪除所緩存的疑似垃圾短信并刪除后續(xù)所緩存的該發(fā)送端通過短信中心/短信網(wǎng)關接口發(fā)送的疑似垃圾短信,如果否,將所緩存的疑似垃圾短信作為非垃圾短信發(fā)送給短信中心/短信網(wǎng)關接口,在監(jiān)控的時間段內(nèi),繼續(xù)通過短信中心/短信網(wǎng)關將從作為發(fā)送端的終端接收的被判定為疑似垃圾短信進行緩存。在該裝置中的過濾模塊中,還包括黑名單控制模塊,用于在采用關鍵詞方式過濾之前,或采用流量控制方式之后,還包括對還未認定為垃圾短信的短信進行黑名單方式過濾設置黑名單,如果發(fā)送該短信的作為發(fā)送端的終端在黑名單中,則認為該短信為垃圾短信;否則,則不是垃圾短信。在該裝置的過濾模塊中,還包括面向用戶的接口模塊,用于對關鍵詞規(guī)則庫中的基本關鍵詞規(guī)則、關鍵詞衍生序列及垃圾短信疑似度進行設置,還用于進行黑名單設置及流量門限值進行設置。圖3為本發(fā)明提供的垃圾短信監(jiān)控與處理的方法流程圖,設置由相關聯(lián)的關鍵詞組成的基本關鍵詞規(guī)則、根據(jù)相關聯(lián)的關鍵詞按照諧音、同形或字形拆分原則得到的關鍵詞衍生序列及垃圾短信疑似度,其具體步驟為步驟301,通信網(wǎng)絡側(cè)接收短信,采用所設置的基本關鍵詞規(guī)則規(guī)則對短信內(nèi)容進行匹配,確定是否匹配成功,如果是,轉(zhuǎn)入步驟302 ;如果否,轉(zhuǎn)入步驟303 ;步驟302、通信網(wǎng)絡側(cè)將該短信作為垃圾短信并刪除,并上報判決結(jié)果;步驟303、通信網(wǎng)絡側(cè)采用所設置的關鍵詞衍生序列對該短信內(nèi)容進行匹配并計算匹配的垃圾短信疑似值,判斷所計算的垃圾短信疑似值是否大于等于所設置的垃圾短信疑似度上范圍,如果是,轉(zhuǎn)入步驟302 ;如果否,轉(zhuǎn)入步驟304 ;在本步驟中,如果否,表示小于等于所設置的垃圾短信疑似度下范圍;步驟304、通信網(wǎng)絡側(cè)將該短信作為非垃圾短信進行轉(zhuǎn)發(fā)。在該實施例中,采用所設置的基本關鍵詞規(guī)則規(guī)則對短信內(nèi)容進行匹配之前,還包括將該短信的短信內(nèi)容中的非中文字符刪除。在該實施例中,計算匹配的垃圾短信疑似值的方法流程如圖4所示,其具體步驟為步驟401、通信網(wǎng)絡側(cè)將關鍵詞衍生序列中的每個關鍵詞衍生字或衍生詞順序與該短信的內(nèi)容進行匹配,如果匹配成功,記錄所匹配成功的關鍵詞衍生字或衍生詞對應的垃圾短信疑似值及匹配成功的短信內(nèi)容位置,轉(zhuǎn)入步驟402 ;如果沒有匹配成功,則進行下一個關鍵詞衍生字或衍生詞的匹配,轉(zhuǎn)入步驟401繼續(xù)執(zhí)行,直到關鍵詞衍生序列中的每個關鍵詞衍生字或衍生詞都被匹配過,轉(zhuǎn)入步驟403 ;步驟402、通信網(wǎng)絡側(cè)繼續(xù)將已匹配成功的關鍵詞衍生字或衍生詞進行匹配成功的短信內(nèi)容位置后的匹配,確定是否匹配成功,如果沒有成功,則進行下一個關鍵詞衍生字或衍生詞的匹配,轉(zhuǎn)入步驟401繼續(xù)執(zhí)行;如果否,則記錄下一個匹配成功的短信內(nèi)容位置,計算垃圾短信疑似值為下一個垃圾短信疑似值除以下一個垃圾短信疑似值與匹配成功的短信內(nèi)容位置與下一匹配成功的短信內(nèi)容位置之差后,與垃圾短信疑似值的和作為該衍生字或衍生詞的垃圾短信疑似值,繼續(xù)轉(zhuǎn)入步驟402進行匹配,直到對該短信內(nèi)容都匹配完,進行下一個關鍵詞衍生字或衍生詞的匹配,轉(zhuǎn)入步驟401執(zhí)行;步驟403、通信網(wǎng)絡側(cè)將所有得到的每個關鍵詞衍生字或衍生詞的垃圾短信疑似值相加,得到最終匹配的垃圾短信疑似值。在本發(fā)明中,所設置的基本關鍵詞規(guī)則是判斷垃圾短信的一組相關聯(lián)的基本關鍵詞組合,如規(guī)則1 “代開” + “發(fā)票”;規(guī)則2 “法輪功”;規(guī)則3 “槍支” + “代購”等等。 所設置的關鍵詞衍生序列是以每條基本關鍵詞規(guī)則中的每個關鍵詞為單位,以組成每個關鍵詞的字為目標,將這些關鍵字按照諧音、同形或/和字形拆分等原則進行關鍵字衍生形成。在這里,關鍵字進行衍生后,一個關鍵字可能衍生為一個詞,每個衍生出的關鍵字都對應設置有一個垃圾短信疑似值ρ (0 < ρ < 1),ρ由通信網(wǎng)絡側(cè)根據(jù)該關鍵字在漢字中的常用度及在垃圾短信中出現(xiàn)的頻率預先設定。比如上述規(guī)則3中的關鍵詞“槍支”,進行關鍵字衍生后,以“槍”字形成衍生序列“槍(0. 3) ”、“搶(0. 1) ”、“嗆(0. 1) ”、“木倉(0. 5) ”、“滄 (0. 1)”...,以“支”字形成衍生序列“支(0. 2)”、“只(0. 1)”及“技(0. 1)”...。在本發(fā)明中,垃圾短信疑似度P是判斷短信是否為垃圾短信的度量值,其大于等于0,如大于設定的疑似垃圾短信門限Tl,如80%,則認為是垃圾短信,如在設定為一定范圍內(nèi)時且短信經(jīng)過判定后落入到范圍內(nèi)時,如50% < ρ < 80%,則認為是疑似垃圾短信,如果小于等于50%,可以認為非垃圾短信。舉一個具體例子說明計算匹配的垃圾短信疑似值過程?;娟P鍵詞規(guī)則“槍支” + “代購”關鍵詞衍生序列關鍵詞“槍支”“槍”衍生字序列{槍(0. 5),搶(0. 1),嗆(0. 1), 木倉(0.5),滄(0. 1)};“支”衍生字序列{支(0. 1),只(0. 1),伎(0. 1)};關鍵詞“代購”“代”衍生字序列{代(0.1),帶(0.1),伐(0.1),貸(0.1),袋 (0. 1)};“購”衍生字序列{購(0. 1),溝(0. 1),鉤(0. 1),夠(0. 1),貝勾(0.5)}。通信網(wǎng)絡側(cè)接收到短信的內(nèi)容短信內(nèi)容為“&帶&----貝勾各類木倉
----支,有需要請聯(lián)系王某1381199900”,(備注,上述內(nèi)容中“一”為漢字一,并非英
文橫線字符)。經(jīng)過了非中文字符的刪除預處理后變?yōu)椤皫?---購各類木倉----
支,有需要請聯(lián)系王某1381199900”。根據(jù)匹配算法,關鍵詞“代購”的匹配結(jié)果為帶(0.1),位置1,貝勾(0.5),位置6; 所以P = 0+0. 1+0. 5/(6-1) = 0. 2 ;關鍵詞“槍支”的匹配結(jié)果為木倉(0. 5),位置10,支 (0. 1),位置15,所以P = O. 2+0. 5+0. 1/5 = 0. 72 ;最終,該短信的垃圾短信疑似值為0. 92, 超過了所設置的垃圾短信疑似度80%,所以被判定為垃圾短信。在本發(fā)明中,還可以將所提供的關鍵詞過濾方式與所提供的流量控制方式結(jié)合進行垃圾短信的監(jiān)控,當然,也可以在結(jié)合方案之前或之后進一步采用黑名單過濾方式進一步對垃圾短信進行監(jiān)控。圖5為本發(fā)明提供的垃圾短信監(jiān)控與處理的方法實施例流程圖,其具體步驟為步驟501、通信系統(tǒng)網(wǎng)絡側(cè)接收到短信后,采用設置的黑名單對發(fā)送該短信的發(fā)送端進行匹配,如果匹配成功,則確定該短信為垃圾短信,刪除并上報判定結(jié)果;如果否,則執(zhí)行步驟502 ;
步驟502、通信網(wǎng)絡側(cè)采用所設置的基本關鍵詞規(guī)則規(guī)則對短信內(nèi)容進行匹配,確定是否匹配成功,如果是,轉(zhuǎn)入步驟503 ;如果否,轉(zhuǎn)入步驟504 ;步驟503、通信網(wǎng)絡側(cè)將該短信作為垃圾短信,刪除該垃圾短信,并上報判決結(jié)果, 將發(fā)送該垃圾短信的發(fā)送端設置在黑名單中;步驟504、通信網(wǎng)絡側(cè)采用所設置的關鍵詞衍生序列對該短信內(nèi)容進行匹配并計算匹配的垃圾短信疑似值,判斷所計算的垃圾短信疑似值是否大于等于所設置的垃圾短信疑似度,如果是,轉(zhuǎn)入步驟503 ;如果否,則轉(zhuǎn)入步驟505 ;步驟505、通信網(wǎng)絡側(cè)判斷所計算的垃圾短信疑似值是否在疑似垃圾短信疑似度的范圍內(nèi),如果是,執(zhí)行步驟506 ;如果否,將該短信作為非垃圾短信進行轉(zhuǎn)發(fā);步驟506、通信網(wǎng)絡側(cè)緩存該疑似垃圾短信,對發(fā)送該垃圾短信的發(fā)送端監(jiān)控,確定其發(fā)送短信量在設定時間內(nèi)是否超過設定的門限值,如果是,執(zhí)行步驟507;如果否,執(zhí)行步驟508 ;在本步驟中,假設設定時間為30秒,在30秒內(nèi)統(tǒng)計發(fā)送該疑似垃圾短信的發(fā)送端發(fā)送的短信數(shù)量,如果超過設定的門限值,則執(zhí)行步驟507 ;如果否,執(zhí)行步驟508 ;在本步驟中,在監(jiān)控的時間段內(nèi),繼續(xù)將從該作為發(fā)送端的終端通過短信中心/ 短信網(wǎng)絡接收的垃圾短信進行緩存;步驟507、通信網(wǎng)絡側(cè)刪除所緩存的垃圾短信并刪除后續(xù)所緩存的垃圾短信,上報判定結(jié)果,將發(fā)送該疑似垃圾短信的發(fā)送端設置在黑名單中;步驟508、通信網(wǎng)絡網(wǎng)絡將所緩存的疑似垃圾短信轉(zhuǎn)發(fā)給接收端。舉一個具體例子說明通信網(wǎng)絡側(cè)接收到發(fā)送端發(fā)送的短信5條,其中一條被判定為疑似垃圾短信,則通信網(wǎng)絡側(cè)將緩存這條被判定為疑似垃圾短信的短信,啟動設定定時器,時間為30秒。在30秒內(nèi),如果繼續(xù)收到該發(fā)送端發(fā)送的短信且被判定為疑似垃圾短信,就繼續(xù)緩存,等到定時器到時時,統(tǒng)計所緩存的該發(fā)送端發(fā)送的疑似垃圾短信數(shù)目,是否超過設定的門限3,如果是,則判定這些疑似垃圾短信為垃圾短信,如果否,則將疑似垃圾短信確定為非垃圾短信,進行轉(zhuǎn)發(fā)處理。在本發(fā)明中,采用關鍵詞過濾方式監(jiān)控短信,往往不能100%確認是否為垃圾短信。這是因為垃圾短信內(nèi)容很容易變化,要完全匹配基本關鍵詞規(guī)則中的關鍵詞,是比較困難的,對于根據(jù)關鍵字衍生序列得到的部分匹配情況,就需要根據(jù)其度量值確定是否為疑似垃圾短信還是垃圾短信,進行不同的處理過程。比如基本關鍵詞過濾規(guī)則為“發(fā)票”+“代開” + “聯(lián)系”,短信內(nèi)容匹配了其中的“發(fā)票” + “聯(lián)系”,則將該短信定位疑似垃圾短信。以上舉較佳實施例,對本發(fā)明的目的、技術方案和優(yōu)點進行了進一步詳細說明,所應理解的是,以上所述僅為本發(fā)明的較佳實施例而已,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換和改進等,均應包含在本發(fā)明的保護范圍之內(nèi)。
1權(quán)利要求
1.一種垃圾短信監(jiān)控與處理的系統(tǒng),其特征在于,該系統(tǒng)包括終端、短信中心/短信網(wǎng)關、垃圾短信處理裝置及營帳支撐系統(tǒng)BOSS,其中,終端,用于作為發(fā)送端向短信中心/短信網(wǎng)關發(fā)送短信,作為接收端從短信中心/短信網(wǎng)關接收短信;短信中心/短信網(wǎng)關,用于從作為發(fā)送端的終端接收到短信后,發(fā)送給垃圾短信處理裝置,從垃圾短信處理裝置中接收到非垃圾短信后,發(fā)送給作為接收端的終端;垃圾短信處理裝置,用于設置基本關鍵詞規(guī)則、關鍵詞衍生序列及垃圾短信疑似度,從短信中心/短信網(wǎng)關接收短信,采用基本關鍵詞規(guī)則匹配,如果匹配成功,將該短信作為垃圾短信刪除,將判決結(jié)果發(fā)送給BOSS,如果匹配不成功,采用關鍵詞衍生序列匹配并計算匹配的垃圾短信疑似值,如果計算的垃圾短信疑似值在所設置的垃圾短信疑似值范圍內(nèi),將該短信作為疑似垃圾短信,如果大于等于設置的垃圾短信疑似度上范圍,將該短信作為垃圾短信刪除,將判決結(jié)果發(fā)送給BOSS,如果小于等于設置的垃圾短信疑似度下范圍,將該短信作為非垃圾短信發(fā)送給短信中心/短信網(wǎng)關;BOSS,用于從垃圾短信處理裝置接收判決結(jié)果,對發(fā)送該垃圾短信的作為發(fā)送端的終端進行處理。
2.如權(quán)利要求1所述的系統(tǒng),其特征在于,所述垃圾短信處理裝置,還用于將疑似垃圾短信緩存,通過短信中心/短信網(wǎng)關對發(fā)送該疑似垃圾短信的作為發(fā)送端的終端監(jiān)控,確定其發(fā)送短信量在設定時間內(nèi)是否超過設定的門限值,如果是,刪除所緩存的疑似垃圾短信并刪除后續(xù)所緩存的該發(fā)送端通過短信中心/短信網(wǎng)關發(fā)送的疑似垃圾短信,如果否, 將所緩存的疑似垃圾短信作為非垃圾短信發(fā)送給短信中心/短信網(wǎng)關,在監(jiān)控時間段內(nèi), 繼續(xù)緩存通過短信中心/短信網(wǎng)關將從作為發(fā)送端的終端接收的被判定為疑似垃圾短信。
3.如權(quán)利要求2所述的系統(tǒng),其特征在于,所述垃圾短信處理裝置,還用于對還未認定為垃圾短信的短信進行黑名單方式過濾設置黑名單,如果發(fā)送該短信的作為發(fā)送端的終端在黑名單中,認為該短信為垃圾短信;否則,不是垃圾短信。
4.一種垃圾短信監(jiān)控與處理的裝置,其特征在于,該裝置包括短信中心/短信網(wǎng)關接口模塊、過濾模塊及BOSS接口模塊,其中,短信中心/短信網(wǎng)關接口模塊,用于從短信中心/短信網(wǎng)關接收短信,將判定為非垃圾短信的短信發(fā)送給短信中心/短信網(wǎng)關;過濾模塊,用于設置基本關鍵詞規(guī)則、關鍵詞衍生序列及垃圾短信疑似度。從短信中心 /短信網(wǎng)關接口模塊接收短信,采用基本關鍵詞規(guī)則匹配,如果匹配成功,將該短信作為垃圾短信并刪除,將判決結(jié)果發(fā)送給BOSS接口模塊,如果匹配不成功,采用關鍵詞衍生序列匹配并計算匹配的垃圾短信疑似值,如果計算的垃圾短信疑似值在所設置的垃圾短信疑似值范圍內(nèi),將該短信作為疑似垃圾短信,如果計算的垃圾短信疑似值大于等于設置的垃圾短信疑似度上范圍,將該短信作為垃圾短信并刪除,將判決結(jié)果發(fā)送給BOSS接口模塊,如果小于等于設置的垃圾短信疑似度下范圍,將該短信作為非垃圾短信發(fā)送給短信中心/短信網(wǎng)關接口模塊;BOSS接口模塊,用于從過濾模塊接收垃圾短信的判決結(jié)果。
5.如權(quán)利要求4所述的裝置,其特征在于,所述過濾模塊中包括關鍵詞過濾模塊及關鍵詞規(guī)則庫,其中,關鍵詞過濾模塊,用于從短信中心/短信網(wǎng)關接口模塊接收短信時,采用關鍵詞規(guī)則庫中的基本關鍵詞規(guī)則匹配,如果匹配成功,將該短信作為垃圾短信并刪除,將判決結(jié)果發(fā)送給BOSS接口模塊,如果匹配不成功,采用關鍵詞規(guī)則庫中的關鍵詞衍生序列匹配并計算匹配的垃圾短信疑似值,如果計算的垃圾短信疑似值在所設置的垃圾短信疑似值范圍內(nèi), 將該短信作為疑似垃圾短信,如果計算的垃圾短信疑似值大于等于設置的垃圾短信疑似度上范圍,將該短信作為垃圾短信并刪除,將判決結(jié)果發(fā)送給BOSS接口模塊,如果小于等于設置的垃圾短信疑似度下范圍,將該短信作為非垃圾短信發(fā)送給短信中心/短信網(wǎng)關接口模塊;關鍵詞規(guī)則庫,用于存儲設置的基本關鍵詞規(guī)則、關鍵詞衍生序列及垃圾短信疑似度。
6.如權(quán)利要求4或5所述的裝置,其特征在于,所述過濾模塊,還包括面向用戶的接口模塊,用于對關鍵詞規(guī)則庫中的基本關鍵詞規(guī)則、關鍵詞衍生序列及垃圾短信疑似度進行設置。
7.如權(quán)利要求6所述的裝置,其特征在于,所述過濾模塊還包括流量控制模塊,用于將疑似垃圾短信緩存,通過短信中心/短信網(wǎng)關接口對發(fā)送該疑似垃圾短信的作為發(fā)送端的終端監(jiān)控,確定其發(fā)送短信量在設定時間內(nèi)是否超過設定的門限值,如果是,刪除所緩存的疑似垃圾短信并刪除后續(xù)所緩存的該發(fā)送端通過短信中心/短信網(wǎng)關接口發(fā)送的疑似垃圾短信,如果否,將所緩存的疑似垃圾短信作為非垃圾短信發(fā)送給短信中心/短信網(wǎng)關接口,在監(jiān)控時間段內(nèi),繼續(xù)緩存通過短信中心/短信網(wǎng)關將從作為發(fā)送端的終端接收的被判定為疑似垃圾短信。
8.如權(quán)利要求7所述的裝置,其特征在于,所述過濾模塊還包括黑名單控制模塊,用于對還未認定為垃圾短信的短信進行黑名單方式過濾設置黑名單,如果發(fā)送該短信的作為發(fā)送端的終端在黑名單中,認為該短信為垃圾短信;否則,則不是垃圾短信。
9.一種垃圾短信監(jiān)控與處理的方法,其特征在于,設置基本關鍵詞規(guī)則、關鍵詞衍生序列及垃圾短信疑似度,該方法包括接收短信,采用所設置的基本關鍵詞規(guī)則規(guī)則對短信內(nèi)容進行匹配,確定是否匹配成功,如果是,將該短信作為垃圾短信并刪除,上報判決結(jié)果;如果否,采用所設置的關鍵詞衍生序列對該短信內(nèi)容進行匹配并計算匹配的垃圾短信疑似值,如果計算的垃圾短信疑似值在所設置的垃圾短信疑似值范圍內(nèi),將該短信作為疑似垃圾短信,如果計算的垃圾短信疑似值大于等于設置的垃圾短信疑似度上范圍,將該短信作為垃圾短信并刪除,并上報判決結(jié)果,如果小于等于設置的垃圾短信疑似度下范圍,將該短信作為非垃圾短信發(fā)送。
10.如權(quán)利要求9所述的方法,其特征在于,所述所設置的基本關鍵詞規(guī)則規(guī)則對短信內(nèi)容進行匹配之前,還包括將該短信的短信內(nèi)容中的非中文字符刪除。
11.如權(quán)利要求9或10所述的方法,其特征在于,所述計算匹配的垃圾短信疑似值a、將關鍵詞衍生序列中的每個衍生字詞順序與該短信內(nèi)容匹配,如果成功,記錄匹配成功的衍生字詞對應的垃圾短信疑似值及匹配成功的短信內(nèi)容位置,轉(zhuǎn)入步驟b;如果沒有匹配成功,進行下一個衍生字詞的匹配,直到關鍵詞衍生序列中的每個衍生字詞都被匹配過,轉(zhuǎn)入步驟C;b、將已匹配成功的衍生字詞進行匹配成功的短信內(nèi)容位置后的匹配,如果沒有成功, 進行下一個衍生字詞的匹配;如果否,則記錄下一個匹配成功的短信內(nèi)容位置,計算該衍生字詞的垃圾短信疑似值為下一個垃圾短信疑似值除以下一個垃圾短信疑似值與匹配成功的短信內(nèi)容位置與下一匹配成功的短信內(nèi)容位置之差,繼續(xù)轉(zhuǎn)入步驟b進行匹配,直到該衍生字詞對該短信內(nèi)容都匹配完,進行下一個衍生字詞的匹配;C、將所有得到的每個衍生字詞的垃圾短信疑似值相加,得到該短信的垃圾短信疑似值。
12.如權(quán)利要求9或10所述的方法,其特征在于,在將該短信作為疑似垃圾短信之后, 該方法還包括將該短信作為疑似垃圾短信緩存,對發(fā)送該疑似垃圾短信的發(fā)送端監(jiān)控,確定其發(fā)送短信量在設定時間內(nèi)是否超過設定的門限值,如果是,刪除所緩存的疑似垃圾短信并刪除后續(xù)所緩存的該發(fā)送端發(fā)送的疑似垃圾短信,如果否,將所緩存的疑似垃圾短信作為非垃圾短信轉(zhuǎn)發(fā),在監(jiān)控的時間段內(nèi),繼續(xù)緩存從發(fā)送端接收被判定為疑似垃圾短信。
13.如權(quán)利要求12所述的方法,其特征在于,該方法還包括對被判定為非垃圾短信的短信采用所設置的黑名單過濾,進一步確定是否為非垃圾短信。
全文摘要
本發(fā)明公開了一種垃圾短信監(jiān)控與處理的系統(tǒng)裝置及方法,設置基本關鍵詞規(guī)則、關鍵詞衍生序列及垃圾短信疑似度,該方法包括接收短信,采用所設置的基本關鍵詞規(guī)則規(guī)則對短信內(nèi)容進行匹配,確定是否匹配成功,如果是,將該短信作為垃圾短信并刪除,上報判決結(jié)果;如果否,采用所設置的關鍵詞衍生序列對該短信內(nèi)容進行匹配并計算匹配的垃圾短信疑似值,如果計算的垃圾短信疑似值在所設置的垃圾短信疑似值范圍內(nèi),將該短信作為疑似垃圾短信,如果計算的垃圾短信疑似值大于等于設置的垃圾短信疑似度上范圍,將該短信作為垃圾短信并刪除,并上報判決結(jié)果,如果小于等于設置的垃圾短信疑似度下范圍,將該短信作為非垃圾短信發(fā)送。本發(fā)明在采用關鍵詞過濾方式監(jiān)控與處理時,降低誤監(jiān)控率及漏監(jiān)控率。
文檔編號H04W12/12GK102547621SQ20101061853
公開日2012年7月4日 申請日期2010年12月23日 優(yōu)先權(quán)日2010年12月23日
發(fā)明者黃卿 申請人:中國移動通信集團公司