欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

短信攔截方法及裝置、云端服務(wù)器的制造方法

文檔序號:7812039閱讀:325來源:國知局
短信攔截方法及裝置、云端服務(wù)器的制造方法
【專利摘要】本發(fā)明提供了一種短信攔截方法及裝置、云端服務(wù)器,其中,所述短信攔截方法包括:接收短信攔截裝置上傳的短信;對短信的文本內(nèi)容進(jìn)行分詞處理,獲得文本內(nèi)容的關(guān)鍵詞;獲取每一關(guān)鍵詞屬于垃圾短信的第一概率權(quán)重值,屬于正常短信的第二概率權(quán)重值;獲取關(guān)鍵詞的所有第一概率權(quán)重值的第一聯(lián)合概率,所有關(guān)鍵詞的所有第二概率權(quán)重值的第二聯(lián)合概率;根據(jù)第一聯(lián)合概率和所述第二聯(lián)合概率,確定短信是否屬于垃圾短信;向短信攔截裝置發(fā)送通知信息,通知信息包括:所述短信是否屬于垃圾短信的信息,以使所述短信攔截裝置根據(jù)所述通知信息確定是否攔截當(dāng)前接收的短信。上述方法能夠解決現(xiàn)有技術(shù)中垃圾短信識別率低、攔截效率低,成本高的問題。
【專利說明】短信攔截方法及裝置、云端服務(wù)器

【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及通信【技術(shù)領(lǐng)域】,尤其涉及一種短信攔截方法及裝置、云端服務(wù)器。

【背景技術(shù)】
[0002]隨著移動通信業(yè)務(wù)的發(fā)展、手機(jī)的普及和短信的資費(fèi)的下降,用戶使用短信傳遞信息越來越多。但是,用戶接收廣告短信、詐騙短信等垃圾短信的次數(shù)越來越多,垃圾短信越來越泛濫,已經(jīng)嚴(yán)重影響到用戶對短信使用的感受,超出了用戶的忍受限度。針對垃圾短信進(jìn)行治理已經(jīng)刻不容緩。
[0003]目前,垃圾短信治理主要采用了自動過濾和人工過濾兩種手段。垃圾短信的攔截主要有三種方式:(I)通過關(guān)鍵字自動過濾滿足條件的用戶進(jìn)入黑名單;(2)滿足一定寬松過濾條件的短信由人工臺審核,人工臺確認(rèn)是垃圾短信的將用戶加入黑名單;(3)接收垃圾短信用戶發(fā)送短信舉報(bào),人工臺審核確認(rèn)是垃圾短信后將被舉報(bào)手機(jī)號碼加入黑名單。
[0004]從目前的垃圾短信的治理所采用的幾種手段的結(jié)果來看,垃圾短信發(fā)送者往往通過特殊格式變化和發(fā)送流量控制來規(guī)避自動過濾,所以自動過濾的攔截效率很低。
[0005]人工臺審核確認(rèn)需要人工臺24小時的值班人員來審核用戶通過短信舉報(bào)所舉報(bào)的垃圾內(nèi)容,確認(rèn)是垃圾短信則將用戶添加到黑名單。如果不進(jìn)行人工審核,往往會發(fā)生惡意舉報(bào)別人或誤舉報(bào)的情況。而通過人工臺來過濾垃圾短信成本太高,而且信息安全受影響。
[0006]綜上所述,從目前的垃圾短信的治理情況來看,垃圾短信自動過濾效果不好,而人工臺過濾垃圾短信則成本太高。


【發(fā)明內(nèi)容】

[0007]針對現(xiàn)有技術(shù)中的缺陷,本發(fā)明提供一種短信攔截方法及裝置、云端服務(wù)器,解決現(xiàn)有技術(shù)中垃圾短信識別率低、攔截效率低,成本高的問題。
[0008]第一方面,本發(fā)明提供了一種短信攔截方法,包括:
[0009]接收短信攔截裝置上傳的短信;
[0010]對所述短信的文本內(nèi)容進(jìn)行分詞處理,獲得所述文本內(nèi)容的關(guān)鍵詞;
[0011]獲取每一關(guān)鍵詞屬于垃圾短信的第一概率權(quán)重值,屬于正常短信的第二概率權(quán)重值;
[0012]獲取所有關(guān)鍵詞的所有第一概率權(quán)重值的第一聯(lián)合概率,所有關(guān)鍵詞的所有第二概率權(quán)重值的第二聯(lián)合概率;
[0013]根據(jù)所述第一聯(lián)合概率和所述第二聯(lián)合概率,確定所述短信是否屬于垃圾短信;
[0014]向所述短信攔截裝置發(fā)送通知信息,所述通知信息包括:所述短信是否屬于垃圾短信的信息,以使所述短信攔截裝置根據(jù)所述通知信息確定是否攔截當(dāng)前接收的短信。
[0015]可選地,所述獲取每一關(guān)鍵詞屬于垃圾短信的第一概率權(quán)重值,屬于正常短信的第二概率權(quán)重值,包括:
[0016]針對每一個關(guān)鍵詞,
[0017]在預(yù)先訓(xùn)練的貝葉斯模型中查找與該關(guān)鍵詞匹配的特征詞,并獲取所述特征詞的正向權(quán)重值和負(fù)向權(quán)重值;
[0018]將所述特征詞的正向權(quán)重值作為與該關(guān)鍵詞的第一概率權(quán)重值;
[0019]將所述特征詞的負(fù)向權(quán)重值作為與該關(guān)鍵詞的第二概率權(quán)重值。
[0020]可選地,對所述短信的文本內(nèi)容進(jìn)行分詞處理,獲得所述文本內(nèi)容的關(guān)鍵詞,包括:
[0021]在所述文本內(nèi)容包括特殊符號時,剔除所述文本內(nèi)容的特殊符號,對剔除特殊符號的文本內(nèi)容進(jìn)行分詞處理,并確定分詞處理后各中文詞/字的詞性、確定相鄰中文詞/字的組合性;
[0022]根據(jù)所述分詞處理后的中文詞/字的詞性、所述相鄰中文詞/字的組合性,獲得所述文本內(nèi)容的關(guān)鍵詞。
[0023]可選地,對所述短信的文本內(nèi)容進(jìn)行分詞處理,獲得所述文本內(nèi)容的關(guān)鍵詞,還包括:
[0024]在所述文本內(nèi)容包括數(shù)字和/或字母時,對所述文本內(nèi)容進(jìn)行分詞處理,并提取所述文本內(nèi)容中的數(shù)字和/或字母;
[0025]相應(yīng)地,根據(jù)所述第一聯(lián)合概率和所述第二聯(lián)合概率,確定所述短信為垃圾短信之后,所述方法還包括:
[0026]判斷所述文本內(nèi)容中的數(shù)字和/或字母是否是手機(jī)號碼、座機(jī)號碼、賬號信息中的一種或多種;
[0027]如果是,則將所述文本內(nèi)容中的數(shù)字和/或字母加入發(fā)送短信攔截裝置的黑名單中。
[0028]可選地,接收短信攔截裝置上傳的短信之后,所述方法還包括:
[0029]確定所述短信的源號碼,并確定所述源號碼在預(yù)設(shè)時間段內(nèi)發(fā)送短信的數(shù)量;
[0030]若所述源號碼在預(yù)設(shè)時間段內(nèi)發(fā)送短信的數(shù)量超過預(yù)設(shè)閾值,則向所述短信攔截裝置發(fā)送所述短信為垃圾短信的信息,且不執(zhí)行對所述短信的文本內(nèi)容進(jìn)行分詞處理的步驟。
[0031]第二方面,本發(fā)明提供一種短信攔截方法,包括:
[0032]對終端中的短信接收事件進(jìn)行監(jiān)測,獲取當(dāng)前接收的短信對應(yīng)的電話號碼;
[0033]確定當(dāng)前接收到的短信對應(yīng)的電話號碼不屬于預(yù)設(shè)的黑名單或者白名單中的電話號碼時,將所述短信上傳云端服務(wù)器,以使云端服務(wù)器根據(jù)貝葉斯模型確定所述短信是否屬于垃圾短信;
[0034]接收所述云端服務(wù)器發(fā)送的通知信息,所述通知信息包括:所述短信是否屬于垃圾短的息;
[0035]根據(jù)所述通知信息確定是否攔截當(dāng)前接收的短信。
[0036]可選地,確定當(dāng)前接收到的短信對應(yīng)的電話號碼不屬于預(yù)設(shè)的黑名單或者白名單中的電話號碼之前,所述方法還包括:
[0037]接收云端服務(wù)器發(fā)送的待攔截信息列表,所述待攔截信息列表包括:需要攔截的短信的特征詞;
[0038]所述確定當(dāng)前接收到的短信對應(yīng)的電話號碼不屬于預(yù)設(shè)的黑名單或者白名單中的電話號碼之后,所述方法還包括:
[0039]提取所述短信的文本內(nèi)容中的敏感詞,查看所述敏感詞與所述特征詞是否匹配;
[0040]在所述敏感詞與所述特征詞匹配時,將當(dāng)前接收的短信作為攔截對象進(jìn)行攔截,則不執(zhí)行所述將上述短信上傳云端服務(wù)器的步驟;
[0041]在所述敏感詞與所述特征詞不匹配時,執(zhí)行所述將所述短信上傳云端服務(wù)器的步驟。
[0042]可選地,所述提取所述短信的文本內(nèi)容中的敏感詞,包括:
[0043]對所述短信的文本內(nèi)容進(jìn)行分詞處理,提取分詞處理后的文本內(nèi)容中的第一個敏感詞和最后一個敏感詞;
[0044]所述查看所述敏感詞與所述特征詞是否匹配的步驟,包括:
[0045]查看所述第一個敏感詞與所述特征詞是否匹配,或者,查看所述最后一個敏感詞與所述特征詞是否匹配。
[0046]第三方面,本發(fā)明提供一種云端服務(wù)器,包括:
[0047]接收模塊,用于接收短信攔截裝置上傳的短信;
[0048]關(guān)鍵詞獲取模塊,用于對所述短信的文本內(nèi)容進(jìn)行分詞處理,獲得所述文本內(nèi)容的關(guān)鍵詞;
[0049]關(guān)鍵詞的概率權(quán)重值獲取模塊,用于獲取每一關(guān)鍵詞屬于垃圾短信的第一概率權(quán)重值,屬于正常短信的第二概率權(quán)重值;
[0050]關(guān)鍵詞的聯(lián)合概率獲取模塊,用于獲取所有關(guān)鍵詞的所有第一概率權(quán)重值的第一聯(lián)合概率,所有關(guān)鍵詞的所有第二概率權(quán)重值的第二聯(lián)合概率;
[0051]判斷模塊,用于根據(jù)所述第一聯(lián)合概率和所述第二聯(lián)合概率,確定所述短信是否屬于垃圾短信;
[0052]發(fā)送模塊,還用于向所述短信攔截裝置發(fā)送通知信息,所述通知信息包括:所述短信是否屬于垃圾短信的信息,以使所述短信攔截裝置根據(jù)所述通知信息確定是否攔截當(dāng)前接收的短信。
[0053]可選地,關(guān)鍵詞的概率權(quán)重值獲取模塊,具體用于:
[0054]針對每一個關(guān)鍵詞,
[0055]在預(yù)先訓(xùn)練的貝葉斯模型中查找與該關(guān)鍵詞匹配的特征詞,并獲取所述特征詞的正向權(quán)重值和負(fù)向權(quán)重值;
[0056]將所述特征詞的正向權(quán)重值作為與該關(guān)鍵詞的第一概率權(quán)重值;
[0057]將所述特征詞的負(fù)向權(quán)重值作為與該關(guān)鍵詞的第二概率權(quán)重值。
[0058]可選地,所述關(guān)鍵詞獲取模塊,具體用于
[0059]在所述文本內(nèi)容包括特殊符號時,剔除所述文本內(nèi)容的特殊符號,對剔除特殊符號的文本內(nèi)容進(jìn)行分詞處理,并確定分詞處理后各中文詞/字的詞性、確定相鄰中文詞/字的組合性;
[0060]根據(jù)所述分詞處理后的中文詞/字的詞性、所述相鄰中文詞/字的組合性,獲得所述文本內(nèi)容的關(guān)鍵詞。
[0061]可選地,所述關(guān)鍵詞獲取模塊,還用于
[0062]在所述文本內(nèi)容包括數(shù)字和/或字母時,對所述文本內(nèi)容進(jìn)行分詞處理,并提取所述文本內(nèi)容中的數(shù)字和/或字母;
[0063]所述云端服務(wù)器還包括:
[0064]號碼判斷模塊,用于判斷所述文本內(nèi)容中的數(shù)字和/或字母是否是手機(jī)號碼、座機(jī)號碼、賬號信息中的一種或多種;
[0065]黑名單更新模塊,用于在所述號碼判斷模塊確定所述文本內(nèi)容中的數(shù)字和/或字母為手機(jī)號碼、座機(jī)號碼、賬號信息中的一種或多種時,將所述文本內(nèi)容中的數(shù)字和/或字母加入發(fā)送短信攔截裝置的黑名單中。
[0066]可選地,所述云端服務(wù)器還包括:
[0067]源號碼獲取模塊,用于確定所述短信的源號碼,并確定所述源號碼在預(yù)設(shè)時間段內(nèi)發(fā)送短信的數(shù)量;
[0068]相應(yīng)地,所述發(fā)送模塊,還用于在所述源號碼獲取模塊確定所述源號碼在預(yù)設(shè)時間段內(nèi)發(fā)送短信的數(shù)量超過預(yù)設(shè)閾值時,向所述短信攔截裝置發(fā)送所述短信為垃圾短信的信息。
[0069]第四方面,本發(fā)明提供一種短信攔截裝置,包括:
[0070]監(jiān)控模塊,用于對終端中的短信接收事件進(jìn)行監(jiān)測,獲取當(dāng)前接收的短信對應(yīng)的電話號碼;
[0071]判斷模塊,用于確定當(dāng)前接收到的短信對應(yīng)的電話號碼是否屬于預(yù)設(shè)的黑名單或者白名單中的電話號碼;
[0072]發(fā)送模塊,用于在所述判斷模塊確定當(dāng)前接收到的短信對應(yīng)的電話號碼不屬于預(yù)設(shè)的黑名單或者白名單中的電話號碼時,將所述短信上傳云端服務(wù)器,以使云端服務(wù)器根據(jù)貝葉斯模型確定所述短信是否屬于垃圾短信;
[0073]接收模塊,用于接收所述云端服務(wù)器發(fā)送的通知信息,所述通知信息包括:所述短信是否屬于垃圾短信的信息;
[0074]短信攔截模塊,用于根據(jù)所述通知信息確定是否攔截當(dāng)前接收的短信。
[0075]可選地,所述接收模塊,還用于在判斷模塊確定所述短信對應(yīng)的電話號碼是否屬于預(yù)設(shè)的黑名單或者白名單中的電話號碼之前,接收云端服務(wù)器發(fā)送的待攔截信息列表,所述待攔截信息列表包括:需要攔截的短信的特征詞;
[0076]所述裝置還包括:
[0077]提取模塊,用于在所述判斷模塊確定所述短信對應(yīng)的電話號碼不屬于預(yù)設(shè)的黑名單或者白名單中的電話號碼之后,提取所述短信的文本內(nèi)容中的敏感詞;
[0078]查看匹配模塊,用于查看所述提取模塊提取的敏感詞與所述特征詞是否匹配;
[0079]所述短信攔截模塊,還用于在所述查看匹配模塊確定所述敏感詞與所述特征詞不匹配時,將當(dāng)前接收的短信作為攔截對象進(jìn)行攔截。
[0080]可選地,所述提取模塊,具體用于
[0081]對所述短信的文本內(nèi)容進(jìn)行分詞處理,提取分詞處理后的文本內(nèi)容中的第一個敏感詞和最后一個敏感詞;
[0082]查看匹配模塊,具體用于
[0083]查看所述第一個敏感詞與所述特征詞是否匹配,或者,查看所述最后一個敏感詞與所述特征詞是否匹配。
[0084]由上述技術(shù)方案可知,本發(fā)明的短信攔截方法及裝置、云端服務(wù)器,通過短信攔截裝置將短信上報(bào)到云端服務(wù)器,由云端服務(wù)器通過短信對應(yīng)的關(guān)鍵詞屬于正常短信和垃圾短信的概率,確定短信是否為垃圾短信,進(jìn)而可提高垃圾短信的識別率,同時提高垃圾短信的攔截效率,降低短信攔截的成本。

【專利附圖】

【附圖說明】
[0085]圖1為本發(fā)明一實(shí)施例提供的短信攔截方法的流程示意圖;
[0086]圖2A為本發(fā)明另一實(shí)施例提供的短信攔截方法的流程示意圖;
[0087]圖2B為本發(fā)明一實(shí)施例提供的短信攔截記錄的示意圖;
[0088]圖2C為垃圾短信的文本內(nèi)容的示意圖;
[0089]圖3為本發(fā)明一實(shí)施例提供的云端服務(wù)器的結(jié)構(gòu)示意圖;
[0090]圖4為本發(fā)明一實(shí)施例提供的短信攔截裝置的結(jié)構(gòu)示意圖。

【具體實(shí)施方式】
[0091]下面結(jié)合附圖和實(shí)施例,對本發(fā)明的【具體實(shí)施方式】作進(jìn)一步詳細(xì)描述。以下實(shí)施例用于說明本發(fā)明,但不用來限制本發(fā)明的范圍。
[0092]圖1示出了本發(fā)明一實(shí)施例提供的短信攔截方法的流程示意圖,如圖1所示,本實(shí)施例的短信攔截方法如下所述。
[0093]步驟101,接收短信攔截裝置上傳的短信。
[0094]在本實(shí)施例中,短信攔截裝置可位于終端內(nèi),用于監(jiān)控終端接收的短信。該終端可為能夠接收短信的終端。
[0095]步驟102,對所述短信的文本內(nèi)容進(jìn)行分詞處理,獲得所述文本內(nèi)容的關(guān)鍵詞。
[0096]為了準(zhǔn)確識別文本內(nèi)容的關(guān)鍵詞,可先剔除短信的文本內(nèi)容中的特殊字符,再從剔除特殊字符后的短信的文本內(nèi)容進(jìn)行分詞處理,將分詞處理后的每一詞/字可與預(yù)先設(shè)定的關(guān)鍵詞數(shù)據(jù)庫進(jìn)行比對,將屬于關(guān)鍵詞數(shù)據(jù)庫中的詞/字作為該短信的文本內(nèi)容的關(guān)鍵詞。
[0097]預(yù)設(shè)的關(guān)鍵詞數(shù)據(jù)庫可包括:票、發(fā)票、稅、平方、抵押等。上述待剔除的特殊字符可包括:空格、下劃線,“<§”、“#”、“&” “一”等等,本實(shí)施例僅為舉例說明。
[0098]當(dāng)短信的文本內(nèi)容為“發(fā)@票&代#開,請#聯(lián)!系1223322”,剔除特殊字符后,該短信的文本內(nèi)容變?yōu)椤鞍l(fā)票代開,請聯(lián)系1223322”。其對應(yīng)的關(guān)鍵詞可為“發(fā)票、代、聯(lián)系”。
[0099]舉例來說,采用當(dāng)前的分詞處理系統(tǒng)對短信的文本內(nèi)容進(jìn)行分詞處理,進(jìn)而采用條件隨機(jī)場模型/關(guān)鍵詞正則方式/統(tǒng)計(jì)方式獲取所述分詞處理后的文本內(nèi)容的關(guān)鍵詞/關(guān)鍵信息。例如,可從剔除特殊字符后的短信的文本內(nèi)容進(jìn)行分詞處理后,采用條件隨機(jī)場模型獲取所述分詞處理后的文本內(nèi)容的關(guān)鍵詞/關(guān)鍵信息??衫斫獾氖?,短信的文本內(nèi)容中的沒有實(shí)際意義的虛詞(如標(biāo)點(diǎn)、助動詞、語氣詞、嘆詞、擬聲詞等)可不作為該短信的文本內(nèi)容的關(guān)鍵詞。
[0100]本實(shí)施例中,對短信的文本內(nèi)容進(jìn)行分詞獲取關(guān)鍵詞的方式可以有多種,本實(shí)施例不對其進(jìn)行限定。
[0101]步驟103,獲取每一關(guān)鍵詞屬于垃圾短信的第一概率權(quán)重值,屬于正常短信的第二概率權(quán)重值。
[0102]可理解的是,可根據(jù)預(yù)先訓(xùn)練的貝葉斯模型確定第一概率權(quán)重值和第二概率權(quán)重值。
[0103]具體地,針對每一個關(guān)鍵詞,可在預(yù)先訓(xùn)練的貝葉斯模型中查找與該關(guān)鍵詞匹配的特征詞,并獲取該特征詞的正向權(quán)重值和負(fù)向權(quán)重值,將該特征詞的正向權(quán)重值作為與該關(guān)鍵詞的第一概率權(quán)重值,將該特征詞的負(fù)向權(quán)重值作為與該關(guān)鍵詞的第二概率權(quán)重值。
[0104]在本實(shí)施例中,一個關(guān)鍵詞對應(yīng)的第一概率權(quán)重值用于表不包含該關(guān)鍵詞的短信為垃圾短信的概率,相應(yīng)的,第二概率權(quán)重值用于表示包含該關(guān)鍵詞的短信為正常短信的概率。
[0105]步驟104,獲取所有關(guān)鍵詞的所有第一概率權(quán)重值的第一聯(lián)合概率,所有關(guān)鍵詞的所有第二概率權(quán)重值的第二聯(lián)合概率。
[0106]可理解的是,該步驟中的第一聯(lián)合概率是用于表示短信文本內(nèi)容中所有關(guān)鍵詞組合在一起屬于垃圾短信的概率,第二聯(lián)合概率是用于表示短信的文本內(nèi)容中所有關(guān)鍵詞組合在一起屬于正常短信的概率。
[0107]在具體應(yīng)用中,第一聯(lián)合概率可以為各個關(guān)鍵詞對應(yīng)的第一概率權(quán)重值的加和,第二聯(lián)合概率可以為各個關(guān)鍵詞對應(yīng)的第二概率權(quán)重值的加和?;蛘咭部梢詾榈谝宦?lián)合概率還可以為各個關(guān)鍵詞對應(yīng)的第一概率權(quán)重值的加權(quán)乘積,第二聯(lián)合概率可以為各個關(guān)鍵詞對應(yīng)的第二概率權(quán)重值的加權(quán)乘積等,本實(shí)施例不對其進(jìn)行限定。
[0108]步驟105,根據(jù)所述第一聯(lián)合概率和所述第二聯(lián)合概率,確定所述短信是否屬于垃圾短信。
[0109]也就是說,可以根據(jù)第一聯(lián)合概率和所述第二聯(lián)合概率的大小確定所述的短信是否為垃圾短信,或者也可以根據(jù)第一聯(lián)合概率和第二聯(lián)合概率的差值與預(yù)設(shè)值之間的關(guān)系確定所述的短信是否為垃圾短信。其具體的判斷方式,可根據(jù)實(shí)際需求設(shè)置。
[0110]步驟106,向所述短信攔截裝置發(fā)送通知信息,所述通知信息包括:所述短信是否屬于垃圾短信的信息,以使所述短信攔截裝置根據(jù)所述通知信息確定是否攔截當(dāng)前接收的短?目。
[0111]本發(fā)明實(shí)施例中,在短信攔截裝置無法確定監(jiān)控的終端中的短信是否為垃圾短信時,將短信上報(bào)云端,由云端確定短信是否為垃圾信息,可節(jié)省終端本地側(cè)的存儲空間,同時,提高垃圾短信的識別率,以及垃圾短信的攔截效率,降低短信攔截的成本。
[0112]在具體應(yīng)用中,短信的文本內(nèi)容可能包括特殊符號和字母等信息,此時針對圖1中所示方法的步驟102,可具體說明如下:
[0113]在短信的文本內(nèi)容包括特殊符號時,剔除所述文本內(nèi)容的特殊符號,對剔除特殊符號的文本內(nèi)容進(jìn)行分詞處理,并確定分詞處理后各中文詞/字的詞性,確定相鄰中文詞/字的組合性;
[0114]進(jìn)而可根據(jù)分詞處理后的中文詞/字的詞性、所述相鄰中文詞/字的組合性,獲取短信的文本內(nèi)容的關(guān)鍵詞。
[0115]例如,包含“代開發(fā)丨丨票”的文本內(nèi)容,可剔除特殊符號“丨丨”進(jìn)而可對“代開發(fā)票”進(jìn)行分詞處理,得到“代開”、“開”、“發(fā)票”,根據(jù)該分詞處理后的詞性,以及相鄰中文詞的組合性,獲得短信的文本內(nèi)容的關(guān)鍵詞“發(fā)票”或“開發(fā)票”等。
[0116]另外,在短信的文本內(nèi)容包括數(shù)字和/或字母時,對短信的文本內(nèi)容進(jìn)行分詞處理,并提取所述文本內(nèi)容中的數(shù)字和/或字母;
[0117]在上述圖1所示的方法中,若云端服務(wù)器確定短信的文本內(nèi)容屬于垃圾短信,則可執(zhí)行判斷所述文本內(nèi)容中的數(shù)字和/或字母是否是手機(jī)號碼、座機(jī)號碼、賬號信息中的一種或多種的步驟;
[0118]在判斷文本內(nèi)容中的數(shù)字和/或字母為手機(jī)號碼/座機(jī)號碼/賬號信息時,將該手機(jī)號碼/座機(jī)號碼/賬號信息加入發(fā)送短信攔截裝置的黑名單中。
[0119]例如,一個短信的文本內(nèi)容如下:“錢打到這個卡上就可以了。建設(shè)銀行:62270007 3030 0027 930李婷”,由此,可將該建設(shè)銀行的賬號加入黑名單中。
[0120]可將更新的黑名單下發(fā)至短信攔截裝置,后續(xù)如果短信的文本內(nèi)容中包括上述的賬號信息,可將該短信直接攔截。
[0121]如圖2C所示,在圖2C所示的短信中,短信的文本內(nèi)容包括:數(shù)字和字母,但是,該數(shù)字“6”、“500”、“199”、“100”等不屬于電話號碼,也不屬于座機(jī)號碼及賬號信息,不對該短信內(nèi)容中的數(shù)字/字母進(jìn)行任何處理。
[0122]在實(shí)際應(yīng)用中,還可能出現(xiàn)的情況是:某一短信的文本內(nèi)容即包括特殊符號,同時也包括數(shù)字,此時,可預(yù)先將短信的文本內(nèi)容的特殊符號去除/剔除,在對剔除特殊符號之后的文本內(nèi)容進(jìn)行分詞處理,并提取剔除特殊符號之后的文本內(nèi)容中的數(shù)字。
[0123]當(dāng)然,在另一種具體應(yīng)用中,云端服務(wù)器在接收短信攔截裝置上傳的短信之后,在對短信的文本內(nèi)容進(jìn)行分詞處理之前,短信攔截方法還可包括如下的圖1中未示出的步驟:
[0124]步驟A01、確定發(fā)送短信的源號碼,并確定源號碼在預(yù)設(shè)時間段內(nèi)發(fā)送短信的數(shù)量。
[0125]例如,短信攔截裝置向云端服務(wù)器上傳一個短信,該短信包括發(fā)送短信的源號碼以及短信的文本內(nèi)容,此時,根據(jù)發(fā)送短信的源號碼“ 1065980530022935”,確定該源號碼在一天之內(nèi)發(fā)送短信的數(shù)量。
[0126]另外,在確定短信的源號碼時,可將附加在源號碼之前的部分?jǐn)?shù)字和/或符號去除,例如,源號碼為 “+086133XXXX”、“ 1069095599”,則可將“+086”、“ 10690” 去除,剩余“133XXXX”、“95599”為真正的源號碼。
[0127]步驟A02、若源號碼在預(yù)設(shè)時間段內(nèi)發(fā)送短信的數(shù)量超過預(yù)設(shè)閾值,則向短信攔截裝置發(fā)送短信為垃圾短信的信息。
[0128]如果上述源號碼“1065980530022935”在一天之內(nèi)發(fā)送短信的數(shù)量超過300條,則可認(rèn)為該源號碼的短信為垃圾短信。
[0129]當(dāng)然,云端服務(wù)器根據(jù)發(fā)送短信的源號碼確定短信為垃圾短信之后,可不再執(zhí)行前述的圖1中所示的對短信的文本內(nèi)容進(jìn)行分詞處理的步驟,以及后續(xù)的步驟。
[0130]在實(shí)際應(yīng)用中,云端服務(wù)器根據(jù)發(fā)送短信的源號碼不能確定短信為垃圾短信,如源號碼在預(yù)設(shè)時間段內(nèi)發(fā)送短信的數(shù)量沒有超過預(yù)設(shè)閾值,此時,云端服務(wù)器可執(zhí)行前述的圖1中所示的對短信的文本內(nèi)容進(jìn)行分詞處理,以及后續(xù)的步驟。
[0131]在一種可能的實(shí)現(xiàn)方式中,前述圖1所示的方法中的步驟103可具體說明如下:
[0132]針對每一個關(guān)鍵詞,可在預(yù)先訓(xùn)練的貝葉斯模型中查找與該關(guān)鍵詞匹配的特征詞,并獲取該特征詞的正向權(quán)重值和負(fù)向權(quán)重值,將該特征詞的正向權(quán)重值作為與該關(guān)鍵詞的第一概率權(quán)重值,將該特征詞的負(fù)向權(quán)重值作為與該關(guān)鍵詞的第二概率權(quán)重值。
[0133]預(yù)先訓(xùn)練的貝葉斯模型中包括有多個特征詞,每一特征詞對應(yīng)有屬于正常短信的正向權(quán)重值,以及對應(yīng)有屬于垃圾短信的負(fù)向權(quán)重值。
[0134]通常,可根據(jù)特征詞的numl及預(yù)先設(shè)定的訓(xùn)練集中正常短信的文本總數(shù),計(jì)算該特征詞的正向權(quán)重值,其中,該numl為所述訓(xùn)練集中正常短信中包含該特征詞的文本的數(shù)量,特征詞的正向權(quán)重值可表征該特征詞屬于正常短信的概率/概率權(quán)重值。
[0135]根據(jù)特征詞的num2以及預(yù)先設(shè)定的訓(xùn)練集中垃圾短信的文本總數(shù),計(jì)算該特征詞的負(fù)向權(quán)重值,其中,num2為所述訓(xùn)練集中垃圾短信中包含該特征詞的文本的數(shù)量,特征詞的負(fù)向權(quán)重值可表征該特征詞屬于垃圾短信的概率/概率權(quán)重值。
[0136]舉例來說,如果包含特征詞“發(fā)票”的短信有100條,其中80條為垃圾短信,20條為正常短信,那么特征詞“發(fā)票”對應(yīng)的正向權(quán)重值為0.8,負(fù)向權(quán)重值為0.2。
[0137]上述實(shí)施例中的短信攔截方法,可用于通知短信攔截裝置是否對短信攔截裝置所屬終端接收到的短信是否進(jìn)行攔截,上述方法可在云端服務(wù)器中執(zhí)行,或者其他服務(wù)器中執(zhí)行,本實(shí)施例僅為舉例說明。
[0138]圖2A示出了本發(fā)明另一實(shí)施例提供的短信攔截方法的流程示意圖,如圖2A所示,本實(shí)施例的短信攔截方法如下所述。
[0139]步驟201,對終端中的短信接收事件進(jìn)行監(jiān)測,獲取當(dāng)前接收的短信對應(yīng)的電話號碼。
[0140]在本實(shí)施例中,各個步驟的執(zhí)行主體可以是一運(yùn)行在移動終端設(shè)備上的應(yīng)用程序,也即,在實(shí)際應(yīng)用中,可以開發(fā)一款應(yīng)用程序,使其在運(yùn)行時能夠執(zhí)行本實(shí)施例中的各步驟操作。當(dāng)然,該應(yīng)用程序可以是一個獨(dú)立的應(yīng)用程序,也可以是另一應(yīng)用程序中的一個功能模塊,例如,在某手機(jī)安全軟件中增加本發(fā)明中的短信攔截功能等。
[0141]由于終端設(shè)備中的操作系統(tǒng)一般會為應(yīng)用程序開放一些接口,供應(yīng)用程序從系統(tǒng)中獲取所需的信息。因此,本實(shí)施例中,難為了能夠?qū)K端設(shè)備中的短信事件進(jìn)行監(jiān)測,可以利用終端的操作系統(tǒng)的這一特性,在操作系統(tǒng)中對應(yīng)用程序進(jìn)行注冊,這樣,當(dāng)操作系統(tǒng)廣播通知消息時,注冊的應(yīng)用程序能夠收聽到這種通知消息,進(jìn)而可從中獲取所需的短信。
[0142]步驟202,確定當(dāng)前接收到的短信對應(yīng)的電話號碼不屬于預(yù)設(shè)的黑名單或者白名單中的電話號碼時,將所述短信上傳云端服務(wù)器,以使云端服務(wù)器根據(jù)貝葉斯模型確定所述短/[目是否屬于垃圾短/[目。
[0143]在本實(shí)施例中,預(yù)先設(shè)置的黑名單、白名單中的具體內(nèi)容本實(shí)施例不限定,為了能夠根據(jù)預(yù)先設(shè)置的黑、白名單來篩選需要攔截或放行的通信信息,本實(shí)施例提供的方法中,黑名單包括需要攔截的號碼,用于篩選需要攔截的短信,白名單包括可放行的號碼,用于篩選需要放行的短信。預(yù)先設(shè)置黑名單/白名單時,可根據(jù)通訊錄中記錄的電話號碼來設(shè)置黑名單/白名單中的號碼,或者,將用戶輸入的號碼設(shè)置為黑名單/白名單中的號碼,本實(shí)施例不對設(shè)置黑名單/白名單的方式進(jìn)行限定。
[0144]可選地,該處的黑名單還可為預(yù)先從云端服務(wù)器下載的黑名單,本實(shí)施例不對其進(jìn)行限定。
[0145]本實(shí)施例中,云端服務(wù)器可根據(jù)前述圖1所示的方法確定短信是佛屬于垃圾短?目。
[0146]步驟203,接收所述云端服務(wù)器發(fā)送的通知信息,所述通知信息包括:所述短信是否屬于垃圾短信的信息;
[0147]步驟204,根據(jù)所述通知信息確定是否攔截當(dāng)前接收的短信。
[0148]結(jié)合圖2Β所示,圖2Β示出了本實(shí)施例中采用上述方法對短信進(jìn)行攔截的短信攔截記錄。本實(shí)施例中,首先確定終端接收到的短信對應(yīng)的電話號碼是否為白名單或者黑名單中的號碼,如果不是,則說明終端本身不能確定該短信是否需要攔截,此時,短信攔截裝置將該短信上報(bào)云端服務(wù)器,由云端服務(wù)器執(zhí)行短信是否為垃圾信息的判斷。這樣一方面,由于短信攔截裝置不執(zhí)行這樣的判斷,減少了短信攔截裝置的資源消耗,另一方面,由于云端服務(wù)器具有更為強(qiáng)大的計(jì)算和存儲資源,能夠進(jìn)行更為復(fù)雜的判斷,可以提高判斷的準(zhǔn)確性。
[0149]本實(shí)施例中的短信攔截方法可提高短信攔截的準(zhǔn)確率,提高攔截效果,減少了用戶的操作量,節(jié)省了終端本地的存儲空間。
[0150]在具體應(yīng)用中,在步驟202之前,圖2Α所示的方法還可包括如下圖中未示出的子步驟201a:
[0151]步驟201a,接收云端服務(wù)器發(fā)送的待攔截信息列表,所述待攔截信息列表中包括:需要攔截的短信的特征詞。
[0152]本實(shí)施例中的待攔截信息列表中的特征詞可為云端服務(wù)器中設(shè)置的屬于垃圾短信的特征詞。如“發(fā)票”、“買房”等等。如圖2C所示,圖2C中的“爆款”、“大牌”等屬于待攔截信息列表中的特征詞。
[0153]相應(yīng)地,在短信攔截方法中包括前述的步驟201a時,圖2A所示的方法中的步驟202之前,該方法還可包括下述的圖中未示出的子步驟202a:
[0154]步驟202a,提取所述短信的文本內(nèi)容中的敏感詞,查看所述敏感詞與所述特征詞是否匹配;在所述敏感詞與所述特征詞匹配時,將當(dāng)前接收的短信作為攔截對象進(jìn)行攔截。
[0155]舉例來說,對所述短信的文本內(nèi)容進(jìn)行分詞處理,提取分詞處理后的文本內(nèi)容中的第一個敏感詞和最后一個敏感詞;
[0156]所述查看所述敏感詞與所述特征詞是否匹配的步驟,包括:
[0157]查看所述第一個敏感詞與所述特征詞是否匹配,或者,查看所述最后一個敏感詞與所述特征詞是否匹配。
[0158]通常,可對短信的文本內(nèi)容進(jìn)行特殊符號的剔除,在剔除特殊符號之后,可對文本內(nèi)容進(jìn)行分詞處理,以便獲取文本內(nèi)容中的敏感詞。
[0159]可選地,在本實(shí)施例的一個短信攔截方法,可包括步驟201、步驟201a和步驟202a?;蛘撸砂ú襟E201、步驟201a和確定短信的號碼不屬于黑名單和白名單的步驟,以及和步驟202a。
[0160]當(dāng)然,如果在步驟202a中,提取所述短信的文本內(nèi)容中的敏感詞,查看所述敏感詞與所述特征詞是否匹配;在所述敏感詞與所述特征詞不匹配時,將所述短信上傳云端服務(wù)器。
[0161]通過本實(shí)施例的短信攔截方法,能夠避免擴(kuò)大短信攔截裝置的攔截范圍,避免將明顯屬于攔截對象的短信上報(bào),避免對相應(yīng)資源的消耗。
[0162]圖3示出了本發(fā)明一實(shí)施例提供的云端服務(wù)器的結(jié)構(gòu)示意圖,如圖3所示,本實(shí)施例的云端服務(wù)器可包括:接收模塊31、關(guān)鍵詞獲取模塊32、關(guān)鍵詞的概率權(quán)重值獲取模塊33、關(guān)鍵詞的聯(lián)合概率獲取模塊34、判斷模塊35和發(fā)送模塊36 ;
[0163]其中,接收模塊31用于接收短信攔截裝置上傳的短信;
[0164]關(guān)鍵詞獲取模塊32用于對所述短信的文本內(nèi)容進(jìn)行分詞處理,獲得所述文本內(nèi)容的關(guān)鍵詞;
[0165]關(guān)鍵詞的概率權(quán)重值獲取模塊33用于獲取每一關(guān)鍵詞屬于垃圾短信的第一概率權(quán)重值,屬于正常短信的第二概率權(quán)重值;
[0166]關(guān)鍵詞的聯(lián)合概率獲取模塊34用于獲取所有關(guān)鍵詞的所有第一概率權(quán)重值的第一聯(lián)合概率,所有關(guān)鍵詞的所有第二概率權(quán)重值的第二聯(lián)合概率;
[0167]判斷模塊35用于根據(jù)所述第一聯(lián)合概率和所述第二聯(lián)合概率,確定所述短信是否屬于垃圾短信;
[0168]發(fā)送模塊36還用于向所述短信攔截裝置發(fā)送通知信息,所述通知信息包括:所述短信是否屬于垃圾短信的信息,以使所述短信攔截裝置根據(jù)所述通知信息確定是否攔截當(dāng)前接收的短信。
[0169]本實(shí)施例的云端服務(wù)器,通過獲取上報(bào)短信的文本內(nèi)容中的關(guān)鍵詞,確定關(guān)鍵詞屬于正常短信和垃圾短信的概率,進(jìn)而確定短信是否為垃圾短信,進(jìn)而可提高垃圾短信的識別率,同時提高垃圾短信的攔截效率,降低短信攔截的成本。
[0170]舉例來說,前述的關(guān)鍵詞的概率權(quán)重值獲取模塊33可具體用于:
[0171]針對每一個關(guān)鍵詞,
[0172]在預(yù)先訓(xùn)練的貝葉斯模型中查找與該關(guān)鍵詞匹配的特征詞,并獲取所述特征詞的正向權(quán)重值和負(fù)向權(quán)重值;
[0173]將所述特征詞的正向權(quán)重值作為與該關(guān)鍵詞的第一概率權(quán)重值;
[0174]將所述特征詞的負(fù)向權(quán)重值作為與該關(guān)鍵詞的第二概率權(quán)重值。
[0175]另外,在具體應(yīng)用中,前述的關(guān)鍵詞獲取模塊32可具體用于,
[0176]在所述文本內(nèi)容包括特殊符號時,對所述文本內(nèi)容進(jìn)行分詞處理,并確定分詞處理后中各中文詞/字的詞性、確定相鄰中文詞/字的組合性;
[0177]根據(jù)所述分詞處理后的中文詞/字的詞性、所述相鄰中文詞/字的組合性,獲得所述文本內(nèi)容的關(guān)鍵詞。
[0178]或者,關(guān)鍵詞獲取模塊32還可用于,在所述文本內(nèi)容包括數(shù)字和/或字母時,對所述文本內(nèi)容進(jìn)行分詞處理,并提取所述文本內(nèi)容中的數(shù)字和/或字母;
[0179]相應(yīng)地,前述的云端服務(wù)器還可包括圖中未示出的號碼判斷模塊37和黑名單更新模塊38,其中,該號碼判斷模塊37用于判斷所述文本內(nèi)容中的數(shù)字和/或字母是否是手機(jī)號碼、座機(jī)號碼、賬號信息中的一種或多種;
[0180]黑名單更新模塊38用于在所述號碼判斷模塊確定所述文本內(nèi)容中的數(shù)字和/或字母為手機(jī)號碼、座機(jī)號碼、賬號信息中的一種或多種時,將所述文本內(nèi)容中的數(shù)字和/或字母加入黑名單中。
[0181]在另一種可能的實(shí)現(xiàn)方式中,前述的云端服務(wù)器還可包括圖中未示出的源號碼獲取模塊39,該源號碼獲取模塊39用于確定所述短信的源號碼,并確定所述源號碼在預(yù)設(shè)時間段內(nèi)發(fā)送短信的數(shù)量;
[0182]相應(yīng)地,所述發(fā)送模塊36還用于在所述源號碼獲取模塊確定所述源號碼在預(yù)設(shè)時間段內(nèi)發(fā)送短信的數(shù)量超過預(yù)設(shè)閾值時,向所述短信攔截裝置發(fā)送所述短信為垃圾短信的信息。
[0183]本實(shí)施例的云端服務(wù)器能夠提高垃圾短信的識別率,以及垃圾短信的攔截效率,降低短信攔截的成本。
[0184]圖4示出了本發(fā)明一實(shí)施例提供的短信攔截裝置的結(jié)構(gòu)示意圖,如圖4所示,本實(shí)施例的短信攔截裝置可包括:監(jiān)控模塊41、判斷模塊42、發(fā)送模塊43和接收模塊44、短信攔截模塊45 ;
[0185]其中,監(jiān)控模塊41用于對終端中的短信接收事件進(jìn)行監(jiān)測,獲取當(dāng)前接收的短信對應(yīng)的電話號碼;
[0186]判斷模塊42用于確定當(dāng)前接收到的短信對應(yīng)的電話號碼是否屬于預(yù)設(shè)的黑名單或者白名單中的電話號碼;
[0187]發(fā)送模塊43用于在所述判斷模塊42確定當(dāng)前接收到的短信對應(yīng)的電話號碼不屬于預(yù)設(shè)的黑名單或者白名單中的電話號碼時,將所述短信上傳云端服務(wù)器,以使云端服務(wù)器根據(jù)貝葉斯模型確定所述短信是否屬于垃圾短信;
[0188]接收模塊44用于接收所述云端服務(wù)器發(fā)送的通知信息,所述通知信息包括:所述短信是否屬于垃圾短信的信息;
[0189]短信攔截模塊45用于根據(jù)所述通知信息確定是否攔截當(dāng)前接收的短信。
[0190]在具體應(yīng)用中,上述的接收模塊44還用于在判斷模塊42確定所述短信對應(yīng)的電話號碼是否屬于預(yù)設(shè)的黑名單或者白名單中的電話號碼之前,接收云端服務(wù)器發(fā)送的待攔截信息列表,所述待攔截信息列表包括:需要攔截的短信的特征詞;
[0191]相應(yīng)地,前述的短信攔截裝置還可包括圖4中未示出的提取模塊46和查看匹配模塊47 ;該提取模塊46用于在所述判斷模塊42確定所述短信對應(yīng)的電話號碼不屬于預(yù)設(shè)的黑名單或者白名單中的電話號碼之后,提取所述短信的文本內(nèi)容中的敏感詞;
[0192]查看匹配模塊47用于查看所述提取模塊46提取的敏感詞與所述特征詞是否匹配;
[0193]所述短信攔截模塊45還用于在所述查看匹配模塊47確定所述敏感詞與所述特征詞不匹配時,將當(dāng)前接收的短信作為攔截對象進(jìn)行攔截。
[0194]舉例來說,所述提取模塊46可具體用于,對所述短信的文本內(nèi)容進(jìn)行分詞處理,提取分詞處理后的文本內(nèi)容中的第一個敏感詞和最后一個敏感詞;
[0195]查看匹配模塊47可具體用于,查看所述第一個敏感詞與所述特征詞是否匹配,或者,查看所述最后一個敏感詞與所述特征詞是否匹配。
[0196]本實(shí)施例中的短信攔截裝置與云端服務(wù)器交互,可提高短信攔截的準(zhǔn)確率,提高攔截效果,減少了用戶的操作量,節(jié)省了終端本地的存儲空間。
[0197]本發(fā)明的說明書中,說明了大量具體細(xì)節(jié)。然而,能夠理解,本發(fā)明的實(shí)施例可以在沒有這些具體細(xì)節(jié)的情況下實(shí)踐。在一些實(shí)例中,并未詳細(xì)示出公知的方法、結(jié)構(gòu)和技術(shù),以便不模糊對本說明書的理解。
[0198]類似地,應(yīng)當(dāng)理解,為了精簡本發(fā)明公開并幫助理解各個發(fā)明方面中的一個或多個,在上面對本發(fā)明的示例性實(shí)施例的描述中,本發(fā)明的各個特征有時被一起分組到單個實(shí)施例、圖、或者對其的描述中。然而,并不應(yīng)將該公開的方法解釋呈反映如下意圖:即所要求保護(hù)的本發(fā)明要求比在每個權(quán)利要求中所明確記載的特征更多的特征。更確切地說,如下面的權(quán)利要求書所反映的那樣,發(fā)明方面在于少于前面公開的單個實(shí)施例的所有特征。因此,遵循【具體實(shí)施方式】的權(quán)利要求書由此明確地并入該【具體實(shí)施方式】,其中每個權(quán)利要求本身都作為本發(fā)明的單獨(dú)實(shí)施例。
[0199]本領(lǐng)域技術(shù)人員可以理解,可以對實(shí)施例中的設(shè)備中的模塊進(jìn)行自適應(yīng)性地改變并且把它們設(shè)置在于該實(shí)施例不同的一個或多個設(shè)備中??梢园褜?shí)施例中的模塊或單元或組件組合成一個模塊或單元或組件,以及此外可以把它們分成多個子模塊或子單元或子組件。除了這樣的特征和/或過程或者單元中的至少一些是互相排斥之處,可以采用任何組合對本說明書(包括伴隨的權(quán)利要求、摘要和附圖)中公開的所有特征以及如此公開的任何方法或者設(shè)備的所有過程或單元進(jìn)行組合。除非另外明確陳述,本說明書(包括伴隨的權(quán)利要求、摘要和附圖)中公開的每個特征可以由提供相同、等同或相似目的的替代特征來代替。
[0200]此外,本領(lǐng)域的技術(shù)人員能夠理解,盡管在此所述的一些實(shí)施例包括其它實(shí)施例中所包括的某些特征而不是其它特征,但是不同實(shí)施例的特征的組合意味著處于本發(fā)明的范圍之內(nèi)并且形成不同的實(shí)施例。例如,在下面的權(quán)利要求書中,所要求保護(hù)的實(shí)施例的任意之一都可以以任意的組合方式來使用。
[0201 ] 本發(fā)明的各個部件實(shí)施例可以以硬件實(shí)現(xiàn),或者以在一個或者多個處理器上運(yùn)行的軟件模塊實(shí)現(xiàn),或者以它們的組合實(shí)現(xiàn)。本領(lǐng)域的技術(shù)人員應(yīng)當(dāng)理解,可以在實(shí)踐中使用微處理器或者數(shù)字信號處理器(DSP)來實(shí)現(xiàn)根據(jù)本發(fā)明實(shí)施例的一種瀏覽器終端的設(shè)備中的一些或者全部部件的一些或者全部功能。本發(fā)明還可以實(shí)現(xiàn)為用于執(zhí)行這里所描述的方法的一部分或者全部的設(shè)備或者裝置程序(例如,計(jì)算機(jī)程序和計(jì)算機(jī)程序產(chǎn)品)。這樣的實(shí)現(xiàn)本發(fā)明的程序可以存儲在計(jì)算機(jī)可讀介質(zhì)上,或者可以具有一個或者多個信號的形式。這樣的信號可以從因特網(wǎng)網(wǎng)站上下載得到,或者在載體信號上提供,或者以任何其他形式提供。
[0202]應(yīng)該注意的是上述實(shí)施例對本發(fā)明進(jìn)行說明而不是對本發(fā)明進(jìn)行限制,并且本領(lǐng)域技術(shù)人員在不脫離所附權(quán)利要求的范圍的情況下可設(shè)計(jì)出替換實(shí)施例。在權(quán)利要求中,不應(yīng)將位于括號之間的任何參考符號構(gòu)造成對權(quán)利要求的限制。單詞“包含”不排除存在未列在權(quán)利要求中的元件或步驟。位于元件之前的單詞“一”或“一個”不排除存在多個這樣的元件。本發(fā)明可以借助于包括有若干不同元件的硬件以及借助于適當(dāng)編程的計(jì)算機(jī)來實(shí)現(xiàn)。在列舉了若干裝置的單元權(quán)利要求中,這些裝置中的若干個可以是通過同一個硬件項(xiàng)來具體體現(xiàn)。單詞第一、第二、以及第三等的使用不表示任何順序??蓪⑦@些單詞解釋為名稱。
[0203]最后應(yīng)說明的是:以上各實(shí)施例僅用以說明本發(fā)明的技術(shù)方案,而非對其限制;盡管參照前述各實(shí)施例對本發(fā)明進(jìn)行了詳細(xì)的說明,本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解:其依然可以對前述各實(shí)施例所記載的技術(shù)方案進(jìn)行修改,或者對其中部分或者全部技術(shù)特征進(jìn)行等同替換;而這些修改或者替換,并不使相應(yīng)技術(shù)方案的本質(zhì)脫離本發(fā)明各實(shí)施例技術(shù)方案的范圍,其均應(yīng)涵蓋在本發(fā)明的權(quán)利要求和說明書的范圍當(dāng)中。
【權(quán)利要求】
1.一種短信攔截方法,其特征在于,包括: 接收短信攔截裝置上傳的短信; 對所述短信的文本內(nèi)容進(jìn)行分詞處理,獲得所述文本內(nèi)容的關(guān)鍵詞; 獲取每一關(guān)鍵詞屬于垃圾短信的第一概率權(quán)重值,屬于正常短信的第二概率權(quán)重值;獲取所有關(guān)鍵詞的所有第一概率權(quán)重值的第一聯(lián)合概率,所有關(guān)鍵詞的所有第二概率權(quán)重值的第二聯(lián)合概率; 根據(jù)所述第一聯(lián)合概率和所述第二聯(lián)合概率,確定所述短信是否屬于垃圾短信; 向所述短信攔截裝置發(fā)送通知信息,所述通知信息包括:所述短信是否屬于垃圾短信的信息,以使所述短信攔截裝置根據(jù)所述通知信息確定是否攔截當(dāng)前接收的短信。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述獲取每一關(guān)鍵詞屬于垃圾短信的第一概率權(quán)重值,屬于正常短信的第二概率權(quán)重值,包括: 針對每一個關(guān)鍵詞, 在預(yù)先訓(xùn)練的貝葉斯模型中查找與該關(guān)鍵詞匹配的特征詞,并獲取所述特征詞的正向權(quán)重值和負(fù)向權(quán)重值; 將所述特征詞的正向權(quán)重值作為與該關(guān)鍵詞的第一概率權(quán)重值; 將所述特征詞的負(fù)向權(quán)重值作為與該關(guān)鍵詞的第二概率權(quán)重值; 和/或, 對所述短信的文本內(nèi)容進(jìn)行分詞處理,獲得所述文本內(nèi)容的關(guān)鍵詞,包括: 在所述文本內(nèi)容包括特殊符號時,剔除所述文本內(nèi)容的特殊符號,對剔除特殊符號的文本內(nèi)容進(jìn)行分詞處理,并確定分詞處理后各中文詞/字的詞性、確定相鄰中文詞/字的組合性; 根據(jù)所述分詞處理后的中文詞/字的詞性、所述相鄰中文詞/字的組合性,獲得所述文本內(nèi)容的關(guān)鍵詞。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,對所述短信的文本內(nèi)容進(jìn)行分詞處理,獲得所述文本內(nèi)容的關(guān)鍵詞,還包括: 在所述文本內(nèi)容包括數(shù)字和/或字母時,對所述文本內(nèi)容進(jìn)行分詞處理,并提取所述文本內(nèi)容中的數(shù)字和/或字母; 相應(yīng)地,根據(jù)所述第一聯(lián)合概率和所述第二聯(lián)合概率,確定所述短信為垃圾短信之后,所述方法還包括: 判斷所述文本內(nèi)容中的數(shù)字和/或字母是否是手機(jī)號碼、座機(jī)號碼、賬號信息中的一種或多種; 如果是,則將所述文本內(nèi)容中的數(shù)字和/或字母加入發(fā)送短信攔截裝置的黑名單中。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,接收短信攔截裝置上傳的短信之后,所述方法還包括: 確定所述短信的源號碼,并確定所述源號碼在預(yù)設(shè)時間段內(nèi)發(fā)送短信的數(shù)量; 若所述源號碼在預(yù)設(shè)時間段內(nèi)發(fā)送短信的數(shù)量超過預(yù)設(shè)閾值,則向所述短信攔截裝置發(fā)送所述短信為垃圾短信的信息,且不執(zhí)行對所述短信的文本內(nèi)容進(jìn)行分詞處理的步驟。
5.一種短信攔截方法,其特征在于,包括: 對終端中的短信接收事件進(jìn)行監(jiān)測,獲取當(dāng)前接收的短信對應(yīng)的電話號碼; 確定當(dāng)前接收到的短信對應(yīng)的電話號碼不屬于預(yù)設(shè)的黑名單或者白名單中的電話號碼時,將所述短信上傳云端服務(wù)器,以使云端服務(wù)器根據(jù)貝葉斯模型確定所述短信是否屬于垃圾短信; 接收所述云端服務(wù)器發(fā)送的通知信息,所述通知信息包括:所述短信是否屬于垃圾短信的信息; 根據(jù)所述通知信息確定是否攔截當(dāng)前接收的短信。
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,確定當(dāng)前接收到的短信對應(yīng)的電話號碼不屬于預(yù)設(shè)的黑名單或者白名單中的電話號碼之前,所述方法還包括: 接收云端服務(wù)器發(fā)送的待攔截信息列表,所述待攔截信息列表包括:需要攔截的短信的特征詞; 所述確定當(dāng)前接收到的短信對應(yīng)的電話號碼不屬于預(yù)設(shè)的黑名單或者白名單中的電話號碼之后,所述方法還包括: 提取所述短信的文本內(nèi)容中的敏感詞,查看所述敏感詞與所述特征詞是否匹配;在所述敏感詞與所述特征詞匹配時,將當(dāng)前接收的短信作為攔截對象進(jìn)行攔截,則不執(zhí)行所述將上述短信上傳云端服務(wù)器的步驟; 在所述敏感詞與所述特征詞不匹配時,執(zhí)行所述將所述短信上傳云端服務(wù)器的步驟; 和/或, 所述提取所述短信的文本內(nèi)容中的敏感詞,包括: 對所述短信的文本內(nèi)容進(jìn)行分詞處理,提取分詞處理后的文本內(nèi)容中的第一個敏感詞和最后一個敏感詞; 所述查看所述敏感詞與所述特征詞是否匹配的步驟,包括: 查看所述第一個敏感詞與所述特征詞是否匹配,或者,查看所述最后一個敏感詞與所述特征詞是否匹配。
7.—種云端服務(wù)器,其特征在于,包括: 接收模塊,用于接收短信攔截裝置上傳的短信; 關(guān)鍵詞獲取模塊,用于對所述短信的文本內(nèi)容進(jìn)行分詞處理,獲得所述文本內(nèi)容的關(guān)鍵詞; 關(guān)鍵詞的概率權(quán)重值獲取模塊,用于獲取每一關(guān)鍵詞屬于垃圾短信的第一概率權(quán)重值,屬于正常短信的第二概率權(quán)重值; 關(guān)鍵詞的聯(lián)合概率獲取模塊,用于獲取所有關(guān)鍵詞的所有第一概率權(quán)重值的第一聯(lián)合概率,所有關(guān)鍵詞的所有第二概率權(quán)重值的第二聯(lián)合概率; 判斷模塊,用于根據(jù)所述第一聯(lián)合概率和所述第二聯(lián)合概率,確定所述短信是否屬于垃圾短信; 發(fā)送模塊,還用于向所述短信攔截裝置發(fā)送通知信息,所述通知信息包括:所述短信是否屬于垃圾短信的信息,以使所述短信攔截裝置根據(jù)所述通知信息確定是否攔截當(dāng)前接收的短。
8.根據(jù)權(quán)利要求7所述的云端服務(wù)器,其特征在于,關(guān)鍵詞的概率權(quán)重值獲取模塊,具體用于: 針對每一個關(guān)鍵詞, 在預(yù)先訓(xùn)練的貝葉斯模型中查找與該關(guān)鍵詞匹配的特征詞,并獲取所述特征詞的正向權(quán)重值和負(fù)向權(quán)重值; 將所述特征詞的正向權(quán)重值作為與該關(guān)鍵詞的第一概率權(quán)重值; 將所述特征詞的負(fù)向權(quán)重值作為與該關(guān)鍵詞的第二概率權(quán)重值; 和/或, 所述關(guān)鍵詞獲取模塊,具體用于 在所述文本內(nèi)容包括特殊符號時,剔除所述文本內(nèi)容的特殊符號,對剔除特殊符號的文本內(nèi)容進(jìn)行分詞處理,并確定分詞處理后各中文詞/字的詞性、確定相鄰中文詞/字的組合性; 根據(jù)所述分詞處理后的中文詞/字的詞性、所述相鄰中文詞/字的組合性,獲得所述文本內(nèi)容的關(guān)鍵詞; 和/或, 所述關(guān)鍵詞獲取模塊,還用于 在所述文本內(nèi)容包括數(shù)字和/或字母時,對所述文本內(nèi)容進(jìn)行分詞處理,并提取所述文本內(nèi)容中的數(shù)字和/或字母; 所述云端服務(wù)器還包括: 號碼判斷模塊,用于判斷所述文本內(nèi)容中的數(shù)字和/或字母是否是手機(jī)號碼、座機(jī)號碼、賬號信息中的一種或多種; 黑名單更新模塊,用于在所述號碼判斷模塊確定所述文本內(nèi)容中的數(shù)字和/或字母為手機(jī)號碼、座機(jī)號碼、賬號信息中的一種或多種時,將所述文本內(nèi)容中的數(shù)字和/或字母加入發(fā)送短信攔截裝置的黑名單中; 和/或, 所述云端服務(wù)器還包括: 源號碼獲取模塊,用于確定所述短信的源號碼,并確定所述源號碼在預(yù)設(shè)時間段內(nèi)發(fā)送短信的數(shù)量; 相應(yīng)地,所述發(fā)送模塊,還用于在所述源號碼獲取模塊確定所述源號碼在預(yù)設(shè)時間段內(nèi)發(fā)送短信的數(shù)量超過預(yù)設(shè)閾值時,向所述短信攔截裝置發(fā)送所述短信為垃圾短信的信肩、O
9.一種短信攔截裝置,其特征在于,包括: 監(jiān)控模塊,用于對終端中的短信接收事件進(jìn)行監(jiān)測,獲取當(dāng)前接收的短信對應(yīng)的電話號碼; 判斷模塊,用于確定當(dāng)前接收到的短信對應(yīng)的電話號碼是否屬于預(yù)設(shè)的黑名單或者白名單中的電話號碼; 發(fā)送模塊,用于在所述判斷模塊確定當(dāng)前接收到的短信對應(yīng)的電話號碼不屬于預(yù)設(shè)的黑名單或者白名單中的電話號碼時,將所述短信上傳云端服務(wù)器,以使云端服務(wù)器根據(jù)貝葉斯模型確定所述短信是否屬于垃圾短信; 接收模塊,用于接收所述云端服務(wù)器發(fā)送的通知信息,所述通知信息包括:所述短信是否屬于垃圾短信的信息; 短信攔截模塊,用于根據(jù)所述通知信息確定是否攔截當(dāng)前接收的短信。
10.根據(jù)權(quán)利要求9所述的裝置,其特征在于, 所述接收模塊,還用于在判斷模塊確定所述短信對應(yīng)的電話號碼是否屬于預(yù)設(shè)的黑名單或者白名單中的電話號碼之前,接收云端服務(wù)器發(fā)送的待攔截信息列表,所述待攔截信息列表包括:需要攔截的短信的特征詞; 所述裝置還包括: 提取模塊,用于在所述判斷模塊確定所述短信對應(yīng)的電話號碼不屬于預(yù)設(shè)的黑名單或者白名單中的電話號碼之后,提取所述短信的文本內(nèi)容中的敏感詞; 查看匹配模塊,用于查看所述提取模塊提取的敏感詞與所述特征詞是否匹配; 所述短信攔截模塊,還用于在所述查看匹配模塊確定所述敏感詞與所述特征詞不匹配時,將當(dāng)前接收的短信作為攔截對象進(jìn)行攔截; 和/或, 所述提取模塊,具體用于 對所述短信的文本內(nèi)容進(jìn)行分詞處理,提取分詞處理后的文本內(nèi)容中的第一個敏感詞和最后一個敏感詞; 查看匹配模塊,具體用于 查看所述第一個敏感詞與所述特征詞是否匹配,或者,查看所述最后一個敏感詞與所述特征詞是否匹配。
【文檔編號】H04W12/12GK104168548SQ201410415794
【公開日】2014年11月26日 申請日期:2014年8月21日 優(yōu)先權(quán)日:2014年8月21日
【發(fā)明者】任寰, 段培堃, 丁超, 李振博, 常富洋, 李雨石 申請人:北京奇虎科技有限公司, 奇智軟件(北京)有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1
漳州市| 库尔勒市| 淳化县| 清涧县| 齐齐哈尔市| 卓资县| 平山县| 辉县市| 田林县| 进贤县| 德庆县| 桂林市| 左云县| 湘潭县| 台北市| 贵州省| 海安县| 乐至县| 贡觉县| 镇坪县| 榆树市| 来宾市| 丘北县| 宜良县| 南和县| 阿坝| 和田市| 梅州市| 华坪县| 江门市| 孙吴县| 巴里| 资阳市| 博爱县| 易门县| 神池县| 林西县| 镇雄县| 泗水县| 晋城| 绿春县|