欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

騷擾短信的檢測方法、系統(tǒng)、移動(dòng)終端和服務(wù)器與流程

文檔序號(hào):11389006閱讀:677來源:國知局
騷擾短信的檢測方法、系統(tǒng)、移動(dòng)終端和服務(wù)器與流程

本發(fā)明涉及互聯(lián)網(wǎng)安全技術(shù),尤其是一種騷擾短信的檢測方法、系統(tǒng)、移動(dòng)終端和服務(wù)器。



背景技術(shù):

隨著手機(jī)等便攜式移動(dòng)終端的普及和短信業(yè)務(wù)的迅速發(fā)展,人們頻繁地使用短信進(jìn)行通信,然而,在人們享受著快捷方便的短信通信手段的同時(shí),伴隨而來的是日趨泛濫的詐騙短信、垃圾短信和偽基站短信。詐騙短信是利用手機(jī)短信的方式騙取金錢或財(cái)務(wù)的短信形式,常見的詐騙短信的形式包括:銀行卡積分相關(guān)內(nèi)容、扣除年費(fèi)相關(guān)內(nèi)容、退換票相關(guān)內(nèi)容、參與活動(dòng)相關(guān)內(nèi)容、開大額信用卡相關(guān)內(nèi)容等,通過這些極具誘惑力的虛假內(nèi)容騙取用戶如銀行卡的支付密碼、網(wǎng)銀的支付密碼等重要信息,嚴(yán)重地?fù)p害了用戶的切身利益。而垃圾短信占用設(shè)備空間,對(duì)用戶識(shí)別有用信息造成困擾,偽基站短信嚴(yán)重影響用戶的使用體驗(yàn)。

詐騙短信是所有垃圾短信中對(duì)用戶危害最大的短信。通過對(duì)詐騙類垃圾短信抽樣分析,發(fā)現(xiàn)其中,冒充銀行的短信最多,占比高達(dá)44.7%;其次是冒充電商商家欺騙迷惑欺騙消費(fèi)者(24.3%)、第三的是冒充電信運(yùn)營商(13.1%)。同時(shí)詐騙短信也是變化最為頻繁的短信。無論是詐騙短信中留下的手機(jī)號(hào)、固話、還是url其生命周期短則一天,長也就一周左右。



技術(shù)實(shí)現(xiàn)要素:

本發(fā)明實(shí)施例所要解決的一個(gè)技術(shù)問題是:提供識(shí)別短信安全等級(jí)的騷擾短信的檢測技術(shù)。

本發(fā)明實(shí)施例提供的一種騷擾短信的檢測方法,應(yīng)用于移動(dòng)終端,包括:

對(duì)接收的短信基于存儲(chǔ)器中的合并文件進(jìn)行切分,得到至少一個(gè)信息特征;所述合并文件從服務(wù)器下載到存儲(chǔ)器中;

將所述信息特征輸入短信分類模型,結(jié)合合并文件,輸出所述短信對(duì)應(yīng)的安全等級(jí)。

基于上述方法的另一實(shí)施例中,還包括:基于輸出的安全等級(jí),將符合預(yù)設(shè)安全等級(jí)的短信和所述短信的相關(guān)信息發(fā)送到服務(wù)器。

基于上述方法的另一實(shí)施例中,還包括:從服務(wù)器下載合并文件,對(duì)所述合并文件進(jìn)行解壓縮和分解,得到詞典庫文件和分類模型文件。

基于上述方法的另一實(shí)施例中,所述對(duì)接收的短信基于存儲(chǔ)器中的合并文件進(jìn)行切分,得到至少一個(gè)信息特征,包括:

接收短信,獲取短信對(duì)應(yīng)的文本內(nèi)容,調(diào)用存儲(chǔ)器中合并文件中的詞典庫文件,將所述短信的文本內(nèi)容與所述詞典庫文件中的特征詞進(jìn)行匹配,確定所述短信中的包含相應(yīng)特征詞的多個(gè)信息特征;

其中,所述詞典庫中的特征詞的長度包含一個(gè)或多個(gè)字符,所述特征詞為具有顯著區(qū)分性的詞。

基于上述方法的另一實(shí)施例中,將所述信息特征輸入短信分類模型,結(jié)合合并文件,輸出所述短信對(duì)應(yīng)的安全等級(jí),包括:

將基于合并文件獲得的分類模型文件輸入短信分類模型中,對(duì)短信分類模型進(jìn)行訓(xùn)練,得到訓(xùn)練好的短信分類模型;

將信息特征輸入所述訓(xùn)練好的短信分類模型中,基于所述短信分類模型輸出所述短信對(duì)應(yīng)的安全等級(jí)。

基于上述方法的另一實(shí)施例中,所述基于所述短信分類模型輸出所述短信對(duì)應(yīng)的安全等級(jí),包括:

根據(jù)所述信息特征對(duì)所述短信的文本內(nèi)容進(jìn)行評(píng)估,以獲取所述短信的文本內(nèi)容的評(píng)估值,基于評(píng)估值得到對(duì)應(yīng)的安全等級(jí)。

基于上述方法的另一實(shí)施例中,根據(jù)所述信息特征對(duì)所述短信的文本內(nèi)容進(jìn)行評(píng)估,包括:

確定每個(gè)所述信息特征對(duì)應(yīng)的權(quán)重;

根據(jù)所述確定的權(quán)重和所述信息特征對(duì)所述短信的文本內(nèi)容進(jìn)行評(píng)估。

根據(jù)本發(fā)明實(shí)施例的另一個(gè)方面,提供的一種騷擾短信的檢測方法,應(yīng)用于服務(wù)器,包括:

接收移動(dòng)終端發(fā)送的文件下載請(qǐng)求;

將詞典庫文件和分類模型文件進(jìn)行組合,并將組合后的詞典庫文件和分類模型文件進(jìn)行壓縮得到合并文件;

將合并文件下發(fā)到發(fā)出文件下載請(qǐng)求的所述移動(dòng)終端。

根據(jù)本發(fā)明實(shí)施例的另一個(gè)方面,提供的一種移動(dòng)終端,應(yīng)用于,包括:

特征提取單元,用于對(duì)接收的短信基于存儲(chǔ)器中的合并文件進(jìn)行切分,得到至少一個(gè)信息特征;所述合并文件從服務(wù)器下載到存儲(chǔ)器中;

等級(jí)評(píng)定單元,用于將所述信息特征輸入短信分類模型,結(jié)合合并文件,輸出所述短信對(duì)應(yīng)的安全等級(jí)。

根據(jù)本發(fā)明實(shí)施例的另一個(gè)方面,提供的一種服務(wù)器,包括:

請(qǐng)求接收單元,用于接收移動(dòng)終端發(fā)送的文件下載請(qǐng)求;

文件合并單元,用于將詞典庫文件和分類模型文件進(jìn)行組合,并將組合后的詞典庫文件和分類模型文件進(jìn)行壓縮得到合并文件;

文件下發(fā)單元,用于將合并文件下發(fā)到發(fā)出文件下載請(qǐng)求的所述移動(dòng)終端。

根據(jù)本發(fā)明實(shí)施例的另一個(gè)方面,提供的一種騷擾短信的檢測系統(tǒng),包括:一個(gè)如上所述的服務(wù)器和至少一個(gè)如上所述的移動(dòng)終端。

基于本發(fā)明上述實(shí)施例提供的一種騷擾短信的檢測方法、系統(tǒng)、移動(dòng)終端和服務(wù)器,對(duì)接收的短信基于存儲(chǔ)器中的合并文件進(jìn)行切分,得到至少一個(gè)信息特征;合并文件從服務(wù)器下載到存儲(chǔ)器中;結(jié)合從服務(wù)器下載的合并文件,實(shí)現(xiàn)無需上傳,只在移動(dòng)終端中就對(duì)短信進(jìn)行切分;將信息特征輸入短信分類模型,結(jié)合合并文件,輸出短信對(duì)應(yīng)的安全等級(jí);通過合并文件和短信分類模型實(shí)現(xiàn)對(duì)短信的安全等級(jí)進(jìn)行分辨,為用戶下一步如何處理短信提供依據(jù);在斷網(wǎng)環(huán)境,在所用存儲(chǔ)資源僅幾百kb的情況,做到有效識(shí)別詐騙短信、偽基站短信和垃圾短信。

下面通過附圖和實(shí)施例,對(duì)本發(fā)明的技術(shù)方案做進(jìn)一步的詳細(xì)描述。

附圖說明

構(gòu)成說明書的一部分的附圖描述了本發(fā)明的實(shí)施例,并且連同描述一起用于解釋本發(fā)明的原理。

參照附圖,根據(jù)下面的詳細(xì)描述,可以更加清楚地理解本發(fā)明,其中:

圖1為本發(fā)明騷擾短信的檢測方法一個(gè)實(shí)施例的流程圖。

圖2為本發(fā)明騷擾短信的檢測方法另一個(gè)實(shí)施例的流程圖。

圖3為本發(fā)明移動(dòng)終端一個(gè)實(shí)施例的結(jié)構(gòu)示意圖。

圖4為本發(fā)明移動(dòng)終端另一個(gè)實(shí)施例的結(jié)構(gòu)示意圖。

圖5為本發(fā)明騷擾短信的檢測方法一個(gè)實(shí)施例的流程圖。

圖6為本發(fā)明服務(wù)器一個(gè)實(shí)施例的結(jié)構(gòu)示意圖。

具體實(shí)施方式

現(xiàn)在將參照附圖來詳細(xì)描述本發(fā)明的各種示例性實(shí)施例。應(yīng)注意到:除非另外具體說明,否則在這些實(shí)施例中闡述的部件和步驟的相對(duì)布置、數(shù)字表達(dá)式和數(shù)值不限制本發(fā)明的范圍。

同時(shí),應(yīng)當(dāng)明白,為了便于描述,附圖中所示出的各個(gè)部分的尺寸并不是按照實(shí)際的比例關(guān)系繪制的。

以下對(duì)至少一個(gè)示例性實(shí)施例的描述實(shí)際上僅僅是說明性的,決不作為對(duì)本發(fā)明及其應(yīng)用或使用的任何限制。

對(duì)于相關(guān)領(lǐng)域普通技術(shù)人員已知的技術(shù)、方法和設(shè)備可能不作詳細(xì)討論,但在適當(dāng)情況下,所述技術(shù)、方法和設(shè)備應(yīng)當(dāng)被視為說明書的一部分。

應(yīng)注意到:相似的標(biāo)號(hào)和字母在下面的附圖中表示類似項(xiàng),因此,一旦某一項(xiàng)在一個(gè)附圖中被定義,則在隨后的附圖中不需要對(duì)其進(jìn)行進(jìn)一步討論。

本發(fā)明實(shí)施例可以應(yīng)用于計(jì)算機(jī)系統(tǒng)/服務(wù)器,其可與眾多其它通用或?qū)S糜?jì)算系統(tǒng)環(huán)境或配置一起操作。適于與計(jì)算機(jī)系統(tǒng)/服務(wù)器一起使用的眾所周知的計(jì)算系統(tǒng)、環(huán)境和/或配置的例子包括但不限于:個(gè)人計(jì)算機(jī)系統(tǒng)、服務(wù)器計(jì)算機(jī)系統(tǒng)、瘦客戶機(jī)、厚客戶機(jī)、手持或膝上設(shè)備、基于微處理器的系統(tǒng)、機(jī)頂盒、可編程消費(fèi)電子產(chǎn)品、網(wǎng)絡(luò)個(gè)人電腦、小型計(jì)算機(jī)系統(tǒng)﹑大型計(jì)算機(jī)系統(tǒng)和包括上述任何系統(tǒng)的分布式云計(jì)算技術(shù)環(huán)境,等等。

計(jì)算機(jī)系統(tǒng)/服務(wù)器可以在由計(jì)算機(jī)系統(tǒng)執(zhí)行的計(jì)算機(jī)系統(tǒng)可執(zhí)行指令(諸如程序模塊)的一般語境下描述。通常,程序模塊可以包括例程、程序、目標(biāo)程序、組件、邏輯、數(shù)據(jù)結(jié)構(gòu)等等,它們執(zhí)行特定的任務(wù)或者實(shí)現(xiàn)特定的抽象數(shù)據(jù)類型。計(jì)算機(jī)系統(tǒng)/服務(wù)器可以在分布式云計(jì)算環(huán)境中實(shí)施,分布式云計(jì)算環(huán)境中,任務(wù)是由通過通信網(wǎng)絡(luò)鏈接的遠(yuǎn)程處理設(shè)備執(zhí)行的。在分布式云計(jì)算環(huán)境中,程序模塊可以位于包括存儲(chǔ)設(shè)備的本地或遠(yuǎn)程計(jì)算系統(tǒng)存儲(chǔ)介質(zhì)上。

圖1為本發(fā)明騷擾短信的檢測方法一個(gè)實(shí)施例的流程圖。如圖1所示,該方法應(yīng)用于移動(dòng)終端,該實(shí)施例方法包括:

步驟101,對(duì)接收的短信基于存儲(chǔ)器中的合并文件進(jìn)行切分,得到至少一個(gè)信息特征;合并文件從服務(wù)器下載到存儲(chǔ)器中。

從服務(wù)器下載合并文件可以是接收到短信之后發(fā)送文件下載請(qǐng)求,并接收服務(wù)器反饋的合并文件存入存儲(chǔ)器中對(duì)接收的短信進(jìn)行切分;還可以是在接收短信之前,提前發(fā)送文件下載請(qǐng)求到服務(wù)器中,接收服務(wù)器反饋的合并文件存入存儲(chǔ)器,以備后續(xù)對(duì)終端接收到的短信進(jìn)行切分;如果是提前接收合并文件,那么,當(dāng)服務(wù)器中合并文件定期更新時(shí),同步對(duì)移動(dòng)終端中的合并文件進(jìn)行更新。

步驟102,將信息特征輸入短信分類模型,結(jié)合合并文件,輸出短信對(duì)應(yīng)的安全等級(jí)。

輸出的安全等級(jí)可以包括但不限于危險(xiǎn)、騷擾和安全級(jí)別,主要用于為用戶下一步對(duì)該短信執(zhí)行操作提供依據(jù),對(duì)于危險(xiǎn)級(jí)別的短信通常進(jìn)行隔離和/或刪除處理;對(duì)于騷擾級(jí)別的短信可以采用隔離和/或刪除和/或提示用戶處理;對(duì)于安全級(jí)別的短信通常是不做處理,直接顯示給用戶。當(dāng)然還可以按照具體需要對(duì)安全等級(jí)進(jìn)行設(shè)置,如設(shè)置第一安全級(jí)別、第二安全級(jí)別等,可設(shè)置至少兩個(gè)安全等級(jí)級(jí)別,上不封頂,可適應(yīng)各種情況。

基于本發(fā)明上述實(shí)施例提供的一種騷擾短信的檢測方法,對(duì)接收的短信基于存儲(chǔ)器中的合并文件進(jìn)行切分,得到至少一個(gè)信息特征;合并文件從服務(wù)器下載到存儲(chǔ)器中;結(jié)合從服務(wù)器下載的合并文件,實(shí)現(xiàn)無需上傳,只在移動(dòng)終端中就對(duì)短信進(jìn)行切分;將信息特征輸入短信分類模型,結(jié)合合并文件,輸出短信對(duì)應(yīng)的安全等級(jí);通過合并文件和短信分類模型實(shí)現(xiàn)對(duì)短信的安全等級(jí)進(jìn)行分辨,為用戶下一步如何處理短信提供依據(jù);在斷網(wǎng)環(huán)境,在所用存儲(chǔ)資源僅幾百kb的情況,做到有效識(shí)別詐騙短信、偽基站短信和垃圾短信。

在本發(fā)明方法上述實(shí)施例的一個(gè)具體示例中,還包括:基于輸出的安全等級(jí),將符合預(yù)設(shè)安全等級(jí)的短信和短信的相關(guān)信息發(fā)送到服務(wù)器。

通過移動(dòng)終端的安全等級(jí)監(jiān)測用戶可將廣告短信、詐騙短信或非法短信上報(bào)至服務(wù)器端,此上報(bào)方式可用戶主動(dòng)發(fā)送或應(yīng)用程序詢問是否有可上報(bào)的垃圾短信。此類短信主要為移動(dòng)終端安裝安全監(jiān)測應(yīng)用程序前,移動(dòng)終端存儲(chǔ)的短信。

服務(wù)器端接收用戶上報(bào)的短信后,提取短信文本中的號(hào)碼信息,用于構(gòu)建黑號(hào)碼庫。其中,用戶還可舉報(bào)黑號(hào)碼及其相關(guān)的欺詐行為,該黑號(hào)碼涉及已證實(shí)的不法行為,具有真實(shí)受害者(如:個(gè)人、公司、團(tuán)體等),服務(wù)器端將黑號(hào)碼和相關(guān)欺詐信息記載至黑號(hào)碼庫中。以舉報(bào)詐騙短信為例,詐騙短信中的銀行賬號(hào)為虛假中獎(jiǎng)信息的賬號(hào),且該賬號(hào)以領(lǐng)獎(jiǎng)保證金的名義騙取若干元,并提供相關(guān)證據(jù)。

其中,用戶還可上報(bào)疑似垃圾短信。

服務(wù)器端判斷的疑似短信:當(dāng)服務(wù)器端對(duì)短信中的號(hào)碼進(jìn)行匹配時(shí),若該號(hào)碼疑似為黑號(hào)碼,則也將該號(hào)碼收入至黑號(hào)碼庫。

利用網(wǎng)絡(luò)資源收集的垃圾短信:服務(wù)器端提取垃圾短信中的號(hào)碼信息,并記錄至黑號(hào)碼庫。

在其他實(shí)施例中,利用網(wǎng)絡(luò)資源收集垃圾信息的方式具體為,可在兼職、出租、貨物交易等信息發(fā)布平臺(tái)、游戲平臺(tái)、通訊群進(jìn)行收集,首先對(duì)消息中涉及錢財(cái)?shù)年P(guān)鍵詞進(jìn)行抓取,然后通過預(yù)設(shè)的規(guī)則(如:交易價(jià)格異常等)進(jìn)行判斷,以確定該消息是否為垃圾信息,若是,將該消息中的號(hào)碼信息記錄至黑號(hào)碼庫。

對(duì)于黑號(hào)碼庫,可對(duì)黑號(hào)碼庫分級(jí),如黑名單、高危名單和疑似名單,不同名單中黑號(hào)碼的危險(xiǎn)程度不同。

黑名單中的黑號(hào)碼主要為已證實(shí)的產(chǎn)生真實(shí)受害者的號(hào)碼信息,此名單中的號(hào)碼具有嚴(yán)重的危險(xiǎn)性。

高危名單中的黑號(hào)碼主要為涉嫌不法行為的號(hào)碼信息,此名單中的號(hào)碼信息還沒有發(fā)生實(shí)質(zhì)的非法行為或還沒有被受害者舉報(bào),具有高危險(xiǎn)性。如號(hào)碼信息涉及低價(jià)交易等。

疑似名單中的黑號(hào)碼主要為疑似涉嫌不法行為的號(hào)碼信息,此名單中的號(hào)碼信息主要為涉及敏感信息的號(hào)碼信息或用戶請(qǐng)求安全檢測的號(hào)碼信息,其危險(xiǎn)性較高危名單中的黑號(hào)碼低。如某號(hào)碼信息短時(shí)間內(nèi)被大量用戶提交安全檢測請(qǐng)求、某號(hào)碼信息大量涉及兼職、充值等涉及錢財(cái)?shù)拿舾行畔ⅰ?/p>

除黑號(hào)碼庫,還可設(shè)置相應(yīng)的白名單,白名單中主要為安全的號(hào)碼信息,通常表現(xiàn)為移動(dòng)、電信、聯(lián)通、銀行等推送的消息。

在本發(fā)明方法上述實(shí)施例的一個(gè)具體示例中,還包括:從服務(wù)器下載合并文件,對(duì)合并文件進(jìn)行解壓縮和分解,得到詞典庫文件和分類模型文件。

本實(shí)施例中,合并文件包括詞典庫文件和分類模型文件,從而做到在有限的空間下,將分詞依賴文件,分類算法依賴文件同時(shí)下發(fā)。這樣即可以準(zhǔn)確的進(jìn)行分詞,還可以利用機(jī)器學(xué)習(xí)的分類算法,將自然語言處理與機(jī)器學(xué)習(xí)有機(jī)的結(jié)合在一起。

在本發(fā)明一實(shí)施例中,服務(wù)器提供的詞典庫文件中的標(biāo)記信息可以是服務(wù)器從互聯(lián)網(wǎng)上收集的,也可以是接收來自移動(dòng)終端提交的,本發(fā)明對(duì)此不作限制。例如,服務(wù)器從互聯(lián)網(wǎng)的網(wǎng)頁內(nèi)容中提取號(hào)碼的標(biāo)記信息,該標(biāo)記信息可以是號(hào)碼的類別,如快遞、送餐、教育等,也可以是直接標(biāo)記該號(hào)碼是惡意的或非惡意的,等等。又如,在移動(dòng)終端提交號(hào)碼的標(biāo)記信息之前,可以由用戶進(jìn)行手動(dòng)標(biāo)記,如用戶在接聽完電話后,會(huì)在移動(dòng)終端的界面上顯示出多個(gè)選項(xiàng),例如送餐電話、快遞電話、推銷電話、房產(chǎn)中介等,用戶根據(jù)接聽電話的內(nèi)容選擇出該電話號(hào)碼的類型,這些被標(biāo)記的號(hào)碼的時(shí)間、地區(qū)、類別等信息均可以為號(hào)碼的標(biāo)記信息。

在本發(fā)明方法上述實(shí)施例的一個(gè)具體示例中,步驟101可以包括:

接收短信,獲取短信對(duì)應(yīng)的文本內(nèi)容,調(diào)用存儲(chǔ)器中合并文件中的詞典庫文件,將短信的文本內(nèi)容與詞典庫文件中的特征詞進(jìn)行匹配,確定短信中的包含相應(yīng)特征詞的多個(gè)信息特征;

其中,詞典庫中的特征詞的長度包含一個(gè)或多個(gè)字符,特征詞為具有顯著區(qū)分性的詞。

在本實(shí)施例中,詞典庫文件中包括大量基于已知的垃圾短信、詐騙短信和偽基站短信獲取的具有識(shí)別功能的特征詞,此時(shí)將收到的短信中的文本內(nèi)容與所有特征詞進(jìn)行匹配,將文本內(nèi)容中與特征詞相匹配的內(nèi)容提取出來,構(gòu)成信息特征,后續(xù)需要根據(jù)這些信息特征對(duì)該短信的級(jí)別進(jìn)行判斷。

圖2為本發(fā)明騷擾短信的檢測方法另一個(gè)實(shí)施例的流程圖。如圖2所示,本實(shí)施例方法包括:

步驟101,對(duì)接收的短信基于存儲(chǔ)器中的合并文件進(jìn)行切分,得到至少一個(gè)信息特征;合并文件從服務(wù)器下載到存儲(chǔ)器中。

從服務(wù)器下載合并文件可以是接收到短信之后發(fā)送文件下載請(qǐng)求,并接收服務(wù)器反饋的合并文件存入存儲(chǔ)器中對(duì)接收的短信進(jìn)行切分;還可以是在接收短信之前,提前發(fā)送文件下載請(qǐng)求到服務(wù)器中,接收服務(wù)器反饋的合并文件存入存儲(chǔ)器,以備后續(xù)對(duì)終端接收到的短信進(jìn)行切分;如果是提前接收合并文件,那么,當(dāng)服務(wù)器中合并文件定期更新時(shí),同步對(duì)移動(dòng)終端中的合并文件進(jìn)行更新。

步驟202,將基于合并文件獲得的分類模型文件輸入短信分類模型中,對(duì)短信分類模型進(jìn)行訓(xùn)練,得到訓(xùn)練好的短信分類模型。

分類模型文件是基于詞典文件經(jīng)過處理獲得的,分類模型文件中包括基于詞典文件中的特征詞獲得的對(duì)應(yīng)短信的詞向量、主題向量等屬性特征,將屬性特征輸入到短信分類模型中,可以對(duì)短信分類模型進(jìn)行訓(xùn)練,經(jīng)過訓(xùn)練的短信分類模型就能對(duì)輸入的短信輸出正確的分類類型。

步驟203,將信息特征輸入訓(xùn)練好的短信分類模型中,基于短信分類模型輸出所述短信對(duì)應(yīng)的安全等級(jí)。

可以采用libsvm(支持向量機(jī)分類庫)構(gòu)造多分類的短信分類模型,也可以采用liblinear(線性分類庫)構(gòu)造多分類的短信分類模型。在采用liblinear構(gòu)造多分類的短信分類模型時(shí),可以調(diào)用liblinear中的動(dòng)態(tài)分類庫,利用調(diào)用的動(dòng)態(tài)分類庫構(gòu)造多分類的短信分類模型。

本實(shí)施例中,將接收到的短信的文本內(nèi)容切分得到信息特征,將這些特征輸入到經(jīng)過已知分類類型的特征詞訓(xùn)練的短信分類模型中,由于該短信分類模型所有訓(xùn)練的物料都是不同已知級(jí)別的短信對(duì)應(yīng)的分類模型文件,因此,訓(xùn)練完成的短信分類模型針對(duì)輸入的信息特征能準(zhǔn)確的給出對(duì)應(yīng)短信的安全級(jí)別。

可以通過lda(latentdirichletallocation,語義主題生成模型)獲得目標(biāo)短信所屬的主題向量即主題。具體的,將目標(biāo)短信的至少一個(gè)分詞中的所有分詞輸入lda模型,lda模型會(huì)對(duì)應(yīng)每個(gè)分詞獲得表示其所屬主題topic概率的向量,然后將輸入的所有分詞的表示其所屬主題topic概率的向量相加,在將相加得到的向量與lda模型的主題矩陣相乘獲得目標(biāo)短信的主題向量并輸出。

將上述生成的訓(xùn)練樣本進(jìn)行人工標(biāo)記,如為了判斷銀行等發(fā)送的消費(fèi)金額、余額等信息,則將短信中基于表征金額、余額等的數(shù)字為基準(zhǔn)生成的特征向量標(biāo)記為正樣本;短信中的其他數(shù)字信息,如打幾折等數(shù)字,以該些數(shù)字為基準(zhǔn)生成的特征向量標(biāo)記為負(fù)樣本。并且,將正樣本的結(jié)果信息定為正確,輸出結(jié)果值為1,將負(fù)樣本的結(jié)果信息定為錯(cuò)誤,輸出結(jié)果值為0。

在本發(fā)明方法上述實(shí)施例的一個(gè)具體示例中,步驟203具體可以包括:根據(jù)信息特征對(duì)短信的文本內(nèi)容進(jìn)行評(píng)估,以獲取短信的文本內(nèi)容的評(píng)估值,基于評(píng)估值得到對(duì)應(yīng)的安全等級(jí)。

當(dāng)基于安全等級(jí)判斷短信為騷擾短信后,則對(duì)該短信進(jìn)行攔截并存儲(chǔ)于黑名單中。在其他實(shí)施例中,判斷短信為騷擾短信后,將該短信從用戶的短信列表中刪除,以避免騷擾短信為用戶帶來的不便,提高用戶使用短信進(jìn)行通信的體驗(yàn)度。

在本發(fā)明方法上述實(shí)施例的一個(gè)具體示例中,根據(jù)信息特征對(duì)短信的文本內(nèi)容進(jìn)行評(píng)估,可以包括:

確定每個(gè)信息特征對(duì)應(yīng)的權(quán)重;

根據(jù)確定的權(quán)重和信息特征對(duì)短信的文本內(nèi)容進(jìn)行評(píng)估。

本實(shí)施例中,根據(jù)信息特征對(duì)短信的文本內(nèi)容進(jìn)行評(píng)估,可以是依據(jù)信息特征的權(quán)重進(jìn)行評(píng)估,而確定每個(gè)信息特征的權(quán)重可以通過多種方式來實(shí)現(xiàn),如根據(jù)專家經(jīng)驗(yàn)或者根據(jù)實(shí)際情況進(jìn)行權(quán)重確定操作;而評(píng)估值的獲得可以包括:獲取在服務(wù)器預(yù)先建立的字典庫文件的特征詞與權(quán)重的對(duì)應(yīng)關(guān)系,根據(jù)該對(duì)應(yīng)關(guān)系,查找每個(gè)信息特征的權(quán)重,隨后,可以根據(jù)權(quán)重和每個(gè)信息特征對(duì)短信的文本內(nèi)容進(jìn)行評(píng)估。

本領(lǐng)域普通技術(shù)人員可以理解:實(shí)現(xiàn)上述方法實(shí)施例的全部或部分步驟可以通過程序指令相關(guān)的硬件來完成,前述的程序可以存儲(chǔ)于一計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中,該程序在執(zhí)行時(shí),執(zhí)行包括上述方法實(shí)施例的步驟;而前述的存儲(chǔ)介質(zhì)包括:rom、ram、磁碟或者光盤等各種可以存儲(chǔ)程序代碼的介質(zhì)。

圖3為本發(fā)明移動(dòng)終端一個(gè)實(shí)施例的結(jié)構(gòu)示意圖。該實(shí)施例的移動(dòng)終端可用于實(shí)現(xiàn)本發(fā)明上述各方法實(shí)施例。如圖3所示,該實(shí)施例的移動(dòng)終端包括:

特征提取單元31,用于對(duì)接收的短信基于存儲(chǔ)器中的合并文件進(jìn)行切分,得到至少一個(gè)信息特征。

其中,合并文件從服務(wù)器下載到存儲(chǔ)器中。

等級(jí)評(píng)定單元32,用于將信息特征輸入短信分類模型,結(jié)合合并文件,輸出短信對(duì)應(yīng)的安全等級(jí)。

基于本發(fā)明上述實(shí)施例提供的一種移動(dòng)終端,對(duì)接收的短信基于存儲(chǔ)器中的合并文件進(jìn)行切分,得到至少一個(gè)信息特征;合并文件從服務(wù)器下載到存儲(chǔ)器中;結(jié)合從服務(wù)器下載的合并文件,實(shí)現(xiàn)無需上傳,只在移動(dòng)終端中就對(duì)短信進(jìn)行切分;將信息特征輸入短信分類模型,結(jié)合合并文件,輸出短信對(duì)應(yīng)的安全等級(jí);通過合并文件和短信分類模型實(shí)現(xiàn)對(duì)短信的安全等級(jí)進(jìn)行分辨,為用戶下一步如何處理短信提供依據(jù);在斷網(wǎng)環(huán)境,在所用存儲(chǔ)資源僅幾百kb的情況,做到有效識(shí)別詐騙短信、偽基站短信和垃圾短信。

在本發(fā)明移動(dòng)終端上述實(shí)施例的一個(gè)具體示例中,還包括短信發(fā)送單元,用于基于輸出的安全等級(jí),將符合預(yù)設(shè)安全等級(jí)的短信和短信的相關(guān)信息發(fā)送到服務(wù)器。

在本發(fā)明移動(dòng)終端上述實(shí)施例的一個(gè)具體示例中,還包括:下載單元,用于從服務(wù)器下載合并文件,對(duì)所述合并文件進(jìn)行解壓縮和分解,得到詞典庫文件和分類模型文件。

在本發(fā)明移動(dòng)終端上述實(shí)施例的一個(gè)具體示例中,特征提取單元31,具體用于接收短信,獲取短信對(duì)應(yīng)的文本內(nèi)容,調(diào)用存儲(chǔ)器中合并文件中的詞典庫文件,將短信的文本內(nèi)容與詞典庫文件中的特征詞進(jìn)行匹配,確定短信中的包含相應(yīng)特征詞的多個(gè)信息特征。

其中,詞典庫中的特征詞的長度包含一個(gè)或多個(gè)字符,特征詞為具有顯著區(qū)分性的詞。

圖4為本發(fā)明移動(dòng)終端另一個(gè)實(shí)施例的結(jié)構(gòu)示意圖。如圖4所示,本實(shí)施例移動(dòng)終端中等級(jí)評(píng)定單元32,包括:

訓(xùn)練模塊321,用于將基于合并文件獲得的分類模型文件輸入短信分類模型中,對(duì)短信分類模型進(jìn)行訓(xùn)練,得到訓(xùn)練好的短信分類模型。

預(yù)測模塊322,用于將信息特征輸入訓(xùn)練好的短信分類模型中,基于短信分類模型輸出短信對(duì)應(yīng)的安全等級(jí)。

本實(shí)施例中,分類模型文件是基于詞典文件經(jīng)過處理獲得的,分類模型文件是已知其分類類別的短信經(jīng)過歸類劃分后的到的文件,將分類模型文件輸入到短信分類模型中,可以對(duì)短信分類模型進(jìn)行訓(xùn)練,經(jīng)過訓(xùn)練的短信分類模型就能對(duì)輸入的短信輸出正確的分類類型。將接收到的短信的文本內(nèi)容切分得到信息特征,將這些特征輸入到經(jīng)過已知分類類型的特征詞訓(xùn)練的短信分類模型中,由于該短信分類模型所有訓(xùn)練的物料都是不同已知級(jí)別的短信對(duì)應(yīng)的分類模型文件,因此,訓(xùn)練完成的短信分類模型針對(duì)輸入的信息特征能準(zhǔn)確的給出對(duì)應(yīng)短信的安全級(jí)別。

在本發(fā)明移動(dòng)終端上述實(shí)施例的一個(gè)具體示例中,預(yù)測模塊322,具體用于根據(jù)信息特征對(duì)所述短信的文本內(nèi)容進(jìn)行評(píng)估,以獲取短信的文本內(nèi)容的評(píng)估值,基于評(píng)估值得到對(duì)應(yīng)的安全等級(jí)。

在本發(fā)明移動(dòng)終端上述實(shí)施例的一個(gè)具體示例中,預(yù)測模塊322,還用于確定每個(gè)信息特征對(duì)應(yīng)的權(quán)重;根據(jù)確定的權(quán)重和信息特征對(duì)短信的文本內(nèi)容進(jìn)行評(píng)估。

本發(fā)明中所涉及的短信不僅指短信,還包括微信短信、qq短信等移動(dòng)終端能接收到的包括文本內(nèi)容的所有短信。

圖5為本發(fā)明騷擾短信的檢測方法一個(gè)實(shí)施例的流程圖。如圖5所示,該方法應(yīng)用于服務(wù)器,該實(shí)施例方法包括:

步驟501,接收移動(dòng)終端發(fā)送的文件下載請(qǐng)求。

移動(dòng)終端存儲(chǔ)空間有限,因此,在不需要對(duì)短信進(jìn)行鑒別時(shí),有可能將之前存儲(chǔ)的合并文件刪除,因此,在移動(dòng)終端接收到新的短信需要鑒別時(shí),需要向服務(wù)器發(fā)送文件下載請(qǐng)求,服務(wù)器按照請(qǐng)求將合并文件下發(fā)到移動(dòng)終端;而當(dāng)移動(dòng)終端中存在已有的合并文件時(shí),此時(shí)文件下載到移動(dòng)終端對(duì)已有的合并文件進(jìn)行更新。

步驟502,將詞典庫文件和分類模型文件進(jìn)行組合,并將組合后的詞典庫文件和分類模型文件進(jìn)行壓縮得到合并文件。

步驟503,將合并文件下發(fā)到發(fā)出文件下載請(qǐng)求的移動(dòng)終端。

基于本發(fā)明上述實(shí)施例提供的一種騷擾短信的檢測方法,在服務(wù)器中將詞典庫文件和分類模型文件組合并壓縮,使合并文件的大小能夠在移動(dòng)終端中正常運(yùn)行,在移動(dòng)終端僅提供幾百kb的存儲(chǔ)空間的情況下,在斷網(wǎng)狀態(tài),移動(dòng)終端僅依靠從服務(wù)器下載的合并文件就能實(shí)現(xiàn)對(duì)垃圾短信、詐騙短信和偽基站短信的識(shí)別。

在本發(fā)明一實(shí)施例中,服務(wù)器的標(biāo)記庫中的標(biāo)記信息可以是服務(wù)器從互聯(lián)網(wǎng)上收集的,也可以是接收來自移動(dòng)終端提交的,本發(fā)明對(duì)此不作限制。例如,服務(wù)器從互聯(lián)網(wǎng)的網(wǎng)頁內(nèi)容中提取號(hào)碼的標(biāo)記信息,該標(biāo)記信息可以是號(hào)碼的類別,如快遞、送餐、教育等,也可以是直接標(biāo)記該號(hào)碼是惡意的或非惡意的,等等。又如,在移動(dòng)終端提交號(hào)碼的標(biāo)記信息之前,可以由用戶進(jìn)行手動(dòng)標(biāo)記,如用戶在接聽完電話后,會(huì)在移動(dòng)終端的界面上顯示出多個(gè)選項(xiàng),例如送餐電話、快遞電話、推銷電話、房產(chǎn)中介等,用戶根據(jù)接聽電話的內(nèi)容選擇出該電話號(hào)碼的類型,這些被標(biāo)記的號(hào)碼的時(shí)間、地區(qū)、類別等信息均可以為號(hào)碼的標(biāo)記信息。

在本發(fā)明方法上述實(shí)施例的一個(gè)具體示例中,其中步驟502中分類模型文件的獲取過程可以包括:

基于詞典庫文件中的特征詞對(duì)采集的訓(xùn)練數(shù)據(jù)進(jìn)行分詞和特征選擇得到分詞特征數(shù)據(jù);

基于分類算法對(duì)分詞特征數(shù)據(jù)進(jìn)行分類,得到分類模型文件。

在本實(shí)施例中,詞典庫文件中的特征詞都是通過對(duì)已知級(jí)別的短信提取得到的,基于這些特征詞對(duì)采集的大量訓(xùn)練數(shù)據(jù)進(jìn)行分詞和特征選擇將得到的分詞特征數(shù)據(jù),其中大量訓(xùn)練數(shù)據(jù)是為了分類訓(xùn)練而采集的具有明確分類類型的短信,將基于訓(xùn)練數(shù)據(jù)得到的分詞特征數(shù)據(jù)輸入分類算法后,就可得到每個(gè)訓(xùn)練數(shù)據(jù)對(duì)應(yīng)的分類類別信息,并基于分類類別信息對(duì)所有分詞特征數(shù)據(jù)進(jìn)行分類,進(jìn)而得到分類模型文件。

在本發(fā)明方法上述實(shí)施例的一個(gè)具體示例中,還包括:接收移動(dòng)終端發(fā)送的短信和短信的相關(guān)信息,將短信和相關(guān)信息存入相應(yīng)數(shù)據(jù)庫中;數(shù)據(jù)包括黑名單數(shù)據(jù)庫、和/或白名單數(shù)據(jù)庫。

服務(wù)器端接收用戶上報(bào)的短信后,提取短信文本中的號(hào)碼信息,用于構(gòu)建黑號(hào)碼庫。其中,用戶還可舉報(bào)黑號(hào)碼及其相關(guān)的欺詐行為,該黑號(hào)碼涉及已證實(shí)的不法行為,具有真實(shí)受害者(如:個(gè)人、公司、團(tuán)體等),服務(wù)器端將黑號(hào)碼和相關(guān)欺詐信息記載至黑號(hào)碼庫中。以舉報(bào)詐騙短信為例,詐騙短信中的銀行賬號(hào)為虛假中獎(jiǎng)信息的賬號(hào),且該賬號(hào)以領(lǐng)獎(jiǎng)保證金的名義騙取若干元,并提供相關(guān)證據(jù)。

其中,用戶還可上報(bào)疑似垃圾短信。

服務(wù)器端判斷的疑似短信:當(dāng)服務(wù)器端對(duì)短信中的號(hào)碼進(jìn)行匹配時(shí),若該號(hào)碼疑似為黑號(hào)碼,則也將該號(hào)碼收入至黑號(hào)碼庫。

利用網(wǎng)絡(luò)資源收集的垃圾短信:服務(wù)器端提取垃圾短信中的號(hào)碼信息,并記錄至黑號(hào)碼庫。

在其他實(shí)施例中,利用網(wǎng)絡(luò)資源收集垃圾信息的方式具體為,可在兼職、出租、貨物交易等信息發(fā)布平臺(tái)、游戲平臺(tái)、通訊群進(jìn)行收集,首先對(duì)消息中涉及錢財(cái)?shù)年P(guān)鍵詞進(jìn)行抓取,然后通過預(yù)設(shè)的規(guī)則(如:交易價(jià)格異常等)進(jìn)行判斷,以確定該消息是否為垃圾信息,若是,將該消息中的號(hào)碼信息記錄至黑號(hào)碼庫。

對(duì)于黑號(hào)碼庫,可對(duì)黑號(hào)碼庫分級(jí),如黑名單、高危名單和疑似名單,不同名單中黑號(hào)碼的危險(xiǎn)程度不同。

黑名單中的黑號(hào)碼主要為已證實(shí)的產(chǎn)生真實(shí)受害者的號(hào)碼信息,此名單中的號(hào)碼具有嚴(yán)重的危險(xiǎn)性。

高危名單中的黑號(hào)碼主要為涉嫌不法行為的號(hào)碼信息,此名單中的號(hào)碼信息還沒有發(fā)生實(shí)質(zhì)的非法行為或還沒有被受害者舉報(bào),具有高危險(xiǎn)性。如號(hào)碼信息涉及低價(jià)交易等。

疑似名單中的黑號(hào)碼主要為疑似涉嫌不法行為的號(hào)碼信息,此名單中的號(hào)碼信息主要為涉及敏感信息的號(hào)碼信息或用戶請(qǐng)求安全檢測的號(hào)碼信息,其危險(xiǎn)性較高危名單中的黑號(hào)碼低。如某號(hào)碼信息短時(shí)間內(nèi)被大量用戶提交安全檢測請(qǐng)求、某號(hào)碼信息大量涉及兼職、充值等涉及錢財(cái)?shù)拿舾行畔ⅰ?/p>

除黑號(hào)碼庫,還可設(shè)置相應(yīng)的白名單,白名單中主要為安全的號(hào)碼信息,通常表現(xiàn)為移動(dòng)、電信、聯(lián)通、銀行等推送的消息。

本領(lǐng)域普通技術(shù)人員可以理解:實(shí)現(xiàn)上述方法實(shí)施例的全部或部分步驟可以通過程序指令相關(guān)的硬件來完成,前述的程序可以存儲(chǔ)于一計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中,該程序在執(zhí)行時(shí),執(zhí)行包括上述方法實(shí)施例的步驟;而前述的存儲(chǔ)介質(zhì)包括:rom、ram、磁碟或者光盤等各種可以存儲(chǔ)程序代碼的介質(zhì)。

圖6為本發(fā)明服務(wù)器一個(gè)實(shí)施例的結(jié)構(gòu)示意圖。該實(shí)施例的服務(wù)器可用于實(shí)現(xiàn)本發(fā)明上述各方法實(shí)施例。如圖6所示,該實(shí)施例的服務(wù)器包括:

請(qǐng)求接收單元61,用于接收移動(dòng)終端發(fā)送的文件下載請(qǐng)求。

移動(dòng)終端存儲(chǔ)空間有限,因此,在不需要對(duì)短信進(jìn)行鑒別時(shí),有可能將之前存儲(chǔ)的合并文件刪除,因此,在移動(dòng)終端接收到新的短信需要鑒別時(shí),需要向服務(wù)器發(fā)送文件下載請(qǐng)求,服務(wù)器按照請(qǐng)求將合并文件下發(fā)到移動(dòng)終端;而當(dāng)移動(dòng)終端中存在已有的合并文件時(shí),此時(shí)文件下載到移動(dòng)終端對(duì)已有的合并文件進(jìn)行更新。

文件合并單元62,用于將詞典庫文件和分類模型文件進(jìn)行組合,并將組合后的詞典庫文件和分類模型文件進(jìn)行壓縮得到合并文件。

文件下發(fā)單元63,用于將合并文件下發(fā)到發(fā)出文件下載請(qǐng)求的移動(dòng)終端。

基于本發(fā)明上述實(shí)施例提供的一種服務(wù)器,在服務(wù)器中將詞典庫文件和分類模型文件組合并壓縮,使合并文件的大小能夠在移動(dòng)終端中正常運(yùn)行,在移動(dòng)終端僅提供幾百kb的存儲(chǔ)空間的情況下,在斷網(wǎng)狀態(tài),移動(dòng)終端僅依靠從服務(wù)器下載的合并文件就能實(shí)現(xiàn)對(duì)垃圾短信、詐騙短信和偽基站短信的識(shí)別。

在本發(fā)明服務(wù)器上述實(shí)施例的一個(gè)具體示例中,還包括:分類獲取單元,用于基于詞典庫文件中的特征詞對(duì)采集的訓(xùn)練數(shù)據(jù)進(jìn)行分詞和特征選擇得到分詞特征數(shù)據(jù);基于分類算法對(duì)分詞特征數(shù)據(jù)進(jìn)行分類,得到分類模型文件。

在本發(fā)明服務(wù)器上述實(shí)施例的一個(gè)具體示例中,還包括存儲(chǔ)單元,用于接收移動(dòng)終端發(fā)送的短信和短信的相關(guān)信息,將短信和相關(guān)信息存入相應(yīng)數(shù)據(jù)庫中;數(shù)據(jù)包括黑名單數(shù)據(jù)庫、和/或白名單數(shù)據(jù)庫。

本發(fā)明上述各實(shí)施例,在服務(wù)器利用海量數(shù)據(jù)學(xué)習(xí)得到一個(gè)詞典文件,該詞典文件是基于全局的一個(gè)分析利用信息增益、交叉熵的算法計(jì)算得到最具有顯著區(qū)分性的詞。利用這些詞,結(jié)合服務(wù)器大規(guī)模的訓(xùn)練語料進(jìn)行分詞、特征選擇,再結(jié)合分類算法得到分類模型文件。然后再將詞典文件和模型文件進(jìn)行有效的組合,同時(shí)進(jìn)行利用高效的壓縮算法生成最終下發(fā)的合并文件。移動(dòng)終端在收到一條短信的時(shí)候,利用合并文件先進(jìn)行短信切分,然后短信分類模型接收切分后的特征,結(jié)合合并文件最終輸出短信的安全等級(jí)。

對(duì)于詐騙短信的識(shí)別的方法必然不是以快對(duì)快的方式來進(jìn)行,針對(duì)詐騙短信率先的提出非白即黑策略。對(duì)于積分詐騙短信、航空詐騙,銀行卡信用額度提取短信,qq兼職短信等等常見類型的詐騙我們都會(huì)應(yīng)用非白即黑策略。用戶輸入的短信先應(yīng)用url策略和號(hào)碼策略進(jìn)行處理,結(jié)合服務(wù)器收集的強(qiáng)大白文件庫,以及機(jī)器學(xué)習(xí)算法共同給出安全等級(jí)。非白即黑策略不是簡單地針對(duì)url對(duì)比白庫,這樣是無法滿足對(duì)于詐騙短信需要高準(zhǔn)確度報(bào)出的要求。所以利用機(jī)器學(xué)習(xí)算法,生成詐騙短信的相關(guān)模型,通過算法模型進(jìn)一步提升準(zhǔn)確率,將非白即黑準(zhǔn)確率提升到99%。從而準(zhǔn)確高效的攔截詐騙短信,實(shí)現(xiàn)以不變應(yīng)萬變。

根據(jù)本發(fā)明實(shí)施例的另一個(gè)方面,提供的一種騷擾短信的檢測系統(tǒng),包括:本發(fā)明上述任意一項(xiàng)實(shí)施例服務(wù)器和至少一個(gè)本發(fā)明上述任意一項(xiàng)實(shí)施例移動(dòng)終端。

1、一種騷擾短信的檢測方法,應(yīng)用于移動(dòng)終端,包括:

對(duì)接收的短信基于存儲(chǔ)器中的合并文件進(jìn)行切分,得到至少一個(gè)信息特征;所述合并文件從服務(wù)器下載到存儲(chǔ)器中;

將所述信息特征輸入短信分類模型,結(jié)合合并文件,輸出所述短信對(duì)應(yīng)的安全等級(jí)。

2、根據(jù)1所述的方法,還包括:基于輸出的安全等級(jí),將符合預(yù)設(shè)安全等級(jí)的短信和所述短信的相關(guān)信息發(fā)送到服務(wù)器。

3、根據(jù)1或2所述的方法,還包括:從服務(wù)器下載合并文件,對(duì)所述合并文件進(jìn)行解壓縮和分解,得到詞典庫文件和分類模型文件。

4、根據(jù)3所述的方法,所述對(duì)接收的短信基于存儲(chǔ)器中的合并文件進(jìn)行切分,得到至少一個(gè)信息特征,包括:

接收短信,獲取短信對(duì)應(yīng)的文本內(nèi)容,調(diào)用存儲(chǔ)器中合并文件中的詞典庫文件,將所述短信的文本內(nèi)容與所述詞典庫文件中的特征詞進(jìn)行匹配,確定所述短信中的包含相應(yīng)特征詞的多個(gè)信息特征;

其中,所述詞典庫中的特征詞的長度包含一個(gè)或多個(gè)字符,所述特征詞為具有顯著區(qū)分性的詞。

5、根據(jù)3或4所述的方法,將所述信息特征輸入短信分類模型,結(jié)合合并文件,輸出所述短信對(duì)應(yīng)的安全等級(jí),包括:

將基于合并文件獲得的分類模型文件輸入短信分類模型中,對(duì)短信分類模型進(jìn)行訓(xùn)練,得到訓(xùn)練好的短信分類模型;

將信息特征輸入所述訓(xùn)練好的短信分類模型中,基于所述短信分類模型輸出所述短信對(duì)應(yīng)的安全等級(jí)。

6、根據(jù)5所述的方法,所述基于所述短信分類模型輸出所述短信對(duì)應(yīng)的安全等級(jí),包括:

根據(jù)所述信息特征對(duì)所述短信的文本內(nèi)容進(jìn)行評(píng)估,以獲取所述短信的文本內(nèi)容的評(píng)估值,基于評(píng)估值得到對(duì)應(yīng)的安全等級(jí)。

7、根據(jù)6所述的方法,根據(jù)所述信息特征對(duì)所述短信的文本內(nèi)容進(jìn)行評(píng)估,包括:

確定每個(gè)所述信息特征對(duì)應(yīng)的權(quán)重;

根據(jù)所述確定的權(quán)重和所述信息特征對(duì)所述短信的文本內(nèi)容進(jìn)行評(píng)估。

8、一種騷擾短信的檢測方法,應(yīng)用于服務(wù)器,包括:

接收移動(dòng)終端發(fā)送的文件下載請(qǐng)求;

將詞典庫文件和分類模型文件進(jìn)行組合,并將組合后的詞典庫文件和分類模型文件進(jìn)行壓縮得到合并文件;

將合并文件下發(fā)到發(fā)出文件下載請(qǐng)求的所述移動(dòng)終端。

9、根據(jù)8所述的方法,所述分類模型文件的獲取,包括:

基于詞典庫文件中的特征詞對(duì)采集的訓(xùn)練數(shù)據(jù)進(jìn)行分詞和特征選擇得到分詞特征數(shù)據(jù);

基于分類算法對(duì)分詞特征數(shù)據(jù)進(jìn)行分類,得到分類模型文件。

10、根據(jù)8或9所述的方法,還包括:接收移動(dòng)終端發(fā)送的短信和所述短信的相關(guān)信息,將所述短信和相關(guān)信息存入相應(yīng)數(shù)據(jù)庫中;所述數(shù)據(jù)包括黑名單數(shù)據(jù)庫、和/或白名單數(shù)據(jù)庫。

11、一種移動(dòng)終端,包括:

特征提取單元,用于對(duì)接收的短信基于存儲(chǔ)器中的合并文件進(jìn)行切分,得到至少一個(gè)信息特征;所述合并文件從服務(wù)器下載到存儲(chǔ)器中;

等級(jí)評(píng)定單元,用于將所述信息特征輸入短信分類模型,結(jié)合合并文件,輸出所述短信對(duì)應(yīng)的安全等級(jí)。

12、根據(jù)11所述的移動(dòng)終端,還包括短信發(fā)送單元,用于基于輸出的安全等級(jí),將符合預(yù)設(shè)安全等級(jí)的短信和所述短信的相關(guān)信息發(fā)送到服務(wù)器。

13、根據(jù)11或12所述的移動(dòng)終端,還包括:下載單元,用于從服務(wù)器下載合并文件,對(duì)所述合并文件進(jìn)行解壓縮和分解,得到詞典庫文件和分類模型文件。

14、根據(jù)13所述的移動(dòng)終端,所述特征提取單元,具體用于接收短信,獲取短信對(duì)應(yīng)的文本內(nèi)容,調(diào)用存儲(chǔ)器中合并文件中的詞典庫文件,將所述短信的文本內(nèi)容與所述詞典庫文件中的特征詞進(jìn)行匹配,確定所述短信中的包含相應(yīng)特征詞的多個(gè)信息特征;

其中,所述詞典庫中的特征詞的長度包含一個(gè)或多個(gè)字符,所述特征詞為具有顯著區(qū)分性的詞。

15、根據(jù)13或14所述的移動(dòng)終端,所述等級(jí)評(píng)定單元,包括:

訓(xùn)練模塊,用于將基于合并文件獲得的分類模型文件輸入短信分類模型中,對(duì)短信分類模型進(jìn)行訓(xùn)練,得到訓(xùn)練好的短信分類模型;

預(yù)測模塊,用于將信息特征輸入所述訓(xùn)練好的短信分類模型中,基于所述短信分類模型輸出所述短信對(duì)應(yīng)的安全等級(jí)。

16、根據(jù)15所述的移動(dòng)終端,所述預(yù)測模塊,具體用于根據(jù)所述信息特征對(duì)所述短信的文本內(nèi)容進(jìn)行評(píng)估,以獲取所述短信的文本內(nèi)容的評(píng)估值,基于評(píng)估值得到對(duì)應(yīng)的安全等級(jí)。

17、根據(jù)16所述的移動(dòng)終端,所述預(yù)測模塊,還用于確定每個(gè)所述信息特征對(duì)應(yīng)的權(quán)重;根據(jù)所述確定的權(quán)重和所述信息特征對(duì)所述短信的文本內(nèi)容進(jìn)行評(píng)估。

18、一種服務(wù)器,包括:

請(qǐng)求接收單元,用于接收移動(dòng)終端發(fā)送的文件下載請(qǐng)求;

文件合并單元,用于將詞典庫文件和分類模型文件進(jìn)行組合,并將組合后的詞典庫文件和分類模型文件進(jìn)行壓縮得到合并文件;

文件下發(fā)單元,用于將合并文件下發(fā)到發(fā)出文件下載請(qǐng)求的所述移動(dòng)終端。

19、根據(jù)18所述的服務(wù)器,還包括:分類獲取單元,用于基于詞典庫文件中的特征詞對(duì)采集的訓(xùn)練數(shù)據(jù)進(jìn)行分詞和特征選擇得到分詞特征數(shù)據(jù);基于分類算法對(duì)分詞特征數(shù)據(jù)進(jìn)行分類,得到分類模型文件。

20、根據(jù)18或19所述的服務(wù)器,還包括存儲(chǔ)單元,用于接收移動(dòng)終端發(fā)送的短信和所述短信的相關(guān)信息,將所述短信和相關(guān)信息存入相應(yīng)數(shù)據(jù)庫中;所述數(shù)據(jù)包括黑名單數(shù)據(jù)庫、和/或白名單數(shù)據(jù)庫。

21、一種騷擾短信的檢測系統(tǒng),包括:一個(gè)如18至20任意一項(xiàng)所述的服務(wù)器和至少一個(gè)如11至17任意一項(xiàng)所述的移動(dòng)終端。

本說明書中各個(gè)實(shí)施例均采用遞進(jìn)的方式描述,每個(gè)實(shí)施例重點(diǎn)說明的都是與其它實(shí)施例的不同之處,各個(gè)實(shí)施例之間相同或相似的部分相互參見即可。對(duì)于系統(tǒng)實(shí)施例而言,由于其與方法實(shí)施例基本對(duì)應(yīng),所以描述的比較簡單,相關(guān)之處參見方法實(shí)施例的部分說明即可。

可能以許多方式來實(shí)現(xiàn)本發(fā)明的方法和裝置。例如,可通過軟件、硬件、固件或者軟件、硬件、固件的任何組合來實(shí)現(xiàn)本發(fā)明的方法和裝置。用于所述方法的步驟的上述順序僅是為了進(jìn)行說明,本發(fā)明的方法的步驟不限于以上具體描述的順序,除非以其它方式特別說明。此外,在一些實(shí)施例中,還可將本發(fā)明實(shí)施為記錄在記錄介質(zhì)中的程序,這些程序包括用于實(shí)現(xiàn)根據(jù)本發(fā)明的方法的機(jī)器可讀指令。因而,本發(fā)明還覆蓋存儲(chǔ)用于執(zhí)行根據(jù)本發(fā)明的方法的程序的記錄介質(zhì)。

本發(fā)明的描述是為了示例和描述起見而給出的,而并不是無遺漏的或者將本發(fā)明限于所公開的形式。很多修改和變化對(duì)于本領(lǐng)域的普通技術(shù)人員而言是顯然的。選擇和描述實(shí)施例是為了更好說明本發(fā)明的原理和實(shí)際應(yīng)用,并且使本領(lǐng)域的普通技術(shù)人員能夠理解本發(fā)明從而設(shè)計(jì)適于特定用途的帶有各種修改的各種實(shí)施例。

當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
沽源县| 无为县| 辽阳市| 新闻| 泸水县| 天柱县| 西宁市| 潜江市| 宜丰县| 开远市| 诏安县| 陆丰市| 昭觉县| 尚志市| 定陶县| 元朗区| 巴林右旗| 洱源县| 班玛县| 双峰县| 登封市| 塔城市| 治多县| 炉霍县| 龙井市| 枣阳市| 大连市| 肥东县| 习水县| 聂拉木县| 蚌埠市| 韶山市| 安西县| 武强县| 肇东市| 漳平市| 湛江市| 察隅县| 藁城市| 灵璧县| 鄂尔多斯市|