識(shí)別垃圾短信的方法、客戶端、云端服務(wù)器和系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及網(wǎng)絡(luò)信息安全技術(shù)領(lǐng)域,具體涉及識(shí)別垃圾短信的方法、客戶端、云端 服務(wù)器和系統(tǒng)。
【背景技術(shù)】
[0002] 隨著移動(dòng)通信技術(shù)的發(fā)展、移動(dòng)設(shè)備的普及和短信資費(fèi)的下降,短信成為移動(dòng)終 端之間進(jìn)行信息傳遞的重要方法之一。用戶在享受短信通信帶來(lái)的便捷時(shí),卻也遭受到一 些廣告短信、詐騙短信等垃圾短信的騷擾,這些垃圾短信影響到用戶的短信使用體驗(yàn),給用 戶的人身、信息、財(cái)產(chǎn)安全帶來(lái)隱患。因此,對(duì)垃圾短信的識(shí)別和攔截是亟待解決的問(wèn)題。
[0003] 現(xiàn)有技術(shù)中,對(duì)垃圾短信的識(shí)別往往通過(guò)將短信的內(nèi)容直接上傳到服務(wù)器,由服 務(wù)器對(duì)該短信的內(nèi)容進(jìn)行識(shí)別,將識(shí)別結(jié)果返回給移動(dòng)終端,如果該短信為垃圾短信,則移 動(dòng)終端對(duì)該短信進(jìn)行攔截或者對(duì)用戶進(jìn)行提示。
[0004] 該方案存在的問(wèn)題是:1、短信的內(nèi)容往往涉及到用戶的個(gè)人信息,在未經(jīng)用戶同 意的情況下將短信的內(nèi)容直接上傳到服務(wù)器侵犯了用戶的個(gè)人隱私,對(duì)用戶的信息安全造 成了損害。2、移動(dòng)終端每次接收到短信時(shí),將短信的內(nèi)容上傳給服務(wù)器,該過(guò)程往往耗費(fèi)相 當(dāng)?shù)木W(wǎng)絡(luò)流量,且處理速度受到移動(dòng)終端所處的網(wǎng)絡(luò)狀態(tài)的限制,不符合用戶需求。
【發(fā)明內(nèi)容】
[0005] 鑒于上述問(wèn)題,提出了本發(fā)明以便提供一種克服上述問(wèn)題或者至少部分地解決上 述問(wèn)題的一種識(shí)別垃圾短信的方法、客戶端、云端服務(wù)器和系統(tǒng)。
[0006] 依據(jù)本發(fā)明的一個(gè)方面,提供了一種識(shí)別垃圾短信的方法,該方法包括:
[0007] 對(duì)移動(dòng)終端中的短信接收事件進(jìn)行檢測(cè);
[0008] 當(dāng)所述移動(dòng)終端接收到短信時(shí),計(jì)算出所述短信的內(nèi)容對(duì)應(yīng)的哈希值;
[0009] 將所述短信的內(nèi)容對(duì)應(yīng)的哈希值上傳到云端服務(wù)器,并接收所述云端服務(wù)器返回 的識(shí)別彳目息;
[0010] 根據(jù)所述識(shí)別信息確定所述短信是否為垃圾短信。
[0011] 可選地,所述計(jì)算出所述短信的內(nèi)容對(duì)應(yīng)的哈希值包括:
[0012] 對(duì)所述短信的內(nèi)容進(jìn)行分詞處理;
[0013] 對(duì)分詞后的各個(gè)詞賦予不同的向量值,匯總計(jì)算得到所述短信的內(nèi)容對(duì)應(yīng)的 simhash值。
[0014] 可選地,該方法進(jìn)一步包括:
[0015] 當(dāng)所述移動(dòng)終端接收到短信時(shí),先根據(jù)移動(dòng)終端的本地規(guī)則判斷所述短信是否為 白短f目;
[0016] 如果不是,則執(zhí)行所述計(jì)算出所述短信的內(nèi)容對(duì)應(yīng)的哈希值,以及將所述短信的 內(nèi)容對(duì)應(yīng)的哈希值上傳到云端服務(wù)器的后續(xù)處理;
[0017] 如果是,則不再進(jìn)行后續(xù)的處理。
[0018] 可選地,所述先根據(jù)移動(dòng)終端的本地規(guī)則判斷所述短信是否為白短信包括如下一 種或多種判斷方法:
[0019] 根據(jù)移動(dòng)終端本地的電話號(hào)碼白名單判斷發(fā)送所述短信的源號(hào)碼是否在所述電 話號(hào)碼白名單中,是則所述短信為白短信;
[0020] 在移動(dòng)終端本地對(duì)短信的內(nèi)容進(jìn)行分詞處理,利用貝葉斯算法計(jì)算分詞后的各個(gè) 詞屬于垃圾短信的概率,匯總計(jì)算得到該短信是垃圾短信的概率,判斷該概率是否小于一 個(gè)預(yù)設(shè)值,是則該短信為白短信;
[0021 ] 在移動(dòng)終端本地計(jì)算短信的內(nèi)容對(duì)應(yīng)的哈希值,再根據(jù)移動(dòng)終端本地的哈希值白 名單判斷該短信的內(nèi)容對(duì)應(yīng)的哈希值是否在哈希值白名單中,是則該短信為白短信。
[0022] 可選地,該方法進(jìn)一步包括:
[0023] 在第一次啟動(dòng)時(shí)彈出聲明協(xié)議,在該聲明協(xié)議中詢問(wèn)用戶是否同意直接將短信內(nèi) 容上傳到云端服務(wù)器;
[0024] 如果用戶選擇了同意,則當(dāng)所述移動(dòng)終端接收到短信時(shí),直接將所述短信的內(nèi)容 上傳到云端服務(wù)器進(jìn)行識(shí)別;
[0025] 如果用戶選擇了不同意,則當(dāng)所述移動(dòng)終端接收到短信時(shí),執(zhí)行所述計(jì)算出所述 短信的內(nèi)容對(duì)應(yīng)的哈希值,以及將所述短信的內(nèi)容對(duì)應(yīng)的哈希值上傳到云端服務(wù)器的后續(xù) 步驟。
[0026] 可選地,該方法進(jìn)一步包括:
[0027] 當(dāng)確定所述短信是垃圾短信時(shí),對(duì)所述短信進(jìn)行攔截處理。
[0028] 依據(jù)本發(fā)明的另一個(gè)方面,提供了一種識(shí)別垃圾短信的方法,該方法包括:
[0029] 接收客戶端側(cè)上傳的短信的內(nèi)容對(duì)應(yīng)的哈希值;
[0030] 將所述短信的內(nèi)容對(duì)應(yīng)的哈希值與哈希值庫(kù)進(jìn)行匹配;其中,所述哈希值庫(kù)中對(duì) 應(yīng)保存有不同短信內(nèi)容對(duì)應(yīng)的哈希值以及已判斷為黑或白的識(shí)別信息;
[0031] 將從哈希值庫(kù)中匹配到的哈希值對(duì)應(yīng)的識(shí)別信息返回給所述客戶端。
[0032] 可選地,所述短信的內(nèi)容對(duì)應(yīng)的哈希值為所述短信的內(nèi)容對(duì)應(yīng)的simhash值。
[0033] 可選地,該方法進(jìn)一步包括:
[0034] 接收用戶舉報(bào)的短信內(nèi)容;
[0035] 對(duì)用戶舉報(bào)的各短信內(nèi)容進(jìn)行黑或白的識(shí)別,并生成對(duì)應(yīng)的s imhash值,將 simhash值和對(duì)應(yīng)的識(shí)別信息保存到所述哈希值庫(kù)中。
[0036] 依據(jù)本發(fā)明的又一個(gè)方面,提供了一種識(shí)別垃圾短信的客戶端,該客戶端包括:
[0037] 接收處理單元,適于對(duì)移動(dòng)終端中的短信接收事件進(jìn)行檢測(cè);當(dāng)所述移動(dòng)終端接 收到短信時(shí),計(jì)算出所述短信的內(nèi)容對(duì)應(yīng)的哈希值并發(fā)送至識(shí)別交互單元;
[0038] 所述識(shí)別交互單元,適于將所述短信的內(nèi)容對(duì)應(yīng)的哈希值上傳到云端服務(wù)器,并 接收所述云端服務(wù)器返回的識(shí)別信息;根據(jù)所述識(shí)別信息確定所述短信是否為垃圾短信。
[0039] 可選地,所述接收處理單元,適于對(duì)所述短信的內(nèi)容進(jìn)行分詞處理;對(duì)分詞后的各 個(gè)詞賦予不同的向量值,匯總計(jì)算得到所述短信的內(nèi)容對(duì)應(yīng)的simhash值。
[0040] 可選地,所述接收處理單元,進(jìn)一步適于當(dāng)所述移動(dòng)終端接收到短信時(shí),先根據(jù)移 動(dòng)終端的本地規(guī)則判斷所述短信是否為白短信;如果不是,則計(jì)算出所述短信的內(nèi)容對(duì)應(yīng) 的哈希值并發(fā)送至所述識(shí)別交互單元;如果是,則不再進(jìn)行后續(xù)處理。
[0041] 可選地,所述接收處理單元,適于根據(jù)如下一種或多種判斷方法判斷所述短信是 否為白短信:
[0042] 根據(jù)移動(dòng)終端本地的電話號(hào)碼白名單判斷發(fā)送所述短信的源號(hào)碼是否在所述電 話號(hào)碼白名單中,是則所述短信為白短信;
[0043] 在移動(dòng)終端本地對(duì)短信的內(nèi)容進(jìn)行分詞處理,利用貝葉斯算法計(jì)算分詞后的各個(gè) 詞屬于垃圾短信的概率,匯總計(jì)算得到該短信是垃圾短信的概率,判斷該概率是否小于一 個(gè)預(yù)設(shè)值,是則該短信為白短信;
[0044] 在移動(dòng)終端本地計(jì)算短信的內(nèi)容對(duì)應(yīng)的哈希值,再根據(jù)移動(dòng)終端本地的哈希值白 名單判斷該短信的內(nèi)容對(duì)應(yīng)的哈希值是否在哈希值白名單中,是則該短信為白短信。
[0045] 可選地,該客戶端進(jìn)一步包括:
[0046] 初始配置單元,適于在第一次啟動(dòng)時(shí)彈出聲明協(xié)議,在該聲明協(xié)議中詢問(wèn)用戶是 否同意直接將短信內(nèi)容上傳到云端服務(wù)器;
[0047] 所述接收處理單元,適于在用戶選擇了同意后,當(dāng)所述移動(dòng)終端接收到短信時(shí),直 接將所述短信的內(nèi)容發(fā)送給所述識(shí)別交互單元;以及適于在用戶選擇了不同意后,當(dāng)所述 移動(dòng)終端接收到短信時(shí),計(jì)算出所述短信的內(nèi)容對(duì)應(yīng)的哈希值并發(fā)送給所述識(shí)別交互單 元;
[0048] 所述識(shí)別交互單元,適于當(dāng)接收到所述短信的內(nèi)容時(shí),直接將所述短信的內(nèi)容上 傳到云端服務(wù)器進(jìn)行識(shí)別;以及適于當(dāng)接收到所述短信的內(nèi)容對(duì)應(yīng)哈希值時(shí),執(zhí)行所述將 所述短信的內(nèi)容對(duì)應(yīng)哈希值上傳到云端服務(wù)器的后續(xù)步驟。
[0049] 可選地,該客戶端進(jìn)一步包括:
[0050] 攔截處理單元,適于當(dāng)確定所述短信是垃圾短信時(shí),對(duì)所述短信進(jìn)行攔截處理。
[0051] 依據(jù)本發(fā)明的再一個(gè)方面,提供了一種識(shí)別垃圾短信的云端服務(wù)器,該云端服務(wù) 器包括:
[0052] 接收單元,適于接收客戶端側(cè)上傳的短信的內(nèi)容對(duì)應(yīng)的哈希值;
[0053] 識(shí)別單元,適于將所述短信的內(nèi)容對(duì)應(yīng)的哈希值與哈希值庫(kù)進(jìn)行匹配;其中,所述 哈希值庫(kù)中對(duì)應(yīng)保存有不同短信內(nèi)容對(duì)應(yīng)的哈希值以及已判斷為黑或白的識(shí)別信息;
[0054] 反饋單元,適于將從哈希值庫(kù)中匹配到的哈希值對(duì)應(yīng)的識(shí)別信息返回給所述客戶 端。
[0055] 可選地,所述短信的內(nèi)容對(duì)應(yīng)的哈希值為所述短信的內(nèi)容對(duì)應(yīng)的simhash值。
[0056] 可選地,所述接收單元,進(jìn)一步適于接收用戶舉報(bào)的短信內(nèi)容;
[0057] 所述識(shí)別單元,進(jìn)一步適于對(duì)用戶舉報(bào)的各短信內(nèi)容進(jìn)行黑或白的識(shí)別,并生成 對(duì)應(yīng)的simhash值,將simhash值和對(duì)應(yīng)的識(shí)別信息保存到所述哈希值庫(kù)中。
[0058] 依據(jù)本發(fā)明的又一個(gè)方面,提供了一種識(shí)別垃圾短信的系統(tǒng),其中,該系統(tǒng)包括如 上任一項(xiàng)所述的識(shí)別垃圾短信的客戶端以及如上任一項(xiàng)所述的識(shí)別垃圾短信的云端服務(wù) 器。
[0059] 由上述可知,本發(fā)明提供的技術(shù)方案