欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

號碼的標(biāo)識方法和裝置與流程

文檔序號:12496325閱讀:389來源:國知局
號碼的標(biāo)識方法和裝置與流程

技術(shù)領(lǐng)域

本申請涉及計(jì)算機(jī)技術(shù)領(lǐng)域,特別是涉及號碼的標(biāo)識方法和裝置。



背景技術(shù):

移動(dòng)通信終端(例如手機(jī)等)作為常用的通訊工具,可以極大的方便用戶和他人取得聯(lián)系,建立通話。然而,由于個(gè)人號碼信息會(huì)通過很多渠道被他人知曉,甚至被惡意的泄露和獲取,使得用戶在使用移動(dòng)電話的過程中,受到很多陌生號碼的來電打擾。

移動(dòng)電話的用戶在收到陌生來電顯示時(shí),在未通話之前,無法了解此聯(lián)系人的通話目的。在一些情況下,陌生通話的內(nèi)容可能涉及保險(xiǎn)推銷,房屋中介,甚至是惡意詐騙等,用戶在接聽這些電話時(shí),會(huì)使正常的生活受到干擾,甚至?xí)趾Φ阶陨淼呢?cái)產(chǎn)安全。同時(shí),在另一些情況下,陌生通話的內(nèi)容可能涉及到用戶關(guān)心的信息,比如需要他簽收的郵件已經(jīng)送到,更換了新號碼的朋友主動(dòng)聯(lián)系等,在這些情況下,陌生來電的通話內(nèi)容對用戶是有用,甚至是意義重大的。因此,一般情況下,用戶只能冒著被干擾等風(fēng)險(xiǎn)來接聽陌生來電,但對于騷擾電話或者惡意詐騙電話而言,一旦用戶接聽了,就使得正常生活被干擾成為既定事實(shí),同時(shí)也給來電者留下了可乘之機(jī),使得用戶的自身財(cái)產(chǎn)安全遭受侵害的可能性大大上升。

為了減少這類可能會(huì)為接聽者帶來風(fēng)險(xiǎn)的電話繼續(xù)危害或騷擾他人的可能,傳統(tǒng)方式中,接聽了這類電話的用戶可以通過登錄相關(guān)網(wǎng)頁,針對這類電話的號碼提交評價(jià),以提示其他用戶這類號碼可能是具有的危害性。但是登錄網(wǎng)頁所提交的評價(jià)內(nèi)容需要用戶思考總結(jié)形成通順語句后錄入,操作繁瑣,導(dǎo)致很多情況下,用戶在接聽的這類電話后并不會(huì)進(jìn)行評價(jià),使得這類電話可以繼續(xù)危害或騷擾其他用戶,難以降低這類電話危害其他用戶的概率。



技術(shù)實(shí)現(xiàn)要素:

為了解決上述技術(shù)問題,本申請?zhí)峁┝颂柎a的標(biāo)識方法和裝置,便利的操作提高了用戶標(biāo)識這種可能危害或騷擾他人號碼的積極性。

本申請實(shí)施例公開了如下技術(shù)方案:

第一方面,本發(fā)明實(shí)施例提供了一種號碼的標(biāo)識方法,所述方法包括:

當(dāng)監(jiān)測到用戶接聽了一號碼的來電時(shí),在通信終端上為所述用戶提供標(biāo)記入口,所述標(biāo)記入口的標(biāo)記界面包括使用者身份標(biāo)記候選項(xiàng),所述使用者身份標(biāo)記候選項(xiàng)包括常見的陌生電話類型;

向服務(wù)器發(fā)送所述用戶針對所述號碼所選擇的使用者身份標(biāo)記信息,使得所述服務(wù)器端創(chuàng)建或更新號碼信息數(shù)據(jù)庫,其中,所述號碼信息數(shù)據(jù)庫用于所述服務(wù)器端查詢所述號碼對應(yīng)的使用者身份信息。

可選的,所述號碼為相對于所述用戶的陌生號碼或者不常用號碼。

可選的,通過以下方式接收用戶通過所述標(biāo)記入口輸入的某號碼的使用者身份標(biāo)記信息:

當(dāng)所述用戶從所述標(biāo)記入口進(jìn)入時(shí),顯示標(biāo)記界面,以便用戶在所述標(biāo)記界面中輸入使用者身份標(biāo)記信息。

可選的,所述為用戶提供標(biāo)記入口包括:

在通信終端的選項(xiàng)菜單中注入所述標(biāo)記入口。

可選的,通過以下方式接收用戶通過所述標(biāo)記入口輸入的某號碼的使用者身份標(biāo)記信息:

當(dāng)用戶選中一號碼并選擇從所述選項(xiàng)菜單中的標(biāo)記入口進(jìn)入時(shí),顯示標(biāo)記界面,以便用戶在所述標(biāo)記界面中輸入使用者身份標(biāo)記信息。

可選的,還包括:

將用戶對號碼的標(biāo)記情況進(jìn)行記錄;

當(dāng)用戶發(fā)起對同一號碼的再次標(biāo)記請求時(shí),提示用戶操作無效。

可選的,還包括:

對使用通信終端過程中的應(yīng)用場景進(jìn)行監(jiān)測,獲取應(yīng)用場景中出現(xiàn)的目標(biāo)號碼;

獲取所述目標(biāo)號碼對應(yīng)的使用者身份信息;

將獲取到的所述目標(biāo)號碼對應(yīng)的使用者身份信息提示給所述用戶。

可選的,所述將獲取到的所述目標(biāo)號碼對應(yīng)的使用者身份信息提示給所述用戶,包括:

依據(jù)提示用戶與所述號碼的使用者身份標(biāo)記信息的標(biāo)記者之間的關(guān)系,對所述標(biāo)記者標(biāo)記的所述號碼的使用者身份標(biāo)記信息進(jìn)行處理。

可選的,所述獲取所述目標(biāo)號碼對應(yīng)的使用者身份信息包括:

將所述目標(biāo)號碼上傳到服務(wù)器端;

根據(jù)所述服務(wù)器端返回的信息,獲取所述目標(biāo)號碼對應(yīng)的使用者身份信息,所述服務(wù)器端返回的信息包括所述服務(wù)器端通過查詢預(yù)先建立的號碼信息數(shù)據(jù)庫所獲取的所述目標(biāo)號碼對應(yīng)的使用者身份信息。

可選的,所述目標(biāo)號碼對應(yīng)的使用者身份信息是所述服務(wù)器端根據(jù)用戶上傳的號碼以及使用者身份標(biāo)記信息確定的。

可選的,所述目標(biāo)號碼對應(yīng)的使用者身份信息是所述服務(wù)器根據(jù)至少兩個(gè)用戶上傳的使用者身份標(biāo)記信息所確定的。

可選的,所述目標(biāo)號碼對應(yīng)的使用者身份信息是所述服務(wù)器當(dāng)不同用戶針對所述目標(biāo)號碼上傳了不同的使用者身份標(biāo)記信息時(shí),根據(jù)各個(gè)使用者身份標(biāo)記信息的被上傳次數(shù),從各個(gè)使用者身份標(biāo)記信息中為所述目標(biāo)號碼選擇的。

可選的,所述獲取所述目標(biāo)號碼對應(yīng)的使用者身份信息包括:

如果所述目標(biāo)號碼的標(biāo)記者出現(xiàn)在被提示用戶的聯(lián)系人中,則獲取該目標(biāo)號碼的各個(gè)標(biāo)記者針對該目標(biāo)號碼上傳的使用者身份標(biāo)記信息,所述目標(biāo)號碼的各個(gè)標(biāo)記者為執(zhí)行上傳操作的用戶;

所述將獲取到的所述目標(biāo)號碼對應(yīng)的使用者身份信息提示給用戶包括:

將出現(xiàn)在聯(lián)系人中的標(biāo)記者上傳的使用者身份標(biāo)記信息單獨(dú)提示給用戶。

第二方面,本發(fā)明實(shí)施例提供了一種號碼的標(biāo)識裝置,所述裝置包括提供單元和發(fā)送單元:

所述提供單元,用于當(dāng)監(jiān)測到用戶接聽了一號碼的來電時(shí),在通信終端上為所述用戶提供標(biāo)記入口,所述標(biāo)記入口的標(biāo)記界面包括使用者身份標(biāo)記候選項(xiàng),所述使用者身份標(biāo)記候選項(xiàng)包括常見的陌生電話類型;

所述發(fā)送單元,用于向服務(wù)器發(fā)送所述用戶針對所述號碼所選擇的使用者身份標(biāo)記信息,使得所述服務(wù)器端創(chuàng)建或更新號碼信息數(shù)據(jù)庫,其中,所述號碼信息數(shù)據(jù)庫用于所述服務(wù)器端查詢所述號碼對應(yīng)的使用者身份信息。

可選的,所述號碼為相對于所述用戶的陌生號碼或者不常用號碼。

可選的,所述提供單元還用于通過以下方式接收用戶通過所述標(biāo)記入口輸入的某號碼的使用者身份標(biāo)記信息:

當(dāng)所述用戶從所述標(biāo)記入口進(jìn)入時(shí),顯示標(biāo)記界面,以便用戶在所述標(biāo)記界面中輸入使用者身份標(biāo)記信息。

可選的,所述提供單元還用于在通信終端的選項(xiàng)菜單中注入所述標(biāo)記入口。

可選的,所述提供單元還用于通過以下方式接收用戶通過所述標(biāo)記入口輸入的某號碼的使用者身份標(biāo)記信息:

當(dāng)用戶選中一號碼并選擇從所述選項(xiàng)菜單中的標(biāo)記入口進(jìn)入時(shí),顯示標(biāo)記界面,以便用戶在所述標(biāo)記界面中輸入使用者身份標(biāo)記信息。

可選的,還包括記錄單元:

所述記錄單元,用于將用戶對號碼的標(biāo)記情況進(jìn)行記錄;當(dāng)用戶發(fā)起對同一號碼的再次標(biāo)記請求時(shí),提示用戶操作無效。

可選的,還包括監(jiān)測單元和獲取單元:

所述檢測單元,用于對使用通信終端過程中的應(yīng)用場景進(jìn)行監(jiān)測,獲取應(yīng)用場景中出現(xiàn)的目標(biāo)號碼;

所述獲取單元,用于獲取所述目標(biāo)號碼對應(yīng)的使用者身份信息;

所述提供單元還用于將獲取到的所述目標(biāo)號碼對應(yīng)的使用者身份信息提示給所述用戶。

可選的,所述提供單元還用于依據(jù)提示用戶與所述號碼的使用者身份標(biāo)記信息的標(biāo)記者之間的關(guān)系,對所述標(biāo)記者標(biāo)記的所述號碼的使用者身份標(biāo)記信息進(jìn)行處理。

可選的,所述獲取單元還用于將所述目標(biāo)號碼上傳到服務(wù)器端;根據(jù)所述服務(wù)器端返回的信息,獲取所述目標(biāo)號碼對應(yīng)的使用者身份信息,所述服務(wù)器端返回的信息包括所述服務(wù)器端通過查詢預(yù)先建立的號碼信息數(shù)據(jù)庫所獲取的所述目標(biāo)號碼對應(yīng)的使用者身份信息。

可選的,所述目標(biāo)號碼對應(yīng)的使用者身份信息是所述服務(wù)器端根據(jù)用戶上傳的號碼以及使用者身份標(biāo)記信息確定的。

可選的,所述目標(biāo)號碼對應(yīng)的使用者身份信息是所述服務(wù)器根據(jù)至少兩個(gè)用戶上傳的使用者身份標(biāo)記信息所確定的。

可選的,所述目標(biāo)號碼對應(yīng)的使用者身份信息是所述服務(wù)器當(dāng)不同用戶針對所述目標(biāo)號碼上傳了不同的使用者身份標(biāo)記信息時(shí),根據(jù)各個(gè)使用者身份標(biāo)記信息的被上傳次數(shù),從各個(gè)使用者身份標(biāo)記信息中為所述目標(biāo)號碼選擇的。

可選的,所述獲取單元還用于如果所述目標(biāo)號碼的標(biāo)記者出現(xiàn)在被提示用戶的聯(lián)系人中,則獲取該目標(biāo)號碼的各個(gè)標(biāo)記者針對該目標(biāo)號碼上傳的使用者身份標(biāo)記信息,所述目標(biāo)號碼的各個(gè)標(biāo)記者為執(zhí)行上傳操作的用戶;

所述提供單元還用于將出現(xiàn)在聯(lián)系人中的標(biāo)記者上傳的使用者身份標(biāo)記信息單獨(dú)提示給用戶。

第三方面,本發(fā)明實(shí)施例提供了一種號碼的標(biāo)識方法,所述方法包括:

服務(wù)器端獲取目標(biāo)號碼對應(yīng)的使用者身份信息,所述目標(biāo)號碼是其他用戶在使用通信終端中的出現(xiàn)的,所述目標(biāo)號碼對應(yīng)的使用者身份信息是所述其他用戶根據(jù)所述目標(biāo)號碼在通信終端上所提供標(biāo)記入口的標(biāo)記界面中使用者身份標(biāo)記候選項(xiàng)所選擇的使用者身份標(biāo)記信息,其中,所述號碼信息數(shù)據(jù)庫用于所述服務(wù)器端端查詢所述號碼對應(yīng)的使用者身份信息;

所述服務(wù)器端將獲取到的所述目標(biāo)號碼對應(yīng)的使用者身份信息提示給所述用戶。

可選的,還包括:

所述服務(wù)器端針對其他用戶根據(jù)所述目標(biāo)號碼在通信終端上所提供標(biāo)記入口的標(biāo)記界面中使用者身份標(biāo)記候選項(xiàng)所選擇的使用者身份標(biāo)記信息創(chuàng)建或更新號碼信息數(shù)據(jù)庫。

可選的,所述服務(wù)器端將獲取到的所述目標(biāo)號碼對應(yīng)的使用者身份信息提示給所述用戶,包括:

所述服務(wù)器端依據(jù)提示用戶與所述號碼的使用者身份標(biāo)記信息的標(biāo)記者之間的關(guān)系,對所述標(biāo)記者標(biāo)記的所述號碼的使用者身份標(biāo)記信息進(jìn)行處理。

可選的,所述服務(wù)器端獲取所述目標(biāo)號碼對應(yīng)的使用者身份信息包括:

所述服務(wù)器端獲取所述目標(biāo)號碼;

所述服務(wù)器端通過查詢預(yù)先建立的號碼信息數(shù)據(jù)庫,獲取所述目標(biāo)號碼對應(yīng)的使用者身份信息并返回給客戶端。

可選的,還包括:

所述服務(wù)器端根據(jù)用戶上傳的號碼以及使用者身份標(biāo)記信息,確定號碼對應(yīng)的使用者身份信息。

可選的,所述服務(wù)器端根據(jù)用戶上傳的號碼以及使用者身份標(biāo)記信息,確定號碼對應(yīng)的使用者身份信息,包括:

所述服務(wù)器端針對同一號碼,根據(jù)至少兩個(gè)用戶上傳的使用者身份標(biāo)記信息,確定號碼對應(yīng)的使用者身份信息。

可選的,所述服務(wù)器端針對同一號碼,根據(jù)至少兩個(gè)用戶上傳的使用者身份標(biāo)記信息,確定號碼對應(yīng)的使用者身份信息包括:

當(dāng)不同用戶針對同一號碼上傳了不同的使用者身份標(biāo)記信息時(shí),所述服務(wù)器端根據(jù)各個(gè)使用者身份標(biāo)記信息的被上傳次數(shù),從各個(gè)使用者身份標(biāo)記信息中為號碼選擇使用者身份信息。

可選的,還包括:

所述服務(wù)器端將執(zhí)行上傳操作的用戶記錄為號碼的標(biāo)記者,并分別記錄各個(gè)標(biāo)記者針對同一號碼上傳的使用者身份標(biāo)記信息;

所述服務(wù)器端獲取所述目標(biāo)號碼對應(yīng)的使用者身份信息包括:

如果所述目標(biāo)號碼的標(biāo)記者出現(xiàn)在被提示用戶的聯(lián)系人中,則所述服務(wù)器端獲取該目標(biāo)號碼的各個(gè)標(biāo)記者針對該目標(biāo)號碼上傳的使用者身份標(biāo)記信息;

所述服務(wù)器端將獲取到的所述目標(biāo)號碼對應(yīng)的使用者身份信息提示給用戶包括:

所述服務(wù)器端將出現(xiàn)在聯(lián)系人中的標(biāo)記者上傳的使用者身份標(biāo)記信息進(jìn)行加權(quán);或者,將出現(xiàn)在聯(lián)系人中的標(biāo)記者上傳的使用者身份標(biāo)記信息單獨(dú)提示給用戶。

可選的,在所述服務(wù)器端獲取所述目標(biāo)號碼對應(yīng)的使用者身份信息之后,還包括:

所述服務(wù)器端為所述使用者身份信息設(shè)置有效時(shí)間;

若所述服務(wù)器端獲取所述使用者身份信息的時(shí)間超過所述有效時(shí)間,所述服務(wù)器端將所述使用者身份信息作為無效的使用者身份信息。

可選的,還包括:通過以下方式建立或更新所述號碼信息數(shù)據(jù)庫:

所述服務(wù)器端對網(wǎng)絡(luò)中的網(wǎng)頁進(jìn)行抓?。?/p>

所述服務(wù)器端根據(jù)預(yù)置的抽取規(guī)則從抓取到的網(wǎng)頁中抽取出目標(biāo)號碼及其對應(yīng)的使用者身份信息,建立所述號碼信息數(shù)據(jù)庫。

可選的,所述服務(wù)器端對網(wǎng)絡(luò)中的網(wǎng)頁進(jìn)行抓取包括:

所述服務(wù)器端對網(wǎng)絡(luò)中特定站點(diǎn)下的網(wǎng)頁進(jìn)行抓??;

所述服務(wù)器端根據(jù)預(yù)置的抽取規(guī)則從抓取到的網(wǎng)頁中抽取出目標(biāo)號碼及其對應(yīng)的使用者身份信息包括:

所述服務(wù)器端針對同一特定站點(diǎn)下的網(wǎng)頁,根據(jù)預(yù)置的該特定站點(diǎn)對應(yīng)的抽取規(guī)則,從該特定站點(diǎn)下的網(wǎng)頁中抽取出目標(biāo)號碼及其對應(yīng)的使用者身份信息。

可選的,還包括:

所述服務(wù)器端通過機(jī)器學(xué)習(xí)的方式獲取所述抽取規(guī)則。

可選的,所述服務(wù)器端通過機(jī)器學(xué)習(xí)的方式獲取所述抽取規(guī)則,包括:

所述服務(wù)器端從預(yù)置站點(diǎn)中提取預(yù)置數(shù)量的網(wǎng)頁作為訓(xùn)練樣本;

所述服務(wù)器端根據(jù)預(yù)置的電話號碼特征,判斷訓(xùn)練樣本網(wǎng)頁中是否存在電話號碼;

如果存在,則所述服務(wù)器端根據(jù)訓(xùn)練樣本網(wǎng)頁的HTML代碼創(chuàng)建DOM樹;

所述服務(wù)器端通過計(jì)算DOM樹中各個(gè)節(jié)點(diǎn)之間的編輯距離,獲取其中的最小循環(huán)單元;

所述服務(wù)器端將所述最小循環(huán)單元的父節(jié)點(diǎn)確定為用戶評論列表節(jié)點(diǎn);

所述服務(wù)器端記錄DOM樹中從根節(jié)點(diǎn)到所述用戶評論列表節(jié)點(diǎn)的路徑,生成路徑抽取規(guī)則。

可選的,所述服務(wù)器端根據(jù)預(yù)置的抽取規(guī)則從抓取到的網(wǎng)頁中抽取出目標(biāo)號碼及其對應(yīng)的使用者身份信息,包括:

所述服務(wù)器端根據(jù)所述路徑抽取規(guī)則,從所述站點(diǎn)的其他網(wǎng)頁中抽取出目標(biāo)號碼,以及用戶評論信息;

所述服務(wù)器端根據(jù)所述用戶評論信息中包含的特征詞,確定所述目標(biāo)號碼對應(yīng)的使用者身份信息。

可選的,還包括:

所述服務(wù)器端使用正則表達(dá)式,對相同的路徑抽取規(guī)則對應(yīng)的網(wǎng)頁的統(tǒng)一資源定位符URL進(jìn)行歸一化,生成URL抽取規(guī)則;

所述服務(wù)器端根據(jù)預(yù)置的抽取規(guī)則從抓取到的網(wǎng)頁中抽取出目標(biāo)號碼及其對應(yīng)的使用者身份信息,包括:

所述服務(wù)器端根據(jù)所述URL抽取規(guī)則,從所述站點(diǎn)的其他網(wǎng)頁中抽取URL特征相匹配的網(wǎng)頁;

所述服務(wù)器端根據(jù)所述路徑抽取規(guī)則,從所述相匹配的網(wǎng)頁中抽取出目標(biāo)號碼,以及用戶評論信息;

所述服務(wù)器端根據(jù)所述用戶評論信息中包含的特征詞,確定所述目標(biāo)號碼對應(yīng)的使用者身份信息。

可選的,所述目標(biāo)號碼為未出現(xiàn)在所述通信終端的通訊錄中的陌生號碼。

第四方面,本發(fā)明實(shí)施例提供了一種號碼的標(biāo)識裝置,所述裝置包括獲取單元和提示單元:

所述獲取單元,用于獲取目標(biāo)號碼對應(yīng)的使用者身份信息,所述目標(biāo)號碼是其他用戶在使用通信終端中的出現(xiàn)的,所述目標(biāo)號碼對應(yīng)的使用者身份信息是所述其他用戶根據(jù)所述目標(biāo)號碼在通信終端上所提供標(biāo)記入口的標(biāo)記界面中使用者身份標(biāo)記候選項(xiàng)所選擇的使用者身份標(biāo)記信息,其中,所述號碼信息數(shù)據(jù)庫用于所述服務(wù)器端端查詢所述號碼對應(yīng)的使用者身份信息;

所述提示單元,用于將獲取到的所述目標(biāo)號碼對應(yīng)的使用者身份信息提示給所述用戶。

可選的,還包括創(chuàng)建更新單元:

所述創(chuàng)建更新單元,用于針對其他用戶根據(jù)所述目標(biāo)號碼在通信終端上所提供標(biāo)記入口的標(biāo)記界面中使用者身份標(biāo)記候選項(xiàng)所選擇的使用者身份標(biāo)記信息創(chuàng)建或更新號碼信息數(shù)據(jù)庫。

可選的,所述提供單元還用于依據(jù)提示用戶與所述號碼的使用者身份標(biāo)記信息的標(biāo)記者之間的關(guān)系,對所述標(biāo)記者標(biāo)記的所述號碼的使用者身份標(biāo)記信息進(jìn)行處理。

可選的,所述獲取單元還用于獲取所述目標(biāo)號碼;通過查詢預(yù)先建立的號碼信息數(shù)據(jù)庫,獲取所述目標(biāo)號碼對應(yīng)的使用者身份信息并返回給客戶端。

可選的,還包括確定單元:

所述確定單元,用于根據(jù)用戶上傳的號碼以及使用者身份標(biāo)記信息,確定號碼對應(yīng)的使用者身份信息。

可選的,所述確定單元還用于針對同一號碼,根據(jù)至少兩個(gè)用戶上傳的使用者身份標(biāo)記信息,確定號碼對應(yīng)的使用者身份信息。

可選的,所述確定單元還用于當(dāng)不同用戶針對同一號碼上傳了不同的使用者身份標(biāo)記信息時(shí),根據(jù)各個(gè)使用者身份標(biāo)記信息的被上傳次數(shù),從各個(gè)使用者身份標(biāo)記信息中為號碼選擇使用者身份信息。

可選的,還包括標(biāo)記單元:

所述標(biāo)記單元,用于將執(zhí)行上傳操作的用戶記錄為號碼的標(biāo)記者,并分別記錄各個(gè)標(biāo)記者針對同一號碼上傳的使用者身份標(biāo)記信息;

所述獲取單元還用于如果所述目標(biāo)號碼的標(biāo)記者出現(xiàn)在被提示用戶的聯(lián)系人中,則獲取該目標(biāo)號碼的各個(gè)標(biāo)記者針對該目標(biāo)號碼上傳的使用者身份標(biāo)記信息;

所述提示單元還用于將出現(xiàn)在聯(lián)系人中的標(biāo)記者上傳的使用者身份標(biāo)記信息進(jìn)行加權(quán);或者,將出現(xiàn)在聯(lián)系人中的標(biāo)記者上傳的使用者身份標(biāo)記信息單獨(dú)提示給用戶。

可選的,還包括設(shè)置單元:

所述設(shè)置單元,用于為所述使用者身份信息設(shè)置有效時(shí)間;若獲取所述使用者身份信息的時(shí)間超過所述有效時(shí)間,將所述使用者身份信息作為無效的使用者身份信息。

可選的,所述建立更新單元還用于對網(wǎng)絡(luò)中的網(wǎng)頁進(jìn)行抓??;根據(jù)預(yù)置的抽取規(guī)則從抓取到的網(wǎng)頁中抽取出目標(biāo)號碼及其對應(yīng)的使用者身份信息,建立所述號碼信息數(shù)據(jù)庫。

可選的,所述建立更新單元還用于對網(wǎng)絡(luò)中特定站點(diǎn)下的網(wǎng)頁進(jìn)行抓?。桓鶕?jù)預(yù)置的抽取規(guī)則從抓取到的網(wǎng)頁中抽取出目標(biāo)號碼及其對應(yīng)的使用者身份信息包括:針對同一特定站點(diǎn)下的網(wǎng)頁,根據(jù)預(yù)置的該特定站點(diǎn)對應(yīng)的抽取規(guī)則,從該特定站點(diǎn)下的網(wǎng)頁中抽取出目標(biāo)號碼及其對應(yīng)的使用者身份信息。

可選的,所述建立更新單元還用于通過機(jī)器學(xué)習(xí)的方式獲取所述抽取規(guī)則。

可選的,所述建立更新單元還用于從預(yù)置站點(diǎn)中提取預(yù)置數(shù)量的網(wǎng)頁作為訓(xùn)練樣本;根據(jù)預(yù)置的電話號碼特征,判斷訓(xùn)練樣本網(wǎng)頁中是否存在電話號碼;如果存在,則根據(jù)訓(xùn)練樣本網(wǎng)頁的HTML代碼創(chuàng)建DOM樹;通過計(jì)算DOM樹中各個(gè)節(jié)點(diǎn)之間的編輯距離,獲取其中的最小循環(huán)單元;將所述最小循環(huán)單元的父節(jié)點(diǎn)確定為用戶評論列表節(jié)點(diǎn);記錄DOM樹中從根節(jié)點(diǎn)到所述用戶評論列表節(jié)點(diǎn)的路徑,生成路徑抽取規(guī)則。

可選的,所述建立更新單元還用于根據(jù)所述路徑抽取規(guī)則,從所述站點(diǎn)的其他網(wǎng)頁中抽取出目標(biāo)號碼,以及用戶評論信息;根據(jù)所述用戶評論信息中包含的特征詞,確定所述目標(biāo)號碼對應(yīng)的使用者身份信息。

可選的,還包括生成單元:

所述生成單元,用于使用正則表達(dá)式,對相同的路徑抽取規(guī)則對應(yīng)的網(wǎng)頁的統(tǒng)一資源定位符URL進(jìn)行歸一化,生成URL抽取規(guī)則;

所述建立更新單元還用于根據(jù)所述URL抽取規(guī)則,從所述站點(diǎn)的其他網(wǎng)頁中抽取URL特征相匹配的網(wǎng)頁;根據(jù)所述路徑抽取規(guī)則,從所述相匹配的網(wǎng)頁中抽取出目標(biāo)號碼,以及用戶評論信息;根據(jù)所述用戶評論信息中包含的特征詞,確定所述目標(biāo)號碼對應(yīng)的使用者身份信息。

可選的,所述目標(biāo)號碼為未出現(xiàn)在所述通信終端的通訊錄中的陌生號碼。

一種號碼信息提示方法,包括:

對使用通信終端過程中的應(yīng)用場景進(jìn)行監(jiān)測,獲取應(yīng)用場景中出現(xiàn)的目標(biāo)號碼;

獲取所述目標(biāo)號碼對應(yīng)的使用者身份信息;

將獲取到的所述目標(biāo)號碼對應(yīng)的使用者身份信息提示給用戶。

其中,所述獲取所述目標(biāo)號碼對應(yīng)的使用者身份信息包括:

將所述目標(biāo)號碼上傳到服務(wù)器端;

所述服務(wù)器端通過查詢預(yù)先建立的號碼信息數(shù)據(jù)庫,獲取所述目標(biāo)號碼對應(yīng)的使用者身份信息并返回給客戶端;

根據(jù)所述服務(wù)器端返回的信息,獲取所述目標(biāo)號碼對應(yīng)的使用者身份信息。

其中,還包括:通過以下方式建立所述號碼信息數(shù)據(jù)庫:

為用戶提供標(biāo)記入口;

根據(jù)用戶通過所述標(biāo)記入口上傳的對號碼的使用者身份標(biāo)記信息,建立所述號碼信息數(shù)據(jù)庫。

其中,所述為用戶提供標(biāo)記入口包括:

對用戶使用通信終端過程中的應(yīng)用場景進(jìn)行監(jiān)測;

當(dāng)監(jiān)測到用戶接聽了一號碼的來電時(shí),如果該號碼為陌生號碼或者不常用號碼,則在用戶界面為用戶提供標(biāo)記入口。

其中,通過以下方式接收用戶通過所述標(biāo)記入口輸入的某號碼的使用者身份標(biāo)記信息:

當(dāng)用戶從所述標(biāo)記入口進(jìn)入時(shí),顯示標(biāo)記界面,以便用戶在所述標(biāo)記界面中輸入使用者身份標(biāo)記信息。

其中,所述為用戶提供標(biāo)記入口包括:

在通信終端的選項(xiàng)菜單中注入標(biāo)記入口。

其中,通過以下方式接收用戶通過所述標(biāo)記入口輸入的某號碼的使用者身份標(biāo)記信息:

當(dāng)用戶選中一號碼并選擇從所述選項(xiàng)菜單中的標(biāo)記入口進(jìn)入時(shí),顯示標(biāo)記界面,以便用戶在所述標(biāo)記界面中輸入使用者身份標(biāo)記信息。

其中,還包括:

在所述標(biāo)記界面中顯示使用者身份標(biāo)記信息候選項(xiàng),以便用戶通過選擇所述候選項(xiàng)來輸入使用者身份標(biāo)記信息。

其中,還包括:

對用戶對號碼的標(biāo)記情況進(jìn)行記錄;

當(dāng)用戶發(fā)起對同一號碼的再次標(biāo)記請求時(shí),提示用戶操作無效。

其中,所述服務(wù)器端根據(jù)用戶上傳的號碼以及使用者身份標(biāo)記信息,確定號碼對應(yīng)的使用者身份信息包括:

針對同一號碼,根據(jù)至少兩個(gè)用戶上傳的使用者身份標(biāo)記信息,確定號碼對應(yīng)的使用者身份信息。

其中,所述針對同一號碼,根據(jù)至少兩個(gè)用戶上傳的使用者身份標(biāo)記信息,確定號碼對應(yīng)的使用者身份信息包括:

當(dāng)不同用戶針對同一號碼上傳了不同的使用者身份標(biāo)記信息時(shí),根據(jù)各個(gè)使用者身份標(biāo)記信息的被上傳次數(shù),從各個(gè)使用者身份標(biāo)記信息中為號碼選擇使用者身份信息。

其中,還包括:

將執(zhí)行上傳操作的用戶記錄為號碼的標(biāo)記者,并分別記錄各個(gè)標(biāo)記者針對同一號碼上傳的使用者身份標(biāo)記信息;

所述獲取所述目標(biāo)號碼對應(yīng)的使用者身份信息包括:

如果所述目標(biāo)號碼的標(biāo)記者出現(xiàn)在被提示用戶的聯(lián)系人中,則獲取該目標(biāo)號碼的各個(gè)標(biāo)記者針對該目標(biāo)號碼上傳的使用者身份標(biāo)記信息;

所述將獲取到的所述目標(biāo)號碼對應(yīng)的使用者身份信息提示給用戶包括:

將出現(xiàn)在聯(lián)系人中的標(biāo)記者上傳的使用者身份標(biāo)記信息進(jìn)行加權(quán);或者,將出現(xiàn)在聯(lián)系人中的標(biāo)記者上傳的使用者身份標(biāo)記信息單獨(dú)提示給用戶。

其中,還包括:通過以下方式建立所述號碼信息數(shù)據(jù)庫:

對網(wǎng)絡(luò)中的網(wǎng)頁進(jìn)行抓取;

根據(jù)預(yù)置的抽取規(guī)則從抓取到的網(wǎng)頁中抽取出目標(biāo)號碼及其對應(yīng)的使用者身份信息,建立所述號碼信息數(shù)據(jù)庫。

其中,所述對網(wǎng)絡(luò)中的網(wǎng)頁進(jìn)行抓取包括:

對網(wǎng)絡(luò)中特定站點(diǎn)下的網(wǎng)頁進(jìn)行抓?。?/p>

所述根據(jù)預(yù)置的抽取規(guī)則從抓取到的網(wǎng)頁中抽取出目標(biāo)號碼及其對應(yīng)的使用者身份信息包括:

針對同一特定站點(diǎn)下的網(wǎng)頁,根據(jù)預(yù)置的該特定站點(diǎn)對應(yīng)的抽取規(guī)則,從該特定站點(diǎn)下的網(wǎng)頁中抽取出目標(biāo)號碼及其對應(yīng)的使用者身份信息。

其中,還包括:

通過機(jī)器學(xué)習(xí)的方式獲取所述抽取規(guī)則。

其中,所述通過機(jī)器學(xué)習(xí)的方式獲取所述抽取規(guī)則包括:

從預(yù)置站點(diǎn)中提取預(yù)置數(shù)量的網(wǎng)頁作為訓(xùn)練樣本;

根據(jù)預(yù)置的電話號碼特征,判斷訓(xùn)練樣本網(wǎng)頁中是否存在電話號碼;

如果存在,則根據(jù)訓(xùn)練樣本網(wǎng)頁的HTML代碼創(chuàng)建DOM樹;

通過計(jì)算DOM樹中各個(gè)節(jié)點(diǎn)之間的編輯距離,獲取其中的最小循環(huán)單元;

將所述最小循環(huán)單元的父節(jié)點(diǎn)確定為用戶評論列表節(jié)點(diǎn);

記錄DOM樹中從根節(jié)點(diǎn)到所述用戶評論列表節(jié)點(diǎn)的路徑,生成路徑抽取規(guī)則。

其中,所述根據(jù)預(yù)置的抽取規(guī)則從抓取到的網(wǎng)頁中抽取出目標(biāo)號碼及其對應(yīng)的使用者身份信息包括:

根據(jù)所述路徑抽取規(guī)則,從所述站點(diǎn)的其他網(wǎng)頁中抽取出目標(biāo)號碼,以及用戶評論信息;

根據(jù)所述用戶評論信息中包含的特征詞,確定所述目標(biāo)號碼對應(yīng)的使用者身份信息。

其中,還包括:

使用正則表達(dá)式,對相同的路徑抽取規(guī)則對應(yīng)的網(wǎng)頁的統(tǒng)一資源定位符URL進(jìn)行歸一化,生成URL抽取規(guī)則;

所述根據(jù)預(yù)置的抽取規(guī)則從抓取到的網(wǎng)頁中抽取出目標(biāo)號碼及其對應(yīng)的使用者身份信息包括:

根據(jù)所述URL抽取規(guī)則,從所述站點(diǎn)的其他網(wǎng)頁中抽取URL特征相匹配的網(wǎng)頁;

根據(jù)所述路徑抽取規(guī)則,從所述相匹配的網(wǎng)頁中抽取出目標(biāo)號碼,以及用戶評論信息;

根據(jù)所述用戶評論信息中包含的特征詞,確定所述目標(biāo)號碼對應(yīng)的使用者身份信息。

其中,所述目標(biāo)號碼為未出現(xiàn)在所述通信終端的通訊錄中的陌生號碼。

一種號碼信息提示系統(tǒng),包括:

監(jiān)測單元,用于對使用通信終端過程中的應(yīng)用場景進(jìn)行監(jiān)測,獲取應(yīng)用場景中出現(xiàn)的目標(biāo)號碼;

身份信息獲取單元,用于獲取所述目標(biāo)號碼對應(yīng)的使用者身份信息;

身份信息提示單元,用于將獲取到的所述目標(biāo)號碼對應(yīng)的使用者身份信息提示給用戶。

其中,所述身份信息獲取包括:

號碼上傳子單元,用于將所述目標(biāo)號碼上傳到服務(wù)器端;

信息查詢子單元,用于所述服務(wù)器端通過查詢預(yù)先建立的號碼信息數(shù)據(jù)庫,獲取所述目標(biāo)號碼對應(yīng)的使用者身份信息并返回給客戶端;

信息獲取子單元,用于根據(jù)所述服務(wù)器端返回的信息,獲取所述目標(biāo)號碼對應(yīng)的使用者身份信息。

其中,還包括:

入口提供單元,用于為用戶提供標(biāo)記入口;

數(shù)據(jù)庫建立單元,用于根據(jù)用戶通過所述標(biāo)記入口上傳的對號碼的使用者身份標(biāo)記信息,建立所述號碼信息數(shù)據(jù)庫。

其中,所述入口提供單元包括:

監(jiān)測子單元,用于對用戶使用通信終端過程中的應(yīng)用場景進(jìn)行監(jiān)測;

第一入口提供子單元,用于當(dāng)監(jiān)測到用戶接聽了一號碼的來電時(shí),如果該號碼為陌生號碼或者不常用號碼,則在用戶界面為用戶提供標(biāo)記入口。

其中,所述數(shù)據(jù)庫建立單元包括:

第一界面顯示子單元,用于當(dāng)用戶從所述標(biāo)記入口進(jìn)入時(shí),顯示標(biāo)記界面,以便用戶在所述標(biāo)記界面中輸入使用者身份標(biāo)記信息。

其中,所述入口提供單元包括:

第二入口提供子單元,用于在通信終端的選項(xiàng)菜單中注入標(biāo)記入口。

其中,所述數(shù)據(jù)庫建立單元包括:

第二界面顯示子單元,用于當(dāng)用戶選中一號碼并選擇從所述選項(xiàng)菜單中的標(biāo)記入口進(jìn)入時(shí),顯示標(biāo)記界面,以便用戶在所述標(biāo)記界面中輸入使用者身份標(biāo)記信息。

其中,還包括:

候選項(xiàng)顯示單元,用于在所述標(biāo)記界面中顯示使用者身份標(biāo)記信息候選項(xiàng),以便用戶通過選擇所述候選項(xiàng)來輸入使用者身份標(biāo)記信息。

其中,還包括:

記錄單元,用于對用戶對號碼的標(biāo)記情況進(jìn)行記錄;

無效提示單元,用于當(dāng)用戶發(fā)起對同一號碼的再次標(biāo)記請求時(shí),提示用戶操作無效。

其中,所述數(shù)據(jù)庫建立單元包括:

身份信息確定子單元,用于針對同一號碼,根據(jù)至少兩個(gè)用戶上傳的使用者身份標(biāo)記信息,確定號碼對應(yīng)的使用者身份信息。

其中,所述身份信息確定子單元包括:

選擇子單元,用于當(dāng)不同用戶針對同一號碼上傳了不同的使用者身份標(biāo)記信息時(shí),根據(jù)各個(gè)使用者身份標(biāo)記信息的被上傳次數(shù),從各個(gè)使用者身份標(biāo)記信息中為號碼選擇使用者身份信息。

其中,還包括:

記錄單元,用于將執(zhí)行上傳操作的用戶記錄為號碼的標(biāo)記者,并分別記錄各個(gè)標(biāo)記者針對同一號碼上傳的使用者身份標(biāo)記信息;

所述身份信息獲取單元具體用于:

如果所述目標(biāo)號碼的標(biāo)記者出現(xiàn)在被提示用戶的聯(lián)系人中,則獲取該目標(biāo)號碼的各個(gè)標(biāo)記者針對該目標(biāo)號碼上傳的使用者身份標(biāo)記信息;

所述身份信息提示單元具體用于:

將出現(xiàn)在聯(lián)系人中的標(biāo)記者上傳的使用者身份標(biāo)記信息進(jìn)行加權(quán);或者,將出現(xiàn)在聯(lián)系人中的標(biāo)記者上傳的使用者身份標(biāo)記信息單獨(dú)提示給用戶。

其中,還包括:

網(wǎng)頁抓取單元,用于對網(wǎng)絡(luò)中的網(wǎng)頁進(jìn)行抓??;

信息抽取單元,用于根據(jù)預(yù)置的抽取規(guī)則從抓取到的網(wǎng)頁中抽取出目標(biāo)號碼及其對應(yīng)的使用者身份信息,建立所述號碼信息數(shù)據(jù)庫。

其中,所述網(wǎng)頁抓取單元包括:

特定站點(diǎn)網(wǎng)頁抓取子單元,用于對網(wǎng)絡(luò)中特定站點(diǎn)下的網(wǎng)頁進(jìn)行抓?。?/p>

所述信息抽取單元包括:

特定站點(diǎn)網(wǎng)頁信息抽取子單元,用于針對同一特定站點(diǎn)下的網(wǎng)頁,根據(jù)預(yù)置的該特定站點(diǎn)對應(yīng)的抽取規(guī)則,從該特定站點(diǎn)下的網(wǎng)頁中抽取出目標(biāo)號碼及其對應(yīng)的使用者身份信息。

其中,還包括:

機(jī)器學(xué)習(xí)單元,用于通過機(jī)器學(xué)習(xí)的方式獲取所述抽取規(guī)則。

其中,所述機(jī)器學(xué)習(xí)單元包括:

訓(xùn)練樣本獲取子單元,用于從預(yù)置站點(diǎn)中提取預(yù)置數(shù)量的網(wǎng)頁作為訓(xùn)練樣本;

判斷子單元,用于根據(jù)預(yù)置的電話號碼特征,判斷訓(xùn)練樣本網(wǎng)頁中是否存在電話號碼;

DOM樹創(chuàng)建子單元,用于如果存在,則根據(jù)訓(xùn)練樣本網(wǎng)頁的HTML代碼創(chuàng)建DOM樹;

計(jì)算子單元,用于通過計(jì)算DOM樹中各個(gè)節(jié)點(diǎn)之間的編輯距離,獲取其中的最小循環(huán)單元;

節(jié)點(diǎn)確定子單元,用于將所述最小循環(huán)單元的父節(jié)點(diǎn)確定為用戶評論列表節(jié)點(diǎn);

路徑記錄子單元,用于記錄DOM樹中從根節(jié)點(diǎn)到所述用戶評論列表節(jié)點(diǎn)的路徑,生成路徑抽取規(guī)則。

其中,所述信息抽取單元包括:

第一用戶評論信息抽取子單元,用于根據(jù)所述路徑抽取規(guī)則,從所述站點(diǎn)的其他網(wǎng)頁中抽取出目標(biāo)號碼,以及用戶評論信息;

第一信息確定子單元,用于根據(jù)所述用戶評論信息中包含的特征詞,確定所述目標(biāo)號碼對應(yīng)的使用者身份信息。

其中,還包括:

URL抽取規(guī)則生成單元,用于使用正則表達(dá)式,對相同的路徑抽取規(guī)則對應(yīng)的網(wǎng)頁的統(tǒng)一資源定位符URL進(jìn)行歸一化,生成URL抽取規(guī)則;

所述信息抽取單元包括:

URL匹配子單元,用于根據(jù)所述URL抽取規(guī)則,從所述站點(diǎn)的其他網(wǎng)頁中抽取URL特征相匹配的網(wǎng)頁;

第二用戶評論信息抽取子單元,用于根據(jù)所述路徑抽取規(guī)則,從所述相匹配的網(wǎng)頁中抽取出目標(biāo)號碼,以及用戶評論信息;

第二信息確定子單元,用于根據(jù)所述用戶評論信息中包含的特征詞,確定所述目標(biāo)號碼對應(yīng)的使用者身份信息。

其中,所述目標(biāo)號碼為未出現(xiàn)在所述通信終端的通訊錄中的陌生號碼。

由上述技術(shù)方案可以看出,當(dāng)確定用戶接聽了一號碼的來電時(shí),可以在通信終端上為用戶提供標(biāo)記入口,通過標(biāo)記入口的標(biāo)記界面為用戶展示常見陌生電話類型的使用者身份標(biāo)記候選項(xiàng),用戶在標(biāo)記界面中選擇符合接聽該號碼的通話內(nèi)容的候選項(xiàng)作為使用者身份信息即可完成對該號碼的標(biāo)識,從而不用進(jìn)行如傳統(tǒng)方式中登錄網(wǎng)頁那種復(fù)雜的操作,也不用自己總結(jié)需要提交的語句內(nèi)容,便利的操作提高了用戶標(biāo)識這種可能危害或騷擾他人號碼的積極性,使得用戶提示其他用戶這類號碼可能是具有危害性的可能性更高。而針對該號碼的使用者身份信息可以發(fā)送到服務(wù)器,以便服務(wù)器創(chuàng)建或更新用于查詢號碼對應(yīng)使用者身份信息的號碼信息數(shù)據(jù)庫;當(dāng)有某位用戶看到該號碼的來電時(shí),通過該服務(wù)器的號碼信息數(shù)據(jù)庫,可以為這位用戶提供針對該號碼的使用者身份標(biāo)記信息以提示這位用戶,從而降低了該號碼危害其他用戶的概率。

附圖說明

為了更清楚地說明本申請實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本申請的一些實(shí)施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動(dòng)性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。

圖1是本發(fā)明實(shí)施例提供的方法的流程圖;

圖2是本發(fā)明實(shí)施例提供的方法中一抽取結(jié)果示意圖;

圖3是本發(fā)明實(shí)施例提供的方法中抽取結(jié)果對應(yīng)的頁面區(qū)域示意圖;

圖4是本發(fā)明實(shí)施例提供的方法中第一用戶界面示意圖;

圖5是本發(fā)明實(shí)施例提供的方法中第二用戶界面示意圖;

圖6是本發(fā)明實(shí)施例提供的方法中第三用戶界面示意圖;

圖7是本發(fā)明實(shí)施例提供的方法中第四用戶界面示意圖;

圖8是本發(fā)明實(shí)施例提供的方法中第五用戶界面示意圖;

圖9是本發(fā)明實(shí)施例提供的方法中第六用戶界面示意圖;

圖10是本發(fā)明實(shí)施例提供的系統(tǒng)的示意圖。

具體實(shí)施方式

下面結(jié)合附圖,對本申請的實(shí)施例進(jìn)行描述。

參見圖1,本發(fā)明實(shí)施例提供的號碼信息提示方法包括以下步驟:

S101:對使用通信終端過程中的應(yīng)用場景進(jìn)行監(jiān)測,獲取應(yīng)用場景中出現(xiàn)的目標(biāo)號碼;

其中,本發(fā)明實(shí)施例所述的目標(biāo)號碼可以是陌生號碼(也就是說用戶的通訊錄中不存在的號碼),或者也可以是通訊錄中沒有詳細(xì)記載使用者身份信息的號碼,例如,用戶可能僅在通訊錄中記錄了“張先生”等非特定性的身份信息,則用戶也可能會(huì)無法及時(shí)分辨出當(dāng)前應(yīng)用場景中的號碼對應(yīng)的使用者身份,因此,也可以作為目標(biāo)號碼獲取到,并通過后續(xù)的步驟為用戶提供號碼的使用者身份信息。當(dāng)然,在實(shí)際應(yīng)用中,也可以將應(yīng)用場景中涉及到的全部的號碼都作為目標(biāo)號碼來看待。但為了便于描述,下文中均以對陌生號碼進(jìn)行提示為例進(jìn)行介紹,當(dāng)然,這種示例行的介紹并不應(yīng)作為對本發(fā)明的限制。

具體實(shí)現(xiàn)時(shí),通信終端設(shè)備中的操作系統(tǒng)一般會(huì)為應(yīng)用程序開放一些接口,供應(yīng)用程序從系統(tǒng)中獲取所需的信息。因此,在本發(fā)明實(shí)施例中,為了能夠?qū)νㄐ沤K端的應(yīng)用場景(包括接到來電、撥打電話、添加號碼到通訊錄、收發(fā)短信等等)進(jìn)行監(jiān)測,本發(fā)明實(shí)施例在通過應(yīng)用程序的方式實(shí)現(xiàn)各個(gè)步驟時(shí),就可以利用通信終端系統(tǒng)的這一特點(diǎn),在操作系統(tǒng)中對應(yīng)用程序進(jìn)行注冊,這樣,當(dāng)操作系統(tǒng)廣播通知消息時(shí),應(yīng)用程序就能夠收聽到這種通知消息,并從中獲取所需的信息。例如,當(dāng)接收來電時(shí),通信終端的操作系統(tǒng)就會(huì)廣播該來電消息,并攜帶來電號碼,這樣,應(yīng)用程序就能夠監(jiān)測到該事件,并從中獲取到來電的號碼;或者,當(dāng)用戶撥打電話時(shí),在用戶按下“呼叫”按鈕之后,系統(tǒng)就會(huì)向應(yīng)用程序廣播撥打電話這一消息,并攜帶具體的呼叫號碼,這樣,應(yīng)用程序同樣能夠監(jiān)測到撥打電話這一事件,并獲取到被叫的號碼;同樣,在向通訊錄中添加聯(lián)系人號碼時(shí),應(yīng)用程序同樣可以通過收聽系統(tǒng)的廣播消息,或者這一事件,并獲取到用戶將要添加的號碼,等等。

應(yīng)用程序在獲取到具體應(yīng)用場景中的號碼之后,就可以通過系統(tǒng)的接口,獲取到用戶保存在通信終端的通訊錄,然后與通訊錄中的信息進(jìn)行比對,如果發(fā)現(xiàn)號碼沒有出現(xiàn)在通訊錄中,就可以將其作為一個(gè)陌生號碼來對待。

需要說明的是,一些通信終端的操作系統(tǒng)可能并不會(huì)直接將其接口向應(yīng)用程序公開,此時(shí),可以通過一些手段獲知到這樣的接口,進(jìn)而獲取到具體應(yīng)用場景中的陌生號碼。但具體的手段并不屬于本發(fā)明實(shí)施例的重點(diǎn)內(nèi)容,因此,這里不再詳述。

另外,對于撥打電話這種應(yīng)用場景而言,用戶一般可以通過多種方式來發(fā)起呼叫,例如,可能直接在通話記錄列表(例如已接電話列表、未接電話列表、已撥電話列表等等)中選中目標(biāo)號碼,然后點(diǎn)擊呼叫按鈕,也有可能是通過按下通信終端的數(shù)字鍵輸入被叫號碼,然后點(diǎn)擊呼叫按鈕;在通過監(jiān)聽系統(tǒng)的廣播消息來監(jiān)測的情況下,一般都是在用戶按下呼叫按鈕之后,系統(tǒng)才會(huì)發(fā)出廣播消息,進(jìn)而應(yīng)用程序也是在用戶按下呼叫按鈕之后才能獲取到該號碼,并進(jìn)行后續(xù)的判斷以及信息提示等操作。但在實(shí)際應(yīng)用中,一旦用戶已經(jīng)按下呼叫按鈕發(fā)起了呼叫,就已經(jīng)開始占用本地及通信系統(tǒng)的資源,并且一旦接通,也許用戶的經(jīng)濟(jì)等方面已經(jīng)遭受損失。因此,對于用戶先輸入號碼再發(fā)起呼叫的情況,如果能在用戶按下呼叫按鈕發(fā)起呼叫之前就能給用戶一些提示信息,則可能會(huì)更有意義。因此,具體實(shí)現(xiàn)時(shí),在系統(tǒng)提供了接口的情況下,也可以通過類似“鉤子函數(shù)”功能的函數(shù),在用戶輸入號碼的過程中,抓取到用戶輸入的具體字符,也即,用戶每輸入一個(gè)字符,都可以抓取到用戶輸入的具體是什么,這樣,當(dāng)通過一些規(guī)則判斷出用戶已經(jīng)輸入完一個(gè)完整的電話號碼之后,就發(fā)起查詢,并將查詢結(jié)果提示給用戶(關(guān)于查詢以及提示的相關(guān)步驟,后文中會(huì)有詳細(xì)地介紹),以期在用戶真正發(fā)起呼叫之前就對被叫號碼的使用者身份信息有所了解,從而進(jìn)一步降低遭受損失的概率。

其中,這里用到的具體的判斷規(guī)則,可以根據(jù)通信協(xié)議中對號碼的編碼情況而定。例如,一般一個(gè)完整的電話號碼的位數(shù)可能是固定的,如,手機(jī)號碼一般是11位,固定電話號碼一般是7位或8位,如果加上服務(wù)區(qū)號,則固定電話也一般為11位,因此,在抓取到用戶輸入的第一個(gè)字符的同時(shí),還可以啟動(dòng)一個(gè)計(jì)數(shù)器,并將其初始值設(shè)為1,每抓取到一個(gè)新的字符,就將計(jì)數(shù)器加一,這樣,當(dāng)計(jì)數(shù)器的數(shù)字達(dá)到一定長度時(shí),就可以認(rèn)為已經(jīng)獲得了一個(gè)完整的號碼,然后發(fā)起查詢即可。當(dāng)然,如前文所述,一個(gè)完整的號碼的總長度可能并不是唯一的,因此,在抓取到第一個(gè)字符時(shí),還可以根據(jù)第一個(gè)字符來判斷下,此次輸入的號碼總長度應(yīng)該是多少。例如,對于手機(jī)號碼而言,一般都是以數(shù)據(jù)“1”開頭的,固定電話的區(qū)號一般是以數(shù)字“0”開頭的,因此,如果抓取到的第一個(gè)數(shù)字是“1”或“0”,則可以基本確定總長度應(yīng)該是11位。如果是抓取到的第一個(gè)數(shù)字既不是“1”也不是“0”,則證明用戶可能要輸入一個(gè)不帶區(qū)號的固定電話號碼,則其長度可能為7位,也可能為8位,此時(shí),可以在抓取到7位數(shù)字時(shí)就查詢一次,如果之后又抓取到一位,則再將完整的8位數(shù)字的號碼再發(fā)起一次查詢即可。此外,在實(shí)際應(yīng)用中,一些運(yùn)營商可能提供一些“IP電話業(yè)務(wù)”等,使用這種業(yè)務(wù)可以節(jié)省資費(fèi),但需要用戶在撥號時(shí)加撥特殊的IP業(yè)務(wù)號碼(例如17951等)。當(dāng)然這種IP業(yè)務(wù)號碼也有固定的編碼規(guī)則,例如,一般都是五位固定的數(shù)字,后面跟電話號碼,因此,針對這種情況,可以預(yù)先收集可能的IP業(yè)務(wù)號碼,當(dāng)抓取到用戶輸入的號碼時(shí),可以首先將抓取到的前五位取出,如果發(fā)現(xiàn)屬于其中某一IP業(yè)務(wù)號碼,再從第六位開始重新計(jì)數(shù),并將第六位之后抓取到的字符確定為被叫號碼,并將完整的號碼發(fā)起查詢即可。

S102:獲取所述目標(biāo)號碼對應(yīng)的使用者身份信息;

首先需要說明的是,在本發(fā)明實(shí)施例中,號碼對應(yīng)的使用者身份信息是指,號碼的擁有者具有怎樣的身份,例如,是否為騙子、房產(chǎn)中介、保險(xiǎn)推銷、快遞等等,總之通過這樣的使用者身份信息,用戶可以分辨出是否要接聽一個(gè)陌生來電,或者撥打一個(gè)陌生電話時(shí)是否安全。

在本發(fā)明實(shí)施例中,為了能夠在發(fā)現(xiàn)應(yīng)用場景中的陌生號碼之后獲取到陌生號碼對應(yīng)的使用者身份信息,可以在已聯(lián)網(wǎng)的情況下,直接在客戶端本地通過搜索等手段獲取陌生號碼的使用者身份信息。當(dāng)然,為了提高效率,可以在服務(wù)器端創(chuàng)建并維護(hù)一個(gè)數(shù)據(jù)庫,該數(shù)據(jù)庫中收集了通過各種途徑獲取到的電話號碼及其對應(yīng)的使用者身份信息;這樣,當(dāng)在通信終端發(fā)現(xiàn)一個(gè)陌生號碼之后,就可以向服務(wù)器發(fā)起查詢,服務(wù)器通過查詢自己維護(hù)的數(shù)據(jù)庫,獲取到陌生號碼對應(yīng)的使用者身份信息,然后返回給通信終端。其中,通信終端可以在已經(jīng)聯(lián)網(wǎng)(GPRS(General Packet Radio Service,通用分組無線服務(wù))/3G(3rd-generation,第三代移動(dòng)通信技術(shù))/WiFi(Wireless Fidelity,無線保真)等)的情況下,將發(fā)現(xiàn)的陌生號碼使用http get或者post請求將陌生號碼上傳到服務(wù)器,陌生號碼可以作為字符串封裝在http url中,也可以作為二進(jìn)制數(shù)據(jù)封裝在http body里。相應(yīng)的,服務(wù)器的返回內(nèi)容中,可以使用JSON(JavaScript Object Notation,是一種輕量級的數(shù)據(jù)交換格式)格式封裝號碼信息,也可以使用XML(Extensible Markup Language,可擴(kuò)展標(biāo)記語言)格式或其它結(jié)構(gòu)化數(shù)據(jù)協(xié)議封裝號碼信息。另外,客戶端與服務(wù)器端的通信也可以使用TCP(Transmission Control Protocol,傳輸控制協(xié)議)、UDP(User Datagram Protocol,用戶數(shù)據(jù)包協(xié)議)或其他自定義協(xié)議實(shí)現(xiàn)。當(dāng)然,為了不依賴于互聯(lián)網(wǎng)(GPRS/3G/Wifi),客戶端與服務(wù)器端的通訊也可以利用移動(dòng)通信信道實(shí)現(xiàn),類似于發(fā)送/接收短消息的技術(shù),其優(yōu)點(diǎn)在于不依賴于手機(jī)端互聯(lián)網(wǎng)是否連通,只要手機(jī)信號暢通即可。

服務(wù)器端在創(chuàng)建并維護(hù)數(shù)據(jù)庫時(shí),可以通過多種數(shù)據(jù)源中獲取所需的信息。例如,在一種方式下,由于互聯(lián)網(wǎng)中包含各種各樣的網(wǎng)頁,其中包含的信息也是異常豐富,甚至還有些網(wǎng)頁是專門用于收集詐騙電話等信息供用戶查詢的,因此,可以利用搜索引擎技術(shù)抓取網(wǎng)頁中的目標(biāo)號碼(也即本發(fā)明實(shí)施例中涉及的詐騙電話、中介電話、保險(xiǎn)銷售電話等等)及對應(yīng)的使用者身份信息,然后進(jìn)行保存。具體實(shí)現(xiàn)時(shí),針對各類身份,可以分別設(shè)定一些搜索的范圍,然后在具體的搜索范圍內(nèi),根據(jù)目標(biāo)電話在網(wǎng)頁中的特征,從網(wǎng)頁中抽取出目標(biāo)電話及對應(yīng)的使用者身份信息。

例如,對于詐騙電話,搜索的范圍可以覆蓋一些主要用于收錄詐騙電話信息的站點(diǎn),這些站點(diǎn)中收錄了很多帶有網(wǎng)友評論的號碼信息,比如指定某個(gè)電話為響一聲就掛、吸費(fèi)電話、詐騙電話等等。因此,可以根據(jù)信息抽取規(guī)則,從這些站點(diǎn)中抽取出目標(biāo)號碼及其對應(yīng)的使用者身份信息。又如,對應(yīng)房產(chǎn)中介電話,搜索的范圍可以覆蓋一些提供房屋買賣、租賃等服務(wù)信息的站點(diǎn),在這些站點(diǎn)中,信息發(fā)布者一般會(huì)提供自己的聯(lián)系電話,并且站點(diǎn)會(huì)對中介及個(gè)人進(jìn)行分類,在一些中介冒充個(gè)人發(fā)布信息的情況下,站點(diǎn)允許用戶對其發(fā)現(xiàn)的房產(chǎn)中介電話進(jìn)行標(biāo)記,等等。因此,同樣可以根據(jù)中介電話在網(wǎng)頁中具有的規(guī)則,從網(wǎng)頁中抽取出目標(biāo)電話及對應(yīng)的使用者身份信息。

其中,對于使用的抽取規(guī)則,可以是預(yù)先由人為等方式設(shè)置,但在本發(fā)明實(shí)施例中,還可以使用機(jī)器學(xué)習(xí)的方法來生成抽取規(guī)則。具體實(shí)現(xiàn)時(shí),對于各類目標(biāo)電話,在選定搜索范圍之后,可以首先分別針對各個(gè)選中的站點(diǎn),選出一些網(wǎng)頁,由機(jī)器學(xué)習(xí)模塊對這些網(wǎng)頁進(jìn)行分析,然后從中總結(jié)出抽取規(guī)則。也即,針對某一類目標(biāo)電話,在選中了幾個(gè)站點(diǎn)之后,分別針對每個(gè)站點(diǎn)會(huì)學(xué)習(xí)出抽取規(guī)則,然后分別用各自的抽取規(guī)則到站點(diǎn)內(nèi)的網(wǎng)頁中抽取出號碼及其對應(yīng)的使用者身份信息。

例如,對于詐騙類的號碼,搜索范圍內(nèi)的站點(diǎn)包括搜電話(http://www.soudianhua.com/)、哪個(gè)打的(http://www.nagedade.com/)、防騙數(shù)據(jù)庫(http://www.fpsjk.com)、查號吧(http://www.chahaoba.com)、手機(jī)號碼歸屬地查詢(http://www.096.me/)、無地遁形(http://www.unxing.com/)、我要搜號(http://www.51sh.cc/)等等。由于這些網(wǎng)站的頁面中一般會(huì)包含用戶到手機(jī)號的評論信息,從評論信息中就能抽取出號碼對應(yīng)的使用者身份信息。因此,抽取規(guī)則可以根據(jù)評論信息來設(shè)置。在機(jī)器學(xué)習(xí)抽取規(guī)則時(shí),相當(dāng)于是需要通過程序去發(fā)現(xiàn)作為訓(xùn)練樣本的網(wǎng)頁中是否存在用戶評論,獲取到用戶評論的抽取規(guī)則。

具體實(shí)現(xiàn)時(shí),可以基于DOM樹來學(xué)習(xí)抽取規(guī)則。其中,DOM是專門適用于HTML/XHTML的文檔對象模型,可以將DOM理解為網(wǎng)頁的API。它把所有的數(shù)據(jù)以父子的節(jié)點(diǎn)層次結(jié)構(gòu)裝入內(nèi)存構(gòu)成一棵樹,這些節(jié)點(diǎn)的類型可以是元素、文本、屬性、注釋或其它。它允許開發(fā)者讀取、創(chuàng)建、刪除和編輯HTML數(shù)據(jù)。因此,通過分析DOM樹中的各個(gè)節(jié)點(diǎn),就可以從中獲取到想要的信息。對于本發(fā)明實(shí)施例中想要獲取的對號碼的用戶評論而言,用戶評論列表本身對應(yīng)著DOM樹中的一個(gè)節(jié)點(diǎn),并且同一個(gè)站點(diǎn)下的各個(gè)網(wǎng)頁的結(jié)構(gòu)會(huì)比較相似,甚至可能是采用一種或者幾種結(jié)構(gòu),也就是說,從根節(jié)點(diǎn)到用戶評論列表節(jié)點(diǎn)的路徑可能是相同的,或者可能分為幾種情況,因此,在機(jī)器學(xué)習(xí)的過程中,就可以從作為訓(xùn)練樣本的網(wǎng)頁中找出從根節(jié)點(diǎn)到用戶評論列表節(jié)點(diǎn)的路徑,以此作為提取規(guī)則。

在機(jī)器學(xué)習(xí)的過程中,如何從作為訓(xùn)練樣本的網(wǎng)頁中發(fā)現(xiàn)用戶評論列表節(jié)點(diǎn)是比較關(guān)鍵的問題,下面對此進(jìn)行介紹。由于同一頁面中一般都是針對同一號碼的用戶評論,并且評論列表中一般可能會(huì)有多條,各條評論信息在頁面的DOM樹中,是同一父節(jié)點(diǎn)(該父節(jié)點(diǎn)即為評論列表節(jié)點(diǎn))下的各個(gè)子節(jié)點(diǎn),并且各個(gè)子節(jié)點(diǎn)之間的相似度比較高(例如索引、標(biāo)簽名、屬性名等都會(huì)比較相似)。因此,就可以基于這一特點(diǎn),來查找到評論列表節(jié)點(diǎn)。具體實(shí)現(xiàn)時(shí),就可以首先針對一個(gè)站點(diǎn)中的指定網(wǎng)頁,根據(jù)號碼的特征(如前文所述的移動(dòng)電話11位、區(qū)號+號碼、網(wǎng)絡(luò)電話號碼等等),判斷頁面中是否包含電話號碼;如果包含,則根據(jù)該頁面的HTML代碼創(chuàng)建該頁面的DOM樹,并通過基于編輯距離的方式計(jì)算各個(gè)節(jié)點(diǎn)之間的相似度,找到其中包含的最小重復(fù)單元,每一個(gè)最小重復(fù)單元就相當(dāng)于對應(yīng)著一條用戶評論,然后就可以將這些最小重復(fù)單元對應(yīng)的共同父節(jié)點(diǎn)確定為用戶評論節(jié)點(diǎn),記錄下從根節(jié)點(diǎn)到該用戶評論節(jié)點(diǎn)的路徑,就可以將該路徑作為這一類網(wǎng)頁的一種規(guī)則模板,也即路徑抽取規(guī)則。當(dāng)然,如前文所述,同一站點(diǎn)下的各個(gè)網(wǎng)頁可能會(huì)具有幾種(一般不會(huì)太多)不同的結(jié)構(gòu),在每種結(jié)構(gòu)下對應(yīng)的從根節(jié)點(diǎn)到用戶評論列表節(jié)點(diǎn)的路徑也不盡相同,因此,針對不同的頁面結(jié)構(gòu),可以分別學(xué)習(xí)出不同的路徑抽取規(guī)則,分別進(jìn)行存儲(chǔ)即可。

在通過機(jī)器學(xué)習(xí)的方式獲取到上述路徑抽取規(guī)則之后,就可以在同一站點(diǎn)下的其他網(wǎng)頁中,利用上述路徑抽取規(guī)則抽取出網(wǎng)頁中包含的目標(biāo)號碼以及使用者身份信息。具體實(shí)現(xiàn)時(shí),可以針對同一站點(diǎn)下的各個(gè)網(wǎng)頁,分別使用路徑抽取規(guī)則抽取出用戶評論列表節(jié)點(diǎn)下的具體信息內(nèi)容。例如,使用路徑抽取規(guī)則抽取到的用戶評論信息如圖2所示,對應(yīng)的頁面中的區(qū)域如圖3所示。進(jìn)而,根據(jù)抽取出的用戶評論信息,可以判斷其中是否存在預(yù)置的檢測特征詞(例如詐騙、騷擾等等),如果包含,就可以提取出來,進(jìn)而就可以根據(jù)提取出的特征詞,來確定目標(biāo)號碼對應(yīng)的使用者身份信息。當(dāng)然,如前文所述,同一站點(diǎn)下可能包括多種路徑抽取規(guī)則,此時(shí),可以使用各種路徑抽取規(guī)則進(jìn)行輪詢,直到成功抽取出所需信息為止。

另外,在其他實(shí)施例中,在提取從根節(jié)點(diǎn)到用戶評論列表節(jié)點(diǎn)的路徑作為抽取規(guī)則的同時(shí),還可以對符合上述特征的網(wǎng)頁的URL提取出來,并根據(jù)各個(gè)URL中存在的共性部分,使用正則表達(dá)式對URL進(jìn)行歸一化,得到URL的提取規(guī)則。例如,針對形如以下所示的URL:http://www.51sh.cc/index.php?type=code&sky=18647777777&v=vh,歸一化之后可以得到:http://www.51sh.cc/index.php\?type=code&sky=\d+&v=vh$。需要說明的是,在進(jìn)行上述歸一化時(shí),需要將相同網(wǎng)頁結(jié)構(gòu)的網(wǎng)頁的URL進(jìn)行歸一化,也就是說,在提取從根節(jié)點(diǎn)到用戶評論列表節(jié)點(diǎn)的路徑時(shí),在同一站點(diǎn)下,有可能提取出多種,此時(shí),同一種下的網(wǎng)頁URL可以進(jìn)行歸一化,得到URL抽取規(guī)則,并且可以與提取到的路徑抽取規(guī)則相對應(yīng)。

在通過機(jī)器學(xué)習(xí)得到上述路徑抽取規(guī)則以及URL抽取規(guī)則之后,就可以使用搜索引擎技術(shù)抓取到同一站點(diǎn)下的其他網(wǎng)頁,然后,使用這種規(guī)則到這些網(wǎng)頁中進(jìn)行匹配抽取。具體的,首先可以利用URL抽取規(guī)則抽取到匹配的網(wǎng)頁,然后再利用對應(yīng)的路徑抽取規(guī)則,從網(wǎng)頁中抽取出其中包含的號碼,以及用戶評論列表下的各條評論信息。然后,通過對抽取到的用戶評論信息中包含的關(guān)鍵詞,即可獲取到號碼對應(yīng)的可能的使用者身份信息。例如,針對某號碼131****2751,從網(wǎng)頁中抽取出的用戶評論信息中包括“騷擾”、“只響一聲”、“胡亂罵人”等特征詞,則可以根據(jù)這些信息最終將該號碼對應(yīng)的使用者身份信息確定為“騷擾”,等等。這種使用路徑抽取規(guī)則以及URL抽取規(guī)則進(jìn)行抽取的方式,相當(dāng)于首先利用URL抽取規(guī)則對站點(diǎn)下的網(wǎng)頁進(jìn)行過濾,然后再使用路徑抽取規(guī)則從剩余的網(wǎng)頁中抽取需要的信息,因此,可以降低計(jì)算量,提高效率。

針對其他目標(biāo)站點(diǎn),也可以分別進(jìn)行上述處理,最終就可以從眾多的網(wǎng)頁中抽取出大量的號碼及其對應(yīng)的使用者身份信息,保存這些信息即可創(chuàng)建起號碼信息數(shù)據(jù)庫,以供查詢使用。

當(dāng)然,除了上述網(wǎng)頁中包含有用戶對電話號碼的評論信息的站點(diǎn)之外,還有一些站點(diǎn)的網(wǎng)頁中可能會(huì)包含針對某號碼非常明顯的使用者身份信息。例如,在房產(chǎn)買賣或租賃的網(wǎng)站中,可能會(huì)規(guī)定用戶在發(fā)布消息時(shí),提供自己的身份信息,或者需要用戶在自己所屬的身份類別中進(jìn)行發(fā)布,等等。也就是說,在一個(gè)頁面中顯示發(fā)布者的電話號碼時(shí),會(huì)同時(shí)顯示出發(fā)布者的身份信息。例如,某用戶發(fā)布出租房屋的消息時(shí),如果是中介公司的職員,則在其信息發(fā)布頁面中顯示該用戶的電話號碼的同時(shí),會(huì)有明顯的“中介”字樣,甚至還可能提供所屬的中介公司,等等。針對這種情況,就可以直接在網(wǎng)頁中提取其中包含的電話號碼及其對應(yīng)的使用者身份信息。具體實(shí)現(xiàn)時(shí),同樣可以預(yù)先設(shè)置搜索的覆蓋范圍,例如在抽取中介電話時(shí),可以使得搜索范圍覆蓋一些常用的提供房租買賣、租賃服務(wù)的站點(diǎn),例如,搜房網(wǎng)soufun.com、搜狐焦點(diǎn)51f.com、安居客anjuke.com等等。然后使用搜索引擎技術(shù)抓取這些站點(diǎn)下的所有網(wǎng)頁,然后根據(jù)電話號碼的特征從網(wǎng)頁中提取出電話號碼,同時(shí)提取出網(wǎng)頁中包含的特征詞。最終,就可以根據(jù)提取出的特征詞,來確定目標(biāo)號碼對應(yīng)的使用者身份信息。

除了上述通過搜索引擎技術(shù)在網(wǎng)頁中抽取目標(biāo)電話及其對應(yīng)的使用者身份信息之外,本發(fā)明實(shí)施例還提供了另一種建立數(shù)據(jù)庫的方法:通過用戶標(biāo)記來獲取電話對應(yīng)的使用者身份信息并建立數(shù)據(jù)庫。也即,可以在通信終端中為用戶提供操作入口,當(dāng)用戶接聽了一個(gè)陌生電話之后發(fā)現(xiàn)對應(yīng)的使用者身份信息之后,可以對電話進(jìn)行標(biāo)記并上傳到服務(wù)器,這樣,通過大量用戶的反饋,服務(wù)器端就可以創(chuàng)建并不斷更新數(shù)據(jù)庫。具體實(shí)現(xiàn)時(shí),可以在通信終端上對用戶接聽來電的事件進(jìn)行監(jiān)測,監(jiān)測到用戶接聽了某陌生來電(具體的監(jiān)測、獲取號碼以及判斷是否為陌生號碼的方法可以與前文所述相同)時(shí),可以為用戶提供標(biāo)記入口,例如,如圖4所示,用戶可以通過“標(biāo)記此號碼”這一入口進(jìn)入標(biāo)記的界面,可以在標(biāo)記界面中顯示一輸入框,用戶可以在輸入框中輸入自己判斷出來的使用者身份信息;或者,為了便于用戶標(biāo)記,還可以在標(biāo)記界面中將常見的陌生電話類型顯示給用戶供用戶選擇,例如,如圖5所示,可以將“保險(xiǎn)推銷”、“房產(chǎn)中介”、“獵頭”、“快遞”顯示給用戶,如果用戶判斷出某電話對應(yīng)的使用者身份信息是其中的某一個(gè),則直接點(diǎn)擊對應(yīng)的按鈕,即可完成標(biāo)記的操作。如果用戶判斷出的使用者身份信息不是上述中的任一個(gè),則還可以點(diǎn)擊“更多”按鈕,此時(shí),還可以顯示出更多的可選使用者身份信息,同時(shí)用戶也可以選擇手工輸入使用者身份信息,如圖6所示。在用戶點(diǎn)擊選擇了某使用者身份信息或輸入了某使用者身份信息之后,還可以通過另一個(gè)入口,將標(biāo)記的信息發(fā)送到服務(wù)器,當(dāng)然,在點(diǎn)擊選擇候選使用者身份信息的情況下,也可以直接通過用戶的點(diǎn)擊操作來觸發(fā)向服務(wù)器端的發(fā)送操作。需要說明的是,除了上述通過顯示標(biāo)記界面的方式來接收用戶的輸入之外,還可以通過其他方式,例如,還可以在用戶通過標(biāo)記入口進(jìn)入之后,打開通信終端上的音頻接收器,這樣,用戶可以通過語音的方式來輸入陌生號碼使用者身份信息。或者,還可以直接以語音的方式為用戶提供標(biāo)記入口,也即以語音的方式提示用戶是否需要進(jìn)行標(biāo)記,同時(shí)打開通信終端上的音頻接收器,如果用戶需要標(biāo)記,則可以直接以口述的方式輸入使用者身份標(biāo)記信息。之后,就可以將接收到的音頻信號轉(zhuǎn)換為文本,并上傳到服務(wù)器,當(dāng)然,還可以直接將接收到的音頻信號上傳到服務(wù)器,在服務(wù)器端將音頻轉(zhuǎn)換為文本。

當(dāng)然,在實(shí)際應(yīng)用中,如果用戶接聽的是一個(gè)位于通訊錄中、但是并不常用的電話,也可以在接聽完之后,提示用戶進(jìn)行標(biāo)記,或者也可以結(jié)合通訊錄中的信息確定是否需要用戶進(jìn)行標(biāo)記。例如,如果某號碼在通訊錄中的用戶名信息是“中介***”,則可以提示用戶進(jìn)行標(biāo)記,等等。其中,為了判斷通訊錄中的號碼是否為用戶常用,可以對各個(gè)號碼的使用次數(shù)進(jìn)行統(tǒng)計(jì),根據(jù)統(tǒng)計(jì)結(jié)果獲知各個(gè)號碼是否常用。另外,也可以不是在用戶接聽完一個(gè)陌生電話或者非常用電話之后就馬上提示用戶進(jìn)行標(biāo)記,而是可以通過提供菜單選項(xiàng)的方式,使得用戶能夠在需要的任意時(shí)刻選擇對某號碼進(jìn)行標(biāo)記并上傳到服務(wù)器。例如,用戶在翻看過去的通話記錄或者通訊錄時(shí),發(fā)現(xiàn)需要對某號碼進(jìn)行標(biāo)記,則可以在選項(xiàng)菜單中選擇入口進(jìn)入標(biāo)記界面,等等。

需要說明的是,在這種實(shí)施方式下,不同的用戶針對同一電話可能會(huì)有不同的身份標(biāo)記信息,尤其是在用戶手動(dòng)輸入使用者身份信息的情況下。因此,為了保證數(shù)據(jù)庫中的數(shù)據(jù)質(zhì)量,可以通過一些手段進(jìn)行優(yōu)化:

第一,只有接聽了陌生來電才能上傳使用者身份信息。要滿足此條件,首先必須是陌生來電主動(dòng)呼叫用戶,用戶自己呼出的陌生電話號碼不可作標(biāo)記,以防止惡意的標(biāo)記行為;其次,用戶必須接通陌生來電,產(chǎn)生通話信息之后才能上傳,即只有在用戶和對方通話之后才有可能獲取有效的使用者身份信息。

第二,同一用戶對同一號碼只能標(biāo)記一次,防止用戶重復(fù)標(biāo)記某一個(gè)陌生號碼,影響數(shù)據(jù)的準(zhǔn)確性。當(dāng)某個(gè)用戶標(biāo)記了一個(gè)號碼后,可以在通信終端對已標(biāo)記的號碼進(jìn)行存儲(chǔ),該用戶下次再嘗試此行為時(shí),會(huì)收到“重復(fù)標(biāo)記”的提示信息,并將此次操作視為無效。

第三,只有達(dá)到一定標(biāo)記數(shù)量的情況下,才視為有效信息,例如,針對146XXXX0987這一號碼,需要有至少N(N≥2)個(gè)以上的用戶將其標(biāo)記為“中介”,才將此作為該號碼對應(yīng)的使用者身份信息,并保存在數(shù)據(jù)庫中。

第四,當(dāng)服務(wù)器收集到多條針對某一號碼的標(biāo)記信息后,可以通過篩選策略選擇最佳的使用者身份信息匹配此號碼。具體的篩選策略可以有多種,例如,可以將多個(gè)用戶的標(biāo)記信息匯總,根據(jù)各種標(biāo)記結(jié)果分別在總的標(biāo)記次數(shù)中所占的比例,來確定該號碼最終的使用者身份信息。例如,有四個(gè)用戶將某號碼標(biāo)記為“中介”,兩個(gè)用戶將該號碼標(biāo)記為“快遞”,則最終可以判定此號碼的使用者身份信息為“中介”。或者,還可以通過標(biāo)記者與被提示用戶之間的關(guān)系(“標(biāo)記者”是指之前上傳了使用者身份標(biāo)記信息的人,“當(dāng)前用戶”是當(dāng)前正在接收到某陌生來電,或者正在撥打陌生電話的人,等待被提示的人,“標(biāo)記者”與“被提示用戶”可能是同一個(gè)人,也可能不同),生成動(dòng)態(tài)的篩選策略。例如,可以增加聯(lián)系人標(biāo)記的權(quán)重,例如,陌生號碼146XXXX0876之前被用戶甲通訊錄中的某個(gè)聯(lián)系人乙標(biāo)記為“中介”(此時(shí),該聯(lián)系人乙是該號碼的一個(gè)標(biāo)記者),則此信息會(huì)自動(dòng)分享,當(dāng)用戶甲收到該號碼的來電時(shí),或者正在撥打該號碼時(shí),發(fā)現(xiàn)該號碼的標(biāo)記者乙出現(xiàn)在該用戶甲的聯(lián)系人中,則可以將該標(biāo)記者乙當(dāng)時(shí)上傳的使用者身份標(biāo)記信息的權(quán)重增加,之后再重新綜合各個(gè)標(biāo)記者針對該號碼上傳的使用者身份標(biāo)記信息,確定出該號碼的使用者身份信息之后,再提示給用戶甲?;蛘咧苯訉⑵渎?lián)系人乙的標(biāo)記情況顯示給用戶,如圖7所示,也即,綜合該號碼的各個(gè)標(biāo)記者的標(biāo)記情況,該號碼的使用者身份信息為“保險(xiǎn)推銷”,但是有一個(gè)聯(lián)系人乙把該號碼標(biāo)記為“房產(chǎn)中介”。

第五,如果某號碼的使用者身份改變,則當(dāng)此號碼的新身份獲得足夠多的標(biāo)記數(shù)量時(shí),系統(tǒng)可以自動(dòng)更新此號碼對應(yīng)的使用者身份信息。具體實(shí)現(xiàn)時(shí),為了實(shí)現(xiàn)這種自動(dòng)更新,用戶上傳的標(biāo)記信息可以具有“有效時(shí)間”的屬性,比如針對某一號碼的“中介”標(biāo)記只能保持一個(gè)月,過期后的標(biāo)記將在規(guī)則審核時(shí)視為無效,以此來規(guī)避號碼對應(yīng)的用戶身份轉(zhuǎn)變問題。比如某個(gè)被標(biāo)記為“中介”的號碼持有人,轉(zhuǎn)行做了“快遞”,則原有的針對他中介身份的標(biāo)記會(huì)逐漸失效,以確保他的新身份能夠更新。當(dāng)然,在實(shí)際應(yīng)用中,如果某號碼對應(yīng)的使用者身份信息發(fā)生變化,則在需要向用戶提示該號碼對應(yīng)的使用者身份信息時(shí),除了更新后的使用者身份信息之外,還可以將該號碼過去對應(yīng)的使用者身份信息一并提示給用戶

第六,標(biāo)記異常處理,如果某用戶在短時(shí)間內(nèi)頻繁標(biāo)記陌生號碼,超出正常用戶接收陌生來電的數(shù)據(jù)量,則服務(wù)器可以對它所上傳的標(biāo)記信息進(jìn)行嚴(yán)格的審核。另一方面,如果某一個(gè)號碼,在短時(shí)間內(nèi)被大量用戶頻繁標(biāo)記,超出了正常號碼被標(biāo)記的數(shù)據(jù)量,則服務(wù)器也可以嚴(yán)格審核針對此號碼的標(biāo)記信息。

除了上述兩種實(shí)施方式外,服務(wù)器還可以通過其他的方式來收集信息,創(chuàng)建并維護(hù)數(shù)據(jù)庫,這里不再一一介紹。

S103:將獲取到的所述目標(biāo)號碼對應(yīng)的使用者身份信息提示給用戶。

在獲取到號碼的使用者身份信息之后,就可以將身份信息顯示在用戶界面中。也即,當(dāng)用戶的通信終端中有新的來電時(shí),就可以在顯示來電號碼的同時(shí),將來電號碼對應(yīng)的使用者身份信息顯示給用戶,用戶在接聽之前,就可以對來電者的身份有所了解?;蛘撸谟脩粝胍獡艽蚰衬吧娫挄r(shí),在按下呼叫按鈕之前或之后,也可以將被叫號碼的使用者身份信息提示給用戶,使得用戶對被叫號碼的使用者身份有所了解。

其中,具體在顯示陌生號碼的使用者身份信息時(shí),可以通過在顯示來電號碼或呼叫號碼的界面之上增加一個(gè)懸浮的對話框的方式來實(shí)現(xiàn),或者,也可以hook系統(tǒng)界面之后,直接在界面中添加陌生號碼的使用者身份信息,等等。

例如,可以在手機(jī)來電界面展現(xiàn)給用戶相關(guān)號碼的使用者身份信息。具體的,當(dāng)客戶端監(jiān)測到用戶接到一個(gè)陌生號碼的來電時(shí),則利用系統(tǒng)相關(guān)API獲取該陌生號碼,并利用Wifi網(wǎng)絡(luò)等,將該號碼以字符串等形式封裝在url中,使用http get請求提交到服務(wù)器端進(jìn)行查詢,服務(wù)器端查詢服務(wù)模塊收到該請求后,在號碼信息數(shù)據(jù)庫中查詢該號碼的身份信息,并返回給客戶端,客戶端調(diào)用顯示模塊在系統(tǒng)來電界面顯示信息,就能夠有效的提示用戶決定是否接聽該來電。如圖8所示,當(dāng)用戶接收到“146****0876”的來電時(shí),就可以將使用者身份信息“北京市人才市場”顯示在用戶界面中。

又如,可以在手機(jī)撥號界面根據(jù)用戶所撥號碼展現(xiàn)相關(guān)的使用者身份信息。具體的,當(dāng)客戶端監(jiān)測到用戶在手機(jī)撥號界面輸入號碼時(shí),與前文類似,向服務(wù)器進(jìn)行查詢并獲取用戶所輸號碼的使用者身份信息,然后顯示給用戶。如圖9所示:當(dāng)用戶呼叫“010-62793650”時(shí),可以將該號碼的使用者身份信息“招商銀行北京分行清華園支行”顯示在用戶界面中。

當(dāng)然,在實(shí)際應(yīng)用中,在向用戶提示陌生號碼對應(yīng)的使用者身份信息時(shí),并不限于上述在用戶界面上展現(xiàn)這一種方式,例如,還可以采用語音播報(bào)等其他方式,這里不再一一詳述。

與本發(fā)明實(shí)施例提供的號碼信息提示方法相對應(yīng),本發(fā)明實(shí)施例還提供了一種號碼信息提供系統(tǒng),參見圖10,該系統(tǒng)可以包括:

監(jiān)測單元1001,用于對使用通信終端過程中的應(yīng)用場景進(jìn)行監(jiān)測,獲取應(yīng)用場景中出現(xiàn)的目標(biāo)號碼;

身份信息獲取單元1002,用于獲取所述目標(biāo)號碼對應(yīng)的使用者身份信息;

身份信息提示單元1003,用于將獲取到的所述目標(biāo)號碼對應(yīng)的使用者身份信息提示給用戶。

其中,身份信息獲取1002可以包括:

號碼上傳子單元,用于將所述目標(biāo)號碼上傳到服務(wù)器端;

信息查詢子單元,用于所述服務(wù)器端通過查詢預(yù)先建立的號碼信息數(shù)據(jù)庫,獲取所述目標(biāo)號碼對應(yīng)的使用者身份信息并返回給客戶端;

信息獲取子單元,用于根據(jù)所述服務(wù)器端返回的信息,獲取所述目標(biāo)號碼對應(yīng)的使用者身份信息。

具體實(shí)現(xiàn)時(shí),還包括:

入口提供子單元,用于為用戶提供標(biāo)記入口;

數(shù)據(jù)庫建立子單元,用于根據(jù)用戶通過所述標(biāo)記入口上傳的對號碼的使用者身份標(biāo)記信息,建立所述號碼信息數(shù)據(jù)庫。

其中,入口提供單元可以包括:

監(jiān)測子單元,用于對用戶使用通信終端過程中的應(yīng)用場景進(jìn)行監(jiān)測;

第一入口提供子單元,用于當(dāng)監(jiān)測到用戶接聽了一號碼的來電時(shí),如果該號碼為陌生號碼或者不常用號碼,則在用戶界面為用戶提供標(biāo)記入口。

其中,所述數(shù)據(jù)庫建立單元可以包括:

第一界面顯示子單元,用于當(dāng)用戶從所述標(biāo)記入口進(jìn)入時(shí),顯示標(biāo)記界面,以便用戶在所述標(biāo)記界面中輸入使用者身份標(biāo)記信息。

或者,入口提供單元也可以包括:

第二入口提供子單元,用于在通信終端的選項(xiàng)菜單中注入標(biāo)記入口。

此時(shí),所述數(shù)據(jù)庫建立單元可以包括:

第二界面顯示子單元,用于當(dāng)用戶選中一號碼并選擇從所述選項(xiàng)菜單中的標(biāo)記入口進(jìn)入時(shí),顯示標(biāo)記界面,以便用戶在所述標(biāo)記界面中輸入使用者身份標(biāo)記信息。

為了便于用戶進(jìn)行標(biāo)記,該系統(tǒng)還可以包括:

候選項(xiàng)顯示單元,用于在所述標(biāo)記界面中顯示使用者身份標(biāo)記信息候選項(xiàng),以便用戶通過選擇所述候選項(xiàng)來輸入使用者身份標(biāo)記信息。

具體實(shí)現(xiàn)時(shí),還可以包括:

記錄單元,用于對用戶對號碼的標(biāo)記情況進(jìn)行記錄;

無效提示單元,用于當(dāng)用戶發(fā)起對同一號碼的再次標(biāo)記請求時(shí),提示用戶操作無效。

其中,所述數(shù)據(jù)庫建立單元包括:

身份信息確定子單元,用于針對同一號碼,根據(jù)至少兩個(gè)用戶上傳的使用者身份標(biāo)記信息,確定號碼對應(yīng)的使用者身份信息。

其中,所述身份信息確定子單元包括:

選擇子單元,用于當(dāng)不同用戶針對同一號碼上傳了不同的使用者身份標(biāo)記信息時(shí),根據(jù)各個(gè)使用者身份標(biāo)記信息的被上傳次數(shù),從各個(gè)使用者身份標(biāo)記信息中為號碼選擇使用者身份信息。

可選的,還可以包括:

記錄單元,用于將執(zhí)行上傳操作的用戶記錄為號碼的標(biāo)記者,并分別記錄各個(gè)標(biāo)記者針對同一號碼上傳的使用者身份標(biāo)記信息;

身份信息獲取單元1002具體用于:

如果所述目標(biāo)號碼的標(biāo)記者出現(xiàn)在被提示用戶的聯(lián)系人中,則獲取該目標(biāo)號碼的各個(gè)標(biāo)記者針對該目標(biāo)號碼上傳的使用者身份標(biāo)記信息;

身份信息提示單元1003具體用于:

將出現(xiàn)在聯(lián)系人中的標(biāo)記者上傳的使用者身份標(biāo)記信息進(jìn)行加權(quán);或者,將出現(xiàn)在聯(lián)系人中的標(biāo)記者上傳的使用者身份標(biāo)記信息單獨(dú)提示給用戶。

在另一種實(shí)施方式先,該系統(tǒng)還可以包括:

網(wǎng)頁抓取單元,用于對網(wǎng)絡(luò)中的網(wǎng)頁進(jìn)行抓取;

信息抽取單元,用于根據(jù)預(yù)置的抽取規(guī)則從抓取到的網(wǎng)頁中抽取出目標(biāo)號碼及其對應(yīng)的使用者身份信息。

其中,所述網(wǎng)頁抓取單元包括:

特定站點(diǎn)網(wǎng)頁抓取子單元,用于對網(wǎng)絡(luò)中特定站點(diǎn)下的網(wǎng)頁進(jìn)行抓??;

所述信息抽取單元包括:

特定站點(diǎn)網(wǎng)頁信息抽取子單元,用于針對同一特定站點(diǎn)下的網(wǎng)頁,根據(jù)預(yù)置的該特定站點(diǎn)對應(yīng)的抽取規(guī)則,從該特定站點(diǎn)下的網(wǎng)頁中抽取出目標(biāo)號碼及其對應(yīng)的使用者身份信息。

可選的,該系統(tǒng)還可以包括:

機(jī)器學(xué)習(xí)單元,用于通過機(jī)器學(xué)習(xí)的方式獲取所述抽取規(guī)則。

其中,所述機(jī)器學(xué)習(xí)單元包括:

訓(xùn)練樣本獲取子單元,用于從預(yù)置站點(diǎn)中提取預(yù)置數(shù)量的網(wǎng)頁作為訓(xùn)練樣本;

判斷子單元,用于根據(jù)預(yù)置的電話號碼特征,判斷訓(xùn)練樣本網(wǎng)頁中是否存在電話號碼;

DOM樹創(chuàng)建子單元,用于如果存在,則根據(jù)訓(xùn)練樣本網(wǎng)頁的HTML代碼創(chuàng)建DOM樹;

計(jì)算子單元,用于通過計(jì)算DOM樹中各個(gè)節(jié)點(diǎn)之間的編輯距離,獲取其中的最小循環(huán)單元;

節(jié)點(diǎn)確定子單元,用于將所述最小循環(huán)單元的父節(jié)點(diǎn)確定為用戶評論列表節(jié)點(diǎn);

路徑記錄子單元,用于記錄DOM樹中從根節(jié)點(diǎn)到所述用戶評論列表節(jié)點(diǎn)的路徑,生成路徑抽取規(guī)則。

所述信息抽取單元可以包括:

第一用戶評論信息抽取子單元,用于根據(jù)所述路徑抽取規(guī)則,從所述站點(diǎn)的其他網(wǎng)頁中抽取出目標(biāo)號碼,以及用戶評論信息;

第一信息確定子單元,用于根據(jù)所述用戶評論信息中包含的特征詞,確定所述目標(biāo)號碼對應(yīng)的使用者身份信息。

或者,為了提高效率,該系統(tǒng)還可以包括:

URL抽取規(guī)則生成單元,用于使用正則表達(dá)式,對相同的路徑抽取規(guī)則對應(yīng)的網(wǎng)頁的統(tǒng)一資源定位符URL進(jìn)行歸一化,生成URL抽取規(guī)則;

所述信息抽取單元包括:

URL匹配子單元,用于根據(jù)所述URL抽取規(guī)則,從所述站點(diǎn)的其他網(wǎng)頁中抽取URL特征相匹配的網(wǎng)頁;

第二用戶評論信息抽取子單元,用于根據(jù)所述路徑抽取規(guī)則,從所述相匹配的網(wǎng)頁中抽取出目標(biāo)號碼,以及用戶評論信息;

第二信息確定子單元,用于根據(jù)所述用戶評論信息中包含的特征詞,確定所述目標(biāo)號碼對應(yīng)的使用者身份信息。

其中,所述目標(biāo)號碼為未出現(xiàn)在所述通信終端的通訊錄中的陌生號碼。

通過以上的實(shí)施方式的描述可知,本領(lǐng)域的技術(shù)人員可以清楚地了解到本發(fā)明可借助軟件加必需的通用硬件平臺的方式來實(shí)現(xiàn)?;谶@樣的理解,本發(fā)明的技術(shù)方案本質(zhì)上或者說對現(xiàn)有技術(shù)做出貢獻(xiàn)的部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計(jì)算機(jī)軟件產(chǎn)品可以存儲(chǔ)在存儲(chǔ)介質(zhì)中,如ROM/RAM、磁碟、光盤等,包括若干指令用以使得一臺計(jì)算機(jī)設(shè)備(可以是個(gè)人計(jì)算機(jī),服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個(gè)實(shí)施例或者實(shí)施例的某些部分所述的方法。

本說明書中的各個(gè)實(shí)施例均采用遞進(jìn)的方式描述,各個(gè)實(shí)施例之間相同相似的部分互相參見即可,每個(gè)實(shí)施例重點(diǎn)說明的都是與其他實(shí)施例的不同之處。尤其,對于裝置或系統(tǒng)實(shí)施例而言,由于其基本相似于方法實(shí)施例,所以描述得比較簡單,相關(guān)之處參見方法實(shí)施例的部分說明即可。以上所描述的裝置及系統(tǒng)實(shí)施例僅僅是示意性的,其中所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個(gè)地方,或者也可以分布到多個(gè)網(wǎng)絡(luò)單元上??梢愿鶕?jù)實(shí)際的需要選擇其中的部分或者全部模塊來實(shí)現(xiàn)本實(shí)施例方案的目的。本領(lǐng)域普通技術(shù)人員在不付出創(chuàng)造性勞動(dòng)的情況下,即可以理解并實(shí)施。

以上對本發(fā)明所提供的號碼信息提示方法及系統(tǒng),進(jìn)行了詳細(xì)介紹,本文中應(yīng)用了具體個(gè)例對本發(fā)明的原理及實(shí)施方式進(jìn)行了闡述,以上實(shí)施例的說明只是用于幫助理解本發(fā)明的方法及其核心思想;同時(shí),對于本領(lǐng)域的一般技術(shù)人員,依據(jù)本發(fā)明的思想,在具體實(shí)施方式及應(yīng)用范圍上均會(huì)有改變之處。綜上所述,本說明書內(nèi)容不應(yīng)理解為對本發(fā)明的限制。

當(dāng)前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會(huì)獲得點(diǎn)贊!
1
拜泉县| 许昌市| 双辽市| 洞头县| 东城区| 辉南县| 西乡县| 江安县| 海林市| 五河县| 板桥市| 克拉玛依市| 赣榆县| 鄂尔多斯市| 亳州市| 永福县| 克东县| 怀来县| 安阳市| 水富县| 宝丰县| 博爱县| 万盛区| 扶绥县| 积石山| 洪洞县| 茶陵县| 鹤峰县| 龙陵县| 揭阳市| 望城县| 苏尼特左旗| 乡宁县| 龙口市| 商水县| 天峻县| 乌鲁木齐市| 涟水县| 循化| 江门市| 芦山县|