欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

基于短信的數(shù)據(jù)采集方法和數(shù)據(jù)采集系統(tǒng)與流程

文檔序號:12479569閱讀:838來源:國知局
基于短信的數(shù)據(jù)采集方法和數(shù)據(jù)采集系統(tǒng)與流程

本發(fā)明涉及通信技術(shù)領(lǐng)域,特別涉及一種基于短信的數(shù)據(jù)采集方法和數(shù)據(jù)采集系統(tǒng)。



背景技術(shù):

在用戶征信等一些領(lǐng)域領(lǐng)域,電商交易、金融數(shù)據(jù)等行業(yè)數(shù)據(jù)是極其有價值的,真實的用戶行為數(shù)據(jù),可以基于這些數(shù)據(jù)以及電信運營商的大數(shù)據(jù)結(jié)合,做精準營銷和征信業(yè)務(wù)的開展。但是,用戶的這些行為數(shù)據(jù)是各公司(例如京東、滴滴等)的核心資產(chǎn),作為電信運營商難以通過各公司來獲取。

當用戶在電商、金融行業(yè)進行注冊、交易等行為時,相應(yīng)公司通常會通過行業(yè)短信的方式實時通知用戶,該短信中含有交易信息,若能獲取到這些行業(yè)短信,則可獲取到相應(yīng)的數(shù)據(jù)。

然而,為保證用戶的隱私,短信內(nèi)容不得保存。由此可見,如何來獲取這些行業(yè)短信并提取出相應(yīng)的有價值數(shù)據(jù),是本領(lǐng)域技術(shù)人員亟需解決的技術(shù)問題。



技術(shù)實現(xiàn)要素:

本發(fā)明旨在至少解決現(xiàn)有技術(shù)中存在的技術(shù)問題之一,提供一種基于短信的數(shù)據(jù)采集方法和數(shù)據(jù)采集系統(tǒng)。

為實現(xiàn)上述目的,本發(fā)明提供了一種基于短信的數(shù)據(jù)采集方法,包括:

接收安全匯聚網(wǎng)關(guān)發(fā)送的短信數(shù)據(jù),所述短信數(shù)據(jù)包括:短信屬性信息和短信文本;

根據(jù)預(yù)先設(shè)置的模版庫判斷所述短信數(shù)據(jù)是否為特定商戶用戶發(fā)送的預(yù)設(shè)類型的行業(yè)短信,所述模版庫中存儲有各特定商戶用戶所發(fā)送的所述預(yù)設(shè)類型的行業(yè)短信的模版,所述模版包括對應(yīng)的所述預(yù)設(shè)類型的行業(yè)短信中的若干個關(guān)鍵詞;

若判斷出所述短信數(shù)據(jù)是所述特定商戶用戶發(fā)送的預(yù)設(shè)類型的行業(yè)短信時,則根據(jù)所述短信數(shù)據(jù)對應(yīng)的模版提取所述短信文本中的關(guān)鍵詞和位于部分關(guān)鍵詞之后的數(shù)值數(shù)據(jù);

將所述短信屬性信息提取出的所述關(guān)鍵詞和所述數(shù)值數(shù)據(jù)按照預(yù)設(shè)格式生成記錄文件。

可選地,所述短信屬性信息包括:發(fā)送號碼;

所述根據(jù)預(yù)先設(shè)置的模版庫判斷所述短信數(shù)據(jù)是否為特定商戶用戶發(fā)送的預(yù)設(shè)類型的行業(yè)短信的步驟包括:

根據(jù)預(yù)先設(shè)置的特定商戶接入號列表和所述發(fā)送號碼判斷所述短信數(shù)據(jù)是否為特定商戶用戶發(fā)送的行業(yè)短信,所述特定商戶接入號列表記載有若干個特定商戶用戶的接入號;

若判斷出所述短信數(shù)據(jù)為特定商戶用戶發(fā)送的行業(yè)短信時,則確定所述短信數(shù)據(jù)所對應(yīng)的特定商戶用戶,并從所述模版庫中調(diào)取出該特定商戶用戶對應(yīng)的所述預(yù)設(shè)類型的行業(yè)短信的若干個模版;

將所述短信文本與調(diào)取出的各模版分別進行匹配;

若所述短信文本與調(diào)取出的一個模版匹配成功時,則識別出所述短信數(shù)據(jù)為特定商戶用戶發(fā)送的預(yù)設(shè)類型的行業(yè)短信。

可選地,所述根據(jù)預(yù)先設(shè)置的特定商戶接入號列表和所述發(fā)送號碼判斷所述短信數(shù)據(jù)是否為特定商戶用戶發(fā)送的行業(yè)短信的步驟包括:

查詢所述特定商戶接入號列表中是否存在所述發(fā)送號碼;

若能夠從所述特定商戶接入號列表中查詢出所述發(fā)送號碼,則判斷出所述短信數(shù)據(jù)為特定商戶用戶發(fā)送的行業(yè)短信,若不能從所述特定商戶接入號列表中查詢出所述發(fā)送號碼,則判斷出所述短信數(shù)據(jù)不為特定商戶用戶發(fā)送的行業(yè)短信。

可選地,所述查詢所述特定商戶接入號列表中是否存在所述發(fā)送號碼的步驟之前還包括:

判斷所述發(fā)送號碼是否為手機號;

若判斷出所述發(fā)送號碼不為手機號,則執(zhí)行所述查詢所述特定商戶接入號列表中是否存在所述發(fā)送號碼的步驟。

可選地,所述根據(jù)預(yù)先設(shè)置的特定商戶接入號列表和所述發(fā)送號碼判斷所述短信數(shù)據(jù)是否為特定商戶用戶發(fā)送的行業(yè)短信的步驟之前還包括:

從行業(yè)網(wǎng)關(guān)中同步所述特定商戶接入號列表。

可選地,所述將所述短信屬性信息、提取出的所述關(guān)鍵詞和所述數(shù)值數(shù)據(jù)按照預(yù)設(shè)格式生成記錄文件的步驟之后還包括:

將接收到的所述短信數(shù)據(jù)丟棄。

為實現(xiàn)上述目的,本發(fā)明還提供了一種基于短信的數(shù)據(jù)采集系統(tǒng),包括:

短信接口模塊,用于接收安全匯聚網(wǎng)關(guān)發(fā)送的短信數(shù)據(jù),所述短信數(shù)據(jù)包括:短信屬性信息和短信文本;

短信判斷模塊,用于根據(jù)預(yù)先設(shè)置的模版庫判斷所述短信數(shù)據(jù)是否為特定商戶用戶發(fā)送的預(yù)設(shè)類型的行業(yè)短信,所述模版庫中存儲有各特定商戶用戶所發(fā)送的所述預(yù)設(shè)類型的行業(yè)短信的模版,所述模版包括所述預(yù)設(shè)類型的行業(yè)短信的關(guān)鍵詞;

數(shù)據(jù)提取模塊,用于若所述短信判斷模塊判斷出所述短信數(shù)據(jù)是所述特定商戶用戶發(fā)送的預(yù)設(shè)類型的行業(yè)短信時,則根據(jù)所述短信數(shù)據(jù)對應(yīng)的模版提取所述短信文本中的關(guān)鍵詞和位于部分關(guān)鍵詞之后的數(shù)值數(shù)據(jù);

記錄生成模塊,用于將所述短信屬性信息、所述數(shù)據(jù)提取模塊提取出的所述關(guān)鍵詞和所述數(shù)值數(shù)據(jù)按照預(yù)設(shè)格式生成記錄文件。

可選地,所述短信屬性信息包括:發(fā)送號碼;

所述短信判斷模塊包括:

行業(yè)短信判斷單元,用于根據(jù)預(yù)先設(shè)置的特定商戶接入號列表和所述發(fā)送號碼判斷所述短信數(shù)據(jù)是否為特定商戶用戶發(fā)送的行業(yè)短信,所述特定商戶接入號列表記載有若干個特定商戶用戶的接入號;

模版調(diào)取單元,用于若所述行業(yè)短信判斷單元判斷出所述短信數(shù)據(jù)為特定商戶用戶發(fā)送的行業(yè)短信時,則確定所述短信數(shù)據(jù)所對應(yīng)的特定商戶用戶,并從所述模版庫中調(diào)取出該特定商戶用戶對應(yīng)的所述預(yù)設(shè)類型的行業(yè)短信的若干個模版;

模版匹配單元,用于將所述短信文本與調(diào)取出的各模版分別進行匹配,其中,若所述短信文本與調(diào)取出的一個模版匹配成功時,則判斷出所述短信數(shù)據(jù)為特定商戶用戶發(fā)送的預(yù)設(shè)類型的行業(yè)短信。

可選地,所述行業(yè)短信判斷單元包括:

號碼查詢子單元,用于查詢所述特定商戶接入號列表中是否存在所述發(fā)送號碼;其中,若能夠從所特定商戶接入號列表中查詢出所述發(fā)送號碼,則識別出所述短信數(shù)據(jù)為特定商戶用戶發(fā)送的行業(yè)短信,若不能從所述特定商戶接入號列表中查詢出所述發(fā)送號碼,則判斷出所述短信數(shù)據(jù)不為特定商戶用戶發(fā)送的行業(yè)短信。

可選地,所述行業(yè)短信判斷單元還包括:

手機號判斷子單元,用于判斷所述發(fā)送號碼是否為手機號;

所述號碼查詢子單元用于若所述手機號判斷子單元判斷出所述發(fā)送號碼不為手機號時,查詢所述特定商戶接入號列表中是否存在所述發(fā)送號碼。

可選地,還包括:商戶接入號信息管理模塊,用于從行業(yè)網(wǎng)關(guān)中同步所述特定商戶接入號列表。

本發(fā)明具有以下有益效果:

本發(fā)明提供了一種基于短信的數(shù)據(jù)采集方法和數(shù)據(jù)采集系統(tǒng),其中,該數(shù)據(jù)采集方法包括:接收安全匯聚網(wǎng)關(guān)發(fā)送的短信數(shù)據(jù);根據(jù)預(yù)先設(shè)置的模版庫判斷短信數(shù)據(jù)是否為特定商戶用戶發(fā)送的預(yù)設(shè)類型的行業(yè)短信;若判斷出短信數(shù)據(jù)是特定商戶用戶發(fā)送的預(yù)設(shè)類型的行業(yè)短信時,則根據(jù)短信數(shù)據(jù)對應(yīng)的模版提取短信文本中的關(guān)鍵詞和位于部分關(guān)鍵詞之后的數(shù)值數(shù)據(jù);將短信屬性信息、提取出的關(guān)鍵詞和數(shù)值數(shù)據(jù)按照預(yù)設(shè)格式生成記錄文件。本發(fā)明的技術(shù)方案可在不影響現(xiàn)有的短信業(yè)務(wù)的前提下,實現(xiàn)對部分短信中的有價值數(shù)據(jù)進行提取。

附圖說明

圖1為本發(fā)明實施例一提供的一種基于短信的數(shù)據(jù)采集方法的流程圖;

圖2為本發(fā)明實施例二提供的一種基于短信的數(shù)據(jù)采集方法的流程圖;

圖3為本發(fā)明實施例三提供的一種數(shù)據(jù)采集系統(tǒng)的結(jié)構(gòu)示意圖。

具體實施方式

為使本領(lǐng)域的技術(shù)人員更好地理解本發(fā)明的技術(shù)方案,下面結(jié)合附圖對本發(fā)明提供的一種基于短信的數(shù)據(jù)采集方法和數(shù)據(jù)采集系統(tǒng)進行詳細描述。

在現(xiàn)有的短信業(yè)務(wù)通信中,普通用戶通過手機號來發(fā)送普通短信,商戶用戶通過接入號來發(fā)送行業(yè)短信。具體地,普通用戶和商戶用戶均通過短信聯(lián)網(wǎng)接口協(xié)議(Short Message Gateway Interface Protocol,簡稱SGIP)將短信發(fā)送給短信中心,短信中心將短信數(shù)據(jù)發(fā)送給安全匯聚網(wǎng)關(guān),安全匯聚網(wǎng)關(guān)將短信數(shù)據(jù)同時發(fā)送給業(yè)務(wù)邏輯系統(tǒng)和垃圾短信系統(tǒng),業(yè)務(wù)邏輯系統(tǒng)根據(jù)其業(yè)務(wù)邏輯返回短息中心是否可以下發(fā),垃圾短信系統(tǒng)對短信內(nèi)容進行關(guān)鍵字或者語義分析,返回給短信中心是否可以下發(fā)。當業(yè)務(wù)邏輯系統(tǒng)和垃圾短信系統(tǒng)都返回可以下發(fā)指令后,短信中心通過信令網(wǎng),將短信發(fā)給終端。

本發(fā)明的技術(shù)方案可在不影響現(xiàn)有的短信業(yè)務(wù)的前提下,實現(xiàn)對部分短信(特定商戶用戶所發(fā)送的預(yù)設(shè)類型的行業(yè)短信)中的有價值數(shù)據(jù)進行提取。此外,該數(shù)據(jù)采集方法也沒有違背電信運營商不允許對用戶的短信進行保存的相關(guān)規(guī)定。

需要說明的是,本發(fā)明中的“特定商戶用戶”是指根據(jù)實際需求預(yù)先確定的一些商戶用戶,這些特定商戶用戶通過統(tǒng)一的行業(yè)網(wǎng)關(guān)進行數(shù)據(jù)通信。相應(yīng)地,行業(yè)網(wǎng)關(guān)中存在記載有這些特定商戶用戶的接入號的特定商戶接入號列表。

此外,對于電信運營商而言,特定商戶用戶所發(fā)送的所有行業(yè)短信并非都包含有價值數(shù)據(jù)(例如:推送廣告的行業(yè)短信),因此需要前提確定一些具有價值數(shù)據(jù)的行業(yè)短信的類型(例如:消費類型的行業(yè)短信、注冊類型的行業(yè)短信),這些具有價值數(shù)據(jù)的行業(yè)短信一般具備相應(yīng)的格式、關(guān)鍵詞。

本發(fā)明中的“預(yù)設(shè)類型的行業(yè)短信”具體是指具備某些特定格式、關(guān)鍵詞的行業(yè)短信,其可根據(jù)實際需求進行相應(yīng)的設(shè)定。在本發(fā)明中,可以通過前期對這些預(yù)設(shè)類型的行業(yè)短信進行采集歸類,以生成各不同預(yù)設(shè)類型的行業(yè)短信分別對應(yīng)的模版,并形成模版庫,其中各模版均包含對應(yīng)的行業(yè)短信中的若干個關(guān)鍵詞,該關(guān)鍵詞可以選自對應(yīng)的行業(yè)短信中所包含的特定商戶用戶的名稱、類型、行為動詞等。其中,對于各模版中關(guān)鍵詞的選取,可以根據(jù)需要進行相應(yīng)的設(shè)定。

例如,針對招商銀行發(fā)送給用戶的轉(zhuǎn)賬、收款、支出、取現(xiàn)的行業(yè)短信的模板可分別設(shè)置為:

{陸金所,P2P,投資};

針對Uber發(fā)送給用戶的注冊、爽約責任、支付的行業(yè)短信的模板可分別設(shè)置為:

{Uber,打車,注冊};

{Uber,打車,爽約責任};

{Uber,打車,支付};

針對交通銀行發(fā)送給用戶的信用卡消費的行業(yè)短信的模板可以設(shè)置為:

{交通銀行,信用卡,消費};

在本發(fā)明中,對于同一特定商戶用戶其所對應(yīng)的預(yù)設(shè)類型的行業(yè)短信的模版可以為1個或多個,各模版所包含關(guān)鍵詞的數(shù)量也不作限定。

需要說明的是,上述設(shè)置的各模版僅起到示例性作用,其不會對本發(fā)明的技術(shù)方案產(chǎn)生限制。本領(lǐng)域技術(shù)人員應(yīng)該知曉的是,在實際應(yīng)用中,可以根據(jù)實際需要來設(shè)置各特定商戶用戶的預(yù)設(shè)類型的行業(yè)短信的模版。

實施例一

圖1為本發(fā)明實施例一提供的一種基于短信的數(shù)據(jù)采集方法的流程圖,如圖1所示,該數(shù)據(jù)采集方法基于相應(yīng)的數(shù)據(jù)采集系統(tǒng),該數(shù)據(jù)采集系統(tǒng)與現(xiàn)行的短信業(yè)務(wù)網(wǎng)絡(luò)中的安全匯聚網(wǎng)關(guān)和行業(yè)網(wǎng)關(guān)均連接,該數(shù)據(jù)采集方法包括:

步驟101、接收安全匯聚網(wǎng)關(guān)發(fā)送的短信數(shù)據(jù)。

在本實施例中,安全匯聚網(wǎng)關(guān)在向業(yè)務(wù)邏輯系統(tǒng)和垃圾短信系統(tǒng)轉(zhuǎn)發(fā)送短信數(shù)據(jù)的同時,還將同樣的短信數(shù)據(jù)轉(zhuǎn)發(fā)給了本發(fā)明中的數(shù)據(jù)采集系統(tǒng),其中短信數(shù)據(jù)包括:短信屬性信息和短信文本。由于該數(shù)據(jù)采集系統(tǒng)與現(xiàn)行的向業(yè)務(wù)邏輯系統(tǒng)和垃圾短信系統(tǒng)為并列關(guān)系,因而不會影響現(xiàn)有的短信業(yè)務(wù)。

其中,短信屬性信息是指描述短信文本相應(yīng)屬性的信息,其一般記載有短信的發(fā)送號碼、接收號碼、發(fā)送時間等相關(guān)信息。

需要說明的是,由于安全匯聚網(wǎng)關(guān)會將所有的短信數(shù)據(jù)都進行轉(zhuǎn)發(fā),因此數(shù)據(jù)采集系統(tǒng)會接收到短信業(yè)務(wù)網(wǎng)絡(luò)中的所有短信數(shù)據(jù),這些短信數(shù)據(jù)可被大致可分為三類:非行業(yè)短信、一般商戶用戶發(fā)送的行業(yè)短信和特定商戶用戶發(fā)送的行業(yè)短信,其中,特定商戶用戶發(fā)送的行業(yè)短信包括:預(yù)設(shè)類型的行業(yè)短信和非預(yù)設(shè)類型的行業(yè)短信。而本發(fā)明中,僅對特定商戶用戶發(fā)送的預(yù)設(shè)類型的行業(yè)短信進行數(shù)據(jù)采集。

步驟102、根據(jù)預(yù)先設(shè)置的模版庫判斷短信數(shù)據(jù)是否為特定商戶用戶發(fā)送的預(yù)設(shè)類型的行業(yè)短信。

其中,模版庫中存儲有各特定商戶用戶所發(fā)送的各預(yù)設(shè)類型的行業(yè)短信的模版,各模版均包括對應(yīng)的行業(yè)短信中的若干個關(guān)鍵詞。

當數(shù)據(jù)采集系統(tǒng)接收到短信業(yè)務(wù)網(wǎng)絡(luò)轉(zhuǎn)發(fā)的一條短信數(shù)據(jù)后,會根據(jù)預(yù)先設(shè)置的模版庫來判斷其所接收到的短信數(shù)據(jù)是否為特定商戶用戶發(fā)送的預(yù)設(shè)類型的行業(yè)短信。具體地,可將接收到的短信數(shù)據(jù)的短信文本與模版庫中的各模版進行逐一匹配(進行關(guān)鍵詞匹配),若能成功匹配到某一模版,則可以判斷出該短信數(shù)據(jù)為特定商戶用戶所發(fā)送的預(yù)設(shè)類型的行業(yè)短信,此時執(zhí)行下述步驟103;若該短信數(shù)據(jù)中的短信文本與模版庫中的各模版均不匹配,則判斷出該短信數(shù)據(jù)不為特定商戶用戶所發(fā)送的預(yù)設(shè)類型的行業(yè)短信,此時執(zhí)行下述步驟105。

步驟103、根據(jù)短信數(shù)據(jù)對應(yīng)的模版提取短信文本中的關(guān)鍵詞和位于部分關(guān)鍵詞之后的數(shù)值數(shù)據(jù)。

在步驟103中,通過上述步驟102所確認的短信數(shù)據(jù)對應(yīng)的模版,提取短信文本中的關(guān)鍵詞和位于部分關(guān)鍵詞之后的數(shù)值數(shù)據(jù)。在實際應(yīng)用中,一些關(guān)鍵詞后面一般不會存在數(shù)值數(shù)據(jù),例如:“陸金所”“Uber”“銀行”“信用卡”等;而另一些關(guān)鍵詞后面則會存在數(shù)值數(shù)據(jù),例如:“投資”“支出”“余額”等,這些關(guān)鍵詞的后面會帶有相應(yīng)的數(shù)值數(shù)據(jù),而這些數(shù)值數(shù)據(jù)具有較大的價值。

步驟104、將短信屬性信息、提取出的關(guān)鍵詞和數(shù)值數(shù)據(jù)按照預(yù)設(shè)格式生成記錄文件。

將步驟101中獲取到的短信屬性信息,以及步驟103中提取出的各關(guān)鍵詞和位于部分關(guān)鍵詞之后的數(shù)值數(shù)據(jù),按照預(yù)設(shè)格式產(chǎn)生記錄文件,以供大數(shù)據(jù)平臺進行采集。

在本實施例中,以步驟101中的短信屬性信息包括:發(fā)送號碼、接收號碼、發(fā)送時間,步驟102中所確認的短信數(shù)據(jù)對應(yīng)的模版為:

{陸金所,p2p,投資}

為例,則通過步驟104進行數(shù)據(jù)提取后生成的記錄文件的格式可以為:

{發(fā)送號碼,接收號碼,發(fā)送時間,陸金所,P2P,投資,金額}

當然,在本實施例中,也可以針對各商戶行為類型為其對應(yīng)的數(shù)值數(shù)據(jù)(金額)配置額度等級,并在記錄文件中進行體現(xiàn)。

例如,針對陸金所的用戶的“投資”行為,數(shù)值數(shù)據(jù)在0~500000之間的值對應(yīng)額度等級“0”,數(shù)值數(shù)據(jù)在500001~1000000之間的值對應(yīng)額度等級“1”……依次類推,此時,生成的記錄文件的格式可以為:

{發(fā)送號碼,接收號碼,發(fā)送時間,陸金所,P2P,投資,額度等級}

針對交通銀行信用卡用戶的“消費”行為,

也可以預(yù)先為數(shù)值數(shù)據(jù)(金額)配置對應(yīng)的額度等級,數(shù)值數(shù)據(jù)在0~2000之內(nèi)的對應(yīng)額度等級“a”,數(shù)值在2001~5000之見的對應(yīng)額度等級“b”……此時,生成的記錄文件的格式可以為:

{發(fā)送號碼,接收號碼,發(fā)送時間,交通銀行,信用卡,金額,額度等級}

需要說明的是,上述所示的記錄文件的格式僅起到示例性作用,其不會對本發(fā)明的技術(shù)方案產(chǎn)生限制。本領(lǐng)域技術(shù)人員應(yīng)該知曉的是,在實際應(yīng)用中,可以根據(jù)實際需要來設(shè)置生成的記錄文件的格式。

此外,本實施例中也可以根據(jù)實際需要有選擇性的將記錄文件中的部分短信屬性信息剔除,以優(yōu)化記錄文件。

步驟105、將接收到的短信數(shù)據(jù)丟棄。

在本實施例中,無論短信數(shù)據(jù)是否有被進行數(shù)據(jù)提取,其最終均會被數(shù)據(jù)采集系統(tǒng)丟棄,即數(shù)據(jù)采集系統(tǒng)中沒有對短信數(shù)據(jù)進行保存。

本發(fā)明實施例一提供了一種基于短信的數(shù)據(jù)采集方法,可在不影響現(xiàn)有的短信業(yè)務(wù)的前提下,實現(xiàn)對部分短信中的有價值數(shù)據(jù)進行實時分析。

實施例二

圖2為本發(fā)明實施例二提供的一種基于短信的數(shù)據(jù)采集方法的流程圖,如圖2所示,該數(shù)據(jù)采集方法基于相應(yīng)的數(shù)據(jù)采集系統(tǒng),該數(shù)據(jù)采集系統(tǒng)與現(xiàn)行的短信業(yè)務(wù)網(wǎng)絡(luò)中的安全匯聚網(wǎng)關(guān)和行業(yè)網(wǎng)關(guān)均連接,該數(shù)據(jù)采集方法包括:

步驟100、從行業(yè)網(wǎng)關(guān)中同步特定商戶接入號列表。

行業(yè)網(wǎng)關(guān)中存在記載有這些特定商戶用戶的接入號的特定商戶接入號列表,數(shù)據(jù)采集系統(tǒng)可向該行業(yè)網(wǎng)關(guān)同步該特定商戶接入號列表。

步驟101、接收安全匯聚網(wǎng)關(guān)發(fā)送的短信數(shù)據(jù)。

其中,短信數(shù)據(jù)包括:短信屬性信息和短信文本,短信屬性信息包括:發(fā)送號碼、接收號碼和發(fā)送時間。

需要說明的是,本實施例中步驟100和步驟101的執(zhí)行順序在本發(fā)明中不作限制,即步驟100可先于步驟101執(zhí)行,或后于步驟101執(zhí)行,或與步驟101同時執(zhí)行。

步驟102a、根據(jù)特定商戶接入號列表和發(fā)送號碼判斷短信數(shù)據(jù)是否為特定商戶用戶發(fā)送的行業(yè)短信。

可選地,步驟102a包括:

步驟102aa、判斷發(fā)送號碼是否為手機號;

通過判斷短信數(shù)據(jù)中的發(fā)送號碼是否滿足手機號碼的格式,可判斷該發(fā)送號碼是否為手機號。若滿足手機號碼的格式,則可以判斷出該發(fā)送號碼為手機號,相應(yīng)地,該短信數(shù)據(jù)不是特定商戶用戶所發(fā)送的預(yù)設(shè)類型的行業(yè)短信,此時執(zhí)行步驟105;若不滿滿足手機號碼的格式,則可以判斷出該發(fā)送號碼不為手機號(即為商戶用戶的接入號),此時執(zhí)行步驟102ab。

步驟102ab、查詢特定商戶接入號列表中是否存在該短信數(shù)據(jù)中的發(fā)送號碼。

在步驟102ab中,若能夠從所特定商戶接入號列表中查詢出發(fā)送號碼,則判斷出短信數(shù)據(jù)為特定商戶用戶發(fā)送的行業(yè)短信,若不能從特定商戶接入號列表中查詢出發(fā)送號碼,則判斷出該短信數(shù)據(jù)不為特定商戶用戶發(fā)送的行業(yè)短信。

需要說明的是,本實施例中當步驟102a中僅包括步驟102ab時,也能實現(xiàn)對短信數(shù)據(jù)是否為特定商戶用戶發(fā)送的行業(yè)短信的判斷,上述步驟102a中包括步驟102aa和步驟102ab的情況為本發(fā)明中的優(yōu)選情況。在實際應(yīng)用中,數(shù)據(jù)采集系統(tǒng)會不斷的接收到安全匯聚網(wǎng)關(guān)發(fā)送的短信數(shù)據(jù),若針對每個短信數(shù)據(jù)中的接入號均進行一次查表(即步驟102ab),由于查表過程需要占用較多的運算資源,則會導(dǎo)致數(shù)據(jù)采集系統(tǒng)的運算負載較大,而本實施例中,通過步驟102aa可以很快的將普通用戶發(fā)送的短信識別出來,并直接丟棄,即不再進行后續(xù)的查表工作,從而可有效降低數(shù)據(jù)采集系統(tǒng)的運算負載。

在步驟102a中,若判斷出短信數(shù)據(jù)為特定商戶用戶發(fā)送的行業(yè)短信時,則執(zhí)行下述步驟102b;若判斷出短信數(shù)據(jù)為特定商戶用戶發(fā)送的行業(yè)短信時,則執(zhí)行下述步驟105。

步驟102b、從模版庫中調(diào)取出該特定商戶用戶對應(yīng)的預(yù)設(shè)類型的行業(yè)短信的若干個模版。

通過在步驟102中確定短信數(shù)據(jù)所對應(yīng)的特定商戶用戶,從模板庫中調(diào)取出該特定商戶用戶對應(yīng)的預(yù)設(shè)類型的行業(yè)短信的若干個模版。

步驟102c、將短信文本與調(diào)取出的各模版分別進行匹配。

與上述實施例一中直接將短信文本與模版庫中的各模版進行逐一匹配的技術(shù)手段相比,本實施例中通過步驟102a和步驟102b先對模版進行提起,然后再通過步驟102c進行匹配,可以有效的減少短信文本的模版匹配次數(shù),從而有效降低數(shù)據(jù)采集系統(tǒng)的運算負載。

在步驟102中,若短信文本與調(diào)取出的一個模版匹配成功時,則判斷出該短信數(shù)據(jù)為特定商戶用戶發(fā)送的預(yù)設(shè)類型的行業(yè)短信,此時執(zhí)行下述步驟103;否則判斷出該短信數(shù)據(jù)不為特定商戶用戶發(fā)送的預(yù)設(shè)類型的行業(yè)短信,此時執(zhí)行下述步驟105。

步驟103、根據(jù)短信數(shù)據(jù)對應(yīng)的模版提取短信文本中的關(guān)鍵詞和位于部分關(guān)鍵詞之后的數(shù)值數(shù)據(jù);

步驟104、將短信屬性信息、提取出的關(guān)鍵詞和數(shù)值數(shù)據(jù)按照預(yù)設(shè)格式生成記錄文件。

步驟105、將接收到的短信數(shù)據(jù)丟棄。

對于本實施例中步驟103~步驟105的具體描述,可參加上述實施例一中相應(yīng)內(nèi)容,此處不再贅述。

本發(fā)明實施例二提供了一種基于短信的數(shù)據(jù)采集方法,可在不影響現(xiàn)有的短信業(yè)務(wù)的前提下,實現(xiàn)對部分短信中的有價值數(shù)據(jù)進行提取,此外,該數(shù)據(jù)采集方法也沒有違背電信運營商不允許對用戶的短信進行保存的相關(guān)規(guī)定。

實施例三

圖3為本發(fā)明實施例三提供的一種數(shù)據(jù)采集系統(tǒng)的結(jié)構(gòu)示意圖,如圖3所示,該數(shù)據(jù)采集系統(tǒng)與現(xiàn)行的短信業(yè)務(wù)網(wǎng)絡(luò)中的安全匯聚網(wǎng)關(guān)和行業(yè)網(wǎng)關(guān)均連接,該數(shù)據(jù)采集系統(tǒng)包括:短信接口模塊1、短信判斷模塊2、數(shù)據(jù)提取模塊3和記錄生成模塊4。

其中,短信接口模塊1用于接收安全匯聚網(wǎng)關(guān)發(fā)送的短信數(shù)據(jù),短信數(shù)據(jù)包括:短信屬性信息和短信文本。短信屬性信息是指描述短信文本相應(yīng)屬性的信息,具體可包括:短信的發(fā)送號碼、接收號碼、發(fā)送時間等相關(guān)信息。

短信判斷模塊2用于根據(jù)預(yù)先設(shè)置的模版庫判斷短信數(shù)據(jù)是否為特定商戶用戶發(fā)送的預(yù)設(shè)類型的行業(yè)短信,模版庫中存儲有各特定商戶用戶所發(fā)送的預(yù)設(shè)類型的行業(yè)短信的模版,模版包括預(yù)設(shè)類型的行業(yè)短信的關(guān)鍵詞。

數(shù)據(jù)提取模塊3用于若短信判斷模塊2判斷出短信數(shù)據(jù)是特定商戶用戶發(fā)送的預(yù)設(shè)類型的行業(yè)短信時,則根據(jù)短信數(shù)據(jù)對應(yīng)的模版提取短信文本中的關(guān)鍵詞和位于部分關(guān)鍵詞之后的數(shù)值數(shù)據(jù)。

記錄生成模塊4用于將短信屬性信息、數(shù)據(jù)提取模塊提取出的關(guān)鍵詞和數(shù)值數(shù)據(jù)按照預(yù)設(shè)格式生成記錄文件。

需要說明的是,本實施例中的短信接口模塊1用于執(zhí)行上述實施例一中的步驟101,短信判斷模塊2用于執(zhí)行上述實施例一中的步驟102,數(shù)據(jù)提取模塊3用于執(zhí)行上述實施例一中的步驟103,記錄生成模塊4用于執(zhí)行上述實施例一中的步驟104,對于各模塊的具體工作過程可參見前述實施例一中相應(yīng)內(nèi)容,此處不再贅述。

本實施例提供的數(shù)據(jù)采集系統(tǒng)可在不影響現(xiàn)有的短信業(yè)務(wù)的前提下,實現(xiàn)對部分短信中的有價值數(shù)據(jù)進行提取。

可選地,短信屬性信息包括:發(fā)送號碼,該數(shù)據(jù)采集系統(tǒng)還包括:商戶接入號信息管理模塊6,商戶接入號信息管理模塊6用于從行業(yè)網(wǎng)關(guān)中同步特定商戶接入號列表。其中,該商戶接入號信息管理模塊6用于執(zhí)行上述實施例二中的步驟100,具體描述可參見上述實施例二中相應(yīng)內(nèi)容,此處不再贅述。

可選地,該數(shù)據(jù)采集系統(tǒng)還包括:數(shù)據(jù)處理模塊5,該數(shù)據(jù)處理模塊5用于在短信判斷模塊2判斷出短信數(shù)據(jù)不是特定商戶用戶發(fā)送的預(yù)設(shè)類型的行業(yè)短信時,以及在記錄生成模塊4生成記錄文件之后,將接收到的短信數(shù)據(jù)丟棄。其中,該數(shù)據(jù)處理模塊5用于執(zhí)行上述實施例一中的步驟105,具體描述可參見上述實施例一中相應(yīng)內(nèi)容,此處不再贅述。

在本實施例中,由于數(shù)據(jù)采集系統(tǒng)所接收各短信數(shù)據(jù)均會被丟棄,即數(shù)據(jù)采集系統(tǒng)中沒有對短信數(shù)據(jù)進行保存,因而沒有違背工信部所要求的電信運營商不允許對用戶的短信進行保存的相關(guān)規(guī)定。

可選地,短信判斷模塊包括:行業(yè)短信判斷單元21、模版調(diào)取單元22和模版匹配單元23。

其中,行業(yè)短信判斷單元21用于根據(jù)預(yù)先設(shè)置的特定商戶接入號列表和發(fā)送號碼判斷短信數(shù)據(jù)是否為特定商戶用戶發(fā)送的行業(yè)短信,特定商戶接入號列表記載有若干個特定商戶用戶的接入號;

模版調(diào)取單元22用于若行業(yè)短信判斷單元21判斷出短信數(shù)據(jù)為特定商戶用戶發(fā)送的行業(yè)短信時,則確定短信數(shù)據(jù)所對應(yīng)的特定商戶用戶,并從模版庫中調(diào)取出該特定商戶用戶對應(yīng)的預(yù)設(shè)類型的行業(yè)短信的若干個模版;

模版匹配單元23用于將短信文本與調(diào)取出的各模版分別進行匹配,其中,若短信文本與調(diào)取出的一個模版匹配成功時,則判斷出短信數(shù)據(jù)為特定商戶用戶發(fā)送的預(yù)設(shè)類型的行業(yè)短信,否則判斷出短信數(shù)據(jù)為不為特定商戶用戶發(fā)送的預(yù)設(shè)類型的行業(yè)短信。

進一步可選地,該行業(yè)短信判斷單元21包括:手機號判斷子單元21a和號碼查詢子單元21b。

其中,手機號判斷子單元21a用于判斷發(fā)送號碼是否為手機號。若手機號判斷子單元判斷出發(fā)送號碼為手機號時,數(shù)據(jù)處理模塊5將該發(fā)送號碼對應(yīng)的短信數(shù)據(jù)丟棄。

號碼查詢子單元21b用于若手機號判斷子單元21a判斷出發(fā)送號碼不為手機號時,查詢特定商戶接入號列表中是否存在發(fā)送號碼;其中,若能夠從所特定商戶接入號列表中查詢出發(fā)送號碼,則判斷出短信數(shù)據(jù)為特定商戶用戶發(fā)送的行業(yè)短信,若不能從特定商戶接入號列表中查詢出發(fā)送號碼,則判斷出短信數(shù)據(jù)不為特定商戶用戶發(fā)送的行業(yè)短信。

需要說明的是,本實施例中的行業(yè)短信判斷單元21用于執(zhí)行上述實施例二中的步驟102a,手機號判斷子單元21a用于執(zhí)行上述實施例二中的步驟102aa,號碼查詢子單元21b用于執(zhí)行上述實施例二中的步驟102ab,模版調(diào)取單元22用于執(zhí)行上述實施例二中的步驟102b,模版匹配單元23用于執(zhí)行上述實施例二中的步驟102c,對于各單元的具體工作過程可參見前述實施例二中相應(yīng)內(nèi)容,此處不再贅述。

本發(fā)明實施例三提供了一種基于短信的數(shù)據(jù)采集系統(tǒng),可在不影響現(xiàn)有的短信業(yè)務(wù)的前提下,實現(xiàn)對部分短信中的有價值數(shù)據(jù)進行提取,此外,該數(shù)據(jù)采集系統(tǒng)也沒有違背電信運營商不允許對用戶的短信進行保存的相關(guān)規(guī)定。

可以理解的是,以上實施方式僅僅是為了說明本發(fā)明的原理而采用的示例性實施方式,然而本發(fā)明并不局限于此。對于本領(lǐng)域內(nèi)的普通技術(shù)人員而言,在不脫離本發(fā)明的精神和實質(zhì)的情況下,可以做出各種變型和改進,這些變型和改進也視為本發(fā)明的保護范圍。

當前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
梁河县| 静安区| 玉山县| 界首市| 揭阳市| 河津市| 旌德县| 张家川| 六枝特区| 名山县| 洛隆县| 诸暨市| 尚志市| 秭归县| 阳曲县| 方城县| 眉山市| 阜新市| 贺州市| 友谊县| 石城县| 西青区| 浦城县| 潼关县| 广西| 灌云县| 赣州市| 永和县| 大埔区| 金塔县| 同心县| 榆中县| 昭苏县| 乡宁县| 玛曲县| 察隅县| 温宿县| 双峰县| 田林县| 开原市| 萨嘎县|