本發(fā)明涉及金融領(lǐng)域,尤其涉及一種交易信息處理的方法及裝置。
背景技術(shù):
隨著銀行服務(wù)意識的提升,當(dāng)用戶發(fā)生交易行為時,都會給用戶及時推送交易信息,具體可以通過傳統(tǒng)的短信渠道發(fā)送到用戶手機上去,也可以通過手機app(application,應(yīng)用程序)推送消息,或通過第三方應(yīng)用平臺站內(nèi)消息的方式進行推送。而交易消息中蘊含著巨大的價值,一條交易信息中包含本次交易的時間、卡號、行為、目的、金額等信息。而銀行為了推送自己的其它增值服務(wù),一般會在交易信息中出現(xiàn)廣告等信息,從而影響交易信息的準確提取。因此,需要對用戶手機中的交易短信和推送通知進行分析,從中提取關(guān)鍵信息,并進行合理分類,幫助用戶統(tǒng)計當(dāng)月消費趨勢及提供相應(yīng)的消費建議,以滿足用戶的需求。
目前,對金融交易信息的處理方法為:首先對各個銀行的交易信息結(jié)構(gòu)進行規(guī)則總結(jié),定義數(shù)據(jù)項對應(yīng)的關(guān)鍵詞,得到各個銀行的交易信息模板;然后利用正則表達式結(jié)構(gòu)化所需交易數(shù)據(jù)項,提取交易數(shù)據(jù)項信息。現(xiàn)有方法主要存在以下問題:
(1)每個銀行的交易信息模板不盡相同,交易數(shù)據(jù)項在信息中出現(xiàn)的位置會經(jīng)常發(fā)生變化,因此需要大量的人工維護,而且當(dāng)交易信息結(jié)構(gòu)發(fā)生變化而未及時修改模板時,會導(dǎo)致交易信息解析不準確;
(2)銀行為了給用戶提供更好的服務(wù),通常會在交易信息中增加廣告或者針對該用戶的提醒通知,這類內(nèi)容中通常會包含與交易相關(guān)的關(guān)鍵字,但是又不屬于用戶交易信息,從而影響了提取數(shù)據(jù)項的準確性。
綜上所述,現(xiàn)有的交易信息直接通過匹配銀行交易信息模板的方式進行處理,存在交易信息解析不準確的問題,導(dǎo)致用戶需求匹配度較低。
技術(shù)實現(xiàn)要素:
本發(fā)明提供一種交易信息處理的方法及裝置,用以解決現(xiàn)有技術(shù)中交易信息直接通過匹配銀行交易信息模板的方式進行處理,存在的交易信息解析不準確的問題。
本發(fā)明實施例提供一種交易信息處理的方法,包括:
從終端接收的推送信息中確定交易信息;
根據(jù)第一數(shù)據(jù)庫,從所述交易信息中確定出標準交易信息,所述第一數(shù)據(jù)庫中存儲有非標準類關(guān)鍵詞;
針對每個標準交易信息,根據(jù)預(yù)設(shè)的結(jié)束標識,確定所述標準交易信息中待提取部分;根據(jù)第二數(shù)據(jù)庫,從所述待提取部分提取所述標準交易信息的各交易數(shù)據(jù)項,所述第二數(shù)據(jù)庫中存儲有各交易數(shù)據(jù)項分別對應(yīng)的關(guān)鍵詞。
進一步地,所述從終端接收的推送信息中確定交易信息,包括:
針對每個推送信息,獲取所述推送信息從首字符開始的預(yù)設(shè)數(shù)量的字符串,將所述字符串與第三數(shù)據(jù)庫匹配,所述第三數(shù)據(jù)庫中存儲有交易信息對應(yīng)的關(guān)鍵詞;
將匹配成功的所述字符串對應(yīng)的推送信息作為交易信息。
進一步地,所述根據(jù)第二數(shù)據(jù)庫,從所述待提取部分提取所述標準交易信息的各交易數(shù)據(jù)項,包括:
對所述待提取部分進行分詞;
根據(jù)所述第二數(shù)據(jù)庫中關(guān)鍵詞,確定各分詞對應(yīng)的交易數(shù)據(jù)項。
進一步地,所述交易數(shù)據(jù)項至少包括交易行為、交易金額;
所述根據(jù)所述第二數(shù)據(jù)庫中關(guān)鍵詞,確定各分詞對應(yīng)的交易數(shù)據(jù)項,包括:
確定所述待提取部分的交易數(shù)據(jù)項為交易金額的分詞;
將距離所述交易金額的分詞最近的交易行為對應(yīng)的分詞確定為所述標準交易信息的交易行為。
進一步地,所述交易數(shù)據(jù)項還包括交易賬號、交易時間;
所述將距離所述交易金額的分詞最近的交易行為確定為所述標準交易信息的交易行為,包括:
分別確定所述交易賬號對應(yīng)的分詞、所述交易時間對應(yīng)的分詞、所述交易金額對應(yīng)的分詞;
從所述交易賬號對應(yīng)的分詞或所述交易時間對應(yīng)的分詞與所述交易金額對應(yīng)的分詞之間的分詞中確定是否存在交易行為對應(yīng)的分詞,若存在則將距離所述交易金額的分詞最近的交易行為對應(yīng)的分詞作為所述標準交易信息的交易行為。
進一步地,所述交易數(shù)據(jù)項還包括交易目的,所述將距離所述交易金額的分詞最近的交易行為對應(yīng)的分詞確定為所述標準交易信息的交易行為之后,還包括:
若存在既屬于交易行為又屬于交易目的的分詞時,則確定所述既屬于交易行為又屬于交易目的的分詞對應(yīng)的交易數(shù)據(jù)項為交易目的。
進一步地,所述第二數(shù)據(jù)庫中存儲有交易行為對應(yīng)的各關(guān)鍵詞的交易方向信息,所述根據(jù)所述第二數(shù)據(jù)庫中關(guān)鍵詞,確定各分詞對應(yīng)的交易數(shù)據(jù)項,包括:
根據(jù)確定的所述待提取部分的交易行為的分詞,在所述第二數(shù)據(jù)庫中提取所述分詞對應(yīng)的關(guān)鍵詞的交易方向;
統(tǒng)計所述終端中具有相同交易方向的標準交易信息,并輸出統(tǒng)計后的結(jié)果。
本發(fā)明實施例還提供一種交易信息處理的裝置,包括:
交易信息確定模塊:用于從終端接收的推送信息中確定交易信息;
標準信息確定模塊:用于根據(jù)第一數(shù)據(jù)庫,從所述交易信息中確定出標準交易信息,所述第一數(shù)據(jù)庫中存儲有非標準類關(guān)鍵詞;
交易數(shù)據(jù)項確定模塊:針對每個標準交易信息,根據(jù)預(yù)設(shè)的結(jié)束標識,確定所述標準交易信息中待提取部分;根據(jù)第二數(shù)據(jù)庫,從所述待提取部分提取所述標準交易信息的各交易數(shù)據(jù)項,所述第二數(shù)據(jù)庫中存儲有各交易數(shù)據(jù)項分別對應(yīng)的關(guān)鍵詞。
進一步地,所述交易信息確定模塊,具體用于:
針對每個推送信息,獲取所述推送信息從首字符開始的預(yù)設(shè)數(shù)量的字符串,將所述字符串與第三數(shù)據(jù)庫匹配,所述第三數(shù)據(jù)庫中存儲有交易信息對應(yīng)的關(guān)鍵詞;
將匹配成功的所述字符串對應(yīng)的推送信息作為交易信息。
進一步地,所述交易數(shù)據(jù)項確定模塊,具體用于:
對所述待提取部分進行分詞;
根據(jù)所述第二數(shù)據(jù)庫中關(guān)鍵詞,確定各分詞對應(yīng)的交易數(shù)據(jù)項。
進一步地,所述交易數(shù)據(jù)項至少包括交易行為、交易金額;
所述交易數(shù)據(jù)項確定模塊,還用于:
確定所述待提取部分的交易數(shù)據(jù)項為交易金額的分詞;
將距離所述交易金額的分詞最近的交易行為對應(yīng)的分詞確定為所述標準交易信息的交易行為。
進一步地,所述交易數(shù)據(jù)項還包括交易賬號、交易時間;
所述交易數(shù)據(jù)項確定模塊,具體用于:
分別確定所述交易賬號對應(yīng)的分詞、所述交易時間對應(yīng)的分詞、所述交易金額對應(yīng)的分詞;
從所述交易賬號對應(yīng)的分詞或所述交易時間對應(yīng)的分詞與所述交易金額對應(yīng)的分詞之間的分詞中確定是否存在交易行為對應(yīng)的分詞,若存在則將距離所述交易金額的分詞最近的交易行為對應(yīng)的分詞作為所述標準交易信息的交易行為。
進一步地,所述交易數(shù)據(jù)項還包括交易目的,所述交易數(shù)據(jù)項確定模塊,還用于:
將距離所述交易金額的分詞最近的交易行為對應(yīng)的分詞確定為所述標準交易信息的交易行為之后,若存在既屬于交易行為又屬于交易目的的分詞時,則確定所述既屬于交易行為又屬于交易目的的分詞對應(yīng)的交易數(shù)據(jù)項為交易目的。
進一步地,所述第二數(shù)據(jù)庫中存儲有交易行為對應(yīng)的各關(guān)鍵詞的交易方向信息,所述交易數(shù)據(jù)項確定模塊,還用于:
根據(jù)確定的所述待提取部分的交易行為的分詞,在所述第二數(shù)據(jù)庫中提取所述分詞對應(yīng)的關(guān)鍵詞的交易方向;
統(tǒng)計所述終端中具有相同交易方向的標準交易信息,并輸出統(tǒng)計后的結(jié)果。
本發(fā)明實施例提供的交易信息處理的方法及裝置,從終端接收的推送信息中確定交易信息;根據(jù)第一數(shù)據(jù)庫,從交易信息中確定出標準交易信息,針對每個標準交易信息,根據(jù)預(yù)設(shè)的結(jié)束標識,確定標準交易信息中待提取部分;根據(jù)第二數(shù)據(jù)庫,從待提取部分提取標準交易信息的各交易數(shù)據(jù)項。本發(fā)明實施例提供的交易信息處理的方法及裝置不需要匹配模板,而是通過數(shù)據(jù)庫篩選的方式得到待提取部分,然后根據(jù)交易數(shù)據(jù)項分別對應(yīng)的關(guān)鍵詞確定待提取部分的各交易數(shù)據(jù)項。由于不需要匹配模板,節(jié)省了大量人工維護成本;此外,通過結(jié)束標識判斷有效交易數(shù)據(jù)的位置,消除了交易信息中的廣告部分的影響,提高了交易信息解析的準確性。
附圖說明
為了更清楚地說明本發(fā)明實施例中的技術(shù)方案,下面將對實施例描述中所需要使用的附圖作簡要介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于本領(lǐng)域的普通技術(shù)人員來講,在不付出創(chuàng)造性勞動性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1為本發(fā)明實施例提供的一種交易信息處理的方法流程示意圖;
圖2為本發(fā)明實施例提供的一種交易信息處理的方法流程圖;
圖3為本發(fā)明實施例提供的一種交易信息處理的裝置結(jié)構(gòu)示意圖。
具體實施方式
為了使本發(fā)明的目的、技術(shù)方案和優(yōu)點更加清楚,下面將結(jié)合附圖對本發(fā)明作進一步地詳細描述,顯然,所描述的實施例僅僅是本發(fā)明一部份實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其它實施例,都屬于本發(fā)明保護的范圍。
本發(fā)明實施例提供一種交易信息處理的方法,應(yīng)用于金融服務(wù)領(lǐng)域,例如,對銀行推送給用戶的消息進行解析。如圖1所示,為本發(fā)明實施例提供的一種交易信息處理的方法流程示意圖,包括:
步驟101:從終端接收的推送信息中確定交易信息;
步驟102:根據(jù)第一數(shù)據(jù)庫,從交易信息中確定出標準交易信息。
其中,第一數(shù)據(jù)庫中存儲有非標準類關(guān)鍵詞;
步驟103:針對每個標準交易信息,根據(jù)預(yù)設(shè)的結(jié)束標識,確定標準交易信息中待提取部分;根據(jù)第二數(shù)據(jù)庫,從待提取部分提取標準交易信息的各交易數(shù)據(jù)項。
其中,第二數(shù)據(jù)庫中存儲有各交易數(shù)據(jù)項分別對應(yīng)的關(guān)鍵詞。
需要說明的是,銀行推送給用戶信息的方式可以為短信形式,也可以為app推送消息形式及第三方應(yīng)用平臺站內(nèi)消息的形式,但是不管采用何種形式,均需預(yù)先通過用戶的授權(quán)許可。
此外,銀行給用戶發(fā)送的短信和推送信息有很多種類型,分別表示不同的應(yīng)用場景。例如,當(dāng)用戶發(fā)送交易時發(fā)送交易提醒信息,當(dāng)用戶需要還款時會發(fā)送提醒還款信息,當(dāng)用戶生日或者銀行促銷活動時會推送相應(yīng)的廣告信息。
一般銀行的交易信息都是為了將本次交易的相關(guān)信息推送給用戶核實,因此語義和結(jié)構(gòu)都很規(guī)范,以便用戶快速理解,銀行的交易信息主要有以下幾類格式:
(1)尾號1234儲蓄卡賬戶09:20通過atm轉(zhuǎn)出290元,余額200元。
(2)您賬戶5678于01月03日21:21發(fā)生網(wǎng)銀快捷支付扣款31元。當(dāng)月交易滿100元送100積分。
(3)貴卡7619于2016年01月12日01:51收到外行匯款,入賬人民幣2000元。
(4)貴卡7619于2016年01月12日01:51匯款人民幣2000元。
(5)貴卡3456于2016年01月12日01:51完成人民幣2000元入賬操作。
(6)電子銀行交易送話費,即日起至1月2日受邀客戶使用個人網(wǎng)銀、手機銀行,進行任意一筆金融交易,前1000名客戶可獲贈10元話費,每位客戶僅可獲贈一次。
(7)溫馨提示,您的尾號為信用卡0310的卡本期賬單截至2月3日欠款2000元,到期還款日2月20日。
(8)尾號6789卡1月4日分期付款提前還款已辦理成功,本期應(yīng)還金額3000元,總計手續(xù)費5元。
因此,首先要把交易信息從終端接收的所有推送信息中提取出來,本發(fā)明實施例中的終端接收到的推送消息不限于通過手機短信的方式,也包括終端應(yīng)用程序app推送方式和第三方應(yīng)用平臺站推送方式等。
具體地,步驟101中,首先針對每個推送信息,獲取該推送信息從首字符開始的預(yù)設(shè)數(shù)量的字符串,然后將該字符串與第三數(shù)據(jù)庫匹配,將匹配成功的字符串對應(yīng)的推送信息作為交易信息。
其中,第三數(shù)據(jù)庫中存儲有交易信息對應(yīng)的關(guān)鍵詞。具體地,根據(jù)對交易信息格式的分析,預(yù)先儲存通用的交易信息的開始字符串作為第三數(shù)據(jù)庫,稱為tradebeginwordlist。例如,“尾號”、“貴卡”、“您賬戶”、“信用卡”等詞語。為了提高提取效率和準確率,預(yù)設(shè)數(shù)量可以根據(jù)第三數(shù)據(jù)庫中的字符串長度設(shè)置為一個定值,如8,或者設(shè)置為從該推送信息開頭第一個字符開始至出現(xiàn)的第一個數(shù)字。例如,針對上述8條推送消息(1)~(8),獲取該從首字符開始的8個的字符串,然后將該字符串與第三數(shù)據(jù)庫匹配,得到(1)、(2)、(3)、(4)、(5)、(8)匹配成功,(6)和(7)匹配失敗,則將(1)、(2)、(3)、(4)、(5)、(8)作為交易信息,排除上述所列舉的非交易信息(6)和(7)。
為了統(tǒng)計用戶銀行卡的金額變動,需要排除與金額變動無關(guān)的非標準類信息。預(yù)先存儲非標準類關(guān)鍵字作為第三數(shù)據(jù)庫,稱為otherwordlist,例如,“已辦理成功”、“受理成功”、“放貸”等。若交易信息出現(xiàn)非標準類關(guān)鍵詞,則將該交易信息排除,如上述推送消息中的(8)。從而得到上述推送消息(1)~(8)中,與用戶銀行卡的金額變動有關(guān)的消息(1)、(2)、(3)、(4)、(5)為標準交易信息。
進一步地,步驟103中,首先針對每個標準交易信息,根據(jù)預(yù)設(shè)的結(jié)束標識,確定標準交易信息中待提取部分。具體地,根據(jù)銀行推送的交易信息的結(jié)構(gòu),廣告類信息一般會用句號標識與用戶的交易信息分隔開,因此可以設(shè)置結(jié)束標志為句號。針對一條標準交易信息,首先確定句號出現(xiàn)的位置,然后提取句號之前的內(nèi)容作為待提取部分,這樣可以有效降低廣告信息的干擾。如推送信息(2)所示,雖然在句號后面的廣告中還會出現(xiàn)金額100元,但由于該部分內(nèi)容已經(jīng)被排除所以并不影響交易特征的提取結(jié)果。
需要說明的是,若標準交易信息出現(xiàn)多次金額,由于通常首次出現(xiàn)的金額為與用戶銀行卡的金額變動有關(guān),則將首次出現(xiàn)的金額及之前的內(nèi)容作為待提取部分,例如推送消息(1),待提取部分為“尾號1234儲蓄卡賬戶09:20通過atm轉(zhuǎn)出290元”。
因此,得到上述推送消息(1)至(5)的待提取部分分別為:“尾號1234儲蓄卡賬戶09:20通過atm轉(zhuǎn)出290元”;“賬戶5678于01月03日21:21發(fā)生網(wǎng)銀快捷支付扣款31元”;“貴卡7619于2016年01月12日01:51收到外行匯款,入賬人民幣2000元。”;“貴卡7619于2016年01月12日01:51匯款人民幣2000元?!?;“貴卡3456于2016年01月12日01:51完成人民幣2000元入賬操作”。
進一步地,步驟103前需預(yù)先存儲各交易數(shù)據(jù)項分別對應(yīng)的關(guān)鍵詞作為第二數(shù)據(jù)庫,交易數(shù)據(jù)項至少包括交易行為、交易金額,此外,根據(jù)交易信息格式的不同,交易數(shù)據(jù)項也可以包括交易賬號、交易時間、交易目的等。
例如,交易時間對應(yīng)的關(guān)鍵詞可以包括:年、月、日、時、分、秒以及標點符號“:”等。交易金額對應(yīng)的關(guān)鍵詞可以包括:元、美元、人民幣、符號“¥”等。交易行為對應(yīng)的關(guān)鍵詞稱為tradeactionwordlist,可以包括如下關(guān)鍵詞:支出、存入、匯款等。交易目的對應(yīng)的關(guān)鍵詞稱為tradepurposewordlist,可以包括如下關(guān)鍵詞:匯款、理財、資金歸集等。
需要說明的是,現(xiàn)有的定義數(shù)據(jù)項對應(yīng)的關(guān)鍵詞方式不夠靈活,如將“還款”定義為交易行為對應(yīng)的關(guān)鍵詞,但是實際上很多時候“還款”是作為本次交易的目的,而交易行為可能是“入賬”(例如:貴卡1111入賬信用卡還款金額1000元),因此,由于現(xiàn)有技術(shù)中直接通過匹配銀行交易信息模板的方式進程處理,因此按照固定的交易數(shù)據(jù)項與關(guān)鍵詞的對應(yīng)格式,會導(dǎo)致交易信息解析不準確。本發(fā)明實施例同一個詞語可以屬于兩個不同的交易數(shù)項,例如,“匯款”既可以作為交易行為,也可以作為交易目的。其中,交易行為中每個詞語會包含自己的方向?qū)傩裕?,支出為出賬方向;存入為入賬方向。
進一步地,步驟103中,提取了標準交易信息的待提取部分之后,首先對待提取部分進行分詞,然后根據(jù)第二數(shù)據(jù)庫中關(guān)鍵詞,確定各分詞對應(yīng)的交易數(shù)據(jù)項。具體地,分別通過豎線對信息(1)至(5)的待提取部分的內(nèi)容進行分詞,得到以下格式:
尾號|1234①|(zhì)儲蓄卡賬戶|09:20②|通過|atm|轉(zhuǎn)出|290元③|
您賬戶|5678①|(zhì)于|01月03日21:21②|發(fā)生|網(wǎng)銀快捷支付|扣款|31元③|
貴卡|7619①|(zhì)于|2016年01月12日01:51②|收到|外行|匯款|,|入賬|人民幣|2000元③|。
貴卡|7619①|(zhì)于|2016年01月12日01:51②|匯款|人民幣|2000元③|。
貴卡|3456①|(zhì)于|2016年01月12日01:51②|完成|人民幣|2000元③|入賬|操作。
具體地,可以將信息中首次出現(xiàn)的數(shù)字序列設(shè)置為交易賬號,然后根據(jù)第二數(shù)據(jù)庫中各個交易數(shù)據(jù)項對應(yīng)的關(guān)鍵詞,確定每個分詞對應(yīng)的交易數(shù)據(jù)項,得到上述待提取部分中的①為交易賬號,②為交易時間,③為交易金額。
對于銀行的標準交易信息格式,應(yīng)該符合以下的格式:
1.開始單詞+①+②+a+p+③+廣告(可選)
2.開始單詞+①+②+p+a+③+廣告(可選)
3.開始單詞+①+②+a+③+廣告(可選)
4.開始單詞+①+②+③+a+廣告(可選)
5.開始單詞+①+②+③+a+p+廣告(可選)
其中,上面格式中的①,②有時候會有缺失,但至少會出現(xiàn)一個。a為交易行為、o為交易方向、p為交易目的。
由于待提取部分可能包括多個交易行為a,因此確定待提取部分的交易數(shù)據(jù)項為交易金額的分詞后,將距離交易金額的分詞最近的交易行為a對應(yīng)的分詞確定為所述標準交易信息的交易行為a。
具體地,分別確定交易賬號對應(yīng)的分詞、交易時間對應(yīng)的分詞以及交易金額對應(yīng)的分詞;從交易賬號對應(yīng)的分詞或交易時間對應(yīng)的分詞與交易金額對應(yīng)的分詞之間的分詞中確定是否存在交易行為對應(yīng)的分詞,若存在則將距離交易金額的分詞最近的交易行為對應(yīng)的分詞作為標準交易信息的交易行為。
例如,交易信息格式可能會出現(xiàn)以下兩種異常情況:1)開始單詞+①+②+p(可不出現(xiàn))+③;2)開始單詞+①+②+p(可不出現(xiàn))+a+p(可不出現(xiàn))+a+③
1)表示到金額前還未出現(xiàn)交易行為,如交易信息(5),此時將距離交易行為“匯款”最近的交易金額對應(yīng)的分詞“2000元”作為交易金額。
2)表示金額之前出現(xiàn)了多個交易行為a,同時在不同位置出現(xiàn)多個p,此時應(yīng)該將離交易金額最近的交易行為a對應(yīng)的分詞作為標準交易信息的交易行為。若出現(xiàn)了多個交易目的p,則所出現(xiàn)的多個p對應(yīng)的分詞作為預(yù)選交易目的。
進一步地,確定了交易行為之后,還需要判斷是否存在既屬于交易行為又屬于交易目的的分詞時,若存在,則確定該既屬于交易行為又屬于交易目的的分詞對應(yīng)的交易數(shù)據(jù)項為交易目的。
如推送信息(3),“匯款”和“入賬”都為交易行為對應(yīng)的分詞,但是按照交易金額就近原則,同時考慮“匯款”為既屬于交易行為又屬于交易目的的分詞時,所以將“入賬”定義為消息(3)的交易行為,將“匯款”定義為消息(3)的交易目的。
進一步地,根據(jù)確定的待提取部分的交易行為的分詞,在第二數(shù)據(jù)庫中提取該分詞對應(yīng)的關(guān)鍵詞的交易方向,并統(tǒng)計終端中具有相同交易方向的標準交易信息,并輸出統(tǒng)計后的結(jié)果。
具體地,根據(jù)確定的交易賬號、交易時間,交易金額、交易行為及交易方向,可以統(tǒng)計出月(年、季度、周、日等)收入總額以及月(年、季度、周、日等)支出總額,并總結(jié)分析收支情況,通過資產(chǎn)管理類app推送給用戶。例如以下方式:
您本月有5筆交易
分屬于3家銀行
總共花了1000元
總共收入5000元
收大于入,很不錯哦!
需要說明的是,本發(fā)明實施例不限于應(yīng)用于資產(chǎn)管理類app,也根據(jù)確定出的各交易數(shù)據(jù)項,優(yōu)化推送信息的格式,以卡片式的方式推送給用戶,例如:
交易時間:2016年1月1日12點19分
交易卡名稱:信用卡
交易卡號:1122
交易金額:100元
交易行為:入賬
交易目的:信用卡還款
本發(fā)明實施例提供的交易信息處理的方法,從終端接收的推送信息中確定交易信息;根據(jù)第一數(shù)據(jù)庫,從交易信息中確定出標準交易信息,針對每個標準交易信息,根據(jù)預(yù)設(shè)的結(jié)束標識,確定標準交易信息中待提取部分;根據(jù)第二數(shù)據(jù)庫,從待提取部分提取標準交易信息的各交易數(shù)據(jù)項。本發(fā)明實施例提供的交易信息處理的方法不需要匹配模板,而是通過數(shù)據(jù)庫篩選的方式得到待提取部分,然后根據(jù)交易數(shù)據(jù)項分別對應(yīng)的關(guān)鍵詞確定待提取部分的各交易數(shù)據(jù)項。由于不需要匹配模板,節(jié)省了大量人工維護成本;此外,通過結(jié)束標識判斷有效交易數(shù)據(jù)的位置,消除了交易信息中的廣告部分的影響,提高了交易信息解析的準確性。
本發(fā)明實施例還提供一種交易信息處理的方法流程,如圖2所示,為本發(fā)明實施例提供的交易信息處理的流程圖,包括:
步驟201:從終端接收的推送信息中確定交易信息。
需要說明的是,銀行推送給用戶信息的方式可以為短信形式,也可以為app推送消息形式及第三方應(yīng)用平臺站內(nèi)消息的形式,但是不管采用何種形式,均需預(yù)先通過用戶的授權(quán)許可。
具體地,在步驟201中,首先針對每個推送信息,獲取該推送信息從首字符開始的預(yù)設(shè)數(shù)量的字符串,然后將該字符串與第三數(shù)據(jù)庫匹配,將匹配成功的字符串對應(yīng)的推送信息作為交易信息。
其中,第三數(shù)據(jù)庫中存儲有交易信息對應(yīng)的關(guān)鍵詞。具體地,根據(jù)對交易信息格式的分析,預(yù)先儲存通用的交易信息的開始字符串作為第三數(shù)據(jù)庫,稱為tradebeginwordlist。例如,“尾號”、“貴卡”、“您賬戶”、“信用卡”等詞語。為了提高提取效率和準確率,預(yù)設(shè)數(shù)量可以根據(jù)第三數(shù)據(jù)庫中的字符串長度設(shè)置為一個定值,如8,或者設(shè)置為從該推送信息開頭第一個字符開始至出現(xiàn)的第一個數(shù)字。例如,針對上述8條推送消息(1)~(8),獲取該從首字符開始的8個的字符串,然后將該字符串與第三數(shù)據(jù)庫匹配,得到(1)、(2)、(3)、(4)、(5)、(8)匹配成功,(6)和(7)匹配失敗,則將(1)、(2)、(3)、(4)、(5)、(8)作為交易信息,排除上述所列舉的非交易信息(6)和(7)。
步驟202:根據(jù)第一數(shù)據(jù)庫,從交易信息中確定出標準交易信息。
其中,第一數(shù)據(jù)庫中存儲有非標準類關(guān)鍵詞;
為了統(tǒng)計用戶銀行卡的金額變動,需要排除與金額變動無關(guān)的非標準類信息。預(yù)先存儲非標準類關(guān)鍵字作為第三數(shù)據(jù)庫,稱為otherwordlist,例如,“已辦理成功”、“受理成功”、“放貸”等。若交易信息出現(xiàn)非標準類關(guān)鍵詞,則將該交易信息排除,如上述推送消息中的(8)。從而得到上述推送消息(1)~(8)中,與用戶銀行卡的金額變動有關(guān)的消息(1)、(2)、(3)、(4)、(5)為標準交易信息。
步驟203:針對每個標準交易信息,根據(jù)預(yù)設(shè)的結(jié)束標識,確定標準交易信息中待提取部分。
具體地,根據(jù)銀行推送的交易信息的結(jié)構(gòu),廣告類信息一般會用句號標識與用戶的交易信息分隔開,因此可以設(shè)置結(jié)束標志為句號。針對一條標準交易信息,首先確定句號出現(xiàn)的位置,然后提取句號之前的內(nèi)容作為待提取部分,這樣可以有效降低廣告信息的干擾。如推送信息(2)所示,雖然在句號后面的廣告中還會出現(xiàn)金額100元,但由于該部分內(nèi)容已經(jīng)被排除所以并不影響交易特征的提取結(jié)果。
需要說明的是,若標準交易信息出現(xiàn)多次金額,由于通常首次出現(xiàn)的金額為與用戶銀行卡的金額變動有關(guān),則將首次出現(xiàn)的金額及之前的內(nèi)容作為待提取部分,例如推送消息(1),待提取部分為“尾號1234儲蓄卡賬戶09:20通過atm轉(zhuǎn)出290元”。
步驟204:對待提取部分進行分詞,根據(jù)第二數(shù)據(jù)庫中關(guān)鍵詞確定各分詞對應(yīng)的交易數(shù)據(jù)項。
其中,第二數(shù)據(jù)庫中存儲有各交易數(shù)據(jù)項分別對應(yīng)的關(guān)鍵詞。
本步驟中,需預(yù)先存儲各交易數(shù)據(jù)項分別對應(yīng)的關(guān)鍵詞作為第二數(shù)據(jù)庫,交易數(shù)據(jù)項至少包括交易行為、交易金額,此外,根據(jù)交易信息格式的不同,交易數(shù)據(jù)項也可以包括交易賬號、交易時間、交易目的等。
例如,交易時間對應(yīng)的關(guān)鍵詞可以包括:年、月、日、時、分、秒以及標點符號“:”等。交易金額對應(yīng)的關(guān)鍵詞可以包括:元、美元、人民幣、符號“¥”等。交易行為對應(yīng)的關(guān)鍵詞稱為tradeactionwordlist,可以包括如下關(guān)鍵詞:支出、存入、匯款等。交易目的對應(yīng)的關(guān)鍵詞稱為tradepurposewordlist,可以包括如下關(guān)鍵詞:匯款、理財、資金歸集等。需要說明的是,同一個詞語可以屬于兩個不同的交易數(shù)項,例如,“匯款”既可以作為交易行為,也可以作為交易目的。其中,交易行為中每個詞語會包含自己的方向?qū)傩?,例如,支出為出賬方向;存入為入賬方向。
具體地,分別通過豎線對信息(1)至(5)的待提取部分的內(nèi)容進行分詞,可以將信息中首次出現(xiàn)的數(shù)字序列設(shè)置為交易賬號,然后根據(jù)第二數(shù)據(jù)庫中各個交易數(shù)據(jù)項對應(yīng)的關(guān)鍵詞,確定每個分詞對應(yīng)的交易數(shù)據(jù)項。
步驟205:分別確定交易賬號對應(yīng)的分詞、交易時間對應(yīng)的分詞以及交易金額對應(yīng)的分詞;
步驟206:判斷待提取部分是否包括多個交易行為,若否,執(zhí)行步驟207,若是執(zhí)行步驟208。
具體地,根據(jù)銀行交易信息的格式的不同,可能出現(xiàn)待提取部分存在多個交易行為的情況,如示例2),則需要從多個分詞中確定該標準交易信息的交易行為對應(yīng)的分詞。
步驟207:將唯一的交易行為對應(yīng)的分詞作為標準交易信息的交易行為;繼續(xù)執(zhí)行步驟209。
步驟208:將距離交易金額的分詞最近的交易行為對應(yīng)的分詞作為標準交易信息的交易行為,繼續(xù)執(zhí)行步驟209。
如示例2),則將第二個交易行為對應(yīng)的分詞作為2)的交易數(shù)據(jù)項中的交易行為。
步驟209:判斷是否存在既屬于交易行為又屬于交易目的的分詞,若存在,則執(zhí)行步驟210,否則執(zhí)行步驟211。
步驟210:將所述既屬于交易行為又屬于交易目的的分詞對應(yīng)的交易數(shù)據(jù)項為交易目的,繼續(xù)執(zhí)行211。
如推送信息(3),“匯款”和“入賬”都為交易行為對應(yīng)的分詞,但是按照交易金額就近原則,同時考慮“匯款”為既屬于交易行為又屬于交易目的的分詞時,所以將“入賬”定義為消息(3)的交易行為,將“匯款”定義為消息(3)的交易目的。
步驟211:根據(jù)確定的待提取部分的交易行為的分詞,在第二數(shù)據(jù)庫中提取該分詞對應(yīng)的關(guān)鍵詞的交易方向,繼續(xù)執(zhí)行212。
步驟212:根據(jù)確定的交易賬號、交易時間、交易金額、交易行為及交易方向,進行統(tǒng)計分析并輸出統(tǒng)計結(jié)果。
具體地,根據(jù)確定的交易賬號、交易時間,交易金額、交易行為及交易方向,可以統(tǒng)計出月(年、季度、周、日等)收入總額以及月(年、季度、周、日等)支出總額,并總結(jié)分析收支情況,通過資產(chǎn)管理類app推送給用戶。
基于同樣的發(fā)明構(gòu)思,本發(fā)明實施例還提供一種交易信息處理的裝置,具體可以為資產(chǎn)管理類app或消息推送前端處理裝置。如圖3所示,為本發(fā)明實施例提供的一種交易信息處理的裝置結(jié)構(gòu)示意圖,包括:
交易信息確定模塊301:用于從終端接收的推送信息中確定交易信息;
標準信息確定模塊302:用于根據(jù)第一數(shù)據(jù)庫,從所述交易信息中確定出標準交易信息,所述第一數(shù)據(jù)庫中存儲有非標準類關(guān)鍵詞;
交易數(shù)據(jù)項確定模塊303:針對每個標準交易信息,根據(jù)預(yù)設(shè)的結(jié)束標識,確定所述標準交易信息中待提取部分;根據(jù)第二數(shù)據(jù)庫,從所述待提取部分提取所述標準交易信息的各交易數(shù)據(jù)項,所述第二數(shù)據(jù)庫中存儲有各交易數(shù)據(jù)項分別對應(yīng)的關(guān)鍵詞。
進一步地,所述交易信息確定模塊301,具體用于:
針對每個推送信息,獲取所述推送信息從首字符開始的預(yù)設(shè)數(shù)量的字符串,將所述字符串與第三數(shù)據(jù)庫匹配,所述第三數(shù)據(jù)庫中存儲有交易信息對應(yīng)的關(guān)鍵詞;
將匹配成功的所述字符串對應(yīng)的推送信息作為交易信息。
進一步地,所述交易數(shù)據(jù)項確定模塊303,還用于:
對所述待提取部分進行分詞;
根據(jù)所述第二數(shù)據(jù)庫中關(guān)鍵詞,確定各分詞對應(yīng)的交易數(shù)據(jù)項。
進一步地,所述交易數(shù)據(jù)項至少包括交易行為、交易金額;
所述交易數(shù)據(jù)項確定模塊303,還用于:
確定所述待提取部分的交易數(shù)據(jù)項為交易金額的分詞;
將距離所述交易金額的分詞最近的交易行為對應(yīng)的分詞確定為所述標準交易信息的交易行為。
進一步地,所述交易數(shù)據(jù)項還包括交易賬號、交易時間;
所述交易數(shù)據(jù)項確定模塊303,具體用于:
分別確定所述交易賬號對應(yīng)的分詞、所述交易時間對應(yīng)的分詞、所述交易金額對應(yīng)的分詞;
從所述交易賬號對應(yīng)的分詞或所述交易時間對應(yīng)的分詞與所述交易金額對應(yīng)的分詞之間的分詞中確定是否存在交易行為對應(yīng)的分詞,若存在則將距離所述交易金額的分詞最近的交易行為對應(yīng)的分詞作為所述標準交易信息的交易行為。
進一步地,所述交易數(shù)據(jù)項還包括交易目的,所述交易數(shù)據(jù)項確定模塊303,還用于:
若存在既屬于交易行為又屬于交易目的的分詞時,則確定所述既屬于交易行為又屬于交易目的的分詞對應(yīng)的交易數(shù)據(jù)項為交易目的。
進一步地,所述第二數(shù)據(jù)庫中存儲有交易行為對應(yīng)的各關(guān)鍵詞的交易方向信息,所述交易數(shù)據(jù)項確定模塊303,還用于:
根據(jù)確定的所述待提取部分的交易行為的分詞,在所述第二數(shù)據(jù)庫中提取所述分詞對應(yīng)的關(guān)鍵詞的交易方向;
統(tǒng)計所述終端中具有相同交易方向的標準交易信息,并輸出統(tǒng)計后的結(jié)果。
本發(fā)明實施例提供的交易信息處理的裝置,從終端接收的推送信息中確定交易信息;根據(jù)第一數(shù)據(jù)庫,從交易信息中確定出標準交易信息,針對每個標準交易信息,根據(jù)預(yù)設(shè)的結(jié)束標識,確定標準交易信息中待提取部分;根據(jù)第二數(shù)據(jù)庫,從待提取部分提取標準交易信息的各交易數(shù)據(jù)項。本發(fā)明實施例提供的交易信息處理的裝置不需要匹配模板,而是通過數(shù)據(jù)庫篩選的方式得到待提取部分,然后根據(jù)交易數(shù)據(jù)項分別對應(yīng)的關(guān)鍵詞確定待提取部分的各交易數(shù)據(jù)項。由于不需要匹配模板,節(jié)省了大量人工維護成本;此外,通過結(jié)束標識判斷有效交易數(shù)據(jù)的位置,消除了交易信息中的廣告部分的影響,提高了交易信息解析的準確性。
本發(fā)明是參照根據(jù)本發(fā)明實施例的方法、設(shè)備(系統(tǒng))、和計算機程序產(chǎn)品的流程圖和/或方框圖來描述的。應(yīng)理解可由計算機程序指令實現(xiàn)流程圖和/或方框圖中的每一流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結(jié)合??商峁┻@些計算機程序指令到通用計算機、專用計算機、嵌入式處理機或其他可編程數(shù)據(jù)處理設(shè)備的處理器以產(chǎn)生一個機器,使得通過計算機或其他可編程數(shù)據(jù)處理設(shè)備的處理器執(zhí)行的指令產(chǎn)生用于實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的系統(tǒng)。
這些計算機程序指令也可存儲在能引導(dǎo)計算機或其他可編程數(shù)據(jù)處理設(shè)備以特定方式工作的計算機可讀存儲器中,使得存儲在該計算機可讀存儲器中的指令產(chǎn)生包括指令系統(tǒng)的制造品,該指令系統(tǒng)實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能。
這些計算機程序指令也可裝載到計算機或其他可編程數(shù)據(jù)處理設(shè)備上,使得在計算機或其他可編程設(shè)備上執(zhí)行一系列操作步驟以產(chǎn)生計算機實現(xiàn)的處理,從而在計算機或其他可編程設(shè)備上執(zhí)行的指令提供用于實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的步驟。
盡管已描述了本發(fā)明的優(yōu)選實施例,但本領(lǐng)域內(nèi)的技術(shù)人員一旦得知了基本創(chuàng)造性概念,則可對這些實施例作出另外的變更和修改。所以,所附權(quán)利要求意欲解釋為包括優(yōu)選實施例以及落入本發(fā)明范圍的所有變更和修改。
顯然,本領(lǐng)域的技術(shù)人員可以對本發(fā)明進行各種改動和變型而不脫離本發(fā)明的精神和范圍。這樣,倘若本發(fā)明的這些修改和變型屬于本發(fā)明權(quán)利要求及其等同技術(shù)的范圍之內(nèi),則本發(fā)明也意圖包含這些改動和變型在內(nèi)。