信息識(shí)別方法、裝置、終端及服務(wù)器的制造方法
【技術(shù)領(lǐng)域】
[0001] 本公開設(shè)及計(jì)算機(jī)技術(shù)領(lǐng)域,尤其設(shè)及一種信息識(shí)別方法、裝置、終端及服務(wù)器。
【背景技術(shù)】
[0002] 相關(guān)技術(shù)中,使用信用卡消費(fèi)的用戶,可W定期收到信用卡中屯、發(fā)送的各種還款 信息,還款信息中一般包括還款金額、還款日期等等,W提醒用戶及時(shí)進(jìn)行還款。
【發(fā)明內(nèi)容】
[0003] 為克服相關(guān)技術(shù)中存在的問題,本公開提供了一種信息識(shí)別方法、裝置、終端及服 務(wù)器。
[0004] 根據(jù)本公開實(shí)施例的第一方面,提供一種信息識(shí)別方法,包括:
[0005] 接收信用卡賬單信息;
[0006] 截取所述信用卡賬單信息中包含金額的分句;
[0007] 對(duì)各分句進(jìn)行分詞處理,基于預(yù)存儲(chǔ)的特征詞集合對(duì)所述分詞處理后得到的詞進(jìn) 行特征提取,得到所述信用卡賬單信息的特征詞集合;
[000引基于預(yù)存儲(chǔ)的訓(xùn)練模型和所述信用卡賬單信息的特征詞集合確定所述信用卡賬 單信息中的款項(xiàng)信息。
[0009] 可選的,所述基于預(yù)存儲(chǔ)的訓(xùn)練模型和所述信用卡賬單信息的特征詞集合確定所 述信用卡賬單信息中的款項(xiàng)信息,包括:
[0010] 讀取所述訓(xùn)練模型中的款項(xiàng)分類;
[0011] 基于預(yù)存儲(chǔ)的訓(xùn)練模型和所述信用卡賬單信息的特征詞集合,對(duì)各所述分句中的 金額進(jìn)行預(yù)測(cè),得到各金額屬于各所述款項(xiàng)分類的概率,所述款項(xiàng)分類包括還款額類和非 還款額類;
[0012] 將概率最高的款項(xiàng)分類作為對(duì)應(yīng)的金額所屬的款項(xiàng)分類;
[0013] 判斷各分句中的金額是否屬于所述還款額類,基于判斷結(jié)果確定所述信用卡賬單 信息中的款項(xiàng)信息。
[0014] 可選的,所述基于判斷結(jié)果確定所述信用卡賬單信息中的款項(xiàng)信息,包括:
[0015] 在沒有一個(gè)所述分句中的金額被判斷為屬于所述還款額類時(shí),確定所述信用卡賬 單信息中的還款信息為零;
[0016] 在只有一個(gè)所述分句中的金額被判斷為屬于所述還款額類時(shí),將所述分句中的金 額確定為還款額,將幣種確認(rèn)為人民幣;
[0017] 在多于一個(gè)所述分句中的金額被判斷為屬于所述還款額類時(shí),基于所述分句中的 幣種的不同確定還款額。
[0018] 可選的,所述基于所述分句中的幣種的不同確定還款額,包括:
[0019] 對(duì)于金額屬于所述還款額的各所述分句,分別提取各所述分句上下文中的幣種信 息;
[0020] 在各所述幣種信息互不相同時(shí),將各所述幣種信息對(duì)應(yīng)的所述分句中的金額確定 為還款額。
[0021] 可選的,所述基于所述分句中的幣種的不同確定還款額,包括:
[0022] 在至少兩個(gè)所述幣種信息相同時(shí),讀取相同的幣種信息對(duì)應(yīng)的金額分別屬于還款 額的概率;
[0023] 將所述概率最大的金額確定為所述幣種信息的還款額。
[0024] 可選的,所述方法還包括:
[0025] 接收服務(wù)器發(fā)送的基于信息增益對(duì)信用卡賬單信息進(jìn)行篩選所得到的特征詞集 合,W及基于樸素貝葉斯分類器對(duì)所述信用卡賬單信息的分句進(jìn)行訓(xùn)練所生成的訓(xùn)練模 型。
[00%] 可選的,所述方法還包括:
[0027]將所述款項(xiàng)信息添加到日歷生成提醒信息。
[002引可選的,所述方法還包括:
[0029] 將所述款項(xiàng)信息發(fā)送至金融應(yīng)用APP進(jìn)行自動(dòng)還款。
[0030] 根據(jù)本公開實(shí)施例的第二方面,提供一種信息識(shí)別方法,包括:
[0031] 獲取設(shè)定時(shí)間段內(nèi)收到的信用卡賬單信息;
[0032] 截取所述信用卡賬單信息中包含金額的分句,并基于預(yù)設(shè)的款項(xiàng)分類對(duì)所述分句 中的金額進(jìn)行標(biāo)注;
[0033] 基于所述款項(xiàng)分類對(duì)標(biāo)注后的所述分句進(jìn)行特征詞選擇,得到特征詞集合;
[0034] W各所述分句中的金額作為訓(xùn)練目標(biāo),基于所述特征詞集合對(duì)標(biāo)注后的所述分句 進(jìn)行訓(xùn)練,得到訓(xùn)練模型;
[0035] 將所述訓(xùn)練模型發(fā)送給終端,W使所述終端基于接收到的信用卡賬單信息中的特 征詞集合及所述訓(xùn)練模型,確定所接收到的信用卡賬單信息中的款項(xiàng)信息。
[0036] 可選的,所述基于所述款項(xiàng)分類對(duì)標(biāo)注后的所述分句進(jìn)行特征詞選擇,得到特征 詞集合,包括:
[0037] 對(duì)所述標(biāo)注后的所述分句進(jìn)行分詞處理;
[0038] 對(duì)所述分詞處理之后得到的詞進(jìn)行去重處理;
[0039] 從所述去重處理之后得到的詞中,選擇出與所述款項(xiàng)分類的關(guān)聯(lián)性大于設(shè)定闊值 的特征詞,所選擇出的特征詞構(gòu)成所述特征詞集合。
[0040] 可選的,所述選擇出與所述款項(xiàng)分類的關(guān)聯(lián)性大于設(shè)定闊值的特征詞,包括:
[0041] 采用信息增益的方法選擇出與所述款項(xiàng)分類的關(guān)聯(lián)性大于設(shè)定闊值的特征詞。
[0042] 可選的,所述基于所述特征詞集合對(duì)標(biāo)注后的所述分句進(jìn)行訓(xùn)練,包括:
[0043] 采用樸素貝葉斯分類器,基于所述特征詞集合對(duì)標(biāo)注后的所述分句進(jìn)行訓(xùn)練。
[0044] 根據(jù)本公開實(shí)施例的第Ξ方面,提供一種信息識(shí)別裝置,包括:
[0045] 第一接收模塊,被配置為接收信用卡賬單信息;
[0046] 第一截取模塊,被配置為截取所述第一接收模塊接收的信用卡賬單信息中包含金 額的分句;
[0047] 處理模塊,被配置為對(duì)所述第一截取模塊截取的各分句進(jìn)行分詞處理,基于預(yù)存 儲(chǔ)的特征詞集合對(duì)所述分詞處理后得到的詞進(jìn)行特征提取,得到所述信用卡賬單信息的特 征詞集合;
[0048] 確定模塊,被配置為基于預(yù)存儲(chǔ)的訓(xùn)練模型和所述處理模塊得到的所述信用卡賬 單信息的特征詞集合確定所述信用卡賬單信息中的款項(xiàng)信息。
[0049] 可選的,所述確定模塊包括:
[0050] 讀取子模塊,被配置為讀取所述訓(xùn)練模型中的款項(xiàng)分類;
[0051] 預(yù)測(cè)子模塊,被配置為基于預(yù)存儲(chǔ)的訓(xùn)練模型和所述信用卡賬單信息的特征詞集 合,對(duì)各所述分句中的金額進(jìn)行預(yù)測(cè),得到各金額屬于所述讀取子模塊讀取的各所述款項(xiàng) 分類的概率,所述款項(xiàng)分類包括還款額類和非還款額類;
[0052] 分類確定子模塊,被配置為將所述預(yù)測(cè)子模塊所預(yù)測(cè)的概率最高的款項(xiàng)分類作為 對(duì)應(yīng)的金額所屬的款項(xiàng)分類;
[0053] 判斷子模塊,被配置為判斷各分句中的金額是否屬于所述還款額,基于判斷結(jié)果 確定所述信用卡賬單信息中的款項(xiàng)信息。
[0054] 可選的,所述判斷子模塊包括:
[0055] 第一確定單元,被配置為在沒有一個(gè)所述分句中的金額被判斷為屬于所述還款額 類時(shí),確定所述信用卡賬單信息中的還款信息為零;
[0056] 第二確定單元,被配置為在只有一個(gè)所述分句中的金額被判斷為屬于所述還款額 類時(shí),將所述分句中的金額確定為還款額,將幣種確認(rèn)為人民幣;
[0057] 第Ξ確定單元,被配置為在多于一個(gè)所述分句中的金額被判斷為屬于所述還款額 類時(shí),基于所述分句中的幣種的不同確定還款額。
[005引可選的,所述第Ξ確定單元包括:
[0059] 提取子單元,被配置為對(duì)于金額屬于所述還款額的各所述分句,分別提取各所述 分句上下文中的幣種信息;
[0060] 第一確定子單元,被配置為在所述提取子單元提取的各所述幣種信息互不相同 時(shí),將各所述幣種信息對(duì)應(yīng)的所述分句中的金額確定為還款額。
[0061] 可選的,所述第Ξ確定單元包括:
[0062] 讀取子單元,被配置為在至少兩個(gè)所述幣種信息相同時(shí),讀取相同的幣種信息對(duì) 應(yīng)的金額分別屬于還款額的概率;
[0063] 第二確定子單元,被配置為將所述讀取子單元讀取的概率最大的金額確定為所述 幣種信息的還款額。
[0064] 可選的,所述裝置還包括:
[0065] 第二接收模塊,被配置為接收服務(wù)器發(fā)送的基于信息增益對(duì)信用卡賬單信息進(jìn)行 篩選所得到的特征詞集合,W及基于樸素貝葉斯分類器對(duì)所述信用卡賬單信息的分句進(jìn)行 訓(xùn)練所生成的訓(xùn)練模型。
[0066] 可選的,所述裝置還包括:
[0067] 添加模塊,被配置為將所述款項(xiàng)信息添加到日歷生成提醒信息。
[006引可選的,所述裝置還包括:
[0069] 發(fā)送模塊,被配置為將所述款項(xiàng)信息發(fā)送至金融應(yīng)用APP進(jìn)行自動(dòng)還款。
[0070] 根據(jù)本公開實(shí)施例的第四方面,提供一種信息識(shí)別裝置,包括:
[0071] 獲取模塊,被配置為獲取設(shè)定時(shí)間段內(nèi)收到的信用卡賬單信息;
[0072] 第二截取模塊,被配置為截取所述獲取模塊獲取的所述信用卡賬單信息中包含金 額的分句,并基于預(yù)設(shè)的款項(xiàng)分類對(duì)所述分句中的金額進(jìn)行標(biāo)注;
[0073] 特征詞選擇模塊,被配置為基于所述款項(xiàng)分類對(duì)所述第二截取模塊標(biāo)注后的所述 分句進(jìn)行特征詞選擇,得到特征詞集合;
[0074] 訓(xùn)練模塊,被配置為W各所述分句中的金額作為訓(xùn)練目標(biāo),基于所述特征詞選擇 模塊選擇的所述特征詞集合對(duì)標(biāo)注后的所述分句進(jìn)行訓(xùn)練,得到訓(xùn)練模型;
[0075] 發(fā)送模塊,被配置為將所述訓(xùn)練模塊訓(xùn)練的所述訓(xùn)練模型發(fā)送給終端,W使所述 終端基于接收到的信用卡賬單信息中的特征詞集合及所述訓(xùn)練模型,確定所接收到的信用 卡賬單信息中的款項(xiàng)信息。
[0076] 可選的,所述特征詞選擇模塊包括:
[0077] 分詞子模塊,被配置為對(duì)所述標(biāo)注后的所述分句進(jìn)行分詞處理;
[0078] 去重子模塊,被配置為對(duì)所述分詞子模塊分詞處理之后得到的詞進(jìn)行去重處理;
[0079] 選擇子模塊,被配置為從所述去重子模塊去重處理之后得到的詞中,選擇出與所 述款項(xiàng)分類的關(guān)聯(lián)性大于設(shè)定闊值的特征詞,所選擇出的特征詞構(gòu)成所述特征詞集合。
[0080] 可選的,所述選擇子模塊包括:
[0081] 選擇單元,被配置為采用信息增益的方法選擇出與所述款項(xiàng)分類的關(guān)聯(lián)性大于設(shè) 定闊值的特征詞。
[0082] 可選的,所述訓(xùn)練模塊包括:
[0083] 訓(xùn)練子模塊,被配置為采用樸素貝葉斯分類器,基于所述特征詞集合對(duì)標(biāo)注后的 所述分句進(jìn)行訓(xùn)練。
[0084] 根據(jù)本公開實(shí)施例的第五方面,提供一種終端,包括:處理器;用于存儲(chǔ)處理器可 執(zhí)行指令的存儲(chǔ)器;其中,所述處理器被配置為:
[0085] 接收信用卡賬單信息;
[0086] 截取所述信用卡賬單信息中包含金額的分句;
[0087] 對(duì)各分句進(jìn)行分詞處理,基于預(yù)存儲(chǔ)的特征詞集合對(duì)所述分詞處理后得到的詞進(jìn) 行特征提取,得到所述信用卡賬單信息的特征詞集合;
[0088] 基于預(yù)存儲(chǔ)的訓(xùn)練模型和所述信用卡賬單信息的特征詞集合確定所述信用卡賬 單信息中的款項(xiàng)信息。
[0089] 根據(jù)本公開實(shí)施例的第六方面,提供一種服務(wù)器,包括:處理器;用于存儲(chǔ)處理器 可執(zhí)行指令的存儲(chǔ)器;其中,所述處理器被配置為:
[0090] 獲取設(shè)定時(shí)間段內(nèi)收到的信用卡賬單信息;
[0091] 截取所述信用卡賬單信息中包含金額的分句,并基于預(yù)設(shè)的款項(xiàng)分類對(duì)所述分句 中的金額進(jìn)行標(biāo)注;
[0092] 基于所述款項(xiàng)分類對(duì)標(biāo)注后的所述分句進(jìn)行特征詞選擇,得到特征詞集合;
[0093] W各所述分句中的金額作為訓(xùn)練目標(biāo),基于所述特征詞集合對(duì)標(biāo)注后的所述分句 進(jìn)行訓(xùn)練,得到訓(xùn)練模型;
[0094] 將所述訓(xùn)練模型發(fā)送給終端,W使所述終端基于接收到的信用卡賬單信息中的特 征詞集合及所述訓(xùn)練模型,確定所接收到的信用卡賬單信息中的款項(xiàng)信息。
[00%]本公開的實(shí)施例提供的技術(shù)方案可W包括W下有益效果:
[0096] 本公開中終端可W截取接收到的信用卡賬單信息中包含金額的分句,對(duì)分句進(jìn)行 分詞處理,并進(jìn)行特征提取,得到賬單信息的特征詞集合,然后基于預(yù)存儲(chǔ)的訓(xùn)練模型能夠 確定賬單信息中的