C模塊可基于射頻識別(RFID)技術(shù),紅外數(shù)據(jù)協(xié)會(IrDA)技術(shù),超寬帶 (UWB)技術(shù),藍(lán)牙(BT)技術(shù)和其他技術(shù)來實(shí)現(xiàn)。
[0274] 在示例性實(shí)施例中,裝置1900可W被一個(gè)或多個(gè)應(yīng)用專用集成電路(ASIC)、數(shù)字 信號處理器(DSP)、數(shù)字信號處理設(shè)備(DSPD)、可編程邏輯器件(PLD)、現(xiàn)場可編程口陣列 (FPGA)、控制器、微控制器、微處理器或其他電子元件實(shí)現(xiàn),用于執(zhí)行上述方法。
[0275] 在示例性實(shí)施例中,還提供了一種包括指令的非臨時(shí)性計(jì)算機(jī)可讀存儲介質(zhì),例 如包括指令的存儲器1904,上述指令可由裝置1900的處理器1920執(zhí)行W完成上述方法。例 如,所述非臨時(shí)性計(jì)算機(jī)可讀存儲介質(zhì)可W是ROM、隨機(jī)存取存儲器(RAM)、CD-R0M、磁帶、軟 盤和光數(shù)據(jù)存儲設(shè)備等。
[0276] 本領(lǐng)域技術(shù)人員在考慮說明書及實(shí)踐運(yùn)里公開的發(fā)明后,將容易想到本公開的其 它實(shí)施方案。本公開旨在涵蓋本公開的任何變型、用途或者適應(yīng)性變化,運(yùn)些變型、用途或 者適應(yīng)性變化遵循本公開的一般性原理并包括本公開未公開的本技術(shù)領(lǐng)域中的公知常識 或慣用技術(shù)手段。說明書和實(shí)施例僅被視為示例性的,本公開的真正范圍和精神由下面的 權(quán)利要求指出。
[0277] W上所述僅為本公開的較佳實(shí)施例而已,并不用W限制本公開,凡在本公開的精 神和原則之內(nèi),所做的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本公開保護(hù)的范圍之內(nèi)。
【主權(quán)項(xiàng)】
1. 一種信息識別方法,其特征在于,包括: 接收信用卡賬單信息; 截取所述信用卡賬單信息中包含金額的分句; 對各分句進(jìn)行分詞處理,基于預(yù)存儲的特征詞集合對所述分詞處理后得到的詞進(jìn)行特 征提取,得到所述信用卡賬單信息的特征詞集合; 基于預(yù)存儲的訓(xùn)練模型和所述信用卡賬單信息的特征詞集合確定所述信用卡賬單信 息中的款項(xiàng)信息。2. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述基于預(yù)存儲的訓(xùn)練模型和所述信用卡 賬單信息的特征詞集合確定所述信用卡賬單信息中的款項(xiàng)信息,包括: 讀取所述訓(xùn)練模型中的款項(xiàng)分類; 基于預(yù)存儲的訓(xùn)練模型和所述信用卡賬單信息的特征詞集合,對各所述分句中的金額 進(jìn)行預(yù)測,得到各金額屬于各所述款項(xiàng)分類的概率,所述款項(xiàng)分類包括還款額類和非還款 額類; 將概率最高的款項(xiàng)分類作為對應(yīng)的金額所屬的款項(xiàng)分類; 判斷各分句中的金額是否屬于所述還款額類,基于判斷結(jié)果確定所述信用卡賬單信息 中的款項(xiàng)信息。3. 根據(jù)權(quán)利要求2所述的方法,其特征在于,所述基于判斷結(jié)果確定所述信用卡賬單信 息中的款項(xiàng)信息,包括: 在沒有一個(gè)所述分句中的金額被判斷為屬于所述還款額類時(shí),確定所述信用卡賬單信 息中的還款信息為零; 在只有一個(gè)所述分句中的金額被判斷為屬于所述還款額類時(shí),將所述分句中的金額確 定為還款額,將幣種確認(rèn)為人民幣; 在多于一個(gè)所述分句中的金額被判斷為屬于所述還款額類時(shí),基于所述分句中的幣種 的不同確定還款額。4. 根據(jù)權(quán)利要求3所述的方法,其特征在于,所述基于所述分句中的幣種的不同確定還 款額,包括: 對于金額屬于所述還款額的各所述分句,分別提取各所述分句上下文中的幣種信息; 在各所述幣種信息互不相同時(shí),將各所述幣種信息對應(yīng)的所述分句中的金額確定為還 款額。5. 根據(jù)權(quán)利要求3所述的方法,其特征在于,所述基于所述分句中的幣種的不同確定還 款額,包括: 在至少兩個(gè)所述幣種信息相同時(shí),讀取相同的幣種信息對應(yīng)的金額分別屬于還款額的 概率; 將所述概率最大的金額確定為所述幣種信息的還款額。6. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括: 接收服務(wù)器發(fā)送的基于信息增益對信用卡賬單信息進(jìn)行篩選所得到的特征詞集合,以 及基于樸素貝葉斯分類器對所述信用卡賬單信息的分句進(jìn)行訓(xùn)練所生成的訓(xùn)練模型。7. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括: 將所述款項(xiàng)信息添加到日歷生成提醒信息。8. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括: 將所述款項(xiàng)信息發(fā)送至金融應(yīng)用APP進(jìn)行自動(dòng)還款。9. 一種信息識別方法,其特征在于,包括: 獲取設(shè)定時(shí)間段內(nèi)收到的信用卡賬單信息; 截取所述信用卡賬單信息中包含金額的分句,并基于預(yù)設(shè)的款項(xiàng)分類對所述分句中的 金額進(jìn)行標(biāo)注; 基于所述款項(xiàng)分類對標(biāo)注后的所述分句進(jìn)行特征詞選擇,得到特征詞集合; 以各所述分句中的金額作為訓(xùn)練目標(biāo),基于所述特征詞集合對標(biāo)注后的所述分句進(jìn)行 訓(xùn)練,得到訓(xùn)練模型; 將所述訓(xùn)練模型發(fā)送給終端,以使所述終端基于接收到的信用卡賬單信息中的特征詞 集合及所述訓(xùn)練模型,確定所接收到的信用卡賬單信息中的款項(xiàng)信息。10. 根據(jù)權(quán)利要求9所述的方法,其特征在于,所述基于所述款項(xiàng)分類對標(biāo)注后的所述 分句進(jìn)行特征詞選擇,得到特征詞集合,包括: 對所述標(biāo)注后的所述分句進(jìn)行分詞處理; 對所述分詞處理之后得到的詞進(jìn)行去重處理; 從所述去重處理之后得到的詞中,選擇出與所述款項(xiàng)分類的關(guān)聯(lián)性大于設(shè)定閾值的特 征詞,所選擇出的特征詞構(gòu)成所述特征詞集合。11. 根據(jù)權(quán)利要求10所述的方法,其特征在于,所述選擇出與所述款項(xiàng)分類的關(guān)聯(lián)性大 于設(shè)定閾值的特征詞,包括: 采用信息增益的方法選擇出與所述款項(xiàng)分類的關(guān)聯(lián)性大于設(shè)定閾值的特征詞。12. 根據(jù)權(quán)利要求9所述的方法,其特征在于,所述基于所述特征詞集合對標(biāo)注后的所 述分句進(jìn)行訓(xùn)練,包括: 采用樸素貝葉斯分類器,基于所述特征詞集合對標(biāo)注后的所述分句進(jìn)行訓(xùn)練。13. -種信息識別裝置,其特征在于,包括: 第一接收模塊,被配置為接收信用卡賬單信息; 第一截取模塊,被配置為截取所述第一接收模塊接收的信用卡賬單信息中包含金額的 分句; 處理模塊,被配置為對所述第一截取模塊截取的各分句進(jìn)行分詞處理,基于預(yù)存儲的 特征詞集合對所述分詞處理后得到的詞進(jìn)行特征提取,得到所述信用卡賬單信息的特征詞 集合; 確定模塊,被配置為基于預(yù)存儲的訓(xùn)練模型和所述處理模塊得到的所述信用卡賬單信 息的特征詞集合確定所述信用卡賬單信息中的款項(xiàng)信息。14.根據(jù)權(quán)利要求13所述的裝置,其特征在于,所述確定模塊包括: 讀取子模塊,被配置為讀取所述訓(xùn)練模型中的款項(xiàng)分類; 預(yù)測子模塊,被配置為基于預(yù)存儲的訓(xùn)練模型和所述信用卡賬單信息的特征詞集合, 對各所述分句中的金額進(jìn)行預(yù)測,得到各金額屬于所述讀取子模塊讀取的各所述款項(xiàng)分類 的概率,所述款項(xiàng)分類包括還款額類和非還款額類; 分類確定子模塊,被配置為將所述預(yù)測子模塊所預(yù)測的概率最高的款項(xiàng)分類作為對應(yīng) 的金額所屬的款項(xiàng)分類; 判斷子模塊,被配置為判斷各分句中的金額是否屬于所述還款額,基于判斷結(jié)果確定 所述信用卡賬單信息中的款項(xiàng)信息。15. 根據(jù)權(quán)利要求14所述的裝置,其特征在于,所述判斷子模塊包括: 第一確定單元,被配置為在沒有一個(gè)所述分句中的金額被判斷為屬于所述還款額類 時(shí),確定所述信用卡賬單信息中的還款信息為零; 第二確定單元,被配置為在只有一個(gè)所述分句中的金額被判斷為屬于所述還款額類 時(shí),將所述分句中的金額確定為還款額,將幣種確認(rèn)為人民幣; 第三確定單元,被配置為在多于一個(gè)所述分句中的金額被判斷為屬于所述還款額類 時(shí),基于所述分句中的幣種的不同確定還款額。16. 根據(jù)權(quán)利要求15所述的裝置,其特征在于,所述第三確定單元包括: 提取子單元,被配置為對于金額屬于所述還款額的各所述分句,分別提取各所述分句 上下文中的幣種信息; 第一確定子單元,被配置為在所述提取子單元提取的各所述幣種信息互不相同時(shí),將 各所述幣種信息對應(yīng)的所述分句中的金額確定為還款額。17. 根據(jù)權(quán)利要求15所述的裝置,其特征在于,所述第三確定單元包括: 讀取子單元,被配置為在至少兩個(gè)所述幣種信息相同時(shí),讀取相同的幣種信息對應(yīng)的 金額分別屬于還款額的概率; 第二確定子單元,被配置為將所述讀取子單元讀取的概率最大的金額確定為所述幣種 信息的還款額。18. 根據(jù)權(quán)利要求13所述的裝置,其特征在于,所述裝置還包括: 第二接收模塊,被配置為接收服務(wù)器發(fā)送的基于信息增益對信用卡賬單信息進(jìn)行篩選 所得到的特征詞集合,以及基于樸素貝葉斯分類器對所述信用卡賬單信息的分句進(jìn)行訓(xùn)練 所生成的訓(xùn)練模型。19. 根據(jù)權(quán)利要求13所述的裝置,其特征在于,所述裝置還包括: 添加模塊,被配置為將所述款項(xiàng)信息添加到日歷生成提醒信息。20. 根據(jù)權(quán)利要求13所述的裝置,其特征在于,所述裝置還包括: 發(fā)送模塊,被配置為將所述款項(xiàng)信息發(fā)送至金融應(yīng)用APP進(jìn)行自動(dòng)還款。21. -種信息識別裝置,其特征在于,包括: 獲取模塊,被配置為獲取設(shè)定時(shí)間段內(nèi)收到的信用卡賬單信息; 第二截取模塊,被配置為截取所述獲取模塊獲取的所述信用卡賬單信息中包含金額的 分句,并基于預(yù)設(shè)的款項(xiàng)分類對所述分句中的金額進(jìn)行標(biāo)注; 特征詞選擇模塊,被配置為基于所述款項(xiàng)分類對所述第二截取模塊標(biāo)注后的所述分句 進(jìn)行特征詞選擇,得到特征詞集合; 訓(xùn)練模塊,被配置為以各所述分句中的金額作為訓(xùn)練目標(biāo),基于所述特征詞選擇模塊 選擇的所述特征詞集合對標(biāo)注后的所述分句進(jìn)行訓(xùn)練,得到訓(xùn)練模型; 發(fā)送模塊,被配置為將所述訓(xùn)練模塊訓(xùn)練的所述訓(xùn)練模型發(fā)送給終端,以使所述終端 基于接收到的信用卡賬單信息中的特征詞集合及所述訓(xùn)練模型,確定所接收到的信用卡賬 單信息中的款項(xiàng)信息。22. 根據(jù)權(quán)利要求21所述的裝置,其特征在于,所述特征詞選擇模塊包括: 分詞子模塊,被配置為對所述標(biāo)注后的所述分句進(jìn)行分詞處理; 去重子模塊,被配置為對所述分詞子模塊分詞處理之后得到的詞進(jìn)行去重處理; 選擇子模塊,被配置為從所述去重子模塊去重處理之后得到的詞中,選擇出與所述款 項(xiàng)分類的關(guān)聯(lián)性大于設(shè)定閾值的特征詞,所選擇出的特征詞構(gòu)成所述特征詞集合。23. 根據(jù)權(quán)利要求22所述的裝置,其特征在于,所述選擇子模塊包括: 選擇單元,被配置為采用信息增益的方法選擇出與所述款項(xiàng)分類的關(guān)聯(lián)性大于設(shè)定閾 值的特征詞。24. 根據(jù)權(quán)利要求21所述的裝置,其特征在于,所述訓(xùn)練模塊包括: 訓(xùn)練子模塊,被配置為采用樸素貝葉斯分類器,基于所述特征詞集合對標(biāo)注后的所述 分句進(jìn)行訓(xùn)練。25. -種終端,其特征在于,包括:處理器;用于存儲處理器可執(zhí)行指令的存儲器;其中, 所述處理器被配置為: 接收信用卡賬單信息; 截取所述信用卡賬單信息中包含金額的分句; 對各分句進(jìn)行分詞處理,基于預(yù)存儲的特征詞集合對所述分詞處理后得到的詞進(jìn)行特 征提取,得到所述信用卡賬單信息的特征詞集合; 基于預(yù)存儲的訓(xùn)練模型和所述信用卡賬單信息的特征詞集合確定所述信用卡賬單信 息中的款項(xiàng)信息。26. -種服務(wù)器,其特征在于,包括:處理器;用于存儲處理器可執(zhí)行指令的存儲器;其 中,所述處理器被配置為: 獲取設(shè)定時(shí)間段內(nèi)收到的信用卡賬單信息; 截取所述信用卡賬單信息中包含金額的分句,并基于預(yù)設(shè)的款項(xiàng)分類對所述分句中的 金額進(jìn)行標(biāo)注; 基于所述款項(xiàng)分類對標(biāo)注后的所述分句進(jìn)行特征詞選擇,得到特征詞集合; 以各所述分句中的金額作為訓(xùn)練目標(biāo),基于所述特征詞集合對標(biāo)注后的所述分句進(jìn)行 訓(xùn)練,得到訓(xùn)練模型; 將所述訓(xùn)練模型發(fā)送給終端,以使所述終端基于接收到的信用卡賬單信息中的特征詞 集合及所述訓(xùn)練模型,確定所接收到的信用卡賬單信息中的款項(xiàng)信息。
【專利摘要】本公開是關(guān)于信息識別方法、裝置及終端,該方法包括:接收到信用卡賬單信息;截取所述信用卡賬單信息中包含金額的分句;對各分句進(jìn)行分詞處理,基于預(yù)存儲的特征詞集合對所述分詞處理后得到的詞進(jìn)行特征提取,得到所述信用卡賬單信息的特征詞集合;基于預(yù)存儲的訓(xùn)練模型和所述信用卡賬單信息的特征詞集合確定所述信用卡賬單信息中的款項(xiàng)信息。應(yīng)用本公開實(shí)施例,能夠針對信息密度較高的信用卡賬單信息進(jìn)行特征提取,對金額及特征詞的識別和提取的準(zhǔn)確度較高,通過所提取的關(guān)鍵詞及預(yù)存儲訓(xùn)練模型能夠得到準(zhǔn)確的還款關(guān)鍵信息,方便了用戶進(jìn)行信用卡還款,優(yōu)化了用戶體驗(yàn)。
【IPC分類】G06Q40/02, G06F17/27
【公開號】CN105447750
【申請?zhí)枴緾N201510792586
【發(fā)明人】汪平仄, 張濤, 陳志軍
【申請人】小米科技有限責(zé)任公司
【公開日】2016年3月30日
【申請日】2015年11月17日