一種發(fā)票公章過濾的方法及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及發(fā)票識(shí)別領(lǐng)域,特別涉及一種發(fā)票公章過濾的方法及裝置。
【背景技術(shù)】
[0002]傳統(tǒng)的OCR(光學(xué)字符識(shí)別)技術(shù)識(shí)別由于受很多圖片質(zhì)量的影響,導(dǎo)致識(shí)別的準(zhǔn)確度下降。特別是在發(fā)票行業(yè),發(fā)票上面經(jīng)常出現(xiàn)大量的公章,這樣將會(huì)導(dǎo)致識(shí)別率下降。去除公章時(shí)候,需要對(duì)圖片進(jìn)行自動(dòng)化分層,這樣大大增加計(jì)算量,導(dǎo)致系統(tǒng)的識(shí)別速度下降,另外,還需要增加系統(tǒng)并行的進(jìn)程來維持系統(tǒng)的正常識(shí)別速度,這樣給系統(tǒng)的維護(hù)帶來了不便,同時(shí)也增加了成本。
【發(fā)明內(nèi)容】
[0003]本發(fā)明要解決的技術(shù)問題在于,針對(duì)現(xiàn)有技術(shù)的上述識(shí)別率下降、識(shí)別速度下降、系統(tǒng)維護(hù)不便、成本較高的缺陷,提供一種能提高識(shí)別率、加快識(shí)別速度、系統(tǒng)維護(hù)較為方便、降低成本的發(fā)票公章過濾的方法及裝置。
[0004]本發(fā)明解決其技術(shù)問題所采用的技術(shù)方案是:構(gòu)造一種發(fā)票公章過濾的方法,包括如下步驟:
[0005]A)接收需要過濾公章的發(fā)票圖片,并將所述發(fā)票圖片轉(zhuǎn)換為像素矩陣;
[0006]B)由所述像素矩陣得到一個(gè)像素點(diǎn)集合,將所述像素點(diǎn)集合中的所有像素進(jìn)行分類;
[0007]C)將分類后每個(gè)類別中的所有像素按照其在所述發(fā)票圖片中的坐標(biāo)進(jìn)行圖片還原,并得到多個(gè)圖層;所述圖層的數(shù)量與所述類別的數(shù)量相同;
[0008]D)使用OCR開源引擎對(duì)每個(gè)所述圖層進(jìn)行識(shí)別;
[0009]E)計(jì)算每個(gè)圖層的識(shí)別分?jǐn)?shù),并將識(shí)別分?jǐn)?shù)最大的圖層作為濾除公章后的圖片。
[0010]在本發(fā)明所述的發(fā)票公章過濾的方法中,所述像素矩陣為RGB像素矩陣。
[0011]在本發(fā)明所述的發(fā)票公章過濾的方法中,所述步驟B)中使用K-均值聚類算法、層次聚類算法和自組織映射圖聚類算法對(duì)所述像素點(diǎn)集合中的所有像素進(jìn)行分類。
[0012]在本發(fā)明所述的發(fā)票公章過濾的方法中,所述步驟E)進(jìn)一步包括:
[0013]El)計(jì)算每個(gè)所述圖層中每個(gè)字符的出現(xiàn)概率及出現(xiàn)次數(shù);
[0014]E2)將當(dāng)前圖層中每個(gè)字符的出現(xiàn)概率及出現(xiàn)次數(shù)進(jìn)行相乘,并將每個(gè)乘積進(jìn)行相加得到所述當(dāng)前圖層的識(shí)別分?jǐn)?shù);
[0015]E3)按照所述步驟E2)中的方式計(jì)算剩余圖層的識(shí)別分?jǐn)?shù);
[0016]E4)找出識(shí)別分?jǐn)?shù)最大的圖層,并將其作為濾除公章后的圖片。
[0017]在本發(fā)明所述的發(fā)票公章過濾的方法中,所述像素矩陣中每個(gè)像素點(diǎn)為一個(gè)三維向量。
[0018]本發(fā)明還涉及一種實(shí)現(xiàn)上述發(fā)票公章過濾的方法的裝置,包括:
[0019]圖片轉(zhuǎn)換單元:用于接收需要過濾公章的發(fā)票圖片,并將所述發(fā)票圖片轉(zhuǎn)換為像素矩陣;
[0020]像素分類單元:用于由所述像素矩陣得到一個(gè)像素點(diǎn)集合,將所述像素點(diǎn)集合中的所有像素進(jìn)行分類;
[0021]圖片還原單元:用于將分類后每個(gè)類別中的所有像素按照其在所述發(fā)票圖片中的坐標(biāo)進(jìn)行圖片還原,并得到多個(gè)圖層;所述圖層的數(shù)量與所述類別的數(shù)量相同;
[0022]圖層識(shí)別單元:用于使用OCR開源引擎對(duì)每個(gè)所述圖層進(jìn)行識(shí)別;
[0023]識(shí)別分?jǐn)?shù)計(jì)算單元:用于計(jì)算每個(gè)圖層的識(shí)別分?jǐn)?shù),并將識(shí)別分?jǐn)?shù)最大的圖層作為濾除公章后的圖片。
[0024]在本發(fā)明所述的裝置中,所述像素矩陣為RGB像素矩陣。
[0025]在本發(fā)明所述的裝置中,所述像素分類單元中使用K-均值聚類算法、層次聚類算法和自組織映射圖聚類算法對(duì)所述像素點(diǎn)集合中的所有像素進(jìn)行分類。
[0026]在本發(fā)明所述的裝置中,所述識(shí)別分?jǐn)?shù)計(jì)算單元進(jìn)一步包括:
[0027]概率次數(shù)計(jì)算模塊:用于計(jì)算每個(gè)所述圖層中每個(gè)字符的出現(xiàn)概率及出現(xiàn)次數(shù);
[0028]相乘相加模塊:用于將當(dāng)前圖層中每個(gè)字符的出現(xiàn)概率及出現(xiàn)次數(shù)進(jìn)行相乘,并將每個(gè)乘積進(jìn)行相加得到所述當(dāng)前圖層的識(shí)別分?jǐn)?shù);
[0029]剩余圖層識(shí)別分?jǐn)?shù)計(jì)算模塊:用于按照所述相乘相加模塊中的方式計(jì)算剩余圖層的識(shí)別分?jǐn)?shù);
[0030]識(shí)別分?jǐn)?shù)最大圖層獲取模塊:用于找出識(shí)別分?jǐn)?shù)最大的圖層,并將其作為濾除公章后的圖片。
[0031]在本發(fā)明所述的裝置中,所述像素矩陣中每個(gè)像素點(diǎn)為一個(gè)三維向量。
[0032]實(shí)施本發(fā)明的發(fā)票公章過濾的方法及裝置,具有以下有益效果:由于將需要過濾公章的發(fā)票圖片轉(zhuǎn)換為像素矩陣,然后將所有像素進(jìn)行分類,將分類后每個(gè)類別中的所有像素按照其在發(fā)票圖片中的坐標(biāo)進(jìn)行圖片還原,得到多個(gè)圖層;使用OCR開源引擎對(duì)每個(gè)圖層進(jìn)行識(shí)別,將識(shí)別分?jǐn)?shù)最大的圖層作為濾除公章后的圖片,這樣就會(huì)有效去除公章對(duì)識(shí)別率的影響,所以其能提高識(shí)別率、加快識(shí)別速度、系統(tǒng)維護(hù)較為方便、降低成本。
【附圖說明】
[0033]為了更清楚地說明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
[0034]圖1為本發(fā)明發(fā)票公章過濾的方法及裝置一個(gè)實(shí)施例中方法的流程圖;
[0035]圖2為所述實(shí)施例中計(jì)算每個(gè)圖層的識(shí)別分?jǐn)?shù),并將識(shí)別分?jǐn)?shù)最大的圖層作為濾除公章后的圖片的具體流程圖;
[0036]圖3為所述實(shí)施例中需要識(shí)別的圖片;
[0037]圖4為所述實(shí)施例中第一圖層的示意圖;
[0038]圖5為所述實(shí)施例中第二圖層的示意圖;
[0039]圖6為所述實(shí)施例中第三圖層的示意圖;
[0040]圖7為所述實(shí)施例中第四圖層的示意圖;
[0041]圖8為所述實(shí)施例中裝置的結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0042]下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動(dòng)的前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
[0043]在本發(fā)明發(fā)票公章過濾的方法及裝置實(shí)施例中,其發(fā)票公章過濾的方法的流程圖如圖1所示。圖1中,該發(fā)票公章過濾的方法包括如下步驟:
[0044]步驟SOl接收需要過濾公章的發(fā)票圖片,并將發(fā)票圖片轉(zhuǎn)換為像素矩陣:首先需要準(zhǔn)備一個(gè)字條訓(xùn)練數(shù)據(jù)。對(duì)每個(gè)字條的字符的出現(xiàn)概率進(jìn)行統(tǒng)計(jì)。這里以發(fā)票代碼字條為例,其字符的出現(xiàn)概率為 prob( ‘0’)= 0.1、prob ( ‘ I’)= 0.1、prob ( ‘2’)= 0.1、prob ( ‘3’)= 0.1、prob ( ‘4’)= 0.1、prob ( ‘5’)= 0.Uprob ( ‘6’)= 0.Uprob ( ‘7’)=0.Uprob ( ‘8’)= 0.1和prob ( ‘9’)= 0.1 ;其中,prob表示字符的出現(xiàn)概率。所有字符的出現(xiàn)概率總和為I。圖3為本實(shí)施例中需要去除公章的圖片,本實(shí)施例中將以圖3中的圖片為例,說明將公章濾除并并獲取相應(yīng)的文字的過程。本步驟中,接收需要過濾公章的發(fā)票圖片,并將發(fā)票圖片轉(zhuǎn)換為像素矩陣,該像素矩陣為RGB (紅綠藍(lán))像素矩陣,每個(gè)像素點(diǎn)為一個(gè)三維向量。
[0045]步驟S02由像素矩陣得到一個(gè)像素點(diǎn)集合,將像素點(diǎn)集合中的所有像素進(jìn)行分類:本步驟中,由像素矩陣得到一個(gè)像素點(diǎn)集合,將像素點(diǎn)集合中的所有像素進(jìn)行分類。本實(shí)施例中,為了描述方便,將像素點(diǎn)集合標(biāo)記為S。系統(tǒng)使用各種聚類算法和歐式距離,把像素點(diǎn)集合中所有像素分為K類,這K類分別標(biāo)記為S1, S2,…,Sk,其中,K為大于O的整數(shù)。根據(jù)交叉驗(yàn)證(Cross Validat1n)表示,當(dāng)K = 10時(shí)分層效果最好。值得一提的是,本步驟使用K-均值聚類算法、層次聚類算法和自組織映射圖聚類算法對(duì)像素點(diǎn)集合中的所有像素進(jìn)行分類。當(dāng)然,在本實(shí)施例的一些情況下,也可以采用其他聚類算法對(duì)像素點(diǎn)結(jié)合中的所有像素進(jìn)行分類。
[0046]步驟S03將分類后每個(gè)類別中的所有像素按照其在發(fā)票圖片中的坐標(biāo)進(jìn)行圖片還原,并得到多個(gè)圖層:本步驟中,將分類后每個(gè)類別中的所有像素按照其在發(fā)票圖片中的坐標(biāo)進(jìn)行圖片還原,并得到多個(gè)圖層,本實(shí)施例中,圖層的數(shù)量與類別的數(shù)量相同,也就是圖層的數(shù)量為K個(gè)。由交叉驗(yàn)證試驗(yàn)表明K= 10個(gè)圖層是最優(yōu)值,對(duì)所有需要識(shí)別的圖片都會(huì)分割為10個(gè)圖層,本實(shí)施例限于篇幅,這里不展示所有圖層,本實(shí)施例以K = 4為例進(jìn)行說明,當(dāng)K = 4時(shí),有四個(gè)圖層,將這四個(gè)圖層分別命名為第一圖層、第二圖層、第三圖層和第四圖層,圖4為本實(shí)施例中第一圖層的示意圖;圖5為本實(shí)施例中第二圖層的示意圖;圖6為本實(shí)施例中第三圖層的示意圖;圖7為本實(shí)施例中第四圖層的示意圖。值得一提的是,在本實(shí)施例的一些情況下,圖層的個(gè)數(shù)可以根據(jù)具體需要進(jìn)行相應(yīng)調(diào)整。
[0047]步驟S04使用OCR開源引擎對(duì)