本發(fā)明屬于模式識(shí)別以及光學(xué)字符識(shí)別(OCR)技術(shù)領(lǐng)域,特別是,更為具體地講,涉及一種粘連字符可分割的人民幣冠字號識(shí)別方法,可應(yīng)用于點(diǎn)鈔驗(yàn)鈔清分機(jī)系統(tǒng)的人民幣冠字號識(shí)別。
背景技術(shù):
《人民幣鑒別儀通用技術(shù)條件》國家標(biāo)準(zhǔn)修改起草工作組在2009年公布了新版驗(yàn)鈔機(jī)標(biāo)準(zhǔn)GB 16999-2010,要求驗(yàn)鈔機(jī)增加紙幣冠字號識(shí)別功能,因此在點(diǎn)鈔機(jī)中嵌入紙幣冠字號識(shí)別功能已經(jīng)成為最新的研究課題。
受機(jī)器性能或鈔票本身污損等影響,驗(yàn)鈔機(jī)對鈔票上冠字號進(jìn)行拍攝或掃描時(shí),會(huì)產(chǎn)生一些干擾,使得字符發(fā)生粘連,這樣造成驗(yàn)鈔機(jī)無法正確識(shí)別人民幣的冠字號,使得其無法達(dá)到《人民幣鑒別儀通用技術(shù)條件》中規(guī)定的冠字號碼誤識(shí)率小于0.03%的要求,其中,冠字號碼誤識(shí)率是指發(fā)生冠字號碼誤識(shí)的紙幣數(shù)量與實(shí)際識(shí)別紙幣數(shù)量的比率。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的目的在于克服現(xiàn)有技術(shù)的不足,提出一種粘連字符可分割的人民幣冠字號識(shí)別方法,以有效地分割粘連字符,減小冠字號碼誤識(shí)率。
為實(shí)現(xiàn)上述發(fā)明目的,本發(fā)明粘連字符可分割的人民幣冠字號識(shí)別方法,其特征在于,包括以下步驟:
(1)、字符分割
1.1)、字符水平粗分割
輸入為圖像傳感器所采集的冠字號灰度圖像,并進(jìn)行二值化處理,并然后進(jìn)行垂直投影解析,在水平位置投影值為0值處,進(jìn)行垂直切分,得到字符的粗分割圖像;
1.2)、字符水平細(xì)分割
1.2.1)、檢測粗分割得到的字符圖像的寬度:若寬度大于單個(gè)字符圖像的最大寬度Dmax,將該字符圖像視為異常字符圖像,轉(zhuǎn)步驟1.2.2);否則將該字符圖像視為單個(gè)字符圖像,繼續(xù)檢測下一個(gè)字符圖像,直到檢測完最后一個(gè)字符圖像并結(jié)束字符分割;
1.2.2)、統(tǒng)計(jì)異常字符圖像的垂直投影曲線,在包含水平中心坐標(biāo)的字符圖像水平區(qū)間的子區(qū)間[xl+s,xr-s]內(nèi)尋找垂直投影曲線的最小值點(diǎn),并將該點(diǎn)作為粘連字符分割點(diǎn),其中,xl,xr為粗分割得到字符圖像水平方向的左右坐標(biāo),s為子區(qū)間設(shè)定參數(shù),根據(jù)具體情況設(shè)定,其值越大,子區(qū)間越??;
1.2.3)、以步驟1.2.2)得到的粘連字符分割點(diǎn)對異常字符圖像做垂直切分,并判斷切分后的左右字符圖像的字符寬度,如果該字符圖像寬度小于最小字符圖像寬度Dmin,則舍棄該字符圖像,反之保留該字符圖像,然后返回步驟1.2),繼續(xù)檢測下一個(gè)字符圖像;
1.3)、字符垂直分割
將步驟1.2)得到的字符圖像進(jìn)行水平投影解析,在投影值為0值字符圖像去除即將字符圖像上下空白部分切除;
(2)、字符識(shí)別
將步驟(1)字符分割得到的單個(gè)字符圖像經(jīng)過字符圖像大小歸一化后,按照水平切分順序,依次送入訓(xùn)練好的卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行識(shí)別,得到相應(yīng)的字符;
(3)、把所有的識(shí)別出來的字符,按照切分順序進(jìn)行組合,得到冠字號(碼)。
本發(fā)明的目的是這樣實(shí)現(xiàn)的。
本發(fā)明粘連字符可分割的人民幣冠字號識(shí)別方法,通過水平細(xì)分割即:通過寬度判定大于單個(gè)字符圖像最大寬度Dmax的為異常字符圖形即粘連字符圖像,并通過異常字符圖像的垂直投影曲線,在設(shè)定的子區(qū)間尋找最小值點(diǎn)作為字符分割點(diǎn),然后進(jìn)行垂直切分,如果切分處理的字符圖像大于最小字符圖像寬度Dmin,則保留該字符圖像,這樣將粘連字符分割開來,提高預(yù)處理過程的字符分割正確率,減小冠字號碼誤識(shí)率。
附圖說明
圖1是本發(fā)明粘連字符可分割的人民幣冠字號識(shí)別方法一種具體實(shí)施方式流程圖;
圖2是存在粘連字符的冠字號灰度圖像一具體實(shí)例圖;
圖3是圖2所示冠字號灰度圖像的垂直投影曲線圖;
圖4是圖2所示冠字號灰度圖像進(jìn)行水平細(xì)分割得到的字符圖像;
圖5是圖1所示卷積神經(jīng)網(wǎng)絡(luò)一具體實(shí)施結(jié)構(gòu)圖。
具體實(shí)施方式
下面結(jié)合附圖對本發(fā)明的具體實(shí)施方式進(jìn)行描述,以便本領(lǐng)域的技術(shù)人員更好地理解本發(fā)明。需要特別提醒注意的是,在以下的描述中,當(dāng)已知功能和設(shè)計(jì)的詳細(xì)描述也許會(huì)淡化本發(fā)明的主要內(nèi)容時(shí),這些描述在這里將被忽略。
圖1是本發(fā)明粘連字符可分割的人民幣冠字號識(shí)別方法一種具體實(shí)施方式流程圖。
在本實(shí)施例中,如圖1所述,本發(fā)明粘連字符可分割的人民幣冠字號識(shí)別方法包括以下步驟:
一、字符分割
S101、輸入為圖像傳感器所采集的8比特灰度冠字號圖像(輸入圖像),進(jìn)行二值化處理,得到二值化圖像;在本實(shí)施例中,二值化處理后,進(jìn)行了取反操作,即0變?yōu)?55,255變?yōu)?,這樣字符就變?yōu)榱税咨?,而背景變?yōu)榱撕谏?/p>
S102、將二值化圖像進(jìn)行垂直投影解析,在水平位置投影值為0值處即該處無垂直方向?yàn)?55的像素點(diǎn)個(gè)數(shù)為0,進(jìn)行垂直切分,得到字符的粗分割圖像;
在本實(shí)施例中,步驟S101、S102即為字符水平粗分割。
S103、粘連字符檢測及分割即字符水平細(xì)分割;
在本實(shí)施例中,如圖2所示,冠字號圖像采集過程中可能會(huì)由于噪聲和污損導(dǎo)致字符之間存在粘連,如果采用傳統(tǒng)的垂直投影分割法即步驟S101、S102的方法直接進(jìn)行分割,U和F會(huì)被視為一個(gè)字符進(jìn)行分割,顯然分割結(jié)果是錯(cuò)誤的,這會(huì)導(dǎo)致無法識(shí)別或識(shí)別錯(cuò)誤。同時(shí),最后一個(gè)字符0由于噪聲導(dǎo)致字符寬度大于Dmax,也被視為異常字符。
在本發(fā)明中,采用以下方法進(jìn)行字符水平細(xì)分割,即:
S1031、檢測粗分割得到的字符圖像的寬度:若寬度大于單個(gè)字符圖像的最大寬度Dmax,將該字符圖像視為異常字符圖像,轉(zhuǎn)步驟S1032;否則將該字符圖像視為單個(gè)字符圖像,繼續(xù)檢測下一個(gè)字符圖像,直到檢測完最后一個(gè)字符圖像并結(jié)束字符分割;
S1032、統(tǒng)計(jì)異常字符圖像的垂直投影曲線,在包含水平中心坐標(biāo)的字符圖像水平區(qū)間的子區(qū)間[xl+s,xr-s]內(nèi)尋找垂直投影曲線的最小值點(diǎn)即該點(diǎn)垂直方向?yàn)?55的像素點(diǎn)個(gè)數(shù)最少,并將該點(diǎn)作為粘連字符分割點(diǎn),其中,xl,xr為粗分割得到字符圖像水平方向的左右坐標(biāo),s為子區(qū)間設(shè)定參數(shù),根據(jù)具體情況設(shè)定,其值越大,子區(qū)間越小;在本實(shí)施例中,字符圖像大小采用像素點(diǎn)表示,參數(shù)s=3,即3個(gè)像素點(diǎn)
S1033、以步驟S1032得到的粘連字符分割點(diǎn)對異常字符圖像做垂直切分,并判斷切分后的左右字符圖像的字符寬度,如果該字符圖像寬度小于最小字符圖像寬度Dmin,則舍棄該字符圖像,反之保留該字符圖像,然后返回步驟1.2),繼續(xù)檢測下一個(gè)字符圖像;
采用上述字符水平細(xì)分割方法后,得到圖3用黑色粗線標(biāo)注的兩個(gè)粘連字符圖像分割坐標(biāo),第一個(gè)異常字符圖像分割后得到兩個(gè)字符,字符寬度都大于字符最小寬度Dmin,因此都保留下來,第二個(gè)異常字符分割后得到兩個(gè)字符,粘連分割點(diǎn)左邊的區(qū)域?qū)挾却笥贒min,保留字符,右邊的區(qū)域?qū)挾刃∮贒min,因此舍棄。最后得到正確分割后的十個(gè)字符,如圖4所示。
S104、字符垂直分割
將步驟S103得到的字符圖像進(jìn)行水平投影解析,在投影值為0值字符圖像去除即將字符圖像上下空白部分切除。
二、字符識(shí)別
S201、將步驟一字符分割得到的單個(gè)字符圖像經(jīng)過字符圖像大小歸一化。在本實(shí)施例中,歸一化尺寸為14x14。
S202、歸一化尺寸后的字符圖像,按照水平切分順序,依次送入訓(xùn)練好的卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行識(shí)別,得到相應(yīng)的字符。
與相傳統(tǒng)模板匹配和人工提取字符特征的識(shí)別方法相比,卷積神經(jīng)網(wǎng)絡(luò)具有識(shí)別率高,自動(dòng)提取字符圖像的各種深層次特征的特點(diǎn)。在本實(shí)施例中,為了減少對資源的消耗,提高識(shí)別速度,同時(shí)兼顧識(shí)別的冠字號碼正確率(冠字號碼誤識(shí)率),對傳統(tǒng)的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行了簡化。
在本實(shí)施例中,如圖5所示,卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)是以LeNet5架構(gòu)為基礎(chǔ),簡化操作為:
1、不包含輸入層,LeNet5架構(gòu)的卷積神經(jīng)網(wǎng)絡(luò)共有7層,而在本實(shí)施例中,卷積神經(jīng)網(wǎng)絡(luò)共有5層,即減少了C5層和F6層,C5層為120個(gè)特征圖組成的卷積層,F(xiàn)6為全連接層,去掉這兩層能夠減少大量的訓(xùn)練參數(shù),節(jié)約了計(jì)算資源和存儲(chǔ)器資源,S4層特征圖直接采用全連接方式連接到輸出層,無需中間隱含層;
2、減少每層的特征圖數(shù)量,LeNet5架構(gòu)的卷積神經(jīng)網(wǎng)絡(luò)C3層特征圖含有16個(gè)特征圖,而本發(fā)明C3層特征圖只含有6個(gè)特征圖;
3、S2層特征圖到C3特征圖采用全連接的方式,而不是LeNet5架構(gòu)的卷積神經(jīng)網(wǎng)絡(luò)中的部分連接方式,采用這種方式雖然增加了一部分連接參數(shù),但是降低了FPGA實(shí)現(xiàn)難度。
4、在本實(shí)施例中,下采樣層采用的是平均池化,無需訓(xùn)練參數(shù),每層只需訓(xùn)練一個(gè)偏置參數(shù)即可。
具體而言,在本實(shí)施例中,所述的卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行識(shí)別為:
S2021、將大小歸一化的14x14單個(gè)字符圖像進(jìn)行卷積,得到包含6個(gè)特征圖的C1層特征圖,每個(gè)特征圖的大小為12x12;
S2022、對C1層特征圖進(jìn)行下采樣,得到包含6個(gè)特征圖的S2層特征圖,每個(gè)特征圖的大小為6x6;
S2023、對S2層特征圖進(jìn)行卷積,得到包含6個(gè)特征圖的C3層特征圖,每個(gè)特征圖的大小為4x4;
S2024、對C3層特征圖進(jìn)行下采樣,得到包含6個(gè)特征圖的S4層特征圖,每個(gè)特征圖的大小為2x2;
S2025、S4層特征圖直接采用全連接方式連接到輸出層,輸出相應(yīng)的字符。
三、把所有的識(shí)別出來的字符,按照切分順序進(jìn)行組合,得到冠字號(碼)。冠字號。
在本實(shí)施例中,先在PC上位機(jī)軟件平臺(tái)上構(gòu)建并訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò),然后將訓(xùn)練好的卷積神經(jīng)網(wǎng)絡(luò)下載到驗(yàn)鈔機(jī)的FPGA芯片中對采集分割得到的字符圖像進(jìn)行識(shí)別。
盡管上面對本發(fā)明說明性的具體實(shí)施方式進(jìn)行了描述,以便于本技術(shù)領(lǐng)域的技術(shù)人員理解本發(fā)明,但應(yīng)該清楚,本發(fā)明不限于具體實(shí)施方式的范圍,對本技術(shù)領(lǐng)域的普通技術(shù)人員來講,只要各種變化在所附的權(quán)利要求限定和確定的本發(fā)明的精神和范圍內(nèi),這些變化是顯而易見的,一切利用本發(fā)明構(gòu)思的發(fā)明創(chuàng)造均在保護(hù)之列。