一種基于白光圖像及紅外圖像的支票印刷體數(shù)字識別系統(tǒng)及其方法
【專利摘要】本發(fā)明公開了一種基于白光圖像及紅外圖像的支票印刷體數(shù)字識別系統(tǒng),包括用于獲取圖像的圖像采集設(shè)備;對獲取的圖像進(jìn)行處理的高速處理模塊,高速處理模塊包括傾斜校正模塊和數(shù)字印刷體識別模塊;以及對處理結(jié)果進(jìn)行顯示的顯示模塊。利用圖像采集設(shè)備,對待測支票進(jìn)行掃描,采集支票在白光與紅外光下所拍攝的兩幅圖像;利用傾斜校正模塊對得到的兩幅圖像進(jìn)行傾斜校正,在傾斜校正后圖像的基礎(chǔ)上利用數(shù)字印刷體識別模塊進(jìn)行數(shù)字印刷體的識別處理;將校正后的圖像以及數(shù)字識別結(jié)果傳輸?shù)斤@示設(shè)備進(jìn)行顯示。本發(fā)明的傾斜校正算法和印刷體數(shù)字字符的定位、分割、識別算法根據(jù)支票圖像自身特性具有準(zhǔn)確性高、實(shí)時性好、魯棒性強(qiáng)的特點(diǎn)。
【專利說明】一種基于白光圖像及紅外圖像的支票印刷體數(shù)字識別系統(tǒng) 及其方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種基于白光圖像及紅外圖像的支票印刷體數(shù)字識別系統(tǒng)及其方法, 屬于數(shù)字圖像處理【技術(shù)領(lǐng)域】。
【背景技術(shù)】
[0002]隨著支票在金融交易中更加普遍和頻繁地使用以及金融領(lǐng)域人工成本的增加,對 于支票上面的信息進(jìn)行機(jī)器自動提取的需要變得越來越迫切。
[0003]支票作為一種金融活動的載體,國家對其大小、排版、制作都有嚴(yán)格的規(guī)定。最新 國家規(guī)定的支票尺寸大小固定,例如支票尺寸大小為80*225mm,精度±1.5mm。在支票信息 排版上,新版本支票其數(shù)字印刷體部分集中在右上角,分為上下兩行。第一行八個數(shù)字,其 中前三位數(shù)字表示銀行機(jī)構(gòu)代號;第四位數(shù)字為預(yù)留號,暫定為0 ;第五和第六位數(shù)字表示 省別地區(qū)代碼;第七位數(shù)字表示支票種類,其中I為現(xiàn)金支票,2為轉(zhuǎn)賬支票,3為清分機(jī)支 票,4為銀行匯票,5為銀行承兌匯票,6為商業(yè)承兌匯票,7為非清分機(jī)本票,8為清分機(jī)本 票;第八位數(shù)字表示印刷識別碼。第二行八個數(shù)字表示流水號??梢钥闯?,雖然印刷體數(shù)字 只有短短的16位,但是其中涉及的信息量是必不可少的,因此對于這兩行印刷體數(shù)字的識 別成為支票自動識別過程中的必要步驟。
【發(fā)明內(nèi)容】
[0004]本發(fā)明針對金融行業(yè)智能識別支票上數(shù)字印刷體的需要,同時為了實(shí)現(xiàn)識別的有 效性和實(shí)時性,提供了一種基于白光圖像及紅外圖像的支票印刷體數(shù)字識別系統(tǒng)及其方 法。該系統(tǒng)利用在白光光照和紅外光照條件下采集到的圖像先進(jìn)行圖像角度判斷確定是否 存在傾斜,如果傾斜采用雙立方差值進(jìn)行傾斜較真,在此基礎(chǔ)上進(jìn)行印刷體數(shù)字的定位、分 害I]、識別。其中很多處理過程都緊密依據(jù)支票圖像這一特殊情況進(jìn)行算法改進(jìn)和策略選擇, 使該系統(tǒng)既能滿足金融行業(yè)準(zhǔn)確性的需要,又能滿足用戶對實(shí)時性體驗(yàn)的需要。
[0005]本發(fā)明的主要技術(shù)內(nèi)容如下:
[0006]一種基于白光圖像及紅外圖像的支票印刷體數(shù)字識別系統(tǒng),包括用于獲取圖像的 圖像采集設(shè)備;對獲取的圖像進(jìn)行處理的高速處理模塊,所述高速處理模塊包括傾斜校正 模塊和數(shù)字印刷體識別模塊;以及對處理結(jié)果進(jìn)行顯示的顯示模塊。
[0007]上述圖像采集設(shè)備為德國Ernst Reiner公司的圖像采集設(shè)備RS893。
[0008]一種基于白光圖像及紅外圖像的支票印刷體數(shù)字識別方法,包括以下步驟:
[0009](I)、利用上述的圖像采集設(shè)備,對待測支票進(jìn)行掃描,采集支票在白光與紅外光 下所拍攝的兩幅圖像;
[0010](2)、利用上述的傾斜校正模塊對步驟(I)得到的兩幅圖像進(jìn)行傾斜校正,在傾斜 校正后圖像的基礎(chǔ)上利用上述的數(shù)字印刷體識別模塊進(jìn)行數(shù)字印刷體的識別處理;
[0011](3)、將步驟(2)校正后的圖像以及數(shù)字識別結(jié)果傳輸?shù)斤@示設(shè)備進(jìn)行顯示。[0012]上述步驟(2)中的傾斜校正的步驟有:
[0013](4a)、取出白光下采集的支票圖像;
[0014](4b)、定位傾斜校正檢測角度的矩形區(qū)域;
[0015](4c)、對確定的矩形區(qū)域圖像進(jìn)行灰度化,對灰度圖像進(jìn)行Canny邊緣檢測;
[0016](4d)、對經(jīng)過Canny邊緣檢測的圖像采用Hough變換的方法統(tǒng)計不同角度直線的 個數(shù);
[0017](4e)、得到傾斜校正角度以后帶入校正函數(shù),采用立方插值得到校正后圖像。
[0018]上述步驟(2)中數(shù)字印刷體的識別處理是基于模板匹配的,其算法包括如下步 驟:
[0019](5a)、定位校正后圖像中的支票圖像部分;
[0020](5b)、對白光下采集圖像進(jìn)行右上角第一行八個數(shù)字印刷體的定位;對于右上角 第二行八個數(shù)字印刷體,采用紅外光照下圖像進(jìn)行定位;
[0021](5c)、對于定位后的數(shù)字印刷體區(qū)域進(jìn)行字符分割;
[0022](5d)、對于分割出來的每個數(shù)字字符進(jìn)行模板匹配得到識別結(jié)果進(jìn)行輸出。
[0023]上述步驟(5b)中對第一行數(shù)字印刷體的定位的方法是:先把步驟(5a)中白光下 采集的圖像灰度二值化,對二值化圖像進(jìn)行中值濾波去除單個黑點(diǎn)對定位的干擾,對中值 濾波后圖像進(jìn)行膨脹將數(shù)字印刷體部分連成一片,根據(jù)數(shù)字印刷體在支票圖像右上角這一 先驗(yàn)條件以及設(shè)定連通域區(qū)間的長寬參數(shù)范圍來定位數(shù)字印刷體部分。
[0024]上述步驟(5c)中對定位后的第一行數(shù)字印刷體的字符分割的方法采用垂直投影 法,統(tǒng)計每一列黑色像素點(diǎn)個數(shù),如果該列黑色像素點(diǎn)個數(shù)小于設(shè)定的閾值,那么該列被認(rèn) 為是不存在字符列。
[0025]上述步驟(5b)中對第二行數(shù)字印刷體的定位的方法是:先把步驟(5a)中紅外光 下采集的圖像灰度二值化,對二值化圖像進(jìn)行中值濾波去除單個黑點(diǎn)對定位的干擾,遍歷 每一行黑色像素點(diǎn)個數(shù),記錄第一行黑色像素點(diǎn)數(shù)目大于閾值的行坐標(biāo),記為v_StartH, 并統(tǒng)計該行第一個和最后一個黑色像素點(diǎn)的列坐標(biāo),分別記為v_StartW和v_EndW ;從v_ StartH開始,往下遍歷8行記錄每一行初始和結(jié)尾黑點(diǎn)列坐標(biāo),取初始列坐標(biāo)最小值賦 給v_StartW ;取結(jié)尾列坐標(biāo)最大值賦給v_EndW ;最終取初始行為v_StartH,結(jié)尾行為v_ StartH+25,初始列為v_StartW,結(jié)尾列為v_EndW+2的區(qū)域進(jìn)行字符分割。
[0026]上述步驟(5c)中對第二行數(shù)字印刷體的字符分割的方法是:統(tǒng)計第一個字符起 始列后第12列,即v_EndW+12列進(jìn)行黑色像素點(diǎn)數(shù)目,記為v_Amountl,如果v_Amountl大 于閾值,則認(rèn)為第一個字符不是1,第一個字符所占寬度為19,字符間間隔為3,根據(jù)這兩個 信息可以推斷第二個字符位置,后面字符位置的確定同理;如果v_Amountl小于閾值,則認(rèn) 為第一個字符是1,第一個字符所占寬度為14,與第二個字符之間間隔為5,從第二個字符 開始,每個字符所占寬度以及字符之間的間隔又變?yōu)?9和3 ;最后一個字符寬度為22,將其 結(jié)束列坐標(biāo)和v_EndW+2進(jìn)行比較取兩者中的較小值。
[0027]上述步驟(5d)對于分割出來的每個數(shù)字字符進(jìn)行模板匹配得到識別結(jié)果進(jìn)行輸 出的特征是:
[0028]對分割出來的單個字符先進(jìn)行面積擴(kuò)充;對于第一行數(shù)字所采用的是白底黑字大 小為22*32的模板,對于第二行數(shù)字所采用的是白底黑字大小為20*32的模板,將垂直投影得到的單個字符進(jìn)行面積擴(kuò)充,擴(kuò)充的原則是將已有分割出的字符置于擴(kuò)充圖像的中間位 置,擴(kuò)充的像素值為255,第一行每個字符擴(kuò)充為26*36大小,第二行每個字符擴(kuò)充為24*36 大?。?br>
[0029]匹配算法采用歸一化相關(guān)匹配法:單個字符與每個模板進(jìn)行歸一化相關(guān)匹配將得 到10個不同大小的值,其中匹配值最大的對應(yīng)的數(shù)字作為識別結(jié)果,將每個字符的最大相 似度值記錄下來,如果在8個最大相似度值中小于0.9的個數(shù)超過閾值個數(shù),那么提示用戶 識別結(jié)果不夠準(zhǔn)確,建議進(jìn)行人工識別。
[0030]借由上述技術(shù)方案,本發(fā)明至少具有下列優(yōu)點(diǎn):
[0031]本發(fā)明科學(xué)合理,充分考慮到了支票圖像規(guī)格化的特點(diǎn)。在識別之前增加傾斜校 正這一預(yù)處理,使得識別更加的準(zhǔn)確。
[0032]該系統(tǒng)充分考慮到了支票圖像特點(diǎn),具有魯棒、快速、準(zhǔn)確的識別效果和友好的用 戶體驗(yàn),因此有很強(qiáng)的市場應(yīng)用潛力。
[0033]本發(fā)明的【具體實(shí)施方式】由以下實(shí)施例及其附圖詳細(xì)給出。
【專利附圖】
【附圖說明】
[0034]圖1為本發(fā)明的系統(tǒng)結(jié)構(gòu)示意圖;
[0035]圖2為本發(fā)明的圖像傾斜校正的流程圖;
[0036]圖3為本發(fā)明的數(shù)字印刷體識別的流程圖。
【具體實(shí)施方式】
[0037]為更進(jìn)一步闡述本發(fā)明為達(dá)成預(yù)定發(fā)明目的所采取的技術(shù)手段及功效,以下結(jié) 合附圖及較佳實(shí)施例,對依據(jù)本發(fā)明提出的其【具體實(shí)施方式】、結(jié)構(gòu)、特征及其功效,詳細(xì)說 明如后。
[0038]如圖1所示,一種基于白光圖像及紅外圖像的支票印刷體數(shù)字識別系統(tǒng),包括用 于獲取圖像的圖像采集設(shè)備;對獲取的圖像進(jìn)行處理的高速處理模塊,所述高速處理模塊 包括傾斜校正模塊和數(shù)字印刷體識別模塊;以及對處理結(jié)果進(jìn)行顯示的顯示模塊。
[0039]作為優(yōu)選方案,上述圖像采集設(shè)備為德國Ernst Reiner公司的圖像采集設(shè)備 RS893。
[0040]一種基于白光圖像及紅外圖像的支票印刷體數(shù)字識別方法,包括以下步驟:
[0041](I)、利用上述的圖像采集設(shè)備,對待測支票進(jìn)行掃描,采集支票在白光與紅外光 下所拍攝的兩幅圖像;
[0042](2)、利用上述的傾斜校正模塊對步驟(I)得到的兩幅圖像進(jìn)行傾斜校正,在傾斜 校正后圖像的基礎(chǔ)上利用上述的數(shù)字印刷體識別模塊進(jìn)行數(shù)字印刷體的識別處理;
[0043](3)、將步驟(2)校正后的圖像以及數(shù)字識別結(jié)果傳輸?shù)斤@示設(shè)備進(jìn)行顯示。
[0044]如圖2所示,上述步驟(2)中的傾斜校正的步驟有:
[0045](a)、取出白光下采集的支票圖像。
[0046]( b )、定位傾斜校正檢測角度的矩形區(qū)域。
[0047]由于支票圖像自身的性質(zhì),其中間區(qū)域存在一黑色邊框的矩形,在求取圖像傾斜 角度的時候,只要對該區(qū)域進(jìn)行不同傾角直線的數(shù)目統(tǒng)計。對于一幅標(biāo)準(zhǔn)的沒有傾斜的支票圖像,其寬度為1336,高度為628,所取區(qū)域左上角坐標(biāo)為(97,150)(其中,97為寬度坐 標(biāo),150為高度坐標(biāo)),右下角坐標(biāo)為(725,445)。但是對于一幅傾斜的支票圖像,矩陣區(qū)域 的絕對位置要轉(zhuǎn)換為相對位置,通過新的左上角和右下角坐標(biāo)確定統(tǒng)計區(qū)域。
[0048](C)、對確定的矩形區(qū)域圖像進(jìn)行灰度化,對灰度圖像進(jìn)行Canny邊緣檢測。經(jīng)過 邊緣檢測后圖像中待檢測直線變少,從而有利于Hough變換檢測角度的速度和精度的提 升。采用Canny邊緣檢測算法的優(yōu)點(diǎn)在于可以通過設(shè)置上限閾值和下限閾值來將斷斷續(xù)續(xù) 的線連接起來。Canny算法檢測邊緣主要步驟有:1)用3*3高斯濾波器進(jìn)行濾波,消除噪 聲;2)針對每一個像素,計算橫向與縱向兩方向的微分近似,以得到像素的梯度大小和方 向;3)對梯度進(jìn)行“非極大抑制”(非局部最大值置0);4)對梯度取兩次閾值;5)對邊緣進(jìn) 行連接。
[0049](d)、對經(jīng)過Canny邊緣檢測的圖像采用Hough變換的方法統(tǒng)計不同角度直線的個 數(shù)。由于支票圖像在放置的時候比較謹(jǐn)慎,一般圖像的傾角都在-15° —15°之間,這里考 慮-45° — 45°之間的角度。如果斜率超過2(63.45° ),則不予統(tǒng)計(主要排除無窮大和 無窮小對角度計算的影響)。定義三個斜率變量來記錄斜率,其中默認(rèn)三個斜率變量初值為 直線數(shù)目最多對應(yīng)的斜率,如果存在其他斜率的直線數(shù)目和最多數(shù)目相同,將該斜率記錄 到另外的斜率變量當(dāng)中;如果不存在,則另外兩個斜率變量不做修改。將斜率換算得到對 應(yīng)的角度,角度范圍控制在-45° — 45°之間。初始取三個角度中中間大小的角度作為校 正函數(shù)輸入角度(這主要是為了排除0°角對角度檢測的影響,因?yàn)樵诤芏嗲闆r下,檢測出 數(shù)目最多的角度為0° ;如果圖像沒有傾斜,那么另外兩個角度也將為0),如果另外兩個角 度中任何一個和初始中間角度之間差值小于0.05° (0.1°就可以滿足精度要求),那么就 將角度相加的和除以2得到最終的傾斜校正函數(shù)輸入角度。
[0050](e)、得到傾斜校正角度以后帶入校正函數(shù),采用立方插值得到校正后圖像。
[0051]得到傾斜校正角度以后帶入校正函數(shù),如果角度為0,那么就跳過校正函數(shù)的執(zhí)行 (節(jié)省時間);如果角度不為0,校正函數(shù)中采用雙立方差值得到校正后圖像(采集到的兩幅 圖像都需要)。雙立方差值可以很好的保存圖像的細(xì)節(jié),這點(diǎn)對于支票圖像至關(guān)重要。
[0052]如圖3所示,上述步驟(2)中數(shù)字印刷體的識別處理是基于模板匹配的,其算法包 括如下步驟:
[0053](a)、定位校正后圖像中的支票圖像部分;取白光下采集的圖像,通過與標(biāo)準(zhǔn)支票 圖像進(jìn)行模板匹配的方法得到支票圖像區(qū)域坐標(biāo),根據(jù)該系列坐標(biāo)可以得到兩幅圖像中支 票部分。
[0054](b)、對白光下采集圖像進(jìn)行右上角第一行八個數(shù)字印刷體的定位;對于右上角第 二行八個數(shù)字印刷體,采用紅外光照下圖像進(jìn)行定位。
[0055]第一行數(shù)字印刷體的定位的方法是:先把白光下采集的圖像進(jìn)行灰度二值化,對 二值化圖像進(jìn)行中值濾波去除單個黑點(diǎn)對定位的干擾,對中值濾波后圖像進(jìn)行膨脹將數(shù)字 印刷體部分連成一片,根據(jù)數(shù)字印刷體在支票圖像右上角這一先驗(yàn)條件以及設(shè)定連通域區(qū) 間的長寬參數(shù)范圍來定位數(shù)字印刷體部分。
[0056]第二行數(shù)字印刷體的定位的方法是:先把支票圖像進(jìn)行灰度二值化,其中白色背 景,黑色信息。對二值化圖像進(jìn)行中值濾波去除單個黑點(diǎn)對定位的干擾。遍歷每一行黑 色像素點(diǎn)個數(shù),記錄第一行黑色像素點(diǎn)數(shù)目大于閾值(參考閾值為15)的行坐標(biāo),記為v_StartH,并統(tǒng)計該行第一個和最后一個黑色像素點(diǎn)的列坐標(biāo),分別記為v_StartW和v_ EndW。紅外光照下得到的圖像中流水號信息容易受到黑色打印的付款行名稱信息的影響, 通過對大量支票圖像的統(tǒng)計發(fā)現(xiàn),付款行名稱信息其高度小于流水號信息,并且如果對流 水號信息有所干擾,其所在位置不會超過流水號字符高度的2/3處。由于流水號字符高度 為定值(26個像素點(diǎn)高度),故從v_StartH開始,往下遍歷8 (小于26的1/3)行記錄每一 行初始和結(jié)尾黑點(diǎn)列坐標(biāo),取初始列坐標(biāo)最小值賦給v_StartW ;取結(jié)尾列坐標(biāo)最大值賦給 v_EndW。最終取初始行為v_StartH,結(jié)尾行為v_StartH+25 (沒有加26是為了去除流水號 剛好下一行連著付款行信息這一種情況對于識別的干擾),初始列為v_StartW,結(jié)尾列為v_ Endff+2 (加2是為了充分保留字符I下半部分的信息)的區(qū)域進(jìn)行字符分割。
[0057](C)、對于定位后的數(shù)字印刷體區(qū)域進(jìn)行字符分割。
[0058]定位后的第一行數(shù)字印刷體的字符分割的方法:采用改進(jìn)的垂直投影的算法,統(tǒng) 計每一列黑色像素點(diǎn)(字符部分為黑色,背景為白色)個數(shù),如果該列黑色像素點(diǎn)個數(shù)小于 設(shè)定的閾值(參考閾值為15),那么該列被認(rèn)為是不存在字符列。
[0059]定位后的第二行數(shù)字印刷體的字符分割的方法是:由于存在付款行信息與流水號 信息重疊這種情況,所以對流水號單個字符的分割就不能采用垂直投影的方法。新方法思 路是:由于單個字符所占寬度以及字符與字符之間的間隔是個固定值(分別為18和4),因 此可以根據(jù)這樣的先驗(yàn)信息進(jìn)行單個字符的分割。但是第一個字符是否為I對后續(xù)字符能 否準(zhǔn)確定位影響很大,采用的策略是:統(tǒng)計第一個字符起始列后第12列,即v_EndW+12列 進(jìn)行黑色像素點(diǎn)數(shù)目,記為v_Amountl,如果v_Amountl大于閾值(參考閾值為3),則認(rèn)為第 一個字符不是1,第一個字符所占寬度為19 (單個字符所占寬度加1),字符間間隔為3 (由 于單個字符寬度加1,所以對應(yīng)字符間隔減1),根據(jù)這兩個信息可以推斷第二個字符位置, 后面字符位置的確定同理;如果v_Amountl小于閾值,則認(rèn)為第一個字符是1,第一個字符 所占寬度為14,與第二個字符之間間隔為5,從第二個字符開始,每個字符所占寬度以及字 符之間的間隔又變?yōu)?9和3。最后一個字符寬度為22 (算上間隔),將其結(jié)束列坐標(biāo)和v_ Endff+2進(jìn)行比較取兩者中的較小值。
[0060](d)、對于分割出來的每個數(shù)字字符進(jìn)行模板匹配得到識別結(jié)果進(jìn)行輸出。其特征 是:
[0061]對分割出來的單個字符先要進(jìn)行面積擴(kuò)充。進(jìn)行面積擴(kuò)充的目的是,對于第一行 數(shù)字所采用的是白底黑字大小為22*32的模板,對于第二行數(shù)字所采用的是白底黑字大小 為20*32的模板,采用模板匹配的方法進(jìn)行識別,需要單個字符圖像的長寬都大于模板長 寬,要不然程序會報錯。因此將垂直投影得到的單個字符要進(jìn)行面積擴(kuò)充,擴(kuò)充的原則是將 已有分割出的字符置于擴(kuò)充圖像的中間位置,擴(kuò)充的像素值為255,第一行每個字符擴(kuò)充為 26*36大小,第二行每個字符擴(kuò)充為24*36大小。
[0062]匹配算法采用歸一化相關(guān)匹配法。單個字符與每個模板進(jìn)行歸一化相關(guān)匹配將得 到10個不同大小的值,其中匹配值最大的對應(yīng)的數(shù)字作為識別結(jié)果,將每個字符的最大相 似度值記錄下來,如果在8個最大相似度值中小于0.9 (如果匹配的很好的話,將會在0.9 以上)的個數(shù)超過閾值個數(shù)(參考閾值為2),那么提示用戶識別結(jié)果不夠準(zhǔn)確,建議進(jìn)行人 工識別。
[0063]以上所述,僅是本發(fā)明的較佳實(shí)施例而已,并非對本發(fā)明作任何形式上的限制,雖然本發(fā)明已以較佳實(shí)施例揭露如上,然而并非用以限定本發(fā)明,任何熟悉本專業(yè)的技術(shù)人 員,在不脫離本發(fā)明技術(shù)方案范圍內(nèi),當(dāng)可利用上述揭示的技術(shù)內(nèi)容作出些許更動或修飾 為等同變化的等效實(shí)施例,但凡是未脫離本發(fā)明技術(shù)方案的內(nèi)容,依據(jù)本發(fā)明的技術(shù)實(shí)質(zhì) 對以上實(shí)施例所作的任何簡單修改、等同變化與修飾,均仍屬于本發(fā)明技術(shù)方案的范圍內(nèi)。
【權(quán)利要求】
1.一種基于白光圖像及紅外圖像的支票印刷體數(shù)字識別系統(tǒng),其特征在于:包括用于獲取圖像的圖像采集設(shè)備;對獲取的圖像進(jìn)行處理的高速處理模塊,所述高速處理模塊包括傾斜校正模塊和數(shù)字印刷體識別模塊;以及對處理結(jié)果進(jìn)行顯示的顯示模塊。
2.根據(jù)權(quán)利要求1所述的一種基于紫外圖像特征的支票真?zhèn)舞b別系統(tǒng),其特征在于: 所述圖像采集設(shè)備為德國Ernst Reiner公司的圖像采集設(shè)備RS893。
3.一種基于白光圖像及紅外圖像的支票印刷體數(shù)字識別方法,其特征在于包括以下步驟:(1)、利用權(quán)利要求1所述的圖像采集設(shè)備,對待測支票進(jìn)行掃描,采集支票在白光與紅外光下所拍攝的兩幅圖像;(2)、利用權(quán)利要求1所述的傾斜校正模塊對步驟(1)得到的兩幅圖像進(jìn)行傾斜校正, 在傾斜校正后圖像的基礎(chǔ)上利用權(quán)利要求1所述的數(shù)字印刷體識別模塊進(jìn)行數(shù)字印刷體的識別處理;(3)、將步驟(2)校正后的圖像以及數(shù)字識別結(jié)果傳輸?shù)斤@示設(shè)備進(jìn)行顯示。
4.根據(jù)權(quán)利要求3所述的一種基于白光圖像及紅外圖像的支票印刷體數(shù)字識別方法, 其特征在于:所述步驟(2)中的傾斜校正的步驟有:(4a)、取出白光下采集的支票圖像;(4b)、定位傾斜校正檢測角度的矩形區(qū)域;(4c)、對確定的矩形區(qū)域圖像進(jìn)行灰度化,對灰度圖像進(jìn)行Canny邊緣檢測;(4d)、對經(jīng)過Canny邊緣檢測的圖像采用Hough變換的方法統(tǒng)計不同角度直線的個數(shù); (4e)、得到傾斜校正角度以后帶入校正函數(shù),采用立方插值得到校正后圖像。
5.根據(jù)權(quán)利要求3所述的一種基于白光圖像及紅外圖像的支票印刷體數(shù)字識別方法, 其特征在于:所述步驟(2)中數(shù)字印刷體的識別處理是基于模板匹配的,其算法包括如下步驟:(5a)、定位校正后圖像中的支票圖像部分;(5b)、對白光下采集圖像進(jìn)行右上角第一行八個數(shù)字印刷體的定位;對于右上角第二行八個數(shù)字印刷體,采用紅外光照下圖像進(jìn)行定位;(5c)、對于定位后的數(shù)字印刷體區(qū)域進(jìn)行字符分割;(5d)、對于分割出來的每個數(shù)字字符進(jìn)行模板匹配得到識別結(jié)果進(jìn)行輸出。
6.根據(jù)權(quán)利要求5所示的一種基于白光圖像及紅外圖像的支票印刷體數(shù)字識別方法, 其特征在于:所述步驟(5b)中對第一行數(shù)字印刷體的定位的方法是:先把步驟(5a)中白光下采集的圖像灰度二值化,對二值化圖像進(jìn)行中值濾波去除單個黑點(diǎn)對定位的干擾,對中值濾波后圖像進(jìn)行膨脹將數(shù)字印刷體部分連成一片,根據(jù)數(shù)字印刷體在支票圖像右上角這一先驗(yàn)條件以及設(shè)定連通域區(qū)間的長寬參數(shù)范圍來定位數(shù)字印刷體部分。
7.根據(jù)權(quán)利要求5所示的一種基于白光圖像及紅外圖像的支票印刷體數(shù)字識別方法, 其特征在于:所述步驟(5c)中對定位后的第一行數(shù)字印刷體的字符分割的方法采用垂直投影法,統(tǒng)計每一列黑色像素點(diǎn)個數(shù),如果該列黑色像素點(diǎn)個數(shù)小于設(shè)定的閾值,那么該列被認(rèn)為是不存在字符列。
8.根據(jù)權(quán)利要求5所示的一種基于白光圖像及紅外圖像的支票印刷體數(shù)字識別方法,其特征在于:所述步驟(5b)中對第二行數(shù)字印刷體的定位的方法是:先把步驟(5a)中紅外光下采集的圖像灰度二值化,對二值化圖像進(jìn)行中值濾波去除單個黑點(diǎn)對定位的干擾,遍歷每一行黑色像素點(diǎn)個數(shù),記錄第一行黑色像素點(diǎn)數(shù)目大于閾值的行坐標(biāo),記為v_StartH, 并統(tǒng)計該行第一個和最后一個黑色像素點(diǎn)的列坐標(biāo),分別記為v_StartW和v_EndW ;從v_ StartH開始,往下遍歷8行記錄每一行初始和結(jié)尾黑點(diǎn)列坐標(biāo),取初始列坐標(biāo)最小值賦給v_StartW ;取結(jié)尾列坐標(biāo)最大值賦給v_EndW ;最終取初始行為v_StartH,結(jié)尾行為v_ StartH+25,初始列為v_StartW,結(jié)尾列為v_EndW+2的區(qū)域進(jìn)行字符分割。
9.根據(jù)權(quán)利要求5所示的一種基于白光圖像及紅外圖像的支票印刷體數(shù)字識別方法, 其特征在于:所述步驟(5c)中對第二行數(shù)字印刷體的字符分割的方法是:統(tǒng)計第一個字符起始列后第12列,即v_EndW+12列進(jìn)行黑色像素點(diǎn)數(shù)目,記為v_Amountl,如果v_Amountl 大于閾值,則認(rèn)為第一個字符不是1,第一個字符所占寬度為19,字符間間隔為3,根據(jù)這兩個信息可以推斷第二個字符位置,后面字符位置的確定同理;如果v_Amountl小于閾值,則認(rèn)為第一個字符是1,第一個字符所占寬度為14,與第二個字符之間間隔為5,從第二個字符開始,每個字符所占寬度以及字符之間的間隔又變?yōu)?9和3 ;最后一個字符寬度為22,將其結(jié)束列坐標(biāo)和v_EndW+2進(jìn)行比較取兩者中的較小值。
10.根據(jù)權(quán)利要求5所示的一種基于白光圖像及紅外圖像的支票印刷體數(shù)字識別方法,其特征在于:所述步驟(5d)對于分割出來的每個數(shù)字字符進(jìn)行模板匹配得到識別結(jié)果進(jìn)行輸出的特征是:對分割出來的單個字符先進(jìn)行面積擴(kuò)充;對于第一行數(shù)字所采用的是白底黑字大小為 22*32的模板,對于第二行數(shù)字所采用的是白底黑字大小為20*32的模板,將垂直投影得到的單個字符進(jìn)行面積擴(kuò)充,擴(kuò)充的原則是將已有分割出的字符置于擴(kuò)充圖像的中間位置, 擴(kuò)充的像素值為255,第一行每個字符擴(kuò)充為26*36大小,第二行每個字符擴(kuò)充為24*36大小;匹配算法采用歸一化 相關(guān)匹配法:單個字符與每個模板進(jìn)行歸一化相關(guān)匹配將得到 10個不同大小的值,其中匹配值最大的對應(yīng)的數(shù)字作為識別結(jié)果,將每個字符的最大相似度值記錄下來,如果在8個最大相似度值中小于0.9的個數(shù)超過閾值個數(shù),那么提示用戶識別結(jié)果不夠準(zhǔn)確,建議進(jìn)行人工識別。
【文檔編號】G07D7/20GK103606220SQ201310669229
【公開日】2014年2月26日 申請日期:2013年12月10日 優(yōu)先權(quán)日:2013年12月10日
【發(fā)明者】徐文波, 鐘俠, 凌志峰, 霍冠英, 李慶武, 朱浩, 周亮基, 林少飛, 鄒相, 趙旦, 鐘宬 申請人:江蘇國光信息產(chǎn)業(yè)股份有限公司, 河海大學(xué)常州校區(qū)