應(yīng)用于票據(jù)影像字符識(shí)別的數(shù)字圖像處理系統(tǒng)及方法
【專利摘要】本發(fā)明公開了一種應(yīng)用于票據(jù)影像字符識(shí)別的數(shù)字圖像處理系統(tǒng)及方法,其中系統(tǒng)方法包括:影像參數(shù)檢測(cè)模塊,用于檢測(cè)票據(jù)影像參數(shù);影像傾斜檢測(cè)模塊,用于檢測(cè)票據(jù)影像中票面的傾斜程度;字符區(qū)域檢測(cè)模塊,用于對(duì)字符區(qū)域進(jìn)行定位;字符區(qū)域可識(shí)別檢測(cè)模塊,用于檢測(cè)字符區(qū)域中的字符參數(shù)和印章像素;字符匹配度檢測(cè)模塊,用于將字符區(qū)域中的字符與模板進(jìn)行匹配度檢測(cè);開口特征檢測(cè)模塊,用于檢測(cè)字符區(qū)域中的字符的開口特征。采用本發(fā)明可以在銀行票據(jù)影像交換的支票影像分析處理過程中提高票據(jù)影像字符識(shí)別正確率。
【專利說明】應(yīng)用于票據(jù)影像字符識(shí)別的數(shù)字圖像處理系統(tǒng)及方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及數(shù)字圖像處理及光學(xué)字符識(shí)別【技術(shù)領(lǐng)域】,尤其涉及應(yīng)用于票據(jù)影像字 符識(shí)別的數(shù)字圖像處理系統(tǒng)及方法。
【背景技術(shù)】
[0002] 隨著數(shù)字圖像處理、模式識(shí)別和人工智能的發(fā)展,光學(xué)字符識(shí)別(Optical Character Recognition, OCR)技術(shù)在金融領(lǐng)域,尤其是票據(jù)影像票面要素合法性檢驗(yàn)、票 據(jù)業(yè)務(wù)流程再造等方面得到了越來越多的應(yīng)用。目前光學(xué)字符識(shí)別系統(tǒng)主要處理流程如圖 1所示,大體可分為影像輸入、影像預(yù)處理、字符特征提取、字符匹配識(shí)別這四個(gè)步驟。
[0003] 第一個(gè)步驟是影像輸入,主要利用光學(xué)儀器對(duì)待識(shí)別的標(biāo)的物(如書籍、文件、證 件等)進(jìn)行掃描,從而生成相應(yīng)的影像數(shù)據(jù),光學(xué)儀器包括掃描儀、傳真機(jī)、數(shù)碼相機(jī)或者 其他攝影器。影像生成時(shí)光照條件,影像的分辨率等因素,將影響后續(xù)識(shí)別的效果和精度。
[0004] 第二個(gè)步驟為圖像的預(yù)處理,這是根據(jù)前一階段生成影像的特點(diǎn),對(duì)影像進(jìn)行處 理以便于后續(xù)階段的字符提取,主要包括影像色彩校正、影像傾斜校正、噪聲過濾以及統(tǒng)一 將影像轉(zhuǎn)換成黑白二部圖或者是灰度圖。預(yù)處理具體細(xì)節(jié)流程,需要根據(jù)影像數(shù)據(jù)的特點(diǎn) 和參數(shù)進(jìn)行設(shè)計(jì),例如影像存在不同程度的色偏,預(yù)處理階段就必須包含色彩矯正這一步。
[0005] 第三個(gè)、第四個(gè)步驟分別為字符特征提取和匹配識(shí)別,主要是將上一階段的字符 區(qū)域按照字符進(jìn)行分割,然后對(duì)單個(gè)字符提取其字符特征,為后續(xù)匹配識(shí)別做準(zhǔn)備。目前的 識(shí)別方法主要有兩種,一為統(tǒng)計(jì)的特征,例如記錄區(qū)域內(nèi)的黑/白像素?cái)?shù)比,當(dāng)文字區(qū)分成 好幾個(gè)區(qū)域時(shí),這一個(gè)個(gè)區(qū)域黑/白像素比的聯(lián)合,就成了空間的一個(gè)數(shù)值向量,稱為特征 向量,在后續(xù)識(shí)別時(shí)只需與該特征向量進(jìn)行比對(duì)即可。而另一類特征為結(jié)構(gòu)的特征,如字符 影像細(xì)線化后,取得字符的筆劃端點(diǎn)、交叉點(diǎn)的數(shù)量及位置,或以筆劃段等字符拓?fù)浣Y(jié)構(gòu)參 數(shù)為特征,然后在特征庫中進(jìn)行比對(duì)即可得到結(jié)果。
[0006] 如上所述,目前字符識(shí)別方法的主要流程架構(gòu)、尤其是第三、第四步驟已經(jīng)比較成 熟穩(wěn)定,而影響其識(shí)別正確率的關(guān)鍵,在于第二個(gè)步驟影像預(yù)處理,待識(shí)別的標(biāo)的物因?yàn)槠?自身特點(diǎn)的不同,以及影像數(shù)據(jù)的掃描過程、掃描生成時(shí)的光照條件的不同和成像設(shè)備的 個(gè)體差異,都會(huì)造成影像包含各種各樣的影響識(shí)別的"噪聲"(以后文中約定噪聲即表示影 響識(shí)別圖像中字符的因素),一個(gè)通用的識(shí)別系統(tǒng)由于效率、性能、成本和可行性的緣故,在 設(shè)計(jì)時(shí)往往不可能也不會(huì)考慮所有可能影響識(shí)別正確率的因素。這即是說,現(xiàn)有通用系統(tǒng) 的設(shè)計(jì)策略是盡可能多地識(shí)別各種影像中的字符,但是其所依據(jù)的影像參數(shù)模型卻不能描 述所有的影像問題,因此往往會(huì)存在有些影像未能得到合適的預(yù)處理就流入后續(xù)的識(shí)別步 驟,最終造成識(shí)別錯(cuò)誤。例如銀行票據(jù)影像交換中的支票編號(hào)識(shí)別問題,因?yàn)橹痹谑褂玫?過程中存在不確定性,往往存在支票編號(hào)被印章、手寫字符覆蓋的問題,同時(shí)生成的票據(jù)影 像也存在光照、色偏上的差異,但是目前通用性的識(shí)別系統(tǒng)上沒有對(duì)這些特征加以定量地 描述和考慮,所以現(xiàn)有的通用識(shí)別系統(tǒng)針對(duì)票據(jù)的識(shí)別結(jié)果往往不能令人滿意,難以滿足 金融業(yè)信息錄入,尤其是賬務(wù)類信息錄入的嚴(yán)格要求,這實(shí)際上也是阻礙光學(xué)字符識(shí)別在 金融業(yè)進(jìn)一步得到推廣的關(guān)鍵。
【發(fā)明內(nèi)容】
[0007] 本發(fā)明實(shí)施例提供一種應(yīng)用于票據(jù)影像字符識(shí)別的數(shù)字圖像處理系統(tǒng),用以在銀 行票據(jù)影像交換的支票影像分析處理過程中提高票據(jù)影像字符識(shí)別正確率,該系統(tǒng)包括:
[0008] 影像參數(shù)檢測(cè)模塊,用于檢測(cè)票據(jù)影像參數(shù);
[0009] 影像傾斜檢測(cè)模塊,用于檢測(cè)票據(jù)影像中票面的傾斜程度;
[0010] 字符區(qū)域檢測(cè)模塊,用于對(duì)字符區(qū)域進(jìn)行定位;
[0011] 字符區(qū)域可識(shí)別檢測(cè)模塊,用于檢測(cè)字符區(qū)域中的字符參數(shù)和印章像素;
[0012] 字符匹配度檢測(cè)模塊,用于將字符區(qū)域中的字符與模板進(jìn)行匹配度檢測(cè);
[0013] 開口特征檢測(cè)模塊,用于檢測(cè)字符區(qū)域中的字符的開口特征。
[0014] 一個(gè)實(shí)施例中,所述影像參數(shù)檢測(cè)模塊具體用于:
[0015] 檢測(cè)票據(jù)影像是否符合分辨率、影像尺寸和影像格式要求,以及是否包含完整票 據(jù)畫面,在達(dá)不到要求時(shí)確定票據(jù)為落地處理。
[0016] 一個(gè)實(shí)施例中,所述影像傾斜檢測(cè)模塊具體用于:
[0017] 通過掃描票據(jù)影像中的票面邊緣獲取票面傾斜角度,在傾斜角度不超過閾值時(shí)進(jìn) 行傾斜矯正并檢測(cè)矯正結(jié)果,在傾斜角度超過閾值或經(jīng)過矯正仍存在傾斜時(shí)確定票據(jù)為落 地處理。
[0018] 一個(gè)實(shí)施例中,所述影像傾斜檢測(cè)模塊具體用于:
[0019] 通過橫向掃描記錄出支票上邊緣的中部的點(diǎn)集的坐標(biāo),根據(jù)記錄的坐標(biāo)進(jìn)行直線 擬合,再根據(jù)擬合上邊緣直線的傾斜角度對(duì)票據(jù)影像進(jìn)行雙線性旋轉(zhuǎn)。
[0020] 一個(gè)實(shí)施例中,所述字符區(qū)域檢測(cè)模塊具體用于:
[0021] 根據(jù)票據(jù)影像中票面結(jié)構(gòu)和票面偏移情況,獲取支票編號(hào)區(qū)域在票據(jù)影像中的位 置坐標(biāo)和尺寸大小,判斷是否能夠分割出支票編號(hào)區(qū)域,若不能分割出支票編號(hào)區(qū)域則確 定票據(jù)為落地處理。
[0022] -個(gè)實(shí)施例中,所述字符區(qū)域檢測(cè)模塊具體用于:
[0023] 測(cè)量出影像右上角中黑色背景的橫向和縱向上的長度,以定位支票票面右上角的 確定坐標(biāo)位置;劃定字符區(qū)域相對(duì)票面的位置和大小;通過動(dòng)態(tài)調(diào)整確定字符區(qū)域的具體 大小和位置坐標(biāo)。
[0024] -個(gè)實(shí)施例中,所述字符區(qū)域可識(shí)別檢測(cè)模塊具體用于:
[0025] 對(duì)字符區(qū)域中每一個(gè)單個(gè)數(shù)字字符進(jìn)行定位分割,檢測(cè)數(shù)字及數(shù)字之間間隙的個(gè) 數(shù)、寬度和高度是否符合字符參數(shù)要求;在HSV色彩空間對(duì)字符區(qū)域進(jìn)行掃描,檢測(cè)字符區(qū) 域的印章像素;如果不符合字符參數(shù)要求或印章像素個(gè)數(shù)超過閾值,則確定票據(jù)為落地處 理。
[0026] -個(gè)實(shí)施例中,所述字符匹配度檢測(cè)模塊具體用于:
[0027] 將字符區(qū)域中定位分割出的每一個(gè)單個(gè)數(shù)字字符與模板進(jìn)行匹配度檢測(cè),并與票 據(jù)影像字符識(shí)別結(jié)果進(jìn)行比對(duì)。
[0028] -個(gè)實(shí)施例中,所述開口特征檢測(cè)模塊具體用于:
[0029] 檢測(cè)字符區(qū)域中定位分割出的每一個(gè)單個(gè)數(shù)字字符的開口特征;在開口特征、匹 配度、識(shí)別結(jié)果均一致時(shí),確定字符識(shí)別成功,否則確定票據(jù)為落地處理。
[0030] 本發(fā)明實(shí)施例還提供一種應(yīng)用于票據(jù)影像字符識(shí)別的數(shù)字圖像處理方法,用以在 銀行票據(jù)影像交換的支票影像分析處理過程中提高票據(jù)影像字符識(shí)別正確率,該方法包 括:
[0031] 檢測(cè)票據(jù)影像參數(shù);
[0032] 檢測(cè)票據(jù)影像中票面的傾斜程度;
[0033] 對(duì)字符區(qū)域進(jìn)行定位;
[0034] 檢測(cè)字符區(qū)域中的字符參數(shù)和印章像素;
[0035] 將字符區(qū)域中的字符與模板進(jìn)行匹配度檢測(cè);
[0036] 檢測(cè)字符區(qū)域中的字符的開口特征。
[0037] -個(gè)實(shí)施例中,所述檢測(cè)票據(jù)影像參數(shù),包括:
[0038] 檢測(cè)票據(jù)影像是否符合分辨率、影像尺寸和影像格式要求,以及是否包含完整票 據(jù)畫面,在達(dá)不到要求時(shí)確定票據(jù)為落地處理。
[0039] -個(gè)實(shí)施例中,所述檢測(cè)票據(jù)影像中票面的傾斜程度,包括:
[0040] 通過掃描票據(jù)影像中的票面邊緣獲取票面傾斜角度,在傾斜角度不超過閾值時(shí)進(jìn) 行傾斜矯正并檢測(cè)矯正結(jié)果,在傾斜角度超過閾值或經(jīng)過矯正仍存在傾斜時(shí)確定票據(jù)為落 地處理。
[0041] 一個(gè)實(shí)施例中,所述進(jìn)行傾斜矯正,包括:
[0042] 通過橫向掃描記錄出支票上邊緣的中部的點(diǎn)集的坐標(biāo),根據(jù)記錄的坐標(biāo)進(jìn)行直線 擬合,再根據(jù)擬合上邊緣直線的傾斜角度對(duì)票據(jù)影像進(jìn)行雙線性旋轉(zhuǎn)。
[0043] 一個(gè)實(shí)施例中,所述對(duì)字符區(qū)域進(jìn)行定位,包括:
[0044] 根據(jù)票據(jù)影像中票面結(jié)構(gòu)和票面偏移情況,獲取支票編號(hào)區(qū)域在票據(jù)影像中的位 置坐標(biāo)和尺寸大小,判斷是否能夠分割出支票編號(hào)區(qū)域,若不能分割出支票編號(hào)區(qū)域則確 定票據(jù)為落地處理。
[0045] 一個(gè)實(shí)施例中,所述對(duì)字符區(qū)域進(jìn)行定位,包括:
[0046] 測(cè)量出影像右上角中黑色背景的橫向和縱向上的長度,以定位支票票面右上角的 確定坐標(biāo)位置;劃定字符區(qū)域相對(duì)票面的位置和大?。煌ㄟ^動(dòng)態(tài)調(diào)整確定字符區(qū)域的具體 大小和位置坐標(biāo)。
[0047] 一個(gè)實(shí)施例中,所述檢測(cè)字符區(qū)域中的字符參數(shù)和印章像素,包括:
[0048] 對(duì)字符區(qū)域中每一個(gè)單個(gè)數(shù)字字符進(jìn)行定位分割,檢測(cè)數(shù)字及數(shù)字之間間隙的個(gè) 數(shù)、寬度和高度是否符合字符參數(shù)要求;在HSV色彩空間對(duì)字符區(qū)域進(jìn)行掃描,檢測(cè)字符區(qū) 域的印章像素;如果不符合字符參數(shù)要求或印章像素個(gè)數(shù)超過閾值,則確定票據(jù)為落地處 理。
[0049] 一個(gè)實(shí)施例中,所述將字符區(qū)域中的字符與模板進(jìn)行匹配度檢測(cè),包括:
[0050] 將字符區(qū)域中定位分割出的每一個(gè)單個(gè)數(shù)字字符與模板進(jìn)行匹配度檢測(cè),并與票 據(jù)影像字符識(shí)別結(jié)果進(jìn)行比對(duì)。
[0051] 一個(gè)實(shí)施例中,所述檢測(cè)字符區(qū)域中的字符的開口特征,包括:
[0052] 檢測(cè)字符區(qū)域中定位分割出的每一個(gè)單個(gè)數(shù)字字符的開口特征;在開口特征、匹 配度、識(shí)別結(jié)果均一致時(shí),確定字符識(shí)別成功,否則確定票據(jù)為落地處理。
[0053] 本發(fā)明實(shí)施例中應(yīng)用于票據(jù)影像字符識(shí)別的數(shù)字圖像處理系統(tǒng)和方法,可以在銀 行票據(jù)影像交換的支票影像分析處理過程中提高票據(jù)影像字符識(shí)別正確率,能夠滿足金融 業(yè)信息錄入,尤其是賬務(wù)類信息錄入的嚴(yán)格要求,有利于光學(xué)字符識(shí)別在金融業(yè)進(jìn)一步得 到推廣。
【專利附圖】
【附圖說明】
[0054] 為了更清楚地說明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn) 有技術(shù)描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見地,下面描述中的附圖僅僅是本 發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以 根據(jù)這些附圖獲得其他的附圖。在附圖中:
[0055] 圖1為【背景技術(shù)】中現(xiàn)有字符識(shí)別系統(tǒng)的處理流程圖;
[0056] 圖2為本發(fā)明實(shí)施例中應(yīng)用于票據(jù)影像字符識(shí)別的數(shù)字圖像處理系統(tǒng)的示意圖;
[0057] 圖3為本發(fā)明實(shí)施例中支票編號(hào)區(qū)域的堅(jiān)直投影結(jié)果示例圖;
[0058] 圖4為本發(fā)明實(shí)施例中字符與模板匹配的示意圖;
[0059] 圖5為本發(fā)明實(shí)施例中開口結(jié)構(gòu)檢測(cè)的示例圖;
[0060] 圖6為本發(fā)明實(shí)施例中應(yīng)用于票據(jù)影像字符識(shí)別的數(shù)字圖像處理方法的流程示 例圖。
【具體實(shí)施方式】
[0061] 為使本發(fā)明實(shí)施例的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚明白,下面結(jié)合附圖對(duì)本發(fā) 明實(shí)施例做進(jìn)一步詳細(xì)說明。在此,本發(fā)明的示意性實(shí)施例及其說明用于解釋本發(fā)明,但并 不作為對(duì)本發(fā)明的限定。
[0062] 本發(fā)明實(shí)施例克服了現(xiàn)有技術(shù)的缺點(diǎn),提供了一種應(yīng)用于票據(jù)影像字符識(shí)別的數(shù) 字圖像處理系統(tǒng),該系統(tǒng)能夠在銀行票據(jù)影像交換的支票影像分析處理過程中提高票據(jù)影 像字符識(shí)別正確率,特別是提高銀行支票編號(hào)識(shí)別正確率。
[0063] 實(shí)施過程中,本發(fā)明實(shí)施例針對(duì)支票編號(hào)的識(shí)別考慮較為全面、完整,例如考慮到 如支票的票面結(jié)構(gòu)、大小尺寸、字體結(jié)構(gòu)特征等支票一般性特征;也考慮到支票在使用流通 過程中所可能遇到的影響識(shí)別正確性的噪聲因素,例如使用時(shí)被印章覆蓋、與其他字符重 疊,以及因設(shè)備環(huán)境差異造成的如票面傾斜、光照不統(tǒng)一等因素。基于此,本發(fā)明實(shí)施例采 用"盡量檢測(cè)、過濾出包含影響識(shí)別的噪聲的影像"的策略,在現(xiàn)有識(shí)別系統(tǒng)的基礎(chǔ)上增加 由若干檢測(cè)和校正模塊組成的新系統(tǒng)。圖2是本發(fā)明實(shí)施例中應(yīng)用于票據(jù)影像字符識(shí)別的 數(shù)字圖像處理系統(tǒng)的示意圖。如圖2所示,該系統(tǒng)包括影像參數(shù)檢測(cè)模塊、影像傾斜檢測(cè)模 塊、字符區(qū)域(R0I)檢測(cè)模塊、R0I可識(shí)別檢測(cè)模塊、字符匹配度檢測(cè)模塊及開口特征檢測(cè) 模塊。這些檢測(cè)模塊分別與現(xiàn)有識(shí)別系統(tǒng)(包括影像生成模塊、影像預(yù)處理模塊、字符特征 提取模塊和字符特征匹配模塊)中的各個(gè)模塊進(jìn)行串聯(lián)。每一個(gè)檢測(cè)模塊以現(xiàn)有識(shí)別系統(tǒng) 中某一模塊處理的處理結(jié)果和中間狀態(tài)為輸入信息,檢查、過濾或者矯正一部分可能會(huì)影 響下一模塊處理結(jié)果正確性的噪聲,如果達(dá)到檢測(cè)標(biāo)準(zhǔn),則指示執(zhí)行后續(xù)的識(shí)別/檢測(cè)模 塊,反之,如果某一檢測(cè)模塊檢測(cè)到會(huì)影響識(shí)別結(jié)果正確性的噪聲,則終止該票據(jù)影像的識(shí) 別過程,做落地處理,落地處理的含義即為人工參與票據(jù)處理。最后識(shí)別完畢后,識(shí)別結(jié)果 輸入數(shù)據(jù)庫存儲(chǔ)。應(yīng)用于票據(jù)影像字符識(shí)別的數(shù)字圖像處理系統(tǒng)的每個(gè)模塊的功能介紹如 下:
[0064] 影像參數(shù)檢測(cè)模塊:用于檢測(cè)票據(jù)影像參數(shù)。例如,該模塊可以串聯(lián)在影像生成 模塊后面,用于檢測(cè)影像生成模塊生成的票據(jù)影像是否符合參數(shù)標(biāo)準(zhǔn),包括分辨率、影像尺 寸、影像格式、以及影像是否包含完整票據(jù)畫面,如果達(dá)不到要求則判定為落地處理。
[0065] 影像傾斜校正模塊:用于檢測(cè)票據(jù)影像中票面的傾斜程度。例如,該模塊可以對(duì)生 成的影像的票面傾斜程度進(jìn)行定量檢測(cè),通過掃描影像中票面上邊緣,獲取其傾斜角度,如 果傾斜角度較小,在一定范圍內(nèi),例如不超過閾值,則進(jìn)行傾斜矯正并檢測(cè)矯正結(jié)果,如果 傾斜角度過大(超過閾值)或者經(jīng)過矯正仍然存在傾斜則判定為落地處理。
[0066] 字符區(qū)域(R0I)檢測(cè)模塊:用于對(duì)字符區(qū)域進(jìn)行定位。例如,該模塊負(fù)責(zé)對(duì)R0I進(jìn) 行定位,根據(jù)支票票面的結(jié)構(gòu)和票面在影像中的偏移情況,獲取支票編號(hào)區(qū)域在影像中的 精確位置坐標(biāo)和尺寸大小,在定位的過程中判斷是否能夠分割的支票編號(hào)區(qū)域,不能分割 出支票編號(hào)區(qū)域則確定票據(jù)為落地處理;還可以初步檢測(cè)是否存在其他字符與R0I區(qū)域重 疊,如果不能完整分割出R0I區(qū)域則判定為落地處理。
[0067] R0I可識(shí)別檢測(cè)模塊:用于檢測(cè)字符區(qū)域中的字符參數(shù)和印章像素。例如,該模塊 負(fù)責(zé)對(duì)R0I中的每一個(gè)單個(gè)數(shù)字字符進(jìn)行定位分割,檢測(cè)數(shù)字以及其間隙的個(gè)數(shù)、寬度、高 度是否符合要求;此外,在HSV色彩空間對(duì)R0I區(qū)域進(jìn)行掃描,檢測(cè)R0I區(qū)域是否存在印章 的紅色或者藍(lán)色,如果字符參數(shù)超過標(biāo)準(zhǔn)或者存在過多的紅色或者藍(lán)色印章像素,如像素 個(gè)數(shù)超過閾值,則判定為落地處理。
[0068] 字符匹配度檢測(cè)模塊:用于將字符區(qū)域中的字符與模板進(jìn)行匹配度檢測(cè)。例如,該 模塊負(fù)責(zé)對(duì)R0I可識(shí)別檢測(cè)模塊中分割出來的結(jié)果單個(gè)字符與模板進(jìn)行匹配度檢測(cè),與現(xiàn) 有識(shí)別系統(tǒng)中最后的字符匹配識(shí)別模塊的識(shí)別結(jié)果進(jìn)行比對(duì)。
[0069] 開口特征檢測(cè)模塊:用于檢測(cè)字符區(qū)域中的字符的開口特征。該模塊檢測(cè)單個(gè)數(shù) 字字符的開口特征。實(shí)施例中如果上述開口特征、匹配度與識(shí)別結(jié)果這三個(gè)結(jié)果一致,則判 定識(shí)別成功,整個(gè)系統(tǒng)運(yùn)行完畢,否則落地處理。
[0070] 如前所述,為了解決現(xiàn)有技術(shù)的問題,本發(fā)明實(shí)施例在整個(gè)識(shí)別過程的每個(gè)處理 階段前后,定性或者定量地對(duì)存在影響識(shí)別正確率因素的支票影像加以檢測(cè)、過濾、處理或 者矯正。本發(fā)明實(shí)施例在現(xiàn)有技術(shù)方案的基礎(chǔ)上增加了若干檢測(cè)模塊,包括影像參數(shù)檢測(cè) 模塊、影像傾斜檢測(cè)模塊、字符區(qū)域(R0I)檢測(cè)模塊、R0I可識(shí)別檢測(cè)模塊、字符匹配度檢測(cè) 模塊及開口特征檢測(cè)模塊,它們串聯(lián)在現(xiàn)有系統(tǒng)基本模塊前后,對(duì)每個(gè)現(xiàn)有系統(tǒng)基本模塊 的處理結(jié)果進(jìn)行檢測(cè),以確保影像的識(shí)別結(jié)果的正確性。具體地說,影像參數(shù)檢測(cè)模塊以影 像生成模塊生成的影像為輸入,檢測(cè)其生的票據(jù)影像的具體參數(shù);影像傾斜檢測(cè)模塊以影 像預(yù)處理模塊校正過的影像為輸入,檢測(cè)其生成的票據(jù)影像中票面的傾斜程度并進(jìn)行冗余 校正;字符區(qū)域(R0I)檢測(cè)模塊和R0I可識(shí)別檢測(cè)模塊則以影像預(yù)處理模塊校正過的影像 為輸入,檢測(cè)并提取票據(jù)編號(hào)區(qū)域;而字符匹配度檢測(cè)模塊則以R0I可識(shí)別檢測(cè)模塊生成 的字符二部圖,和字符特征匹配模塊的識(shí)別結(jié)果為輸入,對(duì)檢查識(shí)別結(jié)果做最后的檢測(cè)。
[0071] 具體實(shí)例中,影像參數(shù)檢測(cè)模塊可以要求影像生成模塊按照一定的參數(shù)設(shè)置,并 在影像生成后對(duì)這些影像的參數(shù)進(jìn)行檢測(cè)。采集影像時(shí)可以要求掃描設(shè)備為目前主流的平 板掃描儀,推薦帶有自動(dòng)影像裁切功能的掃描儀,例如富士通fi-5220c高速掃描儀,掃描時(shí) 盡量使支票影像的四邊與掃描儀的掃描框平行,掃描生成的支票影像經(jīng)檢測(cè)例如可以具備 以下特征:
[0072] 1、圖像分辨率為200dpi的彩色影像;
[0073] 2、影像寬1500±100像素,高650±50像素(以下文中約定圖像尺寸大小以及坐 標(biāo)的單位都是像素);
[0074] 3、影像存儲(chǔ)格式為24位JPG格式、TIFF格式、256色BMP格式中的一種,推薦設(shè)置 輸出格式為24位JPG格式;
[0075] 4、影像中支票票面全部清晰可見,除支票票面以外的影像邊緣背景部分為純黑 色,即RGB值為(0,0,0);
[0076] 5、票據(jù)影像中支票部分相對(duì)于整個(gè)影像沒有大幅傾斜,支票在掃描前經(jīng)過檢驗(yàn), 票據(jù)要素、尤其是待識(shí)別的支票編號(hào)沒有被人為故意涂改(根據(jù)支票使用規(guī)范,網(wǎng)點(diǎn)操作 柜員在收取票據(jù)時(shí)有責(zé)任對(duì)票據(jù)是否清晰、未被涂改進(jìn)行檢查)。
[0077] 如果生成的支票影像的參數(shù)達(dá)不到上述標(biāo)準(zhǔn),則判定為不可識(shí)別或者重新掃描。
[0078] 具體實(shí)例中,影像傾斜檢測(cè)模塊可以負(fù)責(zé)處理前一模塊生成并處理完成的票據(jù)影 像,對(duì)影像中的支票票面進(jìn)行傾斜矯正,并過濾出傾斜過大、無法傾斜矯正以及影像尺寸不 正常的影像。實(shí)施例中可以定量規(guī)定:支票影像傾斜角度超過±15度即判定為不可識(shí)別; 整個(gè)支票影像寬度超過1400至1600像素,高度超過600至700像素的范圍,則判定為不可 識(shí)別。對(duì)于參數(shù)符合上述范圍的影像,進(jìn)行傾斜矯正,首先可以通過橫向掃描記錄出支票上 邊緣的中部的點(diǎn)集的坐標(biāo),根據(jù)坐標(biāo)進(jìn)行直線擬合,再根據(jù)擬合上邊緣直線的傾斜角度對(duì) 影像進(jìn)行雙線性旋轉(zhuǎn),從而完成傾斜矯正。影像傾斜檢測(cè)模塊中傾斜矯正以及檢測(cè)的具體 流程可以如下:
[0079] 1、檢測(cè)支票影像的分辨率Resolution,高度Height,及寬度Width。如果寬度 Width不在1500至1600像素的范圍內(nèi),或者高度Height不在600至700像素的范圍內(nèi),則 判定該影像為不可識(shí)別;如果分辨率Resolution不是200dpi,則判定該影像為不可識(shí)別;
[0080] 2、影像邊緣處理:將圖像的四條邊緣,即四邊寬度為一個(gè)像素的邊緣上的像素全 部變成黑色像素,即將這些像素的RGB值進(jìn)行修改為(0,0,0);
[0081] 3、支票上邊緣檢測(cè):首先可以在橫坐標(biāo)上,以影像寬度上的二分之一處為 中心點(diǎn),在橫坐標(biāo)中確定出WidthX0.5±100像素的范圍。在該范圍內(nèi),從坐標(biāo)為 [WidthXO. 5-100, 1]的像素開始,首先在橫坐標(biāo)固定、縱坐標(biāo)從1到Height的范圍內(nèi)的像 素的RGB值進(jìn)行掃描檢測(cè),當(dāng)掃描到的像素以及后面連續(xù)兩個(gè)像素的RGB三個(gè)通道的值均 小于(50,50,50)時(shí),則認(rèn)為已經(jīng)找到了支票票面區(qū)域的邊緣,記錄邊緣上該點(diǎn)的坐標(biāo),停 止該列像素的掃描,然后再從坐標(biāo)為[WidthXO. 5-100+1,1]的像素開始,再次在橫坐標(biāo)固 定、縱坐標(biāo)從1到Height的范圍的像素進(jìn)行檢測(cè)掃描,重復(fù)該掃描步驟直到一列一列地掃 描完[WidthXO. 5-100, WidthXO. 5+100]內(nèi)的所有像素。掃描任何一列像素時(shí),如果像素 的縱坐標(biāo)超過了 Height X0. 25時(shí)像素的RGB值仍然沒有超過(50, 50, 50)則停止掃描,并 判定該圖像不可掃描;如果對(duì)于任意一個(gè)找到的邊緣像素的縱坐標(biāo)的值與前一個(gè)或者是后 一個(gè)邊緣像素的縱坐標(biāo)的值相差超過±2個(gè)像素,則停止掃描,并判定該影像不可以識(shí)別;
[0082] 4、傾斜角度計(jì)算與矯正:得到支票上邊緣的點(diǎn)集的坐標(biāo),利用最小二乘法擬合出 支票上邊緣的直線的斜率參數(shù),然后以此斜率參數(shù)得到支票票面相對(duì)于支票影像的傾斜角 度,根據(jù)傾斜角度,以影像的中心為圓心,對(duì)影像進(jìn)行雙線性旋轉(zhuǎn)以矯正傾斜。得到傾斜角 度后,如果傾斜的角度超過± 15度,則判定該影像不可識(shí)別;矯正過后,重復(fù)第3、4步驟得 到影像矯正后的傾斜角度,如果校正后支票票面的傾斜角度超過±0. 5度則判定該影像為 不可識(shí)別。
[0083] 具體實(shí)例中,字符區(qū)域(R0I)檢測(cè)模塊在得到矯正過的支票影像后,需要進(jìn)一步 定位位于支票右上角的支票編號(hào)的興趣區(qū)域(R0I,以下文中約定R0I為影像中剛好包含支 票編號(hào)的區(qū)域,即影像的一個(gè)子區(qū)域)以便下一模塊提取字符特征。由于存在不確定的黑 色背景,即支票票面部分在支票影像中并不固定,以及后期打印總存在偏移的原因,右上角 的支票編號(hào)相對(duì)影像坐標(biāo)系并不很固定。該模塊負(fù)責(zé)消除該不確定偏移因素并定位支票編 號(hào)的確切區(qū)域的位置坐標(biāo)和大小。首先可以測(cè)量出影像右上角中黑色背景的橫向和縱向上 的長度,從而定位支票票面右上角的確定坐標(biāo)位置,然后可以劃定R0I區(qū)域相對(duì)票面的大 概位置和大小,最后通過動(dòng)態(tài)調(diào)整進(jìn)一步確定R0I的具體大小和位置坐標(biāo)。具體流程可以 如下:
[0084] 1、右上角黑色背景檢測(cè):考慮到票面和影像都是長方形,并且已經(jīng)經(jīng)過旋轉(zhuǎn)矯 正,因此首先從影像上邊緣的中心點(diǎn),即坐標(biāo)為[WidthXO. 5,1]的像素,在橫坐標(biāo)確定、 縱坐標(biāo)從1到Height的范圍內(nèi)掃描,直到遇到連續(xù)三個(gè)像素的RGB值均小于(50, 50, 50) 為止,則認(rèn)為得到了票面上邊緣的像素。此時(shí)得到的邊緣像素的縱坐標(biāo)標(biāo)記為Height_ Blackground。類似地,從影像右邊緣的中心點(diǎn),即坐標(biāo)為[Width,HeightX0.5]的像素開 始,對(duì)縱坐標(biāo)固定、橫坐標(biāo)從Width到1到范圍內(nèi)的像素進(jìn)行掃描,直到遇到連續(xù)三個(gè)像素 的RGB值均小于(50, 50, 50)的票面右邊緣的像素為止。此時(shí)得到的影像寬度Width與邊 緣像素的橫坐標(biāo)的差值標(biāo)記為Width_Blackground ;
[0085] 2、初步定為R0I區(qū)域:支票編號(hào)區(qū)域R0I即為一個(gè)剛好包含支票編號(hào)數(shù)字部分的 長方形。長方形左上角點(diǎn)的坐標(biāo)的初始值根據(jù)經(jīng)驗(yàn)值可認(rèn)為距票面上邊緣50個(gè)像素,距支 票票面右邊緣300個(gè)像素。R0I區(qū)域的寬度R0I_Width為200像素,高度R0I_Height為53 像素;
[0086] 3、動(dòng)態(tài)調(diào)整R0I區(qū)域:首先可以選取初步定的R0I區(qū)域的RGB三個(gè)通道中的綠 色(G)通道的值,即得到對(duì)應(yīng)R0I區(qū)域的灰度圖,標(biāo)記為Gray_R0I。然后可以根據(jù)該灰度 圖,采用最大類間方差法(0STU)進(jìn)行自適應(yīng)閾值分割,獲得初始R0I區(qū)域的二值化圖,標(biāo) 記為Binary_R0I。R0I左上角的坐標(biāo)標(biāo)記為[new_R0I_X,new_R0I_Y],其中只存在黑色像 素和白色像素,黑色像素的像素值設(shè)置為〇,白色像素的像素值設(shè)置為1。獲得R0I區(qū)域二 部圖后,依次對(duì)其四條寬度為一個(gè)像素的邊緣進(jìn)行掃描。例如左邊緣,對(duì)邊緣上從坐標(biāo)為 [Weight-Weight_Blackground_300, Height+50]的像素開始,橫坐標(biāo)保持不變、縱坐標(biāo)范圍 從Height+50到Height+50+53范圍內(nèi)的像素的灰度值。如果存在黑色像素,則將R0I左 邊緣向右移動(dòng)一個(gè)像素,即將從坐標(biāo)為[Weight-Weight_Blackground_300+l,Height+50] 的像素開始,橫坐標(biāo)保持不變、縱坐標(biāo)范圍從Height+50到Height+50+53范圍內(nèi)的像素集 合(一個(gè)線段)作為R0I新的左邊緣,并再次檢測(cè)新邊緣是否存在黑色像素。如此右移左 邊緣,直到新的左邊緣沒有黑色像素為止。采用類似的方法,對(duì)下邊緣、右邊緣和上邊緣進(jìn) 行動(dòng)態(tài)調(diào)整時(shí),下邊緣向上移動(dòng),右邊緣向左移動(dòng),上邊緣向下移動(dòng)。移動(dòng)的過程中若新的 邊緣不存在黑色像素,即全都是白色像素,則認(rèn)為找到了合適的邊緣并停止移動(dòng)。如果任何 一條邊緣移動(dòng)超過了 10個(gè)像素后新邊緣上仍然存在黑色像素,則判定為不可識(shí)別。調(diào)整 過后,新的Binary_ROI區(qū)域標(biāo)記為new_Binary_ROI,其左上角點(diǎn)像素的坐標(biāo)標(biāo)記為[new_ ROI_X, new_ROI_Y]。如果 new_Binary_ROI 的寬度 new_ROI_Width 低于 180 個(gè)像素,或者高 度new_ROI_Height低于45個(gè)像素,則判定為不可識(shí)別。
[0087] 具體實(shí)例中,R0I可識(shí)別檢測(cè)模塊在當(dāng)R0I檢測(cè)模塊成功獲取R0I區(qū)域的精確坐 標(biāo)和大小后,進(jìn)一步提取R0I中支票編號(hào)的字符特征并進(jìn)行識(shí)別之前,可以對(duì)R0I區(qū)域進(jìn)行 掃描,以檢測(cè)是否存在印章、手寫字符覆蓋等影響識(shí)別的噪聲。銀行使用在進(jìn)行支票業(yè)務(wù)操 作時(shí),使用的印章只有純紅或者純藍(lán)兩種顏色,因此印章檢測(cè)需要將像素從RGB色彩空間 轉(zhuǎn)換到HSV色彩空間,在色彩空間內(nèi)對(duì)印章的純紅色或者純藍(lán)色進(jìn)行檢測(cè)。在支票票面結(jié) 構(gòu)上,支票編號(hào)下方為付款行名稱,有時(shí)存在打印或者手寫的付款行名稱偏移并覆蓋支票 編號(hào)的情況,可以通過對(duì)R0I檢測(cè)模塊生成的R0I區(qū)域的二部圖new_Binary_R0I進(jìn)行堅(jiān)直 投影進(jìn)行檢測(cè)。具體實(shí)施流程可以如下:
[0088] 1、印章檢測(cè):首先在影像上確定R0I區(qū)域的范圍,然后針對(duì)該區(qū)域的每一個(gè)像素, 將像素的RGB值轉(zhuǎn)換成HSV(Hue, Saturation, Value)值。可以約定,純紅色的色相(Hue) 范圍是[0, 01]和[0.9, 1];純藍(lán)色的色相(Hue)范圍內(nèi)[0.55, 0.65];印章像素的飽和度 (Saturation)范圍是[0· 3, 1];印章像素的亮度(Value)范圍是[0· 6, 1]。對(duì)于任何一個(gè) R0I區(qū)域的像素的HSV值,如果其HSV值中的任何一項(xiàng)達(dá)到了上面的范圍,則認(rèn)為是印章像 素(印章像素即為像素 HSV值在上述的范圍內(nèi)的像素),并予以記錄。如果掃描完整個(gè)R0I 區(qū)域后,記錄的印章像素的數(shù)量超過25個(gè),則可以認(rèn)為編號(hào)被印章覆蓋,判定為不可識(shí)別;
[0089] 2、覆蓋字符檢測(cè):獲取前一模塊生成的區(qū)域的二值化圖new_Binary_R0I,按照下 面所示的堅(jiān)直投影函數(shù)R〇I_Projection(x)得到new_Binary_R0I的堅(jiān)直投影結(jié)果。圖3 為本例中支票編號(hào)區(qū)域的堅(jiān)直投影結(jié)果示例圖。如圖3所示,其中X表示橫坐標(biāo),單位為像 素,函數(shù)值為Binary_R0I每一個(gè)縱列上的像素集合的像素值的累加和,設(shè)定黑色像素的像 素pixel_value值為0,白色像素的像素值為1,具體公式如下: ηβλν _R〇I _ Height
[0090] ROl _ projeclion(x) = ^ Pixel _ vahie(i) /=1 '
[0091] 得到累加結(jié)果后,明顯可以看出,橫坐標(biāo)在字符之間的空白分隔區(qū)域的投影函數(shù) 值為恒定結(jié)果,即new_ROI_HeightX 1,連續(xù)的函數(shù)值Y為new_ROI_HeightX 1的區(qū)域的橫 坐標(biāo)區(qū)間的寬度就是字符間的間隔寬度,兩個(gè)值為neW_ROI_HeightXl的連續(xù)區(qū)域之間, 函數(shù)值低于ne W_ROI_HeightXl的區(qū)域的寬度,即為字符的寬度。通過堅(jiān)直投影函數(shù)度量 出10個(gè)間隔(包括首尾)的寬度和8個(gè)字符的寬度,正常的支票編號(hào)的數(shù)字為8位,在分 辨率為200dpi的情況下:字符的寬度設(shè)定在[8, 20]范圍(單位為像素)內(nèi),間隔寬度設(shè)定 在[4, 12]范圍內(nèi),字符的高度設(shè)定在[25, 32]范圍內(nèi),如果字符個(gè)數(shù)或者間隙個(gè)數(shù)不是8 個(gè)和10個(gè),或者有任何字符的寬度或者間隙的寬度不在上述范圍內(nèi),則可認(rèn)為被其他字符 覆蓋,判定為不可識(shí)別。
[0092] 具體實(shí)例中,字符匹配度檢測(cè)模塊可以在通過字符匹配識(shí)別模塊得到識(shí)別結(jié)果 后,檢測(cè)識(shí)別結(jié)果的可靠性。根據(jù)字符區(qū)域檢測(cè)模塊中獲得的new_Binary_R0I區(qū)域上堅(jiān)直 投影函數(shù)R〇I_Projection(x)的結(jié)果,可以得到每一個(gè)數(shù)字字符在new_Binary_R0I中的精 確位置??梢詫?duì)每一個(gè)單個(gè)數(shù)字字符區(qū)域復(fù)制一個(gè)單獨(dú)的拷貝,與0到9的字符模板進(jìn)行 比較并檢測(cè)其匹配度,通過匹配度這個(gè)量化的數(shù)值定量檢測(cè)識(shí)別結(jié)果的可靠性。具體實(shí)施 流程可以如下:
[0093] 1、單個(gè)字符定位檢測(cè):根據(jù)上一模塊中的投影函數(shù)R〇I_Pro jection (X),從 Binary_R0I區(qū)域左到右開始掃描,將第N個(gè)函數(shù)值小于new_ROI_HeightXl的連續(xù)區(qū)域 的起始位置坐標(biāo)記錄在數(shù)組Number_Star [N]中,并將該連續(xù)區(qū)域的寬度記錄在Number_ Width[N]中。其中Number_Star和Number_Width均為具有8個(gè)單元的數(shù)組,對(duì)應(yīng)支票編號(hào) 的8個(gè)數(shù)字。同理根據(jù)上一模塊中的水平投影函數(shù)R0I_h 〇riZ〇n(y)獲取字符上部Number_ Top和下部分Number_Down的坐標(biāo),以及字符高度Number_Height。得到坐標(biāo)后,對(duì)于編 號(hào)中的第N(N e [1,8],支票編號(hào)只有8位)個(gè)字符,從Binary_R0I中的以左上角坐標(biāo)為 [Number_Star[N], Number_Top,大小為 Number_Width[N] XNumber_Height 的區(qū)域進(jìn)行拷 貝即可以獲取第N個(gè)字符的二值化圖的拷貝,標(biāo)記為Num_Binary [N];
[0094] 2、生成數(shù)字模板:選擇一定數(shù)量清晰、沒有印章等覆蓋的支票的影像,經(jīng)過上述 幾個(gè)模塊和步驟的處理,得到支票影像的支票編號(hào)的分割出來的若干字符的二值化圖的 拷貝。從中挑選出清晰的〇到9共10個(gè)字符的二值化圖的拷貝作為模板,標(biāo)記為Num_ Template [Μ]。其中Μ為0到9的整數(shù)。第Μ個(gè)模板上需為數(shù)字Μ的二值化圖,同時(shí)每個(gè)數(shù) 字模板的尺寸需為25X53。如果模板的高或者寬到不要求,則直接在字符的上邊緣和左邊 緣增加若干行、列的白色像素,直到尺寸達(dá)到要求。挑選完成后的模板可以反復(fù)使用,后續(xù) 無需再生成,因此該步驟只需執(zhí)行一次即可,但若支票字體發(fā)生變化,則可以重復(fù)該步驟生 成新的模板。
[0095] 3、單個(gè)字符匹配度檢測(cè):根據(jù)上兩個(gè)步驟產(chǎn)生了編號(hào)數(shù)字字符的二值化圖。對(duì)于 支票編號(hào)中第Ν個(gè)數(shù)字,Ν為1到8之間的整數(shù),將Num_Binary [Ν]與模板Num_Template [Μ] 逐一進(jìn)行匹配,圖4為本例中字符與模板匹配的示意圖,如圖4所示,先將Num_Bianry[N] 的每一像素,與模板Num_Template[0]中坐標(biāo)范圍為寬從1到Number_Width[N]、高從1 到Number_Height的一塊與Num_Binary [N]同樣形狀大小的區(qū)域的像素--對(duì)應(yīng)。對(duì) 于所有對(duì)應(yīng)的像素對(duì),統(tǒng)計(jì)同樣是黑色,以及同樣是白色像素的數(shù)值,這個(gè)數(shù)值除以Num_ Binary[N]中像素的數(shù)量進(jìn)行歸一化后,定義歸一化后的結(jié)果為匹配度。然后再將Num_ Template [0]中坐標(biāo)區(qū)域向右移動(dòng)一個(gè)像素,即將寬從2到Number_Width[N]+l、高從1到 Number_Height的一塊與Num_Binary[N]同樣形狀大小區(qū)域進(jìn)行匹配并統(tǒng)計(jì)出匹配度。如 此移動(dòng)直到Number_Width [Ν] +H等于模板Num_Template [0]的寬25,這時(shí)將區(qū)域移動(dòng)到模 板的寬從1到Number_Width[N]、高從2到Number_Height+l的區(qū)域統(tǒng)計(jì)匹配度,如此直 到Num_Binary[N]與模板上所有不同的同形狀大小區(qū)域統(tǒng)計(jì)了匹配度后,選出其中最高的 匹配度,標(biāo)記為Match[0]。采用同樣的方法,再將Num_Binary[N]與其他所有的模板Num_ Template [Μ]進(jìn)行匹配并得到對(duì)應(yīng)的匹配度Match [Μ],如果這時(shí)Match [I] (I表示數(shù)字I) 最大,則Num_Binary[N]即可識(shí)別成數(shù)字I,同理可以獲得編號(hào)中其他數(shù)字,這時(shí)對(duì)于Num_ Binary[N]的最大匹配度,標(biāo)記為Max_Match[N]。如果I不是字符匹配識(shí)別模塊輸出的識(shí) 別結(jié)果,則認(rèn)為結(jié)果不正確判定為不可識(shí)別;如果匹配度數(shù)值低于0.8,則認(rèn)為結(jié)果不正確 判定為不可識(shí)別。
[0096] 具體實(shí)例中,在通過字符匹配度檢測(cè)模塊得到識(shí)別結(jié)果后,仍然需要由開口特征 檢測(cè)模塊驗(yàn)證識(shí)別結(jié)果的正確性。例如,可以根據(jù)每個(gè)字符二值化圖的區(qū)域的開口結(jié)構(gòu)特 征進(jìn)行檢測(cè),如果開口結(jié)構(gòu)的檢測(cè)結(jié)果與識(shí)別出來的數(shù)字的開口特征一致,則認(rèn)為識(shí)別正 確。不同的數(shù)字的開口特征并不一樣,可以通過對(duì)一個(gè)字符的四個(gè)開口區(qū)域的開口檢測(cè)進(jìn) 行編碼,如果二值化圖的開口特征與識(shí)別結(jié)果對(duì)應(yīng)的數(shù)字的開口特征不符,則可以判定該 影像不可識(shí)別。具體流程可以如下:
[0097] 1、開口結(jié)構(gòu)檢測(cè):圖5為開口結(jié)構(gòu)檢測(cè)的示例圖,如圖5所示,將字符二值化圖劃 分為左上、左下、右下和右上四個(gè)區(qū)域。首先驗(yàn)證左上區(qū)域:先在從字符二值化圖的上半部 分的中心點(diǎn)P_Top開始以水平直線向左邊緣掃描,掃描線記錄為L1,掃描到第一個(gè)黑色像 素則停止,并記錄為Ρ1。如果掃描到了左邊緣仍然沒有黑色像素,則直接認(rèn)為左上角區(qū)域 是開口的并驗(yàn)證下一區(qū)域。如果找到Ρ1,則開始從字符二值化圖的左邊緣的中點(diǎn)開始向右 水平掃描,掃描線記錄為L2,直到遇到第一個(gè)黑色像素停止,記錄為Ρ2。如果Ρ2的橫坐標(biāo) 比Ρ1的橫坐標(biāo)小,則從左邊緣中點(diǎn)的上一個(gè)像素(即縱坐標(biāo)小一個(gè)像素)開始水平掃描, 直到找到的第一個(gè)Ρ2的橫坐標(biāo)比Ρ1的橫坐標(biāo)大。如果掃描的起始點(diǎn)的縱坐標(biāo)為0仍沒有 找到Ρ2,則認(rèn)為該區(qū)域沒有不開口;當(dāng)找到Ρ2時(shí),在掃描線L1上從Ρ1開始向L2做垂直方 向掃描,直到碰到L2為止,掃描線記錄為L3。如果L3上存在黑色像素,則從L2上的Ρ1的 右移一個(gè)像素作為L3的起點(diǎn)重新開始向下垂直掃描。如果直到起點(diǎn)為Ρ_Τορ時(shí)仍然不能 找到一條L3,使得其上面的像素全部為白色,則認(rèn)為該區(qū)域不開口;否則認(rèn)為是開口的;同 理對(duì)左下角、右下角、右上角進(jìn)行判斷;
[0098] 2、開口編碼:從上到下、從左到右對(duì)開口檢測(cè)結(jié)果進(jìn)行編碼,區(qū)域開口標(biāo)記為1, 反之標(biāo)記為0,對(duì)四處開口檢測(cè)結(jié)構(gòu)編碼為四位,數(shù)字〇、3、5、6、8、9的開口編碼如下:
[0099] 0:0000 3:1100 5:0101
[0100] 6 :0001 8 :0000 9 :0101
[0101] 如果某個(gè)字符被識(shí)別成了上述對(duì)應(yīng)的數(shù)字,但是開口檢測(cè)的結(jié)果卻不符合上述開 口編碼,則判定為不可識(shí)別;
[0102] 3、寬度檢測(cè):對(duì)于被識(shí)別成1的字符,如果其寬度超過12個(gè)像素則判定為不可 識(shí)別;對(duì)于識(shí)別成4的字符,如果字符的寬度超過16個(gè)像素,則判定為不可識(shí)別;對(duì)于識(shí) 別成2的字符,對(duì)其二值化圖的每一行像素進(jìn)行掃描,如果最下邊緣的3行像素,每一行中 的黑色像素少于8/10,或者字符二值化圖中間的三行像素中,每一行中黑色像素的數(shù)量多 余1/3,則判定為不可識(shí)別;對(duì)于識(shí)別成7的字符,如果嘴上邊緣的三行像素中,每一行中 的黑色像素少于8/10,或者字符二值化圖的下半部分每一行的像素中黑色像素的數(shù)量多余 1/3,則判定為不可識(shí)別。
[0103] 基于同一發(fā)明構(gòu)思,本發(fā)明實(shí)施例中還提供了一種應(yīng)用于票據(jù)影像字符識(shí)別的數(shù) 字圖像處理方法,如下面的實(shí)施例所述。由于該方法解決問題的原理與應(yīng)用于票據(jù)影像字 符識(shí)別的數(shù)字圖像處理系統(tǒng)相似,因此該方法的實(shí)施可以參見應(yīng)用于票據(jù)影像字符識(shí)別的 數(shù)字圖像處理系統(tǒng)的實(shí)施,重復(fù)之處不再贅述。
[0104] 本發(fā)明實(shí)施例中應(yīng)用于票據(jù)影像字符識(shí)別的數(shù)字圖像處理方法可以包括:
[0105] 檢測(cè)票據(jù)影像參數(shù);
[0106] 檢測(cè)票據(jù)影像中票面的傾斜程度;
[0107] 對(duì)字符區(qū)域進(jìn)行定位;
[0108] 檢測(cè)字符區(qū)域中的字符參數(shù)和印章像素;
[0109] 將字符區(qū)域中的字符與模板進(jìn)行匹配度檢測(cè);
[0110] 檢測(cè)字符區(qū)域中的字符的開口特征。
[0111] 具體實(shí)施時(shí),檢測(cè)票據(jù)影像參數(shù),可以包括:
[0112] 檢測(cè)票據(jù)影像是否符合分辨率、影像尺寸和影像格式要求,以及是否包含完整票 據(jù)畫面,在達(dá)不到要求時(shí)確定票據(jù)為落地處理。
[0113] 具體實(shí)施時(shí),檢測(cè)票據(jù)影像中票面的傾斜程度,可以包括:
[0114] 通過掃描票據(jù)影像中的票面邊緣獲取票面傾斜角度,在傾斜角度不超過閾值時(shí)進(jìn) 行傾斜矯正并檢測(cè)矯正結(jié)果,在傾斜角度超過閾值或經(jīng)過矯正仍存在傾斜時(shí)確定票據(jù)為落 地處理。
[0115] 具體實(shí)施時(shí),進(jìn)行傾斜矯正,可以包括:
[0116] 通過橫向掃描記錄出支票上邊緣的中部的點(diǎn)集的坐標(biāo),根據(jù)記錄的坐標(biāo)進(jìn)行直線 擬合,再根據(jù)擬合上邊緣直線的傾斜角度對(duì)票據(jù)影像進(jìn)行雙線性旋轉(zhuǎn)。
[0117] 具體實(shí)施時(shí),對(duì)字符區(qū)域進(jìn)行定位,可以包括:
[0118] 根據(jù)票據(jù)影像中票面結(jié)構(gòu)和票面偏移情況,獲取支票編號(hào)區(qū)域在票據(jù)影像中的位 置坐標(biāo)和尺寸大小,判斷是否能夠分割出支票編號(hào)區(qū)域,若不能分割出支票編號(hào)區(qū)域則確 定票據(jù)為落地處理。
[0119] 具體實(shí)施時(shí),對(duì)字符區(qū)域進(jìn)行定位,可以包括:
[0120] 測(cè)量出影像右上角中黑色背景的橫向和縱向上的長度,以定位支票票面右上角的 確定坐標(biāo)位置;劃定字符區(qū)域相對(duì)票面的位置和大??;通過動(dòng)態(tài)調(diào)整確定字符區(qū)域的具體 大小和位置坐標(biāo)。
[0121] 具體實(shí)施時(shí),檢測(cè)字符區(qū)域中的字符參數(shù)和印章像素,可以包括:
[0122] 對(duì)字符區(qū)域中每一個(gè)單個(gè)數(shù)字字符進(jìn)行定位分割,檢測(cè)數(shù)字及數(shù)字之間間隙的個(gè) 數(shù)、寬度和高度是否符合字符參數(shù)要求;在HSV色彩空間對(duì)字符區(qū)域進(jìn)行掃描,檢測(cè)字符區(qū) 域的印章像素;如果不符合字符參數(shù)要求或印章像素個(gè)數(shù)超過閾值,則確定票據(jù)為落地處 理。
[0123] 具體實(shí)施時(shí),將字符區(qū)域中的字符與模板進(jìn)行匹配度檢測(cè),可以包括:
[0124] 將字符區(qū)域中定位分割出的每一個(gè)單個(gè)數(shù)字字符與模板進(jìn)行匹配度檢測(cè),并與票 據(jù)影像字符識(shí)別結(jié)果進(jìn)行比對(duì)。
[0125] 具體實(shí)施時(shí),檢測(cè)字符區(qū)域中的字符的開口特征,可以包括:
[0126] 檢測(cè)字符區(qū)域中定位分割出的每一個(gè)單個(gè)數(shù)字字符的開口特征;在開口特征、匹 配度、識(shí)別結(jié)果均一致時(shí),確定字符識(shí)別成功,否則確定票據(jù)為落地處理。
[0127] 如前所述,本發(fā)明實(shí)施例的核心思想是在現(xiàn)有光學(xué)字符識(shí)別技術(shù)的基礎(chǔ)上,分別 在已有識(shí)別流程的每個(gè)步驟前或后增加獨(dú)立的檢測(cè)步驟,這些附加的檢測(cè)步驟專門用于檢 測(cè)會(huì)妨礙下一識(shí)別步驟正確識(shí)別的噪聲,如果發(fā)現(xiàn)噪聲因素則判定不可識(shí)別,并做落地處 理,從而杜絕識(shí)別出錯(cuò)的可能性。
[0128] 圖6為本發(fā)明實(shí)施例中應(yīng)用于票據(jù)影像字符識(shí)別的數(shù)字圖像處理方法的流程示 例圖。圖6中給出了影像參數(shù)檢測(cè)、影像傾斜檢測(cè)、字符區(qū)域檢測(cè)、R0I可識(shí)別檢測(cè)、字符匹 配度檢測(cè)以及開口特征檢測(cè)步驟,以及他們與現(xiàn)有識(shí)別流程之間的組合。圖6中的每一個(gè) 步驟在圖2中都有對(duì)應(yīng)的模塊,即上述每一個(gè)檢測(cè)步驟都可以由新系統(tǒng)中的一個(gè)對(duì)應(yīng)的獨(dú) 立模塊來實(shí)現(xiàn)其功能。識(shí)別流程的每一步驟的輸出都會(huì)接受專門的檢測(cè),同樣地,每個(gè)檢測(cè) 流程的結(jié)果都會(huì)作為判斷條件,以控制是否可以進(jìn)行識(shí)別流程的下一步驟,整個(gè)方法的具 體流程步驟例如可以包括:
[0129] 步驟1 :生成票據(jù)影像,該步驟負(fù)責(zé)生成需要處理的票據(jù)的數(shù)字影像副本,因此需 要采用光學(xué)成像設(shè)備,如平板掃描儀等獲取票據(jù)的數(shù)字影像,票據(jù)本身需人工目測(cè)檢查,票 面部分必須清晰沒有被人為涂改、生成的影像必須也是清晰可辨認(rèn)。生成影像后執(zhí)行步驟 2〇
[0130] 步驟2 :檢測(cè)票據(jù)影像參數(shù),該步驟1生成的票據(jù)影像為輸入,負(fù)責(zé)檢查票據(jù)影像 的具體參數(shù),包括:影像的分辨率是否為200dpi ;影像的大小是否為1500±100X600±50 ; 除支票票面以外的影像邊緣背景部分是否為純黑色,即RGB值為(0, 0, 0)。如果生成的票據(jù) 影像不符合要求,則判定為不可識(shí)別,并重新生成影像或者落地處理,如果通過檢測(cè),則進(jìn) 行步驟3。
[0131] 步驟3 :影像預(yù)處理,該步驟以步驟1生成的票據(jù)影像為輸入,負(fù)責(zé)對(duì)生成的票據(jù) 的影像進(jìn)行色彩、光照以及傾斜校正,以消除不同成像設(shè)備、成像環(huán)境以及人工操作不確定 性等因素對(duì)影像造成的影像,預(yù)處理完畢后執(zhí)行步驟4。
[0132] 步驟4:檢測(cè)影像傾斜,該步驟以步驟3輸出的經(jīng)過預(yù)處理的影像作為輸入,負(fù)責(zé) 檢查影像中票面部分的傾斜程度,(該檢測(cè)步驟與步驟3相互獨(dú)立而功能上冗余,并以此 得到更高的可靠性),即檢測(cè)票面邊緣直線與影像邊緣直線之間的相交角度(小于90度的 角),角度的大小如果為超過± 15度,則判定該票據(jù)影像不可識(shí)別,如果在± 15度之內(nèi),則 利用雙線性插值旋轉(zhuǎn)法進(jìn)行校正,校正后再次檢查傾斜角度,如果仍然有超過±1度的傾 斜,則判定影像不可識(shí)別并落地處理,如果通過檢測(cè),則進(jìn)行步驟5。
[0133] 步驟5 :提取字符特征,該步驟以步驟3輸出的預(yù)處理后的影像為輸入,負(fù)責(zé)提取 待識(shí)別的字符的量化特征,該步驟中首先定位字符區(qū)域在票據(jù)影像中相對(duì)位置,然后逐個(gè) 定位字符區(qū)域內(nèi)的每一個(gè)字符在字符區(qū)域內(nèi)的相對(duì)位置,并量化提取每個(gè)字符的特征,提 取完畢后執(zhí)行步驟6。
[0134] 步驟6 :檢測(cè)字符區(qū)域,該步驟以步驟4輸出的經(jīng)過傾斜檢測(cè)和校正后的影像為輸 入,負(fù)責(zé)檢測(cè)待識(shí)別字符區(qū)域是否符合進(jìn)一步識(shí)別的條件,該步驟首先檢測(cè)票面的右上角 在票據(jù)影像中的位置,即票面上邊緣到影像上邊緣和票面右邊緣到影像右邊緣的距離,并 基于待識(shí)別票據(jù)編號(hào)區(qū)域(即字符區(qū)域)在票面上的位置相對(duì)固定的特點(diǎn),給出字符區(qū)域 在影像中的初始位置。之后利用最大方差法得到字符區(qū)域的二部圖,檢測(cè)生成的二部圖的 四周邊緣是否存在黑色像素,例如字符區(qū)域的二部圖的上邊緣存在黑色像素,則將上邊緣 所在的一整行像素從字符區(qū)域中劃除,使二部圖的上邊緣縱向上向下平移一個(gè)像素,重復(fù) 此步驟直到新的上邊緣不存在黑色像素為止。同樣地如果字符區(qū)域的二部圖的左邊緣上存 在黑色像素,則將左邊緣向右平一個(gè)像素,重復(fù)此步驟直到新的左邊緣上沒有黑色像素為 止。同樣地,下邊緣和右邊緣也按照類似的方式調(diào)整,經(jīng)過逐步調(diào)整區(qū)域四周邊緣,字符區(qū) 域?qū)⒅鸩娇s小,并最終獲得字符區(qū)域的精確位置和大小。如果動(dòng)態(tài)調(diào)整字符區(qū)域的某一條 邊緣的范圍超出了 10個(gè)像素,則判定為不可識(shí)別,并做落地處理,否則繼續(xù)執(zhí)行步驟7。
[0135] 步驟7 :檢測(cè)字符區(qū)域中的字符是否可識(shí)別,該步驟以步驟6輸出的字符區(qū)域二部 圖為輸入,負(fù)責(zé)檢測(cè)字符區(qū)域是否可以分割出能夠識(shí)別的單個(gè)字符的二部圖。首先從票據(jù) 影像中將字符區(qū)域?qū)?yīng)的部分拷貝出副本,并將該副本的色彩空間由RGB轉(zhuǎn)換成HSV,再掃 描是否存在色相在[0, 01]和[0. 9, 1](純紅)或者[0. 55, 0. 65](純藍(lán))之間、飽和度在 [0. 3, 1]之間、亮度在[0. 6, 1]之間的像素,即是否被印章覆蓋;另一方面對(duì)字符區(qū)域的二 部圖進(jìn)行橫向和縱向掃描,檢測(cè)字符區(qū)域中字符的大小和個(gè)數(shù)、以及字符間隔的個(gè)數(shù)和寬 度,縱向掃描時(shí),從字符區(qū)域二部圖中橫向坐標(biāo)固定、從上邊緣垂直到下邊緣的一列像素的 灰度值進(jìn)行掃描,其中連續(xù)的、不存在黑色像素的部分認(rèn)為時(shí)字符間的間隔,連續(xù)的、存在 黑色像素的部分認(rèn)為時(shí)字符。在檢測(cè)的結(jié)果中,間隔數(shù)量必須是10個(gè),字符數(shù)量是8個(gè),字 符的寬度(以像素為單位)在[8, 20]之間,間隔寬度在[4, 12]之間,而字符高度必須在 [25, 32]之間。如果達(dá)不到上述標(biāo)準(zhǔn),則判定為不可識(shí)別做落地處理,否則繼續(xù)執(zhí)行步驟8。
[0136] 步驟8 :匹配字符特征,該步驟以步驟5提取的字符特征作為輸入,負(fù)責(zé)查找并識(shí) 別出字符所對(duì)應(yīng)的數(shù)字。執(zhí)行完畢后繼續(xù)執(zhí)行步驟9。
[0137] 步驟9 :檢測(cè)匹配度和開口特征,該步驟以步驟7中分割出的每個(gè)字符的二部圖和 步驟8的識(shí)別結(jié)果為輸入,負(fù)責(zé)檢測(cè)識(shí)別結(jié)果的正確性。首先將待識(shí)別字符與0至9的字 符模板進(jìn)行匹配,將字符二部圖所有像素與每個(gè)字符模板上對(duì)應(yīng)像素之間的灰度值進(jìn)行二 進(jìn)制異或運(yùn)算,統(tǒng)計(jì)異或結(jié)果為〇的數(shù)量并除以字符二部圖總像素的數(shù)量歸一化,這個(gè)數(shù) 值及定義為該字符與該模板對(duì)應(yīng)的數(shù)字的匹配度,統(tǒng)計(jì)得到匹配度最高的數(shù)字,就是該字 符的真實(shí)數(shù)值。如果最高匹配度小于〇. 95,或者匹配的結(jié)果與步驟8的識(shí)別結(jié)果不一致,則 判定不可識(shí)別做落地處理,否則繼續(xù)執(zhí)行步驟10做進(jìn)一步檢測(cè)。
[0138] 步驟10 :檢測(cè)開口特征,與步驟9功能一樣,該步驟以步驟7中分割出的每個(gè)字符 的二部圖和步驟8的識(shí)別結(jié)果為輸入,負(fù)責(zé)驗(yàn)證識(shí)別結(jié)果的正確性。首先判斷識(shí)別結(jié)果,然 后驗(yàn)證該字符對(duì)應(yīng)的二部圖的開頭特征是否與識(shí)別結(jié)果相吻合,則以字符二部圖的上中心 點(diǎn)(字符的二部圖的上班部分的中心點(diǎn))起點(diǎn),向二部圖的左邊緣水平劃線L1,直到遇到黑 色像素或者左邊緣為止,如果劃出的線段上沒有黑色像素,則認(rèn)為該字符在左上部(字符 二部圖的上半部分的左半邊)是開口的。否則,以字符二部圖的左邊緣的中點(diǎn)為起點(diǎn),向右 邊緣劃水平線L2,直到遇到黑色像素(記為p2)為止,如果p2在pi左邊,則以L2起點(diǎn)的上 一個(gè)像素作為新起點(diǎn)開始重復(fù)劃線L2。得到L1和L2后,以pi為起點(diǎn),向L2劃垂線,然后 以L1上pi右邊一個(gè)像素作為新起點(diǎn)開始重復(fù)向L2劃垂線L3,直到垂線L3與L2的交點(diǎn) 為P2為止,如果夠找到一條沒有黑色像素的垂線L3,則認(rèn)為該字符左上部是開口的,否則 認(rèn)為是閉合的;同樣地,可以對(duì)字符二部圖的左下部、右下部、右上部的開口特性進(jìn)行檢測(cè)。
[0139] 定義開口為1,閉合為0,按照字符左上、左下、右下、右上的開口特征將0、3、5、6、 8、9的開頭特征轉(zhuǎn)換成以下4位編碼 :
[0140] 0:0000 3:1100 5:0101
[0141] 6 :0001 8 :0000 9 :0101
[0142] 如果步驟8的識(shí)別結(jié)果為上述字符中的一個(gè),但開口檢測(cè)結(jié)果與上述編碼不一 致,則判定為不可識(shí)別做落地處理。
[0143] 當(dāng)識(shí)別結(jié)果時(shí)1、2、4、7時(shí),需要進(jìn)行字符寬度檢測(cè)。當(dāng)識(shí)別結(jié)果為1時(shí),如果字符 寬度超過14個(gè)像素之間,則判定為不可識(shí)別;當(dāng)識(shí)別結(jié)果為2時(shí),如果字符二部圖最下面 三行像素中,每一行像素中黑色像素占比低于80%,或者字符二部圖中間的三行像素中,每 一行中黑色像素占比高于30%,則判定為不可識(shí)別;當(dāng)識(shí)別結(jié)果是4時(shí),如果字符的寬度超 過16個(gè)像素,則判定為不可識(shí)別;當(dāng)識(shí)別結(jié)果為7時(shí),如果最上邊緣的三行像素中,每一行 中的黑色像素占比少于80%,或者字符二部圖下半部分每一行的像素中黑色像素占比多余 30%,則判定為不可識(shí)別;
[0144] 該步驟完成后,整個(gè)識(shí)別流程完成,開始下一張票據(jù)影像的識(shí)別。
[0145] 相對(duì)于現(xiàn)有技術(shù),本發(fā)明實(shí)施例的應(yīng)用于票據(jù)影像字符識(shí)別的數(shù)字圖像處理系統(tǒng) 和方法主要在以下兩點(diǎn)上做出了改進(jìn):
[0146] 1、策略不同:現(xiàn)有的識(shí)別技術(shù)所采用的策略多是:"盡量消除影像中影響識(shí)別的 噪聲并確保識(shí)別正確",但是"影響識(shí)別的噪聲"種類繁多,出于效率、成本和可行性的考慮, 很難也不可能將各種噪聲都檢測(cè)出來,此外有些噪聲雖然可以被檢測(cè)出來,但是也很難被 完全排除掉。本發(fā)明實(shí)施例中則采用不同的策略:"盡量檢測(cè)出影響識(shí)別的因素并過濾掉不 易識(shí)別的影像",即并不會(huì)去努力嘗試消除某些難以處理的噪聲,而是試圖檢測(cè)這些噪聲的 存在,并將存在噪聲的影像排除出識(shí)別流程。這樣自然就有效地避免了由于那些難以處理 的噪聲導(dǎo)致的識(shí)別錯(cuò)誤的情況。當(dāng)存在噪聲的影像數(shù)量較少的時(shí)候,(例如同城票交中,本 發(fā)明實(shí)施例過濾出來的影像數(shù)量不會(huì)超過總數(shù)的30% ),可以在保證大部分影像被識(shí)別的 前提下使得識(shí)別正確率明顯提高(注:這里的識(shí)別正確率定義為:識(shí)別結(jié)果正確的影像數(shù) 量與識(shí)別程序判定為識(shí)別成功的影像數(shù)量中的比值;可識(shí)別率定義為:識(shí)別程序判定為識(shí) 別成功的影像的數(shù)量與所有待識(shí)別的影像的數(shù)量的比值);
[0147] 2、專門針對(duì)支票設(shè)計(jì):現(xiàn)有技術(shù)出于成本和通用性的考慮,不會(huì)專門針對(duì)某一個(gè) 特定的識(shí)別場(chǎng)景去開發(fā),本發(fā)明實(shí)施例專門針對(duì)支票編號(hào)的識(shí)別進(jìn)行設(shè)計(jì),針對(duì)支票票面 結(jié)構(gòu)、使用流通過程、影像生成等多個(gè)環(huán)節(jié)進(jìn)行分析,并對(duì)所有可能出現(xiàn)的影響識(shí)別的噪聲 加以定量考慮,并給出識(shí)別檢測(cè)方法。換句話說,本發(fā)明實(shí)施例給出了一個(gè)支票編號(hào)的參數(shù) 化模型,該模型對(duì)諸如支票影像的掃描生成差異、支票票面結(jié)構(gòu)、印章覆蓋、字符覆蓋、支票 編號(hào)字體等特征用一系列參數(shù)進(jìn)行定量描述,識(shí)別流程中的每一個(gè)相應(yīng)步驟都對(duì)這些參數(shù) 加以檢測(cè),如果檢測(cè)結(jié)果達(dá)不到給定的指標(biāo),則判定為不可識(shí)別,因此當(dāng)影像走完整個(gè)識(shí)別 流程得到的識(shí)別結(jié)果,其正確率比現(xiàn)有系統(tǒng)有明顯提高;
[0148] 下面舉一例驗(yàn)證實(shí)驗(yàn)結(jié)果:下面的表格記錄了基于本發(fā)明實(shí)施例的一次驗(yàn)證性實(shí) 驗(yàn)結(jié)果,實(shí)驗(yàn)數(shù)據(jù)為某行同城票交2009年10月到11月間共30天的票據(jù)影像,共計(jì)近6萬 張票據(jù)影像,平均每天的票據(jù)影像為2000張,圖像分辨率200dpi。用于驗(yàn)證識(shí)別結(jié)果正確 性驗(yàn)證的數(shù)據(jù)為該分行會(huì)計(jì)業(yè)務(wù)處理中心同城票據(jù)處理手工錄入記錄。整個(gè)識(shí)別程序有C 語言編寫,開發(fā)平臺(tái)為VC6. 0+0PENCV,測(cè)試數(shù)據(jù)存儲(chǔ)數(shù)據(jù)庫為0RCALE10G。
[0149] 下表中檢測(cè)出不同張數(shù)這一列的數(shù)據(jù)表述的是數(shù)據(jù)庫字段的支票編號(hào)與識(shí)別程 序得出識(shí)別結(jié)果出不一樣的張數(shù),經(jīng)過人工驗(yàn)證識(shí)別程序得到的結(jié)果是正確的,造成不一 樣的原因是由于票據(jù)影像名與數(shù)據(jù)庫對(duì)應(yīng)記錄的名稱字段不匹配造成的,為錄入的錯(cuò)誤。 由統(tǒng)計(jì)結(jié)果可見平均可識(shí)別率超過七成達(dá)到72%左右,識(shí)別正確率為100%。
[0150]
【權(quán)利要求】
1. 一種應(yīng)用于票據(jù)影像字符識(shí)別的數(shù)字圖像處理系統(tǒng),其特征在于,包括: 影像參數(shù)檢測(cè)模塊,用于檢測(cè)票據(jù)影像參數(shù); 影像傾斜檢測(cè)模塊,用于檢測(cè)票據(jù)影像中票面的傾斜程度; 字符區(qū)域檢測(cè)模塊,用于對(duì)字符區(qū)域進(jìn)行定位; 字符區(qū)域可識(shí)別檢測(cè)模塊,用于檢測(cè)字符區(qū)域中的字符參數(shù)和印章像素; 字符匹配度檢測(cè)模塊,用于將字符區(qū)域中的字符與模板進(jìn)行匹配度檢測(cè); 開口特征檢測(cè)模塊,用于檢測(cè)字符區(qū)域中的字符的開口特征。
2. 如權(quán)利要求1所述的系統(tǒng),其特征在于,所述影像參數(shù)檢測(cè)模塊具體用于: 檢測(cè)票據(jù)影像是否符合分辨率、影像尺寸和影像格式要求,以及是否包含完整票據(jù)畫 面,在達(dá)不到要求時(shí)確定票據(jù)為落地處理。
3. 如權(quán)利要求1所述的系統(tǒng),其特征在于,所述影像傾斜檢測(cè)模塊具體用于: 通過掃描票據(jù)影像中的票面邊緣獲取票面傾斜角度,在傾斜角度不超過閾值時(shí)進(jìn)行傾 斜矯正并檢測(cè)矯正結(jié)果,在傾斜角度超過閾值或經(jīng)過矯正仍存在傾斜時(shí)確定票據(jù)為落地處 理。
4. 如權(quán)利要求3所述的系統(tǒng),其特征在于,所述影像傾斜檢測(cè)模塊具體用于: 通過橫向掃描記錄出支票上邊緣的中部的點(diǎn)集的坐標(biāo),根據(jù)記錄的坐標(biāo)進(jìn)行直線擬 合,再根據(jù)擬合上邊緣直線的傾斜角度對(duì)票據(jù)影像進(jìn)行雙線性旋轉(zhuǎn)。
5. 如權(quán)利要求1所述的系統(tǒng),其特征在于,所述字符區(qū)域檢測(cè)模塊具體用于: 根據(jù)票據(jù)影像中票面結(jié)構(gòu)和票面偏移情況,獲取支票編號(hào)區(qū)域在票據(jù)影像中的位置坐 標(biāo)和尺寸大小,判斷是否能夠分割出支票編號(hào)區(qū)域,若不能分割出支票編號(hào)區(qū)域則確定票 據(jù)為落地處理。
6. 如權(quán)利要求5所述的系統(tǒng),其特征在于,所述字符區(qū)域檢測(cè)模塊具體用于: 測(cè)量出影像右上角中黑色背景的橫向和縱向上的長度,以定位支票票面右上角的確定 坐標(biāo)位置;劃定字符區(qū)域相對(duì)票面的位置和大?。煌ㄟ^動(dòng)態(tài)調(diào)整確定字符區(qū)域的具體大小 和位置坐標(biāo)。
7. 如權(quán)利要求1所述的系統(tǒng),其特征在于,所述字符區(qū)域可識(shí)別檢測(cè)模塊具體用于: 對(duì)字符區(qū)域中每一個(gè)單個(gè)數(shù)字字符進(jìn)行定位分割,檢測(cè)數(shù)字及數(shù)字之間間隙的個(gè)數(shù)、 寬度和高度是否符合字符參數(shù)要求;在HSV色彩空間對(duì)字符區(qū)域進(jìn)行掃描,檢測(cè)字符區(qū)域 的印章像素;如果不符合字符參數(shù)要求或印章像素個(gè)數(shù)超過閾值,則確定票據(jù)為落地處理。
8. 如權(quán)利要求7所述的系統(tǒng),其特征在于,所述字符匹配度檢測(cè)模塊具體用于: 將字符區(qū)域中定位分割出的每一個(gè)單個(gè)數(shù)字字符與模板進(jìn)行匹配度檢測(cè),并與票據(jù)影 像字符識(shí)別結(jié)果進(jìn)行比對(duì)。
9. 如權(quán)利要求8所述的系統(tǒng),其特征在于,所述開口特征檢測(cè)模塊具體用于: 檢測(cè)字符區(qū)域中定位分割出的每一個(gè)單個(gè)數(shù)字字符的開口特征;在開口特征、匹配度、 識(shí)別結(jié)果均一致時(shí),確定字符識(shí)別成功,否則確定票據(jù)為落地處理。
10. -種應(yīng)用于票據(jù)影像字符識(shí)別的數(shù)字圖像處理方法,其特征在于,包括: 檢測(cè)票據(jù)影像參數(shù); 檢測(cè)票據(jù)影像中票面的傾斜程度; 對(duì)字符區(qū)域進(jìn)行定位; 檢測(cè)字符區(qū)域中的字符參數(shù)和印章像素; 將字符區(qū)域中的字符與模板進(jìn)行匹配度檢測(cè); 檢測(cè)字符區(qū)域中的字符的開口特征。
11. 如權(quán)利要求10所述的方法,其特征在于,所述檢測(cè)票據(jù)影像參數(shù),包括: 檢測(cè)票據(jù)影像是否符合分辨率、影像尺寸和影像格式要求,以及是否包含完整票據(jù)畫 面,在達(dá)不到要求時(shí)確定票據(jù)為落地處理。
12. 如權(quán)利要求10所述的方法,其特征在于,所述檢測(cè)票據(jù)影像中票面的傾斜程度,包 括: 通過掃描票據(jù)影像中的票面邊緣獲取票面傾斜角度,在傾斜角度不超過閾值時(shí)進(jìn)行傾 斜矯正并檢測(cè)矯正結(jié)果,在傾斜角度超過閾值或經(jīng)過矯正仍存在傾斜時(shí)確定票據(jù)為落地處 理。
13. 如權(quán)利要求12所述的方法,其特征在于,所述進(jìn)行傾斜矯正,包括: 通過橫向掃描記錄出支票上邊緣的中部的點(diǎn)集的坐標(biāo),根據(jù)記錄的坐標(biāo)進(jìn)行直線擬 合,再根據(jù)擬合上邊緣直線的傾斜角度對(duì)票據(jù)影像進(jìn)行雙線性旋轉(zhuǎn)。
14. 如權(quán)利要求10所述的方法,其特征在于,所述對(duì)字符區(qū)域進(jìn)行定位,包括: 根據(jù)票據(jù)影像中票面結(jié)構(gòu)和票面偏移情況,獲取支票編號(hào)區(qū)域在票據(jù)影像中的位置坐 標(biāo)和尺寸大小,判斷是否能夠分割出支票編號(hào)區(qū)域,若不能分割出支票編號(hào)區(qū)域則確定票 據(jù)為落地處理。
15. 如權(quán)利要求14所述的方法,其特征在于,所述對(duì)字符區(qū)域進(jìn)行定位,包括: 測(cè)量出影像右上角中黑色背景的橫向和縱向上的長度,以定位支票票面右上角的確定 坐標(biāo)位置;劃定字符區(qū)域相對(duì)票面的位置和大??;通過動(dòng)態(tài)調(diào)整確定字符區(qū)域的具體大小 和位置坐標(biāo)。
16. 如權(quán)利要求10所述的方法,其特征在于,所述檢測(cè)字符區(qū)域中的字符參數(shù)和印章 像素,包括: 對(duì)字符區(qū)域中每一個(gè)單個(gè)數(shù)字字符進(jìn)行定位分割,檢測(cè)數(shù)字及數(shù)字之間間隙的個(gè)數(shù)、 寬度和高度是否符合字符參數(shù)要求;在HSV色彩空間對(duì)字符區(qū)域進(jìn)行掃描,檢測(cè)字符區(qū)域 的印章像素;如果不符合字符參數(shù)要求或印章像素個(gè)數(shù)超過閾值,則確定票據(jù)為落地處理。
17. 如權(quán)利要求16所述的方法,其特征在于,所述將字符區(qū)域中的字符與模板進(jìn)行匹 配度檢測(cè),包括: 將字符區(qū)域中定位分割出的每一個(gè)單個(gè)數(shù)字字符與模板進(jìn)行匹配度檢測(cè),并與票據(jù)影 像字符識(shí)別結(jié)果進(jìn)行比對(duì)。
18. 如權(quán)利要求17所述的方法,其特征在于,所述檢測(cè)字符區(qū)域中的字符的開口特征, 包括: 檢測(cè)字符區(qū)域中定位分割出的每一個(gè)單個(gè)數(shù)字字符的開口特征;在開口特征、匹配度、 識(shí)別結(jié)果均一致時(shí),確定字符識(shí)別成功,否則確定票據(jù)為落地處理。
【文檔編號(hào)】G06K9/20GK104112128SQ201410276103
【公開日】2014年10月22日 申請(qǐng)日期:2014年6月19日 優(yōu)先權(quán)日:2014年6月19日
【發(fā)明者】曾修遠(yuǎn), 蘇永前, 王彥紅, 程煒華, 周程偉, 趙文哲 申請(qǐng)人:中國工商銀行股份有限公司