基于模板匹配的印刷體數(shù)字識(shí)別方法
【專利摘要】本發(fā)明提供一種基于模板匹配的印刷體數(shù)字識(shí)別方法,該方法包括待識(shí)別圖像輸入部分、模板匹配識(shí)別部分、識(shí)別結(jié)果輸出部分,其很好的挺高了印刷體數(shù)字識(shí)別的識(shí)別率和系統(tǒng)的抗干擾性。通過(guò)對(duì)模板匹配方法的研究和實(shí)現(xiàn),為數(shù)字識(shí)別提供了新的解決途徑和思路,非常有使用價(jià)值和改進(jìn)的價(jià)值。
【專利說(shuō)明】基于模板匹配的印刷體數(shù)字識(shí)別方法
【技術(shù)領(lǐng)域】 [0001] :本發(fā)明提供一種基于模板匹配的印刷體數(shù)字識(shí)別方法,基于模板匹配 的印刷體數(shù)字識(shí)別算法屬于字符識(shí)別領(lǐng)域。
【背景技術(shù)】 [0002] :印刷體數(shù)字識(shí)別一直是模式識(shí)別領(lǐng)域的研究熱點(diǎn)。隨著當(dāng)今社會(huì)信息 化的快速發(fā)展,我們正被數(shù)字化時(shí)代圍繞著,數(shù)字正朝著替代我們對(duì)話和文字語(yǔ)言表達(dá)、 記憶的方向進(jìn)展。手機(jī)號(hào)碼、駕駛證號(hào)碼、身份證號(hào)碼和體檢表中一系列表達(dá)出身份、能力、 對(duì)象和健康質(zhì)量的數(shù)字信息表示都需要用計(jì)算機(jī)解讀的阿拉伯?dāng)?shù)字:1、2、3、4、5、6、7、8、9、 0的組合來(lái)表達(dá)。因此針對(duì)這類問(wèn)題的處理系統(tǒng)設(shè)計(jì)的關(guān)鍵之一就是設(shè)計(jì)出高可靠性和高 識(shí)別率的數(shù)字識(shí)別方法。然而,沒(méi)有哪個(gè)數(shù)字識(shí)別方法能夠達(dá)到完美的識(shí)別效果。因此,對(duì) 印刷體數(shù)字的識(shí)別研究仍然是有重大意義的。
[0003] 左右輪廓特征的印刷體數(shù)字識(shí)別算法,是模板特征匹配的一個(gè)典型應(yīng)用。它的的 主要思路是,把單個(gè)數(shù)字水平分為六部分,可以均勻分為六分,也可以不均勻分,可以根據(jù) 字符字體的特點(diǎn)進(jìn)行相應(yīng)的調(diào)整。在特征提取過(guò)程中,不再是掃描每一行的連續(xù)黑色像素 點(diǎn)的個(gè)數(shù),作為該行的左(右)輪廓特征。而是對(duì)靠近上下邊緣和中間的位置采樣密度大 些。取樣的位置選擇斐波那契數(shù)列進(jìn)行取樣。斐波那契數(shù)列為1,1,2, 3, 5,8,若選擇5個(gè)數(shù) 字,則選擇1,2, 3, 5,8位置處進(jìn)行取樣,既在第一部分和第六部分靠近上下邊緣處,第三部 分和第四部分靠近中間處開(kāi)始的1/8,2/8,3/8,5/8,8/8的位置取樣。利用公式得到所需的 左側(cè)邊緣的特征,共20個(gè)。對(duì)于數(shù)字的右邊緣來(lái)說(shuō),因?yàn)橛逸喞倪吘壓艽蟪潭壬虾妥筮?緣一致,所以在右邊緣抽樣時(shí)只在第三和第四部分取樣,采樣方式采用和左邊緣一樣的不 均勻采樣,這樣會(huì)得到10個(gè)特征,不過(guò)為了提高對(duì)"2"和"7"間的對(duì)比,對(duì)字符的第六部分 進(jìn)行采樣,采樣方式如前,只是只采樣4個(gè)特征,為1/8, 2/8, 3/8, 5/8四個(gè)位置。這樣對(duì)圖 像的左右邊緣特征提取后為一個(gè)34維的特征向量。最后通過(guò)提取算法得到的為34維的特 征向量,使用歐幾里德距離來(lái)比較特征向量之間的相似度。計(jì)算待識(shí)別數(shù)字的特征向量與 標(biāo)準(zhǔn)庫(kù)中各個(gè)數(shù)字的標(biāo)準(zhǔn)模板特征向量的歐氏距離,選擇距離最小的模板字符作為識(shí)別結(jié) 果。由于特征向量維數(shù)太大導(dǎo)致識(shí)別時(shí)間較長(zhǎng)。
[0004] 基于數(shù)字結(jié)構(gòu)特征的印刷體數(shù)字識(shí)別算法,多特征抽取和模板特征匹配的方法來(lái) 實(shí)現(xiàn)印刷體數(shù)字的快速識(shí)別。通過(guò)提取算法得到的為10維的特征向量,使用歐幾里德距離 來(lái)比較特征向量之間的相似度。計(jì)算待識(shí)別數(shù)字的特征向量與標(biāo)準(zhǔn)庫(kù)中各個(gè)數(shù)字的標(biāo)準(zhǔn)模 板特征向量的歐氏距離,選擇距離最小的模板字符作為識(shí)別結(jié)果。雖然降低的特征向量維 數(shù),但該算法的識(shí)別率還是沒(méi)有達(dá)到某些高識(shí)別率的要求。
【發(fā)明內(nèi)容】
:
[0005] 發(fā)明目的:本發(fā)明提供一種基于模板匹配的印刷體數(shù)字識(shí)別方法,其目的是解決 以往的方式所存在的缺點(diǎn)。
[0006] 技術(shù)方案:本發(fā)明是通過(guò)以下技術(shù)方案來(lái)實(shí)現(xiàn)的:
[0007] -種基于模板匹配的印刷體數(shù)字識(shí)別方法,其特征在于:該方法包括待識(shí)別圖像 輸入部分、模板匹配識(shí)別部分、識(shí)別結(jié)果輸出部分,具體步驟如下:
[0008] 待識(shí)別圖像輸入部分,包括以下步驟:
[0009] 步驟1、通過(guò)外部設(shè)備照相機(jī)采集待識(shí)別數(shù)字的圖像,本步驟中相機(jī)像素必須達(dá)到 300萬(wàn)像素以上,使采集的圖像達(dá)到最低識(shí)別要求,將采集好的圖像輸入系統(tǒng);
[0010] 步驟2、將輸入的待識(shí)別圖像進(jìn)行前期預(yù)處理,首先將圖像通過(guò)中值濾波法去除噪 聲,其次將彩色圖像進(jìn)行灰度化處理,再次對(duì)灰度化的圖像進(jìn)行二值化處理,然后對(duì)二值化 的圖像進(jìn)行噪聲粘連區(qū)域修復(fù)再采用自適應(yīng)閾值分割對(duì)數(shù)字圖像分割,最后將分割好的數(shù) 字圖像歸一化處理,將處理好的圖像輸入模板匹配識(shí)別部分;
[0011] 模板匹配識(shí)別部分,該部分的識(shí)別基于模板匹配的印刷體數(shù)字識(shí)別方法,包括以 下步驟:
[0012] 步驟1、將與待識(shí)別字體相同的標(biāo)準(zhǔn)數(shù)字模板圖像導(dǎo)入程序數(shù)據(jù)庫(kù)中,模板圖像為 白色背景,黑色數(shù)字,故數(shù)字區(qū)像素值為0,背景區(qū)像素值為1 ;
[0013] 步驟2、將待識(shí)別圖像輸入部分生成的二值化圖像與模板圖像對(duì)應(yīng)像素位疊加,其 中待識(shí)別的二值化圖像為黑色背景,白色數(shù)字,數(shù)字區(qū)像素值為1,背景區(qū)像素值為〇 ;
[0014] 步驟3、對(duì)疊加后的圖像中各像素點(diǎn)的像素值進(jìn)行統(tǒng)計(jì),分析統(tǒng)計(jì)出的數(shù)據(jù),并識(shí) 別出待識(shí)別的印刷體數(shù)字;
[0015] 識(shí)別結(jié)果輸出部分,將識(shí)別結(jié)果通過(guò)計(jì)算機(jī)顯示器顯示出來(lái)或通過(guò)打印機(jī)輸出結(jié) 果,也可根據(jù)該系統(tǒng)應(yīng)用的領(lǐng)域?qū)⒃擃I(lǐng)域數(shù)據(jù)融入系統(tǒng)中,得出該數(shù)字所關(guān)聯(lián)的全部相關(guān) 信息。
[0016] (一)圖像預(yù)處理過(guò)程:
[0017] (1)圖像采集:數(shù)字圖像既可以通過(guò)聯(lián)機(jī)的攝像設(shè)備采集,也可以通過(guò)已經(jīng)保存 的圖像進(jìn)行識(shí)別,本文采集的圖像是利用相機(jī)拍攝的發(fā)票電子照片,印刷體數(shù)字識(shí)別的形 態(tài)穩(wěn)定且結(jié)構(gòu)簡(jiǎn)單,所以識(shí)別過(guò)程所需要的信息量相對(duì)其他識(shí)別較少,利用相機(jī)拍攝取得 的數(shù)字圖像已經(jīng)可以取得滿足識(shí)別的要求;
[0018] (2)圖像去噪處理:中值濾波器用像素的相鄰區(qū)域的像素的灰度中值代替該像素 的灰度值,是最常見(jiàn)的統(tǒng)計(jì)濾波器,自適應(yīng)中值濾波器則可以對(duì)比較大的概率的噪聲進(jìn)行 處理,還可以在平滑非沖激噪聲的同時(shí)保存細(xì)節(jié),該步驟中采用3*3模板的自適應(yīng)中值濾 波器;
[0019] (3)圖像灰度化:相機(jī)采集的圖片為24位真彩圖,需要轉(zhuǎn)化為灰度圖,用g標(biāo)示灰 度化后的灰度值,R,G,B表示真彩圖中的紅、綠、藍(lán)分量,g = 0. 299R+0. 587G+0. 114B ;
[0020] (4)圖像二值化:字符圖像二值化一般是將256色的灰度圖轉(zhuǎn)化為只有黑白兩色 的二值圖,高步驟中,由于轉(zhuǎn)化后的圖像目標(biāo)為白色,背景為黑色,所以要在圖像二值化之 前對(duì)圖像進(jìn)行反運(yùn)算,圖像二值化是數(shù)字識(shí)別系統(tǒng)中非常重要的一步,其效果的好壞直接 影響到數(shù)字的邊緣分布,好的二值化算法能夠有效區(qū)分前景和背景,得到真實(shí)的字符邊緣, 也就可以得到準(zhǔn)確的數(shù)字特征;
[0021] (5)圖像分割預(yù)處理:針對(duì)圖像中連通面積低于閾值的,判定為噪聲粘連區(qū)域,最 后,對(duì)噪聲粘連區(qū)域進(jìn)行反色處理,從而消除分割過(guò)程中的噪聲粘連區(qū)域和去噪環(huán)節(jié)無(wú)法 去除的雜點(diǎn),從而進(jìn)行正常的數(shù)字分割;
[0022] (6)圖像分割:利用投影法將數(shù)字水平分開(kāi)后,就成功地找到了每個(gè)數(shù)字的左右 邊界;然后對(duì)切分好的每位數(shù)字再進(jìn)行水平投影:即計(jì)算每位數(shù)字的每一行中屬于數(shù)碼的 象素?cái)?shù)目,這樣可以找出每個(gè)數(shù)字的高度值;
[0023] (7)圖像歸一化:數(shù)字大小歸一化是指對(duì)不同大小的數(shù)字作幾何變換,使之成為 同一大小尺寸;數(shù)字大小歸一化要求保持?jǐn)?shù)字的拓?fù)浣Y(jié)構(gòu)不能改變,最大限度地降低數(shù)字 的失真,以便提高識(shí)別準(zhǔn)確率;令f(x,y)為原圖像,g(x',/ )為歸一化后的圖像,歸一 化后的圖像與原圖像的坐標(biāo)之間的映射關(guān)系為:
[0024] X = Ilxi
[0025] y = ε y '
[0026] 其中:
[0027] n = width/width/
[0028] ε = height/height'
[0029] width, width'分別表示原圖像和歸一化后圖像的寬度,同時(shí),height和 height'分別表示原圖像和歸一化后圖像的高度。歸一化后(X',y')點(diǎn)的灰度值為:
[0030] g(x/ ,Yi ) = f(x,y)
[0031] 輸出點(diǎn)可能會(huì)被映射到原圖像的浮點(diǎn)數(shù)的位置,這就需要使用插值算法來(lái)計(jì)算該 點(diǎn)的像素值;插值算法為雙線性插值法;
[0032] 雙線性插值中,設(shè)原圖像點(diǎn)(x,y)周圍四個(gè)像素點(diǎn)分別為(i,j),(i,j+1), (i+1,j),(i+1,j+1),雙線性插值通過(guò)以下公式來(lái)計(jì)算:
[0033] u = (1- λ ) f (i, j) + λ f (i, j+1)
[0034] ν = (1- λ ) f (i+1, j) +
[0035] λ f (i+1, j+1)
[0036] g(x,)= (1_μ)ιι+μν
[0037] 其中 λ = |x-i I,μ = |y-j I ;
[0038] (二)、模板匹配部分:
[0039] (1)將與待識(shí)別字體相同的模板圖像導(dǎo)入程序數(shù)據(jù)庫(kù)中,本申請(qǐng)對(duì)發(fā)票編號(hào)進(jìn)行 識(shí)別所以先將發(fā)票編號(hào)字體的數(shù)字模板導(dǎo)入數(shù)據(jù)庫(kù)中;
[0040] (2)將待識(shí)別的圖像與模板庫(kù)中圖像進(jìn)行像素點(diǎn)疊加,因?yàn)閿?shù)字6與數(shù)字5、8、9有 很大的相似度,所以本文用數(shù)字6舉例來(lái)說(shuō)明本方法;
[0041] (3)匹配結(jié)果統(tǒng)計(jì)
[0042] 首先由于圖像經(jīng)過(guò)二值化處理之后,圖像變成了一個(gè)只有0, 1組成的二維矩陣, 待識(shí)別數(shù)字經(jīng)二值化之后也成為一個(gè)二維矩陣,將圖像分為數(shù)字區(qū)和背景區(qū),待識(shí)別數(shù)字 的數(shù)字區(qū)是由1組成的,背景區(qū)是由0組成的;而模板正是相反,其數(shù)字區(qū)是由0組成的,背 景區(qū)是由1組成的;經(jīng)過(guò)待識(shí)別數(shù)字與模板進(jìn)行加法運(yùn)算,生成一個(gè)由0, 1,2組成的二維矩 陣;理論上如果兩個(gè)圖像完全匹配,值為1的位與對(duì)應(yīng)0的位相加則必定生成一個(gè)只有1組 成的二維矩陣;但如果不匹配則會(huì)出現(xiàn)0和2這兩種結(jié)果;所以只需統(tǒng)計(jì)匹配之后圖像中 像素值為〇和2所占整體圖像的比例便可識(shí)別出結(jié)果;
[0043](三)、匹配結(jié)果輸出模塊:
[0044] 將識(shí)別結(jié)果通過(guò)計(jì)算機(jī)顯示器顯示出來(lái)或通過(guò)打印機(jī)輸出結(jié)果或根據(jù)該系統(tǒng)應(yīng) 用的領(lǐng)域?qū)⒃擃I(lǐng)域數(shù)據(jù)融入系統(tǒng)中,得出該數(shù)字的全部相關(guān)信息。
[0045] 優(yōu)點(diǎn)及效果:本發(fā)明涉及一種基于模板匹配的印刷體數(shù)字識(shí)別方法,其很好的挺 高了印刷體數(shù)字識(shí)別的識(shí)別率和系統(tǒng)的抗干擾性。
[0046] 傳統(tǒng)模板匹配法是實(shí)現(xiàn)離散輸入模式分類的有效途徑之一,其實(shí)質(zhì)是通過(guò)度量輸 入模式與模板之間的相似性,取相似性最大的作為輸入模式所屬類別。此方法是由字符的 直觀形象抽取特征,用相關(guān)匹配原理確定的匹配函數(shù)進(jìn)行判斷,也就是將輸入字符與標(biāo)準(zhǔn) 模板字符在一個(gè)分類器中進(jìn)行匹配。但傳統(tǒng)模板匹配方法的缺點(diǎn)是抗干擾能力差,導(dǎo)致準(zhǔn) 確性差。本文提出了一種基于模板匹配的準(zhǔn)確、高效的數(shù)字識(shí)別算法。所提方法雖然在時(shí) 間上有很好的工作效率,且該算法抗干擾性強(qiáng)識(shí)別率很高,圖像識(shí)別準(zhǔn)確率可達(dá)99%,獲 得了滿意的效果。總的來(lái)說(shuō),通過(guò)對(duì)模板匹配方法的研究和實(shí)現(xiàn),為數(shù)字識(shí)別提供了新的解 決途徑和思路,非常有使用價(jià)值和改進(jìn)的價(jià)值。
【專利附圖】
【附圖說(shuō)明】:
[0047] 圖1為本發(fā)明一種實(shí)例的系統(tǒng)整體結(jié)構(gòu)框圖
[0048] 圖2為本發(fā)明一種實(shí)例的標(biāo)準(zhǔn)數(shù)字模板圖
[0049] 圖3為本發(fā)明一種實(shí)例的待識(shí)別數(shù)字與標(biāo)準(zhǔn)數(shù)字模板匹配的效果圖
[0050] 圖4為本發(fā)明一種實(shí)例的待識(shí)別數(shù)字6與標(biāo)準(zhǔn)數(shù)字模板匹配的結(jié)果統(tǒng)計(jì)圖。
【具體實(shí)施方式】 [0051] :下面結(jié)合附圖對(duì)本發(fā)明做進(jìn)一步的說(shuō)明:
[0052] 本發(fā)明提供一種基于模板匹配的印刷體數(shù)字識(shí)別方法,該方法包括待識(shí)別圖像輸 入部分、模板匹配識(shí)別部分、識(shí)別結(jié)果輸出部分,具體步驟如下:
[0053] 待識(shí)別圖像輸入部分,包括以下步驟:
[0054] 步驟1、通過(guò)外部設(shè)備照相機(jī)采集待識(shí)別數(shù)字的圖像,本步驟中相機(jī)像素必須達(dá)到 300萬(wàn)像素以上,使采集的圖像達(dá)到最低識(shí)別要求,將采集好的圖像輸入系統(tǒng);
[0055] 步驟2、將輸入的待識(shí)別圖像進(jìn)行前期預(yù)處理,首先將圖像通過(guò)中值濾波法去除噪 聲,其次將彩色圖像進(jìn)行灰度化處理,再次對(duì)灰度化的圖像進(jìn)行二值化處理,然后對(duì)二值化 的圖像進(jìn)行噪聲粘連區(qū)域修復(fù)再采用自適應(yīng)閾值分割對(duì)數(shù)字圖像分割,最后將分割好的數(shù) 字圖像歸一化處理,將處理好的圖像輸入模板匹配識(shí)別部分;
[0056] 模板匹配識(shí)別部分,該部分的識(shí)別基于模板匹配的印刷體數(shù)字識(shí)別方法,包括以 下步驟:
[0057] 步驟1、將與待識(shí)別字體相同的標(biāo)準(zhǔn)數(shù)字模板圖像導(dǎo)入程序數(shù)據(jù)庫(kù)中,模板圖像為 白色背景,黑色數(shù)字,故數(shù)字區(qū)像素值為〇,背景區(qū)像素值為1 ;
[0058] 步驟2、將待識(shí)別圖像輸入部分生成的二值化圖像與模板圖像對(duì)應(yīng)像素位疊加,其 中待識(shí)別的二值化圖像為黑色背景,白色數(shù)字,數(shù)字區(qū)像素值為1,背景區(qū)像素值為〇 ;
[0059] 步驟3、對(duì)疊加后的圖像中各像素點(diǎn)的像素值進(jìn)行統(tǒng)計(jì),分析統(tǒng)計(jì)出的數(shù)據(jù),并識(shí) 別出待識(shí)別的印刷體數(shù)字;
[0060] 識(shí)別結(jié)果輸出部分,將識(shí)別結(jié)果通過(guò)計(jì)算機(jī)顯示器顯示出來(lái)或通過(guò)打印機(jī)輸出結(jié) 果,也可根據(jù)該系統(tǒng)應(yīng)用的領(lǐng)域?qū)⒃擃I(lǐng)域數(shù)據(jù)融入系統(tǒng)中,得出該數(shù)字所關(guān)聯(lián)的全部相關(guān) 信息。 實(shí)施例
[0061] 各模塊功能如下:
[0062] 1.發(fā)票圖像輸入預(yù)處理模塊:
[0063] 圖像輸入預(yù)處理部分包括圖像采集、圖像去噪處理、圖像灰度化、圖像二值化、圖 像數(shù)字分割預(yù)處理、數(shù)字分割、數(shù)字圖像歸一化。
[0064] 圖像預(yù)處理過(guò)程說(shuō)明:
[0065] (1)圖像采集:數(shù)字圖像既可以通過(guò)聯(lián)機(jī)的攝像設(shè)備采集,也可以通過(guò)已經(jīng)保存 的圖像進(jìn)行識(shí)別。本文采集的圖像是利用相機(jī)拍攝的發(fā)票電子照片。從原理上說(shuō),分辨率 越高,則保存的數(shù)字信息越多,數(shù)字的識(shí)別率也就越高,但是相應(yīng)的計(jì)算量也就越大,時(shí)間 越慢。印刷體數(shù)字識(shí)別的形態(tài)穩(wěn)定且結(jié)構(gòu)簡(jiǎn)單,所以識(shí)別過(guò)程所需要的信息量相對(duì)其他識(shí) 別較少,利用相機(jī)拍攝取得的數(shù)字圖像已經(jīng)可以取得滿足識(shí)別的要求。
[0066] (2)圖像去噪處理:中值濾波器用像素的相鄰區(qū)域的像素的灰度中值代替該像素 的灰度值,是最常見(jiàn)的統(tǒng)計(jì)濾波器。自適應(yīng)中值濾波器則可以對(duì)比較大的概率的噪聲進(jìn)行 處理,還可以在平滑非沖激噪聲的同時(shí)保存細(xì)節(jié)。在本文中,采用3*3模板的自適應(yīng)中值濾 波器。
[0067] (3)圖像灰度化:相機(jī)采集的圖片為24位真彩圖,需要轉(zhuǎn)化為灰度圖。用g標(biāo)示 灰度化后的灰度值,R,G,B表示真彩圖中的紅、綠、藍(lán)分量,g = 0. 299R+0. 587G+0. 114B。
[0068] (4)圖像二值化:字符圖像二值化一般是將256色的灰度圖轉(zhuǎn)化為只有黑白兩色 的二值圖,在本文中,由于轉(zhuǎn)化后的圖像目標(biāo)為白色,背景為黑色,所以要在圖像二值化之 前對(duì)圖像進(jìn)行反運(yùn)算。圖像二值化是數(shù)字識(shí)別系統(tǒng)中非常重要的一步,其效果的好壞直接 影響到數(shù)字的邊緣分布,好的二值化算法能夠有效區(qū)分前景和背景,得到真實(shí)的字符邊緣, 也就可以得到準(zhǔn)確的數(shù)字特征。
[0069] (5)圖像分割預(yù)處理:針對(duì)圖像中連通面積低于閾值的,判定為噪聲粘連區(qū)域。最 后,對(duì)噪聲粘連區(qū)域進(jìn)行反色處理,從而消除分割過(guò)程中的噪聲粘連區(qū)域和去噪環(huán)節(jié)無(wú)法 去除的雜點(diǎn),從而進(jìn)行正常的數(shù)字分割。
[0070] (6)圖像分割:利用投影法將數(shù)字水平分開(kāi)后,就成功地找到了每個(gè)數(shù)字的左右 邊界。然后對(duì)切分好的每位數(shù)字再進(jìn)行水平投影:即計(jì)算每位數(shù)字的每一行中屬于數(shù)碼的 象素?cái)?shù)目,這樣可以找出每個(gè)數(shù)字的高度值。
[0071] (7)圖像歸一化:數(shù)字大小歸一化是指對(duì)不同大小的數(shù)字作幾何變換,使之成為 同一大小尺寸。數(shù)字大小歸一化要求保持?jǐn)?shù)字的拓?fù)浣Y(jié)構(gòu)不能改變,最大限度地降低數(shù)字 的失真,以便提高識(shí)別準(zhǔn)確率。令f(x,y)為原圖像,g(x',/ )為歸一化后的圖像,歸一 化后的圖像與原圖像的坐標(biāo)之間的映射關(guān)系為:
[0072] X = ηχ,
[0073] y = ε y'
[0074] 其中:
[0075] η = width/width/
[0076] ε = height/height'
[0077] width, width '分別表示原圖像和歸一化后圖像的寬度,同時(shí),height和 height'分別表示原圖像和歸一化后圖像的高度。歸一化后(X',y')點(diǎn)的灰度值為:
[0078] g(x/ ,Yi ) = f(x,y)
[0079] 輸出點(diǎn)可能會(huì)被映射到原圖像的浮點(diǎn)數(shù)的位置,這就需要使用插值算法來(lái)計(jì)算該 點(diǎn)的像素值。插值算法包括最鄰近插值法、雙線性插值法、高階插值法等。
[0080] 雙線性插值的效果好于最鄰近插值,但是計(jì)算要復(fù)雜,運(yùn)算時(shí)間也長(zhǎng)些。設(shè)原圖像 點(diǎn)(X,y)周圍四個(gè)像素點(diǎn)分別為(i,j),(i,j+1),(i+1,j),(i+1,j+Ι),雙線性插值通過(guò)以 下公式來(lái)計(jì)算 :
[0081] u = (1-λ ) f (i,j) + λ f (i,j+1)
[0082] v = (I- λ ) f (i+1, j) +
[0083] λ f (i+1, j+1)
[0084] g(x' ,y' )= (1_μ )ιι+μ v
[0085] 其中 λ = |x-i I,μ = |y-j I。
[0086] 2.模板匹配模塊:
[0087] (1)如圖2所示,將與待識(shí)別字體相同的模板圖像導(dǎo)入程序數(shù)據(jù)庫(kù)中,本文針對(duì)發(fā) 票編號(hào)進(jìn)行識(shí)別所以先將發(fā)票編號(hào)字體的數(shù)字模板導(dǎo)入數(shù)據(jù)庫(kù)中。
[0088] (2)如圖3所示將待識(shí)別的圖像與模板庫(kù)中圖像進(jìn)行像素點(diǎn)疊加,因?yàn)閿?shù)字6與數(shù) 字5、8、9有很大的相似度,所以本文用數(shù)字6舉例來(lái)說(shuō)明本方法。
[0089] (3)匹配結(jié)果統(tǒng)計(jì)
[0090] 首先由于圖像經(jīng)過(guò)二值化處理之后,圖像變成了一個(gè)只有〇, 1組成的二維矩陣, 待識(shí)別數(shù)字經(jīng)二值化之后也成為一個(gè)二維矩陣,將圖像分為數(shù)字區(qū)和背景區(qū),待識(shí)別數(shù)字 的數(shù)字區(qū)是由1組成的,背景區(qū)是由0組成的。而模板正是相反,其數(shù)字區(qū)是由0組成的, 背景區(qū)是由1組成的。經(jīng)過(guò)待識(shí)別數(shù)字與模板進(jìn)行加法運(yùn)算,生成一個(gè)由0, 1,2組成的二 維矩陣。理論上如果兩個(gè)圖像完全匹配,值為1的位與對(duì)應(yīng)0的位相加則必定生成一個(gè)只 有1組成的二維矩陣。但如果不匹配則會(huì)出現(xiàn)〇和2這兩種結(jié)果。所以只需統(tǒng)計(jì)匹配之后 圖像中像素值為〇和2所占整體圖像的比例便可識(shí)別出結(jié)果。匹配結(jié)果如圖4所示。
[0091] 3.匹配結(jié)果輸出模塊:
[0092] 將識(shí)別結(jié)果通過(guò)計(jì)算機(jī)顯示器顯示出來(lái)或通過(guò)打印機(jī)輸出結(jié)果,也可根據(jù)該系統(tǒng) 應(yīng)用的領(lǐng)域?qū)⒃擃I(lǐng)域數(shù)據(jù)融入系統(tǒng)中,得出該數(shù)字的全部相關(guān)信息。
[0093] 實(shí)驗(yàn)結(jié)果分析
[0094] 評(píng)價(jià)一個(gè)數(shù)字識(shí)別系統(tǒng)的指標(biāo),主要依據(jù)正確識(shí)別率和運(yùn)行時(shí)間。本文把數(shù)字正 確識(shí)別率和運(yùn)行時(shí)間,作為評(píng)價(jià)標(biāo)準(zhǔn),與基于左右輪廓特征的印刷體數(shù)字識(shí)別方法和基于 數(shù)字結(jié)構(gòu)特征的印刷體數(shù)字識(shí)別算法進(jìn)行對(duì)比。在程序運(yùn)行設(shè)備、運(yùn)行軟件版本、識(shí)別對(duì)象 以及圖像預(yù)處理和數(shù)字分割環(huán)節(jié)完全一致的情況下,比較三種種識(shí)別算法的正確識(shí)別率和 運(yùn)行時(shí)間,從而對(duì)識(shí)別算法進(jìn)行客觀公正的評(píng)價(jià)。
[0095] 實(shí)驗(yàn)選取的圖片來(lái)自全國(guó)統(tǒng)一啟用印有12位發(fā)票代碼和8位發(fā)票號(hào)碼的普通發(fā) 票圖片作為識(shí)別對(duì)象。由于該系統(tǒng)只進(jìn)行印刷體數(shù)字的識(shí)別,所以對(duì)發(fā)票圖片進(jìn)行了截圖 處理。通過(guò)截圖工具,截取了 12位發(fā)票代碼和8位的發(fā)票號(hào)碼的圖片,并統(tǒng)一轉(zhuǎn)換成png 格式的圖片文件。
[0096] 通過(guò)測(cè)試12張 12位數(shù)字的發(fā)票代碼圖片,和12張 8位數(shù)字的發(fā)票號(hào)碼圖片,總計(jì) 240個(gè)數(shù)字,對(duì)基于左右輪廓特征的印刷體數(shù)字識(shí)別算法、基于數(shù)字結(jié)構(gòu)特征的印刷體數(shù)字 識(shí)別算法和本文提出的基于模板匹配印刷體數(shù)字識(shí)別算法的實(shí)驗(yàn)結(jié)果進(jìn)行了對(duì)比。對(duì)比結(jié) 果如表。
[0097]
【權(quán)利要求】
1. 一種基于模板匹配的印刷體數(shù)字識(shí)別方法,其特征在于:該方法包括待識(shí)別圖像輸 入部分、模板匹配識(shí)別部分、識(shí)別結(jié)果輸出部分,具體步驟如下: 待識(shí)別圖像輸入部分,包括W下步驟: 步驟1、通過(guò)外部設(shè)備照相機(jī)采集待識(shí)別數(shù)字的圖像,本步驟中相機(jī)像素必須達(dá)到300 萬(wàn)像素W上,使采集的圖像達(dá)到最低識(shí)別要求,將采集好的圖像輸入系統(tǒng); 步驟2、將輸入的待識(shí)別圖像進(jìn)行前期預(yù)處理,首先將圖像通過(guò)中值濾波法去除噪聲, 其次將彩色圖像進(jìn)行灰度化處理,再次對(duì)灰度化的圖像進(jìn)行二值化處理,然后對(duì)二值化的 圖像進(jìn)行噪聲粘連區(qū)域修復(fù)再采用自適應(yīng)闊值分割對(duì)數(shù)字圖像分割,最后將分割好的數(shù)字 圖像歸一化處理,將處理好的圖像輸入模板匹配識(shí)別部分; 模板匹配識(shí)別部分,該部分的識(shí)別基于模板匹配的印刷體數(shù)字識(shí)別方法,包括W下步 驟: 步驟1、將與待識(shí)別字體相同的標(biāo)準(zhǔn)數(shù)字模板圖像導(dǎo)入程序數(shù)據(jù)庫(kù)中,模板圖像為白色 背景,黑色數(shù)字,故數(shù)字區(qū)像素值為0,背景區(qū)像素值為1 ; 步驟2、將待識(shí)別圖像輸入部分生成的二值化圖像與模板圖像對(duì)應(yīng)像素位疊加,其中待 識(shí)別的二值化圖像為黑色背景,白色數(shù)字,數(shù)字區(qū)像素值為1,背景區(qū)像素值為0 ; 步驟3、對(duì)疊加后的圖像中各像素點(diǎn)的像素值進(jìn)行統(tǒng)計(jì),分析統(tǒng)計(jì)出的數(shù)據(jù),并識(shí)別出 待識(shí)別的印刷體數(shù)字; 識(shí)別結(jié)果輸出部分,將識(shí)別結(jié)果通過(guò)計(jì)算機(jī)顯示器顯示出來(lái)或通過(guò)打印機(jī)輸出結(jié)果, 也可根據(jù)該系統(tǒng)應(yīng)用的領(lǐng)域?qū)⒃擃I(lǐng)域數(shù)據(jù)融入系統(tǒng)中,得出該數(shù)字所關(guān)聯(lián)的全部相關(guān)信 息。
2. 根據(jù)權(quán)利要求1所述的基于模板匹配的印刷體數(shù)字識(shí)別方法,其特征在于: (一)圖像預(yù)處理過(guò)程: (1)圖像采集;數(shù)字圖像既可W通過(guò)聯(lián)機(jī)的攝像設(shè)備采集,也可W通過(guò)已經(jīng)保存的圖 像進(jìn)行識(shí)別,本文采集的圖像是利用相機(jī)拍攝的發(fā)票電子照片,印刷體數(shù)字識(shí)別的形態(tài)穩(wěn) 定且結(jié)構(gòu)簡(jiǎn)單,所W識(shí)別過(guò)程所需要的信息量相對(duì)其他識(shí)別較少,利用相機(jī)拍攝取得的數(shù) 字圖像已經(jīng)可W取得滿足識(shí)別的要求; (2) 圖像去噪處理:中值濾波器用像素的相鄰區(qū)域的像素的灰度中值代替該像素的灰 度值,是最常見(jiàn)的統(tǒng)計(jì)濾波器,自適應(yīng)中值濾波器則可W對(duì)比較大的概率的噪聲進(jìn)行處理, 還可W在平滑非沖激噪聲的同時(shí)保存細(xì)節(jié),該步驟中采用3*3模板的自適應(yīng)中值濾波器; (3) 圖像灰度化;相機(jī)采集的圖片為24位真彩圖,需要轉(zhuǎn)化為灰度圖,用g標(biāo)示灰度化 后的灰度值,R,G,B表示真彩圖中的紅、綠、藍(lán)分量,g= 0. 299R+0. 587G+0. 114B; (4) 圖像二值化;字符圖像二值化一般是將256色的灰度圖轉(zhuǎn)化為只有黑白兩色的二 值圖,高步驟中,由于轉(zhuǎn)化后的圖像目標(biāo)為白色,背景為黑色,所W要在圖像二值化之前對(duì) 圖像進(jìn)行反運(yùn)算,圖像二值化是數(shù)字識(shí)別系統(tǒng)中非常重要的一步,其效果的好壞直接影響 到數(shù)字的邊緣分布,好的二值化算法能夠有效區(qū)分前景和背景,得到真實(shí)的字符邊緣,也就 可W得到準(zhǔn)確的數(shù)字特征; (5) 圖像分割預(yù)處理;針對(duì)圖像中連通面積低于闊值的,判定為噪聲粘連區(qū)域,最后, 對(duì)噪聲粘連區(qū)域進(jìn)行反色處理,從而消除分割過(guò)程中的噪聲粘連區(qū)域和去噪環(huán)節(jié)無(wú)法去除 的雜點(diǎn),從而進(jìn)行正常的數(shù)字分割; (6) 圖像分割:利用投影法將數(shù)字水平分開(kāi)后,就成功地找到了每個(gè)數(shù)字的左右邊界; 然后對(duì)切分好的每位數(shù)字再進(jìn)行水平投影:即計(jì)算每位數(shù)字的每一行中屬于數(shù)碼的象素?cái)?shù) 目,該樣可W找出每個(gè)數(shù)字的高度值; (7) 圖像歸一化:數(shù)字大小歸一化是指對(duì)不同大小的數(shù)字作幾何變換,使之成為同一 大小尺寸;數(shù)字大小歸一化要求保持?jǐn)?shù)字的拓?fù)浣Y(jié)構(gòu)不能改變,最大限度地降低數(shù)字的失 真,W便提高識(shí)別準(zhǔn)確率;令f(x,y)為原圖像,g(x',y')為歸一化后的圖像,歸一化后 的圖像與原圖像的坐標(biāo)之間的映射關(guān)系為: X = rix' y = e y' 其中: n = width/width^ £= height/height' wi化h,wi化h'分別表示原圖像和歸一化后圖像的寬度,同時(shí),height和hei曲t'分 別表示原圖像和歸一化后圖像的高度。歸一化后(X',y')點(diǎn)的灰度值為: g(x' ,y' ) = f (X,y) 輸出點(diǎn)可能會(huì)被映射到原圖像的浮點(diǎn)數(shù)的位置,該就需要使用插值算法來(lái)計(jì)算該點(diǎn)的 像素值;插值算法為雙線性插值法; 雙線性插值中,設(shè)原圖像點(diǎn)(x,y)周圍四個(gè)像素點(diǎn)分別為(i,j),(i,j+1),(i+1,j), (i+1,j+1),雙線性插值通過(guò)W下公式來(lái)計(jì)算: u = (1-入)f (i, _1.) + 入 f (i, j+1) V = (1- A ) f (i+1, j) + 入 f(i+l,j+1) g(x' ,y' ) = (1-y )u+y V 其中 A = |x-i I,y = |y-j I ; (二)、模板匹配部分: (1) 將與待識(shí)別字體相同的模板圖像導(dǎo)入程序數(shù)據(jù)庫(kù)中,本申請(qǐng)對(duì)發(fā)票編號(hào)進(jìn)行識(shí)別 所W先將發(fā)票編號(hào)字體的數(shù)字模板導(dǎo)入數(shù)據(jù)庫(kù)中; (2) 將待識(shí)別的圖像與模板庫(kù)中圖像進(jìn)行像素點(diǎn)疊加,因?yàn)閿?shù)字6與數(shù)字5、8、9有很大 的相似度,所W本文用數(shù)字6舉例來(lái)說(shuō)明本方法; (3) 匹配結(jié)果統(tǒng)計(jì) 首先由于圖像經(jīng)過(guò)二值化處理之后,圖像變成了一個(gè)只有0, 1組成的二維矩陣,待識(shí) 別數(shù)字經(jīng)二值化之后也成為一個(gè)二維矩陣,將圖像分為數(shù)字區(qū)和背景區(qū),待識(shí)別數(shù)字的數(shù) 字區(qū)是由1組成的,背景區(qū)是由0組成的;而模板正是相反,其數(shù)字區(qū)是由0組成的,背景區(qū) 是由1組成的;經(jīng)過(guò)待識(shí)別數(shù)字與模板進(jìn)行加法運(yùn)算,生成一個(gè)由0, 1,2組成的二維矩陣; 理論上如果兩個(gè)圖像完全匹配,值為1的位與對(duì)應(yīng)0的位相加則必定生成一個(gè)只有1組成 的二維矩陣;但如果不匹配則會(huì)出現(xiàn)0和2該兩種結(jié)果;所W只需統(tǒng)計(jì)匹配之后圖像中像 素值為0和2所占整體圖像的比例便可識(shí)別出結(jié)果; (H)、匹配結(jié)果輸出模塊: 將識(shí)別結(jié)果通過(guò)計(jì)算機(jī)顯示器顯示出來(lái)或通過(guò)打印機(jī)輸出結(jié)果或根據(jù)該系統(tǒng)應(yīng)用的 領(lǐng)域?qū)⒃擃I(lǐng)域數(shù)據(jù)融入系統(tǒng)中,得出該數(shù)字的全部相關(guān)信息。
【文檔編號(hào)】G06K9/40GK104463195SQ201410624087
【公開(kāi)日】2015年3月25日 申請(qǐng)日期:2014年11月8日 優(yōu)先權(quán)日:2014年11月8日
【發(fā)明者】宮義山, 王鵬 申請(qǐng)人:沈陽(yáng)工業(yè)大學(xué)