基于模板匹配的印刷體數(shù)字識(shí)別方法

文檔序號(hào)：6633442閱讀：1029來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

基于模板匹配的印刷體數(shù)字識(shí)別方法
【專利摘要】本發(fā)明提供一種基于模板匹配的印刷體數(shù)字識(shí)別方法，該方法包括待識(shí)別圖像輸入部分、模板匹配識(shí)別部分、識(shí)別結(jié)果輸出部分，其很好的挺高了印刷體數(shù)字識(shí)別的識(shí)別率和系統(tǒng)的抗干擾性。通過(guò)對(duì)模板匹配方法的研究和實(shí)現(xiàn)，為數(shù)字識(shí)別提供了新的解決途徑和思路，非常有使用價(jià)值和改進(jìn)的價(jià)值。
【專利說(shuō)明】基于模板匹配的印刷體數(shù)字識(shí)別方法

【技術(shù)領(lǐng)域】 [0001] ：本發(fā)明提供一種基于模板匹配的印刷體數(shù)字識(shí)別方法，基于模板匹配的印刷體數(shù)字識(shí)別算法屬于字符識(shí)別領(lǐng)域。

【背景技術(shù)】 [0002] ：印刷體數(shù)字識(shí)別一直是模式識(shí)別領(lǐng)域的研究熱點(diǎn)。隨著當(dāng)今社會(huì)信息化的快速發(fā)展，我們正被數(shù)字化時(shí)代圍繞著，數(shù)字正朝著替代我們對(duì)話和文字語(yǔ)言表達(dá)、記憶的方向進(jìn)展。手機(jī)號(hào)碼、駕駛證號(hào)碼、身份證號(hào)碼和體檢表中一系列表達(dá)出身份、能力、對(duì)象和健康質(zhì)量的數(shù)字信息表示都需要用計(jì)算機(jī)解讀的阿拉伯?dāng)?shù)字：1、2、3、4、5、6、7、8、9、 0的組合來(lái)表達(dá)。因此針對(duì)這類問(wèn)題的處理系統(tǒng)設(shè)計(jì)的關(guān)鍵之一就是設(shè)計(jì)出高可靠性和高識(shí)別率的數(shù)字識(shí)別方法。然而，沒(méi)有哪個(gè)數(shù)字識(shí)別方法能夠達(dá)到完美的識(shí)別效果。因此，對(duì) 印刷體數(shù)字的識(shí)別研究仍然是有重大意義的。
[0003] 左右輪廓特征的印刷體數(shù)字識(shí)別算法，是模板特征匹配的一個(gè)典型應(yīng)用。它的的主要思路是，把單個(gè)數(shù)字水平分為六部分，可以均勻分為六分，也可以不均勻分，可以根據(jù) 字符字體的特點(diǎn)進(jìn)行相應(yīng)的調(diào)整。在特征提取過(guò)程中，不再是掃描每一行的連續(xù)黑色像素點(diǎn)的個(gè)數(shù)，作為該行的左（右）輪廓特征。而是對(duì)靠近上下邊緣和中間的位置采樣密度大些。取樣的位置選擇斐波那契數(shù)列進(jìn)行取樣。斐波那契數(shù)列為1，1，2, 3, 5,8,若選擇5個(gè)數(shù) 字，則選擇1，2, 3, 5,8位置處進(jìn)行取樣，既在第一部分和第六部分靠近上下邊緣處，第三部分和第四部分靠近中間處開(kāi)始的1/8,2/8,3/8,5/8,8/8的位置取樣。利用公式得到所需的左側(cè)邊緣的特征，共20個(gè)。對(duì)于數(shù)字的右邊緣來(lái)說(shuō)，因?yàn)橛逸喞倪吘壓艽蟪潭壬虾妥筮?緣一致，所以在右邊緣抽樣時(shí)只在第三和第四部分取樣，采樣方式采用和左邊緣一樣的不均勻采樣，這樣會(huì)得到10個(gè)特征，不過(guò)為了提高對(duì)"2"和"7"間的對(duì)比，對(duì)字符的第六部分進(jìn)行采樣，采樣方式如前，只是只采樣4個(gè)特征，為1/8, 2/8, 3/8, 5/8四個(gè)位置。這樣對(duì)圖像的左右邊緣特征提取后為一個(gè)34維的特征向量。最后通過(guò)提取算法得到的為34維的特征向量，使用歐幾里德距離來(lái)比較特征向量之間的相似度。計(jì)算待識(shí)別數(shù)字的特征向量與標(biāo)準(zhǔn)庫(kù)中各個(gè)數(shù)字的標(biāo)準(zhǔn)模板特征向量的歐氏距離，選擇距離最小的模板字符作為識(shí)別結(jié) 果。由于特征向量維數(shù)太大導(dǎo)致識(shí)別時(shí)間較長(zhǎng)。
[0004] 基于數(shù)字結(jié)構(gòu)特征的印刷體數(shù)字識(shí)別算法，多特征抽取和模板特征匹配的方法來(lái) 實(shí)現(xiàn)印刷體數(shù)字的快速識(shí)別。通過(guò)提取算法得到的為10維的特征向量，使用歐幾里德距離來(lái)比較特征向量之間的相似度。計(jì)算待識(shí)別數(shù)字的特征向量與標(biāo)準(zhǔn)庫(kù)中各個(gè)數(shù)字的標(biāo)準(zhǔn)模板特征向量的歐氏距離，選擇距離最小的模板字符作為識(shí)別結(jié)果。雖然降低的特征向量維數(shù)，但該算法的識(shí)別率還是沒(méi)有達(dá)到某些高識(shí)別率的要求。

【發(fā)明內(nèi)容】
：
[0005] 發(fā)明目的：本發(fā)明提供一種基于模板匹配的印刷體數(shù)字識(shí)別方法，其目的是解決以往的方式所存在的缺點(diǎn)。
[0006] 技術(shù)方案：本發(fā)明是通過(guò)以下技術(shù)方案來(lái)實(shí)現(xiàn)的：
[0007] -種基于模板匹配的印刷體數(shù)字識(shí)別方法，其特征在于：該方法包括待識(shí)別圖像輸入部分、模板匹配識(shí)別部分、識(shí)別結(jié)果輸出部分，具體步驟如下：
[0008] 待識(shí)別圖像輸入部分，包括以下步驟：
[0009] 步驟1、通過(guò)外部設(shè)備照相機(jī)采集待識(shí)別數(shù)字的圖像，本步驟中相機(jī)像素必須達(dá)到 300萬(wàn)像素以上，使采集的圖像達(dá)到最低識(shí)別要求，將采集好的圖像輸入系統(tǒng)；
[0010] 步驟2、將輸入的待識(shí)別圖像進(jìn)行前期預(yù)處理，首先將圖像通過(guò)中值濾波法去除噪聲，其次將彩色圖像進(jìn)行灰度化處理，再次對(duì)灰度化的圖像進(jìn)行二值化處理，然后對(duì)二值化的圖像進(jìn)行噪聲粘連區(qū)域修復(fù)再采用自適應(yīng)閾值分割對(duì)數(shù)字圖像分割，最后將分割好的數(shù) 字圖像歸一化處理，將處理好的圖像輸入模板匹配識(shí)別部分；
[0011] 模板匹配識(shí)別部分，該部分的識(shí)別基于模板匹配的印刷體數(shù)字識(shí)別方法，包括以下步驟：
[0012] 步驟1、將與待識(shí)別字體相同的標(biāo)準(zhǔn)數(shù)字模板圖像導(dǎo)入程序數(shù)據(jù)庫(kù)中，模板圖像為白色背景，黑色數(shù)字，故數(shù)字區(qū)像素值為0,背景區(qū)像素值為1 ;
[0013] 步驟2、將待識(shí)別圖像輸入部分生成的二值化圖像與模板圖像對(duì)應(yīng)像素位疊加，其中待識(shí)別的二值化圖像為黑色背景，白色數(shù)字，數(shù)字區(qū)像素值為1，背景區(qū)像素值為〇 ;
[0014] 步驟3、對(duì)疊加后的圖像中各像素點(diǎn)的像素值進(jìn)行統(tǒng)計(jì)，分析統(tǒng)計(jì)出的數(shù)據(jù)，并識(shí) 別出待識(shí)別的印刷體數(shù)字；
[0015] 識(shí)別結(jié)果輸出部分，將識(shí)別結(jié)果通過(guò)計(jì)算機(jī)顯示器顯示出來(lái)或通過(guò)打印機(jī)輸出結(jié) 果，也可根據(jù)該系統(tǒng)應(yīng)用的領(lǐng)域?qū)⒃擃I(lǐng)域數(shù)據(jù)融入系統(tǒng)中，得出該數(shù)字所關(guān)聯(lián)的全部相關(guān) 信息。
[0016] (一）圖像預(yù)處理過(guò)程：
[0017] (1)圖像采集：數(shù)字圖像既可以通過(guò)聯(lián)機(jī)的攝像設(shè)備采集，也可以通過(guò)已經(jīng)保存的圖像進(jìn)行識(shí)別，本文采集的圖像是利用相機(jī)拍攝的發(fā)票電子照片，印刷體數(shù)字識(shí)別的形態(tài)穩(wěn)定且結(jié)構(gòu)簡(jiǎn)單，所以識(shí)別過(guò)程所需要的信息量相對(duì)其他識(shí)別較少，利用相機(jī)拍攝取得的數(shù)字圖像已經(jīng)可以取得滿足識(shí)別的要求；
[0018] (2)圖像去噪處理：中值濾波器用像素的相鄰區(qū)域的像素的灰度中值代替該像素的灰度值，是最常見(jiàn)的統(tǒng)計(jì)濾波器，自適應(yīng)中值濾波器則可以對(duì)比較大的概率的噪聲進(jìn)行處理，還可以在平滑非沖激噪聲的同時(shí)保存細(xì)節(jié)，該步驟中采用3*3模板的自適應(yīng)中值濾波器；
[0019] (3)圖像灰度化：相機(jī)采集的圖片為24位真彩圖，需要轉(zhuǎn)化為灰度圖，用g標(biāo)示灰度化后的灰度值，R，G，B表示真彩圖中的紅、綠、藍(lán)分量，g = 0. 299R+0. 587G+0. 114B ;
[0020] (4)圖像二值化：字符圖像二值化一般是將256色的灰度圖轉(zhuǎn)化為只有黑白兩色的二值圖，高步驟中，由于轉(zhuǎn)化后的圖像目標(biāo)為白色，背景為黑色，所以要在圖像二值化之前對(duì)圖像進(jìn)行反運(yùn)算，圖像二值化是數(shù)字識(shí)別系統(tǒng)中非常重要的一步，其效果的好壞直接影響到數(shù)字的邊緣分布，好的二值化算法能夠有效區(qū)分前景和背景，得到真實(shí)的字符邊緣，也就可以得到準(zhǔn)確的數(shù)字特征；
[0021] (5)圖像分割預(yù)處理：針對(duì)圖像中連通面積低于閾值的，判定為噪聲粘連區(qū)域，最后，對(duì)噪聲粘連區(qū)域進(jìn)行反色處理，從而消除分割過(guò)程中的噪聲粘連區(qū)域和去噪環(huán)節(jié)無(wú)法去除的雜點(diǎn)，從而進(jìn)行正常的數(shù)字分割；
[0022] (6)圖像分割：利用投影法將數(shù)字水平分開(kāi)后，就成功地找到了每個(gè)數(shù)字的左右邊界；然后對(duì)切分好的每位數(shù)字再進(jìn)行水平投影：即計(jì)算每位數(shù)字的每一行中屬于數(shù)碼的象素?cái)?shù)目，這樣可以找出每個(gè)數(shù)字的高度值；
[0023] (7)圖像歸一化：數(shù)字大小歸一化是指對(duì)不同大小的數(shù)字作幾何變換，使之成為同一大小尺寸；數(shù)字大小歸一化要求保持?jǐn)?shù)字的拓?fù)浣Y(jié)構(gòu)不能改變，最大限度地降低數(shù)字的失真，以便提高識(shí)別準(zhǔn)確率；令f(x，y)為原圖像，g(x'，/ )為歸一化后的圖像，歸一化后的圖像與原圖像的坐標(biāo)之間的映射關(guān)系為：
[0024] X = Ilxi
[0025] y = ε y '
[0026] 其中：
[0027] n = width/width/
[0028] ε = height/height'
[0029] width, width'分別表示原圖像和歸一化后圖像的寬度，同時(shí)，height和 height'分別表示原圖像和歸一化后圖像的高度。歸一化后（X'，y')點(diǎn)的灰度值為：
[0030] g(x/ ,Yi ) = f(x,y)
[0031] 輸出點(diǎn)可能會(huì)被映射到原圖像的浮點(diǎn)數(shù)的位置，這就需要使用插值算法來(lái)計(jì)算該點(diǎn)的像素值；插值算法為雙線性插值法；
[0032] 雙線性插值中，設(shè)原圖像點(diǎn)（x，y)周圍四個(gè)像素點(diǎn)分別為（i，j)，（i，j+1)， (i+1，j)，（i+1，j+1)，雙線性插值通過(guò)以下公式來(lái)計(jì)算：
[0033] u = (1- λ ) f (i, j) + λ f (i, j+1)
[0034] ν = (1- λ ) f (i+1, j) +
[0035] λ f (i+1, j+1)
[0036] g(x，）= (1_μ)ιι+μν
[0037] 其中 λ = |x-i I，μ = |y-j I ;
[0038] (二）、模板匹配部分：
[0039] (1)將與待識(shí)別字體相同的模板圖像導(dǎo)入程序數(shù)據(jù)庫(kù)中，本申請(qǐng)對(duì)發(fā)票編號(hào)進(jìn)行識(shí)別所以先將發(fā)票編號(hào)字體的數(shù)字模板導(dǎo)入數(shù)據(jù)庫(kù)中；
[0040] (2)將待識(shí)別的圖像與模板庫(kù)中圖像進(jìn)行像素點(diǎn)疊加，因?yàn)閿?shù)字6與數(shù)字5、8、9有很大的相似度，所以本文用數(shù)字6舉例來(lái)說(shuō)明本方法；
[0041] (3)匹配結(jié)果統(tǒng)計(jì)
[0042] 首先由于圖像經(jīng)過(guò)二值化處理之后，圖像變成了一個(gè)只有0, 1組成的二維矩陣，待識(shí)別數(shù)字經(jīng)二值化之后也成為一個(gè)二維矩陣，將圖像分為數(shù)字區(qū)和背景區(qū)，待識(shí)別數(shù)字的數(shù)字區(qū)是由1組成的，背景區(qū)是由0組成的；而模板正是相反，其數(shù)字區(qū)是由0組成的，背景區(qū)是由1組成的；經(jīng)過(guò)待識(shí)別數(shù)字與模板進(jìn)行加法運(yùn)算，生成一個(gè)由0, 1，2組成的二維矩陣；理論上如果兩個(gè)圖像完全匹配，值為1的位與對(duì)應(yīng)0的位相加則必定生成一個(gè)只有1組成的二維矩陣；但如果不匹配則會(huì)出現(xiàn)0和2這兩種結(jié)果；所以只需統(tǒng)計(jì)匹配之后圖像中像素值為〇和2所占整體圖像的比例便可識(shí)別出結(jié)果；
[0043](三）、匹配結(jié)果輸出模塊：
[0044] 將識(shí)別結(jié)果通過(guò)計(jì)算機(jī)顯示器顯示出來(lái)或通過(guò)打印機(jī)輸出結(jié)果或根據(jù)該系統(tǒng)應(yīng) 用的領(lǐng)域?qū)⒃擃I(lǐng)域數(shù)據(jù)融入系統(tǒng)中，得出該數(shù)字的全部相關(guān)信息。
[0045] 優(yōu)點(diǎn)及效果：本發(fā)明涉及一種基于模板匹配的印刷體數(shù)字識(shí)別方法，其很好的挺高了印刷體數(shù)字識(shí)別的識(shí)別率和系統(tǒng)的抗干擾性。
[0046] 傳統(tǒng)模板匹配法是實(shí)現(xiàn)離散輸入模式分類的有效途徑之一，其實(shí)質(zhì)是通過(guò)度量輸入模式與模板之間的相似性，取相似性最大的作為輸入模式所屬類別。此方法是由字符的直觀形象抽取特征，用相關(guān)匹配原理確定的匹配函數(shù)進(jìn)行判斷，也就是將輸入字符與標(biāo)準(zhǔn) 模板字符在一個(gè)分類器中進(jìn)行匹配。但傳統(tǒng)模板匹配方法的缺點(diǎn)是抗干擾能力差，導(dǎo)致準(zhǔn) 確性差。本文提出了一種基于模板匹配的準(zhǔn)確、高效的數(shù)字識(shí)別算法。所提方法雖然在時(shí) 間上有很好的工作效率，且該算法抗干擾性強(qiáng)識(shí)別率很高，圖像識(shí)別準(zhǔn)確率可達(dá)99%，獲得了滿意的效果。總的來(lái)說(shuō)，通過(guò)對(duì)模板匹配方法的研究和實(shí)現(xiàn)，為數(shù)字識(shí)別提供了新的解決途徑和思路，非常有使用價(jià)值和改進(jìn)的價(jià)值。

【專利附圖】

【附圖說(shuō)明】：
[0047] 圖1為本發(fā)明一種實(shí)例的系統(tǒng)整體結(jié)構(gòu)框圖
[0048] 圖2為本發(fā)明一種實(shí)例的標(biāo)準(zhǔn)數(shù)字模板圖
[0049] 圖3為本發(fā)明一種實(shí)例的待識(shí)別數(shù)字與標(biāo)準(zhǔn)數(shù)字模板匹配的效果圖
[0050] 圖4為本發(fā)明一種實(shí)例的待識(shí)別數(shù)字6與標(biāo)準(zhǔn)數(shù)字模板匹配的結(jié)果統(tǒng)計(jì)圖。

【具體實(shí)施方式】 [0051] ：下面結(jié)合附圖對(duì)本發(fā)明做進(jìn)一步的說(shuō)明：
[0052] 本發(fā)明提供一種基于模板匹配的印刷體數(shù)字識(shí)別方法，該方法包括待識(shí)別圖像輸入部分、模板匹配識(shí)別部分、識(shí)別結(jié)果輸出部分，具體步驟如下：
[0053] 待識(shí)別圖像輸入部分，包括以下步驟：
[0054] 步驟1、通過(guò)外部設(shè)備照相機(jī)采集待識(shí)別數(shù)字的圖像，本步驟中相機(jī)像素必須達(dá)到 300萬(wàn)像素以上，使采集的圖像達(dá)到最低識(shí)別要求，將采集好的圖像輸入系統(tǒng)；
[0055] 步驟2、將輸入的待識(shí)別圖像進(jìn)行前期預(yù)處理，首先將圖像通過(guò)中值濾波法去除噪聲，其次將彩色圖像進(jìn)行灰度化處理，再次對(duì)灰度化的圖像進(jìn)行二值化處理，然后對(duì)二值化的圖像進(jìn)行噪聲粘連區(qū)域修復(fù)再采用自適應(yīng)閾值分割對(duì)數(shù)字圖像分割，最后將分割好的數(shù) 字圖像歸一化處理，將處理好的圖像輸入模板匹配識(shí)別部分；
[0056] 模板匹配識(shí)別部分，該部分的識(shí)別基于模板匹配的印刷體數(shù)字識(shí)別方法，包括以下步驟：
[0057] 步驟1、將與待識(shí)別字體相同的標(biāo)準(zhǔn)數(shù)字模板圖像導(dǎo)入程序數(shù)據(jù)庫(kù)中，模板圖像為白色背景，黑色數(shù)字，故數(shù)字區(qū)像素值為〇,背景區(qū)像素值為1 ;
[0058] 步驟2、將待識(shí)別圖像輸入部分生成的二值化圖像與模板圖像對(duì)應(yīng)像素位疊加，其中待識(shí)別的二值化圖像為黑色背景，白色數(shù)字，數(shù)字區(qū)像素值為1，背景區(qū)像素值為〇 ;
[0059] 步驟3、對(duì)疊加后的圖像中各像素點(diǎn)的像素值進(jìn)行統(tǒng)計(jì)，分析統(tǒng)計(jì)出的數(shù)據(jù)，并識(shí) 別出待識(shí)別的印刷體數(shù)字；
[0060] 識(shí)別結(jié)果輸出部分，將識(shí)別結(jié)果通過(guò)計(jì)算機(jī)顯示器顯示出來(lái)或通過(guò)打印機(jī)輸出結(jié) 果，也可根據(jù)該系統(tǒng)應(yīng)用的領(lǐng)域?qū)⒃擃I(lǐng)域數(shù)據(jù)融入系統(tǒng)中，得出該數(shù)字所關(guān)聯(lián)的全部相關(guān) 信息。實(shí)施例
[0061] 各模塊功能如下：
[0062] 1.發(fā)票圖像輸入預(yù)處理模塊：
[0063] 圖像輸入預(yù)處理部分包括圖像采集、圖像去噪處理、圖像灰度化、圖像二值化、圖像數(shù)字分割預(yù)處理、數(shù)字分割、數(shù)字圖像歸一化。
[0064] 圖像預(yù)處理過(guò)程說(shuō)明：
[0065] (1)圖像采集：數(shù)字圖像既可以通過(guò)聯(lián)機(jī)的攝像設(shè)備采集，也可以通過(guò)已經(jīng)保存的圖像進(jìn)行識(shí)別。本文采集的圖像是利用相機(jī)拍攝的發(fā)票電子照片。從原理上說(shuō)，分辨率越高，則保存的數(shù)字信息越多，數(shù)字的識(shí)別率也就越高，但是相應(yīng)的計(jì)算量也就越大，時(shí)間越慢。印刷體數(shù)字識(shí)別的形態(tài)穩(wěn)定且結(jié)構(gòu)簡(jiǎn)單，所以識(shí)別過(guò)程所需要的信息量相對(duì)其他識(shí) 別較少，利用相機(jī)拍攝取得的數(shù)字圖像已經(jīng)可以取得滿足識(shí)別的要求。
[0066] (2)圖像去噪處理：中值濾波器用像素的相鄰區(qū)域的像素的灰度中值代替該像素的灰度值，是最常見(jiàn)的統(tǒng)計(jì)濾波器。自適應(yīng)中值濾波器則可以對(duì)比較大的概率的噪聲進(jìn)行處理，還可以在平滑非沖激噪聲的同時(shí)保存細(xì)節(jié)。在本文中，采用3*3模板的自適應(yīng)中值濾波器。
[0067] (3)圖像灰度化：相機(jī)采集的圖片為24位真彩圖，需要轉(zhuǎn)化為灰度圖。用g標(biāo)示灰度化后的灰度值，R，G，B表示真彩圖中的紅、綠、藍(lán)分量，g = 0. 299R+0. 587G+0. 114B。
[0068] (4)圖像二值化：字符圖像二值化一般是將256色的灰度圖轉(zhuǎn)化為只有黑白兩色的二值圖，在本文中，由于轉(zhuǎn)化后的圖像目標(biāo)為白色，背景為黑色，所以要在圖像二值化之前對(duì)圖像進(jìn)行反運(yùn)算。圖像二值化是數(shù)字識(shí)別系統(tǒng)中非常重要的一步，其效果的好壞直接影響到數(shù)字的邊緣分布，好的二值化算法能夠有效區(qū)分前景和背景，得到真實(shí)的字符邊緣，也就可以得到準(zhǔn)確的數(shù)字特征。
[0069] (5)圖像分割預(yù)處理：針對(duì)圖像中連通面積低于閾值的，判定為噪聲粘連區(qū)域。最后，對(duì)噪聲粘連區(qū)域進(jìn)行反色處理，從而消除分割過(guò)程中的噪聲粘連區(qū)域和去噪環(huán)節(jié)無(wú)法去除的雜點(diǎn)，從而進(jìn)行正常的數(shù)字分割。
[0070] (6)圖像分割：利用投影法將數(shù)字水平分開(kāi)后，就成功地找到了每個(gè)數(shù)字的左右邊界。然后對(duì)切分好的每位數(shù)字再進(jìn)行水平投影：即計(jì)算每位數(shù)字的每一行中屬于數(shù)碼的象素?cái)?shù)目，這樣可以找出每個(gè)數(shù)字的高度值。
[0071] (7)圖像歸一化：數(shù)字大小歸一化是指對(duì)不同大小的數(shù)字作幾何變換，使之成為同一大小尺寸。數(shù)字大小歸一化要求保持?jǐn)?shù)字的拓?fù)浣Y(jié)構(gòu)不能改變，最大限度地降低數(shù)字的失真，以便提高識(shí)別準(zhǔn)確率。令f(x，y)為原圖像，g(x'，/ )為歸一化后的圖像，歸一化后的圖像與原圖像的坐標(biāo)之間的映射關(guān)系為：
[0072] X = ηχ，
[0073] y = ε y'
[0074] 其中：
[0075] η = width/width/
[0076] ε = height/height'
[0077] width, width '分別表示原圖像和歸一化后圖像的寬度，同時(shí)，height和 height'分別表示原圖像和歸一化后圖像的高度。歸一化后（X'，y')點(diǎn)的灰度值為：
[0078] g(x/ ,Yi ) = f(x,y)
[0079] 輸出點(diǎn)可能會(huì)被映射到原圖像的浮點(diǎn)數(shù)的位置，這就需要使用插值算法來(lái)計(jì)算該點(diǎn)的像素值。插值算法包括最鄰近插值法、雙線性插值法、高階插值法等。
[0080] 雙線性插值的效果好于最鄰近插值，但是計(jì)算要復(fù)雜，運(yùn)算時(shí)間也長(zhǎng)些。設(shè)原圖像點(diǎn)（X，y)周圍四個(gè)像素點(diǎn)分別為（i，j)，（i，j+1)，（i+1，j)，（i+1，j+Ι)，雙線性插值通過(guò)以下公式來(lái)計(jì)算：
[0081] u = (1-λ ) f (i，j) + λ f (i，j+1)
[0082] v = (I- λ ) f (i+1, j) +
[0083] λ f (i+1, j+1)
[0084] g(x' ，y' ）= (1_μ )ιι+μ v
[0085] 其中 λ = |x-i I，μ = |y-j I。
[0086] 2.模板匹配模塊：
[0087] (1)如圖2所示，將與待識(shí)別字體相同的模板圖像導(dǎo)入程序數(shù)據(jù)庫(kù)中，本文針對(duì)發(fā) 票編號(hào)進(jìn)行識(shí)別所以先將發(fā)票編號(hào)字體的數(shù)字模板導(dǎo)入數(shù)據(jù)庫(kù)中。
[0088] (2)如圖3所示將待識(shí)別的圖像與模板庫(kù)中圖像進(jìn)行像素點(diǎn)疊加，因?yàn)閿?shù)字6與數(shù) 字5、8、9有很大的相似度，所以本文用數(shù)字6舉例來(lái)說(shuō)明本方法。
[0089] (3)匹配結(jié)果統(tǒng)計(jì)
[0090] 首先由于圖像經(jīng)過(guò)二值化處理之后，圖像變成了一個(gè)只有〇, 1組成的二維矩陣，待識(shí)別數(shù)字經(jīng)二值化之后也成為一個(gè)二維矩陣，將圖像分為數(shù)字區(qū)和背景區(qū)，待識(shí)別數(shù)字的數(shù)字區(qū)是由1組成的，背景區(qū)是由0組成的。而模板正是相反，其數(shù)字區(qū)是由0組成的，背景區(qū)是由1組成的。經(jīng)過(guò)待識(shí)別數(shù)字與模板進(jìn)行加法運(yùn)算，生成一個(gè)由0, 1，2組成的二維矩陣。理論上如果兩個(gè)圖像完全匹配，值為1的位與對(duì)應(yīng)0的位相加則必定生成一個(gè)只有1組成的二維矩陣。但如果不匹配則會(huì)出現(xiàn)〇和2這兩種結(jié)果。所以只需統(tǒng)計(jì)匹配之后圖像中像素值為〇和2所占整體圖像的比例便可識(shí)別出結(jié)果。匹配結(jié)果如圖4所示。
[0091] 3.匹配結(jié)果輸出模塊：
[0092] 將識(shí)別結(jié)果通過(guò)計(jì)算機(jī)顯示器顯示出來(lái)或通過(guò)打印機(jī)輸出結(jié)果，也可根據(jù)該系統(tǒng) 應(yīng)用的領(lǐng)域?qū)⒃擃I(lǐng)域數(shù)據(jù)融入系統(tǒng)中，得出該數(shù)字的全部相關(guān)信息。
[0093] 實(shí)驗(yàn)結(jié)果分析
[0094] 評(píng)價(jià)一個(gè)數(shù)字識(shí)別系統(tǒng)的指標(biāo)，主要依據(jù)正確識(shí)別率和運(yùn)行時(shí)間。本文把數(shù)字正確識(shí)別率和運(yùn)行時(shí)間，作為評(píng)價(jià)標(biāo)準(zhǔn)，與基于左右輪廓特征的印刷體數(shù)字識(shí)別方法和基于數(shù)字結(jié)構(gòu)特征的印刷體數(shù)字識(shí)別算法進(jìn)行對(duì)比。在程序運(yùn)行設(shè)備、運(yùn)行軟件版本、識(shí)別對(duì)象以及圖像預(yù)處理和數(shù)字分割環(huán)節(jié)完全一致的情況下，比較三種種識(shí)別算法的正確識(shí)別率和運(yùn)行時(shí)間，從而對(duì)識(shí)別算法進(jìn)行客觀公正的評(píng)價(jià)。
[0095] 實(shí)驗(yàn)選取的圖片來(lái)自全國(guó)統(tǒng)一啟用印有12位發(fā)票代碼和8位發(fā)票號(hào)碼的普通發(fā) 票圖片作為識(shí)別對(duì)象。由于該系統(tǒng)只進(jìn)行印刷體數(shù)字的識(shí)別，所以對(duì)發(fā)票圖片進(jìn)行了截圖處理。通過(guò)截圖工具，截取了 12位發(fā)票代碼和8位的發(fā)票號(hào)碼的圖片，并統(tǒng)一轉(zhuǎn)換成png 格式的圖片文件。
[0096] 通過(guò)測(cè)試12張 12位數(shù)字的發(fā)票代碼圖片，和12張 8位數(shù)字的發(fā)票號(hào)碼圖片，總計(jì) 240個(gè)數(shù)字，對(duì)基于左右輪廓特征的印刷體數(shù)字識(shí)別算法、基于數(shù)字結(jié)構(gòu)特征的印刷體數(shù)字識(shí)別算法和本文提出的基于模板匹配印刷體數(shù)字識(shí)別算法的實(shí)驗(yàn)結(jié)果進(jìn)行了對(duì)比。對(duì)比結(jié) 果如表。
[0097]

【權(quán)利要求】
1. 一種基于模板匹配的印刷體數(shù)字識(shí)別方法，其特征在于：該方法包括待識(shí)別圖像輸入部分、模板匹配識(shí)別部分、識(shí)別結(jié)果輸出部分，具體步驟如下：待識(shí)別圖像輸入部分，包括W下步驟：步驟1、通過(guò)外部設(shè)備照相機(jī)采集待識(shí)別數(shù)字的圖像，本步驟中相機(jī)像素必須達(dá)到300 萬(wàn)像素W上，使采集的圖像達(dá)到最低識(shí)別要求，將采集好的圖像輸入系統(tǒng)；步驟2、將輸入的待識(shí)別圖像進(jìn)行前期預(yù)處理，首先將圖像通過(guò)中值濾波法去除噪聲，其次將彩色圖像進(jìn)行灰度化處理，再次對(duì)灰度化的圖像進(jìn)行二值化處理，然后對(duì)二值化的圖像進(jìn)行噪聲粘連區(qū)域修復(fù)再采用自適應(yīng)闊值分割對(duì)數(shù)字圖像分割，最后將分割好的數(shù)字圖像歸一化處理，將處理好的圖像輸入模板匹配識(shí)別部分；模板匹配識(shí)別部分，該部分的識(shí)別基于模板匹配的印刷體數(shù)字識(shí)別方法，包括W下步驟：步驟1、將與待識(shí)別字體相同的標(biāo)準(zhǔn)數(shù)字模板圖像導(dǎo)入程序數(shù)據(jù)庫(kù)中，模板圖像為白色背景，黑色數(shù)字，故數(shù)字區(qū)像素值為0,背景區(qū)像素值為1 ; 步驟2、將待識(shí)別圖像輸入部分生成的二值化圖像與模板圖像對(duì)應(yīng)像素位疊加，其中待識(shí)別的二值化圖像為黑色背景，白色數(shù)字，數(shù)字區(qū)像素值為1，背景區(qū)像素值為0 ; 步驟3、對(duì)疊加后的圖像中各像素點(diǎn)的像素值進(jìn)行統(tǒng)計(jì)，分析統(tǒng)計(jì)出的數(shù)據(jù)，并識(shí)別出待識(shí)別的印刷體數(shù)字；識(shí)別結(jié)果輸出部分，將識(shí)別結(jié)果通過(guò)計(jì)算機(jī)顯示器顯示出來(lái)或通過(guò)打印機(jī)輸出結(jié)果，也可根據(jù)該系統(tǒng)應(yīng)用的領(lǐng)域?qū)⒃擃I(lǐng)域數(shù)據(jù)融入系統(tǒng)中，得出該數(shù)字所關(guān)聯(lián)的全部相關(guān)信息。
2. 根據(jù)權(quán)利要求1所述的基于模板匹配的印刷體數(shù)字識(shí)別方法，其特征在于： (一）圖像預(yù)處理過(guò)程： (1)圖像采集；數(shù)字圖像既可W通過(guò)聯(lián)機(jī)的攝像設(shè)備采集，也可W通過(guò)已經(jīng)保存的圖像進(jìn)行識(shí)別，本文采集的圖像是利用相機(jī)拍攝的發(fā)票電子照片，印刷體數(shù)字識(shí)別的形態(tài)穩(wěn) 定且結(jié)構(gòu)簡(jiǎn)單，所W識(shí)別過(guò)程所需要的信息量相對(duì)其他識(shí)別較少，利用相機(jī)拍攝取得的數(shù) 字圖像已經(jīng)可W取得滿足識(shí)別的要求； (2) 圖像去噪處理：中值濾波器用像素的相鄰區(qū)域的像素的灰度中值代替該像素的灰度值，是最常見(jiàn)的統(tǒng)計(jì)濾波器，自適應(yīng)中值濾波器則可W對(duì)比較大的概率的噪聲進(jìn)行處理，還可W在平滑非沖激噪聲的同時(shí)保存細(xì)節(jié)，該步驟中采用3*3模板的自適應(yīng)中值濾波器； (3) 圖像灰度化；相機(jī)采集的圖片為24位真彩圖，需要轉(zhuǎn)化為灰度圖，用g標(biāo)示灰度化后的灰度值，R，G，B表示真彩圖中的紅、綠、藍(lán)分量，g= 0. 299R+0. 587G+0. 114B; (4) 圖像二值化；字符圖像二值化一般是將256色的灰度圖轉(zhuǎn)化為只有黑白兩色的二值圖，高步驟中，由于轉(zhuǎn)化后的圖像目標(biāo)為白色，背景為黑色，所W要在圖像二值化之前對(duì) 圖像進(jìn)行反運(yùn)算，圖像二值化是數(shù)字識(shí)別系統(tǒng)中非常重要的一步，其效果的好壞直接影響到數(shù)字的邊緣分布，好的二值化算法能夠有效區(qū)分前景和背景，得到真實(shí)的字符邊緣，也就可W得到準(zhǔn)確的數(shù)字特征； (5) 圖像分割預(yù)處理；針對(duì)圖像中連通面積低于闊值的，判定為噪聲粘連區(qū)域，最后，對(duì)噪聲粘連區(qū)域進(jìn)行反色處理，從而消除分割過(guò)程中的噪聲粘連區(qū)域和去噪環(huán)節(jié)無(wú)法去除的雜點(diǎn)，從而進(jìn)行正常的數(shù)字分割； (6) 圖像分割：利用投影法將數(shù)字水平分開(kāi)后，就成功地找到了每個(gè)數(shù)字的左右邊界；然后對(duì)切分好的每位數(shù)字再進(jìn)行水平投影：即計(jì)算每位數(shù)字的每一行中屬于數(shù)碼的象素?cái)?shù) 目，該樣可W找出每個(gè)數(shù)字的高度值； (7) 圖像歸一化：數(shù)字大小歸一化是指對(duì)不同大小的數(shù)字作幾何變換，使之成為同一大小尺寸；數(shù)字大小歸一化要求保持?jǐn)?shù)字的拓?fù)浣Y(jié)構(gòu)不能改變，最大限度地降低數(shù)字的失真，W便提高識(shí)別準(zhǔn)確率；令f(x，y)為原圖像，g(x'，y')為歸一化后的圖像，歸一化后的圖像與原圖像的坐標(biāo)之間的映射關(guān)系為： X = rix' y = e y' 其中： n = width/width^ ￡= height/height' wi化h，wi化h'分別表示原圖像和歸一化后圖像的寬度，同時(shí)，height和hei曲t'分別表示原圖像和歸一化后圖像的高度。歸一化后（X'，y')點(diǎn)的灰度值為： g(x' ，y' ) = f (X，y) 輸出點(diǎn)可能會(huì)被映射到原圖像的浮點(diǎn)數(shù)的位置，該就需要使用插值算法來(lái)計(jì)算該點(diǎn)的像素值；插值算法為雙線性插值法；雙線性插值中，設(shè)原圖像點(diǎn)（x，y)周圍四個(gè)像素點(diǎn)分別為（i，j)，（i，j+1)，（i+1，j)， (i+1，j+1)，雙線性插值通過(guò)W下公式來(lái)計(jì)算： u = (1-入）f (i, _1.) + 入 f (i, j+1) V = (1- A ) f (i+1, j) + 入 f(i+l，j+1) g(x' ，y' ) = (1-y )u+y V 其中 A = |x-i I，y = |y-j I ; (二）、模板匹配部分： (1) 將與待識(shí)別字體相同的模板圖像導(dǎo)入程序數(shù)據(jù)庫(kù)中，本申請(qǐng)對(duì)發(fā)票編號(hào)進(jìn)行識(shí)別所W先將發(fā)票編號(hào)字體的數(shù)字模板導(dǎo)入數(shù)據(jù)庫(kù)中； (2) 將待識(shí)別的圖像與模板庫(kù)中圖像進(jìn)行像素點(diǎn)疊加，因?yàn)閿?shù)字6與數(shù)字5、8、9有很大的相似度，所W本文用數(shù)字6舉例來(lái)說(shuō)明本方法； (3) 匹配結(jié)果統(tǒng)計(jì) 首先由于圖像經(jīng)過(guò)二值化處理之后，圖像變成了一個(gè)只有0, 1組成的二維矩陣，待識(shí) 別數(shù)字經(jīng)二值化之后也成為一個(gè)二維矩陣，將圖像分為數(shù)字區(qū)和背景區(qū)，待識(shí)別數(shù)字的數(shù) 字區(qū)是由1組成的，背景區(qū)是由0組成的；而模板正是相反，其數(shù)字區(qū)是由0組成的，背景區(qū) 是由1組成的；經(jīng)過(guò)待識(shí)別數(shù)字與模板進(jìn)行加法運(yùn)算，生成一個(gè)由0, 1，2組成的二維矩陣；理論上如果兩個(gè)圖像完全匹配，值為1的位與對(duì)應(yīng)0的位相加則必定生成一個(gè)只有1組成的二維矩陣；但如果不匹配則會(huì)出現(xiàn)0和2該兩種結(jié)果；所W只需統(tǒng)計(jì)匹配之后圖像中像素值為0和2所占整體圖像的比例便可識(shí)別出結(jié)果； (H)、匹配結(jié)果輸出模塊：將識(shí)別結(jié)果通過(guò)計(jì)算機(jī)顯示器顯示出來(lái)或通過(guò)打印機(jī)輸出結(jié)果或根據(jù)該系統(tǒng)應(yīng)用的領(lǐng)域?qū)⒃擃I(lǐng)域數(shù)據(jù)融入系統(tǒng)中，得出該數(shù)字的全部相關(guān)信息。
【文檔編號(hào)】G06K9/40GK104463195SQ201410624087
【公開(kāi)日】2015年3月25日申請(qǐng)日期:2014年11月8日優(yōu)先權(quán)日:2014年11月8日
【發(fā)明者】宮義山, 王鵬申請(qǐng)人:沈陽(yáng)工業(yè)大學(xué)

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：宮義山;王鵬;
技術(shù)所有人：沈陽(yáng)工業(yè)大學(xué);
我是此專利的發(fā)明人

上一篇：一種涉車后臺(tái)電子支付系統(tǒng)及方法
上一篇：服務(wù)器的制造方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無(wú)損檢測(cè)
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺(jué) 2.無(wú)線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢(shì)感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問(wèn)留言已有0條留言

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

印刷體數(shù)字識(shí)別相關(guān)技術(shù)

模板匹配字符識(shí)別算法相關(guān)技術(shù)

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

基于模板匹配的印刷體數(shù)字識(shí)別方法