基于lvq神經(jīng)網(wǎng)絡(luò)的光學字符識別方法
【專利摘要】本發(fā)明涉及一種基于LVQ神經(jīng)網(wǎng)絡(luò)的光學字符識別方法,所述方法包括以下步驟:對待識別字符圖像進行預處理,包括圖像去噪、字符切分、二值化以及特征提??;將單個字符特征送入LVQ神經(jīng)網(wǎng)絡(luò)的輸入層,根據(jù)競爭算法找到獲勝的競爭層神經(jīng)元并進行拒判檢驗;將符合判別條件的字符特征輸入LVQ神經(jīng)網(wǎng)絡(luò)的競爭層進行識別,輸出識別結(jié)果。本發(fā)明方法適應(yīng)對誤判率有嚴格要求的小字符集自動識別領(lǐng)域。
【專利說明】基于LVQ神經(jīng)網(wǎng)絡(luò)的光學字符識別方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種基于學習向量量化(LVQ, Learning Vector Quantization)神經(jīng)網(wǎng)絡(luò)的光學字符識別方法,主要用于對錯識率有嚴格要求的小字符集智能識別。
【背景技術(shù)】
[0002]光學字符識別(Optical Character Recognition, OCR)通過掃描和攝像等光學輸入方式獲取紙張上的文字圖像信息,利用各種模式識別算法分析文字形態(tài)特征,判斷出文字的標準編碼,并按通用格式存儲在文本文件中。在過去的幾十年里,光學字符識別已經(jīng)成為許多研究者的研究目標,它在許多不同的領(lǐng)域,如銀行,航運,商業(yè),通信以及國防等都有重要影響。
[0003]德國科學家Tausheck于1929年正式提出OCR的概念,但電子計算機誕生后才得以真正實現(xiàn)?,F(xiàn)代商品化OCR系統(tǒng)分為三代:第一代OCR出現(xiàn)在1960年到1965年,最早為IBM公司的IBM1418。此產(chǎn)品識別字符少,需經(jīng)過特殊指定。第二代OCR產(chǎn)品出現(xiàn)在60年代中期到70年代初期,典型系統(tǒng)為IBM1287。日本東芝公司首先實現(xiàn)了手寫郵政編碼識別的信函自動分揀系統(tǒng)。第三個時期開始于上世紀70年代中期。這一時期,人們已經(jīng)把目光投向了解決質(zhì)量較差的字符識別,以及大字符集的識別,例如漢字識別,高精度手寫體數(shù)字識別。近年來也出現(xiàn)了能夠識別印刷體、手寫體的漢字、韓文、日文、數(shù)字、英文等多種字符的系統(tǒng)。而銀行票據(jù)自動處理系統(tǒng)也成為了手寫體字符識別系統(tǒng)中的熱點。
[0004]我國的OCR技術(shù),基本上起步于上述第三個時期,商業(yè)OCR產(chǎn)品的識別率最高己經(jīng)可以達到99%以上,并且可以識別多種字體。但是目前還沒有針對國防科技領(lǐng)域,例如遙控碼表、航天器彈道以及其他特殊文件的識別與驗證等對錯識率有嚴格要求的小字符集智能識別方法及相關(guān)產(chǎn)品。
【發(fā)明內(nèi)容】
[0005]本發(fā)明的目的在于克服上述不足,提供一種基于LVQ神經(jīng)網(wǎng)絡(luò)的光學字符識別方法,可以顯著降低錯識率,對印刷質(zhì)量較好的小字符集識別效果達到零錯識率。
[0006]本發(fā)明的目的是這樣實現(xiàn)的:一種基于LVQ神經(jīng)網(wǎng)絡(luò)的光學字符識別方法,所述LVQ神經(jīng)網(wǎng)絡(luò)分為輸入層、競爭層和輸出層,所述方法包括以下步驟:
步驟A、對待識別字符圖像進行預處理,包括圖像去噪、字符切分、二值化以及特征提取。其中圖像去噪處理是去除字符圖像在采樣、數(shù)據(jù)傳輸過程中產(chǎn)生的墨點、折痕等噪聲信號;字符切分處理是對整個字符圖像進行行列劃分,獲取每個字符的大小與位置;圖像二值化處理可以減少大量冗余信息,將單個字符圖像轉(zhuǎn)化為一個二維像素矩陣,O表示白色像素,I表示黑色像素;特征提取過程是對單個字符的二維像素矩陣進行某種運算,提取可用于分類的關(guān)鍵特征。本方法提取的特征為網(wǎng)格特征,網(wǎng)格特征體現(xiàn)了字符整體形狀的分布,具有平移和縮放不變性,有較強的容錯能力和區(qū)分相似字符的能力。網(wǎng)格特征的計算方法如下:將字符圖像均分為Fxli的網(wǎng)格,記第i個網(wǎng)格的中黑色像素的數(shù)量與總像素的比值為Xk,網(wǎng)格的總數(shù)為.則字符特征可用向量表示為:
【權(quán)利要求】
1.一種基于LVQ神經(jīng)網(wǎng)絡(luò)的光學字符識別方法,其特征在于所述方法包括以下步驟: 步驟A、對待識別字符圖像進行預處理,包括圖像去噪、字符切分、二值化以及特征提取,本方法提取的特征為網(wǎng)格特征,將字符圖像均分為Ixf的網(wǎng)格,統(tǒng)計每個網(wǎng)格中的字符像素所占的面積比例,記字符特征向量為;
2.根據(jù)權(quán)利要求1所述的一種基于LVQ神經(jīng)網(wǎng)絡(luò)的光學字符識別方法,其特征在于: 在步驟C中,所述競爭規(guī)則為:根據(jù)式(4)計算每個競爭層神經(jīng)元與輸入向量的距離,距離最小的競爭層神經(jīng)元為獲勝神經(jīng)元,其次為次獲勝神經(jīng)元,序號分別記為Kl和K2
3.根據(jù)權(quán)利要求2所述的一種基于LVQ神經(jīng)網(wǎng)絡(luò)的光學字符識別方法,其特征在于:在步驟D中,拒判條件為
4.根據(jù)權(quán)利要求2所述的一種基于LVQ神經(jīng)網(wǎng)絡(luò)的光學字符識別方法,其特征在于:在步驟D中,拒判條件為
5.根據(jù)權(quán)利要求1所述的一種基于LVQ神經(jīng)網(wǎng)絡(luò)的光學字符識別方法,其特征在于: 在步驟C中,所述競爭規(guī)則為:根據(jù)式(6)計算每個競爭層神經(jīng)元與輸入向量的相似度,相似度最大的競爭層神經(jīng)元為獲勝神經(jīng)元,其次為次獲勝神經(jīng)元,
6.根據(jù)權(quán)利要求5所述的一種基于LVQ神經(jīng)網(wǎng)絡(luò)的光學字符識別方法,其特征在于:在步驟D中,拒判條件為
7.根據(jù)權(quán)利要求5所述的一種基于LVQ神經(jīng)網(wǎng)絡(luò)的光學字符識別方法,其特征在于:在步驟D中,拒判條件為
8.根據(jù)權(quán)利要求1至7所述的一種基于LVQ神經(jīng)網(wǎng)絡(luò)的光學字符識別方法,其特征在于:在步驟E中的學習速率-隨著訓練次數(shù)t根據(jù)式(7)進行同步調(diào)整,
9.根據(jù)權(quán)利要求1至7所述的一種基于LVQ神經(jīng)網(wǎng)絡(luò)的光學字符識別方法,其特征在于:在步驟E中的學習速率-隨著訓練次數(shù)t根據(jù)式(8)進行同步調(diào)整:
【文檔編號】G06K9/60GK103745213SQ201310709595
【公開日】2014年4月23日 申請日期:2014年2月28日 優(yōu)先權(quán)日:2014年2月28日
【發(fā)明者】張煜昕, 李永剛, 何劍偉, 周琳琦, 郭力兵, 李祥明, 茅文浩, 李清梅, 胡上成, 張龍 申請人:中國人民解放軍63680部隊