專利名稱:殘缺印刷體數(shù)字字符的識(shí)別方法
技術(shù)領(lǐng)域:
本發(fā)明涉及的是一種文字識(shí)別方法,特別是一種殘缺印刷體數(shù)字字符的識(shí)別方法。用于圖像識(shí)別領(lǐng)域。
背景技術(shù):
近年來文字識(shí)別技術(shù)廣泛運(yùn)用于各個(gè)工程領(lǐng)域,文字識(shí)別的研究業(yè)取得了巨大的成就,印刷體的文字識(shí)別正確率高達(dá)99%。但是,實(shí)際應(yīng)用中存在著部分殘缺的字符,殘缺字符和完整字符混合在一起,給文字識(shí)別造成了困難。
經(jīng)文獻(xiàn)檢索發(fā)現(xiàn),Pasquale Foggia等人在《Image and Vision Computing》(1999,17(9),701-711.)(《圖像與視覺計(jì)算機(jī)》)上發(fā)表的“Combining statisticaland structural approaches for handwritten character description”(“統(tǒng)計(jì)與結(jié)構(gòu)方法相結(jié)合的手寫體字符描述”),該文中所提出的方法,先先從手寫體字符中提取結(jié)構(gòu)基元,然后用統(tǒng)計(jì)的方法對(duì)結(jié)構(gòu)基元進(jìn)行特征描述,最后采用神經(jīng)網(wǎng)絡(luò)進(jìn)行手寫體識(shí)別。
該文涉及的技術(shù)主要存在以下缺陷和不足(1)算法僅適用于手寫體的文字識(shí)別,雖然能有效克服手寫體的字符變形,但對(duì)于殘缺字符的變形無能為力;(2)殘缺字符的筆畫丟失會(huì)減少字符原有的結(jié)構(gòu)基元;(3)殘缺字符的筆畫丟失同時(shí)還會(huì)改變字符原本的結(jié)構(gòu)基元,使得用統(tǒng)計(jì)方法對(duì)基元特征進(jìn)行描述的時(shí)候發(fā)生畸變;(4)神經(jīng)網(wǎng)絡(luò)的識(shí)別方法必須事先確定輸入特征向量的維數(shù),但殘缺字符的殘缺程度不同會(huì)影響特征向量的維數(shù)。
發(fā)明內(nèi)容
本發(fā)明的目的在于克服現(xiàn)有文字識(shí)別技術(shù)中的不足,提供一種殘缺印刷體數(shù)字字符的識(shí)別方法,使其能夠?qū)埲钡挠∷Ⅲw數(shù)字字符進(jìn)行準(zhǔn)確的識(shí)別。
本發(fā)明是通過以下技術(shù)方案實(shí)現(xiàn)的,本發(fā)明方法如下先將整個(gè)字符輪廓分解為上、下、左和右四個(gè)局部輪廓,并用圖像邊框到字符輪廓的輪廓像素點(diǎn)的位置坐標(biāo)集合表示輪廓。分別對(duì)上、左和右的輪廓輪廓像素點(diǎn)的位置坐標(biāo)進(jìn)行一次離散微分,根據(jù)一次離散微分分析輪廓曲線的趨勢變化,定義5個(gè)結(jié)構(gòu)集元,包括豎直(V)、左斜(L)、右斜(R)、圓弧(C)和突變(P),并從剩余的上、左和右輪廓中提取集元結(jié)構(gòu)特征。此外,利用左右輪廓統(tǒng)計(jì)字符的寬度(W),利用上下輪廓統(tǒng)計(jì)字符高度(H),最后在0.5H范圍內(nèi)統(tǒng)計(jì)筆畫數(shù)目。字符的輪廓結(jié)構(gòu)特征和統(tǒng)計(jì)特征相結(jié)合,為數(shù)字字符建立模型后,采用結(jié)構(gòu)語句識(shí)別方法殘缺數(shù)字字符。
雖然底部殘缺的數(shù)字字符由于丟失了底部的重要筆畫,使得字符失去了許多特征,同時(shí)也使得部分特征變得不穩(wěn)定,給文字識(shí)別造成了很大的困難。但是當(dāng)字符的殘缺部分不超過原有字符的0.5H時(shí),人眼依然能夠準(zhǔn)確地識(shí)別出來。這說明殘缺的字符依然保留有足夠的殘余特征。提取這些殘留的穩(wěn)定特征,采用合理的識(shí)別策略既能實(shí)現(xiàn)底部殘缺數(shù)字字符的識(shí)別。
以下對(duì)本發(fā)明方法作進(jìn)一步的說明,方法步驟如下(1)字符輪廓分解將字符的整體輪廓分解為頂部、底部、左側(cè)和右側(cè)四個(gè)方向的輪廓特征來描述。使得底部輪廓的缺損時(shí),不至于影響到頂部特征,而且也可以從左右兩側(cè)的輪廓特征中提取部分有價(jià)值的信息。
左側(cè)輪廓(LP(k),k=1,2,…M)定義為字符最左側(cè)邊界像素點(diǎn)的水平方向坐標(biāo)值。
LP(i)=min{x|P(x,y)∈C,y=i}i=1,2…M(1)式中P(x,y)表示圖像中坐標(biāo)為(x,y)的像素點(diǎn),C表示字符像素點(diǎn)的集合。同理,右側(cè)輪廓(RP(k),k=1,2,…M)定義為字符最右側(cè)邊界像素點(diǎn)的水平方向坐標(biāo)值。
RP(i)=max{x|P(x,y)∈C,y=i}i=1,2…M(2)相應(yīng)地,頂部輪廓(TP(k),k=1,2,…N)定義為字符最高邊界像素點(diǎn)的垂直方向坐標(biāo)值。底部輪廓(BP(k),k=1,2,…N)定義為字符最低邊界像素點(diǎn)的垂直方向坐標(biāo)值。
TP(j)=min{y|P(x,y)∈C,x=j(luò)}j=1,2…N(3)
BP(j)=max{y|P(x,y)∈C,x=j(luò)}j=1,2…N(4)(2)輪廓一階離散微分為了描述輪廓的變化特征,定義四個(gè)方向輪廓的一階微分LPD=LP(i+1)-LP(i)RPD=RP(i+1)-RP(i)(5)TPD=TP(j+1)-TP(j)BPD=BP(j+1)-BP(j)式中i=1,2,…M-1,j=1,2,…N-1。
(3)各輪廓上的結(jié)構(gòu)集元特征提取根據(jù)字符輪廓的變化趨勢定義構(gòu)成字符輪廓的基本基元。基本基元共有5個(gè)分別為豎直(V)、左斜(L)、右斜(R)、圓弧(C)和突變(P)。定義上述基本基元(a)豎直定義假設(shè)SL,SV和SR分別表示某側(cè)輪廓一階微分值大于零,等于零和小于零的個(gè)數(shù),若SR=0,SL=0,則為結(jié)構(gòu)V。
(b)左斜定義假設(shè)SL,SV和SR分別表示某側(cè)輪廓一階微分值大于零,等于零和小于零的個(gè)數(shù),若SR=0,SL大閾值LT,則為結(jié)構(gòu)L。
(c)右斜定義假設(shè)SL,SV和SR分別表示某側(cè)輪廓一階微分值大于零,等于零和小于零的個(gè)數(shù),若SL=0,SR大閾值RT,則為結(jié)構(gòu)R。
(d)圓弧定義假設(shè)SL,SV和SR分別表示某側(cè)輪廓一階微分值大于零,等于零和小于零的個(gè)數(shù),若SR大于閾值RT,SL大閾值LT,則為結(jié)構(gòu)C。
(e)突變連續(xù)的字符輪廓,其一階微分值的變化量比較小,而當(dāng)字符輪廓發(fā)生突變時(shí),其一階微分值相對(duì)較大。因此,定義當(dāng)輪廓的一階微分值超過閾值PT時(shí)則字符輪廓有突變,即為結(jié)構(gòu)P。結(jié)構(gòu)P將字符輪廓分成幾條連續(xù)的曲線,各條曲線各自獨(dú)立地提取結(jié)構(gòu)特征。
根據(jù)上述定義,考慮到字符輪廓上存在的干擾像素點(diǎn),采用閾值技術(shù)檢測集元假設(shè)PD(k)表示某側(cè)輪廓的一階微分,k=1,2,…K,SL,SV和SR分別為檢測到的PD(k)大于零,等于零和小于零的個(gè)數(shù),PT、RT和LT為正整數(shù),則若|PD(k)|>=PT,則在k處檢測到結(jié)構(gòu)突變(P);檢測到突變結(jié)構(gòu)P的有效范圍在x∈[ST,N-ST+1],y∈[ST,M-ST+1],其中ST表示字符筆劃的寬度。這主要是為了避免干擾嚴(yán)重情況下,輪廓邊緣光滑處理不夠理想時(shí),可能檢測到的假突變基元。
若SL<LT,SR<RT,則檢測到結(jié)構(gòu)為豎直(V);若SL>LT,SR<RT,則檢測到結(jié)構(gòu)為左斜(L);若SL<LT,SR>RT,則檢測到結(jié)構(gòu)為右斜(R);若SL>LT,SR>RT,則檢測到結(jié)構(gòu)為圓弧(C)。
左右兩側(cè)輪廓上檢測到的集元按照從上到下的順序保存在各自的向量組LS和RS中;頂部檢測到集元按從左到右的順序保存在另一個(gè)向量組TS中。頂部輪廓上,TS(i)表示頂部輪廓結(jié)構(gòu)集元的向量組的第i個(gè)結(jié)構(gòu)集元,Tn表示頂部輪廓共有的集元數(shù)目;左側(cè)輪廓上,LS(i)表示左側(cè)輪廓結(jié)構(gòu)集元的向量組的第i個(gè)結(jié)構(gòu)集元,Ln表示左側(cè)輪廓共有的集元數(shù)目;右側(cè)輪廓上,RS(i)表示右側(cè)輪廓結(jié)構(gòu)集元的向量組的第i個(gè)結(jié)構(gòu)集元,Rn表示右側(cè)輪廓共有的集元數(shù)目。
(4)輪廓的統(tǒng)計(jì)特征采用上述的結(jié)構(gòu)基元還不足以準(zhǔn)確識(shí)別殘缺和完整的數(shù)字,引入與結(jié)構(gòu)特征具有較強(qiáng)互不性的輪廓統(tǒng)計(jì)特征。
(a)字符高度與最大字符寬度Wmax之比字符的最大寬度為Wmax=maxk{RP(k)-LP(k)}---(6)]]>單個(gè)字符的高度為h=maxl{TP(l)-BP(l)}---(7)]]>
實(shí)際應(yīng)用中,殘缺字符與完整字符混合在一起,而且數(shù)量相對(duì)較少。因此,雖然底部殘缺致使殘缺字符的高度無法準(zhǔn)確估計(jì),但是在同一文字區(qū)域內(nèi),字符大小的固定的,其高度接近相等,可以采用單個(gè)字符高度的中值濾波估計(jì)字符高度,H=med{h1,h2,…h(huán)m)(8)m是文字區(qū)域內(nèi)的字符總數(shù)。
字符的高寬比為Ratio=H/Wmax(9)該特征主要用于識(shí)別數(shù)字1。當(dāng)Ratio≥2.5,即為數(shù)字1。
(b)垂直方向的筆劃數(shù)在字符0.5H的范圍內(nèi),自上而下掃描每列像素點(diǎn)的筆畫數(shù)目,取筆畫數(shù)目的最大值Smax。該特征主要用于區(qū)別數(shù)字0和8,當(dāng)Smax2≥2時(shí),為字符8;否則為字符0。
(5)建立10個(gè)數(shù)字字符的模型10個(gè)數(shù)字字符的模型如下所示“0”字符的模型Ratio≥2.5,TS(1)=C,Size(LS)=Size(RS)=1,Smax<2“1”字符的模型Ratio<2.5“2”字符的模型Ratio≥2.5,TS(1)=C,LS(1)≠C,LS(Ln-1)=P,LS(Ln)=L“3”字符的模型Ratio≥2.5,TS(1)=C,LS(1)≠C,P∈LS,LS(Ln)≠L;or Ratio≥2.5,TS(1)=V,RS(1)=C“4”字符的模型Ratio≥2.5,TS(1)=L,RS(1)=V“5”字符的模型Ratio≥2.5,V∈TS,P∈RS;“6”字符的模型Ratio≥2.5,TS(1)=C,P∈RS,Size(LS)=1;or Ratio≥2.5,TS(1)=L,V∉RS]]>“7”字符的模型Ratio≥2.5,TS(1)=V,P∈LS,Size(RS)=1;“8”字符的模型Ratio≥2.5,TS(1)=C,Size(LS)=Size(RS)=1,Smax≥2“9”字符的模型Ratio≥2.5,TS(1)=C,LS(1)=C,LS(2)=P
(6)采用結(jié)構(gòu)語句識(shí)別方法識(shí)別殘缺數(shù)字字符采用結(jié)構(gòu)語句識(shí)別方法,將目標(biāo)文字上提取的結(jié)構(gòu)特征和統(tǒng)計(jì)特征,按照已定義的數(shù)字字符模型,與模型匹配,實(shí)現(xiàn)殘缺數(shù)字字符的文字識(shí)別。
本發(fā)明克服了由于數(shù)字字符底部筆畫丟失而導(dǎo)致字符無法識(shí)別的問題,而且對(duì)完整的數(shù)字字符也能實(shí)現(xiàn)準(zhǔn)確識(shí)別。該文字圖象分割方法具有如下優(yōu)點(diǎn)(1)從底部殘缺的數(shù)字字符中,從頂部、左右兩邊的輪廓中提取結(jié)構(gòu)基元和輪廓統(tǒng)計(jì)的殘余特征。(2)根據(jù)上述特征,建立數(shù)字字符的結(jié)構(gòu)模型。(3)能準(zhǔn)確識(shí)別底部殘缺的數(shù)字字符。(4)同時(shí),對(duì)于完整的數(shù)字字符也能實(shí)現(xiàn)準(zhǔn)確識(shí)別,提高了識(shí)別算法對(duì)字符筆畫丟失、變形的可靠性和識(shí)別準(zhǔn)確率。
圖1輪廓定義示意2五個(gè)結(jié)構(gòu)集元示意圖具體實(shí)施方式
如圖1所示,為本發(fā)明輪廓定義示意圖,其中將字符的整體輪廓分解為頂部、底部、左側(cè)和右側(cè)四個(gè)方向的輪廓特征來描述。使得底部輪廓的缺損時(shí),不至于影響到頂部特征,而且也可以從左右兩側(cè)的輪廓特征中提取部分有價(jià)值的信息。
左側(cè)輪廓(LP(k),k=1,2,…M)定義為字符最左側(cè)邊界像素點(diǎn)的水平方向坐標(biāo)值。
LP(i)=min{x|P(x,y)∈C,y=i}i=1,2…M式中P(x,y)表示圖像中坐標(biāo)為(x,y)的像素點(diǎn),C表示字符像素點(diǎn)的集合。同理,右側(cè)輪廓(RP(k),k=1,2,…M)定義為字符最右側(cè)邊界像素點(diǎn)的水平方向坐標(biāo)值。
RP(i)=max{x|P(x,y)∈C,y=i}i=1,2…M相應(yīng)地,頂部輪廓(TP(k),k=1,2,…N)定義為字符最高邊界像素點(diǎn)的垂直方向坐標(biāo)值。底部輪廓(BP(k),k=1,2,…N)定義為字符最低邊界像素點(diǎn)的垂直方向坐標(biāo)值。
TP(j)=min{y|P(x,y)∈C,x=j(luò)}j=1,2…NBP(j)=max{y|P(x,y)∈C,x=j(luò)}j=1,2…N在圖書館藏書的索書號(hào)文字識(shí)別中,由于索書號(hào)貼在書脊上,受書脊空間限制的影響,當(dāng)索書號(hào)由兩行或者兩行以上的字符串組成時(shí),第二行的字符常會(huì)折疊,在攝像頭拍攝得到圖像后,字符的底部便會(huì)丟失。這種字符的存在嚴(yán)重降低了索書號(hào)識(shí)別的正確率。
結(jié)合本發(fā)明方法的內(nèi)容提供以下實(shí)施例,具體如下(1)將字符的整體輪廓分解為頂部、底部、左側(cè)和右側(cè)四個(gè)方向的輪廓特征來描述,并用輪廓像素點(diǎn)的位置坐標(biāo)進(jìn)行表述。
(2)對(duì)各個(gè)輪廓進(jìn)行一階離散微分計(jì)算。
(3)根據(jù)一階離散微分分析輪廓曲線變化趨勢,提取各個(gè)輪廓的結(jié)構(gòu)集元,并建立相應(yīng)的基元向量組?;崛r(shí)的參數(shù)PT=6,LT=3,RT=3,ST=3。
(4)提取輪廓的統(tǒng)計(jì)特征,包括字符的高寬比和0.5H范圍內(nèi)的列方向上的最大筆畫數(shù)。
(5)根據(jù)上述的字符輪廓結(jié)構(gòu)特征和統(tǒng)計(jì)特征,建立10個(gè)數(shù)字字符的模型。
(6)采用結(jié)構(gòu)語句識(shí)別方法識(shí)別殘缺的數(shù)字字符。
采用上述方法對(duì)索書號(hào)中的殘缺數(shù)字字符進(jìn)行識(shí)別,其正確率為91.8%,完整字符的識(shí)別正確率為97.6%,從而保證了索書號(hào)識(shí)別具有較高的正確率。
權(quán)利要求
1.一種殘缺印刷體數(shù)字字符的識(shí)別方法,其特征在于,將整個(gè)字符輪廓分解為上、下、左和右四個(gè)局部輪廓,并用圖像邊框到字符輪廓的輪廓像素點(diǎn)的位置坐標(biāo)集合表示輪廓,分別對(duì)上、左和右的輪廓像素點(diǎn)的位置坐標(biāo)進(jìn)行一次離散微分,根據(jù)一次離散微分分析輪廓曲線的趨勢變化,定義5個(gè)結(jié)構(gòu)集元,包括豎直V、左斜L、右斜R、圓弧C和突變P,并從剩余的上、左和右輪廓中提取集元結(jié)構(gòu)特征,此外,利用左右輪廓統(tǒng)計(jì)字符的寬度W,利用上下輪廓統(tǒng)計(jì)字符高度H,最后在0.5H范圍內(nèi)統(tǒng)計(jì)筆畫數(shù)目,字符的輪廓結(jié)構(gòu)特征和統(tǒng)計(jì)特征相結(jié)合,為數(shù)字字符建立模型后,采用結(jié)構(gòu)語句識(shí)別方法殘缺數(shù)字字符。
2.根據(jù)權(quán)利要求1所述的殘缺印刷體數(shù)字字符的識(shí)別方法,其特征是,以下對(duì)本發(fā)明的進(jìn)一步的限定,包含以下步驟(1)字符輪廓分解,(2)輪廓一階離散微分,(3)各輪廓上的結(jié)構(gòu)集元特征提取,(4)輪廓的統(tǒng)計(jì)特征提取,(5)建立數(shù)字字符的模型,(6)采用結(jié)構(gòu)語句識(shí)別方法識(shí)別文字。
3.根據(jù)權(quán)利要求2所述的殘缺印刷體數(shù)字字符的識(shí)別方法,其特征是,所述的輪廓分解,具體為左側(cè)輪廓定義為字符最左側(cè)邊界像素點(diǎn)的水平方向坐標(biāo)值,右側(cè)輪廓定義為字符最右側(cè)邊界像素點(diǎn)的水平方向坐標(biāo)值,相應(yīng)地,頂部輪廓定義為字符最高邊界像素點(diǎn)的垂直方向坐標(biāo)值,底部輪廓定義為字符最低邊界像素點(diǎn)的垂直方向坐標(biāo)值。
4.根據(jù)權(quán)利要求2所述的殘缺印刷體數(shù)字字符的識(shí)別方法,其特征是,所述的輪廓一階離散微分,具體為定義四個(gè)方向輪廓的一階微分LPD=LP(i+1)-LP(i)RPD=RP(i+1)-RP(i)TPD=TP(j+1)-TP(j)BPD=BP(j+1)-BP(j)式中i=1,2,…M-1,j=1,2,…N-1。
5.根據(jù)權(quán)利要求2所述的殘缺印刷體數(shù)字字符的識(shí)別方法,其特征是,所述的各輪廓上的結(jié)構(gòu)集元特征提取,具體為假設(shè)PD(k)表示某側(cè)輪廓的一階微分,k=1,2,…K,SL,SV和SR分別為檢測到的PD(k)大于零,等于零和小于零的個(gè)數(shù),PT、RT和LT為正整數(shù),則若|PD(k)|>=PT,則在k處檢測到結(jié)構(gòu)突變P;檢測到突變結(jié)構(gòu)P的有效范圍在x∈[ST,N-ST+1],y∈[ST,M-ST+1],其中ST表示字符筆劃的寬度。若SL<LT,SR<RT,則檢測到結(jié)構(gòu)為豎直V;若SL>LT,SR<RT,則檢測到結(jié)構(gòu)為左斜L;若SL<LT,SR>RT,則檢測到結(jié)構(gòu)為右斜R;若SL>LT,SR>RT,則檢測到結(jié)構(gòu)為圓弧C;左右兩側(cè)輪廓上檢測到的集元按照從上到下的順序保存在各自的向量組LS和RS中;頂部檢測到集元按從左到右的順序保存在另一個(gè)向量組TS中,頂部輪廓上,TS(i)表示頂部輪廓結(jié)構(gòu)集元的向量組的第i個(gè)結(jié)構(gòu)集元,Tn表示頂部輪廓共有的集元數(shù)目;左側(cè)輪廓上,LS(i)表示左側(cè)輪廓結(jié)構(gòu)集元的向量組的第i個(gè)結(jié)構(gòu)集元,Ln表示左側(cè)輪廓共有的集元數(shù)目;右側(cè)輪廓上,RS(i)表示右側(cè)輪廓結(jié)構(gòu)集元的向量組的第i個(gè)結(jié)構(gòu)集元,Rn表示右側(cè)輪廓共有的集元數(shù)目。
6.根據(jù)權(quán)利要求2所述的殘缺印刷體數(shù)字字符的識(shí)別方法,其特征是,所述的輪廓的統(tǒng)計(jì)特征提取,具體為a.字符高度與最大字符寬度Wmax之比字符的最大寬度為Wmax=maxk{RP(k)-LP(k)}]]>單個(gè)字符的高度為h=maxl{TP(l)-BP(l)}]]>實(shí)際應(yīng)用中,在同一文字區(qū)域內(nèi),字符大小是固定的,其高度接近相等,采用單個(gè)字符高度的中值濾波估計(jì)字符高度,H=med{h1,h2,…h(huán)m}m是文字區(qū)域內(nèi)的字符總數(shù);字符的高寬比為Ratio=H/Wmax該特征主要用于識(shí)別數(shù)字1,當(dāng)Ratio≥2.5,即為數(shù)字1;b.垂直方向的筆劃數(shù)在字符0.5H的范圍內(nèi),自上而下掃描每列像素點(diǎn)的筆畫數(shù)目,取筆畫數(shù)目的最大值Smax,該特征主要用于區(qū)別數(shù)字0和8,當(dāng)Smax2≥2時(shí),為字符8,否則為字符0。
7.根據(jù)權(quán)利要求2所述的殘缺印刷體數(shù)字字符的識(shí)別方法,其特征是,所述的建立數(shù)字字符的模型,具體為“0”字符的模型Ratio≥2.5,TS(1)=C,Size(LS)=Size(RS)=1,Smax<2“1”字符的模型Ratio<2.5“2”字符的模型Ratio≥2.5,TS(1)=C,LS(1)≠C,LS(Ln-1)=P,LS(Ln)=L“3”字符的模型Ratio≥2.5,TS(1)=C,LS(1)≠C,P∈LS,LS(Ln)≠L;or Ratio≥2.5,TS(1)=V,RS(1)=C“4”字符的模型Ratio≥2.5,TS(1)=L,RS(1)=V“5”字符的模型Ratio≥2.5,V∈TS,P∈RS;“6”即字符的模型Ratio≥2.5,TS(1)=C,P∈RS,Size(LS)=1or Ratio≥2.5,TS(1)=L,V∉RS]]>“7”字符的模型Ratio≥2.5,TS(1)=V,P∈LS,Size(RS)=1;“8”字符的模型Ratio≥2.5,TS(1)=C,Size(LS)=Size(RS)=1,Smax≥2“9”字符的模型Ratio≥2.5,TS(1)=C,LS(1)=C,LS(2)=P
8.根據(jù)權(quán)利要求2所述的殘缺印刷體數(shù)字字符的識(shí)別方法,其特征是,所述的采用結(jié)構(gòu)語句識(shí)別方法識(shí)別文字,具體為采用結(jié)構(gòu)語句識(shí)別方法,將目標(biāo)文字上提取的結(jié)構(gòu)特征和統(tǒng)計(jì)特征,與模型匹配,實(shí)現(xiàn)文字識(shí)別。
全文摘要
一種殘缺印刷體數(shù)字字符的識(shí)別方法,用于圖像識(shí)別領(lǐng)域。方法如下先將整個(gè)字符輪廓分解為上、下、左和右四個(gè)局部輪廓,并用圖像邊框到字符輪廓的輪廓像素點(diǎn)的位置坐標(biāo)集合表示輪廓,分別對(duì)上、左和右的輪廓輪廓像素點(diǎn)的位置坐標(biāo)進(jìn)行一次離散微分,根據(jù)一次離散微分分析輪廓曲線的趨勢變化,從剩余的上、左和右輪廓中提取集元結(jié)構(gòu)特征,此外,利用左右輪廓統(tǒng)計(jì)字符的寬度,利用上下輪廓統(tǒng)計(jì)字符高度,統(tǒng)計(jì)字符的高寬比和在0.5H范圍內(nèi)統(tǒng)計(jì)筆畫數(shù)目,字符的輪廓結(jié)構(gòu)特征和統(tǒng)計(jì)特征相結(jié)合,為數(shù)字字符建立模型后,采用結(jié)構(gòu)語句識(shí)別方法殘缺數(shù)字字符。該方法能夠?qū)崿F(xiàn)底部殘缺和完整數(shù)字字符的正確識(shí)別,提高了實(shí)際應(yīng)用中數(shù)字字符識(shí)別的正確率。
文檔編號(hào)G06K9/72GK1584921SQ20041002504
公開日2005年2月23日 申請日期2004年6月10日 優(yōu)先權(quán)日2004年6月10日
發(fā)明者胡小鋒, 葉慶泰, 徐榕 申請人:上海交通大學(xué)