專利名稱:一種手寫文字的識別方法
技術(shù)領(lǐng)域:
本發(fā)明屬于模式識別與人工智能技術(shù)領(lǐng)域,特別是涉及一種手寫文字圖像識別處理方法。
背景技術(shù):
漢字在線識別是指用戶一邊書寫一邊識別。一般是指用戶通過手寫輸入設(shè)備(比如手寫板、觸摸屏、鼠標(biāo)等)書寫漢字,同時(shí)計(jì)算機(jī)將手寫輸入設(shè)備采集到的漢字書寫軌跡轉(zhuǎn)換為相應(yīng)的漢字機(jī)器內(nèi)碼的識別技術(shù)。按書寫限制的程度,一般可以分為限制性手寫體(如限制筆順,橫平豎直,沒有連筆),手寫印刷體(指書寫工整的漢字),行書手寫體(指有部分筆畫變形和連筆的漢字),草書手寫體(指大部分筆畫變形以及幾乎完全連筆書寫的漢字)。這幾種手寫體的識別難度依次增大,以草書手寫體的識別難度最大。因?yàn)椴輹謱戵w的漢字字型通常已經(jīng)和原漢字字形有了較大的不同,不僅表現(xiàn)在筆畫的變形上,還表現(xiàn)在漢字結(jié)構(gòu)的變形上。這些變形一般是由于書寫者為了達(dá)到更快、更流暢的書寫速度而在原有漢字字形的基礎(chǔ)上改變而來的。因此在以上幾種手寫體漢字中,以草書手寫體的書寫速度最快,因而這種書寫方式也是人們最樂于接受的一種書寫方式。
已有的漢字識別方法大多數(shù)是基于漢字筆畫來進(jìn)行識別的,比如中國發(fā)明專利98106953.3號專利《手寫漢字識別方法及裝置》、98108373.0號專利《文字識別裝置及文字識別方法》以及98122949.2號專利《一種無筆畫順序的手寫字符辨識系統(tǒng)》等專利使用的方法都依賴于筆畫的正確提取與識別,而草書手寫體漢字不但連筆書寫,大部分筆畫變形嚴(yán)重,而且有很多短的筆畫會被省去,因此以上識別方法無法很好地解決草書手寫體漢字的識別。
在中國發(fā)明專利93101683.5號專利《自由書寫聯(lián)機(jī)手寫漢字識別方法及其系統(tǒng)》中也提到已有的基于筆畫或筆段的字形結(jié)構(gòu)識別方法很難處理分解不出筆段的漢字,該專利的特征在于將兩種識別不同書寫風(fēng)格漢字的識別方法相結(jié)合,一種用于識別楷書和部分行書,另一種識別不規(guī)范連筆字,而該專利提出的識別方法的結(jié)合方式是采用一種串行的方式,即先用前種方法識別,拒識以后才用后一種方法識別。這種方法的不足之處在于針對不規(guī)范連筆字的識別只采用了一種識別方法,而其采用的串行結(jié)合的識別方式的不足在于如果某個(gè)草書漢字沒有被拒識,則不會用后一種識別不規(guī)范連筆字的識別方法進(jìn)行識別。
發(fā)明內(nèi)容
本發(fā)明的目的在于克服上述漢字手寫識別方法的不足,提供一種通過脫機(jī)識別方法和聯(lián)機(jī)識別方法相結(jié)合的手寫文字識別方法。
本發(fā)明采用的技術(shù)方案為一種手寫文字的識別方法,通過脫機(jī)文字識別方法和聯(lián)機(jī)文字識別方法相結(jié)合對手寫文字進(jìn)行識別,所述脫機(jī)文字識別方法包括(1)、重構(gòu)手寫文字圖像;(2)、通過文字圖像提取文字筆畫的輪廓方向角特征;(3)、選取脫機(jī)識別候選字;所述聯(lián)機(jī)文字識別方法包括
(A)、提取手寫文字時(shí)序點(diǎn)的聯(lián)機(jī)筆畫方向特征;(B)、選取聯(lián)機(jī)識別候選字。
所述步驟(1)重構(gòu)手寫文字圖像通過采集手寫文字時(shí)序點(diǎn)軌跡坐標(biāo),并將時(shí)序點(diǎn)軌跡線性歸一化到固定大小,再用等寬的線段依次連接所有相鄰的時(shí)序點(diǎn),從而重構(gòu)出原手寫漢字的圖像。
所述步驟(2)提取文字筆畫的輪廓方向角特征通過把漢字圖像在水平和垂直兩個(gè)方向上的直方圖投影畫出4×4的全局彈性網(wǎng)格,使得每一列網(wǎng)格在水平方向上的直方圖投影累積量相等,每一行網(wǎng)格在垂直方向上的直方圖投影累積量相等,再根據(jù)每個(gè)網(wǎng)格水平和垂直兩個(gè)方向上的直方圖投影在網(wǎng)格內(nèi)畫出2×2的局部彈性網(wǎng)格,形成64個(gè)局部彈性網(wǎng)格,再從這64個(gè)網(wǎng)格中提取出文字的輪廓,然后對每個(gè)彈性網(wǎng)格單元內(nèi)的輪廓在4個(gè)方向上進(jìn)行輪廓方向角特征提取,得出輪廓方向角特征。所述4個(gè)方向?yàn)闄M撇、撇豎、豎捺、橫捺。對漢字圖像經(jīng)過輪廓提取后,對字符輪廓點(diǎn)P的8鄰域通過θ(p)=tan-1(DxDy)]]>計(jì)算該輪廓點(diǎn)的輪廓方向角,其中Dx、Dy是p點(diǎn)在x軸和y軸上的梯度函數(shù),且Dx、Dy定義為Dx=(p6+2p7+p8)-(p1+2p2+p3),Dy=(p3+2p5+p8)-(p1+2p4+p6)而輪廓點(diǎn)p的8鄰域?yàn)?
,方向角的取值范圍為0到180度,整個(gè)文字64個(gè)彈性網(wǎng)格單元總共得到256維輪廓方向角特征矢量。
所述步驟(2)還包括線性判決分析(LDA)對輪廓方向角特征進(jìn)行降維,將原先的256維數(shù)降為128維數(shù)。
所述步驟(3)選取脫機(jī)識別候選字通過計(jì)算128維輪廓方向角特征與模板中所有文字特征的歐式距離,選出距離最小的前100個(gè)候選字作為脫機(jī)識別候選字。
所述步驟(A)提取手寫文字筆畫時(shí)序點(diǎn)的方向特征通過對手寫文字筆畫時(shí)序點(diǎn)按固定距離進(jìn)行采樣,又定義采樣后的特征點(diǎn)的筆畫方向角為前一特征點(diǎn)指向該特征點(diǎn)的方向角度,范圍為0到255,線性對應(yīng)0到359度,然后計(jì)算每個(gè)特征點(diǎn)的筆畫方向角,作為該特征點(diǎn)的聯(lián)機(jī)筆畫方向特征。
所述步驟(B)選取聯(lián)機(jī)識別候選字通過動態(tài)時(shí)間規(guī)整(DTW)的方法對聯(lián)機(jī)筆畫方向特征矢量與步驟(3)得出的脫機(jī)識別候選字的多種不同筆順的模板特征矢量進(jìn)行彈性模板匹配,計(jì)算脫機(jī)識別候選字與聯(lián)機(jī)筆畫方向特征的匹配相似度,其中,DTW彈性匹配的局部距離函數(shù)采用如下關(guān)系式計(jì)算d(i,j)=(Δθ)20≤Δθ≤64-(Δθ-128)2+819264≤Δθ≤128,]]>而Δθ=|θi-θj|0≤|θi-θj|<128256-|θi-θj|128≤|θi-θj|<256,]]>i和j分別為當(dāng)前匹配的兩特征值在各自特征序列中的位置,θ為輪廓方向角特征;然后再將100個(gè)脫機(jī)識別候選字按其與聯(lián)機(jī)筆畫方向特征匹配相似度由大到小排序,組成100個(gè)聯(lián)機(jī)識別方法候選字。
本發(fā)明通過對脫機(jī)識別候選字和聯(lián)機(jī)識別候選字進(jìn)行集成完成對手寫文字的識別,其算法稱之為首選識別結(jié)果選擇器,具體包括如下規(guī)則(I)、計(jì)算脫機(jī)識別候選字中每個(gè)候選字的位置分?jǐn)?shù)Si,
Si=i*exp(1-i)*D+i′*exp(1-i′)*C其中i為該候選字在脫機(jī)識別候選字序列中的位置,范圍為1到100,i’為該候選字在聯(lián)機(jī)識別候選字序列中所處的位置,范圍也為1到100,C和D為兩個(gè)常數(shù);(II)、計(jì)算聯(lián)機(jī)識別候選字中每個(gè)候選字的位置分?jǐn)?shù)Tj,Tj=j(luò)*exp(1-j)*C-Pj其中j為該候選字在聯(lián)機(jī)識別候選字序列中的位置,范圍為1到100,C為常數(shù),且與步驟(I)的C相同,Pj為預(yù)先定義好的懲罰分?jǐn)?shù),根據(jù)j的不同而不同;(III)、根據(jù)聯(lián)機(jī)識別候選字的匹配相似度選擇可信度區(qū)間1到M,位置在M以后的候選字認(rèn)為是不可信的候選字;(IV)、將脫機(jī)識別候選字與聯(lián)機(jī)識別候選字序列合在一起按照每個(gè)候選字的位置分?jǐn)?shù)從大到小排序,得出集成候選字序列;(V)、選取一個(gè)候選字作為識別結(jié)果,通過定義Ai為聯(lián)機(jī)識別候選字,Bj為脫機(jī)識別候選字,i和j的范圍為1到100,分別對應(yīng)100個(gè)候選字,如果A1=B1,則選擇A1;如果A1非??尚?,而B1不太可信,則選擇A1;如果B1很可信,則選擇B1;如果Ak=B1且B1=A1,k和1的范圍為1到35,而k<1,則選B1,k>1則選A1;如果Ak=B2且B1=A2,k和1的范圍為1到15,而k<1,則選B1,k>1則選A1;
如果以上各個(gè)條件均不滿足,則選擇集成候選字序列的首個(gè)候選字。
本發(fā)明的基本原理是用戶在書寫連筆草書漢字時(shí),雖然漢字的筆畫和整字的結(jié)構(gòu)會有較大變形,但總體的筆畫方向特征分布較為穩(wěn)定,通過彈性網(wǎng)格特征提取技術(shù)能較好地提取穩(wěn)定的筆畫方向特征而不對漢字筆畫和結(jié)構(gòu)的變形過于敏感,通過提取的這種特征對漢字進(jìn)行識別,本發(fā)明所采用的脫機(jī)識別方法能較好地解決自由筆順的問題;另外,連筆草書漢字即使會有一些短的筆畫被省略,但整字筆畫大體的走向比較穩(wěn)定,通過采用一種限制大體筆順方向的聯(lián)機(jī)識別方法能識別出一些變形較為嚴(yán)重的草書漢字;本發(fā)明將這兩種識別方法結(jié)合起來,即使一些變形嚴(yán)重而且筆順與模板不一致的草書漢字在兩種識別方法識別出的候選字位置較后,通過采用一種集成策略,使原本位置較后的正確候選字被提前,從而大大提高了系統(tǒng)對連筆草書漢字的識別效果。
本發(fā)明與已有的漢字識別方法相比,具有如下的優(yōu)點(diǎn)和有益效果(1)、由于采用的兩種識別方法均不依賴于筆畫或筆段的正確提取與識別,因此能很好地解決對筆畫或筆段不容易提取的草書漢字的識別;(2)、由于一般的脫機(jī)識別方法不考慮筆順信息,而本發(fā)明結(jié)合聯(lián)機(jī)識別方法,能增強(qiáng)對一些變形嚴(yán)重但筆順大體與模板中某一種書寫筆順一致的草書漢字的識別效果;(3)、與限制筆順的聯(lián)機(jī)識別方法相比,本發(fā)明結(jié)合了脫機(jī)識別方法后,能彌補(bǔ)對自由筆順書寫的漢字識別的不足;(4)、本發(fā)明由于對書寫軌跡的所有時(shí)序點(diǎn)用線段連接,所以無論書寫中有無連筆,用于進(jìn)行識別的漢字都是一樣的,所以能較好地識別任意用戶書寫的連筆草書漢字;
(5)、本發(fā)明可準(zhǔn)確識別連筆草書,所以本發(fā)明能讓用戶在用手寫輸入法輸入漢字時(shí)書寫漢字的速度達(dá)到最快。
圖1是本發(fā)明的系統(tǒng)結(jié)構(gòu)框圖;圖2是本發(fā)明的脫機(jī)識別方法的流程框圖;圖3是本發(fā)明的聯(lián)機(jī)識別方法的流程框圖;圖4是本發(fā)明的脫機(jī)與聯(lián)機(jī)的識別結(jié)果集成的流程框圖。
具體實(shí)施例方式
下面結(jié)合附圖對本發(fā)明做進(jìn)一步的說明,實(shí)施本發(fā)明所用的識別設(shè)備可以采用手寫板書寫漢字,用計(jì)算機(jī)進(jìn)行識別,用純平型顯示器顯示用戶圖形界面,可采用C語言編制各類處理程序,便能較好地實(shí)施本發(fā)明。
本發(fā)明的系統(tǒng)結(jié)構(gòu)框圖如附圖1所示,漢字筆畫的時(shí)序點(diǎn)輸入后,可通過脫機(jī)識別和聯(lián)機(jī)識別的方式同時(shí)對漢字進(jìn)行識別,脫機(jī)識別包括重構(gòu)漢字圖像、彈性網(wǎng)格特征提取、LDA降維、通過距離分類器選取脫機(jī)識別候選字、脫機(jī)識別候選字可跟聯(lián)機(jī)識別候選字進(jìn)行彈性模板匹配,通過候選字集成,得出識別結(jié)果;聯(lián)機(jī)識別包括筆畫方向特征提取、彈性模板匹配得出聯(lián)機(jī)識別候選字;本發(fā)明也分別采用脫機(jī)識別方法或聯(lián)機(jī)識別方法對一些手寫較為規(guī)范的漢字進(jìn)行識別。本發(fā)明脫機(jī)識別的模板是經(jīng)過大量包含草書的訓(xùn)練樣本統(tǒng)計(jì)學(xué)習(xí)得到的,聯(lián)機(jī)識別方法的模板也是經(jīng)過學(xué)習(xí)這些樣本,通過對筆順的聚類得到的多筆順模板。
本發(fā)明的脫機(jī)識別方法的流程圖如附圖2所示,具體為將輸入軌跡的時(shí)序點(diǎn)位置歸一化,然后用等寬線段連接所有相鄰時(shí)序點(diǎn),從而重構(gòu)漢字圖像,再用彈性網(wǎng)格提取漢字輪廓方向角特征,得出多維特征后,通過LDA降維,以便距離分類器的計(jì)算,通過距離分類器計(jì)算降維后的特征矢量與模板中所有漢字的特征矢量的歐式距離,將模板中所有漢字按歐式距離從小到大排序,選取前100個(gè)漢字作為脫機(jī)識別的候選字序列。
本發(fā)明的聯(lián)機(jī)識別方法流程框圖如附圖3所示,對輸入時(shí)序點(diǎn)進(jìn)行特征點(diǎn)采樣,然后計(jì)算每個(gè)特征點(diǎn)的筆畫方向角,作為特征點(diǎn)的方向特征,再將所有特征點(diǎn)的方向特征依序作為整個(gè)漢字筆畫方向特征矢量,與每一個(gè)脫機(jī)識別候選字進(jìn)行彈性匹配,按匹配相似度將所有候選字按從大到小排序,最后記錄排序后的漢字序列作為聯(lián)機(jī)識別候選字序列。
本發(fā)明的脫機(jī)與聯(lián)機(jī)的識別結(jié)果集成的流程框圖如附圖4所示,其通過分別計(jì)算每個(gè)脫機(jī)識別候選字在候選字序列中的位置分?jǐn)?shù),和每個(gè)聯(lián)機(jī)識別候選字的位置分?jǐn)?shù),然后計(jì)算聯(lián)機(jī)識別結(jié)果候選字的可信度區(qū)間,再將可信度區(qū)間內(nèi)的聯(lián)機(jī)識別候選字與脫機(jī)識別候選字按每個(gè)字的位置分?jǐn)?shù)從大到小排序,再按首選識別結(jié)果選擇器的規(guī)則選出首選結(jié)果,作為識別結(jié)果。
權(quán)利要求
1.一種手寫文字的識別方法,其特征在于通過脫機(jī)文字識別方法和聯(lián)機(jī)文字識別方法相結(jié)合對手寫文字進(jìn)行識別,所述脫機(jī)文字識別方法包括(1)、重構(gòu)手寫文字圖像;(2)、通過文字圖像提取文字筆畫的輪廓方向角特征;(3)、選取脫機(jī)識別候選字;所述聯(lián)機(jī)文字識別方法包括(A)、提取手寫文字時(shí)序點(diǎn)的聯(lián)機(jī)筆畫方向特征;(B)、選取聯(lián)機(jī)識別候選字。
2.根據(jù)權(quán)利要求1所述的手寫文字的識別方法,其特征在于所述步驟(1)重構(gòu)手寫文字圖像通過采集手寫文字時(shí)序點(diǎn)軌跡坐標(biāo),并將時(shí)序點(diǎn)軌跡線性歸一化到固定大小,再用等寬的線段依次連接所有相鄰的時(shí)序點(diǎn),從而重構(gòu)出原手寫漢字的圖像。
3.根據(jù)權(quán)利要求1或2所述的手寫文字的識別方法,其特征在于所述步驟(2)提取文字筆畫的輪廓方向角特征通過把漢字圖像在水平和垂直兩個(gè)方向上的直方圖投影畫出4x4的全局彈性網(wǎng)格,使得每一列網(wǎng)格在水平方向上的直方圖投影累積量相等,每一行網(wǎng)格在垂直方向上的直方圖投影累積量相等,再根據(jù)每個(gè)網(wǎng)格水平和垂直兩個(gè)方向上的直方圖投影在網(wǎng)格內(nèi)畫出2x2的局部彈性網(wǎng)格,提取出文字的輪廓,然后對每個(gè)彈性網(wǎng)格單元內(nèi)的輪廓在4個(gè)方向上進(jìn)行輪廓方向角特征提取,得出輪廓方向角特征。
4.根據(jù)權(quán)利要求3所輸?shù)氖謱懳淖值淖R別方法,其特征在于所述4個(gè)方向?yàn)闄M撇、撇豎、豎捺、橫捺。
5.根據(jù)權(quán)利要求4所述的手寫文字的識別方法,其特征在于對漢字圖像經(jīng)過輪廓提取后,對字符輪廓點(diǎn)P的8鄰域通過θ(p)=tan-1(DxDy)]]>計(jì)算該輪廓點(diǎn)的輪廓方向角,其中Dx、Dy是p點(diǎn)在x軸和y軸上的梯度函數(shù),且Dx、Dy定義為Dx=(p6+2p7+p8)-(p1+2p2+p3)Dy=(p3+2p5+p8)-(p1+2p4+p6)而輪廓點(diǎn)p的8鄰域?yàn)?br>
6.根據(jù)權(quán)利要求5所述的手寫文字的識別方法,其特征在于所述步驟(2)提取文字筆畫的輪廓方向角特征還包括線性判決分析(LDA)對輪廓方向角特征進(jìn)行降維,將原先的256維數(shù)降為128維數(shù)。
7.根據(jù)權(quán)利要求6所述的手寫文字的識別方法,其特征在于所述步驟(3)選取脫機(jī)識別候選字通過計(jì)算輪廓方向角特征與模板中所有文字特征的歐式距離,選出距離最小的前100個(gè)候選字作為脫機(jī)識別候選字。
8.根據(jù)權(quán)利要求7所述的手寫文字的識別方法,其特征在于所述步驟(A)提取手寫文字筆畫時(shí)序點(diǎn)的方向特征通過對手寫文字筆畫時(shí)序點(diǎn)按固定距離進(jìn)行采樣,又定義采樣后的特征點(diǎn)的筆畫方向角為前一特征點(diǎn)指向該特征點(diǎn)的方向角度,范圍為0到255,線性對應(yīng)0到359度,然后計(jì)算每個(gè)特征點(diǎn)的筆畫方向角,作為該特征點(diǎn)的聯(lián)機(jī)筆畫方向特征。
9.根據(jù)權(quán)利要求8所述的手寫文字的識別方法,其特征在于所述步驟(B)選取聯(lián)機(jī)識別候選字通過動態(tài)時(shí)間規(guī)整(DTW)的方法對聯(lián)機(jī)筆畫方向特征矢量與步驟(3)得出的脫機(jī)識別候選字的多種不同筆順的模板特征矢量進(jìn)行彈性模板匹配,計(jì)算脫機(jī)識別候選字與聯(lián)機(jī)筆畫方向特征的匹配相似度,其中,DTW彈性匹配的局部距離函數(shù)采用如下關(guān)系式計(jì)算d(i,j)=(Δθ)20≤Δθ<64-(Δθ-128)2+819264≤Δθ<128,]]>而Δθ=|θi-θj|0≤|θi-θj|<128256-|θi-θj|128≤|θi-θj|<256,]]>i和j分別為當(dāng)前匹配的兩特征值在各自特征序列中的位置,θ為輪廓方向角特征;然后再將100個(gè)脫機(jī)識別候選字按其與聯(lián)機(jī)筆畫方向特征匹配相似度由大到小排序,組成100個(gè)聯(lián)機(jī)識別方法候選字。
10.根據(jù)權(quán)利要求9所述的手寫文字的識別方法,其特征在于通過對脫機(jī)識別候選字和聯(lián)機(jī)識別候選字進(jìn)行集成完成對手寫文字的識別,具體包括如下步驟(I)、計(jì)算脫機(jī)識別候選字中每個(gè)候選字的位置分?jǐn)?shù)Si,Si=i*exp(1-i)*D+i′*exp(1-i′)*C其中i為該候選字在脫機(jī)識別候選字序列中的位置,范圍為1到100,i’為該候選字在聯(lián)機(jī)識別候選字序列中所處的位置,范圍也為1到100,C和D為兩個(gè)常數(shù);(II)、計(jì)算聯(lián)機(jī)識別候選字中每個(gè)候選字的位置分?jǐn)?shù)Tj,Tj=j(luò)*exp(1-j)*C-Pj其中j為該候選字在聯(lián)機(jī)識別候選字序列中的位置,范圍為1到100,C為常數(shù),且與步驟(I)的C相同,Pj為預(yù)先定義好的懲罰分?jǐn)?shù),根據(jù)j的不同而不同;(III)、根據(jù)聯(lián)機(jī)識別候選字的匹配相似度選擇可信度區(qū)間1到M,位置在M以后的候選字認(rèn)為是不可信的候選字;(IV)、將脫機(jī)識別候選字與聯(lián)機(jī)識別候選字序列合在一起按照每個(gè)候選字的位置分?jǐn)?shù)從大到小排序,得出集成候選字序列;(V)、選取一個(gè)候選字作為識別結(jié)果,通過定義Ai為聯(lián)機(jī)識別候選字,Bj為脫機(jī)識別候選字,i和j的范圍為1到100,分別對應(yīng)100個(gè)候選字,如果A1=B1,則選擇A1;如果A1非??尚?,而B1不太可信,則選擇A1;如果B1很可信,則選擇B1;如果Ak=B1且B1=A1,k和l的范圍為1到35,而k<l,則選B1,k>l則選A1;如果Ak=B2且B1=A2,k和l的范圍為1到15,而k<l,則選B1,k>l則選A1;如果以上各個(gè)條件均不滿足,則選擇集成候選字序列的首個(gè)候選字。
全文摘要
本發(fā)明提供一種基于脫機(jī)識別方法和聯(lián)機(jī)識別方法集成的手寫文字的識別方法,其脫機(jī)識別方法主要包括對漢字筆畫輪廓方向角特征的彈性網(wǎng)格特征提取技術(shù)以及線性判別分析(LDA)對高維特征降維;聯(lián)機(jī)識別方法主要包括對漢字筆畫方向特征進(jìn)行模糊提取以及一種可變性較強(qiáng)的筆畫模板彈性匹配方法;本發(fā)明大大提高了對連筆草書漢字的識別效果,不僅能識別規(guī)范書寫的漢字,也能夠?qū)B筆草書漢字進(jìn)行識別,故而可以讓用戶無限制地自由書寫漢字,還可以提高手寫輸入時(shí)用戶書寫漢字的速度。
文檔編號G06K9/00GK1652138SQ20051003317
公開日2005年8月10日 申請日期2005年2月8日 優(yōu)先權(quán)日2005年2月8日
發(fā)明者金連文, 龍騰 申請人:華南理工大學(xué)