專利名稱:基于統(tǒng)計結(jié)構(gòu)特征的聯(lián)機(jī)手寫漢字識別方法
技術(shù)領(lǐng)域:
基于統(tǒng)計結(jié)構(gòu)特征的聯(lián)機(jī)手寫漢字識別方法屬于聯(lián)機(jī)手寫漢字識別領(lǐng)域。
背景技術(shù):
所謂聯(lián)機(jī)手寫漢字識別,就是計算機(jī)通過一種數(shù)字化儀實時地對人的書寫筆跡進(jìn)行采樣,然后對所得數(shù)據(jù)進(jìn)行自動識別的一種技術(shù)。這種技術(shù)可以使人們以自然的書寫方式將漢字輸入計算機(jī)或智能設(shè)備,容易滿足用戶一般化和小型化的要求,并且可以與其它輸入方法如語音識別技術(shù)很好的互補(bǔ),形成高效的漢字輸入系統(tǒng)。所以,聯(lián)機(jī)手寫漢字識別方法在計算機(jī)應(yīng)用中具有很重要的理論和實際意義。
到目前為止,在眾多研究者的不懈努力下,聯(lián)機(jī)手寫漢字識別技術(shù)已經(jīng)有了比較大的進(jìn)展。通常的聯(lián)機(jī)手寫漢字識別方法有兩大類一種是基于整字模式分析的統(tǒng)計識別方法,強(qiáng)調(diào)從全局的角度描述和利用字符信息,其代表方法是用特征空間中的一組高維數(shù)值特征向量描述漢字模式,并以它們在特征空間中的分布為依據(jù)運(yùn)用決策理論做出分類判決。另一種是基于局部子結(jié)構(gòu)分析的識別方法,主要特征描述以結(jié)構(gòu)分解后的局部筆劃信息為主,代表方法有字符串模型,屬性關(guān)系圖模型,以及隱含Markov模型等。由于統(tǒng)計識別方法以整個漢字為單位進(jìn)行特征提取和匹配,充分地利用了計算機(jī)的數(shù)值處理能力,有利于在特征空間中用數(shù)學(xué)方法尋找漢字的全局相關(guān)結(jié)構(gòu)特征,而且具有速度快、性能好的優(yōu)點,所以本發(fā)明使用了統(tǒng)計方法來識別聯(lián)機(jī)手寫漢字。
統(tǒng)計識別方法成功的關(guān)鍵在于統(tǒng)計特征集合的有效性,亦即取決于不同字符的模式能在多大程度上在特征空間分開。在公開文獻(xiàn)報導(dǎo)中,聯(lián)機(jī)漢字的統(tǒng)計特征主要采用變換系數(shù)特征,該特征較適用于筆劃數(shù)較少和曲弧形筆劃的字符,如英文數(shù)字和日文假名等。漢字內(nèi)高頻分量豐富,變換系數(shù)特征的效果不佳。在脫機(jī)漢字識別方法的研究中提出了一些統(tǒng)計結(jié)構(gòu)數(shù)值特征,如方向線素特征、網(wǎng)格特征、邊框特征、筆劃密度特征、背景特征等等,取得了比較不錯的識別效果。有少數(shù)文獻(xiàn)試圖在聯(lián)機(jī)漢字識別中引入這些統(tǒng)計結(jié)構(gòu)特征,但是由于沒有考慮到聯(lián)機(jī)手寫漢字的特性,識別性能比較差。
本發(fā)明就是在必要的預(yù)處理的基礎(chǔ)上,設(shè)計和提取能夠適應(yīng)聯(lián)機(jī)手寫漢字特性的統(tǒng)計結(jié)構(gòu)特征,實現(xiàn)了高性能的聯(lián)機(jī)手寫漢字識別系統(tǒng),這是目前其它所有文獻(xiàn)中還沒有見到的。
發(fā)明內(nèi)容
本發(fā)明的目的在于實現(xiàn)一個基于統(tǒng)計結(jié)構(gòu)特征的聯(lián)機(jī)手寫漢字識別方法。本識別方法以單個的聯(lián)機(jī)手寫漢字字符作為處理對象,首先對處理的字符對象進(jìn)行必要的預(yù)處理,然后提取出能很好反映聯(lián)機(jī)手寫漢字特點的統(tǒng)計結(jié)構(gòu)特征,再將得到的這些原始特征使用線性鑒別分析LDA壓縮變換為識別特征,最后用改進(jìn)型二次分類器MQDF進(jìn)行識別。
本發(fā)明由以下幾部分組成預(yù)處理、統(tǒng)計結(jié)構(gòu)特征的提取、特征變換、分類器設(shè)計。
1.預(yù)處理預(yù)處理的目的是在識別之前盡量消除筆跡中的噪聲和書寫變形,使待識漢字有一個更好的識別基礎(chǔ)。其任務(wù)一是濾除筆跡采集設(shè)備和書寫者造成的噪聲干擾,如孤立點噪聲、鋸齒形噪聲、筆速不勻等,主要處理方法為濾波平滑和重新采樣;二是對待識漢字作整形處理以消除部分書寫變形,包括線性歸一化、非線性歸一化兩個功能,使待識漢字所占空間區(qū)域映射到一個大小固定的位置,而且整形后字符筆劃在空間分布上更加均勻。
設(shè)一個聯(lián)機(jī)手寫漢字的筆跡為P(x1,y1),P(x2,y2),…,P(xi,yi),(break),P(xi+1,yi+1),…,P(xN,yN)。
這是計算機(jī)通過數(shù)字化儀實時地對書寫時筆尖的移動軌跡進(jìn)行采樣得到的一系列從時間上依序排列的點坐標(biāo),(break)標(biāo)記代表兩個自然筆劃間抬筆和落筆的中斷。
去除孤立點噪聲是指從筆跡點序列中去除只由一兩個點組成的筆劃。濾除鋸齒形噪聲的方法是對相鄰點的坐標(biāo)值進(jìn)行加權(quán)平均,達(dá)到低通濾波的效果。濾波公式為xi′=14(xi-1+2·xi+xi+1)]]>yi′=14(yi-1+2·yi+yi+1)]]>消除筆速不勻的重新采樣方法是對于書寫的軌跡用一個固定長度間隔重新采樣,使得一定長度的筆劃用一定數(shù)量的點來代表,其公式為xj″=[xi′·(si+1-jL)+xi+1′·(jL-si)]/diyj″=[yi′·(si+1-jL)+yi+1′·(jL-si)]/di
上式中,L為固定采樣間隔,取值為常數(shù)1;(xi′,yi′)為待采樣筆劃的N個坐標(biāo)點,i滿足1≤i≤N且si≤jL<si+1;di=(xi+1′-xi′)2+(yi+1′-yi′)2]]>為兩個點之間的長度;Si=Σk=0i-1dk]]>為累計長度,并設(shè)定s0=0;(xj′′,yj′′),j=0,1,···,[sNL]]]>為重新采樣得到的新坐標(biāo)點。
整形處理需要得到各筆跡點在變換后的新坐標(biāo),在本發(fā)明中通過密度均衡法來計算。首先將聯(lián)機(jī)漢字的筆跡轉(zhuǎn)換成漢字圖像[f(x″,y″)]W×H,整形變換前的圖像寬度為W,高度為H,任何一個筆跡點P(xi″,yi″)坐標(biāo)處對應(yīng)黑象素點f(xi″,yi″)=1,其余為白象素點f(x″,y″)=0。U(x″),V(y″)分別表示象素點在水平和垂直方向上的密度投影,即U(x′′)=Σy=1Hf(x′′,y′′)+αU--x′′=1,2,...,W]]>V(y′′)=Σx=1Wf(x′′,y′′)+αV--y′′=1,2,...,H]]>其中,αU,αV為偏置常數(shù),此處設(shè)定αU=αV=6。則原坐標(biāo)為(x″,y″)的筆跡點的新坐標(biāo)為(x’″,y’″)x′′′=Σk=1x′′U(k)×W′Σk=1WU(k),]]>y′′′=Σl=1y′′V(l)×H′Σl=1HV(l)]]>其中,W′為處理后的最大橫坐標(biāo),H′為處理后的最大縱坐標(biāo),這兩個值是處理后的筆跡點坐標(biāo)范圍的期望值,需要在整形處理之前預(yù)先設(shè)定好,此處都設(shè)為64。
預(yù)處理的最后一個步驟是把每個自然筆劃內(nèi)的筆跡點都依序首尾相連,連線上與原筆跡點不重合的點插入筆跡序列,并消除相鄰筆跡點中的重合點。
2.統(tǒng)計結(jié)構(gòu)特征的提取統(tǒng)計結(jié)構(gòu)特征的提取是在預(yù)處理之后的聯(lián)機(jī)手寫漢字筆跡上進(jìn)行的。本發(fā)明通過仔細(xì)研究聯(lián)機(jī)手寫漢字的結(jié)構(gòu)特性,設(shè)計和提取了兩種統(tǒng)計結(jié)構(gòu)特征,分別稱為方向特征和邊緣特征。
2.1方向特征的提取方向特征的提取結(jié)果也分為兩種,稱為相鄰點方向特征和相鄰拐點方向特征。
2.1.1相鄰點方向特征首先計算每個筆跡點的方向在筆跡點坐標(biāo)序列中,任取一點Pi,除最后一點外,都有至少一個后繼點Pj(j>i),我們把從Pi指向Pj的有向線段的方向設(shè)定為Pi點的方向值θi,其值域范圍為
]>故θi=arctg(Yj-YiXj-Xi)]]>然后計算每個筆跡點的方向?qū)傩韵禂?shù)。所謂筆跡點的方向?qū)傩韵禂?shù),是指以該點的方向值為自變量,利用圖4所示的梯形和半梯形函數(shù),計算得到的該點的4種函數(shù)值橫方向?qū)傩韵禂?shù)函數(shù) 豎方向?qū)傩韵禂?shù)函數(shù) 撇方向?qū)傩韵禂?shù)函數(shù) 捺方向?qū)傩韵禂?shù)函數(shù) 上面六個參數(shù)α1~α6是角度閾值,它們的作用是確定方向?qū)傩韵禂?shù)函數(shù)的形狀,在本發(fā)明中分別設(shè)為α1=-10°,α2=260°,α3=280°,α4=250°,α5=300°,α6=330°。
得到方向?qū)傩韵禂?shù)之后,把筆跡點圖像的坐標(biāo)空間均勻劃分成K1×K1個子塊,如圖5所示。分別統(tǒng)計每個子塊中所有筆跡點的各自4種方向?qū)傩韵禂?shù)之和,共得到K1×K1×4維特征。以第(k,l)(這里1≤k≤K1,1≤l≤K1)個子塊為例,統(tǒng)計得到的4維特征分別為Fk,l(h)=ΣP(x,y)∈D(k,l)f(h)(θ),]]>θ為點P(x,y)的方向值;Fk,l(s)=ΣP(x,y)∈D(k,l)f(s)(θ),]]>θ為點P(x,y)的方向值;Fk,l(p)=ΣP(x,y)∈D(k,l)f(p)(θ),]]>θ為點P(x,y)的方向值;Fk,l(n)=ΣP(x,y)∈D(k,l)f(n)(θ),]]>θ為點P(x,y)的方向值;2.1.2相鄰拐點方向特征當(dāng)筆跡顫動時,相鄰點方向的計算會產(chǎn)生較大的偏差,所以我們還設(shè)計了相鄰拐點方向,即把Pi和Pj設(shè)定為筆跡點中相鄰的拐點,重新計算每個筆跡點的方向。所謂拐點是指筆劃書寫的方向前后變化劇烈的點,同時把筆劃端點也設(shè)定為一種拐點。拐點的確定根據(jù)多邊形逼近的基本方法先計算筆劃中每個點與相鄰點間張角的余弦值。拐點的判定是當(dāng)張角γ的余弦值出現(xiàn)最大值并大于設(shè)定閾值,設(shè)為-0.8,此時γ約為2.5弧度。
張角γ的余弦值可利用三角余弦定理計算。設(shè)a,b,c分別為當(dāng)前筆跡點與前后相鄰筆跡點構(gòu)成的三角形的三邊。張角γ為邊a,b的夾角,c為張角γ的對邊,先根據(jù)三角形頂點的坐標(biāo)分別計算三邊的長度,由余弦定理可求得cosγ=c2-a2-b22ab.]]>如圖6所示。
點Pi和Pj,j>i為筆跡點中相鄰的拐點,所有包括Pi點在內(nèi)的在這兩點之間的筆跡點的方向都設(shè)定為從點Pi指向點Pj的有向線段方向。
重新計算每個筆跡點相鄰拐點的方向?qū)傩韵禂?shù)并統(tǒng)計每個空間劃分子塊中的4種方向?qū)傩韵禂?shù)之和,得到另外K1×K1×4維特征。
方向特征是這兩種特征的合并,共有K1×K1×8維特征。
2.2邊緣特征的提取邊緣特征與方向特征不同之處在于邊緣特征能較好地反映出漢字的外圍結(jié)構(gòu)信息。
以從左到右方向為例,提取邊緣特征的方法為把預(yù)處理后的聯(lián)機(jī)漢字筆跡所對應(yīng)圖像的左半部分空間等距分為K2個橫向子區(qū)域,如圖7(a)所示。在每一個子區(qū)域內(nèi),從箭頭方向,即圖像左邊緣往右進(jìn)行逐行掃描。若第i次行掃描時,首次掃描到某個坐標(biāo)點為筆跡點時,計算這個筆跡點的4個相鄰點方向?qū)傩韵禂?shù),記做fi,1(h)、fi,1(s)、fi,1(p)、fi,1(n),如果一直沒有掃描到筆跡點,則這4個系數(shù)為0;繼續(xù)掃描,當(dāng)再次掃描到另外某個坐標(biāo)點為筆跡點時,計算這個筆跡點的相鄰點方向?qū)傩韵禂?shù),記做fi,2(h)、fi,2(s)、fi,2(p)、fi,2(n),同樣的,如果一直沒有再次掃描到筆跡點,則這4個系數(shù)為0。一直到i次行掃描完畢,分別累計各行得到的以上系數(shù),得到8維特征Σifi,1(h),Σifi,1(s),Σifi,1(p),Σifi,1(n),Σifi,2(h),Σifi,2(s),Σifi,2(p),Σifi,2(n).]]>K2個子區(qū)域共得到K2×8維邊緣特征。
從其余7個箭頭方向,即右、上、下另三個邊緣及對角線方向重復(fù)以上方法,如圖7(b)所示,箭頭方向為空間等分和掃描方向,共得到K2×8×8維的邊緣特征。
方向特征和邊緣特征合并后得到完整的一個聯(lián)機(jī)手寫漢字的統(tǒng)計結(jié)構(gòu)特征V。
3.特征變換前面提取得到的原始特征維數(shù)比較高,在樣本數(shù)不是很充分的情況下,會造成計算復(fù)雜度增加并降低分類器性能。所以,在原始特征送到分類器之前,還需要對之進(jìn)行特征變換,把高維原始特征變換壓縮到低維特征空間。本發(fā)明采用線性鑒別分析技術(shù)LDA進(jìn)行特征變換。設(shè){{Vi(j),1≤i≤Nj},1≤j≤C}為原始特征向量集合,式中Vi(j)表示屬于第j個類別的第i個樣本提取的原始特征向量,Nj表示第j個類別的樣本個數(shù),C表示類別數(shù)目。每個類別代表國家標(biāo)準(zhǔn)漢字集合中的一個漢字。用下式計算每個類別的均值以及所有類別的均值μj=1NjΣi=1NjVi(j),]]>μ=1CΣj=1Cμj]]>然后計算類內(nèi)散度矩陣Sw和類間散度矩陣SbSw=1CΣj=1C(1NjΣi=1Nj(Vi(j)-μj)(Vi(j)-μj)T)]]>Sb=1CΣj=1C(μj-μ)(μj-μ)T]]>我們選取|(Sb+Sw)/Sw|作為優(yōu)化準(zhǔn)則,即求取線性變換矩陣A,使得|AT(Sb+Sw)AATSwA|]]>最大。變換矩陣A為n×m維矩陣,n為原始特征維數(shù),設(shè)定變換后的特征維數(shù)為m。變換矩陣的求取方法如下我們對矩陣Sw-1(Sb+Sw)進(jìn)行特征值和特征向量分解,得到特征值{γi,i=1,2,...,n},特征值按值的大小降序排列,以及特征向量ξi,i=1,2,...,n。用前m個特征向量組成矩陣A=[ξ1,ξ2,...,ξm],則A就是符合前面要求的線性變換矩陣。
特征選擇的公式如下Y=AT·V上式中,V為原始結(jié)構(gòu)特征向量,Y是經(jīng)過變換后的特征向量。
4.分類器設(shè)計本發(fā)明使用了針對高斯模型的改進(jìn)型二次分類器MQDF。這里先介紹標(biāo)準(zhǔn)二次分類器QDF。QDF的判決函數(shù)為gj(Y)=Σi=1m((Y-μj)Tζi(j))2λi(j)+Σi=1mlogλi(j)]]>上式中,Y是輸入的特征向量,m為特征維數(shù),μj代表第j個類別的均值向量,ζi(j)是第j個類別的協(xié)方差陣的第i個特征向量,λi(j)是第j個類別的協(xié)方差陣的第i個特征值。對輸入Y進(jìn)行識別時,用如下準(zhǔn)則進(jìn)行分類把Y歸為第i個類別,如果gi(Y)=min1≤j≤Cgj(Y),]]>式中C為類別數(shù)目在實際應(yīng)用中,由于對小特征值的估計不準(zhǔn)確,造成QDF的性能下降。為降低小特征值估計不準(zhǔn)對分類性能的不利影響,我們使用改進(jìn)的二次分類器MQDF。MQDF對過小的特征值用事先確定的常數(shù)代替,其判別函數(shù)如下gj(Y)=Σi=1k((Y-μj)Tζi(j))2λi(j)+Σi=k+1m((Y-μj)Tζi(j))2λ+Σi=1klogλi(j)+Σi=k+1mlogλ--j=1.2······,C]]>上式中,k為小于m的正整數(shù),λ是常數(shù)。k和λ為經(jīng)驗參數(shù),由實驗確定。在分類時,輸入Y被劃分為使gj(Y)取最小值的類別。
本發(fā)明的特征在于,它是一種基于統(tǒng)計結(jié)構(gòu)特征的聯(lián)機(jī)手寫漢字識別方法。它依次含有以下步驟(1)對輸入的聯(lián)機(jī)手寫漢字筆跡進(jìn)行預(yù)處理。
假設(shè)一個聯(lián)機(jī)手寫漢字的筆跡為P(x1,y1),P(x2,y2),…,P(xi,yi),(break),P(xi+1,yi+1),…,P(xN,yN)。依次進(jìn)行如下預(yù)處理。
(1.1)去除孤立點噪聲。
從筆跡點序列中去除只由一兩個點組成的筆劃。
(1.2)濾除鋸齒形噪聲。
用下式對相鄰點的坐標(biāo)值進(jìn)行加權(quán)平均,達(dá)到低通濾波的效果xi′=14(xi-1+2·xi+xi+1)]]>yi′=14(yi-1+2·yi+yi+1)]]>(1.3)消除筆速不勻的重新采樣。
對于書寫的軌跡用一個固定長度間隔采用下式重新采樣,使得一定長度的筆劃用一定數(shù)量的點來代表xj″=[xi′·(si+1-jL)+xi+1′·(jL-si)]/diyj″=[yi′·(si+1-jL)+yi+1′·(jL-si)]/di上式中,L為固定采樣間隔,取值為常數(shù)1;(xi′,yi′)為待采樣筆劃的N個坐標(biāo)點,i滿足1≤i≤N且si≤jL<si+1;di=(xi+1′-xi′)2+(yi+1′-yi′)2]]>為兩個點之間的長度;si=Σk=0i-1dk]]>為累計長度,并設(shè)定s0=0;(xj′′,yj′′),j=0,1,···,[sNL]]]>為重新采樣得到的新坐標(biāo)點。
(1.4)用密度均衡法整形處理。
首先將聯(lián)機(jī)漢字的筆跡轉(zhuǎn)換成漢字圖像[f(x″,y″)]W×H,圖像寬度為W,高度為H,任何一個筆跡點P(xi″,yi″)坐標(biāo)處對應(yīng)黑象素點f(xi″,yi″)=1,其余為白象素點f(x″,y″)=0。計算圖像在水平和垂直方向上的密度投影U(x″),V(y″)U(x′′)=Σy=1Hf(x′′,y′′)+αU--x′′=1,2,...,W]]>V(y′′)=Σx=1Wf(x′′,y′′)+αV--y′′=1,2,...,H]]>其中,αU,αV為偏置常數(shù),此處設(shè)定αU=αV=6。則原坐標(biāo)為(x″,y″)的筆跡點的新坐標(biāo)為(x’″,y’″)x′′′=Σk=1x′′U(k)×W′Σk=1WU(k),]]>y′′′=Σl=1y′′V(l)×H′Σl=1HV(l)]]>其中,整形處理后的最大橫坐標(biāo)為W’,最大縱坐標(biāo)為H’。
(1.5)插值和刪除重合點。
把每個自然筆劃內(nèi)的筆跡點都依序首尾相連,連線上與原筆跡點不重合的點插入筆跡序列,并消除相鄰筆跡點中的重合點。
(2)提取統(tǒng)計結(jié)構(gòu)特征在預(yù)處理之后的聯(lián)機(jī)手寫漢字筆跡上提取方向特征和邊緣特征,合并為原始的統(tǒng)計結(jié)構(gòu)特征。其提取方法分別如下(2.1)提取方向特征方向特征是相鄰點方向特征和相鄰拐點方向特征的合并。這兩種特征的提取步驟如下(2.1.1)提取相鄰點方向特征(a)首先計算除最后一點外的所有筆跡點的相鄰點方向從Pi指向Pi+1的有向線段的方向θi,其值域范圍為
]>θ為點P(x,y)的方向值;Fk,l(s)=ΣP(x,y)∈D(k,l)f(s)(θ),]]>θ為點P(x,y)的方向值;Fk,l(p)=ΣP(x,y)∈D(k,l)f(p)(θ),]]>θ為點P(x,y)的方向值;Fk,l(n)=ΣP(x,y)∈D(k,l)f(n)(θ),]]>θ為點P(x,y)的方向值;一共得到K1×K1×4維特征相鄰點方向特征。
(2.1.2)提取相鄰拐點方向特征用多邊形逼近的方法確定筆跡中的拐點,拐點即筆劃書寫的方向前后變化劇烈的點,包括筆劃拐點在內(nèi),先計算筆劃中每個點與相鄰點間張角的余弦值;張角γ的余弦值可利用三角余弦定理計算,設(shè)a,b,c分別為當(dāng)前筆跡點與前后相鄰筆跡點構(gòu)成的三角形的三邊,張角γ為邊a,b的夾角,c為張角γ的對邊,先根據(jù)三角形頂點的坐標(biāo)分別計算三邊的長度,由余弦定理可求得cosγ=c2-a2-b22ab;]]>拐點的判定是當(dāng)張角γ的余弦值出現(xiàn)最大值并大于設(shè)定閾值,設(shè)為-0.8,此時γ約為2.5弧度;把筆劃端點也設(shè)定為一種拐點。
計算每個筆跡點的相鄰拐點方向設(shè)點Pi和Pj,j>i為筆跡點中相鄰的拐點,所有包括Pi點在內(nèi)的在這兩點之間的筆跡點的方向都設(shè)定為從點Pi指向點Pj的有向線段方向。
重復(fù)(2.1.1)中的(b)(c)兩步,得到K1×K1×4維的相鄰拐點方向特征。
(2.2)提取邊緣特征首先提取左→右方向掃描的邊緣特征把預(yù)處理后的聯(lián)機(jī)漢字筆跡所對應(yīng)圖像的左半部分空間等距分為K2個橫向子區(qū)域,如圖7(a)所示;從箭頭方向(即圖像左邊緣往右)進(jìn)行逐行掃描。若第i次行掃描時,第一次掃描到某個坐標(biāo)點為筆跡點時,計算這個筆跡點的4個相鄰點方向?qū)傩韵禂?shù),記做fi,1(h)、fi,1(s)、fi,1(p)、fi,1(n),如果一直沒有掃描到筆跡點,則這4個系數(shù)為0;繼續(xù)掃描,當(dāng)?shù)诙螔呙璧侥硞€坐標(biāo)點為筆跡點時,計算這個筆跡點的相鄰點方向?qū)傩韵禂?shù),記做fi,2(h)、fi,2(s)、fi,2(p)、fi,2(n),同樣的,如果一直沒有第二次掃描到筆跡點,則這4個系數(shù)為0。行掃描完畢,分別累計各行得到的以上系數(shù),得到8維特征Σifi,1(h),Σifi,1(s),Σifi,1(p),Σifi,1(n),Σifi,2(h),]]>Σifi,2(s),Σifi,2(p),Σifi,2(n).]]>K2個子區(qū)域共得到K2×8維邊緣特征。
然后接著從右、上、下另三個邊緣及四個斜線掃描方向,如圖7(b),重復(fù)以上步驟,共得到K2×8×8維的邊緣特征。
(3)特征變換用線性鑒別分析LDA從原始的統(tǒng)計結(jié)構(gòu)特征中提取識別特征,以改善特征分布,提高識別性能,它依次含有以下步驟
(3.1)用下式計算每個類別的均值μj以及所有類別的均值μμj=1NjΣi=1NjVi(j),]]>μ=1CΣj=1Cμj]]>其中,Vi(j)為屬于第j個類別的第i個樣本提取的原始特征向量,Nj表示第j個類別的樣本個數(shù),C表示類別數(shù)目。
(3.2)用下式計算類內(nèi)散度矩陣Sw和類間散度矩陣SbSw=1CΣj=1C(1NjΣi=1Nj(Vi(j)-μj)(Vi(j)-μj)T)]]>Sb=1CΣj=1C(μj-μ)(μj-μ)T]]>(3.3)對矩陣Sw-1(Sb+Sw)進(jìn)行特征值和特征向量分解,得到按特征值的大小降序排列的特征值γi,i=1,2,...,n和特征向量ξi,i=1,2,...,n。
(3.4)用前m個特征向量組成線性變換矩陣A=[ξ1,ξ2,...,ξm]。
(3.5)用原始特征V和變換矩陣A計算變換后的特征向量YY=AT·V(4)用MQDF分類器進(jìn)行聯(lián)機(jī)手寫漢字識別。
用MQDF分類器進(jìn)行識別包括兩個部分首先要根據(jù)前面得到的識別特征通過事先采集好的樣本訓(xùn)練生成識別庫文件;然后才能利用識別庫對實際輸入待識樣本進(jìn)行識別。
(4.1)訓(xùn)練過程(4.1.1)首先對每個類別j,根據(jù)前面得到的m維識別特征,用下式統(tǒng)計其均值μj和協(xié)方差陣∑jμj=1NjΣi=1NjYi(j),]]>Σj=1NjΣi=1Nj(Yi(j)-μj)·(Yi(j)-μj)T]]>其中,Yi(j)為屬于第j個類別的第i個樣本提取的識別特征向量,Nj表示第j個類別的樣本個數(shù)。
(4.1.2)對每個類別的協(xié)方差陣∑j進(jìn)行特征值和特征向量分解,得到按值的大小降序排列的特征值λi(j),i=1,2,...,m和特征向量ζi(j),i=1,2,...,m
(4.1.3)計算小特征值的替代值λ=1CΣj=1Cλk+1(j)]]>其中,k為小于m的正整數(shù),由實驗確定。
(4.1.4)把前面得到的λi(j),j=1,2,...,C,i=1,2,...,k、ζi(j),j=1,2,...,C,i=1,2,...,m、μj,j=1,2,...,C和λ存儲到識別庫文件中,供后續(xù)的識別使用。
(4.2)識別過程(4.2.1)由待識樣本得到識別特征Y,用下式計算每個類別的判決函數(shù)gj(Y)gj(Y)=Σi=1k((Y-μj)Tζi(j))2λi(j)+Σi=k+1m((Y-μj)Tζi(j))2λ+Σi=1klogλi(j)+Σi=k+1mlogλ]]>其中,m、k的取值同訓(xùn)練過程。
(4.2.2)輸入的待識樣本被劃分為使gj(Y)取最小值的類別。
實驗證明,本發(fā)明的平均識別率為98.43%,達(dá)到令人滿意的效果。
圖1聯(lián)機(jī)手寫漢字識別系統(tǒng)的構(gòu)成。
圖2預(yù)處理流程圖3筆跡點方向的計算方法。
圖4方向?qū)傩韵禂?shù)的計算方法。
圖5筆跡點坐標(biāo)空間的子塊劃分方法。
圖6計算拐點的方法。
圖7邊緣特征的提取方法。
圖8 LDA特征變換方法流程。
具體實施例方式
實現(xiàn)基于統(tǒng)計結(jié)構(gòu)特征的聯(lián)機(jī)手寫漢字識別系統(tǒng)時,首先要通過訓(xùn)練得到識別庫,然后就可以根據(jù)識別庫對聯(lián)機(jī)手寫漢字字符進(jìn)行識別。因而,實用的基于統(tǒng)計結(jié)構(gòu)特征的聯(lián)機(jī)手寫漢字識別系統(tǒng)的實現(xiàn)需要考慮訓(xùn)練過程的實現(xiàn)和識別過程的實現(xiàn)兩個方面,其系統(tǒng)構(gòu)成如圖1所示。這兩個過程中有部分處理內(nèi)容是相同的。
下面詳細(xì)介紹系統(tǒng)的各個部分A.訓(xùn)練過程的實現(xiàn)A.1預(yù)處理預(yù)處理流程如圖2所示。假設(shè)一個聯(lián)機(jī)手寫漢字的筆跡為P(x1,y1),P(x2,y2),…,P(xi,yi),(break),P(xi+1,yi+1),…,P(xN,yN)。
首先要去除孤立點噪聲,從筆跡點序列中去除只由一兩個點組成的筆劃。
然后對相鄰點的坐標(biāo)值進(jìn)行加權(quán)平均,濾除鋸齒形噪聲,濾波公式為xi′=14(xi-1+2·xi+xi+1)]]>yi′=14(yi-1+2·yi+yi+1)]]>重新采樣的目的是消除筆速不勻。其方法是對書寫的軌跡用一個固定長度間隔重新采樣,使得一定長度的筆劃用一定數(shù)量的點來代表,采樣公式為xj″=[xi′·(si+1-jL)+xi+1′·(jL-si)]/diyj″=[yi′·(si+1-jL)+yi+1′·(jL-si)]/di上式中,L為固定采樣間隔,取值為常數(shù)1;(xi′,yi′)為待采樣筆劃的N個坐標(biāo)點,i滿足1≤i≤N且si≤jL<si+1;di=(xi+1′-xi′)2+(yi+1′-yi′)2]]>為兩個點之間的長度;si=Σk=0i-1dk]]>為累計長度,并設(shè)定s0=0;(xj′′,yj′′),j=0,1,···,[sNL]]]>為重新采樣得到的新坐標(biāo)點。
整形處理的任務(wù)是消除待識漢字的部分書寫變形,包括線性歸一化、非線性歸一化兩個功能,使待識漢字所占空間區(qū)域映射到一個大小固定的位置,而且字符筆劃在空間分布上更加均勻。整形處理后各筆跡點變換到新坐標(biāo),變換公式通過密度均衡法來計算首先將聯(lián)機(jī)漢字的筆跡轉(zhuǎn)換成漢字圖像[f(x″,y″)]W×H,圖像寬度為W,高度為H,任何一個筆跡點P(xi″,yi″)坐標(biāo)處對應(yīng)黑象素點f(xi″,yi″)=1,其余為白象素點f(x″,y″)=0。H(x″),V(y″)分別表示象素點在水平和垂直方向上的密度投影,即U(x′′)=Σy=1Hf(x′′,y′′)+αU--x′′=1,2,...,W]]>
V(y′′)=Σx=1Wf(x′′,y′′)+αV--y′′=1,2,...,H]]>其中,αU,αV為偏置常數(shù),本發(fā)明中設(shè)定αU=αV=6。則原坐標(biāo)為(x″,y″)的筆跡點的新坐標(biāo)為(x’″,y’″)x′′′=Σk=1x′′U(k)×W′Σk=1WU(k),]]>y′′′=Σl=1y′′V(l)×H′Σl=1HV(l)]]>其中,W′為處理后的最大橫坐標(biāo),H′為處理后的最大縱坐標(biāo)。本發(fā)明中設(shè)定W′=H′=64。
A.2統(tǒng)計結(jié)構(gòu)特征的提取這一步是在預(yù)處理之后的聯(lián)機(jī)手寫漢字筆跡的基礎(chǔ)上提取出適合聯(lián)機(jī)手寫漢字的結(jié)構(gòu)特性的特征。本發(fā)明中設(shè)計和提取了兩種統(tǒng)計結(jié)構(gòu)特征,分別稱為方向特征和邊緣特征。
A.2.1方向特征的提取方向特征是由相鄰點方向特征和相鄰拐點方向特征這兩種特征合并而成。
相鄰點方向特征的提取方法如下1)首先計算除最后一點外的所有筆跡點的相鄰點方向從當(dāng)前點Pi指向下一點Pi+1的有向線段的方向θi,其值域范圍為
]>θ為點P(x,y)的方向值Fk,l(s)=ΣP(x,y)∈D(k,l)f(s)(θ),]]>θ為點P(x,y)的方向值Fk,l(p)=ΣP(x,y)∈D(k,l)f(p)(θ),]]>θ為點P(x,y)的方向值Fk,l(n)=ΣP(x,y)∈D(k,l)f(n)(θ),]]>θ為點P(x,y)的方向值在本發(fā)明中,K1=8,所以相鄰點方向特征共有8×8×4=256維。
相鄰拐點方向特征的提取方法如下用多邊形逼近的方法確定筆跡中的拐點,拐點即筆劃書寫的方向前后變化劇烈的點,包括筆劃拐點在內(nèi),先計算筆劃中每個點與相鄰點間張角的余弦值;張角γ的余弦值可利用三角余弦定理計算,設(shè)a,b,c分別為當(dāng)前筆跡點與前后相鄰筆跡點構(gòu)成的三角形的三邊,張角γ為邊a,b的夾角,c為張角γ的對邊,先根據(jù)三角形頂點的坐標(biāo)分別計算三邊的長度,由余弦定理可求得cosγ=c2-a2-b22ab;]]>拐點的判定是當(dāng)張角γ的余弦值出現(xiàn)最大值并大于設(shè)定閾值,設(shè)為-0.8,此時γ約為2.5弧度;把筆劃端點也設(shè)定為一種拐點。
計算每個筆跡點的相鄰拐點方向設(shè)點Pi和Pj,j>i為筆跡點中相鄰的拐點,所有包括Pi點在內(nèi)的在這兩點之間的筆跡點的方向都設(shè)定為從點Pi指向點Pj的有向線段方向。
重復(fù)上面的相鄰點方向特征提取方法中的(2)(3)兩步,得到256維的相鄰拐點方向特征。
相鄰點方向特征和相鄰拐點方向特征合并成512維的方向特征。
A.2.2邊緣特征的提取邊緣特征與方向特征不同之處在于邊緣特征能較好地反映出漢字的外圍結(jié)構(gòu)信息。提取邊緣特征的方法如下首先提取從左到右掃描方向的邊緣特征把預(yù)處理后的聯(lián)機(jī)漢字筆跡所對應(yīng)圖像空間的左半部分等距分為K2個橫向子區(qū)域,如圖7(a)所示。在每一個子區(qū)域內(nèi),從箭頭方向,即圖像左邊緣往右,進(jìn)行逐行掃描。若第i次行掃描時,第一次掃描到某個坐標(biāo)點為筆跡點時,計算這個筆跡點的4個相鄰點方向?qū)傩韵禂?shù),記做fi,1(h)、fi,1(s)、fi,1(p)、fi,1(n),如果一直沒有掃描到筆跡點,則這4個系數(shù)為0;繼續(xù)掃描,當(dāng)?shù)诙螔呙璧侥硞€坐標(biāo)點為筆跡點時,累計遇到的這個筆跡點的相鄰點方向?qū)傩韵禂?shù),記做fi,2(h)、fi,2(s)、fi,2(p)、fi,2(n),同樣的,如果一直沒有第二次掃描到筆跡點,則這4個系數(shù)為0。行掃描完畢,分別累計各行得到的以上系數(shù),得到8維特征Σifi,1(h),Σifi,1(s),Σifi,1(p),Σifi,1(n),Σifi,2(h),Σifi,2(s),Σifi,2(p),Σifi,2(n).]]>K2個子區(qū)域共得到K2×8維邊緣特征。
然后從右、上、下另三個邊緣及4個斜線掃描方向重復(fù)以上方法,共得到K2×8×8維的邊緣特征。
在本發(fā)明中,K2=8,邊緣特征共有512維。
方向特征和邊緣特征合并后得到完整的1024維聯(lián)機(jī)手寫漢字統(tǒng)計結(jié)構(gòu)特征。
A.3特征變換特征變換的流程如圖8所示,采用了線性鑒別分析技術(shù)LDA方法,通過求取變換矩陣A,對原始特征進(jìn)行變換壓縮,得到最終的識別特征。
特征變換的具體步驟如下1)首先計算每個類別的均值以及所有類別的均值μj=1NjΣi=1NjVi(j),]]>μ=1CΣj=1Cμj]]>2)然后計算類內(nèi)散度矩陣Sw和類間散度矩陣SbSw=1CΣj=1C(1NjΣi=1Nj(Vi(j)-μj)(Vi(j)-μj)T)]]>Sb=1CΣj=1C(μj-μ)(μj-μ)T]]>3)對矩陣Sw-1(Sb+Sw)進(jìn)行特征值和特征向量分解,得到特征值{γi,i=1,2,...,n},特征值按值的大小降序排列,以及特征向量ξi,i=1,2,...,n。用前m個特征向量組成矩陣A=[ξ1,ξ2,...,ξ256],則A就是要求取的線性變換矩陣。在本發(fā)明中,m取128。
這個變換矩陣A需要存儲到文件中,供識別過程的特征變換使用。
4)得到變換矩陣A后,即可求取最終的特征,變換公式為Y=AT·V。
A.4訓(xùn)練MQDF分類器根據(jù)得到的m維識別特征Y,對每個類別用下式統(tǒng)計其均值和協(xié)方差陣μj=1NjΣi=1NjYi(j),]]>Σj=1NjΣi=1Nj(Yi(j)-μj)·(Yi(j)-μj)T]]>其中,Yi(j)表示第j個類別的第i個訓(xùn)練樣本提取的特征向量,Nj是第j個類別的訓(xùn)練樣本數(shù)目,μj表示第j個類別的均值,∑j表示第j個類別的協(xié)方差矩陣。
對每個類別的協(xié)方差陣進(jìn)行特征值和特征向量分解,得到特征值λi(j),i=1,2,...,m,特征值按值的大小降序排列和特征向量ζi(j),i=1,2,...,m,λi(j)是∑j的第i個特征值,ζi(j)是∑j的第i個特征向量。
我們用下式計算MQDF分類器中的參數(shù)λ,即小特征值的替代值λ=1CΣj=1Cλk+1(j)]]>上式中,k為小于m的正整數(shù),在本發(fā)明中,k取32,C表示類別數(shù)目。
把以上參數(shù)λi(j),j=1,2,...,C,i=1,2,...,k、ζi(j),j=1,2,...,C,i=1,2,...,m、μj,j=1,2,...,C、λ存儲到識別庫文件中,供識別過程使用。這樣就完成了MQDF分類器的訓(xùn)練過程。
B.識別過程的實現(xiàn)識別過程如圖1所示。同訓(xùn)練過程一樣,識別過程也需要首先進(jìn)行預(yù)處理,然后提取得到原始的統(tǒng)計結(jié)構(gòu)特征V。
在進(jìn)行LDA特征變換時,識別過程直接采用訓(xùn)練過程提供的變換矩陣A,得到識別特征向量Y=AT·V。
用MQDF分類器進(jìn)行識別時,所有相關(guān)的分類器參數(shù)從訓(xùn)練過程提供的識別庫文件中讀取。MQDF分類器的判決函數(shù)為gi(Y)=Σi=1k((Y-μj)Tζi(j))2λi(j)+Σi=k+1m((Y-μj)Tζi(j))2λ+Σi=1klogλi(j)+Σi=k+1mlogλ--j=1.2·······,C]]>識別時用上式計算每個類別的gj(Y),分類規(guī)則如下
把Y歸為第i個類別,如果gi(Y)=min1≤j≤Cgi(Y),]]>式中C為類別數(shù)目為驗證本發(fā)明的有效性,我們進(jìn)行了如下實驗訓(xùn)練樣本集使用1000套國標(biāo)二級漢字字集樣本和400套GBK字集樣本,另外60套國標(biāo)二級漢字字集樣本和30套GBK字集樣本作為測試樣本,在GBK字集識別范圍內(nèi)進(jìn)行測試。以上樣本均為自由書寫的聯(lián)機(jī)手寫漢字。在聯(lián)機(jī)手寫漢字識別系統(tǒng)的訓(xùn)練和識別過程中,具體參數(shù)值見上文具體實施方式
中的設(shè)置。
實驗結(jié)果如下
從表中數(shù)據(jù)可看出,基于統(tǒng)計結(jié)構(gòu)特征的聯(lián)機(jī)手寫漢字識別方法在兩種不同識別范圍下均達(dá)到很高的識別性能,識別速度在主頻為PentiumIV-1.7GHz的計算機(jī)上達(dá)到35.27字/秒,完全能夠滿足實用需要。
綜上所述,本發(fā)明提出的基于統(tǒng)計結(jié)構(gòu)特征的聯(lián)機(jī)手寫漢字識別方法及識別系統(tǒng),能夠識別自由書寫的聯(lián)機(jī)手寫漢字,并且經(jīng)實驗證明達(dá)到極高的識別正確率和可靠性,具有非常廣泛的應(yīng)用前景。
權(quán)利要求
1.基于統(tǒng)計結(jié)構(gòu)特征的聯(lián)機(jī)手寫漢字識別方法,其特征在于,它是在主頻為PentiumIV-1.7GHz的計算機(jī)上依次按以下步驟實現(xiàn)的,整個實現(xiàn)過程由訓(xùn)練階段和識別階段分別構(gòu)成訓(xùn)練階段步驟1.預(yù)處理,它依次含有以下步驟步驟1.1上述計算機(jī)通過一種數(shù)字化圖像采集設(shè)備實時地對人的書寫筆跡進(jìn)行采樣,得到的一個聯(lián)機(jī)手寫漢字的筆跡為P(x1,y1),P(x2,y2),...,P(xi,yi),(break),P(xi+1,yi+1),...,P(xN,yN);其中,(break)標(biāo)記代表兩個自然筆劃間抬筆和落筆的中斷;所述筆跡是在聯(lián)機(jī)手寫一個漢字時對筆尖的移動軌跡進(jìn)行采樣得到的一系列從時間上依次排列的點坐標(biāo),所述點坐標(biāo)共有N個;步驟1.2上述計算機(jī)去除孤立點噪聲,即從上述筆跡點序列中去除只由一兩個點組成的筆劃;步驟1.3濾除鋸齒形噪聲,即上述計算機(jī)對上述筆跡中每一個坐標(biāo)點的相鄰點的坐標(biāo)值進(jìn)行加權(quán)平均,以通過低通濾波來形成新的坐標(biāo)點Xi′,Yi′xi′=14(xi-1+2·xi+xi+1)]]>yi′=14(yi-1+2·yi+yi+1)]]>步驟1.3上述計算機(jī)通過重新采樣的方法來消除筆速不均勻,即用一個固定長度的采樣間隔來重新采樣,使得一定長度的筆劃用一定數(shù)量的坐標(biāo)點Xj″,Yj″來代表xj″=[xi′·(si+1-jL)+xi+1′·(jL-si)]/diyj″=[yi′·(si+1-jL)+yi+1′·(jL-si)]/di其中,L為固定坐標(biāo)間隔,取值為常數(shù)1,(xi′,yi′)為待采樣筆劃的N個坐標(biāo)點,i滿足1≤i≤N且si≤jL<si+1si為累計長度,si=Σk=0i-1dk,]]>s0=0,di=(xi+1′-xi′)2+(yi+1′-yi′)2]]>di為兩點之間的長度;(Xj″,Yj″)為重新采樣得到的新坐標(biāo)點.j=0,1,···,[sNL];]]>步驟1.4用密度均衡法進(jìn)行整形處理步驟1.4.1把聯(lián)機(jī)漢字的筆跡轉(zhuǎn)換成漢字圖像,該圖像表示為[f(x″,y″)]W×H,其中W為整形變換前的圖像寬度,H為其高度,任何一個筆跡點P(xi″,yi″)坐標(biāo)處對應(yīng)黑象素點,取f(xi″,yi″)=1,其余為白象素點f(x″,y″)=0;步驟1.4.2計算圖像在水平和垂直方向上的密度投影,分別用U(x″),V(y″)表示U(x′′)=Σy=1Hf(x′′,y′′)+αU,x′′=1,2,...,W]]>V(y′′)=Σx=1Wf(x′′,y′′)+αV,y′′=1,2,...,H]]>其中,αU,αV為偏置常數(shù),此處設(shè)定αU=αV=6;步驟1.4.3計算原坐標(biāo)為(x″,y″)的筆跡點的新坐標(biāo)(x,y)x′′′=Σk=1x′′U(k)×W′Σk=1WU(k);]]>W’為整形后最大橫坐標(biāo);y′′′=Σl=1y′′V(l)×H′Σl=1HV(l);]]>H’為整形后最大縱坐標(biāo);W’、H’是處理后的筆跡點坐標(biāo)范圍的期望值,在處理之前預(yù)先設(shè)定,設(shè)W’=H’=64;步驟1.4.4插值和刪除重合點把每個自然筆劃內(nèi)的筆跡點都依序首尾相連,連線上與原筆跡點不重合的點插入筆跡序列,并清除相鄰筆跡點中的重合點;步驟2提取統(tǒng)計結(jié)構(gòu)特征步驟2.1提取方向特征;步驟2.1.1提取相鄰點方向特征;步驟2.1.1.1計算每個筆跡點的方向;任取一點Pi,最后一點除外,點Pi都有至少一個后繼點Pj,j=i+1,則從點Pi的有向線段的方向便設(shè)定為Pj點的方向值,用θi表示,其值域范圍為
,稱該方向值為相鄰點方向;θi計算方法為,設(shè)(Xi,Yi)為點Pi的坐標(biāo),(Xj,Yj)為點Pj的坐標(biāo);由于θi的三角正切函數(shù)tg(θi)=Yj-YiXj-Xi,]]>故θi=arctg(Yj-YiXj-Xi);]]>步驟2.1.1.2計算每個筆跡點的方向?qū)傩韵禂?shù),即指以該點的方向值為自變量,計算用以下函數(shù)表示的該點的4種函數(shù)值橫方向?qū)傩韵禂?shù)函數(shù)用f(h)(θ)表示 豎方向?qū)傩韵禂?shù)函數(shù),用f(s)(θ)表示 撇方向?qū)傩韵禂?shù)函數(shù),用f(p)(θ)表示 捺方向?qū)傩韵禂?shù)函數(shù),用f(n)(θ)表示 其中,α1~α6為角度及閾值,用于確定方向?qū)傩韵禂?shù)函數(shù)的形狀,設(shè)α1=-10°,α2=260°,α31=280°,α4=250°,α5=300°,α6=330°步驟2.1.1.3把筆跡點圖像的坐標(biāo)空間均勻劃分成K1×K1個子塊,在本發(fā)明中K1取值為8,分別統(tǒng)計每個子塊中,所有筆跡點的各個方向?qū)傩韵禂?shù)之和,得到k1×k×4特征;對于其中任何一個子塊(k,l),1≤k≤K1,1≤l≤K1,所述4維特征分別為第(k,l)個子塊內(nèi),所有筆跡點的橫方向?qū)傩韵禂?shù)函數(shù)之和用Fk,l(h)表示Fk,l(h)=ΣP(x,y)∈D(k,l)f(h)(θ),]]>θ為點P(x,y)的方向值第(k,l)個子塊內(nèi),所有筆跡點的豎方向?qū)傩韵禂?shù)函數(shù)之和用Fk,l(s)表示Fk.l(s)=ΣP(x,y)∈D(k,l)f(s)(θ),]]>θ為點P(x,y)的方向值第(k,l)個子塊內(nèi),所有筆跡點的撇方向?qū)傩韵禂?shù)函數(shù)之和,用Fk,l(p)表示Fk,l(p)=ΣP(x,y)∈D(k,l)f(p)(θ),]]>θ為點P(x,y)的方向值第(k,l)個子塊內(nèi),所有筆跡點的捺方向?qū)傩韵禂?shù)函數(shù)之和,用Fk,l(n)表示Fk,l(n)=ΣP(x,y)∈D(k,l)f(n)(θ),]]>θ為點P(x,y)的方向值步驟2.1.2提取相鄰拐點方向特征步驟2.1.2.1用多邊形逼近的方法確定筆跡中的拐點,拐點即筆劃書寫的方向前后變化劇烈的點,包括筆劃拐點在內(nèi),先計算筆劃中每個點與相鄰點間張角的余弦值;張角γ的余弦值可利用三角余弦定理計算,設(shè)a,b,c分別為當(dāng)前筆跡點與前后相鄰筆跡點構(gòu)成的三角形的三邊,張角γ為邊a,b的夾角,c為張角γ的對邊,先根據(jù)三角形頂點的坐標(biāo)分別計算三邊的長度,由余弦定理可求得cosγ=c2-a2-b22ab;]]>拐點的判定是當(dāng)張角γ的余弦值出現(xiàn)最大值并大于設(shè)定閾值,設(shè)為-0.8,此時γ約為2.5弧度;步驟2.1.2.2按上述方法計算每個筆跡點的相鄰拐點方向,設(shè)點Pi和Pj,j>i為筆跡點中相鄰的拐點,所有包括Pi點在內(nèi)的在這兩點之間的筆跡點的方向都設(shè)定為從點Pi指向點Pj的有向線段方向,然后,根據(jù)這一點再重復(fù)上述步驟2.1.1.2和2.1.1.3,得到K1×K1×4維的相鄰拐點方向特征;步驟2.1.3合并相鄰點方向特征和相鄰拐點方向特征得到k1×k×8維方向特征;步驟2.2提取邊緣特征,它反映了漢字的外圍結(jié)構(gòu)信息步驟2.2.1首先提取從左到右方向掃描的邊緣特征把預(yù)處理后的聯(lián)機(jī)漢字筆跡所對應(yīng)圖像的左半部分空間等距分為K2個橫向子區(qū)域,在每一個子區(qū)域內(nèi),從圖像左緣往右進(jìn)行逐行掃描,凡當(dāng)掃描到某個坐標(biāo)點為筆跡點是便計算這個筆跡點的4個相鄰點方向?qū)傩韵禂?shù),記為fi,1(h)、fi,1(s)、fi,1(p)、fi,1(n)其中,下標(biāo)表示在第i次行掃描中第一次掃到筆跡點,若掃不到筆跡點,則這個系數(shù)為0,在其次行掃描中,若再次遇到作為筆跡點的坐標(biāo)點時便計算這個筆跡點的4個相鄰點方向?qū)傩韵禂?shù),記為fi,2(h)、fi,2(s)、fi,2(p)、fi,2(n),下標(biāo)表示第i次行掃描時,第二次遇到筆跡點,否則,這4個系數(shù)為0,該行掃描結(jié)束,接著,進(jìn)行下一行掃描一直到行掃描共i次,便分別累計各行得到的以上系數(shù),得到8維特征Σifi,1(h),]]>Σifi,1(s),]]>Σifi,1(p),]]>Σifi,1(n),]]>Σifi,2(h),]]>Σifi,2(s),]]>Σifi,2(p),]]>Σifi,2(n),]]>對于K2個子區(qū)域,共得到K2×8維邊緣特征;步驟2.2.2從右、上、下另外三個邊緣以及四個對角線的方向重復(fù)步驟2.2.1所述的方法,從而從上述8個方向,共得到K2×8×8維的邊緣特征;步驟2.2.3合并上述步驟2.2.1和2.2.2得到的方向特征和邊緣特征,得到完整的一個聯(lián)機(jī)手寫漢字的統(tǒng)計結(jié)構(gòu)特征,用V表示步驟3特征變換步驟3.1計算國家標(biāo)準(zhǔn)漢字集合中的一個漢字的原始特征向量集合,該集合用Vi(j)表示{{Vi(j),1≤i≤Nj},1≤j≤C}其中,C表示類別數(shù)目,每個類別代表國家標(biāo)準(zhǔn)漢字集合中的一個漢字;C中的各類別用j表示,j表示其中第j個類別;Nj表示第j個類別的樣本個數(shù),i表示第j個類別中的第i個標(biāo)本;步驟3.2用下式計算每個類別的均值以及所有類別的均值,分別用μj,μ表示;μj=1NjΣi=1NjVi(j);]]>在計算國家標(biāo)準(zhǔn)漢字集合中,每個類別所代表的一個漢字的均值μj后,按下式計算所有類別的均值μ=1CΣj=1Cμj;]]>步驟3.3計算類內(nèi)散度矩陣和類間散度陣,分別用Sw、Sb表示Sw=1CΣj=1C(1NjΣi=1Nj(Vi(j)-μj)(Vi(j)-μj)T)]]>Sb=1CΣj=1C(μj-μ)(μj-μ)T]]>步驟3.4把高維原始特征向量用線性鑒別分析方法變換到低維特征空間對矩陣Sw-1(Sb+Sw)進(jìn)行特征值和特征向量分解,得到按值的大小降序排列的特征值,用γi,i=1,2,...,n表示,特征向量用ξi,i=1,2,...,n表示,按值|AT(Sb+Sw)AATSwA|]]>最大的原則,選擇m,使前m個特征向量組成矩陣A,A為n×m維矩陣,A=[ξ1,ξ2,...,ξm],這是所述的線性變換矩陣;步驟3.5按下式計算變換后的特征向量YY=AT·V;V為從國家標(biāo)準(zhǔn)漢字集合中提取的所有類別漢字中得到的原始特征向量集合;步驟4.訓(xùn)練分類器根據(jù)上述步驟3得到的m維識別特征向量Y,對每個類別用下式分別統(tǒng)計其均值μj和協(xié)方差陣∑jμj=1NjΣi=1NjYi(j),]]>Σj=1NjΣi=1Nj(Yi(j)-μj)·(Yi(j)-μj)T]]>其中,Yi(j)表示第j個類別的第i個訓(xùn)練樣本提取的特征向量,Nj是第j個類別的訓(xùn)練樣本數(shù)目,μj表示第j個類別的識別特征的均值,∑j表示第j個類別的協(xié)方差矩陣接著,再對每個類別的協(xié)方差陣進(jìn)行特征值和特征向量分解,得到特征值λi(j),i=1,2,...,m,它表示第j個類別的第i個訓(xùn)練樣本的特征值λi(j),i=1,2,...,m;按特征值大小降序排列;特征向量為ζi(j),i=1,2,...,m;然后,接下式計算小特征值的替代值,即用事先確定的常數(shù)λ來代替較小的特征值,以降低小特征值統(tǒng)計不準(zhǔn)時分類性能的不好影響λ=1CΣj=1Cλk+1(j),]]>k為小于m的正整數(shù)再把上述參數(shù)λi(j),j=1,2,...,C,i=1,2,...,k、ζi(j),j=1,2,...,C,i=1,2,...,m、μj,j=1,2,...,C、λ存儲進(jìn)識別庫文件中由此得到針對高斯模型的改進(jìn)型二次分類器,用MQDF表示,按下式計算輸入特征向量的判決函數(shù)gj(Y),gj(Y)=Σi=1k((Y-μj)Tζi(j))2λi(j)+Σi=k+1m((Y-μj)Tζi(j))2λ+Σi=1klogλi(j)+Σi=k+1mlogλ,j=1.2······,C]]>分類判決準(zhǔn)則為如果gi(Y)=min1≤j≤Cgj(Y)]]>則把Y歸為第j個類別;識別階段首先,由待識樣本得到識別特征Y,用下式計算每個類別的判決函數(shù)gj(Y),m,K的取值與訓(xùn)練過程相同;gj(Y)=Σi=1k((Y-μj)Tζi(j))2λi(j)+Σi=k+1m((Y-μj)Tζi(j))2λ+Σi=1klogλi(j)+Σi=k+1mlogλ,j=1.2······,C]]>其次,把輸入的待識樣本劃分到使gj(Y)取最小值的類別。
全文摘要
基于統(tǒng)計結(jié)構(gòu)特征的聯(lián)機(jī)手寫漢字識別方法,屬于漢字識別技術(shù)領(lǐng)域,其特征在于先對處理的字符對象進(jìn)行預(yù)處理,以消除噪聲干擾,消除部分書寫變形并把待識漢字所占空間映射到一個固定大小的位置;提取包括方向特征和邊緣特征在內(nèi)的能很好反映聯(lián)機(jī)手寫漢字特征在內(nèi)的統(tǒng)計結(jié)構(gòu)特征,再把得到的這些原始特征使用線性鑒別分析方法壓縮變換為識別特征;最后采用改進(jìn)了的高斯二次分類器模型完成訓(xùn)練和識別,該模型用一個事先設(shè)定的常數(shù)值代替較小的特征值以消除較小的特征值估計不準(zhǔn)確對分類性能的不利影響。本發(fā)明的平均識別率為98.43%,取得令人滿意的效果。
文檔編號G06K9/00GK1664846SQ200510011510
公開日2005年9月7日 申請日期2005年4月1日 優(yōu)先權(quán)日2005年4月1日
發(fā)明者丁曉青, 魯湛, 劉長松, 陳彥, 彭良瑞, 方弛 申請人:清華大學(xué)