專利名稱:手寫漢字自動(dòng)分割和識別方法以及使用該方法的系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及手寫漢字自動(dòng)識別技術(shù),具體地說,涉及對連續(xù)輸入的手寫漢字串進(jìn)行自動(dòng)分割和識別的方法以及使用該方法的系統(tǒng)。
在目前可以接收用戶手寫漢字輸入的信息處理系統(tǒng)中,通常包括一個(gè)基于筆的輸入裝置,該裝置一般由書寫筆和書寫板組成。這樣的基于筆的輸入裝置一般要求用戶在書寫完一個(gè)漢字之后,按下書寫筆或書寫板上的一個(gè)按鈕,以對書寫的漢字串進(jìn)行手動(dòng)分割。自動(dòng)手寫漢字識別機(jī)可以直接對這種經(jīng)過手動(dòng)分割的漢字串進(jìn)行識別。但是手動(dòng)分割過程影響了用戶書寫的連續(xù)性,因此這種書寫方式不符合用戶的書寫習(xí)慣。
IBM公司的ThinkScribe是一種集成了手寫數(shù)字化儀和傳統(tǒng)的基于紙上記錄系統(tǒng)的設(shè)備。該設(shè)備按筆畫和相關(guān)時(shí)序記錄用戶的手寫輸入,并能夠按原來的時(shí)序再現(xiàn)用戶的手寫輸入。用戶一般在ThinkScribe上以連續(xù)方式進(jìn)行書寫,書寫的字與字之間的間隔很小或連在一起。這樣在進(jìn)行自動(dòng)識別之前必須進(jìn)行文字分割。
目前還沒有一種有效的文字分割方法,手寫漢字識別技術(shù)只能對單個(gè)漢字或字間隔很大的手寫漢字串進(jìn)行識別。對手寫漢字串進(jìn)行自動(dòng)分割困難在于1)許多漢字是左右結(jié)構(gòu),當(dāng)在水平線上從左到右快速書寫時(shí),左右成分之間的間隔和字與字之間的間隔非常相似。除了這種空間上的混淆之外,有些漢字的左、右成份本身就可以是一個(gè)獨(dú)立的漢字或與某個(gè)獨(dú)立的漢字非常象。同樣,對于在垂直行上書寫的手寫漢字串也有類似的問題,因?yàn)橛行h字是上下結(jié)構(gòu)的。
2)當(dāng)用戶快速以草書方式書寫時(shí),對于相鄰的漢字來說,前一個(gè)漢字的最后一個(gè)筆畫和后一個(gè)漢字的開始筆畫之間可能相連,彼此沒有任何清楚的界限。
于是,如何克服以上困難提供一種對連續(xù)輸入的手寫漢字串進(jìn)行自動(dòng)分割的方法,是實(shí)現(xiàn)對連續(xù)輸入的手寫漢字串進(jìn)行自動(dòng)識別的基礎(chǔ)。
根據(jù)本發(fā)明的手寫漢字串自動(dòng)分割和識別方法在不同層次上利用了來自于不同源的信息,例如人們的書寫習(xí)慣、漢字串的幾何特征、書寫時(shí)的時(shí)序信息以及語言模型等實(shí)現(xiàn)了對連續(xù)輸入的手寫漢字串的自動(dòng)分割和識別。
根據(jù)本發(fā)明的手寫漢字串自動(dòng)分割和識別方法包括以下步驟建立描述手寫漢字串中筆畫序列幾何特征的幾何模型和描述漢語中字(詞)依賴關(guān)系的語言模型;基于所述相關(guān)時(shí)序信息和幾何模型找出連續(xù)輸入的手寫漢字串中所有的潛在分割方案;對于每一種分割方案,對任意兩個(gè)分割點(diǎn)之間的筆畫組進(jìn)行識別,并計(jì)算出表征識別結(jié)果正確性的概率;用語言模型修正上述表征識別結(jié)果正確性的概率;和選擇對應(yīng)于概率值最大的識別結(jié)果和該識別結(jié)果所對應(yīng)的分割方案作為對用戶連續(xù)輸入的手寫漢字串的分割和識別結(jié)果。
根據(jù)本發(fā)明的手寫漢字串自動(dòng)分割和識別系統(tǒng)包括輸入裝置,用于接收用戶連續(xù)輸入的手寫漢字串,并按筆畫和相關(guān)時(shí)序記錄用戶的手寫輸入;模型存儲裝置,用于存儲描述手寫漢字串中筆畫序列幾何特征的幾何模型和描述漢語中字(詞)依賴關(guān)系的語言模型;分割裝置,基于所述相關(guān)時(shí)序信息和幾何模型找出連續(xù)輸入的手寫漢字串中所有的潛在分割方案;識別裝置,對于每一種分割方案,對任意兩個(gè)分割點(diǎn)之間的筆畫組進(jìn)行識別,并計(jì)算出表征識別結(jié)果正確性的概率;仲裁裝置,用語言模型修正上述表征識別結(jié)果正確性的概率,選擇對應(yīng)于概率值最大的識別結(jié)果和該識別結(jié)果所對應(yīng)的分割方案作為對用戶連續(xù)輸入的手寫漢字串的分割和識別結(jié)果。
通過以下結(jié)合附圖的說明可以使本發(fā)明的目的、特征和優(yōu)點(diǎn)更加清楚。
圖1為根據(jù)本發(fā)明的手寫漢字串自動(dòng)分割和識別方法的概念性流程圖;圖2為根據(jù)本發(fā)明第一實(shí)施例的手寫漢字串自動(dòng)分割和識別方法的流程圖;圖3為根據(jù)本發(fā)明第二實(shí)施例的手寫漢字串自動(dòng)分割和識別方法的流程圖;圖4為根據(jù)本發(fā)明第三實(shí)施例的手寫漢字串自動(dòng)分割和識別方法的流程圖;圖5為根據(jù)本發(fā)明的手寫漢字串自動(dòng)分割和識別系統(tǒng)的框圖。
根據(jù)本發(fā)明的手寫漢字串自動(dòng)分割和識別方法可由下述公式來描述C*→=argmaxPr(C→|S→)---(1)]]>識別的目標(biāo)是檢索出盡可能與用戶書寫的實(shí)際漢字串
相近的漢字串
這可以通過使識別誤差盡可能小來實(shí)現(xiàn)。于是,識別問題可以看作是找出對給定的手寫輸入序列
具有最大后驗(yàn)概率的漢字串
使用Bayes規(guī)則,等式(1)可以寫成C*→=argmaxPr(S→|C→)Pr(C→)---(2)]]>在等式(2)中,Pr
是一源模型,它描述了在涉及的語言中該漢字串出現(xiàn)的可能性??梢酝ㄟ^語言模型獲得概率測量Pr
,就其復(fù)雜度來講這可以是一簡單的字典也可以是一個(gè)基于n元文法(字或詞)的較復(fù)雜的統(tǒng)計(jì)語言模型。Pr
描述了對于每個(gè)給定的漢字串
可以產(chǎn)生的所有書寫序列。讓書寫序列s=f1,f2,…fN,其中fi是一書寫單元(書寫單元可以是部分筆畫、筆畫或筆畫組,也可以是漢字的偏旁部首)。類似地,讓漢字串
=c1,c2…cM,其中每個(gè)ci代表了一個(gè)單獨(dú)的漢字。通常,每個(gè)漢字與一組由兩邊界點(diǎn)確定的書寫單元有關(guān)。具體地說,存在M+1個(gè)邊界點(diǎn){bj},0≤j≤m,其中(i)bO=0并且bM=1;(ii)滿足bj-1+1≤n≤bj的每個(gè)書寫單元fn與cj相關(guān)。在書寫狀態(tài)為分立的情況下,邊界點(diǎn){bj}是唯一確定的,因?yàn)槊總€(gè)漢字是單獨(dú)書寫的。在這種情況下,Pr
可表示為Pr(S→|C→)=Πj=1MPr(Φj|cj)---(3)]]>其中Φj=fbj-1+1…fbj代表了與漢字cj相關(guān)的書寫單元組。
然而,在書寫狀態(tài)為連續(xù)的情況下,邊界點(diǎn){bj}是任意的。在這種情況下,Pr
可表示為Pr(S→|C→)=ΣΠj=1MPr(Φj|cj)---(4)]]>其中Φj的含義同等式(3)。等式(4)中的求和考慮了對于各種假設(shè)將書寫序列分成M段的所有可能分割。
這樣,i)在分立的書寫狀態(tài)下,識別模型可表示為C*→=argmax{[Πj=1MPr(Φj|cj)]Pr(C→)}---(5)]]>ii)在連續(xù)的書寫狀態(tài)下,識別模型可表示為C*→=argmax{ΣΠj=1MPr(Φj|cj)]Pr(C→)}---(6)]]>由以上分析可以看出手寫漢字識別是分割和識別的組合。
圖1示出了根據(jù)以上分析得出本發(fā)明的手寫漢字自動(dòng)分割和識別方法的具體步驟。如圖1所示步驟S102對于用戶的手寫輸入序列
,首先找出所有的潛在分割方案1=1…N;步驟S102對于每一種分割方案進(jìn)行識別并計(jì)算出Πj=1MPr(Φj|cj)]]>或ΣΠj=1M(Pr(Φj|cj);]]>步驟S103用語言模型修正上述計(jì)算結(jié)果,即計(jì)算〔Πj=1MPr(Φj|cj)]]>〕Pr
或[ΣΠj=1M(Pr(Φj|cj)]Pr(C→);]]>;和步驟S104從以上計(jì)算結(jié)果中找出最大值,該值所對應(yīng)的Φj和
(j=1…M)即為用戶手寫漢字輸入序列
的分割和識別結(jié)果。
從以上可以看出,根據(jù)本發(fā)明的對手寫漢字串進(jìn)行自動(dòng)分割和識別的方法,在完成分割的同時(shí)完成了識別。
實(shí)際上,現(xiàn)有的手寫漢字識別方法都是從大量樣本中計(jì)算出Pr(Фj|cj),取Pr(Фj|cj)最大值所對應(yīng)的cj作為對Фj的識別結(jié)果。于是,本發(fā)明的手寫漢字串自動(dòng)分割和識別方法可以利用現(xiàn)有的識別機(jī),對于每一種潛在的分割方案利用現(xiàn)有的識別機(jī)計(jì)算出Πj=1MPr(Φj|cj)]]>或∑
(Pr(Фj|cj)。再用語言模型Pr
校正以上結(jié)果,從各種分割方案對應(yīng)的計(jì)算結(jié)果中找出最大值,該值所對應(yīng)的Φj和cj(j=1…M)即為用戶手寫漢字輸入序列
的分割和識別結(jié)果。
通常在上述方法中,Φj被認(rèn)為是筆畫組,cj是單個(gè)漢字。但對于cj為一個(gè)漢字的組成部分,例如漢字的偏旁部首時(shí)該方法也適用。同時(shí),cj也可以是一個(gè)詞,這樣對于那些包括重疊筆畫無法自動(dòng)分割的漢字串可以進(jìn)行組合識別。但在這種情況下,無法利用現(xiàn)有的識別機(jī)。可以通過手寫漢字串訓(xùn)練程序來計(jì)算Pr(Фj|cj)。當(dāng)然該漢字串中包括單個(gè)漢字。
以下以IBM的ThinkScribe所記錄的手寫漢字串?dāng)?shù)據(jù)為例,詳細(xì)地描述一下本發(fā)明的手寫漢字串自動(dòng)分割方法。
在進(jìn)行手寫漢字串自動(dòng)分割時(shí),我們做了以下的假設(shè)(1)每個(gè)漢字由一些書寫筆畫組成;盡管一些書寫筆畫可能與打印出的漢字筆畫不一定一一對應(yīng)的,但一個(gè)漢字總是在某一書寫筆畫結(jié)束時(shí)結(jié)束。這也就是說,該邊界檢測方法不考慮前一漢字的最后一個(gè)書寫筆畫和下一個(gè)漢字的第一個(gè)筆畫相連的情況。如果這種出現(xiàn)概論很小的事件發(fā)生了,用戶可以啟動(dòng)一個(gè)手動(dòng)程序斷開相連的筆畫來表明分割邊界。
(2)按順序書寫漢字串。這也就是說,前一個(gè)漢字總是在書寫下一個(gè)漢字之前完全書寫完畢。
(3)漢字串在一行中從左到右的方向書寫。如果按從上到下的方向書寫漢字串可以相應(yīng)地修改分割方案。
(4)以IBM的ThinkScribe所記錄的數(shù)據(jù)為例。每個(gè)書寫筆畫由一系列離散的筆畫點(diǎn)的x、y坐標(biāo)以及時(shí)序信息值來表示。于是第i個(gè)書寫筆畫可以表示成s(i)=((x(i,1),y(i,1),t(i,1)),…,(x(i,j),y(i,j),t(i,j)),…(x(i,e(i)),y(i,e(i),t(i,e(i)))其中e(i)是筆畫i中筆畫點(diǎn)的個(gè)數(shù)。于是所要分割的筆畫序列可表示為s(1),s(2)…s(i)其中s(1)是屬于未分割漢字串中的第一個(gè)筆畫。
我們注意到用于漢字分割的一個(gè)很明顯的標(biāo)準(zhǔn)是兩相鄰漢字之間的物理間隔。當(dāng)用戶按從左到右方向書寫時(shí),這樣的間隔可以用兩相鄰筆畫之間垂直方向上的間隙G表示。于是,我們可以在每個(gè)筆畫s(K)的起始點(diǎn)處使用下述條件來測試這樣的間隙Max(x(i,j))≤ Min(x(i,j))-G(7)對于滿足t(i,j)< 對于滿足t(i,j)t(K,1)的所有點(diǎn)≥t(K,1)的所有點(diǎn)請注意,在等式(7)的右邊我們考慮了所有的點(diǎn)。實(shí)際上,當(dāng)人們開始在距離上一個(gè)已確定為潛在邊界的筆畫足夠遠(yuǎn)處開始書寫時(shí)就可以結(jié)束這種測試。于是,條件“包含滿足x(i,j)<x(i,1)+D的某個(gè)點(diǎn)的所有筆畫”可以用作測試結(jié)束條件。這里D是可由經(jīng)驗(yàn)來確定的G的上界(例如它可以是行寬,或至今所確定的文字邊界之間最大距離的1.5倍)。我們現(xiàn)在在定義f(G)是G的一個(gè)單調(diào)上升函數(shù),因?yàn)镚愈大,筆畫s(K)成為邊界筆畫的可能性愈大,f(G)對于給定的漢字串來說是筆畫s(K)為一漢字的起始筆畫的累積概率函數(shù)。注意,此函數(shù)可以通過對典型用戶的書寫數(shù)據(jù)進(jìn)行分析而得到,也可以對某一特定用戶進(jìn)行訓(xùn)練。理論上,它與書寫的具體情況有關(guān)。然而,實(shí)際上由于人們的書寫習(xí)慣不總是固
S-3=雙(2-乙基己酸)1,4-環(huán)己二亞甲基酯
S-4=乙酸2-(2-丁氧基乙氧基)乙基酯
由于在沒
中不同有繼承概率差,所以Pr
可認(rèn)為是勻一的。同樣,對于給定
,Pr
是一常數(shù)。于是Pr(S→|B→)∝Pr(B→|S→)---(13)]]>Pr
是可以從兩個(gè)信息源中通過觀測筆畫幾何特征得出的幾何模型。一個(gè)是間距模型G,它與
有關(guān),另一個(gè)是不同的候選漢字的筆畫特征模型也稱分布模型D,該模型也與
有關(guān)。于是Pr(B→|S→)=Pr(g)(B→|S→)×Pr(d)(B→|S→)---(14)]]>在理論上,Pr(g)和Pr(d)都可以看作是上下文有關(guān)的,即是
的函數(shù)。然而,Pr(g)對
的依賴性非常小,且Pr(g)可以上下文無關(guān)的間隔模型G中計(jì)算出來Pr(g)(B→|S→)=ΠiMfi(G)ΠjM(1-fj(G))]]>其中i的范圍是
中的潛在分割點(diǎn),而j的范圍為不在
中的那些潛在分割點(diǎn)。
對于分布模型,Pr(d)可用不同方式計(jì)算出來,這依賴于所采用的策略,與各種性能參數(shù)之間的權(quán)衡,如復(fù)雜度、可靠性和準(zhǔn)確的增益有關(guān)。一般來說,我們假設(shè)可以從每一個(gè)漢字的書寫樣本中建立X方向上筆畫密度分布。相對于平均大小的漢字來說可以是歸一化的。當(dāng)對于給定
考慮特定
時(shí),我們可以對于
中的每個(gè)ci計(jì)算出各個(gè)X方向上筆畫密度分布,并將與其所存儲的典型分布相比較,得出用于匹配似然性的概率。例如只考慮候選漢字在X方向的分布就可以達(dá)到實(shí)際目的。這樣,對于每個(gè)漢字,首先從收集的書寫樣本中得到X方向上分布的歸一化概率分布函數(shù)并將其存儲起來。于是所觀測到的每個(gè)的X方向上的分布可以給出似然概率圖。于是Pr(d)(B→|S)=ΠiMmi]]>
圖2示出了根據(jù)本發(fā)明第一實(shí)施例的手寫漢字串自動(dòng)分割和識別方法的具體步驟。
首先使用戶的手寫漢字串S經(jīng)過間隔模型G的分析,確定所有的潛在分割點(diǎn),對于每一種潛在的分割方案產(chǎn)生一條路徑,將所以路徑按隊(duì)列存放。然后對于隊(duì)列中的每條路徑進(jìn)行識別。再用分布模型D和語言模型PLM對Pgap·PR進(jìn)行校正,即計(jì)算PLM·PD·PR·Pgap。經(jīng)排列后求出得分最高的路徑,其所對應(yīng)的分割方案和識別結(jié)果即為手寫漢字串
的分割和識別結(jié)果。
圖3示出了根據(jù)本發(fā)明另一個(gè)實(shí)施例的手寫漢字串自動(dòng)分割和識別方法的具體步驟。手寫漢字串
經(jīng)過G模型和D模型的分析后才確定出潛在的分割點(diǎn)。這有助于減少路徑數(shù),提高分割和識別效率。
圖4示出了根據(jù)本發(fā)明第三實(shí)施例的手寫漢字串自動(dòng)分割和識別方法的具體步驟。對于識別結(jié)果用分布模型D′進(jìn)行校正,以提高分割和識別的準(zhǔn)確度。在書寫方向?yàn)樗椒较驎r(shí),當(dāng)識別結(jié)果為左右結(jié)構(gòu)的漢字時(shí),使用字寬度模型D′來修正表征識別結(jié)果正確性的概率值,字寬度模型D’使用即可以為左右結(jié)構(gòu)漢字中的一個(gè)組成部分又可以為單個(gè)漢字的成分的寬度來描述在該寬度下該成分為左右結(jié)構(gòu)漢字中一個(gè)組成部分的可能性或?yàn)閱蝹€(gè)漢字的可能性。而在書寫方向?yàn)榇怪狈较驎r(shí),當(dāng)識別結(jié)果為一上下結(jié)構(gòu)的漢字時(shí)使用字高度模型D’來修正表征識別結(jié)果正確性的概率值,字高度模型D’使用即可以為上下結(jié)構(gòu)漢字中的一個(gè)組成部分又可以為單個(gè)漢字的成分的高度來描述在該高度下該成分為上下結(jié)構(gòu)漢字中一個(gè)組成部分的可能性或?yàn)閱蝹€(gè)漢字的可能性。
此外,正如前邊已討論過的那樣,識別結(jié)果可以是偏旁部首、單字詞或多字詞。
在具體實(shí)施例本發(fā)明的手寫漢字串自動(dòng)分割和識別方法時(shí),可以使用樹狀結(jié)構(gòu)。這樣可以有效地表示代表潛在分割方案的每條路徑。
使用樹狀結(jié)構(gòu)進(jìn)行手寫漢字串自動(dòng)分割和識別的具體步驟為
步驟(1)分析手寫數(shù)據(jù)樣本,構(gòu)造f(G)和f(D)。
步驟(2)對每一筆畫計(jì)算G。如果G大于0,則該筆畫可能是一潛在的分割點(diǎn)。
步驟(3)以最初確定的分割點(diǎn)為根,產(chǎn)生一代表潛在分割方案的二叉樹。左分枝表示不接受前一個(gè)潛在分割點(diǎn),右分枝表示接受前一個(gè)潛在的分割點(diǎn)。每當(dāng)產(chǎn)生新的潛在分割點(diǎn)時(shí),樹就向下產(chǎn)生分枝。從根到葉子節(jié)點(diǎn)的每條路徑都代表了一個(gè)潛在的分割方案。于是可用等式(10)求出每條路徑的得分。然而實(shí)際上,當(dāng)我們向下生長樹時(shí),對于每個(gè)新產(chǎn)生的分枝都用f(G)和識別結(jié)果來估計(jì)分枝存在的可能性,以對樹進(jìn)行裁剪。
步驟(4)如果對于某一個(gè)潛在的分割點(diǎn)f(G)=1,則可以將左分枝裁剪掉。這種情況發(fā)生在兩相鄰筆畫之間存在很大物理間隔時(shí)。
步驟(5)如果某個(gè)特定的似然概率mi等于零,則可以將上一個(gè)左分枝裁剪掉。
步驟(6)如果由于包含前一個(gè)潛在分割點(diǎn),而使識別結(jié)果的概率值落入預(yù)定閾值L之下,則左分枝裁剪掉,L值可由經(jīng)驗(yàn)來定。
步驟(7)對于剩下的每一分枝計(jì)算公式(10)的值。
以上結(jié)合附圖詳細(xì)地描述了根據(jù)本發(fā)明的手寫漢字自動(dòng)分割和識別方法。下面結(jié)構(gòu)圖5描述一下使用該方法的系統(tǒng)。
如圖5所示,根據(jù)本發(fā)明的手寫漢字自動(dòng)分割和識別系統(tǒng)包括輸入裝置,用于接收用戶連續(xù)輸入的手寫漢字串,并按筆畫和相關(guān)時(shí)序記錄用戶的手寫輸入;模型存儲裝置,用于存儲描述手寫漢字串中筆畫序列幾何特征的幾何模型和描述漢語中字(詞)依賴關(guān)系的語言模型;分割裝置,基于所述相關(guān)時(shí)序信息和幾何模型找出連續(xù)輸入的手寫漢字串中所有的潛在分割方案;識別裝置,對于每一種分割方案,對任意兩個(gè)分割點(diǎn)之間的筆畫組進(jìn)行識別,并計(jì)算出表征識別結(jié)果正確性的概率;仲裁裝置,用語言模型修正上述表征識別結(jié)果正確性的概率,選擇對應(yīng)于概率值最大的識別結(jié)果和該識別結(jié)果所對應(yīng)的分割方案作為對用戶連續(xù)輸入的手寫漢字串的分割和識別結(jié)果。
輸入裝置例如可以是IBM公司的ThinkScribe。ThinkScribe是一種集成了手寫數(shù)字化儀和傳統(tǒng)的基于紙上記錄系統(tǒng)的設(shè)備。該設(shè)備按筆畫和相關(guān)時(shí)序記錄用戶的手寫輸入,并能夠按原來的時(shí)序再現(xiàn)用戶的手寫輸入。ThinkScribe可以將數(shù)據(jù)流S(1),S(2),S(3)…存儲在自已的非易失存儲器中,并且在需要時(shí)可以通過輸入/輸出端口送到例如一臺PC機(jī)中,PC機(jī)可以運(yùn)行ThinkScribe的手寫輸入再現(xiàn)程序,按原來的時(shí)序再現(xiàn)用戶的手寫輸入。當(dāng)PC機(jī)安裝有識別程序時(shí),也可以作為一臺識別機(jī),對用戶的手寫輸入進(jìn)行識別。
以上結(jié)合附圖描述了根據(jù)本發(fā)明的在手寫漢字信息處理系統(tǒng)中自動(dòng)分割和識別用戶連續(xù)輸入的手寫漢字串的方法和使用該方法的系統(tǒng)。正如本領(lǐng)域技術(shù)人員所理解的那樣,本發(fā)明不限于以上的實(shí)施例。在不違背本發(fā)明的精神和范疇的條件下,可以對本發(fā)明作出各種修改和變型,本發(fā)明旨在包括所有這些修改和變型。本發(fā)明的保護(hù)范圍由所附權(quán)利要求書來限定。
權(quán)利要求
1.一種在手寫漢字信息處理系統(tǒng)中自動(dòng)分割和識別用戶連續(xù)輸入的手寫漢字串的方法,其中所述手寫漢字信息處理系統(tǒng)按筆畫和相關(guān)時(shí)序信息記錄用戶連續(xù)輸入的手寫漢字串,所述方法的特征在于以下步驟建立描述手寫漢字串中筆畫序列幾何特征的幾何模型和描述漢語中字(詞)依賴關(guān)系的語言模型;基于所述相關(guān)時(shí)序信息和幾何模型找出連續(xù)輸入的手寫漢字串中所有的潛在分割方案;對于每一種分割方案,對任意兩個(gè)分割點(diǎn)之間的筆畫組進(jìn)行識別,并計(jì)算出表征識別結(jié)果正確性的概率;用語言模型修正上述表征識別結(jié)果正確性的概率;和選擇對應(yīng)于概率值最大的識別結(jié)果和該識別結(jié)果所對應(yīng)的分割方案作為對用戶連續(xù)輸入的手寫漢字串的分割和識別結(jié)果。
2.根據(jù)權(quán)利要求1的手寫漢字自動(dòng)分割和識別方法,其特征在于所述幾何模型包括間距模型G,使用兩相鄰筆畫之間的間隔來描述所述兩相鄰筆畫中后一筆畫為一個(gè)潛在分割點(diǎn)的可能性,所述兩相鄰筆畫按相關(guān)時(shí)序信息分為前一筆畫和后一筆畫。
3.根據(jù)權(quán)利要求2的手寫漢字自動(dòng)分割和識別方法,其特征在于所述G模型為一單調(diào)上升函數(shù),其中自變量為兩相鄰筆畫之間的間隔,因變量描述后一筆畫為一個(gè)潛在分割點(diǎn)的可能性。
4.根據(jù)權(quán)利要求1的手寫漢字自動(dòng)分割和識別方法,其特征在于所述幾何模型包括分布模型D,使用當(dāng)前筆畫與前一個(gè)已確定為潛在分割點(diǎn)的筆畫之間的距離來描述當(dāng)前筆畫和潛在的分割點(diǎn)之間的筆畫為一個(gè)字的可能性。
5.根據(jù)權(quán)利要求4的手寫體漢字自動(dòng)分割和識別方法,其特征在于所述D模型為一個(gè)類正態(tài)分布函數(shù),其中自變量為當(dāng)前筆畫與前一個(gè)已確定為潛在分割點(diǎn)的筆畫之間的距離,因變量描述當(dāng)前筆畫和潛在分割點(diǎn)之間的筆畫為一個(gè)字的可能性,當(dāng)自變量在于某一連續(xù)的值域內(nèi)時(shí)該類正態(tài)分布函數(shù)值較大,而當(dāng)自變量落在所述值域外時(shí)該類正態(tài)分布函數(shù)值較小。
6.根據(jù)權(quán)利要求1的手寫漢字自動(dòng)分割和識別方法,其特征在于對所述任意兩個(gè)分割點(diǎn)之間的筆畫組的識別結(jié)果可以是偏旁部首、單字詞或多字詞。
7.根據(jù)權(quán)利要求1的手寫漢字自動(dòng)分割和識別方法,其特征在于在書寫方向?yàn)樗椒较驎r(shí),當(dāng)識別結(jié)果為一左右結(jié)構(gòu)的漢字時(shí)使用字寬度模型D’來修正表征識別結(jié)果正確性的概率值,字寬度模型D’使用即可以為左右結(jié)構(gòu)漢字中的一個(gè)組成部分又可以為單個(gè)漢字的成分的寬度來描述在該寬度下該成分為左右結(jié)構(gòu)漢字中一個(gè)組成部分的可能性或?yàn)閱蝹€(gè)漢字的可能性。
8.根據(jù)權(quán)利要求1的手寫漢字自動(dòng)分割和識別方法,其特征在于在書寫方向?yàn)榇怪狈较驎r(shí),當(dāng)識別結(jié)果為一上下結(jié)構(gòu)的漢字時(shí)使用字高度模型D’來修正表征識別結(jié)果正確性的概率值,字高度模型D’使用即可以為上下結(jié)構(gòu)漢字中的一個(gè)組成部分又可以為單個(gè)漢字的成分的高度來描述在該高度下該成分為上下結(jié)構(gòu)漢字中一個(gè)組成部分的可能性或?yàn)閱蝹€(gè)漢字的可能性。
9.根據(jù)權(quán)利要求1-8中任何一項(xiàng)權(quán)利要求的手寫漢字自動(dòng)分割和識別方法,其特征在于在尋找潛在的分割方案時(shí)使用樹狀結(jié)構(gòu)。
10.根據(jù)權(quán)利要求9的手寫漢字自動(dòng)分割和識別方法,其特征在于所述樹狀結(jié)構(gòu)為二叉樹,其中根節(jié)點(diǎn)代表最初確定的潛在的分割點(diǎn),左分枝表示不接受前一個(gè)潛在的分割點(diǎn),右分枝表示接受前一個(gè)潛在的分割點(diǎn),每當(dāng)產(chǎn)生新的潛在分割點(diǎn)時(shí),樹就向下產(chǎn)生分枝。
11.根據(jù)權(quán)利要求10的手寫漢字自動(dòng)分割和識別方法,其特征在于使用G模型、D模型和識別結(jié)果對所述二叉樹進(jìn)行修剪。
12.一種用于對連續(xù)輸入的手寫漢字串進(jìn)行自動(dòng)分割和識別的系統(tǒng),包括輸入裝置,用于接收用戶連續(xù)輸入的手寫漢字串,并按筆畫和相關(guān)時(shí)序記錄用戶的手寫輸入;模型存儲裝置,用于存儲描述手寫漢字串中筆畫序列幾何特征的幾何模型和描述漢語中字(詞)依賴關(guān)系的語言模型;分割裝置,基于所述相關(guān)時(shí)序信息和幾何模型找出連續(xù)輸入的手寫漢字串中所有的潛在分割方案;識別裝置,對于每一種分割方案,對任意兩個(gè)分割點(diǎn)之間的筆畫組進(jìn)行識別,并計(jì)算出表征識別結(jié)果正確性的概率;仲裁裝置,用語言模型修正上述表征識別結(jié)果正確性的概率,選擇對應(yīng)于概率值最大的識別結(jié)果和該識別結(jié)果所對應(yīng)的分割方案作為對用戶連續(xù)輸入的手寫漢字串的分割和識別結(jié)果。
全文摘要
本發(fā)明公開了一種在手寫漢字信息處理系統(tǒng)中自動(dòng)分割和識別用戶連續(xù)輸入的手寫漢字串的方法,包括以下步驟:建立幾何模型和語言模型;基于相關(guān)時(shí)序信息和幾何模型找出連續(xù)輸入的手寫漢字串中所有的潛在分割方案;對于每一種分割方案,對任意兩個(gè)分割點(diǎn)之間的筆畫組進(jìn)行識別,并計(jì)算出表征識別結(jié)果正確性的概率;用語言模型修正上述表征識別結(jié)果正確性的概率;和,選擇對應(yīng)于概率值最大的識別結(jié)果和該識別結(jié)果所對應(yīng)的分割方案。
文檔編號G06K9/72GK1260524SQ99100938
公開日2000年7月19日 申請日期1999年1月13日 優(yōu)先權(quán)日1999年1月13日
發(fā)明者唐道南, 蘇輝, 王茜鶯 申請人:國際商業(yè)機(jī)器公司