專利名稱:一種旋轉(zhuǎn)無關(guān)的手寫中文草書詞組識別方法
技術(shù)領(lǐng)域:
本發(fā)明屬于采用計算機模式識別對用戶手寫中文進(jìn)行識別的技術(shù)領(lǐng)域,特別是涉
及一種旋轉(zhuǎn)無關(guān)的中文草書詞組識別方法。
背景技術(shù):
手寫漢字識別一般是指用戶通過手寫輸入設(shè)備(比如手寫板、觸摸屏、鼠標(biāo)等) 書寫漢字,同時計算機將手寫輸入設(shè)備采集到的漢字書寫軌跡轉(zhuǎn)換為相應(yīng)的漢字機器內(nèi)碼 的識別技術(shù)。它已經(jīng)廣泛應(yīng)用于實時手寫輸入,中文電子數(shù)據(jù)處理的自動輸入、中文文本壓 縮、辦公自動化及計算機輔助教學(xué)等領(lǐng)域,帶來了巨大的經(jīng)濟和社會效益。傳統(tǒng)的手寫識別 技術(shù)通常所采用的輸入方式為單字符識別,即書寫一個漢字識別一個漢字,這種方式需要 讓計算機知道一個漢字已經(jīng)書寫完畢,常用的判斷書寫完畢的方法有以下幾種
1、點擊特定的按鈕告訴計算機已經(jīng)書寫完畢; 2、書寫結(jié)束后抬筆等待一段時間,當(dāng)?shù)却臅r間超過一個閾值,計算機則判斷已 經(jīng)書寫完畢; 3、書寫一個字符后,隔較遠(yuǎn)距離再書寫下一個字符,計算機判斷抬筆與落筆之間 的距離超過一定閾值時,則認(rèn)為前一個字符書寫完畢; 4、提供兩個或多個書寫框,用戶在一個框內(nèi)書寫完后換到另一個書寫框書寫時, 計算機判斷前一個書寫框內(nèi)的漢字書寫完畢。 以上這幾種方式都存在不同程度的缺陷,如第一種方式需要點擊按鈕,費時費力
且不夠自然,第二種方式寫完需要停頓一段時間,雖然不費力,但費時,直接影響輸入的速
度,第三種和第四種方式需要在書寫完一個字后移動較遠(yuǎn)距離才能開始書寫下一個字符,
不符合人們自然書寫的習(xí)慣。多字符連筆草書的手寫方式是人們最自然且速度最快的中文
手寫輸入方式,但以上這些方法顯然都無法解決多字符連筆輸入的問題。 針對單字輸入不方便的問題,手寫詞組識別也越來越受到人們的重視,目前常用
的詞組識別方法是利用詞組切分方法將詞組切分成單個的字符,然后再利用單字符識別技
術(shù),對每個切分得到的單字符進(jìn)行識別而獲得最終的識別結(jié)果。 然而這種方法的最大缺陷就是詞組切分的結(jié)果對于最終的識別結(jié)果有著非常重 要的影響,如果一旦某個切分路徑出現(xiàn)錯誤就會導(dǎo)致最終的識別錯誤。而且通常用戶書寫 時如果所寫的詞組呈一定角度傾斜,則容易出現(xiàn)切分路徑的錯誤,故而就目前的技術(shù)發(fā)展 而言,詞組切分技術(shù)面臨著很多挑戰(zhàn),特別是針對傾斜的手寫詞組的識別更是還沒有研發(fā) 出非常成熟而且有效的詞組切分技術(shù)。
發(fā)明內(nèi)容
本發(fā)明的目的在于克服現(xiàn)有技術(shù)的不足,提供一種更自由的漢字手寫輸入識別技
術(shù),特別是基于整詞的旋轉(zhuǎn)方向無關(guān)的無約束手寫中文草書詞組識別方法。為了實現(xiàn)上述發(fā)明目的,采用的技術(shù)方案如下
—種手寫中文草書詞組識別方法,采用如下步驟 (1)、對手寫詞組輸入進(jìn)行旋轉(zhuǎn)方向糾正,所述旋轉(zhuǎn)方向糾正采用基于重心平衡的 旋轉(zhuǎn)方向糾正方法,使得該詞組的每一個字的中心均處于水平線上; (2)、對詞組整體提取基于彈性網(wǎng)格方向特征,使得所提取的特征向量的分布呈高 斯分布; (3)、利用修正的二次判決函數(shù)分類器對詞組整體進(jìn)行分類識別,得到識別結(jié)果。
為了使得本發(fā)明的技術(shù)效果更佳,所述步驟(1)和步驟(2)之間還包括一個預(yù)處 理步驟,具體操作如下 (A)、將手寫樣本進(jìn)行大小歸一化,采用一種保持長寬比的線性映射技術(shù)對原始的 詞組輸入序列進(jìn)行歸一化,將詞組的長度和寬度同時放大V倍,其中7 = Y^;,這里選取H 為64, height為詞組原來的高度; (B)、對手寫輸入詞組樣本添加虛擬筆畫針對用戶輸入的詞組的每一對相鄰的筆 畫,將前一筆的尾端和后一筆的始端連接起來,構(gòu)成新的筆畫,作為虛擬筆畫;
(C)、對用戶輸入的詞組樣本序列進(jìn)行重采樣將用戶的詞組的每一筆用等間隔的 點進(jìn)行重采樣,重采樣間隔設(shè)置成1 ; (D)、對用戶輸入的詞組樣本序列進(jìn)行平滑濾波。 本發(fā)明的基本原理是漢字詞組的書寫講究四平八穩(wěn),通常詞組中每一個字的重 心均近似處于同一條水平線上,因此即使詞組被旋轉(zhuǎn)后,只要能找到這條線,將其旋轉(zhuǎn)糾正 成水平線,則詞組的方向就能被糾正成水平方向,同時考慮到糾正后的詞組有可能是上下 顛倒的,且通常書寫方向都是從左到右的,因此通過詞組的書寫方向判斷可以將上下顛倒 的詞組糾正過來。 用戶在書寫詞組的時候,其輸入方式十分多樣化,每個單字符內(nèi)部的連筆和字符
間的連筆都會給導(dǎo)致相同詞組具有多種輸入模式,而本發(fā)明采用的虛擬筆畫等預(yù)處理技術(shù)
和基于彈性網(wǎng)格的特征提取技術(shù)可以很好的統(tǒng)一用戶不同的輸入模式而獲得很好的性能。
另外,修正的二次判決函數(shù)也已經(jīng)被證明是一種性能非常優(yōu)良的分類器技術(shù)。
本發(fā)明與已有的手寫識別方法相比,具有如下的優(yōu)點和有益效果 (1)、由于采用的是詞組手寫輸入,不限制是否連筆或草書,因此其輸入速度大大
超過單字符手寫輸入方式,而且這種無約束的詞組輸入方式與傳統(tǒng)的單字符輸入方式相比
也更加自然和容易被人們所接受。 (2)、由于采用了旋轉(zhuǎn)糾正機制,用戶即使在手持設(shè)備上傾斜著書寫,本發(fā)明也能 正確識別,現(xiàn)在還鮮有此類支持傾斜書寫連筆詞組的輸入方式出現(xiàn)。 (3)、由于采用整詞識別的方法,可以有效的避免了由于切分錯誤導(dǎo)致的最后識別 錯誤,特別是對于連筆草書書寫方式尤其如此。
圖1是本發(fā)明的系統(tǒng)結(jié)構(gòu)框圖; 圖2是本發(fā)明的旋轉(zhuǎn)方向糾正方法的流程框圖; 圖3是對具體手寫詞組樣本的旋轉(zhuǎn)糾正步驟示例;
圖4是本發(fā)明的預(yù)處理的流程框圖; 圖5是本發(fā)明的基于彈性網(wǎng)格的整詞特征提取的特征框圖;
圖6為本發(fā)明采用的8個方向子軸結(jié)構(gòu)示意圖。
具體實施例方式
下面結(jié)合附圖對本發(fā)明做進(jìn)一步的說明,實施本發(fā)明所用的識別設(shè)備可以采用手 寫板書寫漢字,用計算機進(jìn)行識別,用純平型顯示器顯示用戶圖形界面,可采用C/C++語言 編制各類處理程序,便能較好地實施本發(fā)明。 本發(fā)明的系統(tǒng)結(jié)構(gòu)框圖如附圖l所示,中文手寫詞組筆畫的時序點輸入后,首先 對手寫詞組輸入進(jìn)行旋轉(zhuǎn)方向糾正,然后對進(jìn)行旋轉(zhuǎn)糾正后的詞組整體進(jìn)行添加虛擬筆 畫,重采樣等預(yù)處理操作,接著利用基于彈性網(wǎng)格的方向特征提取技術(shù)對整詞進(jìn)行特征提 取,最后用基于修正的二次判決函數(shù)分類器進(jìn)行分類得到識別結(jié)果。 本發(fā)明的詞組旋轉(zhuǎn)方向糾正所采用的方法為基于重心平衡的旋轉(zhuǎn)方向糾正方法, 其流程圖如附圖2所示,具體步驟如下 (A)、將詞組按經(jīng)過其重心的垂直線劃分為左右兩部分。分別計算左右兩部分的重 心。計算兩重心在水平方向X軸上的投影的距離D工; (B)、將詞組按經(jīng)過其重心的水平線劃分為上下兩部分。分別計算上下兩部分的重 心。計算兩重心在垂直方向Y軸上的投影的距離D^
(C)、如果Di < D2,則順時針旋轉(zhuǎn)詞組90° ; (D)、將詞組按經(jīng)過其重心的垂線劃分為左右兩部分。分別計算左右兩部分的重 心; (e)、將計算出來的左右兩部分的重心進(jìn)行連線,計算該連線與水平方向的夾角
e,如果e < t,或者(180° -e) < i,則轉(zhuǎn)到步驟(g)。這里的T是一個預(yù)先定義好
的閾值,通常是一個很小的角度值;(F)、如果e <90° ,則將矩形順時針旋轉(zhuǎn)e角度,否則,將矩形逆時針旋轉(zhuǎn)
(180° -e)角度?;氐讲襟E(D); (g)將詞組按照通過重心的垂直線劃分為左右部分,如果書寫的第一筆的筆畫起
點落在右邊部分,則將整個詞組旋轉(zhuǎn)180° 。 以上步驟中所提到的重心均為書寫筆畫像素的重心。 對于具體的一個傾斜書寫的手寫詞組樣本"下午"的旋轉(zhuǎn)糾正過程如附圖3所示, 可以看出,經(jīng)過2次旋轉(zhuǎn)糾正后,該詞組被旋轉(zhuǎn)到水平位置。其中左右兩部分中間的小圓圈 分別為左右部分的重心。 本發(fā)明的預(yù)處理方法的流程圖如圖4所示,具體步驟如下 (A)、將手寫樣本進(jìn)行大小歸一化,本發(fā)明采用一種保持長寬比的線性映射技術(shù) 對原始的詞組輸入序列進(jìn)行歸一化,其二方法將詞組的長度和寬度同時放大V倍,其中
K = 1T^7,這里選取H為64, height為詞組原來的高度; (B)、對手寫輸入詞組樣本添加虛擬筆畫針對用戶輸入的詞組的每一對相鄰的筆 畫,將前一筆的尾端和后一筆的始端連接起來,構(gòu)成新的筆畫,稱之為虛擬筆畫。
(C)、對用戶輸入的詞組樣本序列進(jìn)行重采樣將用戶的詞組的每一筆(包括所有 的虛擬筆畫)用等間隔的點進(jìn)行重采樣,這里重采樣間隔設(shè)置成1。重采樣的目的是減少歸 一化后漢字樣本數(shù)據(jù)中連續(xù)點的距離的變化和一個筆畫的采樣點的數(shù)目變化。
(D)、對用戶輸入的詞組樣本序列進(jìn)行平滑濾波。 本發(fā)明的流程圖如圖5所示,具體步驟如下
(A)、針對用戶輸入的詞組樣本序列,提取序列中每一個點的方向向量,其方法如
下
假設(shè)P,.用戶輸入序列中任意一點,則該點的方向向:
t:定義如下
<formula>formula see original document page 7</formula>
如果A為起始端點 如果巧為非端點 如果^為末尾端點 (B)、對每一個序列點的方向向量進(jìn)行投影將每一個序列點的方向向量投影到8 個方向子軸上,所述8個方向子軸如附圖6所示,將每一個序列點的方向向量轉(zhuǎn)化為一個8 維的方向向量。其投影方法如下圖所示假設(shè)向量g是任意一個序列點的方向向量,然后用 如圖6所示的方法將其投影到其相鄰的兩個子方向上,其值分別為gl和&,再將其余6個 子方向的值設(shè)置為0,從而構(gòu)成了一個8維的方向向量。 (C)、將用戶輸入的詞組序列投影到一個二維圖像中,然后利用彈性網(wǎng)格技術(shù)將該 圖像劃分成8X16個子塊。其中彈性網(wǎng)格技術(shù)是一種根據(jù)字符圖像的像素分布,用非均勻 的網(wǎng)線對字符圖像進(jìn)行劃分,其原則是使得相鄰兩網(wǎng)線間的像素分布均勻。具體的說,設(shè)漢 字圖像長寬分別為M和N,K是彈性網(wǎng)格在水平方向上的網(wǎng)線數(shù),K則是在垂直方向上的網(wǎng) 線數(shù),那么,對于彈性網(wǎng)格在水平和垂直方向上的網(wǎng)線Ii和Ji,下列公式成立
<formula>formula see original document page 7</formula>(D)、對漢字圖像的每-
l,通過彈性網(wǎng)格劃分得到的8X 16
個序列點的8維方向向量進(jìn)行模糊化形成1024維的特征 128個子塊的中心點作為采樣點,這樣這個漢字詞組
圖像共有8X16二 128個采樣點,然后對于任意一個采樣點(Xi,y》的8維方向特征運用如 下的公式在每一個采樣點上提取模糊化后的方向特征
肌 FL 巧<formula>formula see original document page 7</formula> 其中G(x,y)是一個高斯濾波器,HL和VL分別代表二維高斯濾波器在水平方向和 垂直方向的半寬度,其大小取決于參數(shù)N和M,這樣就得到8X16X8 = 1024維的特征;
(E)、利用變換y = x°5對原始的1024維特征進(jìn)行特征變換形成最終的特征。該 方法的目的是為了使特征向量的分布更接近于高斯分布。
本發(fā)明中的基于修正的二次判決函數(shù)的分類器設(shè)計方法如下 (A)、根據(jù)已有的訓(xùn)練數(shù)據(jù),對于任意一個類別Ci,計算其的類中心mi和協(xié)方差矩
陣E i. (B)、計算修正的二次判決函數(shù)模型假設(shè)原始特征為D維(這里去取1024維),
對每個類的協(xié)方差矩陣E i進(jìn)行特征分解,得到其按特征值降序排列特征向量矩陣①i(其
每一個特征向量表示為小ij, j = 1,2,…,D)和特征值矩陣Ai(其每一個特征值表示為
入ij, j = 1,2,…,D).則E i共有D個特征值和其對應(yīng)的特征向量。取其前K(這里K取
12)個特征向量4ik, k = 1,2,…,K為主特征向量,其后(D-K)個特征值被設(shè)定為固定的
值S i.則修正的二次判決函數(shù)模型為
k 1 1 2 k g = Z^~[(《(x—附,)]2+7(|x-m』)+ Zlog4.+(>/ — A:)log《.
>i 《 >i (C)、對于一個新來的測試樣本,利用修正的二次判決函數(shù)模型計算該樣本與每個 類的二次判決函數(shù)值,所得的值最小的那個類別即為該樣本所述的類別。即X G Ck,如果
A: = arg min g; (x)
權(quán)利要求
一種旋轉(zhuǎn)無關(guān)的手寫中文草書詞組識別方法,其特征在于采用如下步驟(1)、對手寫詞組輸入進(jìn)行旋轉(zhuǎn)方向糾正,所述旋轉(zhuǎn)方向糾正采用基于重心平衡的旋轉(zhuǎn)方向糾正方法,使得該詞組的每一個字的中心均處于水平線上;(2)、對詞組整體提取基于彈性網(wǎng)格的方向特征,使得所提取的特征向量的分布呈高斯分布;(3)、利用修正的二次判決函數(shù)分類器對詞組整體進(jìn)行分類識別,得到識別結(jié)果。
2. 根據(jù)權(quán)利要求1所述的旋轉(zhuǎn)無關(guān)的手寫中文草書詞組識別方法,其特征在于所述步 驟(1)具體包括如下操作(11) 、將詞組按經(jīng)過其重心的垂直線劃分為左右兩部分,分別計算左右兩部分的重心, 以及計算兩重心在水平方向X軸上的投影的距離D工;(12) 、將詞組按經(jīng)過其重心的水平線劃分為上下兩部分,分別計算上下兩部分的重心, 以及計算兩重心在垂直方向Y軸上的投影的距離D2 ;(13) 、如果D工<02,則順時針旋轉(zhuǎn)詞組90° ,并執(zhí)行步驟(14),否則跳過本步驟,直接 執(zhí)行步驟(14);(14) 、將詞組按經(jīng)過其重心的垂線劃分為左右兩部分,分別計算左右兩部分的重心;(15) 、將計算出來的左右兩部分的重心進(jìn)行連線,計算該連線與水平方向的夾角e , 如果9小于預(yù)先設(shè)置的閾值t,或者18(T -e小于i,則轉(zhuǎn)到步驟(17),否則執(zhí)行步驟 (16);(le)、如果e大于t且小于90° ,則將詞組順時針旋轉(zhuǎn)e角度,否則,將詞組逆時針 旋轉(zhuǎn)iso。 -e角度,并返回步驟(14);(17)將詞組按照通過重心的垂直線劃分為左右部分,如果書寫的第一筆的筆畫起點落 在右邊部分,則將整個詞組旋轉(zhuǎn)180。。
3. 根據(jù)權(quán)利要求2所述的旋轉(zhuǎn)無關(guān)的手寫中文草書詞組識別方法,其特征在于所述重 心均采用書寫筆畫像素的重心。
4. 根據(jù)權(quán)利要求1所述的旋轉(zhuǎn)無關(guān)的手寫中文草書詞組識別方法,其特征在于所述步 驟(2)具體包括如下步驟(21) 、針對用戶輸入的詞組樣本序列,提取序列中每一個點的方向向量;(22) 、對每一個序列點的方向向量進(jìn)行投影,將每一個序列點的方向向量投影到8個 方向子軸上,將每一個序列點的方向向量轉(zhuǎn)化為一個8維的方向向量,該8維包括0° 、 45° 、90° 、135° 、180° 、225° 、270° 、315°(23) 、將用戶輸入的詞組序列投影到一個二維圖像中,然后利用彈性網(wǎng)格技術(shù)將該圖 像劃分成8X 16個子塊,假設(shè)漢字詞組的圖像的長寬分別為M和N,K是彈性網(wǎng)格在水平方 向上的網(wǎng)線數(shù),^則是在垂直方向上的網(wǎng)線數(shù),那么,對于彈性網(wǎng)格在水平和垂直方向上的網(wǎng)線Ii和Jj,下列公式成立<formula>formula see original document page 2</formula>(24) 、對漢字圖像的每一個序列點的8維方向向量進(jìn)行模糊化形成1024維的特征將通過彈性網(wǎng)格劃分得到的8X16 = 128個子塊的中心點作為采樣點,這樣這個漢字詞組圖 像共有8X16二 128個采樣點,然后對于任意一個采樣點(Xi,y》的8維方向特征運用如下 的公式在每一個采樣點上提取模糊化后的方向特征<formula>formula see original document page 3</formula>其中G(x,y)是一個高斯濾波器,HL和VL分別代表二維高斯濾波器在水平方向和垂直 方向的半寬度,其大小取決于參數(shù)N和M,這樣就得到8X16X8 = 1024維的特征; (25)、利用變換y = x°5對原始的1024維特征進(jìn)行特征變換形成最終的特征。
5. 根據(jù)權(quán)利要求1所述的旋轉(zhuǎn)無關(guān)的手寫中文草書詞組識別方法,其特征在于所述步 驟(3)具體包括如下步驟(31) 、根據(jù)二次判決函數(shù)分類器已有的訓(xùn)練數(shù)據(jù),對于任意一個類別Ci,計算其中心mi 和協(xié)方差矩陣E i;(32) 、計算修正的二次判決函數(shù)模型,令原始特征為D維,對每個類別的協(xié)方差矩陣E i進(jìn)行特征分解,得到按特征值降序排列特征向量矩陣①i,其中每一個特征向量表示為小ij, j = 1,2,…,D,和特征值矩陣Ai,其中每一個特征值表示為^j, j = 1,2,…,D,則E i 共有D個特征值和其對應(yīng)的特征向量,取其前K個特征向量4ik,k= 1,2,…,K為主特征 向量,其后D-K個特征值被設(shè)定為固定的值Si,則修正的二次判決函數(shù)模型為<formula>formula see original document page 3</formula>(33) 、對于一個新來的測試樣本,利用修正的二次判決函數(shù)模型計算該樣本與每個 類的二次判決函數(shù)值,所得的值最小的那個類別即為該樣本所述的類別,即x G Ck,如果 A: = arg min (x)
6. 根據(jù)權(quán)利要求1所述的旋轉(zhuǎn)無關(guān)的手寫中文草書詞組識別方法,其特征在于所述步驟(1)和步驟(2)之間還包括一個預(yù)處理步驟,具體操作如下(A) 、將手寫樣本進(jìn)行大小歸一化,采用一種保持長寬比的線性映射技術(shù)對原始的詞組 輸入序列進(jìn)行歸一化,將詞組的長度和寬度同時放大V倍,其中「 = ,這里選取H為 64, height為詞組原來的高度;(B) 、對手寫輸入詞組樣本添加虛擬筆畫針對用戶輸入的詞組的每一對相鄰的筆畫,將前一筆的尾端和后一筆的始端連接起來,構(gòu)成新的筆畫,作為虛擬筆畫;(C) 、對用戶輸入的詞組樣本序列進(jìn)行重采樣將用戶的詞組的每一筆用等間隔的點進(jìn) 行重采樣,重采樣間隔設(shè)置成1 ;(D) 、對用戶輸入的詞組樣本序列進(jìn)行平滑濾波。
全文摘要
本發(fā)明提供了一種旋轉(zhuǎn)無關(guān)的手寫中文草書詞組識別方法,采用如下步驟(1)對手寫詞組輸入進(jìn)行旋轉(zhuǎn)方向糾正,所述旋轉(zhuǎn)方向糾正采用基于重心平衡的旋轉(zhuǎn)方向糾正方法,使得該詞組的每一個字的中心均處于水平線上;(2)對詞組整體提提取基于彈性網(wǎng)格的方向特征,使得所提取的特征向量的分布呈高斯分布;(3)利用修正的二次判決函數(shù)分類器對詞組整體進(jìn)行分類識別,得到識別結(jié)果。
文檔編號G06K9/32GK101697200SQ20091019267
公開日2010年4月21日 申請日期2009年9月25日 優(yōu)先權(quán)日2009年9月25日
發(fā)明者丁凱, 金連文 申請人:華南理工大學(xué);