專利名稱:一種基于分類器集成的手寫維文字符識(shí)別方法
技術(shù)領(lǐng)域:
本發(fā)明屬于模式識(shí)別中的文字識(shí)別技術(shù)領(lǐng)域,主要涉及手寫體識(shí)別領(lǐng)域,特別是涉及手寫維文字符識(shí)別領(lǐng)域,具體是一種基于分類器集成的手寫維文字符識(shí)別方法,用于在移動(dòng)平臺(tái)即手機(jī)上實(shí)現(xiàn)維文字符的手寫輸入。
背景技術(shù):
維吾爾文是新疆維吾爾民族交際和工作的主要文字之一,屬阿爾泰語(yǔ)系突厥語(yǔ)族,是一種粘連的拼音文字?,F(xiàn)行的維吾爾文共有32個(gè)字母,其中有8個(gè)元音字母,24個(gè)輔音字母,根據(jù)在單詞中的位置不同,每個(gè)字母有前連式、后連式、雙連式、單立式等2 8種書寫形式,總共有128個(gè)字符。從形體上看,維吾爾文字符采用自右向左、自上向下的手寫方式,沿著一條水平線即基線書寫的部分稱為主體部分,在維文識(shí)別過程中用主體部分來(lái)辨別字符的主要形態(tài),除基線以外的符號(hào)、點(diǎn)等稱為附加部分,附加部分是區(qū)分相似字符的依據(jù)。維吾爾文由維吾爾單詞組成,每個(gè)單詞由幾個(gè)到十幾個(gè)維吾爾字符組成,字符沿著基線相連書寫。研究維吾爾文字符的處理和識(shí)別有助于提升新疆少數(shù)民族地區(qū)的文化交流、信息交流和科技經(jīng)濟(jì)的發(fā)展。在市場(chǎng)上,維吾爾文印刷體文字識(shí)別系統(tǒng)已經(jīng)廣泛的應(yīng)用于維吾爾文信息處理的各個(gè)領(lǐng)域,如辦公自動(dòng)化、出版印刷業(yè)等多種方面。但是,維吾爾文手寫技術(shù)的研究還處于初步探索階段。目前,手寫維文識(shí)別方面的研究和成果均較少,在中國(guó)申請(qǐng)的專利也較少,中國(guó)專利申請(qǐng)?zhí)?010102041177. 5的發(fā)明申請(qǐng)是西安電子科技大學(xué)盧朝陽(yáng)等提出的一種手寫體維吾爾文字符識(shí)別方法,該申請(qǐng)?zhí)岢隽?128類的手寫體維文字符識(shí)別的方法,其首先提出了一種識(shí)別手寫維文字符的方法,奠定了手寫維文字符識(shí)別的基礎(chǔ),該方法針對(duì)128類維文字符先建立維文字符部件庫(kù)和部件字典,是維文字符特征提取和識(shí)別的基礎(chǔ),然后對(duì)單個(gè)部件提取時(shí)分方向特征,最后以加權(quán)距離融合函數(shù)綜合各部件特征,用以識(shí)別整個(gè)字符。該發(fā)明申請(qǐng)首先完整的建立了一種手寫維文字符識(shí)別的方法,開創(chuàng)了手寫維文字符識(shí)別的領(lǐng)域,但其手寫維文字符識(shí)別算法的最高識(shí)別率為84. 23%,識(shí)別率不高。目前,128類的維文單字符識(shí)別的研究還較少,識(shí)別率普遍較低。如何將維吾爾文字符特定的書寫規(guī)則與分類識(shí)別算法有效結(jié)合起來(lái),以及將不同分類器集成,是手寫體維文識(shí)別一個(gè)亟待解決的問題。
發(fā)明內(nèi)容
本發(fā)明的目的是克服現(xiàn)有技術(shù)存在的識(shí)別率較低的技術(shù)問題,提供一種識(shí)別率較高和識(shí)別時(shí)間較短的基于分類器集成的手寫維文字符識(shí)別方法,該方法采用不同的分類器進(jìn)行分類,并對(duì)不同的分類器進(jìn)行集成,與使用單分類器的方法相比,其平均識(shí)別率有了顯著的提高。為實(shí)現(xiàn)發(fā)明目的,本發(fā)明采用的技術(shù)方案說明如下
本發(fā)明是一種基于分類器集成的手寫維文字符識(shí)別方法對(duì)手寫維文字符的識(shí)別過程包括步驟I對(duì)采集到的手寫維文字符進(jìn)行預(yù)處理,去除采集維文字符過程中附加的噪聲,得到規(guī)范化的維文字符;步驟2提取維文字符的特征向量,將規(guī)范化的維文字符從對(duì)象空間映射到特征空間,得到維文字符的方向線素,即維文字符的特征向量;步驟3分別使用 MQDF (Modif ied Quadratic Discriminant Function,修正的二次分類函數(shù))分類器和BP(Back Propagation,后向傳播)神經(jīng)網(wǎng)絡(luò)分類器對(duì)維文字符特征向量分類識(shí)別,得到分類識(shí)別結(jié)果,MQDF分類器的分類結(jié)果是置信值集I和BP神經(jīng)網(wǎng)絡(luò)分類器的分類結(jié)果是置信值集2 ;步驟4對(duì)兩種分類識(shí)別的結(jié)果置信值集I和置信值集2進(jìn)行集成,計(jì)算128個(gè)維文字符中每個(gè)候選字符的兩個(gè)置信值的加權(quán)和,確定最大的加權(quán)和值,得到最終的分類識(shí)別結(jié)果。本發(fā)明采用一種統(tǒng)計(jì)的方法,首先對(duì)維文字符進(jìn)行預(yù)處理,去除由于手寫所帶來(lái)的噪聲,接著提取維文字符的特征向量,并將特征向量分別輸入MQDF分類器和BP神經(jīng)網(wǎng)絡(luò)分類器進(jìn)行分類,最后對(duì)分類識(shí)別的結(jié)果集成,得到最終的識(shí)別結(jié)果并給出候選集。本發(fā)明的實(shí)現(xiàn)還在于手寫維文字符預(yù)處理過程包括I. I裁剪手寫維文字符圖像,去除維文字符圖像中不包含文字軌跡點(diǎn)的區(qū)域,留下包含文字軌跡點(diǎn)的區(qū)域;1. 2對(duì)裁剪后的維文字符進(jìn)行歸一化處理,將大小不同的維文字符圖像歸一化為大小相同的圖像;1. 3對(duì)歸一化后的維文字符圖像進(jìn)行軌跡點(diǎn)重采樣,每隔幾個(gè)點(diǎn)進(jìn)行采樣,若原圖像中存在象素點(diǎn)比較緊密而歸一化處理后象素點(diǎn)比較稀疏的地方則補(bǔ)象素點(diǎn);1. 4對(duì)重采樣后的維文字符圖像進(jìn)行濾波,得到規(guī)范化的維文字符。本發(fā)明首先對(duì)維文字符圖像進(jìn)行裁剪,以圖像中的文字為邊界,將其中不包括文字信息的部分去除,只保留包含文字的矩形區(qū)域。接著將裁剪后的圖像進(jìn)行歸一化處理,將裁剪后大小不一樣的維文字符圖像轉(zhuǎn)換為大小一樣的維文字符圖像。然后將歸一化后的圖像進(jìn)行軌跡點(diǎn)重采樣,減少由于歸一化帶來(lái)的字符拉伸、延展的畸變。最后將重采樣后的維文圖像進(jìn)行濾波,降低圖像的噪聲。本發(fā)明的實(shí)現(xiàn)還在于維文字符特征向量提取的過程包括2. I使用彈性網(wǎng)格對(duì)規(guī)范化的維文字符圖像進(jìn)行劃分;2. 2計(jì)算每個(gè)網(wǎng)格內(nèi)的象素點(diǎn)的方向線素,并計(jì)算出每個(gè)網(wǎng)格的方向象素;2. 3將維文字符的網(wǎng)格降維,并計(jì)算出降維后的維文字符每個(gè)網(wǎng)格的方向象素;2. 4對(duì)所有網(wǎng)格的方向線素進(jìn)行合并,用合并后的方向線素表示維文字符的方向線素,即維文字符的特征向量。本發(fā)明特征提取過程中首先使用彈性網(wǎng)格分割維文圖像。又計(jì)算網(wǎng)格內(nèi)的每個(gè)象素的方向線素,并計(jì)算每個(gè)網(wǎng)格的方向線素。將所有網(wǎng)格的方向線素合并,得到維文字符的方向線素。本發(fā)明的實(shí)現(xiàn)還在于使用MQDF分類器和BP神經(jīng)網(wǎng)絡(luò)分類器進(jìn)行分類的過程包括3. I對(duì)115套的128類維文字符庫(kù)進(jìn)行劃分,將其中的60套作為訓(xùn)練樣本庫(kù),剩余的55套作為識(shí)別樣本庫(kù),115套128類手寫維文字符庫(kù)是基于移動(dòng)終端即手機(jī)平臺(tái)采集的由維吾爾族人手寫的字符庫(kù);3. 2使用MQDF分類器對(duì)60套訓(xùn)練樣本庫(kù)訓(xùn)練,得到128類維文字符的平均MQDF
確信度;
3. 3將待識(shí)別維文字符的特征向量應(yīng)用于MQDF分類器,得到對(duì)應(yīng)的候選字符集I,候選字符集I有128個(gè)候選字符;3. 4對(duì)待識(shí)別維文字符的MQDF候選字符集I進(jìn)行概率處理,轉(zhuǎn)化為候選字符集I對(duì)應(yīng)的后驗(yàn)概率,就是候選的置信值集1,置信值集I有128個(gè)置信值;3. 5使用BP神經(jīng)網(wǎng)絡(luò)分類器對(duì)115套的128類維文字符庫(kù)進(jìn)行劃分,對(duì)其中的60套訓(xùn)練樣本庫(kù)訓(xùn)練,得到神經(jīng)網(wǎng)絡(luò)分類器的系數(shù);3. 6將待識(shí)別維文字的特征向量應(yīng)用于BP神經(jīng)網(wǎng)絡(luò)分類器,得到對(duì)應(yīng)的候選字符集2,候選字符集2有128個(gè)候選字符;3. 7對(duì)待識(shí)別維文字符的BP神經(jīng)網(wǎng)絡(luò)候選字符集2進(jìn)行概率處理,轉(zhuǎn)化為候選集對(duì)應(yīng)的后驗(yàn)概率,就是候選的置信值集2,置信值集2有128個(gè)置信值。本發(fā)明采用了不同的分類器分別對(duì)手寫維文字符的特征向量進(jìn)行分類,采用的MQDF分類器和BP神經(jīng)網(wǎng)絡(luò)分類器復(fù)雜度低,易于實(shí)現(xiàn)。分類過程能充分考慮特征向量在特征空間中分布的特點(diǎn),具有較好的魯棒性和較高的識(shí)別率。本發(fā)明的實(shí)現(xiàn)還在于對(duì)分類識(shí)別結(jié)果集成的過程包括4. I通過實(shí)驗(yàn)確定128個(gè)維文字符中每個(gè)候選字符的兩個(gè)置信值(即MQDF的置信值和BP神經(jīng)網(wǎng)絡(luò)的置信值)的加權(quán)和的權(quán)重系數(shù)Y k ;4. 2根據(jù)得到的加權(quán)和的權(quán)重系數(shù)Y k,計(jì)算128個(gè)維文字符中每個(gè)候選字符的兩個(gè)置信值(MQDF的置信值和BP神經(jīng)網(wǎng)絡(luò)的置信值)的加權(quán)和8“1) = Y (wjx) + Y 2p2 (Wi/x),得到每個(gè)字符最終的置信值,128個(gè)維文字符的置信值形成最終的置信值集,式中Pi (WiA)表示MQDF分類器對(duì)特征向量X所屬類別Wi的概率估計(jì),p2 (WiZx)表示BP神經(jīng)網(wǎng)絡(luò)對(duì)特征向量X所屬類別Wi的概率估計(jì);4. 3根據(jù)最終置信值集中128個(gè)置信值大小,選定最大的置信值對(duì)應(yīng)的字符,確定為待識(shí)別字符的識(shí)別結(jié)果。本發(fā)明采用的分類器集成方法復(fù)雜度低,易于實(shí)現(xiàn)。相對(duì)于獨(dú)立分類器,分類器的集成可以充分利用各個(gè)獨(dú)立分類器的優(yōu)點(diǎn),能有效提高維文字符的識(shí)別率。與現(xiàn)有技術(shù)相比,本發(fā)明具有如下的優(yōu)點(diǎn)(I)本發(fā)明復(fù)雜度低,實(shí)現(xiàn)較簡(jiǎn)單,具有較好的魯棒性。(2)本發(fā)明有效利用了不同分類器的優(yōu)點(diǎn),對(duì)不同分類器的集成就是集合不同分類器的優(yōu)點(diǎn),提高了手寫維文字符識(shí)別的平均識(shí)別率。(3)本發(fā)明平均識(shí)別時(shí)間較短,達(dá)到了實(shí)用價(jià)值。
圖I為本發(fā)明的算法示意圖2為BP神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)示意圖;圖3為128個(gè)維文字符示意圖;圖4為手寫維文字符的部分樣本;圖5為權(quán)值矩陣米樣過程不意圖;圖6為三種算法的平均識(shí)別率曲線圖。
具體實(shí)施例方式為了使本發(fā)明的技術(shù)方案更加清楚,下面結(jié)合附圖對(duì)本發(fā)明作進(jìn)一步的說明。本發(fā)明是使用移動(dòng)終端即手機(jī)平臺(tái)采集的由維吾爾族人手寫的字符庫(kù),在個(gè)人電腦上(處理器Intel酷睿2雙核T6400,內(nèi)存2GB,主頻2GHZ)進(jìn)行了維文字符識(shí)別的實(shí)驗(yàn)。本發(fā)明手寫維吾爾文字符識(shí)別方法是基于128類維文字符,128類維文字符參照?qǐng)D3。實(shí)施例1
本發(fā)明一種基于分類器集成的手寫維文字符識(shí)別方法,參見圖I :對(duì)手寫維文字符識(shí)別過程包括步驟1對(duì)采集到的手寫維文字符進(jìn)行預(yù)處理,去除采集維文字符過程中附加的噪聲,得到規(guī)范化的維文字符。維文字符預(yù)處理過程包括I. I裁剪手寫維文字符圖像,去除維文字符圖像中不包含文字軌跡點(diǎn)的區(qū)域,留下包含文字軌跡點(diǎn)的區(qū)域。I. 2對(duì)裁剪后的維文字符進(jìn)行歸一化處理,將大小不同的維文字符圖像歸一化為大小相同的圖像。I. 3對(duì)歸一化后的維文字符圖像進(jìn)行軌跡點(diǎn)重采樣,每隔幾個(gè)點(diǎn)進(jìn)行采樣,本例中每隔3點(diǎn)采樣,若原圖像中存在象素點(diǎn)比較緊密而歸一化處理后象素點(diǎn)比較稀疏的地方則補(bǔ)象素點(diǎn)。1. 4對(duì)重采樣后的維文字符圖像進(jìn)行濾波,得到規(guī)范化的維文字符。步驟2提取維文字符的特征向量,將規(guī)范化的維文字符從對(duì)象空間映射到特征空間,得到維文字符的方向線素,即維文字符的特征向量。維文字符特征向量提取的過程包括2. 1使用彈性網(wǎng)格對(duì)規(guī)范化的維文字符圖像進(jìn)行劃分;2. 2計(jì)算每個(gè)網(wǎng)格內(nèi)的象素點(diǎn)的方向線素,并計(jì)算出每個(gè)網(wǎng)格的方向象素;2. 3將維文字符的網(wǎng)格降維,并計(jì)算出降維后的每個(gè)網(wǎng)格的方向象素;2. 4對(duì)所有網(wǎng)格的方向線素進(jìn)行合并,用合并后的方向線素表示維文字符的方向線素,即維文字符的特征向量。步驟3分別使用MQDF分類器和BP神經(jīng)網(wǎng)絡(luò)分類器對(duì)維文字符特征向量分類識(shí)另O,得到分類識(shí)別結(jié)果,MQDF分類器的分類結(jié)果是置信值集1,BP神經(jīng)網(wǎng)絡(luò)分類器的分類結(jié)果是置信值集2。使用MQDF分類器和BP神經(jīng)網(wǎng)絡(luò)分類器進(jìn)行分類的過程包括3. 1對(duì)115套的128類維文字符庫(kù)進(jìn)行劃分,將其中的60套作為訓(xùn)練樣本庫(kù),剩余的55套作為識(shí)別樣本庫(kù),115套128類手寫維文字符庫(kù)是基于移動(dòng)終端即手機(jī)平臺(tái)采集的由維吾爾族人手寫的字符庫(kù)。3. 2使用MQDF分類器對(duì)60套訓(xùn)練樣本庫(kù)訓(xùn)練,得到128類維文字符的平均MQDF確信度。3. 3將待識(shí)別維文字符的特征向量應(yīng)用于MQDF分類器,得到對(duì)應(yīng)的候選字符集I,候選字符集I有128個(gè)候選字符。3. 4對(duì)待識(shí)別維文字符的MQDF候選字符集I進(jìn)行概率處理,轉(zhuǎn)化為候選字符集I對(duì)應(yīng)的后驗(yàn)概率,就是候選的置信值集1,置信值集I有128個(gè)置信值。本發(fā)明采用的MQDF分類器易于實(shí)現(xiàn),分類過程能充分考慮特征向量在特征空間中分布的特點(diǎn)。 3. 5使用BP神經(jīng)網(wǎng)絡(luò)分類器對(duì)115套的128類維文字符庫(kù)進(jìn)行劃分,對(duì)其中的60套訓(xùn)練樣本庫(kù)訓(xùn)練,得到神經(jīng)網(wǎng)絡(luò)分類器的系數(shù)。3. 6將待識(shí)別維文字的特征向量應(yīng)用于BP神經(jīng)網(wǎng)絡(luò)分類器,得到對(duì)應(yīng)的候選字符集2,候選字符集2有128個(gè)候選字符。3. 7對(duì)待識(shí)別維文字符的BP神經(jīng)網(wǎng)絡(luò)候選字符集2進(jìn)行概率處理,轉(zhuǎn)化為候選集對(duì)應(yīng)的后驗(yàn)概率,就是候選的置信值集2,置信值集2有128個(gè)置信值。本發(fā)明采用的BP神經(jīng)網(wǎng)絡(luò)分類器結(jié)構(gòu)簡(jiǎn)單,具有較好的魯棒性和較高的識(shí)別率。步驟4對(duì)兩種分類識(shí)別的結(jié)果置信值集I和置信值集2進(jìn)行集成,計(jì)算128個(gè)維文字符中每個(gè)候選字符的兩個(gè)置信值的加權(quán)和,選擇最大的加權(quán)和值作為最終的分類識(shí)別結(jié)果。對(duì)分類識(shí)別結(jié)果集成的過程包括4. I通過實(shí)驗(yàn)確定128個(gè)維文字符中每個(gè)候選字符的兩個(gè)置信值(即MQDF的置信值和BP神經(jīng)網(wǎng)絡(luò)的置信值)的加權(quán)和的權(quán)重系數(shù)Yk,取Y1 = O-I, Y2 = O. 9ο4. 2根據(jù)得到的加權(quán)和的權(quán)重系數(shù)Y k,計(jì)算128個(gè)維文字符中每個(gè)候選字符的兩個(gè)置信值的加權(quán)和gi(x) = Y lPl (WiAHY2P2(WiA),得到每個(gè)字符最終的置信值,128個(gè)維文字符的置信值形成最終的置信值集。因?yàn)楸景l(fā)明采用了兩個(gè)分類器,所以128個(gè)維文字符中每個(gè)候選字符均有兩個(gè)置信值,其中有MQDF的置信值和BP神經(jīng)網(wǎng)絡(luò)的置信值,式中Pi (WiA)表示MQDF分類器對(duì)特征向量X所屬類別Wi的概率估計(jì),p2 (WiZx)表示BP神經(jīng)網(wǎng)絡(luò)對(duì)特征向量X所屬類別Wi的概率估計(jì)。4. 3根據(jù)最終置信值集中128個(gè)置信值大小,選定最大的置信值的字符,確定為待識(shí)別字符的識(shí)別結(jié)果。本發(fā)明使用了兩種分類器,并將結(jié)果集成,提高了識(shí)別率。實(shí)施例2基于分類器集成的手寫維文字符識(shí)別方法同實(shí)施例1,結(jié)合具體識(shí)別過程對(duì)本發(fā)明做更詳細(xì)的說明。本發(fā)明的算法如圖I所示,主要包括5個(gè)部分預(yù)處理、特征提取、MQDF分類器、BP神經(jīng)網(wǎng)絡(luò)分類器、分類器集成。第一部分,預(yù)處理。維文字符的預(yù)處理由四個(gè)部分組成,分別是裁剪、歸一化、軌跡點(diǎn)重采樣、濾波。(I)將手機(jī)上采集的手寫維文字符的軌跡點(diǎn)保存下來(lái),形成維文字符圖像,如圖4所示,圖4中前三行均為手寫維文字符,第四行為該維文字符的對(duì)應(yīng)印刷體。對(duì)采集的維文字符圖像進(jìn)行裁剪,將圖像中不包含文字信息的區(qū)域去除掉,只保留圖像中包含文字信息的矩形區(qū)域。(2)對(duì)裁剪后的圖像做歸一化處理,將大小不同的pXQ的字符圖像歸一化為大小相同的NXN的字符圖像,其中P、Q為圖像的行列數(shù),P、Q取值由于手寫的隨意性具有不確定性,N為圖像歸一化后的行列數(shù),本例中N = 64,其實(shí)質(zhì)就是對(duì)圖像平移和縮放。(3)將大小相同的64X64的字符圖像進(jìn)行軌跡點(diǎn)重采樣,即在圖像中每隔幾個(gè)點(diǎn)進(jìn)行采樣,本例中每隔4點(diǎn)采樣,若原圖像中存在象素點(diǎn)比較緊密而歸一化處理后象素點(diǎn)比較稀疏的地方則補(bǔ)象素點(diǎn),若圖像中無(wú)上述現(xiàn)象,則不作補(bǔ)象素點(diǎn)處理。(4)將重 采樣后的字符圖像進(jìn)行濾波,濾波采用字符象素點(diǎn)的前后3點(diǎn)加權(quán)平均的方法,以減少了由于書寫抖動(dòng)等原因帶來(lái)的噪聲。第二部分,特征提取。本發(fā)明提取的特征向量是方向線素特征向量,其過程如下(I)使用8X8的彈性網(wǎng)格將維文字符圖像劃分成8X8的網(wǎng)格,根據(jù)筆畫密度函數(shù)來(lái)劃分,筆畫密度大的區(qū)域網(wǎng)格密,筆畫密度小的區(qū)域網(wǎng)格疏。(2)計(jì)算每個(gè)網(wǎng)格內(nèi)的象素點(diǎn)的方向線素。給定一個(gè)軌跡點(diǎn)Pp它的方向特征
VrpJ-IpJ^,其向坐標(biāo)中的每隔45度的8個(gè)方向上進(jìn)行垂直投影,只有兩個(gè)方向上有投影
值,其余方向上都是0,則8個(gè)方向上的值組成的向量就是軌跡點(diǎn)Pj的方向線素,方向線素特征向量的維數(shù)為8。對(duì)網(wǎng)格內(nèi)的所有點(diǎn)的方向線素求平均,得到每個(gè)網(wǎng)格的方向線素。(3)將維文字符的網(wǎng)格降維,并計(jì)算出降維后的維文字符網(wǎng)格的方向象素。將8X8的網(wǎng)格擴(kuò)展為9X9的網(wǎng)格,對(duì)8X8網(wǎng)格分別補(bǔ)充一行和一列,將原來(lái)網(wǎng)格的最后一行
權(quán)利要求
1.一種基于分類器集成的手寫維文字符識(shí)別方法,其特征在于識(shí)別過程包括 步驟I對(duì)采集到的手寫維文字符進(jìn)行預(yù)處理,去除采集維文字符過程中附加的噪聲,得到規(guī)范化的維文字符; 步驟2提取維文字符的特征向量,將規(guī)范化的維文字符從對(duì)象空間映射到特征空間,得到維文字符的方向線素,即維文字符的特征向量; 步驟3分別使用MQDF分類器和BP神經(jīng)網(wǎng)絡(luò)分類器對(duì)維文字符特征向量分類識(shí)別,得到分類識(shí)別結(jié)果,MQDF分類器的分類結(jié)果是置信值集I和BP神經(jīng)網(wǎng)絡(luò)分類器的分類結(jié)果是置信值集2 ; 步驟4對(duì)兩種分類識(shí)別的結(jié)果置信值集I和置信值集2進(jìn)行集成,計(jì)算128個(gè)維文字符中每個(gè)候選字符的兩個(gè)置信值的加權(quán)和,選擇最大的加權(quán)和值作為最終的分類識(shí)別結(jié)果。
2.根據(jù)權(quán)利要求I所述的基于分類器集成的手寫維文字符識(shí)別方法,其特征在于 維文字符預(yù)處理過程包括 I. I裁剪手寫維文字符圖像,去除維文字符圖像中不包含文字軌跡點(diǎn)的區(qū)域,留下包含文字軌跡點(diǎn)的區(qū)域; I. 2對(duì)裁剪后的維文字符進(jìn)行歸一化處理,將大小不同的維文字符圖像歸一化為大小相同的圖像; I. 3對(duì)歸一化后的維文字符圖像進(jìn)行軌跡點(diǎn)重采樣,每隔幾個(gè)點(diǎn)進(jìn)行采樣,若原圖像中存在象素點(diǎn)比較緊密而歸一化處理后象素點(diǎn)比較稀疏的地方則補(bǔ)象素點(diǎn); 1.4對(duì)重采樣后的維文字符圖像進(jìn)行濾波,得到規(guī)范化的維文字符。
3.根據(jù)權(quán)利要求2所述的基于分類器集成的手寫維文字符識(shí)別方法,其特征在于 維文字符特征向量提取的過程包括 2.I使用彈性網(wǎng)格對(duì)規(guī)范化的維文字符圖像進(jìn)行劃分; 2.2計(jì)算每個(gè)網(wǎng)格內(nèi)的象素點(diǎn)的方向線素,并計(jì)算出每個(gè)網(wǎng)格的方向象素; 2.3將維文字符的網(wǎng)格降維,并計(jì)算出降維后的維文字符每個(gè)網(wǎng)格的方向象素; 2.4對(duì)所有網(wǎng)格的方向線素進(jìn)行合并,用合并后的方向線素表示維文字符的方向線素,即維文字符的特征向量。
4.根據(jù)權(quán)利要求3所述的基于分類器集成的手寫維文字符識(shí)別方法,其特征在于 使用MQDF分類器和BP神經(jīng)網(wǎng)絡(luò)分類器進(jìn)行分類的過程包括 、 3.I對(duì)115套的128類維文字符庫(kù)進(jìn)行劃分,將其中的60套作為訓(xùn)練樣本庫(kù),剩余的、55、套作為識(shí)別樣本庫(kù),115套128類手寫維文字符庫(kù)是基于移動(dòng)終端即手機(jī)平臺(tái)采集的由維吾爾族人手寫的字符庫(kù); 、 3.2使用MQDF分類器對(duì)60套訓(xùn)練樣本庫(kù)訓(xùn)練,得到128類維文字符的平均MQDF確信、度; 、3.3將待識(shí)別維文字符的特征向量應(yīng)用于MQDF分類器,得到對(duì)應(yīng)的候選字符集I,候選字符集I有128個(gè)候選字符; 、3.4對(duì)待識(shí)別維文字符的MQDF候選字符集I進(jìn)行概率處理,轉(zhuǎn)化為候選字符集I對(duì)應(yīng)的后驗(yàn)概率,就是候選的置信值集1,置信值集I有128個(gè)置信值; 、3.5使用BP神經(jīng)網(wǎng)絡(luò)分類器對(duì)115套的128類維文字符庫(kù)進(jìn)行劃分,對(duì)其中的60套訓(xùn)練樣本庫(kù)訓(xùn)練,得到神經(jīng)網(wǎng)絡(luò)分類器的系數(shù);·3.6將待識(shí)別維文字的特征向量應(yīng)用于BP神經(jīng)網(wǎng)絡(luò)分類器,得到對(duì)應(yīng)的候選字符集2,候選字符集2有128個(gè)候選字符; ·3.7對(duì)待識(shí)別維文字符的BP神經(jīng)網(wǎng)絡(luò)候選字符集2進(jìn)行概率處理,轉(zhuǎn)化為候選集對(duì)應(yīng)的后驗(yàn)概率,就是候選的置信值集2,置信值集2有128個(gè)置信值。
5.根據(jù)權(quán)利要求4所述的基于分類器集成的手寫維文字符識(shí)別方法,其特征在于 對(duì)分類識(shí)別結(jié)果集成的過程包括 ·4.I通過實(shí)驗(yàn)確定128個(gè)維文字符中每個(gè)候選字符的兩個(gè)置信值(即MQDF的置信值和BP神經(jīng)網(wǎng)絡(luò)的置信值)的加權(quán)和的權(quán)重系數(shù)Yk; ·4.2根據(jù)得到的加權(quán)和的權(quán)重系數(shù)Yk,計(jì)算128個(gè)維文字符中每個(gè)候選字符的兩個(gè)置信值(MQDF的置信值和BP神經(jīng)網(wǎng)絡(luò)的置信值)的加權(quán)和gi (X) = Y !P1 (W1Zx) + Y 2p2 (w^x),得到每個(gè)字符最終的置信值,128個(gè)維文字符的置信值形成最終的置信值集,式中P1 (WiA)表示MQDF分類器對(duì)特征向量X所屬類別Wi的概率估計(jì),p2 (WiZx)表示BP神經(jīng)網(wǎng)絡(luò)對(duì)特征向量X所屬類別Wi的概率估計(jì); ·4.3根據(jù)最終置信值集中128個(gè)置信值大小,選定最大的置信值對(duì)應(yīng)的字符,確定為待識(shí)別字符的識(shí)別結(jié)果。
全文摘要
本發(fā)明公開了一種基于分類器集成的手寫維文字符識(shí)別方法,屬于模式識(shí)別領(lǐng)域,該方法首先對(duì)手寫維文字符進(jìn)行預(yù)處理,接著利用方向線素提取維文字符的特征向量,然后分別使用MQDF分類器和BP神經(jīng)網(wǎng)絡(luò)分類器對(duì)維文字符特征向量分類,對(duì)分類識(shí)別的結(jié)果即MQDF置信值集和BP神經(jīng)網(wǎng)絡(luò)置信值集進(jìn)行集成,具體是通過兩個(gè)置信值的加權(quán)和實(shí)現(xiàn)集成,得到最終置信值集,選擇最大的置信值作為識(shí)別結(jié)果。本發(fā)明使用了兩種分類器,并將結(jié)果集成,提高了識(shí)別率,本發(fā)明具有算法性能好、實(shí)時(shí)性強(qiáng)、可靠性高、識(shí)別率高的優(yōu)點(diǎn),主要應(yīng)用于移動(dòng)平臺(tái)即手機(jī)上實(shí)現(xiàn)手寫維文識(shí)別,為維文的信息化處理奠定了基礎(chǔ),為維文的文化交流開辟了新的方法和應(yīng)用途徑。
文檔編號(hào)G06K9/62GK102622610SQ20121005572
公開日2012年8月1日 申請(qǐng)日期2012年3月5日 優(yōu)先權(quán)日2012年3月5日
發(fā)明者盧朝陽(yáng), 戴笑來(lái), 李靜, 許亞美 申請(qǐng)人:西安電子科技大學(xué)