一種基于分類器集成的手寫維文字符識(shí)別方法

文檔序號(hào)：6365775閱讀：148來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

專利名稱：一種基于分類器集成的手寫維文字符識(shí)別方法
技術(shù)領(lǐng)域：
本發(fā)明屬于模式識(shí)別中的文字識(shí)別技術(shù)領(lǐng)域，主要涉及手寫體識(shí)別領(lǐng)域，特別是涉及手寫維文字符識(shí)別領(lǐng)域，具體是一種基于分類器集成的手寫維文字符識(shí)別方法，用于在移動(dòng)平臺(tái)即手機(jī)上實(shí)現(xiàn)維文字符的手寫輸入。
背景技術(shù)：
維吾爾文是新疆維吾爾民族交際和工作的主要文字之一，屬阿爾泰語(yǔ)系突厥語(yǔ)族，是一種粘連的拼音文字?，F(xiàn)行的維吾爾文共有32個(gè)字母，其中有8個(gè)元音字母，24個(gè)輔音字母，根據(jù)在單詞中的位置不同，每個(gè)字母有前連式、后連式、雙連式、單立式等2 8種書寫形式，總共有128個(gè)字符。從形體上看，維吾爾文字符采用自右向左、自上向下的手寫方式，沿著一條水平線即基線書寫的部分稱為主體部分，在維文識(shí)別過程中用主體部分來(lái)辨別字符的主要形態(tài)，除基線以外的符號(hào)、點(diǎn)等稱為附加部分，附加部分是區(qū)分相似字符的依據(jù)。維吾爾文由維吾爾單詞組成，每個(gè)單詞由幾個(gè)到十幾個(gè)維吾爾字符組成，字符沿著基線相連書寫。研究維吾爾文字符的處理和識(shí)別有助于提升新疆少數(shù)民族地區(qū)的文化交流、信息交流和科技經(jīng)濟(jì)的發(fā)展。在市場(chǎng)上，維吾爾文印刷體文字識(shí)別系統(tǒng)已經(jīng)廣泛的應(yīng)用于維吾爾文信息處理的各個(gè)領(lǐng)域，如辦公自動(dòng)化、出版印刷業(yè)等多種方面。但是，維吾爾文手寫技術(shù)的研究還處于初步探索階段。目前，手寫維文識(shí)別方面的研究和成果均較少，在中國(guó)申請(qǐng)的專利也較少，中國(guó)專利申請(qǐng)?zhí)?010102041177. 5的發(fā)明申請(qǐng)是西安電子科技大學(xué)盧朝陽(yáng)等提出的一種手寫體維吾爾文字符識(shí)別方法，該申請(qǐng)?zhí)岢隽?128類的手寫體維文字符識(shí)別的方法，其首先提出了一種識(shí)別手寫維文字符的方法，奠定了手寫維文字符識(shí)別的基礎(chǔ)，該方法針對(duì)128類維文字符先建立維文字符部件庫(kù)和部件字典，是維文字符特征提取和識(shí)別的基礎(chǔ)，然后對(duì)單個(gè)部件提取時(shí)分方向特征，最后以加權(quán)距離融合函數(shù)綜合各部件特征，用以識(shí)別整個(gè)字符。該發(fā)明申請(qǐng)首先完整的建立了一種手寫維文字符識(shí)別的方法，開創(chuàng)了手寫維文字符識(shí)別的領(lǐng)域，但其手寫維文字符識(shí)別算法的最高識(shí)別率為84. 23%，識(shí)別率不高。目前，128類的維文單字符識(shí)別的研究還較少，識(shí)別率普遍較低。如何將維吾爾文字符特定的書寫規(guī)則與分類識(shí)別算法有效結(jié)合起來(lái)，以及將不同分類器集成，是手寫體維文識(shí)別一個(gè)亟待解決的問題。

發(fā)明內(nèi)容
本發(fā)明的目的是克服現(xiàn)有技術(shù)存在的識(shí)別率較低的技術(shù)問題，提供一種識(shí)別率較高和識(shí)別時(shí)間較短的基于分類器集成的手寫維文字符識(shí)別方法，該方法采用不同的分類器進(jìn)行分類，并對(duì)不同的分類器進(jìn)行集成，與使用單分類器的方法相比，其平均識(shí)別率有了顯著的提高。為實(shí)現(xiàn)發(fā)明目的，本發(fā)明采用的技術(shù)方案說明如下
本發(fā)明是一種基于分類器集成的手寫維文字符識(shí)別方法對(duì)手寫維文字符的識(shí)別過程包括步驟I對(duì)采集到的手寫維文字符進(jìn)行預(yù)處理，去除采集維文字符過程中附加的噪聲，得到規(guī)范化的維文字符；步驟2提取維文字符的特征向量，將規(guī)范化的維文字符從對(duì)象空間映射到特征空間，得到維文字符的方向線素，即維文字符的特征向量；步驟3分別使用 MQDF (Modif ied Quadratic Discriminant Function,修正的二次分類函數(shù))分類器和BP(Back Propagation,后向傳播)神經(jīng)網(wǎng)絡(luò)分類器對(duì)維文字符特征向量分類識(shí)別，得到分類識(shí)別結(jié)果，MQDF分類器的分類結(jié)果是置信值集I和BP神經(jīng)網(wǎng)絡(luò)分類器的分類結(jié)果是置信值集2 ；步驟4對(duì)兩種分類識(shí)別的結(jié)果置信值集I和置信值集2進(jìn)行集成，計(jì)算128個(gè)維文字符中每個(gè)候選字符的兩個(gè)置信值的加權(quán)和，確定最大的加權(quán)和值，得到最終的分類識(shí)別結(jié)果。本發(fā)明采用一種統(tǒng)計(jì)的方法，首先對(duì)維文字符進(jìn)行預(yù)處理，去除由于手寫所帶來(lái)的噪聲，接著提取維文字符的特征向量，并將特征向量分別輸入MQDF分類器和BP神經(jīng)網(wǎng)絡(luò)分類器進(jìn)行分類，最后對(duì)分類識(shí)別的結(jié)果集成，得到最終的識(shí)別結(jié)果并給出候選集。本發(fā)明的實(shí)現(xiàn)還在于手寫維文字符預(yù)處理過程包括I. I裁剪手寫維文字符圖像，去除維文字符圖像中不包含文字軌跡點(diǎn)的區(qū)域，留下包含文字軌跡點(diǎn)的區(qū)域；1. 2對(duì)裁剪后的維文字符進(jìn)行歸一化處理，將大小不同的維文字符圖像歸一化為大小相同的圖像；1. 3對(duì)歸一化后的維文字符圖像進(jìn)行軌跡點(diǎn)重采樣，每隔幾個(gè)點(diǎn)進(jìn)行采樣，若原圖像中存在象素點(diǎn)比較緊密而歸一化處理后象素點(diǎn)比較稀疏的地方則補(bǔ)象素點(diǎn)；1. 4對(duì)重采樣后的維文字符圖像進(jìn)行濾波，得到規(guī)范化的維文字符。本發(fā)明首先對(duì)維文字符圖像進(jìn)行裁剪，以圖像中的文字為邊界，將其中不包括文字信息的部分去除，只保留包含文字的矩形區(qū)域。接著將裁剪后的圖像進(jìn)行歸一化處理，將裁剪后大小不一樣的維文字符圖像轉(zhuǎn)換為大小一樣的維文字符圖像。然后將歸一化后的圖像進(jìn)行軌跡點(diǎn)重采樣，減少由于歸一化帶來(lái)的字符拉伸、延展的畸變。最后將重采樣后的維文圖像進(jìn)行濾波，降低圖像的噪聲。本發(fā)明的實(shí)現(xiàn)還在于維文字符特征向量提取的過程包括2. I使用彈性網(wǎng)格對(duì)規(guī)范化的維文字符圖像進(jìn)行劃分；2. 2計(jì)算每個(gè)網(wǎng)格內(nèi)的象素點(diǎn)的方向線素，并計(jì)算出每個(gè)網(wǎng)格的方向象素；2. 3將維文字符的網(wǎng)格降維，并計(jì)算出降維后的維文字符每個(gè)網(wǎng)格的方向象素；2. 4對(duì)所有網(wǎng)格的方向線素進(jìn)行合并，用合并后的方向線素表示維文字符的方向線素，即維文字符的特征向量。本發(fā)明特征提取過程中首先使用彈性網(wǎng)格分割維文圖像。又計(jì)算網(wǎng)格內(nèi)的每個(gè)象素的方向線素，并計(jì)算每個(gè)網(wǎng)格的方向線素。將所有網(wǎng)格的方向線素合并，得到維文字符的方向線素。本發(fā)明的實(shí)現(xiàn)還在于使用MQDF分類器和BP神經(jīng)網(wǎng)絡(luò)分類器進(jìn)行分類的過程包括3. I對(duì)115套的128類維文字符庫(kù)進(jìn)行劃分，將其中的60套作為訓(xùn)練樣本庫(kù)，剩余的55套作為識(shí)別樣本庫(kù)，115套128類手寫維文字符庫(kù)是基于移動(dòng)終端即手機(jī)平臺(tái)采集的由維吾爾族人手寫的字符庫(kù)；3. 2使用MQDF分類器對(duì)60套訓(xùn)練樣本庫(kù)訓(xùn)練，得到128類維文字符的平均MQDF
確信度；
3. 3將待識(shí)別維文字符的特征向量應(yīng)用于MQDF分類器，得到對(duì)應(yīng)的候選字符集I，候選字符集I有128個(gè)候選字符；3. 4對(duì)待識(shí)別維文字符的MQDF候選字符集I進(jìn)行概率處理，轉(zhuǎn)化為候選字符集I對(duì)應(yīng)的后驗(yàn)概率，就是候選的置信值集1，置信值集I有128個(gè)置信值；3. 5使用BP神經(jīng)網(wǎng)絡(luò)分類器對(duì)115套的128類維文字符庫(kù)進(jìn)行劃分，對(duì)其中的60套訓(xùn)練樣本庫(kù)訓(xùn)練，得到神經(jīng)網(wǎng)絡(luò)分類器的系數(shù)；3. 6將待識(shí)別維文字的特征向量應(yīng)用于BP神經(jīng)網(wǎng)絡(luò)分類器，得到對(duì)應(yīng)的候選字符集2，候選字符集2有128個(gè)候選字符；3. 7對(duì)待識(shí)別維文字符的BP神經(jīng)網(wǎng)絡(luò)候選字符集2進(jìn)行概率處理，轉(zhuǎn)化為候選集對(duì)應(yīng)的后驗(yàn)概率，就是候選的置信值集2，置信值集2有128個(gè)置信值。本發(fā)明采用了不同的分類器分別對(duì)手寫維文字符的特征向量進(jìn)行分類，采用的MQDF分類器和BP神經(jīng)網(wǎng)絡(luò)分類器復(fù)雜度低，易于實(shí)現(xiàn)。分類過程能充分考慮特征向量在特征空間中分布的特點(diǎn)，具有較好的魯棒性和較高的識(shí)別率。本發(fā)明的實(shí)現(xiàn)還在于對(duì)分類識(shí)別結(jié)果集成的過程包括4. I通過實(shí)驗(yàn)確定128個(gè)維文字符中每個(gè)候選字符的兩個(gè)置信值(即MQDF的置信值和BP神經(jīng)網(wǎng)絡(luò)的置信值)的加權(quán)和的權(quán)重系數(shù)Y k ；4. 2根據(jù)得到的加權(quán)和的權(quán)重系數(shù)Y k，計(jì)算128個(gè)維文字符中每個(gè)候選字符的兩個(gè)置信值(MQDF的置信值和BP神經(jīng)網(wǎng)絡(luò)的置信值)的加權(quán)和8“1) = Y (wjx) + Y 2p2 (Wi/x)，得到每個(gè)字符最終的置信值，128個(gè)維文字符的置信值形成最終的置信值集，式中Pi (WiA)表示MQDF分類器對(duì)特征向量X所屬類別Wi的概率估計(jì)，p2 (WiZx)表示BP神經(jīng)網(wǎng)絡(luò)對(duì)特征向量X所屬類別Wi的概率估計(jì)；4. 3根據(jù)最終置信值集中128個(gè)置信值大小，選定最大的置信值對(duì)應(yīng)的字符，確定為待識(shí)別字符的識(shí)別結(jié)果。本發(fā)明采用的分類器集成方法復(fù)雜度低，易于實(shí)現(xiàn)。相對(duì)于獨(dú)立分類器，分類器的集成可以充分利用各個(gè)獨(dú)立分類器的優(yōu)點(diǎn)，能有效提高維文字符的識(shí)別率。與現(xiàn)有技術(shù)相比，本發(fā)明具有如下的優(yōu)點(diǎn)(I)本發(fā)明復(fù)雜度低，實(shí)現(xiàn)較簡(jiǎn)單，具有較好的魯棒性。(2)本發(fā)明有效利用了不同分類器的優(yōu)點(diǎn)，對(duì)不同分類器的集成就是集合不同分類器的優(yōu)點(diǎn)，提高了手寫維文字符識(shí)別的平均識(shí)別率。(3)本發(fā)明平均識(shí)別時(shí)間較短，達(dá)到了實(shí)用價(jià)值。

圖I為本發(fā)明的算法示意圖2為BP神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)示意圖；圖3為128個(gè)維文字符示意圖；圖4為手寫維文字符的部分樣本；圖5為權(quán)值矩陣米樣過程不意圖；圖6為三種算法的平均識(shí)別率曲線圖。
具體實(shí)施例方式為了使本發(fā)明的技術(shù)方案更加清楚，下面結(jié)合附圖對(duì)本發(fā)明作進(jìn)一步的說明。本發(fā)明是使用移動(dòng)終端即手機(jī)平臺(tái)采集的由維吾爾族人手寫的字符庫(kù)，在個(gè)人電腦上(處理器Intel酷睿2雙核T6400，內(nèi)存2GB，主頻2GHZ)進(jìn)行了維文字符識(shí)別的實(shí)驗(yàn)。本發(fā)明手寫維吾爾文字符識(shí)別方法是基于128類維文字符，128類維文字符參照?qǐng)D3。實(shí)施例1
本發(fā)明一種基于分類器集成的手寫維文字符識(shí)別方法，參見圖I :對(duì)手寫維文字符識(shí)別過程包括步驟1對(duì)采集到的手寫維文字符進(jìn)行預(yù)處理，去除采集維文字符過程中附加的噪聲,得到規(guī)范化的維文字符。維文字符預(yù)處理過程包括I. I裁剪手寫維文字符圖像，去除維文字符圖像中不包含文字軌跡點(diǎn)的區(qū)域，留下包含文字軌跡點(diǎn)的區(qū)域。I. 2對(duì)裁剪后的維文字符進(jìn)行歸一化處理，將大小不同的維文字符圖像歸一化為大小相同的圖像。I. 3對(duì)歸一化后的維文字符圖像進(jìn)行軌跡點(diǎn)重采樣，每隔幾個(gè)點(diǎn)進(jìn)行采樣，本例中每隔3點(diǎn)采樣，若原圖像中存在象素點(diǎn)比較緊密而歸一化處理后象素點(diǎn)比較稀疏的地方則補(bǔ)象素點(diǎn)。1. 4對(duì)重采樣后的維文字符圖像進(jìn)行濾波，得到規(guī)范化的維文字符。步驟2提取維文字符的特征向量，將規(guī)范化的維文字符從對(duì)象空間映射到特征空間，得到維文字符的方向線素，即維文字符的特征向量。維文字符特征向量提取的過程包括2. 1使用彈性網(wǎng)格對(duì)規(guī)范化的維文字符圖像進(jìn)行劃分；2. 2計(jì)算每個(gè)網(wǎng)格內(nèi)的象素點(diǎn)的方向線素，并計(jì)算出每個(gè)網(wǎng)格的方向象素；2. 3將維文字符的網(wǎng)格降維，并計(jì)算出降維后的每個(gè)網(wǎng)格的方向象素；2. 4對(duì)所有網(wǎng)格的方向線素進(jìn)行合并，用合并后的方向線素表示維文字符的方向線素，即維文字符的特征向量。步驟3分別使用MQDF分類器和BP神經(jīng)網(wǎng)絡(luò)分類器對(duì)維文字符特征向量分類識(shí)另O，得到分類識(shí)別結(jié)果，MQDF分類器的分類結(jié)果是置信值集1，BP神經(jīng)網(wǎng)絡(luò)分類器的分類結(jié)果是置信值集2。使用MQDF分類器和BP神經(jīng)網(wǎng)絡(luò)分類器進(jìn)行分類的過程包括3. 1對(duì)115套的128類維文字符庫(kù)進(jìn)行劃分，將其中的60套作為訓(xùn)練樣本庫(kù)，剩余的55套作為識(shí)別樣本庫(kù)，115套128類手寫維文字符庫(kù)是基于移動(dòng)終端即手機(jī)平臺(tái)采集的由維吾爾族人手寫的字符庫(kù)。3. 2使用MQDF分類器對(duì)60套訓(xùn)練樣本庫(kù)訓(xùn)練，得到128類維文字符的平均MQDF確信度。3. 3將待識(shí)別維文字符的特征向量應(yīng)用于MQDF分類器，得到對(duì)應(yīng)的候選字符集I，候選字符集I有128個(gè)候選字符。3. 4對(duì)待識(shí)別維文字符的MQDF候選字符集I進(jìn)行概率處理，轉(zhuǎn)化為候選字符集I對(duì)應(yīng)的后驗(yàn)概率，就是候選的置信值集1，置信值集I有128個(gè)置信值。本發(fā)明采用的MQDF分類器易于實(shí)現(xiàn)，分類過程能充分考慮特征向量在特征空間中分布的特點(diǎn)。 3. 5使用BP神經(jīng)網(wǎng)絡(luò)分類器對(duì)115套的128類維文字符庫(kù)進(jìn)行劃分，對(duì)其中的60套訓(xùn)練樣本庫(kù)訓(xùn)練，得到神經(jīng)網(wǎng)絡(luò)分類器的系數(shù)。3. 6將待識(shí)別維文字的特征向量應(yīng)用于BP神經(jīng)網(wǎng)絡(luò)分類器，得到對(duì)應(yīng)的候選字符集2，候選字符集2有128個(gè)候選字符。3. 7對(duì)待識(shí)別維文字符的BP神經(jīng)網(wǎng)絡(luò)候選字符集2進(jìn)行概率處理，轉(zhuǎn)化為候選集對(duì)應(yīng)的后驗(yàn)概率，就是候選的置信值集2，置信值集2有128個(gè)置信值。本發(fā)明采用的BP神經(jīng)網(wǎng)絡(luò)分類器結(jié)構(gòu)簡(jiǎn)單，具有較好的魯棒性和較高的識(shí)別率。步驟4對(duì)兩種分類識(shí)別的結(jié)果置信值集I和置信值集2進(jìn)行集成，計(jì)算128個(gè)維文字符中每個(gè)候選字符的兩個(gè)置信值的加權(quán)和，選擇最大的加權(quán)和值作為最終的分類識(shí)別結(jié)果。對(duì)分類識(shí)別結(jié)果集成的過程包括4. I通過實(shí)驗(yàn)確定128個(gè)維文字符中每個(gè)候選字符的兩個(gè)置信值(即MQDF的置信值和BP神經(jīng)網(wǎng)絡(luò)的置信值)的加權(quán)和的權(quán)重系數(shù)Yk,取Y1 = O-I, Y2 = O. 9ο4. 2根據(jù)得到的加權(quán)和的權(quán)重系數(shù)Y k，計(jì)算128個(gè)維文字符中每個(gè)候選字符的兩個(gè)置信值的加權(quán)和gi(x) = Y lPl (WiAHY2P2(WiA)，得到每個(gè)字符最終的置信值，128個(gè)維文字符的置信值形成最終的置信值集。因?yàn)楸景l(fā)明采用了兩個(gè)分類器，所以128個(gè)維文字符中每個(gè)候選字符均有兩個(gè)置信值，其中有MQDF的置信值和BP神經(jīng)網(wǎng)絡(luò)的置信值，式中Pi (WiA)表示MQDF分類器對(duì)特征向量X所屬類別Wi的概率估計(jì)，p2 (WiZx)表示BP神經(jīng)網(wǎng)絡(luò)對(duì)特征向量X所屬類別Wi的概率估計(jì)。4. 3根據(jù)最終置信值集中128個(gè)置信值大小，選定最大的置信值的字符，確定為待識(shí)別字符的識(shí)別結(jié)果。本發(fā)明使用了兩種分類器，并將結(jié)果集成，提高了識(shí)別率。實(shí)施例2基于分類器集成的手寫維文字符識(shí)別方法同實(shí)施例1，結(jié)合具體識(shí)別過程對(duì)本發(fā)明做更詳細(xì)的說明。本發(fā)明的算法如圖I所示，主要包括5個(gè)部分預(yù)處理、特征提取、MQDF分類器、BP神經(jīng)網(wǎng)絡(luò)分類器、分類器集成。第一部分，預(yù)處理。維文字符的預(yù)處理由四個(gè)部分組成，分別是裁剪、歸一化、軌跡點(diǎn)重采樣、濾波。(I)將手機(jī)上采集的手寫維文字符的軌跡點(diǎn)保存下來(lái)，形成維文字符圖像，如圖4所示，圖4中前三行均為手寫維文字符，第四行為該維文字符的對(duì)應(yīng)印刷體。對(duì)采集的維文字符圖像進(jìn)行裁剪，將圖像中不包含文字信息的區(qū)域去除掉，只保留圖像中包含文字信息的矩形區(qū)域。(2)對(duì)裁剪后的圖像做歸一化處理，將大小不同的pXQ的字符圖像歸一化為大小相同的NXN的字符圖像，其中P、Q為圖像的行列數(shù)，P、Q取值由于手寫的隨意性具有不確定性，N為圖像歸一化后的行列數(shù)，本例中N = 64，其實(shí)質(zhì)就是對(duì)圖像平移和縮放。(3)將大小相同的64X64的字符圖像進(jìn)行軌跡點(diǎn)重采樣，即在圖像中每隔幾個(gè)點(diǎn)進(jìn)行采樣，本例中每隔4點(diǎn)采樣，若原圖像中存在象素點(diǎn)比較緊密而歸一化處理后象素點(diǎn)比較稀疏的地方則補(bǔ)象素點(diǎn)，若圖像中無(wú)上述現(xiàn)象，則不作補(bǔ)象素點(diǎn)處理。(4)將重采樣后的字符圖像進(jìn)行濾波，濾波采用字符象素點(diǎn)的前后3點(diǎn)加權(quán)平均的方法，以減少了由于書寫抖動(dòng)等原因帶來(lái)的噪聲。第二部分，特征提取。本發(fā)明提取的特征向量是方向線素特征向量，其過程如下(I)使用8X8的彈性網(wǎng)格將維文字符圖像劃分成8X8的網(wǎng)格，根據(jù)筆畫密度函數(shù)來(lái)劃分，筆畫密度大的區(qū)域網(wǎng)格密，筆畫密度小的區(qū)域網(wǎng)格疏。(2)計(jì)算每個(gè)網(wǎng)格內(nèi)的象素點(diǎn)的方向線素。給定一個(gè)軌跡點(diǎn)Pp它的方向特征
VrpJ-IpJ^，其向坐標(biāo)中的每隔45度的8個(gè)方向上進(jìn)行垂直投影，只有兩個(gè)方向上有投影
值，其余方向上都是0，則8個(gè)方向上的值組成的向量就是軌跡點(diǎn)Pj的方向線素，方向線素特征向量的維數(shù)為8。對(duì)網(wǎng)格內(nèi)的所有點(diǎn)的方向線素求平均，得到每個(gè)網(wǎng)格的方向線素。(3)將維文字符的網(wǎng)格降維，并計(jì)算出降維后的維文字符網(wǎng)格的方向象素。將8X8的網(wǎng)格擴(kuò)展為9X9的網(wǎng)格，對(duì)8X8網(wǎng)格分別補(bǔ)充一行和一列，將原來(lái)網(wǎng)格的最后一行
權(quán)利要求
1.一種基于分類器集成的手寫維文字符識(shí)別方法，其特征在于識(shí)別過程包括步驟I對(duì)采集到的手寫維文字符進(jìn)行預(yù)處理，去除采集維文字符過程中附加的噪聲，得到規(guī)范化的維文字符；步驟2提取維文字符的特征向量，將規(guī)范化的維文字符從對(duì)象空間映射到特征空間，得到維文字符的方向線素，即維文字符的特征向量；步驟3分別使用MQDF分類器和BP神經(jīng)網(wǎng)絡(luò)分類器對(duì)維文字符特征向量分類識(shí)別，得到分類識(shí)別結(jié)果，MQDF分類器的分類結(jié)果是置信值集I和BP神經(jīng)網(wǎng)絡(luò)分類器的分類結(jié)果是置信值集2 ；步驟4對(duì)兩種分類識(shí)別的結(jié)果置信值集I和置信值集2進(jìn)行集成，計(jì)算128個(gè)維文字符中每個(gè)候選字符的兩個(gè)置信值的加權(quán)和，選擇最大的加權(quán)和值作為最終的分類識(shí)別結(jié)果。
2.根據(jù)權(quán)利要求I所述的基于分類器集成的手寫維文字符識(shí)別方法，其特征在于維文字符預(yù)處理過程包括 I. I裁剪手寫維文字符圖像，去除維文字符圖像中不包含文字軌跡點(diǎn)的區(qū)域，留下包含文字軌跡點(diǎn)的區(qū)域； I. 2對(duì)裁剪后的維文字符進(jìn)行歸一化處理，將大小不同的維文字符圖像歸一化為大小相同的圖像； I. 3對(duì)歸一化后的維文字符圖像進(jìn)行軌跡點(diǎn)重采樣，每隔幾個(gè)點(diǎn)進(jìn)行采樣，若原圖像中存在象素點(diǎn)比較緊密而歸一化處理后象素點(diǎn)比較稀疏的地方則補(bǔ)象素點(diǎn)； 1.4對(duì)重采樣后的維文字符圖像進(jìn)行濾波，得到規(guī)范化的維文字符。
3.根據(jù)權(quán)利要求2所述的基于分類器集成的手寫維文字符識(shí)別方法，其特征在于維文字符特征向量提取的過程包括 2.I使用彈性網(wǎng)格對(duì)規(guī)范化的維文字符圖像進(jìn)行劃分； 2.2計(jì)算每個(gè)網(wǎng)格內(nèi)的象素點(diǎn)的方向線素，并計(jì)算出每個(gè)網(wǎng)格的方向象素； 2.3將維文字符的網(wǎng)格降維，并計(jì)算出降維后的維文字符每個(gè)網(wǎng)格的方向象素； 2.4對(duì)所有網(wǎng)格的方向線素進(jìn)行合并，用合并后的方向線素表示維文字符的方向線素，即維文字符的特征向量。
4.根據(jù)權(quán)利要求3所述的基于分類器集成的手寫維文字符識(shí)別方法，其特征在于使用MQDF分類器和BP神經(jīng)網(wǎng)絡(luò)分類器進(jìn)行分類的過程包括、 3.I對(duì)115套的128類維文字符庫(kù)進(jìn)行劃分，將其中的60套作為訓(xùn)練樣本庫(kù)，剩余的、55、套作為識(shí)別樣本庫(kù)，115套128類手寫維文字符庫(kù)是基于移動(dòng)終端即手機(jī)平臺(tái)采集的由維吾爾族人手寫的字符庫(kù)；、 3.2使用MQDF分類器對(duì)60套訓(xùn)練樣本庫(kù)訓(xùn)練，得到128類維文字符的平均MQDF確信、度；、3.3將待識(shí)別維文字符的特征向量應(yīng)用于MQDF分類器，得到對(duì)應(yīng)的候選字符集I，候選字符集I有128個(gè)候選字符；、3.4對(duì)待識(shí)別維文字符的MQDF候選字符集I進(jìn)行概率處理，轉(zhuǎn)化為候選字符集I對(duì)應(yīng)的后驗(yàn)概率，就是候選的置信值集1，置信值集I有128個(gè)置信值；、3.5使用BP神經(jīng)網(wǎng)絡(luò)分類器對(duì)115套的128類維文字符庫(kù)進(jìn)行劃分，對(duì)其中的60套訓(xùn)練樣本庫(kù)訓(xùn)練，得到神經(jīng)網(wǎng)絡(luò)分類器的系數(shù)；·3.6將待識(shí)別維文字的特征向量應(yīng)用于BP神經(jīng)網(wǎng)絡(luò)分類器，得到對(duì)應(yīng)的候選字符集2，候選字符集2有128個(gè)候選字符； ·3.7對(duì)待識(shí)別維文字符的BP神經(jīng)網(wǎng)絡(luò)候選字符集2進(jìn)行概率處理，轉(zhuǎn)化為候選集對(duì)應(yīng)的后驗(yàn)概率，就是候選的置信值集2，置信值集2有128個(gè)置信值。
5.根據(jù)權(quán)利要求4所述的基于分類器集成的手寫維文字符識(shí)別方法，其特征在于對(duì)分類識(shí)別結(jié)果集成的過程包括 ·4.I通過實(shí)驗(yàn)確定128個(gè)維文字符中每個(gè)候選字符的兩個(gè)置信值(即MQDF的置信值和BP神經(jīng)網(wǎng)絡(luò)的置信值)的加權(quán)和的權(quán)重系數(shù)Yk; ·4.2根據(jù)得到的加權(quán)和的權(quán)重系數(shù)Yk，計(jì)算128個(gè)維文字符中每個(gè)候選字符的兩個(gè)置信值(MQDF的置信值和BP神經(jīng)網(wǎng)絡(luò)的置信值)的加權(quán)和gi (X) = Y !P1 (W1Zx) + Y 2p2 (w^x)，得到每個(gè)字符最終的置信值，128個(gè)維文字符的置信值形成最終的置信值集，式中P1 (WiA)表示MQDF分類器對(duì)特征向量X所屬類別Wi的概率估計(jì)，p2 (WiZx)表示BP神經(jīng)網(wǎng)絡(luò)對(duì)特征向量X所屬類別Wi的概率估計(jì)； ·4.3根據(jù)最終置信值集中128個(gè)置信值大小，選定最大的置信值對(duì)應(yīng)的字符，確定為待識(shí)別字符的識(shí)別結(jié)果。
全文摘要
本發(fā)明公開了一種基于分類器集成的手寫維文字符識(shí)別方法，屬于模式識(shí)別領(lǐng)域，該方法首先對(duì)手寫維文字符進(jìn)行預(yù)處理，接著利用方向線素提取維文字符的特征向量，然后分別使用MQDF分類器和BP神經(jīng)網(wǎng)絡(luò)分類器對(duì)維文字符特征向量分類，對(duì)分類識(shí)別的結(jié)果即MQDF置信值集和BP神經(jīng)網(wǎng)絡(luò)置信值集進(jìn)行集成，具體是通過兩個(gè)置信值的加權(quán)和實(shí)現(xiàn)集成，得到最終置信值集，選擇最大的置信值作為識(shí)別結(jié)果。本發(fā)明使用了兩種分類器，并將結(jié)果集成，提高了識(shí)別率，本發(fā)明具有算法性能好、實(shí)時(shí)性強(qiáng)、可靠性高、識(shí)別率高的優(yōu)點(diǎn)，主要應(yīng)用于移動(dòng)平臺(tái)即手機(jī)上實(shí)現(xiàn)手寫維文識(shí)別，為維文的信息化處理奠定了基礎(chǔ)，為維文的文化交流開辟了新的方法和應(yīng)用途徑。
文檔編號(hào)G06K9/62GK102622610SQ20121005572
公開日2012年8月1日申請(qǐng)日期2012年3月5日優(yōu)先權(quán)日2012年3月5日
發(fā)明者盧朝陽(yáng), 戴笑來(lái), 李靜, 許亞美申請(qǐng)人:西安電子科技大學(xué)

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：李靜;盧朝陽(yáng);戴笑來(lái);許亞美
技術(shù)所有人：西安電子科技大學(xué)
我是此專利的發(fā)明人

上一篇：一種多觸摸屏加載程序的系統(tǒng)和方法
上一篇：終端設(shè)備的驅(qū)動(dòng)安裝方法及裝置的制作方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無(wú)損檢測(cè)
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺 2.無(wú)線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢(shì)感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

集成分類器相關(guān)技術(shù)

手寫字符識(shí)別相關(guān)技術(shù)

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種基于分類器集成的手寫維文字符識(shí)別方法