欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種手寫識(shí)別方法及系統(tǒng)的制作方法

文檔序號(hào):6605689閱讀:364來源:國(guó)知局
專利名稱:一種手寫識(shí)別方法及系統(tǒng)的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及手寫識(shí)別技術(shù)領(lǐng)域,特別是涉及一種手寫識(shí)別方法及系統(tǒng)。
背景技術(shù)
手寫識(shí)別技術(shù)是指通過手寫板等軌跡捕獲設(shè)備獲得書寫者的書寫信息,將手寫軌 跡信息轉(zhuǎn)換輸入計(jì)算機(jī)。用戶在手寫板和觸摸屏上書寫的筆畫以坐標(biāo)序列的形式被計(jì)算 機(jī)存儲(chǔ)下來,通過對(duì)文字圖像的抬筆、落筆、筆跡上各像素的空間位置等信息進(jìn)行處理與對(duì) 照,系統(tǒng)將數(shù)據(jù)轉(zhuǎn)化為計(jì)算機(jī)所使用的文字編碼進(jìn)行輸出。在手寫輸入過程中,對(duì)同一個(gè)漢字不同人有不同的書寫筆順(倒插筆書寫),有些 人還習(xí)慣連筆書寫,因此手寫識(shí)別系統(tǒng)需要解決這些倒插筆書寫和連筆書寫的問題。一般的解決方法是用多個(gè)識(shí)別引擎來共同決策,有的引擎在倒插筆書寫時(shí)能給 出較好的識(shí)別結(jié)果,有的引擎在連筆書寫時(shí)能給出較好的識(shí)別結(jié)果,通過將多個(gè)引擎的識(shí) 別結(jié)果綜合打分,最終給出識(shí)別結(jié)果。這種決策方法能夠在很大程度上綜合多個(gè)引擎的優(yōu) 點(diǎn),從而解決倒插筆或連筆識(shí)別問題。但是,這種方法存在以下缺點(diǎn)有些情況下,當(dāng)多個(gè)引擎共同決策時(shí),結(jié)果反而不 正確。這是因?yàn)槊總€(gè)引擎在識(shí)別時(shí)的側(cè)重點(diǎn)不同,有的引擎對(duì)連筆書寫(筆順都是正確的) 的字符能有很高的識(shí)別率,但對(duì)筆順錯(cuò)誤的字符就不能正確識(shí)別;有的引擎對(duì)字符筆順不 敏感,筆順是否錯(cuò)誤并不影響識(shí)別率,但對(duì)是否正楷書寫比較敏感,連筆書寫字符的識(shí)別效 果會(huì)差一些。當(dāng)多個(gè)引擎共同決策時(shí),根據(jù)各個(gè)識(shí)別結(jié)果綜合考慮,給出結(jié)果。例如,輸入一 個(gè)筆順正確、非常潦草的“建”字,連筆引擎識(shí)別結(jié)果正確,但無筆順引擎識(shí)別錯(cuò)誤,兩者綜 合考慮,最終識(shí)別結(jié)果可能會(huì)錯(cuò)誤。再例如,輸入一個(gè)正楷書寫但筆順錯(cuò)誤的“訊”字,無筆 順引擎識(shí)別正確,但連筆引擎識(shí)別結(jié)果錯(cuò)誤,兩者綜合考慮,最終識(shí)別結(jié)果也可能會(huì)錯(cuò)誤。

發(fā)明內(nèi)容
本發(fā)明所要解決的技術(shù)問題是提供一種手寫識(shí)別方法及系統(tǒng),以解決多引擎共同 識(shí)別存在識(shí)別錯(cuò)誤的問題。為了解決上述問題,本發(fā)明公開了一種手寫識(shí)別方法,包括使用單個(gè)識(shí)別引擎進(jìn)行手寫識(shí)別,得到識(shí)別結(jié)果;判斷單個(gè)識(shí)別引擎的識(shí)別結(jié)果是否符合對(duì)應(yīng)的預(yù)置條件,如果符合,則結(jié)束識(shí)別; 如果不符合,則繼續(xù)使用另一單個(gè)識(shí)別引擎進(jìn)行識(shí)別;如果所有單個(gè)識(shí)別引擎的識(shí)別結(jié)果都不符合相應(yīng)的預(yù)置條件,則進(jìn)行綜合決策。優(yōu)選的,所述識(shí)別結(jié)果包括字符編碼和識(shí)別距離。優(yōu)選的,所述判斷單個(gè)識(shí)別引擎的識(shí)別結(jié)果是否符合對(duì)應(yīng)的預(yù)置條件,包括判斷 識(shí)別距離是否小于該單個(gè)識(shí)別引擎對(duì)應(yīng)的置信閾值,如果小于,則符合;否則,不符合。其中,通過以下方式獲得單個(gè)識(shí)別引擎對(duì)應(yīng)的置信閾值從訓(xùn)練樣本中提取特征, 所述特征包括字符編碼和識(shí)別距離;根據(jù)提取出的特征進(jìn)行模型訓(xùn)練,得到對(duì)應(yīng)該單個(gè)識(shí)
3別引擎的置信閾值。優(yōu)選的,所述提取出的特征分為正確識(shí)別的特征和錯(cuò)誤識(shí)別的特征,則所述置信 閾值是根據(jù)正確識(shí)別的特征進(jìn)行模型訓(xùn)練得到,或者是根據(jù)錯(cuò)誤識(shí)別的特征進(jìn)行模型訓(xùn)練 得到。其中,所述進(jìn)行綜合決策包括對(duì)所有單個(gè)識(shí)別引擎的識(shí)別結(jié)果進(jìn)行加權(quán)平均,得 到最終識(shí)別結(jié)果。本發(fā)明還提供了一種手寫識(shí)別系統(tǒng),包括多個(gè)單個(gè)識(shí)別引擎,用于進(jìn)行手寫識(shí)別,得到識(shí)別結(jié)果;引擎選擇器,用于判斷單個(gè)識(shí)別引擎的識(shí)別結(jié)果是否符合對(duì)應(yīng)的預(yù)置條件,如果 符合,則結(jié)束識(shí)別;如果不符合,則繼續(xù)觸發(fā)另一單個(gè)識(shí)別引擎進(jìn)行識(shí)別;
綜合決策模塊,用于當(dāng)所有單個(gè)識(shí)別引擎的識(shí)別結(jié)果都不符合相應(yīng)的預(yù)置條件 時(shí),進(jìn)行綜合決策。優(yōu)選的,所述識(shí)別結(jié)果包括字符編碼和識(shí)別距離;則所述引擎選擇器判斷單個(gè)識(shí) 別引擎的識(shí)別距離是否小于該單個(gè)識(shí)別引擎對(duì)應(yīng)的置信閾值,如果小于,則符合對(duì)應(yīng)的預(yù) 置條件;否則,不符合。其中,所述單個(gè)識(shí)別引擎還用于從訓(xùn)練樣本中提取特征,所述特征包括字符編碼 和識(shí)別距離;所述系統(tǒng)還包括模型訓(xùn)練模塊,用于根據(jù)提取出的特征進(jìn)行模型訓(xùn)練,得到 對(duì)應(yīng)該單個(gè)識(shí)別引擎的置信閾值。優(yōu)選的,所述單個(gè)識(shí)別引擎提取出的特征分為正確識(shí)別的特征和錯(cuò)誤識(shí)別的特 征,則所述置信閾值是模型訓(xùn)練模塊根據(jù)正確識(shí)別的特征進(jìn)行模型訓(xùn)練得到,或者是根據(jù) 錯(cuò)誤識(shí)別的特征進(jìn)行模型訓(xùn)練得到。與現(xiàn)有技術(shù)相比,本發(fā)明具有以下優(yōu)點(diǎn)首先,本發(fā)明提出了一種基于統(tǒng)計(jì)模型的手寫識(shí)別引擎選擇方法,該方法通過對(duì) 單個(gè)識(shí)別引擎的結(jié)果進(jìn)行分析,即用統(tǒng)計(jì)模型來進(jìn)行分析,決定是否還需要其他識(shí)別引擎 來共同決策。對(duì)于一些通過單個(gè)識(shí)別引擎即可得到正確識(shí)別結(jié)果的字符,就不需要再按照 現(xiàn)有技術(shù)一樣進(jìn)行多引擎識(shí)別,因此與現(xiàn)有技術(shù)相比,本發(fā)明具有糾錯(cuò)能力,可以將現(xiàn)有技 術(shù)識(shí)別錯(cuò)誤的結(jié)果糾正。本發(fā)明可以更加合理地應(yīng)用單個(gè)識(shí)別引擎的優(yōu)點(diǎn),提高了識(shí)別正 確率。其次,本發(fā)明在所有單個(gè)識(shí)別引擎的識(shí)別結(jié)果都不符合相應(yīng)預(yù)置條件的情況下,才 會(huì)進(jìn)行綜合決策,因此很多情況下,不再將所有字符都進(jìn)行多引擎識(shí)別,只進(jìn)行單個(gè)引擎的識(shí) 別就可結(jié)束識(shí)別過程,與現(xiàn)有技術(shù)相比,降低了識(shí)別時(shí)的運(yùn)算量,從而提高了識(shí)別速度。


圖1是本發(fā)明實(shí)施例所述一種手寫識(shí)別方法的流程圖;圖2是本發(fā)明實(shí)施例所述一種手寫識(shí)別中的模型訓(xùn)練方法流程圖;圖3是本發(fā)明實(shí)施例所述一種手寫識(shí)別系統(tǒng)的結(jié)構(gòu)圖。
具體實(shí)施例方式為使本發(fā)明的上述目的、特征和優(yōu)點(diǎn)能夠更加明顯易懂,下面結(jié)合附圖和具體實(shí)施方式
對(duì)本發(fā)明作進(jìn)一步詳細(xì)的說明。 本發(fā)明的核心思路是提出一種基于統(tǒng)計(jì)模型的手寫識(shí)別引擎選擇方法,通過對(duì) 單個(gè)識(shí)別引擎的結(jié)果進(jìn)行分析,即用統(tǒng)計(jì)模型來進(jìn)行分析,決定是否還需要其他識(shí)別引擎 來共同決策。 下面通過實(shí)施例進(jìn)行詳細(xì)說明。參照?qǐng)D1,本發(fā)明實(shí)施例一所述一種手寫識(shí)別方法的流程圖。步驟101,使用單個(gè)識(shí)別引擎進(jìn)行手寫識(shí)別,得到識(shí)別結(jié)果;其中,所述識(shí)別引擎包括多個(gè),每個(gè)引擎在識(shí)別時(shí)的側(cè)重點(diǎn)不同,有的引擎對(duì)連筆 書寫(筆順正確)的字符能有很高識(shí)別率,但對(duì)筆順錯(cuò)誤的字符就不能正確識(shí)別;有的引擎 對(duì)字符筆順不敏感,筆順是否錯(cuò)誤并不影響識(shí)別率,但對(duì)是否正楷書寫比較敏感,連筆書寫 字符的識(shí)別效果會(huì)差一些。此外,還有相似字識(shí)別引擎等多種引擎,在此不一一列舉。對(duì)于手寫輸入的字符,如輸入的漢字,首先輸入對(duì)應(yīng)的單個(gè)識(shí)別引擎進(jìn)行識(shí)別。本實(shí)施例中,所述識(shí)別結(jié)果主要包括字符編碼和識(shí)別距離等信息。其中,字符編碼 是字符在計(jì)算機(jī)中的表示,用于計(jì)算機(jī)系統(tǒng)識(shí)別各個(gè)字符,例如用53462來表示“中”。所述 識(shí)別距離是描述用戶輸入筆跡和候選字符有多像的一種度量,即識(shí)別距離越小,識(shí)別結(jié)果 正確的可能性就越大;反之,識(shí)別距離越大,識(shí)別結(jié)果正確的可能性就越小。優(yōu)選的,本實(shí)施例得到的識(shí)別結(jié)果是一選結(jié)果。所述一選是指識(shí)別引擎對(duì)每個(gè)輸 入字符都有多個(gè)候選項(xiàng),并且對(duì)候選項(xiàng)進(jìn)行了排序,其中一選結(jié)果是識(shí)別正確的可能性最 大的結(jié)果。步驟102,判斷單個(gè)識(shí)別引擎的識(shí)別結(jié)果是否符合對(duì)應(yīng)的預(yù)置條件;如果符合,則結(jié)束識(shí)別;如果不符合,則返回步驟101,繼續(xù)使用另一單個(gè)識(shí)別引 擎進(jìn)行識(shí)別;所述預(yù)置條件是指每個(gè)識(shí)別引擎都有各自對(duì)應(yīng)的置信閾值,本實(shí)施例通過將識(shí)別 結(jié)果中的識(shí)別距離與置信閾值進(jìn)行比較來判斷。之所以選擇識(shí)別距離來判斷,主要是因?yàn)?識(shí)別距離能反映出“結(jié)果”正確的可能性。當(dāng)然,如果在識(shí)別中使用的度量是類似度或者概 率,也都可以用來作為判斷條件。所述置信閾值用于表示置信度,是通過統(tǒng)計(jì)模型得出,識(shí) 別引擎不同,得到的置信閾值也可能不同;而且,同一個(gè)識(shí)別引擎中,識(shí)別字符不同,對(duì)應(yīng)的 置信閾值也可能不同。置信閾值的計(jì)算將在下面的圖2流程中進(jìn)行詳細(xì)說明。具體的,如果識(shí)別距離小于該單個(gè)識(shí)別引擎對(duì)應(yīng)的置信閾值,則表示單個(gè)引擎的 識(shí)別結(jié)果正確,流程結(jié)束,就不需要再進(jìn)行多引擎識(shí)別了。如果識(shí)別距離大于該單個(gè)識(shí)別引 擎對(duì)應(yīng)的置信閾值,則表示識(shí)別結(jié)果錯(cuò)誤,還需要使用下一個(gè)單個(gè)識(shí)別引擎繼續(xù)進(jìn)行識(shí)別, 并繼續(xù)進(jìn)行步驟102的判斷。如果判斷結(jié)果小于該識(shí)別引擎的置信閾值,則流程結(jié)束;如果 判斷結(jié)果還是小于該識(shí)別引擎的置信閾值,則再使用另一個(gè)識(shí)別引擎進(jìn)行識(shí)別。如此循環(huán) 下去,直到所有的識(shí)別引擎都識(shí)別完后,識(shí)別結(jié)果還是不符合條件,則進(jìn)入步驟103。例如,對(duì)于手寫輸入的“中”字,通過第一個(gè)識(shí)別引擎得到的識(shí)別距離是100,大于 第一個(gè)識(shí)別引擎的置信閾值90,則進(jìn)入第二個(gè)識(shí)別引擎。如果第二個(gè)識(shí)別引擎的識(shí)別距離 是80,小于第二個(gè)識(shí)別引擎的置信閾值84,則將第二個(gè)識(shí)別引擎識(shí)別出的漢字作為最終識(shí) 別結(jié)果。但如果第二個(gè)識(shí)別引擎的識(shí)別距離是90,大于置信閾值84,則繼續(xù)送入第三個(gè)識(shí) 別引擎。如果系統(tǒng)只有三個(gè)識(shí)別引擎,通過第三個(gè)識(shí)別引擎得到的識(shí)別距離也大于該引擎的置信閾值,則進(jìn)行步驟103所述的綜合決策。步驟103,如果所有單個(gè)識(shí)別引擎的識(shí)別結(jié)果都不符合相應(yīng)的預(yù)置條件,則進(jìn)行綜 合決策。綜合決策的方法可以有多種,其中一種比較簡(jiǎn)單的方法是對(duì)所有單個(gè)識(shí)別引擎 的識(shí)別結(jié)果進(jìn)行加權(quán)平均,得到最終識(shí)別結(jié)果。綜上所述,本實(shí)施例的主要目的是當(dāng)有字符輸入時(shí),根據(jù)單個(gè)識(shí)別引擎的識(shí)別結(jié) 果并結(jié)合統(tǒng)計(jì)模型的置信閾值,判斷由單個(gè)引擎做出最終判斷,還是由多個(gè)引擎共同決策。下面繼續(xù)說明如何利用統(tǒng)計(jì)模塊得到置信閾值。參照?qǐng)D2,是本發(fā)明實(shí)施例所述一種手寫識(shí)別中的模型訓(xùn)練方法流程圖。每個(gè)識(shí)別 引擎都通過以下步驟得到自己的置信閾值步驟201,從訓(xùn)練樣本中提取特征,所述特征包括字符編碼和識(shí)別距離;訓(xùn)練樣本為事先采集好的筆跡數(shù)據(jù),例如100個(gè)人寫的所有漢字的筆跡。提取特 征的方法是將事先采集好的漢字筆跡送入單個(gè)識(shí)別引擎,識(shí)別引擎會(huì)給出字符編碼和識(shí)別距離。步驟202,根據(jù)提取出的特征進(jìn)行模型訓(xùn)練,得到對(duì)應(yīng)該單個(gè)識(shí)別引擎的置信閾值。模型訓(xùn)練的過程是針對(duì)單個(gè)識(shí)別引擎,在樣本集合中統(tǒng)計(jì)出單個(gè)字符的識(shí)別距 離的均值和方差,然后利用均值和方差計(jì)算出置信閾值。其中,通過單個(gè)識(shí)別引擎提取出的特征分為正確識(shí)別的特征和錯(cuò)誤識(shí)別的特征, 則所述置信閾值可以根據(jù)正確識(shí)別的特征進(jìn)行模型訓(xùn)練得到,也可以是根據(jù)錯(cuò)誤識(shí)別的特 征進(jìn)行模型訓(xùn)練得到。例如,在一個(gè)漢字集GB2312中,包括“啊”字和其他漢字共6763個(gè)字,每個(gè)字都有 1000個(gè)訓(xùn)練樣本。在某個(gè)識(shí)別引擎中,針對(duì)“啊”字,能夠正確識(shí)別出的共有900個(gè),這900 個(gè)距離值分布為636 3605,均值(表示為mean)為1553. 898891,方差(表示為vari)為 183634. 619666。這樣,通過公式mean+sqrt (vari) *alphal,就可以計(jì)算出置信閾值。如果 有一個(gè)新的輸入漢字“啊”字,經(jīng)過這個(gè)識(shí)別引擎得到了一選“啊”字,以及距離distance。 如果距離distance小于置信閾值,即可判斷識(shí)別結(jié)果值得信賴,可把結(jié)果直接做為最終識(shí) 別結(jié)果。同樣,在這個(gè)識(shí)別引擎中,錯(cuò)誤識(shí)別成“啊”字的共有100個(gè),這100個(gè)距離 值分布為1183 4422,均值為2181. 608392,方差為255875. 888210。這樣,通過公式 mean-sqrt(vari)*alpha2計(jì)算出的結(jié)果也可以作為置信閾值,判斷方法同上,即如果對(duì) 某個(gè)字符的識(shí)別距離小于該置信閾值,則可判斷識(shí)別結(jié)果值得信賴,可把結(jié)果直接做為最 終識(shí)別結(jié)果。綜上所述,本發(fā)明對(duì)于一些通過單個(gè)識(shí)別引擎即可得到正確識(shí)別結(jié)果的字符,就 不需要再按照現(xiàn)有技術(shù)一樣進(jìn)行多引擎識(shí)別,因此與現(xiàn)有技術(shù)相比,本發(fā)明具有糾錯(cuò)能力, 可以將現(xiàn)有技術(shù)識(shí)別錯(cuò)誤的結(jié)果糾正。本發(fā)明可以更加合理地應(yīng)用單個(gè)識(shí)別引擎的優(yōu)點(diǎn), 提高了識(shí)別正確率。而且,本發(fā)明在所有單個(gè)識(shí)別引擎的識(shí)別結(jié)果都不符合相應(yīng)預(yù)置條件的情況下, 才會(huì)進(jìn)行綜合決策,因此很多情況下,不再將所有字符都進(jìn)行多引擎識(shí)別,只進(jìn)行單個(gè)引
6擎的識(shí)別就可結(jié)束識(shí)別過程,與現(xiàn)有技術(shù)相比,降低了識(shí)別時(shí)的運(yùn)算量,從而提高了識(shí)別速度?;谏鲜龇椒▽?shí)施例的說明,本發(fā)明還提供相應(yīng)的系統(tǒng)實(shí)施例。參照?qǐng)D3,是本發(fā)明實(shí)施例所述一種手寫識(shí)別系統(tǒng)的結(jié)構(gòu)圖。所述手寫識(shí)別系統(tǒng)主要包括單個(gè)識(shí)別引擎31,用于進(jìn)行手寫識(shí)別,得到識(shí)別結(jié)果;所述單個(gè)識(shí)別引擎31包括 多個(gè),如圖3中的單個(gè)識(shí)別引擎31a、單個(gè)識(shí)別引擎31b、...;引擎選擇器32,用于判斷單個(gè)識(shí)別引擎的識(shí)別結(jié)果是否符合對(duì)應(yīng)的預(yù)置條件,如 果符合,則結(jié)束識(shí)別;如果不符合,則繼續(xù)觸發(fā)另一單個(gè)識(shí)別引擎31進(jìn)行識(shí)別;綜合決策模塊33,用于當(dāng)所有單個(gè)識(shí)別引擎的識(shí)別結(jié)果都不符合相應(yīng)的預(yù)置條件 時(shí),進(jìn)行綜合決策。其中,所述識(shí)別結(jié)果包括字符編碼和識(shí)別距離。則所述引擎選擇器32通過以下方式進(jìn)行判斷判斷單個(gè)識(shí)別引擎的識(shí)別距離是 否小于該單個(gè)識(shí)別引擎對(duì)應(yīng)的置信閾值,如果小于,則符合對(duì)應(yīng)的預(yù)置條件;否則,不符合。其中,所述置信閾值的獲得方式如下所述單個(gè)識(shí)別引擎31還用于從訓(xùn)練樣本中提取特征,所述特征包括字符編碼和 識(shí)別距離;所述系統(tǒng)還包括模型訓(xùn)練模塊34,用于根據(jù)提取出的特征進(jìn)行模型訓(xùn)練,得到 對(duì)應(yīng)該單個(gè)識(shí)別引擎的置信閾值。其中,所述單個(gè)識(shí)別引擎提取出的特征分為正確識(shí)別的特征和錯(cuò)誤識(shí)別的特征, 則所述置信閾值可以根據(jù)正確識(shí)別的特征進(jìn)行模型訓(xùn)練得到,也可以根據(jù)錯(cuò)誤識(shí)別的特征 進(jìn)行模型訓(xùn)練得到。綜上所述,當(dāng)有字符輸入時(shí),所述手寫識(shí)別系統(tǒng)根據(jù)字符特征由引擎選擇器選擇 出是由單個(gè)引擎做出最終判斷,還是由多個(gè)引擎共同決策。對(duì)于一些通過單個(gè)識(shí)別引擎即 可得到正確識(shí)別結(jié)果的字符,就不需要再按照現(xiàn)有技術(shù)一樣進(jìn)行多引擎識(shí)別,因此與現(xiàn)有 技術(shù)相比,所述手寫識(shí)別系統(tǒng)具有糾錯(cuò)能力,可以將現(xiàn)有技術(shù)識(shí)別錯(cuò)誤的結(jié)果糾正。所述手 寫識(shí)別系統(tǒng)可以更加合理地應(yīng)用單個(gè)識(shí)別引擎的優(yōu)點(diǎn),提高了識(shí)別正確率。而且,所述手寫 識(shí)別系統(tǒng)在所有單個(gè)識(shí)別引擎的識(shí)別結(jié)果都不符合相應(yīng)預(yù)置條件的情況下,才會(huì)進(jìn)行綜合 決策,因此很多情況下,不再將所有字符都進(jìn)行多引擎識(shí)別,只進(jìn)行單個(gè)引擎的識(shí)別就可結(jié) 束識(shí)別過程,與現(xiàn)有技術(shù)相比,降低了識(shí)別時(shí)的運(yùn)算量,從而提高了識(shí)別速度。本說明書中的各個(gè)實(shí)施例均采用遞進(jìn)的方式描述,每個(gè)實(shí)施例重點(diǎn)說明的都是與 其他實(shí)施例的不同之處,各個(gè)實(shí)施例之間相同相似的部分互相參見即可。對(duì)于系統(tǒng)實(shí)施例 而言,由于其與方法實(shí)施例基本相似,所以描述的比較簡(jiǎn)單,相關(guān)之處參見方法實(shí)施例的部 分說明即可。以上對(duì)本發(fā)明所提供的一種手寫識(shí)別方法及系統(tǒng),進(jìn)行了詳細(xì)介紹,本文中應(yīng)用 了具體個(gè)例對(duì)本發(fā)明的原理及實(shí)施方式進(jìn)行了闡述,以上實(shí)施例的說明只是用于幫助理解 本發(fā)明的方法及其核心思想;同時(shí),對(duì)于本領(lǐng)域的一般技術(shù)人員,依據(jù)本發(fā)明的思想,在具 體實(shí)施方式及應(yīng)用范圍上均會(huì)有改變之處,綜上所述,本說明書內(nèi)容不應(yīng)理解為對(duì)本發(fā)明 的限制。
權(quán)利要求
一種手寫識(shí)別方法,其特征在于,包括使用單個(gè)識(shí)別引擎進(jìn)行手寫識(shí)別,得到識(shí)別結(jié)果;判斷單個(gè)識(shí)別引擎的識(shí)別結(jié)果是否符合對(duì)應(yīng)的預(yù)置條件,如果符合,則結(jié)束識(shí)別;如果不符合,則繼續(xù)使用另一單個(gè)識(shí)別引擎進(jìn)行識(shí)別;如果所有單個(gè)識(shí)別引擎的識(shí)別結(jié)果都不符合相應(yīng)的預(yù)置條件,則進(jìn)行綜合決策。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于所述識(shí)別結(jié)果包括字符編碼和識(shí)別距離。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述判斷單個(gè)識(shí)別引擎的識(shí)別結(jié)果是否 符合對(duì)應(yīng)的預(yù)置條件,包括判斷識(shí)別距離是否小于該單個(gè)識(shí)別引擎對(duì)應(yīng)的置信閾值,如果小于,則符合;否則,不 符合。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,通過以下方式獲得單個(gè)識(shí)別引擎對(duì)應(yīng)的置信閾值從訓(xùn)練樣本中提取特征,所述特征包括字符編碼和識(shí)別距離; 根據(jù)提取出的特征進(jìn)行模型訓(xùn)練,得到對(duì)應(yīng)該單個(gè)識(shí)別引擎的置信閾值。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于所述提取出的特征分為正確識(shí)別的特征和錯(cuò)誤識(shí)別的特征,則所述置信閾值是根據(jù)正 確識(shí)別的特征進(jìn)行模型訓(xùn)練得到,或者是根據(jù)錯(cuò)誤識(shí)別的特征進(jìn)行模型訓(xùn)練得到。
6.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述進(jìn)行綜合決策包括 對(duì)所有單個(gè)識(shí)別引擎的識(shí)別結(jié)果進(jìn)行加權(quán)平均,得到最終識(shí)別結(jié)果。
7.一種手寫識(shí)別系統(tǒng),其特征在于,包括多個(gè)單個(gè)識(shí)別引擎,用于進(jìn)行手寫識(shí)別,得到識(shí)別結(jié)果;引擎選擇器,用于判斷單個(gè)識(shí)別引擎的識(shí)別結(jié)果是否符合對(duì)應(yīng)的預(yù)置條件,如果符合, 則結(jié)束識(shí)別;如果不符合,則繼續(xù)觸發(fā)另一單個(gè)識(shí)別引擎進(jìn)行識(shí)別;綜合決策模塊,用于當(dāng)所有單個(gè)識(shí)別引擎的識(shí)別結(jié)果都不符合相應(yīng)的預(yù)置條件時(shí),進(jìn) 行綜合決策。
8.根據(jù)權(quán)利要求7所述的系統(tǒng),其特征在于 所述識(shí)別結(jié)果包括字符編碼和識(shí)別距離;則所述引擎選擇器判斷單個(gè)識(shí)別引擎的識(shí)別距離是否小于該單個(gè)識(shí)別引擎對(duì)應(yīng)的置 信閾值,如果小于,則符合對(duì)應(yīng)的預(yù)置條件;否則,不符合。
9.根據(jù)權(quán)利要求7或8所述的系統(tǒng),其特征在于所述單個(gè)識(shí)別引擎還用于從訓(xùn)練樣本中提取特征,所述特征包括字符編碼和識(shí)別距罔;所述系統(tǒng)還包括模型訓(xùn)練模塊,用于根據(jù)提取出的特征進(jìn)行模型訓(xùn)練,得到對(duì)應(yīng)該單 個(gè)識(shí)別引擎的置信閾值。
10.根據(jù)權(quán)利要求9所述的系統(tǒng),其特征在于所述單個(gè)識(shí)別引擎提取出的特征分為正確識(shí)別的特征和錯(cuò)誤識(shí)別的特征,則所述置信 閾值是模型訓(xùn)練模塊根據(jù)正確識(shí)別的特征進(jìn)行模型訓(xùn)練得到,或者是根據(jù)錯(cuò)誤識(shí)別的特征 進(jìn)行模型訓(xùn)練得到。
全文摘要
本發(fā)明提供了一種手寫識(shí)別方法及系統(tǒng),以解決多引擎共同識(shí)別存在識(shí)別錯(cuò)誤的問題。所述方法包括使用單個(gè)識(shí)別引擎進(jìn)行手寫識(shí)別,得到識(shí)別結(jié)果;判斷單個(gè)識(shí)別引擎的識(shí)別結(jié)果是否符合對(duì)應(yīng)的預(yù)置條件,如果符合,則結(jié)束識(shí)別;如果不符合,則繼續(xù)使用另一單個(gè)識(shí)別引擎進(jìn)行識(shí)別;如果所有單個(gè)識(shí)別引擎的識(shí)別結(jié)果都不符合相應(yīng)的預(yù)置條件,則進(jìn)行綜合決策。本發(fā)明可以更加合理地應(yīng)用單個(gè)識(shí)別引擎的優(yōu)點(diǎn),提高了識(shí)別正確率。而且,降低了識(shí)別時(shí)的運(yùn)算量,從而提高了識(shí)別速度。
文檔編號(hào)G06K9/62GK101894266SQ201010223528
公開日2010年11月24日 申請(qǐng)日期2010年6月30日 優(yōu)先權(quán)日2010年6月30日
發(fā)明者張連毅, 李健, 武衛(wèi)東 申請(qǐng)人:北京捷通華聲語音技術(shù)有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
昌图县| 安徽省| 石河子市| 班戈县| 平昌县| 荔浦县| 宁乡县| 陆良县| 环江| 北宁市| 龙游县| 定兴县| 垦利县| 松滋市| 大荔县| 宁化县| 焉耆| 云龙县| 华宁县| 呼伦贝尔市| 林周县| 霍州市| 福建省| 启东市| 穆棱市| 镇雄县| 永修县| 柘荣县| 阿图什市| 台安县| 弥勒县| 南昌市| 荆门市| 体育| 武穴市| 贵南县| 紫金县| 天柱县| 合作市| 车致| 太康县|