專利名稱:一種手寫識別方法、系統(tǒng)及手寫識別終端的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及模式識別技術(shù),特別是涉及一種支持疊字輸入的手寫識別方法、系統(tǒng) 及手寫識別終端。
背景技術(shù):
手寫識別(Handwriting Recognize),是指將在手寫設(shè)備上書寫時產(chǎn)生的有序軌 跡信息轉(zhuǎn)化為漢字內(nèi)碼的過程,實際上是手寫軌跡的坐標(biāo)序列到漢字內(nèi)碼的一個映射過 程,是人機交互最自然、最方便的手段之一。目前用于手寫輸入的設(shè)備有許多種,比如電磁感應(yīng)手寫板、壓感式手寫板、觸摸 屏、觸控板、超聲波筆等。用戶在手寫輸入設(shè)備上書寫的筆畫以類似于矢量圖的形式被計算 機存儲下來,通過對文字圖像的抬筆、落筆、筆跡上各像素的空間位置等信息進行處理與對 照,系統(tǒng)將數(shù)據(jù)轉(zhuǎn)化為計算機所使用的文字編碼進行輸出。隨著智能手機、掌上電腦等移動信息工具的普及,手寫識別技術(shù)也進入了規(guī)模應(yīng) 用時代,可廣泛應(yīng)用于各種桌面操作系統(tǒng)、嵌入式操作系統(tǒng)中。但是,目前的手寫識別技術(shù)存在以下問題用戶若輸入一句話,需要一個字一個字的輸入,即用戶寫完一個字后需要等待系 統(tǒng)識別,系統(tǒng)識別后給出多個候選識別結(jié)果,用戶從中進行選擇從而完成一個字的輸入,然 后再開始輸入下一個字,并重復(fù)上述識別過程。由于用戶每寫完一個字就需要進行等待,因 此這種手寫識別方法影響了用戶的書寫速度,使用戶的輸入較慢。
發(fā)明內(nèi)容
本發(fā)明提供一種手寫識別方法、系統(tǒng)及手寫識別終端,以解決現(xiàn)有的手寫識別影 響用戶書寫速度的問題。為了解決上述問題,本發(fā)明公開了一種手寫識別方法,包括采集以疊字連續(xù)輸入的字符筆跡;對所述字符筆跡進行切割,得到至少一條切分路徑;利用字符之間的關(guān)聯(lián)信息對各切分路徑進行綜合判斷,得到最終識別結(jié)果。優(yōu)選的,所述利用字符之間的關(guān)聯(lián)信息對各切分路徑進行綜合判斷,得到最終識 別結(jié)果,包括對各切分路徑進行單字識別,針對每一個切分路徑得到候選識別結(jié)果及得到 該候選識別結(jié)果的第一概率值;利用語言模型對各候選識別結(jié)果進行打分,得出針對每個 候選識別結(jié)果的表示字符間關(guān)聯(lián)信息的第二概率值;根據(jù)各候選識別結(jié)果的第一概率值和 第二概率值得到各候選識別結(jié)果的綜合概率值;按照綜合概率值對各候選識別結(jié)果進行排 序,并選擇綜合概率值最大的候選識別結(jié)果為最終識別結(jié)果。優(yōu)選的,對所述字符筆跡進行切割后還得到各候選識別結(jié)果的表示切割概率的第 三概率值;則所述利用字符之間的關(guān)聯(lián)信息對各切分路徑進行綜合識別還包括根據(jù)各候 選識別結(jié)果的第一概率值、第二概率值以及第三概率值得到各候選識別結(jié)果的綜合概率值。優(yōu)選的,對所述字符筆跡進行切割,得到至少一條切分路徑,包括根據(jù)輸入順頁 序和字符筆跡中筆畫的相對位置進行切割,得到至少一條切分路徑。優(yōu)選的,根據(jù)輸入順頁序和字符筆跡中筆畫的相對位置進行切割,包括若筆畫 的起始點在疊字輸入?yún)^(qū)域的左上角位置,則在該筆畫與上一個輸入的筆畫之間為候選切割 點;若筆畫的起始點在疊字輸入?yún)^(qū)域的右下角位置,則將該筆畫與上一個輸入的筆畫合并 為一個切割塊;切割后的筆畫或切割塊根據(jù)候選切割點組合成不同的切分路徑。優(yōu)選的,根據(jù)輸入順頁序和字符筆跡中筆畫的相對位置進行切割,還包括若筆畫 的起始點在上一個輸入的筆畫的下方或右方位置,則將該筆畫與上一個輸入的筆畫合并為 一個切割塊。本發(fā)明還提供了一種手寫識別系統(tǒng),包括采集模塊,用于采集疊字連續(xù)輸入的字符筆跡;切割模塊,用于對所述字符筆跡進行切割,得到至少一條切分路徑;手寫識別模塊,用于利用字符之間的關(guān)聯(lián)信息對各切分路徑進行綜合判斷,得到 最終識別結(jié)果。優(yōu)選的,所述手寫識別模塊包括單字識別引擎子模塊,用于對各切分路徑進行單 字識別,針對每一個切分路徑得到候選識別結(jié)果及得到該候選識別結(jié)果的第一概率值;語 言打分子模塊,用于利用語言模型對各候選識別結(jié)果進行打分,得出針對每個候選識別結(jié) 果的表示字符間關(guān)聯(lián)信息的第二概率值;綜合判斷子模塊,用于根據(jù)各候選識別結(jié)果的第 一概率值和第二概率值得到各候選識別結(jié)果的綜合概率值;按照綜合概率值對各候選識別 結(jié)果進行排序,并選擇綜合概率值最大的候選識別結(jié)果為最終識別結(jié)果。優(yōu)選的,所述切割模塊對所述字符筆跡進行切割后還得到各候選識別結(jié)果的表示 切割概率的第三概率值;則所述綜合判斷子模塊還用于根據(jù)各候選識別結(jié)果的第一概率 值、第二概率值以及第三概率值得到各候選識別結(jié)果的綜合概率值;按照綜合概率值對各 候選識別結(jié)果進行排序,并選擇綜合概率值最大的候選識別結(jié)果為最終識別結(jié)果。優(yōu)選的,所述切割模塊包括候選切割點設(shè)置子模塊,用于當(dāng)筆畫的起始點在疊字 輸入?yún)^(qū)域的左上角位置時,在該筆畫與上一個輸入的筆畫之間設(shè)置候選切割點;合并子模 塊,用于當(dāng)筆畫的起始點在疊字輸入?yún)^(qū)域的右下角位置時,將該筆畫與上一個輸入的筆畫 合并為一個切割塊;和/或,當(dāng)筆畫的起始點在上一個輸入的筆畫的下方或右方位置時,將 該筆畫與上一個輸入的筆畫合并為一個切割塊;切割后的筆畫或切割塊根據(jù)候選切割點組 合成不同的切分路徑。本發(fā)明一種手寫識別終端,包括所述的手寫識別系統(tǒng)。與現(xiàn)有技術(shù)相比,本發(fā)明具有以下優(yōu)點本發(fā)明支持以疊字連續(xù)輸入的字符筆跡的識別,用戶可以在一塊手寫區(qū)域內(nèi)連續(xù) 重復(fù)書寫,字和字之間不需要等待時間,書寫完成后得到識別結(jié)果,加快了用戶輸入速度。而且,針對用戶連續(xù)輸入的多個字符筆跡,識別時可以利用字符之間的關(guān)聯(lián)信息 進行綜合識別,不僅提高了識別速度,還提高了識別準(zhǔn)確率。并且,本發(fā)明對手寫區(qū)域的屏幕尺寸要求較低,對于目前的手機等小屏幕設(shè)備具 有較大優(yōu)勢。
圖1是本發(fā)明實施例所述一種支持疊字輸入的手寫識別方法流程圖;圖2是本發(fā)明實施例所述一種支持疊字輸入的手寫識別系統(tǒng)的結(jié)構(gòu)圖。
具體實施例方式為使本發(fā)明的上述目的、特征和優(yōu)點能夠更加明顯易懂,下面結(jié)合附圖和具體實 施方式對本發(fā)明作進一步詳細(xì)的說明。本發(fā)明提出一種支持疊字輸入的手寫識別方法、系統(tǒng)及終端,用戶可以在一塊手 寫區(qū)域內(nèi)連續(xù)重復(fù)書寫,字和字之間不需要等待時間,書寫完成后得到識別結(jié)果,加快了用 戶輸入速度。下面通過實施例進行詳細(xì)說明。參照圖1,是本發(fā)明實施例所述一種支持疊字輸入的手寫識別方法流程圖。步驟11,采集以疊字連續(xù)輸入的字符筆跡;用戶在同一塊手寫區(qū)域中可以重復(fù)連續(xù)輸入多個字符,所述字符包含中文文字、 標(biāo)點符號、英文字母等形式。采集用戶連續(xù)輸入的字符筆跡,所述字符筆跡是指以筆畫形式輸入的信息。采集 手寫輸入的設(shè)備有多種,如電磁感應(yīng)手寫板、壓感式手寫板、觸摸屏、觸控板、超聲波筆等, 不同設(shè)備在采集時都是利用設(shè)備上安裝的感應(yīng)裝置記錄下用戶書寫的坐標(biāo),即筆跡點。通 常將落筆的位置記為一個筆畫的起始位置,將抬筆的位置記為一個筆畫的終止位置,落筆 位置和抬筆位置之間的一系列筆跡點構(gòu)成一個輸入筆畫。步驟12,對所述字符筆跡進行切割,得到至少一條切分路徑;所述切割是一種過切割,是指將采集到的字符筆跡以候選切割點進行筆畫切分, 切分后的筆畫根據(jù)候選切割點組合成不同的切分路徑。對于同樣的一組字符筆跡,切割后 可能得到一條切分路徑,也可能得到多條切分路徑。例如,用戶手寫輸入“天下”,進行切割后得到兩個候選切割點,分別位于“二”、 “人”、“下”之間。根據(jù)候選切割點,可能的切分路徑有4條,8卩“二 I人I下”、“二人I下”、 “二 I人下”、“二人下”。還例如,輸入“大”字,經(jīng)過切割后就可能得到“一 I人”的切割結(jié)
: O下面說明如何進行切割本實施例主要是根據(jù)輸入順頁序和字符筆跡中筆畫的相對位置進行切割,其中, 所述相對位置可以指當(dāng)前筆畫與上一個輸入的筆畫之間的位置關(guān)系,也可以指當(dāng)前筆畫在 疊字輸入?yún)^(qū)域(即手寫區(qū)域)的位置關(guān)系。具體的切割方法包括一種切割原理是通常一個字的第一個筆畫落筆點位于左上方位置,而一個字的 最后一個筆畫通常落筆點在右下方位置。因此根據(jù)這種規(guī)律可以得出以下判斷方式根據(jù) 筆畫輸入的先后順頁序,若當(dāng)前輸入筆畫的起始點(即落筆點)在疊字輸入?yún)^(qū)域(即手寫 區(qū)域)的左上角位置,則該筆畫是一個字的開始筆畫的可能性比較大,可以認(rèn)為該筆畫屬 于一個新輸入的字,因此可以在該筆畫與上一個輸入的筆畫之間判定為候選切割點,或者 此處切割的概率比較大;若當(dāng)前輸入筆畫的起始點在疊字輸入?yún)^(qū)域的右下角位置,則該筆畫是一個字的開始筆畫的可能性比較小,可以認(rèn)為該筆畫屬于上一個還未輸入完的字,該 筆畫與上一個輸入的筆畫之間不是候選切割點,因此可以將該筆畫與上一個輸入的筆畫合 并為一個切割塊,或者此處合并的概率比較大。最后,如前所述,切割后的筆畫或切割塊根 據(jù)候選切割點會組合成不同的切分路徑。還有一種切割原理是若一個筆畫位于上一個筆畫的下方或右方,則這個筆畫不 是一個字開始的可能性就比較大?;谶@種規(guī)律得出以下判斷方法若當(dāng)前輸入筆畫的 起始點在上一個輸入的筆畫的下方或右方位置,可以認(rèn)為該筆畫屬于上一個還未輸入完的 字,該筆畫與上一個輸入的筆畫之間不是候選切割點,因此將該筆畫與上一個輸入的筆畫 合并為一個切割塊,或者此處合并的概率比較大。同樣,切割后的筆畫或切割塊根據(jù)候選切 割點會組合成不同的切分路徑。此外,結(jié)合上述兩種切割方法,對于相交筆畫或切割塊,也會認(rèn)為存在候選切割 點;而對于不相交的筆畫或切割塊,則會進行合并。例如,輸入“天”,先輸入的筆畫是“二”, 后輸入的筆畫是“人”,由于“二”和“人”相交,因此“二”和“人”之間存在候選切割點;如果 輸入“下”,先后輸入的筆畫之間不相交,因此會將輸入的三個筆畫合并成一個切割塊“下”。上述提供的幾種切割方法可以單獨使用,也可以結(jié)合起來使用,本發(fā)明實施例在 此不做限定。此外,優(yōu)選的,經(jīng)過切割之后,還可以得到每條切分路徑的切割概率,稱為第三概 率值。所述切割概率表示切分路徑的切割代價,即根據(jù)輸入順頁序和筆畫相對位置得出的 切割正確的概率值。例如,將“天下”切割后得到4條切分路徑,分別是“二 I人I下”、“二 人I下”、“二 I人下”、“二人下”,每條切分路徑都對應(yīng)一個切割概率值。步驟13,利用字符之間的關(guān)聯(lián)信息對各切分路徑進行綜合判斷,得到最終識別結(jié)^ ο本實施例所述的手寫識別方法中,采集到的是用戶連續(xù)輸入的多個字符筆跡,由 于字符之間存在語義上的關(guān)聯(lián)關(guān)系,可利用語言模型找到這種關(guān)聯(lián)信息,因此識別過程中 可充分利用字符之間的這種關(guān)聯(lián)關(guān)系來進行更準(zhǔn)確、更快速的識別。所述利用字符之間的關(guān)聯(lián)信息進行綜合判斷是指利用單字識別引擎和語言模型 進行綜合判斷。具體的識別過程如下步驟131,對各切分路徑進行單字識別,針對每一個切分路徑得到候選識別結(jié)果及 得到該候選識別結(jié)果的第一概率值;其中,所述識別過程可采用現(xiàn)有的多種識別方法,本發(fā)明實施例在此不做限定。每一個切分路徑中,對以候選切割點切分開的每個單字進行識別,對于每個單字 的識別可能得到多個候選識別結(jié)果(是單字候選識別結(jié)果),并得到每個候選識別結(jié)果的 單字識別概率,稱為第一概率值。例如,對于輸入較短的“天下”,對相應(yīng)的4條切分路徑“二 I人I下”、“二人I下”、 “二 I人下”、“二人下”分別進行識別針對切分路徑“二人I下”分別對“二人”、“下”進行 單字識別,對應(yīng)“二人”得到的候選識別結(jié)果可能是“天”、“夫”等等,每一個候選識別結(jié)果 都得到一個單字識別概率,如對應(yīng)“天”、“夫”的第一概率值分別是A、B ;同樣,對于“下”也 進行單字識別得到相應(yīng)的一個或多個候選識別結(jié)果及每個候選識別結(jié)果的第一概率值。其 他切分路徑的單字識別過程相同,不再一一詳述。
步驟132,利用語言模型對各候選識別結(jié)果進行打分,得出針對每個候選識別結(jié)果 的表示字符間關(guān)聯(lián)信息的第二概率值;所述語言模型可表示字符之間的關(guān)聯(lián)信息,這種關(guān)聯(lián)信息可通過概率來表示。語 言模型是指用來計算短語或句子概率的模型,對于一句話,如果有多條切分路徑就會有多 個候選識別結(jié)果,此處的候選識別結(jié)果是指上述步驟131得到的單字候選識別結(jié)果根據(jù)語 言模型組合成字、詞、短語或句子的候選識別結(jié)果,如“二”與“人”組合成一個字“天”,“天” 即為一個候選識別結(jié)果,“文”與“件”組合成詞組“文件”也為一個候選識別結(jié)果。則對每 個候選識別結(jié)果,語言模型會計算出這個句子正確的概率有多大。例如,用戶輸入筆跡點的 一個候選識別結(jié)果為“文仵”,另一個候選識別結(jié)果為“文件”,由語言模型可知,“文件”的概 率要大于“文仵”的概率;若“文件”和“文仵”的識別概率相差不大,則語言模型會將結(jié)果 確定為更為常用的“文件”。關(guān)于語言模型的實現(xiàn),一種簡單的方法是只考慮前后兩個字的概率,如“件”前面 是“文”字的概率是多少,“仵”前面是“文”字的概率是多少,而與再往前是什么字無關(guān)。但 實際上情況并不是這樣,所以復(fù)雜一點的實現(xiàn)方法也可以考慮前前字(或更多的字),或者 考慮基于詞的語言模型,但計算量和存儲空間會增加很多。同樣,對于候選識別結(jié)果“二人下”、“天下”、“夫下”等“,由于“天下”為常用詞,因 此根據(jù)語言模型得出的概率最高;而“二人下”不是常用詞,因此語言模型的概率較低。步驟133,根據(jù)各候選識別結(jié)果的第一概率值和第二概率值得到各候選識別結(jié)果 的綜合概率值;計算綜合概率值時,一種簡單的方法是將每個候選識別結(jié)果的第一概率值和第二 概率值進行加權(quán)相加,得到對應(yīng)該候選識別結(jié)果的一個綜合概率值。當(dāng)然,也可以采用其他 更復(fù)雜的計算方法,本發(fā)明實施例在此不做限定。此外,優(yōu)選的,計算綜合概率值時還可以考慮上述切割概率,即第三概率值。每條 切分路徑都對應(yīng)一切割概率,每條切分路徑下得到的候選識別結(jié)果就可以使用相對應(yīng)的切 割概率計算綜合概率值??梢圆捎玫挠嬎惴椒ㄊ歉鶕?jù)各候選識別結(jié)果的第一概率值、第二概率值以及第 三概率值(即切割概率)得到各候選識別結(jié)果的綜合概率值,如將每個候選識別結(jié)果的第 一概率值、第二概率值和第三概率值(即切割概率)進行加權(quán)相加,得到對應(yīng)該候選識別結(jié) 果的一個綜合概率值。步驟134,按照綜合概率值對各候選識別結(jié)果進行排序,并選擇綜合概率值最大的 候選識別結(jié)果為最終識別結(jié)果。將所有切分路徑的候選識別結(jié)果計算綜合概率值后,通過對所有的候選識別結(jié)果 按照綜合概率值的高低進行排序后,就可以選擇出綜合概率值最大的候選識別結(jié)果為最終 識別結(jié)果并輸出。綜上所述,經(jīng)過以上流程的處理,上述支持疊字輸入的手寫識別方法可以對用戶 在一塊區(qū)域重復(fù)輸入的多個字符進行連續(xù)識別,大大加快了識別速度,而且結(jié)合語言模型 的識別還提高了識別準(zhǔn)確度。同時,由于用戶一次可輸入多個字,大大提高了輸入速度。在實際應(yīng)用中,本發(fā)明實施例所述手寫識別方法可應(yīng)用于一些有手寫輸入需求的 產(chǎn)品中,如PC機、筆記本電腦、平板電腦、手寫板等桌面操作系統(tǒng)中。此外,也可以應(yīng)用到嵌入式操作系統(tǒng)中,例如掌上電腦、手機、PAD、PDA、小屏手機或者橫屏手機等智能移動終 端;個人信息終端、車載信息終端等GPS/GIS終端;eBOOK、電子詞典、智能玩具等智能學(xué)習(xí) 終端;稅控機輸入終端、二代身份證讀卡信息終端、大型數(shù)據(jù)庫查詢終端、酒店管理系統(tǒng)輸 入終端、智能報警器、數(shù)字電視互動遙控器、卡拉OK點歌器、信息家電控制器等其他數(shù)據(jù)終 端。本發(fā)明對手寫區(qū)域的屏幕尺寸要求較低,尤其適用于小屏幕設(shè)備的疊字輸入與識別,對 于目前的手機等小屏幕設(shè)備具有較大優(yōu)勢。優(yōu)選的,在多任務(wù)系統(tǒng)中,上述切割和綜合識別過程可與書寫過程(即筆跡采集 過程)同步進行,從而進一步加快識別處理速度。所述多任務(wù)系統(tǒng)是指可以進行多線程的 系統(tǒng)。在用戶寫字的時間段內(nèi),由于筆跡采集占用CPU較低或者基本不占用CPU,因此大部 分CPU處于空閑狀態(tài)。而在多任務(wù)系統(tǒng)中,可以將這部分空閑的CPU利用起來,邊寫邊識別, 所以可以加快識別速度。基于上述內(nèi)容,本發(fā)明實施例還提供了相應(yīng)的系統(tǒng)實施例。參照圖2,是本發(fā)明實施例所述一種支持疊字輸入的手寫識別系統(tǒng)的結(jié)構(gòu)圖。所述手寫識別系統(tǒng)可以包括采集模塊21、切割模塊22和手寫識別模塊23,其中,采集模塊21,用于采集以疊字連續(xù)輸入的字符筆跡;切割模塊22,用于對采集模塊21采集到的所述字符筆跡進行切割,得到至少一條 切分路徑;手寫識別模塊23,用于利用字符之間的關(guān)聯(lián)信息對各切分路徑進行綜合判斷,得 到最終識別結(jié)果。其中,所述手寫識別模塊23可充分利用字符之間的關(guān)聯(lián)關(guān)系進行更準(zhǔn)確、更快速 的識別,因此所述手寫識別模塊23可進一步包括單字識別引擎子模塊231,用于對各切分路徑進行單字識別,針對每一個切分路徑 得到候選識別結(jié)果及得到該候選識別結(jié)果的第一概率值,并將各候選識別結(jié)果輸入語言打 分子模塊M2 ;語言打分子模塊232,用于利用語言模型對各候選識別結(jié)果進行打分,得出針對每 個候選識別結(jié)果的表示字符間關(guān)聯(lián)信息的第二概率值;綜合判斷子模塊233,用于根據(jù)各候選識別結(jié)果的第一概率值和第二概率值得到 各候選識別結(jié)果的綜合概率值;按照綜合概率值對各候選識別結(jié)果進行排序,并選擇綜合 概率值最大的候選識別結(jié)果為最終識別結(jié)果。優(yōu)選的,所述切割模塊22對所述字符筆跡進行切割后還得到各候選識別結(jié)果的 表示切割概率的第三概率值;則所述綜合判斷子模塊233還可用于根據(jù)各候選識別結(jié)果 的第一概率值、第二概率值以及第三概率值得到各候選識別結(jié)果的綜合概率值;按照綜合 概率值對各候選識別結(jié)果進行排序,并選擇綜合概率值最大的候選識別結(jié)果為最終識別結(jié)果。優(yōu)選的,所述切割模塊22進一步可以包括候選切割點設(shè)置子模塊221和合并子模 塊222。其中,候選切割點設(shè)置子模塊221,用于當(dāng)筆畫的起始點在疊字輸入?yún)^(qū)域的左上角位置 時,在該筆畫與上一個輸入的筆畫之間設(shè)置候選切割點;合并子模塊222,用于當(dāng)筆畫的起始點在疊字輸入?yún)^(qū)域的右下角位置時,將該筆畫與上一個輸入的筆畫合并為一個切割塊;和/或,當(dāng)筆畫的起始點在上一個輸入的筆畫的 下方或右方位置時,將該筆畫與上一個輸入的筆畫合并為一個切割塊;上述切割后的筆畫或切割塊根據(jù)候選切割點組合成不同的切分路徑。基于上述支持疊字輸入的手寫識別系統(tǒng),本發(fā)明實施例還提供了一種手寫識別終 端,該手寫識別終端可包括上述的手寫識別系統(tǒng),從而支持以疊字方式輸入的識別。所述手 寫識別系統(tǒng)的具體結(jié)構(gòu)可參照圖2所示,在此不再詳述。所述手寫識別終端可以是PC機、筆記本電腦、平板電腦、手寫板等桌面操作系統(tǒng) 終端,也可以是掌上電腦、手機、PAD、PDA、小屏手機或者橫屏手機等智能移動終端,還可以 是具有多任務(wù)系統(tǒng)的各類終端。本說明書中的各個實施例均采用遞進的方式描述,每個實施例重點說明的都是與 其他實施例的不同之處,各個實施例之間相同相似的部分互相參見即可。對于系統(tǒng)實施例 而言,由于其與方法實施例基本相似,所以描述的比較簡單,相關(guān)之處參見方法實施例的部 分說明即可。最后,還需要說明的是,在本文中,諸如第一和第二等之類的關(guān)系術(shù)語僅僅用來將 一個實體或者操作與另一個實體或操作區(qū)分開來,而不一定要求或者暗示這些實體或操作 之間存在任何這種實際的關(guān)系或者順頁序。以上對本發(fā)明所提供的一種手寫識別方法、系統(tǒng)及手寫識別終端,進行了詳細(xì)介 紹,本文中應(yīng)用了具體個例對本發(fā)明的原理及實施方式進行了闡述,以上實施例的說明只 是用于幫助理解本發(fā)明的方法及其核心思想;同時,對于本領(lǐng)域的一般技術(shù)人員,依據(jù)本發(fā) 明的思想,在具體實施方式
及應(yīng)用范圍上均會有改變之處,綜上所述,本說明書內(nèi)容不應(yīng)理 解為對本發(fā)明的限制。
權(quán)利要求
1.一種手寫識別方法,其特征在于,包括 采集以疊字連續(xù)輸入的字符筆跡;對所述字符筆跡進行切割,得到至少一條切分路徑;利用字符之間的關(guān)聯(lián)信息對各切分路徑進行綜合判斷,得到最終識別結(jié)果。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述利用字符之間的關(guān)聯(lián)信息對各切分 路徑進行綜合判斷,得到最終識別結(jié)果,包括對各切分路徑進行單字識別,針對每一個切分路徑得到候選識別結(jié)果及得到該候選識 別結(jié)果的第一概率值;利用語言模型對各候選識別結(jié)果進行打分,得出針對每個候選識別結(jié)果的表示字符間 關(guān)聯(lián)信息的第二概率值;根據(jù)各候選識別結(jié)果的第一概率值和第二概率值得到各候選識別結(jié)果的綜合概率值;按照綜合概率值對各候選識別結(jié)果進行排序,并選擇綜合概率值最大的候選識別結(jié)果 為最終識別結(jié)果。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于對所述字符筆跡進行切割后還得到各候選識別結(jié)果的表示切割概率的第三概率值; 則所述利用字符之間的關(guān)聯(lián)信息對各切分路徑進行綜合識別還包括根據(jù)各候選識別 結(jié)果的第一概率值、第二概率值以及第三概率值得到各候選識別結(jié)果的綜合概率值。
4.根據(jù)權(quán)利要求1至3任一所述的方法,其特征在于,對所述字符筆跡進行切割,得到 至少一條切分路徑,包括根據(jù)輸入順序和字符筆跡中筆畫的相對位置進行切割,得到至少一條切分路徑。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,根據(jù)輸入順序和字符筆跡中筆畫的相對 位置進行切割,包括若筆畫的起始點在疊字輸入?yún)^(qū)域的左上角位置,則在該筆畫與上一個輸入的筆畫之間 為候選切割點;若筆畫的起始點在疊字輸入?yún)^(qū)域的右下角位置,則將該筆畫與上一個輸入的筆畫合并 為一個切割塊;切割后的筆畫或切割塊根據(jù)候選切割點組合成不同的切分路徑。
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,根據(jù)輸入順序和字符筆跡中筆畫的相對 位置進行切割,還包括若筆畫的起始點在上一個輸入的筆畫的下方或右方位置,則將該筆畫與上一個輸入的 筆畫合并為一個切割塊。
7.一種手寫識別系統(tǒng),其特征在于,包括 采集模塊,用于采集疊字連續(xù)輸入的字符筆跡;切割模塊,用于對所述字符筆跡進行切割,得到至少一條切分路徑; 手寫識別模塊,用于利用字符之間的關(guān)聯(lián)信息對各切分路徑進行綜合判斷,得到最終 識別結(jié)果。
8.根據(jù)權(quán)利要求7所述的系統(tǒng),其特征在于,所述手寫識別模塊包括單字識別引擎子模塊,用于對各切分路徑進行單字識別,針對每一個切分路徑得到候選識別結(jié)果及得到該候選識別結(jié)果的第一概率值;語言打分子模塊,用于利用語言模型對各候選識別結(jié)果進行打分,得出針對每個候選 識別結(jié)果的表示字符間關(guān)聯(lián)信息的第二概率值;綜合判斷子模塊,用于根據(jù)各候選識別結(jié)果的第一概率值和第二概率值得到各候選識 別結(jié)果的綜合概率值;按照綜合概率值對各候選識別結(jié)果進行排序,并選擇綜合概率值最 大的候選識別結(jié)果為最終識別結(jié)果。
9.根據(jù)權(quán)利要求8所述的系統(tǒng),其特征在于所述切割模塊對所述字符筆跡進行切割后還得到各候選識別結(jié)果的表示切割概率的第三概率值;則所述綜合判斷子模塊還用于根據(jù)各候選識別結(jié)果的第一概率值、第二概率值以及 第三概率值得到各候選識別結(jié)果的綜合概率值;按照綜合概率值對各候選識別結(jié)果進行排 序,并選擇綜合概率值最大的候選識別結(jié)果為最終識別結(jié)果。
10.根據(jù)權(quán)利要求7至9任一所述的系統(tǒng),其特征在于,所述切割模塊包括候選切割點設(shè)置子模塊,用于當(dāng)筆畫的起始點在疊字輸入?yún)^(qū)域的左上角位置時,在該 筆畫與上一個輸入的筆畫之間設(shè)置候選切割點;合并子模塊,用于當(dāng)筆畫的起始點在疊字輸入?yún)^(qū)域的右下角位置時,將該筆畫與上一 個輸入的筆畫合并為一個切割塊;和/或,當(dāng)筆畫的起始點在上一個輸入的筆畫的下方或 右方位置時,將該筆畫與上一個輸入的筆畫合并為一個切割塊;切割后的筆畫或切割塊根據(jù)候選切割點組合成不同的切分路徑。
11.一種手寫識別終端,其特征在于,包括權(quán)利要求7至10任一所述的手寫識別系統(tǒng)。全文摘要
本發(fā)明提供了一種手寫識別方法、系統(tǒng)及手寫識別終端,以解決現(xiàn)有的手寫識別影響用戶書寫速度的問題。所述方法包括采集以疊字連續(xù)輸入的字符筆跡;對所述字符筆跡進行切割,得到至少一條切分路徑;利用字符之間的關(guān)聯(lián)信息對各切分路徑進行綜合判斷,得到最終識別結(jié)果。本發(fā)明支持以疊字連續(xù)輸入的字符筆跡的識別,用戶可以在一塊手寫區(qū)域內(nèi)連續(xù)重復(fù)書寫,字和字之間不需要等待時間,書寫完成后得到識別結(jié)果,加快了用戶輸入速度。而且,針對用戶連續(xù)輸入的多個字符筆跡,識別時可以利用字符之間的關(guān)聯(lián)信息進行綜合識別,不僅提高了識別速度,還提高了識別準(zhǔn)確率。
文檔編號G06F3/041GK102073884SQ201010620040
公開日2011年5月25日 申請日期2010年12月31日 優(yōu)先權(quán)日2010年12月31日
發(fā)明者張連毅, 李健, 武衛(wèi)東 申請人:北京捷通華聲語音技術(shù)有限公司