欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種交互式篇章級(jí)手寫識(shí)別方法及系統(tǒng)的制作方法

文檔序號(hào):6338252閱讀:186來源:國(guó)知局
專利名稱:一種交互式篇章級(jí)手寫識(shí)別方法及系統(tǒng)的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及一種手寫識(shí)別方法及系統(tǒng),尤其涉及一種交互式篇章級(jí)手寫識(shí)別方 法及系統(tǒng)。
背景技術(shù)
隨著電腦和移動(dòng)數(shù)碼設(shè)備在中國(guó)百姓中的普及,人們?cè)絹碓叫枰环N能夠快速 有效的將漢字輸入到數(shù)碼設(shè)備中的方法?,F(xiàn)有技術(shù)中大多采用鍵盤輸入文字信息或者使 用手寫體識(shí)別的技術(shù)輸入文字。使用鍵盤輸入信息,要求用戶根據(jù)漢字編碼方式敲擊鍵盤完成文字輸入。漢字 編碼一般分為音碼和形碼兩種。音碼比較容易掌握,但對(duì)于很多使用方言等發(fā)音不是很 準(zhǔn)確的用戶來說,輸入常會(huì)出錯(cuò),音碼的重碼率很高,用戶輸入時(shí)的大量工作往往是在 候選列表中選擇正確的字,不易快速輸入。形碼錄入的速度較快,但要求用戶牢記各種 拆分方案,對(duì)于普通人來說并不容易實(shí)現(xiàn)。無論是使用音碼還是形碼的鍵盤輸入,都要 求用戶熟記編碼方式,熟悉鍵盤按鍵排位,許多用戶無法達(dá)到這種要求,尤其是一些配 備袖珍鍵盤甚至是沒有無力鍵盤的移動(dòng)設(shè)備,更加無法滿足快速輸入的要求。手寫識(shí)別輸入法是通過設(shè)備將筆尖或手指走過的軌跡按時(shí)間采樣,將獲取的采 用點(diǎn)利用手寫識(shí)別算法識(shí)別后并將識(shí)別結(jié)果顯示出來的一種輸入方法。這種輸入法容易 掌握、不需要記憶漢字編碼方式、不需要熟悉鍵盤按鍵的排列位置,尤其是適合對(duì)鍵盤 不夠熟悉的操作者。目前大多的數(shù)碼設(shè)備都含有觸摸屏或是可外接手寫板,這樣就為手 寫輸入提供了良好的硬件支持,再加上手寫識(shí)別輸入方法所具有的先天優(yōu)點(diǎn)使得它在漢 字輸入領(lǐng)域所占的比重越來越大。然而已有的手寫識(shí)別系統(tǒng)只能進(jìn)行手寫信息的一次性單向傳遞,即(1)當(dāng)用戶 輸入手寫文字(序列)后,無法再次對(duì)手寫序列中的各部分信息進(jìn)行靈活編輯,(2)以 識(shí)別后的書面文字為主要視圖進(jìn)行編輯操作,每次用戶書寫完一個(gè)文字(序列)并獲得 系統(tǒng)輸出的識(shí)別結(jié)果后,就無法再返回查看之前的手寫文字序列。顯然這種一次性單向 傳遞方式是用戶被迫提前逐字或者逐詞識(shí)別并在單個(gè)字或詞的候選結(jié)果中查找、選擇完 正確的文字后再繼續(xù)書寫新的文字,這也成為了用戶難以流暢錄入信息、思維經(jīng)常被中 斷、錄入效率低下的決定性因素。

發(fā)明內(nèi)容
本發(fā)明解決的技術(shù)問題是傳統(tǒng)手寫輸入法無法讓用戶自由編輯已經(jīng)寫入的手 寫字符,從而必須在寫入每個(gè)或者較少的幾個(gè)字符后就需要從候選序列中選擇對(duì)應(yīng)的書 面文字,這會(huì)經(jīng)常打斷用戶書寫思路,書寫過程難以連貫、流暢的進(jìn)行,大大降低了手 寫輸入效率,同時(shí)這種基于局部信息的識(shí)別也無法充分利用用戶在輸入整段或整篇文檔 時(shí)豐富的上下文信息,識(shí)別率也難以進(jìn)一步提升。本發(fā)明提供了一種能夠支持用戶在寫完了一段甚至整篇手寫檔后再進(jìn)行識(shí)別的手寫文字輸入方法。該方法不需要用戶通過預(yù) 先注冊(cè)來獲得該用戶的書寫特征模板,而能自適應(yīng)不同用戶的書寫風(fēng)格;用戶只需直接 將連續(xù)的構(gòu)思轉(zhuǎn)換成手寫文檔即可,識(shí)別系統(tǒng)將對(duì)輸入的整個(gè)手寫文檔進(jìn)行識(shí)別。本發(fā)明解決現(xiàn)有技術(shù)中存在的問題所采用的技術(shù)方案為提供一種交互式篇章 級(jí)手寫識(shí)別方法,包括如下步驟
輸入手寫文檔通過手寫人機(jī)交互輸入手寫文檔;
交互編輯與識(shí)別手寫文檔對(duì)所述手寫文檔進(jìn)行編輯,對(duì)手寫文檔進(jìn)行識(shí)別,編輯 手寫文檔和識(shí)別手寫文檔交互進(jìn)行;
輸出手寫文檔輸出識(shí)別后的手寫文檔。本發(fā)明的進(jìn)一步技術(shù)方案是在輸入手寫文檔步驟中,對(duì)所述手寫文檔進(jìn)行切 分處理,包括如下步驟
手寫文檔的切分將所述手寫文檔切分成單個(gè)手寫信息單元; 建立索引為每個(gè)手寫信息單元建立索引并根據(jù)索引將手寫信息單元存入手寫文
檔;
顯示手寫文檔根據(jù)手寫文檔中手寫信息單元的索引將手寫文檔排版顯示輸出。本發(fā)明的進(jìn)一步技術(shù)方案是在交互編輯與識(shí)別手寫文檔中包括如下步驟 編輯手寫文檔根據(jù)切分的手寫信息單元對(duì)手寫文檔進(jìn)行編輯;
識(shí)別手寫文檔對(duì)手寫文檔進(jìn)行識(shí)別;
交互進(jìn)行編輯和識(shí)別根據(jù)需要交替進(jìn)行編輯手寫文檔和識(shí)別手寫文檔直到確定手 寫文檔內(nèi)容和識(shí)別結(jié)果。本發(fā)明的進(jìn)一步技術(shù)方案是在編輯手寫文檔中包括如下步驟 建立索引對(duì)手寫信息單元進(jìn)行編碼,建立支持編輯操作的索引; 編輯根據(jù)手寫信息單元的索引,對(duì)手寫文檔進(jìn)行編輯;
排版對(duì)編輯后的手寫文檔進(jìn)行排版。本發(fā)明的進(jìn)一步技術(shù)方案是對(duì)所述手寫文檔進(jìn)行切分處理后,在識(shí)別手寫文 檔步驟中,包括如下步驟
提取手寫信息單元從的手寫文檔中提取出手寫信息單元;
進(jìn)行篇章關(guān)聯(lián)分析對(duì)文檔中全部的手寫信息單元進(jìn)行篇章關(guān)聯(lián)分析,通過整篇文 檔字符的聚類找到用戶的書寫整體特征;
產(chǎn)生識(shí)別結(jié)果候選集根據(jù)單個(gè)手寫信息單元的手寫文字特征產(chǎn)生該手寫信息單元 識(shí)別結(jié)果候選集;
修改識(shí)別結(jié)果結(jié)合單個(gè)手寫信息單元的識(shí)別結(jié)果、自然語(yǔ)言模型和用戶書寫的整 體特征調(diào)整每個(gè)單元的識(shí)別結(jié)果候選集,完成手寫文檔識(shí)別。本發(fā)明的進(jìn)一步技術(shù)方案是在進(jìn)行篇章關(guān)聯(lián)分析步驟中,包括如下步驟 預(yù)處理對(duì)采集到的手寫文字信息進(jìn)行預(yù)處理,解決每個(gè)用戶字形的變化、筆畫的
變形等問題;
計(jì)算相似度根據(jù)改進(jìn)的動(dòng)態(tài)時(shí)間彎曲算法計(jì)算兩個(gè)手寫文字之間的相似度; 判斷相似根據(jù)一個(gè)變化的相似度閾值判斷當(dāng)前兩個(gè)手寫文字是否相似。本發(fā)明的進(jìn)一步技術(shù)方案是在產(chǎn)生識(shí)別結(jié)果候選集步驟中,包括如下步驟手寫字符筆跡點(diǎn)信息的預(yù)處理對(duì)輸入的手寫字符筆跡點(diǎn)信息進(jìn)行預(yù)處理操作; 生成特征向量從手寫字符軌跡點(diǎn)中提取出方向特征組成特征向量; 歸類根據(jù)特征向量將字符歸類到最近的一個(gè)候選組內(nèi);
得到識(shí)別結(jié)果在候選組內(nèi)應(yīng)用分類器對(duì)字符在候選組內(nèi)進(jìn)行分類,得到最后識(shí)別結(jié)果。本發(fā)明的進(jìn)一步技術(shù)方案是在修改識(shí)別結(jié)果步驟中,包括如下步驟 獲取手寫文字集合在手寫文檔中獲得與當(dāng)前手寫文字相似的手寫文字集合; 獲取識(shí)別候選獲取該手寫文字集合中每個(gè)手寫文字的前5個(gè)識(shí)別候選,統(tǒng)計(jì)所有
候選中出現(xiàn)的書面文字的種類數(shù);
統(tǒng)計(jì)頻度統(tǒng)計(jì)每類書面文字出現(xiàn)的頻度;
計(jì)算平均位置計(jì)算每類書面文字出現(xiàn)的平均位置,這個(gè)位置是這類文字出現(xiàn)位置 的平均值;
獲取最終識(shí)別候選根據(jù)比較函數(shù)對(duì)每類書面文字排序,取排序中前五個(gè)結(jié)果作為 這個(gè)字的識(shí)別候選。本發(fā)明的進(jìn)一步技術(shù)方案是構(gòu)建一種交互式篇章級(jí)手寫識(shí)別系統(tǒng),包括手寫 文字交互單元及篇章手寫識(shí)別單元,所述手寫文字交互單元包括輸入手寫文字的輸入模 塊,所述篇章手寫識(shí)別單元包括識(shí)別模塊,其特征在于,所述手寫文字交互單元還包括 對(duì)所述手寫文檔進(jìn)行編輯的編輯模塊,所述編輯模塊編輯手寫文檔與所述識(shí)別模塊所述 識(shí)別模塊交互運(yùn)行。本發(fā)明的進(jìn)一步技術(shù)方案是所述手寫文字交互單元還包括對(duì)所述識(shí)別模塊識(shí) 別的手寫文檔的結(jié)果進(jìn)行修改的確認(rèn)修改模塊,所述確認(rèn)修改模塊對(duì)所述識(shí)別結(jié)果進(jìn)行 修改。本發(fā)明的技術(shù)效果是本發(fā)明涉及一種交互式篇章級(jí)手寫識(shí)別方法及系統(tǒng),通 過以手寫文檔為主要視圖,引導(dǎo)用戶采用整篇寫入整篇識(shí)別的方式,改變了傳統(tǒng)識(shí)別系統(tǒng) 輸入一個(gè)或較短的幾個(gè)字,顯示識(shí)別結(jié)果并顯示一組候選字符供用戶選擇的方式。利用 篇章文檔的內(nèi)在關(guān)聯(lián)信息,自適應(yīng)不同用戶的書寫特點(diǎn)的智能手寫識(shí)別方法,可達(dá)到連 續(xù)、快速輸入,更加準(zhǔn)確識(shí)別的效果。


圖1為本發(fā)明流程圖。
圖2為本發(fā)明對(duì)手寫文檔進(jìn)行切分處理的流程圖。
圖3為本發(fā)明手寫文檔的切分流程圖。
圖4為本發(fā)明筆劃區(qū)間示意圖。
圖5為本發(fā)明數(shù)字墨水技術(shù)的流程圖。
圖6為本發(fā)明交互編輯識(shí)別流程圖。
圖7為本發(fā)明編輯手寫文檔流程圖。
圖8為本發(fā)明識(shí)別手寫文檔的流程圖。
圖9為本發(fā)明進(jìn)行篇章關(guān)聯(lián)分析的流程圖。
圖10為本發(fā)明產(chǎn)生識(shí)別結(jié)果候選集的流程圖。圖11為本發(fā)明一個(gè)方向分解實(shí)例圖。圖12為本發(fā)明獲得識(shí)別結(jié)果的流程圖。圖13為本發(fā)明修改識(shí)別結(jié)果的流程圖。圖14為本發(fā)明的結(jié)構(gòu)示意圖。圖15為本發(fā)明的優(yōu)選實(shí)施方式結(jié)構(gòu)示意圖。
具體實(shí)施例方式下面結(jié)合具體實(shí)施例,對(duì)本發(fā)明技術(shù)方案進(jìn)一步說明。如圖1所示,本發(fā)明的具體實(shí)施方式
是提供一種交互式篇章級(jí)手寫識(shí)別方 法,包括如下步驟
步驟100:輸入手寫文檔,即通過手寫人機(jī)交互輸入手寫文檔。如圖2所示,在對(duì)手寫文檔發(fā)出識(shí)別請(qǐng)求步驟中,對(duì)所述手寫文檔進(jìn)行切分處 理包括如下步驟
步驟110 手寫文檔的切分,即將所述手寫文檔切分成單個(gè)手寫信息單元。如圖3所示,對(duì)于手寫文檔的切分包括如下步驟
步驟111:輸入圖像點(diǎn)集合將手寫文字作為圖像一樣輸入其圖像點(diǎn)的集合。步驟112:抽取筆劃區(qū)間,即根據(jù)輸入圖像點(diǎn)集合抽取其中的筆劃區(qū)間。步驟113 初步合并區(qū)間并排序,即經(jīng)過初步合并筆劃區(qū)間后,對(duì)所有的筆劃 區(qū)間按坐標(biāo)位置排序。步驟114:校正合并區(qū)間,即根據(jù)排序的結(jié)果校正合并的區(qū)間。步驟115:形成分割后的單元,即按照合并的筆劃區(qū)間將圖像點(diǎn)分成若干集 合,每個(gè)集合為分割后的單元。具體實(shí)施過程如下手寫筆跡文字切分算法的步驟為根據(jù)輸入圖像點(diǎn)集合抽取 其中的筆劃區(qū)間,經(jīng)過初步合并筆劃區(qū)間后,對(duì)所有的筆劃區(qū)間按坐標(biāo)位置排序,根據(jù) 排序的結(jié)果校正合并的結(jié)果,按照合并的筆劃區(qū)間將圖像點(diǎn)分成若干集合,每個(gè)集合為 分割后的單元,將分割后的單元放縮處理成統(tǒng)一的大小。經(jīng)過這些步驟后,輸入的圖像 點(diǎn)的集合就被分割成若干個(gè)部分了。手寫筆跡文字切分算法模塊盡管具有一系列的算法步驟,但是只有一個(gè)入口和 一個(gè)出口,非常方便使用。切分開始時(shí),輸入?yún)?shù)是包含一個(gè)或多個(gè)手寫文字單元的樣 本點(diǎn)數(shù)據(jù)集合。切分第一步就是抽取筆畫區(qū)間,一個(gè)筆畫包含多個(gè)樣本點(diǎn)數(shù)據(jù),最后一 個(gè)樣本點(diǎn)是結(jié)束點(diǎn),包含一個(gè)結(jié)束標(biāo)志,結(jié)束點(diǎn)意味著一個(gè)筆畫結(jié)束,而筆畫區(qū)間則由 包含在該筆畫的所有點(diǎn)中χ軸的最小值和最大值確定。筆畫區(qū)間圖4所示。由圖4可以看出,在初始筆畫區(qū)間中,“哈”字含有9個(gè)筆畫,因而包含9個(gè) 筆畫區(qū)間,分別從Sl到S9,而“工”和“大”則分別只有3個(gè)筆畫區(qū)間。進(jìn)行初步合 并筆畫區(qū)間時(shí),Si、S2和S3重疊,所以合并成一個(gè)區(qū)間,S4-S9六個(gè)區(qū)間合并,S10、 Sll和S12區(qū)間合并,S13、S14和S15區(qū)間合并,從而產(chǎn)生初步合并的結(jié)果為4個(gè)筆畫 區(qū)間。
得到初步合并區(qū)間之后,需要對(duì)筆畫區(qū)間進(jìn)行一次按照X軸的排序,以保證用 戶手寫順序不同(如先寫后面的“大”,再寫前面的“哈”)時(shí),同樣能夠正確切分圖 像。排序之后,再進(jìn)行一個(gè)校準(zhǔn)合并,使得文字的部首能夠正確被合并到一個(gè)文字中, 如“哈”字左邊的“口”。校準(zhǔn)合并使用一個(gè)高寬比參數(shù),只要發(fā)現(xiàn)某個(gè)筆畫區(qū)間的寬 度小于某個(gè)比值,則表示該區(qū)間很可能是一個(gè)手寫文字的部首而已,再檢查與左右區(qū)間 的間隔,如果間隔也小于某個(gè)比值,則合并兩個(gè)區(qū)間,例如將“哈”字的“口”區(qū)間和 右邊的區(qū)間合并,則產(chǎn)生正確的“哈”字區(qū)間。校準(zhǔn)合并之后,每個(gè)筆畫區(qū)間即表示一個(gè)手寫文字的點(diǎn)χ軸所在的區(qū)間,因此 根據(jù)筆畫區(qū)間的信息,對(duì)輸入?yún)?shù)原始點(diǎn)集合中的所有點(diǎn)根據(jù)判斷其落在哪個(gè)筆畫區(qū)間 中而劃分為不同的點(diǎn)集合,每個(gè)點(diǎn)集合即表示一個(gè)手寫文字的點(diǎn)集合。最后對(duì)每個(gè)點(diǎn)集 合進(jìn)行規(guī)范壓縮,使得所有的手寫文字點(diǎn)數(shù)據(jù)落在標(biāo)準(zhǔn)范圍內(nèi),以便編碼保存。最終輸 出切分后的規(guī)范壓縮的手寫文字,到此,切分過程結(jié)束。步驟120:建立索引,即為每個(gè)手寫信息單元建立索引并根據(jù)索引將手寫信 息單元存入手寫文檔。對(duì)切分或合并處理后的所述手寫信息單元進(jìn)行編碼,建立支持編 輯操作的索引,進(jìn)行索引計(jì)算,得出各獨(dú)立手寫信息單元在整體手寫信息單元中的物理位 置,并計(jì)算所述手寫信息單元相對(duì)于顯示頁(yè)面的動(dòng)態(tài)索引。步驟130:顯示手寫文檔,即根據(jù)手寫文檔中手寫信息單元的索引將手寫文 檔排版顯示輸出。如圖5所示,在顯示手寫文檔步驟中,采用數(shù)字墨水技術(shù)將手寫文檔 排版顯示出來,包括如下步驟
步驟131:運(yùn)筆速度的處理,即根據(jù)筆劃的精細(xì)確定運(yùn)筆速度。用戶用電子筆在 手寫板上書寫時(shí),書寫速度分為加速、減速和勻速三個(gè)過程。書寫加速狀態(tài),則筆劃漸 細(xì);書寫減速狀態(tài),則筆劃漸粗;書寫勻速狀態(tài),則筆劃粗細(xì)不改變。步驟132:書寫動(dòng)作的處理,即根據(jù)運(yùn)筆速度進(jìn)行筆劃粗細(xì)調(diào)整。書寫動(dòng)作分 為起筆、運(yùn)筆、收筆。起筆時(shí)會(huì)有迂回頓筆的效果;運(yùn)筆過程中書寫速度會(huì)時(shí)刻變化, 因此需要根據(jù)運(yùn)筆速度處理策略進(jìn)行筆劃粗細(xì)調(diào)整;收筆時(shí)可能出現(xiàn)慣性甩筆的效果。步驟133:筆劃繪制的處理,即對(duì)筆劃輪廓進(jìn)行羽化處理。一個(gè)完整的筆劃是 由若干個(gè)筆劃區(qū)間線段連接而成,而且筆劃的輪廓可能會(huì)有細(xì)微的“鋸齒”效果,因此 在進(jìn)行筆劃線段連接處需要有連接填充處理,在筆劃邊緣需要加入“羽化”效果。本發(fā)明使用基于速度的筆跡仿真方法摒棄了壓力參數(shù),通過手寫速度調(diào)整筆劃 粗細(xì),針對(duì)于軟筆書法的特殊性,對(duì)起筆、收筆、運(yùn)筆過程進(jìn)行處理,并且對(duì)筆劃輪廓 邊緣、筆劃連接方式等效果也進(jìn)行了處理。在步驟130:顯示手寫文檔,將手寫文檔排版顯示過程中,涉及如下方法 一、存儲(chǔ)及索引的結(jié)構(gòu)
將每幅壓縮完畢的圖像按像素展開成為一維數(shù)組,將每個(gè)字的寬度和總長(zhǎng)度放在數(shù) 組的最前端,設(shè)一位的添加刪除位。這樣文檔的內(nèi)容便存儲(chǔ)在一系列的數(shù)組中。全局索 引的結(jié)構(gòu)分兩個(gè)部分,第一個(gè)字節(jié)存儲(chǔ)的內(nèi)容為對(duì)應(yīng)字的圖像在全文中的位置,第二個(gè) 字節(jié)存放的為圖像數(shù)據(jù)在文件中存儲(chǔ)的位置。動(dòng)態(tài)索引記錄下了每個(gè)顯示在操作頁(yè)面上 的字圖像開始顯示時(shí)左上角的坐標(biāo)值,動(dòng)態(tài)索引的作用在于能夠根據(jù)光標(biāo)的位置快速準(zhǔn) 確地定位光標(biāo)所選定的圖像。動(dòng)態(tài)索引在打開文件時(shí)創(chuàng)建,關(guān)閉文件時(shí)刪除,并不保存在文件中。文檔的結(jié)構(gòu)均由特殊字符控制,特殊字符和文字圖像一同存儲(chǔ)在文檔內(nèi)容中, 特殊字符包括換行符,空行符。每遇到特殊字符時(shí),顯示過程中采取特殊操作,從而 控制文檔顯示的格式。二、索引支持的添加刪除編輯操作
經(jīng)過識(shí)別出添加或者刪除的動(dòng)作,選定將要添加或者刪除的文字圖像,根據(jù)動(dòng)態(tài)索 引所存儲(chǔ)的坐標(biāo),定位將要添加或者刪除的位置,先在索引中進(jìn)行編輯操作。添加時(shí)將 索引添加在正確的位置上,文字圖像內(nèi)容直接加在文件的末端,刪除時(shí)先只在索引中將 對(duì)應(yīng)文字圖像的索引刪除,并將文字圖像的刪除位置1,直到用戶保存文檔時(shí)才真正將文 字圖像內(nèi)容從文件中刪除。三、緩沖區(qū)保存操作
每當(dāng)打開一個(gè)文字圖像文檔時(shí)在內(nèi)存中設(shè)置緩沖區(qū),采用雙緩沖的方式編輯和顯示 文檔。步驟200:交互編輯與識(shí)別手寫文檔,即對(duì)所述手寫文檔進(jìn)行編輯,對(duì)手寫 文檔進(jìn)行識(shí)別,編輯手寫文檔和識(shí)別手寫文檔交互進(jìn)行。具體來說,對(duì)手寫文檔進(jìn)行編 輯后提交進(jìn)行識(shí)別,對(duì)手寫文檔進(jìn)行識(shí)別后再進(jìn)行手寫文檔的編輯,直到手寫文檔的識(shí) 別結(jié)果進(jìn)行確認(rèn)。如圖6所示,具體在交互編輯與識(shí)別手寫文檔步驟中,包括如下步驟 步驟210:編輯手寫文檔,即根據(jù)切分的手寫信息單元對(duì)手寫文檔進(jìn)行編輯。在編輯手寫文檔的步驟中具體包括如下步驟
步驟211:建立索引,即對(duì)手寫信息單元進(jìn)行編碼,建立支持編輯操作的索引。具 體來說,對(duì)切分或合并處理后的所述手寫信息單元進(jìn)行編碼,建立支持編輯操作的索引, 進(jìn)行索引計(jì)算,得出各獨(dú)立手寫信息單元在整體手寫信息單元中的物理位置,并計(jì)算所 述手寫信息單元相對(duì)于顯示頁(yè)面的動(dòng)態(tài)索引。步驟212:編輯,即根據(jù)手寫信息單元的索引,對(duì)手寫文檔進(jìn)行編輯。步驟213:排版,即對(duì)編輯后的手寫文檔進(jìn)行排版。對(duì)每次編輯后受到影響的 信息單元進(jìn)行自動(dòng)排版。步驟220識(shí)別手寫文檔,即對(duì)手寫文檔進(jìn)行識(shí)別。在識(shí)別手寫文檔步驟中, 具體包括如下步驟
步驟221:提取手寫信息單元,即從手寫文檔中提取出手寫信息單元。步驟222:進(jìn)行篇章關(guān)聯(lián)分析,即對(duì)文檔中全部的手寫信息單元進(jìn)行篇章關(guān) 聯(lián)分析,通過整篇文檔字符的聚類找到用戶的書寫整體特征。如圖7所示,具體在在進(jìn) 行篇章關(guān)聯(lián)分析步驟中,包括如下步驟
步驟2221:預(yù)處理,即對(duì)采集到的手寫文字信息進(jìn)行預(yù)處理,解決每個(gè)用戶字形 的變化、筆畫的變形等問題;
步驟2222:計(jì)算相似度,即根據(jù)改進(jìn)的動(dòng)態(tài)時(shí)間彎曲算法計(jì)算兩個(gè)手寫文字之間 的相似度;
步驟2223:判斷相似,即根據(jù)一個(gè)變化的相似度閾值判斷當(dāng)前兩個(gè)手寫文字是否 相似。動(dòng)態(tài)時(shí)間彎曲算法可以歸結(jié)為運(yùn)用動(dòng)態(tài)規(guī)劃思想尋找一條具有最小彎曲代價(jià)的最佳 路徑,由以上的局部距離公式可求得全局的最小距離,這個(gè)最小距離作為兩個(gè)手寫體文 字間的距離。用戶手寫特征關(guān)聯(lián)性分析中第三步中使用的變化的相似度閾值的公式為
權(quán)利要求
1.一種交互式篇章級(jí)手寫識(shí)別方法,包括如下步驟輸入手寫文檔通過手寫人機(jī)交互輸入手寫文檔,將所述手寫文檔切分成獨(dú)立的手 寫信息單元;交互編輯與識(shí)別手寫文檔對(duì)所述手寫文檔進(jìn)行編輯,對(duì)手寫文檔進(jìn)行識(shí)別,編輯 手寫文檔和識(shí)別手寫文檔交互進(jìn)行;輸出手寫文檔輸出識(shí)別后的手寫文檔。
2.根據(jù)權(quán)利要求1所述的交互式篇章級(jí)手寫識(shí)別方法,其特征在于,在輸入手寫文檔 步驟中,對(duì)所述手寫文檔進(jìn)行切分處理,包括如下步驟手寫文檔的切分將所述手寫文檔切分成單個(gè)手寫信息單元; 建立索引為每個(gè)手寫信息單元建立索引并根據(jù)索引將手寫信息單元存入手寫文檔;顯示手寫文檔根據(jù)手寫文檔中手寫信息單元的索引將手寫文檔排版顯示輸出。
3.根據(jù)權(quán)利要求1所述的交互式篇章級(jí)手寫識(shí)別方法,其特征在于,在交互編輯與識(shí) 別手寫文檔中包括如下步驟編輯手寫文檔根據(jù)切分的手寫信息單元對(duì)手寫文檔進(jìn)行編輯; 識(shí)別手寫文檔對(duì)手寫文檔進(jìn)行識(shí)別;交互進(jìn)行編輯和識(shí)別根據(jù)需要交替進(jìn)行編輯手寫文檔和識(shí)別手寫文檔直到確定手 寫文檔內(nèi)容與識(shí)別結(jié)果。
4.根據(jù)權(quán)利要求3所述的交互式篇章級(jí)手寫識(shí)別方法,其特征在于,在編輯手寫文檔 中包括如下步驟建立索引對(duì)手寫信息單元進(jìn)行編碼,建立支持編輯操作的索引; 編輯根據(jù)手寫信息單元的索引,對(duì)手寫文檔進(jìn)行編輯; 排版對(duì)編輯后的手寫文檔進(jìn)行排版。
5.根據(jù)權(quán)利要求3所述的交互式篇章級(jí)手寫識(shí)別方法,其特征在于,在識(shí)別手寫文檔 的步驟中,包括如下步驟提取手寫信息單元從的手寫文檔中提取出手寫信息單元;進(jìn)行篇章關(guān)聯(lián)分析對(duì)文檔中全部的手寫信息單元進(jìn)行篇章關(guān)聯(lián)分析,通過整篇文 檔字符的聚類找到用戶的書寫整體特征;產(chǎn)生識(shí)別結(jié)果候選集根據(jù)單個(gè)手寫信息單元的手寫文字特征產(chǎn)生該手寫信息單元 識(shí)別結(jié)果候選集;修改識(shí)別結(jié)果結(jié)合單個(gè)手寫信息單元的識(shí)別結(jié)果、自然語(yǔ)言模型和用戶書寫的整 體特征調(diào)整每個(gè)單元的識(shí)別結(jié)果候選集,完成手寫文檔識(shí)別。
6.根據(jù)權(quán)利要求5所述的交互式篇章級(jí)手寫識(shí)別方法,其特征在于,在進(jìn)行篇章關(guān)聯(lián) 分析步驟中,包括如下步驟預(yù)處理對(duì)采集到的手寫文字信息進(jìn)行預(yù)處理,解決每個(gè)用戶字形的變化、筆畫的 變形等問題;計(jì)算相似度根據(jù)改進(jìn)的動(dòng)態(tài)時(shí)間彎曲算法計(jì)算兩個(gè)手寫文字之間的相似度; 判斷相似根據(jù)一個(gè)變化的相似度閾值判斷當(dāng)前兩個(gè)手寫文字是否相似。
7.根據(jù)權(quán)利要求5所述的交互式篇章級(jí)手寫識(shí)別方法,其特征在于,在產(chǎn)生識(shí)別結(jié)果候選集步驟中,包括如下步驟手寫字符筆跡點(diǎn)信息的預(yù)處理對(duì)輸入的手寫字符筆跡點(diǎn)信息進(jìn)行預(yù)處理操作; 生成特征向量從手寫字符軌跡點(diǎn)中提取出方向特征組成特征向量; 歸類根據(jù)特征向量將字符歸類到最近的一個(gè)候選組內(nèi);得到識(shí)別結(jié)果在候選組內(nèi)應(yīng)用分類器對(duì)字符在候選組內(nèi)進(jìn)行分類,得到最后識(shí)別結(jié)果。
8.根據(jù)權(quán)利要求5所述的交互式篇章級(jí)手寫識(shí)別方法,其特征在于,在修改識(shí)別結(jié)果 步驟中,包括如下步驟獲取手寫文字集合在手寫文檔中獲得與當(dāng)前手寫文字相似的手寫文字集合; 獲取識(shí)別候選獲取該手寫文字集合中每個(gè)手寫文字的前5個(gè)識(shí)別候選,統(tǒng)計(jì)所有 候選中出現(xiàn)的書面文字的種類數(shù);統(tǒng)計(jì)頻度統(tǒng)計(jì)每類書面文字出現(xiàn)的頻度;計(jì)算平均位置計(jì)算每類書面文字出現(xiàn)的平均位置,這個(gè)位置是這類文字出現(xiàn)位置 的平均值;獲取最終識(shí)別候選根據(jù)比較函數(shù)對(duì)每類書面文字排序,取排序中前五個(gè)結(jié)果作為 這個(gè)字的識(shí)別候選。
9.一種交互式篇章級(jí)手寫識(shí)別系統(tǒng),包括手寫文字交互單元及篇章手寫識(shí)別單元, 所述手寫文字交互單元包括輸入手寫文字的輸入模塊、輸出識(shí)別結(jié)果的輸出模塊,所述 篇章手寫識(shí)別單元包括識(shí)別模塊,所述輸出模塊輸出所述識(shí)別模塊識(shí)別的結(jié)果,其特征 在于,所述手寫文字交互單元還包括對(duì)所述手寫文檔進(jìn)行編輯的編輯模塊,所述編輯模 塊與所述識(shí)別模塊交互運(yùn)行。
10.根據(jù)權(quán)利要求9所述的交互式篇章級(jí)手寫識(shí)別系統(tǒng),其特征在于,所述手寫文字 交互單元還包括對(duì)所述識(shí)別模塊識(shí)別的手寫文檔結(jié)果進(jìn)行確認(rèn)和修改的確認(rèn)修改模塊, 所述確認(rèn)修改模塊對(duì)所述識(shí)別結(jié)果進(jìn)行修改。
全文摘要
本發(fā)明涉及一種交互式篇章級(jí)手寫識(shí)別方法及系統(tǒng),通過以手寫文檔為主要視圖,引導(dǎo)用戶采用整篇寫入整篇識(shí)別的方式,改變了傳統(tǒng)識(shí)別系統(tǒng)輸入一個(gè)或較短的幾個(gè)字,顯示識(shí)別結(jié)果并顯示一組候選字符供用戶選擇的方式。利用篇章文檔的內(nèi)在關(guān)聯(lián)信息,自適應(yīng)不同用戶的書寫特點(diǎn)的智能手寫識(shí)別方法,可達(dá)到連續(xù)、快速輸入,更加準(zhǔn)確識(shí)別的效果。
文檔編號(hào)G06F17/24GK102013010SQ20101058302
公開日2011年4月13日 申請(qǐng)日期2010年12月10日 優(yōu)先權(quán)日2010年12月10日
發(fā)明者周樹森, 李慧, 王曉龍, 郭欣怡, 陳清財(cái) 申請(qǐng)人:哈爾濱工業(yè)大學(xué)深圳研究生院
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
张家港市| 正定县| 商丘市| 高州市| 行唐县| 赞皇县| 景宁| 乌审旗| 瑞丽市| 西和县| 嘉兴市| 宜都市| 宜阳县| 胶州市| 绥中县| 太谷县| 大城县| 雅安市| 增城市| 讷河市| 云和县| 建宁县| 五原县| 通州市| 大理市| 静海县| 石门县| 城固县| 丹凤县| 洛扎县| 竹山县| 宣汉县| 曲水县| 岚皋县| 焦作市| 无锡市| 中牟县| 剑河县| 体育| 绥化市| 灵山县|