專利名稱:基于字符串核的手繪草圖識別方法
技術領域:
本發(fā)明涉及基于核方法的手繪草圖識別。
背景技術:
本發(fā)明所涉及的背景技術包括以下三個方面一、手繪草圖識別手繪草圖識別是將筆式交互獲取的模糊的草圖表達映射至精確的圖形表達,即從人機交互過程中不斷增長的草圖信息中挖掘草圖形狀約束,在領會用戶本來意圖的基礎上,把自由的、不規(guī)則的草圖識別成為規(guī)則的、精確的幾何形狀。目前主要存在三種方式的圖形識別方法,即基于筆劃表示的方法;基于直線、弧、 曲線等圖元表示的方法;基于幾何特征的圖形識別方法。1、基于比劃的表示方法通常情況下,草圖識別系統(tǒng)通過筆式交互方式獲取的草圖表現(xiàn)為若干由用戶在落筆與提筆間的取樣點序列構成的筆劃。筆劃是圖形重要的構成信息。早期的系統(tǒng)視筆劃為符號,賦予它特定的含義,將筆劃的識別等同于圖形的識別。單筆劃識別中,較為經(jīng)典的是 Rubine方法,該方法簡單有效,但它要求用戶必須以固定模式的筆劃來勾勒圖形,而且圖形構成比較簡單。2、基于圖元的表示方法基于圖元表示將圖形表示為直線、弧、曲線等圖元在一定空間關系下的組合。基于圖元的方法通常包含分割、擬合、規(guī)整、識別等步驟。用戶繪制的草圖可以自動拆分成圖元及其關系,圖形模板的訓練不需要用戶干預,模板庫容易擴展,適應性強。但不可避免地訓練模板以及對圖形測試所有己定義的屬性增加了系統(tǒng)開銷。3、基于幾何特征的識別基于幾何特征的方法直接將圖形當成識別單元,直接提取草圖的幾何特征用于分類。通常它要以一定的方式先分割好不同的圖形幾何特征的抽取實質上是將筆劃信息降維,但由于圖形的復雜性,很難以固定維數(shù)的幾何特征保留筆劃的完整信息,部分信息在降維過程中丟失了。因此,幾何特征的方法識別的精確性不高一些視覺不相似的圖形的幾何特征表示可能相近。二、字符串核(Sting Kernel)核方法表示一組相關的機器學習和數(shù)據(jù)挖掘算法。核方法的關鍵組成部分是核函數(shù),核函數(shù)可以度量輸入數(shù)據(jù)的相似性?;谶@些核函數(shù),可以通過支持向量機(SVM)完成分類、回歸等任務。字符串核可處理輸入數(shù)據(jù)類型為字符串的數(shù)據(jù),通過字符串核函數(shù)度量兩個輸入字符串的相似性。字符串核可分為多種,例如譜-類似的,計算兩個輸入字符串的公共子串的字符串核,基于比對的字符串核,由概率模型獲得的字符串核。
字符串核已應用于蛋白質同源檢測、文本分類等領域。三、支持向量機(SupportVector Machine, SVM) 支持向量機(Support Vector Machine, SVM)是著名的基于核方法的系統(tǒng)。支持向量機(support vector machine, SVM)借助于最優(yōu)化方法解決機器學習問題的新工具。它由Vapnik及其合作者發(fā)明,在1992年計算機學習理論的會議上介紹進入機器學習領域,之后受到了廣泛的關注。近年來在其理論研究和算法實現(xiàn)方面都取得了突破性進展,并成為克服“維數(shù)災難”和“過學習”等傳統(tǒng)困難的有力手段。SVM的理論體系涵蓋的對象極為廣泛,如對偶表示、特征空間、學習理論、優(yōu)化理論和算法等。SVM在文本分類、 手寫識別、圖像分類、生物信息學等領域中獲得了比較好的應用。該算法在集合L變?yōu)榭?,或者λ足夠小的時候停止。
發(fā)明內(nèi)容
基于上述現(xiàn)有技術,本發(fā)明提出了一種基于字符串核的手繪草圖識別方法,結合手繪草圖識別、字符串核、支持向量機這三項已有技術,實現(xiàn)一種能夠持續(xù)訓練/積累的新的手繪草圖識別方法。本發(fā)明提出了一種基于字符串核的手繪草圖識別方法,該方法包括以下步驟步驟一,將手繪草圖映射為特征字符串,對輸入的手繪草圖進行等距離采樣,采樣距離閾值根據(jù)經(jīng)驗選擇5像素,并且限定采樣的時間閾值內(nèi)(0.7秒)連續(xù)采樣一個草圖; 將采樣的手繪草圖映射成特征字符串,還包括以下步驟取一正整數(shù)η;計算采樣到的手繪草圖的外接矩形,并將草圖的外接矩形均分為η2 份;每一個分割后獲得的小矩形都可以使用二維坐標X,y來表示,其中1<X,并且 x,y e N;當且僅當一個小矩形的中心點落在了手繪草圖圍成的區(qū)域內(nèi)時,我們認為該小矩形被填充了 ;將一個手繪草圖映射成了一個長度為η2的特征字符串;步驟二,通過支持向量機基于字符串核對作為訓練樣本的采樣草圖進行訓練,獲得分類器,使用格搜索進行參數(shù)調(diào)優(yōu),選擇最佳的懲罰因子C,gama, η ;字符串核通過兩個字符串間的編輯距離來度量這兩個字符串的相似度;所述編輯距離為字符串一變換為字符串二所用的最少字符操作數(shù);步驟三,通過訓練得到的分類器對待識別的草圖進行分類和識別,將模糊、不規(guī)則的手繪草圖映射為精確的幾何形狀。所述字符操作包括刪除字符一 ;(2)插入字符二 ;(3)將一個字符改為另一個字符的操作。所述最佳的懲罰因子C,gama, η的取值分別為5個像素,9個字符,0. 01秒。所述映射過程的計算公式如下首先,定義函數(shù)f :Ν2 — {0,1,2,Λ,η}
“、fx若(X,y)對應的小矩形被填充 /(x^) = |o其他其次,計算特征字符串的過程如下
Initialize :x = 1,y = 1,η = k,眾 e0 +,s=〃 “;For (χ = 1 ;x ^ η ;χ++)For (y = 1 ;y ^ η ;y++){Int tmp = f (χ, y);S = strcat (S, tmp);}Output S ;至此就將一個手繪草圖映射成了一個長度為η2的特征字符串。與現(xiàn)有技術相比,本發(fā)明的一種基于字符串核的草圖識別方法,該方法與草圖的位置,大小,繪制方式無關,允許用戶按照自己習慣的方式進行草圖繪制?;谧址说牟輬D識別方法識別準確率較高,且實現(xiàn)簡單。
圖1為手繪三角形的特征字符串映射(η = 5)示意圖;圖2為實驗圖形集示意圖;圖3為手繪草圖及其識別結果圖;圖4為本發(fā)明的基于字符串核的手繪草圖識別方法的整體流程圖。
具體實施例方式首先基于區(qū)域填充的思想將手繪草圖映射為特征字符串,其次通過支持向量機 (Support Vector Machine, SVM)基于字符串核(String Kernelho)對訓練樣本進行訓練, 獲得分類器,然后通過訓練得到的分類器對待識別的草圖進行分類和識別,將模糊,不規(guī)則的手繪草圖映射為精確的幾何形狀。本發(fā)明的系統(tǒng)運行于visual C++6. 0環(huán)境下,基于Iibsvm軟件包,使用C++語言開發(fā)的。首先,在visual C++6.0中建立一個單文檔視圖的工程;將添加了字符串核 (String Kernel)的Iibsvm軟件包移植到建立的工程中,編寫特征字符串映射模塊的代碼。準備訓練數(shù)據(jù)采集了 1150個樣本,其中1000個樣本作為訓練數(shù)據(jù),150個作為測試數(shù)據(jù),并將草圖映射為特征字符串,將獲得的特征字符串寫入文件中保存。訓練分類器使用特征字符串訓練分類器,并使用格搜索的方式進行參數(shù)調(diào)節(jié),即懲罰因子C,gama, η調(diào)節(jié)。詳細描述如下一、作為本發(fā)明輸入的手繪草圖采樣&識別在該步驟中需要做的是,將采樣到的待識別手繪草圖映射為特征字符串,使用訓練得到的分類器對其進行分類,從而完成手繪草圖的識別。1)預處理對輸入的手繪草圖進行等距離采樣,采樣距離閾值根據(jù)經(jīng)驗選擇5像素,并且限定采樣的時間閾值內(nèi)(0.7秒)連續(xù)采樣一個草圖,對輸入比劃的順序和方向無要求,即若用戶落筆與上一次提筆之間的時間間隔大于0.7秒,則系統(tǒng)認為用戶的上一個草圖輸入結束,并開始繪制一個新的草圖。作為像素點重采樣的間隙,該變量取值根據(jù)經(jīng)驗獲得。將采樣的手繪草圖映射成特征字符串,包括以下步驟首先取一正整數(shù)η ;計算采樣到的手繪草圖的外接矩形,并將草圖的外接矩形均分為η2份。每一個分割后獲得的小矩形都可以使用二維坐標(X,y)來表示,其中1 < X,y < η并且X,y e N。 當且僅當一個小矩形的中心點落在了手繪草圖圍成的區(qū)域內(nèi)時,我們認為該小矩形被填充了。如圖1所示的手繪三角形的特征字符串映射(n = 5Pixel)示意圖(陰影部分表示為被填充)。圖中手繪三角形映射的特征字符串S = 0100002222033004400050000o映射過程的計算公式如下首先,定義函數(shù)
權利要求
1.一種基于字符串核的手繪草圖識別方法,該方法包括以下步驟步驟一,將手繪草圖映射為特征字符串,對輸入的手繪草圖進行等距離采樣,采樣距離閾值根據(jù)經(jīng)驗選擇5像素,并且限定采樣的時間閾值內(nèi)(0.7秒)連續(xù)采樣一個草圖;將采樣的手繪草圖映射成特征字符串,還包括以下步驟取一正整數(shù)η ;計算采樣到的手繪草圖的外接矩形,并將草圖的外接矩形均分為η2份; 每一個分割后獲得的小矩形都可以使用二維坐標χ,y來表示,其中1 < χ,y < η并且χ, y e N;當且僅當一個小矩形的中心點落在了手繪草圖圍成的區(qū)域內(nèi)時,我們認為該小矩形被填充了 ;將一個手繪草圖映射成了一個長度為η2的特征字符串;步驟二,通過支持向量機基于字符串核對作為訓練樣本的采樣草圖進行訓練,獲得分類器,使用格搜索進行參數(shù)調(diào)優(yōu),選擇最佳的參數(shù)C,gama,并使用獲得的C,gama及步驟一中選定的正整數(shù)η對整個訓練集進行訓練,獲取支持向量機模型;字符串核通過兩個字符串間的編輯距離來度量這兩個字符串的相似度;所述編輯距離為字符串一變換為字符串二所用的最少字符操作數(shù);步驟三,通過訓練得到的分類器對待識別的草圖進行分類和識別,將模糊、不規(guī)則的手繪草圖映射為精確的幾何形狀。
2.如權利要求1所述的基于字符串核的手繪草圖識別方法,其特征在于,所述字符操作包括刪除字符一;(2)插入字符二;(3)將一個字符改為另一個字符的操作。
3.如權利要求1所述的基于字符串核的手繪草圖識別方法,其特征在于,所述最佳的懲罰因子C,gama, η的取值分別為5個像素,9個字符,0. 01秒。
4.如權利要求1所述的基于字符串核的手繪草圖識別方法,其特征在于,所述映射過程的計算公式如下首先,定義函數(shù) f :N2 — {0,1,2, Λ, η}“、fx若(x,y)對應的小矩形被填充 /(x^) = |o其他其次,計算特征字符串的過程如下Initialize :x = l,y = l,n = k,眾 e0 +,s =〃 “; For (χ = 1 ;x ^ η ;χ++)For (y = 1 ;y 彡 η ;y++){Int tmp = f (χ, y); S = strcat(S, tmp);ιOutput S ;至此將一個手繪草圖映射成了一個長度為η2的特征字符串。
全文摘要
本發(fā)明公開了一種基于支持向量機的核矩陣近似方法,該方法包括以下步驟首先基于區(qū)域填充的思想將手繪草圖映射為特征字符串,其次通過支持向量機(Support Vector Machine,SVM)基于字符串核(String Kernelho)對訓練樣本進行訓練,獲得分類器,然后通過訓練得到的分類器對待識別的草圖進行分類和識別,將模糊,不規(guī)則的手繪草圖映射為精確的幾何形狀。與現(xiàn)有技術相比,本發(fā)明的方法與草圖的位置,大小,繪制方式無關,允許用戶按照自己習慣的方式進行草圖繪制?;谧址说牟輬D識別方法識別準確率較高,且實現(xiàn)簡單。
文檔編號G06K9/20GK102184395SQ20111015185
公開日2011年9月14日 申請日期2011年6月8日 優(yōu)先權日2011年6月8日
發(fā)明者廖士中, 段孟華 申請人:天津大學