欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種手寫體筆劃特征提取和識別方法及系統(tǒng)的制作方法

文檔序號:6649167閱讀:645來源:國知局
一種手寫體筆劃特征提取和識別方法及系統(tǒng)的制作方法
【專利摘要】本發(fā)明公開了一種手寫體筆劃特征提取和識別方法,通過引入低秩矩陣恢復(fù)和稀疏投影,將手寫體圖像分解為低秩主成分筆劃特征、顯著筆劃特征和筆劃錯(cuò)誤。通過凸優(yōu)化技術(shù),實(shí)現(xiàn)主成分特征編碼、顯著筆劃特征提取和筆劃自動糾錯(cuò),并保持顯著筆劃特征的相似性。得到的稀疏投影不僅可以提取手寫體訓(xùn)練樣本的顯著筆劃特征,且可用于測試樣本的嵌入和鑒別性特征提取,生成訓(xùn)練集和測試集,再輸入最近鄰分類器,根據(jù)測試樣本與訓(xùn)練樣本間的相似性和訓(xùn)練樣本的類別,得到測試樣本的類別信息,得到最準(zhǔn)確的手寫體識別結(jié)果。通過引入低秩和稀疏編碼,在得到主成分筆劃特征和具鑒別性的顯著筆劃特征的同時(shí)可檢測錯(cuò)誤的筆劃,有效提高了手寫體描述和識別能力。
【專利說明】-種手寫體筆劃特征提取和識別方法及系統(tǒng)
[0001] 本申請要求申請日為2014年11月28日、申請?zhí)枮?01410709992. 5、發(fā)明名稱為 "一種手寫體筆劃特征提取和識別方法及系統(tǒng)"的中國專利申請的優(yōu)先權(quán),其全部內(nèi)容通過 引用結(jié)合在本申請中。

【技術(shù)領(lǐng)域】
[0002] 本發(fā)明設(shè)及計(jì)算機(jī)視覺和圖像識別【技術(shù)領(lǐng)域】,更具體的說,是設(shè)及一種手寫體筆 劃特征提取和識別方法及系統(tǒng)。

【背景技術(shù)】
[0003] 隨著計(jì)算機(jī)技術(shù)和智能化的不斷發(fā)展,離線手寫字符識別已經(jīng)發(fā)展成為計(jì)算機(jī)視 覺與模式識別中非常重要的一個(gè)研究課題。離線手寫體識別通過計(jì)算機(jī)將紙質(zhì)圖像電子 化,然后分析字符圖像,獲取字符的筆劃屬性,在辦公自動化、機(jī)器翻譯和筆跡鑒定等領(lǐng)域 有著重大的意義,一旦研究成功并投入應(yīng)用,將產(chǎn)生巨大的社會和經(jīng)濟(jì)效益。但是抽取筆劃 特征的過程具有一定難度,到目前為止,離線手寫體(本發(fā)明中簡稱手寫體)字符識別距實(shí) 用要求還有一定距離。目前的大部分研究工作都集中在處理筆劃特征提取問題,且也已取 得一定的成果。但是真實(shí)世界中的圖像(包括手寫體圖像)通??捎靡粋€(gè)低秩子空間集合 進(jìn)行表征,且手寫體圖像通常包含破壞、丟失數(shù)據(jù),或因書寫習(xí)慣等原因造成的不規(guī)范筆劃 等問題,因此在考慮筆劃特征提取的同時(shí),如何有效修復(fù)筆劃缺失或不規(guī)范的筆劃,同時(shí)自 動定位出錯(cuò)誤的筆劃也是需要深入探討的問題。
[0004] 近年來,一個(gè)最具代表性的低秩恢復(fù)方法RPCA(Robust Principal Component Analysis)可對原始數(shù)據(jù)進(jìn)行精確恢復(fù)。當(dāng)數(shù)據(jù)缺陷很小時(shí),RPCA可W很大程度地 恢復(fù)數(shù)據(jù),但它本質(zhì)上是一種直推式(trans化ctive)的方法,只能提取低秩主成分特 征,但不能處理樣本外數(shù)據(jù),且無法解決在線計(jì)算問題。為了克服此缺點(diǎn),RPCA的推廣 IRPCA(Inductive Robust Principal Component Analysis)被提出。IRPCA 目標(biāo)是通過一 個(gè)低秩的投影來去除或糾正樣本數(shù)據(jù)中可能含有的錯(cuò)誤,但計(jì)算低秩投影的過程并未考慮 特征間的相似性保持問題。
[0005] 因此,提供一種集成的手寫體字符修復(fù)、顯著筆劃特征提取和識別方法及系統(tǒng),實(shí) 現(xiàn)自動定位與檢測錯(cuò)誤的或不規(guī)則的手寫體筆劃,同時(shí)提高手寫體字符表征能力與識別的 準(zhǔn)確度,是本領(lǐng)域技術(shù)人員亟待解決的問題。


【發(fā)明內(nèi)容】

[0006] 有鑒于此,本發(fā)明提供了一種手寫體筆劃特征提取和識別方法及系統(tǒng),W克服現(xiàn) 有技術(shù)中新數(shù)據(jù)輸入時(shí)計(jì)算的復(fù)雜性及未考慮特征相似性保持的問題。
[0007] 為實(shí)現(xiàn)上述目的,本發(fā)明提供如下技術(shù)方案:
[000引一種手寫體筆劃特征提取和識別方法,包括:
[0009] 對原始訓(xùn)練集中的手寫體字符圖像數(shù)據(jù)進(jìn)行凸優(yōu)化和特征學(xué)習(xí),計(jì)算得到可保持 相似性的稀疏投影矩陣,提取出訓(xùn)練樣本集合的顯著筆劃特征,對所述低秩主成分特征進(jìn) 行編碼,得到低秩主成分特征,同時(shí)利用所述筆劃錯(cuò)誤特征對數(shù)據(jù)中的筆劃進(jìn)行糾錯(cuò);
[0010] 利用所述稀疏投影矩陣,對原始的待識別測試樣本集合的具鑒別性的顯著性特征 進(jìn)行提?。?br> [0011] 將提取出的所述訓(xùn)練樣本與測試樣本的顯著筆劃特征輸入最近鄰分類器模型進(jìn) 行分類,通過相似性比化得到與測試樣本最接近的訓(xùn)練樣本,確定待識別的手寫體測試樣 本的識別結(jié)果。
[0012] 優(yōu)選的,所述原始訓(xùn)練集為可能含有錯(cuò)誤筆劃的或不規(guī)范筆劃的手寫體向量集 合義 = [Xl,x,,...,Xw]G股"xw,其中,n是手寫體樣本的維度,N是樣本的數(shù)量,其中包含 有C個(gè)類別標(biāo)簽c〉2的訓(xùn)練樣本集屯=G吸和無任何標(biāo)簽的測試樣本集 而=IX,X2,...,xJ e吸"X",且滿足樣本數(shù)量1+U = N。
[0013] 優(yōu)選的,所述凸優(yōu)化問題為:
[0014]

【權(quán)利要求】
1. 一種手寫體筆劃特征提取和識別方法,其特征在于,包括: 對原始訓(xùn)練集中的手寫體字符圖像數(shù)據(jù)進(jìn)行凸優(yōu)化和特征學(xué)習(xí),計(jì)算得到可保持相似 性的稀疏投影矩陣,提取出訓(xùn)練樣本集合的顯著筆劃特征,對所述低秩主成分特征進(jìn)行編 碼,得到低秩主成分特征,同時(shí)利用所述筆劃錯(cuò)誤特征對數(shù)據(jù)中的筆劃進(jìn)行糾錯(cuò); 利用所述稀疏投影矩陣,對原始的待識別測試樣本集合的具鑒別性的顯著性特征進(jìn)行 提??; 將提取出的所述訓(xùn)練樣本與測試樣本的顯著筆劃特征輸入最近鄰分類器模型進(jìn)行分 類,通過相似性比對,得到與測試樣本最接近的訓(xùn)練樣本,確定待識別的手寫體測試樣本的 識別結(jié)果。
2. 根據(jù)權(quán)利要求1所述的方法,其特征在于, 所述原始訓(xùn)練集為可能含有錯(cuò)誤筆劃的或不規(guī)范筆劃的手寫體向量集合 1 = [11,;...,1#]£股^,其中,11是手寫體樣本的維度^是樣本的數(shù)量,其中包含有 c個(gè)類別標(biāo)簽c>2的訓(xùn)練樣本集;^ x2,...,XjeRnw和無任何標(biāo)簽的測試樣本集 Zc7 = [x"a-2"."xJg]Txm ,且滿足樣本數(shù)量l+u =n〇
3. 根據(jù)權(quán)利要求2所述的方法,其特征在于,所述凸優(yōu)化問題為:
s.t.X = L+SX+E,其中,0 G [〇,1]為低秩和稀疏編碼的權(quán)衡參數(shù),A>〇為依賴于錯(cuò) 誤或噪音級別的參數(shù);又(義)及非負(fù)參數(shù)I表示每一步迭代中顯著筆劃特征相似性保持的 正規(guī)化項(xiàng);N?IL為核范數(shù),I卜11為11范數(shù),I卜I|^為12,1范數(shù),分別定義如下:
其中,Tr(A)為矩陣A的跡,,(.1$)表示表示顯著筆劃特征SxJPSxj間的歐式距離 平方,即IlSxi-SxjIl2;G(t)=X(Qw-Ww)Xt=XFwXt 是一個(gè)對稱矩陣;Il?Il表示I2 范數(shù)
,其中采用余弦相似性表征手寫體顯著筆劃特征之間的相似 性,即C) =exp(cos(0)),其中,cos(0) =xfX, / (||X,.Il_IlX, ||)。
4. 根據(jù)權(quán)利要求1所述的方法,其特征在于,利用所述稀疏投影矩陣,對原始的待識別 測試樣本集合的具鑒別性的顯著性特征進(jìn)行提取的過程具體為: 首先將原始的樣本數(shù)據(jù)集合劃分為訓(xùn)練集和測試集,所述訓(xùn)練集中包含原始的訓(xùn)練樣 本,所述測試集中包含測試樣本; 根據(jù)所述訓(xùn)練集的手寫體訓(xùn)練樣本進(jìn)行優(yōu)化,計(jì)算得到可保持特征數(shù)據(jù)相似性的稀疏 投影矩 將所述訓(xùn)練樣本和測試樣本嵌入得到的稀疏投影空間,分別得到所述訓(xùn)練集和所述測 試集的顯著筆劃特征。
5. 根據(jù)權(quán)利要求4所述的方法,其特征在于,所述將提取出的所述訓(xùn)練樣本和測試樣 本的顯著筆劃特征使用最近鄰法分類器進(jìn)行分類的過程具體為: 將所述提取出的所述手寫體訓(xùn)練樣本和測試樣本的顯著筆劃特征輸入最近鄰分類器 豐旲型; 根據(jù)經(jīng)過投影嵌入后的訓(xùn)練樣本與測試樣本之間的內(nèi)在關(guān)聯(lián)進(jìn)行相似性比對和分析, 得到與測試樣本最接近的訓(xùn)練樣本; 結(jié)合所述訓(xùn)練樣本的類別標(biāo)簽,獲得與其最接近的測試樣本的類別信息,得到待識別 的手寫體測試樣本集合的識別結(jié)果。
6. 根據(jù)權(quán)利要求1-5中任意一項(xiàng)所述的方法,其特征在于,所述最近鄰分類算法為 K-最近鄰分類器,K= 1。
7. -種手寫體筆劃特征提取和識別的系統(tǒng),其特征在于,包括: 訓(xùn)練模塊,用于對原始訓(xùn)練集中的手寫體字符圖像數(shù)據(jù)進(jìn)行凸優(yōu)化和特征學(xué)習(xí),計(jì)算 得到可保持相似性的稀疏投影矩陣,提取出訓(xùn)練樣本集合的顯著筆劃特征;對所述低秩主 成分特征進(jìn)行編碼,得到低秩主成分特征,同時(shí)利用所述筆劃錯(cuò)誤特征對數(shù)據(jù)中的筆劃進(jìn) 行糾錯(cuò); 測試預(yù)處理模塊,用于利用所述稀疏投影矩陣,對原始的待識別測試樣本集合的具鑒 別性的顯著性特征進(jìn)行提取; 測試模塊,用于將提取出的所述訓(xùn)練樣本與測試樣本的顯著筆劃特征輸入最近鄰分類 器模型進(jìn)行分類,通過相似性比對,得到與測試樣本最接近的訓(xùn)練樣本,確定待識別的手寫 體測試樣本的識別結(jié)果。
【文檔編號】G06K9/68GK104504412SQ201510027888
【公開日】2015年4月8日 申請日期:2015年1月20日 優(yōu)先權(quán)日:2014年11月28日
【發(fā)明者】張召, 汪笑宇, 李凡長, 張莉 申請人:蘇州大學(xué)
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1
普格县| 石楼县| 阿城市| 平泉县| 安乡县| 克山县| 吉隆县| 高清| 广安市| 镇平县| 宝坻区| 阿克苏市| 吉安市| 永吉县| 晋城| 云梦县| 厦门市| 阿克苏市| 巧家县| 永泰县| 滁州市| 博罗县| 金堂县| 阳曲县| 永新县| 四子王旗| 邻水| 玉环县| 尤溪县| 莱阳市| 赣州市| 珲春市| 温宿县| 昌吉市| 遂溪县| 密云县| 高邮市| 济源市| 海晏县| 沿河| 隆德县|