專利名稱:一種3d手寫識別特征集取方法
技術(shù)領(lǐng)域:
本發(fā)明屬于3D手寫識別技術(shù)領(lǐng)域,特別涉及3D手寫識別技術(shù)中的特征集取方法。
背景技術(shù):
手寫識別技術(shù)是在人機(jī)交互技術(shù)趨勢下逐漸發(fā)展形成的一門熱門技術(shù)。對比傳統(tǒng)的平面手寫識別,3D手寫識別是目前一種新興的手寫識別技術(shù),可以提供給用戶一種更加自然和高效的人機(jī)交互體驗(yàn),在這些年逐漸成為了手寫識別技術(shù)的研究熱點(diǎn),是今后手寫識別的發(fā)展趨勢。同時(shí),基于三維加速度傳感器的3D手寫識別系統(tǒng)因其體積較小、精度較高、抗外部環(huán)境干擾能力較強(qiáng)等特點(diǎn),在近些年的研究中越來越受到重視。一直以來,特征提取和特征降維是3D手寫識別過程的關(guān)鍵技術(shù)要點(diǎn)。特征融合算法相對比較固定,而特征提取和特征降維算法則靈活多變,采用不同的算法會產(chǎn)生不同的結(jié)果。因此研究3D手寫識別必然需要深入研究相關(guān)的特征提取技術(shù)和特征降維技術(shù)。雖然這些年3D手寫識別研究已經(jīng)取得了一定的進(jìn)展,但在這兩個(gè)方面都尚待深入,本發(fā)明就圍繞這兩個(gè)關(guān)鍵技術(shù),提出了新的方法。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種3D手寫識別特征集取方法,從而構(gòu)建性能更加優(yōu)良的3D手寫識別系統(tǒng),進(jìn)而可以有效地提高3D手寫識別系統(tǒng)的識別率。本發(fā)明的技術(shù)方案如下:一種3D手寫識別特征集取方法,包括以下步驟,獲取原始數(shù)據(jù):采用ADI公司的三維加速度傳感器評估板EVAL-ADXL345Z-M進(jìn)行數(shù)據(jù)的采集;特征提取:提取識別率較高的旋轉(zhuǎn)特征(Rotation Feature, RF)作為3D手寫識別系統(tǒng)的時(shí)域特征,提取識別率較高的快速傅氏變換特征(Fast Fourier Transformation, FFT)作為3D手寫識別系統(tǒng)的頻域特征;特征融合:采用串行方法進(jìn)行時(shí)域和頻域特征融合,得
到時(shí)頻域融合特征-RF+FFT特征;特征降維:利用主成分分析(Principal Component
Analysis, PCA) + 線性鑒別分析(Linear Discriminant Analysis, LDA)組合算法降維;分類識別:使用支持向量機(jī)庫(a library for Support Vector Machines, LIBSVM)軟件包實(shí)現(xiàn)支持向量機(jī)(Supported Vector Machine, SVM)分類識別,核函數(shù)選用徑向基函數(shù),進(jìn)行三次試驗(yàn),取三次試驗(yàn)的平均識別率。與現(xiàn)有技術(shù)相比,本發(fā)明的有益效果是:本發(fā)明的3D手寫識別特征集取方法,一方面結(jié)合3D手寫識別信號是典型非平穩(wěn)信號,以及時(shí)域特征和頻域特征之間存在互補(bǔ)性等特點(diǎn),利用三維加速度傳感器采集到的三維加速度時(shí)域RF旋轉(zhuǎn)特征,融合三維加速度的頻域FFT特征,得到手寫識別系統(tǒng)的時(shí)頻域特征——RF+FFT特征,該特征能更好地體現(xiàn)時(shí)域特征以及頻域特征的互補(bǔ)性,從而可以構(gòu)建性能更加優(yōu)良的3D空間手寫識別系統(tǒng);另一方面由于兩種主流的特征降維算法PCA和LDA各有優(yōu)缺點(diǎn),可以利用PCA+LDA組合的方法對融合后的特征進(jìn)行降維,這樣一來,吸收兩者的優(yōu)點(diǎn),彌補(bǔ)它們的缺點(diǎn),在PCA和LDA之間找到一個(gè)平衡點(diǎn),從而可以有效地提高手寫識別系統(tǒng)的識別率。
圖1本發(fā)明的核心技術(shù)要點(diǎn)的步驟框圖。
圖2本發(fā)明的3D手寫識別特征集取方法流程圖。
具體實(shí)施例方式本發(fā)明的核心技術(shù)要點(diǎn)涉及特征提取和特征降維,詳見圖1所示。本發(fā)明的具體流程步驟如圖2所示,下面結(jié)合圖2和具體實(shí)施方式
對本發(fā)明做進(jìn)一步的詳細(xì)說明。該方法對3D手寫識別系統(tǒng)進(jìn)行特征集取,具體的實(shí)施方式步驟包括:
1.獲取原始數(shù)據(jù):本發(fā)明采用ADI公司的三維加速度傳感器評估板EVAL-ADXL345Z-M進(jìn)行數(shù)據(jù)的采集,實(shí)驗(yàn)對象是10個(gè)阿拉伯?dāng)?shù)字0、1、2、3、4、5、6、7、8、9。字符樣本數(shù)據(jù)集的采集工作由同一實(shí)驗(yàn)室的20名同學(xué)完成:每個(gè)阿拉伯?dāng)?shù)字均收集180組樣本數(shù)據(jù),即這20名試驗(yàn)者可以按照自己的書寫習(xí)慣利用三維加速度傳感器在空中自由書寫0、1、2、3、4、5、
6、7、8、9這10個(gè)數(shù)字各9次。2.特征提取:在原始時(shí)域特征提取中,基于三維加速度傳感器的3D手寫識別系統(tǒng)的加速度特征、速度特征和位移特征的平均識別率分別為70.24%,72.37%,74.62%,而RF旋轉(zhuǎn)特征能夠取得更高的平均識別率81.63%,因此選擇RF旋轉(zhuǎn)特征作為3D手寫識別系統(tǒng)的時(shí)域特征;在原始頻域特征提取中,基于三維加速度傳感器的3D手寫識別系統(tǒng)利用DCT變換特征的平均識別率只有70.53%,而其FFT變換特征能夠取得更高的平均識別率77.34%,因此選擇FFT變換特征作為3D手寫識別系統(tǒng)的頻域特征。3.特征融合:在選取3D手寫識別系統(tǒng)較優(yōu)的原始時(shí)域特征和原始頻域特征以后,結(jié)合時(shí)域和頻域特征的互補(bǔ)性,可以將它們進(jìn)行特征融合,以獲得手寫識別系統(tǒng)的時(shí)頻域融合特征。本發(fā)明中采用串行方法進(jìn)行特征融合,其優(yōu)點(diǎn)是算法簡單,易于實(shí)現(xiàn),并且在一定程度上可以消除原始特征之間的冗余信息。4.特征降維:結(jié)合3D手寫識別系統(tǒng)的特點(diǎn),將PCA+LDA組合降維算法應(yīng)用于3D手寫識別特征降維中,先利用PCA將高維的原始樣本壓縮,接著再PCA變換空間內(nèi),用LDA進(jìn)行特征抽取。這樣一來,PCA+LDA可以正好吸收了兩者的優(yōu)點(diǎn),彌補(bǔ)它們的缺點(diǎn),在PCA和LDA之間找到一個(gè)平衡點(diǎn),也就是得到一個(gè)更加有效地投影矩陣,PCA+LDA對每類訓(xùn)練樣本數(shù)較少的識別問題是非常有效的。5.分類識別:在得到的每個(gè)數(shù)字180組樣本數(shù)據(jù)庫中,通過隨機(jī)抽取的方法,各抽取其中的144組樣本數(shù)據(jù)作為支持向量機(jī)的訓(xùn)練樣本數(shù)據(jù),將每個(gè)數(shù)字剩下的36組樣本數(shù)據(jù)作為其測試樣本。并且使用LIBSVM軟件包實(shí)現(xiàn)SVM分類識別,核函數(shù)選用徑向基函數(shù),進(jìn)行三次試驗(yàn),取三次試驗(yàn)的平均識別率。實(shí)驗(yàn)結(jié)果顯示,采用本發(fā)明的方法得到的基于三維加速度傳感器的3D手寫系統(tǒng)的識別率高達(dá)90.94%,遠(yuǎn)高于單獨(dú)的時(shí)域特征得到的識別率81.63%或者單獨(dú)的頻域特征得到的識別率77.34%。上述實(shí)施例用來解釋說明本發(fā)明,而不是對本發(fā)明進(jìn)行限制,在本發(fā)明的精神和權(quán)利要求的保護(hù)范圍內(nèi),對本發(fā)明做出的任何修改和改變,都落入本發(fā)明的保護(hù)范圍。
權(quán)利要求
1.一種3D手寫識別特征集取方法,其特征在于包括以下步驟: 獲取原始數(shù)據(jù):采用ADI公司的三維加速度傳感器評估板EVAL-ADXL345Z-M進(jìn)行數(shù)據(jù)的米集; 特征提取:提取識別率較高的旋轉(zhuǎn)特征作為3D手寫識別系統(tǒng)的時(shí)域特征,提取識別率較高的快速傅氏變換特征作為3D手寫識別系統(tǒng)的頻域特征; 特征融合:采用串行方法進(jìn)行時(shí)域和頻域特征融合,得到時(shí)頻域融合特征; 特征降維:利用主成分分析和線性鑒別分析組合算法降維; 分類識別:使用支持向量機(jī)庫軟件包實(shí)現(xiàn)支持向量機(jī)分類識別,核函數(shù)選用徑向基函數(shù),進(jìn)行三次試驗(yàn),取三次試驗(yàn)的平均識別率。
全文摘要
本發(fā)明公開了一種3D手寫識別特征集取方法。該方法的步驟包括首先分別提取三維加速度的時(shí)域旋轉(zhuǎn)特征和其頻域快速傅氏變換特征,然后對提取的時(shí)域特征和頻域特征進(jìn)行特征融合,得到時(shí)頻域融合特征——RF+FFT特征,并利用主成分分析和線性鑒別分析組合進(jìn)行特征降維,從而得到更加可以表征3D手寫識別系統(tǒng)的新特征,最后采用支持向量機(jī)進(jìn)行手寫字符的分類識別。利用本發(fā)明的方法,可以構(gòu)建性能更好的3D手寫識別系統(tǒng),有效地提高3D手寫識別系統(tǒng)的識別率。
文檔編號G06K9/46GK103198324SQ201310077179
公開日2013年7月10日 申請日期2013年3月11日 優(yōu)先權(quán)日2013年3月11日
發(fā)明者沈海斌, 應(yīng)攀 申請人:浙江大學(xué)