基于支持向量機(jī)的表面肌電信號(hào)多類(lèi)手部動(dòng)作識(shí)別方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及一種基于支持向量機(jī)的表面肌電信號(hào)多類(lèi)手部動(dòng)作識(shí)別方法,屬于模 式識(shí)別技術(shù)領(lǐng)域。
【背景技術(shù)】
[0002] 特征提取對(duì)于肌電信號(hào)模式識(shí)別問(wèn)題的最終識(shí)別率有著至關(guān)重要的影響。肌電信 號(hào)特征可以分為時(shí)域,頻域,時(shí)頻域三種,其中時(shí)域特征包括一些基于信號(hào)幅值的特征,頻 域特征包括一些基于信號(hào)功率譜的特征,而時(shí)頻域特征包括一些經(jīng)過(guò)小波分析技術(shù)提取出 的特征。時(shí)域特征存在對(duì)非靜態(tài)信號(hào)不魯棒,對(duì)信號(hào)幅值變化較為敏感等缺陷,頻域特征存 在對(duì)經(jīng)過(guò)一些預(yù)處理步驟(如全波校正)后的信號(hào)不魯棒的缺陷,此外一些文獻(xiàn)表明單一 頻域特征性能較差。本文通過(guò)構(gòu)建包括時(shí)域,頻域和時(shí)頻域特征的高性能混合多特征集,來(lái) 克服不同域單一特征的固有缺陷。
[0003] 多通道肌電信號(hào)提取出的多特征集會(huì)存在高維度的特性,維度過(guò)高會(huì)導(dǎo)致模型推 廣能力的下降,同時(shí)極大地增加計(jì)算負(fù)載。一般通過(guò)特征降維來(lái)解決數(shù)據(jù)維度過(guò)高的問(wèn)題, 常見(jiàn)的數(shù)據(jù)降維方法主要分為三類(lèi):特征選擇,特征映射和特征聚類(lèi)。特征選擇試圖從原特 征集中選取一個(gè)更具有代表性的特征子集,特征映射通過(guò)將特征從原始高維空間映射到一 個(gè)低維空間來(lái)降低特征維度,特征聚類(lèi)從原始特征產(chǎn)生多個(gè)聚類(lèi),用聚類(lèi)質(zhì)心的來(lái)取代原 始特征集,作為一種新的低維度表述形式。本文通過(guò)一種基于互信息的最小冗余最大相關(guān) 性特征選擇方法來(lái)完成特征空間降維。
[0004] 模式識(shí)別方法的選擇同樣在很大程度上影響肌電模式識(shí)別問(wèn)題的最終準(zhǔn)確率。已 有工作表明支持向量機(jī)在肌電模式識(shí)別方面有著較好的性能。在對(duì)Atzori等人發(fā)布的 NinaPro數(shù)據(jù)集基準(zhǔn)測(cè)試結(jié)果中,非線(xiàn)性支持向量機(jī)是多種線(xiàn)性和非線(xiàn)性分類(lèi)器中唯一一 種能夠在變換特征情況下依然能夠持續(xù)獲得高識(shí)別率的分類(lèi)器。國(guó)內(nèi)已有涉及支持向量機(jī) 進(jìn)行肌電模式識(shí)別的發(fā)明,大多使用較為經(jīng)典的線(xiàn)性核、徑向基核、多項(xiàng)式核、sigmoid核等 等核函數(shù)。ijstiiri等人提出了一種基于皮爾遜VII函數(shù)的廣義核函數(shù),本發(fā)明通過(guò)使用皮 爾遜VII廣義核函數(shù),在一定程度上提高了識(shí)別準(zhǔn)確率。
【發(fā)明內(nèi)容】
[0005] 本發(fā)明的目的在于針對(duì)現(xiàn)有技術(shù)的不足,提供一種基于支持向量機(jī)的表面肌電信 號(hào)多類(lèi)手部動(dòng)作識(shí)別方法,通過(guò)構(gòu)建一種新型特征集和引入皮爾遜VII廣義核函數(shù),提高 了手部動(dòng)作識(shí)別的準(zhǔn)確性。
[0006] 本發(fā)明的目的是通過(guò)以下技術(shù)方案來(lái)實(shí)現(xiàn)的:一種基于支持向量機(jī)的表面肌電信 號(hào)多類(lèi)手部動(dòng)作識(shí)別方法,包括如下步驟:
[0007] (1)數(shù)據(jù)獲取,預(yù)處理,分割,訓(xùn)練集測(cè)試集的劃分,包括以下子步驟:
[0008] (1. 1)獲取多通道肌電數(shù)據(jù);
[0009] (1. 2)對(duì)數(shù)據(jù)進(jìn)行平滑濾波;
[0010] (1· 3)使用100ms,150ms,200ms,250ms四種長(zhǎng)度的采樣窗口對(duì)數(shù)據(jù)進(jìn)行采樣分 害J,其中采樣窗口的移動(dòng)步長(zhǎng)為窗口長(zhǎng)度的25%;
[0011] (1. 4)根據(jù)評(píng)估方法,將數(shù)據(jù)樣本劃分為訓(xùn)練集和測(cè)試集;
[0012] (2)特征提取,歸一化和自動(dòng)特征選擇,包括以下子步驟:
[0013] (2. 1)對(duì)每個(gè)采樣窗口內(nèi)的數(shù)據(jù),提取一種多特征的特征集;
[0014] (2. 2)對(duì)特征進(jìn)行歸一化處理;
[0015] (2. 3)應(yīng)用基于最小冗余最大相關(guān)性(MinimumRedundancyMaximum Relevance,MRMR)準(zhǔn)則的自動(dòng)特征選擇算法進(jìn)行特征選擇;
[0016] (3)基于皮爾遜VII廣義核支持向量機(jī)的多類(lèi)手部動(dòng)作識(shí)別,包括以下子步驟:
[0017] (3. 1)設(shè)計(jì)基于皮爾遜VII廣義核(PearsonVIIUniversalKernel,PUK)的支 持向量機(jī)分類(lèi)器;
[0018] (3. 2)使用訓(xùn)練集數(shù)據(jù)樣本,展開(kāi)網(wǎng)格搜索參數(shù)優(yōu)化過(guò)程,搜索最優(yōu)的分類(lèi)器參 數(shù);
[0019] (3. 3)使用步驟3. 2得到的最優(yōu)分類(lèi)器參數(shù)和所有的訓(xùn)練集數(shù)據(jù)樣本,訓(xùn)練分類(lèi) 豐旲型;
[0020] (3. 4)將測(cè)試集數(shù)據(jù)樣本依次輸入分類(lèi)模型,輸出分類(lèi)結(jié)果。
[0021] 進(jìn)一步地,步驟1. 1中,數(shù)據(jù)來(lái)源為NinaPro開(kāi)源數(shù)據(jù)集1內(nèi)的10通道肌電數(shù)據(jù)。
[0022] 進(jìn)一步地,步驟1. 2中,使用50毫秒長(zhǎng)度的窗口對(duì)數(shù)據(jù)進(jìn)行均值平滑濾波。
[0023] 進(jìn)一步地,步驟2. 1中的特征集包含19種特征,它們是:信號(hào)幅值的絕對(duì)值之和 (IEMG),信號(hào)幅值的絕對(duì)平均值(MAV),改進(jìn)信號(hào)幅值的絕對(duì)平均值1 (MMAV1),改進(jìn)信號(hào)幅 值的絕對(duì)平均值2 (MMAV2),信號(hào)均方根(RMS),估計(jì)肌肉收縮力非線(xiàn)性檢測(cè)器(v-order), 估測(cè)肌肉收縮力的對(duì)數(shù)檢測(cè)器(LOG),波形長(zhǎng)度(WL),幅值平均變化值(AAC),波形長(zhǎng)度標(biāo) 準(zhǔn)差(WL-DASDV),Willison幅值(WAMP),自回歸系數(shù)(ARC),絕對(duì)平均值斜率(MAVSLP),功 率譜的平均功率(MNP),Daubechiesl小波變換邊界(MDWT-DB1),基于Daubechiesl小波的 多分辨率小波分析(MRWA-DB1),小波包變換后信號(hào)的均值(DWPT-MEAN),小波包變換后信 號(hào)標(biāo)準(zhǔn)差(DWPT-SD),自回歸余數(shù)殘差29種統(tǒng)計(jì)量(ARR-29)。
[0024] 進(jìn)一步地,步驟2. 2中對(duì)訓(xùn)練特征集和測(cè)試特征集采用不同的特征歸一化方法:
[0025] 對(duì)訓(xùn)練特征集的歸一化方法為,用訓(xùn)練特征集每一列減去其自身的均值并除以其 方差;
[0026] 對(duì)測(cè)試特征集的歸一化方法為,用測(cè)試特征集樣本每一列減去訓(xùn)練特征集對(duì)應(yīng)列 的均值并除以訓(xùn)練特征集對(duì)應(yīng)列的方差;
[0027] 其具體公式為:
[0028]
[0029]
[0030] 其中train為訓(xùn)練集,test為測(cè)試集。
[0031] 進(jìn)一步地,步驟2. 3中所述基于最小冗余最大相關(guān)性準(zhǔn)則的自動(dòng)特征選擇算法, 其基本原理為:
[0032] 設(shè)存在一個(gè)特征子集S,S中每一列特征^到類(lèi)標(biāo)簽c的依賴(lài)性D定義為:
[0033]
[0034] S中特征兩兩之間的冗余R定義為:
[0035]
[0036] 上述公式中,I為互信息,兩個(gè)離散變量X和Y之間互信息的計(jì)算公式為:
[0037]
[0038] 最小冗余最大相關(guān)性特征選擇算法試圖找到一個(gè)特征子集S,其滿(mǎn)足擁有最大的 依賴(lài)性D,最小的冗余R,即滿(mǎn)足:
[0039] maxΦ(D,R),Φ=D-R
[0040] 實(shí)際的手勢(shì)識(shí)別實(shí)驗(yàn)中,根據(jù)"在整個(gè)分類(lèi)模型訓(xùn)練過(guò)程中測(cè)試集信息始終保持 未知"的模式識(shí)別原則,對(duì)訓(xùn)練特征集和測(cè)試特征集的特征選擇使用不同的策略,具體步驟 為:
[0041] 對(duì)訓(xùn)練特征集的特征選擇,主要是應(yīng)用基于最小冗余最大相關(guān)性準(zhǔn)則的自動(dòng)特征 選擇算法,選取最優(yōu)的N維子集S。將子集中每一維特征對(duì)應(yīng)于原始特征集中的序號(hào)保存下 來(lái);
[0042] 對(duì)測(cè)試特征集的特征選擇,直接應(yīng)用對(duì)訓(xùn)練集特征選擇時(shí)保存下來(lái)的序號(hào)。
[0043] 進(jìn)一步地,步驟3. 1具體為:采用皮爾遜VII廣義核函數(shù)作為支持向量機(jī)的核函 數(shù),對(duì)于支持向量機(jī)的具體原理描述如下:
[0044] 對(duì)于η個(gè)樣本的訓(xùn)練樣本集D= {(Xi,y;)| Rp,乃e{-1,1}}二,其中Xi為一個(gè) 訓(xùn)練樣本,yi為樣本χ標(biāo)簽;
[0045] 設(shè)變換Φ(·)將輸入空間映射到特征空間上,將數(shù)據(jù)分成兩類(lèi)的線(xiàn)性超平面可以 定義為:
[0046] ωXφ(x)+b= 0ωeRp,beR(1)
[0047] 支持向量機(jī)試圖找到一個(gè)最優(yōu)的超平面,可以最好地劃分訓(xùn)練數(shù)據(jù)集中的兩類(lèi)數(shù) 據(jù),這個(gè)優(yōu)化過(guò)程等價(jià)于求解下列二次規(guī)劃問(wèn)題:
[0050] 其中α為拉格朗日乘子,Ce[0,①