一種基于改進自訓練學習的腦電信號識別方法
【技術領域】
[0001] 本發(fā)明屬于腦-機接口領域,涉及一種基于改進自訓練學習的腦電信號識別方法。
【背景技術】
[0002] 腦-機接口技術(BCI)作為一種新型的人機交互技術,通過采集人的大腦信號,經(jīng) 預處理、特征提取和模式識別等對大腦信號進行建模,生成控制指令,實現(xiàn)大腦對外部設備 的控制。由于其在醫(yī)學、軍事、娛樂等領域具有廣泛的應用前景,BCI已成為神經(jīng)康復、信息 科學等領域的研究熱點。在現(xiàn)有基于EEG的BCI系統(tǒng)中,運動想象作為一種自發(fā)EEG,不需要 肌肉和肢體的真實參與,想象運動也能產(chǎn)生同樣的腦電節(jié)律調制現(xiàn)象,還可以實現(xiàn)異步通 信等特點,目前已成為BCI領域研究的熱點之一。
[0003] 提高對運動想象模式的識別率是BCI系統(tǒng)的核心所在,要獲得高性能的識別算法 需要用戶長時間的訓練,以獲取充足的標記樣本。而長時間的訓練給用戶帶來很大的工作 量及精神負擔,也給BCI系統(tǒng)使用帶來了不便。為此如何減少用戶的訓練時間是BCI系統(tǒng)實 際應用中面臨的問題之一。李遠清等人于2008年首次將半監(jiān)督學習算法引入EEG信號識別 中,用于識別右手/腳兩類運動想象任務(數(shù)據(jù)集Iva),獲得了良好的效果。半監(jiān)督學習算法 通常包含自訓練學習算法、協(xié)同訓練學習算法、基于圖的學習算法、半監(jiān)督支持向量機 (TSVM)等,其中自訓練學習算法由于其使用簡便,已廣泛應用于基于半監(jiān)督學習算法的腦 電信號識別中。龍錦益等人于2010年提出了一種結合特征提取的自訓練學習算法,在自訓 練迭代過程中加入了參數(shù)選擇(通道、波段),在兩類運動想象任務識別中取得98.4%的識 別率。朱向陽等人于2014年提出了一種結合特征提取的協(xié)同訓練半監(jiān)督分類算法,迭代更 新共空間模式(CSP)特征和訓練線性判別/貝葉斯判別兩個分類器,在兩類運動想象任務中 獲得了81.9%的識別率。但在自訓練學習算法框架中,初始的標記樣本通常較少,如果采用 監(jiān)督特征提取算法,將導致初始提取的特征性能較差,從而降低自訓練學習算法的性能。而 如果采用無監(jiān)督特征提取算法,由于無監(jiān)督特征提取算法沒有很好地考慮樣本的判別信 息,不具有判別能力,也很難達到預期效果。
【發(fā)明內(nèi)容】
[0004] 本發(fā)明針對如何減少BCI系統(tǒng)對用戶的訓練時間,提出一種改進自訓練學習的腦 電信號識別方法?;舅悸肥鞘紫壤冒氡O(jiān)督extreme energy ratio(EER)算法提取標記 和未標記樣本的特征向量,然后利用標記樣本訓練SVM分類器,識別未標記樣本,選擇具有 高置信度的樣本及其預測標簽,加入標記樣本集中,并相應地從未標記樣本集中刪除,依次 循環(huán)迭代,最后完成對所有未標記樣本的標注,并獲得最終支持向量機(SVM)分類器。本方 法能夠更為有效而充分地挖掘未標記樣本的信息,提高了 BCI系統(tǒng)的識別性能和魯棒性。
[0005] 技術方案:一種基于改進自訓練學習的腦電信號識別方法,包含以下步驟:
[0006] 步驟一:輸入標記和未標記EEG信號;
[0007]設有兩類想象任務,標記樣本分別為XA和XB,標簽為yie{-l,l},樣本數(shù)量分別為 πα和πβ,未標記樣本為Xu,樣本數(shù)量為u,Xi e RNXT,Xi為單個的EEG信號,i = {1,…,πα,…,πα+ ηΒ,···,nA+nB+u},其中Ν為通道數(shù)量,Τ為米樣時間;
[0008] 步驟二:對EEG信號進行預處理;
[0009]步驟三:利用半監(jiān)督特征提取算法提取標記和未標記樣本的特征向量;
[0010] 步驟四:利用標記樣本訓練SVM分類器,對未標記樣本進行預測;
[0011]步驟五:利用SVM的預測結果,選擇高置信度的樣本及其預測標簽加入標記樣本集 中,并從對應的未標記樣本集中刪除;
[0012]步驟六:如果未標記樣本全部已被標記,則可利用原標記樣本和新增的標記樣本 訓練SVM,對未知樣本進行識別;如果未標記樣本不為空,則返回步驟三。
[0013] 與現(xiàn)有的基于半監(jiān)督學習的腦電信號識別算法相比,本發(fā)明充分挖掘了未標記樣 本的信息,利用半監(jiān)督EER算法提取特征向量,提高了系統(tǒng)識別率和魯棒性。
【附圖說明】
[0014] 圖1為本發(fā)明具體實施流程圖;
【具體實施方式】
[0015] 下面結合說明書附圖進一步闡明本發(fā)明,應理解這些實施例僅用于說明本發(fā)明而 不用于限制本發(fā)明的范圍,在閱讀了本發(fā)明之后,本領域技術人員對本發(fā)明的各種等價形 式的修改均落于本申請所附權利要求所限定的范圍。
[0016] 如圖1所示,本發(fā)明的實施主要包含三個步驟:(1)采用半監(jiān)督EER算法在標記和未 標記樣本上計算映射矩陣,提取特征向量;(2)利用標記樣本訓練SVM,對未標記樣本進行預 測;(3)利用SVM的預測結果,將高置信度的未標記樣本及其預測標簽加入標記樣本集中,并 從相應的未標記樣本集中刪除。
[0017] 步驟1,輸入標記和未標記EEG信號
[0018] 設有兩類想象任務,標記樣本分別為ΧΑ和ΧΒ,標簽為yi e {-1,1},樣本數(shù)量分別為 για和ΠΒ,未標記樣本為Xu,樣本數(shù)量為u,Xi e RNXT,Xi為單個的EEG信號,i = {1,…,για,…,πα+ ΠΒ,···,nA+nB+u},其中N為通道數(shù)量,T為米樣時間;
[0019] 步驟2,對EEG信號進行預處理;
[0020] 步驟3,利用半監(jiān)督EER算法提取標記和未標記樣本的特征向量;
[0021 ]首先利用兩類標記樣本計算協(xié)方差矩陣:
[0024]然后,計算樣本Xi的時域鄰接矩陣1,其定義如下:
[0026] k、t為采樣時刻,r為閾值;
[0027] 依據(jù)鄰接矩陣Wi計算樣本Xi的Laplacian矩陣Li = Di-Wi,其中Di為對角陣,
[0028]計算未標記樣本的正則項R
[0030] 最終可得到最優(yōu)空域濾波器由((1 -a) CB+aRpCA的前m個特征向量和((1 -a)CA+a RPCb的前m個特征向量組成;a e [ 0,1 ]
[0031] 利用該空域濾波器對標記和未標記樣本進行映射,提取Xdt應的特征向量Xl。
[0032] 步驟4,利用標記樣本訓練SVM分類器,對未標記樣本進行預測;
[0033] SVM通過最小化如下目標函數(shù)獲得最優(yōu)判別面:
[0038] C為懲罰因子,為松弛變量,(w,b)為判別面;
[0039] 求取最優(yōu)判別面(w,b)后,可通過判決函數(shù)f (X) = sign(〈w,x>+b)預測未標記樣本 的標簽。
[0040] 步驟5,利用SVM的預測結果,選擇高置信度的樣本及其預測標簽加入標記樣本集 中,并從對應的未標記樣本集中刪除。
[0041] 通過判別函數(shù)f(x)可得到未標記樣本的標簽,但還需要求出未標記樣本屬于各類 的置信度,以便對未標記樣本進行篩選。
[0042]未標記樣本屬于某一類的置信度(或可能性)可由未標記樣本到判別面的距離確 定,距離公式如下:
[0044]距離cU越大,未標記樣本Xl屬于某一類的可能性越高,置信度也就越高,所以未標 記樣本^的置信度輸出為:
[0046] 在得到未標記樣本的置信度后,選擇前s個置信度最高的樣本及其預測標簽加入 標記樣本集中,并從未標記樣本集中刪除。
[0047] 步驟6,如果未標記樣本全部已被標記,則可利用原標記樣本和新增的標記樣本訓 練SVM,對未知樣本進行識別;如果未標記樣本不為空,則轉至步驟3,依次迭代提取特征和 更新分類器。
【主權項】
1. 一種改進自訓練半監(jiān)督學習的腦電信號識別方法,其特征在于,該方法包含W下步 驟: 步驟一:輸入標記和未標記邸G信號; 設有兩類想象任務,標記樣本分別為χΑ和χΒ,標簽為yie {-1,1},樣本數(shù)量分別為nA和 郵,未標記樣本為X。,樣本數(shù)量為U,Xi erNxt,Xi為單個的趾G信號,i = {1,…,ηΑ,…,ΠΑ+ ΠΒ,··· ,ΠΑ+郵+u},其中Ν為通道數(shù)量,Τ為義樣時間; 步驟二:對邸G信號進行預處理; 步驟Ξ:利用半監(jiān)督特征提取算法提取標記和未標記樣本的特征向量; 步驟四:利用標記樣本訓練SVM分類器,對未標記樣本進行預測; 步驟五:利用SVM的預測結果,選擇高置信度的樣本及其預測標簽加入標記樣本集中, 并從對應的未標記樣本集中刪除; 步驟六:如果未標記樣本全部已被標記,則可利用原標記樣本和新增的標記樣本訓練 SVM,對未知樣本進行識別;如果未標記樣本不為空,則返回步驟Ξ。2. 根據(jù)權利要求1所述的一種改進自訓練半監(jiān)督學習的腦電信號識別方法,其特征在 于:步驟Ξ中,利用半監(jiān)督特征提取算法提取標記和未標記樣本的特征向量;具體如下: 首先利用兩類標記樣本計算協(xié)方差矩陣:然后,計算樣本Xi的時域鄰接矩陣Wi,其定義如下:(3; k、t為采樣時刻,r為闊值; 依據(jù)鄰接矩陣Wi計算樣本Xi的Laplacian矩陣Li = Di-Wi,其中Di為對角陣,計算未標記樣本的正則項R(4) 最終可得到最優(yōu)空域濾波器由((l-a)CB+aR)-iCA的前m個特征向量和((l-c〇CA+aR)-iCB 的前m個特征向量組成;ae[〇,l] 利用該空域濾波器對標記和未標記樣本進行映射,提取Xi對應的特征向量XI。3. 根據(jù)權利要求1所述的一種改進自訓練半監(jiān)督學習的腦電信號識別方法,其特征在 于:步驟四中,利用標記樣本訓練SVM分類器,對未標記樣本進行預測;具體如下: SVM通過最小化如下目標函數(shù)獲得最優(yōu)判別面:c為懲罰因子,ξι為松弛變量,(w,b)為判別面,其中w為變量系數(shù),b為常量; 求取最優(yōu)判別面(w,b)后,可通過判決函數(shù)^義)=31旨11(<巧,於+6)預測未標記樣本的標 簽。4.根據(jù)權利要求1所述的一種改進自訓練半監(jiān)督學習的腦電信號識別方法,其特征在 于:步驟五中,利用SVM的預測結果,選擇高置信度的樣本及其預測標簽加入標記樣本集中, 并從對應的未標記樣本集中刪除;具體如下: 未標記樣本屬于某一類的置信度可由未標記樣本到判別面的距離確定,距離公式如 下:(6) 距離di越大,未標記樣本XI屬于某一類的可能性越高,置信度也就越高,所W未標記樣 本XI的置信度輸出為:(7) 在得到未標記樣本的置信度后,選擇前S個置信度最高的樣本及其預測標簽加入標記 樣本集中,并從未標記樣本集中刪除。
【專利摘要】本發(fā)明公開一種改進自訓練半監(jiān)督學習的腦電信號識別方法。首先對采集到的EEG信號進行預處理,利用半監(jiān)督extreme?energy?ratio算法提取標記和未標記樣本的特征向量,然后利用標記樣本訓練支持向量機(SVM),并對未標記樣本進行預測,再選擇具有高置信度的未標記樣本及其對應的預測標簽,加入標記樣本集中,并相應地從未標記樣本集中刪除,依次循環(huán)迭代,最后完成對所有未標記樣本的標注。本發(fā)明不僅大大減少了用戶在使用BCI系統(tǒng)之前的訓練時間,而且有效地提高了識別精度和魯棒性。
【IPC分類】G06K9/62
【公開號】CN105550705
【申請?zhí)枴緾N201510922194
【發(fā)明人】甘海濤, 羅志增, 范影樂, 高發(fā)榮
【申請人】杭州電子科技大學
【公開日】2016年5月4日
【申請日】2015年12月11日