本發(fā)明屬于腦電信號處理,尤其是基于腦電信號情緒識別領(lǐng)域,具體是一種基于腦電信號的負(fù)性情緒分類和抑郁癥判別方法。
背景技術(shù):
1、情緒是一種復(fù)雜的心理狀態(tài),包括生理、行為、認(rèn)知和主觀體驗(yàn)的多重維度,在日常生活和學(xué)習(xí)中占據(jù)了重要的地位。心理學(xué)將人類的情緒分為三個(gè)大類:積極情緒,中性情緒和負(fù)性情緒。情緒識別是指基于信號處理,對不同情緒下的生理或非生理信號進(jìn)行特征提取和模式識別的過程。情緒認(rèn)知及其腦機(jī)制研究,特別是情緒與認(rèn)知的關(guān)系及其潛在的神經(jīng)基礎(chǔ)研究,近年已逐漸成為認(rèn)知神經(jīng)科學(xué)的前沿?zé)狳c(diǎn)課題。其研究成果不僅可以極大地豐富認(rèn)知神經(jīng)科學(xué)的內(nèi)容,而且可為情緒障礙疾病和腦疾病的診斷與治療提供依據(jù)和方法。
2、目前抑郁癥識別常?;谥饔^量表、問卷等方式,但這些方法無法做到客觀準(zhǔn)確。隨著機(jī)器學(xué)習(xí)的興起和中國腦計(jì)劃的展開,越來越多的學(xué)者聚焦于腦科學(xué)研究并將其視為“終極疆域”,腦電信號也被證實(shí)可作為研究腦疾病精準(zhǔn)高效的生理依據(jù)之一。通過對腦電信號進(jìn)行預(yù)處理、特征提取與選擇,并利用機(jī)器學(xué)習(xí)分類算法可以實(shí)現(xiàn)對抑郁癥的識別,從而準(zhǔn)確地分析受試者狀態(tài)。
3、基于腦電信號的情緒識別主要考慮識別準(zhǔn)確率以及識別狀態(tài)兩個(gè)方面,目前的研究都局限于對積極和消極的情緒進(jìn)行二分類,且比較容易區(qū)分而較少有研究聚焦于某一具體的內(nèi)部情緒的研究,這些情緒的內(nèi)部也可以分為不同的等級可以通過某些特征或者某些特征的閾值表現(xiàn)出來。并且單一特征包含的有效信息不夠豐富,無法達(dá)到較好的分類識別效果,因此需要提取多個(gè)腦電特征的多個(gè)電極通道參數(shù)以獲得較高的識別準(zhǔn)確率,然后過高的特征維度會導(dǎo)致模型存在較大冗余,大大增加了運(yùn)算復(fù)雜度并會一定程度影響分類識別精度,易產(chǎn)生過擬合現(xiàn)象導(dǎo)致模型的泛化性能較差。
技術(shù)實(shí)現(xiàn)思路
1、為了解決現(xiàn)有對情緒的分類太過局限和對抑郁癥的早期診斷不夠精確,本發(fā)明提出了一種基于腦電信號的負(fù)性情緒分類和抑郁癥判別方法,本發(fā)明從負(fù)性情緒入手,通過anova檢驗(yàn)方法將負(fù)性情緒再進(jìn)行細(xì)致分類,分為三個(gè)類別:嚴(yán)重負(fù)性情緒、中度負(fù)性情緒和輕微負(fù)性情緒,之后再研究嚴(yán)重負(fù)性情緒和抑郁癥腦疾病之間的關(guān)系,來判斷受試者的狀態(tài)是否達(dá)到了患病的標(biāo)準(zhǔn),實(shí)現(xiàn)了高效的識別效果。
2、本發(fā)明提出的一種基于腦電信號的負(fù)性情緒分類和抑郁癥判別方法,包括如下步驟:
3、步驟1、腦電信號數(shù)據(jù)獲?。和ㄟ^網(wǎng)絡(luò)申請獲取情緒deap數(shù)據(jù)集和husm抑郁癥數(shù)據(jù)集,基于情緒va二維模型對情緒deap數(shù)據(jù)集進(jìn)行處理保留其中的負(fù)性情緒;
4、步驟2、對兩個(gè)數(shù)據(jù)集中的腦電信號進(jìn)行預(yù)處理;
5、腦電信號易收到環(huán)境噪音和物理磁場等因素的影響,為了獲得干凈有效的高信噪比腦電信號,需要對原始混合腦電信號進(jìn)行預(yù)處理。通過matlab軟件以及matlab自帶的eeglab工具箱對數(shù)據(jù)集中的原始混合腦電信號進(jìn)行預(yù)處理。
6、步驟3、特征提取和構(gòu)建多域特征融合矩陣:針對步驟2中兩個(gè)數(shù)據(jù)集,從每個(gè)腦電信號中提取α波與β波的psd比、α波psd的左右腦不對稱性、非線性特征樣本熵三個(gè)特征;將兩個(gè)數(shù)據(jù)集提取的特征參數(shù)進(jìn)行融合,構(gòu)建多域特征融合矩陣。
7、步驟4、對多域特征融合矩陣進(jìn)行特征參數(shù)篩選降維:對步驟3得到的多域特征融合矩陣進(jìn)行特征參數(shù)選擇,去除不存在顯著性差異的特征參數(shù);
8、步驟5、負(fù)性情緒閾值分析:
9、將負(fù)性情緒樣本集進(jìn)行負(fù)面情緒分類,具體分為嚴(yán)重負(fù)性情緒、中度負(fù)性情緒和輕微負(fù)性情緒,按類分析顯著性最高的前兩個(gè)特征參數(shù),并確定這兩個(gè)特征參數(shù)用于判斷每類負(fù)性情緒對應(yīng)的最佳閾值組合;
10、步驟6:訓(xùn)練抑郁癥svm分類器:
11、經(jīng)過步驟5得到的嚴(yán)重負(fù)性情緒樣本中屬于抑郁癥的樣本進(jìn)行標(biāo)記,之后將嚴(yán)重負(fù)性情緒樣本和將步驟4中得到的抑郁樣本集,導(dǎo)入svm分類器分類進(jìn)行訓(xùn)練;
12、步驟7、將待分析情緒的腦電信號,根據(jù)步驟5中的閾值組合進(jìn)行負(fù)性情緒分類,并按照步驟6中的訓(xùn)練好的抑郁癥svm分類器判斷待分析情緒的腦電信號是否為抑郁癥。
13、進(jìn)一步的,所述步驟2中預(yù)處理方法如下:
14、使用eeglab工具箱電極定位,通過濾波器去除50hz的工頻干擾并通過4-45hz的帶通濾波去除高頻信號干擾,并進(jìn)行壞段剔除,再通過ica從原始信號中去除低頻干擾,執(zhí)行完ica后根據(jù)地形圖能量分布和功率譜分析識別移除眼動噪聲和偽影成分。ica是一種線性變換,其主要思想是根據(jù)infomax原理,通過最小化輸出分量之間的互信息,將信號分離成統(tǒng)計(jì)獨(dú)立的非高斯源的線性組合。
15、進(jìn)一步的,所述步驟3中,特征提取方法如下:
16、步驟3.1、從腦電信號中識別出能夠有效反映不同注意狀態(tài)的特征,通道的選取按照國際標(biāo)準(zhǔn)的10-20系統(tǒng)標(biāo)準(zhǔn)電極安放法,根據(jù)情緒腦電和抑郁癥腦電表現(xiàn)最好的前額葉的6個(gè)通道fp1,fp2,f3,f4,f7,f8以及加上c3,c4兩個(gè)中央?yún)^(qū)的通道信號共計(jì)8個(gè)腦電通道進(jìn)行對比分析,在小波包變換分解的基礎(chǔ)上基于頻域和時(shí)頻域比較提取3個(gè)特征,每個(gè)特征均包含8個(gè)電極通道的參數(shù),共計(jì)24個(gè)特征參數(shù)。
17、3個(gè)特征選擇原因如下:經(jīng)過研究分析比較,α波與積極的情緒相關(guān),β波與消極的情緒相關(guān),當(dāng)處于負(fù)性情緒狀態(tài)下時(shí),α波的功率會減少而相應(yīng)地β波的功率會增加,且人類的左右半球與特定的情緒和情感特征有不同的聯(lián)系。且負(fù)性情緒與抑郁癥的關(guān)系較為密切,抑郁癥的長期表現(xiàn)就是情緒低落,所以提取α波與β波的psd比和α波psd的左右腦不對稱性作為分類的特征,非線性特征樣本熵的計(jì)算不依賴于數(shù)據(jù)的長度且計(jì)算誤差較小,抗噪聲和抗干擾能力強(qiáng),且可以反應(yīng)腦部的活動復(fù)雜度因此適合分析復(fù)雜的腦電信號,所以提取非線性特征樣本熵。
18、選取的3個(gè)特征介紹如下:
19、(1)α波與β波的psd比;
20、psd是指信號在頻域上的量,表示功率在各頻率點(diǎn)的分布情況,功率譜通過變換將時(shí)域中幅度隨時(shí)間變化的腦電信號轉(zhuǎn)化為功率隨頻率變化的功率譜圖,從而可以通過功率譜圖直接觀察腦電節(jié)律的分布與變化情況,并定量分析各頻段的分量。p(t)是在時(shí)域上的能量總值,等式右邊的被積函數(shù)就是其能量譜密度,也就是單位頻率的能量,其與信號的時(shí)間長度的比便可以被稱為功率譜密度。
21、
22、其中,p(t)是在時(shí)域上的能量總值;p(f)表示能量譜密度。
23、(2)α波psd的左右腦不對稱性;
24、
25、其中,fright代表α波右腦的psd,fleft代表α波左腦的psd;asym用來表示α波psd的左右腦不對稱性。
26、(3)樣本熵;
27、樣本熵是一種非線性特征,是一種新型的度量時(shí)間復(fù)雜度的方法,與其他的熵分析相比,樣本熵的計(jì)算不依賴于數(shù)據(jù)的長度且計(jì)算誤差較小,抗噪聲和抗干擾能力強(qiáng),因此適合分析復(fù)雜的腦電信號。樣本熵表征腦電信號序列復(fù)雜程度的無量綱指標(biāo),熵值越大代表信號復(fù)雜度越大,代表腦部活躍度高。樣本熵的假定由n個(gè)腦電信號數(shù)據(jù)組成的時(shí)間序列x(n)=x(1),x(2),...,x(n),其樣本熵的計(jì)算方式如下:其基本原理算法流程如下表1所示:
28、表1樣本熵算法原理
29、
30、
31、由上述式子可以看出,樣本熵的算法主要包含三個(gè)參數(shù),分別是數(shù)據(jù)的長度n、嵌入維數(shù)m和有效閾值r,下面介紹樣本熵參數(shù)的選取過程:
32、m是嵌入維數(shù),是計(jì)算樣本熵時(shí)所設(shè)定的窗口長度,在一般的情況下,m的值一般設(shè)置為1或者2。當(dāng)m的取值大于2時(shí),所需要的數(shù)據(jù)長度n需要很長,只有當(dāng)n大于5000時(shí)才會有很好的效果,但在這種情況下,所需要的r也會很大,對信號序列的分析會造成大量的信息丟失。因此本發(fā)明選擇m的值為2。
33、r是有效閾值,表示相似容限,當(dāng)r的值較大時(shí),會丟失較多的信息,而當(dāng)r的值較小時(shí),又會不能理想的估計(jì)出系統(tǒng)的統(tǒng)計(jì)特性。最后的結(jié)論是通常r的取值在0.1~0.25sd(x)(sd(x)是序列的標(biāo)準(zhǔn)差)之間時(shí),特征參數(shù)表示較為理想。本發(fā)明選擇0.2*std作為r的值。
34、參數(shù)n表示數(shù)據(jù)的長度,對n的選取并沒有什么限制,為了得出理想的統(tǒng)計(jì)特征,數(shù)據(jù)點(diǎn)的點(diǎn)數(shù)應(yīng)該控制在100~5000這個(gè)區(qū)域內(nèi)。
35、步驟3.2、將每個(gè)腦電信號提取的24個(gè)特征參數(shù)進(jìn)行融合的得到多域特征融合向量;將每個(gè)腦電信號提取的24個(gè)特征參數(shù)進(jìn)行融合,得到24維(3特征*8通道)的特征向量。
36、步驟3.3、構(gòu)建多域特征融合矩陣;
37、按照步驟3.1和步驟3.2中的操作對情緒deap數(shù)據(jù)集中的多個(gè)腦電信號進(jìn)行處理,得到多域特征融合矩陣,作為負(fù)性情緒樣本集;
38、按照步驟3.1和步驟3.2中的操作對usm抑郁癥數(shù)據(jù)集中的多個(gè)腦電信號進(jìn)行處理,得到的多域特征融合矩陣,作為抑郁樣本集。
39、進(jìn)一步的,所述步驟4中特征參數(shù)篩選降維方法如下:
40、對步驟3得到的多域特征融合矩陣進(jìn)行特征參數(shù)選擇以減少冗余,通過顯著性分析來判斷24個(gè)特征參數(shù)是否具有差異性,根據(jù)結(jié)果篩選出對分類器性能而言最優(yōu)秀的特征子集,去除不存在顯著性差異的特征參數(shù)。
41、根據(jù)顯著性分析的方法,分析負(fù)性情緒樣本集和抑郁樣本集中的多域特征融合向量中24個(gè)參數(shù)的差異性,計(jì)算p值來判斷兩個(gè)樣本集中同一類特征參數(shù)的差異性,p>0.05表示負(fù)性情緒樣本集和抑郁癥樣本集之間不存在顯著性差異,即這類特征參數(shù)在分類時(shí)對結(jié)果的影響很小或者會干擾分類結(jié)果,需要將這些特征參數(shù)舍去。
42、進(jìn)一步的,所述步驟5的具體操作為:
43、將負(fù)性情緒樣本集分為三類,具體分為嚴(yán)重負(fù)性情緒、中度負(fù)性情緒和輕微負(fù)性情緒,按照類別將負(fù)性情緒樣本集的多域特征融合矩陣進(jìn)行anova檢驗(yàn)來判斷,通過計(jì)算分析顯著性最高的前兩個(gè)特征參數(shù),采用基于遍歷法的全局優(yōu)化策略,確定這兩個(gè)特征參數(shù)用于判斷每類負(fù)性情緒對應(yīng)的最佳閾值組合。
44、進(jìn)一步的,所述步驟6的具體操作為:
45、將嚴(yán)重負(fù)性情緒樣本的標(biāo)簽記為1,其中,屬于抑郁癥的嚴(yán)重負(fù)性情緒樣本的標(biāo)簽記為0,利用五折交叉驗(yàn)證法,判斷準(zhǔn)確率;將嚴(yán)重負(fù)性情緒樣本數(shù)據(jù)集隨機(jī)劃分為大小相等的5個(gè)子集然后進(jìn)行五次迭代,每次使用其中的四個(gè)子集作為訓(xùn)練集,剩下的一個(gè)子集作為驗(yàn)證集來測試svm分類器的表現(xiàn),在五次迭代結(jié)束后,計(jì)算這五次結(jié)果的準(zhǔn)確率平均值來代表訓(xùn)練后svm分類器的準(zhǔn)確率。
46、有益效果:本發(fā)明方法不僅提高了情緒識別的準(zhǔn)確率,也為抑郁癥等心理障礙的早期檢測和干預(yù)提供了新的思路。