本發(fā)明涉及一種用于睡眠腦電分期特征選擇的自適應(yīng)模擬退火遺傳算法,屬于自適應(yīng)模擬退火遺傳算法技術(shù)領(lǐng)域。
背景技術(shù):
特征選擇是通過某種算法從全部特征參數(shù)集中篩選出少量的最適合于區(qū)分不同任務(wù)的特征參數(shù)。當(dāng)特征參數(shù)數(shù)量較少時,可通過窮舉法計算所有的特征參數(shù)組合來篩選最優(yōu)特征參數(shù)。而當(dāng)特征參數(shù)數(shù)量較多時,窮舉法幾乎不可能實現(xiàn)。隨著模式識別算法的發(fā)展,特征參數(shù)選擇已成為優(yōu)化特征參數(shù)分類模型的重要手段。特征參數(shù)選擇不僅可以簡化所建立的特征分類模型,還可以最大程度地對輸入變量進行優(yōu)化選擇,去除與輸出變量無關(guān)的輸入變量,進而提高分類模型的泛化特性和穩(wěn)健性。
目前,腦電信號特征參數(shù)選擇算法應(yīng)用較多的有聚類分析法和智能優(yōu)化算法等。聚類分析法通過參數(shù)之間的可分離性、交互信息等進行參數(shù)選擇。另一類重要的特征參數(shù)選擇算法是智能優(yōu)化算法,此類算法通過模擬生物進化論優(yōu)勝劣汰等自然規(guī)律,以實際問題的最優(yōu)解作為訓(xùn)練目標函數(shù)進行反復(fù)的迭代運算,篩選出最佳的特征參數(shù)組合。其中,遺傳算法因具有全局最優(yōu)、易于實現(xiàn)、魯棒性較高等優(yōu)勢已經(jīng)成功應(yīng)用于許多領(lǐng)域。該算法通過編碼方式將待選擇變量模擬為遺傳學(xué)中的染色體,通過遺傳、交叉和變異的方式對染色體編碼進行優(yōu)化迭代,最終得到最優(yōu)的結(jié)果。算法操作過程中以適應(yīng)度函數(shù)作為目標函數(shù),具有高效的并行計算特點,提高了選擇效率。但是,該算法的不足之處在于:(1)需要根據(jù)實際優(yōu)化問題自行設(shè)計適應(yīng)度函數(shù)的類型和參數(shù),沒有通用的適應(yīng)度函數(shù)標準;(2)易陷入局部最優(yōu);(3)收斂速度慢。近年來,人們從編碼方式、控制參數(shù)的確定和交叉機理等方面對基本遺傳算法進行了改進,改善了其易快速收斂到局部最優(yōu)的缺點,提高了收斂速度。其中,最具代表性的是自適應(yīng)遺傳算法(adaptivegeneticalgorithm,aga)和模擬退火遺傳算法(simulatedannealinggeneticalgorithm,saga)。
自適應(yīng)遺傳算法通過個體適應(yīng)度值的當(dāng)前趨勢,對交叉概率和變異概率進行調(diào)整,克服了基本遺傳算法過早收斂到局部最優(yōu)的缺點。模擬退火遺傳算法同時保留了模擬退火算法較強的局部搜索能力以及遺傳算法較強的總體搜索能力,通過兩種方法的優(yōu)勢互補,提高了尋優(yōu)能力。但該算法在對迭代過程中的個體進行模擬退火操作時,在當(dāng)前最優(yōu)解的鄰域內(nèi)隨機產(chǎn)生新解的機制存在致命缺陷,嚴重影響解的質(zhì)量。
綜上所述,目前已有的模擬退火遺傳算法特在特征選擇過程中的鄰域設(shè)置沒有嚴格的定義,鄰域區(qū)間的選擇對于解得穩(wěn)定性影響較大,嚴重的還會造成迭代結(jié)果不收斂。
技術(shù)實現(xiàn)要素:
本發(fā)明的目的是為了解決上述現(xiàn)有技術(shù)存在的問題,進而提供一種用于睡眠腦電分期特征選擇的自適應(yīng)模擬退火遺傳算法。
本發(fā)明的目的是通過以下技術(shù)方案實現(xiàn)的:
一種用于睡眠腦電分期特征選擇的自適應(yīng)模擬退火遺傳算法,
首先將自適應(yīng)遺傳算法交叉概率和變異概率的自適應(yīng)調(diào)整機制加入到模擬退火遺傳算法中;其次,采用基因優(yōu)化算法代替模擬退火遺傳算法中的鄰域隨機選擇機制;最后,設(shè)計加權(quán)適應(yīng)度函數(shù),保證分類結(jié)果的正確率和相似性。
具體步驟如下:
步驟一、特征參數(shù)編碼:設(shè)初始特征向量為x={x1,x2,…,xn},n為待選擇特征參數(shù)個數(shù);采用0/1對其進行編碼,1代表選中,0代表未選中;例如,s={1,1,0,0,1,0,0,…,0},表示選擇了特征參數(shù)x1、x2和x5三個特征參數(shù);
步驟二、適應(yīng)度函數(shù)設(shè)計:適應(yīng)度函數(shù)具體描述如式(1)所示:
f(si)=ω×f(si)+(1-ω)×c(si),i=1,2,...,n(1)
其中,f(si)為第i個特征參數(shù)編碼的分類精度,c(si)為第i個特征參數(shù)編碼分類結(jié)果與目標結(jié)果的相似系數(shù),ω為調(diào)整系數(shù),取0.6~0.8;
步驟三、自適應(yīng)交叉操作:通過式(2)所示交叉概率pc,調(diào)整機制進行自適應(yīng)交叉操作,選擇算術(shù)交叉arithmeticcrossover算子;
其中,fmax為當(dāng)前群體中適應(yīng)度的最大值,favg為當(dāng)前群體的適應(yīng)度均值,f'為兩個交叉?zhèn)€體中適應(yīng)度值較大的,k1和k2分別為(0,1)區(qū)間的常數(shù);
兩個體
其中,α為常數(shù)。
步驟四、自適應(yīng)變異操作:通過式(4)所示變異概率pm,調(diào)整機制進行自適應(yīng)變異操作,選擇高斯變異gaussianmutation操作算子;
其中,fmax為當(dāng)前群體中適應(yīng)度的最大值,favg為當(dāng)前群體的適應(yīng)度均值,f'為兩個交叉?zhèn)€體中適應(yīng)度值較大的,k3和k4分別為(0,1)區(qū)間的常數(shù);
步驟五、個體模擬退火操作:對當(dāng)前最優(yōu)解xbest進行變異操作,輪流對每一位進行變異,可得到n個解空間{s1,s2,...,sn};按照式(1)計算適應(yīng)度值,并將n個f(si)按照由大到小的順序排列;采用基于排序的輪盤賭選擇機制,根據(jù)冪律分布函數(shù)pk=k-τ(1≤k≤n)選擇第k位的解為新解xnew;
步驟六、按照式(1)評價新解xnew的適應(yīng)度,根據(jù)終止條件判斷循環(huán)是否終止。
本發(fā)明通過腦電信號進行睡眠分期,需要從腦電信號中提取大量特征參數(shù),從中篩選出相對最優(yōu)的特征參數(shù)組合用于睡眠腦電數(shù)學(xué)模型的建立。在已有的模擬退火遺傳算法中,保留了遺傳算法較強的總體搜索能力和模擬退火算法較強的局部搜索能力,以期提高產(chǎn)生優(yōu)良個體的概率。本發(fā)明提出一種自適應(yīng)模擬退火遺傳算法,不僅解決了傳統(tǒng)模擬退火遺傳算法鄰域新解產(chǎn)生機制的迭代效率低、受鄰域范圍影響大等缺點,而且能夠?qū)崿F(xiàn)交叉概率和變異概率的自適應(yīng)調(diào)整,同時采用加權(quán)方式進行適應(yīng)度函數(shù)的。相對于其它算法,本發(fā)明所提出的asaga算法的特征篩選效果最優(yōu),當(dāng)特征參數(shù)維數(shù)為10時,分類正確率最高,達到了92%。
附圖說明
圖1為相關(guān)系數(shù)算法特征參數(shù)排序圖。
圖2為遺傳算法的特征參數(shù)排序圖。
圖3為自適應(yīng)遺傳算法的特征參數(shù)排序圖。
圖4為模擬退火遺傳算法的特征參數(shù)排序圖。
圖5為自適應(yīng)模擬退火遺傳算法的特征參數(shù)排序圖。
圖6為特征參數(shù)選擇算法分類對比圖。
具體實施方式
下面將結(jié)合附圖對本發(fā)明做進一步的詳細說明:本實施例在以本發(fā)明技術(shù)方案為前提下進行實施,給出了詳細的實施方式,但本發(fā)明的保護范圍不限于下述實施例。
本實施例所涉及的一種用于睡眠腦電分期特征選擇的自適應(yīng)模擬退火遺傳算法,首先將自適應(yīng)遺傳算法交叉概率和變異概率的自適應(yīng)調(diào)整機制加入到模擬退火遺傳算法中;其次,采用基因優(yōu)化算法代替模擬退火遺傳算法中的鄰域隨機選擇機制;最后,設(shè)計加權(quán)適應(yīng)度函數(shù),保證分類結(jié)果的正確率和相似性。
具體步驟如下:
步驟一、特征參數(shù)編碼:設(shè)初始特征向量為x={x1,x2,…,xn},n為待選擇特征參數(shù)個數(shù)。采用0/1對其進行編碼,1代表選中,0代表未選中。例如,s={1,1,0,0,1,0,0,…,0},表示選擇了特征參數(shù)x1、x2和x5三個特征參數(shù)。
步驟二、適應(yīng)度函數(shù)設(shè)計:適應(yīng)度函數(shù)直接影響asaga算法的尋優(yōu)結(jié)果,與實際問題密切相關(guān)。為了提高睡眠分期正確率,本發(fā)明在適應(yīng)度函數(shù)設(shè)計中同時考慮了睡眠分期結(jié)果的正確率,以及分類結(jié)果與目標結(jié)果的相似性。適應(yīng)度函數(shù)具體可以描述為式(1)所示。
f(si)=ω×f(si)+(1-ω)×c(si),i=1,2,...,n(1)
其中,f(si)為第i個特征參數(shù)編碼的分類精度,c(si)為第i個特征參數(shù)編碼分類結(jié)果與目標結(jié)果的相似系數(shù),ω為調(diào)整系數(shù),一般取0.6~0.8。
步驟三、自適應(yīng)交叉操作:通過式(2)所示交叉概率pc,調(diào)整機制進行自適應(yīng)交叉操作,選擇算術(shù)交叉(arithmeticcrossover)算子。
其中,fmax為當(dāng)前群體中適應(yīng)度的最大值,favg為當(dāng)前群體的適應(yīng)度均值,f'為兩個交叉?zhèn)€體中適應(yīng)度值較大的,k1和k2分別為(0,1)區(qū)間的常數(shù)。
兩個體
其中,α為常數(shù)。
步驟四、自適應(yīng)變異操作:通過式(4)所示變異概率pm,調(diào)整機制進行自適應(yīng)變異操作,選擇高斯變異(gaussianmutation)操作算子。與基本遺傳算法編碼的變異操作不同,高斯變異算子將一組服從正態(tài)分布的隨機數(shù)代替原編碼。由于變異后的解服從正態(tài)分布,因此該算法具有較強的局部搜索能力。
其中,fmax為當(dāng)前群體中適應(yīng)度的最大值,favg為當(dāng)前群體的適應(yīng)度均值,f'為兩個交叉?zhèn)€體中適應(yīng)度值較大的,k3和k4分別為(0,1)區(qū)間的常數(shù)。
步驟五、個體模擬退火操作:對交叉、變異后的個體采用模擬退火算法進行局部尋優(yōu)操作。與常規(guī)模擬退火算法不同的是,對當(dāng)前最優(yōu)解xbest,按照基因優(yōu)化算法(goa)產(chǎn)生新解xnew。具體方法是:對當(dāng)前最優(yōu)解xbest進行變異操作,輪流對每一位進行變異,可得到n個解空間{s1,s2,...,sn}。按照式(1)計算適應(yīng)度值,并將n個f(si)按照由大到小的順序排列。采用基于排序的輪盤賭選擇機制,根據(jù)冪律分布函數(shù)pk=k-τ(1≤k≤n)選擇第k位的解為新解xnew。
步驟六、按照式(1)評價新解xnew的適應(yīng)度,根據(jù)終止條件判斷循環(huán)是否終止。
實驗驗證:
為了驗證自適應(yīng)模擬退火遺傳算法的有效性,以mit-bih多導(dǎo)睡眠數(shù)據(jù)庫的樣本為分析對象,分別提取25個特征參數(shù)。將25個特征參數(shù)依次記為{xi,i=1,2,…,25}。將自適應(yīng)模擬退火遺傳算法(asaga)與現(xiàn)有的相關(guān)系數(shù)法(cca)、普通遺傳算法(ga)、自適應(yīng)遺傳算法(aga)以及模擬退火遺傳算法(saga)的特征選擇效果進行對比驗證。將數(shù)據(jù)庫中所有樣本分為5份,分別依次選擇其中4份為校正樣本,剩余1份為驗證樣本。輪流執(zhí)行5次,以5次分類結(jié)果正確率的均值作為評價特征參數(shù)選擇結(jié)果的標準。
(1)基于相關(guān)系數(shù)的特征選擇
相關(guān)系數(shù)的特征選擇算法(correlationcoefficientalgorithm,cca)是將各特征參數(shù)按其與睡眠狀態(tài)相關(guān)系數(shù)絕對值由大到小的順序進行排列,依次選擇前1~25個參數(shù)進行特征分類。其中,排名前10的特征參數(shù)如圖1所示。
(2)基于智能優(yōu)化算法的特征選擇
隨機產(chǎn)生一個初始特征向量x={x1,x2,…,xn},分別運行g(shù)a,aga,saga,asaga等算法各100次,統(tǒng)計每個特征參數(shù)被選中的頻率,按照從大到小的順序排列,依次選擇前1~25個參數(shù)進行特征分類。各自排名前10的特征參數(shù)如圖2~圖5所示。
5種特征參數(shù)選擇算法分別依次選擇1~25個參數(shù)的分類結(jié)果對比如圖6所示。其中,當(dāng)參數(shù)個數(shù)為5、10、15、20和25時,各特征參數(shù)選擇算法的分類正確率如表1所示。由圖6和表1可知,采用相關(guān)系數(shù)法進行特征參數(shù)篩選時,分類結(jié)果的正確率隨著特征參數(shù)數(shù)量的增加呈上升趨勢。采用ga、aga、saga以及asaga等優(yōu)化算法的結(jié)果總體呈現(xiàn)先上升后下降的趨勢,造成這種現(xiàn)象的原因可以歸結(jié)為:當(dāng)參與建模的參數(shù)過多時,出現(xiàn)了過擬合現(xiàn)象,使得模型的分類誤差增加,分類正確率降低。另一方面也說明優(yōu)化算法可以從所有特征參數(shù)中篩選出少量的最適應(yīng)建模的特征參數(shù)組合。由圖6可知,ga、aga以及saga在特征參數(shù)選擇的效果上差別較小,篩選出的最佳特征組合的特征維數(shù)與分類正確率也較為接近。相對于其它四種算法,本發(fā)明所提出的asaga算法的特征篩選效果最優(yōu),當(dāng)特征參數(shù)維數(shù)為10時,分類正確率最高,達到92%。
表1各特特征參數(shù)選擇算法在不同特征維數(shù)下的分類正確率對比
以上所述,僅為本發(fā)明較佳的具體實施方式,這些具體實施方式都是基于本發(fā)明整體構(gòu)思下的不同實現(xiàn)方式,而且本發(fā)明的保護范圍并不局限于此,任何熟悉本技術(shù)領(lǐng)域的技術(shù)人員在本發(fā)明揭露的技術(shù)范圍內(nèi),可輕易想到的變化或替換,都應(yīng)涵蓋在本發(fā)明的保護范圍之內(nèi)。因此,本發(fā)明的保護范圍應(yīng)該以權(quán)利要求書的保護范圍為準。