一種基于自適應熵投影聚類算法的fMRI特征提取及分類方法
【技術領域】
[0001] 本發(fā)明涉及一種腦功能核磁共振成像(functional Magnetic Resonance Imaging,fMRI)的自動處理與分類方法,具體涉及一種基于自適應j:商投影聚類算法的fMRI 特征提取及分類方法,該方法涉及數(shù)字圖像處理、動態(tài)功能連接矩陣、自適應熵的投影聚類 算法(Adaptive Entropy Algorithm for Projective Clustering,AEPC)和支持向量機 (Support Vector Machine,SVM)等知識領域。 技術背景
[0002] 近年來,隨著科學技術的不斷發(fā)展,觀測大腦活動的設備和儀器不斷增多,無創(chuàng)的 腦功能活動測量方法極大地促進了腦神經(jīng)功能學的發(fā)展。目前用于研宄腦活動的途徑主要 有:腦磁圖(MEG)、腦電圖(EEG)、單光子發(fā)射斷層掃描(SPECT)、電子發(fā)射斷層掃描(PET)、 功能磁共振成像(fMRI)等。其中fMRI因其時空分辨率較高、具有準確定位激活腦區(qū)的能 力、采用無創(chuàng)非侵入式測量方式,成為目前最常用、最有效的測量手段。
[0003] 目前靜息態(tài)fMRI已被廣泛應用于生物信息技術、材料科學等領域。然而針對生物 組織和生物活體的腦部功能與活動等一些非穩(wěn)態(tài)特征的腦部狀態(tài),研宄者正逐步從關注傳 統(tǒng)的穩(wěn)態(tài)功能連接轉(zhuǎn)為關注腦區(qū)間的動態(tài)功能連接。動態(tài)功能連接矩陣揭示了不同時間片 段腦區(qū)間的活動狀況,為處理腦部數(shù)據(jù)提供了更豐富的腦部信息。
[0004] 非監(jiān)督學習方法以自適應的方式對高維無標記數(shù)據(jù)進行分類,動態(tài)功能連接矩陣 正是無標記的高維數(shù)據(jù)集,所以非監(jiān)督學習方法適用于分析高維的腦部數(shù)據(jù)。聚類作為一 種常用的非監(jiān)督學習方法,可以簡化計算、加快收斂速度。受"維度效應"的影響,傳統(tǒng)聚類 方法在對高維數(shù)據(jù)進行聚類時,較之在低維數(shù)據(jù)的表現(xiàn),其性能往往大為降低,聚類精度大 幅度下降。投影聚類算法為高維數(shù)據(jù)聚類的主要方法,但傳統(tǒng)的投影聚類算法大多要求預 設一些重要參數(shù),也未能考慮聚類中心投影子空間的優(yōu)化問題。
[0005] 為此,本發(fā)明應用了一種改進的優(yōu)化目標函數(shù),在聚類中心內(nèi)緊湊度最小化的同 時,優(yōu)化每個聚類中心所在的子空間。這種方法能有效地降低無關或冗余屬性對聚類的影 響,從而提升算法對高維數(shù)據(jù)的聚類能力,獲得高質(zhì)量的聚類結(jié)果,有利于提取精確的數(shù)據(jù) 特征應用于腦部狀態(tài)的分類中。
【發(fā)明內(nèi)容】
[0006] 1.發(fā)明要解決的技術問題
[0007] 本發(fā)明針對fMRI數(shù)據(jù)特征提取與識別問題,提出一種基于自適應熵投影聚類算 法的fMRI特征提取及分類方法,解決了在針對高維的動態(tài)功能連接矩陣數(shù)據(jù)聚類識別時, 使用傳統(tǒng)聚類方法聚類效果不佳以及受操作者主觀因素影響的問題。更為重要的是,本發(fā) 明解決了傳統(tǒng)方法無法選擇出最優(yōu)聚類結(jié)果的問題,可有效得出最優(yōu)聚類中心作為特征。 用該方法提取腦部數(shù)據(jù)特征應用于腦部狀態(tài)的分類與識別中,避免了對時序性的考慮,物 理意義明確,能較好地揭示靜息態(tài)fMRI數(shù)據(jù)的內(nèi)部結(jié)構(gòu)和規(guī)律。
[0008] 2.技術方案
[0009] 首先利用滑動時間窗方法構(gòu)建動態(tài)功能連接矩陣,然后用AEPC方法對動態(tài)功能 連接矩陣進行聚類,計算每個試驗參與者的功能連接矩陣與每個聚類中心的相似性,最后 提取相似性矩陣的元素作為特征,訓練SVM分類器進行分類。
[0010] 本發(fā)明具體內(nèi)容、流程如圖1所示,當目標為甲、乙兩類(如成人和兒童、醉酒和清 醒、悲傷與喜悅、撒謊與未撒謊等)時,實現(xiàn)步驟如下:
[0011] (1)對獲取到的a組甲類試驗參與者和b組乙類試驗參與者的靜息態(tài)fMRI試驗數(shù) 據(jù)進行預處理,消除外界干擾信號并將所有試驗參與者的數(shù)據(jù)標準化到統(tǒng)一的時間和空間 域;所述的預處理過程通過SPM8軟件實現(xiàn),預處理過程包括頭動校正,時間層校準,空間標 準化和空間平滑等步驟;
[0012] (2)預處理后的fMRI數(shù)據(jù),對照解剖學標簽模板(本發(fā)明選用Anatomical Automatic Labeling,AAL)將除去小腦部分的區(qū)域劃分成90個功能腦區(qū),并求取單個腦 區(qū)的各體素的平均時間序列hu= Ihlbl, hu,2, ...,hu, J,其中1為時間長度,u為腦區(qū)標號 (I < u < 90),hu, i為第u個腦區(qū)的體素在時間1上的灰度值,于是有全腦90個腦區(qū)的全 腦時間序列H = Oi1, h2,--h90};
[0013] (3)利用滑動時間窗方法(見圖2說明),將原始長度為1的時間序列, 通過設定單個滑動窗口大小r及相對應的步長V,劃分為m個有重疊的窗口序列
【主權(quán)項】
1. 一種基于自適應熵投影聚類算法的fMRI特征提取及分類方法,包括如下步驟: (1) 對獲取到的靜息態(tài)fMRI數(shù)據(jù)進行預處理,消除外界干擾信號并將所有采集到的實 驗數(shù)據(jù)標準化到統(tǒng)一的時間和空間域;所述的預處理過程通過SPM8軟件實現(xiàn),包括時間層 校準,頭動校正,空間標準化和空間平滑; (2) 構(gòu)建甲類功能連接矩陣A,乙類功能連接矩陣B; (3) 構(gòu)建甲類動態(tài)功能連接矩陣Da,乙類動態(tài)功能連接矩陣Db; (4) 對甲類動態(tài)功能連接矩陣和乙類動態(tài)功能連接矩陣分別進行聚類,形成兩組聚類 中心S,Rb; (5) 構(gòu)建甲類試驗參與者的相似性矩陣Ga,乙類試驗參與者的相似性矩陣Gb; (6) 提取匕中aXk元素作為甲類試驗參與者的特征,并提取Gb中bXk元素作為乙類 試驗參與者的特征,訓練SVM分類器,用于識別甲、乙兩類腦部狀態(tài)。
2. 根據(jù)權(quán)利要求1所述的一種基于自適應熵投影聚類算法的fMRI特征提取及分類方 法,其特征在于,所述步驟(2)中的構(gòu)成功能連接矩陣是指:預處理后的圖像,對照解剖學 標簽模板(AnatomicalAutomaticLabeling,AAL),獲取90個腦區(qū)的平均體素時間序列,求 取各腦區(qū)間的皮爾遜相關系數(shù),則甲類有a個90X90的功能連接矩陣A,乙類有b個90X90 的功能連接矩陣B。
3. 根據(jù)權(quán)利要求1所述的一種基于自適應熵投影聚類算法的fMRI特征提取及分類方 法,其特征在于,所述步驟(3)中的構(gòu)成動態(tài)功能連接矩陣是指:設定時間序列總長度為1, 單個滑動窗口大小為r,滑動步長為V,則m=h表示由時間序列1劃分得到的滑動窗口 V 個數(shù)m,每個滑動窗口為一個90X90的矩陣,每個試驗參與者有m個90X90動態(tài)功能連接 矩陣,故甲類試驗參與者有aXm個90X90的動態(tài)功能連接矩陣,乙類試驗參與者bXm個 90X90的動態(tài)功能連接矩陣。
4. 根據(jù)權(quán)利要求1所述的一種基于自適應熵投影聚類算法的fMRI特征提取及分類方 法,其特征在于,所述步驟(4)中的聚類中心SjPRb是指:提出一種自適應熵的投影聚類算 法,即AEPC,對aXm個甲類試驗參與者的動態(tài)功能連接矩陣采用AEPC進行聚類,形成k個 90X90的矩陣,聚類中心矩陣表示為Sa;對bXm個乙類試驗參與者的動態(tài)功能連接矩陣用 AEPC聚類,也形成k個90X90的矩陣,聚類中心矩陣表示為Rb。
5. 根據(jù)權(quán)利要求1所述的一種基于自適應熵投影聚類算法的fMRI特征提取及分類方 法,其特征在于,所屬步驟(5)中的相似性矩陣GjPGb是指:計算每個甲類試驗參與者的功 能連接矩陣與每個甲類試驗參與者聚類中心&之間的歐式距離,形成相似性矩陣Ga;計算 每個乙類試驗參與者的功能連接矩陣與每個乙類試驗參與者聚類中心Rb之間的歐式距離, 形成相似性矩陣Gb。
【專利摘要】本發(fā)明公開了一種基于自適應熵投影聚類算法的fMRI特征提取及分類方法。該方法首先采用滑動時間窗方法構(gòu)建動態(tài)功能連接矩陣,然后運用自適應熵的投影聚類算法(Adaptive Entropy Algorithm for Projective Clustering,AEPC)分別對甲類和乙類試驗參與者的動態(tài)功能連接矩陣聚類,形成多個聚類中心,隨后計算每個試驗參與者的功能連接矩陣與每個聚類中心的相似性構(gòu)成相似性矩陣,最后提取相似性矩陣中的元素作為特征,訓練SVM分類器對腦部數(shù)據(jù)進行分類。本發(fā)明不僅提高了數(shù)據(jù)分類模型的泛化能力,而且可以提取豐富的腦部動態(tài)結(jié)構(gòu)信息,并可應用于生物信息技術的研究中自動處理與分類腦部數(shù)據(jù)。
【IPC分類】G06K9-46, G06K9-62
【公開號】CN104700120
【申請?zhí)枴緾N201510132205
【發(fā)明人】梅雪, 李微微, 馬士林, 黃嘉爽
【申請人】南京工業(yè)大學
【公開日】2015年6月10日
【申請日】2015年3月23日