本發(fā)明提供一種用于優(yōu)化選取腦卒中相關(guān)生物標(biāo)志物的方法,是一種基于互信息分析-主成分分析-二級支持向量機(jī)的腦卒中生物標(biāo)志物優(yōu)化選取方法,屬于生物醫(yī)學(xué)工程領(lǐng)域。
背景技術(shù):
腦卒中對人的健康及生命影響十分嚴(yán)重,以其高發(fā)病率、高病死率、高致殘率對人類健康構(gòu)成巨大威脅,已成為全球第二大常見死因。腦卒中檢測手段困難,目前腦血管病患者的常規(guī)檢測項(xiàng)目有:
a)主要為血壓、心電圖、眼底檢查、血常規(guī)、尿常規(guī)、血脂、血糖、血液流變學(xué)、血
同型半胱氨酸、抗磷脂抗體等常規(guī)檢測后;
b)腦血管病患者進(jìn)一步行輔助檢查,包括:經(jīng)顱多普勒超聲、頸動脈超聲、顱腦CT(包
括CT、CTA、CTV、CTP)、MRI、MRA等;
c)進(jìn)一步創(chuàng)性檢查:DSA及介入治療。
但是這些方法都存在困難,導(dǎo)致它們不能完全適應(yīng)于目前的臨床檢測。
神經(jīng)生化檢測在腦卒中的作用越來越受到重視,人們期望通過生化指標(biāo)來協(xié)助腦卒中的早期診斷,并作出評價(jià)。近年來,隨著臨床檢驗(yàn)醫(yī)學(xué)的快速發(fā)展與研究的深入,許多新的檢測項(xiàng)目(特別是一些生化標(biāo)志物)的相繼問世,檢驗(yàn)方法也不斷更新與改進(jìn),極大地促進(jìn)了臨床腦卒中的實(shí)驗(yàn)診斷的革命。生化標(biāo)志物在腦卒中的早期診斷、治療、病情監(jiān)測及估計(jì)病人的預(yù)后等方面發(fā)揮著越來越重要的作用。
傳統(tǒng)的大分子標(biāo)志物(大分子蛋白,抗原,激素等)是以抗體為基礎(chǔ)進(jìn)行免疫組化或蛋白質(zhì)印跡檢測,靈敏度低,操作復(fù)雜,并且抗體制備困難;基因標(biāo)志物主要用逆轉(zhuǎn)錄-多聚酶鏈反應(yīng)進(jìn)行檢測,靈敏度雖然高,但是操作中容易有交叉污染,導(dǎo)致假陽性的出現(xiàn)。對于腦卒中,現(xiàn)在還沒有單一,有效的生物標(biāo)志物,必須將集中生物標(biāo)志物結(jié)合起來才能更全面地認(rèn)識和了解腦卒中,發(fā)揮它的臨床作用。當(dāng)前,在做生化檢測時(shí),往往為了全面了解疾病,會做許多標(biāo)志物的檢測,然而有些生物標(biāo)志物的檢測是沒有必要的,同時(shí)有些生物標(biāo)志物之間會有信息的重疊,造成信息量的冗余。
技術(shù)實(shí)現(xiàn)要素:
1.目的:本發(fā)明專利的目的是提供一種用于優(yōu)化選取腦卒中相關(guān)生物標(biāo)志物的方法,它通過選取出的腦卒中生物標(biāo)志物可以很好的對腦卒中進(jìn)行預(yù)判診斷,減少了腦卒中生化檢測過程中信息的冗余浪費(fèi),并且提高了檢測的準(zhǔn)確度。
2.技術(shù)方案:
本發(fā)明是一種用于優(yōu)化選取腦卒中相關(guān)生物標(biāo)志物的方法,它主要分為兩個(gè)環(huán)節(jié),考慮到腦卒中存在有出血性腦卒中和缺血性腦卒中兩種情況,在進(jìn)行診斷時(shí)要進(jìn)行區(qū)分,所以把腦卒中相關(guān)生物標(biāo)志物的優(yōu)化選取過程分為兩個(gè)環(huán)節(jié)。第一個(gè)環(huán)節(jié)是診斷患者是否患有腦卒中,第二個(gè)環(huán)節(jié)區(qū)分得有腦卒中的患者患的是哪一種腦卒中。在每個(gè)環(huán)節(jié)中,先通過互信息分析,分別分析出和患病與否,患哪種腦卒中的互信息值,并以此為進(jìn)行篩選。再運(yùn)用主成分分析,減少信息的冗余,最后用支持向量機(jī)的方法對篩選出的生物標(biāo)志物進(jìn)行調(diào)整修正,來完成整個(gè)優(yōu)化選取過程。
本發(fā)明專利設(shè)計(jì)了一種用于優(yōu)化選取腦卒中生物標(biāo)志物的方法,該方法具體步驟包括:
步驟1,讀入含有多種生化檢測出的生物標(biāo)志物的濃度的個(gè)體數(shù)據(jù),將各組輸入量按照是否患腦卒中定義為1和0,分別計(jì)算各個(gè)生物標(biāo)志物濃度和患病與否的互信息值,并對互信息值進(jìn)行排序;
步驟2,選擇步驟1中互信息值較大的幾個(gè)生物標(biāo)志物信息,對他們進(jìn)行主成分分析,選取累計(jì)方差貢獻(xiàn)率超過80%的幾個(gè)主成分;
步驟3,按照主成分分析過程中得出的線性組合公式,分別計(jì)算選取出的主成分的值作為計(jì)算的輸入量;
步驟4,將含有多種生物標(biāo)志物信息的個(gè)體進(jìn)行分類,四分之三個(gè)體數(shù)據(jù)作為訓(xùn)練集,四分之一作為驗(yàn)證集;將步驟3中選取出的主成分結(jié)果輸入支持向量機(jī)之中,訓(xùn)練集先對支持向量機(jī)進(jìn)行學(xué)習(xí)訓(xùn)練,再通過驗(yàn)證集對患病與否作判斷;通過檢測預(yù)測結(jié)果的靈敏度和特異性來評估所選取的生物標(biāo)志物以及主成分分析是否合適;
步驟5,如果檢測的結(jié)果較差,即靈敏度和特異性都較低,則返回到步驟1,重新選取互信息值較大的生物標(biāo)志物,再按照以上步驟進(jìn)行,直到靈敏度和特異性都達(dá)到工程要求。
步驟6,將前五步輸入數(shù)據(jù)中的正常人數(shù)據(jù)進(jìn)行剔除,再將出血性腦卒中患者定義為2,缺血性腦卒中定義為3;分別計(jì)算各個(gè)生物標(biāo)志物濃度和患兩種病的互信息值,并對互信息值進(jìn)行排序;
步驟7,選擇步驟6中互信息值較大的幾個(gè)生物標(biāo)志物信息,對他們進(jìn)行主成分分析,選取累計(jì)方差貢獻(xiàn)率超過80%的幾個(gè)主成分;
步驟8,將去除正常人后的個(gè)體信息進(jìn)行分類,四分之三個(gè)體數(shù)據(jù)作為訓(xùn)練集,四分之一作為驗(yàn)證集;將步驟7中選取出的可以區(qū)分兩種腦卒中的主成分結(jié)果輸入支持向量機(jī)之中;支持向量機(jī)先通過訓(xùn)練集進(jìn)行學(xué)習(xí)訓(xùn)練,再通過驗(yàn)證集對兩種病進(jìn)行區(qū)分;通過對兩種病區(qū)分結(jié)果的靈敏度和特異性來評估所選取的生物標(biāo)志物以及主成分分析是否合適;
步驟9,如果檢測的結(jié)果較差,即靈敏度和特異性都較低,則返回到步驟6,重新選取互信息值較大的生物標(biāo)志物,重復(fù)步驟6~8,直到靈敏度和特異性都達(dá)到工程要求;這樣最終輸出的結(jié)果就是能夠?qū)⒄H?、缺血性腦卒中患者、出血性腦卒中患者區(qū)分開生物標(biāo)志物選取組合方式。
3、優(yōu)點(diǎn)及功效:
本發(fā)明一種用于優(yōu)化選取腦卒中相關(guān)生物標(biāo)志物的方法,具有以下幾個(gè)優(yōu)點(diǎn):
(1)本發(fā)明通過兩個(gè)步驟對腦卒中生物標(biāo)志物進(jìn)行選取組合,減少了信息的冗余浪費(fèi),同時(shí)通過了支持向量機(jī)的檢驗(yàn),實(shí)現(xiàn)了對選取結(jié)果的修正,實(shí)現(xiàn)了通過選取出生物標(biāo)志物信息可以實(shí)現(xiàn)腦卒中的診斷。
(2)本發(fā)明減少了生化檢測的種類項(xiàng)目,降低了診斷成本,提高了診斷的正確率,同時(shí)可以實(shí)現(xiàn)腦卒中風(fēng)險(xiǎn)的預(yù)判,保護(hù)生命財(cái)產(chǎn)安全。
(3)本發(fā)明提供了一種處理生物信息的普遍手段,對于其他疾病的生物標(biāo)志物信息可以使用同樣的方法進(jìn)行優(yōu)化選取,是一種普適的方法。針對一些要通過多種生化檢測來進(jìn)行診斷的疾病,比方說乳腺癌,肺癌等,生物標(biāo)志物信息有著很大作用,可以使用同種方法進(jìn)行處理來提高斷的靈敏度和特異性。
附圖說明
圖1是本發(fā)明的流程框圖。
具體實(shí)施方式
下面結(jié)合附圖和實(shí)施例,對本發(fā)明的技術(shù)方案做進(jìn)一步的說明。
見圖1所示,本發(fā)明一種用于優(yōu)化選取腦卒中生物標(biāo)志物的方法,該方法具體步驟包括:
步驟1,將從合作單位獲取的就診者生物標(biāo)志物信息輸入,共計(jì)24種生物標(biāo)志物信息。將各組輸入量按照是否患腦卒中定義為1和0,分別計(jì)算各個(gè)生物標(biāo)志物濃度和患病與否的互信息值,并對互信息值進(jìn)行排序;
步驟2,通過互信息值的排序,我們篩選出尿酸,血漿纖維蛋白原等12種相關(guān)性大的生物標(biāo)志物,對他們進(jìn)行主成分分析。通過選取累計(jì)方差貢獻(xiàn)率超過80%的主成分,我們選出了6個(gè)綜合指標(biāo);
步驟3,按照主成分分析過程中得出的線性組合公式,分別計(jì)算選取出的主成分的值作為計(jì)算的輸入量;
步驟4,將含有多種生物標(biāo)志物信息的個(gè)體進(jìn)行分類,將四分之三數(shù)據(jù)作為訓(xùn)練集,四分之一數(shù)據(jù)作為驗(yàn)證集;將步驟3選取出的主成分結(jié)果輸入支持向量機(jī)之中,選擇徑向基函數(shù)作為核函數(shù),通過交叉驗(yàn)證的方法找到最合適的懲罰參數(shù)和核函數(shù)參數(shù)。訓(xùn)練集先對支持向量機(jī)進(jìn)行學(xué)習(xí)訓(xùn)練,再通過驗(yàn)證集對患病與否的判斷;通過檢測預(yù)測結(jié)果的靈敏度和特異性來評估所選取的生物標(biāo)志物以及主成分分析是否合適;
步驟5,如果檢測的結(jié)果較差,即靈敏度和特異性都較低,則返回到步驟1,重新選取互信息值較大的生物標(biāo)志物,再按照以上步驟進(jìn)行,直到靈敏度和特異性都達(dá)到工程要求。通過實(shí)驗(yàn),發(fā)現(xiàn)選出的6個(gè)主成分可以很好的區(qū)分正常人和病人,靈敏度和特異性都達(dá)到了100%。
步驟6,將前五步輸入數(shù)據(jù)中的正常人數(shù)據(jù)進(jìn)行剔除,再將出血性腦卒中患者定義為2,缺血性腦卒中定義為3;分別計(jì)算各個(gè)生物標(biāo)志物濃度和患兩種病的互信息值,并對互信息值進(jìn)行排序;
步驟7,由于出血性腦卒中和缺血性腦卒中在生物標(biāo)志物信息上區(qū)分較小,不同于前一環(huán)節(jié),選出了同型半胱氨酸,C反應(yīng)蛋白等6種生物標(biāo)志物,對他們進(jìn)行主成分分析,選取累計(jì)方差貢獻(xiàn)率超過80%的幾個(gè)主成分,最終選擇出三個(gè)主成分;
步驟8,將已有患有腦卒中患者的數(shù)據(jù)進(jìn)行分類,四分之三數(shù)據(jù)作為訓(xùn)練集,四分之一作為驗(yàn)證集;將步驟7選取出的可以區(qū)分兩種腦卒中的主成分結(jié)果輸入支持向量機(jī)之中,選擇徑向基函數(shù)作為核函數(shù),通過交叉驗(yàn)證的方法找到最合適的懲罰參數(shù)和核函數(shù)參數(shù);支持向量機(jī)先通過訓(xùn)練集進(jìn)行學(xué)習(xí)訓(xùn)練,再通過驗(yàn)證集對兩種病的區(qū)分;通過對兩種病區(qū)分結(jié)果的靈敏度和特異性來評估所選取的生物標(biāo)志物以及主成分分析是否合適;
步驟9,如果檢測的結(jié)果較差,即靈敏度和特異性都較低,則返回到步驟6,重新選取互信息值較大的生物標(biāo)志物,再重復(fù)步驟6~8,直到靈敏度和特異性都達(dá)到工程要求。最終實(shí)驗(yàn)結(jié)果可以較好的把出血性腦卒中患者和缺血性腦卒中患者區(qū)分開,靈敏度和特異性都達(dá)到了80%以上,得到了較好的效果。