專利名稱:基于量子遺傳優(yōu)化的流形降維醫(yī)學(xué)圖像檢索方法
技術(shù)領(lǐng)域:
本發(fā)明涉及的是一種圖像的檢索方法,特別是一種屬于醫(yī)學(xué)圖像的檢索方 法。具體涉及一種基于量子遺傳優(yōu)化的流形降維醫(yī)學(xué)圖像檢索方法。
(二)
背景技術(shù):
隨著醫(yī)學(xué)影像設(shè)備的不斷發(fā)展,臨床上產(chǎn)生的多種模態(tài)的醫(yī)學(xué)影像數(shù)據(jù)越來(lái) 越多,對(duì)影像內(nèi)容的描述也變得越來(lái)越豐富,產(chǎn)生的特征數(shù)據(jù)集的維數(shù)也隨之不 斷增高。在基于內(nèi)容的醫(yī)學(xué)圖像檢索(Content-based Medical Image Retrieval, CBMIR)中,對(duì)醫(yī)學(xué)影像內(nèi)容的描述通常用特征向量的形式來(lái)表示,為了盡可 能準(zhǔn)確、全面地描述圖像信息,這些特征向量往往是從圖像中抽取出來(lái)的幾十維 甚至上百維的高維特征向量,這對(duì)數(shù)據(jù)庫(kù)的組織、索引、基于距離函數(shù)的相似性 度量以及檢索都是很大的挑戰(zhàn),即所謂的維數(shù)災(zāi)難。事實(shí)上,對(duì)于某一特定的高 維特征向量集合,以及它們所張成的高維空間,這些高維向量的重要程度是不同 的,其間仍然存在著很大的冗余。因此,通過(guò)降維技術(shù)去除次要信息的特征向量 以及相關(guān)性較強(qiáng)的特征向量,并保持其內(nèi)在結(jié)構(gòu)是CBMIR研究的關(guān)鍵問(wèn)題之一。
流形學(xué)習(xí)是一種非線性的維數(shù)縮減方法,它的本質(zhì)是將高維空間中的數(shù)據(jù)映 射到一個(gè)低維的非線性子空間(即低維流形),從而實(shí)現(xiàn)降維。局部線性嵌入 (locally linear embedding, LLE)算法是S.T.Roweis和L.K.Saul.在2000年提出的 一種非線性流形降維方法,其用于醫(yī)學(xué)圖像特征降維的基本思想是利用局部線性 重建反映高維數(shù)據(jù)空間中的非線性結(jié)果,使降維后的數(shù)據(jù)保持原始空間的拓?fù)浣Y(jié) 構(gòu)。傳統(tǒng)局部線性嵌入-LLE算法中最核心的問(wèn)題是求取使重建誤差最小的近鄰 局部重建權(quán)值矩陣。然而,該算法是針對(duì)局部數(shù)據(jù)進(jìn)行操作,而大多數(shù)的研究者 都采用與歐氏距離有關(guān)的變量來(lái)定義該權(quán)值矩陣,默認(rèn)距離近的點(diǎn)相互影響大而 距離遠(yuǎn)的點(diǎn)間影響小,這使得該算法對(duì)樣本中的噪音很敏感,此外該算法收斂速 度不夠快。
量子遺傳算法(Quantum Genetic Algorithm, QGA)是量子計(jì)算(Quantum Computing)與遺傳算法(Genetic Algorithm, GA)相結(jié)合的產(chǎn)物。以量子計(jì)算的概念和理論為基礎(chǔ),用量子位編碼表征染色體,通過(guò)量子門(mén)旋轉(zhuǎn)更新來(lái)完成進(jìn) 化搜索,能夠表示出解的線性疊加態(tài),獲得更好的種群多樣性、更快的收斂速度 和全局尋優(yōu)的能力。但到目前為止,還沒(méi)有人將該算法應(yīng)用于局部線性嵌入降維 的優(yōu)化方面。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種可以降低噪聲點(diǎn)對(duì)樣本數(shù)據(jù)的影響,提高運(yùn)行速 度的基于量子遺傳優(yōu)化的流形降維醫(yī)學(xué)圖像檢索方法。 本發(fā)明的目的是這樣實(shí)現(xiàn)的
1、 提出査詢請(qǐng)求首先由用戶通過(guò)査詢接口向醫(yī)學(xué)圖像數(shù)據(jù)庫(kù)提出査詢目 標(biāo)圖像的查詢請(qǐng)求,所述的醫(yī)學(xué)圖像數(shù)據(jù)庫(kù)是圖像入庫(kù)時(shí),將各序列的關(guān)鍵圖像 統(tǒng)一轉(zhuǎn)換為512X512大小的JPG格式圖像構(gòu)成醫(yī)學(xué)圖像數(shù)據(jù)庫(kù);
2、 提取高維醫(yī)學(xué)圖像特征查詢處理模塊根據(jù)請(qǐng)求提取目標(biāo)圖像和醫(yī)學(xué)圖 像數(shù)據(jù)庫(kù)中每幅圖像的72維灰度特征和48維紋理特征,將這些高維特征以向量 的形式存入高維特征向量庫(kù);
3、 基于量子遺傳優(yōu)化的降維對(duì)描述圖像內(nèi)容的高維特征進(jìn)行基于量子遺 傳優(yōu)化的降維,得到32維低維特征子集;
4、 相似性度量通過(guò)相似性度量將檢索結(jié)果返回給用戶。 本發(fā)明還可以包括
1、所述的基于量子遺傳優(yōu)化的降維的方法為
(1) 醫(yī)學(xué)圖像特征向量高維空間/^中的W個(gè)Z)維隨機(jī)向量",X2,…;cJ, x^iT,通過(guò)降維把它們映射到低維空間^中,得到降維后的輸出向量乂 ,
e [1, W] , d《Z);
計(jì)算每一個(gè)樣本點(diǎn)即特征向量jc,的;t個(gè)最近鄰點(diǎn);對(duì)高維空間中的樣本點(diǎn);c,, 計(jì)算該點(diǎn)與其他W-1個(gè)樣本點(diǎn)之間的距離,將距離排序,選擇前A:個(gè)與x,最近 的點(diǎn)作為其鄰近點(diǎn);
(2) 由每個(gè)樣本點(diǎn)的近鄰點(diǎn)計(jì)算出該樣本點(diǎn)的局部重建權(quán)值矩陣『;用每 個(gè)特征向量的近鄰點(diǎn)對(duì)該特征向量進(jìn)行重建,求取使重建誤差最小的近鄰局部重 建權(quán)值矩陣^。
G)保持上步求取的權(quán)值『不變,求Xi在低維嵌入空間的輸出特征向量y,;為了使輸出數(shù)據(jù)在低維空間保持高維空間原有的拓?fù)浣Y(jié)構(gòu)需構(gòu)造一個(gè)代價(jià)函數(shù), 映射過(guò)程中必須使代價(jià)函數(shù)值達(dá)到最小,該函數(shù)形式為
'=1 7 = 1
其中,y,是x,的輸出向量,乂, 01,2,…,"是》,,的A個(gè)近鄰點(diǎn); 為使低維重構(gòu)誤差最小化同樣也要滿足兩個(gè)約束條件 1) Y,是一個(gè)平移不變量,即^.=0;
2 )為了避免產(chǎn)生退化解需使= / ,其中N是數(shù)據(jù)點(diǎn)的個(gè)數(shù),/是"xd 的單位矩陣;
對(duì)e(r)進(jìn)行求解,求取的最優(yōu)解^可以使得代價(jià)函數(shù)sO0達(dá)到最小值;
構(gòu)造一個(gè)WxW的稀疏矩陣『,W,(:1,2,…,7V)可以存儲(chǔ)在其中,當(dāng)、是;c,的
近鄰點(diǎn)時(shí),R;=W .,否則,^,,=0。 此時(shí)誤差代價(jià)函數(shù)式可改寫(xiě)為
其中,M—M,.,)是一個(gè)WxW的對(duì)稱矩陣,其表達(dá)式為
似=(/一『/(/一『)
利用Lagrange乘子法轉(zhuǎn)化為在丄^X =/條件下的特征值和特征向量的問(wèn)
題(M-八)77'=0,艮卩Ma"";
要最小化代價(jià)函數(shù),則取M的最小d個(gè)特征值對(duì)應(yīng)的向量為列向量組成矩
陣y,則r的列向量即為"維空間的降維向量表示。
2、所述的求取使重建誤差最小的近鄰局部重建權(quán)值矩陣的方法為
1) 初始化種群初始化醫(yī)學(xué)圖像特征高維向量中包含7V個(gè)個(gè)體的種群
其中《C/、l,2,…A0為種群中第f代的第J個(gè)個(gè)體,種群中
全部染色體的所有基因a、 e都被初始化為1/W,這意味著一個(gè)染色體所表達(dá) 的是其全部可能狀態(tài)的等概率疊加;
2) 對(duì)種群中的個(gè)體進(jìn)行測(cè)量對(duì)初始種群中的個(gè)體進(jìn)行一次測(cè)量以獲得一組確定的解尸。={",其中《(_/ = l,...,AO是第f代種群中的第j個(gè)
個(gè)體的測(cè)量值,其表現(xiàn)形式為量子為數(shù)目即染色體長(zhǎng)度為附的二進(jìn)制字符串; 其中每-"位為0或1是根據(jù)量子比特的概率| ,(|2或|/ /|2 (/ = 1,...,附)測(cè)量得到的;
具體實(shí)現(xiàn)方法為隨機(jī)產(chǎn)生[o,i]上的一個(gè)數(shù)e,若^>|";|2,則"中相應(yīng)的位取
值為1,否則取值為0;
3) 評(píng)價(jià)二進(jìn)制染色體種群p(r)并保留最優(yōu)解用適應(yīng)度評(píng)價(jià)函數(shù)評(píng)價(jià)種群
尸(r)中每個(gè)染色體,并保留此代中的最優(yōu)解;如算法獲得滿意解,算法停止; 否則,轉(zhuǎn)入步驟4)繼續(xù)進(jìn)行;
4) 量子遺傳操作使用量子旋轉(zhuǎn)門(mén)f/②更新P(r);
5) 改變進(jìn)化代數(shù)進(jìn)化代數(shù)加1,如仍未滿足最大進(jìn)化代數(shù)rm^,算法轉(zhuǎn)
至歩驟2)繼續(xù)進(jìn)行。
3、 所述的相似性度量的方法為直方圖的交,
假設(shè)/和2是兩個(gè)含有W個(gè)biri的顏色直方圖,則它們之間的相交距離用下 式表示
|>11(/" 2》
產(chǎn)l
直方圖的相交是指兩個(gè)直方圖在每個(gè)bin中共有的像素?cái)?shù)量;有時(shí),該值還 可以通過(guò)除以其中一個(gè)直方圖中所有的像素?cái)?shù)量來(lái)實(shí)現(xiàn)標(biāo)準(zhǔn)化,從而使其值處于的值域范圍,如下式所示
s(/,e)《min(/^)/i:;x
4、 所述的相似性度量的方法為余弦距離法-
s(/,e)=/7'*2/(imi*iieii)
其中,I和Q分別表示查詢圖像和數(shù)據(jù)庫(kù)中圖像的特征向量,ih哮示向量范數(shù),
計(jì)算得到的相似性度量值在[o, l]之間,該值越大,表示圖像越相似。
5、 所述的相似性度量的方法,對(duì)于組合特征,相似性度量定義為各個(gè)特征 相似性度量的加權(quán)和,其公式為<formula>formula see original document page 10</formula>表示由m個(gè)特征組合而成,其中^表示第7'個(gè) 特征的權(quán)重系數(shù),它表示第y個(gè)特征的重要性, 一般取各,相等,又S,(/,0表
示第/個(gè)特征的相似性度量函數(shù)值。
本發(fā)明將量子遺傳算法應(yīng)用于局部線性嵌入降維的優(yōu)化。 局部線性嵌入(LLE)方法
LLE算法有一個(gè)前提假設(shè)采樣數(shù)據(jù)所在的低維流形在局部是線性的,即每 個(gè)采樣點(diǎn)可以用它的近鄰點(diǎn)線性表示。
該算法的學(xué)習(xí)目標(biāo)是在低維空間中保持每個(gè)鄰域中的權(quán)值不變,即假設(shè)嵌 入映射在局部是線性的條件下,最小化重構(gòu)誤差。
設(shè)有高維空間i D中的TV個(gè)D維隨機(jī)向量",X2,…xJ ,通過(guò)降維把它們映射 到低維空間W中,得到降維后的輸出向量乂, , = 1,2,…,W, "<<Z)。通常希望能 夠用顯示的映射F來(lái)表示,但當(dāng)U》是非線性結(jié)構(gòu)時(shí),求出顯示映射P相當(dāng)困難。 基于流形學(xué)習(xí)的原理,可以將非線性結(jié)構(gòu)的局部用線性結(jié)構(gòu)來(lái)近似,即可以將非 線性結(jié)構(gòu)的降維分解為局部的線性降維。這就是LLE算法的基本原理,該算法 的主要步驟如下。
(1) 計(jì)算每一個(gè)樣本點(diǎn)(特征向量)x,的k個(gè)最近鄰點(diǎn)。對(duì)高維空間中的樣本 點(diǎn)x,,計(jì)算該點(diǎn)與其他TV- 1個(gè)樣本點(diǎn)之間的距離,將距離排序,選擇前A:個(gè)與x,
最近的點(diǎn)作為其鄰近點(diǎn)。
(2) 由每個(gè)樣本點(diǎn)的近鄰點(diǎn)計(jì)算出該樣本點(diǎn)的局部重建權(quán)值矩陣『。用每個(gè)特 征向量的近鄰點(diǎn)對(duì)該特征向量進(jìn)行重建,求取使重建誤差最小的近鄰局部重建權(quán) 值矩陣。
定義重建擬合誤差函數(shù)如下
<formula>formula see original document page 10</formula>
其中,s(y",2,…,的為;c,的第7個(gè)近鄰點(diǎn),、是x,與x(,之間的權(quán)值在滿足以下
兩個(gè)約束條件時(shí),通過(guò)最小化誤差函數(shù)得到局部重建權(quán)值矩陣,即由樣本點(diǎn)的近 鄰點(diǎn),構(gòu)造出最優(yōu)『矩陣使誤差函數(shù)值達(dá)到最小。
a)每一個(gè)數(shù)據(jù)點(diǎn)《都只能由它的鄰近點(diǎn)來(lái)表示,若x,不是近鄰點(diǎn),則w7 = 0 ;b)權(quán)值矩陣的每一行的和為1,即滿足歸一化約束1^=1。
片1
G)保持權(quán)值『不變,求;c,在低維嵌入空間的輸出特征向量y,。為了使輸出數(shù)
據(jù)在低維空間保持高維空間原有的拓?fù)浣Y(jié)構(gòu)需構(gòu)造一個(gè)代價(jià)函數(shù),映射過(guò)程中必 須使代價(jià)函數(shù)值達(dá)到最小。該函數(shù)形式為-
i>,& ii2
'=1 y=l
其中,y,是 的輸出向量,A(X,2,…力是y,的A個(gè)近鄰點(diǎn)。 為使低維重構(gòu)誤差最小化同樣也要滿足兩個(gè)約束條件
a) y,是一個(gè)平移不變量,即!>,.=0;
b) 為了避免產(chǎn)生退化解需使^f凡少/ = / ,其中W是數(shù)據(jù)點(diǎn)的個(gè)數(shù),/ 是dxd的單位矩陣。
此時(shí),對(duì)s(J0進(jìn)行求解,求取的最優(yōu)解y,可以使得代價(jià)函數(shù)sOO達(dá)到最小值。
構(gòu)造一個(gè)WxW的稀疏矩陣ff , ;(, = 1,2,一^)可以存儲(chǔ)在其中,當(dāng)x,是;c,的近鄰 點(diǎn)時(shí),R, =w ,否則,K,,=0。 此時(shí)誤差代價(jià)函數(shù)式可改寫(xiě)為
/=1 乂=1
其中,似=(似,:,)是一個(gè)7^^的對(duì)稱矩陣,其表達(dá)式為
Af = (/ —『/■(/ —『)
利用Lagmnge乘子法可轉(zhuǎn)化為在丄fx =/條件下的特征值和特征向量的
問(wèn)題(M-A)yr=0,艮卩Mor"or。
要最小化代價(jià)函數(shù),則取M的最小c/個(gè)特征值對(duì)應(yīng)的向量為列向量組成矩 陣y,則F的列向量即為J維空間的降維向量表示。
量子遺傳智能優(yōu)化算法
傳統(tǒng)局部線性嵌入-LLE算法中最核心的問(wèn)題是求取使重建誤差最小的近鄰 局部重建權(quán)值矩陣,然而,該算法是針對(duì)局部進(jìn)行操作,大多數(shù)的研究者都采用與歐氏距離有關(guān)的變量來(lái)定義該權(quán)值矩陣,默認(rèn)距離近的點(diǎn)相互影響大而距離遠(yuǎn) 的點(diǎn)間影響小,這使得該算法對(duì)樣本中的噪音很敏感,此外該算法收斂速度不夠 快。量子遺傳智能優(yōu)化算法建立在量子態(tài)矢量表述基礎(chǔ)上,將量子比特的幾率幅 表示應(yīng)用于染色體的編碼,使得一條染色體可以表達(dá)多個(gè)態(tài)的疊加,并利用量子 旋轉(zhuǎn)門(mén)實(shí)現(xiàn)染色體的更新操作,從而實(shí)現(xiàn)了目標(biāo)的優(yōu)化求解。所以,本發(fā)明利用 量子遺傳算法從數(shù)據(jù)間的本征特性出發(fā),尋找使醫(yī)學(xué)圖像特征向量降維重建誤差 最小的權(quán)重值,從而達(dá)到符合使誤差函數(shù)最小的目的。
本發(fā)明將LLE算法中樣本點(diǎn)與其臨近點(diǎn)的重建權(quán)值集合構(gòu)造為量子遺傳算 法的量子染色體,然后量子遺傳中的個(gè)體在尋優(yōu)的過(guò)程中找到最優(yōu)位置,最終得 到近鄰局部重建權(quán)值矩陣。 (1)量子比特編碼
在量子遺傳算法中,染色體用量子比特來(lái)表示,或者說(shuō)是用隨機(jī)概率方式表 示。量子比特是一個(gè)雙態(tài)量子系統(tǒng),與經(jīng)典位的不同之處在于, 一個(gè)量子比特除 了處于量子位的兩個(gè)基本態(tài)0態(tài)或1態(tài)外,還可以同時(shí)處在O, l兩個(gè)本征態(tài)的迭加 狀態(tài), 一個(gè)量子比特狀態(tài)可以表示為-
其中,"和"表示相應(yīng)態(tài)出現(xiàn)的概率幅。對(duì)量子比特測(cè)量時(shí)得到O的概率為
1 |2,得到l的概率為l-l2。 二者滿足歸一化條件1"12+1/3|2=1。所以,在QGA中,/ 個(gè)量子比特的概率幅可表示為
《,=
卜"2、
〃2…-,
則w個(gè)/位基因構(gòu)成的一個(gè)染色體可以表示為
仏'=
"12a21"22a2, m2、
/ 21A2A,
其中,z表示此染色體的編號(hào),z表示此染色體當(dāng)前進(jìn)化的代數(shù),w表示染色體 基因的個(gè)數(shù),/表示基因里量子比特的個(gè)數(shù)。因此,如果存在一個(gè)具有w個(gè)量子比
特位的系統(tǒng),則該系統(tǒng)能同時(shí)表達(dá)2"個(gè)狀態(tài)。 (2)量子旋轉(zhuǎn)門(mén)在量子遺傳算法中,遺傳操作主要是將構(gòu)造的量子門(mén)c/("作用于量子疊加態(tài)
或糾纏的基態(tài),使其相互干涉,相位發(fā)生改變,從而改變各基態(tài)的概率幅。在本 發(fā)明中,量子門(mén)主要采用量子旋轉(zhuǎn)門(mén),通過(guò)量子旋轉(zhuǎn)門(mén)可以實(shí)現(xiàn)染色體的調(diào)整, 其調(diào)整操作如下
在
cos《 —sin《 sin《 cos《
式中(",,a)為第/個(gè)量子比特,a為旋轉(zhuǎn)角,其幅度影響收斂速度,但是如果其
幅度太大,會(huì)導(dǎo)致早熟,因此,《的大小和方向本文根據(jù)通用的、與問(wèn)題無(wú)關(guān) 的調(diào)整策略確定。
(3)適應(yīng)度評(píng)價(jià)函數(shù) 適應(yīng)度評(píng)價(jià)函數(shù)是衡量個(gè)體優(yōu)劣的標(biāo)志,其作用類似于度量自然界中生物適 應(yīng)環(huán)境的能力。本發(fā)明根據(jù)醫(yī)學(xué)圖像特征向量作為個(gè)體模型的特殊性,所采用的 適應(yīng)度評(píng)價(jià)函數(shù)為-
乂=1
式中,M^.表示種群中第i代的第y個(gè)個(gè)體,iV表示種群中個(gè)體的數(shù)量。
本發(fā)明對(duì)醫(yī)學(xué)圖像檢索中高維特征向量的降維情況進(jìn)行了研究,采用基于量 子遺傳優(yōu)化的流形降維方法實(shí)現(xiàn)了醫(yī)學(xué)圖像的有效檢索。
量子遺傳算法比傳統(tǒng)遺傳算法擁有更好的種群多樣性和更少的種群規(guī)模,并 且,由于其采用量子比特編碼也可以獲得較好的收斂性。因而,本發(fā)明利用量子
遺傳算法從數(shù)據(jù)間的本征特性出發(fā),尋找在醫(yī)學(xué)圖像特征向量降維中使重建誤差 最小的權(quán)重值,從而使得醫(yī)學(xué)圖像檢索在保證精度的條件下達(dá)到較快的檢索速
為了更好的發(fā)現(xiàn)醫(yī)學(xué)圖像檢索中基于流形的非線性降維方法的本征維數(shù),并 尋找使誤差函數(shù)最小的權(quán)值矩陣,本發(fā)明提出了基于量子遺傳優(yōu)化的流形降維醫(yī) 學(xué)圖像檢索方法。在本發(fā)明中,對(duì)LLE非線性降維方法進(jìn)行了改進(jìn),引入量子 遺傳優(yōu)化局部重建權(quán)值矩陣,降低了噪聲點(diǎn)對(duì)樣本數(shù)據(jù)的影響,提高了算法收斂 速度,提高了醫(yī)學(xué)圖像檢索速度和精度。(四)
圖1.量子遺傳優(yōu)化算法流程圖; 圖2.醫(yī)學(xué)圖像檢索系統(tǒng)原理圖。
(五)
具體實(shí)施例方式
下面結(jié)合附圖舉例對(duì)本發(fā)明做更詳細(xì)地描述
本發(fā)明針對(duì)不同解剖部位及各類不同疾病的多模態(tài)醫(yī)學(xué)影像進(jìn)行檢索研究, 選取2種模態(tài)(CT與MR), 3種解剖部位(腦、胸、腹),6種疾病(血腫、垂 體瘤、乳腺癌、肺癌、胰腺癌、膀胱癌)共約800個(gè)病例的影像資信與正常或其 他非正常資料共約IOOO例來(lái)構(gòu)成研究數(shù)據(jù)庫(kù)。圖像入庫(kù)時(shí),各序列的關(guān)鍵圖像 統(tǒng)一轉(zhuǎn)換為512X512大小的JPG格式圖像。首先由用戶通過(guò)査詢接口提出査詢 請(qǐng)求(目標(biāo)圖像),查詢處理模塊根據(jù)請(qǐng)求提取目標(biāo)圖像和圖像數(shù)據(jù)庫(kù)中每幅圖像 的72維灰度特征和48維紋理特征,這些高維特征以向量的形式存入高維特征向 量庫(kù);然后,對(duì)描述圖像內(nèi)容的高維特征進(jìn)行基于量子遺傳優(yōu)化的降維,得到 32維低維特征子集;通過(guò)相似性度量將檢索結(jié)果返回給用戶。系統(tǒng)結(jié)構(gòu)框圖如 圖2所示,具體實(shí)施方法如下-
1. 提取高維醫(yī)學(xué)圖像特征
對(duì)醫(yī)學(xué)圖像進(jìn)行檢索,首先要自動(dòng)抽取圖像特征,建立特征索引庫(kù)?;叶忍?征相對(duì)幾何體特征而言,具有一定的穩(wěn)定性,對(duì)大小,方向都不敏感,表現(xiàn)出相 當(dāng)強(qiáng)的魯棒性,因此是醫(yī)學(xué)圖像檢索最常用的特征之一。由于人體各器官組織的 紋理結(jié)構(gòu)具有一定的區(qū)別,并且,同一器官組織的紋結(jié)構(gòu)相當(dāng)明顯,因此,對(duì)醫(yī)
學(xué)圖像進(jìn)行檢索也常選取紋理特征。
本發(fā)明提取醫(yī)學(xué)圖像的灰度和紋理特征,其中,提取的HSV顏色(灰度) 特征為72維,Gabor紋理特征為48維,因此檢索的聯(lián)合特征向量為72+48=120 維。
2. 基于量子遺傳優(yōu)化的特征向量的流形降維
(1)設(shè)醫(yī)學(xué)圖像特征向量高維空間/^中的iV個(gè)D維隨機(jī)向量k,x,,…;cj,
;c,.ei^,通過(guò)降維把它們映射到低維空間i "中,得到降維后的輸出向量y,, 計(jì)算每一個(gè)樣本點(diǎn)(特征向量)x,的A個(gè)最近鄰點(diǎn)。對(duì)高維空間中的樣本點(diǎn)x,,計(jì)算該點(diǎn)與其他iV- 1個(gè)樣本點(diǎn)之間的距離,將距離排序,選擇前/t個(gè)與x,最 近的點(diǎn)作為其鄰近點(diǎn)。
(2)由每個(gè)樣本點(diǎn)的近鄰點(diǎn)計(jì)算出該樣本點(diǎn)的局部重建權(quán)值矩陣『。用每個(gè)特 征向量的近鄰點(diǎn)對(duì)該特征向量進(jìn)行重建,求取使重建誤差最小的近鄰局部重建權(quán) 值矩陣。
定義重建擬合誤差函數(shù)如下
s,)=iik,i>,~.ii2
其中,x,01,2,…,/t)為x,的j個(gè)近鄰點(diǎn),^,是^與^之間的權(quán)值。
在滿足以下兩個(gè)約束條件時(shí),通過(guò)最小化誤差函數(shù)得到局部重建權(quán)值矩陣, 即由樣本點(diǎn)的近鄰點(diǎn),構(gòu)造出最優(yōu)『矩陣使誤差函數(shù)值達(dá)到最小。
1 )每一個(gè)數(shù)據(jù)點(diǎn)x,都只能由它的鄰近點(diǎn)來(lái)表示,若X,不是近鄰點(diǎn),則w, = 0 ;
2)權(quán)值矩陣的每一行的和為1,即滿足歸一化約束gw,, = 1 。
在求取最優(yōu)『矩陣的過(guò)程中本發(fā)明將LLE算法中樣本點(diǎn)與其臨近點(diǎn)的重建 權(quán)值向量集合構(gòu)造為量子遺傳算法的量子染色體,然后量子遺傳中的個(gè)體在尋優(yōu) 的過(guò)程中找到最優(yōu)位置,最終得到近鄰局部重建權(quán)值矩陣。
1) 初始化種群初始化醫(yī)學(xué)圖像特征高維向量中包含W個(gè)個(gè)體的種群 2(r) = W,其中《(j、l,2,…A0為種群中第,代的第y個(gè)個(gè)體。種群中 全部染色體的所有基因a、 e都被初始化為1/A,這意味著一個(gè)染色體所表達(dá) 的是其全部可能狀態(tài)的等概率疊加。
2) 對(duì)種群中的個(gè)體進(jìn)行測(cè)量對(duì)初始種群中的個(gè)體進(jìn)行一次測(cè)量以獲得一 組確定的解戶。=沐,其中《0:1,…,7V)是第,代種群中的第y個(gè)
個(gè)體的測(cè)量值,其表現(xiàn)形式為量子為數(shù)目即染色體長(zhǎng)度為W的二進(jìn)制字符串。
其中每一位為o或i是根據(jù)量子比特的概率Kf或l/ /f ( / = l,...,w )觀糧得到的。
具體實(shí)現(xiàn)方法為隨機(jī)產(chǎn)生
上的一個(gè)數(shù)e,若6>卜,'|2,則"中相應(yīng)的位取 值為1,否則取值為0;3) 評(píng)價(jià)二進(jìn)制染色體種群p(r)并保留最優(yōu)解用適應(yīng)度評(píng)價(jià)函數(shù)評(píng)價(jià)種群 尸(r)中每個(gè)染色體,并保留此代中的最優(yōu)解。如算法獲得滿意解,算法停止;
否則,轉(zhuǎn)入歩驟4)繼續(xù)進(jìn)行;
4) 量子遺傳操作使用量子旋轉(zhuǎn)門(mén)W"更新尸(r);
5) 改變進(jìn)化代數(shù)進(jìn)化代數(shù)加1,如仍未滿足最大進(jìn)化代數(shù)rm^,算法轉(zhuǎn)
至步驟2)繼續(xù)進(jìn)行。
按照以上步驟即可求取最優(yōu)近鄰局部重建權(quán)值矩陣『。
(3)保持上步求取的權(quán)值『不變,求X,在低維嵌入空間的輸出特征向量y,。為
了使輸出數(shù)據(jù)在低維空間保持高維空間原有的拓?fù)浣Y(jié)構(gòu)需構(gòu)造一個(gè)代價(jià)函數(shù),映 射過(guò)程中必須使代價(jià)函數(shù)值達(dá)到最小。該函數(shù)形式為<formula>formula see original document page 16</formula>其中,y,是、的輸出向量,力01,2,…,/t)是x的/l個(gè)近鄰點(diǎn)。 為使低維重構(gòu)誤差最小化同樣也要滿足兩個(gè)約束條件
1) y,是一個(gè)平移不變量,即|;々=0;
2) 為了避免產(chǎn)生退化解需使<formula>formula see original document page 16</formula>,其中N是數(shù)據(jù)點(diǎn)的個(gè)數(shù),/是dxd 的單位矩陣。
此時(shí),對(duì)s(r)進(jìn)行求解,求取的最優(yōu)解;;,可以使得代價(jià)函數(shù)S(10達(dá)到最小值。 構(gòu)造一個(gè)WxW的稀疏矩陣『,A(,、1,2,…,W)可以存儲(chǔ)在其中,當(dāng)x,是;c,的近鄰 點(diǎn)時(shí),^ ,=,,否則,Wj = 0 。
此時(shí)誤差代價(jià)函數(shù)式可改寫(xiě)為<formula>formula see original document page 16</formula>
其中,M—M,》是一個(gè)WxW的對(duì)稱矩陣,其表達(dá)式為<formula>formula see original document page 16</formula>利用Lagrange乘子法可轉(zhuǎn)化為在1^X =/條件下的特征值和特征向量的
問(wèn)題0W —A)"'=0,艮卩Mo^/la。
要最小化代價(jià)函數(shù),則取M的最小d個(gè)特征值對(duì)應(yīng)的向量為列向量組成矩 陣r,則r的列向量即為"維空間的降維向量表示。
3. 相似性度量
對(duì)醫(yī)學(xué)圖像數(shù)據(jù)庫(kù)中的圖像和待檢索圖像進(jìn)行特征向量降維后就可以用該 低維特征向量來(lái)表征對(duì)應(yīng)的圖像,然后需要對(duì)待檢索圖像和數(shù)據(jù)庫(kù)中圖像進(jìn)行相 似度測(cè)量,本發(fā)明采用如下相似測(cè)度方法
(1) 直方圖的交
假設(shè)/和g是兩個(gè)含有iV個(gè)bin的顏色直方圖,則它們之間的相交距離用下 式表示
直方圖的相交是指兩個(gè)直方圖在每個(gè)bin中共有的像素?cái)?shù)量。有時(shí),該值還 可以通過(guò)除以其中一個(gè)直方圖中所有的像素?cái)?shù)量來(lái)實(shí)現(xiàn)標(biāo)準(zhǔn)化,從而使其值處于
的值域范圍,如下式所示
豐e)《m《e》/2:》
(2) 余弦距離法
5(/,2)=/、/(||/||*||冊(cè)
其中,I和Q分別表示査詢圖像和數(shù)據(jù)庫(kù)中圖像的特征向量,1HI表示向量范數(shù)。 計(jì)算得到的相似性度量值在[O, l]之間,該值越大,表示圖像越相似。
對(duì)于組合特征,相似性度量定義為各個(gè)特征相似性度量的加權(quán)和。其公式為: S(/,2) = Z:%*^(/,0,表示由w個(gè)特征組合而成,其中w,表示第j'個(gè)
特征的權(quán)重系數(shù),它表示第j'個(gè)特征的重要性, 一般取各w,相等。又^(/,2)表
示第_/個(gè)特征的相似性度量函數(shù)值。
4. 算法的性能評(píng)價(jià)本發(fā)明采用MPEG-7推薦的檢索性能評(píng)價(jià)公式來(lái)評(píng)價(jià)本系統(tǒng)的檢索性能,設(shè) 尸w為返回的前W個(gè)結(jié)果中的正確率,又設(shè)W為某一具有特定語(yǔ)義含義的圖像集
合?,F(xiàn)給出示例圖像A, G' = l,2,…,M), M為測(cè)試系統(tǒng)檢索性能而預(yù)先設(shè)定的 示例圖像個(gè)數(shù),存在《e/ ,在對(duì)《的一次檢索中系統(tǒng)返回的前7V個(gè)結(jié)果為 A,)二1,2,…,A^,那么正確率/ w說(shuō))定義如下式所示
前iV個(gè)結(jié)果的査全率~(仏)可以用下式表示
硫n
其中,IWII表示圖像集R所含的圖像數(shù)。
査準(zhǔn)率和査全率越高,表明該檢索系統(tǒng)的效果越好。 一般地,査準(zhǔn)率和查全 率是一對(duì)矛盾體,當(dāng)要求精度較高時(shí),査全率較低,反之亦然。因此, 一般的檢 索系統(tǒng)只要求在這兩者之間達(dá)到一個(gè)最優(yōu)的平衡點(diǎn),就認(rèn)為達(dá)到了較好的檢索性
權(quán)利要求
1、一種基于量子遺傳優(yōu)化的流形降維醫(yī)學(xué)圖像檢索方法,其特征是(1)提出查詢請(qǐng)求首先由用戶通過(guò)查詢接口向醫(yī)學(xué)圖像數(shù)據(jù)庫(kù)提出查詢目標(biāo)圖像的查詢請(qǐng)求,所述的醫(yī)學(xué)圖像數(shù)據(jù)庫(kù)是圖像入庫(kù)時(shí),將各序列的關(guān)鍵圖像統(tǒng)一轉(zhuǎn)換為512×512大小的JPG格式圖像構(gòu)成醫(yī)學(xué)圖像數(shù)據(jù)庫(kù);(2)提取高維醫(yī)學(xué)圖像特征查詢處理模塊根據(jù)請(qǐng)求提取目標(biāo)圖像和醫(yī)學(xué)圖像數(shù)據(jù)庫(kù)中每幅圖像的72維灰度特征和48維紋理特征,將這些高維特征以向量的形式存入高維特征向量庫(kù);(3)基于量子遺傳優(yōu)化的降維對(duì)描述圖像內(nèi)容的高維特征進(jìn)行基于量子遺傳優(yōu)化的降維,得到32維低維特征子集;(4)相似性度量通過(guò)相似性度量將檢索結(jié)果返回給用戶。
2、 根據(jù)權(quán)利要求1所述的基于量子遺傳優(yōu)化的流形降維醫(yī)學(xué)圖像檢索方法,其特征是所述的基于量子遺傳優(yōu)化的降維的方法為(1) 醫(yī)學(xué)圖像特征向量高維空間i D中的iV個(gè)D維隨機(jī)向量^,X2,…JcJ,X,ei 通過(guò)降維把它們映射到低維空間/^中,得到降維后的輸出向量乂 ,計(jì)算每一個(gè)樣本點(diǎn)即特征向量X,的個(gè)最近鄰點(diǎn);對(duì)高維空間中的樣本點(diǎn)X,, 計(jì)算該點(diǎn)與其他iV-l個(gè)樣本點(diǎn)之間的距離,將距離排序,選擇前A個(gè)與X,最近 的點(diǎn)作為其鄰近點(diǎn);(2) 由每個(gè)樣本點(diǎn)的近鄰點(diǎn)計(jì)算出該樣本點(diǎn)的局部重建權(quán)值矩陣『;用每 個(gè)特征向量的近鄰點(diǎn)對(duì)該特征向量進(jìn)行重建,求取使重建誤差最小的近鄰局部重 建權(quán)值矩陣『;G)保持上步求取的權(quán)值『不變,求x,在低維嵌入空間的輸出特征向量y,;為了使輸出數(shù)據(jù)在低維空間保持高維空間原有的拓?fù)浣Y(jié)構(gòu)需構(gòu)造一個(gè)代價(jià)函 數(shù),映射過(guò)程中必須使代價(jià)函數(shù)值達(dá)到最小,該函數(shù)形式為<formula>formula see original document page 2</formula>其中,y,是;c,的輸出向量,7,,(7 = 1,2,...,*)是^的*個(gè)近鄰點(diǎn);為使低維重構(gòu)誤差最小化同樣也要滿足兩個(gè)約束條件 1) y,是一個(gè)平移不變量,即|>,.=0;2)為了避免產(chǎn)生退化解需使=/ ,其中N是數(shù)據(jù)點(diǎn)的個(gè)數(shù),/是"的單位矩陣;對(duì)^(y)進(jìn)行求解,求取的最優(yōu)解y,可以使得代價(jià)函數(shù)f()O達(dá)到最小值; 構(gòu)造一個(gè)WxW的稀疏矩陣『,0、1,2,…,W)可以存儲(chǔ)在其中,當(dāng)x,是;c,的近鄰點(diǎn)時(shí),R,;,否則,K,o; 此時(shí)誤差代價(jià)函數(shù)式可改寫(xiě)為=結(jié)^力,="歴7.) 其中,似=(似,,)是一個(gè)^><^的對(duì)稱矩陣,其表達(dá)式為M =(/-『)7'(/-『)利用Lagrange乘子法轉(zhuǎn)化為在丄^>,乂 =/條件下的特征值和特征向量的 問(wèn)題(M—A)f7'=0,艮卩Mq^Aq;;要最小化代價(jià)函數(shù),則取M的最小t/個(gè)特征值對(duì)應(yīng)的向量為列向量組成矩陣r,則r的列向量即為c/維空間的降維向量表示。
3、根據(jù)權(quán)利要求2所述的基于量子遺傳優(yōu)化的流形降維醫(yī)學(xué)圖像檢索方法, 其特征是所述的求取使重建誤差最小的近鄰局部重建權(quán)值矩陣的方法為1) 初始化種群初始化醫(yī)學(xué)圖像特征高維向量中包含iV個(gè)個(gè)體的種群2(r) = WU(,...,A},其中《C/、1,2,…A0為種群中第M戈的第J個(gè)個(gè)體,種群中全部染色體的所有基因a 、 e都被初始化為i/v^,這意味著一個(gè)染色體所表達(dá)的是其全部可能狀態(tài)的等概率疊加;2) 對(duì)種群中的個(gè)體進(jìn)行測(cè)量對(duì)初始種群中的個(gè)體進(jìn)行一次測(cè)量以獲得一組確定的解尸(r)—",其中《O一l,...,AO是第H戈種群中的第乂個(gè) 個(gè)體的測(cè)量值,其表現(xiàn)形式為量子為數(shù)目即染色體長(zhǎng)度為W的二進(jìn)制字符串;其中每一位為O或l是根據(jù)量子比特的概率hl或|《| (/ = l,...,m)測(cè)量得到的;具體實(shí)現(xiàn)方法為隨機(jī)產(chǎn)生[O,1]上的一個(gè)數(shù)0,若6>>| ,'|2,則《中相應(yīng)的 位取值為1,否則取值為O;3) 評(píng)價(jià)二進(jìn)制染色體種群尸(:r)并保留最優(yōu)解用適應(yīng)度評(píng)價(jià)函數(shù)評(píng)價(jià)種群尸(r)中每個(gè)染色體,并保留此代中的最優(yōu)解;如算法獲得滿意解,算法停止; 否則,轉(zhuǎn)入歩驟4)繼續(xù)進(jìn)行;4) 量子遺傳操作使用量子旋轉(zhuǎn)門(mén)w"更新戶(:r);5) 改變進(jìn)化代數(shù)進(jìn)化代數(shù)加l,如仍未滿足最大進(jìn)化代數(shù)rm^,算法轉(zhuǎn)至步驟2)繼續(xù)進(jìn)行。
4、根據(jù)權(quán)利要求3所述的基于量子遺傳優(yōu)化的流形降維醫(yī)學(xué)圖像檢索方 法,其特征是所述的相似性度量的方法為直方圖的交,/和g是兩個(gè)含有W個(gè)bin的顏色直方圖,它們之間的相交距離用下式表直方圖的相交是指兩個(gè)直方圖在每個(gè)bin中共有的像素?cái)?shù)量;有時(shí),該值還可以通過(guò)除以其中一個(gè)直方圖中所有的像素?cái)?shù)量來(lái)實(shí)現(xiàn)標(biāo)準(zhǔn)化,從而使其值處于[O, l]的值域范圍,如下式所示
5、根據(jù)權(quán)利要求3所述的基于量子遺傳優(yōu)化的流形降維醫(yī)學(xué)圖像檢索方法,其特征是所述的相似性度量的方法為余弦距離法其中,I和Q分別表示查詢圖像和數(shù)據(jù)庫(kù)中圖像的特征向量,IH哮示向量范數(shù), 計(jì)算得到的相似性度量值在[O, l]之間,該值越大,表示圖像越相似。
6、根據(jù)權(quán)利要求3所述的基于量子遺傳優(yōu)化的流形降維醫(yī)學(xué)圖像檢索方法,其特征是所述的相似性度量的方法,對(duì)于組合特征,相似性度量定義為各個(gè)特征相似性度量的加權(quán)和,其公式為s(/,2)=/"e/(imi*.s(/,0 = Z:%*^(/,g),表示由附個(gè)特征組合而成,其中^表示第y個(gè)特征的權(quán)重系數(shù),它表示第J'個(gè)特征的重要性, 一般取各w,相等,又S,(/,g) 表示第/個(gè)特征的相似性度量函數(shù)值。
全文摘要
本發(fā)明提供的是一種基于量子遺傳優(yōu)化的流形降維醫(yī)學(xué)圖像檢索方法。首先由用戶通過(guò)查詢接口向醫(yī)學(xué)圖像數(shù)據(jù)庫(kù)提出查詢目標(biāo)圖像的查詢請(qǐng)求;查詢處理模塊根據(jù)請(qǐng)求提取目標(biāo)圖像和醫(yī)學(xué)圖像數(shù)據(jù)庫(kù)中每幅圖像的72維灰度特征和48維紋理特征,將這些高維特征以向量的形式存入高維特征向量庫(kù);對(duì)描述圖像內(nèi)容的高維特征進(jìn)行基于量子遺傳優(yōu)化的降維,得到32維低維特征子集;通過(guò)相似性度量將檢索結(jié)果返回給用戶。本發(fā)明提出了基于量子遺傳優(yōu)化的流形降維醫(yī)學(xué)圖像檢索方法。在本發(fā)明中,對(duì)LLE非線性降維方法進(jìn)行了改進(jìn),引入量子遺傳優(yōu)化局部重建權(quán)值矩陣,降低了噪聲點(diǎn)對(duì)樣本數(shù)據(jù)的影響,提高了算法收斂速度,提高了醫(yī)學(xué)圖像檢索速度和精度。
文檔編號(hào)G06F17/30GK101546332SQ20091007196
公開(kāi)日2009年9月30日 申請(qǐng)日期2009年5月7日 優(yōu)先權(quán)日2009年5月7日
發(fā)明者望 叢, 馮耀宇, 呂美超, 金 李, 楊廣達(dá), 洪 梁, 湯連志, 磊 王, 胡文廣 申請(qǐng)人:哈爾濱工程大學(xué)