本發(fā)明涉及圖像處理技術(shù)領(lǐng)域,具體涉及一種基于多尺度分解的圖片能量歸一化處理方法及系統(tǒng)。
背景技術(shù):
隨著數(shù)字技術(shù)的發(fā)展,圖像被數(shù)字化為大量像素點(diǎn)組成的點(diǎn)陣,像素點(diǎn)的光學(xué)特性則由像素值表征。
數(shù)字化后的圖像,方便計(jì)算機(jī)處理,為基于機(jī)器學(xué)習(xí)的各類檢測系統(tǒng)提供了先決條件。
現(xiàn)在,基于機(jī)器學(xué)習(xí)的檢測系統(tǒng),被應(yīng)用到各個(gè)領(lǐng)域;以醫(yī)學(xué)領(lǐng)域?yàn)槔?,檢測系統(tǒng)通過對大量數(shù)字化的醫(yī)學(xué)檢測影像的學(xué)習(xí),可以實(shí)現(xiàn)智能的輪廓分離,疾病檢測等功能;例如,x線胸部平片(簡稱胸片)是肺部疾病檢測的基本影像手段之一,通過以大量數(shù)字化的胸片(掃描或通過直接數(shù)字化x線攝像系統(tǒng)得到)作為樣本進(jìn)行機(jī)器學(xué)習(xí),智能檢測系統(tǒng)可以智能的對肺病疾病進(jìn)行檢測,如肺結(jié)節(jié)檢測。
然而,在進(jìn)行檢測時(shí),由于采集胸片的機(jī)器和時(shí)間的不同,胸片圖像中的能量分布往往具有較大差異性,這就給智能檢測帶來了障礙,因此,在將圖像輸入基于機(jī)器學(xué)習(xí)的智能檢測系統(tǒng)前,需要對圖像進(jìn)行歸一化預(yù)處理。
類似的,針對于其他圖片的機(jī)器學(xué)習(xí)系統(tǒng)也存在著需要對輸入的圖像進(jìn)行歸一化預(yù)處理的問題。
現(xiàn)有,對圖像進(jìn)行歸一化處理的方法主要有以下三種:
1、最值歸一化:
通過一定的代數(shù)變換將圖像中的像素值控制在一定范圍內(nèi)。如線性函數(shù)變換,表達(dá)式為y=(x-minvalue)/(maxvalue-minvalue),其中x、y分別為轉(zhuǎn)換前、后的值,maxvalue、minvalue分別為樣本的最大值和最小值;對數(shù)函數(shù)變換,表達(dá)式為y=log10(x);反余切函數(shù)變換,表達(dá)式為y=arctan(x)*2/pi。這種歸一化方法適用于本來就分布在有限范圍內(nèi)的數(shù)據(jù),但該方法只是對圖像做了簡單的線性變換處理,沒有考慮圖像本身的結(jié)構(gòu)信息,處理后得到的圖像可能會(huì)存在空洞或分布不均勻的現(xiàn)象;
2、均值方差歸一化:
通過將像素值減去均值除以方差,來將均值歸一化到0,方差歸一化到1;適用于分布沒有明顯邊界的情況,然而該方法僅計(jì)算圖像的均值和方差然后做的線性變換處理,沒有考慮可能存在的局部強(qiáng)信號當(dāng)圖像中有明顯邊界時(shí)處理后可能會(huì)使邊緣模糊化;
3、直方圖統(tǒng)計(jì)歸一化:
通過統(tǒng)計(jì)圖像像素的直方圖累計(jì)分布,去掉分布譜上前面1%和后面2%的直方圖成分,然后在新的直方圖范圍內(nèi)調(diào)整像素值范圍;當(dāng)該方法只考慮圖像的像素值分布,沒有考慮圖像本身的能量,導(dǎo)致圖片信息的丟失;
現(xiàn)在,亟需一種對圖像進(jìn)行有效能量歸一化的處理方法及系統(tǒng),以克服現(xiàn)有技術(shù)的缺陷,使得歸一化處理后最終得到的圖像能量分布更均勻,且更大可能的保留了圖像的原有信息。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明所要解決的技術(shù)問題是提供一種對圖像進(jìn)行有效能量歸一化的處理方法及系統(tǒng),對圖像進(jìn)行多尺度分解,各個(gè)尺度分別歸一化處理,使得最終得到的圖像能量分布更均勻,且更大可能的保留了圖像的原有信息。
為解決上述技術(shù)問題,本發(fā)明提出以下技術(shù)方案:
基于多尺度分解的圖片能量歸一化處理方法,包括如下步驟:
步驟(1):對原始圖像進(jìn)行多尺度分解,分別得到尺度從精細(xì)到粗糙的多級子帶圖像;
步驟(2):對步驟(1)中得到的各級子帶圖像分別進(jìn)行歸一化處理;
步驟(3):對步驟(2)得到的歸一化處理后的各級子帶圖像進(jìn)行多尺度重建,得到重建后的圖像。
步驟(4):將步驟(3)中重建后的圖像中的各點(diǎn)性變換歸一化為取值在[01]之間,進(jìn)而得到最終處理后的圖像。
本發(fā)明中所稱的圖像均是指數(shù)字圖像或模擬圖像的數(shù)字化后的圖像。
數(shù)字圖像本身既包含大尺度信息如輪廓等,又包含小尺度上的細(xì)節(jié)信息如邊緣等,這些信息一起構(gòu)成圖像的總體效果,缺一不可。如果直接在原圖上進(jìn)行歸一化處理,可能會(huì)丟失其中的一些信息。因此,上述技術(shù)方案的特點(diǎn)是:先對圖像進(jìn)行多尺度分解,充分提取出圖像在不同尺度上的結(jié)構(gòu)和信息,最大可能地保留圖像各個(gè)層次的信息,大的尺度保留圖像中的輪廓等大致信息,小的尺度保留邊緣等細(xì)節(jié);而后,各個(gè)尺度分別歸一化處理使得最終得到的圖像能量分布更均勻且更大可能的保留了圖像的原有信息,可快速高效地實(shí)現(xiàn)圖像的能量歸一化處理。
進(jìn)一步,所述步驟(4)中,根據(jù)設(shè)定的有效百分位數(shù)值的上限和下限,將重建后的圖像中百分位數(shù)值等于上限和下限的各點(diǎn)以及上限和下限之間的各點(diǎn)線,線性變換歸一化為取值在[01]之間;高于上限的點(diǎn)則取值1,低于下限的點(diǎn)則取值0,進(jìn)而得到最終處理后的圖像。
此處所述的有效百分位數(shù)值是一個(gè)范圍值,設(shè)圖像中的像素值的最大值為maxvalue,則百分位數(shù)值=像素值/maxvalue*100%;因此,所有百分位數(shù)值處于有效百分位數(shù)值范圍以內(nèi)的點(diǎn),稱為有效點(diǎn),線性變換歸一化則針對這些有效點(diǎn)進(jìn)行,這樣,百分位數(shù)值等于有效百分位數(shù)值上限的點(diǎn)被線性變化為1,其他點(diǎn)則相應(yīng)線性縮放;
通過設(shè)定這樣的范圍值,對那些值過大(高于有效百分位數(shù)值上限)的點(diǎn)直接取值1,對于那些過小(低于有效百分位數(shù)值下限)的點(diǎn)則直接取值0,這樣不僅提高了歸一化系統(tǒng)的魯棒性,也提高了應(yīng)用歸一化圖像的機(jī)器學(xué)習(xí)系統(tǒng)的魯棒性。
進(jìn)一步,所述步驟(1)中采用拉普拉斯金字塔分解,對原始圖像進(jìn)行多尺度分解,分別得到尺度從精細(xì)到粗糙的多級子帶圖像。
該算法能較好地解析出圖像在不同尺度上的信息,既能通過大的尺度保留圖像中的輪廓等大致信息,又能通過小的尺度保留邊緣等細(xì)節(jié)。
進(jìn)一步,所述步驟(1)中采用小波變換,對原始圖像進(jìn)行多尺度分解,分別得到尺度從精細(xì)到粗糙的多級子帶圖像。
該算法能較好地解析出圖像在不同尺度上的信息,既能通過大的尺度保留圖像中的輪廓等大致信息,又能通過小的尺度保留邊緣等細(xì)節(jié)。
進(jìn)一步,在對圖像進(jìn)行多尺度分解前,還包括對圖像進(jìn)行降采樣的步驟。
降采樣使得需要處理的像素?cái)?shù)量降低,提高了歸一化處理的效率。
進(jìn)一步,還包括,分別計(jì)算每個(gè)尺度的能量或平均絕對偏差的統(tǒng)計(jì)量的步驟,進(jìn)而,所述步驟(2)中,計(jì)算所述統(tǒng)計(jì)量與子帶圖像平均能量的比例,將對應(yīng)尺度上的原子帶圖乘以該比例的開方數(shù),以得到歸一化處理后的各級子帶圖像。
通過統(tǒng)計(jì)大量圖像的各子帶的能量或平均絕對偏差,可以計(jì)算得到統(tǒng)計(jì)量;這樣,在測試時(shí),給定任意一幅圖,將前面統(tǒng)計(jì)得到的統(tǒng)計(jì)量作為整個(gè)圖像空間上的平均值標(biāo)準(zhǔn),來進(jìn)行線性變換歸一化處理;開方處理,則是因?yàn)閳D像的能量值是與像素值的平方成正比,而子帶圖中的值其實(shí)代表的是像素值,因此用原子帶圖乘以比例的開方數(shù)。
進(jìn)一步,所述統(tǒng)計(jì)量為中值、均值以90分位值中的任意一種。
這樣采用不同的統(tǒng)計(jì)值,可以適用于不同要求的系統(tǒng)。本發(fā)明所述的90分位值定義如下:設(shè)某一圖片內(nèi)的像素值的最大值為maxvalue,則90分位值=maxvalue*0.9。
進(jìn)一步,所述步驟(2)中先對各級子帶圖像其進(jìn)行裁剪,獲取中心區(qū)域的圖像信息,將該區(qū)域內(nèi)的圖像平均能量用于所述的比例計(jì)算。
圖像的中心區(qū)以一般集中的圖像的主要能量,通過裁去邊緣部分,既可減少運(yùn)算量,獲得的平均能量值也相對較高,與統(tǒng)計(jì)量的比值也更能反應(yīng)子帶圖在重建后的圖像中所占比例。
本發(fā)明還提出了一種基于多尺度分解的圖片能量歸一化處理系統(tǒng),包括:
輸入模塊,用于輸入原始圖像;
分解模塊,用于對輸入模塊發(fā)送來的原始圖像進(jìn)行多尺度分解,分別得到尺度從精細(xì)到粗糙的多級子帶圖像;
歸一化處理模塊,用于對從分解模塊得到的各級子帶圖像分別進(jìn)行歸一化處理;
重建模塊,用于對歸一化處理模塊得到的歸一化處理后的各級子帶圖像進(jìn)行多尺度重建,得到重建后的圖像;
輸出模塊,用于將從重建模塊中得到的重建后的圖像中的各點(diǎn)線性變換歸一化為取值在[01]之間,進(jìn)而得到最終處理后的圖像輸出。
數(shù)字圖像本身既包含大尺度信息如輪廓等,又包含小尺度上的細(xì)節(jié)信息如邊緣等,這些信息一起構(gòu)成圖像的總體效果,缺一不可。如果直接在原圖上進(jìn)行歸一化處理,可能會(huì)丟失其中的一些信息。因此,上述技術(shù)方案的特點(diǎn)是:先對圖像進(jìn)行多尺度分解,充分提取出圖像在不同尺度上的結(jié)構(gòu)和信息,最大可能地保留圖像各個(gè)層次的信息,大的尺度保留圖像中的輪廓等大致信息,小的尺度保留邊緣等細(xì)節(jié);而后,各個(gè)尺度分別歸一化處理使得最終得到的圖像能量分布更均勻且更大可能的保留了圖像的原有信息,可快速高效地實(shí)現(xiàn)圖像的能量歸一化處理。
進(jìn)一步,還包括統(tǒng)計(jì)模塊,用于計(jì)算和統(tǒng)計(jì)分解模塊分解后的每個(gè)尺度的圖片的能量或平均絕對偏差的統(tǒng)計(jì)量,并發(fā)送給所述歸一化處理模塊;所述歸一化處理模塊,用于計(jì)算所述統(tǒng)計(jì)量與子帶圖像平均能量的比例,將對應(yīng)尺度上的原子帶圖乘以該比例的開方數(shù),以得到歸一化處理后的各級子帶圖像。
通過統(tǒng)計(jì)大量圖像的各子帶的能量或平均絕對偏差,可以計(jì)算得到統(tǒng)計(jì)量;這樣,在測試時(shí),給定任意一幅圖,將前面統(tǒng)計(jì)得到的統(tǒng)計(jì)量作為整個(gè)圖像空間上的平均值標(biāo)準(zhǔn),來進(jìn)行線性變換歸一化處理;開方處理,則是因?yàn)閳D像的能量值是與像素值的平方成正比,而子帶圖中的值其實(shí)代表的是像素值,因此用原子帶圖乘以比例的開方數(shù)。
附圖說明
圖1為本發(fā)明實(shí)施例1中所用方法的流程圖。
圖2為本發(fā)明實(shí)施例1中各個(gè)步驟所得圖像結(jié)果的示意圖。
圖3為本發(fā)明實(shí)施例2中各個(gè)步驟所得圖像結(jié)果的示意圖。
圖4為本發(fā)明實(shí)施例1中的基于多尺度分解的圖片能量歸一化處理系統(tǒng)的示意性框圖。
具體實(shí)施方式
下面通過具體實(shí)施方式對本發(fā)明作進(jìn)一步詳細(xì)的說明:
實(shí)施例1
本實(shí)施例中的基于多尺度分解的圖片能量歸一化處理系統(tǒng)采用大致如圖1中所示的方法,對x線胸片圖像進(jìn)行多尺度分解的能量歸一化,x線胸片圖像為黑白圖像,每個(gè)像素的像素值為其灰度值,具體步驟為:
s01:輸入胸片圖像
如圖2所示,從臨床上采集的原始x線胸片圖大小為2048*2048,像素分辨率為0.175*2mm;先用雙立方差值法對原始胸片圖進(jìn)行降采樣使得像素分辨率為0.5mm,大小為1024*1024;
s02:胸片圖像多尺度分解
對降采樣后的胸片圖像進(jìn)行多尺度分解,本實(shí)施例中采用拉普拉斯金字塔分解,分別得到從精細(xì)到粗糙尺度的n級子帶以及各個(gè)子帶的大小。
如圖2所示,本實(shí)施例中,輸入的胸片圖像被分解為6個(gè)尺度的子帶圖,其大小分別為:10242,5122,2562,1282,642,322。
s03:各子帶能量歸一化處理
對步驟s02中得到的n級子帶分別進(jìn)行歸一化處理。
其中,對于任一級子帶ii,先對其進(jìn)行裁剪,獲取子帶圖中一定區(qū)域的圖像信息ii',本實(shí)施例中,裁剪后的子帶圖像位于原子帶圖像的正中,裁剪前后圖像的寬度比為7/8,高度比為15/16,
然后計(jì)算ii'的平均能量ei:
當(dāng)i<n時(shí),ei=mean(i'i2),此處為了加快計(jì)算,將mean(i'i)近似為0,減少運(yùn)算量;
當(dāng)i=n時(shí),ei=mean((i'i-mean(i'i))2),n級子帶為最接近原圖的子帶;
在此之前,系統(tǒng)通過統(tǒng)計(jì)多張x線胸片圖采用同樣的尺度分級后的各尺度子帶圖的能量或mad(meanabsolutedeviation平均絕對偏差)值,得到了諸如均值、中值或90分位點(diǎn)等統(tǒng)計(jì)值,這些統(tǒng)計(jì)值都可以用來調(diào)整子帶的能量分布;統(tǒng)計(jì)的樣本數(shù)量越多,則統(tǒng)計(jì)量越準(zhǔn)確。
本實(shí)施例中,需要事先對超過200張的x線胸片圖進(jìn)行統(tǒng)計(jì),而用于調(diào)整子帶能量分布的統(tǒng)計(jì)值優(yōu)選的采用能量的均值;
設(shè)對所有統(tǒng)計(jì)圖像的i級子帶進(jìn)行統(tǒng)計(jì)后得到的能量均值表示為enermedi,則調(diào)整后子帶圖的表達(dá)式為:
s04:多尺度重建胸片圖像。
由步驟s04得到的新的各級子帶inew進(jìn)行多尺度重建,得到重建后的圖像imi。
s05:提取有效百分位數(shù)值。
圖像中的像素值的最大值為maxvalue,則百分位數(shù)值=像素值/maxvalue*100%。
本實(shí)施例中,提取的有效百分位數(shù)值設(shè)定為1%~99%;即,像素值小于圖像imi中的最高值×1%的點(diǎn)會(huì)在歸一化中取0,大于該最高值×99%的點(diǎn)將在歸一化中取1,其余點(diǎn)則為有效點(diǎn)。
s06:輸出歸一化后圖像。
對圖像imi進(jìn)行線性變換歸一化處理,使每個(gè)圖像點(diǎn)的值處于[01]之間,進(jìn)而得到最終處理后的胸片圖像。
值得注意的是,在另一些實(shí)施例中,步驟s02中,多尺度分解的程度n值的設(shè)置可根據(jù)圖像具體情況適當(dāng)增大或減??;
而在另一些實(shí)施例中,步驟s01中對于子帶ii的裁剪可視具體情況而定,可以不進(jìn)行裁剪;
在另一些實(shí)施例中,步驟s04中對imi的有效百分位值的選取可適當(dāng)調(diào)整。
還有,本發(fā)明中的多尺度分解方式可用在不同部位、不同解剖位置的x線圖像上,實(shí)現(xiàn)不同部位圖像的歸一化處理。
在一些實(shí)施例中,本發(fā)明的歸一化方法可對彩色圖像進(jìn)行歸一化;
彩色圖像的每個(gè)像素的像素值由為紅、綠、藍(lán)三個(gè)顏色的值組成的向量,因此對于彩色圖像的歸一化,只需將圖像分解為紅、綠、藍(lán)三個(gè)通道,再對每個(gè)通道分別歸一化,而后再合并即可。
本實(shí)施例中的方法是用如圖4所示的基于多尺度分解的圖片能量歸一化處理系統(tǒng)來實(shí)施的;
該系統(tǒng)包括:輸入模塊,用于輸入原始圖像;
分解模塊,用于對輸入模塊發(fā)送來的原始圖像進(jìn)行多尺度分解,分別得到尺度從精細(xì)到粗糙的多級子帶圖像;
統(tǒng)計(jì)模塊,用于計(jì)算、統(tǒng)計(jì)分解模塊分解后的每個(gè)尺度的圖片的統(tǒng)計(jì)值,并發(fā)送給所述歸一化處理模塊;
歸一化處理模塊,用于對從分解模塊得到的各級子帶圖像分別進(jìn)行歸一化處理:
重建模塊,用于對歸一化處理模塊得到的歸一化處理后的各級子帶圖像進(jìn)行多尺度重建,得到重建后的圖像;
輸出模塊,用于將從重建模塊中得到的重建后的圖像中的各點(diǎn)線性變換歸一化為取值在[01]之間,進(jìn)而得到最終處理后的圖像輸出。
因此,該系統(tǒng)的輸入模塊,用于完成本實(shí)施例的步驟s01;
分解模塊,用于完成本實(shí)施例的步驟s02;
歸一化處理模塊,用于完成本實(shí)施例的步驟s03;
重建模塊,用于完成本實(shí)施例的步驟s04;
輸出模塊,用于完成本實(shí)施例的步驟s05和s06;
而本實(shí)施例中所使用的統(tǒng)計(jì)值的獲取,則通過輸入模塊、分解模塊以及統(tǒng)計(jì)模塊來完成:在使用本系統(tǒng)來進(jìn)行歸一化處理前,需要事先輸入超過200張的x線胸片圖進(jìn)行降采樣和多尺度分解,而后將分解得到的各尺度的子帶圖輸入到統(tǒng)計(jì)模塊中;統(tǒng)計(jì)模塊用于首先計(jì)算出每張圖片的能量值或mad(meanabsolutedeviation平均絕對偏差)值,再統(tǒng)計(jì)出均值、中位值、90分位值這些統(tǒng)計(jì)值,用于對而后的胸片圖像歸一化處理;本實(shí)施例中,統(tǒng)計(jì)模塊計(jì)算并統(tǒng)計(jì)出所有輸入圖像各尺度的子帶圖的能量均值,并將該均值發(fā)送給歸一化處理模塊。
由此可知,統(tǒng)計(jì)量是可以進(jìn)行更新的,系統(tǒng)每次處理x線胸片圖像時(shí),均可通過統(tǒng)計(jì)模塊對各尺度的子帶圖的能量值或mad值進(jìn)行計(jì)算,當(dāng)累計(jì)到一定數(shù)量(例如200個(gè))的計(jì)算值后,則可以重新計(jì)算統(tǒng)計(jì)值用以歸一化處理。
實(shí)施例2
本實(shí)施與實(shí)施例1的不同在于:步驟s02中,采用基于daubechies小波基db4的小波變換對降采樣后圖像進(jìn)行多尺度分解;
如圖2所示,分解得到3個(gè)尺度的子帶圖,其大小分別為:5152,2612,1342,其中前兩階子帶分別有h,v,d三個(gè)方向上的高頻系數(shù)(3副子帶圖),最后一階子帶上有a,h,v,d四個(gè)方向的小波系數(shù)(4副子帶圖);
相應(yīng)的,步驟s04中,然后將3個(gè)尺度上的共10條子帶歸一化后的子帶圖進(jìn)行基于daubechies小波基db4的小波重建;
進(jìn)而,用于實(shí)施本實(shí)施例的基于多尺度分解的圖片能量歸一化處理系統(tǒng)中,分解模塊和重建模塊所使用的算法也作相應(yīng)調(diào)整;
另外,本實(shí)施例中的統(tǒng)計(jì)值優(yōu)選的采用能量的中位數(shù),進(jìn)而本實(shí)施例所用系統(tǒng)中的統(tǒng)計(jì)模塊的算法和輸出也作相應(yīng)調(diào)整;
對所有輸入的圖片的所有i級子帶進(jìn)行統(tǒng)計(jì)后得到的能量中位數(shù)表示為enermedi,則調(diào)整后子帶圖的表達(dá)式為:
以上所述的僅是本發(fā)明的實(shí)施例,方案中公知的具體結(jié)構(gòu)和/或特性等常識在此未作過多描述。應(yīng)當(dāng)指出,對于本領(lǐng)域的技術(shù)人員來說,在不脫離本發(fā)明結(jié)構(gòu)的前提下,還可以作出若干變形和改進(jìn),這些也應(yīng)該視為本發(fā)明的保護(hù)范圍,這些都不會(huì)影響本發(fā)明實(shí)施的效果和專利的實(shí)用性。本申請要求的保護(hù)范圍應(yīng)當(dāng)以其權(quán)利要求的內(nèi)容為準(zhǔn),說明書中的具體實(shí)施方式等記載可以用于解釋權(quán)利要求的內(nèi)容。