專利名稱:基于重要位平面的圖像檢索新方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種基于重要位平面的圖像檢索新方法,屬于計算機(jī)視覺、模式識別以及圖像檢索等多個領(lǐng)域的交叉學(xué)科。
背景技術(shù):
自90年代以來,隨著多媒體技術(shù)與網(wǎng)絡(luò)技術(shù)(特別是Internet技術(shù))的迅猛發(fā)展,數(shù)字圖像的來源正在不斷擴(kuò)大。為了能夠從大量的圖像數(shù)據(jù)中快速、準(zhǔn)確地找到用戶所需內(nèi)容,基于內(nèi)容的圖像檢索(Content Based Image Retrieval)技術(shù)得到了廣泛關(guān)注,并已成為國際學(xué)術(shù)界研究的一個熱點。圖像特征的提取與表達(dá)是基于內(nèi)容圖像檢索技術(shù)的基礎(chǔ)。圖像的內(nèi)容主要包括顏色、紋理、形狀以及子對象空間位置關(guān)系等。由于顏色是圖像最直觀的特征,也是圖像視覺重要的感知特性之一,其不僅與圖像中的物體和場景密切相關(guān),而且對圖像本身尺寸、方向、視角的依賴性較小,因此基于顏色的圖像查詢是基于內(nèi)容的圖像檢索中最基本和重要的方法。其中,顏色直方圖(Color Histogram)更是以其特征提取與相似度計算簡單、對圖像尺度與旋轉(zhuǎn)變化不敏感等優(yōu)點,成為圖像檢索系統(tǒng)應(yīng)用最為廣泛的顏色特征。然而,理論分析和實驗結(jié)果表明,傳統(tǒng)顏色直方圖檢索技術(shù)普遍存在丟失顏色空間分布信息、特征維數(shù)過高、無法有效檢索含噪聲圖像等問題。因此,為了克服顏色直方圖檢索技術(shù)存在的弊端,必須將顏色信息與空間信息進(jìn)行結(jié)合,而這種結(jié)合要保證在不增加時間復(fù)雜度的情況下,進(jìn)一步提高檢索準(zhǔn)確率,同時能夠抵抗各種噪聲的干擾。針對這一問題,人們已經(jīng)陸續(xù)提出了一些方法顏色直方圖相交法,該方法雖具有特征提取和相似度計算簡便的優(yōu)點,但是在進(jìn)行顏色量化時會丟失顏色信息,同時,全局顏色直方圖只記錄了全局的顏色統(tǒng)計信息,而丟失了顏色的空間分布信息;累加直方圖方法,雖可通過累加方式來增加直方圖的魯棒性,但仍會丟失顏色的空間分布信息;類似紋理共生矩陣的方法雖然能在一定程度上提取圖像的顏色信息和空間信息,但存在計算復(fù)雜度大等問題。另外,也有一些研究人員提出了顏色特征與空間特征進(jìn)行結(jié)合的方法,這種方法雖然同時考慮了顏色信息與空間信息,但是計算量非常大,更重要的是對于含有噪聲的圖像庫,檢索準(zhǔn)確率很低,即對含噪聲的圖片不具有魯棒性。
Ritendra Datta,Jia Li,James Z.Wang.Content-based image retrieval-approaches andtrends of the new age.Proc.International Workshop on Multimedia Information Retrieval,ACM,pp.253-262,Singapore,November 2005.
發(fā)明內(nèi)容
為解決上述問題,本發(fā)明提出了一種基于重要位平面的圖像檢索新方法,與其它方法不同,我們認(rèn)為重要位平面足以代表圖像的主要信息,更重要的是能夠避免噪聲的干擾,在此基礎(chǔ)上,對圖像進(jìn)行顏色特征與空間特征提取,然后綜合這兩種特征進(jìn)行相似度測量,增加了檢索的準(zhǔn)確率。
大量的實驗證明,本發(fā)明所提出的方法相對于其它方法,具有兩個明顯的優(yōu)點第一,對圖像進(jìn)行位平面分解,提取出圖像的重要位平面,它們包含了圖像的主要信息,而且計算簡單;第二,在重要位平面的基礎(chǔ)上進(jìn)行圖像信息提取,可以避免噪聲的干擾,增強(qiáng)了圖像檢索的準(zhǔn)確率。
本發(fā)明的基本思想是圖像的重要位平面可以很好的表征圖像整體信息,而且忽略圖像的低位平面可以抵抗噪聲的干擾。所以,不是直接利用圖像的信息進(jìn)行檢索,而是先選取圖像的重要位平面,利用重要位平面中的信息來描述圖像、檢索圖像。
本發(fā)明的技術(shù)特征在于首先,對待查詢圖像進(jìn)行位平面分解操作,選取重要的位平面代表圖像的主要信息;然后,提取每個位平面上的顏色信息與空間信息,綜合這些信息作為特征進(jìn)行圖像檢索;最后,將待查詢圖像形成的特征與數(shù)據(jù)庫中圖像的特征進(jìn)行匹配,根據(jù)相似度排序,輸出檢索集合。
由數(shù)字圖像相關(guān)理論知(1)圖像數(shù)據(jù)是以多比特方式存儲的。例如,對256級灰度圖像來說,刻畫表示一個象素需要8個信息位(每個信息位的取值為0或1);而對于24位真彩色圖像(RGB方式)來說,刻畫表示一個象素需要24個信息位,且R、G和B三色各需要8個信息位(每個信息位的取值為0或1);(2)不同信息位其權(quán)值也是不同的。
圖像位平面是將圖像中每一個象素值分解為二進(jìn)制值,而把所有具有相同權(quán)值的位所構(gòu)成的平面稱為位平面。對于256級灰度圖像來說,每個象素占一個字節(jié),即8個二進(jìn)制位,按從高位到低位的排列為b7b6b5b4b3b2b1b0,那么所有象素的b0位就構(gòu)成第0個位平面,b1位就構(gòu)成第1個位平面等等,依此類推,該256級灰度圖像共包含有8個位平面。我們同樣可以把一幅24位真彩色圖像分解成8個位平面,所不同的是,其每個位平面均由R,G,B三個分量的位平面復(fù)合而成。
從位平面分布特點可以看出,隨著位平面從高位到低位(即從位平面7到位平面0),位平面圖像特征逐漸變得復(fù)雜,背景噪聲(也稱隨機(jī)紋理)不斷增加,原圖輪廓逐漸變得模糊直至消失。到位平面0,紋理隨機(jī)布滿整個圖片,單從該位平面圖像已無法看出原圖信息。這恰恰表明,不同信息位對數(shù)字圖像的貢獻(xiàn)是不同的,較高位平面(以下簡稱為“重要位平面”)反映原始圖像的主要內(nèi)容,而較低位平面所攜帶的原始信號能量極少,即忽略較低位平面對原圖像質(zhì)量沒有太大影響。
噪聲攻擊特點數(shù)字圖像遭受噪聲攻擊(光照、銳化、模糊等)以后,其低位平面信息變化較大,而重要位平面信息幾乎沒有變化,也就是說噪聲主要集中在較低位平面。
圖像的重要位平面提取對于一幅24位真彩色圖像(RGB空間),只需要提取其R,G,B分量的最高5個位平面(即重要位平面)就足以表達(dá)圖像內(nèi)容。則真彩色圖像I的位平面分解可定義為 其中,I(i,j)(0≤i<M,0≤j<N)代表原始彩色圖像I的第i行、第j列象素的顏色值,p=3,4…,7表示位平面(p=3代表位平面3,p=4代表位平面4,依此類推)t=1,2,3表示R,G,B三個分量;Bp,t(·)表示圖像的位平面分解操作。經(jīng)過以上位平面分解處理,真彩色圖像I就被分解為15個位平面,并且這些位平面都是二值的(0或1)。
位平面的復(fù)合考慮到真彩色圖像的每個象素都是由R,G,B三個分量復(fù)合而成的,所以對圖像進(jìn)行位平面分解操作后,可將相同權(quán)值位平面對應(yīng)的R,G,B三個分量重新組合成新象素,以形成新的位平面圖像,這樣由原來分解出的15個位平面圖像最終轉(zhuǎn)換成5個位平面圖像(即重要位平面圖像)。
因為R,G,B三個分量的每個分量取值都是0或1,所以重新組合后的重要位平面圖像顏色值范圍為0~7,通過統(tǒng)計每個重要位平面圖像中各象素點顏色值的頻數(shù),就可以得到重要位平面圖像的顏色直方圖,為了使顏色直方圖不隨尺度變化,需要對其進(jìn)行歸一化處理。
另外,重要位平面圖像顏色直方圖雖很好地反映了圖像的顏色信息,但其無法準(zhǔn)確刻畫圖像顏色的空間分布特征。為此,結(jié)合空間矩理論,給出重要位平面圖像的空間特征表示。
首先,計算出重要位平面圖像Dp(i,j)中顏色k的空間分布重心Op(ip(k),jp(k))。
矩對于圖像I,它的二維p+q階空間矩可定義為Mpq=Σi=0M-1Σj=0N-1ipjqI(i,j),p,q=0,1,2,···]]>重心坐標(biāo)圖像I的重心坐標(biāo)O(i,j)可定義為(i‾,j‾)=(M10M00,M01M00)]]>
與此相對應(yīng),將重要位平面圖像Dp(i,j)中顏色k的空間分布重心Op(ip(k),jp(k))定義為i‾p(k)=1Ep(k)Σ(i,j)∈Ap(k)i×Dp(i,j),]]>j‾p(k)=1Ep(k)Σ(i,j)∈Ap(k)j×Dp(i,j)]]>其中,Ap(k)表示重要位平面圖像Dp(i,j)中顏色值為k的象素點集合,而Ep(k)表示Ap(k)所包含的象素點數(shù)目。
然后,計算出重要位平面圖像Dp(i,j)中顏色k相對其重心的標(biāo)準(zhǔn)偏差σp(k),并將其作為空間特征。
σp(k)=Σ(i,j)∈Ap(k)(i-i‾p(k))2+(j-j‾p(k))2Ep(k)]]>顏色k的標(biāo)準(zhǔn)偏差σp(k)很好地刻畫了顏色k與其均值的偏差程度,反映了顏色的空間分布特性。
在圖像匹配時,本發(fā)明將顏色與空間特征結(jié)合作為相似性測度,同時考慮到基于重要位平面的檢索需要提取各個重要位平面圖像的特征進(jìn)行查詢,所以將每一個位平面賦予權(quán)值,綜合這些位平面的距離作為總的相似度。當(dāng)距離足夠小時,就認(rèn)為兩幅圖像是相似的。通過計算數(shù)據(jù)庫中每一幅圖像與示例圖像之間的相似度,然后按照相似度由大到小的順序返回圖像檢索的查詢結(jié)果。
圖1本發(fā)明的基本流程2使用本發(fā)明完成的檢索例子圖3使用本發(fā)明完成的檢索例子(圖庫中含噪聲圖像)具體實施方式
現(xiàn)結(jié)合附圖對本發(fā)明做進(jìn)一步描述根據(jù)本發(fā)明提出的基于重要位平面的圖像檢索方法,我們用Visual C++6.0程序設(shè)計語言實現(xiàn)了該方法。選用SIMP LIcity系統(tǒng)使用的測試集(http//wang.ist.psu.edu/docs/related)作為圖像庫,該測試集是從Corel圖像庫中選取的,共包含有10個語義類,包括汽車、馬、花卉、大象、建筑物、海灘等。其中,每個語義類包含有100幅圖像,共計1000幅圖像(編號分別為0~999)。
為評價圖像檢索算法的效果,同時考慮到檢索系統(tǒng)返回的相似圖像數(shù)目(不是所有)不適宜采用常規(guī)的查準(zhǔn)率(Precision)和查全率(Recall)評價指標(biāo),故本發(fā)明采用了Tan Kian-Lee等提出的“標(biāo)準(zhǔn)查準(zhǔn)率(Normal Precision)”和“標(biāo)準(zhǔn)查全率(Normal Recall)”作為相似檢索的評價準(zhǔn)則。標(biāo)準(zhǔn)查準(zhǔn)率PNormal和標(biāo)準(zhǔn)查全率RNormal的具體定義為PNormal=1-Σi=1L(logri-logi)logN!(N-L)!L!,]]>RNormal=1-Σi=1L(ri-i)(N-L)L]]>其中,N為檢索系統(tǒng)返回的圖像數(shù)目(實驗中N選取為20),L是檢索結(jié)果中與示例圖像相關(guān)的圖像數(shù)目,ri是第i幅相關(guān)圖像的排序。
假設(shè)示例圖像為Q,數(shù)據(jù)庫中待檢索圖像為I,則Q、I之間的重要位平面圖像距離定義為Sp(Q,I)=Σk=07|HpQ(k)-HpI(k)|×min(σpQ(k),σpI(k))max(σpQ(k),σpI(k))]]>其中,HpQ(k)和HpI(k)分別是Q與I的重要位平面圖像顏色特征,σpQ(k)和σpI(k)分別是Q與I的重要位平面圖像空間特征,k=0,1…,7表示顏色值,p=3,4,…7代表重要位平面。
考慮到基于重要位平面的檢索需要提取各個重要位平面圖像的特征進(jìn)行查詢,所以圖像Q與I間總的相似度為S′(Q,I)=Σp=37wp×SP(Q,I)]]>其中,wp為各個重要位平面的權(quán)值,將其統(tǒng)一設(shè)置為0.2,p=3,4,…7代表重要位平面。
我們以SIMP LIcity系統(tǒng)使用的測試集作為測試平臺,從中隨機(jī)抽取50幅作為示例圖像,其中每類5幅,每次查詢返回前20幅最相似的圖像作為檢索結(jié)果,與傳統(tǒng)方法相比,本發(fā)明對于圖像檢索很有效。
為了說明本發(fā)明的魯棒性,我們首先從測試圖像庫的每類語義圖像中隨機(jī)抽取30幅圖像(共計300幅);然后對這300幅圖像分別進(jìn)行加噪處理(包括模糊、銳化、光照、濾波等);最后將上述300幅含噪聲圖像(編號為1000~1229)與原來的1000幅圖像集中在一起以構(gòu)成新的測試圖像庫進(jìn)行檢索。我們發(fā)現(xiàn)本發(fā)明不僅可以有效檢索出示例圖像所對應(yīng)的含噪聲圖像,而且能夠有效檢索出同類圖像所對應(yīng)的含噪聲圖像,具有較好的魯棒性。
權(quán)利要求
1.一種基于重要位平面的圖像檢索新方法,其特征在于首先,對待查詢圖像進(jìn)行重要位平面提??;然后提取重要位平面的顏色和空間信息作為檢索特征;再利用上述顏色、空間兩種特征計算圖像間內(nèi)容的相似度;最后將待查詢圖像與圖像庫中的圖像進(jìn)行特征匹配。
2.根據(jù)權(quán)利要求1所述的一種基于重要位平面的圖像檢索方法,其特征在于提取真彩色圖像的最高五個位平面作為重要位平面。 其中,I(i,j)(0≤i<M,0≤j<N)代表原始彩色圖像I的第i行、第j列象素的顏色值,p=3,4…,7表示位平面(p=3代表位平面3,p=4代表位平面4,依此類推);t=1,2,3表示R,G,B三個分量;Bp,t(·)表示圖像的位平面分解操作。
3.根據(jù)權(quán)利要求1所述的一種基于重要位平面的圖像檢索方法,其特征在于經(jīng)圖像位平面分解操作后,將具有相同權(quán)值位平面所對應(yīng)的R,G,B三個分量重新組合成新象素,以形成新的位平面圖像Dp(p=3,4…7),其中Dp={Dp(i,j),0≤i<M,0≤j<N}。
4.根據(jù)權(quán)利要求3所述的一種基于重要位平面的圖像檢索方法,其特征在于對于新的位平面圖像R,G,B三個分量來說,每個分量的取值都是0或1,所以重新組合后的重要位平面圖像的象素值范圍為0~7。
5.根據(jù)權(quán)利要求1所述的一種基于重要位平面的圖像檢索方法,其特征在于對重要位平面圖像統(tǒng)計顏色直方圖并進(jìn)行歸一化處理。
6.根據(jù)權(quán)利要求1所述的一種基于重要位平面的圖像檢索方法,其特征在于計算重要位平面圖像中顏色k相對其重心Op(ip(k),jp(k))的標(biāo)準(zhǔn)偏差σp(k)作為空間特征。σp(k)=Σ(i,j)∈Ap(k)(i-i‾p(k))2+(j-j‾p(k))2Ep(k)]]>其中,Ap(k)表示重要位平面圖像Dp(i,j)中顏色值為k的象素點集合,而Ep(k)表示Ap(k)所包含的象素點數(shù)目。
7.根據(jù)權(quán)利要求1所述的一種基于重要位平面的圖像檢索方法,其特征在于圖像匹配是依據(jù)圖像間的顏色和空間特征的相似性進(jìn)行度量的,查詢圖像Q與數(shù)據(jù)庫中圖像I間的距離定義為Sp(Q,I)=Σk=07|HpQ(k)-HpI(k)|×min(σpQ(k),σpI(k))max(σpQ(k),σpI(k))]]>其中,HpQ(k)和HpI(k)分別是Q與I的重要位平面圖像顏色特征,σpQ(k)和σpI(k)分別是Q與I的重要位平面圖像空間特征。考慮到基于重要位平面的檢索需要提取各個重要位平面圖像的特征進(jìn)行查詢,圖像間總的相似度為S′(Q,I)=Σp=37wp×SP(Q,I)]]>其中,wp為各個重要位平面的權(quán)值。
全文摘要
本發(fā)明涉及一種基于重要位平面的圖像檢索新方法,利用圖像位平面原理,結(jié)合噪聲攻擊特點(對高位平面影響較小),通過提取圖像重要位平面的內(nèi)容來檢索相似圖像。該發(fā)明主要包括如下特點首先從原始圖像中提取重要位平面;然后選取重要位平面圖像的顏色直方圖作為顏色特征,選取重要位平面圖像的顏色標(biāo)準(zhǔn)偏差作為空間特征;最后綜合利用上述顏色、空間兩個特征計算圖像間內(nèi)容的相似度,根據(jù)相似度排序,輸出相似圖像集合。本發(fā)明所提出的圖像檢索方法不僅計算簡單,而且具有較高的查準(zhǔn)率和查全率,特別對光照、銳化、模糊等噪聲攻擊均具有較好的魯棒性。
文檔編號G06F17/30GK101038668SQ20061006758
公開日2007年9月19日 申請日期2006年3月18日 優(yōu)先權(quán)日2006年3月18日
發(fā)明者王向陽, 胡峰麗 申請人:遼寧師范大學(xué)