欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種基于形態(tài)學特征和字典學習的高光譜圖像分類方法與流程

文檔序號:11952113閱讀:871來源:國知局
一種基于形態(tài)學特征和字典學習的高光譜圖像分類方法與流程
本發(fā)明屬于圖像分類領(lǐng)域,尤其涉及一種基于形態(tài)學特征和字典學習的高光譜圖像分類方法。
背景技術(shù)
:隨著遙感技術(shù)和計算機技術(shù)的發(fā)展,高光譜遙感圖像已經(jīng)滲入到社會、經(jīng)濟的各個領(lǐng)域。同時,高光譜圖像的數(shù)量也日趨增長,如何組織圖像、對高光譜圖像進行分類任務(wù),就成為了遙感信息
技術(shù)領(lǐng)域
中一項重要的研究課題。由于高光譜圖像有著維數(shù)高、樣本少的特點,而傳統(tǒng)高光譜圖像分類方法僅考慮了光譜特性而忽略了圖像中的空間特性,加之圖像的數(shù)字化存儲與人類語義理解之間存在天然的“語義鴻溝”問題,高效可靠的高光譜圖像分類依然充滿挑戰(zhàn)。數(shù)學形態(tài)學是一種被廣泛用于圖像處理領(lǐng)域的方法,在遙感圖像領(lǐng)域中,數(shù)學形態(tài)學應用在描述高光譜圖像中地物的輪廓以及空間關(guān)系上。擴展形態(tài)學剖面(ExtendedMorphologicalProfile,EMP)是一種基于數(shù)學形態(tài)學的多層分析方法,對于高光譜圖像能夠很好的的提取其空間信息,保留圖像中的空間幾何結(jié)構(gòu)特性。由于數(shù)學形態(tài)學是一種經(jīng)典的非線性空間信息處理技術(shù),能從復雜的信息中將有意義的形狀分量提取出來,因而能夠較好的符合遙感地物分類的特性。大量研究表明,類似于EMP這樣的多尺度計算和處理,是有效地從高光譜圖像中提取空間信息的方法。而同時,近年來,在自然語言處理(NatureLanguageProcessing,NLP)上取得了巨大成功的詞袋(BagofWord,BoW)已經(jīng)成功的應用于自然圖像的分類中。詞袋模型是一種魯棒性的表示方法,能夠很好的表示出高光譜圖像的空間信息以及有效的消弭底層特征與高層語義之間的“語義鴻溝”。在詞袋模型中,需要學習一個過完備的有判別力的字典,字典中的每一項都對應數(shù)據(jù)中一部分感興趣的信號,稱之為視覺單詞(VisualWord)。字典在詞袋模型中起著關(guān)鍵性作用,直觀上視覺單詞之間有著高度的相關(guān)性,某些視覺單詞在分類中可能屬于同一類別,而某些視覺單詞的出現(xiàn)頻率也影響著其他視覺單詞的出現(xiàn)頻率?;谠~袋模型的圖像分類框架主要由以下三步組成:(1)對圖像進行底層特征的抽??;(2)通過對底層特征分析學習一個過完備的字典;(3)利用字典對底層特征進行編碼以獲取更有判別力的特征用以分類任務(wù)。技術(shù)實現(xiàn)要素:發(fā)明目的:本發(fā)明為了解決現(xiàn)有技術(shù)中的問題,提出了基于形態(tài)學特征和字典學習的高光譜圖像分類方法。
發(fā)明內(nèi)容:本發(fā)明公開了一種基于形態(tài)學特征和字典學習的高光譜圖像分類方法,包含如下步驟:對含有待分類像素點的高光譜圖像進行以下步驟1~步驟3的處理;步驟1,對高光譜圖像提取形態(tài)學特征作為底層形態(tài)學特征:輸入含有待分類像素點的高光譜圖像I,對高光譜圖像I的每個像素利用數(shù)學形態(tài)學方法計算該像素的形態(tài)學特征F;步驟2,對獲得的底層形態(tài)學特征,利用k-均值無監(jiān)督聚類方法學習一個過完備的字典;步驟3,利用學習到的字典對高光譜圖像I的每一個像素點的底層形態(tài)學特征進行編碼,獲得編碼特征;步驟4,對高光譜圖像I中的編碼特征進行采樣并分類,有標簽的的像素點數(shù)據(jù)作為訓練數(shù)據(jù)集,無標簽的像素點數(shù)據(jù)作為待分類數(shù)據(jù)集。對于AVIRISIndianPines數(shù)據(jù)集來說,本發(fā)明中選擇1000個像素點作為訓練數(shù)據(jù)集,其余19336個像素點作為待分類數(shù)據(jù)集;對于HYDICEWashingtonDCMALL數(shù)據(jù)集而言,本發(fā)明中選擇777個像素點作為訓練數(shù)據(jù)集,其余19204個像素點作為待分類數(shù)據(jù)集;步驟5,將訓練數(shù)據(jù)集中的像素點數(shù)據(jù)的編碼特征表示使用支持向量機建立分類模型(即得到支持向量機中的參數(shù)權(quán)重向量值和偏移向量值);步驟6,利用分類模型對待分類數(shù)據(jù)集中的像素點數(shù)據(jù)進行分類,得到像素點對應的分類類標,完成圖像分類任務(wù)。其中,步驟1包括如下步驟:步驟1-1,輸入含有待分類像素點的高光譜圖像I,采用核主成分分析方法將高光譜圖像I分析,并提取前d個主成分,獲得以主成分為數(shù)據(jù)的d張圖像[I1,...,Id],其中,Id表示第d張成分圖像,d在本發(fā)明中優(yōu)選13。步驟1-2,對每一個成分圖像Ii,i=1,2,...d,定義n種大小的滑動窗口,稱為結(jié)構(gòu)元素,其中n在本發(fā)明中優(yōu)選為5,通過如下公式計算每一個成分圖像Ii的形態(tài)學剖面特征MP(Ii):其中,表示成分圖像Ii的第k個開形態(tài)學剖面特征,開形態(tài)學剖面是利用不同大小的結(jié)構(gòu)元素對同一幅成分圖像使用開運算獲得的,就是開運算操作,其中R是指實數(shù)域,它是一系列膨脹操作接腐蝕操作的結(jié)果。膨脹和腐蝕操作是數(shù)學形態(tài)學中最基本的兩種操作。類似的,表示成分圖像Ii的第k個閉形態(tài)學剖面特征,閉形態(tài)學剖面是利用不同大小的結(jié)構(gòu)元素對同一幅成分圖像使用閉運算獲得的,為閉運算操作,它與開運算相反,是由一系列腐蝕運算接膨脹運算后得到。步驟1-3,將每一個成分圖像中計算得到的形態(tài)學剖面特征順序排列就得到該高光譜圖像的擴展形態(tài)學特征F:F=EMP(I)={MP(I1),...,MP(Id)},其中EMP(I)是指對圖像I利用擴展形態(tài)學剖面算法提取的特征,即擴展形態(tài)學特征F。步驟2包括:由步驟1得到高光譜圖像I中每一個像素點所對應的底層擴展形態(tài)學特征的維度是d(2n+1)維,假設(shè)高光譜圖像I包含M個像素點,則對這d(2n+1)×M維數(shù)據(jù)利用k均值聚類方法,將M個像素點數(shù)據(jù)聚成K1個類,每個類都表示一個視覺單詞,而每個像素點的特征都用這些視覺單詞中的數(shù)個線性表示,這K1個類的類中心是一個d(2n+1)維的向量,將這些類中心向量順序排列就得到學習到的字典D。其中K1在本發(fā)明中優(yōu)選512。步驟3包括:通過如下目標函數(shù)計算得到編碼特征c:s.t.1Tcj=1,∀j,]]>其中算子表示計算滿足后面式子中最小的c,j為遍歷下標,cj表示第j個編碼特征,j取值為1~M,λ是權(quán)重參數(shù),在本發(fā)明中優(yōu)選為0.1,s.t.是使得…滿足…的意思。F=[f1,...,fj,...fN],⊙記錄了元素之間的點乘,sj表示第j個擴展形態(tài)學特征fj和字典D中第j個編碼基的距離,通過如下公式計算:是||fj-cp||22<γ,j=1,2,...,|ζj‾|,p=1,2,...,K1,]]>是指第p個視覺單詞中所包含的特征點個數(shù),cp表示第p個編碼特征,其中對于每個擴展形態(tài)學特征在計算距離時選取最近鄰的l個視覺單詞對其進行編碼,γ為參數(shù),在本發(fā)明中優(yōu)選為0.75。根據(jù)目標函數(shù)固定了擴展形態(tài)學特征和字典D獲得最終的編碼特征c。步驟4中包括:對高光譜圖像編碼特征按列進行排列,以每列的K1維編碼表示一個像素點的特征,將所有M個K1維編碼特征按地圖像素序列進行標記,對應地構(gòu)造出一個標簽map,并將有標簽的像素點數(shù)據(jù)與待標簽的像素點數(shù)據(jù)分離,有標簽的的像素點數(shù)據(jù)作為訓練數(shù)據(jù)集,無標簽的像素點數(shù)據(jù)作為待分類數(shù)據(jù)集。步驟5包括:以訓練數(shù)據(jù)集中的像素點數(shù)據(jù)的編碼特征為輸入,利用標準的線性支持向量機對分類任務(wù)進行建模。即將步驟4獲得的高光譜圖像的編碼特征向量按像素點排列,對每類地物的高光譜圖像編碼特征,隨機選擇一定數(shù)量的特征作為訓練數(shù)據(jù),在本發(fā)明中,在AVIRISIndianPines以及HYDICEWashingtonDCMall數(shù)據(jù)集上分別選擇1000個樣本和777個樣本作為訓練數(shù)據(jù),其余的特征作為待分類數(shù)據(jù)。步驟6包括:對于待分類數(shù)據(jù)集中的像素點數(shù)據(jù)的編碼特征,利用步驟5中得到的模型對其進行分類,給予該像素點類標,完成分類任務(wù)。本發(fā)明是為了解決現(xiàn)有高光譜圖像分類方法中,忽略了高光譜圖像中豐富的空間信息以及圖像底層編碼與高層語義之間固有的“語義鴻溝”問題而提出的新型字典學習框架。本發(fā)明具有以下特征:首先,對高光譜圖像數(shù)據(jù)提取數(shù)學形態(tài)學特征作為富含空間信息的底層特征。然后,使用k均值方法聚類生成過完備的字典。最后,使用局部約束線性編碼對底層特征進行編碼,以獲得能夠較好保持特征空間結(jié)構(gòu)信息的高層語義編碼,同時也消除了圖像底層特征與圖像高層語義之間的“語義鴻溝”。實驗結(jié)果表明該方法能夠獲得更加有判別力的語義特征,獲得較好的分類效果。本發(fā)明可用于高光譜圖像分類方面的任務(wù)。本發(fā)明提出了一種基于字典學習的擴展形態(tài)學剖面編碼方法應用于高光譜圖像分類上。指出現(xiàn)有的高光譜圖像分類框架沒有充分考慮到圖像空間信息以及圖像高層語義與底層特征的“語義鴻溝”問題。為此設(shè)計一種利用字典學習同時考慮上述兩個問題的分類框架。首先,利用擴展形態(tài)學剖面提取高光譜圖像中的形態(tài)學特征以利用空間信息;然后,基于提取的底層特征利用k-均值算法學習一個過完備的字典;最后,利用局部約束線性編碼基于學習到的字典對底層特征進行編碼,獲得富含空間信息的高層表示。使用得到的編碼作為特征用分類器分類,實驗結(jié)果表明與傳統(tǒng)的高光譜圖像分類方法相比,本發(fā)明提出的方法能夠提高分類的準確率,獲得較好的分類效果。有益效果:本發(fā)明應用在高光譜圖像分類領(lǐng)域,在高光譜圖像特征表示上,本發(fā)明提取高光譜圖像中豐富的空間信息,同時能夠消除圖像底層特征與高層語義之間的“語義鴻溝”,在高光譜圖像分類上有著顯著的效果,因此基于形態(tài)學特征和字典學習的高光譜圖像分類方法具有較高的使用價值。附圖說明下面結(jié)合附圖和具體實施方式對本發(fā)明做更進一步的具體說明,本發(fā)明的上述和/或其他方面的優(yōu)點將會變得更加清楚。圖1為本發(fā)明流程圖。圖2為IndianPines數(shù)據(jù)集真值圖。圖3為IndianPines數(shù)據(jù)集分類結(jié)果示意圖。圖4為不同匯合策略在分類準確率上的比較圖。具體實施方式如圖1所示,本發(fā)明公開了一種基于形態(tài)學特征和字典學習的高光譜圖像分類方法,包含如下步驟:對含有待分類像素點的高光譜圖像進行以下步驟1~步驟3的處理;步驟1,對高光譜圖像提取形態(tài)學特征作為底層特征:對高光譜圖像I的每個像素利用數(shù)學形態(tài)學方法計算該像素的形態(tài)學特征F;步驟2,對獲得的底層形態(tài)學特征,利用k-均值無監(jiān)督聚類方法學習一個過完備的字典;步驟3,利用學習到的字典對高光譜圖像I的每一個像素的底層形態(tài)學特征進行編碼,獲得編碼特征;步驟4,對高光譜圖像I中的編碼特征進行采樣:隨機以每類地物對應的一定數(shù)量有標簽的的像素作為訓練數(shù)據(jù)集,無標簽的數(shù)據(jù)作為待分類數(shù)據(jù)集;步驟5,將訓練數(shù)據(jù)的編碼特征表示使用支持向量機進行建模;步驟6,利用分類模型對待分類數(shù)據(jù)進行分類。步驟1對高光譜圖像提取底層形態(tài)學特征具體包括如下步驟:首先利用核主成分分析方法將高光譜圖像I分析,并提取前d個主成分,獲得以主成分為數(shù)據(jù)的d張圖像[I1,...,Id]。其中d在本發(fā)明中優(yōu)選13。對每一個成分圖像Ii,i=1,2,...d,定義n種大小的滑動窗口,稱為結(jié)構(gòu)元素,其中n在本發(fā)明中優(yōu)選。計算每一個成分圖像的形態(tài)學剖面MP(Ii):其中是開形態(tài)學剖面特征,開形態(tài)學剖面是利用不同大小的結(jié)構(gòu)元素對同一幅成分圖像使用開運算獲得的,就是開運算操作,其中R是指實數(shù)域,它是一系列膨脹操作接腐蝕操作的結(jié)果。膨脹和腐蝕操作是數(shù)學形態(tài)學中最基本的兩種操作。類似的,是閉形態(tài)學剖面特征,它是利用不同大小的結(jié)構(gòu)元素對同一幅成分圖像使用閉運算獲得的,即是閉運算操作,它與開運算相反,是由一系列腐蝕運算接膨脹運算后得到。將每一個成分圖像中計算得到的形態(tài)學剖面特征順序排列就得到該高光譜圖像的擴展形態(tài)學特征F:F=EMP(I)={MP(I1),...,MP(Id)},其中EMP(I)是指對圖像I利用擴展形態(tài)學剖面算法提取的特征,也即擴展形態(tài)學特州F。步驟2的字典學習包括:由步驟1可知,對于高光譜圖像I,它每一個像素點所對應的底層擴展形態(tài)學特征的維度是d(2n+1)維,假設(shè)高光譜圖像I包含M個像素點,則對這d(2n+1)×M維數(shù)據(jù)利用k均值聚類方法,將M個數(shù)據(jù)聚成K個類,每個類都表示一個視覺單詞,而每個像素點的特征都可以用這些視覺單詞中的數(shù)個線性表示。這K個類的類中心是一個d(2n+1)維的向量,將這些類中心向量順序排列就得到學習到的字典D。其中K在本發(fā)明中優(yōu)選512。步驟3的編碼階段包括:對于步驟1得到擴展形態(tài)學特征F和步驟2得到的字典D,根據(jù)局部限制線性編碼的目標函數(shù)利用D對特征F進行編碼,以獲得需要的編碼c:s.t.1Tcj=1,∀j,]]>其中F=[f1,...,fj,...fN],⊙記錄了元素之間的點乘,sj是f和字典D中第j個編碼基的距離:是指第p個視覺單詞中所包含的特征點個數(shù)。根據(jù)目標函數(shù)固定了f和D能夠獲得最終的編碼特征c。其中對于每個特征f在計算距離是選取最近鄰的l個視覺單詞對其進行編碼。步驟5的采樣階段包括:將步驟4獲得的高光譜圖像的編碼特征向量按像素點排列,對每類地物的高光譜圖像編碼特征,隨機選擇一定數(shù)量的特征作為訓練數(shù)據(jù),在本發(fā)明中,在AVIRISIndianPines以及HYDICEWashingtonDCMall數(shù)據(jù)集上分別選擇1000個樣本和777個樣本作為訓練數(shù)據(jù),其余的特征作為待分類數(shù)據(jù)。步驟6的建模階段包括:對于訓練數(shù)據(jù)的所有像素點對應的編碼特征,對其使用線性支持向量機進行建模。步驟7的分類階段包括:對于待分類的像素點的編碼特征,利用步驟6中所得到的模型對這些向量進行分類判定,以獲得最終的分類結(jié)果。實施例1本實施例包括以下部分:1、提取高光譜圖像底層特征:首先利用核主成分分析方法將高光譜圖像I分析,并提取前d個主成分,獲得以主成分為數(shù)據(jù)的d張圖像[I1,...,Id]。其中d在本發(fā)明中優(yōu)選13。對每一個成分圖像Ii,i=1,2,...d,定義n種大小的滑動窗口,稱為結(jié)構(gòu)元素,其中n在本發(fā)明中優(yōu)選。計算每一個成分圖像的形態(tài)學剖面MP(Ii):其中是開形態(tài)學剖面特征,開形態(tài)學剖面是利用不同大小的結(jié)構(gòu)元素對同一幅成分圖像使用開運算獲得的,就是開運算操作,其中R是指實數(shù)域,它是一系列膨脹操作接腐蝕操作的結(jié)果。膨脹和腐蝕操作是數(shù)學形態(tài)學中最基本的兩種操作。類似的,是閉形態(tài)學剖面特征,它是利用不同大小的結(jié)構(gòu)元素對同一幅成分圖像使用閉運算獲得的,即是閉運算操作,它與開運算相反,是由一系列腐蝕運算接膨脹運算后得到。將每一個成分圖像中計算得到的形態(tài)學剖面特征順序排列就得到該高光譜圖像的擴展形態(tài)學特征F:F=EMP(I)={MP(I1),...,MP(Id)}2、字典學習:對于高光譜圖像I,它每一個像素點所對應的底層擴展形態(tài)學特征的維度是d(2n+1)維,假設(shè)高光譜圖像I包含M個像素點,則對這d(2n+1)×M維數(shù)據(jù)利用k均值聚類方法,將M個數(shù)據(jù)聚成K個類,每個類都表示一個視覺單詞,而每個像素點的特征都可以用這些視覺單詞中的數(shù)個線性表示。這K個類的類中心是一個d(2n+1)維的向量,將這些類中心向量順序排列就得到學習到的字典D。其中K在本實例中優(yōu)選512。3、特征編碼:在編碼階段,對于一個學習到的的字典,可以使用局部約束線性編碼(LLC)算法對得到的底層特征進行編碼。LLC編碼方式是一種集合了硬編碼(VQ)和軟編碼(SC)優(yōu)點的編碼方式。首先,學習硬編碼可以看作是一種廣義的零階局域方法。然后,LLC也可以看做是一種局部性的稀疏編碼。受生物視覺系統(tǒng)的啟發(fā),研究人員認為人的視覺總是關(guān)注少數(shù)個特點,因此稀疏特征對于特征學習是有效的。然而并沒有理論分析說明為什么稀疏性對高維特征空間的學習是有效的。前人研究說明了一個良好的一階非線性函數(shù)能夠使得編碼是局部性的,從而導致編碼的結(jié)果是稀疏的。這也說明了局部性比稀疏性更為本質(zhì),而稀疏性只是局部性的一種結(jié)果而已?;诖耍琇LC應該是更適合于特征編碼的算法。如此,則可以通過優(yōu)化下式來求解編碼:s.t.1Tcj=1,∀j]]>其中F=[f1,...,fj,...fN],⊙記錄了元素之間的點乘,sj是f和字典D中第j個編碼基的距離,其描述兩者之間的相似比例:是指第p個視覺單詞中所包含的特征點個數(shù)。根據(jù)目標函數(shù)固定了f和D能夠獲得最終的編碼特征c。其中對于每個特征f在計算距離是選取最近鄰的l個視覺單詞對其進行編碼。4、訓練集采樣:將高光譜圖像的編碼特征向量按像素點排列,對每類地物的高光譜圖像編碼特征,隨機選擇一定數(shù)量的特征作為訓練數(shù)據(jù),在本實例中,在AVIRISIndianPines數(shù)據(jù)集上分別選擇1000個樣本作為訓練數(shù)據(jù),其余的特征作為待分類數(shù)據(jù)。5、進行建模:對于訓練數(shù)據(jù)的所有像素點對應的編碼特征,使用線性支持向量機(Supportvectormachine,SVM)對數(shù)據(jù)進行建模。6、圖像分類:對于待分類的高光譜圖像的編碼特征,利用所得到的模型對這些特征進行分類判定,使得模型對該高光譜圖像中的每一個待分類的像素點都有一個類的定性,從而獲得最終的分類結(jié)果。實施例2圖2為來源為IndianPines數(shù)據(jù)集的圖像真值表,其縱橫坐標為該高光譜圖像所對應物理空間像素點,每個像素點約代表20平方米的真實地理空間大小。圖3為用本發(fā)明方法在IndianPines上的分類效果圖,與真值表對比可知本發(fā)明方法在絕大部分像素點的分類結(jié)果均正確,僅有少量像素點會有分類誤差產(chǎn)生。(由于附圖均為灰度圖,因此圖2和圖3)圖4為使用不同的參數(shù)l在IndianPines數(shù)據(jù)上獲得的分類準確率,其中縱坐標為分類準確率,橫坐標為發(fā)明中l(wèi)的取值個數(shù)??梢钥吹?,隨著l的增長,分類準確率也隨之上升,但上升的速率隨著l的不斷攀升而減弱。當l的取值大于250(即將近一半的字典維數(shù))時,分類準確率的上升就非常的緩慢了。但是,計算的時間復雜度則一直增大。為了平衡時間復雜的開銷,在本發(fā)明中優(yōu)選250為最佳參數(shù)選擇。本發(fā)明提供了一種基于形態(tài)學特征和字典學習的高光譜圖像分類方法,具體實現(xiàn)該技術(shù)方案的方法和途徑很多,以上所述僅是本發(fā)明的優(yōu)選實施方式,應當指出,對于本
技術(shù)領(lǐng)域
的普通技術(shù)人員來說,在不脫離本發(fā)明原理的前提下,還可以做出若干改進和潤飾,這些改進和潤飾也應視為本發(fā)明的保護范圍。本實施例中未明確的各組成部分均可用現(xiàn)有技術(shù)加以實現(xiàn)。當前第1頁1 2 3 
當前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
平邑县| 梁平县| 赞皇县| 汝阳县| 扎鲁特旗| 叶城县| 万州区| 鹿泉市| 隆子县| 马公市| 招远市| 临沂市| 永平县| 墨竹工卡县| 独山县| 承德市| 鄂伦春自治旗| 靖西县| 建水县| 夏河县| 江津市| 额尔古纳市| 休宁县| 东乌珠穆沁旗| 枞阳县| 林芝县| 浮山县| 盐津县| 安多县| 和林格尔县| 东台市| 桦川县| 昌乐县| 铁岭县| 凤山县| 砀山县| 保亭| 太谷县| 江川县| 滦南县| 博客|