基于集成學(xué)習(xí)的極化sar圖像半監(jiān)督分類方法
【專利摘要】本發(fā)明公開(kāi)了一種基于集成學(xué)習(xí)的極化SAR圖像半監(jiān)督分類方法,其實(shí)現(xiàn)步驟為:(1)輸入一幅極化SAR圖像;(2)提取極化SAR圖像的散射特征,偏振參數(shù)和紋理特征;(3)利用Knn算法計(jì)算樣本的抗噪因子;(4)根據(jù)樣本的權(quán)重,抽取訓(xùn)練樣本;(5)訓(xùn)練得到分類器,并計(jì)算錯(cuò)誤率;(6)根據(jù)錯(cuò)誤率調(diào)整樣本的權(quán)重;(7)根據(jù)Wishart距離,選擇置信度高的未標(biāo)記樣本,加入到訓(xùn)練集,并賦權(quán)重;(8)判斷是否滿足停止條件,滿足則結(jié)束并輸出分類結(jié)果,否則轉(zhuǎn)到(4);本發(fā)明組合偏振參數(shù),散射特征和紋理特征,能夠更全面地描述地物真實(shí)情況,并利用部分未標(biāo)記樣本,豐富了原始訓(xùn)練樣本,獲得了較好的分類精度。
【專利說(shuō)明】基于集成學(xué)習(xí)的極化SAR圖像半監(jiān)督分類方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于圖像處理【技術(shù)領(lǐng)域】,具體設(shè)及一種基于集成學(xué)習(xí)的極化SAR圖像半監(jiān) 督分類方法。
【背景技術(shù)】
[0002] 極化SAR (合成孔徑雷達(dá))因其巨大的優(yōu)勢(shì),不管是在民用或者是軍用事業(yè)都得到 了廣泛的應(yīng)用,例如目標(biāo)檢測(cè),地物分類,參數(shù)反演等等。其中,地物分類方面的應(yīng)用是極化 SAR眾多應(yīng)用中非常重要的一個(gè)。
[0003] 極化SAR圖像分類方法大致包括兩大步驟,即特征的選取和分類器的確定。如何 獲取有價(jià)值的特征和好的分類策略是極化SAR圖像分類問(wèn)題的重點(diǎn)。特征方面,常用的有 偏振參數(shù),散射矩陣和紋理特征。Cloude于1997年提出了著名的H/a分類方法,即由散射 矩陣分解得到散射滴H和散射角a,根據(jù)該兩個(gè)值可W把一幅極化SAR圖像分為8類。之 后,基于不同分解的極化SAR圖像分類方法紛紛出現(xiàn)。由于實(shí)際地物具有復(fù)雜的種類結(jié)構(gòu), 因此由某一種分解表征地物的特性是不全面的。
[0004] 一般情況下,極化SAR圖像的標(biāo)簽都是通過(guò)人工標(biāo)記獲取的,因此,很容易由于人 為因素引入錯(cuò)誤,而該些錯(cuò)誤標(biāo)簽對(duì)于分類器而言,其影響是致命的。而一般的極化SAR分 類方法中,極少考慮了該部分問(wèn)題,實(shí)際上該些由于人為因素引入的錯(cuò)誤標(biāo)簽,對(duì)分類器的 影響是不可W忽略的。
[0005] 極化SAR通過(guò)對(duì)目標(biāo)進(jìn)行全極化測(cè)量,而獲取豐富全面的目標(biāo)信息,使得極化SAR 在分類問(wèn)題中優(yōu)勢(shì)非常明顯。目前,不管是機(jī)載極化SAR還是星載極化SAR數(shù)據(jù)在網(wǎng)絡(luò)上 都可W非常方便的獲取到,而且極化SAR數(shù)據(jù)也已經(jīng)非常豐富。但是極化SAR圖像的自動(dòng) 解譯方法的發(fā)展沒(méi)有想象中的那么迅速。如何對(duì)海量級(jí)別的極化SAR數(shù)據(jù)分析,成為今后 遙感圖像處理的一個(gè)重要研究點(diǎn)。
[0006] 極化SAR圖像的分類大致分為無(wú)監(jiān)督和有監(jiān)督兩大類。對(duì)于極化SAR圖像的有 監(jiān)督分類中,最常用的是基于極化數(shù)據(jù)的統(tǒng)計(jì)分布而進(jìn)行的。例如基于協(xié)方差矩陣的復(fù) Wishart分布,基于極化測(cè)量矢量的多元復(fù)高斯分布等等。而有監(jiān)督分類必須知道一定數(shù)量 的有標(biāo)記樣本,而對(duì)于極化SAR數(shù)據(jù)而言,人工標(biāo)記訓(xùn)練樣本的該個(gè)過(guò)程,通常要花費(fèi)大量 的人力和時(shí)間,而且通過(guò)人工標(biāo)記不能保證訓(xùn)練樣本的正確性,也不能根據(jù)有限的訓(xùn)練樣 本,就能夠估計(jì)出整個(gè)樣本的分布。
【發(fā)明內(nèi)容】
[0007] 本發(fā)明的目的在于針對(duì)已有技術(shù)的不足,提出一種基于集成學(xué)習(xí)的極化SAR圖 像半監(jiān)督分類方法,一方面通過(guò)K近鄰(Knn)算法抑制了標(biāo)簽噪聲的影響,另一方面通過(guò) Wishart距離添加一部分未標(biāo)記樣本幫助分類,提高了分類精度。
[000引為實(shí)現(xiàn)上述目的,本發(fā)明包括如下步驟:
[0009] (1)提取一幅極化SAR圖像的特征,特征包括偏振參數(shù)F1、散射特征巧和紋理特 征F3 ;
[0010] (la)基于S矩陣,提取極化SAR圖像的偏振參數(shù)FI ;
[0011] Qb)基于極化散射分解,提取極化SAR圖像的散射特征巧;
[0012] (Ic)基于灰度共生矩陣,提取極化SAR圖像的紋理特征F3;
[001引 似從極化SAR圖像的已標(biāo)記樣本中選擇1%比率的樣本作為訓(xùn)練樣本,初始化訓(xùn) 練樣本的權(quán)重{W。};
[0014] (3)用K近鄰化nearest nei曲borhoods)算法計(jì)算每個(gè)訓(xùn)練樣本的抗噪因子 C。,n = 1,. . .,N ;
[0015] (3a)對(duì)極化SAR圖像中每一個(gè)有標(biāo)記的樣本點(diǎn),計(jì)算該樣本點(diǎn)和該樣本點(diǎn)的八個(gè) 近鄰像素點(diǎn)的歐氏距離;
[0016] (3b)選擇該樣本點(diǎn)的k個(gè)最近的近鄰,計(jì)算該k個(gè)近鄰與該樣本點(diǎn)屬于同一類別 的比率,即抗噪因子,k值取3;
[0017] (4)進(jìn)入迭代過(guò)程,并記錄當(dāng)前迭代次數(shù)t,初始t = 1,用弱分類器B訓(xùn)練此輪的 訓(xùn)練數(shù)據(jù),得到基分類器、;
[0018] 妨計(jì)算ht的錯(cuò)誤率
【權(quán)利要求】
1. 一種基于集成學(xué)習(xí)的極化SAR圖像半監(jiān)督分類方法,包括如下步驟: (1) 提取一幅極化SAR圖像的特征,特征包括偏振參數(shù)Fl、散射特征F2和紋理特征F3 ; (la) 基于S矩陣,提取極化SAR圖像的偏振參數(shù)Fl; (lb) 基于極化散射分解,提取極化SAR圖像的散射特征F2 ; (lc) 基于灰度共生矩陣,提取極化SAR圖像的紋理特征F3 ; (2) 從極化SAR圖像的已標(biāo)記樣本中選擇1 %比率的樣本作為訓(xùn)練樣本,訓(xùn)練樣本的個(gè) 數(shù)為N,初始化所述訓(xùn)練樣本的樣本權(quán)重{WJ,初始值都設(shè)置為1/N; (3) 用K近鄰(Knearestneighborhoods)算法計(jì)算每個(gè)訓(xùn)練樣本的抗噪因子Cn,n= 1, ? ? ? ,N; (3a)對(duì)步驟(2)中的每個(gè)訓(xùn)練樣本,計(jì)算該樣本和該樣本的八個(gè)近鄰像素點(diǎn)的歐氏距 離; (3b)選擇該樣本的八個(gè)近鄰像素點(diǎn)與該樣本的歐式距離最小的k個(gè)像素點(diǎn),計(jì)算這k個(gè)近鄰像素點(diǎn)與該樣本屬于同一類別的比率,即抗噪因子,k值取3 ; (4) 根據(jù)步驟(1)提取的所述訓(xùn)練樣本的極化SAR圖像的特征,用弱分類器B對(duì)訓(xùn)練樣 本進(jìn)行訓(xùn)練,得到基分類器ht,并記錄當(dāng)前次數(shù)t,初始t= 1 ;
其中,<是第t輪迭代中第i個(gè)樣本的權(quán)重,ht(Xi)是第i個(gè)樣本被預(yù)測(cè)的類別,5^是 第i個(gè)樣本的真實(shí)類別,N是樣本個(gè)數(shù);
其中,In是對(duì)數(shù)函數(shù),et是錯(cuò)誤率,Ct是抗噪因子; (7) 根據(jù)步驟(3)計(jì)算得到的訓(xùn)練樣本的抗噪因子,更新步驟⑵中所述的訓(xùn)練樣本的
其中,<+1是第t+1輪迭代中第i個(gè)樣本的權(quán)重,at是基分類器ht的權(quán)重,Ct是抗噪 因子,Zt是歸一化因子,WJIlJ是第一次第n個(gè)樣本的樣本權(quán)重Fh1的簡(jiǎn)寫; (8) 用(4)中訓(xùn)練得到的基分類器ht對(duì)極化SAR圖像的未標(biāo)記樣本集U預(yù)測(cè),分別計(jì) 算被預(yù)測(cè)為第m類的樣本到第m類聚類中心的距離,取距離最近的兩個(gè)樣本加入有標(biāo)記樣 本,并給這兩個(gè)樣本賦權(quán)重:
其中,彳是未標(biāo)記樣本集中的第i個(gè)樣本,4是已標(biāo)記樣本中第j個(gè)樣本,m為任意類 別標(biāo)記; (9) 重復(fù)步驟(4)?(8),若達(dá)到設(shè)置的最大迭代次數(shù)或當(dāng)錯(cuò)誤率大于0.5則結(jié)束并跳 轉(zhuǎn)到步驟(10),否則返回步驟(4)繼續(xù); (10) 將⑷?⑶步驟中產(chǎn)生的基分類器進(jìn)行組合,得到組合分類器:
其中,at是第t輪迭代的分類器的權(quán)重,ht(x)是基分類器ht對(duì)樣本X的預(yù)測(cè)結(jié)果,sign是符號(hào)函數(shù); (11) 利用步驟(10)中的組合分類器給極化SAR圖像預(yù)測(cè)分類,輸出極化SAR圖像的分 類結(jié)果。
2. 根據(jù)權(quán)利要求1所述的基于集成學(xué)習(xí)的極化SAR圖像半監(jiān)督分類方法,其特征在于, 步驟(Ia)所述的提取偏振參數(shù)Fl,包括如下步驟: 第一步,按照如下公式分別計(jì)算得到12組特征參數(shù): HH通道后向散射系數(shù): < =< 心尤> HV通道后向散射系數(shù):4 =<LiC> VV通道后向散射系數(shù):< =<K> 共極化比:rvvhh= 10Xlog(ISvv 12/IShh 12) 交叉極化比:rhvhh= 10Xlog(IShv 12/IShh 12) HV/W通道比:rhvvv= 10Xlog(IShvIVISvv 12) W/HH后向散射系數(shù)比:K> / <心乂, > HV/HH后向散射系數(shù)比:< / <" =<心又> / < > HV/VV后向散射系數(shù)比:<./< =<K,. > / <K> HH-VV相位:,=arg(<SaaSi:;. >) 去極化比j=<K> /(< 心乂, > + <K>)
其中Shh表示水平方向發(fā)射水平方向接受的極化波回波數(shù)據(jù),Shv表示水平方向發(fā)射垂 直方向接受的極化波回波數(shù)據(jù),Svh表示垂直方向發(fā)射水平方向接受的極化波回波數(shù)據(jù),Svv 表示垂直方向發(fā)射垂直方向接受的極化波回波數(shù)據(jù),&表示極化SAR圖像中水平分量和垂 直分量的頻幅差,R2表示兩個(gè)方向45度和135度的分量之間的功率差,R3表示極化SAR圖 像的電磁波在左右圓極化基下的分量之間的功率差,&表示總幅度值; 第二步,將這12組特征參數(shù)組合,得到偏振參數(shù)特征Fl。
3. 根據(jù)權(quán)利要求1所述的基于集成學(xué)習(xí)的極化SAR圖像半監(jiān)督分類方法,其特征在于, 步驟(Ib)所述的提取散射特征F2,包括如下步驟: 第一步,Pauli分解: 通過(guò)如下公式計(jì)算得到參數(shù)Ia|2,|b|2,Icl2
其中T是相干矩陣,T(1,1)T(2,2)T(3,3)分別是相干矩陣對(duì)角線上的三個(gè)元素,|a|2 表示極化SAR散射矩陣中奇次散射對(duì)應(yīng)的能量,Ib12表示極化SAR散射矩陣中偶次散射對(duì) 應(yīng)的能量,Ic12表示極化SAR散射矩陣中45度角時(shí)偶次散射對(duì)應(yīng)的能量; 第二步,Cloude分解: 通過(guò)如下公式計(jì)算得到參數(shù)H,A,a
其中X1,X2,A3是相干矩陣的三個(gè)特征值,H表示極化SAR圖像散射矩陣的散射熵, ?1是相干矩陣的第i個(gè)特征值除以所有特征值總和得到的一個(gè)比值,A表示極化SAR圖像 散射矩陣的反熵,a表示散射類型; 第三步,F(xiàn)reeman-Druden分解: 通過(guò)如下公式計(jì)算得到參數(shù)Ps,Pv,Pd < |ShJ2>=fs|el2+fdM2+fd < Is』〉=fs+fd+fv <|S^S;T\2>=fsj3 + fda + fv/3 < \Sm\2>=fv/3 其中fs表示平面散射分量系數(shù),fd表示二面角散射分量系數(shù),f7表示體散射分量系數(shù), 在此基礎(chǔ)上,根據(jù)下式計(jì)算得到三個(gè)散射功率分量:
其中Ps表示表面散射功率,Pd表示表面散射功率,Pv表示體散射功率,e表示水平發(fā) 射水平接受的反向散射系數(shù)與垂直發(fā)射垂直接受的反向散射系數(shù)的比值,當(dāng)Shh與尤,內(nèi)積 得到的實(shí)部比零小時(shí),e取1,當(dāng)Shh與 內(nèi)積得到的實(shí)部不比零小時(shí),a取-1;R值表示 極化SAR圖像的同極化比; 第四步,Krogager分解: 根據(jù)下面的式子,分解S矩陣:
其中,S表示極化SAR圖像的散射矩陣,P表示散射目標(biāo)的絕對(duì)相位值,j表示復(fù)數(shù)的虛 部符號(hào),%表示相對(duì)于二面角散射分量和螺旋體散射分量的偏移量,匕表示極化SAR圖像 的散射矩陣的球分量,kd表示極化SAR圖像的散射矩陣的二面角分量,kh表示極化SAR圖 像的散射矩陣中體散射分量;用待定系數(shù)法求解得到ks,kd,kh三個(gè)參數(shù)的值; 第五步,Huynen分解: 根據(jù)下面的式子,分解相干矩陣矩陣T:
其中,a表示極化SAR圖像的對(duì)稱性因子,c表示極化SAR圖像的構(gòu)型因子,i表示復(fù)數(shù) 虛數(shù)符號(hào),d表示極化SAR圖像局部曲率差,h表示極化SAR圖像的方向性,g表示極化SAR 圖像對(duì)稱和非對(duì)稱部分的耦合度,b表示極化SAR圖像的非規(guī)則性因子,e表示極化SAR圖 像的表面扭轉(zhuǎn)性,f表示極化SAR圖像的螺旋性,1表示極化SAR圖像的非對(duì)稱性因子,用待 定系數(shù)法求解得到Atl,BfB,Btl-B,C,D,E,F(xiàn),G,H這幾個(gè)參數(shù)值; 第六步,將這些參數(shù)組合,得到散射特征F2。
4. 根據(jù)權(quán)利要求1所述的基于集成學(xué)習(xí)的極化SAR圖像半監(jiān)督分類方法,其特征在于, 步驟(Ic)所述的提取紋理特征F3,包括如下步驟: 第一步,按照如下公式分別計(jì)算得到紋理特征:
其中,i,j分別表示極化SAR圖像對(duì)應(yīng)的兩個(gè)位置的功率值,X表示極化SAR圖像像素 對(duì)應(yīng)位置的橫坐標(biāo),y表示極化SAR圖像像素對(duì)應(yīng)位置的縱坐標(biāo),dx表示極化SAR圖像像素 的橫向偏移量,dy表示極化SAR圖像像素的縱向偏移量; 第二步,將這些特征組合,得到紋理特征F3。
5. 根據(jù)權(quán)利要求1所述的基于集成學(xué)習(xí)的極化SAR圖像半監(jiān)督分類方法,其特征在于, 步驟(11)所述的極化SAR圖像的分類結(jié)果,包括如下步驟: 以R,G,B為三基色,按照一定比率混合,得到綠色、草綠色、藍(lán)色、紅色、紫紅色、橘黃 色,不同類別分別著不同顏色。
【文檔編號(hào)】G06K9/62GK104504393SQ201410748929
【公開(kāi)日】2015年4月8日 申請(qǐng)日期:2014年12月4日 優(yōu)先權(quán)日:2014年12月4日
【發(fā)明者】王爽, 焦李成, 陳國(guó)棟, 劉闖, 張濤, 劉紅英, 熊濤, 馬文萍 申請(qǐng)人:西安電子科技大學(xué)