本發(fā)明屬于農(nóng)業(yè)災(zāi)害識別領(lǐng)域,特別涉及多特征融合的玉米前期圖像旱情識別方法。
背景技術(shù):
圖像處理是計(jì)算機(jī)的一種相關(guān)技術(shù),它是為了達(dá)到某種目的而對圖像進(jìn)行運(yùn)算和處理的一種過程,一般將圖像信號轉(zhuǎn)化為數(shù)字信號并利用計(jì)算機(jī)對其進(jìn)行處理。在圖像處理技術(shù)發(fā)展的早期,主要是在人的視覺效果和圖像質(zhì)量上進(jìn)行改善。隨著圖像處理技術(shù)的迅猛發(fā)展,其技術(shù)已經(jīng)十分成熟,在很多領(lǐng)域和行業(yè)得到了廣泛的應(yīng)用,如:刑偵技術(shù)、通訊技術(shù)、醫(yī)學(xué)影像、生物識別、氣象等方面。然而數(shù)字圖像處理在農(nóng)業(yè)中的應(yīng)用相對滯后,但是對農(nóng)業(yè)的影響在逐步深入。目前計(jì)算機(jī)圖像處理技術(shù)在農(nóng)業(yè)中的主要應(yīng)用有:農(nóng)作物狀態(tài)監(jiān)測、果實(shí)成熟度監(jiān)測、作物形狀識別分析、作物病蟲害監(jiān)測等。
當(dāng)今經(jīng)濟(jì)飛速發(fā)展,環(huán)境問題迫在眉睫。干旱作為一種自然災(zāi)害,是世界上危害最為嚴(yán)重的災(zāi)難之一。由干旱所引發(fā)的水資源匱乏,糧食減產(chǎn)會(huì)造成生態(tài)惡化、國家糧食危機(jī)等一系列棘手問題。玉米是我國重要的糧食作物之一,其生育期耗水較多且對水份脅迫反應(yīng)較為敏感,因此干旱已經(jīng)成為世界范圍之內(nèi)玉米生產(chǎn)的制約因素。干旱缺水導(dǎo)致許多玉米產(chǎn)區(qū)產(chǎn)量不穩(wěn)不高,對玉米的生長生育、形態(tài)特征、生理生化以及產(chǎn)品質(zhì)量均有一定的影響。由于干旱作為一種復(fù)雜的現(xiàn)象難以直接觀測其發(fā)生時(shí)間、發(fā)展過程及影響范圍,因而目前國內(nèi)外對旱情的評價(jià)主要是干旱指標(biāo)。常見的干旱指標(biāo)有標(biāo)準(zhǔn)降水指數(shù)、帕爾默干旱指數(shù)以及作物濕度指數(shù)等。這些農(nóng)業(yè)干旱指標(biāo)的獲取通常涉及到農(nóng)業(yè)、氣象、水文、以及植物生理等眾多的學(xué)科,同時(shí)農(nóng)業(yè)系統(tǒng)又是一個(gè)自然系統(tǒng)和人工系統(tǒng)高度交織的領(lǐng)域,因此農(nóng)業(yè)干旱監(jiān)測無論是在理論上還是技術(shù)手段上均面臨著較大的瓶頸。
技術(shù)實(shí)現(xiàn)要素:
為克服現(xiàn)有技術(shù)的不足,本發(fā)明旨在建立識別模型,在玉米的生育前期就對植株的旱情狀況做出判斷,為農(nóng)業(yè)工作人員后續(xù)的工作做準(zhǔn)備,保證玉米供水充足,植株正常生長,防止災(zāi)害發(fā)生。為此,本發(fā)明采用的技術(shù)方案是,基于多特征融合的玉米前期圖像旱情識別方法,首先對所獲取到的玉米植株圖像進(jìn)行預(yù)處理,將玉米葉片從復(fù)雜的背景圖片中較為清晰、完整地提取出來,對分割后的圖像進(jìn)行亮度調(diào)整以及位置變化,模擬實(shí)際應(yīng)用中可能會(huì)出現(xiàn)的樣本狀況,作為對原始樣本集的擴(kuò)充;此后,將所獲取到的亮度調(diào)整后樣本、位置變化后樣本和原樣本集合并作為新的樣本集進(jìn)行后續(xù)的處理,從新樣本集中提取包括顏色、奇異值以及紋理的三類特征,采用遺傳算法對特征進(jìn)行降維處理,構(gòu)建特征數(shù)據(jù)庫;最后選用最小二乘支持向量機(jī)作為分類器對玉米植株做出旱情識別。
具體地,采用K-means聚類算法對獲取到的玉米植株原圖像進(jìn)行圖像分割。
從新樣本集中提取包括顏色、奇異值以及紋理的三類特征,具體地,
(1)顏色特征:分別提取R、G、B直方圖的均值+偏度特征,共6維,R、G、B分別代表紅、綠、藍(lán)三種顏色通道,每種通道分為256階亮度,R、G、B直方圖分別統(tǒng)計(jì)在各個(gè)顏色通道中亮度的信息,均值和偏度計(jì)算公式如下:
均值:
其中m為直方圖均值,i為像素值,pi為像素值為i的像素個(gè)數(shù);
偏度:
其中Skew為直方圖偏度,X為樣本數(shù)據(jù),μ為樣本數(shù)據(jù)均值,σ為樣本數(shù)據(jù)方差;
(2)奇異值特征:奇異值分解簡稱SVD分解,是對分割后的圖像進(jìn)行灰度化處理之后,將該圖像作為一個(gè)二維矩陣對其進(jìn)行奇異值分解的一種特征提取方法,分解公式如下:
A=U×Σ×VT
其中:A為m×n的矩陣,U為做左奇異矩陣,VT為右奇異矩陣,Σ為奇異值矩陣,奇異值矩陣是一個(gè)對角陣,其對角線上的元素即為矩陣的奇異值,其個(gè)數(shù)為min(m,n),其數(shù)值在奇異值矩陣中按從大到小的順序排列,采用前r個(gè)奇異值來近似描述矩陣,r<<min(m,n),這里定義部分奇異值分解公式如下:
Am×n≈Um×rΣr×rVTr×n
將這r個(gè)奇異值進(jìn)行歸一化處理,將處理后的值作為圖像的r個(gè)奇異值特征,歸一化公式如下:
其中λ為矩陣的奇異值,λmax為圖像矩陣的最大奇異值即奇異值矩陣中的第一個(gè)元素,為歸一化后的矩陣的奇異值即圖像的奇異值特征;
通過繪制圖像識別正確率與奇異值特征有效個(gè)數(shù)r的關(guān)系曲線來確定r的取值;
(3)紋理特征:選取統(tǒng)計(jì)紋理中的灰度-梯度共生矩陣,定義圖像大小為N×N,灰度-梯度共生矩陣中的元素為H(x,y),其取值為歸一化后的灰度圖像F(i,j)及歸一化后的梯度圖像G(i,j)中,灰度值為x且梯度值y的像素總個(gè)數(shù);
即集合中{(i,j)|F(i,j)=x∩G(i,j)=y(tǒng),i,j=0,1,2...N-1}元素的總個(gè)數(shù),L表示灰度級數(shù),Lg表示梯度級數(shù),則F(i,j)∈[0,L-1],G(i,j)∈[0,Lg-1];
對提取到的灰度-梯度共生矩陣進(jìn)行歸一化處理,使其各元素之和為1,歸一化公式如下所示:
其中為歸一化后的灰度-梯度共生矩陣,通過計(jì)算該矩陣的統(tǒng)計(jì)特征獲取紋理信息,采用15種統(tǒng)計(jì)特征,包括:小梯度優(yōu)勢、大梯度優(yōu)勢、灰度分布的不均勻性、梯度分布的不均勻性、能量、灰度平均、梯度平均、灰度均方差、梯度均方差、相關(guān)、灰度熵、梯度熵、混合熵、慣性、逆差矩,將提取到的這15種統(tǒng)計(jì)特征作為圖像的15維紋理特征;
提取出的圖像特征包括顏色6維,奇異值20維,紋理15維共計(jì)41維特征,對41維特征采用遺傳算法進(jìn)行降維處理,獲取圖像本質(zhì)特征。
其中部分特征的計(jì)算公式如下所示:
(1)小梯度優(yōu)勢
(2)大梯度優(yōu)勢
(3)慣性
(4)能量
將提取到的23維特征作為特征變量,基于最小二乘支持向量機(jī)建立判別模型,將訓(xùn)練樣本的特征數(shù)據(jù)放入支持向量機(jī)中進(jìn)行學(xué)習(xí),得到玉米圖像旱情識別模型。
本發(fā)明的特點(diǎn)及有益效果是:
目前原始玉米植株樣本包括前期正常152個(gè),前期中旱186個(gè),前期特旱180個(gè)。進(jìn)行樣本擴(kuò)充后,前期正常共計(jì)912個(gè),前期中旱共計(jì)1116個(gè),前期特旱共計(jì)1080個(gè)。本試驗(yàn)將顏色、SVD、紋理的單特征作為對比試驗(yàn)進(jìn)行識別正確率的測試,之后對本發(fā)明采用的遺傳算法所提取出的最優(yōu)特征子集進(jìn)行識別正確率的測試。試驗(yàn)每次抽取樣本的三分之二作為訓(xùn)練集,剩余樣本作為測試集,為保證試驗(yàn)結(jié)果的真實(shí)性,每次隨機(jī)抽取樣本,試驗(yàn)重復(fù)100次,取100次試驗(yàn)結(jié)果的平均值作為最終的識別正確率。試驗(yàn)結(jié)果如表1所示,從中可以看出,經(jīng)過遺傳算法尋優(yōu)后,從41維特征中選取了其中的有效特征23維,降低了特征的維數(shù),消除了冗余特征,且相比較單個(gè)特征而言包含更多的圖像信息,識別正確率有了大幅度的提高。
附圖說明:
圖1玉米旱情識別流程圖。
圖2對原始樣本進(jìn)行圖像預(yù)處理。圖中,(a)兩幅演示玉米植株原圖,(b)K-means聚類分割效果圖。
圖3原始數(shù)據(jù)集的擴(kuò)充。圖中,(a)原始分割圖像,(b)原始圖像提高亮度,(c)原始圖像降低亮度,(d)原始圖像逆時(shí)針旋轉(zhuǎn)300,(e)原始圖像逆時(shí)針旋轉(zhuǎn)900,(f)原始圖像逆時(shí)針旋轉(zhuǎn)1200。
圖4分割圖像RGB直方圖。
圖5識別正確率與奇異值特征有效個(gè)數(shù)r取值的關(guān)系曲線。
具體實(shí)施方式
為解決現(xiàn)有技術(shù)中的問題,本發(fā)明對玉米前期旱情的分析采用圖像處理的方法加以解決。
供試玉米品種為鄭單958,2014年6月18日播種,種植密度為60030株/hm2,每池2行×6株。生長前期土壤水份正常供應(yīng),保證玉米正常出苗。將玉米正常出苗以后至成熟的生長時(shí)期分為生育前期(出苗-大喇叭口期,下同)、生育中期(大喇叭口期-灌漿期,下同)、生育后期(灌漿-成熟期,下同)三個(gè)生育階段。本發(fā)明提供了一種基于圖像處理技術(shù)的玉米生育前期旱情識別方法。以玉米生育前期正常、生育前期中旱和生育前期特旱三類圖像樣本為研究對象。首先運(yùn)用圖像預(yù)處理技術(shù)對原始樣本集進(jìn)行感興趣區(qū)域(葉片)的提取,進(jìn)而提取分割后圖像的顏色、奇異值和紋理三類特征作為玉米旱情識別的特征變量,最后基于最小二乘支持向量機(jī)建立識別模型,從而在玉米的生育前期就對植株的旱情狀況做出判斷,為農(nóng)業(yè)工作人員后續(xù)的工作做準(zhǔn)備,保證玉米供水充足,植株正常生長,防止災(zāi)害發(fā)生。
本發(fā)明涉及圖像預(yù)處理、圖像樣本擴(kuò)充、特征提取、特征融合以及建立分類模型五大部分。
首先對所獲取到的玉米植株圖像進(jìn)行預(yù)處理,將玉米葉片從復(fù)雜的背景圖片中較為清晰、完整地提取出來??紤]到目前所獲取的樣本數(shù)目比較少,同時(shí)受天氣、環(huán)境、圖像采集時(shí)間、硬件裝置等因素的影響可能會(huì)造成圖像亮度差異、位置差異等。因此本發(fā)明對分割后的圖像進(jìn)行亮度調(diào)整以及位置變化,模擬實(shí)際應(yīng)用中可能會(huì)出現(xiàn)的樣本狀況,作為對原始樣本集的擴(kuò)充;此算法過后,將所獲取到的亮度調(diào)整后樣本、位置變化后樣本和原樣本集合并作為新的樣本集進(jìn)行后續(xù)的處理;然后從新樣本集中提取包括顏色、奇異值以及紋理的三類特征,采用遺傳算法對特征進(jìn)行降維處理,構(gòu)建特征數(shù)據(jù)庫;最后選用最小二乘支持向量機(jī)作為分類器對玉米植株做出旱情識別。
下面結(jié)合附圖和具體實(shí)施方式進(jìn)一步詳細(xì)說明本發(fā)明。本發(fā)明的具體步驟是,
步驟一
對獲取到的玉米植株圖像進(jìn)行預(yù)處理。考慮所獲得的圖像本身背景復(fù)雜,對玉米植株干擾大,因此本發(fā)明采用K-means聚類算法對獲取到的玉米植株原圖像進(jìn)行圖像分割,將玉米葉片從復(fù)雜背景中提取出來,該算法處理速度快,效果理想,其分割效果如圖2所示。
步驟二
對分割后的玉米圖片進(jìn)行樣本擴(kuò)充。通過等幅調(diào)整R、G、B值可以達(dá)到圖像亮度的改變,其中等幅增加R、G、B取值可以提高圖像亮度;等幅減小R、G、B取值則可以降低圖像亮度,效果如圖3(b)(c)所示。將原圖像按照順時(shí)針依次旋轉(zhuǎn)30°、90°、120°得到位置不同的玉米植株圖像,效果如圖3(d)(e)(f)所示。通過樣本的擴(kuò)充后一幅原圖像增加了五幅,使得新樣本集為原樣本集的六倍。
步驟三
對新的數(shù)據(jù)集進(jìn)行特征提取,提取玉米圖像的有效特征用于下一步的特征學(xué)習(xí)。
(1)顏色特征。分別提取R、G、B直方圖的均值+偏度特征,共6維。R、G、B分別代表紅、綠、藍(lán)三種顏色通道,每種通道分為256階亮度,R、G、B直方圖分別統(tǒng)計(jì)在各個(gè)顏色通道中亮度的信息。玉米植株受干旱影響,其葉片狀態(tài)也會(huì)受到直接影響。正常的葉片通常是呈現(xiàn)嫩綠色,而受干旱影響的植株葉片呈深綠甚至偏黃,這就直接對其RGB直方圖的分布造成了影響,而均值和偏度特征可以反映出直方圖的偏移方向以及峰值所在的位置,均值和偏度計(jì)算公式如下:
均值:
其中m為直方圖均值,i為像素值,pi為像素值為i的像素個(gè)數(shù)。
偏度:
其中Skew為直方圖偏度,X為樣本數(shù)據(jù),μ為樣本數(shù)據(jù)均值,σ為樣本數(shù)據(jù)方差。
(2)奇異值特征。奇異值分解簡稱SVD分解,是對分割后的圖像進(jìn)行灰度化處理之后,將該圖像作為一個(gè)二維矩陣對其進(jìn)行奇異值分解的一種特征提取方法,該方法能夠有效的提取圖像的能量信息,分解公式如下:
A=U×Σ×VT
其中A為m×n的矩陣,U為做左奇異矩陣,VT為右奇異矩陣,Σ為奇異值矩陣。奇異值矩陣是一個(gè)對角陣,其對角線上的元素即為矩陣的奇異值,其個(gè)數(shù)為min(m,n),其數(shù)值在奇異值矩陣中按從大到小的順序排列。由于奇異值數(shù)值越大對圖像的影響越大,且在很多情況下,前10%甚至前1%的奇異值的和就占了全部奇異值之和的99%以上,因此可以用前r(r<<min(m,n))個(gè)奇異值來近似描述矩陣,這里定義部分奇異值分解公式如下:
Am×n≈Um×rΣr×rVTr×n
在上述式子中,用較少個(gè)數(shù)的奇異值來近似描述矩陣,這樣既可以降低奇異值維數(shù),又可以近似的描述矩陣。由于獲取到的奇異值量級不一,若直接將r個(gè)奇異值作為圖像特征,容易影響數(shù)據(jù)分析的結(jié)果。因此本發(fā)明將這r個(gè)奇異值進(jìn)行歸一化處理,將處理后的值作為圖像的r個(gè)奇異值特征,歸一化公式如下:
其中λ為矩陣的奇異值,λmax為圖像矩陣的最大奇異值(即奇異值矩陣中的第一個(gè)元素),為歸一化后的矩陣的奇異值(即圖像的奇異值特征)。
由上述可知,基于奇異值矩陣的特征提取方法的關(guān)鍵在于奇異值特征有效個(gè)數(shù)r的選擇。為尋找奇異值特征的有效個(gè)數(shù)且兼顧分類效果和計(jì)算復(fù)雜度,本發(fā)明通過繪制圖像識別正確率與奇異值特征有效個(gè)數(shù)r的關(guān)系曲線來確定r的取值。如圖5所示,橫坐標(biāo)為選取的奇異值特征有效個(gè)數(shù)r,縱坐標(biāo)為對應(yīng)的識別正確率。通過關(guān)系曲線可以看出,隨著奇異值取值個(gè)數(shù)的增加,識別正確率也是逐漸增加。其中r<20時(shí),識別正確率增長速度快,在r>20后,增長速度明顯下降,且識別正確率均在80%以上,因此本發(fā)明選取奇異值的特征個(gè)數(shù)r為20,即在較少的奇異值特征個(gè)數(shù)前提下,獲得較高的識別正確率。
(3)紋理特征。顏色和SVD特征均不包含圖像的紋理信息,從圖像角度考慮,正常植株其葉片會(huì)比較舒展,紋理相對平滑;而干旱植株相對卷曲,紋理相對粗糙。因此本發(fā)明提取其紋理特征,選取統(tǒng)計(jì)紋理中的灰度-梯度共生矩陣,既能夠很清晰地表現(xiàn)圖像像素灰度與梯度的分布規(guī)律,同時(shí)也體現(xiàn)了像素與其鄰域像素的空間關(guān)系。
定義圖像大小為N×N,灰度-梯度共生矩陣中的元素為H(x,y),其取值為歸一化后的灰度圖像F(i,j)及歸一化后的梯度圖像G(i,j)中,灰度值為x且梯度值y的像素總個(gè)數(shù)。
即集合中{(i,j)|F(i,j)=x∩G(i,j)=y(tǒng),i,j=0,1,2...N-1}元素的總個(gè)數(shù),L表示灰度級數(shù),Lg表示梯度級數(shù),則F(i,j)∈[0,L-1],G(i,j)∈[0,Lg-1]。
對提取到的灰度-梯度共生矩陣進(jìn)行歸一化處理,使其各元素之和為1。歸一化公式如下所示:
其中為歸一化后的灰度-梯度共生矩陣。通過計(jì)算該矩陣的統(tǒng)計(jì)特征獲取紋理信息。本發(fā)明采用較為常見的15種統(tǒng)計(jì)特征,包括:小梯度優(yōu)勢、大梯度優(yōu)勢、灰度分布的不均勻性、梯度分布的不均勻性、能量、灰度平均、梯度平均、灰度均方差、梯度均方差、相關(guān)、灰度熵、梯度熵、混合熵、慣性、逆差矩,將提取到的這15種統(tǒng)計(jì)特征作為圖像的15維紋理特征。其中部分特征的計(jì)算公式如下所示:
(1)小梯度優(yōu)勢
(2)大梯度優(yōu)勢
(3)慣性
(4)能量
步驟四
步驟三提取出的圖像特征包括顏色6維,奇異值20維,紋理15維共計(jì)41維特征,若將41維特征直接融合作為特征數(shù)據(jù)庫,不僅維數(shù)過高,同時(shí)也可能會(huì)由于特征的冗余而對識別結(jié)果造成影響。因此本發(fā)明對41維特征采用遺傳算法進(jìn)行降維處理,獲取圖像本質(zhì)特征,節(jié)省存儲(chǔ)空間。
遺傳算法是從特征集合中選擇性能良好的特征子集合,使所選取的特征個(gè)數(shù)少且識別正確率高,是提高學(xué)習(xí)算法性能的一個(gè)重要手段。本發(fā)明采用的遺傳算法中的初始種群是由隨機(jī)函數(shù)產(chǎn)生,適應(yīng)度函數(shù)定義如下:
其中Fitness為適應(yīng)度函數(shù)的值,X為所選中的特征子集,Accuracy為經(jīng)過遺傳算法所選中的特征子集的分類正確率,n為本次所選擇的特征個(gè)數(shù),N為原始特征個(gè)數(shù),λ為調(diào)整參數(shù),為兼顧識別正確率和所選特征個(gè)數(shù),本發(fā)明中λ取值0.5。
本發(fā)明采用選擇、交叉、變異三種遺傳算子,其中選擇算子選取最優(yōu)保存方法,下一代保存上一代的90%,即選擇概率為0.9;交叉算子為根據(jù)預(yù)先設(shè)定的交叉概率隨機(jī)選擇一對父代染色體進(jìn)行信息交換,產(chǎn)生的兩個(gè)“子代”作為下一代的成員,本發(fā)明所選交叉概率為0.7;變異算子則是對上一代中適應(yīng)度排在后面的個(gè)體進(jìn)行變異操作,本發(fā)明所選取變異概率為0.02。
經(jīng)過遺傳算法尋優(yōu),得到最優(yōu)特征子集為23維,其中包括顏色特征4維,分別是:B偏度、G偏度、B均值、R均值;SVD特征11維,分別是:第3、5、7、9、10、11、12、15、18、19、20個(gè)奇異值特征;紋理特征8維,分別是:小梯度優(yōu)勢、大梯度優(yōu)勢、能量、灰度平均、灰度均方差、梯度均方差、相關(guān)、慣性。將這23維特征作為玉米植株圖像的一種描述,構(gòu)建特征數(shù)據(jù)庫。
步驟五
本發(fā)明將提取到的23維特征作為特征變量,基于最小二乘支持向量機(jī)建立判別模型。最小二乘支持向量機(jī)(least squares support vector machines,LSSVM)是支持向量機(jī)的一種變形,同支持向量機(jī)一樣,也是一種基于核的學(xué)習(xí)方法。將訓(xùn)練樣本的特征數(shù)據(jù)放入支持向量機(jī)中進(jìn)行學(xué)習(xí),得到玉米圖像旱情識別模型。將測試樣本的特征數(shù)據(jù)放入訓(xùn)練好的分類器模型中,即可得到玉米旱情的分類結(jié)果。測試結(jié)果如表1所示,可以看出,單一特征對樣本的分類能力有限,將單一特征融合并提取有效特征后的特征子集,維數(shù)相對較低,且取得了很好的識別效果。
從試驗(yàn)結(jié)果來看,本發(fā)明提出的基于圖像處理技術(shù)的玉米植株旱情識別具有一定的可行性,為農(nóng)業(yè)旱情識別提供了新思路,對降低玉米干旱災(zāi)害,減少經(jīng)濟(jì)損失,維護(hù)國家糧食安全有重要的意義。