本發(fā)明涉及一種玉米種子高光譜圖像多特征轉(zhuǎn)換方法,尤其是一種基于多線性判別分析的玉米種子高光譜圖像多特征轉(zhuǎn)換方法。
背景技術(shù):
:玉米是世界總產(chǎn)量最高的糧食作物和主要的畜牧業(yè)飼料來(lái)源,同時(shí)也是工業(yè)生產(chǎn)中的重要原料,因而對(duì)于減少種子的混雜,保證農(nóng)業(yè)生產(chǎn)的順利進(jìn)行具有重要的價(jià)值。目前,對(duì)玉米種子的外部品質(zhì)檢測(cè)主要采用可見(jiàn)光圖像檢測(cè)和紅外圖像檢測(cè)等較成熟的技術(shù),但是這些檢測(cè)技術(shù)無(wú)法獲取玉米種子內(nèi)部品質(zhì)有效信息。近紅外光譜技術(shù)可在線實(shí)時(shí)無(wú)損檢測(cè)種子的內(nèi)部品質(zhì),而近紅外光譜技術(shù)只提供對(duì)檢驗(yàn)個(gè)體一個(gè)小區(qū)域的檢測(cè)。由于種子的品質(zhì)在空間上存在差異,所以該方法還存在一定的局限。高光譜圖像技術(shù)是一種廣泛應(yīng)用的農(nóng)產(chǎn)品品質(zhì)無(wú)損檢測(cè)方法,可以獲得種子的幾何形態(tài)學(xué)特征和光譜特征等優(yōu)點(diǎn),在種子品種識(shí)別中得到了廣泛的應(yīng)用。種子的品種識(shí)別從本質(zhì)上來(lái)說(shuō)是一個(gè)模式識(shí)別問(wèn)題,分類特征的充分挖掘獲取是識(shí)別模型精度和魯棒性的保證。盡管高光譜圖像技術(shù)可獲得種子的外部形態(tài)學(xué)特征和內(nèi)部的化學(xué)成分特征,但是現(xiàn)有的高光譜圖像識(shí)別中,多是利用單一特征(如光譜特征等),存在著分類特征信息丟失的可能性。較充分的特征信息有利于分類模型的學(xué)習(xí),從而提高模型的識(shí)別能力。然而,過(guò)多的特征學(xué)習(xí)也會(huì)存在著過(guò)擬合的風(fēng)險(xiǎn),高光譜圖像波段數(shù)目眾多,同時(shí)波段之間含有大量的冗余信息,不僅影響識(shí)別的精度,而且不利于高光譜圖像技術(shù)在種子品質(zhì)檢測(cè)在線應(yīng)用的實(shí)時(shí)性,因而有必要對(duì)數(shù)據(jù)進(jìn)行降維處理。特征提取和波段選擇是高光譜數(shù)據(jù)降維的兩種主要途徑。特征提取是將原始特征轉(zhuǎn)換為一組具有明顯物理意義、統(tǒng)計(jì)意義或核的特征降維方法,如主成分分析(PrincipalComponentAnalysis,PCA)、線性判別分析(Lineardiscriminantanalysis,LDA)等。波段選擇是尋找最能代表原始光譜信息波段的過(guò)程,以此減少和優(yōu)化特征空間且不改變?cè)嫉墓庾V信息,如無(wú)信息變量消除法(UninformativeVariableEliminate,UVE)、連續(xù)投影算法(SuccessiveProjectionsAlgorithm,SPA)等。特征提取和波段選擇的降維方法已經(jīng)被廣泛應(yīng)用到農(nóng)產(chǎn)品品質(zhì)的無(wú)損檢測(cè)中。一方面,這些方法利用的是對(duì)于分類有利的特征,在包含更多對(duì)于分類的無(wú)用特征時(shí),這些特征提取方法效果難以保證。另一方面,由于這些多特征波段選擇方法多是先利用均值光譜特征進(jìn)行波段選擇,然后將選擇的波段應(yīng)用到其他特征,導(dǎo)致對(duì)其他特征信息考慮不足,不能確保選擇的最優(yōu)波段對(duì)于其他特征的適用性。在如何充分提取高光譜圖像的有用信息,并同時(shí)滿足高光譜圖像無(wú)損檢測(cè)技術(shù)在線應(yīng)用的實(shí)時(shí)性和高分類精度上仍存在改進(jìn)的空間。技術(shù)實(shí)現(xiàn)要素:本發(fā)明的目的是克服現(xiàn)有技術(shù)中存在的不足,提供一種基于多線性判別分析的玉米種子高光譜圖像多特征轉(zhuǎn)換方法,其能夠?qū)崿F(xiàn)玉米種子高光譜圖像多特征條件下特征選擇,操作簡(jiǎn)單,快速有效,并具有較高的魯棒性等優(yōu)點(diǎn)。按照本發(fā)明提供的技術(shù)方案,所述基于多線性判別分析的玉米種子高光譜圖像多特征轉(zhuǎn)換方法,其特征是,包括:a、將待識(shí)別的Num粒玉米種子樣本放置在高光譜圖像采集系統(tǒng)中,采集并獲取該M粒玉米種子樣本在L個(gè)波段下的L個(gè)高光譜圖像,L為自然數(shù);b、利用閾值分割獲取玉米種子的輪廓曲線,提取輪廓下玉米種子的均值光譜特征和紋理特征,將L個(gè)波段下獲得的共L個(gè)均值光譜特征和L個(gè)紋理特征進(jìn)行特征融合,將融合特征作為待識(shí)別玉米種子的特征參數(shù)X;c、利用步驟b所得到的玉米種子特征參數(shù)X,基于多線性判別分析(MLDA)算法對(duì)玉米種子特征參數(shù)X進(jìn)行特征提取,并得到特征提取后的融合特征矩陣計(jì)算每個(gè)波段下的原始特征對(duì)第一主成分的貢獻(xiàn)率W,設(shè)定閾值,選擇較大W值所對(duì)應(yīng)的波段作為最優(yōu)波段,輸出最優(yōu)波段集合Θ,將最優(yōu)波段集合Θ應(yīng)用到特征提取后的融合特征矩陣得到特征轉(zhuǎn)換后的特征S;d、建立預(yù)測(cè)模型,對(duì)轉(zhuǎn)換后的特征進(jìn)行評(píng)價(jià)。進(jìn)一步的,在所述步驟b中,獲得玉米種子的特征參數(shù)X的具體步驟包括:玉米種子高光譜圖像的均值光譜特征和紋理特征分別為(其中,X1表示均值光譜特征;X2~X14表示紋理特征,且X2~X6分別表示為紋理特征中一階數(shù)據(jù)統(tǒng)計(jì)的:能量(energy)、熵(entropy)、偏度(skew)、標(biāo)準(zhǔn)差(standarddeviation)、力矩(moment)特征;X7~X14分別為紋理特征中二階數(shù)據(jù)統(tǒng)計(jì)在0°、45°、90°和135°四個(gè)方向上的對(duì)比度均值(contrastmean)、對(duì)比度標(biāo)準(zhǔn)差(contraststandarddeviation)、相關(guān)性均值(correlationmean)、相關(guān)性標(biāo)準(zhǔn)差(correlationstandarddeviation)、能量均值(energymean)、能量標(biāo)準(zhǔn)差(energystandarddeviation)、同質(zhì)度均值(homogenousmean)和同質(zhì)度標(biāo)準(zhǔn)差(homogenousstandarddeviation)特征),rij為第i粒玉米種子的第j個(gè)特征,Num個(gè)樣本在L個(gè)波段下構(gòu)成一個(gè)L×Num的矩陣;首先對(duì)特征進(jìn)行歸一化處理,使融合特征達(dá)到數(shù)量級(jí)上的一致性;再對(duì)每一個(gè)樣本在第p個(gè)波段下分別進(jìn)行特征組合(為第j個(gè)特征),得到14個(gè)特征在L個(gè)波段下Num個(gè)樣本的融合特征矩陣X∈{K14×14×L×Num},其中,p=1,2,...,L。進(jìn)一步的,在所述步驟c中,獲得玉米種子的特征參數(shù)轉(zhuǎn)換特征的具體步驟包括:根據(jù)MLDA計(jì)算最佳投影向量將14×14×L×Num維度的原始融合特征空間投影到J1×J2×J3×J4的特征空間,得到投影后的特征矩陣其中,Ym的計(jì)算公式為:Ym=X×U1(1)T×U2(2)T×U3(3)T×U4(4)T---(1);]]>不同n-mode的投影方向U(n)計(jì)算公式為:U(n)|n=14=argmaxU(1),U(2),U(3),U(4)Σc=1Cnc||(X‾c-X‾)×U1(1)T×U2(2)T×U3(3)T×U4(4)T||2Σi=1NumΣc=1C||(Xi-X‾c)×U1(1)T×U2(2)T×U3(3)T×U4(4)T||2=argmaxU(n)TU(n)=Itrace(U(n)T·SB(n)·U(n)T)trace(U(n)T·SW(n)·U(n)T)---(2);]]>公式(2)中,共有C類樣本,nc為第c類的樣本數(shù),是第c類樣本融合特征的平均值,為全部樣本融合特征的平均值,Xi表示第i個(gè)樣本;與分別表示為按照l(shuí)-mode張量展開(kāi)的類內(nèi)離散方差和類間離散方差,其中,U(3)設(shè)置為L(zhǎng)×L的正交單位矩陣,U(4)為Num×Num的單位矩陣;根據(jù)線性判別分析(LinearDiscriminantAnalysis,LDA)中主成分與原始特征之間滿足線性關(guān)系t=WXi的思想,推廣到MLDA中,所求取的第一主成分t1與原始融合特征X∈{K14×14×L×Num}也滿足線性關(guān)系,U(3)的第一行可反映為每個(gè)波段下的特征信息對(duì)第一主成分的貢獻(xiàn)率W,W對(duì)應(yīng)的值越大,則該波段下的特征信息對(duì)主成分的貢獻(xiàn)率越大,以此選出最優(yōu)波段集合Θ;將最優(yōu)波段集合應(yīng)用到特征選擇后的融合特征矩陣,得到特征轉(zhuǎn)換后的矩陣進(jìn)一步的,所述步驟c中MLDA算法首先對(duì)融合特征進(jìn)行特征提取,得到特征提取后的矩陣,根據(jù)每個(gè)波段下的特征信息在第一主成分上的貢獻(xiàn)率作為波段選擇的依據(jù),將較大貢獻(xiàn)率所對(duì)應(yīng)的波段作為最優(yōu)波段,并應(yīng)用到特征提取后的矩陣得到轉(zhuǎn)換特征,具體包括:S1、計(jì)算整體樣本均值第c類樣本均值初始化投影矩陣根據(jù)公式(2)和公式(3)對(duì)融合特征進(jìn)行特征選擇;S2、通過(guò)最優(yōu)化迭代法得到第t次SW(n)(t)和SB(n)(t)的l-mode張量展開(kāi)分別為:SB(n)(t)=Σc=1Cnc(X‾c-X‾)(n)·Φn‾(t-1)T·Φn‾(t-1)·(X‾c-X‾)(n)TSW(n)=Σi=1NumΣc=1C(Xi-X‾c)·Φn‾T·Φn‾·(X‾c-X‾)(n)T---(3);]]>S3、根據(jù)廣義特征值分解計(jì)算(SW(n)(t))-1SB(n)(t)=UΛUT中最大廣義特征值所對(duì)應(yīng)的單位廣義特征向量S4、當(dāng)達(dá)到設(shè)定的閾值或最大迭代次數(shù)K時(shí)則停止迭代,輸出最佳投影方向向量U(n)和特征選擇后的融合特征矩陣否則返回步驟S2;S5、計(jì)算每個(gè)波段下的原始特征對(duì)第一主成分的貢獻(xiàn)率W,設(shè)定閾值,選擇較大W值所對(duì)應(yīng)的波段作為最優(yōu)波段,輸出最優(yōu)波段集合Θ;S6、將最優(yōu)波段集合Θ應(yīng)用到特征選擇后的特征矩陣得到轉(zhuǎn)換特征S。本發(fā)明所述基于多線性判別分析的玉米種子高光譜圖像多特征轉(zhuǎn)換方法,通過(guò)對(duì)玉米種子高光譜圖像進(jìn)行特征轉(zhuǎn)換,其能夠?qū)崿F(xiàn)多特征條件下特征轉(zhuǎn)換,操作簡(jiǎn)單,快速有效,并具有較高魯棒性等優(yōu)點(diǎn)。附圖說(shuō)明圖1為玉米種子高光譜圖像的圖像分割和特征提取過(guò)程示意圖。圖2為本發(fā)明所述基于多線性判別分析的玉米種子高光譜圖像多特征轉(zhuǎn)換方法的流程示意圖。具體實(shí)施方式下面結(jié)合具體附圖對(duì)本發(fā)明作進(jìn)一步說(shuō)明。本發(fā)明所述基于多線性判別分析的玉米種子高光譜圖像多特征轉(zhuǎn)換方法,包括:a、如圖1所示:首先選擇待識(shí)別玉米種子輪廓最清晰的圖像對(duì)應(yīng)的波段(在700.1nm處),利用自適應(yīng)閾值分割法,獲得該波段下的待識(shí)別玉米種子的輪廓曲線。將該輪廓曲線投射到L個(gè)波段上,提取L個(gè)波段下玉米種子輪廓圖像的均值光譜特征和紋理特征(一階統(tǒng)計(jì)量和二階統(tǒng)計(jì)量),L為自然數(shù);b、如圖2所示:對(duì)均值光譜特征和紋理特征進(jìn)行歸一化處理,消除特征之間在數(shù)量級(jí)上的差異;c、玉米種子高光譜圖像的均值光譜特征和紋理特征分別為(其中,X1表示均值光譜特征;X2~X14表示紋理特征,且X2~X6分別表示為紋理特征中一階數(shù)據(jù)統(tǒng)計(jì)的:能量(energy)、熵(entropy)、偏度(skew)、標(biāo)準(zhǔn)差(standarddeviation)、力矩(moment)特征;X7~X14分別為紋理特征中二階數(shù)據(jù)統(tǒng)計(jì)在0°、45°、90°和135°四個(gè)方向上的對(duì)比度均值(contrastmean)、對(duì)比度標(biāo)準(zhǔn)差(contraststandarddeviation)、相關(guān)性均值(correlationmean)、相關(guān)性標(biāo)準(zhǔn)差(correlationstandarddeviation)、能量均值(energymean)、能量標(biāo)準(zhǔn)差(energystandarddeviation)、同質(zhì)度均值(homogenousmean)和同質(zhì)度標(biāo)準(zhǔn)差(homogenousstandarddeviation)特征),為第i粒玉米種子的第j個(gè)特征,Num個(gè)樣本在L個(gè)波段下構(gòu)成一個(gè)L×Num的矩陣;首先對(duì)特征進(jìn)行歸一化處理,使融合特征達(dá)到數(shù)量級(jí)上的一致性;再對(duì)每一個(gè)樣本在第p個(gè)波段下分別進(jìn)行特征組合(為第j個(gè)特征),得到14個(gè)特征在L個(gè)波段下Num個(gè)樣本的融合特征矩陣X∈{K14×14×L×Num},其中,p=1,2,...,L;d、根據(jù)MLDA(多重線性判別分析,MultipleLinearDiscrminantAnalysis)尋找具有最大類間散度和最小類內(nèi)散度(廣義瑞利商)的投影方向的思想計(jì)算最佳投影向量最佳投影向量將14×14×L×Num維度的原始融合特征空間投影到J1×J2×J3×J4的特征空間,得到投影后的特征矩陣其中,Ym的計(jì)算公式為:Ym=X×U1(1)T×U2(2)T×U3(3)T×U4(4)T---(1);]]>假設(shè)共有C類樣本,nc為第c類的樣本數(shù),是第c類樣本融合特征的平均值,為全部樣本融合特征的平均值,Xi表示第i個(gè)樣本。不同n-mode的投影方向U(n)計(jì)算公式為:U(n)|n=14=argmaxU(1),U(2),U(3),U(4)Σc=1Cnc||(X‾c-X‾)×U1(1)T×U2(2)T×U3(3)T×U4(4)T||2Σi=1NumΣc=1C||(Xi-X‾c)×U1(1)T×U2(2)T×U3(3)T×U4(4)T||2=argmaxU(n)TU(n)=Itrace(U(n)T·SB(n)·U(n)T)trace(U(n)T·SW(n)·U(n)T)---(2);]]>公式(2)中,與分別表示為按照l(shuí)-mode張量展開(kāi)的類內(nèi)離散方差和類間離散方差,最佳投影向量U(l)可以轉(zhuǎn)化為計(jì)算矩陣SW(l)-1SB(l)求取最大特征值所對(duì)應(yīng)的特征向量的問(wèn)題,通過(guò)k階最優(yōu)化迭代法來(lái)計(jì)算U(l)。其中,U(3)設(shè)置為L(zhǎng)×L的正交單位矩陣,U(4)為Num×Num的單位矩陣,從而實(shí)現(xiàn)對(duì)特征的降維而不改變波段的數(shù)目。e、根據(jù)線性判別分析(LinearDiscriminantAnalysis,LDA)中主成分與原始特征之間滿足線性關(guān)系t=WXi的思想,推廣到MLDA中,所求取的第一主成分t1與原始融合特征X∈{K14×14×L×Num}也滿足線性關(guān)系,U(3)的第一行可反映為每個(gè)波段下的特征信息對(duì)第一主成分的貢獻(xiàn)率W,W對(duì)應(yīng)的值越大,則該波段下的特征信息對(duì)主成分的貢獻(xiàn)率越大,以此選出最優(yōu)波段集合Θ;f、將最優(yōu)波段集合應(yīng)用到特征選擇后的融合特征矩陣,得到特征轉(zhuǎn)換后的矩陣g、對(duì)特征轉(zhuǎn)換后的特征組合建立分類識(shí)別模型,根據(jù)分類精度進(jìn)行評(píng)價(jià)。當(dāng)前第1頁(yè)1 2 3