本發(fā)明涉及圖像識別技術(shù)領(lǐng)域,具體涉及一種基于K-均值聚類的圖像特征提取方法。
背景技術(shù):
圖像的識別分類在所有應(yīng)用領(lǐng)域中的應(yīng)用最為直接,由于獲取的圖像數(shù)據(jù)內(nèi)容豐富,提取圖像的特征技術(shù)就變得非常關(guān)鍵,傳統(tǒng)的圖像特征提取主要包含光譜特征、紋理特征以及形狀特征。常用的光譜特征提取方法有主成分分析法、K-T變換、典型分析法以及基于遺傳算法的特征提取算法。主成分分析法是圖像中最常用的一種變換算法,是一種非常有效的特征提取算法,但是這種算法需要處理的數(shù)據(jù)非常大,因為圖像中包含大量的觀測數(shù)據(jù),造成了計算復(fù)雜度大大增加。
鑒于上述缺陷,本發(fā)明創(chuàng)作者經(jīng)過長時間的研究和實踐終于獲得了本發(fā)明。
技術(shù)實現(xiàn)要素:
為解決上述技術(shù)缺陷,本發(fā)明采用的技術(shù)方案在于,提供一種基于K-均值聚類的圖像特征提取方法,該方法包括以下步驟:
步驟S1:采集圖像并對圖像進(jìn)行預(yù)處理,以及建立圖像數(shù)據(jù)庫;
步驟S2:利用K-均值聚類算法對圖像進(jìn)行聚類分析,將圖像數(shù)據(jù)庫分為K類;
步驟S3:利用主成分分析算法對分為K類的圖像數(shù)據(jù)庫中的分類圖像進(jìn)行處理,得到主成分分析圖像;
步驟S4:根據(jù)性能指標(biāo)估計主成分分析圖像,選取效果最好的圖像。
較佳的,述步驟S1具體包括:
步驟S11:通過圖像采集設(shè)備采集圖像;
步驟S12:對所獲取的圖像進(jìn)行尺寸大小歸一化;
步驟S13:建立圖像數(shù)據(jù)庫。
較佳的,所述步驟S2具體包括:
步驟S21:統(tǒng)計圖像數(shù)據(jù)庫中每一幅圖像的波段數(shù)和像素數(shù),并將其表示為一個矩陣X;
步驟S22:根據(jù)主成分分析算法的需求輸入指定數(shù)目的聚類類數(shù)N;
步驟S23:在初始矩陣X中隨機(jī)選取N個對象作為初始聚類中心;
步驟S24:根據(jù)每個聚類的中心,計算每個對象與這些中心對象的距離,并根據(jù)最小距離重新對相應(yīng)對象進(jìn)行劃分,形成一類;
步驟S25:更新聚類中心,然后以每一類的平均向量作為新的聚類中心,重新分配數(shù)據(jù)對象;
步驟S26:反復(fù)迭代,直到滿足每個聚類不再發(fā)生變化為止。
較佳的,所述步驟S3具體包括:
步驟S31:選取新獲得的聚類中心作為新的輸入樣本;
步驟S32:利用高斯核函數(shù)和新輸入的樣本計算核矩陣K,核矩陣K的計算公式為:
式中,xi,xj為樣本向量,c表示輸入的樣本數(shù)量,表示對樣本向量的非線性變換,k(·)表示高斯核函數(shù);
步驟S33:對核矩陣K進(jìn)行歸一化處理得到歸一化之后的核矩陣K′:
K′=(K-AcK-KAc+AcKAc)ij
式中,Ac是一個c×c矩陣,(Ac)ij=1/c;
步驟S34:分別計算歸一化之后的核矩陣K′的特征值和特征向量,并對特征向量進(jìn)行歸一化處理;
步驟S35:將特征值按照從大到小的順序進(jìn)行排列,選擇前r個非零的特征值對應(yīng)的特征向量αi作為主分量;
步驟S36:將特征空間中所有的光譜向量映射到與第r個特征值對應(yīng)的特征向量Vr,映射公式為:
步驟S37:將所得向量恢復(fù)為圖像,得到第r幅主成分圖像,依次得到所有的主成分圖像。
較佳的,所述步驟S4具體包括:
步驟S41:分別計算各主成分?jǐn)?shù)據(jù)的方差,并對其標(biāo)準(zhǔn)化處理;
步驟S42:計算每一分量標(biāo)準(zhǔn)方差的比例;
步驟S43:根據(jù)得到的比例大小選擇出效果最好的圖像。
與現(xiàn)有技術(shù)相比,本發(fā)明提供的一種基于K-均值聚類的圖像特征提取方法有如下好處:
(1)本發(fā)明將K-均值聚類算法應(yīng)用到圖像特征提取中,提高了圖像特征提取的性能,可有效地提取多光譜圖像中的非線性特征信息,同時也改善了圖像特征提取計算量大的缺點。
(2)結(jié)合傳統(tǒng)的主成分分析算法,引入了高斯核函數(shù),使得主成分分析算法變得更加魯棒,在圖像的特征提取中具有更好的效果。
附圖說明
為了更清楚地說明本發(fā)明各實施例中的技術(shù)方案,下面將對實施例描述中所需要使用的附圖作簡單地介紹。
圖1為本發(fā)明的一種基于K-均值聚類的圖像特征提取方法的流程圖;
圖2為步驟S1的流程圖;
圖3為步驟S2的流程圖;
圖4為步驟S3的流程圖;
圖5為步驟S4的流程圖。
具體實施方式
以下結(jié)合附圖,對本發(fā)明上述的和另外的技術(shù)特征和優(yōu)點作更詳細(xì)的說明。
如圖1所示,為本發(fā)明的一種基于K-均值聚類的圖像特征提取方法的流程圖,該方法包括以下步驟:
步驟S1:采集圖像并對圖像進(jìn)行預(yù)處理,以及建立圖像數(shù)據(jù)庫。
如圖2所示,為步驟S1的流程圖,該步驟S1具體包括:
步驟S11:通過圖像采集設(shè)備采集圖像。
步驟S12:對所獲取的圖像進(jìn)行尺寸大小歸一化。
步驟S13:建立圖像數(shù)據(jù)庫。
步驟S2:利用K-均值聚類算法對圖像進(jìn)行聚類分析,將圖像數(shù)據(jù)庫分為K類。
如圖3所示,為步驟S2的流程圖,該步驟S2具體包括:
步驟S21:統(tǒng)計圖像數(shù)據(jù)庫中每一幅圖像的波段數(shù)和像素數(shù),并將其表示為一個矩陣X。
步驟S22:根據(jù)主成分分析算法的需求輸入指定數(shù)目的聚類類數(shù)N。
步驟S23:在初始矩陣X中隨機(jī)選取N個對象作為初始聚類中心。
步驟S24:根據(jù)每個聚類的中心,計算每個對象與這些中心對象的距離,并根據(jù)最小距離重新對相應(yīng)對象進(jìn)行劃分,形成一類。
步驟S25:更新聚類中心,然后以每一類的平均向量作為新的聚類中心,重新分配數(shù)據(jù)對象。
步驟S26:反復(fù)迭代,直到滿足每個聚類不再發(fā)生變化為止。
步驟S3:利用主成分分析算法對分為K類的圖像數(shù)據(jù)庫中的分類圖像進(jìn)行處理,得到主成分分析圖像。
如圖4所示,為步驟S3的流程圖,該步驟S3具體包括:
步驟S31:選取新獲得的聚類中心作為新的輸入樣本。
步驟S32:利用高斯核函數(shù)和新輸入的樣本計算核矩陣K,核矩陣K的計算公式為:
式中,xi,xj為樣本向量,c表示輸入的樣本數(shù)量,表示對樣本向量的非線性變換,k(·)表示高斯核函數(shù)。
步驟S33:對核矩陣K進(jìn)行歸一化處理得到歸一化之后的核矩陣K′:
K′=(K-AcK-KAc+AcKAc)ij
式中,Ac是一個c×c矩陣,(Ac)ij=1/c。
步驟S34:分別計算歸一化之后的核矩陣K′的特征值和特征向量,并對特征向量進(jìn)行歸一化處理。
步驟S35:將特征值按照從大到小的順序進(jìn)行排列,選擇前r個非零的特征值對應(yīng)的特征向量αi作為主分量。
步驟S36:將特征空間中所有的光譜向量映射到與第r個特征值對應(yīng)的特征向量Vr,映射公式為:
步驟S37:將所得向量恢復(fù)為圖像,得到第r幅主成分圖像,依次得到所有的主成分圖像。
步驟S4:根據(jù)性能指標(biāo)估計主成分分析圖像,選取效果最好的圖像。
如圖5所示,為步驟S4的流程圖,該步驟S4具體包括:
步驟S41:分別計算各主成分?jǐn)?shù)據(jù)的方差,并對其標(biāo)準(zhǔn)化處理。
步驟S42:計算每一分量標(biāo)準(zhǔn)方差的比例。
步驟S43:根據(jù)得到的比例大小選擇出效果最好的圖像。
本發(fā)明提供的一種基于K-均值聚類的圖像特征提取方法有如下好處:
(1)本發(fā)明將K-均值聚類算法應(yīng)用到圖像特征提取中,提高了圖像特征提取的性能,可有效地提取多光譜圖像中的非線性特征信息,同時也改善了圖像特征提取計算量大的缺點。
(2)結(jié)合傳統(tǒng)的主成分分析算法,引入了高斯核函數(shù),使得主成分分析算法變得更加魯棒,在圖像的特征提取中具有更好的效果。
以上所述僅為本發(fā)明的較佳實施例,對本發(fā)明而言僅僅是說明性的,而非限制性的。本專業(yè)技術(shù)人員理解,在本發(fā)明權(quán)利要求所限定的精神和范圍內(nèi)可對其進(jìn)行許多改變,修改,甚至等效,但都將落入本發(fā)明的保護(hù)范圍內(nèi)。