本發(fā)明涉及人臉識別領(lǐng)域,特別涉及一種頻域劃分的人臉特征識別方法及系統(tǒng)。
背景技術(shù):
現(xiàn)有的人臉識別系統(tǒng)一般都是對人臉圖像進行預(yù)處理,在利用卷積神經(jīng)網(wǎng)絡(luò)進行訓(xùn)練,得到了訓(xùn)練之后的網(wǎng)絡(luò)的權(quán)重,從而完成訓(xùn)練。在應(yīng)用中,將人臉的圖片作為輸入,通過訓(xùn)練好的卷積神經(jīng)網(wǎng)絡(luò),得到人臉的特征表示,再通過特征的比較來實現(xiàn)人臉的識別。訓(xùn)練的圖像大多來自于互聯(lián)網(wǎng),是質(zhì)量比較高的圖像,實際使用的圖像,存在很多的低質(zhì)量的圖片,如低分辨率、模糊、噪聲等,通過網(wǎng)絡(luò)并不能提取出合適的特征,降低了識別的效果。
現(xiàn)有的圖像預(yù)處理技術(shù)如下:
a.在訓(xùn)練過程中加入隨機噪聲和模糊
缺點:該方法只能對已知的干擾進行數(shù)據(jù)增強,無法應(yīng)對現(xiàn)實中的復(fù)雜的噪聲情況。
b.進行圖像的去模糊和重建
缺點:圖像的重建可能會一定程度上丟失一些圖像的細節(jié)信息,影響識別效果。同時,重建的操作是耗時的。
技術(shù)實現(xiàn)要素:
本發(fā)明要解決上述技術(shù)問題,提供一種能夠增強系統(tǒng)的抗噪聲能力的頻域劃分的人臉特征識別方法。
解決上述技術(shù)問題,本發(fā)明提供了一種頻域劃分的人臉特征識別方法,包括:
將訓(xùn)練圖像x進行fft變換,得到所述訓(xùn)練圖像中每個通道的對應(yīng)的不同的頻率分布f=fft(x);
將每個所述頻率分布f進行劃分,分別得到多個頻率成分fi;
對每個頻率成分fi進行ifft變換,得到不同頻率成分fi對應(yīng)的圖像成分xi;
結(jié)合所述訓(xùn)練圖像x的標簽y,得到處理后的訓(xùn)練數(shù)據(jù)z=(x1,x2,…,xk,y),k為圖像成分xi的總數(shù);
使用處理之后的訓(xùn)練數(shù)據(jù)z進行卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練,并得到網(wǎng)絡(luò)參數(shù)模型;
通過根據(jù)所述網(wǎng)絡(luò)參數(shù)模型對于輸入的待識別圖像y進行處理,得到待識別圖像y的特征;通過計算所述特征的歐氏距離l對所述待識別圖像y進行樣本比對獲取人臉特征,完成人臉識別。
進一步的,如前述的頻域劃分的人臉特征識別方法,將每個所述頻率分布f進行劃分,具體劃分方法為:在所述頻率分布f內(nèi)定義k個半徑為r1、r2、…rk的同心圓形,其中r1<r2<...<rk,;將所述頻率分布劃分為k個頻率范圍并得到k個頻率成分fi;且所述頻率分布f與頻率成分fi關(guān)系為
更進一步的,如前述的頻域劃分的人臉特征識別方法,所述通過網(wǎng)絡(luò)參數(shù)模型對于輸入的待識別圖像y進行處理,得到浮點數(shù)的數(shù)組向量f1、f2作為y的特征,具體方法為:將ifft變換之后的圖像,作為所述卷積神經(jīng)網(wǎng)絡(luò)的輸入,前饋;同時,選擇最后一個隱含層的數(shù)作為特征。
更進一步的,如前述的頻域劃分的人臉特征識別方法,所述歐氏距離l的計算方法,具體為:
其中,l為所述歐式距離,n為所述y的特征的長度。
本發(fā)明還提供一種頻域劃分的人臉特征識別系統(tǒng),所述系統(tǒng)通過模型對于輸入的待識別圖像進行處理,得到待識別圖像的特征;通過計算所述特征的歐氏距離l對所述待識別圖像進行樣本比對獲取人臉特征,完成人臉識別。本發(fā)明的有益效果:
采用本發(fā)明方法能夠通過頻域劃分的去除如低分辨率、模糊、噪聲高等情況的低質(zhì)量圖片,并且,本發(fā)明方法能夠通過網(wǎng)絡(luò)提取出合適的人臉圖像的特征;具有人臉識別速度快,準確率高,魯棒性強,抗噪聲能力好的特點。
附圖說明
圖1是本發(fā)明一種實施例中的頻域劃分的人臉特征識別方法的流程示意圖;
圖2是本發(fā)明一種實施例中的頻域劃分的人臉特征識別方法中的訓(xùn)練過程示意圖;
圖3是本發(fā)明一種實施例中的頻域劃分的人臉特征識別方法中的應(yīng)用過程示意圖。
具體實施方式
為使本發(fā)明的目的、技術(shù)方案和優(yōu)點更加清楚明白,以下結(jié)合具體實施例,并參照附圖,對本發(fā)明進一步詳細說明。
如圖1所示,本發(fā)明提供一種頻域劃分的人臉特征識別方法,包括:
s101.將訓(xùn)練圖像x進行fft變換,得到頻率分布f=fft(x),具體的,圖像x在計算機中的存儲是三維的數(shù)組,分別為通道(channel)、高度(height)、寬度(width);其中rgb格式的圖像具有3個通道,分別對應(yīng)的是red、green、blue,針對每個通道都進行快速傅里葉變換,即fft變換,由于fft變化是本領(lǐng)域公知的技術(shù),在此就不再贅述;
s102.將所述頻率分布f進行劃分,得到多個頻率成分fi;
s103.對每個頻率成分fi進行ifft變換,得到不同頻率成分fi對應(yīng)的圖像成分xi;其中ifft為數(shù)字信號處理中的快速傅里葉逆變換,為本領(lǐng)域技術(shù)人員公知技術(shù),在此就不贅述;
s104.結(jié)合所述訓(xùn)練圖像x的標簽y,得到處理后的訓(xùn)練數(shù)據(jù)z=(x1,x2,…,xk,y),k為圖像成分xi的總數(shù);
s105.使用處理之后的訓(xùn)練數(shù)據(jù)z進行卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練,并得到卷積神經(jīng)網(wǎng)絡(luò)的參數(shù);
s106.通過模型對于輸入的待識別圖像y進行處理,得到待識別圖像y的特征,具體為,將ifft變換之后的圖像,作為所述卷積神經(jīng)網(wǎng)絡(luò)的輸入,前饋;同時,選擇最后一個隱含層的數(shù)作為待識別圖像y特征,所述特征是浮點數(shù)的數(shù)組向量;通過計算所述特征的歐氏距離對所述待識別圖像y進行樣本比對獲取人臉特征,完成人臉識別。
如圖2所示,為采用本發(fā)明方法對系統(tǒng)進行訓(xùn)練的流程。記訓(xùn)練的圖像為x。對x進行fft變換,得到頻率分布:
f=fft(x)
通過預(yù)定的頻率的劃分,將頻率分布f進行劃分,通過得到多個部分的頻率分布:
其中fi表示不同的頻率成分。對每個頻率成分進行ifft變換,得到不同頻率對應(yīng)的圖像:
xi=ifft(fi)
記y為該訓(xùn)練圖像對應(yīng)的標簽。則一個處理后的訓(xùn)練數(shù)據(jù)可以表示為(x1,x2,…,xk,y)。
使用處理后的訓(xùn)練數(shù)據(jù)進行卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練。從而得到網(wǎng)絡(luò)的參數(shù)。
如圖3所示,為根據(jù)圖2中生成的模型進行應(yīng)用的過程流程圖,對于輸入的圖像x,按圖2中的處理操作,得到x1,x2,…,xk,將k個圖像成分作為卷積神經(jīng)網(wǎng)絡(luò)的輸入,從而得到人臉圖像的特征表示。在樣本比對的時候,直接計算特征的歐氏距離即可;所述歐氏距離l的計算方法,具體為:
其中,l為所述歐式距離,n為所述y的特征的長度。
然后使用softmax來監(jiān)督學(xué)習(xí);softmax的監(jiān)督信號如下:
其中,in是類別,pn是預(yù)測的類別。
本發(fā)明還提供一種頻域劃分的人臉特征識別系統(tǒng),該系統(tǒng)通過模型對于輸入的待識別圖像y進行處理,得到待識別圖像y的特征;通過計算所述特征的歐氏距離對所述待識別圖像y進行樣本比對獲取人臉特征,完成人臉識別。
所屬領(lǐng)域的普通技術(shù)人員應(yīng)當理解:以上,所述僅為本發(fā)明的具體實施例而已,并不用于限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi),所做的任何修改、等同替換、改進等,均應(yīng)包含在本發(fā)明的保護范圍之內(nèi)。與該發(fā)明方法或等同的技術(shù)原理都屬保護范圍之內(nèi)。