本發(fā)明涉及的是一種水下目標(biāo)特征提取方法。
背景技術(shù):
目前,關(guān)于水下目標(biāo)特征提取主要有時(shí)域和頻域兩種方法,時(shí)域即從波形結(jié)構(gòu)特征進(jìn)行提取,時(shí)域分析主要基于以下理論:目標(biāo)之間的結(jié)構(gòu)、材料或是形狀之間差異會(huì)反映在其回波形狀上,目標(biāo)差異越明顯其波形結(jié)構(gòu)差異越明顯;此外回波的接收角度和目標(biāo)的姿態(tài)不同,也會(huì)對(duì)時(shí)域的波形產(chǎn)生較大影響,這些差異也隱藏著目標(biāo)之間的特性,即從波形結(jié)構(gòu)里提取目標(biāo)的分類特征。頻域特征指將信號(hào)處理后得到的頻譜特征,通過譜估計(jì)的方法對(duì)目標(biāo)進(jìn)行辨別,并從中進(jìn)行目標(biāo)特征參數(shù)提取,其方法包括有無(wú)參譜估計(jì),參數(shù)化譜估計(jì)和高階譜估計(jì)。但是在實(shí)際操作中,水下信號(hào)多為非平穩(wěn)信號(hào),頻率變化較劇烈,還參雜著很多背景噪聲。如果變換到頻域空間上就會(huì)導(dǎo)致時(shí)序的結(jié)構(gòu)信息丟失,不能完整的刻畫出目標(biāo)信號(hào)在時(shí)序上的長(zhǎng)時(shí)結(jié)構(gòu)特征。這就使得當(dāng)前基于頻域的水下目標(biāo)特征提取方法的效果深受質(zhì)疑。因此,如何把時(shí)域信號(hào)和頻域信號(hào)有效的融合,實(shí)現(xiàn)基于信號(hào)融合的特征提取方法成為本發(fā)明需要解決的關(guān)鍵問題。
傳統(tǒng)的cnn網(wǎng)絡(luò)是一個(gè)具有多隱層的的深度神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。對(duì)這種網(wǎng)絡(luò)進(jìn)行如下描述:
卷積神經(jīng)網(wǎng)絡(luò)中每一層都是由多個(gè)二維特征圖羅列而成,每個(gè)特征圖中一個(gè)像素代表一個(gè)神經(jīng)元節(jié)點(diǎn)。網(wǎng)絡(luò)中把神經(jīng)元節(jié)點(diǎn)分為卷積神經(jīng)元和池化神經(jīng)元。池化神經(jīng)元組成二維池化特征圖,其激活值對(duì)應(yīng)特征圖像素值,而池化特征圖的組合又形成了池化層。卷積神經(jīng)元、卷積特征圖和卷積層之間存在類似的關(guān)系。cnn網(wǎng)絡(luò)以卷積層和池化層交替棧式結(jié)構(gòu)連接而成,網(wǎng)絡(luò)將二維圖像數(shù)據(jù)作為輸入。區(qū)別于傳統(tǒng)模式識(shí)別手段,樣本的數(shù)據(jù)處理、特征提取以及分類流程都隱式的嵌入到這種深度互聯(lián)結(jié)構(gòu)的卷積網(wǎng)絡(luò)中。一般情況下,卷積層又被稱為特征提取層,前一層的某一局部感受野以適當(dāng)大小輸入到卷積層對(duì)應(yīng)的神經(jīng)元上,將這一過程稱為提取局部特征,也就是說局部特征之間的位置關(guān)系較上一層的輸入是未發(fā)生位置變化的;又將池化層稱為特征映射層或下采樣層,將每個(gè)特征圖映射為一個(gè)平面。為了保持特征映射過程中特征的位移、旋轉(zhuǎn)不變性,卷積層的激活函數(shù)通常采用激活值不易發(fā)散的sigmoid函數(shù)。另外,因?yàn)槊總€(gè)特征映射層上的神經(jīng)元采用權(quán)值共享的原則,從而極大的減少了網(wǎng)絡(luò)參數(shù)的數(shù)量,又避免了因過多的自由參數(shù)帶來(lái)的過擬合現(xiàn)象。網(wǎng)絡(luò)中每一個(gè)特征提取層(卷積層)后伴隨著一個(gè)特征映射層(池化層),這種帶有池化結(jié)構(gòu)的網(wǎng)絡(luò),可以使得模型對(duì)原始數(shù)據(jù)具有很強(qiáng)的降噪和抗干擾能力。
池化層中某一區(qū)域內(nèi)的多個(gè)神經(jīng)元,只有激活值大的那個(gè)神經(jīng)元才能起到強(qiáng)化權(quán)值的作用,這也符合了“最大值檢出假說”。這種神經(jīng)元在不斷強(qiáng)化自身的同時(shí)還控制了周圍神經(jīng)元的輸出結(jié)果,也就是特征映射圖中提取到的特征為每個(gè)局部區(qū)域的相同特征。
卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)以原始圖像作為網(wǎng)絡(luò)輸入,圖中使用了4層網(wǎng)絡(luò)結(jié)構(gòu),每層各個(gè)特征圖中的相鄰神經(jīng)元以卷積核大小為單位,逐層將局部信息向下層傳遞,而下層則對(duì)傳遞過來(lái)的信息進(jìn)行卷積運(yùn)算即特征提取,如邊緣特征或方向特征。網(wǎng)絡(luò)的訓(xùn)練過程則是不斷修改卷積核中參數(shù)的過程。而同一個(gè)卷積核是被特征圖所共享的,可以視卷積核為一個(gè)可滑動(dòng)的濾波器,掃描整個(gè)特征圖的過程記為對(duì)某一特征進(jìn)行提取的過程。而作為二次特征提取的池化層更像是模糊濾波器??梢岳斫鉃閷⒈姸嚯s糅在輸入數(shù)據(jù)中的特征信息經(jīng)過網(wǎng)絡(luò)的過濾最終分散到了各個(gè)低分辨率特征圖上。
二維圖像中特征信息往往具有很強(qiáng)的隱蔽性,因?yàn)橛^測(cè)目標(biāo)位置的變化,觀察角度的不同等都會(huì)導(dǎo)致觀測(cè)目標(biāo)產(chǎn)生形變、位移甚至扭曲。然而用顯式的方法將圖像中具有位移、縮放和扭曲不變性的特征提取出來(lái)的難度又是巨大的,即使存在也不具有廣泛的適用性。
針對(duì)這樣的問題,cnn的特征檢測(cè)機(jī)制則給出了很好的答案。cnn的每次卷積運(yùn)算都是針對(duì)局部特征進(jìn)行的提取,因而目標(biāo)的位置變化或縮放變化都不會(huì)對(duì)特征提取過程產(chǎn)生影響,并且cnn這種隱式的提取過程使得模型具有廣泛的適用性。大量訓(xùn)練數(shù)據(jù)中的不變性結(jié)構(gòu)信息在網(wǎng)絡(luò)的特征空間中逐層被提取出來(lái)。又因?yàn)槠浣Y(jié)構(gòu)的特點(diǎn)能與邏輯回歸分類器進(jìn)行無(wú)縫的融合,實(shí)現(xiàn)了端到端的圖像處理方法。其可以直接將圖像輸入到網(wǎng)絡(luò),并獲得分類信息。避免了特征提取和分類之間的數(shù)據(jù)重構(gòu),而其中的特征提取過程隱藏在了網(wǎng)絡(luò)結(jié)構(gòu)當(dāng)中。
由于特征圖之間的權(quán)值是局部相連且權(quán)值共享的,基于這一特點(diǎn)可以將一個(gè)網(wǎng)絡(luò)置于多個(gè)機(jī)器中同時(shí)進(jìn)行訓(xùn)練實(shí)現(xiàn)并行的效果。其在計(jì)算和訓(xùn)練速度上明顯優(yōu)于其他全連接神經(jīng)網(wǎng)絡(luò)。
cnn網(wǎng)絡(luò)模型的設(shè)計(jì)靈感來(lái)自于仿生學(xué),其結(jié)構(gòu)特點(diǎn)更接近生物神經(jīng)網(wǎng),所以在處理一些自然界的原始信號(hào),如圖像信息或聲音信息時(shí)具有獨(dú)特的優(yōu)越性。
可以概括出,卷積神經(jīng)網(wǎng)絡(luò)較其他網(wǎng)絡(luò)模型在特征提取方面有如下優(yōu)勢(shì):
1、檢測(cè)數(shù)據(jù)可以直接作為網(wǎng)絡(luò)的輸入數(shù)據(jù),無(wú)需任何預(yù)處理過程;
2、端到端的數(shù)據(jù)處理過程,簡(jiǎn)化了數(shù)據(jù)重建的復(fù)雜度;
3、權(quán)值共享的策略,在減輕了訓(xùn)練負(fù)擔(dān)的同時(shí),為訓(xùn)練提供并行化的可能。
由于原始輸入通過深層網(wǎng)絡(luò)得到的深層特征數(shù)據(jù)都是以特征圖的方式呈現(xiàn)出來(lái),而三維特征最終又都會(huì)通過一維向量化即全連接的方式輸入到全連接層進(jìn)行分類處理,其中,全連接層和卷積層的主要區(qū)別是卷積層嵌入了有大量的空間信息,而全連接層則沒有。卷積層的空間結(jié)構(gòu)可以用一個(gè)3維張量來(lái)表示,其表示形式為h×w×d,其中,h,w表示卷積層中的一個(gè)卷積特征圖的縱向神經(jīng)元數(shù)目和橫向神經(jīng)元數(shù)目,d則表示層中特征圖的數(shù)目。這種3維張量可以理解為卷積層將二維輸入數(shù)據(jù)分解成了多個(gè)h×w的局部區(qū)域,而d維個(gè)這樣的局部區(qū)域組成的集合一同描述著一種視覺模式。而全連接層將卷積層得到的出作為輸入,但是會(huì)將3維的特征圖進(jìn)行向量化,得到的1維特征向量代表分類器的特征向量。在這一過程中,空間信息會(huì)丟失并且空間特征不能在softmax層得到恢復(fù),進(jìn)而影響到分類準(zhǔn)確度,并且在網(wǎng)絡(luò)不斷反饋調(diào)節(jié)時(shí)會(huì)間接影響特征提取的質(zhì)量。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的目的在于提供一種簡(jiǎn)單直接,能彌補(bǔ)因全連接層的一維向量化所帶來(lái)的空間信息丟失的基于卷積神經(jīng)網(wǎng)絡(luò)的水下目標(biāo)特征提取方法。
本發(fā)明的目的是這樣實(shí)現(xiàn)的:
1、將原始輻射噪聲信號(hào)的采樣序列s(n),分成25個(gè)連續(xù)部分,每個(gè)部分再設(shè)置25個(gè)采樣點(diǎn),其中25個(gè)連續(xù)部分之間允許有數(shù)據(jù)交叉重疊的部分,交叉重疊度設(shè)置為50%;
2、將第j段數(shù)據(jù)信號(hào)的采樣樣本mj(n)做歸一化和中心化處理;
歸一化處理:
l的取值設(shè)置為2的整數(shù)次冪;
中心化處理:
3、進(jìn)行短時(shí)傅里葉變換
經(jīng)過以上操作即得到完整的lofar圖,將已經(jīng)獲得的lofar譜圖作為卷積網(wǎng)絡(luò)的輸入,執(zhí)行以下分步:
(1)在初始化階段采用隨機(jī)初始化參數(shù)方法為卷積網(wǎng)絡(luò)中的權(quán)值進(jìn)行賦值,并且確定網(wǎng)絡(luò)參數(shù)調(diào)整方法為梯度下降方法,并設(shè)置網(wǎng)絡(luò)訓(xùn)練終止條件,設(shè)置輸出數(shù)據(jù)與標(biāo)簽數(shù)據(jù)的偏差閾值為0.07;
(2)將處理好的lofar圖作為網(wǎng)絡(luò)的輸入矩陣,在前向傳播階段,輸入矩陣通過兩次交替的卷積和池化運(yùn)算將特征圖傳遞到了加權(quán)層,得到初步的特征圖信息;
(3)在加權(quán)層為特征圖進(jìn)行加權(quán),加權(quán)過程分為兩部分:一個(gè)是spatial維度的加權(quán),另一個(gè)是channel維度的加權(quán);
4、獲得兩種權(quán)值向量后,將向量賦值到已有3維張量中;其具體的操作包括:
x'kij=αijβkxkij
最后在對(duì)χ'的每個(gè)特征圖進(jìn)行加和池化操作,將3維的帶權(quán)特征張量聚合成一個(gè)一維的特征向量f={f1,f2,...,fk},其中fk計(jì)算為式,
通過以上的處理將3維的帶權(quán)特征張量聚合成一個(gè)一維的特征向量;
5、將得到特征向量輸入到全連接層進(jìn)行分類并計(jì)算與標(biāo)簽數(shù)據(jù)的誤差,檢查損失誤差是否低于誤差閾值,若低于則停止網(wǎng)絡(luò)訓(xùn)練,否則進(jìn)入步驟6;
6、使用梯度下降方法對(duì)網(wǎng)絡(luò)從后向前逐層進(jìn)行參數(shù)調(diào)整,并轉(zhuǎn)入步驟2。
本發(fā)明提出了一個(gè)簡(jiǎn)單直接的方法,來(lái)彌補(bǔ)上面所提到的因全連接層的一維向量化所帶來(lái)的空間信息丟失。
在最后一個(gè)特征圖層向量化之前,本發(fā)明將會(huì)強(qiáng)化特征圖層的空間信息,使得這種空間信息可以輸入到最后的全連接層中。強(qiáng)化的角度則會(huì)從通道(channel)和空間(spatial)兩個(gè)維度來(lái)增強(qiáng),最后聚合為一維向量輸入到全連接層。
強(qiáng)化特征圖層空間信息的方法主要是,首先假設(shè)不同的特征圖之間的重要程度是不一樣的,比如有的特征圖中包含的信息會(huì)比較單一,而有的會(huì)因?yàn)槟承┨卣餍畔⒌臄?shù)據(jù)表示是非線性和線性不可分的,所以經(jīng)過深層過濾后的特征圖里仍然包含許多信息。同樣,每個(gè)特征像素的重要程度也是有區(qū)分的。基于以上想法,本發(fā)明將給予不同特征圖和特征像素賦予權(quán)值,來(lái)強(qiáng)化空間結(jié)構(gòu)信息,進(jìn)而提取高質(zhì)量的數(shù)據(jù)特征。
首先針對(duì)多維加權(quán)算法的步驟和流程進(jìn)行說明。在具體的賦權(quán)過程中,假設(shè)已經(jīng)得到在一次前向傳播過程中的最終特征圖層,對(duì)該特征圖層進(jìn)行多維加權(quán)流程如下:
1、局部池化:
對(duì)最后一層卷積層的每個(gè)特征圖使用局部池化操作,池化窗口大小為w×h,窗口滑動(dòng)步長(zhǎng)為s。經(jīng)過池化后得到一個(gè)3維張量。
2、計(jì)算空間(spatial)權(quán)重因子:
對(duì)池化后的特征圖上的每個(gè)特征像素都指派一個(gè)權(quán)重αij,對(duì)應(yīng)特征圖上的第(i,j)個(gè)像素。
3、計(jì)算通道(channel)權(quán)重因子:
對(duì)于池化后的每個(gè)特征圖即通道k,都賦予一個(gè)權(quán)重βk。(詳細(xì)計(jì)算通道權(quán)重過程將在3.3.2中介紹)
4、加權(quán)計(jì)算:
將上兩步計(jì)算得到的空間權(quán)值和通道權(quán)值賦予到其對(duì)應(yīng)的位置上,最后得到一個(gè)帶權(quán)的3維張量。
5、向量歸一化:
針對(duì)以上數(shù)據(jù)進(jìn)行歸一化處理,得到聚合后的多維加權(quán)特征向量。
經(jīng)過以上5步處理好的向量稱為多維加權(quán)特征向量。在以上流程中,將最后一層卷積層進(jìn)行池化操作的目的是為了起到特征二次提取的作用。同時(shí),該池化操作方法還可以有效的降低待處理的數(shù)據(jù)規(guī)模。
接下來(lái)是加權(quán)過程。
在完成以上操作,獲得兩種權(quán)值向量后,需要將向量賦值到已有3維張量中。其具體的操作是,首先定義
x'kij=αijβkxkij
最后在對(duì)χ'的每個(gè)特征圖進(jìn)行加和池化操作,將3維的帶權(quán)特征張量聚合成一個(gè)一維的特征向量f={f1,f2,...,fk},其中fk計(jì)算為式。
通過以上的處理,已經(jīng)將3維的帶權(quán)特征張量聚合成一個(gè)一維的特征向量。下一步需要針對(duì)得到的特征向量f做歸一化處理后再連入全連接層,進(jìn)行聚合的主要目的就是為了減少全連階層的輸入規(guī)模,進(jìn)而減少了需要訓(xùn)練的網(wǎng)絡(luò)連接權(quán)值,從而避免過擬合現(xiàn)象發(fā)生。然后再將特征向量做歸一處理,就是得到了最終的多維加權(quán)特征向量。
接下來(lái)具體介紹兩種權(quán)值的計(jì)算過程。
針對(duì)多維加權(quán)算法中的空間權(quán)重和通道權(quán)重,本發(fā)明主要采取了兩種無(wú)參數(shù)化的空間權(quán)重因子和通道權(quán)重因子的計(jì)算方法,其中無(wú)參數(shù)化指的是不會(huì)對(duì)卷積網(wǎng)絡(luò)帶來(lái)額外的參數(shù),而使其影響到網(wǎng)絡(luò)的訓(xùn)練效率和可能發(fā)生的過擬合現(xiàn)象。
根據(jù)神經(jīng)認(rèn)知機(jī)對(duì)可塑性突觸的形成的假設(shè):如果在神經(jīng)元y的近旁存在有比y更強(qiáng)的激活神經(jīng)元y',則從x至y的突觸連接就不進(jìn)行強(qiáng)化。這也就是說,這種突觸連接的強(qiáng)化應(yīng)符合“最大值檢出假說”,即在某一小區(qū)域(稱之為鄰域)內(nèi)存在的一神經(jīng)元集合中,只有輸出最大的神經(jīng)元才發(fā)生輸入突觸的強(qiáng)化。
從以上理論可以理解為,激活值越大的神經(jīng)元對(duì)其附近的連接權(quán)值影響越大,其重要程度也就越大。那么定義ck為3維特征張量χ中的第k個(gè)特征圖,
通過式上面的式子得到了初步的空間權(quán)值矩陣,其含義為將不同特征圖的同一位置激活值xkij進(jìn)行疊加,從而反映出平面空間上某一位置累計(jì)激活值的強(qiáng)度,即強(qiáng)度越大該位置也就越重要,該位置對(duì)應(yīng)αij的值也就應(yīng)該越大,之后就是對(duì)s進(jìn)行歸一化操作,得到最終的權(quán)值矩陣a,此處的歸一化處理選取的是含有兩個(gè)超參的歸一化函數(shù):
其中sij表示s中第(i,j)個(gè)像素值,可調(diào)參數(shù)a,b的選取,可以根據(jù)網(wǎng)絡(luò)訓(xùn)練情況而定。
對(duì)于面向通道上的權(quán)值向量的選取,本發(fā)明提出了一種基于圖像熵的加權(quán)算法。因?yàn)槟承┨卣餍畔⒌臄?shù)據(jù)表示是非線性和線性不可分的,所以經(jīng)過深層過濾后的特征圖里仍然包含許多信息。因此對(duì)于每個(gè)特征圖的重要程度可以用其中含有的信息量多少進(jìn)行分析。
衡量信息多少的信息熵是從整個(gè)信息來(lái)源的統(tǒng)計(jì)特性上進(jìn)行分析獲得的。它是從平均意義上來(lái)反映信源的總體特性。對(duì)于某特定的信源,其信息熵只有一個(gè)。不同統(tǒng)計(jì)特性的信息來(lái)源,其信息熵也會(huì)有相應(yīng)的變化。針對(duì)未知性較大的變量,其信息熵的個(gè)數(shù)也相對(duì)較多。
鑒于信息熵以上特性,本發(fā)明將引入圖像熵的思想來(lái)衡量特征圖中信息量的多少。雖然圖像熵指的是整個(gè)圖像中的平均信息量,但是一維的圖像熵只能反映出圖像中灰度分布的聚集情況。并不能表現(xiàn)出信息在空間的分布特征。因此本發(fā)明為了能與特征圖相適應(yīng)且同時(shí)反映出特征圖中信息的空間分布特征,本發(fā)明采用了二維圖像熵的方法來(lái)解決該問題。在具體操作上,本發(fā)明選擇特征圖的鄰域激活均值作為激活值分布的空間特征量,與特征圖內(nèi)某一像素的激活值組成特征二元組。
但是圖像熵中的灰度值是一個(gè)離散化的數(shù)值,而特征圖中激活值是通過連續(xù)的激活函數(shù)得到的,所以再計(jì)算特征圖的圖像熵之前,本發(fā)明采用等寬離散化的方法對(duì)特征圖重新處理,實(shí)現(xiàn)連續(xù)數(shù)據(jù)的離散化。其中對(duì)每個(gè)像素點(diǎn)的激活值處理如式所示。
其中x為某像素點(diǎn)的激活值,xmin,xmax為激活函數(shù)有效的下界和上界,m為離散后的區(qū)間長(zhǎng)度。定義(i,j)為離散化后的特征二元組其中i(0≤i≤m)為特征像素的離散激活值,j(0≤j≤m)為離散化后的特征圖鄰域激活均值。第k個(gè)特征圖的熵值為hk,具體計(jì)算如下式所示,
其中
而f(i,j)表示特征二元組(i,j)出現(xiàn)的頻數(shù),hw為特征圖像尺度大小。至此給出的特征圖熵值計(jì)算公式既反映出了特征圖中所含信息量的多少,又強(qiáng)調(diào)了特征圖中激活值與其鄰域的信息分布情況。最后再對(duì)所有特征圖的熵值進(jìn)行歸一化處理,即如式。
上面部分介紹了為了增強(qiáng)卷積特征圖中的空間信息而引入的一種新的多維特征加權(quán)算法以及該算法的計(jì)算方式。
本發(fā)明利用lofar譜圖實(shí)現(xiàn)了兩種信號(hào)的有效融合,lofar譜圖保留了信號(hào)在時(shí)間和頻率兩個(gè)維度的信息。即將一個(gè)連續(xù)時(shí)間段內(nèi)的信號(hào)分成多個(gè)幀,對(duì)每一幀內(nèi)的信號(hào)求其功率譜,最后將多個(gè)功率譜以時(shí)間順序展開。并利用深度學(xué)習(xí)知識(shí),隱式的提取目標(biāo)特征,減少了人工參與的工作。所以,本發(fā)明針對(duì)lofar譜圖使用卷積神經(jīng)網(wǎng)絡(luò)(convolutionalneuralnetwork,cnn)對(duì)目標(biāo)進(jìn)行時(shí)頻特征分析,提取能夠反映時(shí)間結(jié)構(gòu)和頻率信息的特征。
本發(fā)明主要工作是針對(duì)傳統(tǒng)cnn網(wǎng)絡(luò)進(jìn)行研究與改進(jìn)。cnn網(wǎng)絡(luò)中的卷積過程能過程能夠提取出原始圖像或聲音信號(hào)中的局部特征信息,并且效果良好,得到了廣泛的應(yīng)用。
本發(fā)明的有益效果為:
本發(fā)明方法的識(shí)別率與傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)算法相比,對(duì)特征圖層進(jìn)行了空間信息多維度的加權(quán)操作,來(lái)彌補(bǔ)上面所提到的因全連接層的一維向量化所帶來(lái)的空間信息丟失的缺陷。
在利用lofar圖譜進(jìn)行目標(biāo)識(shí)別時(shí),結(jié)合了特征圖多維度加權(quán)算法的卷積神經(jīng)網(wǎng)絡(luò)的識(shí)別率更加準(zhǔn)確,將識(shí)別率提高到75%左右。
附圖說明
圖1為本發(fā)明的加權(quán)過成圖;
圖2為本發(fā)明的流程圖;
圖3為卷積網(wǎng)絡(luò)結(jié)構(gòu)圖;
圖4a與圖4b為感受野大小與濾波器數(shù)量?jī)山M實(shí)驗(yàn)方案;
圖5a與圖5b為參數(shù)實(shí)驗(yàn)效果對(duì)比圖;
圖6為對(duì)比實(shí)驗(yàn)收斂效果圖。
具體實(shí)施方式
下面舉例對(duì)本發(fā)明做更詳細(xì)的描述。
對(duì)原始噪聲信號(hào)進(jìn)行時(shí)頻域的轉(zhuǎn)換生成能夠表示時(shí)頻域信息的lofar譜圖。具體處理過程為:
1、定義s(n)為原始輻射噪聲信號(hào)的采樣序列,將其分成25個(gè)連續(xù)部分,每個(gè)部分再設(shè)置25個(gè)采樣點(diǎn)。其中25個(gè)連續(xù)部分之間允許有數(shù)據(jù)交叉重疊的部分,交叉重疊度設(shè)置為50%。
2、定義mj(n)為第j段信號(hào)的采樣樣本,并對(duì)其做歸一化和中心化處理,其目的是讓輻射噪聲信號(hào)的幅值在時(shí)間上分布均勻和達(dá)到去直流使樣本的均值為零。
歸一化處理:
為了便進(jìn)行傅里葉變換的計(jì)算,將l的取值設(shè)置為2的整數(shù)次冪。
中心化處理:
3.定義
將以上獲得的各段數(shù)據(jù)的功率譜按時(shí)間順序依次展開,即得到完整的lofar圖。
上述即為lofar圖獲取的一般步驟,雖然lofar譜圖是二維的圖像,橫軸表示時(shí)間,縱軸表示頻率,但反映的卻是三維的信息。可以用灰度值的大小來(lái)表示在該時(shí)間和該頻率下的能量大小。
將已經(jīng)獲取lofar譜圖作為卷積網(wǎng)絡(luò)的輸入,帶有特征圖加權(quán)的網(wǎng)絡(luò)的具體結(jié)構(gòu)如圖3。
(1).在初始化階段采用隨機(jī)初始化參數(shù)方法為卷積網(wǎng)絡(luò)中的權(quán)值進(jìn)行賦值,并且確定網(wǎng)絡(luò)參數(shù)調(diào)整方法為梯度下降方法,即網(wǎng)絡(luò)反向傳播訓(xùn)練階段使用梯度下降方法收斂整個(gè)網(wǎng)絡(luò)。并設(shè)置網(wǎng)絡(luò)訓(xùn)練終止條件,設(shè)置輸出數(shù)據(jù)與標(biāo)簽數(shù)據(jù)的偏差閾值為0.07。
(2).將處理好lofar圖作為網(wǎng)絡(luò)的輸入矩陣。在前向傳播階段,輸入矩陣通過兩次交
替的卷積和池化運(yùn)算將特征圖傳遞到了加權(quán)層。此時(shí)得到了初步的特征圖信息。
(3).為實(shí)現(xiàn)增強(qiáng)特征圖空間信息在加權(quán)層為特征圖進(jìn)行加權(quán),加權(quán)過程大致分為兩大
部分:一個(gè)spatial維度的加權(quán)一個(gè)channel維度的加權(quán)。
根據(jù)神經(jīng)認(rèn)知機(jī)對(duì)可塑性突觸的形成的假設(shè):如果在神經(jīng)元y的近旁存在有比y更強(qiáng)的激活神經(jīng)元y',則從x至y的突觸連接就不進(jìn)行強(qiáng)化。這也就是說,這種突觸連接的強(qiáng)化應(yīng)符合“最大值檢出假說”,即在某一小區(qū)域(稱之為鄰域)內(nèi)存在的一神經(jīng)元集合中,只有輸出最大的神經(jīng)元才發(fā)生輸入突觸的強(qiáng)化。
從以上理論可以理解為,激活值越大的神經(jīng)元對(duì)其附近的連接權(quán)值影響越大,其重要程度也就越大。那么定義ck為3維特征張量χ中的第k個(gè)特征圖,
通過式上面的式子得到了初步的空間權(quán)值矩陣,其含義為將不同特征圖的同一位置激活值xkij進(jìn)行疊加,從而反映出平面空間上某一位置累計(jì)激活值的強(qiáng)度,即強(qiáng)度越大該位置也就越重要,該位置對(duì)應(yīng)αij的值也就應(yīng)該越大,之后就是對(duì)s進(jìn)行歸一化操作,得到最終的權(quán)值矩陣a,此處的歸一化處理選取的是含有兩個(gè)超參的歸一化函數(shù):
其中sij表示s中第(i,j)個(gè)像素值,設(shè)置可調(diào)參數(shù)α=0.5,b=1。
對(duì)于面向通道上的權(quán)值向量的選取,本發(fā)明提出了一種基于圖像熵的加權(quán)算法。因?yàn)槟承┨卣餍畔⒌臄?shù)據(jù)表示是非線性和線性不可分的,所以經(jīng)過深層過濾后的特征圖里仍然包含許多信息。因此對(duì)于每個(gè)特征圖的重要程度可以用其中含有的信息量多少進(jìn)行分析。
衡量信息多少的信息熵是從整個(gè)信息來(lái)源的統(tǒng)計(jì)特性上進(jìn)行分析獲得的。它是從平均意義上來(lái)反映信源的總體特性。對(duì)于某特定的信源,其信息熵只有一個(gè)。不同統(tǒng)計(jì)特性的信息來(lái)源,其信息熵也會(huì)有相應(yīng)的變化。針對(duì)未知性較大的變量,其信息熵的個(gè)數(shù)也相對(duì)較多。
鑒于信息熵以上特性,本發(fā)明將引入圖像熵的思想來(lái)衡量特征圖中信息量的多少。雖然圖像熵指的是整個(gè)圖像中的平均信息量,但是一維的圖像熵只能反映出圖像中灰度分布的聚集情況。并不能表現(xiàn)出信息在空間的分布特征。因此本發(fā)明為了能與特征圖相適應(yīng)且同時(shí)反映出特征圖中信息的空間分布特征,本發(fā)明采用了二維圖像熵的方法來(lái)解決該問題。在具體操作上,本發(fā)明選擇特征圖的鄰域激活均值作為激活值分布的空間特征量,與特征圖內(nèi)某一像素的激活值組成特征二元組。
但是圖像熵中的灰度值是一個(gè)離散化的數(shù)值,而特征圖中激活值是通過連續(xù)的激活函數(shù)得到的,所以再計(jì)算特征圖的圖像熵之前,本發(fā)明采用等寬離散化的方法對(duì)特征圖重新處理,實(shí)現(xiàn)連續(xù)數(shù)據(jù)的離散化。其中對(duì)每個(gè)像素點(diǎn)的激活值處理如式所示。
其中x為某像素點(diǎn)的激活值,xmin,xmax為激活函數(shù)有效的下界和上界,設(shè)置m=255為離散后的區(qū)間長(zhǎng)度。定義(i,j)為離散化后的特征二元組其中i(0≤i≤m)為特征像素的離散激活值,j(0≤j≤m)為離散化后的特征圖鄰域激活均值。第k個(gè)特征圖的熵值為hk,具體計(jì)算如下式(3-6)所示。
其中
而f(i,j)表示特征二元組(i,j)出現(xiàn)的頻數(shù),hw為特征圖像尺度大小。至此給出的特征圖熵值計(jì)算公式既反映出了特征圖中所含信息量的多少,又強(qiáng)調(diào)了特征圖中激活值與其鄰域的信息分布情況。最后再對(duì)所有特征圖的熵值進(jìn)行歸一化處理,即如式。
上面部分介紹了新的多維特征加權(quán)算法以及該算法的計(jì)算方式。
4、在完成以上操作,獲得兩種權(quán)值向量后,需要將向量賦值到已有3維張量中。其具體的操作是,首先定義
x'kij=αijβkxkij
最后在對(duì)χ'的每個(gè)特征圖進(jìn)行加和池化操作,將3維的帶權(quán)特征張量聚合成一個(gè)一維的特征向量f={f1,f2,...,fk},其中fk計(jì)算為式。
通過以上的處理,已經(jīng)將3維的帶權(quán)特征張量聚合成一個(gè)一維的特征向量。
5、將得到特征向量輸入到全連接層進(jìn)行分類并計(jì)算與標(biāo)簽數(shù)據(jù)的誤差。檢查損失誤差是否低于誤差閾值,若低于則停止網(wǎng)絡(luò)訓(xùn)練。否則進(jìn)入步驟6。
6、使用梯度下降方法對(duì)網(wǎng)絡(luò)從后向前逐層進(jìn)行參數(shù)調(diào)整,因?yàn)榧訖?quán)層沒有引入額外參數(shù),所以整個(gè)調(diào)整過程與傳統(tǒng)卷積網(wǎng)絡(luò)無(wú)異。并轉(zhuǎn)入步驟2。
實(shí)驗(yàn)結(jié)果與分析:
(一)數(shù)據(jù)集的選取
本章節(jié)將以仿真的形式,現(xiàn)假定目標(biāo)噪聲由線譜和連續(xù)譜組成且符合平穩(wěn)態(tài)隨機(jī)過程,其中線譜通常分布在1khz以下的低頻端。并將多組具有隨機(jī)相位的正弦波作為目標(biāo)信號(hào)的線譜分量。即表示為下式。
其中k為線譜數(shù)量,ak為第k條線譜的幅度,fk為線譜頻率,φk為隨機(jī)的相位。在模擬不同的信號(hào)時(shí),fk控制在1khz以內(nèi)。為了模擬真實(shí)環(huán)境下的噪聲情況,在仿真的時(shí)序信號(hào)中混入幅值不同的高斯白噪聲。
結(jié)果及分析
(1)感受野大小和濾波器數(shù)量對(duì)算法的影響
在卷積網(wǎng)絡(luò)中,感受野大小和濾波器數(shù)量影響特征提取的質(zhì)量與效率,所以它們的取值對(duì)算法有很大的影響。在實(shí)驗(yàn)中,設(shè)置多組不同實(shí)驗(yàn)方案進(jìn)行對(duì)比如圖5a與圖5b,從效果對(duì)比圖中可以看出,感受野粒度細(xì)實(shí)驗(yàn)效果越好,以及濾波器越多實(shí)驗(yàn)效果越好。
(2)加權(quán)cnn算法和傳統(tǒng)cnn算法的對(duì)比
將本發(fā)明提出加權(quán)cnn與傳統(tǒng)卷積網(wǎng)絡(luò)以及ricnn進(jìn)行對(duì)比,網(wǎng)絡(luò)收斂效果如圖6。從
圖中可以看出,帶有加權(quán)cnn的網(wǎng)絡(luò)模型的收斂速度要優(yōu)于其它兩種網(wǎng)絡(luò)模型。
結(jié)論:
本發(fā)明的改進(jìn)算法在傳統(tǒng)的卷積神經(jīng)網(wǎng)絡(luò)基礎(chǔ)上,主要做了以下改進(jìn):
卷積網(wǎng)絡(luò)中卷積池化部分的特征圖在進(jìn)入全連接層時(shí),會(huì)造成空間信息的丟失,為了彌補(bǔ)空間特征信息,本發(fā)明提出了多維特征加權(quán)算法,通過給通道維度和空間維度的信息賦予一定的權(quán)值來(lái)進(jìn)行特征圖層的空間強(qiáng)化,對(duì)于通道維度的強(qiáng)化思想是利用圖像熵理論為每個(gè)通道上的特征圖進(jìn)行熵值計(jì)算。