本發(fā)明涉及合成孔徑雷達(dá)(sar)目標(biāo)檢測,涉及一種sar圖像船舶目標(biāo)檢測方法,可以于復(fù)雜環(huán)境下的船舶目標(biāo)檢測任務(wù)。
背景技術(shù):
1、合成孔徑雷達(dá)(sar)技術(shù),以其卓越的高分辨率成像特性,在當(dāng)代軍事及民用領(lǐng)域占據(jù)了舉足輕重的地位。該技術(shù)通過發(fā)射并接收反射回來的電磁波,來捕獲目標(biāo)的圖像信息,其應(yīng)用范圍覆蓋了地球觀測、軍事偵察、災(zāi)害監(jiān)測等多個(gè)關(guān)鍵領(lǐng)域。然而,sar圖像的獲取過程并非毫無挑戰(zhàn),它們常常面臨著大氣擾動(dòng)、多路徑效應(yīng)和地表雜波等復(fù)雜環(huán)境因素的干擾,這些干擾因素可能會(huì)掩蓋目標(biāo)信號或使其變得模糊,從而增加了目標(biāo)檢測的難度。此外,目標(biāo)的準(zhǔn)確識別不僅依賴于其外觀特征,還與其所處的上下文環(huán)境密切相關(guān),例如,船舶可能位于海上或靠近岸邊。sar圖像中目標(biāo)的多尺度特性,即目標(biāo)以不同尺寸出現(xiàn),為檢測算法的設(shè)計(jì)增添了額外的復(fù)雜性。
2、為了應(yīng)對sar圖像中因目標(biāo)尺度變化帶來的挑戰(zhàn),研究人員已經(jīng)采取了一系列策略來提升檢測算法對尺度變化的魯棒性。其中之一是顯式數(shù)據(jù)增強(qiáng)技術(shù),它通過在訓(xùn)練集中模擬不同尺度的目標(biāo),以此增強(qiáng)模型對尺度變化的適應(yīng)性。同時(shí),多尺度特征集成方法通過整合不同分辨率下提取的特征,旨在提供更為全面的尺度信息。金字塔特征層次結(jié)構(gòu)則通過構(gòu)建多級的特征表示,來捕捉不同尺度的目標(biāo)信息。
3、然而,在處理sar圖像的過程中,現(xiàn)有方法仍存在局限性。一個(gè)核心問題在于,不同尺度的目標(biāo)可能需要不同大小的感受野來有效捕捉其上下文信息。目前,許多方法采用固定大小的感受野來處理不同尺度的目標(biāo),這限制了網(wǎng)絡(luò)對于大型目標(biāo)上下文信息的捕捉能力,影響了sar圖像目標(biāo)檢測的整體性能。
4、現(xiàn)有的sar圖像目標(biāo)檢測方法嘗試通過擴(kuò)展背景網(wǎng)絡(luò)的空間感受野來應(yīng)對挑戰(zhàn),但這種做法存在一些局限性。例如,使用大卷積核可能會(huì)引入額外的背景噪聲,這對小目標(biāo)的準(zhǔn)確檢測可能產(chǎn)生不利影響。這是因?yàn)榇缶矸e核在提取背景特征時(shí),可能會(huì)捕獲到與目標(biāo)無關(guān)的噪聲信號,從而干擾小目標(biāo)的特征表示。因此,如何在增加上下文信息的同時(shí),減少對小目標(biāo)檢測精度的潛在損失,成為了一個(gè)待解決的問題。此外,擴(kuò)張卷積雖然能有效擴(kuò)大感受野,但如果使用較大的擴(kuò)張率,它可能會(huì)降低對高頻信號的響應(yīng),導(dǎo)致無法捕捉到圖像中的高頻細(xì)節(jié)信息。這種情況在處理細(xì)節(jié)豐富的圖像時(shí)尤為突出,可能會(huì)導(dǎo)致檢測性能的下降。傳統(tǒng)的擴(kuò)張卷積方法采用全局固定的擴(kuò)張率,并未充分考慮圖像中不同區(qū)域的局部頻率特性,可能無法最優(yōu)地適應(yīng)圖像的所有部分。
技術(shù)實(shí)現(xiàn)思路
1、為了克服現(xiàn)有技術(shù)的不足,本發(fā)明提供一種基于自適應(yīng)卷積的多核sar目標(biāo)檢測方法。采用多尺度卷積核和自適應(yīng)的擴(kuò)張卷積來提取不同尺度的目標(biāo)特征,并捕獲局部上下文。本發(fā)明設(shè)計(jì)具有動(dòng)態(tài)調(diào)整感受野能力的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),以便更好地捕捉和理解不同尺度目標(biāo)的上下文信息。通過這兩種結(jié)構(gòu)的結(jié)合,可以顯著提高sar圖像中目標(biāo)檢測的準(zhǔn)確性和魯棒性。本發(fā)明的技術(shù)方案主要包塊兩個(gè)部分:多核上下文感知網(wǎng)絡(luò)和頻譜自適應(yīng)膨脹網(wǎng)絡(luò)。在提出的基于自適應(yīng)卷積的多核合成孔徑雷達(dá)(sar)目標(biāo)檢測方法中,首先接收輸入的sar圖像,并將其送入一個(gè)特征提取網(wǎng)絡(luò)。這個(gè)特征提取網(wǎng)絡(luò)包含了多個(gè)卷積層和批歸一化層,用于從輸入圖像中提取特征。在每個(gè)卷積層之后,都使用了silu激活函數(shù),以引入非線性變換并增強(qiáng)模型的表達(dá)能力。
2、多核上下文感知網(wǎng)絡(luò),采用了一種并行處理的方式,利用了不同尺寸的卷積核來捕獲多尺度的目標(biāo)特征。此外,通過上下文中心錨點(diǎn)注意力模塊,該網(wǎng)絡(luò)能夠有效地捕獲長距離的上下文信息,從而提高了檢測的準(zhǔn)確性。本發(fā)明引入了頻譜自適應(yīng)膨脹結(jié)構(gòu),通過頻譜分析動(dòng)態(tài)調(diào)整卷積的擴(kuò)張率,以優(yōu)化感受野和有效帶寬之間的平衡。這一結(jié)構(gòu)的引入使得模型能夠更好地適應(yīng)不同尺度的目標(biāo)??臻g金字塔快速池化(spatial?pyramidpooling,spp)技術(shù)被用來進(jìn)一步增強(qiáng)模型對空間信息的感知能力。通過對輸入特征圖進(jìn)行不同尺度的池化操作,spp技術(shù)使得模型能夠有效地捕獲圖像中不同尺度的信息。此外,漸進(jìn)式不對稱特征金字塔網(wǎng)絡(luò)被用于構(gòu)建特征金字塔,通過多尺度融合提高了對不同尺寸目標(biāo)的檢測性能。這種網(wǎng)絡(luò)結(jié)構(gòu)的設(shè)計(jì)使得模型能夠更全面地考慮目標(biāo)在不同尺度下的特征。檢測頭被設(shè)計(jì)為解耦的,這意味著它可以獨(dú)立于特征提取網(wǎng)絡(luò)進(jìn)行優(yōu)化。這種設(shè)計(jì)使得模型的訓(xùn)練過程更加靈活,可以針對特定任務(wù)進(jìn)行定制優(yōu)化。
3、最終,該框架能夠輸出精確的目標(biāo)檢測結(jié)果,包括目標(biāo)的位置、類別和方向等詳細(xì)信息。通過這種綜合性的設(shè)計(jì),該方法在sar圖像目標(biāo)檢測任務(wù)中能夠有效地處理多尺度目標(biāo),同時(shí)充分考慮到目標(biāo)的形狀和上下文信息,實(shí)現(xiàn)了高性能的檢測效果。
4、本發(fā)明解決其技術(shù)問題所采用的技術(shù)方案包括如下步驟:
5、步驟1:數(shù)據(jù)集準(zhǔn)備;
6、網(wǎng)絡(luò)結(jié)構(gòu)的訓(xùn)練和測試采用hrsid公共數(shù)據(jù)集,該數(shù)據(jù)集為了處理高分辨率合成孔徑雷達(dá)(sar)圖像的船只檢測、語義分割和實(shí)例分割任務(wù)而設(shè)計(jì),hrsid公共數(shù)據(jù)集在sar圖像分析算法的研發(fā)和基準(zhǔn)測試中得到了廣泛應(yīng)用,尤其是在船只檢測方面,包含了5604張高分辨率sar圖像以及16951個(gè)船只實(shí)例的標(biāo)注,sar圖像圖像來源于sentinel-1b、terrasar-x和tandemi-x傳感器,保證了各種成像條件和分辨率的覆蓋;hrsid數(shù)據(jù)集包括高分辨率圖像以及捕獲的多樣化場景(包括不同海況、海域和沿海港口),其中3642張用于訓(xùn)練,1962張用于測試,圖像大小為800×800。
7、步驟2:基于自適應(yīng)卷積的多核sar目標(biāo)檢測模型構(gòu)建;
8、目標(biāo)檢測模型包括卷積塊、多核上下文感知網(wǎng)絡(luò)、頻譜自適應(yīng)膨脹結(jié)構(gòu)、漸進(jìn)式不對稱特征金字塔網(wǎng)絡(luò)和解耦檢測頭;輸入sar圖像后,經(jīng)過卷積塊后輸入多核上下文感知網(wǎng)絡(luò),多核上下文感知網(wǎng)絡(luò)的輸出依次通過頻譜自適應(yīng)膨脹結(jié)構(gòu)和空間金字塔快速池化,將經(jīng)過多核上下文感知網(wǎng)絡(luò)和空間金字塔快速池化的圖像輸入至漸進(jìn)式不對稱特征金字塔網(wǎng)絡(luò)進(jìn)行處理,得到特征圖,之后特征圖輸入解耦檢測頭進(jìn)行后處理;
9、步驟3:損失函數(shù);
10、步驟4:采用損失函數(shù)使用訓(xùn)練集對網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練,訓(xùn)練過程中采用驗(yàn)證集,觀察模型性能,并得到map50、map50:95兩項(xiàng)指標(biāo)最高的網(wǎng)絡(luò)模型。
11、步驟2中,目標(biāo)檢測模型的構(gòu)建過程如下:
12、步驟2-1:構(gòu)建卷積塊,三個(gè)卷積塊依次串聯(lián);
13、卷積塊包括卷積層、批歸一化和silu激活函數(shù),卷積層窗口尺寸為3×3,填充為1,步長為1;
14、步驟2-2:構(gòu)建多核上下文感知網(wǎng)絡(luò);
15、多核上下文感知網(wǎng)絡(luò)為三個(gè)多核上下文感知結(jié)構(gòu)依次串聯(lián);
16、步驟2-3:構(gòu)建頻譜自適應(yīng)膨脹結(jié)構(gòu);
17、頻譜自適應(yīng)膨脹結(jié)構(gòu)為處理高度變化的空間頻率信息而設(shè)計(jì),分為三個(gè)功能塊:自適應(yīng)選擇膨脹率模塊、頻率選擇模塊和自適應(yīng)選擇內(nèi)核模塊;頻率選擇模塊分析和優(yōu)化輸入特征圖在不同頻率上的表現(xiàn),通過調(diào)整頻率成分的權(quán)重來調(diào)整不同頻率帶的貢獻(xiàn),輸出為加權(quán)合成的特征圖;自適應(yīng)選擇內(nèi)核模塊調(diào)整卷積核的成分,以便更好地捕獲高頻和低頻信息,輸出為自適應(yīng)卷積核;頻率選擇模塊輸出的特征圖和自適應(yīng)選擇內(nèi)核模塊輸出的自適應(yīng)卷積核為自適應(yīng)選擇膨脹率模塊的輸入,首先根據(jù)輸入特征圖的局部特性生成一個(gè)膨脹圖(dilation?map)。膨脹圖中的每個(gè)值定義了相應(yīng)位置的膨脹卷積應(yīng)使用的膨脹率。根據(jù)膨脹圖指示的膨脹率,對輸入特征圖應(yīng)用膨脹卷積。膨脹卷積通過在卷積核的元素之間插入空格(由膨脹率確定)來增大其感受野,而不增加參數(shù)數(shù)量或計(jì)算復(fù)雜度。自適應(yīng)膨脹結(jié)構(gòu)最終的輸出為經(jīng)過自適應(yīng)膨脹卷積的特征圖;
18、步驟2-4:構(gòu)建空間金字塔快速池化、漸進(jìn)式不對稱特征金字塔網(wǎng)絡(luò)和解耦檢測頭;
19、空間金字塔快速池化的輸入為頻譜自適應(yīng)膨脹結(jié)構(gòu)輸出的f4通道數(shù)為256,輸出通道數(shù)為256,漸進(jìn)式不對稱特征金字塔網(wǎng)絡(luò)的輸入來自多核上下文感知結(jié)構(gòu)2輸出的特征圖f2、多核上下文感知輸出的f3和空間金字塔快速池化的輸出f5,通道數(shù)分別為64和128,256;漸進(jìn)式不對稱特征金字塔網(wǎng)絡(luò)輸出的三個(gè)大小分別為20*20、40*40、80*80大小的特征圖作為三個(gè)解耦檢測頭的輸入;
20、步驟2-5:解耦檢測;
21、檢測頭把漸進(jìn)式不對稱特征金字塔網(wǎng)絡(luò)輸出的三個(gè)大小分別為20*20、40*40、80*80大小的特征圖作為三個(gè)解耦檢測頭的輸入,傳統(tǒng)的檢測頭往往使用同一套特征來同時(shí)完成目標(biāo)的分類和回歸任務(wù),但由于分類和回歸任務(wù)的需求不同,這種共享特征的方式可能會(huì)導(dǎo)致兩者之間的沖突,進(jìn)而影響檢測精度;解耦檢測頭通過將分類和回歸任務(wù)分離開來,使用不同的分支分別處理這兩種任務(wù),從而提高檢測性能;分類分支專注于目標(biāo)的分類任務(wù),輸入來自特征金字塔網(wǎng)絡(luò)輸出的特征圖,通過一系列卷積層提取用于分類的特征,輸出的特征用于預(yù)測每個(gè)檢測框中的目標(biāo)類別得分,分類分支的輸出形狀為四維的向量,四維包括批次大小、錨的數(shù)量*類別數(shù)、特征圖的寬及特征圖的高;回歸分支專注于邊界框的回歸任務(wù),即預(yù)測目標(biāo)的位置;同樣,輸入來自漸進(jìn)式不對稱特征金字塔網(wǎng)絡(luò)輸出的特征圖,通過不同的一系列卷積層提取用于回歸的特征,回歸分支輸出的特征用于預(yù)測每個(gè)邊界框的位置信息,位置信息包括邊界框的左上角和右下角坐標(biāo),或者中心點(diǎn)和寬和高,輸出的形狀為批次大小、錨的數(shù)量*4、特征圖的寬和特征圖的高;
22、步驟2-6:后處理;
23、在解耦檢測頭輸出檢測結(jié)果后,需要經(jīng)過后處理步驟,以得到最終的目標(biāo)檢測結(jié)果,后處理的步驟包括邊界框解碼、非極大值抑制、閾值過濾和結(jié)果輸出,4個(gè)步驟串聯(lián)進(jìn)行,邊界框解碼將回歸分支預(yù)測的檢測框的位置信息解碼為相對于原圖的實(shí)際坐標(biāo);例如,回歸頭輸出的是中心點(diǎn)偏移和寬高比,轉(zhuǎn)換為實(shí)際的左上角和右下角坐標(biāo);隨后進(jìn)行非極大值抑制操作,首先選取得分最高的邊界框作為當(dāng)前框,然后將與它的重疊度(iou)超過0.5的其他框移除,依次重復(fù)非極大值抑制的過程,直到?jīng)]有滿足條件的候選框?yàn)橹?;最后,將置信度的閾值低?.001的邊界框剔除,保留的框即為檢測結(jié)果;
24、步驟3中所述損失函數(shù)包括類別分類損失和邊界框回歸損失:
25、分類損失使用交叉熵?fù)p失binary?cross-entropy?loss衡量模型對目標(biāo)類別的預(yù)測準(zhǔn)確性,如公式(9)所示:
26、
27、其中n是邊界框的數(shù)量,yi是真實(shí)標(biāo)簽,1表示目標(biāo)存在,0表示目標(biāo)不存在,pi是模型預(yù)測的置信度分?jǐn)?shù);
28、邊界框回歸損失為并集上的廣義交損失(generalized?intersection?overunion,ciou?loss)和基于距離的特征學(xué)習(xí)損失(distance-based?feature?learningloss,dfl?loss)的形式;
29、dfl?loss用于優(yōu)化邊界框的回歸任務(wù),不直接預(yù)測邊界框的坐標(biāo),而是預(yù)測坐標(biāo)的分布(例如通過一組基礎(chǔ)函數(shù)),從而通過基礎(chǔ)函數(shù)的組合來更精確地估計(jì)邊界框的位置,fl的公式如公式(10)為:
30、dfl(si,si+1)=-(yi+1-y)log(si)+(y-yi)log(si+1)??(10)
31、這里,si和si+1分別代表預(yù)測的分布在第i個(gè)區(qū)間和第i+1區(qū)間的概率,而y是真實(shí)的標(biāo)簽或值;損失函數(shù)通過優(yōu)化預(yù)測分布與真實(shí)值之間的距離來改善模型的預(yù)測精度;
32、ciou?loss是一種用于邊界框回歸的損失函數(shù),考慮了邊界框之間的重疊區(qū)域、中心點(diǎn)距離及寬高比,從而提供了一個(gè)更全面的損失評估;如公式(11)所示:
33、
34、其中,ρ(b,bgt)表示預(yù)測框bgt與真實(shí)框b之間的距離,c是包含兩個(gè)框的最小閉合框的對角線長度,v和α是與寬高比相關(guān)的項(xiàng),用以調(diào)整寬高比對比損失的貢獻(xiàn);
35、整體的損失函數(shù)如公式(12)所示:
36、
37、所述步驟2-2中,多核上下文感知結(jié)構(gòu)中,輸入為來自前一個(gè)階段的特征圖fl-1,l表示當(dāng)前在進(jìn)行多核上下文感知結(jié)構(gòu)的第l層,l-1表示上一層,所輸入的特征圖首先經(jīng)過haar小波降采樣模塊進(jìn)行空間尺寸縮減;3×3的卷積層對haar小波降采樣后的特征圖進(jìn)行卷積操作,提取語義特征,其中3×3的卷積層改變特征圖的深度,即通道數(shù);將經(jīng)過3×3的卷積層后的特征圖xl-1按通道數(shù)平均分割成兩部分和然后將兩部分分配到兩個(gè)不同的處理路徑上;一條路徑為一個(gè)前饋網(wǎng)絡(luò)(feed-forward?network,ffn),前饋網(wǎng)絡(luò)通過兩個(gè)串聯(lián)的卷積層和激活函數(shù)對輸入特征圖進(jìn)行直接的前向傳播,提取和傳遞特征信息,輸出為另一條路徑由多個(gè)多核上下文感知層串聯(lián)組成,每個(gè)多核上下文感知層都是網(wǎng)絡(luò)中的一個(gè)基本構(gòu)建單元,輸出為
38、將前饋網(wǎng)絡(luò)ffn的輸出與多核上下文感知層的輸出進(jìn)行拼接,然后通過卷積層進(jìn)一步整合特征,輸出最終的特征圖fl,整個(gè)多核上下文感知結(jié)構(gòu)的輸出fl的表示如公式(1)所示:
39、
40、其中,concat表示拼接操作,conv表示卷積操作,拼接和卷積操作有助于整合不同處理路徑的特征,增強(qiáng)本發(fā)明的模型對輸入數(shù)據(jù)的表示能力;
41、多核上下文感知網(wǎng)絡(luò)如圖3所示,多核上下文感知結(jié)構(gòu)如圖4所示,多核上下文感知層內(nèi)部集成多核上下文感知模塊和上下文中心錨點(diǎn)注意力模塊,兩個(gè)模塊并行進(jìn)行,如圖5所示,多核上下文感知層的輸入從上一結(jié)構(gòu)或前一多核上下文感知層傳入的特征圖多核上下文感知模塊利用多尺度卷積核捕獲不同尺度的目標(biāo)特征;上下文中心錨點(diǎn)注意力模塊的輸入同樣為上一結(jié)構(gòu)或前一多核上下文感知層傳入的特征圖專注于捕獲圖像中遠(yuǎn)距離像素間的上下文關(guān)系;上下文中心錨點(diǎn)注意力模塊先經(jīng)過平均池化獲取全局特征,再經(jīng)過1×1的卷積層和3×3的深度可分離卷積對全局特征提取和細(xì)化,從而增強(qiáng)特征的語義信息;將多核上下文感知模塊和上下文中心錨點(diǎn)注意力模塊輸出的特征圖進(jìn)行相乘,再將相乘得到的結(jié)果加上多核上下文感知模塊輸出的特征圖,通過一個(gè)1x1卷積層處理融合后的特征圖,進(jìn)一步整合特征,并減少特征維度,輸出兩個(gè)并行路徑的處理結(jié)果最終通過通道級聯(lián)和融合操作相結(jié)合,以生成每個(gè)階段的輸出特征圖;
42、所述多核上下文感知模塊中,多核上下文感知模塊的輸入為多核上下文感知模塊處理后的特征圖輸出為pl-1,n,用于后續(xù)層或模塊的輸入;初始的深度可分離卷積操作,使用3x3的卷積核對輸入進(jìn)行特征提取,隨后多尺度深度可分離卷積分別使用5x5、7x7、9x9和11x11的卷積核進(jìn)行深度可分離卷積操作,這些操作幫助模型捕捉不同尺度的空間特征,采用恒等映射(identity)將經(jīng)過3×3深度分離卷積的直接傳遞到融合階段,與其它尺度的特征圖進(jìn)行融合;
43、所述上下文中心錨點(diǎn)注意力模塊中,上下文中心錨點(diǎn)注意力模塊的公式表示為公式(2):
44、
45、平均池化操作(avgpool)對輸入特征圖進(jìn)行空間維度的降采樣,減小特征圖的尺寸以減少后續(xù)計(jì)算量,平均池化通過計(jì)算輸入特征圖中每個(gè)小區(qū)域的平均值實(shí)現(xiàn),接著使用1x1的卷積層來調(diào)整通道數(shù),這一步不會(huì)改變特征圖的空間尺寸,主要用于線性組合不同通道的特征;首先進(jìn)行的是1x(11+2xn)的深度可分離卷積,處理寬度方向的特征;其后是(11+2xn)x1的深度可分離卷積,處理高度方向的特征。深度可分離卷積通過分別對每個(gè)輸入通道進(jìn)行空間卷積,然后應(yīng)用1x1卷積融合通道信息;再次通過1x1卷積整合深度卷積后的特征,進(jìn)一步提升了特征的表達(dá)能力和整合不同尺寸特征的能力,最后,通過sigmoid激活函數(shù)處理最終的卷積輸出,得到最終的注意力權(quán)重圖al-1,n,sigmoid函數(shù)將輸出值壓縮到0和1之間,表示每個(gè)位置的重要性。
46、所述步驟2.3中,構(gòu)建頻譜自適應(yīng)膨脹結(jié)構(gòu)的步驟為:
47、步驟2-3-1:構(gòu)建頻率選擇模塊;
48、在頻率選擇模塊中,輸入的空間域特征圖是多核上下文感知網(wǎng)絡(luò)的輸出f3,首先通過傅立葉變換被轉(zhuǎn)換到頻域,形成xf,轉(zhuǎn)換揭示了圖像中的不同頻率成分;接著,xf被分解成多個(gè)預(yù)定義的頻率帶,每個(gè)頻率帶通過應(yīng)用相應(yīng)的頻域掩模mb提取對應(yīng)的頻率范圍的特征每個(gè)頻率帶特征獨(dú)立地通過為其設(shè)計(jì)的卷積核mb進(jìn)行處理,生成卷積后的結(jié)果yb,為了確定每個(gè)頻率帶在最終輸出中的貢獻(xiàn),對yb應(yīng)用1×1卷積和sigmoid激活函數(shù)生成選擇圖sb,選擇圖sb表達(dá)了各個(gè)頻率帶的重要性;最終,所有加權(quán)的頻率帶特征yb通過與它們各自的選擇圖sb相乘并累加,合成最終的輸出特征圖y,使得模塊能夠動(dòng)態(tài)調(diào)整對不同頻率帶的關(guān)注,優(yōu)化整體的特征提取和信息合成,最終輸出的特征圖通過公式(3)計(jì)算得到:
49、y=∑bsb·yb?(3)
50、其中,sb=sigmoid(conv(xb)),表示對每個(gè)頻率帶特征應(yīng)用1x1卷積和sigmoid函數(shù)得到的選擇權(quán)重,重加權(quán)后的頻率帶特征通過加權(quán)求和,形成最終的輸出特征圖,該輸出特征圖具有經(jīng)過優(yōu)化的頻率成分,更適合進(jìn)行復(fù)雜的空間處理;
51、步驟2-3-2:構(gòu)建自適應(yīng)選擇內(nèi)核模塊;
52、自適應(yīng)選擇內(nèi)核模塊的輸入為多核上下文感知網(wǎng)絡(luò)的輸出f3,global?pool表示全局池化操作,conv表示卷積操作,relu是非線性激活函數(shù),σ是sigmoid函數(shù),用于將卷積操作的輸出壓縮到0和1之間;如公式(4)所示:
53、g=σ(conv(relu(conv(lobal?pool(f3)))))???(4)
54、自適應(yīng)選擇內(nèi)核模塊使用全局池化獲得輸入特征圖的全局上下文信息,再通過一系列卷積和relu層進(jìn)一步處理,然后通過sigmoid激活函數(shù)產(chǎn)生一個(gè)調(diào)節(jié)因子g;
55、初始卷積核k分解為低頻kl和高頻kh兩部分,根據(jù)全局特征圖調(diào)節(jié)因子g動(dòng)態(tài)調(diào)整兩種核的組合,完整如公式(5)所示:
56、k′=g·kl+·k(1-g)·kh??(5)
57、kl=average(k)??(6)
58、kh=k-kl??(7)
59、其中,k′是最終的自適應(yīng)卷積核,用于處理輸入特征,g是從全局特征提取得到的調(diào)節(jié)因子,控制低頻核的影響,1-g自然控制高頻核的影響,確保低頻和高頻成分的平衡;average為求均值;
60、自適應(yīng)選擇內(nèi)核模塊的核心在于如何使用全局特征圖平衡低頻kl和高頻kh核的貢獻(xiàn),g的值決定了在特定的圖像區(qū)域中,低頻信息與高頻信息的相對重要性;
61、步驟2-3-3:構(gòu)建自適應(yīng)選擇膨脹率模塊;
62、自適應(yīng)選擇膨脹率模塊的整個(gè)過程如公式(8)所示:
63、y(p)=∑k∈kx(p+r(p)·k′)·w(k′)??(8)
64、其中,k′是自適應(yīng)選擇內(nèi)核模塊輸出的自適應(yīng)卷積核,x(p)是輸入特征圖在位置p的值,w(k′)是卷積核在位置k的權(quán)重,r(p)是擴(kuò)張映射在位置p的擴(kuò)張率,由前面的卷積+relu層動(dòng)態(tài)生成,y(p)為頻譜自適應(yīng)膨脹結(jié)構(gòu)最終輸出的特征圖。
65、一種電子設(shè)備,包括一個(gè)或多個(gè)處理器;存儲器;一個(gè)或多個(gè)程序,其中所述一個(gè)或多個(gè)程序被存儲在所述存儲器中并被配置為由所述一個(gè)或多個(gè)處理器執(zhí)行,所述一個(gè)或多個(gè)程序配置用于執(zhí)行如上項(xiàng)所述的方法。
66、一種計(jì)算機(jī)可讀存儲介質(zhì),所述計(jì)算機(jī)可讀存儲介質(zhì)存儲有程序代碼,所述程序代碼可被處理器調(diào)用執(zhí)行如上所述的方法。
67、本發(fā)明的有益效果在于所提出的基于自適應(yīng)膨脹卷積的多核sar目標(biāo)檢測方法,采用了多核多尺度、基于頻域的自適應(yīng)膨脹卷積等技術(shù)手段,有效解決了傳統(tǒng)sar目標(biāo)檢測方法在復(fù)雜環(huán)境下的局限性,顯著提升了目標(biāo)檢測的性能。該方法不僅有效應(yīng)對了多尺度目標(biāo)檢測的挑戰(zhàn),還提高了復(fù)雜背景下目標(biāo)識別的準(zhǔn)確性,顯著增強(qiáng)了模型的魯棒性。最終,本發(fā)明提供的解決方案大幅提升了sar圖像目標(biāo)檢測的性能,在軍事偵察、災(zāi)害監(jiān)測、地球觀測等實(shí)際應(yīng)用中具有重要的價(jià)值和廣泛的應(yīng)用前景。