本發(fā)明屬于目標(biāo)檢測(cè),尤其涉及基于改進(jìn)yolov5s的目標(biāo)檢測(cè)方法、系統(tǒng)、設(shè)備及存儲(chǔ)介質(zhì)。
背景技術(shù):
1、隨著社會(huì)經(jīng)濟(jì)的持續(xù)發(fā)展,對(duì)目標(biāo)檢測(cè)的可靠性要求也越來越高,傳統(tǒng)的目標(biāo)檢測(cè)方法通常依賴于手工設(shè)計(jì)的特征提取器來獲取目標(biāo)的關(guān)鍵特征,如尺度不變特征變換匹配(sift)算法、加速穩(wěn)健特征(surf)算法和yolov5系列算法等。其中,yolov5系列算法的網(wǎng)絡(luò)結(jié)構(gòu)呈現(xiàn)高度一致性,性能差異主要體現(xiàn)在網(wǎng)絡(luò)深度和寬度的調(diào)整上。yolov5推出了四個(gè)不同版本的模型:yolov5s、yolov5m、yolov5l和yolov5x,四個(gè)版本在模型體積上呈現(xiàn)出遞增的趨勢(shì),滿足了不同應(yīng)用場(chǎng)景下對(duì)模型復(fù)雜度和性能的需求,但傳統(tǒng)的目標(biāo)檢測(cè)算法往往會(huì)出現(xiàn)漏檢、誤檢等情況,并且在處理復(fù)雜場(chǎng)景和多變目標(biāo)時(shí)往往面臨挑戰(zhàn)。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明的目的在于:提供基于改進(jìn)yolov5s的目標(biāo)檢測(cè)方法、系統(tǒng)、設(shè)備及存儲(chǔ)介質(zhì),以解決現(xiàn)有技術(shù)的目標(biāo)檢測(cè)算法往往會(huì)出現(xiàn)漏檢、誤檢等情況,并且在處理復(fù)雜場(chǎng)景和多變目標(biāo)時(shí)往往面臨挑戰(zhàn)的問題。
2、本申請(qǐng)實(shí)施例是這樣實(shí)現(xiàn)的,基于改進(jìn)yolov5s的目標(biāo)檢測(cè)方法,包括:提供圖片數(shù)據(jù)集,對(duì)數(shù)據(jù)集中的圖片人工標(biāo)注檢測(cè)目標(biāo);
3、構(gòu)建yolov5s網(wǎng)絡(luò)模型,yolov5s網(wǎng)絡(luò)模型包括特征融合網(wǎng)絡(luò)和檢測(cè)頭,在特征融合網(wǎng)絡(luò)添加gam注意力機(jī)制,檢測(cè)頭使用siou位置損失函數(shù);
4、訓(xùn)練yolov5s網(wǎng)絡(luò)模型;
5、測(cè)試yolov5s網(wǎng)絡(luò)模型;
6、輸入未標(biāo)注檢測(cè)目標(biāo)的圖片,獲得檢測(cè)目標(biāo)結(jié)果。
7、可選地,在本申請(qǐng)的一些實(shí)施例中,圖片數(shù)據(jù)集包括網(wǎng)絡(luò)上有開源的圖像和自行拍攝的圖像,其中,自行拍攝的圖像需要利用labelimg標(biāo)注軟件對(duì)該圖像上的檢測(cè)目標(biāo)進(jìn)行人工標(biāo)注;或
8、圖片數(shù)據(jù)集包括融合圖像數(shù)據(jù)集,利用labelimg標(biāo)注軟件對(duì)融合圖像數(shù)據(jù)集中的圖片上的檢測(cè)目標(biāo)進(jìn)行人工標(biāo)注。
9、可選地,在本申請(qǐng)的一些實(shí)施例中,yolov5s網(wǎng)絡(luò)模型還包括輸入和骨干網(wǎng)絡(luò)。
10、可選地,在本申請(qǐng)的一些實(shí)施例中,在特征融合網(wǎng)絡(luò)的后端加入了gam注意力機(jī)制,gam注意力機(jī)制的網(wǎng)絡(luò)結(jié)構(gòu)包括通道注意力模塊和空間注意力模塊。
11、可選地,在本申請(qǐng)的一些實(shí)施例中,通道注意力模塊的計(jì)算公式如下:
12、mc(f1)=σ(reper(mlp(per(f1))))
13、式中,σ表示sigmoid函數(shù),per表示維度轉(zhuǎn)換;reper表示反向恢復(fù)維度;mlp表示兩個(gè)具有隱藏層的多層感知機(jī);f1表示輸入的特征圖,f1∈rc×w×h,其中,c是特征圖通道數(shù),w×h是特征圖的大?。缓?或
14、空間注意力模塊的計(jì)算公式如下:
15、
16、式中,σ表示sigmoid函數(shù),表示對(duì)輸入特征圖進(jìn)行特征映射壓縮的7×7卷積運(yùn)算,表示表示對(duì)壓縮后的圖片進(jìn)行升維操作的7×7卷積運(yùn)算,f2表示輸入特征圖。
17、可選地,在本申請(qǐng)的一些實(shí)施例中,siou位置損失函數(shù)包括角度成本λ、距離成本δ、形狀成本ω和iou成本,siou位置損失函數(shù)的計(jì)算公式如下:
18、
19、式中,lsiou表示siou位置損失函數(shù),λ表示角度成本,δ表示距離成本,ω表示形狀成本和iou是交并比,表示兩框交集面積比它們的并集面積。
20、可選地,在本申請(qǐng)的一些實(shí)施例中,角度成本λ計(jì)算如公式如下:
21、
22、式中,ch是預(yù)測(cè)框中心點(diǎn)與真實(shí)框中心點(diǎn)之間的垂直距離,σ是預(yù)測(cè)框中心點(diǎn)與真實(shí)框中心點(diǎn)連線的距離,α是水平軸和連接每個(gè)框中心的線之間的角度;和/或
23、距離成本△計(jì)算如公式如下:
24、
25、
26、γ2=2-λ
27、式中,ρx表示在x方向的歸一化距離;ρy表示在y方向的歸一化距離;是真實(shí)框的橫坐標(biāo);表示真實(shí)框的縱坐標(biāo);bcx表示預(yù)測(cè)框的橫坐標(biāo);bcy表示預(yù)測(cè)框的縱坐標(biāo);cw表示預(yù)測(cè)框中心到真實(shí)框中心的水平距離,ch表示預(yù)測(cè)框中心到真實(shí)框中心的垂直距離;和/或
28、形狀成本ω計(jì)算公式如下:
29、
30、式中,ωw表示水平方向的歸一化系數(shù)參數(shù);ωh表示垂直方向的歸一化系數(shù);w表示預(yù)測(cè)框的寬,wgt表示真實(shí)框的寬,h表示預(yù)測(cè)框的高,hgt表示真實(shí)框的高;θ表示控制對(duì)形狀損失的系數(shù);和/或
31、iou成本計(jì)算公式如下:
32、
33、式中,iou表示預(yù)測(cè)框與真實(shí)真實(shí)框的面積交集與面積并集的比值;b表示預(yù)測(cè)框的面積,bgt為真實(shí)框的面積。
34、相應(yīng)的,本申請(qǐng)實(shí)施例還提供基于改進(jìn)yolov5s的目標(biāo)檢測(cè)系統(tǒng),包括:圖片數(shù)據(jù)集獲取模塊,用于提供圖片數(shù)據(jù)集,對(duì)數(shù)據(jù)集中的圖片人工標(biāo)注檢測(cè)目標(biāo);
35、yolov5s網(wǎng)絡(luò)模型構(gòu)建模塊,用于構(gòu)建yolov5s網(wǎng)絡(luò)模型,yolov5s網(wǎng)絡(luò)模型包括特征融合網(wǎng)絡(luò)和檢測(cè)頭,在特征融合網(wǎng)絡(luò)添加gam注意力機(jī)制,檢測(cè)頭使用siou位置損失函數(shù);
36、yolov5s網(wǎng)絡(luò)模型訓(xùn)練模塊,用于訓(xùn)練yolov5s網(wǎng)絡(luò)模型;
37、yolov5s網(wǎng)絡(luò)模型測(cè)試模塊,用于測(cè)試yolov5s網(wǎng)絡(luò)模型;
38、檢測(cè)目標(biāo)模塊,用于輸入未標(biāo)注檢測(cè)目標(biāo)的圖片,獲得檢測(cè)目標(biāo)結(jié)果。
39、相應(yīng)的,本申請(qǐng)實(shí)施例還提供計(jì)算機(jī)設(shè)備,包括儲(chǔ)存器和處理器,所述儲(chǔ)存器存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被所述處理器執(zhí)行時(shí),使得所述處理器執(zhí)行如上述方法的步驟。
40、相應(yīng)的,本申請(qǐng)實(shí)施例還提供計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí),使得所述處理器執(zhí)行如上述方法的步驟。
41、綜上所述,由于采用了上述技術(shù)方案,本發(fā)明的有益效果是:
42、本申請(qǐng)為提高yolov5s中小目標(biāo)檢測(cè)能力,基于yolov5s算法提出新的改進(jìn)方法,首先通過在特征融合網(wǎng)絡(luò)中添加gam注意力機(jī)制,使模型更加聚焦對(duì)目標(biāo)檢測(cè)有利的特征,從而提高檢測(cè)的準(zhǔn)確性。其次,將位置損失函數(shù)更換為siou,提高了模型收斂速度和推理的準(zhǔn)確性。本申請(qǐng)改進(jìn)后的yolov5s進(jìn)行目標(biāo)檢測(cè)在一定程度上減少了目標(biāo)檢測(cè)的漏檢率與誤檢率。
1.基于改進(jìn)yolov5s的目標(biāo)檢測(cè)方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的基于改進(jìn)yolov5s的目標(biāo)檢測(cè)方法,其特征在于,圖片數(shù)據(jù)集包括網(wǎng)絡(luò)上有開源的圖像和自行拍攝的圖像,其中,自行拍攝的圖像需要利用labelimg標(biāo)注軟件對(duì)該圖像上的檢測(cè)目標(biāo)進(jìn)行人工標(biāo)注;或
3.根據(jù)權(quán)利要求1所述的基于改進(jìn)yolov5s的目標(biāo)檢測(cè)方法,其特征在于,yolov5s網(wǎng)絡(luò)模型還包括輸入和骨干網(wǎng)絡(luò)。
4.根據(jù)權(quán)利要求1所述的基于改進(jìn)yolov5s的目標(biāo)檢測(cè)方法,其特征在于,在特征融合網(wǎng)絡(luò)的后端加入了gam注意力機(jī)制,gam注意力機(jī)制的網(wǎng)絡(luò)結(jié)構(gòu)包括通道注意力模塊和空間注意力模塊。
5.根據(jù)權(quán)利要求4所述的基于改進(jìn)yolov5s的目標(biāo)檢測(cè)方法,其特征在于,通道注意力模塊的計(jì)算公式如下:
6.根據(jù)權(quán)利要求1所述的基于改進(jìn)yolov5s的目標(biāo)檢測(cè)方法,其特征在于,siou位置損失函數(shù)包括角度成本λ、距離成本δ、形狀成本ω和iou成本,siou位置損失函數(shù)的計(jì)算公式如下:
7.根據(jù)權(quán)利要求6所述的基于改進(jìn)yolov5s的目標(biāo)檢測(cè)方法,其特征在于,角度成本λ計(jì)算如公式如下:
8.基于改進(jìn)yolov5s的目標(biāo)檢測(cè)系統(tǒng),其特征在于,包括:
9.計(jì)算機(jī)設(shè)備,其特征在于,包括儲(chǔ)存器和處理器,所述儲(chǔ)存器存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被所述處理器執(zhí)行時(shí),使得所述處理器執(zhí)行如權(quán)利要求1-7中任一項(xiàng)所述方法的步驟。
10.計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其特征在于,存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí),使得所述處理器執(zhí)行如權(quán)利要求1-7任一項(xiàng)所述方法的步驟。