本發(fā)明涉及目標檢測領域,尤其涉及一種基于改進的yolov5s模型的吸煙行為檢測方法。
背景技術:
1、吸煙不僅嚴重危害人們的身體健康而且容易引起火災等事故,因此,如何對吸煙行為進行自動檢測一直是研究的熱點問題。隨著人工智能的飛速發(fā)展,基于深度學習的目標檢測技術被廣泛應用于吸煙行為自動檢測領域。
2、目前現有的基于深度學習的吸煙行為檢測方法通常采用下述幾種方法:
3、(1)采用深度神經網絡對吸煙行為手勢進行特征提取,從而實現吸煙行為的自動檢測;
4、(2)通過對香煙煙霧的hog特征及紋理特征進行分析對香煙煙霧進行識別,從而實現吸煙行為的自動檢測;
5、(3)通過建立基于深度學習算法的目標檢測模型對香煙進行目標識別,從而實現吸煙行為的自動檢測。
6、上述方法存在以下缺陷:
7、對于方法(1),由于吸煙手勢多變、人體膚色多樣、相機拍攝角度不同、易與吸煙行為類似的手勢相混淆等因素,導致吸煙手勢的識別誤判率較大,吸煙行為檢測的準確率較低;
8、對于方法(2),由于香煙煙霧濃度較低、易擴散、邊緣不明顯等因素,導致香煙煙霧難以與背景區(qū)分,吸煙行為檢測的準確率較低;
9、對于方法(3),由于香煙目標較小、易與類煙物相混淆等因素,導致香煙目標難以識別,吸煙行為檢測的準確率較低;并且,由于建立的目標檢測模型時空復雜度較高,導致吸煙行為檢測的實時性較低。
10、可見,提供一種檢測準確率高、實時性高的吸煙行為檢測方法是亟待解決的問題。
技術實現思路
1、鑒于上述的分析,本發(fā)明旨在提供一種基于改進的yolov5s模型的吸煙行為檢測方法,用以解決現有吸煙行為檢測方法實時性低、準確率低的問題。
2、本發(fā)明提供了一種基于改進的yolov5s模型的吸煙行為檢測方法,所述方法包括以下步驟:
3、采集吸煙行為圖像,對所述吸煙行為圖像進行預處理、圖像增強以及標注構建數據集;
4、構建吸煙行為檢測模型,基于所述數據集對所述吸煙行為檢測模型進行訓練,訓練過程中進行正樣本擴充,訓練完成后得到訓練好的吸煙行為檢測模型;
5、將待檢測的圖像輸入所述訓練好的吸煙行為檢測模型,實現吸煙行為檢測。
6、進一步地,所述基于所述數據集對所述吸煙行為檢測模型進行訓練,訓練過程中進行正樣本擴充,訓練完成后得到訓練好的吸煙行為檢測模型包括:
7、將數據集的訓練集中的每個樣本輸入所述吸煙行為檢測模型進行訓練,輸出對應的推理圖;所述推理圖包括預測框,每個預測框包括該預測框對應的中心點的坐標、預測框的高度和寬度、檢測目標類別編號、置信度分數;
8、若推理圖中的預測框為正樣本,則增加與其相應的預測框進行正樣本擴充;
9、通過樣本的標注框與對應的推理圖的預測框之間的誤差計算損失函數,當損失函數達到閾值時得到訓練好的吸煙行為檢測模型。
10、進一步地,所述若推理圖中的預測框為正樣本,則增加與其相應的預測框進行正樣本擴充包括:若推理圖中的預測框為正樣本,則按該預測框的大小在其上、下、左、右四個方向建立與其相鄰的四個預測框,從與其相鄰的四個預測框中選取中心點與該預測框對應的標注框的中心點距離最近的兩個預測框作為新增的預測框;設置新增的預測框的類別與該預測框一致。
11、進一步地,所述損失函數包括檢測目標置信度損失、檢測目標類別損失、預測框損失。
12、進一步地,所述損失函數的表達式如下所示:
13、loss=λobjbceobj+λclsbcecls+λboxfiou,
14、其中,bceobj為檢測目標置信度損失,bcecls為檢測目標類別損失,fiou為預測框損失,λobj、λcls、λbox為權重系數。
15、進一步地,所述檢測目標置信度損失代表預測準確性的誤差,即預測框中是否存在目標,所述檢測目標置信度損失的損失函數表達式如下所示:
16、
17、
18、其中,n為樣本總數,m為正樣本的數量,n-m為負樣本的數量,yi=1表示預測框中存在目標,yi=0表示預測框中不存在目標,p1為預測框中存在目標的概率,α為系數。
19、進一步地,所述檢測目標類別損失代表預測框的類別與標注框的類別之間的誤差,所述檢測目標類別損失的損失函數表達式如下所示:
20、
21、其中,np為正樣本的數量,n為類別的數量,ci=1表示預測的類別屬于ci類別,ci=0表示預測的類別不屬于ci類別,βi為正樣本中ci類別的比例,γ為控制系數,pi表示預測為ci類別的概率。
22、進一步地,所述預測框損失代表預測框與樣本標注框之間的位置誤差,所述預測框損失的損失函數表達式如下所示:
23、
24、其中,bpre表示預測框所占的區(qū)域,bgt表示標注框所占的區(qū)域,iou為預測框與標注框的交并比,ρ2(bpre,bgt)表示預測框中心點與標注框中心點之間的距離,wpre為預測框的寬度,wgt為標注框的寬度,ρ2(wpre,wgt)表示預測框的寬度與標注框的寬度差值的平方,hpre為預測框的高度,hgt為標注框的高度,ρ2(hpre,hgt)表示預測框的高度與標注框的高度差值的平方,cw2表示預測框與標注框最小外接矩形寬度的平方,ch2表示預測框與標注框最小外接矩形高度的平方,c2表示預測框與標注框最小外接矩形對角線長度的平方,表示空集。
25、進一步地,所述對所述吸煙行為圖像進行預處理、圖像增強以及標注構建數據集包括:
26、剔除香煙特征點不明顯的吸煙行為圖像,將剩余吸煙行為圖像像素尺寸、格式調整為一致;
27、對像素尺寸調整后的吸煙行為圖像進行圖像增強處理;
28、對像素尺寸調整以及圖像增強后的吸煙行為圖像進行標注構建數據集,并將所述數據集劃分為訓練集和測試集。
29、進一步地,所述對像素尺寸調整后的吸煙行為圖像進行圖像增強處理包括以下一種或多種方法:
30、隨機選擇所述吸煙行為圖像中的部分內容并復制到其他圖像中,生成新的吸煙行為圖像;
31、對所述吸煙行為圖像進行二維線性變換,生成新的吸煙行為圖像;所述二維線性變換包括旋轉、平移、縮放、錯切、翻轉;
32、在所述吸煙行為圖像中隨機選取兩幅圖像,將所述兩幅圖像按一定比例混合,生成新的吸煙行為圖像;
33、隨機調整所述吸煙行為圖像的色調、飽和度、亮度,生成新的吸煙行為圖像;
34、隨機遮擋所述吸煙行為圖像中的部分區(qū)域,生成新的吸煙行為圖像。
35、與現有技術相比,本發(fā)明至少可實現如下有益效果之一:
36、1、本發(fā)明提出的nhswish激活函數采用分段函數簡化表達式,提高了計算效率,適用于資源有限的嵌入式設備。
37、2、本發(fā)明提出的c5_1模塊以及c5_2模塊由cbh模塊經過多次通道疊加組成,不僅降低了參數量和運算量,而且增加了不同通道之間的信息融合;sppfs模塊通過增加不同通道之間的信息融合具有更深入的信息融合效果,有利于更全面地提取全局特征信息,為提高模型預測的精度提供了基礎。
38、3、本發(fā)明將骨干網絡中p2單元的輸出輸入至頸部網絡fpn并將fpn中第二層特征融合層的輸出輸入至pan,可以降低小目標特征信息在多層卷積計算過程中的衰減,使特征信息在fpn與pan中進行特征融合,增強了圖像淺層語義信息的傳播,平衡深層網絡對于目標類別識別與淺層網絡對于小目標的定位進行不同尺度圖像特征提取之間的矛盾;將骨干網絡中sppfs模塊的輸出直接作為信息流輸入至頸部網絡pan,提高了預測框位置的精度,為提高模型預測的精度提供了基礎。
39、4、本發(fā)明提出的bceobj損失函數,可以動態(tài)調整正、負樣本的損失值,從而提高了模型收斂的速度和目標檢測的精度;bcecls損失函數可以動態(tài)調整不同類別的損失值,用于平衡不同類別之間樣本數量的不均衡;fiou損失函數通過分別計算預測框與標注框的長度比、寬度比而不是考慮寬高比的一致性,提高了寬高比的準確性,可以平衡預測框與標注框無交集、交集較少以及高度重合情況下的損失值,避免了預測框損失值過大或過小,加速了模型的收斂。
40、本發(fā)明中,上述各技術方案之間還可以相互組合,以實現更多的優(yōu)選組合方案。本發(fā)明的其他特征和優(yōu)點將在隨后的說明書中闡述,并且,部分優(yōu)點可從說明書中變得顯而易見,或者通過實施本發(fā)明而了解。本發(fā)明的目的和其他優(yōu)點可通過說明書以及附圖中所特別指出的內容中來實現和獲得。