本發(fā)明屬于圖像處理,尤其涉及一種識別布匹細(xì)小復(fù)雜瑕疵的方法、計算機設(shè)備以及介質(zhì),特別適用于對布匹細(xì)小復(fù)雜瑕疵的識別。
背景技術(shù):
1、對于布匹瑕疵檢測,主要依靠基于機器視覺的深度學(xué)習(xí)網(wǎng)絡(luò)進行檢測。由于布匹織物的瑕疵類型眾多、形狀各異且大小不均勻,使用基于深度學(xué)習(xí)的方法去檢測顯得尤為重要。通過大量的樣本數(shù)據(jù)去訓(xùn)練網(wǎng)絡(luò),使其對于各類型布匹織物的檢測具有泛化性和魯棒性。故在檢測中,對于所設(shè)計的網(wǎng)絡(luò),需要有能力去處理不同顏色,不同尺寸,不同規(guī)格樣本,因此網(wǎng)絡(luò)的泛化性、精準(zhǔn)性、高效性和穩(wěn)定性顯得格外重要。目前,由于卷積神經(jīng)網(wǎng)絡(luò)具有較大的非線性擬合功能,使其在瑕疵檢測時大幅提高了檢測效率。例如:
2、zhao等提出一種基于vgg16網(wǎng)絡(luò)的檢測方法用于亞麻織物和圖像織物的疵點檢測,可檢測出破洞、污漬等6種疵點,但在訓(xùn)練時所用到的參數(shù)數(shù)量較多,訓(xùn)練時間較長,不滿足檢測瑕疵點時效性的要求。pandia等將織物顏色作為重要特征設(shè)計了一種深度卷積神經(jīng)網(wǎng)絡(luò),從各種缺陷數(shù)據(jù)集的訓(xùn)練階段進行學(xué)習(xí),在測試階段利用了一種學(xué)習(xí)特性進行疵點分類,但僅對于具有明顯特征的瑕疵點進行分類,而未能滿足細(xì)小復(fù)雜瑕疵的檢測,具有局限性。朱俊嶺等人采用ar模型譜估計對布匹紋理圖像建模,得到方差序列,通過計算疵點圖像和正常紋理圖像譜估計之間得相關(guān)系數(shù)得到疵點類型和位置,但是在建模過程中容易出現(xiàn)如虛假譜峰,譜線分裂的情況,并且噪聲又會使得使譜估計惡化,使得檢測精度下降,檢測結(jié)果產(chǎn)生較大偏差。安萌等基于faster?rcnn網(wǎng)絡(luò)模型,對卷積神經(jīng)網(wǎng)絡(luò)進行優(yōu)化,將不同尺度的特征金字塔網(wǎng)絡(luò)模型引入?yún)^(qū)域生成網(wǎng)絡(luò)(rpn)以增加細(xì)節(jié)化的淺層特征,通過對softmax分類器進行正則化來減小類內(nèi)間距、增大類間間距,不斷更新網(wǎng)絡(luò)參數(shù)來提高網(wǎng)絡(luò)收斂能力,雖然能夠生成高質(zhì)量的候選區(qū)域,但在一些情況下,對于長寬比例較大的區(qū)域識別效果不佳,易出現(xiàn)梯度爆炸的情況,且其性能在某些條件下還可能會受到限制。
3、基于yolo(you?only?look?once)的目標(biāo)識別成為主流,檢測器通常由兩部分組成,一個是提取特征的主干網(wǎng)絡(luò)(backbone),即基礎(chǔ)網(wǎng)絡(luò),一般在imagenet數(shù)據(jù)集上進行預(yù)訓(xùn)練。另一個是預(yù)測對象類別和邊界框的頭部(head),而頸部(neck)被構(gòu)建在主干與頭部之間,用于匯集不同的特征圖。但是網(wǎng)絡(luò)層數(shù)的深淺會直接影響到目標(biāo)檢測的準(zhǔn)確度與效率,網(wǎng)絡(luò)結(jié)構(gòu)越深,非線性表達(dá)能力,可以學(xué)習(xí)更加復(fù)雜的變換,可以擬合更加復(fù)雜的特征輸入;網(wǎng)絡(luò)層數(shù)越淺,則相反。研究者們一直在優(yōu)化網(wǎng)絡(luò)的模型,不斷調(diào)整參數(shù),使其在準(zhǔn)確度高的基礎(chǔ)上減少運算量,提高效率。目前,對于其他版本的yolo存在當(dāng)輸入數(shù)據(jù)經(jīng)過逐層特征提取和空間變換時,大量信息將會丟失的問題,信息的損失可能導(dǎo)致有偏差的梯度流,這些流隨后被用來更新模型,便很可能導(dǎo)致深層網(wǎng)絡(luò)建立不正確的關(guān)聯(lián)連接。
4、而基于yolov9的檢測方法在使用中具有較大的發(fā)展?jié)摿?,其提出可編程梯度信?programable?gradient?infomation,pgi)的概念來應(yīng)對深度網(wǎng)絡(luò)實現(xiàn)多個目標(biāo)所需的各種變化,同時yolov9中還設(shè)計了一種基于梯度路徑規(guī)劃的新型輕量級網(wǎng)絡(luò)架構(gòu)-通用高效層聚合網(wǎng)絡(luò)(generalized?efficient?layer?aggregation?network,gelan)。
5、但是,在將yolov9應(yīng)用于布匹細(xì)小復(fù)雜瑕疵識別時,存在如下問題:
6、1.資源消耗量較大:雖然yolov9在準(zhǔn)確度、效率方面有所提升,但它仍然是一個復(fù)雜的深度學(xué)習(xí)模型,需要較大的資源和較長的時間來進行訓(xùn)練和推理。
7、2.模型過擬合和欠擬合影響識別效果:與其他深度學(xué)習(xí)模型相同,yolov9也面臨著過擬合和欠擬合的問題,過擬合意味著模型在訓(xùn)練集上表現(xiàn)良好,但在測試集上表現(xiàn)較差,而欠擬合則意味著模型在訓(xùn)練集和測試集上都表現(xiàn)較差,很有可能造成因擬合問題而影響對于細(xì)小瑕疵的檢測效果和效率的情況出現(xiàn)。
8、3.泛化能力不足影響瑕疵識別精度:盡管yolov9通過多個數(shù)據(jù)集進行測試獲得了相對較好的結(jié)果,但其泛化能力可能還存在欠缺。即遇到所使用的數(shù)據(jù)量,如果過少、質(zhì)量過于差、規(guī)格不標(biāo)準(zhǔn),標(biāo)簽特征不夠明顯,則會對訓(xùn)練的結(jié)果產(chǎn)生嚴(yán)重誤差。如果數(shù)據(jù)集不平衡,即某些類別的樣本數(shù)量遠(yuǎn)遠(yuǎn)多于其他類別,那么模型可能會偏向于識別數(shù)量較多的類別,而忽略數(shù)量較少的類別,進而對細(xì)小復(fù)雜的瑕疵識別精度造成影響,可能會導(dǎo)致漏檢、錯檢的情況出現(xiàn)。
9、4.對長寬比例較大的目標(biāo)檢測效果較差:由于在布匹生產(chǎn)過程中,流水線機器是持續(xù)作業(yè)的,這就有可能造成出現(xiàn)的疵點是細(xì)小狹長,或者密集分布的,而yolov9在預(yù)測時將整個圖像分成了較大的網(wǎng)格,因此在檢測中可能出現(xiàn)對于密集目標(biāo)的處理不夠理想,容易出現(xiàn)漏檢或檢測框重疊的情況。
技術(shù)實現(xiàn)思路
1、本發(fā)明的目的在于提出一種識別布匹細(xì)小復(fù)雜瑕疵的方法,該方法基于改進的yolov9搭建用于布匹細(xì)小復(fù)雜瑕疵識別的模型,以提升針對細(xì)小復(fù)雜瑕疵的識別準(zhǔn)確率和效率。
2、本發(fā)明為了實現(xiàn)上述目的,采用如下技術(shù)方案:
3、一種識別布匹細(xì)小復(fù)雜瑕疵的方法,包括如下步驟:
4、步驟1.首先對收集的布匹瑕疵圖像進行預(yù)處理,并形成用于模型訓(xùn)練的數(shù)據(jù)集;
5、步驟2.搭建基于改進的yolov9模型的布匹細(xì)小復(fù)雜瑕疵識別模型;其中改進的yolov9模型,其主支路結(jié)構(gòu)是在原有yolov9模型的基礎(chǔ)上進行如下改進得到的:
6、在主支路結(jié)構(gòu)的主干網(wǎng)絡(luò)中引入改進蛇形動態(tài)卷積模塊c-dsc,對瑕疵點自適應(yīng)動態(tài)提取,用于以提高對復(fù)雜瑕疵形狀和邊界的敏感性,增強對細(xì)長復(fù)雜樣式的瑕疵檢測能力;使用rt-detr模型中的aifi模塊來替換yolov9模型中的sppelan模塊,用于增強模型對局部和全局信息的處理能力,增強同一尺度內(nèi)特征之間的交互,以減少處理延遲,提高速度;在head層前加入多尺度前饋網(wǎng)絡(luò)msfn,用于聚合多尺度特征并增強非線性信息轉(zhuǎn)換;
7、步驟3.利用步驟1的數(shù)據(jù)集訓(xùn)練基于改進的yolov9模型的布匹細(xì)小復(fù)雜瑕疵識別模型,在布匹細(xì)小復(fù)雜瑕疵識別模型訓(xùn)練過程中,引入輔助分支幫助訓(xùn)練;
8、步驟4.將待識別的布匹瑕疵圖像經(jīng)過步驟1的預(yù)處理后,輸入步驟3訓(xùn)練好的布匹細(xì)小復(fù)雜瑕疵識別模型中,最終輸出得到目標(biāo)識別結(jié)果,包括邊界框的位置和類別,從而識別出布匹瑕疵圖像中存在的布匹細(xì)小復(fù)雜瑕疵。
9、此外,在識別布匹細(xì)小復(fù)雜瑕疵的方法的基礎(chǔ)上,本發(fā)明還提出了一種計算機設(shè)備,該計算機設(shè)備包括存儲器和一個或多個處理器。在存儲器中存儲有可執(zhí)行代碼。
10、當(dāng)處理器執(zhí)行可執(zhí)行代碼時,用于實現(xiàn)上述識別布匹細(xì)小復(fù)雜瑕疵的方法。
11、此外,在識別布匹細(xì)小復(fù)雜瑕疵的方法的基礎(chǔ)上,本發(fā)明還提出了一種計算機可讀存儲介質(zhì),其上存儲有程序,該程序被處理器執(zhí)行時,用于實現(xiàn)識別布匹細(xì)小復(fù)雜瑕疵的方法。
12、本發(fā)明具有如下優(yōu)點:
13、如上所述,本發(fā)明述及了一種基于改進yolov9模型的識別布匹細(xì)小復(fù)雜瑕疵的方法,該方法針對布匹細(xì)小復(fù)雜瑕疵檢測問題,首先在yolov9的主干網(wǎng)絡(luò)(backbone)引入的動態(tài)蛇形卷積(dynamic?snake?convolution,dsc)和卷積注意力機制模塊(convolutionalblock?attention?module,cbam)相結(jié)合的模塊c-dsc,用于改善對目標(biāo)形狀和邊界的敏感性,使其提升對于復(fù)雜瑕疵的檢測能力。其中動態(tài)蛇形卷積模仿了蛇的形狀和特性,主要用于處理具有細(xì)長、迂回和不規(guī)則形態(tài)的數(shù)據(jù)結(jié)構(gòu),不僅可以自適應(yīng)地聚焦于管狀結(jié)構(gòu)的細(xì)長曲線局部特征,還增強了對幾何結(jié)構(gòu)的感知能力,并且可以防止在迭代過程中陷入環(huán)形循環(huán)的情況產(chǎn)生,而cbam注意力模塊的添加,通過結(jié)合了通道注意力和空間注意力,能夠自適應(yīng)地學(xué)習(xí)到不同特征之間的關(guān)聯(lián)性,又可以使模型的特征提取能力和泛化能力得到提高,且不會增加網(wǎng)絡(luò)的運算量。而后使用基于transformer的實時檢測轉(zhuǎn)換器(real-timedetection?transformer,rt-detr)模型中的尺度內(nèi)特征交互(attentionbased?intra-scale?feature?interaction,aifi)模塊來替換yolov9中的sppelan(spatial?pyramidpooling?with?enhanced?local?attention?network),由于其與transformer的encoder類似,可增強模型對局部和全局信息的處理能力、以及減少處理延遲,通過優(yōu)化多尺度特征間的注意力運算,降低了計算資源的消耗,使模型在應(yīng)對復(fù)雜場景時展現(xiàn)出更高的靈活性和運行效率。最后在head層前引入多尺度前饋網(wǎng)絡(luò)(multi-scale?feedforward?network,msfn),msfn的設(shè)計能夠改善非線性特征變換,強化非線性的信息轉(zhuǎn)換,使得模型能夠更好地處理復(fù)雜的非線性問題,并且還可以通過提取不同尺度的特征使其增強對于特征提取的能力,尤其可以應(yīng)用于增強細(xì)小復(fù)雜瑕疵的提取。通過以上改進,使得本發(fā)明搭建的基于改進的yolov9模型的布匹細(xì)小復(fù)雜瑕疵識別模型,很好的提升了本發(fā)明針對布匹瑕疵圖像中細(xì)小復(fù)雜瑕疵的識別準(zhǔn)確率和效率。