本發(fā)明屬于圖像識別領(lǐng)域,特別涉及一種alc綠色環(huán)保墻板缺陷識別方法。
背景技術(shù):
1、alc綠色環(huán)保墻板因其輕質(zhì)、保溫和隔音等優(yōu)點(diǎn)而廣泛應(yīng)用,但在生產(chǎn)過程中可能出現(xiàn)裂紋、氣泡、變色、剝落、污漬和凹陷缺陷,影響其性能和美觀;傳統(tǒng)的缺陷檢測方法如目視檢查依賴人工操作,容易受到主觀因素影響,導(dǎo)致漏檢或誤判,且效率低下的檢驗(yàn)速度難以滿足生產(chǎn)需求;alc綠色環(huán)保墻板缺陷識別方法通過自動(dòng)化和智能化手段,提高了檢測效率和準(zhǔn)確性,顯著縮短了檢測時(shí)間,減少了對人工的依賴,從而降低了人工成本,并及時(shí)發(fā)現(xiàn)產(chǎn)品的質(zhì)量問題,提高產(chǎn)品的可靠性和一致性。
2、傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)(cnn)局限于局部感受域,難以捕捉全局上下文信息,而transformer雖然在全局理解上表現(xiàn)出色,但計(jì)算效率低,且可能忽略細(xì)節(jié),結(jié)合cnn和transformer的優(yōu)點(diǎn),可以同時(shí)實(shí)現(xiàn)對局部特征的精確捕捉與全局上下文的有效理解,從而提高模型的計(jì)算效率和細(xì)節(jié)保留能力,這種結(jié)合減少了計(jì)算冗余,提高alc綠色環(huán)保墻板缺陷識別的準(zhǔn)確性。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明提供一種alc綠色環(huán)保墻板缺陷識別方法,旨在提出多頭自注意力、像素聚焦塊和特征傳遞前饋網(wǎng)絡(luò);多頭自注意力通過多個(gè)獨(dú)立的注意力頭,增強(qiáng)了對多樣化特征和信息關(guān)系的捕捉能力,使模型能夠兼顧全局上下文與局部細(xì)節(jié);像素聚焦塊則利用卷積操作提取局部特征,并通過位置嵌入增強(qiáng)空間感知,使模型能夠處理長序列數(shù)據(jù);特征傳遞前饋網(wǎng)絡(luò)則有效融合局部與全局信息,提升模型在復(fù)雜任務(wù)中的表現(xiàn);各模塊協(xié)同作用,確保缺陷識別模型在保持高計(jì)算效率的同時(shí)實(shí)現(xiàn)優(yōu)異的檢測性能。
2、本發(fā)明旨在提出多頭自注意力、像素聚焦塊、特征傳遞前饋網(wǎng)絡(luò)、高效特征提取塊和高效特征增強(qiáng)模塊,提供一種alc綠色環(huán)保墻板缺陷識別方法,包括以下步驟:
3、s1、alc綠色環(huán)保墻板缺陷數(shù)據(jù)集制作,收集alc綠色環(huán)保墻板缺陷圖片,包含多種缺陷類型,對每張alc綠色環(huán)保墻板缺陷圖片進(jìn)行缺陷標(biāo)注,形成alc綠色環(huán)保墻板缺陷數(shù)據(jù)集;
4、s2、構(gòu)建多頭自注意力,把特征圖拆分成n個(gè)特征子空間分別進(jìn)行自注意力操作,然后把自注意力操作輸出的特征圖連接并進(jìn)行深度可分離卷積,最后進(jìn)行殘差連接并輸出特征圖;
5、s3、構(gòu)建像素聚焦塊,通過展平、位置嵌入、歸一化、激活、多通道1d卷積捕獲特征圖的局部特征信息,并進(jìn)行殘差連接,最后輸出特征圖;
6、s4、構(gòu)建特征傳遞前饋網(wǎng)絡(luò),包括全局平均池化、兩個(gè)全連接層、廣播上下文信息、并進(jìn)行殘差連接和輸出;
7、s5、構(gòu)建高效特征提取塊,包括n個(gè)高效特征提取模塊,高效特征提取模塊由多頭自注意力、像素聚焦塊和特征傳遞前饋網(wǎng)絡(luò)構(gòu)成;
8、s6、構(gòu)建高效特征增強(qiáng)模塊,包括1×1卷積、5×5卷積、5個(gè)高效特征提取塊,輸出增強(qiáng)后的特征圖;
9、s7、構(gòu)建alc綠色環(huán)保墻板缺陷識別模型,包括輸入、高效特征增強(qiáng)模塊、alc綠色環(huán)保墻板缺陷檢測頭和輸出;
10、s8、訓(xùn)練alc綠色環(huán)保墻板缺陷識別模型并檢測,使用alc綠色環(huán)保墻板缺陷數(shù)據(jù)集訓(xùn)練alc綠色環(huán)保墻板缺陷識別模型,訓(xùn)練完成后,將新的待檢測alc綠色環(huán)保墻板照片輸入到alc綠色環(huán)保墻板缺陷識別模型,得到檢測結(jié)果,檢測結(jié)果包括alc綠色環(huán)保墻板圖片中的缺陷位置及種類。
11、優(yōu)選地,在s1步驟中,對于多種缺陷類型,包含裂紋、氣泡、變色、剝落、污漬和凹陷缺陷。
12、優(yōu)選地,在s2步驟中,對于多頭自注意力,輸入特征,,、和分別代表的高、寬和通道,把拆分成n個(gè)特征,得到,, ?代表第i個(gè)拆分的特征,把n個(gè)頭獨(dú)立計(jì)算注意力,,分別代表第i個(gè)頭的線性變換權(quán)重矩陣,分別代表第i個(gè)頭的查詢、鍵和值,對和進(jìn)行自適應(yīng)池化,,,是池化后的固定尺寸,為第i個(gè)拆分特征的通道數(shù),對每個(gè)頭分別計(jì)算注意力權(quán)重,,,是第i個(gè)頭的注意力權(quán)重矩陣,是縮放因子等于鍵向量的維度,將應(yīng)用于池化后的鍵,,,是第i個(gè)頭的加權(quán)輸出,并進(jìn)行殘差連接和卷積操作進(jìn)一步捕捉局部特征信息,,,代表1×1卷積,將所有的頭的輸出拼接,關(guān)注不同子空間的特征,并恢復(fù)原始通道維度,,,將拼接的輸出特征通過深度可分離卷積減少參數(shù)量并提高計(jì)算效率,,,最終通過殘差連接將輸入特征與處理后的特征相加,保留輸入特征的原始信息,得到最終的輸出,, ?。
13、優(yōu)選地,在s2步驟中,對于多頭自注意力,通過在全局范圍內(nèi)計(jì)算特征間的依賴關(guān)系,從多個(gè)視角捕捉特征的長距離關(guān)系,不同的注意力頭可以關(guān)注特征圖的不同部分,豐富了模型的上下文感知能力,使得全局信息得到有效融合。
14、優(yōu)選地,在s3步驟中,對于像素聚焦塊,輸入,,把輸入特征展平,空間信息轉(zhuǎn)化為序列信息,利用序列模型對位置的敏感性來捕捉信息,,,為,在展平的特征上添加位置嵌入,增強(qiáng)位置感知能力,避免展平后序列化特征丟失空間結(jié)構(gòu),,,代表一個(gè)長為的序列位置嵌入,通過歸一化調(diào)整特征分布以提高模型的穩(wěn)定性,,,代表歸一化操作,通過leakyrelu函數(shù)激活,在序列化特征中引入非線性,從而更好地表達(dá)復(fù)雜的特征,,,代表激活函數(shù),通過多通道1d卷積在多個(gè)特征通道上提取序列維度上的特征,捕捉相鄰位置特征之間的相關(guān)性,并進(jìn)行殘差連接避免梯度消失,,,?代表多通道1d卷積,代表連接操作,代表逐元素相加。
15、優(yōu)選地,在s3步驟中,對于像素聚焦塊,像素聚焦塊專注于局部特征,通過位置嵌入增強(qiáng)位置感知能力,利用多通道1d卷積捕捉鄰域特征,并使用殘差連接保留輸入信息。
16、優(yōu)選地,在s4步驟中,對于特征傳遞前饋網(wǎng)絡(luò),輸入特征,,將特征通過全局平均池化,保留每個(gè)通道整體的特征,,,代表全局平均池化,通過兩個(gè)全連接層生成自適應(yīng)通道權(quán)重,增加非線性表達(dá),自適應(yīng)地調(diào)整各個(gè)通道的權(quán)重,,,,為權(quán)重矩陣,為縮放比例,代表偏置項(xiàng),?代表激活函數(shù),將生成的權(quán)重廣播到空間維度,將廣播的權(quán)重與輸入的特征圖進(jìn)行逐通道乘法,使每個(gè)通道的權(quán)重影響到整個(gè)特征圖,并進(jìn)行殘差連接避免梯度消失得到輸出, ?,,代表逐通道乘法,代表逐通道逐元素相加。
17、優(yōu)選地,在s4步驟中,對于特征傳遞前饋網(wǎng)絡(luò),通過通道加權(quán)機(jī)制自適應(yīng)地強(qiáng)調(diào)重要特征,使用全局平均池化和全連接層生成權(quán)重以增強(qiáng)顯著特征,在通道級別優(yōu)化特征表達(dá),同時(shí)通過殘差連接穩(wěn)健傳遞特征,提升模型的非線性表達(dá)能力。
18、優(yōu)選地,在s5步驟中,對于高效特征提取塊,輸入特征,,將n個(gè)高效特征提取模塊堆疊,將長距離依賴的全局特征和細(xì)粒度的局部特征的融合,提高模型的性能和效率,,,,代表第個(gè)高效特征提取模塊,,代表多頭自注意力,代表像素聚焦塊,代表特征傳遞前饋網(wǎng)絡(luò)。
19、優(yōu)選地,在s5步驟中,對于高效特征提取塊,過堆疊多個(gè)高效特征提取模塊,將長距離依賴的全局特征和細(xì)粒度的局部特征有效融合,使得模型在保留細(xì)節(jié)信息的同時(shí)具備全局感知能力;其中,每個(gè)模塊利用多頭自注意力和像素聚焦塊提取的特征,進(jìn)一步通過特征傳遞前饋網(wǎng)絡(luò)優(yōu)化和增強(qiáng)特征表達(dá),從而提升模型的性能和計(jì)算效率。
20、優(yōu)選地,在s6步驟中,對于高效特征增強(qiáng)模塊,輸入特征,,通過5×5卷積增強(qiáng)模型對局部信息的捕捉和第一個(gè)高效特征提取塊得到,,通過下采樣縮小空間尺寸、降低計(jì)算復(fù)雜度,并通過第二個(gè)高效特征提取塊進(jìn)一步提取深層特征得到,,通過下采樣進(jìn)一步減小空間分辨率,提取更深層次的特征,并通過第三個(gè)高效特征提取塊進(jìn)一步提取深層特征得到,,通過上采樣保留不同分辨率層之間的特征信息,殘差連接保留中層特征表達(dá),再通過1×1卷積融合特征,并通過第四個(gè)高效特征提取塊進(jìn)一步提取深層特征得到,,通過上采樣恢復(fù)到原始分辨率,殘差連接保留初始特征信息,1×1卷積融合特征和第五個(gè)高效特征提取塊提取最終的增強(qiáng)特征得到,,最后通過5×5卷積在最終特征圖上做出進(jìn)一步的平滑和整合得到輸出,,,代表5×5卷積操作。
21、優(yōu)選地,在s6步驟中,對于高效特征增強(qiáng)模塊,通過多層次特征提取與融合,逐步提取全局與局部信息:初始輸入經(jīng)過5×5卷積和一系列高效特征提取塊提煉特征,并通過多層下采樣與上采樣逐步融合不同分辨率的特征,結(jié)合殘差連接保留關(guān)鍵信息,最終經(jīng)過1×1卷積和5×5卷積對特征進(jìn)一步整合,生成兼具細(xì)節(jié)和語義信息的增強(qiáng)輸出。
22、優(yōu)選地,在s7步驟中,對于alc綠色環(huán)保墻板缺陷識別模型,輸入圖像,通過骨干網(wǎng)絡(luò)得到圖像特征,輸入高效特征增強(qiáng)模塊得到增強(qiáng)后的輸出特征,再通過檢測頭進(jìn)行檢測,得到alc綠色環(huán)保墻板缺陷檢測結(jié)果,檢測結(jié)果包括alc綠色環(huán)保墻板缺陷的位置和種類。
23、與現(xiàn)有技術(shù)相比,本發(fā)明具有以下技術(shù)效果:
24、本發(fā)明提供的技術(shù)方案提出了多頭自注意力、像素聚焦塊、特征傳遞前饋網(wǎng)絡(luò);多頭自注意力通過在全局范圍內(nèi)計(jì)算特征間的依賴關(guān)系,從多個(gè)視角捕捉特征的長距離關(guān)系,不同的注意力頭可以關(guān)注特征圖的不同部分,豐富了模型的上下文感知能力,使得全局信息得到有效融合;像素聚焦塊專注于局部特征,通過位置嵌入增強(qiáng)位置感知能力,利用1d卷積捕捉鄰域特征,并使用殘差連接保留輸入信息,這樣設(shè)計(jì)使得模型可以精細(xì)地捕獲局部細(xì)節(jié),尤其在邊緣和紋理等細(xì)粒度信息上表現(xiàn)出色;特征傳遞前饋網(wǎng)絡(luò)通過通道加權(quán)機(jī)制自適應(yīng)地強(qiáng)調(diào)重要特征,使用全局平均池化和全連接層生成權(quán)重以增強(qiáng)顯著特征,在通道級別優(yōu)化了特征表達(dá),同時(shí)通過殘差連接穩(wěn)健地傳遞特征,提升模型的非線性表達(dá)能力;多種模塊的組合應(yīng)用確保了alc綠色環(huán)保墻板缺陷模型在計(jì)算效率和檢測性能之間的良好平衡。