本發(fā)明涉及計(jì)算機(jī)視覺(jué)和工業(yè)精密檢測(cè),更具體地涉及一種工業(yè)圖像離焦評(píng)估方法和裝置、電子設(shè)備以及存儲(chǔ)介質(zhì)。
背景技術(shù):
1、近年來(lái),計(jì)算機(jī)視覺(jué)技術(shù)已走進(jìn)人們的日常工作和生活中,其中在工業(yè)精密檢測(cè)領(lǐng)域,所使用的高精度相機(jī)往往具有固定的焦距和較淺的景深,使得清晰成像的范圍較小,從而容易出現(xiàn)離焦模糊。因此,對(duì)工業(yè)圖像進(jìn)行離焦評(píng)估具有重要的意義。由于圖像離焦程度與圖像清晰度成正相關(guān),且對(duì)曝光條件魯棒,基于圖像清晰度的離焦評(píng)估方法備受關(guān)注。傳統(tǒng)的基于圖像清晰度的離焦評(píng)估方法通常依賴圖像特征提取和量化分析,主要包括兩類:基于圖像梯度信息的離焦評(píng)估方法和基于圖像頻域分析的離焦評(píng)估方法?;趫D像梯度信息的離焦評(píng)估方法通過(guò)計(jì)算圖像中像素點(diǎn)的梯度信息,來(lái)評(píng)估圖像的離焦程度。常用的梯度信息提取算子有sobel算子、scharr算子、laplacian算子等,這些算子對(duì)圖像進(jìn)行卷積運(yùn)算,獲取圖像中像素點(diǎn)的梯度信息,完成圖像清晰度的表征,進(jìn)而得到離焦評(píng)估結(jié)果。此外,還可以結(jié)合其它特征,例如熵、對(duì)比度等,進(jìn)一步提高圖像離焦評(píng)估的準(zhǔn)確性?;趫D像頻域分析的離焦評(píng)估方法將圖像從空間域轉(zhuǎn)換到頻域,分析圖像的頻率成分。圖像的清晰度與高頻成分的含量有關(guān),高頻成分越多,圖像越清晰,圖像的離焦程度越低,其中常用的頻域分析方法有傅里葉變換、小波變換等。以上傳統(tǒng)的基于圖像清晰度的離焦評(píng)估方法通常依賴于手工設(shè)計(jì)的圖像特征,雖然效率較高,但離焦評(píng)估的準(zhǔn)確性較差。隨著深度學(xué)習(xí)的發(fā)展,基于深度網(wǎng)絡(luò)的離焦評(píng)估方法受到關(guān)注,其中基于輕量網(wǎng)絡(luò)的離焦評(píng)估方法憑借網(wǎng)絡(luò)結(jié)構(gòu)的輕量化提高了部署和應(yīng)用的便捷性,但是其精度較低。為此,如何設(shè)計(jì)一種精確的基于輕量網(wǎng)絡(luò)的離焦評(píng)估方法仍有待進(jìn)一步研究。
技術(shù)實(shí)現(xiàn)思路
1、鑒于上述問(wèn)題,本發(fā)明提供了一種工業(yè)圖像離焦評(píng)估方法和裝置、電子設(shè)備以及存儲(chǔ)介質(zhì)。
2、根據(jù)本發(fā)明的第一個(gè)方面,提供了一種工業(yè)圖像離焦評(píng)估方法,該方法包括:
3、通過(guò)視覺(jué)傳感器獲取工業(yè)圖像,并對(duì)工業(yè)圖像進(jìn)行分塊,得到圖像塊集合;
4、將圖像塊集合中的各圖像塊分別輸入訓(xùn)練完成的圖像塊離焦評(píng)估網(wǎng)絡(luò)中,獲得各圖像塊的離焦評(píng)估結(jié)果,并將所有圖像塊的離焦評(píng)估結(jié)果的均值作為工業(yè)圖像的離焦評(píng)估結(jié)果;
5、其中,圖像塊離焦評(píng)估網(wǎng)絡(luò)包括多通路特征提取器、特征精修單元和量化單元;
6、其中,多通路特征提取器包括多個(gè)空洞卷積、特征拼接層和最大池化層;
7、其中,特征精修單元包括依次連接的雙通路通道注意力和卷積層,雙通路通道注意力包括第一自適應(yīng)最大池化層、第一自適應(yīng)平均池化層、特征拼接及展平層和第一全連接層;
8、其中,量化單元包括依次連接的第二自適應(yīng)最大池化層、特征展平層和第二全連接層。
9、根據(jù)本發(fā)明的實(shí)施例,上述將圖像塊集合中的各圖像塊分別輸入訓(xùn)練完成的圖像塊離焦評(píng)估網(wǎng)絡(luò)中,獲得各圖像塊的離焦評(píng)估結(jié)果包括:
10、利用預(yù)先構(gòu)建的訓(xùn)練樣本并結(jié)合預(yù)先設(shè)定的損失函數(shù)對(duì)圖像塊離焦評(píng)估網(wǎng)絡(luò)進(jìn)行訓(xùn)練,得到訓(xùn)練完成的圖像塊離焦評(píng)估網(wǎng)絡(luò);
11、利用訓(xùn)練完成的多通路特征提取器對(duì)圖像塊集合中的圖像塊進(jìn)行特征提取,將提取到的多個(gè)特征進(jìn)行拼接,并對(duì)拼接結(jié)果執(zhí)行最大池化操作,得到初始特征圖;
12、利用訓(xùn)練完成的特征精修單元對(duì)初始特征圖執(zhí)行最大池化操作和平均池化操作,將池化操作的結(jié)果進(jìn)行拼接和展平操作,并將拼接和展平操作的結(jié)果進(jìn)行全連接操作與卷積操作,得到中間特征圖;
13、利用訓(xùn)練完成的量化單元對(duì)中間特征圖進(jìn)行最大池化操作,將最大池化操作的結(jié)果經(jīng)過(guò)展平操作后進(jìn)行全連接操作,得到圖像塊的離焦評(píng)估結(jié)果。
14、根據(jù)本發(fā)明的實(shí)施例,上述利用訓(xùn)練完成的多通路特征提取器對(duì)圖像塊集合中的圖像塊進(jìn)行特征提取,將提取到的多個(gè)特征進(jìn)行拼接,并對(duì)拼接結(jié)果執(zhí)行最大池化操作,得到初始特征圖包括:
15、利用多個(gè)空洞卷積對(duì)圖像塊進(jìn)行特征提取,得到多個(gè)特征圖,并利用特征拼接層將多個(gè)特征圖沿著空間維度進(jìn)行拼接,得到第一特征圖;
16、利用最大池化層對(duì)第一特征圖沿著高度維度和寬度維度執(zhí)行最大池化操作,得到第二特征圖,并將第二特征圖作為初始特征圖輸入到訓(xùn)練完成的特征精修單元中。
17、根據(jù)本發(fā)明的實(shí)施例,上述利用訓(xùn)練完成的特征精修單元對(duì)初始特征圖執(zhí)行最大池化操作和平均池化操作,將池化操作的結(jié)果進(jìn)行拼接和展平操作,并將拼接和展平操作的結(jié)果進(jìn)行全連接操作與卷積操作,得到中間特征圖包括:
18、利用訓(xùn)練完成的雙通路通道注意力的第一自適應(yīng)最大池化層和第一自適應(yīng)平均池化層分別對(duì)初始特征圖進(jìn)行自適應(yīng)最大池化操作和自適應(yīng)平均池化操作,得到第三特征圖和第四特征圖;
19、利用訓(xùn)練完成的雙通路通道注意力的特征拼接及展平層對(duì)第三特征圖和第四特征圖沿著通道維度進(jìn)行拼接,得到第五特征圖,并將第五特征圖進(jìn)行展平,得到第六特征圖;
20、利用訓(xùn)練完成的雙通路通道注意力的第一全連接層對(duì)第六特征圖進(jìn)行多層線性處理,得到第七特征圖,并將第七特征圖與初始特征圖進(jìn)行相乘,得到第八特征圖;
21、利用訓(xùn)練完成的特征精修單元的卷積層對(duì)第八特征圖進(jìn)行卷積處理,得到第九特征圖,并將第九特征圖作為中間特征圖輸入到訓(xùn)練完成的量化單元中。
22、根據(jù)本發(fā)明的實(shí)施例,上述利用訓(xùn)練完成的量化單元對(duì)中間特征圖進(jìn)行最大池化操作,將最大池化操作的結(jié)果經(jīng)過(guò)展平操作后進(jìn)行全連接操作,得到圖像塊的離焦評(píng)估結(jié)果包括:
23、利用訓(xùn)練完成的量化單元的第二自適應(yīng)最大池化層對(duì)中間特征圖進(jìn)行自適應(yīng)最大池化操作,得到第十特征圖;
24、利用訓(xùn)練完成的量化單元的特征展平層對(duì)第十特征圖進(jìn)行展平操作,得到第十一特征圖;
25、利用訓(xùn)練完成的量化單元的第二全連接層對(duì)第十一特征圖進(jìn)行多層線性處理,得到圖像塊的離焦評(píng)估結(jié)果。
26、根據(jù)本發(fā)明的第二個(gè)方面,提供了一種工業(yè)圖像離焦評(píng)估裝置,該裝置包括:
27、圖像塊獲取模塊,用于通過(guò)視覺(jué)傳感器獲取工業(yè)圖像,并對(duì)工業(yè)圖像進(jìn)行分塊,得到圖像塊集合;
28、離焦評(píng)估模塊,用于將圖像塊集合中的各圖像塊分別輸入訓(xùn)練完成的圖像塊離焦評(píng)估網(wǎng)絡(luò)中,獲得各圖像塊的離焦評(píng)估結(jié)果,并將所有圖像塊的離焦評(píng)估結(jié)果的均值作為工業(yè)圖像的離焦評(píng)估結(jié)果;
29、其中,圖像塊離焦評(píng)估網(wǎng)絡(luò)包括多通路特征提取器、特征精修單元和量化單元;
30、其中,多通路特征提取器包括多個(gè)空洞卷積、特征拼接層和最大池化層;
31、其中,特征精修單元包括依次連接的雙通路通道注意力和卷積層,雙通路通道注意力包括第一自適應(yīng)最大池化層、第一自適應(yīng)平均池化層、特征拼接及展平層和第一全連接層;
32、其中,量化單元包括依次連接的第二自適應(yīng)最大池化層、特征展平層和第二全連接層。
33、本發(fā)明的第三方面提供了一種電子設(shè)備,包括:一個(gè)或多個(gè)處理器;存儲(chǔ)器,用于存儲(chǔ)一個(gè)或多個(gè)計(jì)算機(jī)程序,其中,上述一個(gè)或多個(gè)處理器執(zhí)行上述一個(gè)或多個(gè)計(jì)算機(jī)程序以實(shí)現(xiàn)上述方法的步驟。
34、本發(fā)明的第四方面還提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序或指令,上述計(jì)算機(jī)程序或指令被處理器執(zhí)行以實(shí)現(xiàn)上述方法的步驟。
35、本發(fā)明通過(guò)對(duì)工業(yè)圖像進(jìn)行等間隔分塊,同時(shí)利用集成了多通路特征提取器、特征精修單元以及量化單元的圖像塊離焦評(píng)估網(wǎng)絡(luò)對(duì)各圖像塊進(jìn)行離焦評(píng)估,并綜合各圖像塊的離焦評(píng)估結(jié)果形成整個(gè)圖像的離焦評(píng)估結(jié)果。本發(fā)明能夠在便捷部署和應(yīng)用的同時(shí),提高離焦評(píng)估的精度,為工業(yè)精密檢測(cè)提供技術(shù)支持。