1.基于深度學(xué)習(xí)的多視角安檢圖像自動(dòng)識(shí)別方法,其特征在于:按如下步驟進(jìn)行,
2.根據(jù)權(quán)利要求1所述的基于深度學(xué)習(xí)的多視角安檢圖像自動(dòng)識(shí)別方法,其特征在于:步驟3)中卷積神經(jīng)網(wǎng)絡(luò)初始化設(shè)置的參數(shù)通過(guò)預(yù)訓(xùn)練得到,預(yù)訓(xùn)練利用vit模型進(jìn)行;預(yù)訓(xùn)練時(shí),設(shè)定損失函數(shù)閾值以及最大訓(xùn)練次數(shù),并初始化訓(xùn)練參數(shù);通過(guò)預(yù)訓(xùn)練得到卷積神經(jīng)網(wǎng)絡(luò)初始化參數(shù)。
3.根據(jù)權(quán)利要求1所述的基于深度學(xué)習(xí)的多視角安檢圖像自動(dòng)識(shí)別方法,其特征在于:步驟5)中特征融合的步驟為,
4.根據(jù)權(quán)利要求1所述的基于深度學(xué)習(xí)的多視角安檢圖像自動(dòng)識(shí)別方法,其特征在于:步驟6)中分類器由全連接層和softmax層構(gòu)成,全連接層由zx=(wx)thx表示,其中zx表示全連接層的輸出,即每個(gè)檢測(cè)類別的回歸值,hx表示步驟5)的輸出矩陣展平到一維數(shù)組后得到的特征向量,wx表示全連接層的權(quán)重矩陣;softmax層表示為其中k是檢測(cè)類別總數(shù),zi是全連接層輸出矩陣zx中第i個(gè)類別的數(shù)值,pi是檢測(cè)樣本向量z屬于第i個(gè)類別的概率。
5.根據(jù)權(quán)利要求1所述的基于深度學(xué)習(xí)的多視角安檢圖像自動(dòng)識(shí)別方法,其特征在于:步驟3)中采用resnet與fpn結(jié)合的卷積神經(jīng)網(wǎng)絡(luò)模型;輸入數(shù)據(jù)包括批大小、連續(xù)幀數(shù)、每幀中的圖像數(shù)量、圖像通道數(shù)、圖像長(zhǎng)度、圖像寬度;resnet包括初始卷積層、殘差模塊、全局平均池化層;殘差模塊包含多個(gè)卷積層,層與層之間存在恒等映射關(guān)系,即f(x)=h(x)+x,其中x表示輸入,f(x)表示殘差模塊的輸出,h(x)表示卷積層的輸出;fpn包括上采樣器,從resnet的conv2、conv3、conv4和conv5層提取特征并通過(guò)卷積層輸出。
6.根據(jù)權(quán)利要求1所述的基于深度學(xué)習(xí)的多視角安檢圖像自動(dòng)識(shí)別方法,其特征在于:步驟4)中,建立查詢矩陣時(shí),設(shè)查詢矩陣大小為(h,w),分辨率為s,查詢矩陣的點(diǎn)記為(x,y),在建立(x,y)坐標(biāo)位置的同時(shí)對(duì)z軸進(jìn)行采樣,以使網(wǎng)格點(diǎn)具有深度信息;在3d空間內(nèi),采樣點(diǎn)表示為(x′,y′,z′i)
7.根據(jù)權(quán)利要求1所述的基于深度學(xué)習(xí)的多視角安檢圖像自動(dòng)識(shí)別方法,其特征在于:步驟1)中多視角探頭包括主視探頭、俯視探頭和側(cè)視探頭,對(duì)應(yīng)的安檢圖像包括主視角安檢圖像、俯視角安檢圖像以及側(cè)視角安檢圖像。
8.根據(jù)權(quán)利要求1所述的基于深度學(xué)習(xí)的多視角安檢圖像自動(dòng)識(shí)別方法,其特征在于:步驟2)中,所述預(yù)處理包括裁剪、旋轉(zhuǎn)、縮放和歸一化處理。
9.根據(jù)權(quán)利要求1所述的基于深度學(xué)習(xí)的多視角安檢圖像自動(dòng)識(shí)別方法,其特征在于:步驟7)中,達(dá)到設(shè)定的條件是指map@50滿足設(shè)定要求;map@50指在交并比閾值為50%的情況下得到的平均精度。