本技術(shù)涉及圖像處理,尤其涉及一種基于動態(tài)自適應(yīng)閾值的銘牌文本檢測方法和系統(tǒng)。
背景技術(shù):
1、銘牌文本檢測是在圖像處理和計算機視覺領(lǐng)域中的重要應(yīng)用之一。傳統(tǒng)的銘牌文本檢測算法通常采用圖像處理和模式識別技術(shù)來識別圖像中的文本信息,以自動識別和提取銘牌上的文字內(nèi)容。這種技術(shù)在工業(yè)生產(chǎn)、安全監(jiān)控、智能交通等領(lǐng)域有著廣泛的應(yīng)用。然而,先前技術(shù)中的基于圖像分割和特征提取的方法通常需要大量的訓(xùn)練數(shù)據(jù)和復(fù)雜的算法設(shè)計,存在著識別精度不高、對光照和噪聲敏感等問題;且該方法在復(fù)雜背景下的文本識別精度有限,可能會出現(xiàn)誤識別或漏識別的情況。
技術(shù)實現(xiàn)思路
1、為解決上述技術(shù)問題,本發(fā)明的目的在于:提供一種識別精度高的基于動態(tài)自適應(yīng)閾值的銘牌文本檢測方法和系統(tǒng)。
2、為實現(xiàn)上述目的,本技術(shù)實施例的一方面提出了一種基于動態(tài)自適應(yīng)閾值的銘牌文本檢測方法,包括以下步驟:
3、獲取待檢測銘牌圖像;
4、根據(jù)不同的下采樣倍數(shù)對所述待檢測銘牌圖像進行下采樣,得到多個下采樣特征圖,進而根據(jù)預(yù)設(shè)的上采樣倍數(shù)對各所述下采樣特征圖進行上采樣,得到多個下采樣子特征圖;
5、將所述下采樣特征圖和所述下采樣子特征圖輸入預(yù)設(shè)的顯著位置選擇模塊進行特征選擇,得到多個初始特征圖;
6、將所述下采樣特征圖和所述初始特征圖輸入預(yù)設(shè)的cafm特征融合模塊進行特征融合,得到復(fù)合特征圖;
7、將所述復(fù)合特征圖輸入預(yù)設(shè)的預(yù)測頭模塊,得到用于預(yù)測文本的概率圖和閾值圖;
8、根據(jù)所述概率圖確定所述閾值圖中各第一像素點對應(yīng)的自適應(yīng)閾值,進而根據(jù)所述自適應(yīng)閾值對所述概率圖進行二值化處理,得到銘牌文本檢測結(jié)果。
9、在一些實施例中,所述根據(jù)不同的下采樣倍數(shù)對所述待檢測銘牌圖像進行下采樣,得到多個下采樣特征圖,進而根據(jù)預(yù)設(shè)的上采樣倍數(shù)對各所述下采樣特征圖進行上采樣,得到多個下采樣子特征圖,具體包括:
10、根據(jù)不同的所述下采樣倍數(shù)對所述待檢測銘牌圖像進行下采樣,得到第一下采樣特征圖、第二下采樣特征圖、第三下采樣特征圖以及第四下采樣特征圖;
11、根據(jù)所述上采樣倍數(shù)對所述第二下采樣特征圖進行上采樣,得到第二下采樣子特征圖;
12、根據(jù)所述上采樣倍數(shù)對所述第三下采樣特征圖進行上采樣,得到第三下采樣子特征圖;
13、根據(jù)所述上采樣倍數(shù)對所述第四下采樣特征圖進行上采樣,得到第四下采樣子特征圖。
14、在一些實施例中,所述將所述下采樣特征圖和所述下采樣子特征圖輸入預(yù)設(shè)的顯著位置選擇模塊進行特征選擇,得到多個初始特征圖,具體包括:
15、將所述第一下采樣特征圖和所述第二下采樣子特征圖輸入所述顯著位置選擇模塊進行特征選擇,進而將特征選擇后的所述第一下采樣特征圖和所述第二下采樣子特征圖進行元素級相加,得到第一初始特征圖;
16、將所述第二下采樣特征圖和所述第三下采樣子特征圖輸入所述顯著位置選擇模塊進行特征選擇,進而將特征選擇后的所述第二下采樣特征圖和所述第三下采樣子特征圖進行元素級相加,得到第二初始特征圖;
17、將所述第三下采樣特征圖和所述第四下采樣子特征圖輸入所述顯著位置選擇模塊進行特征選擇,進而將特征選擇后的所述第三下采樣特征圖和所述第四下采樣子特征圖進行元素級相加,得到第三初始特征圖。
18、在一些實施例中,所述將所述下采樣特征圖和所述初始特征圖輸入預(yù)設(shè)的cafm特征融合模塊進行特征融合,得到復(fù)合特征圖,具體為:
19、將所述第一初始特征圖、所述第二初始特征圖、所述第三初始特征圖以及所述第四下采樣特征圖進行上采樣,進而將上采樣后的所述第一初始特征圖、所述第二初始特征圖、所述第三初始特征圖以及所述第四下采樣特征圖輸入所述cafm特征融合模塊進行特征融合,得到所述復(fù)合特征圖。
20、在一些實施例中,所述根據(jù)所述概率圖確定所述閾值圖中各第一像素點對應(yīng)的自適應(yīng)閾值,具體包括:
21、獲取動量衰減系數(shù),并根據(jù)所述概率圖獲取所述待檢測銘牌圖像對應(yīng)的區(qū)域預(yù)測概率;
22、計算所述區(qū)域預(yù)測概率的加權(quán)平均值,進而根據(jù)所述動量衰減系數(shù)和所述加權(quán)平均值得到全局閾值;
23、計算文本區(qū)域類別和非文本區(qū)域類別的預(yù)測期望值,得到局部閾值;
24、對所述全局閾值和所述局部閾值進行最大歸一化處理,得到所述自適應(yīng)閾值。
25、在一些實施例中,所述自適應(yīng)閾值通過下式確定:
26、
27、其中,τt(c)表示第t個時間步中第c個類別對應(yīng)的所述自適應(yīng)閾值,τt表示第t個時間步對應(yīng)的所述全局閾值,表示第t個時間步中第c個類別對應(yīng)的所述局部閾值,maxnorm(·)表示最大歸一化操作,c表示總類別數(shù),t和c為正整數(shù)。
28、在一些實施例中,所述根據(jù)所述自適應(yīng)閾值對所述概率圖進行二值化處理,得到銘牌文本檢測結(jié)果,具體為:
29、將所述自適應(yīng)閾值作為二值化處理的閾值,根據(jù)所述閾值對所述概率圖進行二值化處理,得到所述銘牌文本檢測結(jié)果。
30、為實現(xiàn)上述目的,本技術(shù)實施例的另一方面提出了一種基于動態(tài)自適應(yīng)閾值的銘牌文本檢測系統(tǒng),包括:
31、圖像獲取模塊,用于獲取待檢測銘牌圖像;
32、圖像采樣模塊,用于根據(jù)不同的下采樣倍數(shù)對所述待檢測銘牌圖像進行下采樣,得到多個下采樣特征圖,進而根據(jù)預(yù)設(shè)的上采樣倍數(shù)對各所述下采樣特征圖進行上采樣,得到多個下采樣子特征圖;
33、特征選擇模塊,用于將所述下采樣特征圖和所述下采樣子特征圖輸入預(yù)設(shè)的顯著位置選擇模塊進行特征選擇,得到多個初始特征圖;
34、特征融合模塊,用于將所述下采樣特征圖和所述初始特征圖輸入預(yù)設(shè)的cafm特征融合模塊進行特征融合,得到復(fù)合特征圖;
35、文本預(yù)測模塊,用于將所述復(fù)合特征圖輸入預(yù)設(shè)的預(yù)測頭模塊,得到用于預(yù)測文本的概率圖和閾值圖;
36、二值化處理模塊,用于根據(jù)所述概率圖確定所述閾值圖中各像素點對應(yīng)的自適應(yīng)閾值,進而根據(jù)所述自適應(yīng)閾值對所述概率圖進行二值化處理,得到銘牌文本檢測結(jié)果。
37、為實現(xiàn)上述目的,本技術(shù)實施例的另一方面提出了一種電子設(shè)備,所述電子設(shè)備包括存儲器、處理器、存儲在所述存儲器上并可在所述處理器上運行的程序以及用于實現(xiàn)所述處理器和所述存儲器之間的連接通信的數(shù)據(jù)總線,所述程序被所述處理器執(zhí)行時實現(xiàn)如前面所述的基于動態(tài)自適應(yīng)閾值的銘牌文本檢測方法。
38、為實現(xiàn)上述目的,本技術(shù)實施例的另一方面提出了一種存儲介質(zhì),所述存儲介質(zhì)為計算機可讀存儲介質(zhì),用于計算機可讀存儲,所述存儲介質(zhì)存儲有一個或者多個程序,所述一個或者多個程序可被一個或者多個處理器執(zhí)行,以實現(xiàn)如前面所述的基于動態(tài)自適應(yīng)閾值的銘牌文本檢測方法。
39、本發(fā)明的有益效果是:本發(fā)明的基于動態(tài)自適應(yīng)閾值的銘牌文本檢測方法和系統(tǒng),一方面在將下采樣子特征圖和下采樣特征圖進行融合前,通過引入顯著位置選擇模塊進行特征選擇生成初始特征圖,能夠自適應(yīng)地選擇待檢測銘牌圖像中具有顯著性的位置,從而更加精確地定位和提取銘牌文本;另一方面,通過引入cafm特征融合模塊進行特征融合生成復(fù)合特征圖,能夠綜合利用多種特征,提高對銘牌文本區(qū)域的檢測和識別能力;另外,在對概率圖進行二值化處理前,通過動態(tài)確定閾值圖中的自適應(yīng)閾值,能夠更好地應(yīng)對銘牌文本在不同風(fēng)格、尺寸和光照條件下的變化,提高銘牌文本檢測的魯棒性和泛化能力。