一種用于標識數(shù)字圖像中給定模糊數(shù)字直線段的方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及一種用于標識數(shù)字圖像中給定模糊數(shù)字直線段的方法,即由分散或連 續(xù)像素組成的集合,進行可視化標識的一種計算方法。
【背景技術(shù)】
[0002] 數(shù)字圖像處理中,識別圖像中具有特定屬性的對象具有很高的學術(shù)和應用價 值,例如人臉識別,光學字符識別等。數(shù)字直線段及衍生的,具有直線幾何特征的圖形識 別屬于圖像識別領(lǐng)域中的重要分支,其應用包括衛(wèi)星圖片中的道路識別(S.Aliana,V. A. Tolpekina, ff. Bijkera, L. Kumarb, "Identifying curvature of overpass mountain roads in Iran from high spatial resolution remote sensing data",Int. J. of Appl. Earth Observation and Geoinformation, vol. 26, pp. 21 - 25, 2014.),焊接中的焊縫識別 (L. Jia, N. Sun, "A line segment detection algorithm based on statistical analyses of quantified directions in digital image",Comput. Mode11ing&New Technologies ,vol. 18, no. 6, pp. 79-88, 2014.)等。對于數(shù)字直線段及衍生對象的自動識別計算方法在 國內(nèi)外學術(shù)界不斷推陳出新,雖然識別精度和效率逐步上升,但一直采用較粗糙的方法標 識結(jié)果,如【附圖說明】中圖1所示。圖1展示了三種常見標識方法,從左至右依次為端點標識 法(P. Bhowmick and B. B. Bhattacharya, "Fast polygonal approximation of digital curves using relaxed straightness properties",IEEE Trans. Pattern Anal. Mach. Intel 1.,vol. 29, no. 9, pp. 1590-1602, S印t. 2007.),彩色線段標識法(L. Jia, N. Sun, "A line segment detection algorithm based on statistical analyses of quantified directions in digital image",Comput. Model1ing&New Technologies, vol. 18,no.6, pp. 79-88, 2014.)和斜率覆蓋標識法(L.Buzer, "A simple algorithm for digital line recognition in the general case",Pattern Recognition, vol. 40, no. 6, pp:1675-1684 ,Jun. 2007.)。這三種標識法的共同缺點是使用單色完全覆蓋標識對象,過多修改了圖像原 始數(shù)據(jù),導致背景信息丟失,無法清楚標識疊加區(qū)域,對人眼觀察被識別對象造成了障礙, 特別是當識別對象只包含覆蓋區(qū)域的部分像素時,這種對象包含部分像素的情況是現(xiàn)實圖 像中的常見情況。學術(shù)界常以類似圖1中(a)和(c)的相應原始圖像開展測試,在這種理 想狀態(tài)下,單色覆蓋引起的問題不顯著,但涉及到實際應用時,往往需要根據(jù)實際圖像測試 結(jié)果反復開展實驗,類似圖1所示的三種標識法在實際實驗中會導致標識區(qū)域背景信息的 完全丟失且難以區(qū)分疊加區(qū)域,使得測試結(jié)果難以用人眼進行評估。因此,針對圖形識別, 特別是數(shù)字直線段及衍生對象的識別,缺乏一種既實施簡單,又能相對完好保存圖像背景 的標識計算方法。
【發(fā)明內(nèi)容】
[0003] 本發(fā)明要解決的技術(shù)問題是:為了克服現(xiàn)有數(shù)字直線段及衍生對象的自動識別后 的標識法使用單色完全覆蓋標識對象,過多修改了圖像原始數(shù)據(jù),導致背景信息丟失,無法 清楚標識疊加區(qū)域,對人眼觀察被識別對象造成了障礙的不足,本發(fā)明提供一種用于標識 數(shù)字圖像中給定模糊數(shù)字直線段的方法,特別適用于可視化標識數(shù)字直線段,模糊數(shù)字直 線段等數(shù)字圖像中具有直線幾何特征的像素集合,除在數(shù)字圖像中添加矩形邊框外,不修 改數(shù)字圖像中其他原始信息。
[0004] 為使陳述清楚明了,現(xiàn)集中定義本發(fā)明所涉及的部分符號和概念。
[0005] Z+表示正整數(shù)集合。
[0006] Z表示包括零的整數(shù)集合。
[0007] R+表示包括零的正實數(shù)集合。
[0008] R表示包括零的實數(shù)集合。
[0009] max {元素|元素滿足的條件}表示滿足條件的"最大"元素。
[0010] min {元素|元素滿足的條件}表示滿足條件的"最小"元素。
[0011] 對于 rGR+,
【主權(quán)項】
1. 一種用于標識數(shù)字圖像中給定模糊數(shù)字直線段的方法,其特征在于, 當模糊數(shù)字直線段BDSS識別算法完成對寬i高?Α的數(shù)字圖像中模糊數(shù)字直線段BDSS 的識別,模糊數(shù)字直線段BDSS以像素集合的形式保存為識別結(jié)果; 根據(jù)識別結(jié)果給定的一個模糊數(shù)字直線段BDSS,計算其幾何直線特性,使用斜率符合 該幾何直線特性的矩形邊框標識給定像素集合。
2. 如權(quán)利要求1所述的用于標識數(shù)字圖像中給定模糊數(shù)字直線段的方法,其特征在 于:具體包括以下步驟: 步驟1 :計算坐標中心化圖像空間中,對應坐標空間ICI的中心坐標; 步驟2 :根據(jù)模糊數(shù)字直線段BDSS中像素的中心坐標,計算平均中心,并使用線性回歸 計算模糊數(shù)字直線段BDSS的方向Θ ; 步驟3 :計算模糊數(shù)字直線段BDSS中像素的轉(zhuǎn)換坐標:將坐標中心化對應的坐標空間 C丨的原點平移到平均中心,并將X軸正半軸旋轉(zhuǎn)至與Θ重合; 步驟4 :根據(jù)模糊數(shù)字直線段BDSS中像素的轉(zhuǎn)換坐標計算模糊數(shù)字直線段BDSS在轉(zhuǎn) 換坐標系中的四個邊界點; 步驟5 :生成平行于方向Θ的邊界線IJP 12,并計算其轉(zhuǎn)換坐標,邊界線IJP 12分別 通過步驟4中的其中兩個邊界點; 步驟6:生成垂直于方向Θ的邊界線13和I4,并計算其轉(zhuǎn)換坐標,邊界線13和I 4分別 通過步驟4中的另外兩個邊界點,直線I1, 12, 13和1 4相交形成矩形邊框; 步驟7 :根據(jù)步驟5和6所生成的轉(zhuǎn)換坐標,計算其中心坐標; 步驟8 :根據(jù)步驟7所生成的中心坐標,計算其偏移量并將偏移量保存為結(jié)果輸出。
3. 如權(quán)利要求2所述的用于標識數(shù)字圖像中給定模糊數(shù)字直線段的方法,其特征在 于:步驟1和2中,將識別模糊數(shù)字直線段BDSS的數(shù)字圖像映射為:F,坐標中心化:F,對于 任意像素 P e BDSS,若ρ的偏移量為d,則其中心坐標根據(jù)式(1)計算:
通過BDSS像素的中心坐標,計算BDSS的平均中心負二(Xy); 根據(jù)線性回歸理論,BDSS的方向Θ e [〇, π ),由式(2)計算:
(XJi) G 其中i = 1,2··· η,η為BDSS所含像素總數(shù)。
4. 如權(quán)利要求3所述的用于標識數(shù)字圖像中給定模糊數(shù)字直線段的方法,其特征在 于:步驟3中,對于ρ = 〇,y) e C,其轉(zhuǎn)換坐標# = (χλ,/) e f裉據(jù)式⑶計算:
5. 如權(quán)利要求4所述的用于標識數(shù)字圖像中給定模糊數(shù)字直線段的方法,其特征在 于:步驟4中,轉(zhuǎn)換坐標系e'中的四個邊界點通過比較轉(zhuǎn)換坐標的所有橫坐標X和縱坐標y 得到。
6. 如權(quán)利要求5所述的用于標識數(shù)字圖像中給定模糊數(shù)字直線段的方 法,其特征在于:坐標空間已的原點的轉(zhuǎn)換坐標為(〇(, ) = (_^COS0 - ysin0,xsin0 - ycos0),步驟 7 中,對于 p' = (x',;y')e C,其中心坐標 P = (X, y) e e,根據(jù)式(7)計算:
7. 如權(quán)利要求6所述的用于標識數(shù)字圖像中給定模糊數(shù)字直線段的方法,其特征在 于:步驟8中,對于'p = 0,y) e :Γ像素的偏移量d由式⑶計算:
在e'l中,由于原點位于BDSS的平均中心,BDSS像素轉(zhuǎn)換坐標存在四個極值,即橫坐標 最大值X' lmax,橫坐標最小值X' lmin,縱坐標最大值y' ""和縱坐標最小值y' Wlllin; J7中 存在著對應轉(zhuǎn)換坐標(χ< lmax,〇),(X IminJ 〇),(〇,y' 和(〇,y' 的像素,這些像 素為步驟4所述的邊界點; 其中,T1表示矩形邊框,矩形邊框7的定義由式(4)給出:
其*dm=dist(p' (x,,y, ),lm),m = l,2,3,4,dist(p' (x,,y, ),Im)表示從 p' (x,,y,) 做與Im垂直的直線,垂線與I 交點到V (x, ,y, >的歐幾里得距離。
8. 如權(quán)利要求7所述的用于標識數(shù)字圖像中給定模糊數(shù)字直線段的方法,其特征在 于:式(5)和式(6)分別為1種12上,1 3和14上.!T像素的轉(zhuǎn)換坐標:
【專利摘要】本發(fā)明涉及一種用于標識數(shù)字圖像中給定模糊數(shù)字直線段的方法,當模糊數(shù)字直線段BDSS識別算法完成對數(shù)字圖像中模糊數(shù)字直線段BDSS的識別,模糊數(shù)字直線段BDSS以集合的形式保存為識別結(jié)果;根據(jù)識別結(jié)果給定的一個模糊數(shù)字直線段BDSS,計算其幾何直線特性,使用斜率符合該幾何直線特性的矩形邊框標識給定像素集合。本發(fā)明特別適用于可視化標識數(shù)字直線段,模糊數(shù)字直線段等數(shù)字圖像中具有直線幾何特征的像素集合,除在數(shù)字圖像中添加矩形邊框外,不修改數(shù)字圖像中其他原始信息,背景更容易觀察;實施簡單,耗時與分辨率基本呈線性穩(wěn)定增加,性能高效。
【IPC分類】G06T7-00, G06K9-62
【公開號】CN104751177
【申請?zhí)枴緾N201510137710
【發(fā)明人】賈靚
【申請人】常州大學
【公開日】2015年7月1日
【申請日】2015年3月26日