本發(fā)明涉及一種基于簡化鄰域的光學刻劃字符邊緣點真假的特征表示和分類方法及應用,屬于工業(yè)追蹤產品信息的技術領域。
背景技術:
光學刻劃字符廣泛應用于工業(yè)產品的標牌和銘牌上,用以追蹤產品信息。通常由硬質合金打標針或鑲嵌工業(yè)鉆石的打標針直接刻入金屬工件的材料內部而形成的標示,采用低角度前景光式照明方法采集圖像。由于這是一種凹凸的立體字符,筆畫中存在光線被遮擋的情況,表現(xiàn)為與光線平行方向的筆畫呈現(xiàn)高灰度值,與光線垂直方向的筆畫呈現(xiàn)低灰度值,背景的灰度值介于以上兩種之間,如圖1所示。因此常用的基于梯度的邊緣提取方法無法準確地提取刻劃字符的邊緣,因為在筆畫中的高灰度像素區(qū)域和低灰度像素區(qū)域的交界處,梯度也發(fā)生了大幅變化,基于梯度的邊緣提取方法也會把這些點檢測出來,而這些點不是字符邊緣的有效組成部分,屬于假邊緣點。這些假邊緣點的存在為后續(xù)的字符識別與檢測造成了巨大障礙。
中國專利文獻cn105279507公開了一種提取刻劃字符輪廓的方法,該發(fā)明是采用多相活動輪廓模型確定高低亮度區(qū)域,通過直方圖分析將多相圖像轉換成雙相圖像最后利用水平集的方法獲得輪廓。
中國專利文獻cn106023191公開了一種基于結構特征的光學刻劃字符邊緣提取和邊緣擬合方法,其在canny算子提取的邊緣基礎上,通過模式識別方法(結合模板提取和k近鄰方法)去除字符邊緣中的假邊緣點,得到斷續(xù)的字符輪廓,然后根據筆畫結構特征和斷點距離和位置對邊緣進行擬合。
上述專利文獻都是對刻劃字符進行輪廓提取的方法,而本發(fā)明的目的是針對專利文獻cn106023191中,去除假邊緣的方法(結合模板提取和k近鄰的方法)進行了改進。為了去除這些假邊緣點,可以使用模式識別的方法,首先提取邊緣點的特征,然后使用分類器對特征進行分類,從而達到去除假邊緣點的目的。專利文獻cn106023191,采用基于鄰域特征結合k近鄰分類器的方法,但是該種特征提取方法存在特征繁雜冗余、對光照魯棒性不強和k近鄰的模板選取復雜等問題,而本方法通過對鄰域特征進行簡化,降低了特征的維度,從而減少了模式的數(shù)量,有利于樣本的選擇。通過結合直方圖的方法對鄰域特征進行了量化,使得該種特征對光照有較好的魯棒性。通過分析發(fā)現(xiàn)該種分類問題屬于樣本不均衡問題,采用adaboost分類方法比k近鄰具有更好的分類效果。
技術實現(xiàn)要素:
針對現(xiàn)有技術存在的技術問題,本發(fā)明提出一種基于簡化鄰域的光學刻劃字符邊緣點真假的特征表示和分類方法。
本發(fā)明還提出了一種利用上述方法去除樣本光學刻劃字符中的假邊緣點的方法。
發(fā)明概述:
一種基于簡化鄰域的光學刻劃字符邊緣點真假的特征表示和分類方法,包括:
首先,使用canny算子提取光學刻劃字符邊緣點,以所述邊緣點為中心向上、向下、向左、向右分別提取一個字符筆畫長度的像素灰度,構成所述邊緣點的′十′字簡化鄰域;
其次,通過分析圖像的灰度直方圖,確定高亮度、低亮度和背景亮度的劃分閾值;
繼而,基于所述的劃分閾值對提取的邊緣點的′十′字簡化鄰域像素值進行3階量化,并轉換成特征向量;
最后,對量化后的邊緣點的特征向量進行真、假標記,作為訓練集;利用adaboost分類方法訓練訓練集,得到分類函數(shù),利用分類函數(shù)去除樣本點中的假邊緣點。
本發(fā)明的技術方案如下:
一種基于簡化鄰域的光學刻劃字符邊緣點真假的特征表示和分類方法,包括:
1)提取光學刻劃字符邊緣點,以所述邊緣點為中心向上、向下、向左、向右分別提取單位字符筆畫長度的像素灰度,構成所述邊緣點的′十′字簡化鄰域;
2)根據刻劃字符特點對特征進行3階量化,確定所述光學刻劃字符圖像的高亮度和背景亮度的劃分閾值、低亮度和背景亮度的劃分閾值;
3)基于所述的劃分閾值對提取的邊緣點的′十′字簡化鄰域像素值進行3階量化,并轉換成特征向量;
4)對量化后的邊緣點的特征向量進行人為真、假標記,作為訓練集;
5)利用adaboost分類方法訓練訓練集,得到分類函數(shù)。
根據本發(fā)明優(yōu)選的,在步驟1)中,利用canny算子提取光學刻劃字符邊緣點。
根據本發(fā)明優(yōu)選的,在步驟1)中,以所述邊緣點為中心向上、向下、向左、向右分別提取一個字符筆畫長度的像素灰度。
根據本發(fā)明優(yōu)選的,在步驟1)中,所述一個字符筆畫長度為5個像素長度。即所述′十′字簡化鄰域的水平方向有11個像素灰度,垂直方向有11個像素灰度。
根據本發(fā)明優(yōu)選的,在步驟2)中,通過分析光學刻劃字符圖像的灰度直方圖,確定所述光學刻劃字符圖像的高亮度和背景亮度的劃分閾值、低亮度和背景亮度的劃分閾值。在步驟2)中,通過分析刻劃字符圖像特點,發(fā)現(xiàn)其由高亮度區(qū)域、低亮度區(qū)域和背景亮度區(qū)域組成,所以對特征選擇3階量化最為符合圖像特點。
根據本發(fā)明優(yōu)選的,在步驟2)中,通過分析光學刻劃字符圖像的灰度直方圖,確定所述光學刻劃字符圖像的高亮度和背景亮度的劃分閾值、低亮度和背景亮度的劃分閾值的方法如下:
將所述低亮度和背景亮度的劃分閾值,定為所述灰度直方圖中最大連續(xù)單調上升的起始處;
將所述高亮度和背景亮度的劃分閾值,定為所述灰度直方圖中最大連續(xù)單調下降的結束處。
根據本發(fā)明優(yōu)選的,所述劃分閾值的具體方法為:
(1)所述光學刻劃字符圖像為256級的灰度圖像表示為i(x,y),所述光學刻劃字符圖像的灰度直方圖為h(n),n=1,2…256,灰度直方圖的梯度
(2)梯度變號處標記為cn=g(n)*g(n+1),當cn>0時,表示在n處梯度符號不變,當cn<0時,表示在n處梯度符號改變;cn<0記為
(3)計算連續(xù)上升和連續(xù)下降的長度ai=(ai+1-ai)*g(ai),當所述ai為正時,表示是上升,當所述ai為負時,表示是下降。
(4)計算max(ai)時的ai記為ap,min(ai)時的ai記為aq,最大連續(xù)上升起始處就是ap,最大連續(xù)下降的結束處就是aq+1;即ap是低亮度和背景亮度的劃分閾值,aq+1是高亮度和背景亮度的劃分閾值。
根據本發(fā)明優(yōu)選的,所述步驟3)中轉換成特征向量的方法:通過把垂直方向的像素經過轉置后,添加于水平方向像素后,構成特征向量,即構成長度為22個像素的特征。
根據本發(fā)明優(yōu)選的,所述步驟4)利用adaboost分類方法訓練訓練集,得到分類函數(shù)的具體方法如下:
即,自適應增強算法adaboost采用gentleadaboost模型,其訓練過程描述如下:
4-1)訓練樣本共有n個,并且標記為:(x1,y1),...,(xn,yn),其中,xi∈rn為待訓練特征,yi∈{-1,1};yi=1表示為真邊緣點,yi=-1表示為假邊緣點;
4-2)初始化樣本的權重:wi=1/n,i=1,...n;
4-3)對j=1,2…m,其中m表示訓練的輪數(shù);
a.從所有的待訓練特征樣本中,挑選第j輪中,最佳的弱分類器hj(x),使得在該樣本權重的分布下,樣本的加權均方誤差最小,即,選擇
b.對權重進行更新:wi←wi·exp(-yi·hi(xi)),i=1,...n;
c.歸一化權重使得:
4-4)輸出強分類器:
一種利用上述方法去除樣本光學刻劃字符中的假邊緣點的方法,為利用分類函數(shù)去除樣本點中的假邊緣點。即,通過訓練集,訓練得到分類器h(x),把待分類點的特征(即簡化鄰域特征)輸入,即可得到分類結果。
本發(fā)明的有益效果:
本發(fā)明相比一般的方法對字符邊緣點的真假分類上更加準確,對于圖像整體光照變化有更強的魯棒性,并且特征更加簡單,為后續(xù)字符的處理帶來很大幫助。
本發(fā)明采用量化后的簡化鄰域特征,結合adaboost進行分類:
1、通過對水平和垂直方向的像素進行采樣,減少了特征維度,降低了樣本選擇的復雜度。
2、對特征進行了量化,并通過對直方圖分析,確定量化閾值,使得本特征對光照的魯棒性增強。
3、由于真假邊緣點樣本數(shù)量的不均,該問題是一種樣本不均衡問題,采用adaboost分類方法比k近鄰方法更好。
附圖說明
圖1為原始光學刻劃字符圖像;
圖2為本發(fā)明提取的邊緣點結果;
圖3為本發(fā)明中所述′十′字簡化鄰域示意圖;
圖4為光學刻劃字符圖像的灰度直方圖;
圖5-1為量化后的水平方向的結果;
圖5-2為量化后的垂直方向的結果;
圖6為使用分類器去除的假邊緣點;
圖7為去除假邊緣點以后的結果;
圖8是鄰域特征k近鄰分類結果圖;
圖9是簡化鄰域特征k近鄰分類結果圖;
圖10鄰域特征在adaboost下分類結果;
圖11簡化鄰域特征在adaboost下分類結果;
圖12是k近鄰分類器下兩種特征對真點分類錯誤率統(tǒng)計結果;
圖13是k近鄰分類器下兩種特征對假點分類錯誤率統(tǒng)計結果;
圖14是adaboost分類器下兩種特征對真點分類錯誤率統(tǒng)計結果;
圖15是adaboost分類器下兩種特征對假點分類錯誤率統(tǒng)計結果。
具體實施方式
下面結合附圖與實施例對本發(fā)明作進一步說明,但不限于此。
實施例1、
一種基于簡化鄰域的光學刻劃字符邊緣點真假的特征表示和分類方法,包括:
1)利用canny算子提取光學刻劃字符邊緣點,以所述邊緣點為中心向上、向下、向左、向右分別提取一個字符筆畫長度的像素灰度,構成所述邊緣點的′十′字簡化鄰域;所述一個字符筆畫長度為5個像素長度。即所述′十′字簡化鄰域的水平方向有11個像素灰度,垂直方向有11個像素灰度。
特征的選擇對分類效果有至關重要的作用,既要考慮特征的準確性,還要考慮特征的魯棒性和簡易性。通過分析canny算子提取的邊緣點周圍像素灰度發(fā)現(xiàn),真,假邊緣點的鄰域灰度分布有明顯不同,真邊緣點總位于,高灰度與背景灰度之間,或者低灰度與背景灰度之間,假邊緣點總是位于高、低灰度的交界處,而且假邊緣點的走向通常為水平方向、垂直方向和對角方向。雖然鄰域灰度包含了該點的真假信息,但同時也有許多信息的冗余,而且鄰域的長度也不能選擇太大,否則隨著鄰域半徑的增大會急劇增加特征的維度,并且加劇分類上的困難,經過以上分析發(fā)現(xiàn),水平與垂直方向的灰度值也能夠包含大部分邊緣點的真假信息,并且簡化了特征的維度。為此選擇邊緣點的上、下、左、右,各一個筆畫長度的像素作為特征,如圖3所示,為敘述方便,稱為′十′字簡化鄰域。
2)根據刻劃字符特點對特征進行3階量化,確定所述光學刻劃字符圖像的高亮度和背景亮度的劃分閾值、低亮度和背景亮度的劃分閾值;通過分析刻劃字符圖像特點,發(fā)現(xiàn)其由高亮度區(qū)域、低亮度區(qū)域和背景亮度區(qū)域組成,所以對特征選擇3階量化最為符合圖像特點。
通過分析光學刻劃字符圖像的灰度直方圖,確定所述光學刻劃字符圖像的高亮度和背景亮度的劃分閾值、低亮度和背景亮度的劃分閾值;
將所述低亮度和背景亮度的劃分閾值,定為所述灰度直方圖中最大連續(xù)單調上升的起始處;
將所述高亮度和背景亮度的劃分閾值,定為所述灰度直方圖中最大連續(xù)單調下降的結束處。
為了進一步簡化特征,對′十′字鄰域的像素進行量化,結合刻畫字符特點,考慮到刻畫字符有低灰度區(qū)域、高灰度區(qū)域和背景灰度區(qū)域,所以量化階數(shù)選擇3最為合適。由于每個字符和光源的距離不一樣,金屬表面也不是絕對的平整,導致字符圖像灰度有略微的變化,根據經驗直接選擇閾值進行量化,不能完全適用于所有字符,使得結果出現(xiàn)偏差。因而,對每個字符圖像的灰度直方圖進行分析,如圖4所示,發(fā)現(xiàn)字符圖像中背景區(qū)域像素占總像素的大部分,并在直方圖中近似服從正態(tài)分布,高低像素位于直方圖兩側區(qū)域,鑒于這個特點,把低閾值設定為直方圖中最大連續(xù)單調上升的起始處,高閾值設定為直方圖中最大連續(xù)單調下降的結束處,從而達到自適應的效果。
所述劃分閾值的具體方法為:
(1)所述光學刻劃字符圖像為256級的灰度圖像表示為i(x,y),所述光學刻劃字符圖像的灰度直方圖為h(n),n=1,2…256,灰度直方圖的梯度
(2)梯度變號處標記為cn=g(n)*g(n+1),當cn>0時,表示在n處梯度符號不變,當cn<0時,表示在n處梯度符號改變;cn<0記為
(3)計算連續(xù)上升和連續(xù)下降的長度ai=(ai+1-ai)*g(ai),當所述ai為正時,表示是上升,當所述ai為負時,表示是下降。
(4)計算max(ai)時的ai記為ap,min(ai)時的ai記為aq,最大連續(xù)上升起始處就是ap,最大連續(xù)下降的結束處就是aq+1;即ap是低亮度和背景亮度的劃分閾值,aq+1是高亮度和背景亮度的劃分閾值。
3)基于所述的劃分閾值對提取的邊緣點的′十′字簡化鄰域像素值進行3階量化,并轉換成特征向量;通過把垂直方向的像素經過轉置后,添加于水平方向像素后,構成特征向量,即構成長度為22個像素的特征向量。
4)對量化后的邊緣點的特征向量進行人為真、假標記,作為訓練集;
5)利用adaboost分類方法訓練訓練集,得到分類函數(shù)。
實施例2、
如實施例1所述的一種基于簡化鄰域的光學刻劃字符邊緣點真假的特征表示和分類方法,其區(qū)別在于,所述步驟4)利用adaboost分類方法訓練訓練集,得到分類函數(shù)的具體方法如下:
即,自適應增強算法adaboost采用gentleadaboost模型,其訓練過程描述如下:
4-1)訓練樣本共有n個,并且標記為:(x1,y1),...,(xn,yn),其中,xi∈rn為待訓練特征,yi∈{-1,1};yi=1表示為真邊緣點,yi=-1表示為假邊緣點;
4-2)初始化樣本的權重:wi=1/n,i=1,...n;
4-3)forj=1:m,其中m表示訓練的輪數(shù);
a.從所有的待訓練特征樣本中,挑選第j輪中,最佳的弱分類器hj(x),使得在該樣本權重的分布下,樣本的加權均方誤差最小,即,選擇
b.對權重進行更新:wi←wi·exp(-yi·hi(xi)),i=1,...n;
c.歸一化權重使得:
4-4)輸出強分類器:
為了采用分類器進行真假分類,首先需要對量化后的特征向量進行真、假標記,用來作為訓練集。但是由于刻劃字符樣本中存在樣本不平衡問題,真邊緣點的數(shù)量遠遠大于假邊緣點的數(shù)量,所以在訓練樣本的采集時,需要進行篩選,減少不平衡性。
分類器選擇上,傳統(tǒng)的k近鄰算法在面對樣本不平衡問題時,往往不能獲得很好的效果,為了進一步減少樣本不平衡對分類結果的影響,選擇使用gentleadaboost分類算法作為分類器,gentleadaboost算法通過將多個弱分類器,經過優(yōu)化算法加權組合成強分類器,由于對分類錯誤的樣本權值會加大,所以對于難以分類的樣本能夠表現(xiàn)很好的效果。
實施例3、
一種利用如實施例1、2所述方法去除樣本光學刻劃字符中的假邊緣點的方法,為利用分類函數(shù)去除樣本點中的假邊緣點。
把后續(xù)待分類樣本經過提取簡化′十′字鄰域特征向量,經過量化并轉換成特征向量后,輸入分類器h(x),輸出的結果就是分類的結果。圖6所示就是分類后去除的假邊緣點,圖7所示是去除假邊緣后的邊緣。
對比例、
將本發(fā)明所述方法與現(xiàn)有技術(結合k近鄰方法對真假邊緣點進行分類)的方法相比較。
現(xiàn)有技術:采用5×5鄰域特征,結合k近鄰方法對真假邊緣點進行分類。
鄰域特征用k近鄰算法分類,在圖像灰度整體改變的時候測試結果,以字符′g′為例,在灰度改變不大的時候鄰域特征表現(xiàn)出較好的分類效果,但是在圖像整體灰度值發(fā)生變化的時候基于鄰域特征的識別率急劇下降,出現(xiàn)許多的錯誤,如圖8所示。
鄰域特征在圖像灰度發(fā)生改變的時候,分類效果下降,而簡化鄰域特征由于根據直方圖進行了量化,在面對圖像整體灰度改變時,仍能夠有較好的區(qū)分效果,表現(xiàn)出很好的穩(wěn)定性,如圖9。
adaboost算法結果,由于k近鄰算法對于不均衡樣本存在樣本選取困難等問題,采用gentleadaboost分類方法對鄰域特征,以及簡化鄰域特征在模擬光照強度變化下進行比較。
鄰域特征結合adaboost的分類結果,如圖10,簡化特征結合adaboost的分類結果,如圖11。
對分類結果的錯誤率進行統(tǒng)計,數(shù)值越高表示分類效果越差。圖12是k近鄰分類器下兩種特征對真點分類錯誤率統(tǒng)計結果;圖13是k近鄰分類器下兩種特征對假點分類錯誤率統(tǒng)計結果;圖14是adaboost分類器下兩種特征對真點分類錯誤率統(tǒng)計結果;圖15是adaboost分類器下兩種特征對假點分類錯誤率統(tǒng)計結果。
結論
根據整體灰度值的變化統(tǒng)計了兩種特征對于真假邊緣點的分類錯誤率。如圖14、圖15,橫坐標表示圖像整體的灰度改變模擬光照的改變,由低到高,縱坐標表示分類錯誤率,數(shù)值越高表示分類效果越差。分別計算對假邊緣點和真邊緣點的分類誤差。從實驗結果上看,adaboost算法對于占少數(shù)樣本的假邊緣點,相比k近鄰算法具有更加高的識別率。而對于占多數(shù)樣本的真邊緣點,識別率有所下降。基于鄰域灰度的特征在圖像灰度不改變時擁有最高的識別效率,但是當灰度改變時分類錯誤率急劇上升。而發(fā)明所述方法基于簡化鄰域的特征,無論灰度如何改變,都能保持較好的分類效果。通過以上兩種特征在k近鄰算法和adaboost下比較,本發(fā)明提出的基于簡化鄰域的特征,通過自適應改變量化閾值,使得在光照發(fā)生改變時,仍然獲得很好的識別效率,對光照改變具有較強的魯棒性。通過比較分類器,發(fā)現(xiàn)adaboost算法在對假邊緣點的分類上效果更好,但同時對于真邊緣點的識別率也略有降低,由于對于假邊緣點的去除相對更為重要,所以就去除假邊緣點的問題,使用adaboost算法更好。