含多類型標識的信息載體的識別方法
【專利摘要】本發(fā)明提出了一種含多類型標識的信息載體的識別方法,該信息載體可以是產(chǎn)品標貼。本發(fā)明利用輔助定位標識以及相應(yīng)定位標識檢測識別算法,自動識別信息載體上的輔助定位標識,實現(xiàn)了多類型數(shù)據(jù)的自動定位,利用圖像識別算法實現(xiàn)同時識別字符、條形碼、顯示屏顯示內(nèi)容、二維碼、以及圖形等信息,電子顯示屏可顯示字符,條碼,二維碼,圖形等內(nèi)容,信息載體信息豐富,識別結(jié)果準確可靠。由于字符識別相較對條碼識別、二維碼識別、圖形識別,字符偏小,字符分割與字符識別難度大,為保證字符識別的準確率,本發(fā)明對字符識別利用已知的字符長度對識別結(jié)果進行校驗。
【專利說明】含多類型標識的信息載體的識別方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及含多類型標識的信息載體的識別方法,該信息載體可以是產(chǎn)品標貼,其上包含字符標識、條形碼標識以及二維碼標識在內(nèi)的多類型標識。
【背景技術(shù)】
[0002]隨著數(shù)字圖像技術(shù)的不斷發(fā)展,不僅可以通過計算機視覺技術(shù)識別數(shù)字、表盤刻度,而且可以識別字符、條形碼以及二維碼。計算機視覺技術(shù)應(yīng)用領(lǐng)域也越來越豐富多樣,有些
【發(fā)明者】提出在圖像中識別字符的方法。北京大學(xué)與方正集團提出一種用于驗證碼識別的分割方法(專利號:201110287721.1),該專利提供的是網(wǎng)頁中驗證碼圖像中提取字符的方法。201210349375.X公開了一種基于識別反饋的字符圖像驗證碼識別方法,也對圖像中字符識別做了介紹,但并沒有考慮字符定位問題。
[0003]現(xiàn)有的技術(shù)方案中,計算機視覺技術(shù)在電子標簽等器件設(shè)備上的數(shù)據(jù)自動讀取方面沒有實際的應(yīng)用,尤其是字符、條碼、二維碼等多內(nèi)容識別方面。主要原因是利用計算機視覺技術(shù)難以對字符、條碼、二維碼等信息進行準確定位,有效地分割不同信息區(qū)域。字符識別算法最大難度在于字符的準確定位與分割。條碼、二維碼均含有定位標志,但同時識別兩個條碼或兩個二維碼時,由于不能區(qū)分不同條碼、二維碼的定位標志,使得定位失敗。
[0004]有些發(fā)明人提出集成圖像識別和其他標識識別的方案,例如成都博約創(chuàng)信科技有限責(zé)任公司的專利申請:201310565053.3。但是該案僅僅是餐盤計數(shù)與食品標簽識別。專利201310140900.1涉及一種支持多種標識技術(shù)的ERP數(shù)據(jù)識別方法,該方案僅可以在同一載體上分別識別,無法在掃描完信息載體后同時識別多種類型標識信息。
【發(fā)明內(nèi)容】
[0005]本發(fā)明提出了一種含多類型標識的信息載體的識別方法,有效識別同一信息載體上多種類型的數(shù)據(jù)標識,準確分割標識,提高識別的準確率。信息載體利用輔助定位標識進行信息載體的定位,有利于各種數(shù)據(jù)標識的分割。
[0006]本發(fā)明的技術(shù)方案是這樣實現(xiàn)的:
[0007]一種含多類型標識的信息載體的識別方法,其特征在于包括以下步驟:
[0008]捕獲信息載體的圖像,并對該圖像進行增強去噪處理;
[0009]結(jié)合信息載體的形式與輔助定位標識,在捕獲的圖像上對信息載體進行定位,主要包括以下步驟:
[0010]首先,利用邊緣提取算法或直線檢測算法,識別輔助定位標識,得到定位標識區(qū)域頂點位置,
[0011]其次,由定位標識的頂點位置信息,以及定位標識與信息載體的尺寸比例關(guān)系以及相對位置關(guān)系,計算出信息載體在圖像上的位置區(qū)域,對信息載體的圖像進行透視變換,得到信息載體的正視圖,
[0012]最后,根據(jù)信息載體的各類型標識分布與尺寸比例,計算出各類型數(shù)據(jù)標識區(qū)域在信息載體中的位置;
[0013]利用各標識在信息載體中的位置,在信息載體的正視圖上分別分割出字符區(qū)域、條碼區(qū)域、二維碼區(qū)域、顯示屏區(qū)域以及圖形區(qū)域所對應(yīng)的圖像塊;
[0014]利用字符識別算法對字符區(qū)域圖像塊進行字符識別;
[0015]利用條碼識別算法對條碼區(qū)域圖像進行條碼識別;
[0016]利用二維碼識別算法對二維碼區(qū)域圖像進行二維碼識別;
[0017]利用圖形匹配算法對圖形區(qū)域圖像進行圖形識別;
[0018]對顯示屏顯示的內(nèi)容進行分割,根據(jù)已知的條碼、字符、二維碼以及圖形信息的相對分布位置,分割出顯示屏內(nèi)各種數(shù)據(jù)標識對應(yīng)的圖像塊;
[0019]對從顯示屏中分割出的條碼、字符、二維碼、圖形的各個數(shù)據(jù)標識的圖像塊進行識別;
[0020]利用已知識別字符的長度,對字符識別結(jié)果進行驗證,如果正確,則輸出或執(zhí)行條碼識別結(jié)果、二維碼識別結(jié)果以及圖形識別結(jié)果,否則重新捕獲信息載體的圖像并進行以上分析處理。
[0021]在本發(fā)明的含多類型標識的信息載體的識別方法中,利用輔助定位標識進行信息載體的定位。
[0022]在本發(fā)明的含多類型標識的信息載體的識別方法中,所述輔助定位標識為一種特定圖形,特定圖形預(yù)先設(shè)定好的一種圖形,主要用來讓計算機快速識別及定位。特定圖形可以是實體多邊形、邊框或圖案,計算機以特定圖形為參照物計算出信息載體在捕獲圖像中的位置。
[0023]在本發(fā)明的含多類型標識的信息載體的識別方法中,所述字符識別包括文字、字母以及數(shù)字識別。
[0024]實施本發(fā)明的這種含多類型標識的信息載體的識別方法,具有以下有益效果:本發(fā)明利用輔助定位標識以及相應(yīng)定位標識檢測識別算法,自動識別信息載體上的輔助定位標識,可以快速有效地分割數(shù)據(jù)信息區(qū)域。本發(fā)明實現(xiàn)同時識別多種字符、條形碼、顯示屏顯示內(nèi)容、二維碼、以及圖形等信息,識別內(nèi)容豐富,識別結(jié)果準確可靠。本發(fā)明中由于字符識別相較于條碼識別、二維碼識別、圖形識別,識別難度大,為提高了識別準確率,利用字符長度對字符識別結(jié)果進行校驗。
【專利附圖】
【附圖說明】
[0025]圖1為本發(fā)明的含多類型標識的信息載體的識別方法的流程圖;
[0026]圖2為待識別的信息載體,表現(xiàn)為一標簽,其包含字符、顯示屏、二維碼、條碼以及圖形,而顯示屏也可以含有字符等標識;
[0027]圖3為信息載體的一種實施方式,信息載體外側(cè)帶黑色矩形框;
[0028]圖4為信息載體的另一種實施方式,顯示屏外側(cè)帶黑色矩形框;
[0029]圖5為圖2的信息載體的分割結(jié)果。
【具體實施方式】
[0030]下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進行清楚、完整地描述。為了便于更好的理解本專利所描述的方法,此處輔助定位標識以一種寬度為5_的黑色矩形框為例進行說明。如圖1所示,本發(fā)明的含多類型標識的信息載體的識別方法,包括以下步驟:
[0031]SOl:捕獲信息載體的圖像,并對該圖像進行增強去噪處理。如圖2,信息載體可以是常見的標簽,其上附帶多種類型的標識,例如顯示屏、圖形標識、字符標識、二維碼標識、條碼標識等。在信息載體上附設(shè)黑色矩形框,或者在顯示屏周圍附設(shè)黑色矩形框,以該黑框作為輔助定位標識。黑框的寬度例如是5mm。
[0032]S02:針對矩形黑框輔助定位標識,利用如下步驟,檢測出信息載體在圖像中的位置。
[0033]I)對獲取的圖像進行邊緣檢測,得到信息載體圖像的邊緣特征;
[0034]2)根據(jù)信息載體圖像上黑框的邊緣為一平行四邊形,具有4個頂點,邊緣連續(xù),內(nèi)角接近于90°,以及面積限于特定范圍等特征,設(shè)計檢測算法識別出圖像邊緣特征中黑框?qū)?yīng)的邊緣特征,獲取頂點坐標pl, p2, p3, p4 ;
[0035]3)根據(jù)頂點坐標pl,p2, p3, p4的相對位置,對頂點進行逆時針排序,獲得逆時針序的四個頂點pl',P2',p3',p4',其中pl'為左上角頂點;
[0036]圖3表示對信息載體上的黑框進行識別,圖4表示對顯示屏的黑框進行識別。
[0037]S03:由定位標識的頂點位置信息,以及定位標識與信息載體的尺寸比例關(guān)系以及相對位置關(guān)系,計算出信息載體在圖像上的位置區(qū)域,即四個頂點P1, P2, P3, P4。
[0038]S04:對信息載體的圖像進行透視變換,得到信息載體的正視圖。以圖像區(qū)域的的四個頂點P1, P2, P3, P4為參照,將P1, P2, P3, P4構(gòu)成的四邊形區(qū)域圖像透視變換為固定寬高比的矩形圖像,得到信息載體的正視圖像。變換方法可以是常見的圖像變換方案,在此不做詳述。
[0039]S05:利用各標識的內(nèi)容排列與尺寸比例,在信息載體的正視圖上分別分割出字符區(qū)域、條碼區(qū)域、二維碼區(qū)域、顯示屏區(qū)域以及圖形區(qū)域所對應(yīng)的圖像塊。標識的排布和比例由系統(tǒng)預(yù)設(shè),在已知圖像信息,通過預(yù)設(shè)的方法分割各標識是可以實現(xiàn)的。利用特定區(qū)域內(nèi)不同數(shù)據(jù)排列方式以及尺寸比例參數(shù),由由頂點位置坐標P1, P2, P3, P4,計算出字符、條碼、二維碼以及圖形對應(yīng)的圖像區(qū)域,截取字符圖形塊R0,截取條碼圖像塊R1、二維碼圖像塊民、圖形圖像塊R3。圖5中,僅顯示字符、條碼、顯示屏以及二維碼,其他類型標識的分割與處理于此類似。
[0040]S06:利用字符識別算法對字符區(qū)域圖像塊Rtl進行字符識別。對字符內(nèi)容進行輪廓特征特征提取,分割字符,對單個字符采用模板匹配算法進行識別,得到全部字符識別結(jié)果后進行位數(shù)校驗,校驗成功輸出識別結(jié)果。例如識別的字符長度為8,則如果字符識別結(jié)果長度不等于8,表示字符識別結(jié)果錯誤,識別終止并返回S01。
[0041]S07:利用條碼識別算法對條碼區(qū)域圖像R1進行條碼識別。
[0042]S08:利用二維碼識別算法對二維碼區(qū)域圖像R2進行二維碼識別。
[0043]S09:利用圖形匹配算法對圖形區(qū)域圖像&進行圖形識別。識別過程采用圖像自然特征匹配的方式實現(xiàn)。預(yù)先存儲圖形的特征點和特征描述子,對比讀取的目標圖形與預(yù)先存儲的圖形,得出最優(yōu)匹配。利用圖像特征點檢測與匹配算法,識別圖像塊r3。
[0044]S10:對顯示屏顯示的內(nèi)容圖像進行分割,根據(jù)顯示屏內(nèi)的條碼、字符、二維碼以及圖形信息的相對分布位置,分割出顯示屏內(nèi)各種信息的圖像塊。顯示屏可以包含、多種標識信息,例如字符、條碼以及二維碼等,顯示屏內(nèi)標識的排布和比例由系統(tǒng)預(yù)設(shè)。根據(jù)已知的條碼、字符、二維碼、圖形信息的相對分布位置,分割出顯示屏內(nèi)字符圖形塊Rc/、條碼圖像塊R/、二維碼圖像塊R2'、圖形圖像R3'。
[0045]Sll:對從顯示屏中分割出的條碼、字符、二維碼、圖形的各個圖像塊進行識別。顯示屏內(nèi)的標識Rc/ ,R/,R2',R3'的識別方法可以是步驟S06至S09采用的方案。
[0046]S12:輸出或執(zhí)行字符識別結(jié)果、條碼識別結(jié)果、二維碼識別結(jié)果以及圖形識別結(jié)果。在本發(fā)明中,不限制識別結(jié)果的輸出方式,可以是直接輸出識別出的字內(nèi)容,也可以是根據(jù)識別結(jié)果鏈接預(yù)定義的數(shù)據(jù)、圖片、網(wǎng)頁等等。
[0047]字符識別算法基于支持向量機和神經(jīng)網(wǎng)絡(luò)算法,識別準確率對特定字符如3、6、9識別正確率在99 %,其他數(shù)字字符均可以準確識別。正由于某些字符存在識別失敗的情況,所以通過成功輸出識別字符位數(shù)作為驗證標準,位數(shù)不足重新識別,提高了識別準確率。
[0048]以上所述僅為本發(fā)明的較佳實施例而已,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進等,均應(yīng)包含在本發(fā)明的保護范圍之內(nèi)。
【權(quán)利要求】
1.一種含多類型標識的信息載體的識別方法,其特征在于包括以下步驟: 捕獲信息載體的圖像,并對該圖像進行增強去噪處理; 結(jié)合信息載體的形式與輔助定位標識,在捕獲的圖像上對信息載體進行定位,主要包括以下步驟: 首先,利用邊緣提取算法或直線檢測算法,識別輔助定位標識,得到定位標識區(qū)域頂點位置, 其次,由定位標識的頂點位置信息,以及定位標識與信息載體的尺寸比例關(guān)系以及相對位置關(guān)系,計算出信息載體在圖像上的位置區(qū)域,對信息載體的圖像進行透視變換,得到信息載體的正視圖, 最后,根據(jù)信息載體的各類型標識分布與尺寸比例,計算出各類型數(shù)據(jù)標識區(qū)域在信息載體中的位置; 利用各標識在信息載體中的位置,在信息載體的正視圖上分別分割出字符區(qū)域、條碼區(qū)域、二維碼區(qū)域、顯示屏區(qū)域以及圖形區(qū)域所對應(yīng)的圖像塊; 利用字符識別算法對字符區(qū)域圖像塊進行字符識別; 利用條碼識別算法對條碼區(qū)域圖像進行條碼識別; 利用二維碼識別算法對二維碼區(qū)域圖像進行二維碼識別; 利用圖形匹配算法對圖形區(qū)域圖像進行圖形識別; 對顯示屏顯示的內(nèi)容進行分割,根據(jù)已知的條碼、字符、二維碼以及圖形信息的相對分布位置,分割出顯示屏內(nèi)各種數(shù)據(jù)標識對應(yīng)的圖像塊; 對從顯示屏中分割出的條碼、字符、二維碼、圖形的各個數(shù)據(jù)標識的圖像塊進行識別;利用已知識別字符的長度,對字符識別結(jié)果進行驗證,如果正確,則輸出或執(zhí)行條碼識別結(jié)果、二維碼識別結(jié)果以及圖形識別結(jié)果,否則重新捕獲信息載體的圖像并進行以上分析處理。
2.根據(jù)權(quán)利要求1所述的含多類型標識的信息載體的識別方法,其特征在于,利用輔助定位標識進行信息載體的定位。
3.根據(jù)權(quán)利要求1所述的含多類型標識的信息載體的識別方法,其特征在于,所述輔助定位標識為一種幾何圖形,該幾何圖形為預(yù)先設(shè)定好的一種圖形,用于快速識別及定位。
4.根據(jù)權(quán)利要求1所述的含多類型標識的信息載體的識別方法,其特征在于,所述字符識別包括文字、字母以及數(shù)字識別。
5.根據(jù)權(quán)利要求1所述的含多類型標識的信息載體的識別方法,其特征在于,利用邊緣檢測算法、直線檢測算法識別輔助定位標識,獲取定位標識位置坐標。
6.根據(jù)權(quán)利要求1所述的含多類型標識的信息載體的識別方法,其特征在于,顯示屏用于顯示字符、條碼、二維碼、圖形信息。
7.根據(jù)權(quán)利要求1所述的含多類型標識的信息載體的識別方法,其特征在于,利用分割不同數(shù)據(jù)類型的圖像,分別對不同的數(shù)據(jù)類型圖像塊進行分析識別,實現(xiàn)多類型標識的同時識別。
8.根據(jù)權(quán)利要求1所述的含多類型標識的信息載體的識別方法,其特征在于,利用已知識別字符的長度,對字符識別結(jié)果進行驗證。
【文檔編號】G06K7/10GK104392238SQ201410512627
【公開日】2015年3月4日 申請日期:2014年9月29日 優(yōu)先權(quán)日:2014年9月29日
【發(fā)明者】樊曉莉, 樊曉東, 惠艷萍, 孟俊華, 唐文平, 劉家賓, 馮欣, 馮賓, 田明 申請人:樊曉莉