本發(fā)明涉及移動圖像捕獲及處理領(lǐng)域,特別是一種使用移動設(shè)備識別對象的系統(tǒng)及其識別方法。
背景技術(shù):
眾所周知,在數(shù)字圖像處理領(lǐng)域,通過使用電腦連接特定的外部設(shè)備比如掃描儀,多功能設(shè)備,可以很好的完成圖像捕獲及處理的任務(wù),而且技術(shù)也非常成熟。然而,在每天的日常活動中,由于其非常的便利性,人們越來越傾向于使用移動設(shè)備,這大大推動了通過移動設(shè)備進行圖像采集及處理的需求。
在移動設(shè)備上使用傳統(tǒng)的圖像采集和處理技術(shù)手段面臨著明顯的挑戰(zhàn),比如,移動設(shè)備的處理能力以及圖像分辨率的限制,使得常規(guī)的基于掃描儀的處理算法在使用移動設(shè)備捕獲的數(shù)字圖像處理表現(xiàn)不佳。
此外,使用常規(guī)圖像處理算法會耗費相當(dāng)?shù)南到y(tǒng)資源,在移動設(shè)備上有限的處理能力和存儲也導(dǎo)致了使用常規(guī)圖像處理算法的性能瓶頸。
再一個挑戰(zhàn)是通過手機拍攝的圖像與傳統(tǒng)的掃描儀不同,后者能夠忠實地反映實際的長寬比,尺寸和形狀,移動設(shè)備捕獲的圖像通常不能保證這樣的效果,而會有變形的偏差。
對于上述的挑戰(zhàn),有必要提供一種圖像捕獲及處理的算法及應(yīng)用,以便使用移動設(shè)備采集,處理及識別對象,同時利用有效的處理方法以維持較低的計算成本。
技術(shù)實現(xiàn)要素:
為解決現(xiàn)有技術(shù)的不足,本發(fā)明的目的在于提供一種使用移動設(shè)備識別對象的系統(tǒng)及其識別方法,本發(fā)明通過降低到合適的分辨率,最大限度地減少了移動設(shè)備處理器的負(fù)擔(dān),并優(yōu)化了計算效率,具有很強的魯棒性。
為了實現(xiàn)上述目標(biāo),本發(fā)明采用如下的技術(shù)方案:
一種使用移動設(shè)備識別對象的系統(tǒng),包括:捕獲數(shù)字圖像的移動設(shè)備,接收數(shù)字圖像的信息并降低圖像分辨率的預(yù)處理模塊,接收預(yù)處理模塊的信息并比較、分類特征向量的模板特征矩陣模塊。
前述的一種使用移動設(shè)備識別對象的系統(tǒng),預(yù)處理模塊將數(shù)字圖像分割成具有維水平和維垂直像素的降低了分辨率的預(yù)處理圖像。
前述的一種使用移動設(shè)備識別對象的識別方法,包括如下步驟:
步驟一,使用移動設(shè)備捕獲數(shù)字圖像;
步驟二,使用處理器對接收到的數(shù)字圖像進行降低圖像分辨率的預(yù)處理;
步驟三,使用處理器對預(yù)處理后的信息用模板特征矩陣比較及分類特征向量。
前述的一種使用移動設(shè)備識別對象的識別方法,步驟二,使用處理器對接收到的數(shù)字圖像進行降低圖像分辨率的預(yù)處理;由移動設(shè)備捕獲的數(shù)字圖像300可以被劃分成S個部分304,每個部分304可以包含多個像素306,形成包含維水平像素和維垂直像素的S x S柵格。
前述的一種使用移動設(shè)備識別對象的識別方法,步驟二,使用處理器對接收到的數(shù)字圖像進行降低圖像分辨率的預(yù)處理;通過二值化算法將多色調(diào)的數(shù)字圖像變換成為黑白圖像。
前述的一種使用移動設(shè)備識別對象的識別方法,步驟二,使用處理器對接收到的數(shù)字圖像進行降低圖像分辨率的預(yù)處理;通過二值化算法將多色調(diào)的數(shù)字圖像變換成為黑白圖像;二值化算法包括:1)確定一個對象的類的顏色配置文件和方案,2)調(diào)整對象的類的顏色配置文件或色彩方案的詳細(xì)二值化參數(shù),3)使用閾值調(diào)整圖像的二值化參數(shù)。
前述的一種使用移動設(shè)備識別對象的識別方法,步驟二,使用處理器對接收到的數(shù)字圖像進行降低圖像分辨率的預(yù)處理;通過二值化算法將多色調(diào)的數(shù)字圖像變換成為黑白圖像;二值化算法包括:1)通過對象的類掩模確定對象的背景區(qū)域,2)調(diào)整對象的背景區(qū)域的顏色配置文件或色彩方案的詳細(xì)二值化參數(shù),3)使用閾值調(diào)整圖像的二值化參數(shù)。
前述的一種使用移動設(shè)備識別對象的識別方法,對象的類掩模確定一個或多個對象的背景區(qū)域。
本發(fā)明的有益之處在于:本發(fā)明提供一種使用移動設(shè)備識別對象的系統(tǒng)及其識別方法,本發(fā)明通過移動設(shè)備捕獲數(shù)字圖像,通過預(yù)處理將數(shù)字圖像的分辨率降低,再與多元模板特征矩陣的比較及分類,基于對象特征,識別一個或多個屬于特定對象類中的對象;通過降低到合適的分辨率,最大限度地減少了移動設(shè)備處理器的負(fù)擔(dān),并優(yōu)化了計算效率,具有很強的魯棒性。
附圖說明
圖1為本發(fā)明對象的一種實施例的數(shù)字圖像;
圖2為圖1分割成多個用于產(chǎn)生預(yù)處理圖像;
圖3為圖1降低分辨率后特征化后的預(yù)處理圖像;
圖4為為本發(fā)明的多個子區(qū)域的數(shù)字圖像的示意圖;
圖5為圖4的一種實施例的掩碼展示;
圖6為圖4的另一實施例的掩碼展示;
圖7為圖4的另一實施例的掩碼展示;
具體實施方式
以下結(jié)合附圖和具體實施例對本發(fā)明作具體的介紹。
一種使用移動設(shè)備識別對象的系統(tǒng),包括:捕獲數(shù)字圖像的移動設(shè)備,接收數(shù)字圖像的信息并降低圖像分辨率的預(yù)處理模塊,接收預(yù)處理模塊的信息并比較、分類特征向量的模板特征矩陣模塊。
預(yù)處理模塊可以將一個數(shù)字圖像R(具有y.sub.R維垂直和x.sub.R維水平像素分辨率)分割成具有S.sub.x維水平和S.sub.y維垂直像素的降低了分辨率的預(yù)處理圖像。
移動設(shè)備為市場上普遍使用的智能手機;處理器是手機自帶的處理器,比如安卓手機是驍龍,蘋果手機是A4,A5。
一種使用移動設(shè)備識別對象的識別方法,包括如下步驟:
步驟一,使用移動設(shè)備捕獲數(shù)字圖像;
步驟二,使用處理器對接收到的數(shù)字圖像進行降低圖像分辨率的預(yù)處理;
步驟三,使用處理器對預(yù)處理后的信息用模板特征矩陣比較及分類特征向量。
降低圖像分辨率的預(yù)處理具體方法如下:
方法一;如圖1-2, 由移動設(shè)備捕獲的數(shù)字圖像300可以被劃分成多個部分304,每個部分304可以包含多個像素306,形成包含p.sub.S(x)維水平像素和p.sub.S(y)維垂直像素的矩形柵格。p.sub.S(x)= p.sub.S(y)=4。在此實例中,數(shù)字圖像300被劃分為S個部分,其中每個部分304對應(yīng)于S x S 柵格的302的一個部分。在預(yù)處理圖像左上角的像素312對應(yīng)于左上角部304的數(shù)字圖像。需要說明的是,為了降低分辨率,也可以采用其它的方法生成預(yù)處理圖像,圖像的特征值(分辨率,照明,模糊度)物體和背景的對比,文字和其它符號的使用,等等。
方法二;參照圖4-7,通過二值化算法將多色調(diào)的數(shù)字圖像變換成為黑白圖像;二值化算法包括:1)確定一個對象的類的顏色配置文件和方案,2)調(diào)整對象的類的顏色配置文件或色彩方案的詳細(xì)二值化參數(shù),3)使用閾值調(diào)整圖像的二值化參數(shù)。
作為一種實施例,圖4-5,改善二值化可以包括確定一個對象的類的顏色配置文件和方案,調(diào)整一個或基于所述對象類的顏色配置文件或色彩方案的詳細(xì)二值化參數(shù);和使用閾值調(diào)整圖像的二值化參數(shù)。
作為一種優(yōu)選,二值化算法采用類掩模確定對象的背景區(qū)域;二值化算法包括:1)通過對象的類掩模確定對象的背景區(qū)域,2)調(diào)整對象的背景區(qū)域的顏色配置文件或色彩方案的詳細(xì)二值化參數(shù),3)使用閾值調(diào)整圖像的二值化參數(shù)。
需要說明的是,對象的類掩模確定一個或多個對象的背景區(qū)域。改進的二值化方法可以包括確定一個對象的類掩模。對象的類掩??梢允侨魏晤愋偷难谀#峁┝烁信d趣的特征的特定區(qū)域的類。
如圖5所示,改進的二值化包括確定一個對象的類掩模420所確定的區(qū)域,以排除數(shù)字圖像400的除了感興趣的單個區(qū)域外的其它所有的區(qū)域??梢酝ㄟ^獲得對象類掩模既與物體的顏色配置文件和/或顏色方案,調(diào)整基于所述對象的背景區(qū)域的顏色信息和/或顏色方案,并且使用調(diào)整后的二值化參數(shù)閾值。
如圖5所示,對于多個感興趣區(qū)域也可以使用對象類掩模420,以選擇性地指定區(qū)域和/或參數(shù)值化,產(chǎn)生高品質(zhì)的雙色調(diào)圖像的分層方法。例如,如圖6多個文字區(qū)404,406可以被保留為二值化(可以使用調(diào)整的參數(shù))將對象類后掩模420,以從二進制化排除所有非文本區(qū)域,等等。
本發(fā)明提供一種使用移動設(shè)備識別對象的系統(tǒng)及其識別方法,本發(fā)明通過移動設(shè)備捕獲數(shù)字圖像,通過預(yù)處理將數(shù)字圖像的分辨率降低,再與多元模板特征矩陣的比較及分類,基于對象特征,識別一個或多個屬于特定對象類中的對象;通過降低到合適的分辨率,最大限度地減少了移動設(shè)備處理器的負(fù)擔(dān),并優(yōu)化了計算效率,具有很強的魯棒性。
以上顯示和描述了本發(fā)明的基本原理、主要特征和優(yōu)點。本行業(yè)的技術(shù)人員應(yīng)該了解,上述實施例不以任何形式限制本發(fā)明,凡采用等同替換或等效變換的方式所獲得的技術(shù)方案,均落在本發(fā)明的保護范圍內(nèi)。