專利名稱:圖像識別方法及系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及圖像識別的技術(shù)領(lǐng)域,特別涉及采用模式識別技術(shù)對靜態(tài)的目 標(biāo)圖像進(jìn)行識別的方法及系統(tǒng)。
背景技術(shù):
圖像識別作為辦公自動化中一個(gè)高端技術(shù),正隨著模式識別技術(shù)的發(fā)展而
不斷發(fā)展,并被積極推廣應(yīng)用。例如部分機(jī)場采用指紋識別4支術(shù)進(jìn)行身份確 認(rèn)。模式識別是一種從大量信息和數(shù)據(jù)出發(fā),在專家經(jīng)驗(yàn)和已有認(rèn)識的基礎(chǔ)上, 利用計(jì)算機(jī)和數(shù)學(xué)推理的方法對形狀、模式、曲線、數(shù)字、字符格式和圖形自 動完成識別的過程。模式識別包括相互關(guān)聯(lián)的兩個(gè)階段,即學(xué)習(xí)階段和實(shí)現(xiàn)階
段;學(xué)習(xí)階段是對樣本進(jìn)行特征選擇,尋找分類的規(guī)律;實(shí)現(xiàn)階段是根據(jù)分類 規(guī)律對未知樣本集進(jìn)行分類和識別。
在模式識別技術(shù)的目標(biāo)圖像的識別問題中,目標(biāo)搜索、特征信息提取、邏 輯判別是三個(gè)主要技術(shù)環(huán)節(jié)。目標(biāo)圖像的識別技術(shù)需要通過對圖像信息的多重 數(shù)據(jù)處理,獲得目標(biāo)圖像的邊界信息,通過邊界信息和其它圖像信息提取或計(jì) 算得到目標(biāo)圖像的特征信息,然后對特征信息進(jìn)行邏輯判斷,以獲得目標(biāo)圖像 的識別結(jié)果。
上述特征信息的提取目前尚無通用的提取方法,只能通過分析具體識別對 象來決定選取何種特征信息,然后針對選擇特征信息的特點(diǎn)來設(shè)計(jì)提取方法, 不具有通用性。目前所選擇的特征信息除了圖像的形象信息外,其他特征信息 都包含基于邏輯思維的,或者需要經(jīng)過圖像信息處理、數(shù)學(xué)變換、演繹推理、 統(tǒng)計(jì)計(jì)算才能得到的特征信息。現(xiàn)有技術(shù)中邏輯判斷是通過獲得的多個(gè)特征信
息不同取值的組合來判斷,以獲得目標(biāo)圖像的識別結(jié)果。在很多場合,這種特 征信息取值組合與目標(biāo)圖像之間的關(guān)系,都需要大量的實(shí)驗(yàn)獲得經(jīng)驗(yàn)數(shù)據(jù),或 者通過專家系統(tǒng)技術(shù)來獲得,經(jīng)驗(yàn)數(shù)據(jù)是保證邏輯判斷準(zhǔn)確因數(shù)之一。
在上述目標(biāo)圖像的識別技術(shù)中,圖像特征信息提取和目標(biāo)識別過程要完成 大量的圖像信息處理和數(shù)學(xué)統(tǒng)計(jì)計(jì)算,另外還包括復(fù)雜的數(shù)學(xué)變換、演繹推理,使圖像目標(biāo)識別的過程速度相對較慢、技術(shù)復(fù)雜、識別準(zhǔn)確率不高;由于特征 信息取值組合與目標(biāo)圖像之間的關(guān)系,都需要大量的實(shí)驗(yàn)獲得經(jīng)驗(yàn)數(shù)據(jù),或者 通過專家系統(tǒng)技術(shù)來獲得,每次遇到一個(gè)新的識別領(lǐng)域,就需要重新獲取大量 的經(jīng)驗(yàn)數(shù)據(jù),并建立一套特征信息取值組合與目標(biāo)圖像之間的關(guān)系,所以,通 過現(xiàn)有識別方法構(gòu)成的識別系統(tǒng)的通用性很差。
具有視覺能力的動物對圖像信息都有快速分析、判斷的能力,這種能力來 源于形象思維。形象思維是通過感知表象信息,調(diào)用大腦中的形象知識(表象、 意象、經(jīng)驗(yàn)等),通過分析、比較、歸納、想象等思維活動,完成對事物本質(zhì)的 認(rèn)識。這一思維活動并沒有經(jīng)過復(fù)雜嚴(yán)密的邏輯推理過程,但卻是簡潔、快速、 有效的。對于圖像靜態(tài)目標(biāo)識別問題,形象思維的思維活動相對來說是很筒單 的。目前簡化圖像識別的主要問題,是如何模擬形象思維方法來完成識別過程。
發(fā)明內(nèi)容
一方面,本發(fā)明的目的在于提供一種圖像識別方法,以提高識別速度、識 別準(zhǔn)確度,且該圖像識別方法的通用性較好。
為達(dá)到上述目的,本發(fā)明采用如下技術(shù)方案該圖像識別方法步驟如下 (1)獲取待識別圖像的信息;
(2 )在模板信息庫中選擇目標(biāo)圖像,并將選中目標(biāo)圖像的模板信息導(dǎo)入識 別系統(tǒng),所述模板信息至少包括目標(biāo)圖像中標(biāo)識區(qū)域的信息、以及標(biāo)識區(qū)域內(nèi) 標(biāo)志像素的特征信息;
(3)根據(jù)標(biāo)識區(qū)域的信息確定待識別圖像中的待識別區(qū)域;
(4 )在待識別區(qū)域中查找與標(biāo)識區(qū)域中標(biāo)志像素對應(yīng)的像素;計(jì)算查找到 的像素的特征信息與標(biāo)識區(qū)域中標(biāo)志像素的特征信息的最大相似度;
(5)判斷所述最大相似度是否在誤差范圍內(nèi),若在誤差范圍內(nèi),則所述待 識別圖像與所述目標(biāo)圖像相匹配;否則所述待識別圖像與所述目標(biāo)圖像不匹配。 上述技術(shù)方案所描述的圖像識別方法,通過選擇圖像的局部,以模板方式 記憶目標(biāo)圖像中標(biāo)識區(qū)域內(nèi)的形與像的特征信息,在確定待識別圖像中與標(biāo)識 區(qū)域相對應(yīng)的待識別區(qū)域后,計(jì)算待識別區(qū)域內(nèi)的特征信息和標(biāo)識區(qū)域內(nèi)的特 征信息的相似度,當(dāng)相似度符合誤差要求時(shí),表示找到與待識別圖像相匹配的目標(biāo)圖^f象,即實(shí)現(xiàn)了圖像的識別。
由于上述方法中只需要比較標(biāo)識區(qū)域內(nèi)和待識別區(qū)域的特征信息,所需要 的信息量比現(xiàn)有技術(shù)要少很多,并且所比較的特征信息是像素的特征信息,沒 有經(jīng)過任何預(yù)處理,不需要大量的圖像信息處理和數(shù)學(xué)統(tǒng)計(jì)計(jì)算,也沒有復(fù)雜 的數(shù)學(xué)變換、演繹推理,使圖像識別的過程相對于現(xiàn)有識別技術(shù)而言較快,實(shí) 現(xiàn)也較為簡單。
由于上述圖像識別方法中以模板方式記憶目標(biāo)圖像的形與像的特征信息, 這些形與像的特征信息相當(dāng)于動物大腦中的形象知識,所有的才莫板信息都是在 識別之前就保存完成的,這樣在識別過程中不需要對新的目標(biāo)圖像進(jìn)行特征分
析、識別策略分析等復(fù)雜工作;也不需要做大數(shù)據(jù)量的圖像處理,通過對比這
些特征信息來模擬動物大腦的形象思維以完成圖像識別。所以本發(fā)明圖像識別 方法相對于現(xiàn)有的圖像識別技術(shù)而言,其識別速度快,識別效率得到了提高。
由于上述圖像識別方法中不需要獲取大量的經(jīng)驗(yàn)數(shù)據(jù),只是提取像素的特 征信息,對其中標(biāo)志像素的特征信息進(jìn)行比較,計(jì)算出相似度就可以完成識別 過程。在遇到一個(gè)新的靜態(tài)圖像識別的問題時(shí),可以采用本發(fā)明提供的技術(shù)方 案,故而本發(fā)明圖像識別方法具有較好的通用性。
另一方面,本發(fā)明的目的還在于提供一種圖像識別系統(tǒng),以提高識別速度 和識別準(zhǔn)確度,且該圖像識別系統(tǒng)的通用性較好。
為達(dá)到上述目的,本發(fā)明采用如下技術(shù)方案該圖像識別系統(tǒng)包括 圖像輸入模塊,用于導(dǎo)入待識別圖像的信息;
模板信息選擇模塊,用于在模板信息庫選擇目標(biāo)圖像,并讀取模板信息庫 中目標(biāo)圖像的模板信息,所述模板信息包括目標(biāo)圖像中標(biāo)識區(qū)域的信息、以及 標(biāo)識區(qū)域內(nèi)標(biāo)志像素的特征信息;
掃描模塊,連接到圖像輸入模塊和模板信息選擇模塊,依據(jù)標(biāo)識區(qū)域的信 息在待識別圖像上確定待識別區(qū)域,在待識別區(qū)域中查找與標(biāo)識區(qū)域中標(biāo)志像 素對應(yīng)的像素;并計(jì)算查找到的像素的特征信息與標(biāo)識區(qū)域中標(biāo)志像素的特征 信息的最大相似度;
判斷模塊,連接到掃描模塊,依據(jù)計(jì)算出的最大相似度,輸出所述待識別 圖像與所述目標(biāo)圖像相匹配;或者輸出所述待識別圖像與所述目標(biāo)圖像不匹配。由上述技術(shù)方案所描述的圖像識別系統(tǒng),由圖像輸入模塊導(dǎo)入待識別圖像 的信息,并通過對比待識別圖像的待識別區(qū)域內(nèi)特征信息與目標(biāo)圖像的標(biāo)識區(qū) 域內(nèi)特征信息,當(dāng)兩者的相似度符合誤差要求時(shí),表示找到與待識別圖像相匹 配的目標(biāo)圖像,即實(shí)現(xiàn)了圖像的識別。
由于上述圖像識別系統(tǒng)在識別過程中,只需要比較標(biāo)識區(qū)域內(nèi)和待識別區(qū) 域的特征信息,所需要的信息量比現(xiàn)有技術(shù)要少很多,并且所比較的特征信息 是像素的特征信息,沒有經(jīng)過任何預(yù)處理,不需要大量的圖像信息處理和數(shù)學(xué) 統(tǒng)計(jì)計(jì)算,也沒有復(fù)雜的數(shù)學(xué)變換、演繹推理,使圖像識別相對于現(xiàn)有識別技 術(shù)而言較快,實(shí)現(xiàn)也較為筒單。
由于上述圖像識別系統(tǒng)中以模板信息方式保存目標(biāo)圖像的形與像的特征信 息,這些形與像的特征信息相當(dāng)于動物大腦中的形象知識,并且在識別過程中
不需要對新的目標(biāo)圖像進(jìn)行特征分析、識別策略分析等復(fù)雜工作;也不需要做 大數(shù)據(jù)量的圖像處理,通過對比這些特征信息來模擬動物大腦的形象思維以完 成圖像識別。所以本發(fā)明圖像識別系統(tǒng)相對于現(xiàn)有的圖像識別技術(shù)而言,其識 別速度快,識別效率得到了提高。
由于上述圖像識別系統(tǒng)不需要獲取大量的經(jīng)驗(yàn)數(shù)據(jù),只是提取像素的特征 信息,對其中標(biāo)志像素的特征信息進(jìn)行比較,計(jì)算出相似度就可以完成識別過 程。在遇到一個(gè)新的靜態(tài)圖像識別的問題時(shí),可以采用本發(fā)明提供的技術(shù)方案, 故而本發(fā)明圖像識別系統(tǒng)具有較好的通用性。
圖1是本發(fā)明圖像識別方法實(shí)施例的流程圖2是本發(fā)明圖像識別方法實(shí)施例中精確識別的流程圖3是本發(fā)明圖像識別系統(tǒng)實(shí)施例的結(jié)構(gòu)圖4是本發(fā)明圖像識別系統(tǒng)實(shí)施例的內(nèi)部結(jié)構(gòu)圖5是本發(fā)明圖像識別方法在票據(jù)版面識別中應(yīng)用的流程圖6是票據(jù)版面識別中第一 目標(biāo)票據(jù)圖像標(biāo)識示意圖7是票據(jù)版面識別中第二目標(biāo)票據(jù)圖像標(biāo)識示意圖8是票據(jù)版面識別中第三目標(biāo)票據(jù)圖像標(biāo)識示意圖;圖9是票據(jù)版面識別中提取的特征信息的幾何參數(shù)示意圖。
具體實(shí)施例方式
本發(fā)明圖像識別方法及系統(tǒng)是一種模仿形象思維的模板式組合標(biāo)識圖像識 別。在現(xiàn)有基于邏輯思維方式的圖像識別技術(shù)中,需要提取完整的信息、經(jīng)過 嚴(yán)密的推理與計(jì)算、以及有序的處理過程,才能最后完成圖像識別。而模仿形 象思維方式的圖像識別技術(shù),完全基于圖像中形與像的特征信息,所記憶的信 息僅是表征其特征的很少一部分,并且對特征信息的處理是并行的,沒有大量 復(fù)雜的數(shù)學(xué)計(jì)算和邏輯推理,就可以完成圖像識別。比較上述兩種基于不同思 維方式的圖像識別技術(shù),可知基于形象思維方式的圖像識別具有特征信息量小, 處理過程簡約、高效的優(yōu)勢。
就目前對形象思維的認(rèn)知程度,還不能完全模擬形象思維的高級思維活動 來解決圖像識別問題。但對于圖像靜態(tài)識別問題,分析形象思維的高級思維活 動特點(diǎn),模擬特征目標(biāo)識別過程的主要特點(diǎn)及方法是可以實(shí)現(xiàn)的,這也是本發(fā) 明的核心思想。
形象思維對圖像的識別過程最主要的是直接利用記憶的形與象的特征信 息搜索匹配的目標(biāo)圖像,根據(jù)相似程度獲得識別結(jié)果。這種方法有三個(gè)主要特 點(diǎn)第一、直接利用形與像的特征信息搜索匹配的目標(biāo)圖像,不對原始圖像信 息作各種預(yù)處理;第二、根據(jù)不同的識別目標(biāo)集合及不同的識別準(zhǔn)確率要求, 調(diào)整參與圖像識別的特征信息元素?cái)?shù)量;第三、根據(jù)統(tǒng)一的相似程度指標(biāo)判定 識別結(jié)果。本發(fā)明圖像識別方法及系統(tǒng)模擬這三個(gè)特點(diǎn),實(shí)現(xiàn)了一種簡潔、高 效的圖像識別方法,通過使用少量的特征信息,直接匹配目標(biāo)圖像使識別的速 度大大提高;通過使用相似程度指標(biāo)使該方法可應(yīng)用于各種靜態(tài)圖像目標(biāo)的識 別,具有較好的通用性。
下面結(jié)合附圖對本發(fā)明圖像識別方法及系統(tǒng)進(jìn)行詳細(xì)描述。
如圖1所示,為本發(fā)明圖像識別方法的流程圖,該過程包括目標(biāo)圖像的模 板信息準(zhǔn)備,以及后續(xù)的識別過程,其中步驟101至步驟103為目標(biāo)圖像的模 板信息準(zhǔn)備,其后為具體的識別過程。圖l所示的具體過程如下
101、調(diào)入作為識別目標(biāo)的圖像并將其轉(zhuǎn)換為24位RGB圖像,即獲取圖像的基本信息和特征信息,所述基本信息至少包含目標(biāo)圖像以像素為單位的寬度
Bw、高度Bh和圖像分辨率Bf;特征信息是指像素的坐標(biāo)、亮度和顏色。用鼠標(biāo) 圏定該RGB圖像的局部區(qū)域,并將該局部區(qū)域作為該目標(biāo)圖像的標(biāo)識區(qū)域。
記錄標(biāo)識區(qū)域的信息主要包括標(biāo)識區(qū)域中心坐標(biāo)偏移P。 ( x, y)、標(biāo)識區(qū) 域參數(shù)Reb(l, t, r, b)、搜索區(qū)域參數(shù)Res(l, t, r, b)。通過這些標(biāo)識區(qū)域的信息 可以準(zhǔn)確定位標(biāo)識區(qū)域,然后就可確定標(biāo)識區(qū)域內(nèi)的特征信息元素個(gè)數(shù)Na和區(qū) 別特征級級特征信息元素個(gè)數(shù)Nm 。
其中,標(biāo)識區(qū)域中心坐標(biāo)偏移表示標(biāo)識區(qū)域中心與它的基準(zhǔn)坐標(biāo)點(diǎn)的偏移 量,為了能夠更精確地進(jìn)行圖像識別,可以設(shè)置主要標(biāo)識區(qū)域和輔助標(biāo)識區(qū)域, 其中主要標(biāo)識區(qū)域的基準(zhǔn)坐標(biāo)點(diǎn)規(guī)定為圖像左上角(0, O)坐標(biāo)點(diǎn);輔助標(biāo)識 區(qū)域的基準(zhǔn)坐標(biāo)點(diǎn)規(guī)定為主要標(biāo)識區(qū)域的中心點(diǎn)。
當(dāng)所選定的標(biāo)識區(qū)域在實(shí)際圖像中的位置不會變化時(shí),該標(biāo)識區(qū)域稱為定 位標(biāo)識區(qū)域,當(dāng)所選定的標(biāo)識區(qū)域在實(shí)際圖像中的位置會發(fā)生變化時(shí),該標(biāo)識 區(qū)域稱為非定位標(biāo)識區(qū)域,本發(fā)明中通過表示區(qū)域的中心坐標(biāo)偏移來區(qū)分定位 標(biāo)識和非定位標(biāo)識,當(dāng)中心坐標(biāo)偏移P。為(0, G)時(shí),該標(biāo)識區(qū)域?yàn)榉嵌ㄎ粯?biāo) 識,否則為定位標(biāo)識。
一般情況下需要人工選擇圖像中的主要標(biāo)識區(qū)域,對于定位標(biāo)識,如果不 進(jìn)行人工選擇標(biāo)識區(qū)域,則自動生成默認(rèn)的標(biāo)識區(qū)域。根據(jù)目標(biāo)圖像的具體情 況可選擇或不選擇若干個(gè)輔助標(biāo)識區(qū)域,輔助標(biāo)識區(qū)域固定為定位標(biāo)識,其中 心坐標(biāo)偏移表示以主要標(biāo)識區(qū)域的中心為參考點(diǎn)的坐標(biāo)偏移。
標(biāo)識區(qū)域參數(shù)Reb、搜索區(qū)域參數(shù)Res與矩形參數(shù)定義相同,即1 (left) 表示矩形區(qū)域左上角x坐標(biāo)(中心點(diǎn)的左偏移),t (top)表示矩形區(qū)域左上角 y坐標(biāo)(中心點(diǎn)的上偏移),r ( right )表示矩形區(qū)域右下角x坐標(biāo)(中心點(diǎn)的 右偏移),b (bottom)表示矩形區(qū)域右下角y坐標(biāo)(中心點(diǎn)的下偏移),這樣就 構(gòu)成一個(gè)向中心點(diǎn)四周偏移的矩形。
特征信息的元素以Ty (x, y, s, l)表示,其中x、 y表示特征信息^象素點(diǎn)以標(biāo) 識圖像中心為原點(diǎn)的相對幾何坐標(biāo);s表示特征信息像素點(diǎn)的顏色標(biāo)記代碼;1 表示特征信息像素點(diǎn)的亮度標(biāo)記代碼。
通過上述的步驟101即可提取到目標(biāo)圖像標(biāo)識區(qū)域內(nèi)的特征信息,完成了對靜態(tài)目標(biāo)圖像的特征描述。
102、 利用上述目標(biāo)圖像的基本信息、標(biāo)識區(qū)域的信息、以及標(biāo)識區(qū)域內(nèi)標(biāo)
志像素的特征信息構(gòu)成描述目標(biāo)圖像的完整模板信息,然后為模板信息記錄項(xiàng)
添加名稱和^r索標(biāo)識代碼,并保存該;^莫板信息記錄項(xiàng)。所述基本信息至少包含 目標(biāo)圖像以像素為單位的寬度Bw、高度Bh和圖像分辨率Bf。本步驟完成了對 靜態(tài)目標(biāo)圖像的特征記憶。
103、 將至少一個(gè)目標(biāo)圖像的模板信息構(gòu)建成模板信息庫。
104、 在識別圖像之前,首先在目標(biāo)模扭.信息庫中選擇所需的目標(biāo)才莫板信息,
并將其導(dǎo)入圖像識別系統(tǒng)。
105、 調(diào)入待識別圖像,并將其轉(zhuǎn)換為RGB圖像。
106、 根據(jù)待識別圖像的分辨率與目標(biāo)模板基本信息分辨率,按下式計(jì)算各 標(biāo)識特征信息元素的幾何坐標(biāo)縮放比值Fk=Df/Bf,其中Df是待識別圖像的分 辨率,Bf是目標(biāo)圖像的分辨率。
當(dāng)待識別圖像的中心坐標(biāo)偏移P。為(0, 0)時(shí),標(biāo)識為非定位標(biāo)識,否則 為定位標(biāo)識。對于非定位標(biāo)識的識別問題直接轉(zhuǎn)向步驟107。對于定位標(biāo)識的識 別問題,按如下公式順序計(jì)算與各模板信息的相似指標(biāo)Xjw、 Xjh。
Xjw= (Fk*Bw-Dw) /Dw;Xjh= ( Fk*Bh - Dh ) /Dh;
其中,Bw、 Bh分別是目標(biāo)圖像的寬度和高度;Dw、 Dh分別是待識別圖像的 寬度和高度。設(shè)定一個(gè)判定指標(biāo)Ra、 Rb, Ra的取值范圍為大于5%小于等于15%; Rb取值范圍為大于-15%小于等于-5%;若Rb〈Xjw 〈Ra并且Rb〈Xjh <Ra,則待識別圖 像符合目標(biāo)圖像的外形尺寸,轉(zhuǎn)向步驟107,否則重新選擇一個(gè)目標(biāo)圖像,并執(zhí) 行步驟106,當(dāng)待識別圖像與所有的目標(biāo)圖像都不符合外形尺寸時(shí),判定結(jié)束, 并給出沒有找到與待識別圖像匹配的目標(biāo)圖像的識別結(jié)果。
107、 利用模板信息中主要標(biāo)識區(qū)域的搜索區(qū)域參數(shù)、標(biāo)識區(qū)域的中心坐標(biāo) 偏移,在待識別圖像中確定待識別區(qū)域,并計(jì)算主要標(biāo)識區(qū)域內(nèi)標(biāo)志像素的特 征信息和待識別區(qū)域內(nèi)像素的特征信息的相似度,設(shè)定一個(gè)判定指標(biāo)R。, R。的取 值范圍為大于90%小于等于100%。當(dāng)找到的待識別區(qū)域中計(jì)算出的最大相似度 滿足XSsm〉R。時(shí),則粗略判定待識別圖像與目標(biāo)圖像匹配,由于是粗略識別,所
以在本步驟中只需要利用部分標(biāo)志像素(即區(qū)別特征級的標(biāo)志像素)的特征信息來計(jì)算相似度。
對于定位標(biāo)識的識別問題,具體過程如下
(1 )設(shè)定粗略識別X、 Y平面的默認(rèn)搜索鄰域Rd、 Re。 Rd是對應(yīng)200dpi分 辨率的參數(shù),Ra取值范圍為大于50小于等于200。 Re是對應(yīng)待識別圖像分辨率 的參數(shù)RHl^(Df/ 200)。根據(jù)標(biāo)識區(qū)域的信息中標(biāo)識區(qū)域中心坐標(biāo)偏移Pc、標(biāo) 識區(qū)域參數(shù)Reb、搜索區(qū)域參數(shù)Res,計(jì)算搜索區(qū)域Rezs。
如果Res是人工選擇的,按下面公式計(jì)算搜索區(qū)域Rezs:
Rezs. 1= ( Pc. x- (Reb. 1—Res. 1) ) *Fk ; Rezs. r= ( Pc. x+ (Res. r- Reb. r) ) *Fk ;
Rezs. t= (Pc. y-(Reb. t-Res. t) ) *Fk ; Rezs. b= ( Pc. y+(Res. b- Reb. b) ) *Fk ;
如果Res是自動選擇的,按下面公式計(jì)算搜索過程中心坐標(biāo)的搜索區(qū)域Rezs:
Rezs. l=Pe. x*Fk - Re; Rezs. r=Pe. x*Fk + Re;
Rezs. t=Pc. y*Fk - R" Rezs. b=Pc. y*Fk + Re;
其中,Rezs. l表示以搜索中心坐標(biāo)為準(zhǔn)向左的偏移量,Rezs. r表示以搜索中 心坐標(biāo)為準(zhǔn)向右的偏移量,Rezs. t表示以搜索中心坐標(biāo)為準(zhǔn)向上的偏移量,Rezs. b 表示以搜索中心坐標(biāo)為準(zhǔn)向下的偏移量;搜索中心有標(biāo)識區(qū)域的中心坐標(biāo)偏移 P。確定。
設(shè)置粗略搜索過程X、 Y方向的增量dsx、 dsy。 dsx=Rf*(Df/ 200); dsy=Rf* (Df / 200)。 Rf是對應(yīng)200dpi分辨率的參數(shù),Rf取值范圍為大于1小于等于6。
(2) 由于是針對定位標(biāo)識的圖像識別,可以設(shè)定粗略識別最大搜索的偏斜 角度取值范圍為大于5小于等于20,記為alfs。旋轉(zhuǎn)角度的搜索范圍是(-Ralf ~ Ralf)。設(shè)置搜索過程旋轉(zhuǎn)角度的增量(Ut取值范圍為大于1小于等于3。
(3) 對區(qū)別特征級標(biāo)志像素的特征信息,按照步驟(2)中的旋轉(zhuǎn)角度以 及旋轉(zhuǎn)角度的步進(jìn)量(Uf,按照旋轉(zhuǎn)角度的增量變化待識別圖像的偏斜角度,在 待識別圖像上按照步驟(1)中界定的搜索范圍內(nèi),按照X、 Y方向的增量dsx、 dsy,搜索待識別區(qū)域,將待識別區(qū)域中的像素逐步與目標(biāo)圖像中的主要標(biāo)識區(qū) 域內(nèi)的像素比較,計(jì)算出一個(gè)相似度XSs。當(dāng)找到的待識別區(qū)域中計(jì)算出的最大 相似度滿足XsJRc時(shí),返回最大相似度Xs吣當(dāng)前映射的旋轉(zhuǎn)角度alG和當(dāng)前 標(biāo)識區(qū)域的搜索中心點(diǎn)坐標(biāo)PeS,并轉(zhuǎn)向步驟108。如果所有偏斜角度都搜索完 成之后還不能找到滿足Xs〉R。的最大相似度,則返回步驟106。對于非定位標(biāo)識的識別問題,其具體過程如下
1) 將標(biāo)識區(qū)域參數(shù)Res設(shè)置為待識別圖像的整個(gè)區(qū)域。即Res. 1=0; Res. t=0; Res. r=Dw; Res. b=Dh;其中Dw表示待識別圖像的寬度;Dh表示待識別圖像的高 度。按下面公式計(jì)算搜索區(qū)域Rezs:
Rezs. 1= Res. 1 +Cw*Fk/2; Rezs. t= Res. t +Ch*Fk/2;
Rezs. r= Res. r - Cw*Fk/2; Rezs. b= Res. b -Ch*Fk/2;
其中,Cw表示目標(biāo)圖像中標(biāo)識區(qū)域的寬度;Ch表示目標(biāo)圖像中標(biāo)識區(qū)域的 高度。搜索過程X、 Y方向的增量與定位標(biāo)識粗略搜索過程X、 Y方向的增量相 同,即dsx=Rf*(Df/ 200); dsy=Rf* (Df / 200) 。 Rf是對應(yīng)200dpi分辨率的參數(shù), Rf取值范圍為大于1小于等于6。
2) 對于非定位標(biāo)識的圖像識別,可以設(shè)定粗略識別最大搜索的偏斜角度Raf 取值范圍為180度,記為alfs。旋轉(zhuǎn)角度的搜索范圍(-Ralf ~Ralf),設(shè)置搜索 過程旋轉(zhuǎn)角度的增量d^取值范圍為大于1小于等于3。
3) 對區(qū)別特征級標(biāo)志像素的特征信息,按照步驟(2)中的旋轉(zhuǎn)角度以及 旋轉(zhuǎn)角度的步進(jìn)量(Uf,按照旋轉(zhuǎn)角度的增量變化待識別圖像的偏斜角度,并在 偏斜后的待識別圖像中,按照步驟(1)中界定的搜索范圍內(nèi),沿X、 Y方向的 增量dsx、 dsy,搜索待識別區(qū)域,并將待識別區(qū)域內(nèi)的像素逐步與目標(biāo)圖像中主 要標(biāo)志區(qū)域內(nèi)的像素比較,計(jì)算出一個(gè)相似度XSs。當(dāng)找到的待識別區(qū)域中計(jì)算 出的最大相似度滿足XsJR。時(shí),返回最大相似度XSsm、當(dāng)前映射的旋轉(zhuǎn)角度alfjs 和當(dāng)前標(biāo)識區(qū)域的搜索中心點(diǎn)坐標(biāo)P。s,并轉(zhuǎn)向步驟108。如果所有偏斜角度都 搜索完成之后還不能找到滿足XSsm〉R。的最大相似度,則返回步驟106。
通過上述步驟106和107即可完成對圖像的粗選匹配。
108、對通過粗選匹配的目標(biāo)圖^象進(jìn)行進(jìn)一步的精確識別,精確識別也需要 計(jì)算特征信息的相似程度指標(biāo),返回最大相似程度指標(biāo)Xs,設(shè)定一個(gè)判定指標(biāo)
l的取值范圍為大于90°/。小于等于100°/。。如果最大相似程度指標(biāo)XSsm〉R。,則 判定待識別圖像與目標(biāo)圖像匹配;否則判定待識別圖像與目標(biāo)圖像不匹配。
該精確識別的具體流程如圖2,所示
Sl、設(shè)定精確識別中X、 Y平面的4叟索鄰域Rg、 Rh。 Rg是對應(yīng)200dpi分辨率 的參數(shù),Rg取值范圍為大于5小于等于20。 Rh是對應(yīng)待識別圖像分辨率的參數(shù),Rh = Rg*(Df/ 200)。根據(jù)粗略識別過程返回的旋轉(zhuǎn)角度alfjs和搜索中心點(diǎn)坐標(biāo) Pcs,按下面公式確定精確搜索過程中心坐標(biāo)的搜索區(qū)域Rezjs。
Rezjs. 1=PCS. x—Rh; Re2jS. r=Pcs. x+ R"
Rezjs. t=Pcs. y_Rh; Rezjs. b=Pcs. y+ Rh;
當(dāng)前映射的旋轉(zhuǎn)角度采用粗略識別過程返回的旋轉(zhuǎn)角度alfjs,還需要設(shè)置 搜索過程X、 Y方向的增量dsjx=l; dsjy =1,設(shè)定精確識別最大搜索的偏斜角度 Ralfj, R"n取值范圍為大于0小于等于5。旋轉(zhuǎn)角度的搜索范圍是(alfjs-Ralfj~ alfjs+Ralfj)。設(shè)置搜索過程旋轉(zhuǎn)角度的增量dsjalf=l。
52、 對所有標(biāo)志像素的特征信息,在上述旋轉(zhuǎn)角度的變換范圍內(nèi),按照旋 轉(zhuǎn)角度的增量變化待識別圖像的偏轉(zhuǎn)角度,然后按照X、 Y方向的增量,搜索待 識別區(qū)域,并將待識別區(qū)域內(nèi)的像素逐個(gè)與主要標(biāo)識區(qū)域內(nèi)的像素比較,并計(jì) 算出相似度XSjs。當(dāng)找到的待識別區(qū)域中計(jì)算出的最大相似度滿足Xs,L時(shí),返 回最大相似度Xsjsm、當(dāng)前映射的旋轉(zhuǎn)角度a 1 f jzs和當(dāng)前標(biāo)識圖像的搜索中心點(diǎn)坐 標(biāo)P。"并執(zhí)行步驟S3。如果不能找到滿足Xs細(xì)〉R。的最大相似度,則輸出所述待 識別圖像與當(dāng)前的目標(biāo)圖像不匹配,并返回執(zhí)行步驟107 (返回后,按照步驟 107中返回當(dāng)前映射的旋轉(zhuǎn)角度和當(dāng)前標(biāo)識區(qū)域的搜索中心點(diǎn)坐標(biāo),繼續(xù)進(jìn)行搜 索),直到系統(tǒng)中的所有模板信息全都被匹配比較完成。
53、 判斷目標(biāo)圖像是否設(shè)定有輔助標(biāo)識區(qū)域,若設(shè)定有輔助標(biāo)識區(qū)域,則 執(zhí)行步驟S4;否則輸出所述待識別圖像與當(dāng)前的目標(biāo)圖像相匹配。
54、 根據(jù)精確識別過程返回主要標(biāo)識的旋轉(zhuǎn)角度alfjzs和搜索中心點(diǎn)坐標(biāo) P",按下面公式確定輔助標(biāo)識搜索過程中心坐標(biāo)P。fs和搜索區(qū)域Refjs,并設(shè)置搜 索過程X、 Y方向的增量ds,l; dsjy =1。
Pcfs. x=Pcs. x + (Pcf. x*cos (alf jZS)+Pcf. y*sin (alf jzs)) *Fk;
PCfS. y=Pcs. y + (PCf. x *sin(alf jzs)+ Pcf. y *cos (alf jzs)) * Fk;
Re"" 1= Pcfs. x_ Rh; Ret'jS. r= PCfS. x+ Rh;
Refjs. t= Pcfs. y- Rh; Refjs. b= Pcfs. y+ Rh;
其中Pef是輔助標(biāo)識區(qū)域相對于主要標(biāo)識中心坐標(biāo)的偏移。
按下面公式對輔助標(biāo)識的Nt.個(gè)特征信息元素作初始旋轉(zhuǎn)映射變換
Tyi. x = (( Tf" x+ Pcf. x ) *cos (a 1 f jzs) + (Tf" y+ Pcf. y ) * s in (a 1 f jzs)) * Fk - Pcfs. x;Tyi. y = ((Tfi. x+ Pcf, x ) *s in (alf jzs) + ( Tfi. y+ Pcf. y ) *cos (alf jzs)) * Fk - Pcfs. y;
其中,Tyi是第i個(gè)輔助標(biāo)識特征信息元素Tfi作初始旋轉(zhuǎn)映射變換后的元 素。經(jīng)變換后,旋轉(zhuǎn)映射變換的初始旋轉(zhuǎn)角度alfjs=0,最大搜索的偏斜角度與 精確識別最大搜索的偏斜角度相同,R"fj取值范圍為大于0小于等于5,旋轉(zhuǎn)角 度的搜索范圍是(-Ralfj~ Ralfj ),并設(shè)置搜索過程旋轉(zhuǎn)角度的增量d一產(chǎn)l。
S5、對輔助標(biāo)識區(qū)域中全部標(biāo)志像素的特征信息,按照S2中同樣的方法計(jì) 算相似度,并獲取最大相似度XSjsm。
當(dāng)最大相似度Xs一〉Re時(shí),返回最大相似程度指標(biāo)XsjM、當(dāng)前映射的旋轉(zhuǎn)角 度alfjfs和當(dāng)前標(biāo)識圖像的搜索中心點(diǎn)坐標(biāo)Pew并輸出所述待識別圖像與當(dāng)前 的目標(biāo)圖像相匹配;當(dāng)沒有找到滿足Xs細(xì)〉R。的最大相似度時(shí),則輸出所述待識 別圖像與當(dāng)前的目標(biāo)圖像不匹配,并返回執(zhí)行步驟106,直到系統(tǒng)中的所有模板 信息全都被匹配比較完成。
上述技術(shù)方案所描述的圖像識別方法,通過選擇圖像的局部,以模板方式 記憶目標(biāo)圖像中標(biāo)識區(qū)域內(nèi)的形與像的特征信息,在查找到待識別圖像中與標(biāo) 識區(qū)域相對應(yīng)的待識別區(qū)域后,計(jì)算待識別區(qū)域內(nèi)的特征信息和標(biāo)識區(qū)域內(nèi)的 特征信息的相似度,當(dāng)相似度符合誤差要求時(shí),表示找到與待識別圖像相匹配 的目標(biāo)圖像,即實(shí)現(xiàn)了圖像的識別。
由于上述方法中只需要比較標(biāo)識區(qū)域內(nèi)和待識別區(qū)域的特征信息,所需要 的信息量比現(xiàn)有技術(shù)要少很多,并且所比較的特征信息是像素的特征信息,沒 有經(jīng)過任何預(yù)處理,不需要大量的圖像信息處理和數(shù)學(xué)統(tǒng)計(jì)計(jì)算,也沒有復(fù)雜 的數(shù)學(xué)變換、演繹推理,使圖像識別的過程相對于現(xiàn)有識別技術(shù)而言較快,實(shí) 現(xiàn)也較為簡單。
由于上述方法中采用了主要標(biāo)識區(qū)域和輔助標(biāo)識區(qū)域,通過輔助標(biāo)識區(qū)域 內(nèi)的識別過程可以更進(jìn)一步地提高識別的準(zhǔn)確性。
對應(yīng)于上述方法構(gòu)建一個(gè)圖像識別系統(tǒng),如圖3所示,為本發(fā)明圖像識別 系統(tǒng)的原理圖,該系統(tǒng)至少包含目標(biāo)圖像模板信息生成工具、目標(biāo)圖像模板信 息庫和目標(biāo)圖像識別系統(tǒng)三部分,其中模板信息生成工具負(fù)責(zé)前期目標(biāo)圖像的 模板信息準(zhǔn)備,目標(biāo)圖像模板信息庫中保存了已準(zhǔn)備好的模板信息,目標(biāo)圖像 識別系統(tǒng)主要負(fù)責(zé)圖像的識別。該圖像識別系統(tǒng)包括圖像輸入模塊、模板信息選擇模塊、掃描模塊、判斷 模塊和外形掃描模塊,其中各個(gè)模塊的連接關(guān)系和實(shí)現(xiàn)的功能如下
如圖4所示,圖像輸入模塊,用于導(dǎo)入待識別圖像的信息,主要讀取圖像 的RGB信息。
模板信息選擇模塊,用于在模板信息庫選擇目標(biāo)圖像,并讀取模板信息庫 中目標(biāo)圖像的模板信息,可以根據(jù)需要選擇不同的模版信息庫,所述模板信息 包括目標(biāo)圖像的基本信息、標(biāo)識區(qū)域的信息、以及標(biāo)識區(qū)域內(nèi)標(biāo)志像素的特征 信息。掃描模塊,連接到圖像輸入模塊和模板信息選擇模塊,依據(jù)標(biāo)識區(qū)域的 信息在待識別圖像上確定待識別區(qū)域,待識別區(qū)域的查找過程和上述圖像識別 方法中完全相同,并且查找后需要按照旋轉(zhuǎn)角度來計(jì)算待識別區(qū)域內(nèi)特征信息 與標(biāo)識區(qū)域內(nèi)特征信息的相似度,返回其中最大相似度。判斷模塊,連接到掃 描模塊,依據(jù)計(jì)算出的相似度,輸出所述待識別圖像與所述目標(biāo)圖像相匹配; 或者輸出所述待識別圖像與所述目標(biāo)圖像不匹配。
上述判斷模塊的具體工作過程如下在存儲器中事先保存了特征信息的相 似度判定指標(biāo);當(dāng)掃描模塊輸出最大相似度時(shí),將該最大相似度與相似度判定 指標(biāo)比較,若計(jì)算出的最大相似度大于相似度判定指標(biāo),則輸出目標(biāo)圖像與待 識別圖像匹配;否則輸出目標(biāo)圖像與待識別圖像不匹配。
上述的標(biāo)識區(qū)域具有如下特點(diǎn)
1、 人為選定的具有明顯視覺效果,反映目標(biāo)圖像特征的局部圖像。
2、 分為主要標(biāo)識區(qū)域和輔助標(biāo)識區(qū)域。主要標(biāo)識只有一個(gè),輔助標(biāo)識可以 有多個(gè)。輔助標(biāo)識與主要標(biāo)識的幾何位置關(guān)系是固定不變的。主要標(biāo)識用于區(qū) 別目標(biāo)之間的明顯差別,多個(gè)輔助標(biāo)識逐級精確區(qū)分目標(biāo)之間的細(xì)微差別。
3、 分為定位標(biāo)識和非定位標(biāo)識,定位標(biāo)識是指標(biāo)識區(qū)域在圖像的指定區(qū)域 內(nèi);非定位標(biāo)識是指不能確定標(biāo)識在圖像中的位置。
對于采用定位標(biāo)識進(jìn)行圖像識別的情況,在確定待識別區(qū)域之前,先要粗 略判斷該圖像在大小上是否相似,為了選擇外形相符的目標(biāo)圖像,本發(fā)明圖像 識別系統(tǒng)還包括外形掃描模塊,連接到才莫板信息選擇模塊、圖像輸入模塊和掃 描模塊,對選擇的目標(biāo)圖像進(jìn)行外形尺寸的比較,用于查找與待識別圖像外形 尺寸相符的目標(biāo)圖像,并將所述目標(biāo)圖像的特征信息傳送到掃描模塊。這樣所有進(jìn)入掃描模塊進(jìn)行識別的目標(biāo)圖像都是在尺寸上符合要求的,不必要對尺寸 不符合的目標(biāo)圖像進(jìn)行識別,加快了圖像識別的過程。
用戶通過圖像輸入模塊輸入待識別圖像后,再通過模板信息選擇模塊將目 標(biāo)圖像的信息選擇,通過外形掃描模塊過濾掉外形尺寸不相符的目標(biāo)圖像,然 后通過掃描模塊將外形尺寸相符的目標(biāo)圖像和待識別圖像進(jìn)行圖像識別。掃描 模塊找到待識別區(qū)域后,在待識別區(qū)域內(nèi)進(jìn)行特征信息的比較,計(jì)算出相似度, 最后由判斷模塊利用相似度得出匹配結(jié)果。在整個(gè)識別過程中只需要比較待識 別區(qū)域內(nèi)的特征信息,所比較的信息相對于現(xiàn)有識別技術(shù)要少,并且不需要對 特征信息進(jìn)行邏輯運(yùn)算,加快了識別過程。
下面介紹一個(gè)采用本發(fā)明的票據(jù)版面的圖像識別過程,票據(jù)版面識別是票 據(jù)自動處理首先要解決的關(guān)鍵問題。各行各業(yè)的票據(jù)種類不計(jì)其數(shù),新的票據(jù) 不斷地出現(xiàn),可用于識別的票面信息千變?nèi)f化。構(gòu)建能適應(yīng)這種變化的票據(jù)版 面識別系統(tǒng)是實(shí)現(xiàn)票據(jù)自動處理的基礎(chǔ)。
本發(fā)明所述的方法非常有效的解決這一票面信息千變?nèi)f化票據(jù)版面識別問 題。為票據(jù)版面識別提供了一種通用的、快速記憶、識別方法。按照本發(fā)明所 述的方法構(gòu)建的票據(jù)版面識別系統(tǒng)與圖3所示是一致的。只需才艮據(jù)票據(jù)版面識
別的要求對界面做相應(yīng)的改動。包括三部分 一、描述票據(jù)圖像特征的模板信 息生成的工具軟件;二、記憶票據(jù)圖像特征的模板信息庫;三、實(shí)現(xiàn)票據(jù)版面 識別的圖像靜態(tài)目標(biāo)識別系統(tǒng)。按照本發(fā)明所述的方法實(shí)現(xiàn)票據(jù)版面識別的流 程如圖4所示,這一流程又分為兩大部分。第一部分是識別前的準(zhǔn)備工作,包 括票據(jù)圖像特征的描述、記憶,識別目標(biāo)的選擇,識別目標(biāo)集特征信息的優(yōu)化。 第二部分是在線的識別過程。本發(fā)明這種通過模板與標(biāo)識組合,模擬形象思維 對圖像信息進(jìn)行記憶與識別的方法以及上述的流程設(shè)計(jì),使得本發(fā)明的實(shí)施例 具有如下優(yōu)點(diǎn)
通過簡單人工參與,選擇標(biāo)識區(qū)域,實(shí)現(xiàn)票據(jù)圖像特征描述與記憶。 通過簡單人工參與,選擇目標(biāo)票據(jù)模板信息,實(shí)現(xiàn)有限票據(jù)類型識別系統(tǒng) 的快速構(gòu)成。
按照本發(fā)明的方法,不對待識別圖像進(jìn)行預(yù)處理,直接利用少量特征信息, 通過搜索與匹配,實(shí)現(xiàn)圖像的快速準(zhǔn)確識別。如圖5所示包括目標(biāo)圖像的模板信息準(zhǔn)備過程,本發(fā)明圖像識別方法用 于票據(jù)版面的識別通過以下步驟實(shí)現(xiàn)
401、 在模板工具軟件中,按先后順序打開三個(gè)目標(biāo)票據(jù)圖像。前兩個(gè)目標(biāo) 票據(jù)圖像如圖6、圖7所示,票面圖像信息基本是一樣的。其差別是目標(biāo)票據(jù) 圖像l標(biāo)有"(壹)"字樣;目標(biāo)票據(jù)圖像2標(biāo)有"(武)"字樣;第三個(gè)目標(biāo)票 據(jù)圖像與前兩個(gè)具有不同圖像特征的,如圖8所示。
402、 按先后順序分別為三個(gè)目標(biāo)票據(jù)圖像選擇作為主要標(biāo)識區(qū)域的局部圖 像,并提取該主要標(biāo)識區(qū)域內(nèi)標(biāo)志像素的特征信息,其選擇標(biāo)識類型為定位標(biāo) 識。特征信息的幾何參數(shù)示意如圖9所示。白點(diǎn)表示標(biāo)識圖像信息點(diǎn);深色點(diǎn) 表示背景信息點(diǎn);將主要標(biāo)識的信息加入到模板中。
根據(jù)本發(fā)明方法,本實(shí)施例中分別選擇圖6中的Al、圖7中的A2和圖8中 的A3三個(gè)區(qū)域的局部圖像,作為三個(gè)目標(biāo)票據(jù)圖像的主要標(biāo)識區(qū)域。
403、 按先后順序分別為前兩個(gè)目標(biāo)票據(jù)圖像選擇作為輔助標(biāo)識區(qū)域的局部 圖像,并提取該輔助標(biāo)識區(qū)域內(nèi)標(biāo)志像素的特征信息,其選擇標(biāo)識類型為定位 標(biāo)識。計(jì)算以主要標(biāo)識中心坐標(biāo)為參考點(diǎn)的輔助標(biāo)識中心坐標(biāo)偏移,同時(shí)將輔 助標(biāo)識的信息加入到模板中。
圖5中的Bl和圖7中的B2兩個(gè)區(qū)域的局部圖像作為目標(biāo)票據(jù)圖像l、目標(biāo) 票據(jù)圖像2的輔助標(biāo)識區(qū)域。
404、 將目標(biāo)圖像的基本信息、主要標(biāo)識區(qū)域的信息、以及主要標(biāo)識區(qū)域內(nèi) 的提取出的特征信息加入模板,構(gòu)成描述目標(biāo)圖像特征的完整模板信息,當(dāng)設(shè) 定了輔助標(biāo)識區(qū)域時(shí),還需要將輔助標(biāo)識區(qū)域信息以及其內(nèi)特取出的特征信息 加入才莫板。其中,基本信息設(shè)置如下對目標(biāo)票據(jù)圖像l設(shè)置Bw-1365; Bh=645; Bf=200;對目標(biāo)票據(jù)圖^f象2設(shè)置Bw=1368; Bh=643; Bf=200;對目標(biāo)票據(jù)圖像 3設(shè)置Bw^840; Bh=920; Bf=200。
405、 為模板信息記錄項(xiàng)添加票據(jù)圖像得名稱和檢索標(biāo)識代碼,并將該模板 記錄項(xiàng)保存于模板信息庫。
在本實(shí)施例中,對目標(biāo)票據(jù)圖像1添加票據(jù)圖像名稱為"方正奧德業(yè)務(wù)檔 案綜合管理系統(tǒng)轉(zhuǎn)賬支票測試樣張(壹),,和檢索標(biāo)識代碼為011001。對目標(biāo) 票據(jù)圖像2添加票據(jù)圖像目標(biāo)名稱為"方正奧德業(yè)務(wù)檔案綜合管理系統(tǒng)轉(zhuǎn)賬支票測試樣張(武)"和檢索標(biāo)識代碼為011002。對目標(biāo)票據(jù)圖像3添加票據(jù)圖像 目標(biāo)名稱為"中國工商銀行轉(zhuǎn)賬支票(京)"和^r索標(biāo)識代碼為011101。
406、 根據(jù)目標(biāo)圖像出現(xiàn)的頻率高低,從模板信息庫中為票據(jù)版面識別系統(tǒng) 選擇所需的目標(biāo)斗莫板。在票據(jù)類型目標(biāo)識別系統(tǒng),通過檢索,顯示相關(guān)業(yè)務(wù)票 據(jù)模板信息的列表。點(diǎn)擊票據(jù)模板記錄項(xiàng),可觀察對應(yīng)的目標(biāo)票據(jù)圖像和所選 擇標(biāo)識圖像。在本實(shí)施例中,為本系統(tǒng)選擇此前錄入的3個(gè)目標(biāo)票據(jù)圖像的模 板信息,并將其導(dǎo)入票據(jù)版面識別系統(tǒng)。
以上步驟就完成了對目標(biāo)圖像的準(zhǔn)備工作。
407、 將一個(gè)待識別票據(jù)圖像轉(zhuǎn)換為RGB的24位圖像并加載。
408、 根據(jù)當(dāng)前待識別票據(jù)圖像的分辨率Df與目標(biāo)模板基本信息分辨率Bf, 計(jì)算各標(biāo)識票據(jù)圖像和目標(biāo)票據(jù)圖像的縮放比值Fk=Df / Bf 。
例如當(dāng)前待識別圖像分辨率-300dpi;目標(biāo)才莫板基本信息分辨率-200dpi, Fk=300 / 200=1. 5。
409、 本實(shí)施例為定位標(biāo)識的識別問題,按如下公式順序計(jì)算與各模板基本 信息的相似指標(biāo)Xjw、 Xjh:
Xj> (Fk, Bw-Dw) /Dw; Xjh= ( Fk,Bh - Dh ) /Dh;
其中Bw、 Bh分別是目標(biāo)票據(jù)圖像模板信息中的寬度和高度;DW、 Dh分別是 待識別圖像的寬度和高度。設(shè)定判定指標(biāo)Ra =10%、 Rb=-10%。如果Rb<Xjw <Ra 并且Rb〈Xjh〈Ra判定該圖像符合該目標(biāo)的外形尺寸,轉(zhuǎn)向步驟411,否則重新選擇 一個(gè)目標(biāo)圖像,并執(zhí)行步驟410,當(dāng)待識別圖像與所有的目標(biāo)圖像都不符合外形 尺寸時(shí),判定結(jié)束,并給出沒有找到與待識別圖像匹配的目標(biāo)圖像的識別結(jié)果。
在本實(shí)施例中的外形尺寸都能夠相符。
410、 調(diào)用該模板主要標(biāo)識區(qū)域內(nèi)的標(biāo)志像素信息,在定位區(qū)域內(nèi)進(jìn)行粗略 識別的定位標(biāo)識特征信息的搜索與匹配,
本實(shí)施例中粗略識別中計(jì)算相似度的過程具體如下 (1 )設(shè)定粗略識別X、 Y平面的默認(rèn)搜索鄰域Rd=100。 Re=Rd* (Df / 200) =100* (300/200) =150。
根據(jù)主要標(biāo)識區(qū)域的信息中,主要標(biāo)識區(qū)域中心坐標(biāo)偏移P。、標(biāo)識區(qū)域參 數(shù)Reb、搜索區(qū)域參數(shù)Res計(jì)算搜索區(qū)域,由于Res是人工選擇的,按下面公式計(jì)算搜索過程中心坐標(biāo)的搜索區(qū)域Rezs:
Rezs. 1= (Pc. x-(Reb. 1-Res. 1) ) *Fk ;Rezs. r= ( Pc. x+(Res. r- Reb. r) ) *Fk ; Rezs. t= ( Pc. y- (Reb. t-Res. t) ) *Fk ;Rezs. b= ( Pc. y+ (Res. b- Reb. b) ) *Fk ; 設(shè)定R嚴(yán)2;那么粗略搜索過程X、 Y方向的增量如下 dsx=Rf*(Df/ 200)=2*(300/200)=3; dsy= dsx。
(2) 對定位標(biāo)識的待識別票據(jù)圖像,設(shè)定粗略識別最大搜索的偏斜角度 Ralf=l5,偏斜角度記為alfs。旋轉(zhuǎn)角度的搜索范圍是(-15 ~15)。設(shè)置搜索過 程旋轉(zhuǎn)角度的增量(U產(chǎn)2。
(3) 并在待識別圖像內(nèi)按X、 Y方向的增量,確定待識別區(qū)域;在偏斜角 度變化一個(gè)增量dsalf=2時(shí),將標(biāo)識區(qū)域中的標(biāo)志像素的坐標(biāo)按照偏斜角度旋轉(zhuǎn), 然后將待識別區(qū)域內(nèi)的像素逐個(gè)和變換后的區(qū)分級標(biāo)志像素比較,計(jì)算特征信 息相似度XSs。當(dāng)找到的待識別區(qū)域中計(jì)算出的最大相似度滿足XsJR。時(shí),返回 最大相似度Xsm當(dāng)前映射的旋轉(zhuǎn)角度alfjs和當(dāng)前搜索中心點(diǎn)坐標(biāo)P。s,并執(zhí)行 步驟411,如果按照所有偏斜角度將待識別圖像搜索完成后,還沒找到滿足 XSs,Re的相似度,則輸出目標(biāo)圖像與待識別圖像不匹配,并返回執(zhí)行步驟409。
411、設(shè)定精確識別X、 Y平面的搜索鄰域Rg、 Rh。 Rg=10, Rh = Rg*(Df/ 200)= Rg* (300 / 200) =15。根據(jù)粗略識別過程返回的旋轉(zhuǎn)角度alfjs和搜索中心點(diǎn)坐標(biāo) 按下面公式確定精確搜索過程中心坐標(biāo)的搜索區(qū)域Rezjs。 ReZjS. 1=PCS. x-Rh; ReZjS. r=Pcs. x+ Rh;
Rezjs. t=Pcs. y-Rh; Rezjs. b=Pcs. y+ Rh;
由于需要進(jìn)行精確識別,設(shè)置搜索過程X、 Y方向的增量和旋轉(zhuǎn)角度的增量 要比較小, 一般設(shè)定山,l; ds.iy=l。當(dāng)前映射的旋轉(zhuǎn)角度是alfjs,設(shè)定精確識 別最大搜索的偏斜角度Ralfj=5,旋轉(zhuǎn)角度的搜索范圍是(alf js-Ralfj ~ alf js+Ralfj ), 設(shè)置搜索過程旋轉(zhuǎn)角度的增量dsjalf=l。
偏斜角度按照旋轉(zhuǎn)角度的增量dsjalf=l變化,將標(biāo)識區(qū)域中的標(biāo)志像素的坐 標(biāo)按照偏斜角度進(jìn)行旋轉(zhuǎn)變換,在待識別圖像的待識別區(qū)域內(nèi)按X、 Y方向的增 量dsjx=l; dsjy =1,并計(jì)算待識別區(qū)域中特征信息和所有變換后的標(biāo)志像素的特 征信息的相似度Xsjs,當(dāng)找到最大相似度滿足Xs一〉L時(shí),退出搜索匹配過程, 返回最大相似程度指標(biāo)Xsjsm、當(dāng)前映射的旋轉(zhuǎn)角度a 1 f jzs和當(dāng)前搜索中心點(diǎn)坐標(biāo)P"。當(dāng)沒有找到滿足XSjjRe的最大相似度,并返回執(zhí)行步驟410 (按照410中 返回的當(dāng)前映射的旋轉(zhuǎn)角度和當(dāng)前搜索中心點(diǎn)坐標(biāo),繼續(xù)搜索),直到系統(tǒng)中的 所有模板信息全都被匹配比較完成。
判斷目標(biāo)圖像是否設(shè)定有輔助標(biāo)識區(qū)域,若沒有輔助標(biāo)識區(qū)域,則輸出所 述待識別圖像與當(dāng)前的目標(biāo)圖像相匹配。若設(shè)定有輔助標(biāo)識區(qū)域,根據(jù)精確識 別過程返回主要標(biāo)識的旋轉(zhuǎn)角度a 1 f jzs和搜索中心點(diǎn)坐標(biāo)P。s,按下面公式確定輔 助標(biāo)識區(qū)域搜索過程中心坐標(biāo)P。fs和搜索區(qū)域Refjs。
PCfS. x=Pcs. x + (Pcf. x *cos (alfjzs)+ Pcf. y *sin(alfjzs)) * Fk;
PCfS. y=Pcs. y + (Pc" x *sin(alfjzs)+ Pcf. y *cos (alf jzs)) * Fk;
RefjS. 1= PCfS- x- R" RefjS. r= PCfS. x+ R"
Refjs. t= Pcfs. y_ Rh; Refjs. b= Pcfs. y+ Rh;
其中P。f是輔助標(biāo)識與主要標(biāo)識中心坐標(biāo)的偏移。設(shè)置搜索過程X、 Y方向的 i曽量dsjx=l; dsjy =1。
按下面公式對輔助標(biāo)識的Nf個(gè)特征信息元素作初始旋轉(zhuǎn)映射變換
Tyi. x = (( Tfi. x+ Pcf. x ) *cos (alf jzs) + ( Tfi. y+ Pcf. y ) *sin (alf jzs)) * Fk - Pcfs. x;
Tyi. y = ( (Tfi. x+ Pcf. x ) *sin (alf jzs)+ ( Tfi. y+ Pcf. y ) *cos (alf jzs)) * Fk - Pcfs. y;
其中Tyi是第i個(gè)輔助標(biāo)識區(qū)域內(nèi)的特征信息元素Tn作初始旋轉(zhuǎn)映射變換 后的元素。經(jīng)變換后,設(shè)置旋轉(zhuǎn)映射變換的初始旋轉(zhuǎn)角度alfjs=0。最大搜索的 偏斜角度R"f產(chǎn)2,旋轉(zhuǎn)角度的搜索范圍是(-Ralfj~Ralfj),設(shè)置搜索過程旋轉(zhuǎn)角度 的增量dsw產(chǎn)l。
對輔助標(biāo)識區(qū)域中所有標(biāo)志像素的特征信息,當(dāng)偏斜角度變化一個(gè)旋轉(zhuǎn)角
度的增量d一產(chǎn)l時(shí),將輔助標(biāo)識區(qū)域中的標(biāo)志像素的坐標(biāo)按照偏斜角度進(jìn)行旋
轉(zhuǎn)變換,并計(jì)算變換后的標(biāo)志像素的特征信息和搜索區(qū)域內(nèi)像素的相似度XSjs。 如果如果找到最大相似度Xsjsm〉R。,返回最大相似程度指標(biāo)Xsjsra、當(dāng)前映射的旋 轉(zhuǎn)角度alfjfs和當(dāng)前搜索中心點(diǎn)坐標(biāo)P£fs,并輸出所述待識別圖像與當(dāng)前的目標(biāo) 圖像相匹配;如果沒有找到滿足Xs細(xì)〉Re的最大相似度,則輸出所述待識別圖像 與當(dāng)前的目標(biāo)圖像不匹配,并返回執(zhí)行步驟408,直到系統(tǒng)中的所有模板信息全 都4皮匹配比較完成。
上述粗略識別和精確識別過程都需要通過映射變換并計(jì)算相似度,該過程具體包括如下步驟
① 按下面公式,對N。個(gè)特征信息元素作旋轉(zhuǎn)映射變換。
Tyti. x = Tyi. x *cos(alf0)+ Tyi. y *sin(alf0);
Tyti. y = Tyi. x *sin(alf0)+ Tyi. y *cos(alf0); 其中N。是特征信息中參與搜索匹配的特征信息元素個(gè)數(shù),alf。是三維搜索 空間中一個(gè)離散點(diǎn)的旋轉(zhuǎn)角度。Tyti是第i個(gè)特征信息元素Tyi作旋轉(zhuǎn)映射變換 后的元素。
② 每作一次旋轉(zhuǎn)映射變換后,在三維搜索空間的X、 Y平面,順序作平移的 映射變換。
對于主要標(biāo)識按下面7>式計(jì)算
Tyyi. x = Tyti. x* Fk + Mx0;Tyyi. y = Tyti. y* Fk + My0; 對于輔助標(biāo)識按下面公式計(jì)算
Tyyi. x = Tyti. x + Mx0;Tyyi. y = Tyti. y + My0; 其中Mx。、 My。是三維搜索空間中旋轉(zhuǎn)角度,等于alf。的平面上一個(gè)離散點(diǎn)的 X和Y的坐標(biāo)。Tyyi是第i個(gè)特征信息元素Tyi作旋轉(zhuǎn)、平移映射變換后的元素。 ①、②兩步驟并不改變特征信息元素的光學(xué)參數(shù)。
③ 設(shè)定亮度偏差指標(biāo)Rm。 Rm取值范圍為大于5%小于等于20%。對第i個(gè)變換 后的特征信息元素,根據(jù)其幾何坐標(biāo)參數(shù),直接提取待識別圖像中對應(yīng)像素的
光學(xué)參數(shù)Dsi(第i個(gè)像素點(diǎn)的顏色值)、Dj第i個(gè)像素點(diǎn)的亮度值),如果Tyyi.S
(第i個(gè)特征信息元素的顏色值)等于Dsi并且(Tyyi. l-Du) / 255的絕對值小于 Rm,判定該特征信息元素相似,否則判定該特征信息元素不相似。^沒相似特征信 息元素計(jì)數(shù)變量Nx記錄判定特征信息元素相似的個(gè)數(shù)。對N。個(gè)特征信息元素判 定相似性,相似程度指標(biāo)Xss按下面公式求取Xss=Nx / N。。
按上述的流程步驟,通過粗略快速搜索和精確細(xì)致匹配實(shí)現(xiàn)對票據(jù)類型的 快速準(zhǔn)確識別。
本發(fā)明主要用于尋找相匹配的圖像,例如票據(jù)識別、印章識別等。 以上所述,僅為本發(fā)明的具體實(shí)施方式
,但本發(fā)明的保護(hù)范圍并不局限于 此,任何熟悉本技術(shù)領(lǐng)域的技術(shù)人員在本發(fā)明揭露的技術(shù)范圍內(nèi),可輕易想到 變化或替換,都應(yīng)涵蓋在本發(fā)明的保護(hù)范圍之內(nèi)。因此,本發(fā)明的保護(hù)范圍應(yīng)該以權(quán)利要求的保護(hù)范圍為準(zhǔn)。
權(quán)利要求
1、一種圖像識別方法,包括(1)獲取待識別圖像的信息;其特征在于還包括以下步驟(2)在模板信息庫中選擇目標(biāo)圖像,并將選中目標(biāo)圖像的模板信息導(dǎo)入識別系統(tǒng),所述模板信息至少包括目標(biāo)圖像中標(biāo)識區(qū)域的信息、以及標(biāo)識區(qū)域內(nèi)標(biāo)志像素的特征信息;(3)根據(jù)標(biāo)識區(qū)域的信息確定待識別圖像中的待識別區(qū)域;(4)在待識別區(qū)域中查找與標(biāo)識區(qū)域中標(biāo)志像素對應(yīng)的像素;計(jì)算查找到的像素的特征信息與標(biāo)識區(qū)域中標(biāo)志像素的特征信息的最大相似度;(5)判斷所述最大相似度是否在誤差范圍內(nèi),若在誤差范圍內(nèi),則所述待識別圖像與所述目標(biāo)圖像相匹配;否則所述待識別圖像與所述目標(biāo)圖像不匹配。
2、 根據(jù)權(quán)利要求1所述的圖像識別方法,其特征在于,所述目標(biāo)圖像的模 板信息按如下步驟提取獲取目標(biāo)圖像的寬度、高度和分辨率; 輸入標(biāo)識區(qū)域的信息;根據(jù)標(biāo)識區(qū)域的信息在所述目標(biāo)圖像中確定標(biāo)識區(qū)域; 獲取所述標(biāo)識區(qū)域內(nèi)標(biāo)志像素的特征信息,所述特征信息包括該像素的坐 標(biāo)、亮度和顏色;將圖像的寬度、高度和分辨率,標(biāo)識區(qū)域的信息,以及標(biāo)識區(qū)域內(nèi)標(biāo)志像 素的特征信息保存為模板信息,并為所述模板信息添加名稱和檢索碼。
3、 根據(jù)權(quán)利要求1所述的圖像識別方法,其特征在于,所述標(biāo)識區(qū)域的信 息包括主要標(biāo)識區(qū)域的信息和/或輔助標(biāo)識區(qū)域的信息。
4、 根據(jù)權(quán)利要求3所述的圖像識別方法,其特征在于,所述主要標(biāo)識區(qū)域 的信息至少包括主要標(biāo)識區(qū)域參數(shù)、中心偏移坐標(biāo)和搜索區(qū)域參數(shù),用于確定 主要標(biāo)識區(qū)域;所述輔助標(biāo)識區(qū)域的信息至少包括輔助標(biāo)識區(qū)域相對于主要標(biāo) 識區(qū)域的中心偏移坐標(biāo),以及輔助標(biāo)識區(qū)域參數(shù)、搜索區(qū)域參數(shù),用于確定輔 助標(biāo)識區(qū)i或。
5、 根據(jù)權(quán)利要求1所述的圖像識別方法,其特征在于,所述待識別圖像的 信息包括待識別圖像的分辨率,所述目標(biāo)圖像的模板信息包括目標(biāo)圖像的分辨率;所述步驟(2)之后還包括如下步驟按如下公式計(jì)算待識別圖像和目標(biāo)圖像的縮放比值Fk=Df/Bf,其中,Df 為待識別圖像的分辨率,Bf為目標(biāo)圖像的分辨率。
6、 根據(jù)權(quán)利要求1所述的圖像識別方法,其特征在于,所述待識別圖像的 信息包括待識別圖像的寬度和高度,所述目標(biāo)圖像的模板信息包括目標(biāo)圖像的 寬度和高度;若所述標(biāo)識區(qū)域?yàn)槎ㄎ粯?biāo)識,則所述步驟(2)之后還包括查找 與待識別圖像外形尺寸相符的目標(biāo)圖像,具體方法如下計(jì)算待識別圖像和目標(biāo)圖像的相似指標(biāo),公式為Xjw= (Fk*Bw-Dw) /Dw,X jh= ( Fk*Bh - Dh ) /Dh,其中,Bw為目標(biāo)圖像的寬度,Bh為目標(biāo)圖像的高度,Dw為待識別圖像的寬 度,Dh為待識別圖像的高度;判斷X;和Xjh是否在誤差范圍內(nèi),如果在誤差范圍內(nèi),則該目標(biāo)圖像的外 形尺寸與待識別圖像的外形尺寸相符;否則該目標(biāo)圖像的外形尺寸與待識別圖 像的外形尺寸不相符。
7、 根據(jù)權(quán)利要求1所述的圖像識別方法,其特征在于所述步驟(4)具體 包括設(shè)定偏轉(zhuǎn)角度范圍和偏轉(zhuǎn)角度的增量; 在偏轉(zhuǎn)角度范圍內(nèi),按照偏轉(zhuǎn)角度的增量確定偏轉(zhuǎn)角度; 將目標(biāo)圖像中標(biāo)識區(qū)域內(nèi)的標(biāo)志像素坐標(biāo)按照偏轉(zhuǎn)角度進(jìn)行變換; 在待識別區(qū)域中查找與變換后的標(biāo)志像素相對應(yīng)的像素; 計(jì)算查找到的像素的特征信息與標(biāo)識區(qū)域中標(biāo)志像素的特征信息的最大相 似度。
8、 一種圖像識別系統(tǒng),包括 圖像輸入模塊,用于導(dǎo)入待識別圖像的信息; 其特征在于還包括模板信息選擇模塊,用于在模板信息庫選擇目標(biāo)圖像,并讀取模板信息庫中目標(biāo)圖像的模板信息,所述模板信息包括目標(biāo)圖像中標(biāo)識區(qū)域的信息、以及標(biāo)識區(qū)域內(nèi)標(biāo)志像素的特征信息;掃描模塊,連接到圖像輸入模塊和模板信息選擇模塊,依據(jù)標(biāo)識區(qū)域的信 息在待識別圖像上確定待識別區(qū)域,在待識別區(qū)域中查找與標(biāo)識區(qū)域中標(biāo)志像 素對應(yīng)的像素;并計(jì)算查找到的像素的特征信息與標(biāo)識區(qū)域中標(biāo)志像素的特征 信息的最大相似度;判斷模塊,連接到掃描模塊,依據(jù)計(jì)算出的最大相似度,輸出所述待識別 圖像與所述目標(biāo)圖像相匹配;或者輸出所述待識別圖像與所述目標(biāo)圖像不匹配。
9、 根據(jù)權(quán)利要求8所述的圖像識別系統(tǒng),其特征在于,所述判斷模塊包括 存儲器,用于保存目標(biāo)圖像與待識別圖像匹配的相似度判定指標(biāo); 比較器,連接到掃描模塊和存儲器,用于比較計(jì)算出的最大相似度與存儲器中的相似度判定指標(biāo),若計(jì)算出的最大相似度大于相似度判定指標(biāo),則輸出 目標(biāo)圖像與待識別圖像匹配;否則輸出目標(biāo)圖像與待識別圖像不匹配。
10、 根據(jù)權(quán)利要求8所述的圖像識別系統(tǒng),其特征在于還包括 外形掃描模塊,連接到模板信息選擇模塊、圖像輸入模塊和掃描模塊,用于查找與待識別圖像外形尺寸相符的目標(biāo)圖像,并將所述目標(biāo)圖像的特征信息 傳送到掃描模塊。
全文摘要
本發(fā)明公開了一種圖像識別方法及系統(tǒng),涉及采用模式識別技術(shù)對靜態(tài)的目標(biāo)圖像進(jìn)行識別的方法及系統(tǒng)。解決了現(xiàn)有圖像識別技術(shù)中速度相對較慢問題。該圖像識別方法及系統(tǒng)將圖像的標(biāo)識區(qū)域信息和標(biāo)識區(qū)域內(nèi)的特征信息保存為模板信息,然后利用標(biāo)識區(qū)域確定待識別圖像中的待識別區(qū)域,然后比較標(biāo)識區(qū)域和待識別區(qū)域內(nèi)的特征信息,當(dāng)兩者的相似度在誤差范圍時(shí),認(rèn)為待識別圖像和目標(biāo)圖像相匹配,實(shí)現(xiàn)圖像識別,在識別過程中,只需要比較待識別區(qū)域的特征信息,數(shù)據(jù)量較少,并且不需要對特征信息進(jìn)行邏輯推理和數(shù)學(xué)運(yùn)算,從而加快了圖像識別速度。本發(fā)明主要用于尋找相匹配的圖像,例如票據(jù)識別、印章識別等。
文檔編號G06K9/32GK101464951SQ200710301950
公開日2009年6月24日 申請日期2007年12月21日 優(yōu)先權(quán)日2007年12月21日
發(fā)明者曾培祥 申請人:北大方正集團(tuán)有限公司;北京方正奧德計(jì)算機(jī)系統(tǒng)有限公司