專利名稱:字符識(shí)別方法
技術(shù)領(lǐng)域:
本發(fā)明涉及用于讀取圖像信息的方法。
背景技術(shù):
將圖像信息讀取至計(jì)算機(jī)的處理可以使用光學(xué)字符識(shí)別(在下文中
被稱為OCR)技術(shù)。OCR技術(shù)是一種根據(jù)圖像上呈現(xiàn)的形狀來(lái)檢測(cè)字符 并且輸出可以由計(jì)算機(jī)處理的文本代碼信息的技術(shù)。例如,OCR技術(shù)可 以被用于讀取報(bào)告。報(bào)告具有其上要寫入字符的預(yù)定區(qū)域。該區(qū)域由繪 制在報(bào)告上的框線來(lái)限定。OCR技術(shù)必須準(zhǔn)確地檢測(cè)出要寫入字符的所 述區(qū)域。為了準(zhǔn)確檢測(cè)要寫入字符的區(qū)域,有效的是,標(biāo)識(shí)框線的位置、 角、尺寸等。框線的位置例如可以基于作為預(yù)先保持的模板的報(bào)告圖像 數(shù)據(jù)的框線信息與從輸入的報(bào)告的圖像數(shù)據(jù)中獲取的框線信息之間的偏 移量來(lái)精確標(biāo)識(shí)。
報(bào)告的框線信息例如可以包括多個(gè)彩色信息片段或者包括多個(gè)密度 級(jí)(其將被稱為彩色報(bào)告)。在將OCR技術(shù)應(yīng)用于彩色報(bào)告時(shí),刪除讀 取的彩色報(bào)告圖像信息的預(yù)定彩色信息片段。從刪除了該彩色信息片段 之后的報(bào)告圖像數(shù)據(jù)中檢測(cè)文本信息。當(dāng)從彩色報(bào)告中刪除彩色信息片 段時(shí),報(bào)告圖像信息的部分框線信息也可能被刪除,或者可能殘留報(bào)告 圖像信息的部分不需要的噪聲信息。
通用霍夫變換(Generalized Hough Transform)可用作用于計(jì)算模板 圖像信息與輸入的圖像信息之間的偏移量的方法。通用霍夫變換保持作 為基準(zhǔn)圖像的具有復(fù)雜且不同的結(jié)構(gòu)的報(bào)告模板。通用霍夫變換針對(duì)諸 如平行、旋轉(zhuǎn)以及擴(kuò)展/收縮各變形參數(shù)限定投票空間(voting space)并 且通過(guò)針對(duì)各參數(shù)在投票空間進(jìn)行投票來(lái)估計(jì)輸入圖像的偏移量。通用 霍夫變換可以在輸入報(bào)告圖像是具有復(fù)雜結(jié)構(gòu)的報(bào)告圖像并且在框線中
具有噪聲和/或中斷的情況下,估計(jì)該輸入報(bào)告圖像與模板的報(bào)告圖像之
間的偏移量。在日本特開(kāi)專利公報(bào)10-27208和日本專利3756309中公開(kāi) 了涉及上述技術(shù)的技術(shù)。
然而,通用霍夫變換需要用于實(shí)現(xiàn)投票空間的巨大存儲(chǔ)器空間和用 于投票的大量處理時(shí)間。
發(fā)明內(nèi)容
根據(jù)一實(shí)施方式的一個(gè)方面,提供了一種從一區(qū)域中具有框架和多 個(gè)字符的圖像中識(shí)別出字符的方法,所述方法包括以下步驟區(qū)域劃分 步驟,該區(qū)域劃分步驟將所述區(qū)域分成分別具有多個(gè)局部圖像的多個(gè)局 部區(qū)域;模板圖像提供步驟,該模板圖像提供步驟提供具有基準(zhǔn)框架圖 像的模板圖像;圖像差別計(jì)算步驟,該圖像差別計(jì)算步驟分別計(jì)算所述 多個(gè)局部圖像與所述模板圖像的所述基準(zhǔn)框架圖像之間的差別;不重合 度計(jì)算步驟,該不重合度計(jì)算步驟基于所述多個(gè)局部圖像與所述基準(zhǔn)框 架圖像的所述差別的平均來(lái)計(jì)算所述圖像與所述模板圖像的不重合度; 以及字符識(shí)別步驟,該字符識(shí)別步驟修正所述不重合度,從而從所述圖 像中識(shí)別出所述多個(gè)字符。
圖1是圖像處理裝置1的硬件構(gòu)造圖2是從接收輸入圖像信息17到輸出修正圖像的處理的流程圖3是輸入圖像信息17的實(shí)施例;
圖4是二進(jìn)制化的模板圖像信息18的圖像;
圖5是Sobel的水平邊緣過(guò)濾器的設(shè)置值21-1;
圖6是Sobel的垂直邊緣過(guò)濾器的設(shè)置值21-2;
圖7是將輸入圖像信息17分成多個(gè)局部圖像區(qū)所得的圖8是用于應(yīng)用Bucket方法的說(shuō)明圖9是模板圖像信息18的局部圖像區(qū);
圖10是比較矢量190的實(shí)施例;
圖11是投票處理的流程圖12是投票空間的構(gòu)造實(shí)施例;
圖13是投票處理的原理圖14是用于計(jì)算與各像素相對(duì)應(yīng)的偏移參數(shù)的說(shuō)明圖15是示出了輸入圖像信息17的局部區(qū)域55的圖。
具體實(shí)施例方式
圖1是圖像處理裝置1的硬件構(gòu)造圖。
圖像處理裝置1包括連接至 總線107的控制模塊101、存儲(chǔ)器102、輸入模塊103、存儲(chǔ)模塊104以 及輸出模塊105。
控制模塊101控制整個(gè)圖像處理裝置1。例如,控制模塊101可以 是中央處理單元(CPU)??刂颇K101執(zhí)行在存儲(chǔ)器102中展開(kāi)的圖像 處理程序108。圖像處理程序108使控制模塊101充任輪廓點(diǎn)集創(chuàng)建模塊、 局部圖像投票模塊、參數(shù)窄化模塊、局部圖像粘貼模塊等。控制模塊101 具有這樣的功能在輸入圖像信息17為報(bào)告的情況下,將呈現(xiàn)在報(bào)告上 的字符串圖像(stringimage)轉(zhuǎn)換成計(jì)算機(jī)可以處理的文本代碼信息。
存儲(chǔ)器102是要展開(kāi)存儲(chǔ)在存儲(chǔ)模塊104中的圖像處理程序108的 存儲(chǔ)區(qū)。存儲(chǔ)器102是存儲(chǔ)控制模塊101執(zhí)行圖像處理程序108時(shí)產(chǎn)生 的各種操作結(jié)果的存儲(chǔ)區(qū)。存儲(chǔ)器102可以是隨機(jī)存儲(chǔ)存儲(chǔ)器(RAM)。
輸入模塊103接收與用戶要指定給控制模塊101的各種命令或圖像 有關(guān)的信息。輸入模塊103可以是鍵盤、鼠標(biāo)器或觸摸板。輸入模塊103 例如可以是圖像掃描器。存儲(chǔ)模塊104例如可以是硬盤驅(qū)動(dòng)器。存儲(chǔ)模 塊104可以存儲(chǔ)圖像處理程序108、作為基準(zhǔn)報(bào)告圖像的基準(zhǔn)圖像信息(其 在下文中將被稱為模板圖像信息)18、輸入圖像信息17等。輸出模塊105 輸出圖像處理的結(jié)果信息。輸出模塊105例如可以是顯示器(顯示裝置)。
輪廓點(diǎn)集創(chuàng)建模塊提取來(lái)自輸入圖像信息17的圖像內(nèi)呈現(xiàn)的形狀 的輪廓。輪廓點(diǎn)集創(chuàng)建模塊創(chuàng)建構(gòu)成輸入圖像信息17中包含的框線信息 的輪廓(筆劃)的點(diǎn)集(輸入圖像輪廓點(diǎn)集)。框線用于限定報(bào)告內(nèi)的文 本的輸入?yún)^(qū)域,或者更清楚地示出報(bào)告的特征。輪廓點(diǎn)集創(chuàng)建模塊可以預(yù)先標(biāo)識(shí)模板圖像信息18中包含的輪廓的點(diǎn)集(模板輪廓點(diǎn)集)。例如, 輪廓點(diǎn)集創(chuàng)建模塊在登記模板圖像信息18時(shí)限定模板輪廓點(diǎn)集。輪廓點(diǎn) 集創(chuàng)建模塊將限定的模板輪廓點(diǎn)集存儲(chǔ)到存儲(chǔ)模塊104中。輪廓點(diǎn)集創(chuàng) 建模塊獲取與將輸入圖像信息17分成格子圖案所得的各局部圖像相對(duì)應(yīng) 的輸入圖像輪廓點(diǎn)集和模板輪廓點(diǎn)集。
局部圖像投票模塊使用與將輸入圖像信息17分成格子圖案所得的 各局部圖像相對(duì)應(yīng)的模板輪廓點(diǎn)集和輸入圖像輪廓點(diǎn)集,基于通用霍夫 變換的原理,在示出偏移參數(shù)的投票空間投票。作為通過(guò)局部圖像投票 模塊投票的結(jié)果,投票空間內(nèi)具有較高的投票頻率的區(qū)域可以是偏移參 數(shù)的估計(jì)值。
參數(shù)窄化模塊按步進(jìn)方式將通用霍夫變換的操作參數(shù)(分辨率)從 低分辨率切換成高分辨率。如果目標(biāo)精度是第二小數(shù)位,則該操作參數(shù) 是第一小數(shù)位的值。在獲取了第一小數(shù)位的候選之后,將該操作參數(shù)假 定為第一小數(shù)位的值。通過(guò)重復(fù)這個(gè)處理,計(jì)算出具有目標(biāo)精度的偏移 參數(shù)。參數(shù)窄化模塊允許逐步窄化偏移參數(shù)的候選,同時(shí)抑制輪廓點(diǎn)數(shù) 量和/或表示偏移參數(shù)的投票空間的尺寸的大量增加。
局部圖像粘貼模塊在根據(jù)將圖像分成格子圖案所得的區(qū)域計(jì)算出的 偏移參數(shù)中提取具有較高可靠性的偏移參數(shù)。局部圖像粘貼模塊通過(guò)內(nèi) 插局部圖像區(qū)的偏移參數(shù)來(lái)計(jì)算針對(duì)輸入圖像信息17內(nèi)各像素的偏移參 數(shù)。結(jié)果,即使在局部圖像區(qū)之間偏移參數(shù)不同的情況下,局部圖像粘 貼模塊也可以平滑地粘貼局部圖像區(qū)。局部圖像粘貼模塊輸出利用與輸 入圖像信息17內(nèi)的像素相對(duì)應(yīng)的偏移參數(shù)進(jìn)行位置修正所得的修正圖 像。
接下來(lái),對(duì)根據(jù)這種實(shí)施方式的從接收輸入圖像信息17到輸出修正 圖像的處理進(jìn)行說(shuō)明。圖2是從接收輸入圖像信息17到輸出修正圖像的 處理的流程圖??刂颇K101根據(jù)輸入圖像信息17創(chuàng)建輪廓點(diǎn)集(S01)。 控制模塊101將輸入圖像信息17分成多個(gè)局部圖像區(qū)(S02)??刂颇K 101采用預(yù)定尺寸的矩形將輸入圖像信息17劃分成格子圖案。劃分出的 矩形被稱為局部圖像區(qū)??刂颇K101對(duì)各局部圖像區(qū)執(zhí)行通用霍夫變 換而執(zhí)行投票處理(S03)。當(dāng)在S03中執(zhí)行通用霍夫變換時(shí),控制模塊 101執(zhí)行窄化投票處理的操作參數(shù)的處理(S04)??刂颇K101在S03 中執(zhí)行對(duì)局部圖像的投票處理,直到獲取了針對(duì)所有局部圖像區(qū)的投票 結(jié)果為止(S05:否)。如果獲取了針對(duì)所有局部圖像區(qū)的投票結(jié)果(S05: 是),則控制模塊101執(zhí)行粘貼局部圖像的處理(S06)。下面,對(duì)這些步 驟進(jìn)行詳細(xì)說(shuō)明。
這種實(shí)施方式的輸入圖像信息17可以是黑白色二值報(bào)告、彩色報(bào)告 或灰度級(jí)報(bào)告。圖3是輸入圖像信息17的實(shí)施例。輸入圖像信息17具 有框線信息173-1、框線信息173-2以及文本信息172??蚓€信息173-1 是要輸入特征的框架??蚓€信息173-2是澄清報(bào)告的特征同時(shí)不是直接寫 入特征的區(qū)域的框架。圖像處理裝置1獲取準(zhǔn)確地定位框線信息173-1 以便高精度地檢測(cè)文本信息172的修正圖像。為了獲取修正圖像,圖像 處理裝置1將框線信息173-1和框線信息173-2與模板圖像信息相對(duì)準(zhǔn)。 框線信息173-1、 173-4以及173-5是輸入圖像信息17的框架中的有色框 架。
控制模塊101執(zhí)行針對(duì)輸入圖像信息17的退出(dropout)處理。該 退出處理是將預(yù)先打印在報(bào)告上的線和/或文本的色彩中的特定顏色(退 出顏色)中的一部分限定為在隨后的圖像處理中不處理的圖形信息的處理。
接下來(lái),對(duì)SOl中的輪廓點(diǎn)集創(chuàng)建處理進(jìn)行說(shuō)明。根據(jù)這種實(shí)施方 式,輪廓點(diǎn)集創(chuàng)建模塊針對(duì)色彩和灰度級(jí)報(bào)告執(zhí)行根據(jù)Niblack方法對(duì)輸 入圖像進(jìn)行二值化的處理。該Niback方法是局部二值化處理方法。 Niblack方法是這樣的二值化方法其限定與對(duì)象像素(subject pixel)有 關(guān)的周圍信息(如每一條邊都具有等于5個(gè)像素的長(zhǎng)度的矩形和每一條 邊都具有7個(gè)像素的矩形)并且獲取針對(duì)各像素的閾值。首先,將矩形 過(guò)濾器限定為背景分離處理。根據(jù)矩形過(guò)濾器內(nèi)的密度分散值確定背景 部分或信息部分。接著,限定用于與背景分離的閾值(omin),并且如果 該過(guò)濾器內(nèi)的計(jì)算結(jié)果等于或高于cimin,則確定存在信息。如果密度分 散值等于或高于閾值(cnnin),則獲取聚焦像素k的密度的閾值,并且確
定白色像素或黑色像素。在隨后處理中,黑色像素是要被操作的像素。 黑色像素可以被包括在框線的邊緣線或文本信息中。輪廓點(diǎn)集創(chuàng)建模塊 在轉(zhuǎn)換后的二值圖形信息內(nèi)創(chuàng)建筆劃的輪廓點(diǎn)集。
圖4示出了模板圖像信息18。該模板圖像信息18是對(duì)報(bào)告進(jìn)行二 值化所得的圖像。模板圖像信息18是報(bào)告的框線的形狀的基準(zhǔn)??蚓€的 形狀例如根據(jù)相對(duì)于基準(zhǔn)點(diǎn)的距離、角度、框線的擴(kuò)展/收縮的尺寸以及 框線的擴(kuò)展/收縮方向來(lái)標(biāo)識(shí)。在該報(bào)告的情況下,可以標(biāo)識(shí)輸入特征的 位置。在模板圖像信息18的文本要輸入的區(qū)域的坐標(biāo)信息已知的情況下, 當(dāng)裝置執(zhí)行讀取文本數(shù)據(jù)的處理時(shí),容易檢測(cè)文本形狀信息。因此,可 以通過(guò)將根據(jù)框線的位置旋轉(zhuǎn)角、擴(kuò)展/收縮等所得的形狀與模板圖像信 息18的框線的形狀相匹配而高精度地讀出輸入圖像信息17的框線內(nèi)的 字符串。
下面是為應(yīng)用Niblack而使用的設(shè)置值的實(shí)施例。經(jīng)受局部Niblack 的窗口的一邊的長(zhǎng)度是"5"。 Niblack的設(shè)置值在此為"-0.1"。通過(guò)將平 均密度差閾值添加至將聚焦像素k的密度乘以標(biāo)準(zhǔn)偏差所得的值來(lái)計(jì)算 該設(shè)置值。平均密度差閾值在此為"8.0"。平均邊緣強(qiáng)度閾值在此為"8.0"。 邊緣數(shù)閾值為"6"。
這里,對(duì)用于S02中的輪廓點(diǎn)集創(chuàng)建處理的另一方法進(jìn)行說(shuō)明。輪 廓點(diǎn)集創(chuàng)建模塊通過(guò)Sobd邊緣過(guò)濾器從具有顏色/陰影像素值的輸入圖 像信息17中提取輪廓點(diǎn)集。輪廓點(diǎn)集創(chuàng)建模塊創(chuàng)建構(gòu)成所提取的輸入圖 像信息17的框線的像素集。
輪廓點(diǎn)集創(chuàng)建模塊利用Sobel邊緣過(guò)濾器在圖像上執(zhí)行區(qū)域劃分。 該區(qū)域劃分是獲取不是輸入圖像信息17內(nèi)的背景的筆劃的像素的處理。 輪廓點(diǎn)集創(chuàng)建模塊通過(guò)比較針對(duì)像素檢測(cè)出的邊緣的值與預(yù)定閾值來(lái)確 定聚焦像素是否為背景像素。圖5是Sobel水平邊緣過(guò)濾器的設(shè)置值21-1 。 圖6是針對(duì)Sobel垂直邊緣過(guò)濾器的設(shè)置值21-2。輪廓點(diǎn)集創(chuàng)建模塊計(jì)算 輸入圖像信息17的各像素的邊緣值。例如,輪廓點(diǎn)集創(chuàng)建模塊可以限定 邊緣值,以使其成為整合成255或以下的值。例如,在將密度閾值預(yù)先 設(shè)置成25的情況下,如果該邊緣值小于25,則輪廓點(diǎn)集創(chuàng)建模塊確定該聚焦像素是黑色像素。
邊緣值可以根據(jù)報(bào)告來(lái)設(shè)置。例如,對(duì)于彩色報(bào)告中的背景顏色與 提取的文本顏色之間存在較小色差的情況下來(lái)說(shuō),該邊緣值必須被設(shè)置 得較低。另一方面,如果背景顏色與要提取的文本顏色之間存在較大色
差,則即使將邊緣值設(shè)置得較高也可進(jìn)行提取。這里,水平分量值是H, 而垂直分量值是V。輪廓點(diǎn)集創(chuàng)建模塊根據(jù)下面的等式(等式1)計(jì)算邊 緣值。
<formula>complex formula see original document page 10</formula>(等式l)
對(duì)于圖像處理的對(duì)象是報(bào)告圖像的情況來(lái)說(shuō),水平分量的邊緣分量 和垂直分量的邊緣分量可以是通用霍夫變換處理的對(duì)象。這是因?yàn)榕c一 般報(bào)告相比,報(bào)告圖像的框架或文本的形狀具有更多的縱向(垂直)線 段或橫向(水平)線段。通用霍夫變換考慮了黑色像素的方向分量。因 此,對(duì)于報(bào)告圖像的情況來(lái)說(shuō),輪廓點(diǎn)集創(chuàng)建模塊根據(jù)獲取的各種邊緣 分量的方向分量提取水平分量的邊緣分量和垂直分量的邊緣分量。另選 的是,輪廓點(diǎn)集創(chuàng)建模塊可構(gòu)造成將獲取的各種邊緣分量的方向分量分 類成水平分量的邊緣分量和垂直分量的邊緣分量。這種構(gòu)造因?yàn)樵谕ㄓ?霍夫變換中縮減了要比較的元素?cái)?shù),所以可以縮減為了局部圖像投票模 塊計(jì)算偏移參數(shù)所需的時(shí)間。
對(duì)于報(bào)告圖像是對(duì)象的情況來(lái)說(shuō),僅僅水平分量的邊緣分量可以是 通用霍夫變換的對(duì)象,或者僅僅垂直分量的邊緣分量可以是通用霍夫變 換的對(duì)象。在這種情況下,輪廓點(diǎn)集創(chuàng)建模塊將根據(jù)通用霍夫變換計(jì)算 偏移參數(shù)的處理應(yīng)用至水平分量和垂直分量中的任一個(gè)。這種構(gòu)造因?yàn)?可以更多地減少通用霍夫變換中要比較的元素?cái)?shù),所以可以縮減局部圖 像投票模塊計(jì)算偏移參數(shù)所需的時(shí)間。輪廓點(diǎn)集創(chuàng)建模塊可以處理具有 更多像素的方向分量,作為根據(jù)通用霍夫變換計(jì)算偏移參數(shù)的處理的對(duì) 象。
接下來(lái),對(duì)將輸入圖像信息17分成局部圖像區(qū)的處理進(jìn)行說(shuō)明。 局部圖像投票模塊將輸入圖像信息17劃分為格子圖案。預(yù)先限定了 劃分為格子圖案的范圍。要?jiǎng)澐值姆秶Q于報(bào)告的格式。按包括報(bào)告的圖像內(nèi)的獨(dú)特元素單位的方式來(lái)劃分該范圍。因?yàn)榫?xì)地劃分報(bào)告可 以縮減針對(duì)一個(gè)范圍的投票處理的次數(shù),所以可以有利地縮減局部圖像 投票模塊計(jì)算的量。另一方面,精細(xì)劃分報(bào)告所得的范圍不具有不利地 縮減局部圖像投票模塊的處理結(jié)果的可靠性的任何圖形特征。因此,將 覆蓋報(bào)告內(nèi)特征部分的區(qū)域限定為所述范圍。
圖7是將輸入圖像信息17分成多個(gè)局部圖像區(qū)的圖。標(biāo)號(hào)176指劃 分輸入圖像信息17的線。根據(jù)這種實(shí)施方式,線176將輸入圖像信息17 分成格子圖案。例如,當(dāng)將具有連續(xù)格子形狀的表分成多個(gè)范圍時(shí),在 格子的每一個(gè)交點(diǎn)處出現(xiàn)偏移參數(shù)的峰值。可以通過(guò)將整個(gè)表限定為所 述范圍來(lái)防止通用霍夫變換中出現(xiàn)的偽峰值。在圖7中,局部圖像投票 模塊將輸入圖像信息17分成水平3個(gè)乘以垂直3個(gè)共9個(gè)局部圖像區(qū) 170。
接下來(lái),對(duì)S03中對(duì)局部圖像進(jìn)行投票的處理進(jìn)行說(shuō)明。局部圖像 投票模塊根據(jù)與各局部圖像區(qū)相對(duì)應(yīng)的模板輪廓點(diǎn)集和輸入圖像輪廓點(diǎn) 集計(jì)算偏移參數(shù)。局部圖像投票模塊根據(jù)通用霍夫變換的原理計(jì)算偏移 參數(shù)。通用霍夫變換對(duì)表示偏移參數(shù)的投票空間進(jìn)行投票。通用霍夫變 換根據(jù)投票空間中的具有高投票頻率的局部圖像區(qū)的參數(shù)輸出針對(duì)該參 數(shù)的估計(jì)值。
局部圖像投票模塊根據(jù)Bucket方法來(lái)限定投票空間。Bucket方法是 計(jì)算機(jī)科學(xué)的一種方法。Bucket方法將具有空間范圍的對(duì)象分成多個(gè)較 小區(qū)域。因?yàn)榭梢詫⑼ㄓ没舴蜃儞Q應(yīng)用至每一個(gè)局部圖像區(qū),所以應(yīng)用 Bucket方法可以增加處理的速度。
圖8示出了針對(duì)應(yīng)用Bucekt方法的說(shuō)明圖。局部圖像投票模塊還劃 分輸入圖像信息17的在S02中劃分為格子圖案所得的局部圖像區(qū)170。 標(biāo)號(hào)175指劃分局部圖像區(qū)170的格子線。預(yù)先限定了劃分用格子線之 間的距離。例如,限定了偏移的最大量,其例如被希望為出現(xiàn)在圖像掃 描儀裝置中。對(duì)于圖像掃描儀中出現(xiàn)的偏移量為lcm的情況來(lái)說(shuō),局部 圖像投票模塊按各自等于1 cm的多個(gè)間隔創(chuàng)建紙質(zhì)報(bào)告的格子線。標(biāo)號(hào) 183指模板圖像信息18的與輸入圖像信息17的局部圖像區(qū)170相對(duì)應(yīng)的
區(qū)域。局部圖像投票模塊處理區(qū)域183中被格子線175包圍的區(qū)域,作 為模板圖像信息18的局部圖像區(qū)180。
局部圖像投票模塊通過(guò)將通用霍夫變換的原理應(yīng)用至各局部圖像區(qū) 來(lái)計(jì)算偏移參數(shù)。局部圖像投票模塊使用模板輪廓點(diǎn)集和輸入圖像輪廓 點(diǎn)集,來(lái)將允許投票空間中的最大得票數(shù)的參數(shù)估計(jì)為偏移參數(shù)。通用 霍夫變換是霍夫變換的應(yīng)用。霍夫變換是將初始(x、 y)坐標(biāo)系統(tǒng)變換 成(R、 e)極坐標(biāo)系統(tǒng)并且基于極坐標(biāo)系統(tǒng)檢測(cè)直線的形狀的方法。不 僅對(duì)于直線來(lái)說(shuō),而且對(duì)于采用任意形式的圖形來(lái)說(shuō),通用霍夫變換都 可以提取平行移動(dòng)/旋轉(zhuǎn)/擴(kuò)展或收縮等的參數(shù)。根據(jù)這種實(shí)施方式,通過(guò) 通用霍夫變換計(jì)算出的參數(shù)是報(bào)告的偏移參數(shù)。通用霍夫變換對(duì)模板輪 廓點(diǎn)集與輸入圖像輪廓點(diǎn)集之間的坐標(biāo)差進(jìn)行投票并且將最多投票參數(shù) 處理為要獲取的參數(shù)。因?yàn)橥ㄓ没舴蜃儞Q輪詢(poll)具有最大得票數(shù)的 參數(shù),所以即使對(duì)象圖像具有噪聲或中斷,該檢測(cè)也會(huì)具有高精度。
對(duì)根據(jù)這種實(shí)施方式的通用霍夫變換的處理進(jìn)行說(shuō)明。局部圖像投 票模塊根據(jù)下面的處理對(duì)表示偏移參數(shù)的投票空間進(jìn)行投票。
局部圖像投票模塊限定從模板圖像信息18的局部圖像區(qū)內(nèi)的基準(zhǔn) 點(diǎn)和模板圖像信息18中的基準(zhǔn)點(diǎn)起到局部圖像區(qū)180上的各黑色像素的 矢量。圖9示出了模板圖像信息18的局部圖像區(qū)。標(biāo)號(hào)180指模板圖像 信息18的局部圖像區(qū)。標(biāo)號(hào)181指周部圖像區(qū)180內(nèi)的基準(zhǔn)點(diǎn)?;鶞?zhǔn)點(diǎn) 181被預(yù)先限定。標(biāo)號(hào)182指局部圖像區(qū)180內(nèi)的模板輪廓點(diǎn)集。
局部圖像投票模塊限定比較矢量,其是相對(duì)基準(zhǔn)點(diǎn)181對(duì)稱的矢量。 圖10是比較矢量的實(shí)施例。標(biāo)號(hào)191是比較矢量190與局部圖像區(qū)180 之間的對(duì)稱中心。中心191對(duì)應(yīng)于基準(zhǔn)點(diǎn)181。標(biāo)號(hào)192指針對(duì)比較矢量 190的模板輪廓點(diǎn)集。比較矢量190和模板輪廓點(diǎn)集182針對(duì)一點(diǎn)相對(duì)稱。 因此,對(duì)于作為比較矢量的對(duì)象的中心191是上述模板輪廓點(diǎn)集182的 情況來(lái)說(shuō),模板輪廓點(diǎn)集192始終經(jīng)過(guò)基準(zhǔn)點(diǎn)181。值得注意的是,通用 霍夫變換不僅可以考慮像素的交疊,而且可以考慮像素的方向矢量的交 疊。增加針對(duì)通用霍夫變換的參數(shù)的數(shù)量可以增加計(jì)算偏移量的精度, 然而,這導(dǎo)致了大量的計(jì)算。因此,根據(jù)圖像處理裝置1的硬件的處理能力限定參數(shù)的維度。
局部圖像投票模塊根據(jù)下面的處理來(lái)執(zhí)行投票處理。圖11是投票處 理的流程圖。局部圖像投票模塊創(chuàng)建投票空間(Sll)。投票空間是多維 空間。
圖12是投票空間的構(gòu)造實(shí)施例。標(biāo)號(hào)30指投票空間的數(shù)據(jù)構(gòu)造圖。 標(biāo)號(hào)30-1到30-7是存儲(chǔ)針對(duì)水平軸向位置32和垂直軸向位置33的得票 數(shù)的區(qū)域。區(qū)域30-1到30-7是在比較矢量190的角旋轉(zhuǎn)一度的情況下的 區(qū)域。另外,該空間基于線性擴(kuò)展/收縮的比例和/或線性擴(kuò)展/收縮的方向 增加。標(biāo)號(hào)31指用于存儲(chǔ)針對(duì)各參數(shù)創(chuàng)建的得票數(shù)的區(qū)域。
局部圖像投票模塊基于諸如水平軸向位置、垂直軸向位置、旋轉(zhuǎn)角、 線性擴(kuò)展/收縮的比例和線性擴(kuò)展/收縮的方向以及參數(shù)的精度的參數(shù)類 型來(lái)確定投票空間的尺寸(S12)。
接下來(lái),局部圖像投票模塊通過(guò)下面的步驟確定要投票的對(duì)象并且 在投票空間中對(duì)其進(jìn)行投票(S13)。值得注意的是,通用霍夫變換可以 考慮輪廓線的方向矢量。為簡(jiǎn)化說(shuō)明,在這種實(shí)施方式的描述中省略了 針對(duì)輪廓線的方向矢量的描述。
圖13是投票處理的原理圖。標(biāo)號(hào)170指輸入圖像信息17的局部圖 像區(qū)。標(biāo)號(hào)171指局部圖像區(qū)170的基準(zhǔn)點(diǎn)。在此假定基準(zhǔn)點(diǎn)171相對(duì) 模板圖像信息18的周部圖像區(qū)180中的基準(zhǔn)點(diǎn)180偏移橫向x、縱向y 以及旋轉(zhuǎn)角e。
局部圖像投票模塊基于當(dāng)前旋轉(zhuǎn)角的參數(shù)來(lái)識(shí)別比較矢量190的旋 轉(zhuǎn)方向。局部圖像投票模塊在輸入圖像信息17的局部圖像區(qū)170的位置 上設(shè)置作為旋轉(zhuǎn)比較矢量190的對(duì)象的、基于所述參數(shù)標(biāo)識(shí)其水平軸向 和垂直軸向的中心。局部圖像投票模塊針對(duì)局部圖像區(qū)170內(nèi)的、比較 矢量l卯與模板輪廓點(diǎn)集192交疊的輸入圖像輪廓點(diǎn)集173-1和173-2的 水平軸向位置和垂直軸向位置進(jìn)行投票。對(duì)于水平x、垂直y以及旋轉(zhuǎn)角 6的參數(shù)值表示偏移量,并且對(duì)象中心191被設(shè)置在輸入圖像輪廓點(diǎn)集 173-1和173-2上的情況來(lái)說(shuō),模板輪廓點(diǎn)集192始終經(jīng)過(guò)基準(zhǔn)點(diǎn)171。 局部圖像投票模塊可以獲取可以作為具有特定參數(shù)的最大值的基準(zhǔn)點(diǎn)。
局部圖像投票模塊執(zhí)行針對(duì)局部圖像區(qū)170內(nèi)的所有像素的投票處 理。局部圖像投票模塊還可以僅在局部圖像區(qū)170的黑色像素上限定比 較矢量190的對(duì)象中心191。通過(guò)僅在局部圖像區(qū)170的黑色像素上執(zhí)行 投票處理,與在局部圖像區(qū)170的所有像素上執(zhí)行投票處理的操作量相 比,可以更有利地減少投票所需的操作量。
對(duì)于要計(jì)算偏移參數(shù)的對(duì)象是報(bào)告的情況來(lái)說(shuō),輸入圖像信息17與 模板圖像信息18之間的平行移動(dòng)的值(x、 y)和旋轉(zhuǎn)角的值(e)處于 限制范圍內(nèi)。因此,根據(jù)這種實(shí)施方式的通用霍夫變換利用針對(duì)限制旋 轉(zhuǎn)角的每一個(gè)值e的一對(duì)值(x、 y)進(jìn)行投票,并將得票最多的旋轉(zhuǎn)角 的值e和平行移動(dòng)的值(x、 y)的組合作為偏移參數(shù)的計(jì)算結(jié)果。
在對(duì)所有預(yù)置參數(shù)的組合執(zhí)行完投票處理之前(S14:否),局部圖 像投票模塊重復(fù)S12和S13中的處理。在局部圖像投票模塊對(duì)所有預(yù)置 參數(shù)的組合執(zhí)行了投票處理之后(S14:是),局部圖像投票模塊根據(jù)獲 取的投票空間的分布圖檢測(cè)最大參數(shù)。該最大參數(shù)被估計(jì)為模板圖像信 息18的局部圖像區(qū)180與輸入圖像信息17的局部圖像區(qū)之間的仿射變 換(Affme transformation)矩陣。該仿射變換矩陣可以是偏移參數(shù)。
在這種實(shí)施方式中使用的輸入圖像信息17等同于利用偏移參數(shù)對(duì) 模板圖像信息18進(jìn)行仿射變換的結(jié)果。仿射變換是諸如平行移動(dòng)和旋轉(zhuǎn) 的線性變換。因此,可以通過(guò)利用偏移參數(shù)對(duì)輸入圖像信息17執(zhí)行逆變 換來(lái)創(chuàng)建修正偏移所得的修正圖像。
局部圖像投票模塊獲取水平軸行程Tx、垂直軸行程Ty以及旋轉(zhuǎn)角0, 作為偏移參數(shù)。局部圖像投票模塊在針對(duì)線性擴(kuò)展/收縮的比例和線性擴(kuò) 展/收縮的方向執(zhí)行投票處理時(shí)獲取線性擴(kuò)展/收縮的比例和線性擴(kuò)展/收 縮的方向的參數(shù)。偏移參數(shù)是仿射變換矩陣,并且輸入圖像信息和模板 報(bào)告圖像具有線性映射的關(guān)系。變換等式由下面的等式(等式2)來(lái)表示。
<formula>complex formula see original document page 14</formula>
等式2中的值(x、 y)是變換之前的坐標(biāo)。根據(jù)這種實(shí)施方式,它 們是模板圖像信息18中的像素的坐標(biāo)。值(x', y')是變換之后的坐標(biāo)。 根據(jù)這種實(shí)施方式,它們是輸入圖像信息17中的像素的坐標(biāo)。符號(hào)Tx、Ty以及e是仿射變換矩陣。
根據(jù)(等式2)得出用于根據(jù)輸入圖像信息17獲取修正圖像信息的
等式(等式3)。
<formula>complex formula see original document page 15</formula>
(等式3)的值(x", y")是修正圖像中的像素的坐標(biāo)。
接下來(lái),對(duì)S04中的參數(shù)窄化處理進(jìn)行說(shuō)明。為了縮減圖像處理所 需計(jì)算量,這種實(shí)施方式執(zhí)行具有多分辨率的多級(jí)處理。根據(jù)這種實(shí)施 方式的要通過(guò)通用霍夫變換獲取的圖像信息的偏移參數(shù)是水平和垂直平 行移動(dòng)的偏移、旋轉(zhuǎn)移動(dòng)的偏移和線性擴(kuò)展/收縮的方向、線性擴(kuò)展/收縮 的比例等。通用霍夫變換需要存儲(chǔ)針對(duì)每一個(gè)具有目標(biāo)精度的參數(shù)的投 票結(jié)果的存儲(chǔ)器區(qū)。投票空間的尺寸按數(shù)量等于參數(shù)的類型數(shù)量的乘數(shù) 級(jí)增加。因此,從一開(kāi)始就執(zhí)行用于獲取具有目標(biāo)精度的三維參數(shù)的操 作會(huì)導(dǎo)致圖像處理需要的大量處理時(shí)間和用于存儲(chǔ)三維參數(shù)的大量存儲(chǔ) 器空間。
因此,參數(shù)窄化模塊執(zhí)行首先獲取偏移參數(shù)的粗略估計(jì)值接著精確 獲取圍繞粗略估計(jì)值的參數(shù)的多級(jí)處理。參數(shù)窄化模塊將局部圖像區(qū)的 結(jié)果從粗略結(jié)果改變成精細(xì)結(jié)果。作為按多級(jí)改變分辨率的結(jié)果,可以 防止表示輪廓點(diǎn)數(shù)量和/或偏移參數(shù)的大尺寸投票空間,并且可以逐漸窄 化最佳參數(shù)的候選。結(jié)果,可以縮減要由參數(shù)窄化模塊執(zhí)行的投票處理 中的計(jì)算量,并且可以在不造成任何精度上的降低的情況下,計(jì)算出偏 移參數(shù)。例如,可以將為獲取估計(jì)值而限定的通用霍夫變換的對(duì)象的改 變量(步驟數(shù))限定為使該結(jié)果可以與圖像處理裝置1內(nèi)的存儲(chǔ)器區(qū)相 適配,并且可以使用整個(gè)存儲(chǔ)器區(qū)。
例如,參數(shù)窄化模塊可以通過(guò)下面的方法限定針對(duì)投票空間的參數(shù) 的增量。參數(shù)窄化模塊根據(jù)參數(shù)可以具有的范圍和存儲(chǔ)器區(qū)的尺寸計(jì)算 可用于各參數(shù)的存儲(chǔ)器區(qū)。對(duì)于平行移動(dòng)(水平和垂直)和旋轉(zhuǎn)角的情 況來(lái)說(shuō),存儲(chǔ)器區(qū)是三維的,并且參數(shù)窄化模塊將存儲(chǔ)器分成三個(gè)。接 下來(lái),參數(shù)窄化模塊根據(jù)參數(shù)可以采取的范圍、存儲(chǔ)參數(shù)的各存儲(chǔ)器量 以及分配給對(duì)象參數(shù)的存儲(chǔ)器的量獲取各參數(shù)的最佳增量。
下面,對(duì)計(jì)算角參數(shù)的實(shí)施例進(jìn)行說(shuō)明。對(duì)于局部圖像投票模塊針
對(duì)一個(gè)投票需要處理時(shí)間a (ms)和估計(jì)角的數(shù)目為P的情況來(lái)說(shuō),直 到獲取仿射變換矩陣為止所需的處理時(shí)間為a(3 (rns)。因此,利用多分 辨率的參數(shù)窄化模塊按步驟窄化P估計(jì)角。
在第一步驟中的投票處理中,參數(shù)窄化模塊將估計(jì)角分成n個(gè)范圍 并且使用每一個(gè)范圍的中心角,來(lái)獲取被最多投票的角。第一步驟中的 投票處理是用于窄化角范圍的目的的處理。因?yàn)椴恍枰镀蔽恢玫木龋?所以參數(shù)窄化模塊利用縮減輸入圖像信息17所得的具有更少黑色像素信 息的圖像縮減了經(jīng)受投票處理的黑色像素的數(shù)量,并且可以進(jìn)一步縮減 處理時(shí)間。
為了減少非意想的角被偶然地最多投票的情況,要作為窄化結(jié)果而 選擇的角應(yīng)是滿足等式(等式4)的條件的角。<formula>complex formula see original document page 16</formula>(等式4)
在等式4中,B指按任意角的得票數(shù),Bm指按具有最大得票數(shù)的角 的得票數(shù),而a是預(yù)選閾值。
在第二步驟中的投票處理中,參數(shù)窄化模塊對(duì)選定角范圍中呈現(xiàn)的 角進(jìn)行投票。參數(shù)窄化模塊獲取具有最多得票的投票空間的角,作為仿 射變換矩陣。該仿射變換矩陣是偏移參數(shù)。值得注意的是,對(duì)于用于投 票的黑色像素的數(shù)量具有可靠的比例的情況來(lái)說(shuō),參數(shù)窄化模塊可以獲
,取最大投票位置,作為仿射變換矩陣。對(duì)于第二步驟中的投票處理是用 于識(shí)別角的目的的處理來(lái)說(shuō),參數(shù)窄化模塊在第三步驟中執(zhí)行投票處理。 第三步驟中的投票處理僅在識(shí)別出的角執(zhí)行針對(duì)投票空間的投票處理。 因?yàn)榇颂幰宰R(shí)別最大得票位置為目的,所以要使用的黑色像素的數(shù)量必 須足夠。預(yù)先限定了每一個(gè)步驟中的角的范圍的大小。
局部圖像投票模塊可以通過(guò)通用霍夫變換窄化經(jīng)受投票處理的像 素。局部圖像投票模塊基于局部輪廓點(diǎn)集窄化投票處理。
對(duì)于寬度方向上具有W個(gè)像素而高度方向上具有H個(gè)像素的圖像內(nèi) 的黑色像素與全部像素的比例為G。/。的情況來(lái)說(shuō),該圖像中的黑色像素的 數(shù)量為(G*W*H/100)。因此,總處理量為N^ ((G*W*H/100)的平方),
其中在根據(jù)通用霍夫變換進(jìn)行投票處理時(shí)的處理量對(duì)模板圖像信息18和 輸入圖像信息的全部黑色像素執(zhí)行一次。
在通用霍夫變換中,是否出現(xiàn)最大值(峰值)處的得票位置是重要 的。因此,如果出現(xiàn)峰值,則不需要對(duì)所有黑色像素執(zhí)行投票處理。如 果投票處理被執(zhí)行了較少次數(shù),則可以縮減處理時(shí)間。然而,對(duì)于模板 圖像信息18的黑色像素的數(shù)量和輸入圖像信息的黑色像素的數(shù)量例如被 縮減至F。/。的情況來(lái)說(shuō),偏移參數(shù)的計(jì)算精度降低了。更具體地說(shuō),針對(duì) 要被投票的位置的投票率降低至((F的平方)/100) %,其中,在對(duì)所 有黑色像素執(zhí)行投票處理的情況下,投票率為100%。
因此,根據(jù)這種實(shí)施方式,僅縮減輸入圖像信息17的黑色像素的數(shù) 量。例如,管理者預(yù)選要用于輸出修正圖像的處理的黑色像素的數(shù)量占 輸入圖像信息17的全部黑色像素的數(shù)量的比例。這是因?yàn)椋瑢?duì)于輸入圖 像信息17的黑色像素的數(shù)量較低的情況來(lái)說(shuō),利用模板圖像信息18的 投票結(jié)果具有較少劣化的統(tǒng)計(jì)學(xué)精度。更具體地說(shuō),這是因?yàn)槟0鍒D像 信息18不包含噪聲信息而輸入圖像信息17可能包含噪聲信息。值得注 意的是,該方法可以在對(duì)模板圖像信息1S執(zhí)行通用霍夫變換的處理之前 縮減該模板圖像信息的黑色像素。然而,檢測(cè)的精度在縮減模板圖像信 息18的黑色像素的數(shù)量時(shí)降低。
要縮減的黑色像素的數(shù)量可以根據(jù)執(zhí)行通用霍夫變換的計(jì)算機(jī)的處 理能力恰當(dāng)改變。通過(guò)進(jìn)行這種操作,局部圖像投票模塊可以通過(guò)僅對(duì) 輸入圖像信息17的要用于投票處理的一部分黑色像素執(zhí)行通用霍夫變換 的操作來(lái)縮減處理時(shí)間。
接下來(lái),對(duì)局部圖像粘貼模塊在S06中根據(jù)局部圖像投票模塊計(jì)算 出的各局部圖像區(qū)的偏移參數(shù)來(lái)輸出輸入圖像信息的修正圖像的處理進(jìn) 行說(shuō)明。
通用霍夫變換所需的計(jì)算量隨變換參數(shù)的數(shù)量增加。為了在實(shí)用的 處理時(shí)間內(nèi)獲取根據(jù)通用霍夫變換提供的結(jié)果,可以將偏移限制成仿射 變換的偏移。因此,對(duì)于偏移包括局部擴(kuò)展/收縮(非線性擴(kuò)展/收縮)的 情況來(lái)說(shuō),難于估計(jì)偏移參數(shù)。因此,在通過(guò)應(yīng)用通用霍夫變換獲取了針對(duì)允許仿射變換的范圍內(nèi)的各局部圖像區(qū)的偏移參數(shù)之后,局部圖像 粘貼模塊通過(guò)對(duì)圖像變換參數(shù)的雙線性插值來(lái)對(duì)局部圖像區(qū)進(jìn)行插值。 局部圖像粘貼模塊不僅可以修正因仿射變換造成的畸變而且可以修正因 局部擴(kuò)展/收縮而造成的畸變。
實(shí)際輸入圖像信息17具有非線性擴(kuò)展/收縮。非線性擴(kuò)展/收縮例如 可能在圖像掃描儀裝置獲取報(bào)告上的圖像信息時(shí)因自動(dòng)饋紙器的旋轉(zhuǎn)不 均和/或報(bào)告紙的顫動(dòng)而造成。
局部圖像投票模塊計(jì)算各個(gè)局部圖像區(qū)的修正圖像。偏移參數(shù)值可 能在局部圖像區(qū)之間不同。因此,當(dāng)將局部圖像區(qū)的修正圖像按照原狀 合并時(shí)在區(qū)域之間的邊界可能出現(xiàn)不連續(xù)部分(不重合)。如果可以獲取 連續(xù)的用于修正非連續(xù)部分的參數(shù),則可以輸出修正局部擴(kuò)展/收縮畸變 所得的修正圖像信息。
圖14是用于計(jì)算與各像素相對(duì)應(yīng)的偏移參數(shù)的說(shuō)明圖。標(biāo)號(hào)52指 與在輸入圖像信息17的各局部圖像區(qū)170中獲取的偏移參數(shù)有關(guān)的像 素。偏移參數(shù)52例如與各局部圖像區(qū)170的中心處的像素有關(guān)。
局部圖像粘貼模塊計(jì)算與輸入圖像信息17的局部圖像區(qū)170內(nèi)的各 像素相對(duì)應(yīng)的偏移參數(shù)。例如可以通過(guò)對(duì)在局部圖像區(qū)中獲取的偏移參 數(shù)值進(jìn)行插值來(lái)計(jì)算與輸入圖像信息17的每一個(gè)像素相對(duì)應(yīng)的修正參數(shù) 值。
標(biāo)號(hào)53指在局部圖像區(qū)處于輸入圖像信息17外的情況下各局部圖 像區(qū)的中心的位置。標(biāo)號(hào)54指用于通過(guò)控制模塊101對(duì)輸入圖像信息17 的像素的偏移參數(shù)值進(jìn)行插值的矩形區(qū)。矩形區(qū)54的頂點(diǎn)是像素52或 像素53。輸入圖像信息17的各局部圖像區(qū)170的像素52不存在于輸入 圖像信息17的外邊緣外。因此,控制模塊101不能創(chuàng)建矩形區(qū)54。因此, 控制模塊101定義輸入圖像信息17外的虛擬像素53。像素53的位置處 于具有與輸入圖像信息17內(nèi)的像素52形成的矩形區(qū)54的形狀相同的形 狀的矩形區(qū)的頂點(diǎn)處??刂颇K101將外邊緣處的局部圖像區(qū)170的像 素52的偏移參數(shù)值定義為像素53的偏移參數(shù)值。
對(duì)于輸入圖像信息17具有M x N個(gè)局部圖像區(qū)來(lái)說(shuō),每一個(gè)都用于
計(jì)算各像素的偏移參數(shù)值的矩形區(qū)54的數(shù)量為(M+l) x (N+l)。接 下來(lái),局部圖像粘貼模塊計(jì)算與各像素相對(duì)應(yīng)的偏移參數(shù)值。
圖15是示出了圖14中的輸入圖像信息17的一部分中的區(qū)域55的圖。
標(biāo)號(hào)55指輸入圖像信息17的一部分中的區(qū)域。標(biāo)號(hào)52指與針對(duì)各 局部圖像區(qū)170計(jì)算出的偏移參數(shù)值有關(guān)的像素。偏移參數(shù)值A(chǔ)是針對(duì) 局部圖像區(qū)A的中心位置處的像素52-1的偏移參數(shù)值。偏移參數(shù)值B是 針對(duì)局部圖像區(qū)B的中心位置處的像素52-2的偏移參數(shù)值。偏移參數(shù)值 C是針對(duì)局部圖像區(qū)C的中心位置處的像素52-3的偏移參數(shù)值。偏移參 數(shù)值D是針對(duì)局部圖像區(qū)D的中心位置處的像素52-4的偏移參數(shù)值。
標(biāo)號(hào)56指經(jīng)受計(jì)算的像素。像素56的修正參數(shù)值在此為E。標(biāo)號(hào) 57指像素E的水平位置。水平位置57是點(diǎn)X,在該點(diǎn)X處,從像素E 起的、與連接像素52-1和像素52-3的直線平行的直線與連接像素52-1 和像素52-2的直線相交。點(diǎn)X位于這樣的位置處,g卩,在該位置處,對(duì) 于像素52-1與像素52-2之間的距離為"1"的情況來(lái)說(shuō),距像素52-1的 距離為"X",而距像素52-2的距離為"l-X"。垂直位置58具有點(diǎn)Y, 在該點(diǎn)Y處,從像素E起的與連接像素52-1和像素52-2的直線平行的 直線與連接像素52-1和像素52-3的直線相交。點(diǎn)Y位于這樣的位置處, 即,在該位置處,對(duì)于像素52-1與像素52-3之間的距離為"1"的情況 來(lái)說(shuō),距像素52-l的距離為"Y",而距像素52-3的距離為"1-Y"。
輸入圖像信息17中的像素56的修正參數(shù)例如通過(guò)按下面的等式(等 式5)進(jìn)行雙線性插值來(lái)計(jì)算。
<formula>complex formula see original document page 19</formula> (等式5)
局部圖像粘貼模塊利用修正參數(shù)修正輸入圖像信息17中的每一個(gè) 像素。局部圖像粘貼模塊輸出修正后的圖像,作為"修正圖像"。
在此,對(duì)要通過(guò)局部圖像粘貼模塊執(zhí)行的其它實(shí)施例進(jìn)行說(shuō)明。局 部圖像粘貼模塊可以僅利用高度可靠的偏移參數(shù)通過(guò)雙線性插值來(lái)計(jì)算 針對(duì)各像素的修正參數(shù)。作為對(duì)各個(gè)局部圖像區(qū)執(zhí)行投票處理的結(jié)果而 獲取的仿射變換矩陣可能不是始終有效的。因此,局部圖像粘貼模塊通過(guò)將投票處理計(jì)算出的數(shù)據(jù)值與預(yù)置閾值相比較來(lái)確定有效性。因?yàn)榫?部圖像粘貼模塊僅使用有效偏移參數(shù)來(lái)執(zhí)行針對(duì)像素的修正處理,結(jié)果, 與直接利用根據(jù)通用霍夫變換獲取的所有偏移參數(shù)值進(jìn)行修正相比,可 以更準(zhǔn)確地執(zhí)行修正。
局部圖像粘貼模塊基于是否滿足下面的等式(等式6)中的條件來(lái) 確定針對(duì)每一個(gè)局部圖像區(qū)計(jì)算出的仿射變換矩陣是否正確。
"EB>0" n "MC/EB>CB" (等式6)
在此,EB是輸入圖像信息17的局部圖像區(qū)170的黑色像素的數(shù)量。 MC是投票空間內(nèi)的最大得票數(shù)。CB是用于確定它是否為正常仿射變換 矩陣的閾值。CB是統(tǒng)計(jì)學(xué)地獲取的允許正常仿射變換矩陣的值。局部圖 像粘貼模塊將滿足等式6中的條件的投票結(jié)果確定為有效區(qū)域中的仿射 變換矩陣。
接下來(lái),針對(duì)被確定為具有無(wú)效仿射變換矩陣的局部圖像區(qū),局部 圖像粘貼模塊根據(jù)下面的處理計(jì)算偏移參數(shù)。局部圖像粘貼模塊通過(guò)根 據(jù)具有有效仿射變換矩陣的其它局部圖像區(qū)的偏移參數(shù)進(jìn)行線性插值, 來(lái)計(jì)算針對(duì)具有無(wú)效仿射變換矩陣的局部圖像區(qū)的偏移參數(shù)。
根據(jù)這種實(shí)施方式,局部圖像粘貼模塊例如可以從輸入圖像信息17 的上左處的局部圖像區(qū)起按次序執(zhí)行確定處理。如果檢測(cè)到具有無(wú)效仿 射變換矩陣的局部圖像區(qū)170,則局部圖像粘貼模塊搜索具有無(wú)效仿射變 換矩陣的局部圖像區(qū)170的上、下以及左側(cè)和右側(cè)的局部圖像區(qū)170。如 果上、下、左以及右局部圖像區(qū)170是具有正常仿射變換矩陣的局部圖 像區(qū),則局部圖像粘貼模塊針對(duì)具有無(wú)效仿射變換值的局部圖像區(qū)170 的偏移參數(shù),利用上、下以及左和右正常偏移參數(shù)執(zhí)行線性插值。局部 圖像粘貼模塊利用與該上、下、左以及右正常局部圖像區(qū)的偏移參數(shù)有 關(guān)的像素到與具有無(wú)效仿射變換矩陣的局部圖像區(qū)170的偏移參數(shù)有關(guān) 的像素的距離以及該上、下、左以及右正常局部圖像區(qū)的偏移參數(shù)值執(zhí) 行線性插值。
局部圖像粘貼模塊從輸入圖像信息17的上左處的局部圖像區(qū)170起 搜索上述線性插值處理。因此,對(duì)于輸入圖像信息中從左側(cè)起的第一列
(Mx 1)上的所有區(qū)域或從頂部起第一行(1 xN)上的所有區(qū)域都是具 有無(wú)效仿射變換矩陣的情況來(lái)說(shuō),局部圖像粘貼模塊不能找到用于執(zhí)行 線性插值的有效區(qū)域。因此,局部圖像粘貼模塊利用第二行或列上的局 部圖像區(qū)170對(duì)第一行或列上的局部圖像區(qū)170與執(zhí)行線性插值處理。 因?yàn)榫植繄D像粘貼模塊通過(guò)線性插值處理獲取輸入圖像區(qū)17的所有局部 圖像區(qū)170,所以每一個(gè)局部圖像區(qū)170的偏移參數(shù)可以是有效仿射變換 矩陣。
局部圖像粘貼模塊執(zhí)行確定偏移參數(shù)值是否有效的處理。例如,根 據(jù)由局部圖像投票模塊執(zhí)行的投票處理來(lái)確定投票空間中具有最大值的 參數(shù)。局部圖像投票模塊將投票空間中具有最大值的最高參數(shù)確定為偏 移參數(shù)值。在此,如果與最高參數(shù)相對(duì)應(yīng)的最大值高于預(yù)置值,則局部 圖像粘貼模塊確定該偏移參數(shù)值有效。如果與最高參數(shù)相對(duì)應(yīng)的最大值 不同于第二最大值達(dá)預(yù)置值或更大,則局部圖像粘貼模塊也確定該偏移 參數(shù)值無(wú)效。
局部圖像粘貼模塊在確定偏移參數(shù)值的有效性之后,針對(duì)具有無(wú)效 偏移參數(shù)值的局部圖像區(qū)中的偏移參數(shù)值,利用另一有效偏移參數(shù)值執(zhí) 行線性插值處理。因此,在一個(gè)例程中包括了確定偏移參數(shù)值的有效性 的處理和針對(duì)偏移參數(shù)值進(jìn)行線性插值的處理。
通過(guò)局部圖像粘貼模塊來(lái)執(zhí)行包括確定處理和線性插值處理的例 程,輸入圖像信息17的全部局部圖像區(qū)可能都是有效區(qū)域。然而,對(duì)于 局部地存在具有問(wèn)題的多個(gè)局部圖像區(qū)的情況來(lái)說(shuō),不能僅通過(guò)執(zhí)行一 次該例程將具有無(wú)效偏移參數(shù)值的局部圖像區(qū)轉(zhuǎn)換成具有有效偏移參數(shù) 值的局部圖像區(qū)。因此,局部圖像粘貼模塊執(zhí)行包括確定處理和線性插 值處理的例程多次。
局部圖像粘貼模塊獲取與局部圖像區(qū)的中心有關(guān)的有效偏移參數(shù) 值。值得注意的是,局部圖像粘貼模塊可以僅利用有效偏移參數(shù)值來(lái)計(jì) 算與無(wú)效區(qū)域的各像素相對(duì)應(yīng)的修正參數(shù)。然而,根據(jù)這種實(shí)施方式, 預(yù)先修正了與局部圖像區(qū)有關(guān)的偏移參數(shù)。結(jié)果,有利地簡(jiǎn)化了計(jì)算修 正參數(shù)的處理。
通過(guò)執(zhí)行上述操作,可以輸出根據(jù)用于輸入圖像信息17的模板圖像 進(jìn)行的有關(guān)于平行移動(dòng)、旋轉(zhuǎn)移動(dòng)、線性擴(kuò)展/收縮以及非線性擴(kuò)展/收縮 的修正所得的圖像。控制模塊101根據(jù)修正圖像內(nèi)存儲(chǔ)字符串的框架 173-1檢測(cè)文本172的圖像信息,并將該圖像信息轉(zhuǎn)換成可以由計(jì)算機(jī)處 理的文本代碼信息。
權(quán)利要求
1、一種計(jì)算機(jī)可讀介質(zhì),該計(jì)算機(jī)可讀介質(zhì)存儲(chǔ)有執(zhí)行用于從一區(qū)域中具有框架和多個(gè)字符的圖像中識(shí)別出字符的處理的程序,所述處理包括以下步驟區(qū)域劃分步驟,該區(qū)域劃分步驟將所述區(qū)域分成分別具有多個(gè)局部圖像的多個(gè)局部區(qū)域;模板圖像提供步驟,該模板圖像提供步驟提供具有基準(zhǔn)框架圖像的模板圖像;圖像差別計(jì)算步驟,該圖像差別計(jì)算步驟分別計(jì)算所述多個(gè)局部圖像與所述模板圖像的所述基準(zhǔn)框架圖像之間的差別;不重合度計(jì)算步驟,該不重合度計(jì)算步驟基于所述多個(gè)局部圖像與所述基準(zhǔn)框架圖像的所述差別的平均來(lái)計(jì)算所述圖像與所述模板圖像的不重合度;以及字符識(shí)別步驟,該字符識(shí)別步驟修正所述不重合度,從所述圖像識(shí)別出所述多個(gè)字符。
2、 根據(jù)權(quán)利要求1所述的計(jì)算機(jī)可讀介質(zhì),其中,所述圖像差別計(jì)算步驟計(jì)算平行移動(dòng)、旋轉(zhuǎn)角以及線性延伸的比例中的至少一種。
3、 根據(jù)權(quán)利要求1所述的計(jì)算機(jī)可讀介質(zhì),其中,所述圖像差別計(jì)算步驟利用廣義霍夫變換來(lái)計(jì)算。
4、 根據(jù)權(quán)利要求1所述的計(jì)算機(jī)可讀介質(zhì),其中,所述圖像差別計(jì)算步驟計(jì)算所述框架的垂直分量和水平分量中的至少一種的所述差別。
5、 根據(jù)權(quán)利要求1所述的計(jì)算機(jī)可讀介質(zhì),其中,所述不重合度計(jì)算步驟還包括,關(guān)聯(lián)步驟,該關(guān)聯(lián)步驟將所述差別與所述局部圖像的多 個(gè)像素中的一個(gè)像素相關(guān)聯(lián),和像素差別計(jì)算步驟,該像素差別計(jì)算步驟基于與設(shè)置所述局部圖像的所述差別的所述區(qū)域的距離來(lái)計(jì)算所述多個(gè)像素中的另一像素的所述 差別。
6、 根據(jù)權(quán)利要求1所述的計(jì)算機(jī)可讀介質(zhì),其中,所述關(guān)聯(lián)步驟在所述局部圖像的中心像素處關(guān)聯(lián)所述差別。
7、 一種用于從一區(qū)域中具有框架和多個(gè)字符的圖像中識(shí)別出字符的裝置,所述裝置包括存儲(chǔ)器,該存儲(chǔ)器用于存儲(chǔ)具有基準(zhǔn)框架圖像的模板圖像;和處理器,該處理器用于執(zhí)行如下處理,所述處理包括以下步驟 區(qū)域劃分步驟,該區(qū)域劃分步驟將所述區(qū)域分成分別具有多個(gè)局部圖像的多個(gè)局部區(qū)域;圖像差別計(jì)算步驟,該圖像差別計(jì)算步驟分別計(jì)算所述多個(gè)局部圖像與所述模板圖像的所述基準(zhǔn)框架圖像之間的差別;不重合度計(jì)算步驟,該不重合度計(jì)算步驟基于所述多個(gè)局部圖像與 所述基準(zhǔn)框架圖像的所述差別的平均來(lái)計(jì)算所述圖像與所述模板圖像的 不重合度;以及字符識(shí)別步驟,該字符識(shí)別步驟修正所述不重合度,從所述圖像中 識(shí)別出所述多個(gè)字符。
8、 一種用于從一區(qū)域中具有框架和多個(gè)字符的圖像中識(shí)別出字符的 方法,所述方法包括以下步驟-區(qū)域劃分步驟,該區(qū)域劃分步驟將所述區(qū)域分成分別具有多個(gè)局部 圖像的多個(gè)局部區(qū)域;模板圖像提供步驟,該模板圖像提供步驟提供具有基準(zhǔn)框架圖像的 模板圖像;圖像差別計(jì)算步驟,該圖像差別計(jì)算步驟分別計(jì)算所述多個(gè)局部圖 像與所述模板圖像的所述基準(zhǔn)框架圖像之間的差別;不重合度計(jì)算步驟,該不重合度計(jì)算步驟基于所述多個(gè)局部圖像與 所述基準(zhǔn)框架圖像的所述差別的平均來(lái)計(jì)算所述圖像與所述模板圖像的 不重合度;以及字符識(shí)別步驟,該字符識(shí)別步驟修正所述不重合度,從所述圖像中 識(shí)別出所述多個(gè)字符。
全文摘要
本發(fā)明涉及字符識(shí)別方法。根據(jù)一個(gè)方面的實(shí)施方式,提供了一種從一區(qū)域中具有框架和多個(gè)字符的圖像中識(shí)別出字符的方法,該方法包括以下步驟區(qū)域劃分步驟,該區(qū)域劃分步驟將所述區(qū)域分成分別具有多個(gè)局部圖像的多個(gè)局部區(qū)域;模板圖像提供步驟,該模板圖像提供步驟提供具有基準(zhǔn)框架圖像的模板圖像;圖像差別計(jì)算步驟,該圖像差別計(jì)算步驟分別計(jì)算所述多個(gè)局部圖像與所述模板圖像的所述基準(zhǔn)框架圖像之間的差別;不重合度計(jì)算步驟,該不重合度計(jì)算步驟基于所述多個(gè)局部圖像與所述基準(zhǔn)框架圖像的該差別的平均來(lái)計(jì)算所述圖像與所述模板圖像的不重合度;以及字符識(shí)別步驟,該字符識(shí)別步驟修正所述不重合度,從而從所述圖像中識(shí)別出該多個(gè)字符。
文檔編號(hào)G06K9/34GK101344925SQ20081012806
公開(kāi)日2009年1月14日 申請(qǐng)日期2008年7月10日 優(yōu)先權(quán)日2007年7月10日
發(fā)明者直井聰, 藤本克仁, 諏訪美佐子 申請(qǐng)人:富士通株式會(huì)社