專利名稱:對像素數(shù)據(jù)進行二進制化的方法和裝置的制作方法
技術領域:
本發(fā)明涉及對像素數(shù)據(jù)進行二進制化的方法和裝置。
本發(fā)明涉及自動字符識別系統(tǒng)的圖像準備領域。字符識別系統(tǒng)大致分為兩個子系統(tǒng),其中第一個子系統(tǒng)的任務是圖像的準備,而第二個子系統(tǒng)的任務是真正的識別。在圖像準備時,使用測量技術獲得識別的文件,即所謂的原件。為形成原件的一個圖像,準備出文字段落、行及單個字符,并清除由明顯可見的干擾所引起的字符圖像。被識別的字符首先置于有光區(qū)域,并必須轉換以利于進一步的處理。這將通過一掃描器(目前最好是集成的半導體掃描器)來進行。為了進一步的處理,連續(xù)測得的原件的灰度一般在掃描后直接轉換為黑-白判斷(schwarz-weiβ-Entscheidung)。由掃描器提供的模擬信號最好首先通過一個A/D轉換器轉換為分立的信號,接著產(chǎn)生一個為字符識別能足以重現(xiàn)原圖像內容的灰度圖像原件的二進制圖像。字符區(qū)域的背景亮度和灰度可能會有很大的起伏。在原件的子區(qū)域中人們可以得到較小的背景亮度的起伏,但字符區(qū)域的灰度卻經(jīng)常隨不同的字符甚至在一個字符之內發(fā)生變化。因此,背景亮度的區(qū)別可以對一個較大的圖像段落采用相同的規(guī)則來處理,而字符灰度的不同則采用只在局部起作用的規(guī)則來平衡。
按照二進制化特性的黑白判斷的局部控制是采用差分運算(differenzierende Operation),為確定一像素的灰度,該運算不僅考慮該點的灰度值,而且也考慮其周圍的灰度值。這里周圍區(qū)域大小的選取必須與需辨認的符號的大小相符。最簡單的方法是首先確定周圍區(qū)域的中間灰度值,如果一個像素比該中間灰度值黑則被認為是黑色,否則,被認為是白色。此外,為降低背景區(qū)域和符號黑色區(qū)域的噪聲,可應用二進制化特性曲線,在中間灰度值較低的區(qū)域提高閾值Q,而在中間灰度值較高的區(qū)域降低該閾值。在符號對比度變化較大的情況下這樣是有益的按照在一個較大周圍區(qū)域觀察到的對比度控制二進制化特性曲線,并且對印刷較深的符號應用與對印刷較淺的符號不同的二進制化特性曲線。
在上述的圖像準備的二進制化階段為所有后續(xù)處理步驟產(chǎn)生有效信息。因此,在該階段損失的信息將影響所有的進一步的處理步驟,并限制了整個系統(tǒng)的效率。
二進制化時遇到的一個問題是對于靈敏的二進制化的圖像,圖像的處理采用按印刷較淺的字符設置的二進制化特性,這樣對比度較小的字符能很好地被辨認,但是干擾結構和圖案也能清晰地顯現(xiàn)出。與此相反,對于非靈敏的二進制化圖像,對比度較高的字符能被很好地辨認,而干擾信息和背景噪聲被抑制。在對地址區(qū)域字符的識別中這一問題變得尤其突出;地址區(qū)域通常有一個背景結構,在這種情況下從對灰色圖像的周圍的局部觀察很難判斷某一灰度值究竟涉及書寫的字跡還是干擾的背景圖案。
本發(fā)明的任務是,提供一種這樣的方法和裝置,從用不同的二進制化特性構成的多個二進制圖像中選擇一個最優(yōu)二進制化的圖像。
本發(fā)明的任務這樣來完成,從像素灰度值數(shù)據(jù)的記錄中分別應用不同靈敏度的二進制化特性構成多個黑白二進制圖像。對每一個這樣的二進制圖像計算數(shù)據(jù)S=FSU..,]]>其中FS為圖像中黑點的數(shù)目,表示黑白過渡點的數(shù)目。最大的S值所對應的圖像即為最優(yōu)二進制化的圖像。
下面結合附圖詳細解釋本發(fā)明。
圖1表示按照本發(fā)明的裝置框圖。
圖2表示提供幾個黑白二進制圖像的二進制數(shù)據(jù)源的框圖。
圖3表示二進制化判斷圖。
圖4為一動態(tài)噪聲閾值圖。
圖5表示一封信中識別區(qū)(ROI)的一個例子。
圖6表示確定黑白過渡點的計數(shù)方向。
圖7為一分析曲線。
圖8為一系列不同的二進制化的圖像。
圖9表示另一個按照本發(fā)明的裝置的框圖。
圖1所示的按照本發(fā)明的裝置的框圖包括一個二進制數(shù)據(jù)源1和一個ROI探測器模塊2,用以提供二進制圖像點的給定部分,即識別區(qū)(ROI-region of interest)。如圖2所示,在二進制數(shù)據(jù)源1中,并行地產(chǎn)生n個(典型取為4至6)二進制圖像。二進制數(shù)據(jù)源1由圖中未詳細表示出的灰度-像素數(shù)據(jù)源,即從圖像輸入裝置3(例如掃描儀),獲取灰度圖像的像素值。從原理上講,在按照本發(fā)明的裝置中也可以順序地產(chǎn)生n個二進制圖像。
這n個二進制圖像分別具有不同的二進制化特性。如已知的那樣,為對灰度圖像二進制化,在每一像素的周圍局部區(qū)域進行中間值計算4。周圍局部區(qū)域的選取是可隨參數(shù)變化的。從經(jīng)驗可知,對信件的地址區(qū)域中的字體,合適的周圍局部區(qū)域的大小為1mm2。中間值最好由周圍局部區(qū)域中典型點的算術平均灰度值來構成,這里,需進行二進制化的圖像點位于該周圍局部區(qū)域的中點。
最好在相對于需二進制化的圖象點對稱的一個擴大的周圍環(huán)境區(qū)域內計算出最大值、最小值和對比度5,作為進行二進制化的其他測量值。這里,擴展的周圍環(huán)境區(qū)域中最黑的灰度值被賦予最小值MIN。而最大值MAXabs最好為擴展周圍環(huán)境區(qū)域中的絕對最亮的灰度值。對比度最好由次最大值的最小值MAXk來計算(例如在3×3擴展周圍區(qū)域中由三列次最大值計算)。
對比度由下式?jīng)Q定K=MAXk-MINMAXk]]>通過MAXk來定義K的方法使得圖像的最大灰度值對對比度,從而對二進制化結果的影響不是很靈敏。否則,灰度圖像中的非正常亮點,以及過渡邊緣區(qū)域(如標記或信封上的透明窗口)將導致較大的對比度改變。對比度的明顯改變只有通過字跡本身引起。
灰度圖像的每一個像點暫時存儲在像素存儲器6中,直至計算出相對于每一像點的中間值,最小值,MAXk和對比度。
測量值中間值、最小值、最大值和對比度最好由n個圖像一起計算。在這一情況下,二進制圖像的區(qū)別只在于下面將要說明的判斷圖3中的其他參量。
在判斷圖中,橫座標為每一需二進制化的像素Pi的實際中間值,縱座標為實際的像素值。圖3中劃出了三條不同的特性曲線,二進制化的靈敏度隨著這些特性曲線直線部分斜率的增加而增大。若一個由給定中間值和給定像素所確定的點位于特性曲線之上則被賦予值“白”,相反,若在其下則被賦予值“黑”。通常情況下,當對比度較小時選擇靈敏度較高的特性曲線,而當對比度較大時選取靈敏度較低的特性曲線。
為降低噪聲在圖3中引入了不同的閾值白色閾值WS根據(jù)MAXk給出,白色閾值的典型大小范圍為MAXk的70-85%。若實際像素值Pi大于該閾值,則被賦予白色,與特性曲線無關。
絕對黑色閾值SSW的作用是當像素值Pi小于該絕對閾值時被置為黑色。
因為在通常情況下,黑的地址區(qū)域比白的地址區(qū)域更容易引起較強的白色噪聲,所以最好引入一個與像素最大值MAXk有關的動態(tài)的白色噪聲閾WS=f(MAXk),它較強或較弱地降低白色噪聲。圖4給出了這種動態(tài)白色閾值的一個例子,其中灰度值的值域取為8位。
按照本發(fā)明,為實現(xiàn)二進制化,應用n個不同的,最好按靈敏度排列的特性曲線,來完成n個不同的二進制化的二進制圖像。這n個圖像被存入圖像存儲器7中,識別區(qū)ROI的數(shù)據(jù)供分析裝置8使用,而整個圖像則供剪輯裝置(Montierwerk)9使用。
圖5表示含有一地址塊12的識別區(qū)11的原樣的一個例子。從原理上講,可用不同探測器獲得識別區(qū)的信息,例如,窗口探測器,在帶有透明窗口的信件上,從光澤圖像中確定座標,這個圖像是用一個專用掃描器獲得的;探測地址標簽的標簽探測器;使用一定的算法尋找行結構并將典型的地址結構標志為識別子區(qū)的地址塊探測器;通過顏色分析確定識別子區(qū)的顏色信息探測器;或通過預定的座標確定識別子區(qū)的固定區(qū)域探測器。
在分析裝置8中,對1至n的每一個二進制圖像分別計算出相對于由ROI探測器模塊2確定的識別區(qū)的數(shù)值S1,S2,…,Sn。
為計算數(shù)值S必須計算黑像點的數(shù)目FS和黑-白或白-黑過渡點的數(shù)目。
過渡像點數(shù)目可以在列方向,或行方向,或在兩個方向上逐個像素地數(shù)出。圖6表示了確定過渡像點列方向、行方向和列方向與行方向的計數(shù)方向。
數(shù)值S與二進制化的二進制圖像的關系如圖7的曲線所示,圖像是按二進制化特性靈敏度逐漸降低的順序排列。當使用靈敏度很高的二進制化特性時,S的值很大。它對應的二進制圖像實際上很黑,只有相對較少的黑-白過渡像點。隨著靈敏度的降低,黑-白過渡像點急劇增加,從而導致S的下降。二進制化特性的靈敏靈進一步減小,S值再次增加,在這種情況下,字跡信息清晰。隨著二進制化特性的靈敏度的進一步減小,二進制化圖像中的符號繼續(xù)分解(zerfallen),使得數(shù)值S再次下降。結果得到一個S曲線,其相對最大值對應于最優(yōu)識別的圖像。
圖8表示了一地址區(qū)域的分別以不同的靈敏度形成的四個不同的圖像及其相應的數(shù)值S。圖中表明,具有最大S值(S=1.87)的圖像(C)是最清晰的。
由分析裝置8提供的數(shù)值S1至Sn在評估裝置10中進一步被處理,即由數(shù)值S1至Sn中確定相對最大值,并這樣來控制剪輯裝置9,即在識別的子區(qū)域中輸出具有最大S的二進制圖像,并對該圖像其余部分輸出標準圖像。n個二進制圖像中的與等候的原樣表面相適應的一個圖像用作為標準圖像。也可以舍棄剪輯裝置9中的剪輯步驟,在這種情況下可以用導致S取最大值的二進制化特性進行整個二進制圖像的輸出,這對專業(yè)人員來說是顯而易見的。但是應該對原樣進行劃分和剪輯,因為識別子區(qū)通常與整個原樣表面具有不同的光學特性。
對于具有數(shù)個識別子區(qū)ROI的原樣,如具有數(shù)個透明窗口的信或帶有標記的平面,可以運用本發(fā)明的一個擴展。當有K個識別子區(qū)時最好使用K個分析裝置,圖9表示了具有K個分析裝置8的本發(fā)明的一個實施例,從它們的每一個輸出以上述方式計算出的n個S1至Sn的數(shù)值。然后對每一個識別子區(qū)在其所屬的分析裝置中進行獨立的分析。這樣,對每一個識別子區(qū)找到一個最優(yōu)識別的二進制圖像,并被輸出剪輯。圖9表示,數(shù)據(jù)由ROI探測器模塊2,傳送給控制裝置10’,傳送給分析裝置8’進行分析。剪輯裝置9’由控制裝置10’控制。由不同的ROI探測器探測到的子區(qū)的重疊,通過不同ROI探測器的優(yōu)化被消除,這樣對于分析裝置和剪輯只存在明確、單一的子區(qū)。
權利要求
1.像素數(shù)據(jù)二進制化的方法,其特征在于,從像素灰度值數(shù)據(jù)的記錄中分別應用不同靈敏度的二進制化特性構成多個黑白二進制圖像。對每一個這樣的二進制圖像計算數(shù)值S=FSU..,]]>其中FS為圖像中黑點的數(shù)目,表示黑白過渡點的數(shù)目。最大的S值所對應的圖像即為最優(yōu)二進制化的圖像。
2.根據(jù)權利要求1的方法,其特征在于,數(shù)值S的計算和對每一圖像的相應選擇只對二進制擇圖像點的一個或數(shù)個預定的部分(ROI)進行。
3.根據(jù)權利要求2的方法,其特征在于,按照不同的標準給出數(shù)個預定部分(ROI)。
4.根據(jù)權利要求2或3的方法,其特征在于,按照一預定的標準二進制化特性將上述預定部分(ROI)剪輯,和相應的剩余圖像組合成一個整圖像。
5.根據(jù)權利要求1至4之一的方法,其特征在于,作為參數(shù)的量化特性值有中間值,最小值,最大值,對比度,以及用于降低像素灰度值數(shù)據(jù)的噪聲的預定的噪聲閾值。
6.帶有一個二進制數(shù)據(jù)源(1)的對像素數(shù)據(jù)二進制化的裝置,其特征在于,二進制數(shù)據(jù)源(1)由像素灰度值的記錄中分別以不同的靈敏度的量化特性提供數(shù)個黑白二進制圖像;安置一分析裝置(8),用以對n個二進制數(shù)據(jù)圖像中的每一個計算數(shù)值S=FSU..,]]>其中FS表示黑二進制像點的數(shù)目,而表示黑-白過渡點的數(shù)目;安置一評估裝置(10),用于從大量二進制數(shù)據(jù)圖像中選出具有最大S值的那幅圖像。
7.根據(jù)權利要求6的裝置,其特征在于,安置一圖像存儲器(7),用于暫時存儲n個二進制數(shù)據(jù),這些數(shù)據(jù)由該存儲器傳送至分析裝置(8)。
8.按照權利要求6或7的裝置,其特征在于,安置有探測器模塊(2),用于二進制數(shù)據(jù)像點的預定部分(ROI)的選擇。
全文摘要
本發(fā)明公開了一種像素數(shù)據(jù)二進制化的方法和裝置,從像素灰度值數(shù)據(jù)記錄中分別應用不同靈敏度的二進制化特性構成多個黑—白二進制圖像。對每一個這樣的二進制圖像計算數(shù)值S=FS/,其中FS為圖像中黑點的數(shù)目,表示黑白過渡點的數(shù)目。最大的S值所對應的圖像即為最優(yōu)二進制化的圖像。
文檔編號H04N1/403GK1144587SQ95192294
公開日1997年3月5日 申請日期1995年3月31日 優(yōu)先權日1994年3月31日
發(fā)明者沃爾夫岡·韋伯, 埃伯哈德·羅哈姆, 安杰斯·巴豪澤, 沃爾特·黑塞 申請人:利森蒂亞專利管理有限公司