用于文檔圖像的自適應(yīng)二值化方法和設(shè)備的制作方法

文檔序號：6467574閱讀：127來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

專利名稱：用于文檔圖像的自適應(yīng)二值化方法和設(shè)備的制作方法
技術(shù)領(lǐng)域：
本發(fā)明涉及圖像二值化技術(shù)，尤其涉及用于文檔圖像的自適應(yīng)二值化方法和設(shè)備。
背景技術(shù)：
近年來，隨著圖像處理技術(shù)的迅速發(fā)展，文檔圖像光學(xué)字符識別(OCR)正得到廣泛的應(yīng)用。作為一種圖像預(yù)處理技術(shù)，文檔圖像二值化處理經(jīng)常在OCR系統(tǒng)中被用到。二值化處理是將彩色或灰度級圖像轉(zhuǎn)換成黑白圖像的過程，其中黑白圖像只具有黑、白兩個灰度級。有許多種用于文檔圖像的全局或自適應(yīng)的二值化方法。二值化方法的例子包括Otsu方法，用于根據(jù)灰度直方圖計(jì)算閾值(參見〃 A ThresholdSelection Method from Gray-Level Histograms 〃， IEEE Trans. On systems, Man,30and cybernetics, Vol. SMC-9， No. 1， pp. 62-66， January 1979) ， Niblack方法，用于基于圖像的局部均值禾口標(biāo)準(zhǔn)差計(jì)算閾值(參見〃 Anlntroduction to Digitall Image Processing"， Prentice-Hal 1， EnglewoodCliffs， NJ(1986))和Sauvola方法，其是對Niblack方法的改進(jìn)并且嘗試抑制噪聲區(qū)(參見J. Sauvola和M.Pietikainen，〃 Ad即tive document imagebinarization，〃 Pattern Recognition 33②，pp.225-236，2000。
例如0tsu方法的全局二值化方法對于退化的弱筆劃字符和光線變化的背景效果不佳。例如Niblack方法和Sauvola方法的自適應(yīng)二值化方法雖然能夠應(yīng)對上述情況，但經(jīng)常在背景圖像中產(chǎn)生大量噪聲。作為對Niblack方法的改進(jìn)的Sauvola方法對于紋理背景圖像效果較好，但可能會丟失弱筆劃。此外，目前的二值化方法都不適合處理帶表格線的字符串圖像。

發(fā)明內(nèi)容
本發(fā)明的目的是提供一種用于文檔圖像的自適應(yīng)二值化方法和設(shè)備，以至少克服現(xiàn)有技術(shù)的部分不足。在本發(fā)明的一個實(shí)施例中，用于文檔圖像的自適應(yīng)二值化設(shè)備包含估計(jì)器，根據(jù)在行和列中的一個方向上文檔圖像的每一組像素，估計(jì)該組的每個像素的第一背景灰度級，以獲得文檔圖像的第一背景圖像；計(jì)算器，針對文檔圖像的每個像素，計(jì)算以該像素為中心的第一像素區(qū)域中所有像素到第一背景圖像的平均距離r，并計(jì)算該像素的第一背景灰度級和與平均距離r正相關(guān)的量d之間的差，以作為該像素的第一閾值；和提取器，根據(jù) 第一閾值從文檔圖像中提取出第一二值化圖像，其中，第一背景灰度級的估計(jì)所基于的像素區(qū)間和第一像素區(qū)域的尺寸大于預(yù)定尺寸。在一個可選實(shí)施例中，估計(jì)器還根據(jù)在行和列中的另一個方向上文檔圖像的每一組像素，估計(jì)該組的每個像素的第二背景灰度級，以獲得文檔圖像的第二背景圖像，計(jì)算器還針對文檔圖像的每個像素，計(jì)算以該像素為中心的第二像素區(qū)域中所有像素到第二背景
4圖像的平均距離r，并計(jì)算該像素的第二背景灰度級和與平均距離r正相關(guān)的量d之間的差，以作為該像素的第二閾值，并且提取器還根據(jù)第二閾值從文檔圖像中提取出第二二值化圖像，其中，第二背景灰度級的估計(jì)所基于的像素區(qū)間和第二像素區(qū)域的尺寸大于所述預(yù)定尺寸，其中，所述自適應(yīng)二值化設(shè)備還包括圖像合并器，獲得第一和第二二值化圖像間的邏輯與圖像。在一個可選實(shí)施例中，在計(jì)算第一和第二閾值時，d = kXr，O < k < 2。在一個可選實(shí)施例中，在計(jì)算第一和第二閾值時，d = kX (rn+1 r_rn |) ， 0 < k < 2，
rn為文檔圖像的估計(jì)噪聲。在一個可選實(shí)施例中，估計(jì)器通過平均值或迭代多項(xiàng)式回歸來進(jìn)行估計(jì)。在本發(fā)明的一個實(shí)施例中，用于文檔圖像的自適應(yīng)二值化方法，包括根據(jù)在行和
列中的一個方向上文檔圖像的每一組像素，估計(jì)該組的每個像素的第一背景灰度級，以獲
得文檔圖像的第一背景圖像；針對文檔圖像的每個像素，計(jì)算以該像素為中心的第一像素
區(qū)域中所有像素到第一背景圖像的平均距離r，并計(jì)算該像素的第一背景灰度級和與平均
距離r正相關(guān)的量d之間的差，以作為該像素的第一閾值；和根據(jù)第一閾值從文檔圖像中提
取出第一二值化圖像，其中，第一背景灰度級的估計(jì)所基于的像素區(qū)間和第一像素區(qū)域的
尺寸大于預(yù)定尺寸。

參照下面結(jié)合附圖對本發(fā)明實(shí)施例的說明，會更加容易地理解本發(fā)明的以上和其它目的、特點(diǎn)和優(yōu)點(diǎn)。在附圖中，相同的或?qū)?yīng)的技術(shù)特征或部件將采用相同或?qū)?yīng)的附圖標(biāo)記來表示。
圖1是示出根據(jù)本發(fā)明實(shí)施例的用于文檔圖像的自適應(yīng)二值化設(shè)備的框圖。
圖2是示出根據(jù)本發(fā)明實(shí)施例的用于文檔圖像的自適應(yīng)二值化方法的流程圖。
圖3A示意性示出了計(jì)算器計(jì)算閾值的原理，圖3B示出了在應(yīng)用閾值時估計(jì)噪聲所產(chǎn)生的作用。圖4示意性示出了由原始文檔圖像中一行像素估計(jì)背景圖像中該行像素的過程圖5示意性示出了圖1的自適應(yīng)二值化設(shè)備處理文檔圖像的具體示例。圖6是示出根據(jù)本發(fā)明優(yōu)選實(shí)施例的用于文檔圖像的自適應(yīng)二值化設(shè)備的框圖。圖7是示出根據(jù)本發(fā)明優(yōu)選實(shí)施例的用于文檔圖像的自適應(yīng)二值化方法的流程圖。圖8示意性示出了圖6的自適應(yīng)二值化設(shè)備處理文檔圖像的具體示例。
圖9是示出其中實(shí)現(xiàn)本發(fā)明的計(jì)算機(jī)的示例性結(jié)構(gòu)的框圖。
具體實(shí)施例方式
下面參照附圖來說明本發(fā)明的實(shí)施例。應(yīng)當(dāng)注意，為了清楚的目的，附圖和說明中
省略了與本發(fā)明無關(guān)的、本領(lǐng)域普通技術(shù)人員已知的部件和處理的表示和描述。
圖1是示出根據(jù)本發(fā)明實(shí)施例的用于文檔圖像的自適應(yīng)二值化設(shè)備100的框圖。如圖1所示，自適應(yīng)二值化設(shè)備100包括估計(jì)器101、計(jì)算器102和提取器103。
在圖l所示的實(shí)施例中，假定在文檔圖像中分布有沿行方向延伸的線條，并且沿行方向存在手寫或打印的文字。此外，假定文檔圖像的灰度級為0到255。灰度級255代表純白，灰度級O代表純黑，并且文檔圖像具有淺灰度(即高灰度級)背景，深灰度(即低灰度級)文字。估計(jì)器101以文檔圖像的每一行的像素為一組，逐行處理文檔圖像。在處理中，估計(jì)器101根據(jù)行方向上文檔圖像的每一組像素，估計(jì)該組的每個像素的背景灰度級，以獲得文檔圖像的背景圖像。可以將文檔圖像認(rèn)為是背景圖像與文字圖像的疊加，并且線條也被認(rèn)為是背景圖像的一部分。由于文字與線條相交的部分往往具有比文字和線條更深的灰度，因此當(dāng)線條被提取為背景圖像的一部分時，自然能夠?qū)⒕€條與文字分離。由于根據(jù)每一行的像素來估計(jì)背景圖像，因此能夠更加適應(yīng)地將沿行方向延伸的線條估計(jì)為背景圖像的一部分。可以利用各種方法來進(jìn)行估計(jì)。例如，可以通過平均值來估計(jì)背景圖像，其中對于每一組像素中的每一個像素，針對以該像素為中心的像素區(qū)間內(nèi)的所有像素求灰度級平均值，并且將灰度級平均值作為當(dāng)前像素的背景灰度級。這樣，所有像素的背景灰度級構(gòu)成文檔圖像的背景圖像。為了足夠區(qū)分背景和文字，可以將像素區(qū)間的尺寸(即寬度)設(shè)置為大于某個值，使得區(qū)間內(nèi)至少包含背景像素。例如，可以將像素區(qū)間的尺寸設(shè)置為大于文字的平均或最大筆劃寬度。優(yōu)選地，可以將像素區(qū)間的尺寸設(shè)置為大于文字沿線條方向(在本實(shí)施例中為行方向)的平均或最大筆劃寬度。在一個實(shí)施例中，像素區(qū)間的尺寸為ll個對于接近圖像邊界的像素，以其為中心的像素區(qū)間可能包含邊界以外的部分。對于這樣的情況，可以只針對像素區(qū)間內(nèi)的實(shí)際像素求平均值。也可以采用迭代多項(xiàng)式回歸來擬合估計(jì)背景圖像。適合使用的多項(xiàng)式擬合函數(shù)可采用P次多項(xiàng)式，如P = 7。擬合函數(shù)的形式為
f (x) = ao+^x+^xS+^xS+^xA+^xS+^^+^x7 其中p越大，函數(shù)的擬合能力越強(qiáng)，但容易過擬合；p越小，擬合能力越差，但容易
欠擬合。給定一行像素(Xl， y》，…，(xn， yn) ，x,. = ^代表像素歸一化的列坐標(biāo)，乂.=條代表像素(設(shè)灰度級gi在0至255之間)歸一化后的灰度級，n是一行的像素數(shù)目。
將輸入A，…，Xn的0至p次冪依次安排放置于一個矩陣X
<formula>formula see original document page 6</formula>，以定義多項(xiàng)式濾波矩陣
HnXn = X(XTX+e I)-Y 其中I是單位矩陣，e是一個小正常數(shù)，例如取e = 0. OOOln。對于給定的圖像，寬度n是一個常量，故濾波矩陣是一個常量矩陣。設(shè)多項(xiàng)式回歸函數(shù)擬合輸出yi，…，yn的結(jié)果為4，…，4，記輸出行的列向量y=(y"…，y》t，擬合行的列向量為f = (4，…，4)t，則它們滿足f = Hy。經(jīng)過多次迭代的使用多項(xiàng)式回歸，可以估計(jì)出輸入圖像的背景圖像(假定文檔背
景為白色，文檔字符筆劃為黑色)。針對一行像素，估計(jì)文檔圖像該行背景的過程如下(l)設(shè)置初始迭代次數(shù)t = O，初始瑜出jT 二為，…，乂w =_y ; (2)對于圖像的一行數(shù)據(jù)y,)，…，y,)，經(jīng)過第t次多項(xiàng)式擬合，我們得到了輸出f,)，…，fn(t)(其中若,')〉l，則裁減為乂W"); (3)如果迭代次數(shù)滿足t > T，則終止迭代并輸出f,)，…，fn(t)作為該行背景；
(4)按照如下規(guī)則計(jì)算y,1)，…，yn(t+1):若乂(') > 乂')+△(')，貝U,+"=,')，否貝U
=xw ，其中△(t)是一個噪聲閾值。 (5)增加迭代次數(shù)t —t+l，返回步驟(2)，開始新一輪迭代。在第(4)步中，有一個噪聲閾值A(chǔ)(t)，它可以如下設(shè)置設(shè)初始噪聲為A(Q) =0.2，結(jié)束噪聲為A =0，則第
t次迭代噪聲AW-^A^。上述的迭代過程是逐漸把筆劃處的像素值以背景多項(xiàng)式行插值來替代的過程，最終輸出收斂于背景行曲線。圖4示意性示出了由原始文檔圖像中一行像素估計(jì)背景圖像中該行像素的過程，其中點(diǎn)線為(Xi，y,))，實(shí)線為(Xi，fi(t))，自上而下迭代次數(shù)t二0，…，6。
圖5示意性示出了圖1的自適應(yīng)二值化設(shè)備處理文檔圖像的具體示例。原始文檔圖像如圖5中的(A)所示，并且逐行估計(jì)背景得到的背景圖像如圖5中的(B)所示。
當(dāng)然，也可以采用現(xiàn)有技術(shù)已知的其它方法來逐行估計(jì)背景圖像。
回到圖l，根據(jù)估計(jì)器101獲得的背景圖像和文檔圖像，計(jì)算器102確定像素的二值化所需的比較閾值。具體地，計(jì)算器102針對文檔圖像的每個像素，計(jì)算以該像素為中心的像素區(qū)域中所有像素到背景圖像的平均距離r，并計(jì)算該像素的背景灰度級和與平均距離r正相關(guān)的量d之間的差t，以作為該像素的閾值。閾值t可以表示為t = B-f (r)，其中d = f (r)是與平均距離r正相關(guān)的量，B為估計(jì)的背景圖像中相應(yīng)像素的灰度級。所述平均距離r可以是像素區(qū)域中所有像素與估計(jì)的背景圖像中對應(yīng)像素的灰度級之差的平均值，但也可以是其它距離的平均值。像素區(qū)域可以具有任意形狀，例如圓形、多邊形等等。優(yōu)選地，像素區(qū)域可以是(2w+l) X (2w+l)的正方形。可以將像素區(qū)域的尺寸(例如寬度、長度、直徑等)設(shè)置為大于某個值，使得區(qū)域內(nèi)至少包含背景像素。例如，可以將像素區(qū)域的尺寸設(shè)置為大于文字的平均或最大筆劃寬度。優(yōu)選地，可以將像素區(qū)域沿線條方向(在本實(shí)施例中為行方向)的尺寸設(shè)置為大于平均或最大筆劃寬度。在一個實(shí)施例中，像素區(qū)域的尺寸為ll個像素。
對于接近圖像邊界的像素，以其為中心的像素區(qū)域可能包含邊界以外的部分。對于這樣的情況，可以只針對像素區(qū)域內(nèi)的實(shí)際像素求平均值。圖3A示意性示出了計(jì)算器計(jì)算閾值的原理。如圖3A所示，強(qiáng)筆劃的像素與弱筆劃的像素與背景圖像的距離存在差別。對于每個像素，閾值的可能范圍為背景圖像的相應(yīng)像素的灰度級到該像素的灰度級的區(qū)間之內(nèi)。相應(yīng)地，根據(jù)文檔圖像中每個像素的灰度級確定相適應(yīng)的閾值，使得能夠?qū)崿F(xiàn)自適應(yīng)的二值化處理。
7
可以指定各種函數(shù)f(r)，只要其能夠反映正相關(guān)關(guān)系。優(yōu)選地，可以指定函數(shù)d二f(r) =kXr，0<k<2。在一個實(shí)施例中，k可以取值1。進(jìn)一步地，可以在確定閾值時考慮到噪聲(如圖3A所示)。例如，可以指定函數(shù)d=f (r) = kX (rn+|r-rn|)，0 < k < 2， rn為文檔圖像的估計(jì)噪聲。在一個實(shí)施例中，k可以取值l。 k越小，二值化后的筆劃越粗，k越大，二值化后的筆劃越細(xì)。可以采用現(xiàn)有技術(shù)的方法來估計(jì)文檔圖像的噪聲。圖3B示出了在應(yīng)用閾值時估計(jì)噪聲所產(chǎn)生的作用。如圖3B所示，在平均距離r小于估計(jì)噪聲rn的區(qū)間，會導(dǎo)致將像素視為背景，而在平均距離r大于估計(jì)噪聲rn的區(qū)間，會導(dǎo)致將像素視為文字。在一個實(shí)施例中，可將噪聲rn假定為20或25，或20至25之間的值。回到圖l，提取器103根據(jù)計(jì)算器102確定的閾值，從文檔圖像中提取出二值化圖像。例如，提取器103可以將文檔圖像的每個像素的灰度級與其相應(yīng)閾值進(jìn)行比較，將灰度級小于閾值的像素處理為文字像素，而將灰度級大于或等于閾值的像素處理為背景像素。提取器103提取的二值化圖像如圖5中的(C)所示。作為一個具體例子，設(shè)文檔圖像為I，估計(jì)得到的背景圖像為B，I中某像素點(diǎn)處的灰度級為gij(O到255之間)，B中該點(diǎn)的灰度級為bij(O到255之間)，以該點(diǎn)為中心的正方形窗大小為(2w+l) X (2w+l)，則計(jì)算該點(diǎn)處的閾值計(jì)算方法為
tij = birk(rn+|rirrn|) 其中rn為文檔圖像中的噪聲大小(rn設(shè)得越大，二值圖像中的噪聲越少，但弱筆劃的丟失越大)，r".為背景圖像與文檔圖像鄰域的差均值得到該點(diǎn)處的閾值之后，比較gij和tij，若gij < tij，則該點(diǎn)為筆劃點(diǎn)(純黑色0)，否則它為背景點(diǎn)(純白色255)。圖2是示出根據(jù)本發(fā)明實(shí)施例的用于文檔圖像的自適應(yīng)二值化方法的流程圖。
如圖2所示，方法從步驟200開始。在步驟202，根據(jù)在行方向上文檔圖像的每一組像素，估計(jì)該組的每個像素的背景灰度級，以獲得文檔圖像的背景圖像。在步驟204，針對文檔圖像的一個像素，計(jì)算以該像素為中心的像素區(qū)域中所有像素到背景圖像的平均距離r，并計(jì)算該像素的背景灰度級和與平均距離r正相關(guān)的量d之間的差t，以作為該像素的閾值。在步驟206，確定是否有未計(jì)算閾值的像素。如果有，則返回步驟204繼續(xù)計(jì)算。如果沒有，則前進(jìn)到步驟208，根據(jù)閾值從文檔圖像中提取出二值化圖像。像素區(qū)域可以具有任意形狀，例如圓形、多邊形等等。優(yōu)選地，像素區(qū)域可以是(2w+l) X (2w+l)的正方形?？梢詫⑾袼貐^(qū)域的尺寸(例如寬度、長度、直徑等)設(shè)置為大于某個值，使得區(qū)域內(nèi)至少包含背景像素。例如，可以將像素區(qū)域的尺寸設(shè)置為大于文字的平均或最大筆劃寬度。優(yōu)選地，可以將像素區(qū)域沿線條方向(在本實(shí)施例中為行方向)的尺寸設(shè)置為大于平均或最大筆劃寬度。在一個實(shí)施例中，像素區(qū)域的尺寸為ll個像素。對于接近圖像邊界的像素，以其為中心的像素區(qū)域可能包含邊界以外的部分。對于這樣的情況，可以只針對像素區(qū)域內(nèi)的實(shí)際像素求平均值。對于接近圖像邊界的像素，以其為中心的像素區(qū)域可能包含邊界以外的部分。對于這樣的情況，可以只針對像素區(qū)域內(nèi)的實(shí)際像素求平均值。所屬技術(shù)領(lǐng)域的普通技術(shù)人員明白，本發(fā)明的實(shí)施例也適用于在文檔圖像中分布有沿列方向延伸的線條，并且沿列方向存在手寫或打印的文字。在這樣的情況下，可以以每列的像素為單位來進(jìn)行背景圖像估計(jì)。此外，本發(fā)明的實(shí)施例也適用于其它文檔圖像灰度級范圍。并且，本發(fā)明的實(shí)施例也適用于其它文檔圖像灰度級表示，例如灰度級255代表純黑，灰度級0代表純白。在這種情況下，只需要例如將灰度級表示轉(zhuǎn)換成與圖1的實(shí)施例一致即可。圖6是示出根據(jù)本發(fā)明優(yōu)選實(shí)施例的用于文檔圖像的自適應(yīng)二值化設(shè)備600的框圖。在圖6的實(shí)施例中，文檔圖像中包含行、列兩個方向的線條背景。假定文檔圖像的灰度級為0到255?；叶燃?55代表純白，灰度級0代表純黑，并且文檔圖像具有淺灰度(即高灰度級)背景，深灰度(即低灰度級)文字。如圖6所示，自適應(yīng)二值化設(shè)備600包括估計(jì)器601、計(jì)算器602、提取器603和圖像合并器604。估計(jì)器601以文檔圖像的每一行的像素為一組，逐行處理文檔圖像。在處理中，估
計(jì)器601根據(jù)行方向上文檔圖像的每一組像素，估計(jì)該組的每個像素的背景灰度級，以獲
得文檔圖像的第一背景圖像。具體估計(jì)方法與前面參照估計(jì)器101描述的相同。圖8示意性示出了圖6的自適應(yīng)二值化設(shè)備處理文檔圖像的具體示例。原始文檔
圖像如圖8中的(A)所示，并且逐行估計(jì)背景得到的第一背景圖像如圖8中的(B)所示。回到圖6，根據(jù)估計(jì)器601獲得的第一背景圖像和文檔圖像，計(jì)算器602確定像素
的二值化所需的第一比較閾值。具體計(jì)算方法與前面參照計(jì)算器102描述的相同。提取器603根據(jù)計(jì)算器602確定的第一閾值，從文檔圖像中提取出第一二值化圖
像。具體提取方法與前面參照提取器103描述的相同。第一二值化圖像如圖8中的(D)所示。此外，估計(jì)器601還以文檔圖像的每一列的像素為一組，逐列處理文檔圖像。在處理中，估計(jì)器601根據(jù)列方向上文檔圖像的每一組像素，估計(jì)該組的每個像素的背景灰度級，以獲得文檔圖像的第二背景圖像。具體估計(jì)方法與前面參照估計(jì)器101描述的相同。原始文檔圖像如圖8中的(A)所示，并且逐列估計(jì)背景得到的第二背景圖像如圖8中的(C)所示。回到圖6，根據(jù)估計(jì)器601獲得的第二背景圖像和文檔圖像，計(jì)算器602還確定像素的二值化所需的第二比較閾值。具體計(jì)算方法與前面參照計(jì)算器102描述的相同。
提取器603還根據(jù)計(jì)算器602確定的第二閾值，從文檔圖像中提取出第二二值化圖像。具體提取方法與前面參照提取器103描述的相同。第二二值化圖像如圖8中的(E)所示。圖像合并器604獲得第一和第二二值化圖像間的邏輯與圖像，S卩，通過將第一和
第二二值化圖像中相應(yīng)像素的0或1的像素值進(jìn)行邏輯與運(yùn)算，得到的結(jié)果作為最終二值
化圖像中相應(yīng)像素的像素值。最終的二值化圖像如圖8中的(F)所示。圖7是示出根據(jù)本發(fā)明優(yōu)選實(shí)施例的用于文檔圖像的自適應(yīng)二值化方法的流程圖。如圖7所示，方法從步驟700開始。在步驟702，根據(jù)在行方向上文檔圖像的每一組像素，估計(jì)該組的每個像素的背景灰度級，以獲得文檔圖像的第一背景圖像。在步驟704，針對文檔圖像的一個像素，計(jì)算以該像素為中心的像素區(qū)域中所有像素到第一背景圖像的平均距離r，并計(jì)算該像素的背景灰度級和與平均距離r正相關(guān)的量d之間的差t，以作為該像素的第一閾值。在步驟706，確定是否有未計(jì)算第一閾值的像素。如果有，則返回步驟704繼續(xù)計(jì)算。如果沒有，則前進(jìn)到步驟708，根據(jù)第一閾值從文檔圖像中提取出第一二值化圖像。在步驟710，根據(jù)在列方向上文檔圖像的每一組像素，估計(jì)該組的每個像素的背景灰度級，以獲得文檔圖像的第二背景圖像。在步驟712，針對文檔圖像的一個像素，計(jì)算以該像素為中心的像素區(qū)域中所有像素到第二背景圖像的平均距離r，并計(jì)算該像素的背景灰度級和與平均距離r正相關(guān)的量d之間的差t，以作為該像素的第二閾值。在步驟714，確定是否有未計(jì)算第二閾值的像素。如果有，則返回步驟712繼續(xù)計(jì)算。如果沒有，則前進(jìn)到步驟716，根據(jù)第二閾值從文檔圖像中提取出第二二值化圖像。在步驟718，獲得第一和第二二值化圖像間的邏輯與圖像。像素區(qū)域可以具有任意形狀，例如圓形、多邊形等等。優(yōu)選地，像素區(qū)域可以是(2w+l) X (2w+l)的正方形?？梢詫⑾袼貐^(qū)域的尺寸(例如寬度、長度、直徑等)設(shè)置為大于某個值，使得區(qū)域內(nèi)至少包含背景像素。例如，可以將像素區(qū)域的尺寸設(shè)置為大于文字的平均或最大筆劃寬度。優(yōu)選地，可以將像素區(qū)域沿線條方向(在本實(shí)施例中為行方向)的尺寸設(shè)置為大于平均或最大筆劃寬度。在一個實(shí)施例中，像素區(qū)域的尺寸為ll個像素。對于接近圖像邊界的像素，以其為中心的像素區(qū)域可能包含邊界以外的部分。對于這樣的情況，可以只針對像素區(qū)域內(nèi)的實(shí)際像素求平均值。對于接近圖像邊界的像素，以其為中心的像素區(qū)域可能包含邊界以外的部分。對于這樣的情況，可以只針對像素區(qū)域內(nèi)的實(shí)際像素求平均值。雖然在圖6和圖7的實(shí)施例中先處理行方向再處理列方向，然而也可以先處理列方向再處理行方向。根據(jù)本發(fā)明的實(shí)施例，能夠?qū)⒗绫砀窬€的線條作為背景從文檔圖像中過濾掉。
此外，根據(jù)本發(fā)明的實(shí)施例，能夠處理退化的弱筆劃，并使強(qiáng)筆劃和弱筆劃在最終的二值化
圖像中具有近似相等的寬度。此外，根據(jù)本發(fā)明的實(shí)施例，在二值化圖像的空白區(qū)域中噪聲
較低。此外，根據(jù)本發(fā)明的實(shí)施例，能夠處理光照亮度變化的背景，以得到平滑的背景圖像，
從而能夠應(yīng)對光線變化背景的情況。本發(fā)明的設(shè)備和方法實(shí)現(xiàn)環(huán)境如圖9所示。在圖9中，中央處理單元(CPU)901根據(jù)只讀映射數(shù)據(jù)(ROM)902中存儲的程序或從存儲部分908加載到隨機(jī)存取映射數(shù)據(jù)(RAM)903的程序執(zhí)行各種處理。在RAM 903中，也根據(jù)需要存儲當(dāng)CPU 901執(zhí)行各種處理等等時所需的數(shù)據(jù)。 CPU 901、ROM 902和RAM 903經(jīng)由總線904彼此連接。輸入/輸出接口 905也連接到總線904。下述部件連接到輸入/輸出接口 905 :輸入部分906，包括鍵盤、鼠標(biāo)等等；輸出部分907，包括顯示器，比如陰極射線管(CRT)、液晶顯示器(LCD)等等，和揚(yáng)聲器等等；存儲部分908，包括硬盤等等；和通信部分909，包括網(wǎng)絡(luò)接口卡比如LAN卡、調(diào)制解調(diào)器等等。通信部分909經(jīng)由網(wǎng)絡(luò)比如因特網(wǎng)執(zhí)行通信處理。根據(jù)需要，驅(qū)動器910也連接到輸入/輸出接口 905?？刹鹦督橘|(zhì)911比如磁盤、光盤、磁光盤、半導(dǎo)體映射數(shù)據(jù)等等根據(jù)需要被安裝在驅(qū)動器910上，使得從中讀出的計(jì)算
10機(jī)程序根據(jù)需要被安裝到存儲部分908中。在通過軟件實(shí)現(xiàn)上述步驟和處理的情況下，從網(wǎng)絡(luò)比如因特網(wǎng)或存儲介質(zhì)比如可拆卸介質(zhì)911安裝構(gòu)成軟件的程序。本領(lǐng)域的技術(shù)人員應(yīng)當(dāng)理解，這種存儲介質(zhì)不局限于圖9所示的其中存儲有程序、與方法相分離地分發(fā)以向用戶提供程序的可拆卸介質(zhì)911。可拆卸介質(zhì)911的例子包含磁盤、光盤(包含光盤只讀映射數(shù)據(jù)(CD-ROM)和數(shù)字通用盤(DVD))、磁光盤(包含迷你盤(MD)和半導(dǎo)體映射數(shù)據(jù)。或者，存儲介質(zhì)可以是ROM 902、存儲部分908中包含的硬盤等等，其中存有程序，并且與包含它們的方法一起被分發(fā)給用戶。在前面的說明書中參照特定實(shí)施例描述了本發(fā)明。然而本領(lǐng)域的普通技術(shù)人員理解，在不偏離如權(quán)利要求書限定的本發(fā)明的范圍的前提下可以進(jìn)行各種修改和改變。
權(quán)利要求
一種用于文檔圖像的自適應(yīng)二值化設(shè)備，包括估計(jì)器，根據(jù)在行和列中的一個方向上文檔圖像的每一組像素，估計(jì)該組的每個像素的第一背景灰度級，以獲得文檔圖像的第一背景圖像；計(jì)算器，針對文檔圖像的每個像素，計(jì)算以該像素為中心的第一像素區(qū)域中所有像素到第一背景圖像的平均距離r，并計(jì)算該像素的第一背景灰度級和與平均距離r正相關(guān)的量d之間的差，以作為該像素的第一閾值；和提取器，根據(jù)第一閾值從文檔圖像中提取出第一二值化圖像，其中，第一背景灰度級的估計(jì)所基于的像素區(qū)間和第一像素區(qū)域的尺寸大于預(yù)定尺寸。
2. 如權(quán)利要求l所述的自適應(yīng)二值化設(shè)備，其中，估計(jì)器還根據(jù)在行和列中的另一個方向上文檔圖像的每一組像素，估計(jì)該組的每個像素的第二背景灰度級，以獲得文檔圖像的第二背景圖像，計(jì)算器還針對文檔圖像的每個像素，計(jì)算以該像素為中心的第二像素區(qū)域中所有像素到第二背景圖像的平均距離r，并計(jì)算該像素的第二背景灰度級和與平均距離r正相關(guān)的量d之間的差，以作為該像素的第二閾值，并且提取器還根據(jù)第二閾值從文檔圖像中提取出第二二值化圖像，其中，第二背景灰度級的估計(jì)所基于的像素區(qū)間和第二像素區(qū)域的尺寸大于所述預(yù)定尺寸，其中，所述自適應(yīng)二值化設(shè)備還包括圖像合并器，獲得第一和第二二值化圖像間的邏輯與圖像。
3. 如權(quán)利要求1或2所述的自適應(yīng)二值化設(shè)備，其中，在計(jì)算第一和第二閾值時，d = kXr，O < k < 2。
4. 如權(quán)利要求1或2所述的自適應(yīng)二值化設(shè)備，其中，在計(jì)算第一和第二閾值時，d = kX (rn+|r-rn|)，0 < k < 2， rn為文檔圖像的估計(jì)噪聲。
5. 如權(quán)利要求1或2所述的自適應(yīng)二值化設(shè)備，其中，所述估計(jì)器通過平均值或迭代多項(xiàng)式回歸來進(jìn)行估計(jì)。
6. —種用于文檔圖像的自適應(yīng)二值化方法，包括根據(jù)在行和列中的一個方向上文檔圖像的每一組像素，估計(jì)該組的每個像素的第一背景灰度級，以獲得文檔圖像的第一背景圖像；針對文檔圖像的每個像素，計(jì)算以該像素為中心的第一像素區(qū)域中所有像素到第一背景圖像的平均距離r，并計(jì)算該像素的第一背景灰度級和與平均距離r正相關(guān)的量d之間的差，以作為該像素的第一閾值；禾口根據(jù)第一閾值從文檔圖像中提取出第一二值化圖像，其中，一背景灰度級的估計(jì)所基于的像素區(qū)間和第一像素區(qū)域的尺寸大于預(yù)定尺寸。
7. 如權(quán)利要求6所述的自適應(yīng)二值化方法，還包括根據(jù)在行和列中的另一個方向上文檔圖像的每一組像素，估計(jì)該組的每個像素的第二背景灰度級，以獲得文檔圖像的第二背景圖像；針對文檔圖像的每個像素，計(jì)算以該像素為中心的第二像素區(qū)域中所有像素到第二背景圖像的平均距離r，并計(jì)算該像素的第二背景灰度級和與平均距離r正相關(guān)的量d之間的差，以作為該像素的第二閾值；根據(jù)第二閾值從文檔圖像中提取出第二二值化圖像；禾口獲得第一和第二二值化圖像間的邏輯與圖像，其中，第二背景灰度級的估計(jì)所基于的像素區(qū)間和第二像素區(qū)域的尺寸大于所述預(yù)定尺寸。
8. 如權(quán)利要求6或7所述的自適應(yīng)二值化方法，其中，在計(jì)算第一和第二閾值時，d = kXr，O < k < 2。
9. 如權(quán)利要求6或7所述的自適應(yīng)二值化方法，其中，在計(jì)算第一和第二閾值時，d = kX (rn+|r-rn|)，0 < k < 2， rn為文檔圖像的估計(jì)噪聲。
10. 如權(quán)利要求6或7所述的自適應(yīng)二值化方法，其中，通過平均值或迭代多項(xiàng)式回歸來進(jìn)行估計(jì)。
全文摘要
用于文檔圖像的自適應(yīng)二值化方法和設(shè)備。自適應(yīng)二值化設(shè)備包含估計(jì)器，根據(jù)在行和列中的一個方向上文檔圖像的每一組像素，估計(jì)該組的每個像素的第一背景灰度級，以獲得文檔圖像的第一背景圖像；計(jì)算器，針對文檔圖像的每個像素，計(jì)算以該像素為中心的第一像素區(qū)域中所有像素到第一背景圖像的平均距離r，并計(jì)算該像素的第一背景灰度級和與平均距離r正相關(guān)的量d之間的差，以作為該像素的第一閾值；和提取器，根據(jù)第一閾值從文檔圖像中提取出第一二值化圖像，其中，第一背景灰度級的估計(jì)所基于的像素區(qū)間和第一像素區(qū)域的尺寸大于預(yù)定尺寸。因而，能夠去除文檔圖像中的水平豎直方向上的線條，以利于提高字符識別率。
文檔編號G06K9/38GK101727583SQ20081017118
公開日2010年6月9日申請日期2008年10月22日優(yōu)先權(quán)日2008年10月22日
發(fā)明者堀田悅伸, 孫俊, 皆川明洋, 直井聰, 藤本克仁, 鄭大念申請人:富士通株式會社

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：鄭大念;孫俊;直井聰;堀田悅伸;皆川明洋;藤本克仁
技術(shù)所有人：富士通株式會社
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無損檢測
2、畢老師：機(jī)構(gòu)動力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點(diǎn)贊！

精彩留言，會給你點(diǎn)贊！

圖像自適應(yīng)二值化相關(guān)技術(shù)

自適應(yīng)二值化相關(guān)技術(shù)

自適應(yīng)閾值二值化相關(guān)技術(shù)

局部自適應(yīng)閾值二值化相關(guān)技術(shù)

自適應(yīng)二值化算法相關(guān)技術(shù)

局部自適應(yīng)二值化相關(guān)技術(shù)

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

用于文檔圖像的自適應(yīng)二值化方法和設(shè)備的制作方法