一種文檔掃描圖像透字效應(yīng)消除方法
【專(zhuān)利摘要】本發(fā)明涉及一種文檔掃描圖像透字效應(yīng)消除方法,包括下面幾個(gè)步驟:灰度化;使用中值濾波處理;計(jì)算圖像的灰度值中值;文本區(qū)域與背景區(qū)域分離;利用K均值方法進(jìn)行正面文本與背面文本分離,分成:正面文本子集,對(duì)應(yīng)于類(lèi)心灰度值最低的子集;背面文本子集,對(duì)應(yīng)于類(lèi)心灰度值最大的子集;待確定文本子集,對(duì)應(yīng)于類(lèi)心灰度值在前兩者之間的子集;背面文本區(qū)域重新賦值。本發(fā)明能夠有效抑制雙面文檔掃描圖像中出現(xiàn)的透字效應(yīng),提高掃描圖像的可視質(zhì)量。
【專(zhuān)利說(shuō)明】一種文檔掃描圖像透字效應(yīng)消除方法
所屬【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及掃描文檔圖像恢復(fù)技術(shù),尤其是針對(duì)雙面文檔掃描圖像的透字效應(yīng)消除方法。
【背景技術(shù)】
[0002]當(dāng)掃描雙面打印或手寫(xiě)的文檔時(shí),一種常見(jiàn)的問(wèn)題是從正面能看到背面的文字。這種現(xiàn)象稱(chēng)為“透字效應(yīng)”。造成透字效應(yīng)的原因是背面文本吸收了部分反射光線。掃描紙張?jiān)奖?,或者反面文本的墨水滲透情況越嚴(yán)重,透字效應(yīng)越明顯。人們?cè)跇?gòu)建數(shù)字圖書(shū)館時(shí),經(jīng)常需要將時(shí)間久遠(yuǎn)的文獻(xiàn)或者手稿經(jīng)掃描轉(zhuǎn)化為數(shù)字圖像。由于紙張以及墨水的滲透情況,掃描后的文檔圖像中透字效應(yīng)很明顯,這會(huì)嚴(yán)重影響掃描文檔圖像的可視質(zhì)量。因此開(kāi)展對(duì)掃描文檔圖像 透字效應(yīng)消除方面的研究是非常有必要的。
[0003]早期文獻(xiàn)利用二值化處理消除掃描文檔中的透字現(xiàn)象[1],但處理后的圖像是以二值形式出現(xiàn)的,這種方法并不利于讀者閱讀原始文獻(xiàn)資料的需求。還有一些方法同時(shí)使用掃描文檔的正面和反面兩幅圖像來(lái)消除透字效應(yīng)[2][3][4]。所用技術(shù)包括線性成像模型[2]、盲信號(hào)分離(BSS) [3]、獨(dú)立成分分析(ICA) [4]、非負(fù)矩陣分解(NMF) [5]等。如果正反面兩掃描圖像嚴(yán)格對(duì)齊,使用這類(lèi)方法可以得到很好的消除效果。但在實(shí)際情況下,文檔對(duì)齊難以實(shí)現(xiàn)。特別是對(duì)于掃描文檔較厚,或者紙張本身存在明顯變形或者干擾的情況(如存放時(shí)間較長(zhǎng)的舊文獻(xiàn))。另外當(dāng)獲取的掃描文檔圖像只有單面時(shí),這種方法完全失效。還有一類(lèi)基于單幅掃描圖像的透字效應(yīng)去除方法。如Lins等[6]首先將圖像分為9個(gè)子塊,并使用訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)分類(lèi)器將各個(gè)子塊分為三類(lèi),分別對(duì)應(yīng)于較弱、一般和較強(qiáng)三種透字效應(yīng)干擾情況。對(duì)于不同情況的子塊,分別選取對(duì)應(yīng)的閾值分離正面文本區(qū)域,然后采用雙線性插值技術(shù)去除背面文本的干擾。此類(lèi)方法適用于掃描圖像的透字效應(yīng)去除,不適用于掃描文檔的透字效應(yīng)去除,而且,存在處理方法較為復(fù)雜的缺陷。
[0004]參考文獻(xiàn):
[0005][I] J.da Silva, R.Lins, F.Martins, etal.“A new and efficient algorithmto binarize document images removing back-to-front interference, ”Journal ofUniversal computer science, vol.14, n0.2, pp.299—313,2008.[0006][2]A.G.Sharma, ^Show-through cancellat1n in scans of duplex printeddocuments, ” IEEE Transact1ns on Image Processing, vol.10, n0.5, pp.736-754,2001.[0007][3]A.Tonazzini, E.Salerno, and L.Bedini, “Fast correct 1n ofbleed-through distort1n in grayscale documents by a blind source separat1ntechnique,,’Internat1nal Journal on Document Analysis and Recognit1n, vol.10, n0.1, pp.17-25,2007.[0008][4]A.Tonazzini, L.Bedini,and E.Salerno, “Independent component analysisfor document restorat1n, Internat1nal Journal on Document Analysis and Recognition, ” 2004, vol.7, n0.1, pp.17-27.[0009][5]F.Merrikh-Bayat, M.Babaie-Zadeh, and C.Jutten, “Using Non-NegativeMatrix Factorizat1n for Removing Show-Through, ” Internat1nal Conference on LVA/I CA, 2010.pp.482 - 489.[0010][6]R.Lins, J.Silva, S.Banergee, etal., “Enhancing the filtering-out ofthe back-to-front interference in color documents with a neural classifier,,’inInternat1nal Conference on Pattern Recognit1n (ICPR).1EEE, 2010, pp.2415-2419.
【發(fā)明內(nèi)容】
[0011]本發(fā)明的目的是提出一種針對(duì)文檔掃描圖像的透字效應(yīng)消除方法,能夠有效抑制雙面文檔掃描圖像中出現(xiàn)的透字效應(yīng),提高掃描圖像的可視質(zhì)量。本發(fā)明的技術(shù)方案如下:
[0012]一種文檔掃描圖像透字效應(yīng)消除方法,包括下列步驟:
[0013]步驟1:灰度化:用F表示待處理的彩色掃描文檔圖像,對(duì)其進(jìn)行灰度化處理,并用I表示灰度化圖像;
[0014]步驟2:圖像濾波:對(duì)灰度化圖像使用中值濾波處理圖像,用If表示濾波結(jié)果;
[0015]步驟3:獲取參數(shù):將If中各點(diǎn)的灰度值按照從小到大順序排列,并用IF(η) (η =1,2,…,N)表示,其中N為像素點(diǎn)總數(shù),其中If(I)代表1f中灰度值的最小值,If(N)表示If中灰度值最大值。選用IF(n)中排第I %和排第99%的灰度值,分別用Imin和Imax表示,使用Imin和Imax計(jì)算圖像的灰度值中值,用Imral表示;
[0016]步驟4:文本區(qū)域與背景區(qū)域分離:將I中各點(diǎn)的灰度值與Imed比較,得到背景區(qū)域二值圖,用Ibk表示,使用Inred提取文本區(qū)域圖像,用T表示,即有:
[0017]
【權(quán)利要求】
1.一種文檔掃描圖像透字效應(yīng)消除方法,包括下列步驟: 步驟1:灰度化:用F表示待處理的彩色掃描文檔圖像,對(duì)其進(jìn)行灰度化處理,并用I表示灰度化圖像; 步驟2:圖像濾波:對(duì)灰度化圖像使用中值濾波處理圖像,用If表示濾波結(jié)果; 步驟3:獲取參數(shù):將If中各點(diǎn)的灰度值按照從小到大順序排列,并用IF(n) (η =1,2,…,N)表示,其中N為像素點(diǎn)總數(shù),其中If(I)代表1f中灰度值的最小值,If(N)表示If中灰度值最大值。選用IF(n)中排第I %和排第99%的灰度值,分別用Imin和Imax表示,使用Imin和Imax計(jì)算圖像的灰度值中值,用Imral表示; 步驟4:文本區(qū)域與背景區(qū)域分離:將I中各點(diǎn)的灰度值與Inred比較,得到背景區(qū)域二值圖,用Ibk表示,使用Inred提取文本區(qū)域圖像,用T表示,即有:
【文檔編號(hào)】G06T5/00GK104036469SQ201410301425
【公開(kāi)日】2014年9月10日 申請(qǐng)日期:2014年6月27日 優(yōu)先權(quán)日:2014年6月27日
【發(fā)明者】王建, 劉長(zhǎng)波 申請(qǐng)人:天津大學(xué)