一種圖像的二值化方法及系統(tǒng)的制作方法

文檔序號(hào)：6651513閱讀：316來源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

專利名稱：一種圖像的二值化方法及系統(tǒng)的制作方法
技術(shù)領(lǐng)域：
本發(fā)明屬于計(jì)算機(jī)信息處理領(lǐng)域的圖像處理技術(shù)，具體涉及一種圖像的二值化方法及系統(tǒng)。
背景技術(shù)：
隨著數(shù)碼相機(jī)與攝像頭等數(shù)碼產(chǎn)品應(yīng)用的普遍，由這些數(shù)碼產(chǎn)品拍攝的圖像的文字識(shí)別也必將得到廣泛得應(yīng)用。通常，文字識(shí)別首先要進(jìn)行二值化，所謂的二值化，就是把彩色圖像或灰度圖像變?yōu)楹诎讏D像的過程，而這種黑白圖像的每個(gè)象素以1比特被編碼。二值化的方法大體上可以分為全局閾值法和局部閾值法，也有一些兩者結(jié)合的做法。全局閾值法是指對(duì)整幅圖像選取單一的閾值進(jìn)行二值化。局部閾值法指把圖像分成若干區(qū)域，對(duì)每一個(gè)區(qū)域或每一個(gè)象素點(diǎn)設(shè)定閾值，然后逐點(diǎn)對(duì)圖像二值化。全局閾值方法的計(jì)算速度較快，發(fā)展的也比較成熟。如以O(shè)tso方法為基礎(chǔ)的“一種二值化的方法”[中國(guó)專利申請(qǐng)?zhí)朇N200510080050.6，2005年11月9日公開]，對(duì)于處理大多數(shù)的掃描儀輸入的圖像已經(jīng)達(dá)到了很好的效果，但是由于數(shù)碼相機(jī)或攝像頭拍攝的圖像因光照、拍攝角度等原因，造成圖像背景深度嚴(yán)重的不均勻，用全局閾值法效果不盡人意。另一方面，局部閾值法僅考慮象素點(diǎn)的鄰域特性，以Bernsen法為例，該算法以局部窗口的最大、最小值平均為象素點(diǎn)的閾值，因此，當(dāng)窗口內(nèi)象素均為背景或筆劃，而其灰度又不均勻時(shí)就得到錯(cuò)誤的二值化結(jié)果，因此出現(xiàn)偽影現(xiàn)象。有些局部閾值法采用子圖像形式，如“基于局部最大方差分割的圖像二值化算法”[姚宇華等，微型電腦應(yīng)用，2003年第19卷第8期]，其對(duì)于子圖像的閾值求取依賴子圖像直方圖的雙峰特性，然而數(shù)碼相機(jī)拍攝的圖像，一般背景與前景的對(duì)比不突出，大部分子圖像直方圖都是單峰的，因此上述方法對(duì)于數(shù)碼相機(jī)圖像不適用。還有一些結(jié)合局部與全局的方法，如“基于目標(biāo)邊緣的圖像二值化方法研究”[鄭浩等，計(jì)量技術(shù)，2002年第4期]中描述了一種基于邊緣檢測(cè)的二值化方法，但其二值化效果受差分算子的選擇的影響較大，且求取邊緣時(shí)，速度較慢。

發(fā)明內(nèi)容
針對(duì)現(xiàn)有技術(shù)中存在的缺陷，本發(fā)明的目的是提供一種圖像的二值化方法及系統(tǒng)，該方法及系統(tǒng)能夠很好的解決由數(shù)碼相機(jī)等拍攝的圖像，因?yàn)楣庹盏葐栴}引起的背景深度不均勻的問題。同時(shí)，本發(fā)明利用掃描圖像時(shí)直接得到的象素之間的跳變信息來判斷圖像塊的前景、背景屬性，加上三個(gè)等級(jí)特征的相互參考，對(duì)象素的前景、背景判斷快速、準(zhǔn)確，從而最終能夠獲得適合OCR識(shí)別的黑白圖像。
為達(dá)到以上目的，本發(fā)明采用的技術(shù)方案是一種圖像的二值化方法，包括以下步驟(1)將輸入的文檔轉(zhuǎn)換為數(shù)字圖像數(shù)據(jù)；(2)首先將圖像按三個(gè)等級(jí)分塊，分別為整體級(jí)、子圖像區(qū)域級(jí)、象素區(qū)域級(jí)，然后掃描統(tǒng)計(jì)三個(gè)等級(jí)各塊的特征值；(3)計(jì)算出整體級(jí)和子圖像區(qū)域級(jí)各塊的閾值；(4)根據(jù)步驟(2)和步驟(3)得到的數(shù)據(jù)對(duì)子圖像區(qū)域級(jí)的特征值進(jìn)行修正；(5)根據(jù)修正后的特征值對(duì)圖像逐點(diǎn)二值化。
更進(jìn)一步，為使本發(fā)明具有更好的效果，步驟(2)中，所述的整體級(jí)是整幅圖像為一個(gè)塊，子圖像區(qū)域級(jí)是將圖像分成若干個(gè)子圖像，所述的子圖像是固定大小的，或者是根據(jù)整體級(jí)圖像的大小，按比例確定，每一個(gè)子圖像塊不小于128×128個(gè)象素點(diǎn)；象素區(qū)域級(jí)是以n*n的象素點(diǎn)陣為一塊，其中n為正整數(shù)，n小于等于16。
步驟(2)中，掃描統(tǒng)計(jì)三個(gè)等級(jí)各塊的特征值是按如下方法實(shí)現(xiàn)的依次掃描每一個(gè)象素點(diǎn)，對(duì)于每一個(gè)象素點(diǎn)，根據(jù)其所在圖像的位置，確定其在各級(jí)上分別屬于哪個(gè)塊，然后將此象素的特征參與到其所屬的各級(jí)塊的特征統(tǒng)計(jì)中。
再進(jìn)一步，步驟2)中所述的各等級(jí)塊的特征值包括子圖像中每一塊的灰度直方圖、最大灰度值、最小灰度值、跳變灰度平均值、灰度跳變較大的象素?cái)?shù)；上述特征值中的灰度跳變是這樣求取的比較當(dāng)前象素點(diǎn)與其隔行或隔列象素點(diǎn)的灰度值，如果足夠大，灰度跳變象素?cái)?shù)加1，將每一個(gè)灰度差值累加，掃描完本塊內(nèi)所有象素后，累加的灰度差值與灰度跳變象素?cái)?shù)的商為該塊的灰度跳變均值。
步驟2)中灰度跳變的求取過程中，不是每?jī)蓚€(gè)象素的灰度差異都要累加，本發(fā)明首先設(shè)定一個(gè)基礎(chǔ)跳變值，只有兩象素灰度差異大于基礎(chǔ)跳變值的才參與累加計(jì)算，所述的基礎(chǔ)跳變值的經(jīng)驗(yàn)值在5-8之間。
進(jìn)一步，步驟(3)中，運(yùn)用各級(jí)統(tǒng)計(jì)出的灰度直方圖，用大津法求出整幅圖像和子圖像級(jí)中每一塊圖像的閾值。
進(jìn)一步，步驟(4)中根據(jù)步驟(2)和步驟(3)得到的數(shù)據(jù)對(duì)子圖像區(qū)域級(jí)的特征值進(jìn)行修正的方法包括以下步驟a.首先，設(shè)定一個(gè)參考跳變值。以子圖像區(qū)域級(jí)二值化閾值為橫坐標(biāo)，子圖像區(qū)域級(jí)跳變值為縱坐標(biāo)，將子圖像劃分在不同的區(qū)域中；b.然后，對(duì)不同區(qū)域的子圖像采取不同的分析方法；進(jìn)一步的，所述的分析方法如下a)圖像前景、背景交替較少并且背景比重較多的圖像，首先選擇該子圖像周圍跳變值較大的圖像，用這些跳變較大的子圖像的平均二值化閾值做為該子圖像的二值化閾值。如果該子圖像塊周圍沒有滿足條件的其他子圖像塊，那么就判斷一下該子圖像塊是否純粹的背景塊，如果是，就令該子圖像塊的二值化閾值為該子圖像塊最小灰度值-1，即二值化后，該圖像塊沒有前景象素。否則，令整體級(jí)閾值為該子圖像塊的二值化閾值。
b)對(duì)于可能存在部分連續(xù)的背景或前景的子圖像，參考象素區(qū)域級(jí)跳變重新掃描統(tǒng)計(jì)數(shù)據(jù)。
進(jìn)一步的，本發(fā)明所述的重新掃描過程中，首先確定一個(gè)最小精確跳變值，然后找到包含在子圖像級(jí)塊內(nèi)的所有象素級(jí)塊，只有滿足大于精確跳變值的象素級(jí)塊才參與重新掃描、統(tǒng)計(jì)數(shù)據(jù)。如果沒有足夠的滿足條件的象素級(jí)塊參與統(tǒng)計(jì)，那么就按1)的方法處理。與1)方法中處理不同的是，如果子圖像周圍沒有用于計(jì)算閾值的滿足條件的其他子圖像，閾值不作修改。
c)對(duì)于前景、背景交替較多的子圖像，不予修改。
步驟(5)中二值轉(zhuǎn)化的方法包括以下步驟(a)首先確定象素二值化主要遵循的3條規(guī)則即①灰度值越大，則說明象素點(diǎn)的顏色越淡，傾向于判斷為背景，反之亦然；②象素所屬子圖像區(qū)域級(jí)的子圖像塊內(nèi)跳變?cè)酱?，說明前景、背景變換越強(qiáng)烈，含有帶識(shí)別文字較多。③象素級(jí)塊內(nèi)跳變?cè)酱?，說明象素屬于邊緣象素的可能性較大。
(b)利用上述規(guī)則，對(duì)每一個(gè)象素做前景、背景判斷。
一種圖像的二值化系統(tǒng)，包括以下裝置圖像輸入裝置、分塊掃描裝置、閾值求取裝置、數(shù)據(jù)分析裝置及二值轉(zhuǎn)化裝置和輸出裝置；其中，圖像輸入裝置用于將輸入的文檔轉(zhuǎn)換為數(shù)字圖像數(shù)據(jù)；分塊掃描裝置用于將圖像按三個(gè)等級(jí)分塊并掃描統(tǒng)計(jì)三個(gè)等級(jí)各塊的特征值，所述的三個(gè)等級(jí)分塊分別為整體級(jí)、子圖像區(qū)域級(jí)、象素區(qū)域級(jí)；閾值求取裝置用于計(jì)算出整體級(jí)和子圖像區(qū)域級(jí)各塊的閾值；數(shù)據(jù)分析裝置用于根據(jù)分塊掃描裝置和閾值求取裝置得到各種特征值，對(duì)子圖像區(qū)域級(jí)的特征值進(jìn)行修正；二值轉(zhuǎn)化裝置用于將原始圖像轉(zhuǎn)換為黑白二值的圖像文件；輸出裝置用于輸出已被轉(zhuǎn)換黑白二值的圖像文件。
本發(fā)明的效果在于采用本發(fā)明所述的方法，可準(zhǔn)確快速的由灰度圖像得到適合于OCR識(shí)別的黑白圖像，尤其適用于用數(shù)碼相機(jī)、攝像頭等拍攝的，由于拍攝角度、光線、陰影等造成的背景色不均的圖像的二值化。

圖1是根據(jù)本發(fā)明所述系統(tǒng)的總體框圖；圖2是本發(fā)明實(shí)施例中進(jìn)行特征統(tǒng)計(jì)的流程圖；圖3是本發(fā)明實(shí)施例中數(shù)據(jù)分析的特征區(qū)域圖；圖4是本發(fā)明實(shí)施例中一個(gè)象素點(diǎn)二值化的流程圖；圖5是本發(fā)明所述方法與其他方法的效果對(duì)比圖，其中a、b、c分別是灰度圖、大津法效果圖、本發(fā)明效果圖。
具體實(shí)施例方式
下面結(jié)合附圖及具體實(shí)施方式
對(duì)本發(fā)明作進(jìn)一步的描述。
如圖1所示，一種圖像的二值化系統(tǒng)，包括圖像特征統(tǒng)計(jì)分析部分和逐點(diǎn)二值化部分，具體包括以下裝置圖像輸入裝置、分塊掃描裝置、閾值求取裝置、數(shù)據(jù)分析裝置及二值轉(zhuǎn)化裝置和輸出裝置。
其中，圖像特征統(tǒng)計(jì)分析部分包括圖像輸入裝置，它可以是掃描儀、傳真機(jī)或數(shù)碼相機(jī)等圖像輸入裝置，尤其適用于數(shù)碼相機(jī)或攝像頭拍攝的圖像。還包括掃描裝置、閾值求取裝置、數(shù)據(jù)分析裝置。
其中，圖像輸入裝置用于將輸入的文檔轉(zhuǎn)換為數(shù)字圖像數(shù)據(jù)；分塊掃描裝置用于將圖像按三個(gè)等級(jí)分塊并掃描統(tǒng)計(jì)三個(gè)等級(jí)各塊的特征值，所述的三個(gè)等級(jí)分塊分別為整體級(jí)、子圖像區(qū)域級(jí)、象素區(qū)域級(jí)；閾值求取裝置用于計(jì)算出整體級(jí)和子圖像區(qū)域級(jí)各塊的閾值；數(shù)據(jù)分析裝置用于根據(jù)分塊掃描裝置和閾值求取裝置得到各種特征值，對(duì)子圖像區(qū)域級(jí)的特征值進(jìn)行修正；二值轉(zhuǎn)化裝置用于將原始圖像轉(zhuǎn)換為黑白二值的圖像文件；輸出裝置用于輸出已被轉(zhuǎn)換黑白二值的圖像文件。
一種圖像的二值化方法，包括以下步驟(1)將輸入文檔轉(zhuǎn)換為數(shù)字圖像數(shù)據(jù)，所述的文檔可以是打印文檔、手寫文檔或其他形式的文檔；(2)首先將圖像按三個(gè)等級(jí)分塊，分別為整體級(jí)、子圖像區(qū)域級(jí)、象素區(qū)域級(jí)，然后掃描統(tǒng)計(jì)三個(gè)等級(jí)各塊的特征值；1)首先將圖像按三個(gè)等級(jí)分塊，第一個(gè)等級(jí)為整體級(jí)，即整幅圖像為一個(gè)塊；第二個(gè)等級(jí)為子圖像區(qū)域級(jí)，將圖像分成同等大小的幾個(gè)子圖像，如，將圖像分成10×10。因?yàn)槊恳蛔訄D像塊需要由大津法計(jì)算二值化閾值，因此每個(gè)子圖像塊不能過小，在圖像比較小的情況下，減少子圖像塊數(shù)目，令每一個(gè)子圖像塊不小于128×128個(gè)象素點(diǎn)。第三個(gè)等級(jí)為象素區(qū)域級(jí)，如8×8的象素點(diǎn)陣為一塊。
2)然后，依次掃描每一個(gè)象素點(diǎn)。如圖2所示，步驟(2)通過掃描裝置逐點(diǎn)統(tǒng)計(jì)圖像上的點(diǎn)，根據(jù)各點(diǎn)的灰度值記錄統(tǒng)計(jì)分析時(shí)需要的數(shù)據(jù)是按以下方法實(shí)現(xiàn)的。
對(duì)于每一個(gè)象素點(diǎn)，根據(jù)其所在圖像的位置，確定其在各級(jí)上分別屬于哪個(gè)塊，然后將此象素的特征參與到其所屬的各級(jí)塊的特征統(tǒng)計(jì)中。因?yàn)樗邢笏卦诘谝坏燃?jí)上均屬于同一塊，掃描時(shí)不必統(tǒng)計(jì)整體級(jí)的特征，掃描后由子圖像級(jí)的特征累加即可得到整體級(jí)的統(tǒng)計(jì)值。因此掃描過程中只統(tǒng)計(jì)子圖像級(jí)與象素級(jí)的特征值。
上述方法中的特征值包括子圖像中每一塊的灰度直方圖、最大灰度值、最小灰度值、跳變灰度平均值、灰度跳變較大的象素?cái)?shù)等。
上述特征值中的灰度跳變是這樣求取的比較當(dāng)前象素點(diǎn)與其隔行(或隔列)象素點(diǎn)的灰度值，如果足夠大，灰度跳變象素?cái)?shù)加1，將每一個(gè)灰度差值累加，掃描完本塊內(nèi)所有象素后，累加的灰度差值與灰度跳變象素?cái)?shù)的商為該塊的灰度跳變均值。上述比較的兩個(gè)象素也可以是相鄰的，但是隔行或隔列的兩象素之間在邊界上跳變更明顯，而對(duì)于非邊界則差異較小，因此效果更好。
上述灰度跳變的求取過程中，不是每?jī)蓚€(gè)象素的灰度差異都要累加，因?yàn)橄嘟耐瑢俦尘盎蚯熬暗膬上笏刂g也會(huì)有微小的差異，如果將這些微小的差異累加，與邊界間象素的差異共同參與跳變的計(jì)算，必定會(huì)抹煞跳變特征的突出性，因此，本發(fā)明首先設(shè)定一個(gè)基礎(chǔ)跳變值(基礎(chǔ)跳變值的經(jīng)驗(yàn)值在5-8之間)，兩象素灰度差異大于基礎(chǔ)跳變值的才參與累加計(jì)算。
本發(fā)明所述的掃描過程中，不必每一個(gè)象素都統(tǒng)計(jì)，實(shí)踐證明，隔行、隔列的抽取統(tǒng)計(jì)象素不會(huì)影響整塊的各種特征值，而且大大的減少了掃描時(shí)間。
(3)計(jì)算出整體級(jí)和子圖像區(qū)域級(jí)各塊的閾值；本實(shí)施例中，運(yùn)用各級(jí)統(tǒng)計(jì)出的灰度直方圖，用大津法求出整幅圖像和子圖像級(jí)中每一塊圖像的閾值，當(dāng)然，也可采用其他求取閾值的方法，比如平均灰度閾值法、數(shù)學(xué)期望法等。
(4)根據(jù)步驟(2)和步驟(3)得到的數(shù)據(jù)對(duì)子圖像區(qū)域級(jí)的特征值進(jìn)行修正；本發(fā)明所述的數(shù)據(jù)分析的過程就是進(jìn)一步使子圖像級(jí)二值化閾值精確的過程。數(shù)據(jù)分析裝置輸入的參數(shù)是掃描裝置和閾值求取裝置中得到的圖像各個(gè)級(jí)的特征值，輸出的是子圖像級(jí)每一塊子圖像相對(duì)精確的二值化閾值。首先，設(shè)定一個(gè)參考跳變值(經(jīng)驗(yàn)值為整體級(jí)平均跳變值與基礎(chǔ)跳變值的平均值)。以子圖像區(qū)域級(jí)二值化閾值為橫坐標(biāo)，子圖像區(qū)域級(jí)跳變值為縱坐標(biāo)，將子圖像劃分在不同的區(qū)域中。圖3示出按照本發(fā)明一個(gè)實(shí)施例數(shù)據(jù)分析過程中用到的特征區(qū)域圖。從圖3可以看到，根據(jù)子圖像二值化閾值與跳變值的不同，子圖像被分在3個(gè)不同的區(qū)域。本發(fā)明將對(duì)3個(gè)區(qū)域的子圖像采取不同的分析方法。
首先，A區(qū)域的子圖像跳變較小，二值化閾值偏高，則圖像前景、背景交替較少并且背景比重較多，對(duì)于這種特征的圖像，大津法計(jì)算得到的區(qū)域的閾值通常偏高，按此閾值二值化得到的圖像就會(huì)產(chǎn)生很多污點(diǎn)。對(duì)于A區(qū)域的子圖像，我們首先選擇該子圖像周圍跳變值較大的圖像，用這些跳變較大的子圖像的平均二值化閾值做為該子圖像的二值化閾值。如果該子圖像塊周圍沒有滿足條件的其他子圖像塊，那么就判斷一下該子圖像決是否純粹的背景塊，如果是，就令該子圖像塊的二值化閾值為該子圖像塊最小灰度值-1，即二值化后，該圖像塊沒有前景象素。
本發(fā)明所述的純粹背景塊的判斷如下，首先，子圖像塊的跳變閾值要較小，滿足小于基本跳變值與參考跳變值的均值，其次，子圖像的最小象素值要小于整體級(jí)二值化閾值，子圖像的最大象素值要大于整體級(jí)二值化閾值。
如果不能滿足上述兩個(gè)條件，令整體級(jí)閾值為該子圖像塊的二值化閾值。
B區(qū)域的子圖像跳變低于整體級(jí)跳變，說明該區(qū)域可能存在部分連續(xù)的背景或前景，因此，對(duì)于該區(qū)域的子圖像，要參考象素區(qū)域級(jí)跳變重新掃描統(tǒng)計(jì)數(shù)據(jù)。
本發(fā)明所述的重新掃描過程如下首先確定一個(gè)最小精確跳變值，認(rèn)為大于該精確跳變值的象素級(jí)塊中存在足夠的前背景交替，最小精確跳變值取在參考跳變值與整體級(jí)平均跳變值之間。
然后找到包含在子圖像級(jí)塊內(nèi)的所有象素級(jí)塊，將滿足大于精確跳變值的象素級(jí)塊重新掃描，統(tǒng)計(jì)數(shù)據(jù)，根據(jù)直方圖重新用大津法計(jì)算二值化閾值作為該子圖像塊的閾值。
如果沒有足夠的滿足條件的象素級(jí)塊參與統(tǒng)計(jì)，那么就像A區(qū)域的子圖像一樣，選擇子圖像周圍跳變值較大的圖像，用這些跳變較大的子圖像的平均二值化閾值做為該子圖像的二值化閾值。與A區(qū)域子圖像處理不同的是，如果子圖像周圍沒有用于計(jì)算閾值的滿足條件的其他子圖像，閾值不作修改。
C區(qū)域的子圖像跳變值較高，認(rèn)為這個(gè)區(qū)域的子圖像前景、背景交替較多，等同于包含很多的文本信息的區(qū)域，因此大津法計(jì)算得到的閾值較準(zhǔn)確，不予修改。
(5)二值轉(zhuǎn)化裝置對(duì)圖像逐點(diǎn)二值化，即將灰度圖像轉(zhuǎn)換為黑白二值的圖像文件。
本發(fā)明所述的象素二值化的流程主要遵循下列規(guī)則1.灰度值越大，則說明象素點(diǎn)的顏色越淡，傾向于判斷為背景，反之亦然。
2.象素所屬子圖像區(qū)域級(jí)的子圖像塊內(nèi)跳變?cè)酱?，說明前景、背景變換越強(qiáng)烈，含有帶識(shí)別文字較多。
3.象素級(jí)塊內(nèi)跳變?cè)酱?，說明象素屬于邊緣象素的可能性較大。
如圖4所示，一個(gè)象素二值化判斷的流程如下首先，根據(jù)以求取閾值裝置輸出的整體級(jí)閾值為中心，劃出一個(gè)隔離帶，隔離帶的上沿為整體級(jí)的最大閾值，下沿為整體級(jí)的最小閾值。令最大、最小閾值分別為Max_T，Min_T，整體級(jí)閾值為Whole_T，那么
Max_T＝Whole_T×(1+α)，Min_T＝Whole_T×(1-α)，其中α為一個(gè)固定的系數(shù)，經(jīng)驗(yàn)值為0.4。
根據(jù)現(xiàn)有的數(shù)據(jù)，可進(jìn)行二值化的部分圖像象素有下列幾種情況1.灰度值大于整體級(jí)最大閾值的，判斷為背景象素；2.灰度值小于整體級(jí)最小閾值，子圖像級(jí)塊內(nèi)灰度跳變較小(防止陰影區(qū)域的文字背景誤判)，且子圖像級(jí)塊的最大灰度大于閾值(防止無前景陰影區(qū)域誤判)的象素，判斷為前景象素。
3.灰度值大于整體級(jí)閾值，象素級(jí)灰度跳變較小，且象素級(jí)最大、最小灰度差較小的，判斷為背景象素。
如果象素不屬于上述三種情況，就根據(jù)雙線性差值求出象素級(jí)閾值。首先找出距離本象素點(diǎn)最近的四個(gè)子圖像級(jí)的子圖像塊，認(rèn)為每個(gè)子圖像塊的子圖像級(jí)閾值為該圖像塊中心點(diǎn)象素的二值化閾值，設(shè)四個(gè)中心點(diǎn)的閾值分別為TTL、TTR、TBL、TBR、WT、WB、WL、WR為對(duì)該象素點(diǎn)影響度的權(quán)值，則該象素點(diǎn)的閾值為T＝WT×(TTL×WL+TTR×WR)+WB×(TBL×WL+TBR×WR)；其中，上述權(quán)值由象素點(diǎn)到以四個(gè)中心點(diǎn)為頂點(diǎn)的長(zhǎng)方形(或正方形)上、下、左、右各邊的距離計(jì)算得到，與距離成反比。
根據(jù)象素點(diǎn)閾值與前期統(tǒng)計(jì)的其他特征值，大部分象素的二值化結(jié)果就都可以確定了。主要包括下述情況1.如果象素灰度值與象素點(diǎn)閾值相差較大，則象素灰度值大于閾值的判斷為背景，反之判斷為前景。
2.如果象素灰度值與象素點(diǎn)閾值相差不大，象素級(jí)灰度跳變較小，象素級(jí)最大灰度值與最小灰度值的差別也很小，說明該象素級(jí)區(qū)域存在邊界的可能性較小，如果該象素點(diǎn)的灰度值大于最大、最小灰度值的平均值，則判斷為背景。
3.若象素灰度值與象素點(diǎn)閾值差別很小，又不滿足上述條件，就要求取該象素的跳變狀態(tài)，來確定象素應(yīng)該判為背景還是前景。
在步驟求取該象素的跳變狀態(tài)中，設(shè)HT、HB、HL、HR分別為該象素相鄰的上、下、左、右象素與該象素本身的灰度差，若任意灰度差大于基礎(chǔ)跳變與一個(gè)系數(shù)(經(jīng)驗(yàn)值為1.5～2)的乘積，則認(rèn)為該象素屬于邊緣象素，要根據(jù)跳變狀態(tài)來確定，否則直接根據(jù)象素級(jí)閾值判斷。
確定為邊緣象素的通過下述幾種情況來判斷1.若HT、HB、HL、HR的和大于兩倍的基礎(chǔ)跳變，說明該象素是較周邊象素顏色較深的，判斷為前景；
2.若HT、HB、HL、HR的和小于負(fù)的基礎(chǔ)跳變的兩倍，說明該象素是較周邊象素顏色較淺的，判斷為背景；若不能滿足上述兩個(gè)條件，則用象素級(jí)最大值與最小值的平均值做為該象素的二值化閾值。
實(shí)驗(yàn)結(jié)果表明，通過采用本發(fā)明，二值化后的圖像能夠很好的規(guī)避由于拍攝角度不同對(duì)圖像造成的背景深淺不一致問題，且與其他復(fù)雜的區(qū)域二值化相比速度相對(duì)較快。
由此看來，本發(fā)明起到了顯著的優(yōu)化作用。
顯然，本領(lǐng)域的技術(shù)人員可以對(duì)本發(fā)明進(jìn)行各種改動(dòng)和變型而不脫離本發(fā)明的精神和范圍。這樣，倘若本發(fā)明的這些修改和變型屬于本發(fā)明權(quán)利要求及其等同技術(shù)的范圍之內(nèi)，則本發(fā)明也意圖包含這些改動(dòng)和變型在內(nèi)。
權(quán)利要求
1.一種圖像的二值化方法，包括以下步驟(1)將輸入的文檔轉(zhuǎn)換為數(shù)字圖像數(shù)據(jù)；(2)首先將圖像按三個(gè)等級(jí)分塊，分別為整體級(jí)、子圖像區(qū)域級(jí)、象素區(qū)域級(jí)，然后掃描統(tǒng)計(jì)三個(gè)等級(jí)各塊的特征值；(3)計(jì)算出整體級(jí)和子圖像區(qū)域級(jí)各塊的閾值；(4)根據(jù)步驟(2)和步驟(3)得到的數(shù)據(jù)對(duì)子圖像區(qū)域級(jí)的特征值進(jìn)行修正；(5)根據(jù)修正后的特征值對(duì)圖像逐點(diǎn)二值化。
2.如權(quán)利要求1所述的一種圖像的二值化方法，其特征是步驟(2)中，所述的整體級(jí)是整幅圖像為一個(gè)塊，子圖像區(qū)域級(jí)是將圖像分成若干個(gè)子圖像，所述的子圖像是固定大小的，或者是根據(jù)整體級(jí)圖像的大小，按比例確定，每一個(gè)子圖像塊不小于128×128個(gè)象素點(diǎn)；象素區(qū)域級(jí)是以n*n的象素點(diǎn)陣為一塊，其中n為正整數(shù)，n小于等于16。
3.如權(quán)利要求1所述的一種圖像的二值化方法，其特征是步驟(2)中，掃描統(tǒng)計(jì)三個(gè)等級(jí)各塊的特征值是按如下方法實(shí)現(xiàn)的依次掃描每一個(gè)象素點(diǎn)，對(duì)于每一個(gè)象素點(diǎn)，根據(jù)其所在圖像的位置，確定其在各級(jí)上分別屬于哪個(gè)塊，然后將此象素的特征參與到其所屬的各級(jí)塊的特征統(tǒng)計(jì)中。
4.如權(quán)利要求2所述的一種圖像的二值化方法，其特征是步驟2)中所述的各等級(jí)塊的特征值包括子圖像中每一塊的灰度直方圖、最大灰度值、最小灰度值、跳變灰度平均值、灰度跳變較大的象素?cái)?shù)。
5.如權(quán)利要求4所述的一種圖像的二值化方法，其特征是上述特征值中的灰度跳變是這樣求取的比較當(dāng)前象素點(diǎn)與其隔行或隔列象素點(diǎn)的灰度值，如果足夠大，灰度跳變象素?cái)?shù)加1，將每一個(gè)灰度差值累加，掃描完本塊內(nèi)所有象素后，累加的灰度差值與灰度跳變象素?cái)?shù)的商為該塊的灰度跳變均值。
6.如權(quán)利要求5所述的一種圖像的二值化方法，其特征是步驟2)中灰度跳變的求取過程中，首先設(shè)定一個(gè)基礎(chǔ)跳變值，只有兩象素灰度差異大于基礎(chǔ)跳變值的才參與累加計(jì)算，所述的基礎(chǔ)跳變值的經(jīng)驗(yàn)值在5-8之間。
7.如權(quán)利要求1、2、3、4、5或6所述的一種圖像的二值化方法，其特征是步驟(3)中，運(yùn)用各級(jí)統(tǒng)計(jì)出的灰度直方圖，用大津法求出整幅圖像和子圖像級(jí)中每一塊圖像的閾值。
8.如權(quán)利要求1、2、3、4、5或6所述的一種圖像的二值化方法，其特征是步驟(4)中根據(jù)步驟(2)和步驟(3)得到的數(shù)據(jù)對(duì)子圖像區(qū)域級(jí)的特征值進(jìn)行修正的方法包括以下步驟a.首先，設(shè)定一個(gè)參考跳變值，以子圖像區(qū)域級(jí)二值化閾值為橫坐標(biāo)，子圖像區(qū)域級(jí)跳變值為縱坐標(biāo)，將子圖像劃分在不同的區(qū)域中；b.然后，對(duì)不同區(qū)域的子圖像采取不同的分析方法；進(jìn)一步的，上述的分析方法如下a)圖像前景、背景交替較少并且背景比重較多的圖像，首先選擇該子圖像周圍跳變值較大的圖像，用這些跳變較大的子圖像的平均二值化閾值做為該子圖像的二值化閾值，如果該子圖像塊周圍沒有滿足條件的其他子圖像塊，那么就判斷一下該子圖像塊是否純粹的背景塊，如果是，就令該子圖像塊的二值化閾值為該子圖像塊最小灰度值-1，即二值化后，該圖像塊沒有前景象素。否則，令整體級(jí)閾值為該子圖像塊的二值化閾值；b)對(duì)于可能存在部分連續(xù)的背景或前景的子圖像，參考象素區(qū)域級(jí)跳變重新掃描統(tǒng)計(jì)數(shù)據(jù)；進(jìn)一步的，本發(fā)明所述的重新掃描過程中，首先確定一個(gè)最小精確跳變值，然后找到包含在子圖像級(jí)塊內(nèi)的所有象素級(jí)塊，只有滿足大于精確跳變值的象素級(jí)塊才參與重新扭描、統(tǒng)計(jì)數(shù)據(jù)，如果沒有足夠的滿足條件的象素級(jí)塊參與統(tǒng)計(jì)，那么就按a)的方法處理，與a)方法中處理不同的是，如果子圖像周圍沒有用于計(jì)算閾值的滿足條件的其他子圖像，閾值不作修改；c)對(duì)于前景、背景交替較多的子圖像，不予修改。
9.如權(quán)利要求1、2、3、4、5或6所述的一種圖像的二值化方法，其特征是步驟(5)中二值轉(zhuǎn)化的方法包括以下步驟(a)首先確定象素二值化主要遵循的3條規(guī)則即①灰度值越大，則說明象素點(diǎn)的顏色越淡，傾向于判斷為背景，反之亦然；②象素所屬子圖像區(qū)域級(jí)的子圖像塊內(nèi)跳變?cè)酱?，說明前景、背景變換越強(qiáng)烈，含有帶識(shí)別文字較多；③象素級(jí)塊內(nèi)跳變?cè)酱?，說明象素屬于邊緣象素的可能性較大；(b)利用上述規(guī)則，對(duì)每一個(gè)象素做前景、背景判斷。
10.一種圖像的二值化系統(tǒng)，包括以下裝置圖像輸入裝置、分塊掃描裝置、閾值求取裝置、數(shù)據(jù)分析裝置及二值轉(zhuǎn)化裝置和輸出裝置；其中，圖像輸入裝置用于將輸入的文檔轉(zhuǎn)換為數(shù)字圖像數(shù)據(jù)；分塊掃描裝置用于將圖像按三個(gè)等級(jí)分塊并掃描統(tǒng)計(jì)三個(gè)等級(jí)各塊的特征值，所述的三個(gè)等級(jí)分塊分別為整體級(jí)、子圖像區(qū)域級(jí)、象素區(qū)域級(jí)；閾值求取裝置用于計(jì)算出整體級(jí)和子圖像區(qū)域級(jí)各塊的閾值；數(shù)據(jù)分析裝置用于根據(jù)分塊掃描裝置和閾值求取裝置得到各種特征值，對(duì)子圖像區(qū)域級(jí)的特征值進(jìn)行修正；二值轉(zhuǎn)化裝置用于將原始圖像轉(zhuǎn)換為黑白二值的圖像文件；輸出裝置用于輸出已被轉(zhuǎn)換黑白二值的圖像文件。
全文摘要
本發(fā)明涉及一種圖像的二值化系統(tǒng)及方法，屬于計(jì)算機(jī)信息處理領(lǐng)域的圖像處理技術(shù)?，F(xiàn)有技術(shù)中，對(duì)于掃描儀輸入的圖像的二值化方法已經(jīng)很成熟，但是對(duì)于數(shù)碼相機(jī)或攝像頭拍攝的圖像，還存在偽影、計(jì)算復(fù)雜等問題。本發(fā)明所述的二值化方法按統(tǒng)計(jì)的象素范圍將對(duì)圖像的統(tǒng)計(jì)數(shù)據(jù)分為三個(gè)等級(jí)，并且提出了根據(jù)跳變確定圖像區(qū)域的屬性的方法，最后以上述統(tǒng)計(jì)的各級(jí)特征值為依據(jù)，對(duì)每個(gè)象素點(diǎn)進(jìn)行二值轉(zhuǎn)換。本發(fā)明所述二值化系統(tǒng)包括分塊掃描裝置、閾值求取裝置、數(shù)據(jù)分析裝置和二值轉(zhuǎn)化裝置。采用本發(fā)明所述的方法，統(tǒng)計(jì)快捷，精確度高。尤其用于數(shù)碼相機(jī)拍攝的圖像，二值化效果優(yōu)于其他方法。
文檔編號(hào)G06K9/38GK1790378SQ20051013237
公開日2006年6月21日申請(qǐng)日期2005年12月21日優(yōu)先權(quán)日2005年12月21日
發(fā)明者劉芝, 康凱申請(qǐng)人:北大方正集團(tuán)有限公司, 北京北大方正技術(shù)研究院有限公司, 北京大學(xué)

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：劉芝;康凱
技術(shù)所有人：北大方正集團(tuán)有限公司;北京北大方正技術(shù)研究院有限公司;北京大學(xué)
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無損檢測(cè)
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢(shì)感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

圖像二值化方法相關(guān)技術(shù)

圖像二值化的方法相關(guān)技術(shù)

圖像二值化相關(guān)技術(shù)

圖像二值化算法相關(guān)技術(shù)

matlab灰度圖像二值化相關(guān)技術(shù)

opencv圖像二值化相關(guān)技術(shù)

圖像二值化處理相關(guān)技術(shù)

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種圖像的二值化方法及系統(tǒng)的制作方法