自適應(yīng)文本圖像的分割方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明設(shè)及圖像處理技術(shù),特別是設(shè)及一種自適應(yīng)文本圖像的分割方法。
【背景技術(shù)】
[0002] 圖像增強(qiáng)是指增強(qiáng)圖像中的有用信息,從而改善圖像的視覺效果。在相似性度量 中,常用的有歐氏距離計(jì)算、均方誤差評(píng)價(jià)、相關(guān)系數(shù)法和頻譜分析等方法。相似性度量對(duì) 于聚類、分類等常用機(jī)器學(xué)習(xí)算法都有很重要的意義。
[0003] 圖像分割在目標(biāo)檢測(cè)中有重要應(yīng)用。常用的分割算法在系統(tǒng)的處理過程中不能進(jìn) 行人工調(diào)節(jié)闊值。并且圖像分割算法需要設(shè)置參數(shù),并根據(jù)不同的圖像設(shè)置不同的參數(shù),才 能得到比較好的結(jié)果。但對(duì)于數(shù)據(jù)系統(tǒng)而言,在成千上萬的文本圖片,不可能針對(duì)不同的圖 像設(shè)置不同的參數(shù)。
【發(fā)明內(nèi)容】
[0004] 本發(fā)明提供的自適應(yīng)文本圖像的分割方法,可W有效地提高二值分割的準(zhǔn)確性。
[0005] 根據(jù)本發(fā)明的一方面,提供一種自適應(yīng)文本圖像的分割方法,包括;通過己氏距離 濾波器的第一濾波窗寬對(duì)圖像的灰度矩陣進(jìn)行濾波得到己氏距離矩陣;將所述己氏距離矩 陣通過最大滴分割算法進(jìn)行二值分割得到第一二值矩陣;所述第一二值矩陣通過鄰域信息 進(jìn)行糾錯(cuò)得到第二二值矩陣;所述第二二值矩陣通過游程直方圖進(jìn)行統(tǒng)計(jì)得到字符寬度; 根據(jù)所述字符寬度確定第二濾波窗寬;如果所述第二濾波窗寬與所述第一濾波窗寬相同, 則所述第二二值矩陣作為系統(tǒng)的輸出結(jié)果。
[0006] 本發(fā)明實(shí)施例提供的自適應(yīng)文本圖像的分割方法,通過己氏距離濾波器的第一濾 波窗寬對(duì)圖像的灰度矩陣進(jìn)行濾波得到己氏距離矩陣,將己氏距離矩陣通過最大滴分割算 法進(jìn)行二值分割得到第一二值矩陣,第一二值矩陣通過鄰域信息進(jìn)行糾錯(cuò)得到第二二值矩 陣,第二二值矩陣通過游程直方圖進(jìn)行統(tǒng)計(jì)得到字符寬度,根據(jù)字符寬度確定第二濾波窗 寬,如果第二濾波窗寬與第一濾波窗寬相同,則第二二值矩陣作為系統(tǒng)的輸出結(jié)果,從而可 W有效地提高二值分割的準(zhǔn)確性。
【附圖說明】
[0007] 圖1為本發(fā)明實(shí)施例提供的自適應(yīng)文本圖像的分割方法流程圖;
[000引圖2為本發(fā)明實(shí)施例提供的另一自適應(yīng)文本圖像的分割方法流程圖。
【具體實(shí)施方式】
[0009] 下面結(jié)合附圖對(duì)本發(fā)明實(shí)施例提供的自適應(yīng)文本圖像的分割方法進(jìn)行詳細(xì)描述。
[0010] 圖1為本發(fā)明實(shí)施例提供的自適應(yīng)文本圖像的分割方法流程圖。
[0011] 參照?qǐng)D1,在步驟S101,通過己氏距離濾波器的第一濾波窗寬對(duì)圖像的灰度矩陣 進(jìn)行濾波得到己氏距離矩陣。
[0012] 在步驟S102,將所述己氏距離矩陣通過最大滴分割算法進(jìn)行二值分割得到第一二 值矩陣。
[0013] 在步驟S103,所述第一二值矩陣通過鄰域信息進(jìn)行糾錯(cuò)得到第二二值矩陣。
[0014] 在步驟S104,所述第二二值矩陣通過游程直方圖進(jìn)行統(tǒng)計(jì)得到字符寬度。
[0015] 在步驟S105,根據(jù)所述字符寬度確定第二濾波窗寬。
[0016] 在步驟S106,如果所述第二濾波窗寬與所述第一濾波窗寬相同,則所述第二二值 矩陣作為系統(tǒng)的輸出結(jié)果。
[0017] 該里,通過所述掃描寬度直方圖對(duì)所述第二二值矩陣在0°、45°、90°和135° 四個(gè)方向下分別進(jìn)行統(tǒng)計(jì)得到四個(gè)方向的結(jié)果,將該四個(gè)方向的結(jié)果進(jìn)行加和得到一個(gè)最 終的統(tǒng)計(jì)結(jié)果,選取統(tǒng)計(jì)結(jié)果中選取出現(xiàn)比例最高的字符寬度作為系統(tǒng)認(rèn)定的字符寬度。
[0018] 進(jìn)一步地,所述方法還包括:
[0019] 如果所述第二濾波窗寬與所述第一濾波窗寬不相同,則己氏距離濾波器的第二濾 波窗寬對(duì)圖像的灰度矩陣進(jìn)行濾波。
[0020] 進(jìn)一步地,所述通過己氏距離濾波器的第一濾波窗寬對(duì)圖像的灰度矩陣進(jìn)行濾波 得到己氏距離矩陣包括:
[0021] 遍歷所述圖像的灰度矩陣的每個(gè)像素點(diǎn);
[0022] 所述每個(gè)像素點(diǎn)通過常數(shù)模板、高斯核利用所述己氏距離濾波器得到所述每個(gè)像 素點(diǎn)的己氏距離;
[0023] 所述每個(gè)像素點(diǎn)的己氏距離構(gòu)成己氏距離矩陣。
[0024] 該里,己氏距離矩陣由公式(1)可知:
[0025]
【主權(quán)項(xiàng)】
1. 一種自適應(yīng)文本圖像的分割方法,其特征在于,所述方法包括: 通過巴氏距離濾波器的第一濾波窗寬對(duì)圖像的灰度矩陣進(jìn)行濾波得到巴氏距離矩 陣; 將所述巴氏距離矩陣通過最大熵分割算法進(jìn)行二值分割得到第一二值矩陣; 所述第一二值矩陣通過鄰域信息進(jìn)行糾錯(cuò)得到第二二值矩陣; 所述第二二值矩陣通過游程直方圖進(jìn)行統(tǒng)計(jì)得到字符寬度; 根據(jù)所述字符寬度確定第二濾波窗寬; 如果所述第二濾波窗寬與所述第一濾波窗寬相同,則所述第二二值矩陣作為系統(tǒng)的輸 出結(jié)果。
2. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括: 如果所述第二濾波窗寬與所述第一濾波窗寬不相同,則巴氏距離濾波器的第二濾波窗 寬對(duì)圖像的灰度矩陣進(jìn)行濾波。
3. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述通過巴氏距離濾波器的第一濾波窗 寬對(duì)圖像的灰度矩陣進(jìn)行濾波得到巴氏距離矩陣包括: 遍歷所述圖像的灰度矩陣的每個(gè)像素點(diǎn); 所述每個(gè)像素點(diǎn)通過常數(shù)模板、高斯核利用所述巴氏距離濾波器得到所述每個(gè)像素點(diǎn) 的巴氏距離; 所述每個(gè)像素點(diǎn)的巴氏距離構(gòu)成巴氏距離矩陣。
4. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述將所述巴氏距離矩陣通過最大熵分 割算法進(jìn)行二值分割得到第一二值矩陣包括: 通過所述巴氏距離矩陣選取多個(gè)備選閾值點(diǎn); 通過最大熵分割方法分別對(duì)所述多個(gè)備選閾值點(diǎn)進(jìn)行評(píng)價(jià)得到多個(gè)評(píng)價(jià)值; 從所述多個(gè)評(píng)價(jià)值中選取最大的評(píng)價(jià)值; 將所述最大的評(píng)價(jià)值對(duì)應(yīng)的備選閾值點(diǎn)作為輸出的閾值。
5. 根據(jù)權(quán)利要求4的方法,其特征在于,所述通過所述巴氏距離矩陣選取多個(gè)備選閾 值點(diǎn)包括: 獲取所述巴氏距離矩陣中的最大值和最小值; 通過搜索精度對(duì)所述最大值和所述最小值之間的值進(jìn)行等分得到多個(gè)備選閾值點(diǎn)。
6. 根據(jù)權(quán)利要求4所述的方法,其特征在于,所述通過最大熵分割方法分別對(duì)所述多 個(gè)備選閾值點(diǎn)進(jìn)行評(píng)價(jià)得到多個(gè)評(píng)價(jià)值包括,重復(fù)執(zhí)行以下處理,直至所述多個(gè)備選閾值 點(diǎn)全部都被評(píng)價(jià): 根據(jù)所述備選閾值點(diǎn)的閾值將元素分為第一類和第二類; 分別統(tǒng)計(jì)所述第一類的概率分布直方圖和所述第二類的概率分布直方圖得到第一類 直方圖熵和第二類直方圖熵; 將所述第一類直方圖熵和所述第二類直方圖熵進(jìn)行運(yùn)算得到所述評(píng)價(jià)值。
7. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述分別統(tǒng)計(jì)所述第一類的概率分布直 方圖和所述第二類的概率分布直方圖得到第一類直方圖熵和第二類直方圖熵包括: 根據(jù)下式計(jì)算所述第一類直方圖熵和第二類直方圖熵:
其中,H(p| Qi)為所述第一類直方圖熵或所述第二類直方圖熵,p(x| Oi)為所述第一 類巴氏系數(shù)的概率分布直方圖或所述第二類的概率分布直方圖。
8. 根據(jù)權(quán)利要求4所述的方法,其特征在于,所述從所述多個(gè)評(píng)價(jià)值中選取最大的評(píng) 價(jià)值包括: 根據(jù)下式計(jì)算所述最大的評(píng)價(jià)值: k = arg max {//(/? | ω\) + Π(ρ \ ω2)) 其中,所述最大的評(píng)價(jià)值,Η(ρ| ω?)為所述第一類巴氏系數(shù)分布的熵,Η(ρ| ω2) 為所述第二類巴氏系數(shù)分布的熵。
9. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述第一二值矩陣通過鄰域信息進(jìn)行糾 錯(cuò)得到第二二值矩陣包括: 根據(jù)所述字符寬度確定像素點(diǎn)的鄰域邊長(zhǎng)、第一糾錯(cuò)閾值和第二糾錯(cuò)閾值; 如果第一像素點(diǎn)的周圍的像素點(diǎn)的字符點(diǎn)個(gè)數(shù)大于所述第一閾值,則將所述第一像素 點(diǎn)糾正為所述字符點(diǎn); 如果所述第一像素點(diǎn)的周圍的像素點(diǎn)的字符點(diǎn)個(gè)數(shù)小于所述第二閾值,則將所述第一 像素點(diǎn)糾正為所述背景點(diǎn)。
10. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述字符寬度確定第二濾波窗 寬包括: 根據(jù)下式計(jì)算所述第二濾波窗寬: W1= 2*L0-1 其中,W1S所述第二濾波窗寬,L ^為所述字符寬度。
【專利摘要】本發(fā)明提供的自適應(yīng)文本圖像的分割方法,包括:通過巴氏距離濾波器的第一濾波窗寬對(duì)圖像的灰度矩陣進(jìn)行濾波得到巴氏距離矩陣;將所述巴氏距離矩陣通過最大熵分割算法進(jìn)行二值分割得到第一二值矩陣;所述第一二值矩陣通過鄰域信息進(jìn)行糾錯(cuò)得到第二二值矩陣;所述第二二值矩陣通過游程直方圖進(jìn)行統(tǒng)計(jì)得到字符寬度;根據(jù)所述字符寬度確定第二濾波窗寬;如果所述第二濾波窗寬與所述第一濾波窗寬相同,則所述第二二值矩陣作為系統(tǒng)的輸出結(jié)果。本發(fā)明可以有效地提高二值分割的準(zhǔn)確性。
【IPC分類】G06T7-00
【公開號(hào)】CN104867152
【申請(qǐng)?zhí)枴緾N201510275544
【發(fā)明人】陳李江, 劉寧
【申請(qǐng)人】北京云江科技有限公司
【公開日】2015年8月26日
【申請(qǐng)日】2015年5月26日