字符提取方法、裝置及終端的制作方法
【專(zhuān)利摘要】本發(fā)明是關(guān)于一種字符提取方法、裝置及終端,屬于圖像處理【技術(shù)領(lǐng)域】。方法包括:對(duì)于目標(biāo)圖像中的每一個(gè)像素點(diǎn),在預(yù)設(shè)數(shù)目個(gè)方向中的一個(gè)方向上,以像素點(diǎn)為中心,根據(jù)目標(biāo)圖像中字符線條的粗細(xì)程度,在目標(biāo)圖像中選擇一個(gè)區(qū)塊;根據(jù)區(qū)塊內(nèi)各個(gè)像素點(diǎn)的像素值,計(jì)算像素點(diǎn)在方向上的梯度對(duì)稱(chēng)相關(guān)度;根據(jù)各個(gè)像素點(diǎn)在預(yù)設(shè)數(shù)目個(gè)方向上的梯度對(duì)稱(chēng)相關(guān)度,在目標(biāo)圖像中進(jìn)行字符提取。本發(fā)明基于目標(biāo)圖像中各個(gè)像素點(diǎn)在預(yù)設(shè)數(shù)目個(gè)方向上的梯度對(duì)稱(chēng)相關(guān)度進(jìn)行字符提取,由于該種字符提取方式對(duì)大尺度的光照明暗變化情況魯棒,所以不但適用于印刷體圖像,還可適用于包含凸起區(qū)域的銀行卡或車(chē)牌等非印刷體圖像,該種字符提取方式具有較強(qiáng)的普適性。
【專(zhuān)利說(shuō)明】字符提取方法、裝置及終端
【技術(shù)領(lǐng)域】
[0001]本公開(kāi)涉及圖像處理【技術(shù)領(lǐng)域】,特別涉及一種字符提取方法、裝置及終端。
【背景技術(shù)】
[0002]隨著社會(huì)的不斷進(jìn)步,利用OCR (Optical Character Recognition,光學(xué)字符識(shí)另O)系統(tǒng)進(jìn)行字符識(shí)別已經(jīng)廣泛地應(yīng)用于各行各業(yè)中,如,通行證處理、安全文件處理(支票、財(cái)務(wù)文件、賬單)、郵件追蹤處理等。由于OCR系統(tǒng)在進(jìn)行字符識(shí)別時(shí),要求字符區(qū)域中的字符清晰、背景單一、分辨率高,所以為了使OCR系統(tǒng)能夠?qū)ψ址M(jìn)行有效識(shí)別,如何進(jìn)行字符提取,成為了一個(gè)關(guān)鍵問(wèn)題。
[0003]相關(guān)技術(shù)中,基于字符切分和顏色聚類(lèi)進(jìn)行字符提取。首先,將每一行包含多個(gè)字符的區(qū)域圖像,切分成只包含單個(gè)字符的若干個(gè)子區(qū)域圖像;之后,對(duì)于任一個(gè)子區(qū)域圖像來(lái)說(shuō),根據(jù)字符顏色特征對(duì)該子區(qū)域圖像進(jìn)行顏色聚類(lèi),分離出不同的顏色圖層;再者,從多個(gè)顏色圖層中找到包含最多字符信息的顏色圖層,并將該顏色圖層作為單個(gè)字符提取圖像;重復(fù)執(zhí)行上面兩個(gè)步驟,得到多幅單個(gè)字符提取圖像;最后,將得到的多幅單個(gè)字符提取圖像進(jìn)行拼接,得到整個(gè)字符提取圖像,將整個(gè)字符提取圖像輸入給OCR系統(tǒng)進(jìn)行識(shí)別。
[0004]在實(shí)現(xiàn)本公開(kāi)的過(guò)程中,發(fā)明人發(fā)現(xiàn)相關(guān)技術(shù)至少存在以下問(wèn)題:
[0005]在對(duì)銀行卡或車(chē)牌等表面凹凸不平的目標(biāo)物進(jìn)行字符提取時(shí),由于凸起區(qū)域可能存在強(qiáng)烈的反光和陰影,所以目標(biāo)物圖像的灰度可能分布不均勻,進(jìn)而在對(duì)由目標(biāo)圖像中提取的字符進(jìn)行識(shí)別時(shí),識(shí)別準(zhǔn)確率較低,該種字符提取方式不具有普適性。
【發(fā)明內(nèi)容】
[0006]為克服相關(guān)技術(shù)中存在的問(wèn)題,本公開(kāi)提供一種字符提取方法、裝置及終端。
[0007]根據(jù)本公開(kāi)實(shí)施例的第一方面,提供一種字符提取方法,所述方法包括:
[0008]對(duì)于目標(biāo)圖像中的每一個(gè)像素點(diǎn),在預(yù)設(shè)數(shù)目個(gè)方向中的一個(gè)方向上,以所述像素點(diǎn)為中心,根據(jù)所述目標(biāo)圖像中字符線條的粗細(xì)程度,在所述目標(biāo)圖像中選擇一個(gè)區(qū)塊;
[0009]根據(jù)所述區(qū)塊內(nèi)各個(gè)像素點(diǎn)的像素值,計(jì)算所述像素點(diǎn)在所述方向上的梯度對(duì)稱(chēng)相關(guān)度;
[0010]根據(jù)各個(gè)像素點(diǎn)在預(yù)設(shè)數(shù)目個(gè)方向上的梯度對(duì)稱(chēng)相關(guān)度,在所述目標(biāo)圖像中進(jìn)行字符提取。
[0011]可選地,當(dāng)所述方向?yàn)樗鱿袼攸c(diǎn)的水平右方向時(shí),所述根據(jù)所述區(qū)塊內(nèi)各個(gè)像素點(diǎn)的像素值,應(yīng)用如下公式,計(jì)算所述像素點(diǎn)在所述方向上的梯度對(duì)稱(chēng)相關(guān)度,包括:
[0012]
【權(quán)利要求】
1.一種字符提取方法,其特征在于,所述方法包括: 對(duì)于目標(biāo)圖像中的每一個(gè)像素點(diǎn),在預(yù)設(shè)數(shù)目個(gè)方向中的一個(gè)方向上,以所述像素點(diǎn)為中心,根據(jù)所述目標(biāo)圖像中字符線條的粗細(xì)程度,在所述目標(biāo)圖像中選擇一個(gè)區(qū)塊; 根據(jù)所述區(qū)塊內(nèi)各個(gè)像素點(diǎn)的像素值,計(jì)算所述像素點(diǎn)在所述方向上的梯度對(duì)稱(chēng)相關(guān)度; 根據(jù)各個(gè)像素點(diǎn)在預(yù)設(shè)數(shù)目個(gè)方向上的梯度對(duì)稱(chēng)相關(guān)度,在所述目標(biāo)圖像中進(jìn)行字符提取。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,當(dāng)所述方向?yàn)樗鱿袼攸c(diǎn)的水平右方向時(shí),所述根據(jù)所述區(qū)塊內(nèi)各個(gè)像素點(diǎn)的像素值,應(yīng)用如下公式,計(jì)算所述像素點(diǎn)在所述方向上的梯度對(duì)稱(chēng)相關(guān)度,包括:
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)各個(gè)像素點(diǎn)在預(yù)設(shè)數(shù)目個(gè)方向上的梯度對(duì)稱(chēng)相關(guān)度,在所述目標(biāo)圖像中進(jìn)行字符提取,包括: 對(duì)于多個(gè)像素點(diǎn)中的一個(gè)像素點(diǎn),從所述像素點(diǎn)在預(yù)設(shè)數(shù)目個(gè)方向上的梯度對(duì)稱(chēng)相關(guān)度中,確定小于第一預(yù)設(shè)閾值的梯度對(duì)稱(chēng)相關(guān)度; 將所述小于第一預(yù)設(shè)閾值的梯度對(duì)稱(chēng)相關(guān)度置O ; 確定所述像素點(diǎn)的鄰域,根據(jù)所述鄰域包括的像素點(diǎn)對(duì)應(yīng)的梯度對(duì)稱(chēng)相關(guān)度,對(duì)所述像素點(diǎn)在預(yù)設(shè)數(shù)目個(gè)方向上的梯度對(duì)稱(chēng)相關(guān)度進(jìn)行歸一化處理,得到所述像素點(diǎn)在預(yù)設(shè)數(shù)目個(gè)方向上的歸一化梯度對(duì)稱(chēng)相關(guān)度; 根據(jù)各個(gè)像素點(diǎn)在預(yù)設(shè)數(shù)目個(gè)方向上的歸一化梯度對(duì)稱(chēng)相關(guān)度,在所述目標(biāo)圖像中進(jìn)行字符提取。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述根據(jù)所述鄰域中包括的像素點(diǎn)對(duì)應(yīng)的梯度對(duì)稱(chēng)相關(guān)度,應(yīng)用下述公式,對(duì)所述像素點(diǎn)在預(yù)設(shè)數(shù)目個(gè)方向上的梯度對(duì)稱(chēng)相關(guān)度進(jìn)行歸一化處理,包括:
5.根據(jù)權(quán)利要求3所述的方法,其特征在于,根據(jù)各個(gè)像素點(diǎn)在預(yù)設(shè)數(shù)目個(gè)方向上的歸一化梯度對(duì)稱(chēng)相關(guān)度,在所述目標(biāo)圖像中進(jìn)行字符提取,包括:對(duì)于多個(gè)像素點(diǎn)中的一個(gè)像素點(diǎn),根據(jù)所述像素點(diǎn)在預(yù)設(shè)數(shù)目個(gè)方向上的歸一化梯度對(duì)稱(chēng)相關(guān)度,計(jì)算所述像素點(diǎn)的字符似然度; 在所述目標(biāo)圖像中確定字符似然度大于第二預(yù)設(shè)閾值的各個(gè)像素點(diǎn); 在所述字符似然度大于第二預(yù)設(shè)閾值的各個(gè)像素點(diǎn)中,將最多像素點(diǎn)聚集的圖像區(qū)域確定為字符所在區(qū)域。
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述根據(jù)所述像素點(diǎn)在預(yù)設(shè)數(shù)目個(gè)方向上的歸一化梯度對(duì)稱(chēng)相關(guān)度,應(yīng)用下述公式,計(jì)算所述像素點(diǎn)的字符似然度,包括:
7.一種字符提取裝置,其特征在于,所述裝置包括: 區(qū)塊選擇模塊,用于對(duì)于目標(biāo)圖像中的每一個(gè)像素點(diǎn),在預(yù)設(shè)數(shù)目個(gè)方向中的一個(gè)方向上,以所述像素點(diǎn)為中心,根據(jù)所述目標(biāo)圖像中字符線條的粗細(xì)程度,在所述目標(biāo)圖像中選擇一個(gè)區(qū)塊; 相關(guān)度計(jì)算模塊,用于根據(jù)所述區(qū)塊內(nèi)各個(gè)像素點(diǎn)的像素值,計(jì)算所述像素點(diǎn)在所述方向上的梯度對(duì)稱(chēng)相關(guān)度; 字符提取模塊,用于根據(jù)各個(gè)像素點(diǎn)在預(yù)設(shè)數(shù)目個(gè)方向上的梯度對(duì)稱(chēng)相關(guān)度,在所述目標(biāo)圖像中進(jìn)行字符提取。
8.根據(jù)權(quán)利要求7所述的裝置,其特征在于,當(dāng)所述方向?yàn)樗鱿袼攸c(diǎn)的水平右方向時(shí),所述相關(guān)度計(jì)算模塊,應(yīng)用如下公式,計(jì)算所述像素點(diǎn)在所述方向上的梯度對(duì)稱(chēng)相關(guān)度:
9.根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述字符提取模塊,包括: 相關(guān)度確定單元,用于對(duì)于多個(gè)像素點(diǎn)中的一個(gè)像素點(diǎn),從所述像素點(diǎn)在預(yù)設(shè)數(shù)目個(gè)方向上的梯度對(duì)稱(chēng)相關(guān)度中,確定小于第一預(yù)設(shè)閾值的梯度對(duì)稱(chēng)相關(guān)度; 相關(guān)度賦值單元,用于將所述小于第一預(yù)設(shè)閾值的梯度對(duì)稱(chēng)相關(guān)度置O ; 歸一化處理單元,用于確定所述像素點(diǎn)的鄰域,根據(jù)所述鄰域包括的像素點(diǎn)對(duì)應(yīng)的梯度對(duì)稱(chēng)相關(guān)度,對(duì)所述像素點(diǎn)在預(yù)設(shè)數(shù)目個(gè)方向上的梯度對(duì)稱(chēng)相關(guān)度進(jìn)行歸一化處理,得到所述像素點(diǎn)在預(yù)設(shè)數(shù)目個(gè)方向上的歸一化梯度對(duì)稱(chēng)相關(guān)度; 字符提取單元,用于根據(jù)各個(gè)像素點(diǎn)在預(yù)設(shè)數(shù)目個(gè)方向上的歸一化梯度對(duì)稱(chēng)相關(guān)度,在所述目標(biāo)圖像中進(jìn)行字符提取。
10.根據(jù)權(quán)利要求9所述的裝置,其特征在于,所述歸一化處理模塊,應(yīng)用下述公式,對(duì)所述像素點(diǎn)在預(yù)設(shè)數(shù)目個(gè)方向上的梯度對(duì)稱(chēng)相關(guān)度進(jìn)行歸一化處理:
11.根據(jù)權(quán)利要求9所述的裝置,其特征在于,所述字符提取單元,包括: 字符似然度計(jì)算子單元,用于對(duì)于多個(gè)像素點(diǎn)中的一個(gè)像素點(diǎn),根據(jù)所述像素點(diǎn)在預(yù)設(shè)數(shù)目個(gè)方向上的歸一化梯度對(duì)稱(chēng)相關(guān)度,計(jì)算所述像素點(diǎn)的字符似然度; 像素點(diǎn)確定子單元,用于在所述目標(biāo)圖像中確定字符似然度大于第二預(yù)設(shè)閾值的各個(gè)像素點(diǎn); 字符區(qū)域確定子單元,用于在所述字符似然度大于第二預(yù)設(shè)閾值的各個(gè)像素點(diǎn)中,將最多像素點(diǎn)聚集的圖像區(qū)域確定為字符所在區(qū)域。
12.根據(jù)權(quán)利要求11所述的裝置,其特征在于,所述字符似然度計(jì)算子單元,應(yīng)用下述公式,計(jì)算所述像素點(diǎn)的字符似然度:
13.—種終端,其特征在于,包括: 處理器; 用于存儲(chǔ)處理器可執(zhí)行指令的存儲(chǔ)器; 其中,所述處理器被配置為:對(duì)于目標(biāo)圖像中的每一個(gè)像素點(diǎn),在預(yù)設(shè)數(shù)目個(gè)方向中的一個(gè)方向上,以所述像素點(diǎn)為中心,根據(jù)所述目標(biāo)圖像中字符線條的粗細(xì)程度,在所述目標(biāo)圖像中選擇一個(gè)區(qū)塊;根據(jù)所述區(qū)塊內(nèi)各個(gè)像素點(diǎn)的像素值,計(jì)算所述像素點(diǎn)在所述方向上的梯度對(duì)稱(chēng)相關(guān)度;根據(jù)各個(gè)像素點(diǎn)在預(yù)設(shè)數(shù)目個(gè)方向上的梯度對(duì)稱(chēng)相關(guān)度,在所述目標(biāo)圖像中進(jìn)行字符提取。
【文檔編號(hào)】G06K9/20GK103955684SQ201410127565
【公開(kāi)日】2014年7月30日 申請(qǐng)日期:2014年3月31日 優(yōu)先權(quán)日:2014年3月31日
【發(fā)明者】王百超, 王琳, 陳志軍 申請(qǐng)人:小米科技有限責(zé)任公司