欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種掃描文檔圖像的傾斜校正方法與流程

文檔序號(hào):12273000閱讀:5200來(lái)源:國(guó)知局

本發(fā)明涉及文檔圖像自動(dòng)處理技術(shù)領(lǐng)域,特別涉及一種掃描文檔圖像的傾斜校正方法。



背景技術(shù):

文檔圖像自動(dòng)處理的目的是在數(shù)字圖像中識(shí)別文字,圖形和圖片,并按照需要提取信息。其中,文字處理包括:版面分析,切分出段落,行和單字,然后進(jìn)行OCR中的識(shí)別。在OCR識(shí)別中,文本圖像經(jīng)常會(huì)出現(xiàn)一定角度的傾斜。因?yàn)閳D像的傾斜使OCR中字符分割發(fā)生困難,3度以上的傾斜會(huì)引起字符明顯變形,使大部分OCR方法難以適應(yīng)。為了將傾斜的文本圖像校正,以便于字符識(shí)別中的后續(xù)處理,快速準(zhǔn)確的檢測(cè)傾斜文本圖像的傾角成為一項(xiàng)重要的預(yù)處理技術(shù)。

目前對(duì)文檔圖像傾角檢測(cè)的方法主要有基于Hough變換的方法,基于交叉相關(guān)性的方法,基于投影特征的方法,基于Fourier變換的方法和基于K-最近鄰簇的方法。

其中,Hough變換是最常用的傾斜角檢測(cè)的方法,但基于Hough算法的計(jì)算量非常大,導(dǎo)致該方法應(yīng)用難度大。交叉相關(guān)算法是一種基于等距離的水平平行線上的像素點(diǎn)的相關(guān)性的方法,雖然計(jì)算得到的準(zhǔn)確率很高,但是同樣的存在計(jì)算量過(guò)大的問(wèn)題。

使用文本行投影進(jìn)行變換,只根據(jù)文本行就可以計(jì)算文檔圖像的傾斜角度。對(duì)圖像中的直線可使用鏈碼方法進(jìn)行標(biāo)記,對(duì)有效點(diǎn)進(jìn)行標(biāo)記和標(biāo)記合并,根據(jù)直線的邊緣點(diǎn)進(jìn)行直線擬合是比較穩(wěn)定可靠的方法,基于投影方法的改進(jìn),提出了兩級(jí)邊緣投影直方圖差的算法?;诖?,本發(fā)明設(shè)計(jì)了一種掃描文檔圖像的傾斜校正方法。旨在提出一種快速的準(zhǔn)確的圖像傾斜校正方法,解決現(xiàn)有數(shù)字圖像字符識(shí)別業(yè)務(wù)中圖像的分割識(shí)別問(wèn)題,提高文檔信息采集,錄入準(zhǔn)確性、減少拒識(shí)率,提高產(chǎn)品的易操作性和可靠性。



技術(shù)實(shí)現(xiàn)要素:

本發(fā)明為了彌補(bǔ)現(xiàn)有技術(shù)的缺陷,提供了一種簡(jiǎn)單高效的掃描文檔圖像的傾斜校正方法。

本發(fā)明是通過(guò)如下技術(shù)方案實(shí)現(xiàn)的:

一種掃描文檔圖像的傾斜校正方法,其特征在于包括以下步驟:

(1)掃描圖像,尋找圖像邊緣標(biāo)記點(diǎn);

(2)首先在預(yù)定的角度范圍內(nèi)以一定角度步長(zhǎng)對(duì)選定的圖像邊緣標(biāo)記點(diǎn)做多方向投影,其次獲取投影直方圖;然后計(jì)算各角度投影直方圖的均方差,求出所有投影直方圖方差的最大差分,將對(duì)應(yīng)的投影角度作為傾角的粗略估值;最后以粗略估值為中心,以第1次投影步長(zhǎng)為半徑的角度范圍內(nèi),再次以給定的檢測(cè)精度為步長(zhǎng)進(jìn)行投影;重復(fù)第1次投影的工作,求出投影直方圖方差的最大值,以對(duì)應(yīng)的角度作為圖像傾角的檢測(cè)值;

(3)如果傾斜角度的絕對(duì)值小于設(shè)定值,不進(jìn)行圖像旋轉(zhuǎn);

(4)選取水平和垂直邊緣標(biāo)記點(diǎn)投影計(jì)算出的較小的角度作為傾斜角,對(duì)圖像照傾斜角度進(jìn)行旋轉(zhuǎn)變換。

所述步驟(1)中,首先根據(jù)圖像尺寸設(shè)置檢測(cè)步長(zhǎng),對(duì)圖像上、下、左、右四個(gè)區(qū)域進(jìn)行檢測(cè);然后根據(jù)檢測(cè)步長(zhǎng)從水平方向和垂直方向分別檢測(cè)圖像,找出邊緣標(biāo)記點(diǎn),對(duì)邊緣標(biāo)記點(diǎn)進(jìn)行投影。

所述步驟(2)中,選取次級(jí)步長(zhǎng)θ,且取值比允許的傾斜誤差稍大,按公式計(jì)算初級(jí)角度步長(zhǎng)θ1,計(jì)算公式為其中,θ1為初級(jí)步長(zhǎng),θ為次級(jí)步長(zhǎng),θmax為最大校正傾斜角度。

本發(fā)明的有益效果是:該掃描文檔圖像的傾斜校正方法,采用邊緣標(biāo)記點(diǎn)兩級(jí)投影,提高了傾斜角的檢測(cè)速度,同時(shí)采用投影直方圖方差技術(shù),投影面積方差最大的角度就是要檢測(cè)的角度,只對(duì)邊緣點(diǎn)進(jìn)行投影,計(jì)算快速,在滿足檢測(cè)的精度的同時(shí)又能減少總的投影次數(shù);校正速度快且準(zhǔn)確率較高,滿足了字符識(shí)別預(yù)處理的要求。

具體實(shí)施方式

為了使本發(fā)明所要解決的技術(shù)問(wèn)題、技術(shù)方案及有益效果更加清楚明白,以下結(jié)合實(shí)施例,對(duì)本發(fā)明進(jìn)行詳細(xì)的說(shuō)明。應(yīng)當(dāng)說(shuō)明的是,此處所描述的具體實(shí)施例僅用以解釋本發(fā)明,并不用于限定本發(fā)明。

該掃描文檔圖像的傾斜校正方法,包括以下步驟:

(1)掃描圖像,尋找圖像邊緣標(biāo)記點(diǎn);

(2)首先在預(yù)定的角度范圍內(nèi)以一定角度步長(zhǎng)對(duì)選定的圖像邊緣標(biāo)記點(diǎn)做多方向投影,其次獲取投影直方圖;然后計(jì)算各角度投影直方圖的均方差,求出所有投影直方圖方 差的最大差分,將對(duì)應(yīng)的投影角度作為傾角的粗略估值;最后以粗略估值為中心,以第1次投影步長(zhǎng)為半徑的角度范圍內(nèi),再次以給定的檢測(cè)精度為步長(zhǎng)進(jìn)行投影;重復(fù)第1次投影的工作,求出投影直方圖方差的最大值,以對(duì)應(yīng)的角度作為圖像傾角的檢測(cè)值;

(3)如果傾斜角度的絕對(duì)值小于設(shè)定值,不進(jìn)行圖像旋轉(zhuǎn);

(4)選取水平和垂直邊緣標(biāo)記點(diǎn)投影計(jì)算出的較小的角度作為傾斜角,對(duì)圖像照傾斜角度進(jìn)行旋轉(zhuǎn)變換。

所述步驟(1)中,首先根據(jù)圖像尺寸設(shè)置檢測(cè)步長(zhǎng),對(duì)圖像上、下、左、右四個(gè)區(qū)域進(jìn)行檢測(cè);然后根據(jù)檢測(cè)步長(zhǎng)從水平方向和垂直方向分別檢測(cè)圖像,找出邊緣標(biāo)記點(diǎn),對(duì)邊緣標(biāo)記點(diǎn)進(jìn)行投影。

所述步驟(2)中,選取次級(jí)步長(zhǎng)θ,且取值比允許的傾斜誤差稍大,按公式計(jì)算初級(jí)角度步長(zhǎng)θ1,計(jì)算公式為其中,θ1為初級(jí)步長(zhǎng),θ為次級(jí)步長(zhǎng),θmax為最大校正傾斜角度。

該掃描文檔圖像的傾斜校正方法,采用邊緣標(biāo)記點(diǎn)兩級(jí)投影,提高了傾斜角的檢測(cè)速度,同時(shí)采用投影直方圖方差技術(shù),投影面積方差最大的角度就是要檢測(cè)的角度,只對(duì)邊緣點(diǎn)進(jìn)行投影,計(jì)算快速,在滿足檢測(cè)的精度的同時(shí)又能減少總的投影次數(shù);校正速度快且準(zhǔn)確率較高,滿足了字符識(shí)別預(yù)處理的要求。

當(dāng)前第1頁(yè)1 2 3 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
房山区| 逊克县| 南投县| 延吉市| 那曲县| 阿克陶县| 英德市| 信宜市| 攀枝花市| 内乡县| 汕尾市| 五常市| 屏东县| 家居| 多伦县| 齐齐哈尔市| 南召县| 正镶白旗| 常德市| 英德市| 淳安县| 梅河口市| 宁波市| 普定县| 玉溪市| 辽阳县| 九寨沟县| 仲巴县| 三台县| 汽车| 定州市| 平原县| 驻马店市| 谷城县| 右玉县| 大洼县| 汾西县| 静乐县| 麦盖提县| 姚安县| 嘉义市|