融入fft的綜合評(píng)價(jià)法的碎紙片縱橫切拼接復(fù)原算法
【專利摘要】本發(fā)明公開(kāi)了一種融入FFT的綜合評(píng)價(jià)的碎紙片縱橫切拼接復(fù)原算法。首先通過(guò)對(duì)圖像碎片進(jìn)行編碼,將其轉(zhuǎn)化為灰度矩陣并對(duì)其進(jìn)行二值化處理。利用FFT快速傅立葉變化,進(jìn)行頻域轉(zhuǎn)化,進(jìn)行頻域分析。之后分成兩種情況,對(duì)于中文,行的劃分依據(jù)是漢字的中心縱坐標(biāo);對(duì)于英文,行的劃分依據(jù)是字母的下端基線。然后,利用行匹配將所有的碎片行分類。利用FFT處理后邊緣矩陣的互相關(guān)系數(shù)大小和直接匹配法的匹配成功率進(jìn)行綜合評(píng)價(jià),用每個(gè)碎片的左右兩個(gè)邊分別與左右邊緣的兩邊進(jìn)行匹配,選取其中匹配度最高的完成匹配,重復(fù)直至完成行匹配。對(duì)其結(jié)果進(jìn)行人工干預(yù)。之后進(jìn)行間排序,此處依舊利用上述的綜合評(píng)價(jià)法實(shí)現(xiàn),之后對(duì)結(jié)果再進(jìn)行一次人工檢查與干預(yù),完成碎片的復(fù)原。
【專利說(shuō)明】融入FFT的綜合評(píng)價(jià)法的碎紙片縱橫切拼接復(fù)原算法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明主要運(yùn)用于中英文圖像拼接(文字拼接)領(lǐng)域,設(shè)計(jì)了一種融入FFT的綜合評(píng)價(jià)的碎紙片縱橫切拼接復(fù)原算法。
【背景技術(shù)】
[0002]快速傅里葉變換,是離散傅氏變換的快速算法,它是根據(jù)離散傅氏變換的奇、偶、虛、實(shí)等特性,對(duì)離散傅里葉變換的算法進(jìn)行改進(jìn)獲得的。它對(duì)傅氏變換的理論并沒(méi)有新的
發(fā)現(xiàn),但是對(duì)于在計(jì)算機(jī)系統(tǒng)或者說(shuō)數(shù)字系統(tǒng)中應(yīng)用離散傅立葉變換,可以說(shuō)是進(jìn)了一大步??焖俑凳献儞Q算法可以運(yùn)用到圖像拼接的領(lǐng)域。
【發(fā)明內(nèi)容】
[0003]單面印刷文字文件橫縱切碎片的復(fù)原
為了探尋兩個(gè)相鄰碎片間的關(guān)系,本算法將各個(gè)碎片編碼后矩陣的邊緣列進(jìn)行FFT快速傅里葉變換,因?yàn)樽罱K圖片的最左邊全為白色,所以首先可以得到原圖最左邊一列,再將該碎片的最右列和其他碎片的最左列逐一進(jìn)行互相關(guān)系數(shù)的計(jì)算,得出一族互相關(guān)系數(shù),選取其中結(jié)果最大的一列的碎片進(jìn)行匹配,得到最終結(jié)果。
[0004]傅里葉原理表明:任何連續(xù)測(cè)量的時(shí)序或信號(hào),都可以表示為不同頻率的正弦波信號(hào)的無(wú)限疊加。而根據(jù)該原理創(chuàng)立的傅里葉變換算法利用直接測(cè)量到的原始信號(hào),以累加方式來(lái)計(jì)算該信號(hào)中不同正弦波信號(hào)的頻率、振幅和相位。
[0005]對(duì)于信號(hào)的分析,很多情況下僅依靠時(shí)域是遠(yuǎn)遠(yuǎn)不夠的,很多時(shí)域上不好分析的信號(hào)轉(zhuǎn)入頻域的分析中,立即變得便于分析。本算法依據(jù)分析的需要,分別將每個(gè)灰度矩陣的左上角和右上角看作起點(diǎn),將0-1 二值矩陣一列的取值看作y軸,將離散的點(diǎn)看作t軸,對(duì)其進(jìn)行FFT處理。得到每個(gè)矩陣的邊緣列的頻譜。對(duì)它的特征進(jìn)行提取,并分別計(jì)算它與其它碎紙片邊緣的互相關(guān)系數(shù),進(jìn)行匹配。筆者認(rèn)為,頻譜特征接近,即互相關(guān)系數(shù)接近的兩個(gè)碎紙片處在相鄰的位置。
[0006]單面印刷文字橫縱切片的復(fù)原難度比僅有縱向切片文件的復(fù)原大很多,一方面在于碎紙片變多使得編程變得困難和程序運(yùn)行速度變慢,另一方面在于紙片變小導(dǎo)致的信息變少?gòu)亩沟闷ヅ涓子诎l(fā)生錯(cuò)誤。本算法闡述了研究過(guò)程中方案的探索和最終使用的方案的改進(jìn)。本算法分別對(duì)中文和英文的處理方法進(jìn)行了分析。
[0007]本算法對(duì)于這種方案進(jìn)行了分步處理。最后進(jìn)行了一次人工干預(yù),得到正確的結(jié)果。
[0008]本算法在此對(duì)中英文兩種情況進(jìn)行分別討論,不同特征。
[0009]一、中文文件的復(fù)原
本算法對(duì)于中文文件的復(fù)原主要經(jīng)過(guò)行分類、綜合評(píng)價(jià)體系的建立以及人工干預(yù)組成。其算法流程圖如圖1所示:
(1)行分類①分類方案的選取
首先,筆者經(jīng)過(guò)觀察發(fā)現(xiàn),不是所有的標(biāo)點(diǎn)都是全角的,所以不同行上面的字位置并不處在完全一樣的列上。所以對(duì)于碎片的處理不能通過(guò)列分類而實(shí)現(xiàn)。之后,筆者經(jīng)過(guò)觀察發(fā)現(xiàn),除去空行后,所有的碎片只有11種行的分布位置,所以可以先對(duì)它們進(jìn)行行分類,之后再對(duì)于每一行類別的碎片進(jìn)行相對(duì)位置的排序,即可恢復(fù)原文。
[0010]觀察事例圖片,本算法發(fā)現(xiàn)文字的漢字大小幾乎一致,對(duì)所有碎片中漢字的縱向高度進(jìn)行統(tǒng)計(jì),本算法發(fā)現(xiàn)漢字的縱向高度為38-41個(gè)像素,但是漢字的上下卻往往并不對(duì)齊,所以本算法對(duì)于所有漢字縱向的中心點(diǎn)縱坐標(biāo)進(jìn)行了記錄,根據(jù)這些縱坐標(biāo)的位置,并設(shè)定一個(gè)像素的閾值,對(duì)所有碎紙片進(jìn)行行分類。
[0011]觀察到事例圖片中的行間距一致,而且大多數(shù)正規(guī)文件的行間距幾乎一樣寬,所以本算法首先假定圖片中漢字的行間距一致,但是英文的行間距卻并不完全一致,因此,本算法改變思路,轉(zhuǎn)而去分析漢字高度。
[0012]因?yàn)槊總€(gè)漢字的高度有一定的出入,而且漢字的底也不太相同,再加上部分形如“一”的文字存在,所以本算法的分析思路基于漢字的中心點(diǎn)。為了證明這種想法的合理性,本算法對(duì)所有漢字縱向坐標(biāo)進(jìn)行分析,發(fā)現(xiàn)同一行的漢字中心縱坐標(biāo)處在閾值為1的區(qū)間內(nèi),所以用這種方法對(duì)漢字進(jìn)行行分類可以得到較好的結(jié)果。
[0013]②灰度矩陣的預(yù)處理
每個(gè)漢字的大小不完全一樣,一方面為了便于觀察,另一方面為了減少部分形如“翁”之類的漢字中間空白部分的干擾。本算法首先對(duì)灰度矩陣進(jìn)行預(yù)處理。因?yàn)楸倔w首先,將灰度矩陣以RGB值128作為閾值,轉(zhuǎn)化為0-1 二值矩陣。
[0014]之后,對(duì)生成的矩陣進(jìn)行掃描,從上到下并且橫向進(jìn)行,一旦在某一行中遇到有一個(gè)像素為黑色,便將整行變成黑色,直到結(jié)束為止。為了防止形如“翁”的字干擾后續(xù)檢驗(yàn)。此時(shí),再對(duì)矩陣進(jìn)行檢驗(yàn),將寬度小于20像素的白線全部變成黑色。
[0015]因?yàn)閳D片中的文本碎片均不含有噪音,所以噪音中黑點(diǎn)與白點(diǎn)的影響可以忽略不計(jì)。
[0016]為了顯示上述方法的處理效果,本算法選取一張?jiān)瓐D與一張?zhí)幚砗蟮膱D片進(jìn)行對(duì)t匕,為了使這種事例具有普遍性,本算法選取兩個(gè)典型圖進(jìn)行師范,如圖2、圖3所示,其處理結(jié)果分別如圖4,圖5所示。
[0017]經(jīng)過(guò)對(duì)上述效果的觀察,本預(yù)處理的效果十分明顯,結(jié)果也很成功。
[0018]③行分類的實(shí)施與結(jié)果
本算法先確定兩個(gè)邊緣列的碎片項(xiàng)。之后,本算法對(duì)于預(yù)處理后的矩陣進(jìn)行分析,統(tǒng)計(jì)出所有黑色部分的中心縱坐標(biāo)大小,對(duì)其進(jìn)行記錄,并設(shè)定閾值為1,對(duì)其進(jìn)行分類。
[0019]對(duì)于結(jié)果分析可得,該分類與其差別較小,可以對(duì)其進(jìn)行人工干預(yù),將每行之間的先后順序進(jìn)行排列,本部分的任務(wù)完成。
[0020](2)基于FFT信號(hào)處理的互相關(guān)系數(shù)模型
一種普遍的方法為:利用(1)中的圖片編碼方式,得出二值矩陣,首先利用碎片左側(cè)的邊緣找出最左邊的一個(gè)碎片,之后將灰度矩陣它最右邊一列分別與其他碎片最左邊一列進(jìn)行分別邏輯異或運(yùn)算,并將所有結(jié)果進(jìn)行求和,選取結(jié)果最大的一個(gè)碎片與其相連,但是這種方法的匹配成功率較低,所以本文采取了其他的方法。[0021]為了探尋兩個(gè)相鄰碎片間的關(guān)系,本算法將各個(gè)碎片編碼后矩陣的邊緣列進(jìn)行FFT快速傅里葉變換,因?yàn)樽罱K圖片的最左邊全為白色,所以首先可以得到原圖最左邊一列,再將該碎片的最右列和其他碎片的最左列逐一進(jìn)行互相關(guān)系數(shù)的計(jì)算,得出一族互相關(guān)系數(shù),選取其中結(jié)果最大的一列的碎片進(jìn)行匹配,得到最終結(jié)果。
[0022]傅里葉原理表明:任何連續(xù)測(cè)量的時(shí)序或信號(hào),都可以表示為不同頻率的正弦波信號(hào)的無(wú)限疊加。而根據(jù)該原理創(chuàng)立的傅里葉變換算法利用直接測(cè)量到的原始信號(hào),以累加方式來(lái)計(jì)算該信號(hào)中不同正弦波信號(hào)的頻率、振幅和相位。
[0023]對(duì)于信號(hào)的分析,很多情況下僅依靠時(shí)域是遠(yuǎn)遠(yuǎn)不夠的,很多時(shí)域上不好分析的信號(hào)轉(zhuǎn)入頻域的分析中,立即變得便于分析。本算法依據(jù)分析的需要,分別將每個(gè)灰度矩陣的左上角和右上角看作起點(diǎn),將0-1 二值矩陣一列的取值看作y軸,將離散的點(diǎn)看作t軸,對(duì)其進(jìn)行FFT處理。得到每個(gè)矩陣的邊緣列的頻譜。對(duì)它的特征進(jìn)行提取,并分別計(jì)算它與其它碎紙片邊緣的互相關(guān)系數(shù),進(jìn)行匹配。筆者認(rèn)為,頻譜特征接近,即互相關(guān)系數(shù)接近的兩個(gè)碎紙片處在相鄰的位置。
[0024](1)圖片編碼矩陣的FFT處理:
①FFT快速傅里葉變換與DFT離散傅里葉變換算法的比較:
對(duì)于任一離散序列χ(--)的父點(diǎn),其DFT計(jì)算公式如下所示:
【權(quán)利要求】
1.一種融入FFT的綜合評(píng)價(jià)的碎紙片縱橫切拼接復(fù)原算法。
2.其特征在于能夠進(jìn)行中英文單面橫縱切片的恢復(fù)。
3.如權(quán)利要求1一種融入FFT的綜合評(píng)價(jià)的碎紙片縱橫切拼接復(fù)原算法。
4.其特征在于它可以進(jìn)行中文和英文文件的復(fù)原。
5.如權(quán)利要求2—種融入FFT的綜合評(píng)價(jià)的碎紙片縱橫切拼接復(fù)原算法。
6.其特征在于,本算法對(duì)于中英文文件的復(fù)原主要經(jīng)過(guò)行分類、綜合評(píng)價(jià)匹配法、行排序和人工干預(yù)組成。
7.中文的行分類依靠行中心線,英文依靠行基線。
8.如權(quán)利要求2—種融入FFT的綜合評(píng)價(jià)的碎紙片縱橫切拼接復(fù)原算法。
9.其特征在于,每個(gè)漢字的大小不完全一樣,一方面為了便于觀察,另一方面為了減少部分形如“翁”之類的漢字中間空白部分的干擾。
10.本算法首先對(duì)灰度矩陣進(jìn)行預(yù)處理。
11.如權(quán)利要求2—種融入FFT的綜合評(píng)價(jià)的碎紙片縱橫切拼接復(fù)原算法。
12.其特征在于,本算法將各個(gè)碎片編碼后矩陣的邊緣列進(jìn)行FFT快速傅里葉變換,因?yàn)樽罱K圖片的最左邊全為白色,所以首先可以得到原圖最左邊一列,再將該碎片的最右列和其他碎片的最左列逐一進(jìn)行互相關(guān)系數(shù)和綜合評(píng)價(jià)值的計(jì)算,得出一族互相關(guān)系數(shù),選取其中結(jié)果最大的一列的碎片進(jìn)行匹配,得到最終結(jié)果。
13.如權(quán)利要求2—種融入FFT的綜合評(píng)價(jià)的碎紙片縱橫切拼接復(fù)原算法。
14.其特征在于,本發(fā)明認(rèn)為兩個(gè)相鄰的矩陣如果綜合評(píng)價(jià)值越高,則兩圖片的匹配度越好,選取匹配度最高的圖片進(jìn)行匹配。
15.因?yàn)榛f(xié)方差函數(shù)不能進(jìn)行歸一化處理,從而用量化的指標(biāo)來(lái)清楚地反映出兩個(gè)信號(hào)的相關(guān)系數(shù),所以本算法采用了基于信號(hào)處理從歸一化互相關(guān)系數(shù)模型去對(duì)兩個(gè)信號(hào)的相關(guān)系數(shù)進(jìn)行定量的衡量。
16.行匹配與列排序的方法一致,均靠綜合評(píng)價(jià)值去進(jìn)行匹配。
17.如權(quán)利要求2—種融入FFT的綜合評(píng)價(jià)的碎紙片縱橫切拼接復(fù)原算法。
18.其特征在于,英文文件的行分類要更難。
19.一方面每個(gè)英文字母的縱向高度不同,而且有的整體位置較高,有的整體位置較低,所以難以定位其每一行的位置,對(duì)字母進(jìn)行篩選;另一方面,因?yàn)橛⑽淖帜负芏喽加谢《龋倚畔⑤^少,所以英文文件經(jīng)過(guò)縱橫切片后更加難以復(fù)原。
20.其算法流程圖如圖6所示。
21.本算法中文文件和英文文件的區(qū)別主要在于數(shù)據(jù)的預(yù)處理和行分類上面。
【文檔編號(hào)】G06T3/40GK103679671SQ201310458541
【公開(kāi)日】2014年3月26日 申請(qǐng)日期:2014年1月12日 優(yōu)先權(quán)日:2014年1月12日
【發(fā)明者】王浩, 鄭智隆, 曹丹, 鄒孟霖, 于思奇, 孫翰斐, 李子祺, 張旭, 余冬琪 申請(qǐng)人:王浩