專利名稱:圖像畸變自動校正的圖像處理方法
技術(shù)領(lǐng)域:
本發(fā)明涉及的是一種圖像處理技術(shù)領(lǐng)域的方法,具體是一種圖像畸變自動校正的圖像處理方法。
背景技術(shù):
當(dāng)用數(shù)碼相機(jī)或者手機(jī)等拍攝設(shè)備拍攝名片、文本等資料時,所拍到的圖像往往會是傾斜的,而且名片、文本等本來矩形的物體會發(fā)生畸變而變成任意四邊形。其原因是在拍攝名片或者文本時,拍攝者并沒有正對并且垂直于被拍攝物體,而是距離被拍攝物有一定的水平距離和偏移角度。而拍攝者在拍攝這些資料時,很少會去正對并且垂直,因此,這種畸變現(xiàn)象非常常見,對人們讀取這些資料上面的信息或進(jìn)行文字處理時造成一些困難。
經(jīng)對現(xiàn)有技術(shù)文獻(xiàn)的檢索發(fā)現(xiàn),中國專利公開號CN1607824A,
公開日為2005年4月20日,發(fā)明名稱圖像處理系統(tǒng)及圖像處理方法和電子相機(jī)及圖像處理裝置。該發(fā)明描述了一套圖像處理系統(tǒng)及其處理方法,其圖像處理系統(tǒng)由電子照相機(jī)及圖像處理裝置組成。其中,電子照相機(jī)包括攝像部,圖像記錄部,加工信息取得部和加工信息記錄部,攝像部拍攝被拍攝體,圖像記錄部記錄由該攝像部拍攝到的圖像,加工信息取得部根據(jù)記錄在該圖像記錄部內(nèi)的圖像,取得在對該圖像的規(guī)定加工中使用的加工信息,加工信息記錄部將由該取得部取得的加工信息與取得源的圖像對應(yīng)記錄。圖像處理裝置,其具備對由電子照相機(jī)拍攝記錄的圖像,根據(jù)與該圖像度應(yīng)而由所述電子照相機(jī)記錄的加工信息,進(jìn)行規(guī)定加工的圖像處理部。該發(fā)明中,電子照相機(jī)拍攝到的圖像以再生模式顯示在監(jiān)視器上,如果用戶需要修正圖像畸變,那么用戶需要自己動手操作識別修正時成為基準(zhǔn)的四邊形的輪廓線,找到想要的輪廓線后,確定操作,將選擇的輪廓線的4個頂點(diǎn)的坐標(biāo)信息寫入顯示圖像的圖像文件的標(biāo)題部。之后,在修正時,圖像處理裝置從中讀取坐標(biāo)信息執(zhí)行修正操作。該技術(shù)發(fā)明需要用戶自己動手操作,不能實(shí)現(xiàn)自動校正,過程復(fù)雜,精確度不高,除了數(shù)碼相機(jī)外,還需要個人計算機(jī)(PC)和投影儀,設(shè)備復(fù)雜,處理過程比較緩慢。
另外,Photoshop軟件(美國Adobe公司開發(fā)的面向數(shù)字圖像處理的軟件)也可以實(shí)現(xiàn)圖像畸變校正的功能,但是必須要在個人計算機(jī)上實(shí)施,需要用戶動手調(diào)節(jié)校正角度,因此操作過程中會出現(xiàn)誤差,精確度不高,不能實(shí)現(xiàn)自動校正功能。而且該軟件只能對樓房等建筑物的梯形畸變進(jìn)行校正,不能夠校正名片、文本的形狀傾斜和臺形畸變,應(yīng)用范圍小。
發(fā)明內(nèi)容
本發(fā)明針對現(xiàn)有技術(shù)的不足,提供一種圖像畸變自動校正的圖像處理方法。本發(fā)明能夠校正名片、文本的形狀傾斜和臺形畸變,能夠快速的實(shí)現(xiàn)畸變校正,整個過程不需要人工參與,真正實(shí)現(xiàn)自動校正,易于實(shí)現(xiàn),操作簡單。
本發(fā)明是通過以下技術(shù)方案實(shí)現(xiàn)的,包括五個步驟(1)提取輪廓利用otsu算法(大津算法)進(jìn)行自動閾值分割,采用形態(tài)學(xué)方法進(jìn)行邊緣輪廓提取;(2)解析輪廓利用radon變換(奧地利數(shù)學(xué)家Radon提出的一種用于直線檢測的投影變換)將上步提取的邊緣輪廓以直線方程的形式解析出來,并且求得四個端點(diǎn)的坐標(biāo);(3)計算縱橫比建立成像設(shè)備內(nèi)部光學(xué)成像的數(shù)學(xué)模型,利用光學(xué)成像知識,建立方程組,求得縱橫比;(4)畸變校正利用兩組坐標(biāo)求得畸變校正矩陣對圖像進(jìn)行校正,校正過程中圖像的縱橫比保持不變;(5)校正補(bǔ)償利用數(shù)字識別的方法對校正后的圖像判斷上面的數(shù)字時候發(fā)生倒置的現(xiàn)象,選擇是否需要旋轉(zhuǎn)圖像,完成校正后的圖像進(jìn)行校正不成。
本發(fā)明中,首先提取名片、文本等四邊形的邊緣輪廓,將四條邊分離出來。其中,輪廓提取所用的大津算法,是一種自動閾值分割的快速方法。這種方法,能夠很快計算出彩色圖或者灰度圖的分割閾值,并將原圖轉(zhuǎn)換成二值圖。本發(fā)明中,利用名片、文本等與背景在亮度和色彩度上的差異,大津算法在閾值分割轉(zhuǎn)換成二值圖時將背景自動設(shè)為黑色,而名片等設(shè)為白色,因此,在得到的二值圖中,包括兩個部分黑色的背景和白色的名片或者文本。形態(tài)學(xué)提取邊界時,利用邊界提取算子對二值圖進(jìn)行運(yùn)算,可以將邊緣輪廓提取出來,這樣,得到一個白色四邊形的二值圖。
在解析輪廓時,用到的radon變換是一種直線檢測的算法。對步驟(1)得到的白色四邊形的二值圖應(yīng)用radon變換,得到有四個對應(yīng)亮點(diǎn)的radon變換圖。每個亮點(diǎn)對應(yīng)四邊形的一條邊,通過讀取亮點(diǎn)在radon變換圖上的對應(yīng)的XY坐標(biāo)值,可以把每條邊的直線解析式求出來。聯(lián)立每兩條邊,可以求出四邊形的四個端點(diǎn)坐標(biāo)。
成像設(shè)備內(nèi)部成像過程遵循透鏡成像規(guī)律。假設(shè)名片或者文本等矩形物長寬分別為l,m,相對于拍攝者矩形旋轉(zhuǎn)角為α,拍攝裝備的透鏡主光軸與拍攝平面夾角θ,矩形中心在拍攝區(qū)域所在的直角坐標(biāo)系中的坐標(biāo)為(x0,y0),拍攝區(qū)域中心到透鏡光心距離為D,光學(xué)系數(shù)為k,一共有8個未知參數(shù),可以用這8個參數(shù)將矩形的四個端點(diǎn)坐標(biāo)表示出來,然后利用兩條特殊光線過主光軸的光線以及平行于主光軸的光線將四個端點(diǎn)在成像屏上的坐標(biāo)求出來。這樣,再利用步驟(2)中求得的四邊形的四個端點(diǎn)坐標(biāo),可以聯(lián)立形成一個方程組,包括8個方程和8個未知數(shù),通過解方程組,可以求解出矩形的長寬比,也就是縱橫比。
進(jìn)行校正時,需要校正前四個端點(diǎn)的坐標(biāo),即步驟(2)中所求得的坐標(biāo),以及校正后四個端點(diǎn)的坐標(biāo)。可以用校正前的坐標(biāo),以及校正之后四邊形成為矩形的條件和校正之后保持求得的縱橫比的條件,求出校正后四個端點(diǎn)的坐標(biāo)。利用這兩組坐標(biāo)求得畸變校正矩陣進(jìn)行校正。
校正過程一方面將畸變的四邊形變?yōu)榫匦?,另一方面還要保持縱橫比不變。但是,校正之后,名片或者文本上面的文字信息對于讀者看來,可能是倒置的。因此,需要利用文字識別的技術(shù),判別名片上面的數(shù)字或英文字母是否倒置。如果是倒置的,那么旋轉(zhuǎn)圖像,再進(jìn)行判斷,以保證最后的結(jié)果中文字不顛倒。
本發(fā)明可以作為畸變校正子模塊嵌入成像設(shè)備內(nèi)部的中央處理模塊,使成像設(shè)備具有畸變自動校正功能?;冃U幽K在硬件上與中央處理模塊共享相同的數(shù)字信號處理芯片,軟件上使用本發(fā)明的數(shù)字圖像處理方法,在功能上實(shí)現(xiàn)畸變自動校正。
與現(xiàn)有技術(shù)相比,本發(fā)明能夠快速的實(shí)現(xiàn)畸變校正,整個過程不需要人工參與,真正實(shí)現(xiàn)自動校正。并且,引進(jìn)光學(xué)成像數(shù)學(xué)模型,求得名片、文本的原縱橫比,使校正結(jié)果保持原先的縱橫比不變,保證最后的校正結(jié)果形狀上不失真。最后,使用文字識別,確定名片、文本上面的文字信息沒有倒置,使用簡易方便。本發(fā)明可用于醫(yī)學(xué)成像、監(jiān)控設(shè)備、手機(jī)、數(shù)碼相機(jī)、數(shù)碼攝像機(jī)等大多數(shù)成像設(shè)備中,而且不需要在硬件上做大的改動,實(shí)現(xiàn)簡單。
圖1為本發(fā)明方法流程2為成像設(shè)備內(nèi)部光學(xué)成像數(shù)學(xué)模型。
圖3為拍攝區(qū)域的平面圖。
具體實(shí)施例方式
本發(fā)明利用radon變換快速的提取出名片、文本的四邊輪廓,利用輪廓頂點(diǎn)信息,對畸變圖像進(jìn)行校正,并且,建立拍攝設(shè)備內(nèi)部成像數(shù)學(xué)模型,建立包括名片、文本等縱橫比參數(shù)的方程組,通過解方程組的方法求出矩形物體的縱橫比并應(yīng)用到校正過程中,使最后的校正結(jié)果不會產(chǎn)生變形。最后,通過文字識別,識別校正之后的圖像是否出現(xiàn)倒置,判斷是否需要對校正之后的圖像進(jìn)行旋轉(zhuǎn),從而得到符合要求的校正結(jié)果。
如圖1所示,本發(fā)明的圖像處理方法包括五個步驟,分別為提取輪廓、解析輪廓、計算縱橫比、畸變校正、校正補(bǔ)償。
提取輪廓步驟包括兩個部分,自動閾值分割和形態(tài)學(xué)輪廓提取。自動閾值分割采用的是大津算法??紤]到名片或者文本與旁邊的背景在色彩度和亮度上的差異,采用大津算法能夠簡單快速的把名片或者文本與背景分開。應(yīng)用大津算法,將彩色圖或者灰度圖變?yōu)槎祱DBW,在二值圖BW上背景部分為黑色,而名片等成為一個白色的四邊形。然后,對二值圖BW應(yīng)用形態(tài)學(xué)邊界提取方法,其處理過程為用一個3×3的值全為1的矩陣腐蝕上面得到的二值圖BW,得到一個新的二值圖BW1,然后用BW減去BW1就得到需要的邊界輪廓二值圖BW2.在最后得到的二值圖BW2中,背景和四邊形的內(nèi)部全變成黑色,而只有四邊形的四條邊保持白色。這樣,白色四邊形的邊界輪廓就被提取出來。
解析輪廓步驟使用的是radon變換檢測直線的算法。radon變換可以理解為圖像在ρ-θ空間的投影,ρ-θ空間的每一點(diǎn)對應(yīng)圖像空間一條直線,而radon變換是圖像象素點(diǎn)在每條直線上的積分,也可理解為圖像順時針旋轉(zhuǎn)θ角度后在水平軸上的投影。因此圖像中每條直線會在ρ-θ空間形成一個亮點(diǎn),直線的檢測轉(zhuǎn)化為在ρ-θ變換域?qū)α咙c(diǎn)的檢測。因此,對輪廓提取步驟得到的邊界輪廓二值圖BW2應(yīng)用radon變換,可以發(fā)現(xiàn)在得到的radon變換圖上有四個明顯的亮點(diǎn),它們分別對應(yīng)四邊形的四條邊,利用四個亮點(diǎn)的ρ,θ值,可以準(zhǔn)確的四條邊的直線方程解析式寫出來。因此,邊界輪廓解析成功。分別聯(lián)立兩條邊的方程,可以將四個端點(diǎn)的坐標(biāo)求解出來。這四個端點(diǎn)在畸變校正中被稱為輸入點(diǎn)。
計算縱橫比步驟中,首先要建立一個成像設(shè)備內(nèi)部光學(xué)成像的數(shù)學(xué)模型。如圖2所示,成像設(shè)備的透鏡中心O與成像屏以及被照射區(qū)域(即成像區(qū)域)中心O’三點(diǎn)共線,建立如圖2所示坐標(biāo)系。其中,透鏡中心與成像區(qū)域中心距離為D,透鏡主光軸與成像區(qū)域所在的平面的夾角為θ。拍攝時,成像設(shè)備的透鏡組焦距為f,設(shè)備內(nèi)部成像光學(xué)系數(shù)為k。圖3為成像區(qū)域的平面圖。假設(shè)名片、文本等矩形物品的長為l,寬為m,矩形的中心在成像區(qū)域坐標(biāo)系中的坐標(biāo)為(x0,y0),相對于坐標(biāo)軸,矩形旋轉(zhuǎn)了α角。為了計算方便,令R=(l2)2+(m2)2]]>∂1=arctan(ml)-∂]]>∂2=arctan(lm)-∂]]>那么,在圖3所示的坐標(biāo)系中,矩形的四個端點(diǎn)的坐標(biāo)分別為(R×cos(1)+x0,R×sin(1)×sin(θ)+y0,-D+R×sin(1)×cos(θ)+y0×sin(θ))(-R×sin(2)+x0,R×cos(2)×sin(θ)+y0,-D+R×cos(2)×cos(θ)+y0×sin(θ))(R×sin(2)+x0,-R×cos(2)×sin(θ)+y0,-D-R×cos(2)×cos(θ)+y0×sin(θ))(-R×cos(1)+x0,-R×sin(1)×sin(θ)+y0,-D-R×sin(1)×cos(θ)+y0×sin(θ))利用這四個端點(diǎn)過透鏡之后折射到成像屏上的兩條特殊光線,可以求出這四個端點(diǎn)在成像屏上的像的坐標(biāo)。這兩條直線,一條是過透鏡光心的直線,方向不變,另外一條是平行于主光軸的直線,過透鏡之后折射經(jīng)過焦點(diǎn)后落到成像屏上。根據(jù)這兩條直線的方程就可以求出像點(diǎn)的坐標(biāo)。作后求得的四個端點(diǎn)對應(yīng)的像點(diǎn)在圖2所示的坐標(biāo)系中的XY坐標(biāo)分別為
(-f×[R×COS(∂1)+x0]D-f-R×sin(∂1)×cos(θ)-y0×sin(θ),]]>-f×[R×sin(∂1)×sin(θ)+y0]D-f-R×sin(∂1)×cos(θ)-y0×sin(θ))]]>(f×[R×sin(∂2)-x0]D-f-R×cos(∂2)×cos(θ)-y0×sin(θ),]]>-f×[R×cos(∂2)×sin(θ)+y0]D-f-R×cos(∂2)×cos(θ)-y0×sin(θ))]]>(-f×[R×sin(∂2)+x0]D-f+R×cos(∂2)×cos(θ)-y0×sin(θ),]]>f×[R×cos(∂2)×sin(θ)-y0]D-f+R×cos(∂2)×cos(θ)-y0×sin(θ))]]>(f×[R×cos(∂1)-x0]D-f+R×sin(∂1)×cos(θ)-y0×sin(θ),]]>f×[R×sin(∂1)×sin(θ)-y0]D-f+R×sin(∂1)×cos(θ)-y0×sin(θ))]]>再利用步驟(2)中,求得的圖像中四邊形的四個端點(diǎn)的坐標(biāo),聯(lián)立-f×[R×cos(∂1)+x0]D-f-R×sin(∂1)×cos(θ)-y0×sin(θ)×k=x1-s2]]>-f×[R×sin(∂1)×sin(θ)+y0]D-f-R×sin(∂1)×cos(θ)-y0×sin(θ)×k=y1-t2]]>f×[R×sin(∂2)-x0]D-f-R×cos(∂2)×cos(θ)-y0×sin(θ)×k=x2-s2]]>-f×[R×cos(∂2)×sin(θ)+y0]D-f-R×cos(∂2)×cos(θ)-y0×sin(θ)×k=y2-t2]]>-f×[R×sin(∂2)+x0]D-f+R×cos(∂2)×cos(θ)-y0×sin(θ)×k=x3-s2]]>f×[R×cos(∂2)×sin(θ)-y0]D-f+R×cos(∂2)×cos(θ)-y0×sin(θ)×k=y3-t2]]>f×[R×cos(∂1)-x0]D-f+R×sin(∂1)×cos(θ)-y0×sin(θ)×k=x4-s2]]>f×[R×sin(∂1)×sin(θ)-y0]D-f+R×sin(∂1)×cos(θ)-y0×sin(θ)×k=y4-t2]]>其中,k是成像屏與圖像之間的放縮系數(shù),s和t是圖像矩陣的維數(shù),x1,x2,x3,x4,y1,y2,y3,y4分別是步驟(2)中計算出的拍得的圖像中白色四邊形四個端點(diǎn)的坐標(biāo)。這樣,上面一個方程組共8個未知數(shù)(焦距f已知),8個方程,未知數(shù)可分別解出,這樣,l與m的比值即縱橫比可迎刃而解。
畸變校正時,要利用兩組坐標(biāo)值。一組是在步驟(2)中求得的白色四邊形的四個端點(diǎn)的坐標(biāo)值,另一組是校正之后這四個端點(diǎn)對應(yīng)的矩形四個端點(diǎn)的坐標(biāo)值,這組端點(diǎn)被成為基準(zhǔn)點(diǎn)。首先固定白色四邊形左上方的端點(diǎn),校正之后矩形左上方的端點(diǎn)也是這點(diǎn),在位置上是不動的,坐標(biāo)值也不變。然后選擇以固定端點(diǎn)為端點(diǎn)的一條邊,計算其邊長,以這條邊的邊長作為校正之后的矩形的一條邊長,利用上面計算出來的縱橫比可以計算出校正之后的矩形的另外一條邊的邊長。矩形的長寬都確定之后,再利用固定點(diǎn)的坐標(biāo),可以分別將其余三點(diǎn)的坐標(biāo)計算出來。因此,校正之后的矩形四個端點(diǎn)的坐標(biāo)確定下來,即基準(zhǔn)點(diǎn)的坐標(biāo)確定下來。利用輸入點(diǎn)和基準(zhǔn)點(diǎn)的坐標(biāo)可以將校正矩陣求出來。求解過程如下假設(shè)校正之前四點(diǎn)坐標(biāo)為(x1,y1),(x2,y2),(x3,y3),(x4,y4),校正之后四點(diǎn)坐標(biāo)為(x1’,y1’),(x2’,y2’),(x3’,y3’),(x4’,y4’),畸變校正矩陣H,H=h11h12h13h21h22h23h31h32h33]]>h=(h11,h12,h13,h21,h22,h23,h31,h32,h33)T他們之間存在關(guān)系式x1y11000-x1′x1-x1′y1-x1000x1y11-y1′x1-y1′y1-y1x2y21000-x2′x2-x2′y2-x2000x2y21-y2′x2-y2′y2-y2x3y31000-x3′x3-x3′y3-x3000x3y31-y3′x3-y3′y3-y3x4y41000-x4′x4-x4′y4-x4000x4y41-y4′x4-y4′y4-y4×h=0]]>利用該關(guān)系式可以解出h,相應(yīng)畸變校正矩陣H可以解得。利用原圖像的象素點(diǎn)的坐標(biāo)和畸變校正矩陣即可對原先的圖像進(jìn)行校正,校正之后得到的圖像中,名片和文本變?yōu)榫匦?,并且保持了原先的縱橫比。
應(yīng)用文字識別對校正之后的圖像進(jìn)行補(bǔ)償。目前的文字識別技術(shù)發(fā)展迅速,而且由于名片或者文本上面的數(shù)字都是印刷體,比之手寫體文字識別要簡單很多。校正補(bǔ)償步驟包括四部分圖像分割、特征提取、文字識別、判斷補(bǔ)償。對校正之后的圖像進(jìn)行預(yù)處理后,把圖像二值化,使二值化之后的圖像,文字等為黑色,而其他背景變?yōu)榘咨?。利用形態(tài)學(xué)連通區(qū)域法將需要識別的問字分割出來,具體做法如下在二值圖上檢測到第一個黑色象素點(diǎn),假設(shè)它是連通域上的一個黑色象素點(diǎn),把它作為遞歸過程的開始,遞歸公式為Xk=(Xk-1B(yǎng))∩A,Xk代表提取出來的連通區(qū)域,A代表上面的二值圖,B是一個3×3的8連通區(qū)域模板。在將所有符合要求的連通區(qū)域找出后,再進(jìn)行歸一化,將所有連通區(qū)域都進(jìn)行插值變成20×10的矩陣。因為名片或者文本中絕大多數(shù)都包含阿拉伯?dāng)?shù)字,因此本發(fā)明著重對阿拉伯?dāng)?shù)字進(jìn)行識別。如果名片或者文本中沒有數(shù)字,那么可依次對英文字母和漢字進(jìn)行識別。例如,本發(fā)明對數(shù)字進(jìn)行識別時,通過對2,3,4,5,7(因為0,1,6,8,9即使倒置也有相應(yīng)的數(shù)字與其對應(yīng),例如,0與0,6與9,等等。)特征的分析,采用四種數(shù)字特征橫線特征,豎線特征,水平方向過線數(shù),垂直方向過線數(shù),這些數(shù)字的數(shù)字特征如下表1所示。因此,建立相應(yīng)的分類器,如以下表2所示,可以分別將這些數(shù)字識別。例如,現(xiàn)在識別出數(shù)字2,那么說明,名片等沒有發(fā)生倒置,如果,利用分類器沒有識別出數(shù)字,那么說明,名片等發(fā)生倒置。因此,需要對校正后的圖像再進(jìn)行旋轉(zhuǎn),然后得到的圖像才是最后需要的。
表1為數(shù)字特征表格。
表2為數(shù)字分類器。
本發(fā)明可以作為畸變校正子模塊嵌入成像設(shè)備內(nèi)部的中央處理模塊,使成像設(shè)備具有畸變自動校正功能。其實(shí)現(xiàn)方法為,畸變校正子模塊作為功能子模塊嵌在成像設(shè)備的中央處理模塊中,在硬件上與中央處理模塊共享相同的數(shù)字信號處理芯片,軟件上使用本發(fā)明的數(shù)字圖像處理方法,在功能上實(shí)現(xiàn)畸變自動校正。
權(quán)利要求
1.一種圖像畸變自動校正的圖像處理方法,其特征在于,包括五個步驟(1)提取輪廓利用大津算法進(jìn)行自動閾值分割,采用形態(tài)學(xué)方法進(jìn)行邊緣輪廓提?。?2)解析輪廓利用radon變換將上步提取的邊緣輪廓以直線方程的形式解析出來,并且求得四個端點(diǎn)的坐標(biāo);(3)計算縱橫比建立成像設(shè)備內(nèi)部光學(xué)成像的數(shù)學(xué)模型,利用光學(xué)成像知識,建立方程組,求得縱橫比;(4)畸變校正利用兩組坐標(biāo)求得畸變校正矩陣對圖像進(jìn)行校正,校正過程中圖像的縱橫比保持不變;(5)校正補(bǔ)償利用數(shù)字識別的方法對校正后的圖像判斷上面的數(shù)字時候發(fā)生倒置的現(xiàn)象,選擇是否需要旋轉(zhuǎn)圖像,完成校正后的圖像進(jìn)行校正不成。
2.根據(jù)權(quán)利要求1所述的圖像畸變自動校正的圖像處理方法,其特征是,所述的提取輪廓步驟包括兩個部分自動閾值分割和形態(tài)學(xué)輪廓提取,首先采用大津算法對圖像進(jìn)行自動閾值分割,得到一個二值圖,在二值圖上,名片、文本變成白色,除此之外的背景變?yōu)楹谏焕眯螒B(tài)學(xué)方法,對白色區(qū)域進(jìn)行處理,只留下白色四邊形的邊緣輪廓,這樣,輪廓提取完成。
3.根據(jù)權(quán)利要求1所述的圖像畸變自動校正的圖像處理方法,其特征是,所述的解析輪廓步驟中,利用radon變換解析出二值圖上四條白色邊緣直線的ρ-θ空間信息,把四條白色邊緣的直線方程求出來,然后利用解方程組的方法,把四個端點(diǎn)的坐標(biāo)求解出來。
4.根據(jù)權(quán)利要求1所述的圖像畸變自動校正的圖像處理方法,其特征是,所述的計算縱橫比步驟中,通過建立成像設(shè)備內(nèi)部光學(xué)成像的數(shù)學(xué)模型,建立如下方程組-f×[R×cos(∂1)+x0]D-f-R×sin(∂1)×cos(θ)-y0×sin(θ)×k=x1-s2]]>-f×[R×sin(∂1)×sin(θ)+y0]D-f-R×sin(∂1)×cos(θ)-y0×sin(θ)×k=y1-t2]]>f×[R×sin(∂2)-x0]D-f-R×cos(∂2)×cos(θ)-y0×sin(θ)×k=x2-s2]]>-f×[R×cos(∂2)×sin(θ)+y0]D-f-R×cos(∂2)×cos(θ)-y0×sin(θ)×k=y2-t2]]>-f×[R×sin(∂2)+x0]D-f+R×cos(∂2)×cos(θ)-y0×sin(θ)×k=x3-s2]]>f×[R×cos(∂2)×sin(θ)-y0]D-f+R×cos(∂2)×cos(θ)-y0×sin(θ)×k=y3-t2]]>f×[R×cos(∂1)-x0]D-f+R×sin(∂1)×cos(θ)-y0×sin(θ)×k=x4-s2]]>f×[R×sin(∂1)×sin(θ)-y0]D-f+R×sin(∂1)×cos(θ)-y0×sin(θ)×k=y4-t2]]>其中,矩形長l,寬m,透鏡中心與成像區(qū)域中心距離為D,透鏡主光軸與成像區(qū)域所在的平面的夾角為θ,已知焦距f,矩形的中心在成像區(qū)域坐標(biāo)系中的坐標(biāo)為(x0,y0),相對于坐標(biāo)軸,矩形旋轉(zhuǎn)了α角,k是成像屏與圖像之間的放縮系數(shù),s和t是圖像矩陣的維數(shù),x1,x2,x3,x4,y1,y2,y3,y4分別是步驟(2)中計算出的拍得的圖像中白色四邊形四個端點(diǎn)的坐標(biāo),假設(shè)R=(l2)2+(m2)2]]>∂1=arctan(ml)-∂]]>∂2=arctan(lm)-∂]]>這樣,上面的方程組可解,這些參數(shù)解出來,就能得到矩形的縱橫比。
5.根據(jù)權(quán)利要求1所述的圖像畸變自動校正的圖像處理方法,其特征是,所述的畸變校正步驟,首先利用步驟(2)中計算出來的四個端點(diǎn)的坐標(biāo)值作為輸入點(diǎn),利用輸入點(diǎn)以及縱橫比將基準(zhǔn)點(diǎn)計算出來,然后利用兩組坐標(biāo)值將畸變校正矩陣H求出來,再利用畸變校正矩陣對原圖像進(jìn)行校正,校正之后的圖像中矩形保持縱橫比不變。
6.根據(jù)權(quán)利要求1所述的圖像畸變自動校正的圖像處理方法,其特征是,所述的校正補(bǔ)償步驟中,采用文字識別的算法進(jìn)行補(bǔ)償,如果識別結(jié)果中正確識別出數(shù)字或英文字母,那么不需旋轉(zhuǎn)校正之后的圖像,如果識別結(jié)果沒有識別出數(shù)字或英文字母,那么需要對圖像進(jìn)行旋轉(zhuǎn)校正。
全文摘要
一種圖像畸變自動校正的圖像處理方法,本發(fā)明利用radon變換快速的提取出名片、文本的四邊輪廓,利用輪廓頂點(diǎn)信息,對畸變圖像進(jìn)行校正,并且,建立拍攝設(shè)備內(nèi)部成像數(shù)學(xué)模型,建立包括名片、文本縱橫比參數(shù)的方程組,通過解方程組的方法求出矩形物體的縱橫比并應(yīng)用到校正過程中,使最后的校正結(jié)果不會產(chǎn)生變形。最后,通過文字識別,識別校正之后的圖像是否出現(xiàn)倒置,判斷是否需要對校正之后的圖像進(jìn)行旋轉(zhuǎn),從而得到符合要求的校正結(jié)果。本發(fā)明能夠快速的實(shí)現(xiàn)畸變校正,整個過程不需要人工參與,真正實(shí)現(xiàn)自動校正。本發(fā)明可用于醫(yī)學(xué)成像、監(jiān)控設(shè)備、手機(jī)、數(shù)碼相機(jī)、數(shù)碼攝像機(jī)等大多數(shù)成像設(shè)備中,易于實(shí)現(xiàn),用戶操作簡單。
文檔編號H04N1/387GK1937698SQ20061011727
公開日2007年3月28日 申請日期2006年10月19日 優(yōu)先權(quán)日2006年10月19日
發(fā)明者趙群飛, 張森, 孫明, 森澤太平, 賴尾修三 申請人:上海交通大學(xué)