專利名稱:數(shù)字成像設(shè)備現(xiàn)場全景成像的方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種數(shù)字成像方法,特別是指一種利用可移動數(shù)字成像設(shè)備實時對連續(xù)背景圖像進行拼接而生成全景圖像的方法,以及對基于上述方法進行全景圖像顯示的方法,屬于數(shù)字圖像處理技術(shù)。
背景技術(shù):
數(shù)字相機、集成有微型攝像裝置的手機具有方便小巧,易于攜帶并可以隨時拍照的特點,但物理尺寸的限制使該類拍照設(shè)備的成像質(zhì)量差、視野小,不能滿足人們對拍照的期望。
成像質(zhì)量差、視野受限是一般數(shù)字相機和集成有微型攝像裝置的手機都面臨的問題。針對這類問題,人們從機械、光學及數(shù)字技術(shù)等多方面做了許多改進。
例如,中國專利ZL 92215421.X設(shè)計了一種360°環(huán)攝全景照相機,包括照相機機身、鏡頭、電源控制器及相機底盤。機身中間開有一縫隙式曝光孔的成像面,機身下的底盤內(nèi)裝有微型電機和減速器、減速器出軸與輸片膠輥連接和收片軸呈差動嚙合,另一出軸上的小齒輪與底盤內(nèi)齒輪嚙合,電源控制器有三擋控制電機變速的調(diào)壓器。該裝置精度高,適合拍攝室內(nèi)全景;但對于野外寬闊畫風景和大型團體照等,卻需要添加額外的機械裝置和驅(qū)動部件,因此,不適于便攜使用。
中國專利申請00802545.2(公開號CN 1352754)公開了一種兩反射器系統(tǒng),一個是雙曲面反射鏡,另一個是凹橢圓或球面反射鏡,通過光學原理消除光學象差,用于捕獲超廣角全景圖象。但是,該系統(tǒng)精密而龐大的光學設(shè)備同樣不適于裝設(shè)在小巧靈活的便攜設(shè)備上。
近年來數(shù)字技術(shù)的應用極大地促進了成像技術(shù)的發(fā)展,數(shù)碼成像技術(shù)的最大好處是處理準確靈活。一張照片被數(shù)字化為成上百萬像素的數(shù)字集合,進而對該照片的處理,可充分地利用高速大容量的計算機進行像素級的編輯;因此,對多幅照片的拼接組合也就簡化為對相應像素集合的重組和排列。具有部分重合的兩張照片在計算機中可以先進行內(nèi)容匹配,定位出重疊位置,然后按內(nèi)容連續(xù)地拼接為一張更大的照片。這樣,可以在不更改成像器材的情況下,達到擴展成像視野、提高成像質(zhì)量的目的。
上述的方法雖然簡單經(jīng)濟,但目前都是離線后處理方式即用戶使用數(shù)字相機或集成有微型攝像裝置的手機連續(xù)拍攝多張照片,然后一起輸入到計算機后進行排序、匹配和拼接。這樣就不可避免地造成了整個處理周期長、操作多;另外,如果在后處理時發(fā)現(xiàn)個別照片不合乎要求,這將導致整個拼接處理的失效,用戶需要重新拍照并重復上述的操作。因此,如果將該方法直接用于數(shù)字相機或集成有微型攝像裝置的手機,即使通過計算機的離線處理可以得到高質(zhì)量的畫質(zhì),但同時也喪失了這些可移動拍攝的即時、便捷等特點。
中國專利ZL 01230425.5設(shè)計了一種用于旋轉(zhuǎn)拍攝的數(shù)碼照相機,它是在已有的數(shù)碼相機電路中增加了微電機和旋轉(zhuǎn)裝置。微電機在控制電路的控制下,驅(qū)動旋轉(zhuǎn)裝置使暗箱在底座上作旋轉(zhuǎn)運動。圖像信息處理電路每旋轉(zhuǎn)一個角度接收一列數(shù)字信號,最后合成一幅完整圖像。該設(shè)備具有一定的自動化和連續(xù)性,但其利用額外的機械裝置精確地旋轉(zhuǎn)相機,圖像合成是一固定的拼接過程,在實際使用中既不靈活,體積又龐大,不適用于用手機或數(shù)字相機這種便攜自如拍照的場合;若用手工旋轉(zhuǎn)相機,該方法要求操作者必須機械化地精確旋轉(zhuǎn),顯然,這是不切實際的。
發(fā)明內(nèi)容
本發(fā)明的主要目的在于提供一種數(shù)字成像設(shè)備現(xiàn)場全景成像的方法,彌補拍照手機成像質(zhì)量不足的缺憾,提供一種便捷實用的手機全景成像方法,簡化用戶操作,適應現(xiàn)場成像要求。
本發(fā)明的另一目的在于提供一種數(shù)字成像設(shè)備現(xiàn)場全景成像的方法,避免采用任何額外附加的機械或光學設(shè)備,保持通常的手工拍照習慣;同時采用人機配合方式,主動取景、連續(xù)拍攝及智能拼接,形成一種新穎實用的實時處理方法。
本發(fā)明的再一目的在于提供一種便攜數(shù)字成像設(shè)備有效顯示現(xiàn)場全景圖像的顯示方法,在小屏幕上滾動顯示大幅面全景照片,兼顧全局內(nèi)容的完整和局部細節(jié)的清晰;內(nèi)容滾動顯示,具有動態(tài)效果;圖像平穩(wěn)清晰,優(yōu)于視頻效果。
本發(fā)明的目的是這樣實現(xiàn)的一種數(shù)字成像設(shè)備現(xiàn)場全景成像的方法,至少包括步驟1將數(shù)字成像設(shè)備當前所獲取的動態(tài)圖像和上一圖像進行匹配;步驟2根據(jù)步驟1的匹配結(jié)果,將上一圖像和當前所獲取的動態(tài)圖像進行拼接處理,構(gòu)成全景圖像。
上述的匹配過程可以采用最為基本的遍歷(窮舉)的方法,也可以通過進一步地優(yōu)化,得到快速場景匹配方法,加速搜索準確的重疊位置。所述的快速場景匹配方法至少包括如下述的兩種流程1、采用多分辨的方法步驟11B設(shè)定一不小于1的移動步長和一初始重疊位置;步驟12B計算當前所獲取的動態(tài)圖像和上一圖像在該重疊位置的相似性值;將該重疊位置周圍距離為移動步長的8個鄰域為候選重疊位置,并計算各候選重疊位置的相似性值;步驟13B在計算獲得的各相似性值之中選取最小的相似性值;并將該最小相似性值對應的重疊位置作為新的初始重疊位置;步驟14B縮小移動步長;執(zhí)行步驟12B,直至移動步長不大于1。
2、采用爬山法進行搜索步驟11C根據(jù)設(shè)定的比值,設(shè)定初始重疊位置,并設(shè)定移動步長為1;步驟12C計算當前所獲取的動態(tài)圖像和上一圖像在該重疊位置的相似性值;將該重疊位置周圍8個鄰域為候選重疊位置,并計算各候選重疊位置的相似性值;步驟13C在計算獲得的各相似性值之中選取最小的相似性值;步驟14C如果初始重疊位置的相似性值不等于該最小相似性值,則將該最小相似性值對應的重疊位置作為新的初始重疊位置,執(zhí)行步驟12C;否則,匹配結(jié)束。
拼接圖像時,具體的處理流程是步驟21將包括重疊區(qū)域的上一圖像的數(shù)據(jù)存儲在數(shù)字成像設(shè)備的拼接緩沖區(qū)中;步驟22分別從上一圖像的數(shù)據(jù)和當前所獲取的動態(tài)圖像的數(shù)據(jù)中取出其重疊區(qū)域的數(shù)據(jù);步驟23對步驟22中取出的兩個重疊區(qū)域的數(shù)據(jù)進行加權(quán)平均處理后,將獲得的加權(quán)平均數(shù)據(jù)存儲在數(shù)字成像設(shè)備的拼接緩沖區(qū)中上一圖像的數(shù)據(jù)的重疊區(qū)域中;步驟24將當前所獲取的動態(tài)圖像數(shù)據(jù)中不包含重疊區(qū)域的數(shù)據(jù)存儲到拼接緩沖區(qū)的重疊區(qū)域之后。
上述的加權(quán)平均的目的是為了使被拼接的圖像在拼接處能夠具有較好的過渡效果,因此,可以采用如下的方式來進行加權(quán)處理如果PkCD在上一圖像內(nèi)且不在當前所獲取的動態(tài)圖像內(nèi),PkCD=PkAD;如果PkCD在當前所獲取的動態(tài)圖像內(nèi)且不在上一圖像內(nèi),PkCD=PkBD;如果PkCD在上一圖像和當前所獲取的動態(tài)圖像的重疊區(qū)內(nèi),
PkCD=(PkAD+PkBD)/2,或者PkCD=(1-w/L)PkAD+w/L×PkBD;其中,AD為上一圖像在重疊區(qū)內(nèi)的圖像塊,BD為當前所獲取的動態(tài)圖像在重疊區(qū)內(nèi)的圖像塊,CD為拼接圖像在重疊區(qū)內(nèi)的圖像塊;并且,AD、BD、CD的矢量形式IAD、IBD和ICD分別表達為IAD=[P1AD,P2AD,...,PNAD]′IBD=[P1BD,P2BD,...,PNBD]′ICD=[P1CD,P2CD,...,PNCD]′PkAD為AD中的第k個像素,PkBD為BD中的第k個像素,PkCD為CD中的第k個像素;w為PkCD在重疊區(qū)內(nèi)沿拼接方向的水平或垂直距離位置;L為沿拼接方向的重疊區(qū)長度。
需要說明的是上述的加權(quán)方法為線性的,也可以采用非線性的加權(quán)方法,這些方法只是具體的算法,可以直接引用,在此不再贅述。
實際的操作過程中,數(shù)字成像設(shè)備實際上是不斷地對拍攝狀態(tài)進行檢測,當用戶拍攝當前照片后,才會進行拼接的操作;否則,按照本發(fā)明的方法,繼續(xù)進行實時的匹配操作,計算當前的重疊區(qū)與預設(shè)的推薦重疊位置的偏離值,以取景提示的信號反饋給用戶,等待用戶的調(diào)整和拍攝操作。當圖像拼接的數(shù)量達到預定的值或用戶按鍵終止拼接時,終止全景拍攝狀態(tài)。
當采用上述的方法得到了一個全景圖像以后,由于所述的數(shù)字成像設(shè)備本身的顯示裝置不可能一次完全顯示全部的圖像,所以,需要對所述的圖像滾動顯示,具體的顯示方法是根據(jù)用戶輸入的全景圖像顯示命令,連續(xù)地將要顯示的全景圖像數(shù)據(jù)傳送到數(shù)字成像設(shè)備的顯示緩沖區(qū)中;由所述的數(shù)字成像設(shè)備的顯示處理模塊讀取并輸出到顯示界面,形成全景畫面的滾動顯示效果。
根據(jù)上述的技術(shù)方案可知本發(fā)明的主要優(yōu)點在于彌補了現(xiàn)有數(shù)字成像設(shè)備不能實時提供一種便捷實用的全景成像功能的缺陷,簡化了用戶拼接圖像的操作,適應了現(xiàn)場成像要求;本發(fā)明避免了采用任何額外附加的機械或光學設(shè)備,保持了通常的手工拍照習慣;同時,通過采用人機配合方式,主動取景、連續(xù)拍攝及智能拼接,形成了一種新穎實用的實時圖像處理方法。同時也為用戶在數(shù)字成像設(shè)備上顯示拼接的圖像提供了方便的手段。
圖1為本發(fā)明以具體實施例的流程圖;圖2為本發(fā)明匹配流程中多分辨搜索的實施例流程圖;圖3為本發(fā)明匹配流程中爬山法搜索的實施例流程圖。
具體實施例方式
以下結(jié)合具體的實施例對本發(fā)明作進一步的詳細說明本發(fā)明首先,將數(shù)字成像設(shè)備當前所獲取的動態(tài)圖像和上一圖像進行匹配;然后,根據(jù)的匹配結(jié)果,將上一圖像和當前所獲取的動態(tài)圖像進行拼接處理,構(gòu)成全景圖像。
其中,前一個步驟的目的是對當前所獲取的動態(tài)圖像和上一圖像的場景進行匹配處理,從中找到相似性最大區(qū)域;在具體的數(shù)字全景生成處理中,對于上述的兩幅連續(xù)拍攝的照片,需要經(jīng)過如下的步驟來處理步驟1針對數(shù)字成像設(shè)備當前所獲取的動態(tài)圖像和上一圖像,設(shè)定一可能重疊位置,計算該重疊位置下兩幅圖像的內(nèi)容相似性測度值;步驟2搜索所有候選重疊位置,選擇最小的內(nèi)容相似性測度值,它對應的重疊位置即為兩幅圖像最準確的內(nèi)容重疊位置。
參見圖1,以下是實現(xiàn)上述方法的具體實例
首先,針對當前所獲取的動態(tài)圖像和上一圖像,設(shè)定一初始重疊位置;其次,計算當前所獲取的動態(tài)圖像和上一圖像在該重疊位置下的相似性值;然后,移動所述的重疊位置,重復上一步驟的計算,直到計算出所有重疊位置下的相似性值;最后,選擇最小相似性值所對應的重疊位置為最終的準確重疊位置。
在上述的步驟中,當前所獲取的動態(tài)圖像和上一圖像在重疊位置下的相似性具體根據(jù)如下的公式(1)或公式(2)計算SD=1NΣk=1N|PkAD-PkBD|---(1)]]>SD=1NΣk=1N(PkAD-PkBD)2---(2)]]>其中,AD為上一圖像在重疊區(qū)內(nèi)的圖像塊,BD為當前所獲取的動態(tài)圖像在重疊區(qū)內(nèi)的圖像塊;并且,AD、BD的矢量形式IAD和IBD分別表達為IAD=[P1AD,P2AD,...,PNAD]′IBD=[P1BD,P2BD,...,PNBD]′PkAD為AD中的第k個像素,PkBD為BD中的第k個像素;SD為公式(1)重疊區(qū)內(nèi)像素差異絕對值的平均值或公式(2)重疊區(qū)內(nèi)像素的均方差;N為重疊區(qū)內(nèi)的像素總個數(shù)。
應當說明的是上述步驟中的最小相似性值即為上述公式中的SD,SD的值越小,說明該值所對應的區(qū)域的相似性、重合度越大,所以上述最后一步中選擇最小相似性值所對應的重疊位置為最終的準確重疊位置。
上述的方法是最為基本的遍歷(窮舉)的方法,事實上,采用這一方法找出最佳重疊位置,計算量大,費時長,不便于便攜設(shè)備的實時計算。為此,可以通過進一步地優(yōu)化,得到如下實施例所描述的快速場景匹配方法,加速搜索準確的重疊位置。
參見圖21、多分辨搜索首先,設(shè)定一不小于1的移動步長,例如16,和一初始重疊位置;其次,計算當前所獲取的動態(tài)圖像和上一圖像在該重疊位置的相似性值;將該重疊位置周圍距離為移動步長的8個鄰域為候選重疊位置,并計算各候選重疊位置的相似性值;然后,在計算獲得的各相似性值之中選取最小的相似性值;并將該最小相似性值對應的重疊位置作為新的初始重疊位置;最后,縮小移動步長,例如,取原來移動步長值的一半或1/3;重復執(zhí)行計算,直至移動步長不大于1。
此時得到的即為最終的準確重疊位置。
采用上述的方法,對于320×240的數(shù)字圖像,用遍歷法需要進行76800個可能重疊位置的相似度測量,用上述多分辨搜索方法(如步長為16的粗分辨遍歷及其后步長減半的漸細搜索策略)僅需332次測量,計算量是原先的1/231。
參見圖32、爬山法搜索事實上,如果約束用戶拍攝時留有基本固定尺寸的重疊,上述場景匹配算法沒有必要進行全幅面的匹配搜索,而是在設(shè)定區(qū)內(nèi)進行局部啟發(fā)式搜索。具體的方法是首先,根據(jù)設(shè)定的重疊比值,例如1/5圖像尺寸,設(shè)定初始重疊位置,并設(shè)定移動步長為1;其次,計算當前所獲取的動態(tài)圖像和上一圖像在該重疊位置的相似性值;將該重疊位置周圍8個鄰域為候選重疊位置,并計算各候選重疊位置的相似性值;然后,在計算獲得的各相似性值之中選取最小的相似性值;最后,如果初始重疊位置的相似性值不等于該最小相似性值,則將該最小的相似性值對應的位置作為新的初始重疊位置,執(zhí)行重復計算;否則,匹配結(jié)束。
這時得到的重疊位置為最佳匹配位置。
上述爬山法,根據(jù)圖像內(nèi)容的復雜度及用戶的拍攝誤差,一般能在16至240次內(nèi)找到局部最優(yōu)解,可以大大地減少計算量。
根據(jù)上述的匹配結(jié)果,在用戶確定拼接的時候,例如數(shù)字相機的用戶按下拍照快門實施拍照后,對上述的兩個圖像進行拼接處理,構(gòu)成全景圖像。
改變兩幅圖像像素的重新組合和排列關(guān)系,就可以達到圖像拼接的目的,但是在重疊區(qū)內(nèi)像素的選擇對拼接的質(zhì)量有所影響。
本發(fā)明利用重疊區(qū)內(nèi)對應像素的加權(quán)平均來提高拼接質(zhì)量。假設(shè)上一圖像A和當前所獲取的動態(tài)圖像B在位置D處重疊,AD和BD分別為圖像A和B在重疊區(qū)內(nèi)的圖像塊,對于新拼接的全景圖像C,CD為拼接圖像在重疊區(qū)內(nèi)的圖像塊;并且,AD、BD、CD的矢量形式IAD、IBD和ICD分別表達為IAD=[P1AD,P2AD,...,PNAD]′IBD=[P1BD,P2BD,...,PNBD]′ICD=[P1CD,P2CD,...,PNCD]′其中,PkCD=w1×PkAD+w1×PkBD,且w1和w2為加權(quán)系數(shù),其和為1;PkAD為AD中的第k個像素,PkBD為BD中的第k個像素,PkCD為CD中的第k個像素。
具體的拼接步驟是步驟21將包括重疊區(qū)域的上一圖像A的數(shù)據(jù)存儲在數(shù)字成像設(shè)備的拼接緩沖區(qū)C中;
步驟22分別從上一圖像A的數(shù)據(jù)和當前所獲取的動態(tài)圖像B的數(shù)據(jù)中取出其重疊區(qū)域的數(shù)據(jù)AD、BD;步驟23對步驟22中取出的兩個重疊區(qū)域AD、BD的數(shù)據(jù)采用平均法或線性加權(quán)平均法處理后,將獲得的加權(quán)平均數(shù)據(jù)存儲在數(shù)字成像設(shè)備的拼接緩沖區(qū)C中上一圖像A的數(shù)據(jù)的重疊區(qū)域AD中;步驟24將當前所獲取的動態(tài)圖像B數(shù)據(jù)中不包含重疊區(qū)域的數(shù)據(jù)存儲到拼接緩沖區(qū)C的重疊區(qū)域CD之后。
當采用平均加權(quán)方法時,按照如下的規(guī)則獲得重疊區(qū)內(nèi)的數(shù)據(jù)PkCD如果PkCD在上一圖像內(nèi)且不在當前所獲取的動態(tài)圖像內(nèi),PkCD=PkAD;如果PkCD在當前所獲取的動態(tài)圖像內(nèi)且不在上一圖像內(nèi),PkCD=PkBD;如果PkCD在上一圖像和當前所獲取的動態(tài)圖像的重疊區(qū)內(nèi),則PkCD=(PkAD+PkBD)/2。
采用平均法,同時使用了重疊區(qū)內(nèi)兩原始圖像的信息,因此避免了由于圖像內(nèi)容不完全一致而造成的邊界明顯突變,使得拼接后的圖像的重疊區(qū)域能自然和非重疊區(qū)域平滑過渡。
當采用線性加權(quán)平均法時,按照如下的規(guī)則獲得重疊區(qū)內(nèi)的數(shù)據(jù)PkCD如果PkCD在上一圖像內(nèi)且不在當前所獲取的動態(tài)圖像內(nèi),PkCD=PkAD;如果PkCD在當前所獲取的動態(tài)圖像內(nèi)且不在上一圖像內(nèi),PkCD=PkBD;如果PkCD在上一圖像和當前所獲取的動態(tài)圖像的重疊區(qū)內(nèi),則PkCD=(1-w/L)PkAD+w/L×PkBD。
采用線性加權(quán)平均法,可以使拼接重疊區(qū)內(nèi)的內(nèi)容逐漸平滑地從圖像A過渡到圖像B,能更加有效地改善最終的拼接質(zhì)量。
在上述的拼接過程中,除了采用上述線性加權(quán)的方法外,還可以采用非線性加權(quán)的方法來改善或提高拼接圖像在重疊區(qū)域中的畫面質(zhì)量,具體的加權(quán)算法在此不一一枚舉。
具體在數(shù)字成像設(shè)備,例如數(shù)字相機、具有攝像功能的手機等,進行現(xiàn)場全景成像的時候,在上述的匹配過程完成后,所述的數(shù)字成像設(shè)備還要對拍攝狀態(tài)進行檢測,當檢測到用戶拍攝當前照片后,即用戶按下快門后,則進行拼接操作;否則所述的數(shù)字成像設(shè)備在等待用戶的拍攝操作同時,還將繼續(xù)進行上述的實時匹配,計算當前的重疊區(qū)與系統(tǒng)預設(shè)的推薦重疊位置的偏離值,以取景提示的信號反饋給用戶,等待用戶的調(diào)整和拍攝操作。當圖像拼接的數(shù)量達到系統(tǒng)預定值或用戶按鍵終止拼接時,終止全景拍攝狀態(tài)。
上述實時匹配的結(jié)果現(xiàn)場反饋給用戶,可有效地指導用戶取景,保證拼接質(zhì)量,例如,系統(tǒng)設(shè)定為自左向右拼接,為保證拼接效率和匹配質(zhì)量,系統(tǒng)推薦1/5圖像尺寸為最佳重疊位置。當用戶拍完前一張照片后,稍微向右旋轉(zhuǎn)相機一個角度,系統(tǒng)實時地捕獲當前的新場景與上一張照片匹配,如果通過計算得到的重疊位置為1/2,系統(tǒng)則提示用戶繼續(xù)向右旋轉(zhuǎn);如果計算得到的重疊位置為1/8,系統(tǒng)則提示用戶向左旋轉(zhuǎn)。同理,對于自左向右水平拼接的模式,用戶若上下偏離過多,系統(tǒng)計算出上下偏差,并以上下越界信號給用戶發(fā)出提示。
由于上述的數(shù)字成像設(shè)備一般為便攜式的產(chǎn)品,該類產(chǎn)品用于顯示的屏幕尺寸有限,因此其顯示界面無法完整顯示拼接后的全景圖像,為此需要通過如下的處理使全景圖像能夠在所述的數(shù)字成像設(shè)備上顯示首先,接收用戶輸入的全景圖像顯示命令(該命令可以通過按動設(shè)置在數(shù)字成像設(shè)備上相應的按鍵實現(xiàn)),然后,將要顯示的全景圖像數(shù)據(jù)傳送到數(shù)字成像設(shè)備的顯示緩沖區(qū)中;具體的命令分析和處理步驟包括分析用戶輸入的顯示命令;如果所述的顯示命令不是圖像移動命令,不做顯示全景圖像移動顯示的操作;否則,根據(jù)移動命令中的移動方向參數(shù),并以當前顯示內(nèi)容為基準,進一步分析被顯示的圖像是否已經(jīng)到達相應的邊界;如果是,則由所述的數(shù)字成像設(shè)備的顯示處理模塊讀取并輸出到顯示界面;如果不是,則以當前顯示內(nèi)容為基準,根據(jù)移動方向參數(shù),從全景圖像數(shù)據(jù)中不斷地取出新的顯示內(nèi)容,并將該顯示內(nèi)容輸出到顯示緩沖區(qū)中;由所述的數(shù)字成像設(shè)備的顯示處理模塊讀取并輸出到顯示界面,最終形成全景圖像的滾動顯示。為進一步增加控制的靈活性,系統(tǒng)實時監(jiān)視用戶按方向鍵的持續(xù)時間,持續(xù)時間越長,沿該方向滾動的速度越快。
綜上所述,本發(fā)明的功能就是利用模式識別和數(shù)字處理技術(shù)有效便捷地提高數(shù)字拍照設(shè)備的成像視野和拍攝效果,可廣泛用于拍照手機、數(shù)碼相機及其他便攜的數(shù)碼攝影設(shè)備。本發(fā)明針對數(shù)字拍照設(shè)備要求實時便捷的特點,拍攝一張,實時拼接一張,省略了現(xiàn)有技術(shù)中排序、傳輸?shù)冗^程,拍攝完畢,全景圖像當場就能生成;本發(fā)明使用智能識別技術(shù),利用微處理器準確計算出相鄰兩張照片的重疊位置,進而實現(xiàn)了內(nèi)容連續(xù)的無縫拼接;傳統(tǒng)的圖像拼接方法均為后處理方式,針對已經(jīng)拍好的一組照片進行拼接,若存在無效照片,整個拼接就會失敗,故拼接質(zhì)量無法保證。本發(fā)明在用戶的拍攝過程中實時地進行圖像匹配,根據(jù)前一張照片指引用戶合理取景,通常指示用戶在取景時保存有整幅圖像1/5的重疊區(qū)域,這樣可以確保在保留足夠的圖像拼接信息的同時,減少了設(shè)備計算的工作量,使得匹配能快速進行,保證了匹配的實時性和有效性,最終的圖像拼接質(zhì)量也得到了很好的保證。
最后應說明的是以上實施例僅用以說明本發(fā)明而并非限制本發(fā)明所描述的技術(shù)方案;因此,盡管本說明書參照上述的各個實施例對本發(fā)明已進行了詳細的說明,但是,本領(lǐng)域的普通技術(shù)人員應當理解,仍然可以對本發(fā)明進行修改或者等同替換;而一切不脫離本發(fā)明的精神和范圍的技術(shù)方案及其改進,其均應涵蓋在本發(fā)明的權(quán)利要求范圍當中。
權(quán)利要求
1.一種數(shù)字成像設(shè)備現(xiàn)場全景成像的方法,其特征在于該方法至少包括如下的步驟步驟1將數(shù)字成像設(shè)備當前所獲取的動態(tài)圖像和上一圖像進行匹配;步驟2根據(jù)步驟1的匹配結(jié)果,將上一圖像和當前所獲取的動態(tài)圖像進行拼接處理,構(gòu)成全景圖像。
2.根據(jù)權(quán)利要求1所述的數(shù)字成像設(shè)備現(xiàn)場全景成像的方法,其特征在于所述步驟1具體包括步驟11A針對當前所獲取的動態(tài)圖像和上一圖像,設(shè)定一初始重疊位置;步驟12A計算當前所獲取的動態(tài)圖像和上一圖像在該重疊位置下的相似性值;步驟13A移動所述的重疊位置,執(zhí)行步驟12A,直到計算出所有重疊位置下的相似性值;步驟14A選擇最小相似性值所對應的重疊位置為最終的準確重疊位置。
3.根據(jù)權(quán)利要求1所述的數(shù)字成像設(shè)備現(xiàn)場全景成像的方法,其特征在于所述步驟1具體包括步驟11B設(shè)定一不小于1的移動步長和一初始重疊位置;步驟12B計算當前所獲取的動態(tài)圖像和上一圖像在該重疊位置的相似性值;將該重疊位置周圍距離為移動步長的8個鄰域為候選重疊位置,并計算各候選重疊位置的相似性值;步驟13B在計算獲得的各相似性值之中選取最小的相似性值;并將該最小相似性值對應的重疊位置作為新的初始重疊位置;步驟14B縮小移動步長;執(zhí)行步驟12B,直至移動步長不大于1結(jié)束匹配。
4.根據(jù)權(quán)利要求1所述的數(shù)字成像設(shè)備現(xiàn)場全景成像的方法,其特征在于所述步驟1具體包括步驟11C根據(jù)設(shè)定的比值,設(shè)定初始重疊位置,并設(shè)定移動步長為1;步驟12C計算當前所獲取的動態(tài)圖像和上一圖像在該重疊位置的相似性值;將該重疊位置周圍8個鄰域為候選重疊位置,并計算各候選重疊位置的相似性值;步驟13C在計算獲得的各相似性值之中選取最小的相似性值;步驟14C如果初始重疊位置的相似性值不等于該最小相似性值,則將該最小相似性值對應的重疊位置作為新的初始重疊位置,執(zhí)行步驟12C;否則,匹配結(jié)束。
5.根據(jù)權(quán)利要求2或3或4所述的數(shù)字成像設(shè)備現(xiàn)場全景成像的方法,其特征在于當前所獲取的動態(tài)圖像和上一圖像在重疊位置下的相似性具體根據(jù)如下的公式(1)或公式(2)計算SD=1NΣk=1N|PkAD-PkBD|---(1)]]>SD=1NΣk=1N(PkAD-PkBD)2---(2)]]>其中,AD為上一圖像在重疊區(qū)內(nèi)的圖像塊,BD為當前所獲取的動態(tài)圖像在重疊區(qū)內(nèi)的圖像塊;并且,AD、BD的矢量形式IAD和IBD分別表達為IAD=[P1AD,P2AD,...,PNAD]′IBD=[P1BD,P2BD,...,PNBD]′PkAD為AD中的第k個像素,PkBD為BD中的第k個像素;SD為公式(1)重疊區(qū)內(nèi)像素差異絕對值的平均值或公式(2)重疊區(qū)內(nèi)像素的均方差;N為重疊區(qū)內(nèi)的像素總個數(shù)。
6.根據(jù)權(quán)利要求1所述的數(shù)字成像設(shè)備現(xiàn)場全景成像的方法,其特征在于所述的步驟2具體包括步驟21將包括重疊區(qū)域的上一圖像的數(shù)據(jù)存儲在數(shù)字成像設(shè)備的拼接緩沖區(qū)中;步驟22分別從上一圖像的數(shù)據(jù)和當前所獲取的動態(tài)圖像的數(shù)據(jù)中取出其重疊區(qū)域的數(shù)據(jù);步驟23對步驟22中取出的兩個重疊區(qū)域的數(shù)據(jù)進行加權(quán)平均處理后,將獲得的加權(quán)平均數(shù)據(jù)存儲在數(shù)字成像設(shè)備的拼接緩沖區(qū)中上一圖像的數(shù)據(jù)的重疊區(qū)域中;步驟24將當前所獲取的動態(tài)圖像數(shù)據(jù)中不包含重疊區(qū)域的數(shù)據(jù)存儲到拼接緩沖區(qū)的重疊區(qū)域之后。
7.根據(jù)權(quán)利要求6所述的數(shù)字成像設(shè)備現(xiàn)場全景成像的方法,其特征在于所述的加權(quán)平均處理遵守如下的規(guī)則如果PkCD在上一圖像內(nèi)且不在當前所獲取的動態(tài)圖像內(nèi),PkCD=PkAD;如果PkCD在當前所獲取的動態(tài)圖像內(nèi)且不在上一圖像內(nèi),PkCD=PkBD;如果PkCD在上一圖像和當前所獲取的動態(tài)圖像的重疊區(qū)內(nèi),PkCD=(PkAD+PkBD)/2,或者PkCD=(1-w/L)PkAD+w/LxPkBD;其中,AD為上一圖像在重疊區(qū)內(nèi)的圖像塊,BD為當前所獲取的動態(tài)圖像在重疊區(qū)內(nèi)的圖像塊,CD為拼接圖像在重疊區(qū)內(nèi)的圖像塊;并且,AD、BD、CD的矢量形式IAD、IBD和ICD分別表達為IAD=[P1AD,P2AD,...,PNAD]′IBD=[P1BD,P2BD,...,PNBD]′ICD=[P1CD,P2CD,...,PNCD]′PkAD為AD中的第k個像素,PkBD為BD中的第k個像素,PkCD為CD中的第k個像素;w為PkCD在重疊區(qū)內(nèi)沿拼接方向的水平或垂直距離位置;L為沿拼接方向的重疊區(qū)長度。
8.根據(jù)權(quán)利要求1所述的數(shù)字成像設(shè)備現(xiàn)場全景成像的方法,其特征在于在步驟2之前還進一步包括步驟1A對拍攝狀態(tài)進行檢測的步驟,當用戶拍攝當前照片后,則執(zhí)行步驟2;否則繼續(xù)等待用戶的拍攝操作。
9.根據(jù)權(quán)利要求8所述的數(shù)字成像設(shè)備現(xiàn)場全景成像的方法,其特征在于在步驟1A之后,步驟2之前還進一步包括步驟1B分析步驟1的匹配結(jié)果,如果當前的重疊區(qū)偏離預設(shè)的推薦重疊位置,所述的數(shù)字成像設(shè)備計算出當前的重疊區(qū)與推薦重疊區(qū)的偏差,并以取景提示的信號反饋給用戶。
10.根據(jù)權(quán)利要求1所述的數(shù)字成像設(shè)備現(xiàn)場全景成像的方法,其特征在于該方法進一步包括步驟3根據(jù)用戶輸入的全景圖像顯示命令,將要顯示的全景圖像數(shù)據(jù)傳送到數(shù)字成像設(shè)備的顯示緩沖區(qū)中;步驟4由所述的數(shù)字成像設(shè)備的顯示處理模塊讀取并輸出到顯示界面。
11.根據(jù)權(quán)利要求10所述的數(shù)字成像設(shè)備現(xiàn)場全景成像的方法,其特征在于所述的步驟3具體包括步驟31分析用戶輸入的顯示命令;步驟32如果所述的顯示命令不是圖像移動命令,則不做全景圖像移動顯示的操作;步驟33否則,根據(jù)移動命令中的移動方向參數(shù),并以當前顯示內(nèi)容為基準,進一步分析被顯示的圖像是否已經(jīng)到達相應的邊界;是則執(zhí)行步驟4;步驟34以當前顯示內(nèi)容為基準,根據(jù)移動方向參數(shù),從全景圖像數(shù)據(jù)中取出新的顯示內(nèi)容,并將該顯示內(nèi)容輸出到顯示緩沖區(qū)中;執(zhí)行步驟4。
全文摘要
本發(fā)明公開了一種數(shù)字成像設(shè)備現(xiàn)場全景成像的方法,首先,將數(shù)字成像設(shè)備當前所獲取的動態(tài)圖像和上一圖像利用采用多分辨的方法或爬山法進行匹配;根據(jù)上述的匹配結(jié)果利用加權(quán)平均的方法進行拼接處理,構(gòu)成全景圖像。本發(fā)明的主要優(yōu)點在于彌補了現(xiàn)有數(shù)字成像設(shè)備不能實時提供一種便捷實用的全景成像功能的缺陷,簡化了用戶拼接圖像的操作,適應了現(xiàn)場成像要求;本發(fā)明避免了采用任何額外附加的機械或光學設(shè)備,保持了通常的手工拍照習慣;同時,通過采用人機配合方式,主動取景、連續(xù)拍攝及智能拼接,形成了一種新穎實用的實時圖像處理方法;同時也為用戶在數(shù)字成像設(shè)備上顯示拼接的圖像提供了方便的手段。
文檔編號G06T5/50GK1567376SQ03146508
公開日2005年1月19日 申請日期2003年7月3日 優(yōu)先權(quán)日2003年7月3日
發(fā)明者馬堃 申請人:馬堃