專利名稱:基于自適應六邊形搜索及五幀背景對齊的動背景視頻對象提取的制作方法
技術領域:
本發(fā)明涉及一種視頻分割中的處理方法,特別涉及一種基于自適應六邊形運動估計及五幀背景對齊的動背景下視頻對象提取方法。
背景技術:
對于動態(tài)視頻序列中運動對象的提取,由于攝像機產生的全局運動使得在靜背景下的分割方法,如幀差或者背景差分等方法不適用于動背景下的分割,即不能夠準確地將運動對象提取出來,因此針對動背景下的分割問題必須首先消除攝像機運動所造成的全局運動的影響,通過全局運動估計和補償技術,將問題轉化成靜背景下的分割問題,進而應用靜背景下廣泛的分割方法實現(xiàn)動背景下的準確、有效分割。全局運動估計是指估計由攝像機運動引起的序列背景區(qū)域的運動規(guī)律,求解出相·應數(shù)學運動模型中的多個參數(shù)。全局運動補償是在根據(jù)運動估計所得到的全局運動參數(shù),在當前幀和前一幀之間作一個相應的背景對齊的映射變換。這樣在準確的補償之后就可以采用幀差或背景差等方法消除背景區(qū)域,突出感興趣的具有局部運動的前景區(qū)域(參見楊文明.時空融合的視頻對象分割[D].浙江浙江大學,2006)。對于動背景下的運動對象分割問題,目前國際上已有相當多的學者做了大量的研究工作。如利用改進的分水嶺算法將運動補償后的視頻幀分割成不同的灰度區(qū)域,通過光流計算得到序列的運動信息,最后,將運動信息和分割的區(qū)域按一定的準則綜合得到對象模板,達到對視頻對象的準確定位(參見張慶利.一種基于運動背景的視頻對象分割算法.上海大學學報(自然科學版),2005,11(2):111-115.)。如建立四參數(shù)運動放射模型來描述全局運動,采用塊匹配方法進行參數(shù)估計,結合Horn-Schunck算法檢測出運動目標并應用卡爾曼濾波對運動目標的質心位置等信息進行跟蹤,實現(xiàn)了動態(tài)場景中運動對象的檢測與跟蹤。(參見施家棟.動態(tài)場景中運動目標檢測與跟蹤.北京理工大學學報,2009,29(10) :858-876.)。另一種采用非參數(shù)核密度估計的方法,首先采用匹配加權的全局運動估計補償算法消除動態(tài)場景下背景運動的影響,然后估計各像素屬于前景與背景的概率密度并結合形態(tài)學等算法進行處理,實現(xiàn)了動背景下運動對象的準確、有效分割。(參見馬志強.一種動態(tài)場景下運動對象分割新算法.計算機工程與科學,2012,34(4) :43-46.)。為了解決動背景下的分割問題,本發(fā)明方法實現(xiàn)了一種采用宏塊預判斷、塊匹配、攝像機六參數(shù)仿射模型、最小二乘法等全局運動估計及補償方法,并通過五幀背景對齊結合邊緣信息等實現(xiàn)動背景分割。實驗證明,該方法實現(xiàn)了動背景視頻序列中視頻對象的提取,并且提取精度得到明顯提高。
發(fā)明內容
本發(fā)明要解決的技術問題是如何減少塊匹配的運算時間,如何實現(xiàn)動背景下視頻對象的準確提取。本發(fā)明解決其技術問題所采用的技術方案是一種基于自適應六邊形運動估計及五幀背景對齊的動背景下視頻對象提取方法,包括以下步驟(I)將第K-2幀、第K-I幀、參考幀K幀、第K+1幀與第K+2幀分別分成8X8宏塊,根據(jù)紋理信息對該五幀中所有宏塊進行預判斷、篩選;(2)對上述篩選后的宏塊采用SAD準則、自適應六邊形搜索策略進行塊匹配,分別以第K-2幀、第K-I幀、第K+1幀與第K+2幀作為當前幀,以第K幀作為參考幀,得到該四幀相對于參考幀K幀的運動矢量場,并通過最小二乘法計算全局運動參數(shù),獲得攝像機六參數(shù)模型;(3)對第K-2幀進行運動補償,使第K-2幀與第K幀背景對齊,得到重建幀κ-2’,按照同樣的方法對第κ-I幀、第K+1幀與第K+2幀進行運動補償,使第K-I幀、第K+1幀及第K+2幀分別與第K幀背景對齊,并得到重建幀Κ-Γ、重建幀Κ+Γ及重建幀K+2’ ; (4)對重建幀κ-2’、Κ-Γ、K+1’、K+2’及參考幀K幀分別采用Kirsch算子提取邊緣信息,并分別計算其相對于參考幀K邊緣的幀差屯、d2、d3、d4,采用最大方差閾值方法進行二值化;(5)分別對連續(xù)五幀前兩幀和后兩幀得到的幀差二值化結果進行與運算;對得到的與運算結果采用或運算及形態(tài)學、中值濾波等進行后處理,實現(xiàn)動背景下視頻對象的快速有效分割。所述步驟(I)中對于當前第K-2幀、第K-I幀、第K+1幀、第K+2幀與參考幀K幀中分成的8X8宏塊進行預判斷及篩選,具體步驟如下由于在下述步驟中應用最小二乘法計算全局運動參數(shù)的時候,很多誤差大的宏塊被直接刪除,如果能夠在最小二乘法運算之前將誤差大的宏塊剔除,將顯著的提高運算速度,并降低運算量。而決定宏塊誤差大小、影響計算準確性的重要因素便是宏塊的紋理信息,也就是梯度信息。本部分提出的宏塊預判斷及篩選的方法正是從宏塊的梯度信息出發(fā),根據(jù)設定的閾值對于宏塊進行篩選抑或保留,當宏塊的信息量小于該閾值時,對該宏塊進行篩選,不作為下述步驟中參與塊匹配的宏塊;當信息量大于該閾值時,則對宏塊進行保留,作為有效特征塊參與進行下述的運動估計等運算。其主要步驟如下第一步將每一幀分成8X8子塊,經試驗證明,若采用分成16X16子塊的形式則計算量過大,若分成4X4子塊則塊匹配等方法不夠精確,故采用8X8子塊的形式;第二步采用Sobel算子得到每一幀的梯度圖,將梯度信息作為宏塊剔除的判斷依據(jù);
權利要求
1.應用于一種基于自適應六邊形運動估計及五幀背景對齊的動背景下視頻對象提取方法,其特征在于包括以下步驟 (1)將第K-2幀、第K-I幀、參考幀K幀、第K+1幀與第K+2幀分別分成8X8宏塊,根據(jù)紋理信息對該五幀中所有宏塊進行預判斷、篩選; (2)對上述篩選后的宏塊采用SAD準則、自適應六邊形搜索策略進行塊匹配,分別以第K-2幀、第K-I幀、第K+1幀與第K+2幀作為當前幀,以第K幀作為參考幀,得到該四幀相對于參考幀K幀的運動矢量場,并通過最小二乘法計算全局運動參數(shù),獲得攝像機六參數(shù)模型; (3)對第K-2幀進行運動補償,使第K-2幀與第K幀背景對齊,得到重建幀K-2’,按照同樣的方法對第K-I幀、第K+1幀與第K+2幀進行運動補償,使第K-I幀、第K+1幀及第K+2幀分別與第K幀背景對齊,并得到重建幀Κ-Γ、重建幀Κ+Γ及重建幀K+2’ ; (4)對重建幀K-2’、Κ-Γ、K+1’、K+2’及參考幀K幀分別采用Kirsch算子提取邊緣信息,并分別計算其相對于參考幀K邊緣的幀差屯、d2、d3、d4,采用最大方差閾值方法進行二值化; (5)分別對連續(xù)五幀前兩幀和后兩幀得到的幀差二值化結果進行與運算;對得到的與運算結果采用或運算及形態(tài)學、中值濾波等進行后處理,實現(xiàn)動背景下視頻對象的快速有效分割。
2.根據(jù)權利要求I所述的方法,其特征在于所述步驟(I)的對于當前第K-2幀、第K-I幀、第K+1幀、第K+2幀與參考幀K幀中分成的8X8宏塊進行預判斷及篩選,具體步驟如下 由于在下述步驟中應用最小二乘法計算全局運動參數(shù)的時候,很多誤差大的宏塊被直接刪除,如果能夠在最小二乘法運算之前將誤差大的宏塊剔除,將顯著的提高運算速度,并降低運算量。而決定宏塊誤差大小、影響計算準確性的重要因素便是宏塊的紋理信息,也就是梯度信息。本部分提出的宏塊預判斷及篩選的方法正是從宏塊的梯度信息出發(fā),根據(jù)設定的閾值對于宏塊進行篩選抑或保留,當宏塊的信息量小于該閾值時,對該宏塊進行篩選,不作為下述步驟中參與塊匹配的宏塊;當信息量大于該閾值時,則對宏塊進行保留,作為有效特征塊參與進行下述的運動估計等運算。
其主要步驟如下 第一步將每一幀分成8X8子塊,經試驗證明,若采用分成16X16子塊的形式則計算量過大,若分成4X4子塊則塊匹配等方法不夠精確,故采用8X8子塊的形式; 第二步采用Sobel算子得到每一幀的梯度圖,將梯度信息作為宏塊剔除的判斷依據(jù);
3.根據(jù)權利要求I所述的方法,其特征在于所述步驟(2)的分別以Κ-2幀、K-I幀、Κ+1幀、Κ+2幀作為當前幀,以K幀作為參考幀,對篩選后的宏塊采用SAD準則、自適應六邊形搜索策略進行塊匹配,并將塊匹配求得的運動矢量場利用最小二乘法獲得攝像機六參數(shù)模型,其具體步驟如下 (i)塊匹配準則SAD 本部分采用SAD塊匹配準則,該準則不僅能夠找到最佳匹配點,并且計算量小、耗時短。
4.根據(jù)權利要求I所述的方法,其特征在于所述步驟(3)的通過運動補償分別獲得當前幀K-2幀、K-I幀、K+1幀及K+2幀的重建幀Κ-2’、Κ-Γ、K+1’、K+2’,其具體內容如下 對于當前幀Κ-2幀、K-I幀、Κ+1幀及Κ+2幀中的每一個點根據(jù)上述獲取的攝像機模型,計算其分別在參考幀K中的對應位置并對其進行賦值,從而實現(xiàn)對于Κ-2幀、K-I幀、Κ+1幀及Κ+2幀的全局運動補償,使補償后的重建幀Κ-2’、Κ-Γ、Κ+1’、Κ+2’與參考幀K的背景對齊,從而實現(xiàn)下述結合邊緣信息、自適應最大方差閾值的基于自適應六邊形運動估計及五幀背景對齊的動背景下視頻分割方法。
5.根據(jù)權利要求I所述的方法,其特征在于所述步驟(4)的采用Kirsch算子提取邊緣信息,并分別與參考幀K邊緣進行差分,采用最大方差閾值進行二值化,其具體步驟如下 (i)Kirsch算子提取邊緣信息,并與參考幀K邊緣進行差分 邊緣檢測算子種類很多,選擇Kirsch邊緣檢測算子對于重建幀Κ-2’、Κ-Γ、Κ+1’、Κ+2’及參考巾貞K巾貞進行邊緣特征提取。
Kirsch算子是由8個模板組成的方向算子,如下所示,8個模板代表8個方向,圖像中的每個點都用8個模板進行卷積,取8個方向中的最大值作為邊緣幅度圖像的輸出。Kirschl算子的8個方向模板如下
6.根據(jù)權利要求I所述的方法,其特征在于所述步驟(5)的對連續(xù)五幀前兩幀和后兩幀得到的幀差二值化結果分別進行與運算,并經過或運算及濾波等后處理 對上述二值化結果OtusBuf I、OtusBuf2、OtusBuf3、OtusBuf4進行與運算,與運算的結果如下
全文摘要
本發(fā)明公開了一種基于自適應六邊形運動估計及五幀背景對齊的動背景下視頻對象提取方法,包括如下步驟首先將K-2幀、K-1幀、參考幀K、K+1幀與K+2幀分成8×8宏塊,根據(jù)宏塊判斷準則對宏塊進行篩選;對篩選后的宏塊采用自適應六邊形運動估計方法進行塊匹配,分別得到上述四幀相對于參考幀的運動矢量場,并通過最小二乘法計算全局運動參數(shù);對第K-2幀、K-1幀、K+1幀與K+2幀分別進行運動補償,使該四幀與參考幀背景對齊,并得到四幀的重建幀;對重建幀及參考幀分別采用Kirsch算子提取邊緣信息,計算相對于參考幀邊緣的幀差,最大方差閾值二值化;分別對連續(xù)五幀前兩幀和后兩幀得到的幀差進行與運算;最后進行或運算并做后處理,實現(xiàn)動背景視頻對象的快速有效分割。
文檔編號H04N7/32GK102917222SQ20121039784
公開日2013年2月6日 申請日期2012年10月18日 優(yōu)先權日2012年10月18日
發(fā)明者祝世平, 郭智超, 高潔 申請人:北京航空航天大學