專利名稱:視頻編碼方法
技術領域:
本發(fā)明通常涉及基于對象的視頻編碼領域,且更具體地涉及根據(jù)一種處理來編碼視頻數(shù)據(jù)序列的方法,在所述處理中幾類數(shù)據(jù)被識別,所述數(shù)據(jù)由所謂的多個視頻對象平面(VOP)所組成,該VOP或者是內(nèi)部編碼的VOP(I-VOP),其僅僅利用從它們自身得到的信息進行編碼,或者是預測編碼VOP(P-VOP),其利用一個從過去的參考VOP得到的運動補償預測進行編碼,或者是雙向預測的VOP(B-VOP),其利用一個從過去和將來的參考VOP得到的運動補償預測進行編碼。
背景技術:
MPEG-4視頻標準提供了多種技術,其以較大范圍的比特率在許多應用領域,例如數(shù)字電視、流動視頻、移動多媒體、游戲等等之內(nèi)觀看、訪問和操作對象(而不是如以前的MPEG標準去操作像素)。所述標準對視頻對象(VO)進行操作,所述視頻對象由時間和空間信息所限定,所述時間和空間信息以形狀、運動和結構信息的形式表現(xiàn),并分別在位流中被編碼(這些VO是用戶能夠訪問和操作的實體)。
MPEG-4方法依賴于一序列連續(xù)場景的基于內(nèi)容的視覺數(shù)據(jù)顯示,每一個場景是VO的復合體,VO帶有它自身固有的特性形狀、運動和結構。除了VO的概念之外,MPEG-4標準介紹了其它的一些東西,如視頻對象層(依賴于應用,每一個VO或者以一個可縮放,或者以不能縮放的形式被編碼,其由視頻對象層或者VOL表現(xiàn))和視頻對象平面(VOP)(=在時間上的VO實例)。可以假定一個輸入視頻序列的每一幀被分割成許多任意形狀的圖像區(qū)域(VO),且屬于同一個VO的VOP的形狀、運動和結構信息被編碼并且被傳送到相應于特定的時間或空間分辨率的分離的VOL中(其允許隨后去單獨地解碼每一個VOP且促成了所需要的對視頻序列的靈活操作)。
下面是由這樣一個編碼結構處理過的幀的三種類型I-VOP、P-VOP、和B-VOP。I-VOP是一個內(nèi)部編碼的VOP該編碼操作僅僅使用從其自身得到的信息(其是使用了最大數(shù)量的位的VOP)。P-VOP是預測編碼的VOP,且該編碼操作則是使用一個從過去的參考VOP中得到的運動補償預測,該過去的參考VOP或者可以是一個I-VOP或者可以是另一個P-VOP(與一個I-VOP相反,僅編碼當前運動補償P-VOP與它的參考VOP之間的差因此,一個P-VOP通常比一個I-VOP使用更少的位)。B-VOP是使用從過去和將來的參考VOP(I-VOP或者P-VOP)的運動補償預測進行編碼得到的VOP,分別基于所謂的向前的和向后的運動估計而被編碼的VOP。一個B-VOP不能作參考VOP,且象P-VOP,僅有當前運動補償B-VOP與它的參考VOP之間的差被編碼。
不幸地,這時,使用所述B-VOP預測(也叫做內(nèi)插或者雙向模式)經(jīng)常得不到壓縮方面的效果。如果壓縮有時能被改善大約20%,在一些情形下也會急劇地降低。
發(fā)明內(nèi)容
于是本發(fā)明的一個目的是提出一種編碼方法,其僅僅在B-VOP預測有效時才使用這樣的B-VOP預測。
為此,本發(fā)明涉及一種在說明書的前序部分中限定的編碼方法,所述編碼方法包括對每一個VOP的編碼步驟和一個在所述編碼步驟之前在當前的VOP和先前的一個VOP之間執(zhí)行的運動估計步驟,所述運動估計步驟本身包括一個關于要被編碼的VOP的類型的判定處理且基于下面的子步驟-在一個序號為N的VOP(VOP N)和先前的一個VOP(VOP N-1)之間執(zhí)行一個運動估計;-以所述運動估計為基礎,計算一個所謂的相干系數(shù),提供對序列運動的量化;-基于所述相干系數(shù)與一個預定閾值的比較結果,對當前的VOP的類型作出最終的判定,根據(jù)所述相干系數(shù)相對于所述閾值的值判定所述當前VOP是一個B-VOP或者不是一個B-VOP。
本發(fā)明現(xiàn)在參照附圖,以示例的方式進行描述,其中圖1圖示了根據(jù)本發(fā)明的編碼方法的主要步驟。
具體實施例方式
一個MPEG-4編碼器包括幾個功能塊,在所述功能塊中一個或者幾個存儲器用于以標準所需要的傳輸順序輸出VOP。例如,如果輸入順序是IBBPBBP...,那么輸出或者傳輸順序將會是IPBBPBB...(為了能夠向后預測,編碼器必須將自然順序的圖像重新排序為所述的傳輸順序,以使B-VOP在它們所參考過去和將來的VOP之后被傳輸)。所述編碼器還包括一個運動估計器,用于接收當前的VOP和先前的一個VOP(或者參考VOP),并且判定對于當前VOP將執(zhí)行哪種預測對于I-VOP為沒有預測,對于P-VOP為向前預測,對于B-VOP為雙向預測。
如圖1顯示了在運動估計器中關于預測的判定過程的步驟,根據(jù)本發(fā)明,所述判定基于以下步驟的執(zhí)行過程。首先,捕捉當前的VOP(序號N)(步驟CAP-VN)。然后在VOP N和先前的VOP(序號N-1)之間執(zhí)行運動估計(M-EST),且為了量化序列運動,計算一個命名為“相干系數(shù)”的系數(shù)(步驟CF-CPT),且將所述相干系數(shù)與一個預定的閾值進行比較(步驟CF-TEST)。根據(jù)比較結果(Y=低于,或者N=不低于),VOP N被允許(N-AL)或者不被允許(N-NAL)作為一個B-VOP。然后執(zhí)行關于預測模式的最終判定(步驟V-DEC),并且能夠執(zhí)行對當前VOP(=I-VOP、或者P-VOP、或者B-VOP)的編碼步驟(步驟COD)。
對于在比較測試中使用的相干系數(shù)可以提出幾種表示法,而這并不限制本發(fā)明的范圍。不過,一個優(yōu)選的相干系數(shù)可以是例如下面所表述的在同一個VOP中的宏塊(以16×16像素模式或者8×8像素模式估計)的運動矢量與它的先前宏塊的運動矢量之間的絕對差的總和與前一個VOP的類似總和的比率(在此被重新調(diào)用,即對于大小為k×k的宏塊,SAD的表示式是SAD=Σi=0K×K|A(i)-B(i)|]]>其中B(i)和A(i)分別表示所考慮的當前宏塊和參考VOP中與在所述參考VOP中定義的搜索范圍內(nèi)的最大宏塊相匹配的宏塊)。
權利要求
1.一個根據(jù)一種處理來編碼一序列視頻數(shù)據(jù)的方法,在所述處理中數(shù)據(jù)的幾種類型被識別,所述數(shù)據(jù)由所謂的視頻對象平面(VOP)組成,VOP或者是內(nèi)部編碼的VOP(I-VOP),其僅僅利用從它們自身得到的信息進行編碼,或者是預測編碼VOP(P-VOP),其利用一個從過去的參考VOP得到的運動補償預測進行編碼,或者是雙向預測的VOP(B-VOP),其利用一個從過去和將來的參考VOP得到的運動補償預測進行編碼,所述編碼方法包括對每一個VOP進行編碼的步驟,在所述編碼步驟之前在當前VOP和先前的一個VOP之間執(zhí)行一個運動估計步驟,所述運動估計步驟本身包括一個關于要被編碼的VOP的類型的判定處理,并且基于以下子步驟-在一個序號為N的VOP(VOP N)和先前的一個VOP(VOP N-1)之間執(zhí)行運動估計;-以所述運動估計為基礎,計算一個所謂的相干系數(shù),提供對序列運動的量化;-基于所述相干系數(shù)與一個預定閾值的比較結果,對當前的VOP的類型作出最終的判定,根據(jù)所述相干系數(shù)相對于所述閾值的值判定所述當前VOP是一個B-VOP或者不是一個B-VOP。
2.根據(jù)權利要求1所述的編碼方法,其中所述相干系數(shù)被表述為由所述運動估計產(chǎn)生的同一個VOP中的宏塊和它先前宏塊的運動矢量之間的絕對差的總和(SAD)同先前的VOP的類似總和的比率。
全文摘要
本發(fā)明涉及一種編碼方法,該方法對I、P或者B類型的視頻對象平面(VOP)進行處理且包括對所述VOP的動態(tài)分配。根據(jù)所述方法,對于每一個輸入幀,在當前幀和先前幀之間執(zhí)行一個初步的前向運動估計。然后使用當前和先前運動場來求取相干系數(shù)的值,其表示為與當前和先前運動場中的局部差的總和相關聯(lián)。根據(jù)所述相干系數(shù)相對于實驗確定的閾值的值,最后判定要被編碼的幀的類型。
文檔編號G06T9/00GK1706199SQ200380101555
公開日2005年12月7日 申請日期2003年10月13日 優(yōu)先權日2002年10月16日
發(fā)明者M·德里尤西, F·戈羅里雷, D·斯努克 申請人:皇家飛利浦電子股份有限公司