專利名稱:數(shù)字視頻編碼用可變精度圖像間定時規(guī)定的方法和裝置的制作方法
技術領域:
本發(fā)明涉及多媒體壓縮系統(tǒng)的領域。具體來說,本發(fā)明公開了一種用于規(guī)定可變精度圖像間(inter-picture)定吋的方法和系統(tǒng)。
技術背景基于數(shù)字的電子媒體格式最終在尖端在很大程度上取代模擬電子 媒體格式。數(shù)字壓縮磁盤(CD)很早以前就取代了模擬乙烯唱片。模 擬盒式磁帶越來越稀少。第二和第三代數(shù)字音頻系統(tǒng),例如MD盤和 MP3 (MPEG音頻第三層)正在從壓縮磁盤的第一代數(shù)字音頻格式中 分享市場份額。視頻媒體轉向數(shù)字存儲和傳輸格式的速度比音頻媒體慢。很大程 度上是由于大量的數(shù)字信息需要以數(shù)字形式精確地表達視頻。需要精 確地表達視頻的大量數(shù)字信息需要非常高容量的數(shù)字存儲系統(tǒng)和高帶 寬的傳輸系統(tǒng)。然而,視頻正在迅速地向數(shù)字存儲和傳輸格式轉變。更快的計算 機處理器、高密度存儲系統(tǒng),和新型有效的壓縮和編碼算法最終使數(shù) 字視頻適合于消費者物價點。DVD (數(shù)字多功能光盤),即一種數(shù)字視 頻系統(tǒng),在幾年間已成為最為暢銷的消費者電子產品之一。DVD以其 高視頻質量、非常高的音頻質量、方便性和額外特征已經迅速取代了 盒式錄像機(VCR)成為預錄制視頻回放系統(tǒng)的選擇。老式的模擬NTSC (國家電視標準委員會)視頻傳輸系統(tǒng)正在被數(shù)字ATSC (先進電視標 準委員會)視頻傳輸系統(tǒng)所取代。計算機系統(tǒng)已經使用許多年各種不同的數(shù)字編碼格式。計算機系 統(tǒng)使用的最好的數(shù)字視頻壓縮和編碼系統(tǒng)是眾所周知的縮寫為MPEG 的活動圖像專家組(Motion Pictures Expert Croup)所支持的數(shù)字視頻 格式。MPEG的最著名并被最廣泛應用的三種數(shù)字媒體格式被簡稱為 MPEG-1, MPEG-2和MPEG-4。視頻CD (VCD)和早期的消費者級數(shù)字視頻編輯系統(tǒng)使用早期的MPEG-l.數(shù)字視頻編碼格式。數(shù)字多功能光盤(DVD)和Dish Network牌直播衛(wèi)星(DBS)電視廣播系統(tǒng)使 用更高質量的MPEG-2數(shù)字視頻壓縮和編碼系統(tǒng)。MPEG-4編碼系統(tǒng) 迅速地被最新的基于計算機的數(shù)字視頻編碼器改進并與數(shù)字視頻播放 器相關聯(lián)。MPEG-2和MPEG-4標準壓縮一系列視頻幀或視頻場并且隨后將 壓縮的幀或場編碼為數(shù)字比特流。當對視頻幀或場用MPEG-2和 MPEG-4系統(tǒng)進行編碼時,視頻幀或場將被分成宏塊的矩形網格。每個 宏塊被獨立地壓縮或編碼。當壓縮視頻幀或場時,該MPEG-4標準可以將幀或場壓縮成三種 壓縮的幀或場的一種幀內編碼幀(I-幀),單向預測幀(P幀),或雙 向預測幀(B幀)。幀內編碼幀在不參照其它視頻幀的情況下完全獨立 地將獨立視頻幀編碼。P幀參照單一先前顯示的視頻幀限定一個視頻 幀。B幀參照當前幀之前顯示的視頻幀和在當前幀后顯示的視頻幀限 定一個視頻幀。由于對冗余視頻信息的有效利用,P幀和B幀通常提 供最好的壓縮。發(fā)明內容用于數(shù)字視頻編碼的可變精度圖像間定吋規(guī)定的方法和裝置被公 開。具體來說,本發(fā)明公開了一種使臨近的視頻圖像的相對吋間以相 當有效的方式進行編碼的系統(tǒng)。在一個實施方式中,確定當前視頻圖 像和臨近視頻圖像之間的顯示時間差。該顯示時間差隨后被編碼為視 頻圖像的數(shù)字表示。在一個優(yōu)選實施方式中,臨近的視頻圖像是最新 傳輸?shù)拇鎯D像。為有效地進行編碼,顯示時間差可以用可變長度的編碼系統(tǒng)或算 術編碼進行編碼。在一個可選擇實施方式中,顯示時間差被編碼為2 的冪來減少傳輸?shù)谋忍氐臄?shù)目。從附圖和以下的詳細說明中可以使本發(fā)明的其它目的、特征和優(yōu) 點顯而易見。
本領域的技術人員參照以下的詳細說明將很容易地理解本發(fā)明的 目的,特性和優(yōu)點。圖1表示一種可能的數(shù)字視頻編碼系統(tǒng)的高級框圖。圖2表示一系列圖像應該播放的順序排列的視頻圖像,其中連接 不同圖像的箭頭代表用運動補償創(chuàng)建的圖像間相關性。 -圖3表示以圖像的優(yōu)選傳輸順序排列的圖2中的視頻圖像,其中 連接不同圖像的箭頭表示用運動補償創(chuàng)建的圖像間相關性。圖4表示一系列視頻圖像,其中視頻圖像間互相參照的距離被選 為2的冪。
具體實施方式
一種多媒體壓縮和編碼系統(tǒng)中用于制定變化精度的圖像間定時的 方法和系統(tǒng)被公開。在以下的描述中,為了說明的目的,所闡述的特 定術語為本發(fā)明提供全面理解。然而,對于本領域的技術人員,實施本發(fā)明并不需要這些具體細節(jié)。例如,本發(fā)明是參照MPEG-4多媒體 壓縮和編碼系統(tǒng)來進行說明的。然而,相同的技術可以容易地應用在 其它類型的壓縮和編碼系統(tǒng)中。多媒體壓縮和編碼綜述圖1表示技術領域中所熟知的典型的數(shù)字視頻編碼器100的高級 框圖。該數(shù)字視頻編碼器]00接收在框圖的左側的視頻幀105的輸入 視頻流。每個視頻幀被離散余弦變換(DCT)單元110所處理。該幀 可以獨立地(幀內)處理或者參照運動補償單元(幀間)接收來自其 它幀的信息來處理。然后, 一個量化器(Q)單元120將來自離散余弦 變換單元110的信息量化。最后,量化的視頻幀用熵編碼器(H)單元 180編碼來生成編碼的比特流。該熵編碼器(H)單元180可以用可變 長度編碼(VLC)系統(tǒng)。由于幀間編碼的視頻幀是參照其它臨近視頻幀來限定的,所以數(shù) 字視頻編碼器]00需要創(chuàng)建一個將出現(xiàn)在數(shù)字視頻解碼器中的每個幀 怎樣解碼的復本,這樣幀間就可以被編碼。因此,數(shù)字視頻編碼器IOO 的下部實際為一個數(shù)字視頻解碼器系統(tǒng)。具體來說, 一個反量化(Q—"單元130將視頻幀信息的量化倒置,并且反離散余弦變換(DCT—1)單 元140將視頻幀信息的離散余弦變換進行倒置。在所有DCT系數(shù)從 iDCT中重建時,該運動補償單元將使用信息以及運動矢量來重建隨后 將被用作下一幀運動評估的參考幀的編碼幀。該解碼幀可隨后用于對相對于解碼視頻幀中的信息限定的幀間(P 幀或B幀)進行編碼。具體來說, 一種運動補償(MC)單元50和運 動評估(ME)單元160被用來確定運動矢量并產生用于編碼幀間的不 同數(shù)值。一個速率控制器l卯接收來自數(shù)字視頻編碼器100的不同分量的 信息并使用該信息為每個視頻幀分配比特預算。該速率控制器190應 按照以下方式分配比特預算,使其產生最高質量的遵循一系列指定的 限制的數(shù)字視頻比特流。具體來說,該速率控制器190在沒有溢出緩 沖(通過發(fā)射比能夠存儲的更多的信息來超過解碼器中可訪問的存儲 量)或下溢緩沖(發(fā)送視頻幀不夠快因此使解碼器缺少進行顯示的視 頻幀)的情況下產生最高質量的壓縮視頻流。多媒體壓縮與編碼綜述在一些視頻信號中,連續(xù)視頻圖像(幀或場)之間的時間可以不 恒定。(注意本文將用術語視頻圖像來一般地指視頻幀或視頻場)。 例如, 一些視頻圖像可能由于傳輸帶寬的限制而丟掉。此外,該視頻 定時還可能由于攝像機的不規(guī)則或特殊效果,如慢動作或快動作等而 改變。在一些視頻流中,原始視頻源可以通過設計簡單地具有非一致 圖像間吋間。例如,由于沒有通過例如視頻攝像系統(tǒng)等統(tǒng)一的視頻捕 捉系統(tǒng)來創(chuàng)建非任意視頻定時,所以如計算機圖像動畫等合成視頻可 具有非一致的定時。靈活的數(shù)字視頻編碼系統(tǒng)應能夠處理非一致的定 時。許多數(shù)字視頻編碼系統(tǒng)將視頻圖像分成宏塊的矩形網格。視頻圖 像中的每個個體宏塊被獨立地壓縮和編碼。在某些實施方式中,使用 熟知的"像素區(qū)塊"的宏塊中的子塊。這樣的像素塊可以具有其本身 的可內插的運動矢量。即使本發(fā)明的說明被等同地應用在宏塊和像素 區(qū)塊中,本文將涉及宏塊。某些視頻編碼標準,如,ISO MPEG標準或ITU H.264標準,使用不同類型的預測宏塊來將視頻圖像編碼。在預期中,宏塊可以為以下 三種類型中的一種。1. I宏塊——一個內(I)宏塊在其編碼中不使用來自任何其它視 頻圖像的信息(完全自定義的);2. P宏塊——一種單向預測(P)宏塊是指來自一在前視頻圖像 的圖像信息;或3. B宏塊——一種雙向預測(B)宏塊使用一在前圖像和一在后 視頻圖像的信息。如果視頻圖像中所有的宏塊為內宏塊,則視頻圖像為幀內編碼幀。 如果一個視頻圖像僅包括單向預測宏塊或內宏塊,則視頻圖像被已知 為P幀。如果視頻圖像包括任何雙向預測宏塊,那么視頻圖像已知為B 幀。為簡單起見,本文將考慮所給圖像中的所有宏塊為同一類型的情 況。將編碼的視頻圖像的一個樣本順序可以表示為1,B2B3B4P5B6B7B8B9P,oBuP,2B,31,4…其中字母(1, P或B)代表如果視頻圖像為I幀,P幀,或B幀,且數(shù)字代表以視頻圖像的順序的視頻圖像的攝像順序。該攝像的順序 為攝像機記錄視頻圖像的順序,因此也是視頻圖像應該被顯示的順序 (顯示順序)。視頻圖像的在前樣本系列在圖2中圖解表示。參考圖2,箭頭表示來自存儲圖像的宏塊(在此種情況下I幀或p幀)被用在其它圖像的 運動補償預測中。在圖2的情況中,在幀內視頻圖像I,的編譯中沒有來自其它圖像的信息。視頻圖像P5是在其編碼過程中使用來自在前視頻圖像I,的視 頻信息的P幀,因此從視頻圖像I,到視頻圖像P5繪制了一個箭頭。視 頻圖像B2、視頻圖像B3、視頻像B4在其編譯過程中都使用來自視頻圖像I,和視頻圖像p5的信息,因此從視頻圖像L和視頻圖像p5到視頻圖像B2、視頻圖像B3和視頻圖像B4繪制了箭頭。如上所述該圖像間吋間通常互不相同。由于B圖像使用來自在后圖像(隨后將被顯示的圖像)的信息時,傳輸順序通常與顯示順序不同。具體來說,構建其它圖像所需的視頻 圖像應首先被傳輸。對于以上順序,傳輸順序應為 1,P5B2B3B4PiqB6B7BsB9P,2B,山4B,3…圖3圖解說明了圖2中的視頻圖像的上述傳輸順序。再次地,圖 中的箭頭指示來自存儲的圖像的宏塊(此種情況下為I或P)被用在其 它視頻圖像的運動補償預測中。參照圖3,該系統(tǒng)首先傳輸并不依賴于任何其它幀的I幀I,。隨后, 該系統(tǒng)傳輸依賴于視頻圖像I,的P幀視頻圖像P5。隨后,即使視頻圖 像B2將在視頻圖像P5前被顯示,系統(tǒng)仍將在視頻圖像P5后傳輸B幀 視頻圖像B2。其原因是,當應對B2進行解碼時,解碼器將己經接收并 存儲了將視頻圖像B2進行解碼所必須的視頻圖像I,和P5中的信息。類似地,視頻圖像I卜P5已準備好來將隨后的視頻圖像B3和視頻圖像B4進行解碼。該接收器/解碼器記錄用于正確顯示的視頻圖像順序。在本 操作中,I和P圖像通常指存儲的圖像。P幀圖像的編碼過程典型地使用運動補償,其中在圖像中為每個宏 塊來計算運動矢量。使用計算出的運動矢量,預測宏塊(P宏塊)可以 通過轉變上述在前圖像中的像素來進行。在P幀圖像中的實際宏塊和 預測宏塊之間的差別隨后被編碼以進行傳輸。每個運動矢量也可以通過預測編碼來傳輸。例如, 一個運動矢量 預測可以用臨近的運動矢量形成。在此種情況下,在實際運動矢量和 運動矢量預測之間的差別被編碼以進行傳輸。每個B宏塊使用兩個運動矢量第一運動矢量是指上述在前視頻 圖像,第二運動矢量是指在后視頻圖像。從這兩個運動矢量中,計算 兩個預測宏塊。此兩個預測宏塊隨后用某一函數(shù)結合在一起來形成最 終的預測宏塊。如上所述,在B幀圖像中的實際宏塊和最終預測宏塊 之間的差別隨后被編碼以進行傳輸。由于具有P宏塊,B宏塊的每個運動矢量(MV)可以通過預測編 碼來傳輸。具體來說, 一個預測運動矢量用臨近的運動矢量來形成。 隨后,在實際運動矢量和預測的之間的差別被編碼以進行傳輸。然而,由于B宏塊,存在著從最近的存儲圖像宏塊中內插運動矢 量的機會。在數(shù)字視頻編碼和數(shù)字視頻解碼中都進行這樣的內插。該運動矢量在從攝影機緩慢掃過靜態(tài)背景的視頻順序的視頻圖像 中工作得非常好。實際上,這樣的運動矢量內插足夠好以致可以單獨 使用。具體來說,這意味著對于這些使用內插的編碼的B宏塊運動矢 量無需計算或傳輸任何差別信息。為進一步說明,在上述情況中,我們將圖像i和j之間的圖像間顯示時間表示為Di,i,即,如果圖像的顯示時間分別為Ti和Tj,貝lj Di,「Ti-Tj隨后為 Di,「Di'j+Dj,k Di, k=-Dk, i 注意Di,j在某些情況下可以取負值。因此,如果MV5,,為參考I,的P5宏塊的運動矢量,則對于B2、 B3 和B4中對應的宏塊,參考I,和P5的運動矢量應分別地插入 MV2. ,二MV5,,承D2,,/D5j MV5, 2=MV5J*D5,2/D5J MV3, 「MV5, ,D3,'/D5,,MLV4,產MV5,JD4',/D5j MV5,4=MV5, ^Ds,4/D5,, 注意,由于顯示吋間的比率被用于運動矢量預測,所以不需要絕 對顯示吋間。因此,相對顯示時間可以用做Di,i顯示時間值。本情況作為H.264標準中的實例被概括。在概括中, 一個P或B 圖像可以使用任何先前傳輸?shù)膱D像用于運動矢量預測。因此,在上述情況下,圖像B3可以在其預測中使用圖像Ii和圖像B2。此外,運動圖像不僅可被內插還可被外推。因此,在此種情況下我們將得到 MV3,產MV2,'承D3, "D2,'此種運動矢量外推(或內插)也可以應用在預測過程中來用于運 動矢量的預測編碼過程。在任何情況下,在非一致圖像間時間的問題是將Di,j的相對顯示時 間傳輸?shù)浇邮掌魃希@也是本發(fā)明的主題。在本發(fā)明的一個實施方式 中,在第一圖像之后對于每個圖像,我們將傳輸當前圖像和最新傳輸?shù)拇鎯D像之間的顯示時間差。為了錯誤恢復,在圖像中應將傳輸重復幾次,例如,在MPEG或H.264標準的所謂切片頭部(sliceheader) 中。如果所有的切片頭部丟失,那么推測起來,用于解碼信息的依賴 于丟失圖像的其它圖像也不能被解碼。因此,在上述情況中,我們應傳輸以下i D2, sD3, 5D4,5D10,5D6,10D7, ioDs, 10D9, ioD|2.10 Du, 12D14, 12D13,14--' 為了運動矢量的評估,用于Du的精度需要可以在各圖像間改變。例如,如果在兩個P幀圖像P5和P7之間的中途只有一個單一 B幀圖像B6,則發(fā)送D7,5=2和D6,7=-l就足夠了。其中Di, j顯示時間值為相對時間值。如果,作為替換,視頻圖像B6僅在視頻圖像P5和視頻圖像P7之間距離的1/4處,則將發(fā)送的適當 的Di,j顯示時間值為D7,5="CI D6,產-l注意在以上兩個例子中,在視頻圖像B6和視頻圖像P7之間的顯示時間是作為顯示吋間"單位"來使用,并且在視頻圖像P5和視頻圖像 P;之間的顯示時間差為4個顯示時間"單位"??傊绻龜?shù)為2的冪則運動矢量評估的復雜性較小。如果如 圖4中所圖解的,兩個存儲圖像之間的Di,i (圖像問吋間)被選為2的 冪,則在我們的實施方式中很容易完成??蛇x擇地,該評估過程可以 被定義為將所有除數(shù)取截取或近似為2的冪。當圖像間的時間為2的冪時,如果只有(2的)整數(shù)次冪被傳輸, 而不是圖像間時間的全數(shù)值被傳輸,數(shù)據比特的數(shù)目能夠被減少。圖4 中圖解說明了圖像間的距離被選為2的冪的情況。在此種情況下,在 視頻圖像P,和視頻圖像P3之間的D3J顯示時間值2傳輸為1 (因為 2'=2),并且在視頻圖像P7和視頻圖像P3之間的07,3顯示時間值4可 以傳輸為2 (由于22=4)。在某些情況下,可以不使用運動矢量內插。然而,仍然需要將視 頻圖像的顯示順序傳輸?shù)浇邮掌?播放器系統(tǒng)中,這樣接收器/播放器將 按照適當?shù)捻樞蝻@示視頻圖像。在此種情況下,不考慮實際顯示的時 間,用于Di,的簡單有符號整數(shù)就足夠。在某些應用中可以只需要符號。圖像間時間Di,i可以簡單地作為簡單有符號整數(shù)值傳輸。然而,可 以使用許多方法來將Di,i數(shù)值編碼來完成額外壓縮。例如, 一個可變長 度編碼數(shù)量之前的符號位相對容易實施和提供編碼效率??梢允褂玫囊粋€此種可變長度編碼系統(tǒng)是所熟知的UVLC (通用 可變長度編碼)。該UVLC可變長度編碼系統(tǒng)由編碼詞給出1 = 12= 010 3 = 011 4= 00100 5= 00101 6= 00〗10 7= 00111 8 = 0001000...用于將圖像間時間編碼的另一種方法可以用算術編碼方法。典型 地,算術編碼使用條件可能性來實現(xiàn)數(shù)據比特的非常高的壓縮。因此,本發(fā)明介紹了一種將圖像間顯示時間進行編碼和傳輸?shù)暮?單但有效的方法。圖像間的顯示時間的編碼過程可以通過使用可變長 度編碼或算術編碼而變得非常有效。此外,所需的精度可以選為符合 視頻解碼器的需要,而不再更多。上述內容說明了一種用于在多媒體壓縮和編碼系統(tǒng)中指定各種精 度的圖像間時間的系統(tǒng)。應該理解的是本領域的普通技術人員可以在 不背離本發(fā)明范圍的情況下對本發(fā)明元件的材料和排列進行改變和改 進。
權利要求
1.一種方法,包括接收第一視頻圖像、第二視頻圖像和所述第二視頻圖像的順序值,所述順序值表示在視頻圖像的序列中所述第二視頻圖像相對于所述第一視頻圖像的位置;以及通過使用所述順序值來對所述第二視頻圖像進行解碼。
2. 如權利要求1所述的方法,其中所述順序值表示時間值。
3. 如權利要求1所述的方法,其中所述順序值不表示時間值。
4. 如權利要求1所述的方法,其中所述視頻圖像的序列是用于顯 示視頻圖像的序列。
5. 如權利要求1所述的方法,其中對所述第二視頻圖像進行解碼 包括使用所述順序值來基于另一視頻圖像的運動矢量計算用于所述第 二視頻圖像的運動矢量。
6. 如權利要求5所述的方法,其中所述另一圖像是第三視頻圖像。
7. 如權利要求5所述的方法,其中計算所述運動矢量包括基于所 述另 一視頻圖像的所述運動矢量來執(zhí)行內插操作。
8. 如權利要求5所述的方法,其中計算所述運動矢量包括基于所 述另一視頻圖像的所述運動矢量來執(zhí)行外推操作。
9. 如權利要求1所述的方法,其中所述順序值是壓縮的順序值。
10. 如權利要求9所述的方法,其中所述順序值是通過使用可變長 度編碼來壓縮的。
11. 如權利要求9所述的方法,其中所述順序值是通過使用算術編 碼來壓縮的。
12. 如權利要求1所述的方法,其中所述順序值被存儲在與所述第 二視頻圖像相關的切片頭部中。
13. 如權利要求1所述的方法,其中所述順序值表示所述第二視頻 圖像和所述第一視頻圖像之間的順序差值。
14. 如權利要求1所述的方法,其中所述順序值在所述第二視頻圖像中被存儲了多于一次。
15. 如權利要求l所述的方法,還包括接收順序值的序列,其中所 述順序值的序列是非一致的。
16. —種方法,包括接收第一視頻圖像、第二視頻圖像和所述第二視頻圖像的順序值, 所述順序值表示在視頻圖像的序列中所述第二視頻圖像相對于所述第一視頻圖像的位置;以及通過使用所述順序值來顯示所述第二視頻圖像。
17. 如權利要求16所述的方法,其中所述順序值用于基于另一視 頻圖像的運動矢量來計算用于所述第二視頻圖像的運動矢量。
18. —種方法,包括 接收第一視頻圖像;接收使所述第一視頻圖像與第二視頻圖像相關的順序值;以及 通過使用所述順序值來計算用于所述第一視頻圖像的第一運動矢里。
19. 如權利要求18所述的方法,其中計算所述第一運動矢量包括 使用所述順序值來對第二運動矢量執(zhí)行內插操作以計算所述第一運動矢量。
20. 如權利要求18所述的方法,其中所述第二視頻圖像用于在所 述第一視頻圖像的解碼之前進行解碼。
21. 如權利要求18所述的方法,其中所述順序值被存儲在與所述第一視頻圖像相關的切片頭部中。
22. 如權利要求18所述的方法,其中所述順序值在所述第一視頻 圖像中被存儲了多于一次。
23. 如權利要求18所述的方法,其中所述順序值包括時間值。
24. 如權利要求18所述的方法,其中計算所述第一運動矢量包括 確定所述第一視頻圖像的順序值和第二視頻圖像的順序值之間的第一順序差值;確定第三視頻圖像的順序值和所述第二視頻圖像的所述順序值之 間的第二順序差值;以及通過將用于所述第三視頻圖像的運動矢量與由所述第一順序差值 和所述第二順序差值定義的值相乘來計算用于所述第一視頻圖像的所 述第一運動矢量。
25. —種解碼方法,用于包括第一視頻圖像、第二視頻圖像和第三 視頻圖像的比特流,所述方法包括計算特定值,該特定值基于(i)所述第三視頻圖像的順序值和所述第一視頻圖像的順序值之間的第一順序差值,禾n (ii)所述第二視頻圖像的順序值和所述第一視頻圖像的所述順序值之間的第二順序差值;基于所述特定值和用于所述第三視頻圖像的運動矢量來計算用于 所述第二視頻圖像的特定運動矢量;以及通過使用計算的運動矢量來對至少一個視頻圖像進行解碼。
26. 如權利要求25所述的方法,其中特定視頻圖像的順序值用于 指定該特定視頻圖像在視頻圖像的序列中的位置。
27. 如權利要求26所述的方法,其中所述序列是用于顯示視頻圖 像的序列。
28. 如權利要求25所述的方法,其中特定視頻圖像的順序值表示 該特定視頻圖像相對于另一視頻圖像的位置關系。
29. 如權利要求25所述的方法,其中所述特定值與所述第二順序 差值成比例。
30. 如權利要求25所述的方法,其中所述特定值與所述第一順序 差值成反比。
31. 如權利要求25所述的方法,其中所述第二視頻圖像的所述順 序值來源于存儲在與所述第二視頻圖像相關的切片頭部中的值。
32. 如權利要求25所述的方法,其中通過使用計算的運動矢量來 對所述第二視頻圖像進行解碼。
33. 如權利要求32所述的方法,其中所述第一和第三視頻圖像在 所述第二視頻圖像之前被解碼。
34. —種方法,用于包括第一視頻圖像、第二視頻圖像和第三視頻 圖像的流,所述方法包括計算基于第一順序差值和第二順序差值的特定值,其中(i) 所述第一順序差值表示所述第三視頻圖像的順序值和所 述第一視頻圖像的順序值之間的差值;并且(ii) 所述第二順序差值表示所述第二視頻圖像的順序值和所 述第一視頻圖像的所述順序值之間的差值,其中特定視頻圖像的順序 值表示該特定視頻圖像在視頻圖像的序列中的位置;基于所述特定值和用于所述第三視頻圖像的運動矢量來計算用于 所述第二視頻圖像的運動矢量;以及基于用于所述第三視頻圖像的所述運動矢量來計算用于所述第二 視頻圖像的另一運動矢量。
35. 如權利要求34所述的方法,其中所述特定視頻圖像的所述順 序值指定所述特定視頻圖像在視頻圖像的序列中的顯示順序。
36. —種設備,包括用于執(zhí)行如權利要求1-35中的任一項所述 的方法的裝置。
全文摘要
本發(fā)明公開了一種數(shù)字視頻編碼中用于可變精度圖像間定時規(guī)定的方法和裝置。具體來說,本發(fā)明提供一種允許臨近視頻圖像的相對時間可以按各種有效的方式進行編碼的系統(tǒng)。在一個實施方式中,確定了當前視頻圖像(105)和臨近視頻圖像中的顯示時間差。顯示時間差隨后被編碼(180)為視頻圖像的數(shù)字表達。在一個優(yōu)選實施方式中,該臨近視頻圖像為最新傳輸?shù)拇鎯D像。為有效進行編碼,顯示時間差可以用可變長度編碼系統(tǒng)或算術編碼進行編碼。在一個可選擇實施方式中,該顯示時間差被作為2的冪來進行編碼以減少傳輸比特的數(shù)目。
文檔編號H04N7/36GK101262605SQ20081008223
公開日2008年9月10日 申請日期2003年7月11日 優(yōu)先權日2002年7月15日
發(fā)明者A·普里, A·杜米特拉斯, B·G·哈斯克爾, D·W·辛格 申請人:蘋果電腦有限公司