專利名稱:用于對視頻進行解碼的設備的制作方法
技術領域:
示例性實施例涉及對視頻進行編碼和解碼。
背景技術:
隨著用于再現(xiàn)和存儲高分辨率或高質量視頻內容的硬件的發(fā)展和提供,對有效地對高分辨率或高質量視頻內容進行編碼或解碼的視頻編解碼器的需求正在增加。在傳統(tǒng)的視頻編解碼器中,基于具有預定大小的宏塊,根據受限的編碼方法對視頻進行編碼。由所述視頻編解碼器執(zhí)行的現(xiàn)有的幀間預測來估計運動矢量,并通過使用2NX 2N大小的宏塊的具有2NX2N、2NXN、NX2N和NXN的大小的分區(qū)來估計所述宏塊的運動。
發(fā)明內容
技術問題示例性實施例提供通過使用任意形狀的分區(qū)執(zhí)行幀間預測來對視頻進行編碼和解碼。技術方案根據示例性實施 例的一方面,提供了一種對視頻進行編碼的方法,所述方法包括:將視頻數(shù)據劃分為最大編碼單元;基于根據最大編碼單元的至少一個劃分的區(qū)域的分層結構的較深層編碼單元,對最大編碼單元的視頻數(shù)據進行編碼,確定編碼的結果將被輸出的編碼深度,其中,在分層結構中,隨著深度的加深,上層深度的編碼單元被劃分,所述確定包括使用通過根據任意比例劃分上層深度的編碼單元而獲得的分區(qū)執(zhí)行幀間預測;輸出比特流,所述比特流包括與針對最大編碼單元的至少一個劃分的區(qū)域的編碼深度相應的編碼視頻數(shù)據以及關于編碼深度和編碼模式的信息。有益效果根據示例性實施例,由于在考慮圖像的大小的同時增大了編碼單元的最大大小,同時在考慮圖像的特征時調整編碼單元,因此可提高圖像壓縮效率。即使圖像數(shù)據具有高分辨率和大數(shù)據量,也可通過使用編碼單元的大小和編碼模式來有效地解碼和恢復圖像數(shù)據,其中,通過使用從編碼器接收的關于最佳編碼模式的信息根據圖像數(shù)據的特征自適應地確定所述編碼單元的大小和編碼模式。
圖1是根據示例性實施例的用于對視頻進行編碼的設備的框圖;圖2是根據示例性實施例的用于對視頻進行解碼的設備的框圖;圖3是用于描述根據示例性實施例的編碼單元的概念的示圖4是根據示例性實施例的基于編碼單元的圖像編碼器的框圖;圖5是根據示例性實施例的基于編碼單元的圖像解碼器的框圖;圖6是示出根據示例性實施例的根據深度的較深層編碼單元以及分區(qū)的示圖;圖7是用于描述根據示例性實施例的編碼單元和變換單元之間的關系的示圖;圖8是用于描述根據示例性實施例的與編碼深度相應的編碼單元的編碼信息的示圖;圖9是根據示例性實施例的根據深度的較深層編碼單元的示圖;圖10至圖12是用于描述根據示例性實施例的編碼單元、預測單元和變換單元之間的關系的不圖;圖13是用于描述根據表I的編碼模式信息的編碼單元、預測單元或分區(qū)以及變換單元之間的關系的示圖;圖14是示出根據示例性實施例的對視頻進行編碼的方法的流程圖;圖15是示出根據示例性實施例的對視頻進行解碼的方法的流程圖;圖16是根據另一示例性實施例的關于使用根據任意比例劃分的分區(qū)進行的幀間預測的視頻編碼設備的框圖;圖17是根據另一示例性實施例的關于使用根據任意比例劃分的分區(qū)進行的幀間預測的視頻解碼設備的框圖;圖18是根據示例性實施例的通過根據任意比例劃分編碼單元而獲得的示例性分區(qū)的框圖;圖19示出根據示例性實施例的序列參數(shù)集的語法,其中,序列參數(shù)集包括關于用于幀間預測的分區(qū)類型是否包括通過根據任意比例劃分編碼單元而獲得的分區(qū)的信息;圖20是示出根據另一示例性實施例的關于使用根據任意比例劃分的分區(qū)進行的幀間預測的視頻編碼方法的流程圖;圖21是示出根據另一示例性實施例的關于使用根據任意比例劃分的分區(qū)進行的幀間預測的視頻編碼方法的流程圖。最佳實施方式根據示例性實施例的一方面,提供了一種對視頻進行編碼的方法,所述方法包括:將視頻數(shù)據劃分為最大編碼單元;基于根據最大編碼單元的至少一個劃分的區(qū)域的分層結構的較深層編碼單元,對最大編碼單元的視頻數(shù)據進行編碼,確定編碼的結果將被輸出的編碼深度,其中,在分層結構中,隨著深度加深,上層深度的編碼單元被劃分,所述確定包括使用通過根據任意比例劃分編碼單元而獲得的分區(qū)執(zhí)行幀間預測;輸出比特流,所述比特流包括與針對根據最大編碼單元的至少一個劃分的區(qū)域的編碼深度相應的編碼視頻數(shù)據以及關于編碼深度和編碼模式的信息。深度表示編碼單元被分層劃分的次數(shù),隨著深度加深,根據深度的較深層編碼單元可從最大編碼單元被劃分以獲得最小編碼單元。深度從上層深度被加深到下層深度。隨著深度加深,最大編碼單元被劃分的次數(shù)增加,最大編碼單元被劃分的可能次數(shù)的總數(shù)相應于最大深度。編碼單元的最大大小和最大深度可被預先確定。
確定編碼深度的步驟可包括:選擇性地確定是否使用通過根據任意比例劃分編碼單元而獲得的分區(qū)執(zhí)行幀間預測。
輸出比特流的步驟可包括:包括指示用于幀間預測的分區(qū)類型是否包括通過根據任意比例劃分編碼單元而獲得的分區(qū)的信息。通過根據任意比例劃分編碼單元而獲得的分區(qū)可以是通過根據1:3或3:1的比例劃分編碼單元的高和寬而獲得的分區(qū)。最大編碼單元可被選擇性地設置為大小為16X16、32X32、64X64、128X128和256X256的塊中的至少一個。編碼深度可被確定為根據相應劃分的區(qū)域的分層結構的較深層編碼單元的編碼結果中具有最高編碼效率的較深層編碼單元的深度,并針對最大編碼單元內的所述至少一個劃分的區(qū)域被獨立地確定。根據示例性實施例的另一方面,提供了一種對視頻進行解碼的方法,所述方法包括:接收并解析編碼視頻數(shù)據的比特流;從比特流提取根據最大編碼單元的編碼視頻數(shù)據以及關于根據最大編碼單元的編碼深度和編碼模式的信息;基于關于根據最大編碼單元的編碼深度和編碼模式的信息,針對根據最大編碼單元的至少一個編碼深度的編碼單元,執(zhí)行解碼,所述解碼包括使用通過根據任意比例劃分編碼單元而獲得的分區(qū)進行的運動補償,其中,所述至少一個編碼深度的編碼單元被確定為最大編碼單元的至少一個劃分的區(qū)域的分層結構的較深層編碼單元的深度之一。提取編碼視頻數(shù)據的步驟可包括:進一步從比特流提取指示用于幀間預測的分區(qū)類型是否包括通過根據任意比例劃分編碼單元而獲得的分區(qū)的信息。執(zhí)行解碼的步驟可包括:基于從比特流提取的指示用于幀間預測的分區(qū)類型是否包括通過根據任意比例劃分編碼單元而獲得的分區(qū)的信息,選擇性地確定是否使用通過根據任意比例劃分編碼單元而獲得的分區(qū)執(zhí)行運動補償。根據示例性實施 例的另一方面,提供了一種用于對視頻進行編碼的設備,所述設備包括:最大編碼單元劃分器,將視頻數(shù)據劃分為最大編碼單元;編碼器,基于根據最大編碼單元的至少一個劃分的區(qū)域的分層結構的較深層編碼單元,對最大編碼單元的視頻數(shù)據進行編碼,確定編碼的結果將被輸出的編碼深度,其中,在分層結構中,隨著深度加深,上層深度的編碼單元被劃分,所述確定包括使用通過根據任意比例劃分編碼單元而獲得的分區(qū)執(zhí)行幀間預測;輸出單元,輸出比特流,所述比特流包括與針對根據最大編碼單元的至少一個劃分的區(qū)域的編碼深度相應的編碼視頻數(shù)據以及關于編碼深度和編碼模式的信息。根據示例性實施例的另一方面,提供了一種用于對視頻進行解碼的設備,所述設備包括:解析器,接收并解析編碼視頻數(shù)據的比特流;提取器,從比特流提取根據最大編碼單元的編碼視頻數(shù)據以及關于根據最大編碼單元的編碼深度和編碼模式的信息;解碼器,基于關于根據最大編碼單元的編碼深度和編碼模式的信息,針對根據最大編碼單元的至少一個編碼深度的編碼單元,執(zhí)行解碼,所述解碼包括使用通過根據任意比例劃分編碼單元而獲得的分區(qū)進行的運動補償,其中,所述至少一個編碼深度的編碼單元被確定為最大編碼單元的至少一個劃分的區(qū)域的分層結構的較深層編碼單元的深度之一。根據示例性實施例的另一方面,提供了一種計算機可讀記錄介質,所述計算機可讀記錄介質記錄有用于執(zhí)行對視頻進行編碼的方法的程序。根據示例性實施例的另一方面,提供了一種計算機可讀記錄介質,所述計算機可讀記錄介質記錄有用于執(zhí)行對視頻進行解碼的方法的程序。
具體實施例方式以下,將參照附圖更充分地描述示例性實施例,其中,示例性實施例顯示在附圖中。在示例性實施例中,“單元”根據其上下文可表示大小的單位或可不表示大小的單位。以下,根據示例性實施例,“編碼單元”是進行編碼的數(shù)據單元以及被編碼后的數(shù)據單元,其中,按照所述進行編碼的數(shù)據單元,圖像數(shù)據在編碼器端被編碼,按照所述被編碼后的數(shù)據單元,編碼圖像數(shù)據在解碼器端被解碼。此外,“編碼深度”表示編碼單元被編碼的深度。以下,“圖像”可表示視頻的靜止圖像或者運動圖像(S卩,視頻本身)。將參照圖1至圖15描述根據示例性實施例的基于空間分層的數(shù)據單元對視頻進行的編碼和解碼,將參照圖16至圖21描述根據示例性實施例的通過使用按照任意比例劃分的分區(qū)進行幀間預測來對視頻進行的編碼和解碼。圖1是根據示例性實施例的視頻編碼設備100的框圖。視頻編碼設備100包括最大編碼單元劃分器110、編碼單元確定器120和輸出單元130。最大編碼單元劃分器110可基于圖像的當前畫面的最大編碼單元對當前畫面進行劃分。如果當前畫面大于最大編碼單元,則當前畫面的圖像數(shù)據可被劃分為至少一個最大編碼單元。根據示例性實施例的最大編碼單元可以是具有32X32,64X64,128X 128、256 X 256等大小的數(shù)據單元,其中,數(shù)據單元的形狀是寬和高為2的平方的方形。圖像數(shù)據可根據所述至少一個最大編碼單元被輸出到編碼單元確定器120。根據示例性實施例的編碼單元可由最大大小以及深度來表征。深度表示編碼單元從最大編碼單元被空間劃分 的次數(shù),并且隨著深度加深或增加,根據深度的較深層編碼單元可從最大編碼單元被劃分為最小編碼單元。最大編碼單元的深度是最上層深度,最小編碼單元的深度是最下層深度。由于與每個深度相應的編碼單元的大小隨著最大編碼單元的深度加深而減小,因此,與上層深度相應的編碼單元可包括多個與下層深度相應的編碼單
J Li ο如上所述,當前畫面的圖像數(shù)據根據編碼單元的最大大小而被劃分為最大編碼單元,所述最大編碼單元中的每一個可包括根據深度被劃分的較深層編碼單元。由于根據示例性實施例的最大編碼單元根據深度被劃分,因此包括在最大編碼單元中的空間域的圖像數(shù)據可根據深度被分層劃分??深A定編碼單元的最大深度和最大大小,所述最大深度和最大大小限定最大編碼單元的高和寬被分層劃分的總次數(shù)。編碼單元確定器120對通過根據深度劃分最大編碼單元的區(qū)域而獲得的至少一個劃分的區(qū)域進行編碼,并根據所述至少一個劃分的區(qū)域確定用于輸出最終編碼的圖像數(shù)據的深度。換句話說,編碼單元確定器120通過根據當前畫面的最大編碼單元按照根據深度的較深層編碼單元對圖像數(shù)據進行編碼,并選擇具有最小編碼誤差的深度,來確定編碼深度。因此,與確定的編碼深度相應的編碼單元的編碼圖像數(shù)據被最終輸出。此外,與編碼深度相應的編碼單元可被視為被編碼的編碼單元。確定的編碼深度和根據確定的編碼深度的編碼圖像數(shù)據被輸出到輸出單元130。
基于與等于或低于最大深度的至少一個深度相應的較深層編碼單元對最大編碼單元中的圖像數(shù)據進行編碼,基于較深層編碼單元中的每一個來比較對圖像數(shù)據進行編碼的結果。在比較較深層編碼單元的編碼誤差之后,可選擇具有最小編碼誤差的深度。可針對每個最大編碼單元選擇至少一個編碼深度。隨著編碼單元根據深度而被分層劃分,并且隨著編碼單元的數(shù)量增加,最大編碼單元的大小被劃分。此外,即使在一個最大編碼單元中編碼單元相應于相同深度,也通過分別測量每個編碼單元的圖像數(shù)據的編碼誤差來確定是否將與相同深度相應的編碼單元中的每一個劃分到下層深度。因此,即使當圖像數(shù)據被包括在一個最大編碼單元中時,圖像數(shù)據也根據多個深度被劃分為多個區(qū)域,并且在所述一個最大編碼單元中,編碼誤差可根據區(qū)域而不同,因此,編碼深度可根據圖像數(shù)據中的區(qū)域而不同。因此,在一個最大編碼單元中可確定一個或多個編碼深度,可根據至少一個編碼深度的編碼單元來劃分最大編碼單元的圖像數(shù) 據。因此,編碼單元確定器120可確定包括在最大編碼單元中的具有樹結構的編碼單元。根據示例性實施例的“具有樹結構的編碼單元”包括在最大編碼單元中包括的所有較深層編碼單元中與被確定為編碼深度的深度相應的編碼單元。在最大編碼單元的相同區(qū)域中,編碼深度的編碼單元可根據深度被分層確定,在不同的區(qū)域中,編碼深度的編碼單元可被獨立地確定。類似地,當前區(qū)域中的編碼深度可獨立于另一區(qū)域中的編碼深度被確定。根據示例性實施例的最大深度是關于從最大編碼單元到最小編碼單元的劃分次數(shù)的索引,即,關于最大編碼單元被劃分到最小編碼單元的次數(shù)的索引。根據示例性實施例的第一最大深度可表示從最大編碼單元到最小編碼單元的總劃分次數(shù)。根據示例性實施例的第二最大深度可表示從最大編碼單元到最小編碼單元的深度級的總數(shù)。例如,當最大編碼單元的深度為O時,最大編碼單元被劃分一次的編碼單元的深度可被設置為1,最大編碼單元被劃分兩次的編碼單元的深度可被設置為2。這里,如果最小編碼單元是最大編碼單元被劃分四次的編碼單元,則存在深度0、1、2、3和4這5個深度級,因此,第一最大深度可被設置為4,第二最大深度可被設置為5。可根據最大編碼單元執(zhí)行預測編碼和變換。還可根據最大編碼單元,基于根據等于最大深度的深度或小于最大深度的深度的較深層編碼單元來執(zhí)行預測編碼和變換??筛鶕蛔儞Q或整數(shù)變換的方法來執(zhí)行變換。由于每當最大編碼單元根據深度被劃分時較深層編碼單元的數(shù)量增加,因此可針對隨著深度加深而產生的所有較深層編碼單元執(zhí)行包括預測編碼和變換的編碼。為了便于描述,現(xiàn)在將基于最大編碼單元中的當前深度的編碼單元來描述預測編碼和變換。視頻編碼設備100可變化地選擇用于對圖像數(shù)據進行編碼的數(shù)據單元的大小或形狀。為了對圖像數(shù)據進行編碼,執(zhí)行諸如預測編碼、變換和熵編碼的操作,此時,可針對所有操作使用相同的數(shù)據單元,或者可針對每個操作使用不同的數(shù)據單元。例如,視頻編碼設備100不僅可選擇用于對圖像數(shù)據進行編碼的編碼單元,還可選擇與編碼單元不同的數(shù)據單元,以便對編碼單元中的圖像數(shù)據執(zhí)行預測編碼。為了在最大編碼單元中執(zhí)行預測編碼,可基于與編碼深度相應的編碼單元(S卩,基于不再被劃分為與下層深度相應的編碼單元的編碼單元)執(zhí)行預測編碼。以下,現(xiàn)將不再被劃分并且變成用于預測編碼的基本單元的編碼單元稱為“預測單元”。通過對預測單元進行劃分所獲得的分區(qū)可包括通過對預測單元的高和寬中的至少一個進行劃分所獲得的預測單元或數(shù)據單元。例如,當2NX2N (其中,N是正整數(shù))的編碼單元不再被劃分,并且變成2NX2N的預測單元時,分區(qū)的大小可以是2NX 2N、2NX N、NX 2N或NX N。分區(qū)類型的示例包括通過對預測單元的高或寬進行對稱劃分所獲得的對稱分區(qū)、通過對預測單元的高或寬進行不對稱劃分(諸如l:n或η:1)所獲得的分區(qū)、通過對預測單元進行幾何劃分所獲得的分區(qū)以及具有任意形狀的分區(qū)。預測單元的預測模式可以是幀內模式、幀間模式和跳過模式中的至少一個。例如,可針對2ΝX 2Ν、2ΝX N、NX 2Ν或NX N的分區(qū)執(zhí)行幀內模式或幀間模式。此外,可僅針對2ΝΧ2Ν的分區(qū)執(zhí)行跳過模式。針對編碼單元中的一個預測單元獨立地執(zhí)行編碼,從而選擇具有最小編碼誤差的預測模式。視頻編碼設備100還可不僅基于用于對圖像數(shù)據進行編碼的編碼單元,還基于不同于編碼單元的數(shù)據單元,對編碼單元中的圖像數(shù)據執(zhí)行變換。為了在編碼單元中執(zhí)行變換,可基于具有小于或等于編碼單元的大小的數(shù)據單元來執(zhí)行變換。例如,用于變換的數(shù)據單元可包括用于幀內模式的數(shù)據單元和用于幀間模式的數(shù)據單元?,F(xiàn)將用作變換的基礎的數(shù)據單元稱為“變換單元”。還可在變換單元中設置指示通過對編碼單元的高和寬進行劃分來達到變換單元的劃分次數(shù)的變換深度。例如,在2ΝΧ 2Ν的當前編碼單元中,當變換單元的大小也為2ΝΧ2Ν時,變換深度可以是0,當所述當前編碼單元的高和寬中的每一個被劃分為兩等份,總共被劃分為4~1個變換單元,從而變換單元的大小是NXN時,變換深度可以是1,當所述當前編碼單元的高和寬的每一個被劃分為四等份,總共被劃分為4~2個變換單元,從而變換單元的大小是Ν/2ΧΝ/2時,變換深度可以是
2。例如,可根據分層樹結構來設置變換單元,其中,根據變換深度的分層特性,上層變換深度的變換單元被劃分為下層變換深度的四個變換單元。與編碼單元類似,編碼單元中的變換單元可被遞歸地劃分為大小更小的區(qū)域,從而可以以區(qū)域為單位獨立地確定變換單元。因此,可根據具有根據變換深度的樹結構的變換,來劃分編碼單元中的殘差數(shù)據。根據與編碼深度相應的編碼單元的編碼信息不僅需要關于編碼深度的信息,還需要關于與預測編碼和變換有關的信息的信息。因此,編碼單元確定器120不僅確定具有最小編碼誤差的編碼深度,還確定預測單元中的分區(qū)類型、根據預測單元的預測模式和用于變換的變換單元的大小。稍后將參照圖3至圖12詳細描述根據示例性實施例的根據最大編碼單元中的樹結構的編碼單元以及確定分區(qū)的方法。編碼單元確定器120可通過使用基于拉格朗日乘子的率失真優(yōu)化來測量根據深度的較深層編碼單元的編碼誤差。輸出單元130在比特流中輸出最大編碼單元的圖像數(shù)據以及關于根據編碼深度的編碼模式的信息,其中,所述圖像數(shù)據基于由編碼單元確定器120確定的至少一個編碼深度被編碼。 通過對圖像的殘差數(shù)據進行編碼來獲得編碼圖像數(shù)據。
關于根據編碼深度的編碼模式的信息可包括關于編碼深度的信息、關于預測單元中的分區(qū)類型的信息、預測模式以及變換單元的大小??赏ㄟ^使用根據深度的劃分信息來定義關于編碼深度的信息,關于編碼深度的信息指示是否針對下層深度而不是當前深度的編碼單元來執(zhí)行編碼。如果當前編碼單元的當前深度是編碼深度,則當前編碼單元中的圖像數(shù)據被編碼并被輸出,因此劃分信息可被定義為不將當前編碼單元劃分到下層深度??蛇x地,如果當前編碼單元的當前深度不是編碼深度,則針對下層深度的編碼單元來執(zhí)行編碼,因此,劃分信息可被定義為劃分當前編碼單元以獲得下層深度的編碼單元。如果當前深度不是編碼深度,則針對被劃分為下層深度的至少一個編碼單元的編碼單元來執(zhí)行編碼。由于在當前深度的一個編碼單元中存在下層深度的至少一個編碼單元,因此針對下層深度的每個編碼單元重復執(zhí)行編碼,因此,可針對具有相同深度的編碼單元遞歸地執(zhí)行編碼。由于針對一個最大編碼單元確定具有樹結構的編碼單元,并且針對編碼深度的編碼單元確定關于至少一個編碼模式的信息,因此,可針對一個最大編碼單元確定關于至少一個編碼模式的信息。此外,由于圖像數(shù)據根據深度被分層劃分,因此,最大編碼單元的圖像數(shù)據的編碼深度可根據位置而不同,因此,可針對圖像數(shù)據設置關于編碼深度和編碼模式的信息。因此,輸出單元130可將關于相應的編碼深度和編碼模式的編碼信息分配給包括在最大編碼單元中的編碼單元、預測單元和最小單元中的至少一個。根據示例性實施例的最小單元是通過將具有最低深度的最小編碼單元劃分4次所獲得的矩形數(shù)據單元。 可選地,最小單元可以是最大矩形數(shù)據單元,所述最大矩形數(shù)據單元可包括在最大編碼單元中所包括的所有編碼單元、預測單元、分區(qū)單元和變換單元中。例如,通過輸出單元130輸出的編碼信息可被分為根據編碼單元的編碼信息和根據預測單元的編碼信息。根據編碼單元的編碼信息可包括關于預測模式的信息和關于分區(qū)大小的信息。根據預測單元的編碼信息可包括關于幀間模式的估計方向的信息、關于幀間模式的參考圖像索引的信息、關于運動矢量的信息、關于幀內模式的色度分量的信息和關于幀內模式的插值方法的信息。此外,關于根據畫面、像條或GOP定義的編碼單元的最大大小的信息以及關于最大深度的信息可被插入比特流的SPS (序列參數(shù)集)或頭中。在視頻編碼設備100中,較深層編碼單元可以是通過將作為上一層的上層深度的編碼單元的高或寬劃分兩次所獲得的編碼單元。換句話說,當當前深度的編碼單元的大小為2NX 2N時,下層深度的編碼單元的大小可以是NX N。此外,大小為2NX 2N的當前深度的編碼單元可最多包括下層深度的4個編碼單元。因此,視頻編碼設備100可通過基于考慮當前畫面的特征所確定的最大編碼單元的大小和最大深度,針對每個最大編碼單元確定具有最佳形狀和最佳大小的編碼單元,來形成具有樹結構的編碼單元。此外,由于可通過使用各種預測模式和變換中的任何一個來針對每個最大編碼單元執(zhí)行編碼,因此可考慮各種圖像大小的編碼單元的特征來確定最佳編碼模式。因此,如果以傳統(tǒng)的宏塊對具有高分辨率或大數(shù)據量的圖像進行編碼,則每個畫面的宏塊數(shù)量過度增加。因此,針對每個宏塊產生的壓縮信息的條數(shù)增加,因此難以發(fā)送壓縮信息,數(shù)據壓縮效率降低。然而,通過使用視頻編碼設備100,由于在考慮圖像大小的同時增加編碼單元的最大大小,同時在考慮圖像特征的同時調整編碼單元,因此可提高圖像壓縮效率。圖2是根據示例性實施例的視頻解碼設備200的框圖。視頻解碼設備200包括接收器210、圖像數(shù)據和編碼信息提取器220和圖像數(shù)據解碼器230。用于視頻解碼設備200的各種操作的各種術語(諸如編碼單元、深度、預測單元、變換單元和關于各種編碼模式的信息)的定義與以上參照圖1和視頻編碼設備100描述的那些術語相同。接收器210接收并解析編碼視頻的比特流。圖像數(shù)據和編碼信息提取器220從解析的比特流提取每個編碼單元的編碼圖像數(shù)據,并將提取的圖像數(shù)據輸出到圖像數(shù)據解碼器230,其中,編碼單元具有根據每個最大編碼單元的樹結構。圖像數(shù)據和編碼信息提取器220可從關于當前畫面的頭或SPS提取關于當前畫面的編碼單元的最大大小的信息。此外,圖像數(shù)據和編碼信息提取器220從解析的比特流提取關于根據每個最大編碼單元的具有樹結構的編碼單元的編碼深度和編碼模式的信息。提取的關于編碼深度和編碼模式的信息被輸出到圖像數(shù)據解碼器230。換句話說,比特流中的圖像數(shù)據被劃分為最大編碼單元,從而圖像數(shù)據解碼器230對每個最大編碼單元的圖像數(shù)據進行解碼??舍槍﹃P于與編碼深度相應的 至少一個編碼單元的信息,來設置關于根據最大編碼單元的編碼深度和編碼模式的信息,關于編碼模式的信息可包括關于與編碼深度相應的相應編碼單元的分區(qū)類型的信息、關于預測模式的信息和變換單元的大小。此外,根據深度的劃分信息可被提取作為關于編碼深度的信息。由圖像數(shù)據和編碼信息提取器220提取的關于根據每個最大編碼單元的編碼深度和編碼模式的信息是關于編碼深度和編碼模式的信息,其中,所述編碼深度和編碼模式被確定為用于當編碼器(諸如視頻編碼設備100)根據每個最大編碼單元對每個根據深度的較深層編碼單元重復執(zhí)行編碼時產生最小編碼誤差。因此,視頻解碼設備200可通過根據產生最小編碼誤差的編碼深度和編碼模式對圖像數(shù)據進行解碼來恢復圖像。由于關于編碼深度和編碼模式的編碼信息可被分配給相應編碼單元、預測單元和最小單元中的預定數(shù)據單元,因此圖像數(shù)據和編碼信息提取器220可提取關于根據預定數(shù)據單元的編碼深度和編碼模式的信息。被分配關于編碼深度和編碼模式的相同信息的預定數(shù)據單元可被推斷為包括在相同最大編碼單元中的數(shù)據單元。圖像數(shù)據解碼器230通過基于關于根據最大編碼單元的編碼深度和編碼模式的信息對每個最大編碼單元中的圖像數(shù)據進行解碼,來恢復當前畫面。換句話說,圖像數(shù)據解碼器230可基于提取的關于包括在每個最大編碼單元中的具有樹結構的編碼單元中的每個編碼單元的分區(qū)類型、預測模式和變換單元的信息,來對編碼圖像數(shù)據進行解碼。解碼處理可包括預測(包括幀內預測和運動補償)和反變換??筛鶕凑蛔儞Q或反整數(shù)變換的方法來執(zhí)行反變換。圖像數(shù)據解碼器230可基于關于根據編碼深度的編碼單元的預測單元的分區(qū)類型和預測模式的信息,根據每個編碼單元的分區(qū)和預測模式執(zhí)行幀內預測或運動補償。此外,圖像數(shù)據解碼器230可基于關于根據編碼深度的編碼單元的變換單元的大小的信息,根據編碼單元中的每個變換單元執(zhí)行反變換,從而根據最大編碼單元執(zhí)行反變換。圖像數(shù)據解碼器230可通過使用根據深度的劃分信息來確定當前最大編碼單元的至少一個編碼深度。如果劃分信息指示圖像數(shù)據在當前深度下不再被劃分,則當前深度是編碼深度。因此,圖像數(shù)據解碼器230可通過使用與編碼深度相應的每個編碼單元的關于預測單元的分區(qū)類型、預測模式和變換單元大小的信息,對當前最大編碼單元中與每個編碼深度相應的至少一個編碼單元的編碼數(shù)據進行解碼,并輸出當前最大編碼單元的圖像數(shù)據。換句話說,可通過觀察為編碼單元、預測單元和最小單元中的預定數(shù)據單元分配的編碼信息集來收集包括編碼信息(包括相同劃分信息)的數(shù)據單元,收集的數(shù)據單元可被視為將由圖像數(shù)據解碼器230以相同的編碼模式進行解碼的一個數(shù)據單元。視頻解碼設備200可獲得關于當針對每個最大編碼單元遞歸執(zhí)行編碼時產生最小編碼誤差的至少一個編碼單元的信息,并可使用所述信息來對當前畫面進行解碼。換句話說,可對每個最大編碼單元中被確定為最佳編碼單元的具有樹結構的編碼單元進行解碼。此外,可在考慮分辨率和圖像數(shù)據量的同時來確定編碼單元的最大大小。因此,即使圖像數(shù)據具有高分辨率和大數(shù)據量,也可通過使用編碼單元的大小和編碼模式來有效地對圖像數(shù)據進行解碼和恢復,其中,通過使用從編碼器接收的關于最佳編碼模式的信息,根據圖像數(shù)據的特征來適應性地確定所述編碼單元的大小和所述編碼模式?,F(xiàn)在將參照圖3至圖13描述根據示例性實施例的確定具有樹結構的編碼單元、預測單元和變換單元的方法。圖3是用于描述根據示例性實施例的編碼單元的概念的示圖。編碼單元的大小 可被表示為寬X高,可以是64X64、32X32、16X16和8X8。64X64的編碼單元可被劃分為64X64、64X32、32X64或32X32的分區(qū),32X32的編碼單元可被劃分為32X32、32X16、16X32或16X16的分區(qū),16X16的編碼單元可被劃分為16X16、16X8、8X16或8X8的分區(qū),8X8的編碼單元可被劃分為8X8、8X4、4X8或4X4的分區(qū)。在視頻數(shù)據310中,分辨率為1920X1080,編碼單元的最大大小為64X64,最大深度為2。在視頻數(shù)據320中,分辨率為1920X1080,編碼單元的最大大小為64X64,最大深度為3。在視頻數(shù)據330中,分辨率為352 X 288,編碼單元的最大大小為16 X 16,最大深度為I。圖3中示出的最大深度指示從最大編碼單元到最小解碼單元的總劃分次數(shù)。如果分辨率高或數(shù)據量大,則編碼單元的最大大小可較大,從而不僅提高了編碼效率還精確地反映出圖像的特征。因此,分辨率高于視頻數(shù)據330的視頻數(shù)據310和視頻數(shù)據320的編碼單元的最大大小可以是64。由于視頻數(shù)據310的最大深度是2,因此,由于通過將最大編碼單元劃分兩次,深度被加深兩層,因此視頻數(shù)據310的編碼單元315可包括長軸大小為64的最大編碼單元以及長軸大小為32和16的編碼單元。同時,由于視頻數(shù)據330的最大深度是1,因此,由于通過將最大編碼單元劃分一次,深度被加深一層,因此視頻數(shù)據330的編碼單元335可包括長軸大小為16的最大編碼單元以及長軸大小為8的編碼單元。由于視頻數(shù)據320的最大深度為3,因此,由于通過將最大編碼單元劃分三次,深度被加深3層,因此視頻數(shù)據320的編碼單元325可包括長軸大小為64的最大編碼單元以及長軸大小為32、16和8的編碼單元。隨著深度加深,可精確地表達詳細信息。圖4是根據示例性實施例的基于編碼單元的圖像編碼器400的框圖。圖像編碼器400執(zhí)行視頻編碼設備100的編碼單元確定器120的操作以對圖像數(shù)據進行編碼。換句話說,幀內預測器410在幀內模式下對當前幀405中的編碼單元執(zhí)行幀內預測,運動估計器420和運動補償器425在幀間模式下通過使用當前幀405和參考幀495,對當前幀405中的編碼單元分別執(zhí)行幀間估計和運動補償。從幀內預測器410、運動估計器420和運動補償器425輸出的數(shù)據通過變換器430和量化器440被輸出作為量化的變換系數(shù)。量化的變換系數(shù)通過反量化器460和反變換器470被恢復為空間域中的數(shù)據,恢復的空間域中的數(shù)據在通過去塊單元480和環(huán)路濾波單元490進行后處理之后被輸出為參考幀495。量化的變換系數(shù)可通過熵編碼器450被輸出為比特流455。為了將圖像編碼器400應用在視頻編碼設備100中,圖像編碼器400的所有元件(即,幀內預測器410、運動估計器420、運動補償器425、變換器430、量化器440、熵編碼器450、反量化器460、反變換器470、去塊單元480和環(huán)路濾波單元490)在考慮每個最大編碼單元的最大深度的同時,基于具有樹結構的編碼單元中的每個編碼單元來執(zhí)行操作。具體地,幀內預測器410、運動估計器420和運動補償器425在考慮當前最大編碼單元的最大大小和最大深度的同時確定具有樹結構的編碼單元中的每個編碼單元的分區(qū)和預測模式,變換器430確定具有樹結構的編碼單元中的每個編碼單元中的變換單元的大小。圖5是根據示例性實施例的基于編碼單元的圖像解碼器500的框圖。解析器510從比特流505解析將被解碼的編碼圖像數(shù)據以及解碼所需的關于編碼的信息。編碼圖像數(shù)據通過熵解碼器520和反量化器530被輸出為反量化的數(shù)據,反量化的數(shù)據通過反變換器540被恢復為空間域中的圖像數(shù)據。幀內預測器550針對空間域中的圖像數(shù)據,在幀內模式下對編碼單元執(zhí)行幀內預測,運動補償器560通過使用參考幀585在幀間模式下對編碼單元執(zhí)行運動補償。通過幀內預測器550和運動補償器560的空間域中的圖像數(shù)據可在通過去塊單元570和環(huán)路濾波器單元580進行后處理之后被輸出為恢復幀595。此外,通過去塊單元570和環(huán)路濾波器單元580進行后處理的圖像數(shù)據可被輸出為參考幀585。為了在視頻解碼設備200的圖像數(shù)據解碼器230中對圖像數(shù)據進行解碼,圖像解碼器500可執(zhí)行在解析器510之后執(zhí)行的操作。為了將圖像解碼器500應用在視頻解碼設備200中,圖像解碼器500的所有元件(即,解析器510、熵解碼器520、反量化器530、反變換器540、幀內預測器550、運動補償器560、去塊單元570和環(huán)路濾波單元580)針對每個最大編碼單元基于具有樹結構的編碼單元執(zhí)行操作。具體地,幀內預測器550和運動補償器560基于每個具有樹結構的編碼單元的分區(qū)和預測模式執(zhí)行操作,反變換器540基于每個編碼單元的變換單元的大小執(zhí)行操作。圖6是 示出根據示例性實施例的根據深度的較深層編碼單元以及分區(qū)的示圖。視頻編碼設備100和視頻解碼設備200使用分層編碼單元以考慮圖像的特征??筛鶕D像的特征自適應地確定編碼單元的最大高度、最大寬度和最大深度,或可由用戶不同地設置編碼單元的最大高度、最大寬度和最大深度。可根據編碼單元的預定最大大小來確定根據深度的較深層編碼單元的大小。在根據示例性實施例的編碼單元的分層結構600中,編碼單元的最大高度和最大寬度均為64,最大深度為4。由于深度沿分層結構600的縱軸加深,因此較深層編碼單元的高度和寬度均被劃分。此外,沿分層結構600的橫軸示出作為每個較深層編碼單元的預測編碼的基礎的預測單元和分區(qū)。換句話說,編碼單元610是分層結構600中的最大編碼單元,其中,深度為0,大小(即,高度乘寬度)為64X64。深度沿縱軸加深,從而存在大小為32X32且深度為I的編碼單元620、大小為16X16且深度為2的編碼單元630、大小為8X8且深度為3的編碼單元640以及大小為4X4且深度為4的編碼單元650。大小為4X4且深度為4的編碼單元650
是最小編碼單元。編碼單元的預測單元和分區(qū)根據每個深度沿橫軸排列。換句話說,如果大小為64X64且深度為O的編碼單元610是預測單元,則預測單元可被劃分為包括在編碼單元610中的分區(qū),即,大小為64X64的分區(qū)610、大小為64X32的分區(qū)612、大小為32X64的分區(qū)614或大小為32X32的分區(qū)616。類似地,大小為32X32且深度為I的編碼單元620的預測單元可被劃分為包括在編碼單元620中的分區(qū),即,大小為32X32的分區(qū)620、大小為32X16的分區(qū)622、大小為16X32的分區(qū)624和大小為16X16的分區(qū)626。類似地,大小為16X16且深度為2的編碼單元630的預測單元可被劃分為包括在編碼單元630中的分區(qū), 即,包括在編碼單元630中的大小為16X16的分區(qū)630、大小為16X8的分區(qū)632、大小為8X16的分區(qū)634和大小為8X8的分區(qū)636。類似地,大小為8X8且深度為3的編碼單元640的預測單元可被劃分為包括在編碼單元640中的分區(qū),即,包括在編碼單元640中的大小為8X8的分區(qū)640、大小為8 X 4的分區(qū)642、大小為4X8的分區(qū)644或大小為4X4的分區(qū)646。大小為4X4且深度為4的編碼單元650是最小編碼單元和最下層深度的編碼單元。編碼單元650的預測單元僅被分配給大小為4X4的分區(qū)。為了確定組成最大編碼單元610的編碼單元的至少一個編碼深度,視頻編碼設備100的編碼單元確定器120針對包括在最大編碼單元610中的與每個深度相應的編碼單元執(zhí)行編碼。隨著深度加深,以相同范圍和相同大小包括數(shù)據的根據深度的較深層編碼單元的數(shù)量增加。例如,需要四個與深度2相應的編碼單元,以覆蓋包括在與深度I相應的一個編碼單元中的數(shù)據。因此,為了比較相同數(shù)據根據深度的編碼結果,與深度I相應的編碼單元和四個與深度2相應的編碼單元各自被編碼。為了針對深度中的當前深度執(zhí)行編碼,可通過沿分層結構600的橫軸,針對與當前深度相應的編碼單元中的每個預測單元執(zhí)行編碼,來針對當前深度選擇最小編碼誤差??蛇x地,可通過隨著深度沿分層結構600的縱軸加深針對每個深度執(zhí)行編碼來比較根據深度的最小編碼誤差,從而搜索最小編碼誤差。編碼單元610中具有最小編碼誤差的深度和分區(qū)可被選為編碼單元610的編碼深度和分區(qū)類型。
圖7是用于描述根據示例性實施例的編碼單元710和變換單元720之間的關系的示圖。視頻編碼設備100或視頻解碼設備200針對每個最大編碼單元,根據具有小于或等于最大編碼單元的大小的編碼單元來對圖像進行編碼或解碼??苫诓淮笥谙鄳幋a單元的數(shù)據單元來選擇編碼期間用于變換的變換單元的大小。例如,在視頻編碼設備100或視頻解碼設備200中,如果編碼單元710的大小是64 X 64,則可通過使用大小為32X32的變換單元720來執(zhí)行變換。此外,可通過對小于64X64的大小為32X32、16X 16、8X8和4X4的變換單元中的每一個執(zhí)行變換,來對大小為64X64的編碼單元710的數(shù)據進行編碼,隨后可選擇具有最小編碼誤差的變換單元。圖8是用于描述根據示例性實施例的與編碼深度相應的編碼單元的編碼信息的示圖。視頻編碼設備100的輸出單元130可對與編碼深度相應的每個編碼單元的關于分區(qū)類型的信息800、關于預測模式的信息810和關于變換單元的大小的信息820進行編碼和發(fā)送,以作為關于編碼模式 的信息。信息800指示關于通過對當前編碼單元的預測單元進行劃分而獲得的分區(qū)的形狀的信息,其中,所述分區(qū)是用于對當前編碼單元進行預測編碼的數(shù)據單元。例如,大小為2NX2N的當前編碼單元CU_0可被劃分為大小為2NX2N的分區(qū)802、大小為2NXN的分區(qū)804、大小為NX 2N的分區(qū)806和大小為NXN的分區(qū)808中的任意一個。這里,關于分區(qū)類型的信息800被設置為指示大小為2NXN的分區(qū)804、大小為NX2N的分區(qū)806和大小為NXN的大小的分區(qū)808之一。信息810指示每個分區(qū)的預測模式。例如,信息810可指示對由信息800指示的分區(qū)執(zhí)行的預測編碼的模式,即,幀內模式812、幀間模式814或跳過模式816。信息820指示當針對當前編碼單元執(zhí)行變換時所基于的變換單元。例如,變換單元可以是第一幀內變換單元822、第二幀內變換單元824、第一幀間變換單元826或第二幀內變換單元828。視頻解碼設備200的圖像數(shù)據和編碼信息提取器220可根據每個較深層編碼單元提取和使用用于解碼的信息800、810和820。圖9是根據示例性實施例的根據深度的較深層編碼單元的示圖。劃分信息可被用于指示深度的改變。劃分信息指示當前深度的編碼單元是否被劃分為下層深度的編碼單元。用于對深度為O且大小為2N_0X2N_0的編碼單元900進行預測編碼的預測單元910可包括以下分區(qū)類型的分區(qū):大小為2N_0X2N_0的分區(qū)類型912、大小為2N_0XN_0的分區(qū)類型914、大小為N_0X2N_0的分區(qū)類型916、大小為Ν_0ΧΝ_0的分區(qū)類型918。圖9僅示出通過對預測單元910進行對稱劃分而獲得的分區(qū)類型912至918,但應理解分區(qū)類型不限于此,預測單元910的分區(qū)可包括不對稱分區(qū)、具有預定形狀的分區(qū)和具有幾何形狀的分區(qū)。根據每個分區(qū)類型,對一個大小為2N_0X2N_0的分區(qū)、兩個大小為2N_0XN_0的分區(qū)、兩個大小為N_0X2N_0的分區(qū)和四個大小為Ν_0ΧΝ_0的分區(qū)重復執(zhí)行預測編碼??蓪Υ笮?N_0 X 2N_0、N_0 X 2N_0、2N_0 X N_0和N_0 X N_0的分區(qū)執(zhí)行幀內模式和幀間模式下的預測編碼。可僅對大小為2N_0X2N_0的分區(qū)執(zhí)行跳過模式下的預測編碼。比較包括分區(qū)類型912至918中的預測編碼的編碼的誤差,在分區(qū)類型中確定最小編碼誤差。如果在分區(qū)類型912至916之一中編碼誤差最小,則預測單元910可不被劃分到下層深度。如果在分區(qū)類型918中編碼誤差最小,則深度從O改變到I以在操作920對分區(qū)類型918進行劃分,對深度為2且 大小為Ν_0ΧΝ_0的編碼單元930重復執(zhí)行編碼,以搜索
最小編碼誤差。用于對深度為I且大小為2N_1X2N_1 (= Ν_0ΧΝ_0)的編碼單元930進行預測編碼的預測單元940可包括以下分區(qū)類型的分區(qū):大小為2N_1X2N_1的分區(qū)類型942、大小為2N_1XN_1的分區(qū)類型944、大小為N_1X2N_1的分區(qū)類型946、大小為N_1 XN_1的分區(qū)類型948。如果在分區(qū)類型948中編碼誤差最小,則深度從I改變到2以在操作950對分區(qū)類型948進行劃分,對深度為2且大小為N_2XN_2的編碼單元960重復執(zhí)行編碼,以搜索
最小編碼誤差。當最大深度為d時,可執(zhí)行根據每個深度的劃分操作,直到深度變?yōu)閐-Ι,劃分信息可被編碼直到深度為O到d-2中的一個。換句話說,當編碼被執(zhí)行直到在操作970與深度d-2相應的編碼單元被劃分之后深度為d-Ι時,用于對深度為d-Ι且大小為2N_(d-l) X2N_(d-1)的編碼單元980進行預測編碼的預測單元990可包括以下分區(qū)類型的分區(qū):大小為2N_(d-l) X2N_(d-l)的分區(qū)類型992、大小為2N_(d_l) XN_(d_l)的分區(qū)類型994、大小為N_(d-1) X2N_(d-l)的分區(qū)類型996、大小為N_(d-1) XN_(d-l)的分區(qū)類型998??稍诜謪^(qū)類型992至998中對一個大小為2N_(d_l) X2N_(d_l)的分區(qū)、兩個大小為2N_(d-l) XN_(d-l)的分區(qū)、兩個大小為N_(d-1) X2N_(d-l)的分區(qū)、四個大小為N_(d-1) XN_(d-l)的分區(qū)重復執(zhí)行預測編碼,以搜索具有最小編碼誤差的分區(qū)類型。即使當分區(qū)類型998具有最小編碼誤差時,但由于最大深度為d,因此深度為d-1的編碼單元cu_(d-l)不再被劃分到下層深度,用于組成當前最大編碼單元900的編碼單元的編碼深度被確定為d-Ι,當前最大編碼單元900的分區(qū)類型可被確定為N_(d-1) XN_(d-1)。此外,由于最大深度為d并且具有最下層深度d-Ι的最小編碼單元980不再被劃分到下層深度,因此不設置最小編碼單元980的劃分信息。數(shù)據單元999可以為當前最大編碼單元的‘最小單元’。根據示例性實施例的最小單元可以是通過將最小編碼單元980劃分4次而獲得的矩形數(shù)據單元。通過重復執(zhí)行編碼,視頻編碼設備100可通過比較根據編碼單元900的深度的編碼誤差來選擇具有最小編碼誤差的深度以確定編碼深度,將相應的分區(qū)類型和預測模式設置為編碼深度的編碼模式。這樣,在I至d的所有深度中比較根據深度的最小編碼誤差,具有最小編碼誤差的深度可被確定為編碼深度。編碼深度、預測單元的分區(qū)類型和預測模式可被編碼和發(fā)送,作為關于編碼模式的信息。此外,由于編碼單元從深度O被劃分到編碼深度,因此僅編碼深度的劃分信息被設置為0,除了編碼深度之外的深度的劃分信息被設置為I。視頻解碼設備200的圖像數(shù)據和編碼信息提取器220可提取并使用關于編碼單元900的編碼深度和預測單元的信息以對分區(qū)912進行解碼。視頻解碼設備200可通過使用根據深度的劃分信息將劃分信息為O的深度確定為編碼深度,并使用關于相應深度的編碼模式的信息以進行解碼。圖10至圖12是用于描述根據示例性實施例的編碼單元1010、預測單元1060和變換單元1070之間的關系的示圖。編碼單元1010是最大編碼單元中與由視頻編碼設備100確定的編碼深度相應的具有樹結構的編碼單元。預測單元1060是編碼單元1010中的每一個的預測單元的分區(qū),變換單元1070是編碼單元1010中的每一個的變換單元。當編碼單元1010中的最大編碼單元的深度是O時,編碼單元1012和1054的深度是 1,編碼單元 1014、1016、1018、1028、1050 和 1052 的深度是 2,編碼單元 1020、1022、1024、1026、1030、1032和1048的深度是3,編碼單元1040、1042、1044和1046的深度是4。在預測單元1060中,通過對編碼單元1010中的編碼單元進行劃分來獲得某些編碼單元 1014、1016、1022、1032、1048、1050、1052 和 1054。換句話說,編碼單元 1014、1022、1050和1054中的分區(qū)類型具有2NXN的大小,編碼單元1016、1048和1052中的分區(qū)類型具有NX2N的大小,編碼單元1032的分區(qū)類型具有NXN的大小。編碼單元1010的預測單元和分區(qū)小于或等于每個編碼單元。對小于編碼單元1052的數(shù)據單元中的變換單元1070中的編碼單元1052的圖像數(shù)據執(zhí)行變換或反變換。此外,變換單元1070中的編碼單元1014、1016、1022、1032、1048、1050和1052在大小和形狀方面與預測單元1060中的編碼單元1014、1016、1022、1032、1048,1050和1052不同。換句話說,視頻編碼設備100和視頻解碼設備200可對相同編碼單元中的數(shù)據單元分別執(zhí)行幀內預測、運動估計、運動補償、變換和反變換。因此,對最大編碼單元的每個區(qū)域中具有分層結構的編碼單元中的每一個遞歸地執(zhí)行編碼,以確定最佳編碼單元,從而可獲得具有遞歸樹結構的編碼單元。編碼信息可包括關于編碼單元的劃 分信息、關于分區(qū)類型的信息、關于預測模式的信息和關于變換單元的大小的信息中。表I示出可由視頻編碼設備100和視頻解碼設備200設置的編碼信息。表I
權利要求
1.一種對視頻進行解碼的設備,所述設備包括: 接收器,接收并解析編碼圖像的比特流; 處理器,通過使用從接收到的比特流解析的指示編碼單元的劃分形狀的信息和關于編碼單元的預測單元的信息,確定作為數(shù)據單元的具有分層結構的編碼單元以及用于對編碼單元進行預測的子單元,其中,按所述數(shù)據單元對編碼的圖像進行解碼,其中,子單元包括通過根據任意比例對編碼單元的高度和寬度中的至少一個進行劃分而獲得的分區(qū), 解碼器,使用從接收到的比特流解析的編碼信息,通過執(zhí)行解碼來重建圖像,其中,解碼包括使用針對編碼單元的分區(qū)的運動補償, 其中,具有分層結構的編碼單元包括根據編碼深度并獨立于鄰近編碼單元而分層劃分的編碼深度的編碼單元。
2.如權利要求1所述的設備,其中,處理器基于針對具有分層結構的編碼單元的關于編碼深度和編碼模式的編碼信息,在編碼深度的編碼單元之中確定當前編碼單元的分區(qū)類型和預測模式,如果確定的分區(qū)類型和預測模式是通過根據任意比例對當前編碼單元進行劃分而獲得的用于幀間預測的分區(qū)的類型,則處理器確定通過根據任意比例對當前編碼單元的高度和寬度中的至少一個進行劃分而獲得的子分區(qū)。
3.如權利要求1所述的設備,其中,解碼器選擇性地確定是否使用從比特流提取的通過基于指示用于幀間預測的分區(qū)類型的信息根據任意比例對編碼單元進行劃分而獲得的分區(qū)以及通過根據任意比例對編碼單元進行劃分而獲得的分區(qū),來執(zhí)行運動補償。
4.如權利要求1所述的設備,其中,分區(qū)包括大小等于當前編碼單元或分區(qū)的大小的預測單元、通過對當前編碼單元的高度和寬度中的至少一個進行對稱劃分而獲得的子分區(qū)、以及通過對當前編碼單元的高度和寬度中的至少一個進行不對稱劃分而獲得的子分區(qū)。
5.如權利要求1所述的設備,其中,基于關于編碼單元被分層劃分到的編碼單元的最大大小的信息以及編碼單元被分層劃分到的編碼單元的深度的信息,編碼圖像的圖像被編碼。
全文摘要
公開了一種對視頻進行編碼的方法和設備,所述方法包括基于根據最大編碼單元的至少一個劃分的區(qū)域的分層結構的較深層編碼單元,對最大編碼單元的視頻數(shù)據進行編碼,并使用通過根據任意比例劃分編碼單元而獲得的分區(qū)執(zhí)行幀間預測,來確定編碼深度;輸出比特流,所述比特流包括與根據最大編碼單元的編碼深度相應的編碼視頻數(shù)據以及關于編碼深度和編碼模式的信息。
文檔編號H04N7/26GK103220523SQ201310091250
公開日2013年7月24日 申請日期2010年12月8日 優(yōu)先權日2009年12月8日
發(fā)明者李善一, 千岷洙, 韓宇鎮(zhèn) 申請人:三星電子株式會社