用于對圖像進行編碼的方法和設(shè)備以及用于進行解碼的方法和設(shè)備的制作方法
【專利摘要】提供一種用于對被運動預(yù)測的當(dāng)前預(yù)測單元的運動信息進行編碼和解碼的方法和設(shè)備。該圖像編碼方法包括:獲得第一參考畫面列表、第二參考畫面列表和組合參考畫面列表,其中,所述組合參考畫面列表是包括在第一參考畫面列表中的參考畫面與包括在第二參考畫面列表中的參考畫面的組合;基于單向運動感預(yù)測模式的情況的數(shù)量和雙向運動預(yù)測模式的情況的數(shù)量,來對指示在當(dāng)前預(yù)測單元的編碼中使用的運動預(yù)測模式和參考畫面的參考語法進行編碼。
【專利說明】用于對圖像進行編碼的方法和設(shè)備以及用于進行解碼的方法和設(shè)備
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及用于對靜止圖像和視頻進行編碼和解碼的方法和設(shè)備,更具體地講,涉及用于對當(dāng)前預(yù)測單元的運動信息進行編碼和解碼的方法和設(shè)備。
【背景技術(shù)】
[0002]根據(jù)諸如MPEG-4H.264/MPEG-4高級視頻編碼(AVC)的編解碼器,通過使用單獨的語法來對指示在運動預(yù)測期間的當(dāng)前塊的運動的方向的預(yù)測模式信息和在當(dāng)前塊的運動預(yù)測中使用的參考畫面信息進行編碼。
【發(fā)明內(nèi)容】
[0003]技術(shù)問題
[0004]本發(fā)明提供用于通過使用單個語法來對當(dāng)前預(yù)測單元的運動預(yù)測模式信息和運動預(yù)測中使用的參考畫面信息進行編碼和解碼的方法和設(shè)備。
[0005]解決方案
[0006]根據(jù)本發(fā)明的實施例,提供用于使用單個參考語法來對運動預(yù)測模式信息和參考畫面信息進行編碼的方法和設(shè)備。
[0007]有益效果
[0008]根據(jù)本發(fā)明的實施例,通過使用單個參考語法來有效地對預(yù)測方向(預(yù)測模式)信息和用于當(dāng)前預(yù)測單元的參考畫面信息進行編碼,從而提高圖像的壓縮效率。
【專利附圖】
【附圖說明】
[0009]圖1是根據(jù)本發(fā)明的實施例的視頻編碼設(shè)備的框圖;
[0010]圖2是根據(jù)本發(fā)明的實施例的視頻解碼設(shè)備的框圖;
[0011]圖3是用于描述根據(jù)本發(fā)明的實施例的編碼單元的概念的示圖;
[0012]圖4是根據(jù)本發(fā)明的實施例的基于具有分層結(jié)構(gòu)的編碼單元的視頻編碼器的框圖;
[0013]圖5是根據(jù)本發(fā)明的實施例的基于具有分層結(jié)構(gòu)的編碼單元的視頻解碼器的框圖;
[0014]圖6是示出根據(jù)本發(fā)明的實施例的根據(jù)深度的較深層編碼單元和分區(qū)(partition)的不圖;
[0015]圖7是用于描述根據(jù)本發(fā)明的實施例的編碼單元和變換單元之間的關(guān)系的示圖;
[0016]圖8是用于描述根據(jù)本發(fā)明的實施例的與編碼深度相應(yīng)的編碼單元的編碼信息的示圖;
[0017]圖9是根據(jù)本發(fā)明的實施例的根據(jù)深度的較深層編碼單元的示圖;
[0018]圖10至圖12是用于描述根據(jù)本發(fā)明的實施例的編碼單元、預(yù)測單元和頻率變換單元之間的關(guān)系的示圖;
[0019]圖13是用于描述根據(jù)表I的編碼模式信息的編碼單元、預(yù)測單元和變換單元之間的關(guān)系的不圖;
[0020]圖14是示出根據(jù)本發(fā)明的實施例的由B畫面中的預(yù)測單元參考的參考畫面的示例的示圖;
[0021]圖15A至圖15C示出根據(jù)本發(fā)明的實施例的分配到參考畫面的參考畫面索引的示例;
[0022]圖16A和圖16B示出根據(jù)本發(fā)明的實施例的在單向預(yù)測中使用的組合參考畫面列表;
[0023]圖17示出根據(jù)本發(fā)明的實施例的示出基于單向運動預(yù)測模式的情況的數(shù)量和雙向運動預(yù)測模式的情況的數(shù)量而分配的參考語法值的表,其中,所述參考語法值指示單向運動預(yù)測模式和雙向運動預(yù)測模式以及參考畫面;
[0024]圖18示出根據(jù)本發(fā)明的實施例的將參考語法信息二值化的處理的示例;
[0025]圖19是示出根據(jù)本發(fā)明的實施例的圖像編碼方法的流程圖;
[0026]圖20是示出根據(jù)本發(fā)明的實施例的圖像解碼方法的流程圖。
[0027]最佳模式
[0028]根據(jù)本發(fā)明的一方面,提供一種圖像編碼方法,包括:獲得第一參考畫面列表、第二參考畫面列表和組合參考畫面列表,其中,所述組合參考畫面列表是包括在第一參考畫面列表中的參考畫面與包括在第二參考畫面列表中的參考畫面的組合;通過使用單向運動預(yù)測模式和雙向預(yù)測模式之一來對當(dāng)前預(yù)測單元進行編碼,其中,在單向運動預(yù)測模式中,通過使用包括在組合參考畫面列表中的參考畫面來對當(dāng)前預(yù)測單元執(zhí)行單向運動預(yù)測,在雙向預(yù)測模式中,通過使用第一參考畫面列表和第二參考畫面列表來對當(dāng)前預(yù)測單元執(zhí)行雙向運動預(yù)測;基于單向運動感預(yù)測模式的情況的數(shù)量和雙向運動預(yù)測模式的情況的數(shù)量,來對指示在當(dāng)前預(yù)測單元的編碼中使用的運動預(yù)測模式和參考畫面的參考語法進行編碼。
[0029]根據(jù)本發(fā)明的另一方面,提供一種圖像編碼設(shè)備,包括:運動預(yù)測單元,用于通過使用單向運動預(yù)測模式和雙向預(yù)測模式之一來對當(dāng)前預(yù)測單元進行進行預(yù)測,其中,在單向運動預(yù)測模式中,通過使用包括在組合參考畫面列表中的參考畫面來對當(dāng)前預(yù)測單元執(zhí)行單向運動預(yù)測,在雙向預(yù)測模式中,通過使用第一參考畫面列表和第二參考畫面列表來對當(dāng)前預(yù)測單元執(zhí)行雙向運動預(yù)測;熵編碼器,用于基于單向運動感預(yù)測模式的情況的數(shù)量和雙向運動預(yù)測模式的情況的數(shù)量,來對指示在當(dāng)前預(yù)測單元的編碼中使用的運動預(yù)測模式和參考畫面的參考語法進行編碼。
[0030]根據(jù)本發(fā)明的另一方面,提供一種圖像解碼方法,包括:獲得第一參考畫面列表、第二參考畫面列表和組合參考畫面列表,其中,組合參考畫面列表是包括在第一參考畫面列表中的參考畫面與包括在第二參考畫面列表中的參考畫面的組合;基于單向運動預(yù)測模式的情況的數(shù)量和雙向運動預(yù)測模式的情況的數(shù)量,根據(jù)當(dāng)前預(yù)測單元的編碼中使用的運動預(yù)測模式和參考畫面確定參考語法的值,其中,在單向運動預(yù)測模式中,包括在組合參考列表中的參考畫面被使用,在雙向運動預(yù)測模式中,第一參考畫面列表和第二參考畫面列表被使用;從比特流獲得當(dāng)前預(yù)測單元的參考語法:通過使用獲得的參考語法的值來確定當(dāng)前預(yù)測單元的運動預(yù)測模式和參考畫面:通過使用確定的運動預(yù)測模式和確定的參考畫面來對當(dāng)前預(yù)測單元執(zhí)行運動補償。
[0031]根據(jù)本發(fā)明的另一方面,提供一種圖像解碼器,包括:熵解碼器,用于獲得第一參考畫面列表、第二參考畫面列表和組合參考畫面列表,其中,組合參考畫面列表是包括在第一參考畫面列表中的參考畫面與包括在第二參考畫面列表中的參考畫面的組合,基于單向運動預(yù)測模式的情況的數(shù)量和雙向運動預(yù)測模式的情況的數(shù)量,根據(jù)當(dāng)前預(yù)測單元的編碼中使用的運動預(yù)測模式和參考畫面確定參考語法的值,其中,在單向運動預(yù)測模式中,包括在組合參考列表中的參考畫面被使用,在雙向運動預(yù)測模式中,第一參考畫面列表和第二參考畫面列表被使用,通過使用從比特流獲得的當(dāng)前預(yù)測單元的參考語法來確定當(dāng)前預(yù)測單元的運動預(yù)測模式和參考畫面;運動補償單元,用于通過使用確定的運動預(yù)測模式和確定的參考畫面來對當(dāng)前預(yù)測單元執(zhí)行運動補償。
【具體實施方式】
[0032]以下,將參照附圖來詳細(xì)描述本發(fā)明的實施例。
[0033]圖1是根據(jù)本發(fā)明的實施例的視頻編碼設(shè)備100的框圖。
[0034]視頻編碼設(shè)備100包括最大編碼單元劃分器110、編碼單元確定器120和輸出單元130。
[0035]最大編碼單元劃分器110可基于作為最大尺寸的編碼單元的最大編碼單元來劃分圖像的當(dāng)前畫面。如果當(dāng)前畫面大于最大編碼單元,則當(dāng)前畫面的圖像數(shù)據(jù)可被劃分為至少一個最大編碼單元。根據(jù)本發(fā)明的實施例的最大編碼單元可以是尺寸為32X32、64X64、128X128、256X256等的數(shù)據(jù)單元,其中,數(shù)據(jù)單元的形狀是具有2的若干次方的寬度和長度并大于8的正方形。圖像數(shù)據(jù)可以以至少一個最大編碼單元為單位被輸出到編碼單元確定器120。
[0036]根據(jù)本發(fā)明的實施例的編碼單元可由最大尺寸和深度來表征。深度表示從最大編碼單元空間劃分編碼單元的次數(shù),并且隨著深度加深,可將較深層編碼單元從最大編碼單元劃分為最小編碼單元。最大編碼單元的深度是最高深度,最小編碼單元的深度是最低深度。由于隨著最大編碼單元的深度加深,與每個深度相應(yīng)的編碼單元的尺寸減小,因此,與更高深度相應(yīng)的編碼單元可包括多個與更低深度相應(yīng)的編碼單元。
[0037]如上所述,當(dāng)前畫面的圖像數(shù)據(jù)根據(jù)編碼單元的最大尺寸被劃分為最大編碼單元,并且每個最大編碼單元可包括根據(jù)深度被劃分的較深層編碼單元。由于根據(jù)本發(fā)明的實施例的最大編碼單元根據(jù)深度被劃分,因此包括在最大編碼單元中的空間域的圖像數(shù)據(jù)可根據(jù)深度被分層地分類。
[0038]可預(yù)先確定編碼單元的最大深度和最大尺寸,其中,編碼單元的最大深度和最大尺寸限制最大編碼單元的高度和寬度被分層地劃分的總次數(shù)。
[0039]編碼單元確定器120對通過根據(jù)深度劃分最大編碼單元的區(qū)域而獲得的至少一個劃分區(qū)域進行編碼,并根據(jù)所述至少一個劃分區(qū)域確定用于輸出最終編碼的圖像數(shù)據(jù)的深度。換句話說,編碼單元確定器120通過根據(jù)當(dāng)前畫面的最大編碼單元對根據(jù)深度的較深層編碼單元中的圖像數(shù)據(jù)進行編碼并選擇具有最小編碼誤差的深度,來確定編碼深度。根據(jù)最大編碼器的確定的編碼深度和編碼圖像數(shù)據(jù)被輸出到輸出單元130。[0040]基于與等于或低于最大深度的至少一個深度相應(yīng)的較深層編碼單元對最大編碼單元中的圖像數(shù)據(jù)進行編碼,并且基于每個較深層編碼單元比較對圖像數(shù)據(jù)進行編碼的結(jié)果。在對較深層編碼單元的編碼誤差進行比較之后,可選擇具有最小編碼誤差的深度??舍槍γ總€最大編碼單元選擇至少一個編碼深度。
[0041]隨著編碼單元根據(jù)深度被分層地劃分,并且隨著編碼單元的數(shù)量增加,最大編碼單元的尺寸被劃分。另外,即使在一個最大編碼單元中多個編碼單元相應(yīng)于相同深度,也通過分別測量每個編碼單元的圖像數(shù)據(jù)的編碼誤差來確定是否將與相同深度相應(yīng)的編碼單元中的每個編碼單元劃分至更低深度。因此,即使當(dāng)圖像數(shù)據(jù)被包括在一個最大編碼單元中時,圖像數(shù)據(jù)也根據(jù)多個深度被劃分為多個區(qū)域,在一個最大編碼單元中編碼誤差可根據(jù)區(qū)域而不同,因此編碼深度可根據(jù)圖像數(shù)據(jù)中的區(qū)域而不同。因此,在一個最大編碼單元中可確定一個或多個編碼深度,并且可根據(jù)至少一個編碼深度的編碼單元來劃分最大編碼單元的圖像數(shù)據(jù)。
[0042]因此,編碼單元確定器120可確定包括在當(dāng)前最大編碼單元中的具有樹結(jié)構(gòu)的編碼單元。根據(jù)本發(fā)明的實施例的“具有樹結(jié)構(gòu)的編碼單元”包括最大編碼單元中所包括的所有較深層編碼單元中的與確定為編碼深度的深度相應(yīng)的編碼單元。在最大編碼單元的相同區(qū)域中,具有編碼深度的編碼單元可根據(jù)深度被分層地確定,在不同的區(qū)域中,具有該編碼深度的編碼單元可被獨立地確定。類似地,當(dāng)前區(qū)域中的編碼深度可獨立于另一區(qū)域中的編碼深度被確定。
[0043]根據(jù)本發(fā)明的實施例的最大深度是與從最大編碼單元到最小編碼單元的被執(zhí)行的劃分次數(shù)相關(guān)的索引。根據(jù)本發(fā)明的實施例的第一最大深度可表示從最大編碼單元到最小編碼單元的被執(zhí)行的總劃分次數(shù)。根據(jù)本發(fā)明的實施例的第二最大深度可表示從最大編碼單元到最小編碼單元的深度級的總數(shù)。例如,當(dāng)最大編碼單元的深度是O時,最大編碼單元被劃分一次的編碼單元的深度可被設(shè)置為1,并且最大編碼單元被劃分兩次的編碼單元的深度可被設(shè)置為2。這里,如果最小編碼單元是最大編碼單元被劃分四次的編碼單元,則存在深度為O、1、2、3和4的5個深度級,因此,第一最大深度可被設(shè)置為4,第二最大深度可被設(shè)置為5。
[0044]可根據(jù)最大編碼單元執(zhí)行預(yù)測編碼和變換。還可根據(jù)最大編碼單元,基于根據(jù)等于最大深度的深度或小于最大深度的多個深度的較深層編碼單元來執(zhí)行預(yù)測編碼和變換。
[0045]由于每當(dāng)最大編碼單元根據(jù)深度被劃分時,較深層編碼單元的數(shù)量增加,因此對隨著深度的加深而產(chǎn)生的所有的較深層編碼單元執(zhí)行包括預(yù)測編碼和變換的編碼。為了便于描述,現(xiàn)將基于在至少一個最大編碼單元中的當(dāng)前深度的編碼單元來描述預(yù)測編碼和變換。
[0046]視頻編碼設(shè)備100可不同地選擇用于對圖像數(shù)據(jù)進行編碼的數(shù)據(jù)單元的尺寸或形狀。為了對圖像數(shù)據(jù)進行編碼,執(zhí)行多個操作(諸如,預(yù)測編碼、變換和熵編碼),此時,可針對所有操作使用相同的數(shù)據(jù)單元,或者可針對每個操作使用不同的數(shù)據(jù)單元。
[0047]例如,視頻編碼設(shè)備100不僅可選擇用于對圖像數(shù)據(jù)進行編碼的編碼單元,還可選擇與該編碼單元不同的數(shù)據(jù)單元,以便對編碼單元中的圖像數(shù)據(jù)執(zhí)行預(yù)測編碼。
[0048]為了在最大編碼單元中執(zhí)行預(yù)測編碼,可基于與編碼深度相應(yīng)的編碼單元(即,基于不再被劃分為與更低深度相應(yīng)的多個編碼單元的編碼單元)執(zhí)行預(yù)測編碼。以下,不再被劃分并且變?yōu)橛糜陬A(yù)測編碼的基本單元的編碼單元現(xiàn)在將被稱為“預(yù)測單元”。通過劃分預(yù)測單元而獲得的分區(qū)可包括:通過劃分預(yù)測單元的高度和寬度中的至少一個而獲得的預(yù)測單元或數(shù)據(jù)單元。
[0049]例如,當(dāng)2NX2N(其中,N是正整數(shù))的編碼單元不再被劃分并且變?yōu)?NX2N的預(yù)測單元時,分區(qū)的尺寸可以是2NX2N、2NXN、NX2N或NXN。分區(qū)類型的示例包括通過對預(yù)測單元的高度或?qū)挾冗M行對稱劃分而獲得的對稱分區(qū)、通過對預(yù)測單元的高度或?qū)挾冗M行不對稱劃分(諸如,l:n或n:l)而獲得的分區(qū)、通過對預(yù)測單元進行幾何劃分而獲得的分區(qū)以及具有任意形狀的分區(qū)。
[0050]預(yù)測單元的預(yù)測模式可以是幀內(nèi)模式、幀間模式和跳過模式中的至少一個。例如,可對2N X 2N、2N X N、N X 2N或N X N的分區(qū)執(zhí)行幀內(nèi)模式或幀間模式。另外,可僅對2N X 2N的分區(qū)執(zhí)行跳過模式。對編碼單元中的一個預(yù)測單元獨立地執(zhí)行編碼,從而選擇具有最小編碼誤差的預(yù)測模式。
[0051]視頻編碼設(shè)備100不僅可基于用于對圖像數(shù)據(jù)進行編碼的編碼單元還可基于與該編碼單元不同的數(shù)據(jù)單元,對編碼單元中的圖像數(shù)據(jù)執(zhí)行變換。
[0052]為了在編碼單元中執(zhí)行變換,可基于具有小于或等于編碼單元的尺寸的數(shù)據(jù)單元來執(zhí)行變換。例如,用于變換的數(shù)據(jù)單元可包括用于幀內(nèi)模式的數(shù)據(jù)單元以及用于幀間模式的數(shù)據(jù)單元。
[0053]用作變換的基礎(chǔ)的數(shù)據(jù)單元現(xiàn)將被稱為“變換單元”。與編碼單元類似,編碼單元中的變換單元可被遞歸地劃分為更小尺寸的區(qū)域,從而變換單元可以以區(qū)域為單位被獨立地確定。因此,編碼單元中的殘差數(shù)據(jù)可根據(jù)具有根據(jù)變換深度的樹結(jié)構(gòu)的變換單元被劃分。
[0054]還可在變換單元中設(shè)置指示通過對編碼單元的高度和寬度進行劃分以達到變換單元而執(zhí)行的劃分次數(shù)的變換深度。例如,在2NX2N的當(dāng)前編碼單元中,當(dāng)變換單元的尺寸是2NX2N時,變換深度可以是0,當(dāng)變換單元的尺寸是NXN時,變換深度可以是1,當(dāng)變換單元的尺寸是N/2XN/2時,變換深度可以是2。也就是說,也可根據(jù)變換深度設(shè)置具有樹結(jié)構(gòu)的變換單元。
[0055]根據(jù)與編碼深度相應(yīng)的編碼單元的編碼信息不僅需要關(guān)于編碼深度的信息,還需要與預(yù)測編碼和變換相關(guān)的信息。因此,編碼單元確定器120不僅確定具有最小編碼誤差的編碼深度,還確定預(yù)測單元中的分區(qū)類型、根據(jù)預(yù)測單元的預(yù)測模式以及用于變換的變換單元的尺寸。
[0056]稍后將參照圖3至圖12來詳細(xì)地描述根據(jù)本發(fā)明的實施例的最大編碼單元中的根據(jù)樹結(jié)構(gòu)的編碼單元以及確定分區(qū)的方法。
[0057]編碼單元確定器120可通過使用基于拉格朗日乘子(Lagrangian multiplier)的率失真優(yōu)化來測量根據(jù)深度的較深層編碼單元的編碼誤差。
[0058]輸出單元130在比特流中輸出最大編碼單元的圖像數(shù)據(jù)以及關(guān)于根據(jù)編碼深度的編碼模式的信息,其中,所述圖像數(shù)據(jù)基于由編碼單元確定器120確定的至少一個編碼深度被編碼。
[0059]編碼的圖像數(shù)據(jù)可以是圖像的殘差數(shù)據(jù)的編碼結(jié)果。
[0060]關(guān)于根據(jù)編碼深度的編碼模式的信息可包括關(guān)于編碼深度的信息、關(guān)于預(yù)測單元中的分區(qū)類型的信息、預(yù)測模式信息以及變換單元的尺寸信息。
[0061]可通過使用根據(jù)深度的劃分信息來定義關(guān)于編碼深度的信息,劃分信息指示是否針對更低深度而非當(dāng)前深度的編碼單元來執(zhí)行編碼。如果當(dāng)前編碼單元的當(dāng)前深度是編碼深度,則當(dāng)前編碼單元中的圖像數(shù)據(jù)被編碼和輸出,因此劃分信息可被定義為不將當(dāng)前編碼單元劃分為更低深度??蛇x擇地,如果當(dāng)前編碼單元的當(dāng)前深度不是編碼深度,則對更低深度的編碼單元執(zhí)行編碼,因此劃分信息可被定義為劃分當(dāng)前編碼單元以獲得更低深度的編碼單元。
[0062]如果當(dāng)前深度不是編碼深度,則對被劃分為更低深度的編碼單元的編碼單元執(zhí)行編碼。由于更低深度的至少一個編碼單元存在于當(dāng)前深度的一個編碼單元中,對更低深度的每個編碼單元重復(fù)地執(zhí)行編碼,因此可對具有相同深度的編碼單元遞歸地執(zhí)行編碼。
[0063]由于對一個最大編碼單元確定具有樹結(jié)構(gòu)的編碼單元,并且對編碼深度的編碼單元確定關(guān)于至少一個編碼模式的信息,因此可對一個最大編碼單元確定關(guān)于至少一個編碼模式的信息。另外,由于圖像數(shù)據(jù)根據(jù)深度被分層地劃分,最大編碼單元的圖像數(shù)據(jù)的編碼深度可根據(jù)位置而不同,因此可對圖像數(shù)據(jù)設(shè)置關(guān)于編碼深度以及編碼模式的信息。
[0064]因此,輸出單元130可將關(guān)于相應(yīng)編碼深度和編碼模式的編碼信息分配給包括在最大編碼單元中的編碼單元、預(yù)測單元和最小單元中的至少一個。
[0065]根據(jù)本發(fā)明的實施例的最小單元是通過對組成最低深度的最小編碼單元進行劃分4次而獲得的矩形數(shù)據(jù)單元。可選擇地,最小單元可以是最大矩形數(shù)據(jù)單元,最大矩形數(shù)據(jù)單元可被包括在最大編碼單元中所包括的所有編碼單元、預(yù)測單元、分區(qū)單元和變換單元中。
[0066]例如,通過輸出單元130輸出的編碼信息可被分類為根據(jù)編碼單元的編碼信息以及根據(jù)預(yù)測單元的編碼信息。根據(jù)編碼單元的編碼信息可包括關(guān)于預(yù)測模式的信息以及關(guān)于分區(qū)的尺寸的信息。根據(jù)預(yù)測單元的編碼信息可包括關(guān)于以下內(nèi)容的信息:幀間模式的估計方向、巾貞間模式的參考圖像索引、運動矢量、幀內(nèi)模式的色度分量以及幀內(nèi)模式的插值方法。此外,關(guān)于根據(jù)畫面、條帶或GOP定義的編碼單元的最大尺寸的信息以及關(guān)于最大深度的信息可被插入到比特流的頭。
[0067]在視頻編碼設(shè)備100中,較深層編碼單元可以是通過將作為上一層的更高深度的編碼單元的高度或?qū)挾瘸远@得的編碼單元。換句話說,在當(dāng)前深度的編碼單元的尺寸是2NX2N時,更低深度的編碼單元的尺寸是NXN。另外,尺寸為2NX 2N的當(dāng)前深度的編碼單元可包括最多4個更低深度的編碼單元。
[0068]因此,視頻編碼設(shè)備100可通過基于考慮當(dāng)前畫面的特性所確定的最大編碼單元的尺寸和最大深度,針對每個最大編碼單元確定具有最佳形狀和最佳尺寸的編碼單元,來形成具有樹結(jié)構(gòu)的編碼單元。另外,由于通過使用各種預(yù)測模式和變換中的任何一個對每個最大編碼單元執(zhí)行編碼,因此可考慮各種圖像尺寸的編碼單元的特性來確定最佳編碼模式。
[0069]因此,如果在傳統(tǒng)的宏塊中對具有高分辨率或大數(shù)據(jù)量的圖像進行編碼,則每個畫面的宏塊的數(shù)量過度增加。因此,針對每個宏塊產(chǎn)生的壓縮信息的條數(shù)增加,因此難以發(fā)送壓縮信息并且數(shù)據(jù)壓縮效率降低。然而,通過使用視頻編碼設(shè)備100,由于在考慮圖像的尺寸的同時增加編碼單元的最大尺寸,同時在考慮圖像的特征的同時調(diào)整編碼單元,因此圖像壓縮效率會增加。
[0070] 圖2是根據(jù)本發(fā)明的實施例的視頻解碼設(shè)備200的框圖。
[0071 ] 視頻解碼設(shè)備200包括接收器210、圖像數(shù)據(jù)和編碼信息提取器220以及圖像數(shù)據(jù)解碼器230。用于視頻解碼設(shè)備200的各種操作的各種術(shù)語(諸如,編碼單元、深度、預(yù)測單元、變換單元和關(guān)于各種編碼模式的信息)的定義與以上參照圖1和視頻編碼設(shè)備100描述的那些定義一致。
[0072]接收器210接收編碼視頻的比特流以對語法元素進行解析。圖像數(shù)據(jù)和編碼信息提取器220通過對解析的語法元素執(zhí)行熵解碼來基于具有樹結(jié)構(gòu)的編碼單元提取指示編碼圖像數(shù)據(jù)的語法元素,并且將提取的語法元素輸出到圖像數(shù)據(jù)解碼器230。也就是說,圖像數(shù)據(jù)和編碼信息提取器220對以O(shè)和I的比特串的形式接收的語法元素執(zhí)行熵解碼,從而恢復(fù)語法元素。
[0073]另外,圖像數(shù)據(jù)和編碼信息提取器220從解析的比特流針對根據(jù)每個最大編碼單元的具有樹結(jié)構(gòu)的編碼單元提取關(guān)于編碼深度的信息、編碼模式、顏色分量信息、預(yù)測模式信息等。提取的關(guān)于編碼深度和編碼模式的信息被輸出到圖像數(shù)據(jù)解碼器230。比特流中的圖像數(shù)據(jù)被劃分為最大編碼單元,從而圖像數(shù)據(jù)解碼器230針對每個最大編碼單元對圖像數(shù)據(jù)進行解碼。
[0074]可針對關(guān)于與編碼深度相應(yīng)的至少一個編碼單元的信息來設(shè)置關(guān)于根據(jù)最大編碼單元的編碼深度和編碼模式的信息,并且關(guān)于編碼模式的信息可包括關(guān)于以下內(nèi)容的信息:與編碼深度相應(yīng)的相應(yīng)編碼單元的分區(qū)類型、預(yù)測模式以及變換單元的尺寸。另外,根據(jù)深度的劃分信息可被提取為關(guān)于編碼深度的信息。
[0075]由圖像數(shù)據(jù)和編碼信息提取器220提取的關(guān)于根據(jù)每個最大編碼單元的編碼深度和編碼模式的信息是關(guān)于這樣的編碼深度和編碼模式的信息:所述編碼深度和編碼模式被確定用于當(dāng)編碼器(諸如,視頻編碼設(shè)備100)根據(jù)每個最大編碼單元針對根據(jù)深度的每個較深層編碼單元重復(fù)執(zhí)行編碼時產(chǎn)生最小編碼誤差。因此,視頻解碼設(shè)備200可通過根據(jù)產(chǎn)生最小編碼誤差的編碼深度和編碼模式對圖像數(shù)據(jù)進行解碼來恢復(fù)圖像。
[0076]由于關(guān)于編碼深度和編碼模式的編碼信息可被分配給相應(yīng)編碼單元、預(yù)測單元以及最小單元中的預(yù)定數(shù)據(jù)單元,因此,圖像數(shù)據(jù)和編碼信息提取器220可根據(jù)預(yù)定數(shù)據(jù)單元提取關(guān)于編碼深度和編碼模式的信息。當(dāng)關(guān)于相應(yīng)的最大編碼單元的編碼深度和編碼模式的信息被分配到每個預(yù)定數(shù)據(jù)單元時,被分配相同的關(guān)于編碼深度和編碼模式的信息的預(yù)定數(shù)據(jù)單元可被推斷為包括在相同的最大編碼單元中的數(shù)據(jù)單元。
[0077]圖像數(shù)據(jù)解碼器230可通過基于關(guān)于根據(jù)最大編碼單元的編碼深度和編碼模式的信息對每個最大編碼單元中的圖像數(shù)據(jù)進行解碼來恢復(fù)當(dāng)前畫面。換句話說,圖像數(shù)據(jù)解碼器230可基于提取的關(guān)于包括在每個最大編碼單元中的具有樹結(jié)構(gòu)的編碼單元的每個編碼單元的分區(qū)類型、預(yù)測模式和變換單元的信息來對編碼圖像數(shù)據(jù)進行解碼。解碼處理可包括預(yù)測(所述預(yù)測包括幀內(nèi)預(yù)測和運動補償)和反變換。
[0078]圖像數(shù)據(jù)解碼器230可基于關(guān)于根據(jù)編碼深度的編碼單元的預(yù)測單元的分區(qū)類
型以及預(yù)測模式的信息,根據(jù)每個編碼單元的分區(qū)和預(yù)測模式來執(zhí)行幀內(nèi)預(yù)測或運動補m
\-ΖΧ ο
[0079]另外,圖像數(shù)據(jù)解碼器230可基于關(guān)于根據(jù)編碼深度的編碼單元的變換單元的尺寸的信息,根據(jù)編碼單元中的每個變換單元執(zhí)行反變換,以便根據(jù)最大編碼單元執(zhí)行反變換。
[0080]圖像數(shù)據(jù)解碼器230可通過使用根據(jù)深度的劃分信息來確定當(dāng)前最大編碼單元的至少一個編碼深度。如果劃分信息指示圖像數(shù)據(jù)在當(dāng)前深度中不再被劃分,則當(dāng)前深度是編碼深度。因此,圖像數(shù)據(jù)解碼器230可通過使用關(guān)于預(yù)測單元的分區(qū)類型、預(yù)測模式以及變換單元的尺寸的信息,來針對當(dāng)前最大編碼單元的圖像數(shù)據(jù)的當(dāng)前深度的編碼單元進行解碼。
[0081]換句話說,可通過觀察針對編碼單元、預(yù)測單元和最小單元之中的預(yù)定數(shù)據(jù)單元分配的編碼信息集,來聚集包括包含相同劃分信息的編碼信息的數(shù)據(jù)單元,收集的數(shù)據(jù)單元可被認(rèn)為是將由圖像數(shù)據(jù)解碼器230以相同的編碼模式進行解碼的一個數(shù)據(jù)單元。
[0082]視頻解碼設(shè)備200可獲得關(guān)于當(dāng)針對每個最大編碼單元遞歸執(zhí)行編碼時產(chǎn)生最小編碼誤差的至少一個編碼單元的信息,并可使用所述信息來對當(dāng)前畫面進行解碼。換句話說,可對每個最大編碼單元中被確定為最佳編碼單元的具有樹結(jié)構(gòu)的編碼單元的編碼圖像數(shù)據(jù)進行解碼。
[0083]因此,即使圖像數(shù)據(jù)具有高分辨率和大數(shù)據(jù)量,也可通過使用從編碼器接收的關(guān)于最佳編碼模式的信息,通過使用根據(jù)圖像數(shù)據(jù)的特性自適應(yīng)地確定的編碼單元的尺寸和編碼模式來有效地對圖像數(shù)據(jù)進行解碼和恢復(fù)。
[0084]現(xiàn)將參照圖3至圖13描述根據(jù)本發(fā)明的實施例的確定具有樹結(jié)構(gòu)的編碼單元、預(yù)測單元和變換單元的方法。
[0085]圖3是用于描述根據(jù)本發(fā)明的實施例的分層編碼單元的概念的示圖。
[0086]編碼單元的尺寸可按照寬度X高度來表示,并可以是64X64、32X32、16X16和8X8。64X64的編碼單元可被劃分為64 X 64、64 X 32、32 X 64或32 X 32的分區(qū),32 X 32的編碼單元可被劃分為32X32、32X16、16X32或16X16的分區(qū),16X16的編碼單元可被劃分為16X16、16X8、8X16或8X8的分區(qū),8X8的編碼單元可被劃分為8X8、8X4、4X8或4X4的分區(qū)。
[0087]關(guān)于視頻數(shù)據(jù)310,設(shè)置分辨率是1920 X 1080,編碼單元的最大尺寸是64,并且最大深度是2。關(guān)于視頻數(shù)據(jù)320,設(shè)置分辨率是1920X1080,編碼單元的最大尺寸是64,并且最大深度是3。關(guān)于視頻數(shù)據(jù)330,設(shè)置分辨率是352 X 288,編碼單元的最大尺寸是16,并且最大深度是I。圖3中示出的最大深度表示從最大編碼單元到最小編碼單元的劃分總數(shù)。
[0088]如果分辨率高或者數(shù)據(jù)量大,則編碼單元的最大尺寸可以較大以便不僅提高編碼效率還準(zhǔn)確地反映圖像的特性。因此,分辨率比視頻數(shù)據(jù)330更高的視頻數(shù)據(jù)310和視頻數(shù)據(jù)320的編碼單元的最大尺寸可以是64。
[0089]由于視頻數(shù)據(jù)310的最大深度是2而由于通過劃分最大編碼單元兩次深度被加深到兩層,因此視頻數(shù)據(jù)310的編碼單元315可包括長軸尺寸為64的最大編碼單元以及長軸尺寸為32和16的編碼單元。同時,由于視頻數(shù)據(jù)330的最大深度是I而由于通過劃分最大編碼單元一次深度被加深到一層,因此視頻數(shù)據(jù)330的編碼單元335可包括長軸尺寸為16的最大編碼單元以及長軸尺寸為8的編碼單元。
[0090]由于視頻數(shù)據(jù)320的最大深度是3而由于通過劃分最大編碼單元三次深度被加深到3層,因此視頻數(shù)據(jù)320的編碼單元325可包括長軸尺寸為64的最大編碼單元以及長軸尺寸為32、16和8的編碼單元。隨著深度的加深,可精確地表示詳細(xì)的信息。
[0091]圖4是根據(jù)本發(fā)明的實施例的基于編碼單元的圖像編碼器400的框圖。
[0092]圖像編碼器400包括在視頻編碼設(shè)備100的編碼單元確定器120中執(zhí)行的操作以對圖像數(shù)據(jù)進行編碼。也就是說,幀內(nèi)預(yù)測器410在幀內(nèi)模式下對當(dāng)前幀405中的編碼單元執(zhí)行幀內(nèi)預(yù)測,運動估計器420和運動補償器425在幀間模式下通過使用當(dāng)前幀405和參考幀495對編碼單元分別執(zhí)行幀間估計和運動補償。
[0093]從幀內(nèi)預(yù)測器410、運動估計器420和運動補償器425輸出的數(shù)據(jù)通過變換器430和量化器440被輸出為量化的變換系數(shù)。量化的變換系數(shù)通過反量化器460和反變換器470被恢復(fù)為空間域中的數(shù)據(jù),并且恢復(fù)的空間域中的數(shù)據(jù)在通過去塊單元480和環(huán)路濾波單元490后處理之后被輸出為參考幀495。量化的變換系數(shù)可通過熵編碼器450被輸出為比特流455。
[0094]為了使圖像編碼器400被應(yīng)用到視頻編碼設(shè)備100中,圖像編碼器400的所有元件(即,幀內(nèi)預(yù)測器410、運動估計器420、運動補償器425、變換器430、量化器440、熵編碼器450、反量化器460、反變換器470、去塊單元480和環(huán)路濾波單元490)在考慮每個最大編碼單元的最大深度的同時,基于具有樹結(jié)構(gòu)的多個編碼單元中的每個編碼單元執(zhí)行操作。
[0095]具體地講,幀內(nèi)預(yù)測器410、運動估計器420和運動補償器425在考慮當(dāng)前最大編碼單元的最大尺寸和最大深度的同時,確定具有樹結(jié)構(gòu)的多個編碼單元中的每個編碼單元的分區(qū)和預(yù)測模式,并且變換器430確定具有樹結(jié)構(gòu)的多個編碼單元的每個編碼單元中的變換單元的尺寸。
[0096]圖5是根據(jù)本發(fā)明的實施例的基于編碼單元的視頻解碼器500的框圖。
[0097]解析器510從比特流505解析`將被解碼的編碼圖像數(shù)據(jù)以及解碼所需的關(guān)于編碼的信息。編碼的圖像數(shù)據(jù)通過解碼器520和反量化器530被輸出為反量化的數(shù)據(jù)。反變換器540將反量化的數(shù)據(jù)恢復(fù)為空間域中的圖像數(shù)據(jù)。幀內(nèi)預(yù)測器550針對空間域中的圖像數(shù)據(jù)對幀內(nèi)模式的編碼單元執(zhí)行幀內(nèi)預(yù)測,運動補償器560通過使用參考幀585對幀間模式下的編碼單元執(zhí)行運動補償。
[0098]經(jīng)過幀內(nèi)預(yù)測器550和運動補償器560的空間域中的圖像數(shù)據(jù)可在通過去塊單元570和環(huán)路濾波單元580后處理之后被輸出為重構(gòu)的幀595。另外,經(jīng)過去塊單元570和環(huán)路濾波單元580后處理的圖像數(shù)據(jù)可被輸出為參考幀585。
[0099]為了使視頻解碼器500被應(yīng)用到視頻解碼設(shè)備200中,圖像解碼器500的所有元件(即,解析器510、熵解碼器520、反量化器530、反變換器540、幀內(nèi)預(yù)測器550、運動補償器560、去塊單元570和環(huán)路濾波單元580)基于每個最大編碼單元的具有樹結(jié)構(gòu)的編碼單元執(zhí)行操作。
[0100]幀內(nèi)預(yù)測器550和運動補償器560針對每個具有樹結(jié)構(gòu)的編碼單元確定分區(qū)和預(yù)測模式,并且反變換器540必須針對每個編碼單元確定變換單元的尺寸。
[0101]圖6是示出根據(jù)本發(fā)明的實施例的根據(jù)深度的較深層編碼單元和分區(qū)的示圖。
[0102]視頻編碼設(shè)備100和視頻解碼設(shè)備200使用分層的編碼單元以考慮圖像的特性。編碼單元的最大高度、最大寬度和最大深度可根據(jù)圖像的特性被自適應(yīng)地確定,或者可由用戶不同地設(shè)置。根據(jù)深度的較深層編碼單元的尺寸可根據(jù)編碼單元的預(yù)定最大尺寸被確定。
[0103]在根據(jù)本發(fā)明的實施例的編碼單元的分層結(jié)構(gòu)600中,編碼單元的最大高度和最大寬度都是64,并且最大深度是4。由于深度沿著分層結(jié)構(gòu)600的縱軸加深,因此較深層編碼單元的高度和寬度都被劃分。另外,作為用于每個較深層編碼單元的預(yù)測編碼的基礎(chǔ)的預(yù)測單元和分區(qū)沿分層結(jié)構(gòu)600的橫軸被顯示。
[0104]換句話說,編碼單元610是分層結(jié)構(gòu)600中的最大編碼單元,其中,深度是0,尺寸(即,高度乘寬度)是64X64。深度沿縱軸加深,并且存在尺寸為32X32和深度為I的編碼單元620、尺寸為16X16和深度為2的編碼單元630、尺寸為8X8和深度為3的編碼單元640以及尺寸為4X4和深度為4的編碼單元650。尺寸為4X4和深度為4的編碼單元650是最小編碼單元。
[0105]編碼單元的預(yù)測單元和分區(qū)根據(jù)每個深度沿橫軸排列。換句話說,如果尺寸為64X64和深度為O的編碼單元610是預(yù)測單元,則該預(yù)測單元可被劃分為包括在編碼單元610中的分區(qū)(即,尺寸為64X64的分區(qū)610、尺寸為64X32的分區(qū)612、尺寸為32X64的分區(qū)614、或者尺寸為32X32的分區(qū)616)。
[0106]類似地,尺寸為32X32和深度為I的編碼單元620的預(yù)測單元可被劃分為包括在編碼單元620中的分區(qū)(即,尺寸為32X32的分區(qū)620、尺寸為32X16的分區(qū)622、尺寸為16X32的分區(qū)624以及尺寸為16X16的分區(qū)626)。
[0107]類似地,尺寸為16 X 16和深度為2的編碼單元630的預(yù)測單元可被劃分為包括在編碼單元630中的分區(qū)(即,包括在編碼單元630中的尺寸為16X16的分區(qū)、尺寸為16X8的分區(qū)632、尺寸為8X16的分區(qū)634以及尺寸為8X8的分區(qū)636)。
[0108]類似地,尺寸為8X8和 深度為3的編碼單元640的預(yù)測單元可被劃分為包括在編碼單元640中的分區(qū)(即,包括在編碼單元640中的尺寸為8X8的分區(qū)、尺寸為8X4的分區(qū)642、尺寸為4X8的分區(qū)644以及尺寸為4X4的分區(qū)646)。
[0109]尺寸為4X4和深度為4的編碼單元650是最小編碼單元以及最低深度的編碼單元。編碼單元650的預(yù)測單元僅被分配給尺寸為4X4的分區(qū)。
[0110]為了確定構(gòu)成最大編碼單元610的編碼單元的至少一個編碼深度,視頻編碼設(shè)備100的編碼單元確定器120對包括在最大編碼單元610中的與每個深度相應(yīng)的編碼單元執(zhí)行編碼。
[0111]隨著深度加深,包括相同范圍和相同尺寸的數(shù)據(jù)的根據(jù)深度的較深層編碼單元的數(shù)量增加。例如,需要四個與深度2相應(yīng)的編碼單元以覆蓋包括在一個與深度I相應(yīng)的編碼單元中的數(shù)據(jù)。因此,為了根據(jù)深度對相同數(shù)據(jù)的多個編碼結(jié)果進行比較,與深度I相應(yīng)的編碼單元以及與深度2相應(yīng)的四個編碼單元都被編碼。
[0112]為了針對多個深度中的當(dāng)前深度執(zhí)行編碼,通過沿分層結(jié)構(gòu)600的橫軸,對與當(dāng)前深度相應(yīng)的多個編碼單元中的每個預(yù)測單元執(zhí)行編碼來針對當(dāng)前深度選擇最小編碼誤差??蛇x擇地,可通過隨著深度沿分層結(jié)構(gòu)600的縱軸加深,針對每個深度執(zhí)行編碼,來根據(jù)深度比較最小編碼誤差,從而搜索最小編碼誤差。在最大編碼單元610中的具有最小編碼誤差的深度和分區(qū)可被選為最大編碼單元610的編碼深度和分區(qū)類型。
[0113]圖7是用于描述根據(jù)本發(fā)明的實施例的編碼單元710和變換單元720之間的關(guān)系的示圖。[0114]視頻編碼設(shè)備100或視頻解碼設(shè)備200針對每個最大編碼單元根據(jù)尺寸小于或等于最大編碼單元的編碼單元來對圖像進行編碼或解碼??苫诓淮笥谙鄳?yīng)編碼單元的數(shù)據(jù)單元來選擇在編碼期間用于變換的變換單元的尺寸。
[0115]例如,在視頻編碼設(shè)備100或視頻解碼設(shè)備200中,如果編碼單元710的尺寸是64X64,則可通過使用尺寸為32X32的變換單元720來執(zhí)行變換。
[0116]另外,可通過對小于64X64的尺寸為32X32、16X 16、8X8和4X4的每個變換單元執(zhí)行變換,來對尺寸為64X64的編碼單元710的數(shù)據(jù)進行編碼,并且隨后可選擇具有最小編碼誤差的變換單元。
[0117]圖8是用于描述根據(jù)本發(fā)明的實施例的與編碼深度相應(yīng)的編碼單元的編碼信息的示圖。
[0118]視頻編碼設(shè)備100的輸出單元130可對關(guān)于分區(qū)類型的信息800、關(guān)于預(yù)測模式的信息810以及關(guān)于與編碼深度相應(yīng)的每個編碼單元的變換單元的尺寸的信息820進行編碼和發(fā)送,作為關(guān)于編碼模式的信息。
[0119]信息800指示關(guān)于通過劃分當(dāng)前編碼單元的預(yù)測單元而獲得的分區(qū)的形狀的信息,其中,所述分區(qū)是用于對當(dāng)前編碼單元進行預(yù)測編碼的數(shù)據(jù)單元。例如,尺寸為2NX2N的當(dāng)前編碼單元CU_0可被劃分為如下分區(qū)中的任何一個:尺寸為2NX2N的分區(qū)802、尺寸為2NXN的分區(qū)804、尺寸為NX2N的分區(qū)806以及尺寸為NXN的分區(qū)808。這里,關(guān)于分區(qū)類型的信息800被設(shè)置為指示尺寸為尺寸為2NX2N的分區(qū)802、2NXN的分區(qū)804、尺寸為NX 2N的分區(qū)806以及尺寸為NXN的分區(qū)808中的一個。
[0120]信息810指示每個分區(qū)的預(yù)測模式。例如,信息810可指示對由信息800指示的分區(qū)執(zhí)行的預(yù)測編碼的模式(即,幀內(nèi)模式812、幀間模式814或跳過模式816)。
[0121]信息820指示當(dāng)對當(dāng)前編碼單元執(zhí)行變換時所基于的變換單元。例如,變換單元可以是第一幀內(nèi)變換單元822、第二幀內(nèi)變換`單元824、第一幀間變換單元826或第二幀間變換單元828。
[0122]視頻解碼設(shè)備200的圖像數(shù)據(jù)和編碼信息提取器210可根據(jù)每個較深層編碼單元來提取并使用用于解碼的關(guān)于編碼單元的信息800、關(guān)于預(yù)測模式的信息810和關(guān)于變換單元的尺寸的信息820。
[0123]圖9是根據(jù)本發(fā)明的實施例的根據(jù)深度的較深層編碼單元的示圖。
[0124]劃分信息可用于指示深度的改變。劃分信息指示當(dāng)前深度的編碼單元是否被劃分為更低深度的編碼單元。
[0125]用于對深度為O和尺寸為2N_0X2N_0的編碼單元900進行預(yù)測編碼的預(yù)測單元910可包括如下分區(qū)類型的分區(qū):尺寸為2N_0X2N_0的分區(qū)類型912、尺寸為2N_0XN_0的分區(qū)類型914、尺寸為N_0 X 2N_0的分區(qū)類型916以及尺寸為Ν_0 ΧΝ_0的分區(qū)類型918。盡管圖9僅示出通過對預(yù)測單元910對稱劃分而獲得的分區(qū)類型912至918,但是分區(qū)類型不限于此,并且預(yù)測單元910的分區(qū)可包括不對稱分區(qū)、具有預(yù)定形狀的分區(qū)以及具有幾何形狀的分區(qū)。
[0126]根據(jù)每個分區(qū)類型對如下分區(qū)重復(fù)地執(zhí)行預(yù)測編碼:尺寸為2N_0X2N_0的一個分區(qū)、尺寸為2N_0XN_0的兩個分區(qū)、尺寸為N_0X2N_0的兩個分區(qū)以及尺寸為Ν_0ΧΝ_0的四個分區(qū)??蓪Τ叽鐬?N_0X2N_0、N_0X2N_0、2N_0XN_0以及Ν_0ΧΝ_0的分區(qū)執(zhí)行幀內(nèi)模式和幀間模式的預(yù)測編碼。僅對尺寸為2N_0X2N_0的分區(qū)執(zhí)行跳過模式的預(yù)測編碼。
[0127]如果在尺寸為2N_0X2N_0、2N_0XN_0和N_0X2N_0的分區(qū)類型912至916之一中的編碼誤差最小,則預(yù)測單元910可不被劃分為更低深度。
[0128]如果在尺寸為N_0 X N_0的分區(qū)類型918中的編碼誤差最小,則在操作920,深度從O改變?yōu)镮以劃分分區(qū)類型918,并且對深度為2和尺寸為Ν_0ΧΝ_0的分區(qū)類型的編碼單元重復(fù)地執(zhí)行編碼以搜索最小編碼誤差。
[0129]用于對深度為I和尺寸為2Ν_1Χ2Ν_1 (=Ν_0ΧΝ_0)的(分區(qū)類型的)編碼單元930進行預(yù)測編碼的預(yù)測單元940可包括如下分區(qū)類型的分區(qū):尺寸為2N_1X2N_1的分區(qū)類型942、尺寸為2N_1XN_1的分區(qū)類型944、尺寸為N_1 X2N_1的分區(qū)類型946以及尺寸為N_1XN_1的分區(qū)類型948。
[0130]如果在尺寸為N_1XN_1的分區(qū)類型948中編碼誤差最小,則在操作950,深度從I改變?yōu)?以劃分分區(qū)類型948,并且對深度為2和尺寸為N_2XN_2的編碼單元960重復(fù)地執(zhí)行編碼以搜索最小編碼誤差。
[0131]當(dāng)最大深度是d時,根據(jù)深度的劃分操作可被執(zhí)行直到深度變?yōu)閐-Ι,并且劃分信息可被編碼直到深度是O至d-2之一。換句話說,當(dāng)執(zhí)行編碼直到在操作970與深度d-2相應(yīng)的編碼單元被劃分之后深度是d-Ι時,用于對深度為d-Ι和尺寸為2N_(d-l) X2N_(d-l)的編碼單元980進行預(yù)測編碼的預(yù)測單元990可包括如下分區(qū)類型的分區(qū):尺寸為2N_(d-1) X2N_(d-l)的分區(qū)類型992、尺寸為2N_(d-l) XN_(d-l)的分區(qū)類型994、尺寸為N_(d-1) X2N_(d-l)的分區(qū)類型996以及尺寸為N_(d_l) XN_(d_l)的分區(qū)類型998。
[0132]可對分區(qū)類型992至998中的如下分區(qū)重復(fù)地執(zhí)行預(yù)測編碼以搜索具有最小編碼誤差的分區(qū)類型:尺寸為2N_(d-l) X2N_(d-l)的一個分區(qū)、尺寸為2N_(d-l) XN_(d_l)的兩個分區(qū)、尺寸SN_(d-l) X2N_(d-l)的兩個分區(qū)、尺寸為N_(d_l) XN_(d_l)的四個分區(qū)。
[0133]即使在尺寸為N_(d-1) XN_(d-l)的分區(qū)類型998具有最小編碼誤差時,由于最大深度是d,因此深度為d-Ι的編碼單元CU_(d-l)不再被劃分到更低深度,并且構(gòu)成當(dāng)前最大編碼單元900的編碼單元的編碼深度被確定為d-Ι并且當(dāng)前最大編碼單元900的分區(qū)類型可被確定為N_(d_l) XN_(d-l)。另外,由于最大深度是d,因此最小編碼單兀980的劃分/[目息不被設(shè)置。
[0134]數(shù)據(jù)單元999可以是當(dāng)前最大編碼單元的“最小單元”。根據(jù)本發(fā)明的實施例的最小單元可以是通過對最小編碼單元980劃分4次而獲得的矩形數(shù)據(jù)單元。通過重復(fù)地執(zhí)行編碼,視頻編碼設(shè)備100可通過比較根據(jù)編碼單元900的多個深度的多個編碼誤差來選擇具有最小編碼誤差的深度以確定編碼深度,并且將相應(yīng)分區(qū)類型以及預(yù)測模式設(shè)置為編碼深度的編碼模式。
[0135]這樣,根據(jù)深度的最小編碼誤差在所有的深度I至d中被比較,并且具有最小編碼誤差的深度可被確定為編碼深度。編碼深度、預(yù)測單元的分區(qū)類型以及預(yù)測模式可被編碼并作為關(guān)于編碼模式的信息被發(fā)送。另外,由于編碼單元從深度O被劃分到編碼深度,因此僅該編碼深度的劃分信息被設(shè)置0,除了編碼深度之外的深度的劃分信息被設(shè)置為I。
[0136]視頻解碼設(shè)備200的圖像數(shù)據(jù)和編碼信息提取器220可提取并使用關(guān)于編碼單元900的編碼深度以及預(yù)測單元的信息以對分區(qū)912進行解碼。視頻解碼設(shè)備200可通過使用根據(jù)深度的劃分信息來將劃分信息是O的深度確定為編碼深度,并且使用關(guān)于相應(yīng)深度的編碼模式的信息用于解碼。
[0137]圖10至圖12是用于描述根據(jù)本發(fā)明的實施例的編碼單元1010、預(yù)測單元1060和變換單元1070之間的關(guān)系的示圖。
[0138]編碼單元1010是最大編碼單元中的與由視頻編碼設(shè)備100確定的編碼深度相應(yīng)的具有樹結(jié)構(gòu)的編碼單元。預(yù)測單元1060是每個編碼單元1010的預(yù)測單元的分區(qū),變換單元1070是每個編碼單元1010的變換單元。
[0139]當(dāng)在編碼單元1010中最大編碼單元的深度是O時,編碼單元1012和1054的深度是 1,編碼單元 1014、1016、1018、1028、1050 和 1052 的深度是 2,編碼單元 1020、1022、1024、1026、1030、1032和1048的深度是3,編碼單元1040、1042、1044和1046的深度是4。
[0140]在預(yù)測單元1060 中,一些編碼單元 1014、1016、1022、1032、1048、1050、1052 和1054通過劃分編碼單元而獲得。換句話說,編碼單元1014、1022、1050和1054中的分區(qū)類型的尺寸為2NXN,編碼單元1016、1048和1052中的分區(qū)類型尺寸的NX 2N,編碼單元1032的分區(qū)類型的尺寸為NXN。編碼單元1010的預(yù)測單元和分區(qū)小于或等于每個編碼單元。
[0141]以小于編碼單元1052的數(shù)據(jù)單元對變換單元1070中的編碼單元1052的圖像數(shù)據(jù)執(zhí)行變換或反變換。另外,變換單元1070中的編碼單元1014、1016、1022、1032、1048、1050和1052在尺寸和形狀上與預(yù)測單元1060的編碼單元1014、1016、1022、1032、1048、1050和1052不同。換句話說,視頻編碼設(shè)備100和視頻解碼設(shè)備200可對相同編碼單元中的數(shù)據(jù)單元獨立地執(zhí)行幀內(nèi)預(yù)測、運動 估計、運動補償、變換和反變換。
[0142]因此,對最大編碼單元的每個區(qū)域中的具有分層結(jié)構(gòu)的每個編碼單元遞歸地執(zhí)行編碼,以確定最佳編碼單元,因此可獲得具有遞歸樹結(jié)構(gòu)的編碼單元。編碼信息可包括關(guān)于編碼單元的劃分信息、關(guān)于分區(qū)類型的信息、關(guān)于預(yù)測模式的信息以及關(guān)于變換單元的尺寸的信息。
[0143]表1顯示可由視頻編碼設(shè)備100和視頻解碼設(shè)備200設(shè)置的編碼信息。
[0144]表1
[0145]
【權(quán)利要求】
1.一種圖像編碼方法,包括: 獲得第一參考畫面列表、第二參考畫面列表和組合參考畫面列表,其中,所述組合參考畫面列表是包括在第一參考畫面列表中的參考畫面與包括在第二參考畫面列表中的參考畫面的組合; 通過使用單向運動預(yù)測模式和雙向預(yù)測模式之一來對當(dāng)前預(yù)測單元進行編碼,其中,在單向運動預(yù)測模式中通過使用包括在組合參考畫面列表中的參考畫面來對當(dāng)前預(yù)測單元執(zhí)行單向運動預(yù)測,在雙向預(yù)測模式中通過使用第一參考畫面列表和第二參考畫面列表來對當(dāng)前預(yù)測單元執(zhí)行雙向運動預(yù)測; 基于單向運動感預(yù)測模式的情況的數(shù)量和雙向運動預(yù)測模式的情況的數(shù)量,來對指示在當(dāng)前預(yù)測單元的編碼中使用的運動預(yù)測模式和參考畫面的參考語法進行編碼。
2.如權(quán)利要求1所述的圖像編碼方法,其中,在參考語法的編碼中,不同值的參考語法被分配用于單向運動預(yù)測模式中可用的參考畫面中的每個以及雙向運動預(yù)測模式中可用的參考畫面的組合,并且對與當(dāng)前預(yù)測單元的運動預(yù)測模式以及當(dāng)前預(yù)測單元的運動預(yù)測中使用的參考畫面相應(yīng)的參考語法的值進行編碼。
3.如權(quán)利要求2所述的圖像編碼方法,其中,當(dāng)包括在組合參考列表中的參考畫面的數(shù)量是NumOfRef_LC,包括在第一參考列表中的參考畫面的數(shù)量是NumOFRef_LO,包括在第二參考畫面列表中的參考畫面的數(shù)量是NumOfRef_LI,并且當(dāng)前預(yù)測單元的單向運動預(yù)測和雙向運動預(yù)測的所有情況的數(shù)量是MaxValue時,MaxValue具有根據(jù)以下等式確定的值;MaxValue=NumOfRef_LC+Num0fRef_L0XNumOfRef_LI, 其中,將從O到(MaxValue-1)的值中的一個分配為用于單向運動預(yù)測模式中可用的參考畫面中的每個以及雙向運動預(yù)測模式中可用的參考畫面的組合的參考語法。
4.如權(quán)利要求3所述的圖像編碼方法,其中,當(dāng)重復(fù)地包括在第一參考畫面列表和第二參考畫面列表中的參考畫面的數(shù)量是NumOfRedundancy時,NumOfRef_L0+Numofref_I1-NumOfRedundancy個未重復(fù)的參考畫面包括在組合參考畫面列表中。
5.如權(quán)利要求3所述的圖像編碼方法,其中,當(dāng)單向地運動預(yù)測當(dāng)前預(yù)測單元時,根據(jù)當(dāng)前預(yù)測單元參考的組合參考畫面列表的參考畫面將從O到(NumOfRef_LC-l)的值編碼為當(dāng)前預(yù)測單元的參考語法。
6.如權(quán)利要求3所述的圖像編碼方法,其中,當(dāng)對當(dāng)前預(yù)測單元進行雙向運動預(yù)測時,根據(jù)由當(dāng)前預(yù)測單元參考的第一參考畫面列表的第一參考畫面以及第二參考畫面列表的第二參考畫面的組合,將從(NumOfRef_LC)到(MaxValue-1)的值編碼為當(dāng)前預(yù)測單元的參考語法。
7.如權(quán)利要求3所述的圖像編碼方法,其中,當(dāng)參考語法的值為MaxValue時,指示特殊情況,其中,在特殊情況中沒有使用單向運動預(yù)測模式的參考畫面和雙向運動預(yù)測模式的參考畫面的組合。
8.一種圖像解碼方法,包括: 獲得第一參考畫面列表、第二參考畫面列表和組合參考畫面列表,其中,組合參考畫面列表是包括在第一參考畫面列表中的參考畫面與包括在第二參考畫面列表中的參考畫面的組合; 基于單向運動預(yù)測模式的情況的數(shù)量和雙向運動預(yù)測模式的情況的數(shù)量,根據(jù)當(dāng)前預(yù)測單元的編碼中使用的運動預(yù)測模式和參考畫面,確定參考語法的值,其中,在單向運動預(yù)測模式中,包括在組合參考列表中的參考畫面被使用,在雙向運動預(yù)測模式中,第一參考畫面列表和第二參考趣面列表被使用; 從比特流獲得當(dāng)前預(yù)測單元的參考語法; 通過使用參考語法的值來確定當(dāng)前預(yù)測單元的運動預(yù)測模式和參考畫面: 通過使用確定的運動預(yù)測模式和確定的參考畫面來對當(dāng)前預(yù)測單元執(zhí)行運動補償。
9.如權(quán)利要求8所述的圖像解碼方法,其中,在第一參考畫面列表中,以從距離當(dāng)前畫面最近的在前參考畫面到在所述在后參考畫面之前的參考畫面的順序分配參考畫面索引,在第二參考畫面列表中,以從距離當(dāng)前畫面最近的在后參考畫面到在所述在后參考畫面之后的參考畫面的順序分配參考畫面索引。
10.如權(quán)利要求8所述的圖像解碼方法,其中,參考語法具有分配給單向運動預(yù)測模式中可用的參考畫面中的每個以及雙向運動預(yù)測模式中可用的參考畫面的組合的值。
11.如權(quán)利要求10所述的圖像解碼方法,其中,當(dāng)包括在組合參考列表中的參考畫面的數(shù)量是NumOfRef_LC,包括在第一參考列表中的參考畫面的數(shù)量是NumOFRef_L0,包括在第二參考畫面列表中的參考畫面的數(shù)量是NumOfRef_Ll,并且當(dāng)前預(yù)測單元的單向運動預(yù)測和雙向運動預(yù)測的所有情況的數(shù)量是MaxValue時,MaxValue具有根據(jù)以下等式確定的值;MaxValue=NumOfRef_LC+NumOfRef_LO XNumOfRef_Ll, 其中,將從O到(MaxValue-1)的值中的一個分配為用于單向運動預(yù)測模式中可用的參考畫面中的每個以及雙向運動預(yù)測模式中可用的參考畫面的組合的參考語法。
12.如權(quán)利要求11所述的圖像解碼方法,其中,當(dāng)重復(fù)地包括在第一參考畫面列表和第二參考畫面列表中的參考畫面的數(shù)量是NumOfRedundancy時,NumOfRef_L0+Numofref_I1-NumOfRedundancy個未重復(fù)的參考畫面包括在組合參考畫面列表中。
13.如權(quán)利要求11所述的圖像解碼方法,其中,當(dāng)對當(dāng)前預(yù)測單元進行單向運動預(yù)測時,根據(jù)當(dāng)前預(yù)測單元參考的組合參考畫面列表的參考畫面將從O到(NumOfRef_LC-l)的值編碼為當(dāng)前預(yù)測單元的參考語法。
14.如權(quán)利要求11所述的圖像解碼方法,其中,當(dāng)當(dāng)前預(yù)測單元進行雙向運動預(yù)測時,根據(jù)由當(dāng)前預(yù)測單元參考的第一參考畫面列表的第一參考畫面以及第二參考畫面列表的第二參考畫面的組合,將從(NumOfRef_LC)到(MaxValue-1)的值編碼為當(dāng)前預(yù)測單元的參考語法O
15.如權(quán)利要求11所述的圖像解碼方法,其中,當(dāng)參考語法的值為MaxValue時,指示特殊情況,其中,在特殊情況中沒有使用單向運動預(yù)測模式的參考畫面和雙向運動預(yù)測模式的參考畫面的組合。
【文檔編號】H04N19/51GK103563382SQ201280022824
【公開日】2014年2月5日 申請日期:2012年3月12日 優(yōu)先權(quán)日:2011年3月11日
【發(fā)明者】李泰美, 樸永五 申請人:三星電子株式會社