專利名稱:對使用有向變換生成的比特流進(jìn)行解碼的方法
技術(shù)領(lǐng)域:
本發(fā)明總體上涉及視頻編解碼器,更具體地,涉及在視頻幀和圖像中的像素塊的編碼和解碼中使用的有向變換(directional transform)。
背景技術(shù):
編解碼器數(shù)字視頻編解碼器對視頻進(jìn)行壓縮和解壓。編解碼器可以在廣播設(shè)備、電視、個(gè)人計(jì)算機(jī)、錄像機(jī)和播放器、衛(wèi)星以及移動(dòng)設(shè)備和在線設(shè)備中找到。編解碼器將視頻的各幀劃分為像素塊,并且一次處理一個(gè)塊。在編碼中,消除空間和時(shí)間冗余以減小數(shù)據(jù)率。本發(fā)明與視頻編碼和解碼中使用的變換特別相關(guān)。最普通的變換是MPEG和H. 264/AVC標(biāo)準(zhǔn)中規(guī)定的離散余弦變換(DCT)。DCT對空間域中的像素強(qiáng)度進(jìn)行轉(zhuǎn)換以對頻域中的系數(shù)進(jìn)行變換。然后對系數(shù)進(jìn)行量化,進(jìn)行熵解碼,以生成壓縮比特流。比特流可以存儲(chǔ)在介質(zhì)(DVD)上,或者直接傳送到解碼器。在解碼中,這些步驟反過來。在熵解碼和逆量化之后,進(jìn)行逆變換以恢復(fù)原始視頻。通常,解碼器的數(shù)量(例如,全世界的消費(fèi)類產(chǎn)品)遠(yuǎn)遠(yuǎn)超過編碼器的數(shù)量。因此,為了實(shí)現(xiàn)互通性,僅比特流和解碼處理被標(biāo)準(zhǔn)化。編碼處理通常不在標(biāo)準(zhǔn)中規(guī)定。變換DCT包括施加于塊中的各像素行的水平ID DCT和施加于各像素列的垂直1DDCT。對于主要具有水平特征和垂直特征的塊,2D DCT是高效的。然而,2D DCT不能高效地對包含既非水平也非垂直的特征(即,有向特征)的塊進(jìn)行變換,其中“有向(directional) ”指水平和垂直以外的朝向。通常,存在兩種實(shí)現(xiàn)有向變換的方法。第一種方法沿著塊內(nèi)的預(yù)定路徑施加2DDCT。第二種方法施加有向?yàn)V波器,之后是2D DCT0通常,扇形濾波器(fan filter)將塊劃分為有向子帶的集合。隨后對各子帶施加變換。這樣實(shí)施輪廓波(contourlet)等的有向變換。輪廓波高效地對包含由曲線邊界分離的平滑區(qū)域的幀進(jìn)行變換。已經(jīng)使用有向變換來補(bǔ)充現(xiàn)有視頻編碼方法(諸如H. 264/AVC)的現(xiàn)有2D DCT或DCT類的變換。在編碼處理中,H. 264/AVC編碼器從變換集(諸如傳統(tǒng)的2D變換)及有向變換集中進(jìn)行選擇。然后選擇在編碼率/失真方面產(chǎn)生最佳性能的一個(gè)變換,以進(jìn)行編碼和解碼。在變換之后,可以利用有向數(shù)據(jù)的統(tǒng)計(jì)來對相應(yīng)數(shù)據(jù)的熵解碼進(jìn)行改進(jìn)。在H. 264/AVC中,使用上下文(context)自適應(yīng)二進(jìn)制算術(shù)編碼器(CABAC)或上下文自適應(yīng)可變長度編碼器(CAVLC)對不同類型的數(shù)據(jù)進(jìn)行熵編碼。把輸入符號映射到二進(jìn)制碼字并由算術(shù)編碼器進(jìn)行壓縮。上下文用于調(diào)整算術(shù)編碼器所使用的統(tǒng)計(jì)。各上下文存儲(chǔ)最可能的符號(0或I)以及相應(yīng)的概率。H. 264/AVC標(biāo)準(zhǔn)被設(shè)計(jì)為使用2D DCT0現(xiàn)有方法可以使用有向變換來擴(kuò)展H. 264/AVC編碼器的性能。然而,這些方法仍然使用傳統(tǒng)的H. 264/AVC架構(gòu)來生成與方向有關(guān)的判決以及數(shù)據(jù)并進(jìn)行編碼。因而,需要高效地表示有向信息,并提高編碼效率。變換的目的在于將像素值變化的塊轉(zhuǎn)換為大部分系數(shù)為0的系數(shù)塊。在DCT的情況下,將像素的陣列集轉(zhuǎn)換為表示塊中的低頻至高頻數(shù)據(jù)的DCT系數(shù)集。最低的頻率是DC系數(shù),其與通過變換而轉(zhuǎn)換的全部像素的平均值相關(guān)。下一個(gè)系數(shù)表示信號中包含的最低頻余弦波的幅值。隨后的系數(shù)對應(yīng)于遞增的頻率。如果數(shù)據(jù)非常適合于DCT,則許多頻率系數(shù)為零,是解碼器重建視頻時(shí)所不需要的。使用并行ID變換集的現(xiàn)有的有向變換的一個(gè)問題在于根據(jù)變換在塊中的位置,各ID變換的長度可能發(fā)生變化。例如,為了使用朝向45度的有向變換對8X8塊進(jìn)行變換,沿著塊的主對角線的ID變換具有8個(gè)元素,并且相鄰的ID具有7個(gè)元素,等等,直至一個(gè)或兩個(gè)元素的變換,這是低效的。一個(gè)元素的變換最多是一個(gè)像素值的縮放,這對提高編碼效率不起多大作用。因而,需要一種方法,該方法使用這些變換對塊進(jìn)行變換而不會(huì)因?yàn)樾〉淖儞Q路徑而變得低效,但仍保持原變換的有向特性。還需要一種方法來以進(jìn)一步提高編碼效率但無損于性能(當(dāng)數(shù)據(jù)在第二正交方 向上不相關(guān)時(shí)2D DCT的性能會(huì)劣化)的方式對第一變換集的輸出施加第二變換集。此外,需要一種適合于對H. 264/AVC等預(yù)測編碼器中普遍存在的預(yù)測殘余塊進(jìn)行編碼的該變換的分割后的形式。
發(fā)明內(nèi)容
比特流包括幀序列。各幀被劃分為編碼塊。針對各個(gè)塊,在根據(jù)比特流中的變換索引確定的變換角處確定路徑集。從比特流中取得變換系數(shù)。變換系數(shù)包括各路徑的一個(gè)DC系數(shù)。對變換系數(shù)施加逆變換來生成解碼視頻。
圖IA是根據(jù)本發(fā)明的實(shí)施方式的視頻系統(tǒng)的框圖;圖IB是根據(jù)本發(fā)明的實(shí)施方式的解碼器的框圖;圖IC是根據(jù)本發(fā)明的實(shí)施方式的編碼器的框圖;圖2是根據(jù)本發(fā)明的實(shí)施方式的子塊和分區(qū)有向處理模塊的框圖;圖3是根據(jù)本發(fā)明的實(shí)施方式的變換類型和方向判決模塊的框圖;圖4是根據(jù)本發(fā)明的實(shí)施方式的方向推斷模塊的框圖;圖5是根據(jù)本發(fā)明的實(shí)施方式的有向預(yù)測模塊的框圖;圖6是根據(jù)本發(fā)明的實(shí)施方式的有向索引編碼器模塊的框圖;圖7是根據(jù)本發(fā)明的實(shí)施方式的有向索引編碼器模塊的第一實(shí)施方式的示意圖;圖8是根據(jù)本發(fā)明的實(shí)施方式的有向索引編碼器模塊的第二實(shí)施方式的示意圖;圖9和圖10是根據(jù)本發(fā)明的實(shí)施方式的上下文生成模塊的流程圖;圖IlA和圖IlB是根據(jù)本發(fā)明的實(shí)施方式的主有向變換和次有向變換的路徑的示意圖;圖12A至圖12F是根據(jù)本發(fā)明的實(shí)施方式的8X8像素塊的主有向變換的框圖;以及圖13是根據(jù)本發(fā)明的實(shí)施方式的分區(qū)有向變換集的框圖。
具體實(shí)施例方式編解碼器圖IA示出了根據(jù)本發(fā)明的實(shí)施方式的視頻系統(tǒng)。該系統(tǒng)包括編碼器10和解碼器20,合稱為編解碼器30。如所公知的,編解碼器可以在包括有存儲(chǔ)器和輸入/輸出接口的處理器中實(shí)現(xiàn)。編碼器將輸入視頻I壓縮成比特流15。如后所述,編碼器對輸入視頻施加變換、量化和熵編碼。為了保證輸出視頻準(zhǔn)確地反映輸入視頻,解碼器20以相反的順序執(zhí)行相反的步驟。另外,編碼器通常包括解碼器的等同物,以提供編碼處理的反饋。因?yàn)樵诰幋a器中所有編碼器變量都是現(xiàn)成的,所以編碼器中的解碼器相對簡單。本發(fā)明與逆有向變換25特別相關(guān)。如下所述并且如圖IlB所示,變換可以包括主變換和次變換。在編碼中,主變換對像素強(qiáng)度進(jìn)行運(yùn)算以確定變換系數(shù),例如DC系數(shù)和AC系數(shù)。次變換僅對DC系數(shù)1160進(jìn)行運(yùn)算以生成次變換系數(shù)1170以進(jìn)一步減少數(shù)據(jù)冗余。逆變換包括次逆變換26和主逆變換27,次逆變換26用于重建DC系數(shù),主逆變換27恢復(fù)解碼視頻的像素強(qiáng)度。為了保證編碼器與解碼器之間的互通性,視頻編碼標(biāo)準(zhǔn)通常僅規(guī)定比特流和解碼處理。然而,本領(lǐng)域技術(shù)人員可以理解,下面詳細(xì)進(jìn)行的編碼處理的說明足以精確地推導(dǎo)出相反的解碼處理。解碼器圖IB示出了本發(fā)明的解碼器20的相關(guān)部分。解碼器接收編碼比特流15和信息160。將比特流提供給CABAC熵解碼器191,CABAC熵解碼器191根據(jù)該信息生成量化變換系數(shù)192。對于第一塊,該信息可以是初始上下文。之后,該信息與前一處理(解碼)的塊相關(guān)。對系數(shù)進(jìn)行逆量化24和逆變換25,從而解碼塊形成輸出或解碼視頻2。變換可以是逆離散余弦變換(IDCT)。變換可以包括2D逆離散余弦變換,以及逆有向變換集。還可以施加下面詳細(xì)說明的次逆變換。將信息160提供給解碼器的上下文生成模塊(CGM),該上下文生成模塊(CGM)將所選擇的上下文921-922轉(zhuǎn)發(fā)給CABAC解碼器。將先前解碼的塊160的預(yù)測變換指示符(PTI) 501提供給有向索引解碼模塊(DIDM) 601,該有向索引解碼模塊(DIDM) 601生成逆變換25的變換指示符602。逆變換可以使用任何逆變換,例如ID水平和ID垂直逆DCT (2D IDCT)41、逆有向變換42的集合以及任何其它已知的逆變換43。應(yīng)當(dāng)注意,當(dāng)前的視頻編碼標(biāo)準(zhǔn)僅使用一個(gè)預(yù)先規(guī)定的變換,從而不需要不同變換的索引。此外,當(dāng)前的標(biāo)準(zhǔn)在逆變換中不考慮與先前解碼的塊相關(guān)的邊信息。編碼器圖IC示出了編碼器10的相關(guān)細(xì)節(jié)。根據(jù)本發(fā)明的實(shí)施方式,編碼器使用有向變換。可以在編碼器的處理器中執(zhí)行所示方法的步驟。處理器包括公知的存儲(chǔ)器和輸入/輸出接口。編碼器的輸入是待編碼視頻的幀的塊101。如本文定義的,塊包括宏塊、子塊以及塊分區(qū),通常是像素陣列。在大部分編碼應(yīng)用中,優(yōu)選對宏塊和子塊進(jìn)行運(yùn)算。塊可以包含原始視頻數(shù)據(jù)、視頻數(shù)據(jù)的空間或運(yùn)動(dòng)補(bǔ)償預(yù)測的殘余或者其它待變換的與紋理相關(guān)的數(shù)據(jù)??梢酝ㄟ^子塊分區(qū)有向處理模塊(sroPM)200將塊分區(qū)為子塊。在本文中,將子塊作為“塊” 一次一個(gè)地進(jìn)行處理。使用從傳統(tǒng)的二維離散余弦變換(2D DCT) 120、有向變換130的集合或其它變換(通稱為變換125)中選擇的變換對各塊進(jìn)行變換。通過變換類型和方向判決模塊(TTDDM) 300來測量輸出。TTDDM使用編碼率/失真成本等的指標(biāo)來確定哪個(gè)變換提供最佳性能。編碼率/失真成本是編碼率與標(biāo)量乘失真的總和。 選擇具有最小成本的變換類型和方向進(jìn)行變換。性能可以是,但不限于,編碼效率的度量。其思想是選擇具有最佳性能的變換進(jìn)行編碼,并且將所選擇的變換作為比特流中的索引16傳達(dá)給解碼器。TTDDM還可以接收來自方向推斷模塊(DM) 400的輸入。DIM的輸入是指示先前剛處理的塊所使用的變換和方向的數(shù)據(jù)160的集合。DIM的輸出是與數(shù)據(jù)160對應(yīng)的值或值的集合,比如優(yōu)選的方向431。TTDDM使用該信息來判決使用哪個(gè)變換和方向?qū)K101進(jìn)行編碼。TTDDM還可以向SPDPM轉(zhuǎn)發(fā)最終分區(qū)指示符(FPI) 141,作為分割的指導(dǎo)。TTDDM模塊生成變換塊102和表示所選擇的變換和方向的所選變換指示符(STI) 145。然后,使用熵編碼對變換塊102進(jìn)行適當(dāng)編碼(150),以生成編碼輸出塊17。方向預(yù)測模塊(DPM) 500還從DM接收信息,并接收與先前處理的塊160相關(guān)的信息。DPM使用該信息生成預(yù)測變換指示符(PTI) 501。PTI與STI 145—起被輸入到有向索引編碼模塊(DIEM) 600。DIEM將該表征轉(zhuǎn)換成二進(jìn)制碼字603,以通過上下文自適應(yīng)二進(jìn)制算術(shù)編碼器(CABAC) 190進(jìn)行編碼。通過上下文生成模塊(CGM)900確定供CABAC使用的上下文。CGM的輸入是來自DIM的與先前剛編碼的塊所使用的變換和方向相關(guān)的信息,或者是來自當(dāng)前塊的已編碼信息。CGM生成CABAC的上下文,以對二進(jìn)制有向索引進(jìn)行編碼。CABAC輸出編碼后的變換索引16。子塊和分區(qū)有向處理模塊圖2示出了 SPDPM 200的細(xì)節(jié)。輸入塊101中的像素可以表示與視頻相關(guān)的信息,諸如視頻幀數(shù)據(jù)、運(yùn)動(dòng)補(bǔ)償預(yù)測殘余以及空間預(yù)測殘余。SroPM將塊劃分為多個(gè)分區(qū)210,通常為像素陣列。對分區(qū)施加傳統(tǒng)或有向變換125。由TTDDM生成的最終分區(qū)指示符141指示使用哪個(gè)分區(qū)以實(shí)現(xiàn)最佳性能。變換類型和方向判決模塊圖3示出了選擇最佳變換和方向以用來對塊210進(jìn)行變換的TTDDM 300。變換選擇器310選擇可用變換類型中的哪一個(gè)要發(fā)送到測量模塊320,測量模塊320確定用于選擇變換的編碼率/失真(R/D)成本等的指標(biāo)321。變換選擇器可受DM 400的影響。DM例如可以對相鄰塊進(jìn)行檢查以確定哪個(gè)方向?qū)τ诋?dāng)前塊更好。然后可以把測量限于可用方向的子集,因而減少處理時(shí)間。在使用這些測量確定最佳方向或變換之后,輸出所選變換指示符145以及相應(yīng)的變換塊102。如果TTDDM對所選擇的多個(gè)分區(qū)進(jìn)行工作,則還向SPDPM輸出產(chǎn)生最佳性能的最終分區(qū)指示符141。方向推斷模塊圖4示出了 DM 400。塊選擇模塊使用先前處理的塊和邊信息160來確定當(dāng)前塊的可能變換方向411。使用可能變換方向來確定優(yōu)選方向431的集合。該優(yōu)選方向431的集合隨后供DPM使用以減少表示該信息所需的比特?cái)?shù),這樣會(huì)提高編碼器和解碼器中的效率。塊選擇模塊(BSM)410基于所選塊與當(dāng)前塊之間的距離等標(biāo)準(zhǔn),從塊160中進(jìn)行選擇??煽啃耘袥Q模塊(RDM) 420估計(jì)所選塊的可靠性。RDM模塊可以使用紋理信息、位置和其它的塊數(shù)據(jù)412。各個(gè)所選塊的可靠性因數(shù)421以及相應(yīng)的變換方向411送至識別優(yōu)選方向413的優(yōu)選方向確定模塊(PDDM)。有向預(yù)測模塊圖5示出了 DPM 500,其確定DIEM 600和CGM的預(yù)測變換指示符501。第一級預(yù)測器510從優(yōu)選方向431中選擇候選515。第二級預(yù)測器420使用這些候選和編碼邊信息160來選擇優(yōu)選變換指示符501。 為了對變換后的紋理殘余進(jìn)行編碼,可以將所選變換指示符145與紋理預(yù)測器(諸如在H.264/AVC中使用的幀內(nèi)預(yù)測模式)關(guān)聯(lián)起來。因此,送至DPM的邊信息可以包括例如幀內(nèi)預(yù)測模式以選擇指示符501。有向索引編碼模塊圖6示出了 DIEM 600。輸入包括所選變換指示符145和預(yù)測變換指示符501,它們被映射605-606到方向的有義表示。對于所選變換指示符和預(yù)測變換指示符可以使用不同的映射605-606。確定610兩個(gè)方向之差作為變換指示符差值612。因?yàn)轭A(yù)測是所選變換方向的合理近似,所以小的角度差應(yīng)該導(dǎo)致可有效編碼的類似碼字。該差被二值化620成碼字603,該碼字603被CABAC 190熵編碼為編碼變換索引16。應(yīng)當(dāng)理解,可以使用任何上下文自適應(yīng)熵編碼器以及可變長度編碼(VLC)。如下所述,可以繞過611該差值計(jì)算。圖7示意地示出了DIEM 600的第一實(shí)施方式。例如,存在8個(gè)可能的變換方向701和相應(yīng)的預(yù)測702。由所選變換指示符145選擇變換方向,并且由PTI 501選擇預(yù)測。變換指示符被映射到格雷(Gray)碼,在格雷碼中,相鄰的方向只差一比特。通過異或(X0R)610運(yùn)算對所選方向和預(yù)測方向的碼字進(jìn)行逐位比較,以取得差值611。對于精確的預(yù)測器,這樣會(huì)生成大部分為零的比特流以得到低的熵。因?yàn)橹甘痉成?05-606使用二進(jìn)制表示,因此不使用二值化620。圖8示出了 DIEM的第二實(shí)施方式。在該實(shí)施方式中,通過均勻連續(xù)的序號表示方向。差值610為A = (Is-Ip+N) modN其中,Is和Ip分別是所選方向指示符和預(yù)測方向指示符的映射索引,N是可能方向的數(shù)量,例如是8。因?yàn)楦赡苁切〉牟钪担远祷?20采用很少的比特對接近于零(0,l,N-l,2,N-2,...)的差值進(jìn)行編碼??梢岳@過611差值計(jì)算并且把映射后的變換指示符別直接傳送到二值化模塊620。在這種情況下,上下文生成模塊900使用預(yù)測編碼指示符來選擇適當(dāng)?shù)纳舷挛?。上下文生成模塊圖9-圖10示出了 CGM 900的實(shí)施方式。CGM選擇CABAC 190的上下文921-922。還可以選擇兩個(gè)以上的上下文。為了確定上下文,CGM可以使用優(yōu)選處理塊信息160、PTI501以及優(yōu)選方向431。上下文A和B區(qū)分準(zhǔn)確的預(yù)測方向和不準(zhǔn)確的預(yù)測。圖9示出了如何使用優(yōu)選方向431來確定上下文。確定910最大差值9并且將其與預(yù)定閾值T相比較。如果差值小于閾值,則在上下文A 921中的預(yù)測是準(zhǔn)確的,否則上下文B 922是不準(zhǔn)確的。例如,如果使用DIEM,則送至CABAC的比特大部分為0,選擇上下文A以符合這種可能性。CGM 900的上下文選擇還可以考慮其它因素,諸如比特位置,以在兩個(gè)以上的上下文當(dāng)中進(jìn)行判斷。圖10所示的實(shí)施方式假設(shè)DIEM繞過611差值計(jì)算610。輸入預(yù)測變換指示符501和位置索引ilOOl,位置索引ilOOl表示將要對索引603中的哪個(gè)比特進(jìn)行編碼。采用在DIEM中使用的同一指示符映射605將PTI 501映射1010成二進(jìn)制碼字。因?yàn)榇a字都應(yīng)該是相同的,所以CABAC的最可能比特應(yīng)該與1030的當(dāng)前比特CW[i]相同。因而,如果比較1030指示當(dāng)前比特為1,則選擇優(yōu)選I的上下文A 921,否則選擇0為優(yōu)選比特的上下文B922。主有向變換和次有向變換圖11示出了根據(jù)本發(fā)明的實(shí)施方式的有向變換。應(yīng)當(dāng)理解,在解碼中,變換為逆 變換。對MXN像素塊1100進(jìn)行變換(或逆變換)。為了進(jìn)行變換,與像素相關(guān)的值1101可以是強(qiáng)度或變換系數(shù),這取決于編碼或解碼的階段。變換包括ID變換(TojT1,.. ,Tn_J集1102,其中N為施加于塊的ID變換的總數(shù)。變換Ti的長度Ii表示ID變換所作用于的像素?cái)?shù)量。因而,集合中的變換ITc^T1,... ,TnJ具有對應(yīng)的長度{lo,I1,...,In-J。在塊內(nèi)沿著路徑1102對各像素施加各變換。路徑通常包括連續(xù)的或相鄰的像素的集合。然而,也可以在路徑中包括非連續(xù)的像素。如圖IIB所示,如果路徑上的像素的值是系數(shù),則各路徑的第一系數(shù)是DC系數(shù),之后是AC系數(shù)。所有的第一系數(shù)1150匯集在次變換系數(shù)(STC)集1170中。該集中的第一次系數(shù)是次DC (SDC)系數(shù)。在解碼中,可以將次有向變換26施加于次變換系數(shù)集,以重建各路徑的DC系數(shù)。在編碼中,在形成次變換系數(shù)集1170之后丟棄各路徑的第一或DC系數(shù)。相對于垂直方向1103,各路徑朝向由有向變換索引確定的變換角0 1105。如上所述,在編碼中確定的變換索引是待解碼比特流的一部分。特定塊和變換的路徑通常朝向同一方向。生成路徑的方式如下。針對塊指定變換長度的最小路徑Lmin1110。變換路徑通常起始于位于塊1100的邊緣(或角部)處的起始像素1120。如上所述,如果像素的值為系數(shù),則起始像素的值為DC系數(shù)。路徑沿著角度0繼續(xù),直至另一個(gè)邊緣處的結(jié)束像素1121。像素中的路徑長度為m。如果起始像素位于邊緣或角部處,則該長度為m = I。如果m ^ Lfflin,則認(rèn)為路徑完整。如果塊仍然包含不在路徑上的任何像素,則開始新的路徑。新的路徑可以起始于塊中任何未變換的像素。通常,新的路徑起始于前一路徑的起點(diǎn)鄰接或附近的像素,或者,路徑可以起始于塊的對角,使得塊內(nèi)的路徑長度的分布基本上對稱。處理繼續(xù)步驟2,直到全部像素被變換為止。如果m< Lmin,則路徑太短,將與先前處理的像素相鄰的像素包括進(jìn)來而繼續(xù)處理。如果有一個(gè)以上的相鄰像素,則使用塊內(nèi)的其它路徑來確定當(dāng)前路徑。如果未處理的像素是可用的,則使該像素成為路徑的一部分,并且使路徑長度m遞增,并且在方向(180-0)上繼續(xù)進(jìn)行步驟2,直至到達(dá)塊的邊緣。因此,在繼續(xù)步驟2之前,把方向0設(shè)置為(180-0 ),實(shí)際上是掉頭。圖12A-圖12C分別示出了 Lmin = 3且角度為45度、30度以及90度的有向變換。圖12D-圖12F示出了 Lmin = 5的有向變換。當(dāng)路徑在塊的內(nèi)部而不是在塊的邊緣結(jié)束時(shí)可以有其它的實(shí)施方式。除了使用逆變換系數(shù)之外,逆變換26沿著與上述相同的路徑工作。例如,如果針對各路徑使用ID DCT,則逆變換將使用ID逆DCT (IDCT)。次有向變換圖IlB示出了次有向變換26。在施加了主有向變換之后,可以沿著包含初始系數(shù)的路徑將次變換自適應(yīng)地施加于各塊,其中初始系數(shù)來自初始變換的各路徑。這些系數(shù)通常對應(yīng)于DCT等ID變換的DC系數(shù)。 除了使用逆次變換系數(shù)之外,逆次變換沿著與上述相同的路徑工作。在解碼中,在逆有向變換之前執(zhí)行逆次有向變換。次變換進(jìn)一步減少了有向變換系數(shù)的DC分量中的冗余?;蛘?,可以使用一個(gè)有向變換的DC分量預(yù)測另一有向變換的DC分量。分割有向變換圖13示出了分割有向變換。大致沿著相對于垂直線成分割角^的線1310將MXN(8X8)像素塊1300分割為兩個(gè)塊分區(qū)A和B。分割角垂直于變換角0 1105。然后,按照塊分區(qū)A具有朝向角度eA的路徑的集合,并且分割B具有朝向角度eB的路徑的集合的約束,使用上述步驟生成有向變換。認(rèn)為有向變換0的主角度與eA相同。由于在分區(qū)內(nèi)生成路徑,因此線1310接近于分區(qū)的邊緣。因而,有向變換中的各像素在分割A(yù)或B中。角度04和0B可以是不同的。在本發(fā)明的一個(gè)實(shí)施方式中,次有向變換被施加于兩個(gè)分區(qū)B。為了使處理反轉(zhuǎn),施加次逆變換,然后將逆有向變換獨(dú)立地施加于分區(qū)A和B。在本發(fā)明的另一個(gè)實(shí)施方式中,將次變換獨(dú)立地施加于各分區(qū)。也就是說,要么可以在逆主變換之前施加兩個(gè)逆次變換,要么可以將逆次變換和逆主變換獨(dú)立地施加于分區(qū)??梢灾饓K自適應(yīng)地做出這種判決??s放和量化順序在完成主變換和次變換之后,對所得到的系數(shù)進(jìn)行縮放、排序和量化。變換系數(shù)的縮放取決于各ID有向變換的路徑的長度m,或者系數(shù)在塊內(nèi)的位置。長度m的ID變換具有縮放因數(shù)Sm。因而,可以按Sm對長度為m的路徑中的全部系數(shù)進(jìn)行縮放。通常,在對相同的像素值進(jìn)行變換時(shí),把縮放因數(shù)選擇為DC系數(shù)的大小相同。如果長度為m = 4的變換對值分別為V的四個(gè)像素進(jìn)行變換,并且長度為m = 5的變換對值分別為V的五個(gè)像素進(jìn)行變換,則將縮放因數(shù)Sm選擇為兩個(gè)變換輸出相同值的第一(DC)系數(shù)。還可以有其它的縮放方法。基于長度m或方向0,可以對更短的變換賦予更小或更大的縮放因數(shù)??s放還可以是變換本身的一部分,以簡化該處理的實(shí)現(xiàn)。按掃描的順序布置縮放系數(shù)。在一個(gè)實(shí)施方式中,獨(dú)立地按順序?qū)ψ儞Q集ITtl, Ti,...,VJ進(jìn)行掃描。在各變換中,首先對第一 DC系數(shù)進(jìn)行掃描,之后按照與該變換的路徑相同的順序?qū)﹄S后的AC系數(shù)進(jìn)行掃描。在另一個(gè)實(shí)施方式中,對來自各變換的全部第一 DC系數(shù)進(jìn)行掃描,之后是來自各變換的全部第二系數(shù),等等,直到最后一個(gè)變換。在第二實(shí)施方式中,對變換進(jìn)行掃描的順序可以變化。例如,可以按照它們的索引的順序?qū)@些變換進(jìn)行掃描,即,第一掃描按照{(diào)0,1,. . .,N-1}的順序使用來自變換集ITtl, T1, , VJ的DC系數(shù)。或者,可以按照變換的長度{lo,I1, ...,In-J的順序?qū)@些變換進(jìn)行掃描。可以基于系數(shù)在塊內(nèi)的相對位置對這些系數(shù)進(jìn)行掃描。例如,可以首先對沿著塊的邊緣的全部系數(shù)進(jìn)行掃描,之后是從邊緣錯(cuò)開的系數(shù)。
盡管已經(jīng)通過優(yōu)選實(shí)施方式的示例說明了本發(fā)明,但是要理解的是,在本發(fā)明的精神和范圍內(nèi),可以進(jìn)行各種其它調(diào)整和變動(dòng)。因此,所附權(quán)利要求旨在涵蓋落入本發(fā)明的真正精神和范圍內(nèi)的所有這樣的變化和變動(dòng)。
權(quán)利要求
1.一種對比特流進(jìn)行解碼的方法,其中所述比特流對應(yīng)于編碼視頻,所述編碼視頻包括幀序列,各個(gè)幀被劃分為編碼塊,該方法針對每個(gè)編碼塊包括如下步驟 確定步驟,確定所述塊中的路徑集,其中各路徑處于根據(jù)所述比特流中的變換索引確定的變換角; 取得步驟,從所述比特流取得變換系數(shù),其中所述變換系數(shù)對于各個(gè)路徑包括一個(gè)DC系數(shù);以及 施加步驟,在各路徑上對所述變換系數(shù)施加主逆變換以生成解碼視頻, 其中在解碼器中執(zhí)行所述確定步驟、取得步驟和施加步驟。
2.根據(jù)權(quán)利要求I所述的方法,其中各路徑具有第一系數(shù)以形成第一系數(shù)集,并且所述取得步驟還包括 對所述第一系數(shù)集施加次逆變換以得到各路徑的所述DC系數(shù)。
3.根據(jù)權(quán)利要求I所述的方法,其中各路徑具有第一系數(shù)以形成第一系數(shù)集,并且所述取得步驟還包括 根據(jù)所述第一系數(shù)集預(yù)測各路徑的DC分量。
4.根據(jù)權(quán)利要求I所述的方法,還包括 將長度與各路徑關(guān)聯(lián)起來。
5.根據(jù)權(quán)利要求4所述的方法,其中所述長度是不同的。
6.根據(jù)權(quán)利要求I所述的方法,其中所述主逆變換基于逆離散余弦變換。
7.根據(jù)權(quán)利要求I所述的方法,還包括 按照分割角將所述塊分割為一組分區(qū)。
8.根據(jù)權(quán)利要求7所述的方法,其中所述分割角垂直于所述變換角。
9.根據(jù)權(quán)利要求I所述的方法,其中所述塊包括宏塊、子塊、塊分區(qū)或像素陣列。
10.根據(jù)權(quán)利要求I所述的方法,還包括 根據(jù)量化參數(shù)對所述變換系數(shù)進(jìn)行逆量化;以及 根據(jù)所述變換系數(shù)在所述塊中的位置對所述變換系數(shù)進(jìn)行縮放。
11.根據(jù)權(quán)利要求4所述的方法,還包括 根據(jù)量化參數(shù)對所述變換系數(shù)進(jìn)行逆量化;以及 根據(jù)所述長度對所述變換系數(shù)進(jìn)行縮放。
12.根據(jù)權(quán)利要求I所述的方法,其中系數(shù)的掃描順序取決于系數(shù)的量化順序。
13.根據(jù)權(quán)利要求I所述的方法,其中獨(dú)立地執(zhí)行各逆變換的掃描順序。
全文摘要
比特流包括幀序列。各幀被劃分為編碼塊。針對各個(gè)塊,在根據(jù)比特流中的變換索引確定的變換角處確定路徑集。從比特流中取得變換系數(shù)。變換系數(shù)包括各路徑的一個(gè)DC系數(shù)。對變換系數(shù)進(jìn)行逆變換以生成解碼視頻。
文檔編號H04N7/26GK102763410SQ201080047570
公開日2012年10月31日 申請日期2010年9月16日 優(yōu)先權(quán)日2009年10月21日
發(fā)明者R·A·科恩, 孫惠方, 安東尼·韋特羅 申請人:三菱電機(jī)株式會(huì)社