用于幀內(nèi)預(yù)測(cè)譯碼的最大概率變換的制作方法
【專(zhuān)利摘要】一種視頻譯碼器可經(jīng)配置以:確定視頻數(shù)據(jù)塊的幀內(nèi)譯碼模式;基于針對(duì)所述視頻數(shù)據(jù)塊而確定的所述幀內(nèi)預(yù)測(cè)模式來(lái)識(shí)別最大概率變換;以及對(duì)所述最大概率變換是否為用于對(duì)所述視頻數(shù)據(jù)塊進(jìn)行編碼的變換的指示進(jìn)行譯碼。所述最大概率變換可為非正方形變換。
【專(zhuān)利說(shuō)明】用于幀內(nèi)預(yù)測(cè)譯碼的最大概率變換
[0001]本申請(qǐng)案主張2011年10月11日申請(qǐng)的第61 / 545,901號(hào)美國(guó)臨時(shí)申請(qǐng)案的優(yōu)先權(quán),所述申請(qǐng)案的全部?jī)?nèi)容以引用的方式并入本文中。
【技術(shù)領(lǐng)域】
[0002]本發(fā)明涉及視頻譯碼,且更特定來(lái)說(shuō),涉及用于經(jīng)譯碼視頻數(shù)據(jù)的譯碼特性的信令。
【背景技術(shù)】
[0003]數(shù)字視頻能力可并入到廣泛范圍的裝置中,包含數(shù)字電視、數(shù)字直播系統(tǒng)、無(wú)線(xiàn)廣播系統(tǒng)、個(gè)人數(shù)字助理(PDA)、膝上型或桌上型計(jì)算機(jī)、數(shù)碼相機(jī)、數(shù)字記錄裝置、數(shù)字媒體播放器、視頻游戲裝置、視頻游戲控制臺(tái)、蜂窩式或衛(wèi)星無(wú)線(xiàn)電電話(huà)、視頻會(huì)議裝置等等。數(shù)字視頻裝置實(shí)施視頻壓縮技術(shù),例如由MPEG-2、MPEG-4、ITU-T H.263或ITU-T H.264 /MPEG-4第10部分高級(jí)視頻譯碼(AVC)定義的標(biāo)準(zhǔn)和所述標(biāo)準(zhǔn)的擴(kuò)展部分中所描述的那些視頻壓縮技術(shù),以更有效地發(fā)射和接收數(shù)字視頻信息。
[0004]視頻壓縮技術(shù)執(zhí)行空間預(yù)測(cè)和/或時(shí)間預(yù)測(cè)以減少或移除視頻序列中所固有的冗余。對(duì)于基于塊的視頻譯碼,可將一視頻幀或切片分割成若干視頻塊??蛇M(jìn)一步分割每一視頻塊。使用關(guān)于相鄰視頻塊的空間預(yù)測(cè)來(lái)編碼經(jīng)幀內(nèi)譯碼的(I)幀或切片中的視頻塊。經(jīng)幀間譯碼的(P或B)幀或切片中的視頻塊可使用關(guān)于同一幀或切片中的相鄰宏塊或譯碼單元的空間預(yù)測(cè)或關(guān)于其它參考幀的時(shí)間預(yù)測(cè)。
【發(fā)明內(nèi)容】
[0005]本發(fā)明描述用于在經(jīng)編碼視頻位流中用信號(hào)通知視頻數(shù)據(jù)塊的選定變換大小的技術(shù)。根據(jù)本發(fā)明的技術(shù),可基于所述塊的幀內(nèi)預(yù)測(cè)模式來(lái)確定最大概率變換。所述最大概率變換可為正方形變換或非正方形變換。第一語(yǔ)法元素可用信號(hào)通知所述所確定的最大概率變換是否為用于對(duì)所述變換塊進(jìn)行譯碼的實(shí)際變換大小。如果所述實(shí)際變換是所述最大概率變換,那么在所述經(jīng)編碼位流中不需要用信號(hào)通知其它語(yǔ)法元素。如果所述實(shí)際變換不是所述最大概率變換,那么額外的語(yǔ)法元素可用信號(hào)通知哪一變換(除了所述最大概率變換之外)是用于對(duì)所述塊進(jìn)行譯碼的所述實(shí)際變換。
[0006]在一個(gè)實(shí)例中,一種對(duì)視頻數(shù)據(jù)進(jìn)行譯碼的方法包含:確定視頻數(shù)據(jù)塊的幀內(nèi)譯碼模式;基于針對(duì)所述視頻數(shù)據(jù)塊而確定的所述幀內(nèi)預(yù)測(cè)模式來(lái)識(shí)別最大概率變換,其中所述最大概率變換是非正方形變換;以及對(duì)所述最大概率變換是否為用于對(duì)所述視頻數(shù)據(jù)塊進(jìn)行編碼的變換的指示進(jìn)行譯碼。
[0007]在另一實(shí)例中,一種視頻譯碼裝置包含視頻譯碼器,所述視頻譯碼器經(jīng)配置以:確定視頻數(shù)據(jù)塊的幀內(nèi)譯碼模式;基于針對(duì)所述視頻數(shù)據(jù)塊而確定的所述幀內(nèi)預(yù)測(cè)模式來(lái)識(shí)別最大概率變換,其中所述最大概率變換是非正方形變換;以及對(duì)所述最大概率變換是否為用于對(duì)所述視頻數(shù)據(jù)塊進(jìn)行編碼的變換的指示進(jìn)行譯碼。[0008]在另一實(shí)例中,一種用于視頻譯碼的裝置包含:用于確定視頻數(shù)據(jù)塊的幀內(nèi)譯碼模式的裝置;用于基于針對(duì)所述視頻數(shù)據(jù)塊而確定的所述幀內(nèi)預(yù)測(cè)模式來(lái)識(shí)別最大概率變換的裝置,其中所述最大概率變換是非正方形變換;以及用于對(duì)所述最大概率變換是否為用于對(duì)所述視頻數(shù)據(jù)塊進(jìn)行編碼的變換的指示進(jìn)行譯碼的裝置。
[0009]在另一實(shí)例中,一種計(jì)算機(jī)可讀存儲(chǔ)媒體存儲(chǔ)指令,所述指令可操作以致使一個(gè)或一個(gè)以上處理器:確定視頻數(shù)據(jù)塊的幀內(nèi)譯碼模式;基于針對(duì)所述視頻數(shù)據(jù)塊而確定的所述幀內(nèi)預(yù)測(cè)模式來(lái)識(shí)別最大概率變換,其中所述最大概率變換是非正方形變換;以及對(duì)所述最大概率變換是否為用于對(duì)所述視頻數(shù)據(jù)塊進(jìn)行編碼的變換的指示進(jìn)行譯碼。
[0010]一個(gè)或一個(gè)以上實(shí)例的細(xì)節(jié)陳述于附圖及以下描述中。其它特征、目標(biāo)及優(yōu)勢(shì)將從描述及附圖和從權(quán)利要求書(shū)中顯而易見(jiàn)。
【專(zhuān)利附圖】
【附圖說(shuō)明】
[0011]圖1為說(shuō)明可利用本發(fā)明中所描述的技術(shù)的實(shí)例性視頻編碼及解碼系統(tǒng)的框圖。
[0012]圖2A和2B是說(shuō)明應(yīng)用于最大譯碼單元(LCU)的四叉樹(shù)分割的實(shí)例的概念圖。
[0013]圖3是說(shuō)明四叉樹(shù)分割的實(shí)例的概念圖。
[0014]圖4A和4B是四叉樹(shù)變換單元分區(qū)的概念圖。
[0015]圖5A和5B是非正方形變換單元分區(qū)的概念圖。
[0016]圖6是說(shuō)明可實(shí)施本發(fā)明中所描述的技術(shù)的視頻編碼器的實(shí)例的框圖。
[0017]圖7展示幀內(nèi)預(yù)測(cè)模式和方向的實(shí)例。
[0018]圖8是說(shuō)明對(duì)經(jīng)編碼視頻序列進(jìn)行解碼的視頻解碼器的實(shí)例的框圖。
[0019]圖9是說(shuō)明根據(jù)本發(fā)明的技術(shù)的用于用信號(hào)通知變換的實(shí)例性方法的流程圖。
【具體實(shí)施方式】
[0020]視頻譯碼器通過(guò)利用空間和時(shí)間冗余來(lái)壓縮視頻數(shù)據(jù)。舉例來(lái)說(shuō),視頻譯碼器可通過(guò)相對(duì)于同一圖片的先前經(jīng)譯碼相鄰塊來(lái)預(yù)測(cè)當(dāng)前塊而利用空間冗余。相對(duì)于同一圖片的先前經(jīng)譯碼相鄰塊來(lái)預(yù)測(cè)當(dāng)前塊有時(shí)被稱(chēng)作幀內(nèi)預(yù)測(cè)或幀內(nèi)模式。同樣,視頻譯碼器可通過(guò)相對(duì)于先前經(jīng)譯碼圖片的數(shù)據(jù)來(lái)預(yù)測(cè)當(dāng)前塊而利用時(shí)間冗余。相對(duì)于先前經(jīng)譯碼幀的塊來(lái)預(yù)測(cè)當(dāng)前塊有時(shí)被稱(chēng)作幀間預(yù)測(cè)或幀間模式。在幀內(nèi)預(yù)測(cè)和幀間預(yù)測(cè)兩者中,視頻譯碼器從已被譯碼的塊來(lái)預(yù)測(cè)當(dāng)前塊,且隨后計(jì)算所述塊的殘余數(shù)據(jù)以作為所述塊的實(shí)際值與所述塊的所預(yù)測(cè)值之間的差。
[0021]如將在下文更詳細(xì)地闡釋?zhuān)勺儞Q、掃描并量化一組殘余值以界定一組變換系數(shù)。包含變換系數(shù)的數(shù)據(jù)結(jié)構(gòu)通常被稱(chēng)作變換單元(TU)。各種形狀和大小的TU可用于傳輸并重構(gòu)經(jīng)編碼視頻數(shù)據(jù)。本發(fā)明描述用于經(jīng)編碼視頻位流中用信號(hào)通知將用于特定視頻數(shù)據(jù)塊的TU的大小的技術(shù)。更特定來(lái)說(shuō),本發(fā)明描述用于利用幀內(nèi)預(yù)測(cè)模式與變換大小之間的關(guān)系的技術(shù),其可減少與用信號(hào)通知變換大小相關(guān)聯(lián)的位開(kāi)銷(xiāo)。
[0022]如將在下文更詳細(xì)地闡釋?zhuān)屡d的HEVC標(biāo)準(zhǔn)允許視頻塊的四叉樹(shù)型TU分區(qū)結(jié)構(gòu)。通過(guò)使用四叉樹(shù)分解,可將較大的正方形塊分裂為四個(gè)較小的正方形塊。四個(gè)較小的正方形塊中的每一者還可各自被分裂為四個(gè)更小的塊,且以此類(lèi)推,直到達(dá)到最小的塊大小為止。在層級(jí)I分解下,整個(gè)變換塊被分裂為四個(gè)四分之一大小的塊。在層級(jí)2處,四個(gè)四分之一大小的變換塊中的一者或一者以上被進(jìn)一步分裂為四個(gè)I / 16大小的變換塊。在層級(jí)3處,I / 16大小的變換塊中的一者或一者以上被進(jìn)一步分裂為四個(gè)更小的變換塊。舉例來(lái)說(shuō),可基于作為對(duì)視頻數(shù)據(jù)進(jìn)行編碼的部分而確定的速率-失真優(yōu)化計(jì)算來(lái)確定變換塊是否需要進(jìn)行進(jìn)一步分裂。層級(jí)O處的TU意味著整個(gè)譯碼單元一起被變換而不需要進(jìn)一步分裂。在此情況下,TU具有與譯碼單元相同的大小。
[0023]已提出使用非正方形變換來(lái)用于經(jīng)幀內(nèi)預(yù)測(cè)塊。在此些例子中,TU可具有矩形形狀。假設(shè)2NX2N表示正方形變換。非正方形變換可因此表示為hNX2N及2NXhN,其中hN表示N的值的一半,且2N表示N的值的兩倍。因此,2NX2N TU可被分裂為四個(gè)垂直變換(即,四個(gè)hNX2N變換)或四個(gè)水平變換(即,四個(gè)2NXhN變換)。在當(dāng)前技術(shù)的一個(gè)實(shí)例中,視頻編碼器可首先在經(jīng)編碼位流中用信號(hào)通知旗標(biāo)(NS_Flag),以向視頻解碼器用信號(hào)通知是否使用正方形變換(即,NXN),其中,例如,設(shè)定為O的NS_Flag用信號(hào)通知選擇了變換NX N,且設(shè)定為I的NS_Flag用信號(hào)通知選擇了兩個(gè)非正方形變換(hNX 2N及2NXhN)中的一者。在其中選擇了兩個(gè)非正方形變換中的一者的情況下(即,NS_Flag=l),可需要傳輸額外的旗標(biāo)(NS_Dir),其中,例如設(shè)定為O的NS_Dir指示選擇了變換大小hNX2N,且設(shè)定為I的NS_Dir指示選擇了變換大小2NXhN。
[0024]根據(jù)上文所描述的信令方法,當(dāng)選擇NXN變換時(shí)使用一個(gè)旗標(biāo),而當(dāng)選擇了非正方形變換hN X 2N或2N X hN時(shí)使用兩個(gè)旗標(biāo)。當(dāng)N X N是最大概率變換時(shí),此信令技術(shù)可產(chǎn)生位節(jié)省,這是因?yàn)槭褂米钌俚男帕钗?在此實(shí)例中的I個(gè)旗標(biāo))來(lái)用于NXN變換。然而,在一些例子中,最可能的變換可為與NXN變換相對(duì)的非正方形變換。舉例來(lái)說(shuō),用于特定視頻數(shù)據(jù)塊的最可能的變換是正方形變換還是非正方形變換可取決于用于對(duì)塊進(jìn)行譯碼的幀內(nèi)預(yù)測(cè)模式。根據(jù)本發(fā)明的技術(shù),當(dāng)用于塊的最大概率變換大小是非正方形變換時(shí),視頻編碼器可在經(jīng)編碼位流中用信號(hào)通知指示所述最大概率變換是否為用于對(duì)所述塊進(jìn)行譯碼的實(shí)際變換的旗標(biāo)。因此,當(dāng)非正方形變換是最大概率變換時(shí),可通過(guò)使用一個(gè)旗標(biāo)來(lái)用于用信號(hào)通知非正方形變換來(lái)實(shí)現(xiàn)位節(jié)省,這與上文所描述的兩個(gè)旗標(biāo)相對(duì)。因此,在一些例子中,本發(fā)明的技術(shù)通過(guò)使用最少的信令位來(lái)用于最大概率變換而改進(jìn)變換信令方法。
[0025]在一個(gè)實(shí)例中,視頻編碼器可首先選擇用于譯碼單元的幀內(nèi)預(yù)測(cè)模式,且隨后如上文所描述選擇變換。每一幀內(nèi)預(yù)測(cè)模式k可具有相關(guān)聯(lián)的最大概率變換(MPT),其可為(例如)NXN、hNX2N或2NXhN中的一者。視頻編碼器可產(chǎn)生旗標(biāo)(MPT_Flag)以供包含在經(jīng)編碼位流中以用信號(hào)通知選定變換是否為用于當(dāng)前幀內(nèi)預(yù)測(cè)模式k的MPT (k)。舉例來(lái)說(shuō),設(shè)定為I的MPT_Flag意味著選定變換是MPT (k),而設(shè)定為O的MPT_Flag可意味著選定變換不是MPT (k)。在其中MPT_Flag被設(shè)定為O的例子中,可傳輸額外旗標(biāo)(MPT_ReSMode)來(lái)用信號(hào)通知選擇了另外兩個(gè)變換中的哪一者。
[0026]作為一實(shí)例,假設(shè)用于當(dāng)前預(yù)測(cè)塊的幀內(nèi)預(yù)測(cè)模式是模式1,且hNX2N是與此幀內(nèi)預(yù)測(cè)模式相關(guān)聯(lián)的MPT,即,hNX2N=MPT(l)。如果選定的幀內(nèi)預(yù)測(cè)模式是hNX 2N,那么可在經(jīng)編碼位流中用信號(hào)通知設(shè)定為I的MPT_Flag,而不需要任何其它額外位來(lái)用信號(hào)通知變換。如果選定的幀內(nèi)預(yù)測(cè)模式是NXN,那么用信號(hào)通知設(shè)定為O的MPT_Flag,隨后是設(shè)定為O的MPT_ReSMode。如果選定的幀內(nèi)預(yù)測(cè)模式是2NXhN,那么用信號(hào)通知設(shè)定為O的MPT_Flag,隨后是設(shè)定為 I 的 MPT_ResMode。[0027]在一些例子中,用于幀內(nèi)預(yù)測(cè)模式的最大概率變換MPT(k)可預(yù)先界定,且對(duì)于視頻編碼器和視頻解碼器兩者是已知的。在其它例子中,用于幀內(nèi)預(yù)測(cè)模式的最大概率變換MPT(k)可由視頻編碼器確定,且在經(jīng)編碼位流中使用高層級(jí)語(yǔ)法用信號(hào)通知,所述高層級(jí)語(yǔ)法例如為序列參數(shù)集(SPS)、圖片參數(shù)集(PPS)、調(diào)適參數(shù)集(APS)等。在又其它例子中,MPT與幀內(nèi)預(yù)測(cè)模式k之間的映射MPT(k)可為塊大小自適應(yīng)的,其中對(duì)于不同的塊大小,MPT(k)可不同,甚至在幀內(nèi)預(yù)測(cè)模式相同時(shí)也如此。類(lèi)似地,MPT(k)還可基于其它信息(例如,QP、幀間預(yù)測(cè)方向、塊類(lèi)型等)而為自適應(yīng)的。
[0028]在一些例子中,用于幀內(nèi)預(yù)測(cè)模式的最大概率變換MPT(k)可基于大量已被編碼的塊的選定變換。。舉例來(lái)說(shuō),如果對(duì)于當(dāng)前幀中已被編碼的具有相同幀內(nèi)預(yù)測(cè)模式k的所有塊,變換NX N是最頻繁出現(xiàn)的變換,那么可將MPT (k)設(shè)定為NX N變換以用于對(duì)當(dāng)前塊進(jìn)行編碼。在此實(shí)例中,可通過(guò)視頻編碼器和視頻解碼器兩者來(lái)跟蹤此類(lèi)變換出現(xiàn)的頻率,使得可在視頻編碼器和視頻解碼器兩者處動(dòng)態(tài)地調(diào)整最大概率變換到幀內(nèi)預(yù)測(cè)模式的映射,而不在經(jīng)編碼位流中顯式地用信號(hào)通知所述映射。
[0029]圖1為說(shuō)明可利用如本發(fā)明中所描述的用于用信號(hào)通知變換大小的技術(shù)的實(shí)例性視頻編碼及解碼系統(tǒng)10的框圖。如圖1中所示,系統(tǒng)10包含源裝置12,所述源裝置經(jīng)由通信信道16將經(jīng)編碼視頻發(fā)射到目的地裝置14。源裝置12及目的地裝置14可包括廣泛范圍的裝置中的任一者。在一些情況下,源裝置12和目的地裝置14可包括無(wú)線(xiàn)通信裝置,例如無(wú)線(xiàn)手持機(jī)、所謂的蜂窩式或衛(wèi)星無(wú)線(xiàn)電電話(huà),或可在通信信道16上(在此情況下,通信信道16為無(wú)線(xiàn)的)傳送視頻信息的任何無(wú)線(xiàn)裝置。
[0030]然而,涉及對(duì)表示視頻數(shù)據(jù)塊的變換大小的語(yǔ)法數(shù)據(jù)進(jìn)行譯碼的本發(fā)明的技術(shù)不一定受限于無(wú)線(xiàn)應(yīng)用或環(huán)境。舉例來(lái)說(shuō),這些技術(shù)可適用于空中電視廣播、有線(xiàn)電視發(fā)射、衛(wèi)星電視發(fā)射、因特網(wǎng)視頻發(fā)射、經(jīng)編碼到存儲(chǔ)媒體上的經(jīng)編碼的數(shù)字視頻,或其它情況。因此,通信信道16可包括適合于發(fā)射經(jīng)編碼視頻數(shù)據(jù)的無(wú)線(xiàn)媒體或有線(xiàn)媒體的任何組合。另外,通信信道16既定表示其中視頻編碼裝置可能將數(shù)據(jù)發(fā)射到視頻解碼裝置的許多方式中的僅一種方式。舉例來(lái)說(shuō),在系統(tǒng)10的其它配置中,源裝置12可能產(chǎn)生經(jīng)編碼視頻以供目的地裝置14解碼且將經(jīng)編碼視頻存儲(chǔ)在存儲(chǔ)媒體或文件服務(wù)器上,使得目的地裝置14可在需要時(shí)存取所述經(jīng)編碼視頻。
[0031]在圖1的實(shí)例中,源裝置12包含視頻源18、視頻編碼器20、調(diào)制器/解調(diào)器(調(diào)制解調(diào)器)22和發(fā)射器24。目的地裝置14包含接收器26、調(diào)制解調(diào)器28、視頻解碼器30,和顯示裝置32。根據(jù)本發(fā)明,源裝置12的視頻編碼器20可經(jīng)配置以應(yīng)用用于對(duì)表示視頻數(shù)據(jù)塊的幀內(nèi)預(yù)測(cè)模式的語(yǔ)法數(shù)據(jù)進(jìn)行譯碼的技術(shù)。在其它實(shí)例中,源裝置和目的地裝置可包含其它組件或布置。舉例來(lái)說(shuō),源裝置12可從外部視頻源18 (例如,外部相機(jī))接收視頻數(shù)據(jù)。同樣,目的地裝置14可與外部顯示裝置介接,而不是包含集成式顯示裝置。
[0032]圖1的所說(shuō)明的系統(tǒng)10僅為一個(gè)實(shí)例。用于對(duì)表示視頻數(shù)據(jù)塊的選定變換的語(yǔ)法數(shù)據(jù)進(jìn)行譯碼的技術(shù)可由任何數(shù)字視頻編碼和/或解碼裝置來(lái)執(zhí)行。盡管一般來(lái)說(shuō),本發(fā)明的技術(shù)是由視頻譯碼裝置來(lái)執(zhí)行,但所述技術(shù)還可由視頻編碼器/解碼器(通常被稱(chēng)作“CODEC”)來(lái)執(zhí)行。另外,本發(fā)明的技術(shù)還可由視頻預(yù)處理器來(lái)執(zhí)行。源裝置12及目的地裝置14僅為此些譯碼裝置的實(shí)例,其中源裝置12產(chǎn)生用于發(fā)射到目的地裝置14的經(jīng)譯碼視頻數(shù)據(jù)。在一些實(shí)例中,裝置12、14可以大體上對(duì)稱(chēng)的方式操作以使得裝置12、14中的每一者包含視頻編碼和解碼組件。因此,系統(tǒng)10可支持視頻裝置12、14之間的單向或雙向視頻發(fā)射,例如用于視頻流式傳輸、視頻回放、視頻廣播或視頻電話(huà)。
[0033]源裝置12的視頻源18可包含視頻俘獲裝置,例如攝像機(jī)、含有先前所俘獲的視頻的視頻檔案,和/或來(lái)自視頻內(nèi)容提供者的視頻饋送。作為另一替代方案,視頻源18可產(chǎn)生基于計(jì)算機(jī)圖形的數(shù)據(jù)作為源視頻,或直播視頻、存檔視頻與計(jì)算機(jī)產(chǎn)生的視頻的組合。在一些情況下,如果視頻源18為視頻相機(jī),那么源裝置12及目的地裝置14可形成所謂的相機(jī)電話(huà)或視頻電話(huà)。然而,如上文所提及,一般來(lái)說(shuō),本發(fā)明中所描述的技術(shù)可適用于視頻譯碼,且可適用于無(wú)線(xiàn)及/或有線(xiàn)應(yīng)用。在每一情況下,可由視頻編碼器20來(lái)編碼經(jīng)俘獲的、經(jīng)預(yù)先俘獲的或計(jì)算機(jī)產(chǎn)生的視頻。經(jīng)編碼的視頻信息可接著由調(diào)制解調(diào)器22根據(jù)通信標(biāo)準(zhǔn)來(lái)調(diào)制,且經(jīng)由發(fā)射器24而發(fā)射到目的地裝置14。調(diào)制解調(diào)器22可包含各種混頻器、濾波器、放大器或經(jīng)設(shè)計(jì)以用于信號(hào)調(diào)制的其它組件。發(fā)射器24可包含經(jīng)設(shè)計(jì)以用于發(fā)射數(shù)據(jù)的電路,包括放大器、濾波器及一個(gè)或一個(gè)以上天線(xiàn)。
[0034]目的地裝置14的接收器26經(jīng)由信道16接收信息,且調(diào)制解調(diào)器28解調(diào)所述信息。再次地,視頻編碼過(guò)程可實(shí)施本文中所描述的用以對(duì)表示視頻數(shù)據(jù)塊的幀內(nèi)預(yù)測(cè)模式的語(yǔ)法數(shù)據(jù)進(jìn)行譯碼的技術(shù)中的一者或一者以上。經(jīng)由信道16傳送的信息可包含由視頻編碼器20界定的語(yǔ)法信息,所述語(yǔ)法信息還由視頻解碼器30使用,所述語(yǔ)法信息包含描述宏塊和其它經(jīng)譯碼單元(例如,G0P)的特性和/或處理的語(yǔ)法元素。顯示裝置32向用戶(hù)顯示經(jīng)解碼的視頻數(shù)據(jù),且可包括多種顯示裝置中的任一者,例如陰極射線(xiàn)管(CRT)、液晶顯示器(LCD)、等離子體顯示器、有機(jī)發(fā)光二極管(OLED)顯示器或另一類(lèi)型的顯示裝置。
[0035]在圖1的實(shí)例中,通信信道16可包括任一無(wú)線(xiàn)或有線(xiàn)通信媒體,例如,射頻(RF)頻譜或一個(gè)或一個(gè)以上物理傳輸線(xiàn)、或無(wú)線(xiàn)和有線(xiàn)媒體的任一組合。通信信道16可形成例如局域網(wǎng)、廣域網(wǎng)或例如因特網(wǎng)的全球網(wǎng)絡(luò)的基于包的網(wǎng)絡(luò)的部分。通信信道16 —般表示用于將視頻數(shù)據(jù)從源裝置12發(fā)射到目的地裝置14的任何合適的通信媒體或不同通信媒體的集合,包含有線(xiàn)或無(wú)線(xiàn)媒體的任何合適組合。通信信道16可包含可用于促進(jìn)從源裝置12到目的地裝置14的通信的路由器、交換器、基站或任何其它設(shè)備。
[0036]視頻編碼器20和視頻解碼器30可根據(jù)例如ITU-T H.264標(biāo)準(zhǔn)(或者被稱(chēng)作MPEG4第10部分,高級(jí)視頻譯碼(AVC))的視頻壓縮標(biāo)準(zhǔn)而操作。然而,本發(fā)明的技術(shù)不限于任何特定譯碼標(biāo)準(zhǔn)。其它實(shí)例包含MPEG-2和ITU-T H.263。盡管圖1中未展示,但在一些方面中,視頻編碼器20及視頻解碼器30可各自與音頻編碼器及解碼器集成,且可包含適當(dāng)?shù)腗UX-DEMUX單元或其它硬件及軟件,以處置對(duì)共同數(shù)據(jù)流或單獨(dú)數(shù)據(jù)流中的音頻與視頻兩者的編碼。如果適用,MUX-DEMUX單元可符合ITU H.223多路復(fù)用器協(xié)議或例如用戶(hù)數(shù)據(jù)報(bào)協(xié)議(m)P)等其它協(xié)議。
[0037]ITU-T H.264 / MPEG-4 (AVC)標(biāo)準(zhǔn)由 ITU-T 視頻譯碼專(zhuān)家組(VCEG)與 ISO / IEC運(yùn)動(dòng)圖片專(zhuān)家組(MPEG) —起制定,作為被稱(chēng)為聯(lián)合視頻小組(JVT)的共同伙伴關(guān)系的產(chǎn)物。在一些方面中,本發(fā)明中所描述的技術(shù)可應(yīng)用于通常符合H.264標(biāo)準(zhǔn)的裝置。ITU-T研究組在2005年3月在ITU-T推薦H.264 “用于通用音視頻服務(wù)的高級(jí)視頻譯碼(AdvancedVideo Coding for generic audiovisual services) ”中描述了 H.264標(biāo)準(zhǔn),其在本文中可被稱(chēng)作H.264標(biāo)準(zhǔn)或H.264規(guī)范或H.264 / AVC標(biāo)準(zhǔn)或規(guī)范。聯(lián)合視頻小組(JVT)繼續(xù)致力于對(duì)H.264 / MPEG-4AVC的擴(kuò)展。[0038]視頻編碼器20和視頻解碼器30各自可經(jīng)實(shí)施為例如一個(gè)或一個(gè)以上微處理器、數(shù)字信號(hào)處理器(DSP)、專(zhuān)用集成電路(ASIC)、現(xiàn)場(chǎng)可編程門(mén)陣列(FPGA)、離散邏輯、軟件、硬件、固件或其任何組合的多種合適編碼器電路中的任一者。視頻編碼器20和視頻解碼器30中的每一者可包含于一個(gè)或一個(gè)以上編碼器或解碼器中,所述視頻編碼器和視頻解碼器中的任一者可作為組合式編碼器/解碼器(CODEC)的一部分而集成于相應(yīng)相機(jī)、計(jì)算機(jī)、移動(dòng)裝置、訂戶(hù)裝置、廣播裝置、機(jī)頂盒、服務(wù)器等中。
[0039]一視頻序列通常包含一系列視頻幀。圖片群組(GOP) —般包括一系列一個(gè)或一個(gè)以上視頻幀。GOP可在GOP的標(biāo)頭、GOP的一個(gè)或一個(gè)以上幀的標(biāo)頭或其它地方中包含語(yǔ)法數(shù)據(jù),所述語(yǔ)法數(shù)據(jù)描述包含于GOP中的幀的數(shù)目。每一幀可包含幀語(yǔ)法數(shù)據(jù),所述幀語(yǔ)法數(shù)據(jù)描述相應(yīng)幀的編碼模式。頻編碼器20通常對(duì)個(gè)別視頻幀內(nèi)的視頻塊進(jìn)行操作以便編碼視頻數(shù)據(jù)。一視頻塊可對(duì)應(yīng)于一宏塊或一宏塊的一分區(qū)。所述視頻塊可具有固定的或變化的大小,且可根據(jù)指定的譯碼標(biāo)準(zhǔn)而大小不同。每一視頻幀可包含多個(gè)切片。每一切片可包含多個(gè)宏塊,所述多個(gè)宏塊可布置成若干分區(qū),所述分區(qū)還被稱(chēng)作子塊。
[0040]作為一實(shí)例,ITU-T H.264標(biāo)準(zhǔn)支持各種塊大小(例如,針對(duì)亮度分量的16X 16、8X8或4X4,和針對(duì)色度分量的8X8)的幀內(nèi)預(yù)測(cè),以及各種塊大小(例如,針對(duì)亮度分量的16X16、16X8、8X16、8X8、8X4、4X8和4X4,和針對(duì)色度分量的對(duì)應(yīng)縮放的大小)的幀間預(yù)測(cè)。在本發(fā)明中,“NXN”與“N乘N”可以可互換地使用,以在垂直和水平尺寸方面指代塊的像素尺寸,例如16X 16像素或16乘16像素。一般來(lái)說(shuō),16X16塊將具有在垂直方向上的16個(gè)像素(y=16)和在水平方向上的16個(gè)像素(x=16)。同樣地,NXN塊一般具有在垂直方向上的N個(gè)像素和在水平方向上的N個(gè)像素,其中N表示非負(fù)整數(shù)值。一塊中的像素可布置在若干行和若干列中。此外,塊無(wú)需一定在水平方向上具有與在垂直方向上相同數(shù)目的像素。舉例來(lái)說(shuō),塊可包括NXM個(gè)像素,其中M不一定等于N。小于16X16的塊大小可被稱(chēng)作ITU-T H.264中的16 X 16宏塊的分區(qū)。
[0041]視頻塊可包含像素域中的像素?cái)?shù)據(jù)的塊,或(例如)在對(duì)表示經(jīng)譯碼的視頻塊與預(yù)測(cè)視頻塊之間的像素差異的殘余視頻塊數(shù)據(jù)應(yīng)用例如離散余弦變換(DCT)、整數(shù)變換、小波變換或概念上類(lèi)似的變換等變換之后的在變換域中的變換系數(shù)的塊。在一些情況下,視頻塊可包括變換域中的經(jīng)量化變換系數(shù)塊。
[0042]較小視頻塊可提供較好分辨率,且可用于包含高等級(jí)的細(xì)節(jié)的視頻幀的位置。一般來(lái)說(shuō),可將宏塊和有時(shí)被稱(chēng)作子塊的各種分區(qū)視為視頻塊。另外,可將切片視為多個(gè)視頻塊,例如若干宏塊和/或若干子塊。每一切片可為視頻幀的可獨(dú)立解碼單元?;蛘?,幀自身可為可解碼單元,或可將幀的其它部分定義為可解碼單元。
[0043]正在開(kāi)發(fā)新的視頻譯碼標(biāo)準(zhǔn),例如高效率視頻譯碼(HEVC)標(biāo)準(zhǔn)。新興的HEVC標(biāo)準(zhǔn)還可被稱(chēng)作H.265。標(biāo)準(zhǔn)化工作是基于被稱(chēng)作HEVC測(cè)試模型(HM)的視頻譯碼裝置模型。HM假設(shè)視頻譯碼裝置有優(yōu)于根據(jù)(例如)ITU-T H.264 / AVC的裝置的若干能力。舉例來(lái)說(shuō),H.264提供九種幀內(nèi)預(yù)測(cè)模式,而HM(例如)基于正被幀內(nèi)預(yù)測(cè)譯碼的塊的大小而提供多達(dá)三十三種幀內(nèi)預(yù)測(cè)模式。被稱(chēng)作“HEVC工作草案8(HEVC Working Draft8) ”或“WD8”的HEVC的最近的草案描述于布洛斯(Bross)等人的文獻(xiàn)JCTVC-J1003 “高效率視頻譯碼(HEVC)文本規(guī)范草案 8(High efficiency video coding (HEVC) text specificationdraft8)”,ITU-T SG16WP3 和 ISO / IEC JTCl / SC29 / WGll 的視頻譯碼聯(lián)合合作小組(JCT-VC)第10次會(huì)議:瑞典斯德哥爾摩,2012年7月11日至20日,其截止2012年10月3日為止可從
[0044]http: / / phenix.1nt-evry.fr / jet / doc_end_user / documents / 10_Stockholm / wgll / JCTVC-J1003_v8.zip 下載。
[0045]HM將視頻數(shù)據(jù)塊稱(chēng)作譯碼單元(CU)。位流內(nèi)的語(yǔ)法數(shù)據(jù)可定義最大譯碼單元(LCU),其為在像素?cái)?shù)目方面的最大譯碼單元。一般來(lái)說(shuō),CU具有與H.264的宏塊類(lèi)似的目的,只不過(guò)⑶不具有大小區(qū)別。因此,⑶可被分裂為若干子⑶。一般來(lái)說(shuō),在本發(fā)明中對(duì)⑶的參考可涉及圖片的最大譯碼單元或IXU的子⑶。IXU可被分裂成若干子⑶,且每一子CU可被分裂成若干子CU。位流的語(yǔ)法數(shù)據(jù)可界定LCU可被分裂的最大倍數(shù),被稱(chēng)作CU深度。因此,位流還可界定最小譯碼單元(SCU)。本發(fā)明還使用術(shù)語(yǔ)“塊”來(lái)指代CU、預(yù)測(cè)單元(PU)或TU中的任一者。
[0046]IXU可與四叉樹(shù)數(shù)據(jù)結(jié)構(gòu)相關(guān)聯(lián)。一般來(lái)說(shuō),四叉樹(shù)數(shù)據(jù)結(jié)構(gòu)每個(gè)⑶包含一個(gè)節(jié)點(diǎn),其中根節(jié)點(diǎn)對(duì)應(yīng)于LCU。如果將CU分裂為四個(gè)子CU,那么對(duì)應(yīng)于CU的節(jié)點(diǎn)包含四個(gè)葉節(jié)點(diǎn),所述四個(gè)葉節(jié)點(diǎn)中的每一者對(duì)應(yīng)于子CU中的一者。所述四叉樹(shù)數(shù)據(jù)結(jié)構(gòu)的每一節(jié)點(diǎn)可提供對(duì)應(yīng)CU的語(yǔ)法數(shù)據(jù)。舉例來(lái)說(shuō),四叉樹(shù)中的節(jié)點(diǎn)可包含分裂旗標(biāo),從而指示對(duì)應(yīng)于所述節(jié)點(diǎn)的CU是否被分裂為子CU??蛇f歸地界定CU的語(yǔ)法元素,且所述語(yǔ)法元素可取決于CU是否被分裂為子CU。
[0047]未分裂的⑶可包含一個(gè)或一個(gè)以上預(yù)測(cè)單元(PU)。一般來(lái)說(shuō),I3U表示對(duì)應(yīng)⑶的全部或一部分,且包含用于檢索PU的參考樣本的數(shù)據(jù)。舉例來(lái)說(shuō),在對(duì)PU進(jìn)行幀內(nèi)預(yù)測(cè)模式編碼時(shí),PU可包含描述PU的幀內(nèi)預(yù)測(cè)模式的數(shù)據(jù)。作為另一實(shí)例,在對(duì)進(jìn)行幀間模式編碼時(shí),PU可包含界定PU的運(yùn)動(dòng)向量的數(shù)據(jù)。界定運(yùn)動(dòng)向量的數(shù)據(jù)可描述(例如)運(yùn)動(dòng)向量的水平分量、運(yùn)動(dòng)向量的垂直分量、運(yùn)動(dòng)向量的分辨率(例如,四分之一像素精度或八分之一像素精度)、運(yùn)動(dòng)向量指向的參考幀,和/或運(yùn)動(dòng)向量的參考列表(例如,列表O或列表I)。界定I3U的CU的數(shù)據(jù)還可描述(例如)將CU分割為一個(gè)或一個(gè)以上ro。分割模式在CU未被譯碼、被幀內(nèi)預(yù)測(cè)模式編碼還是被幀間預(yù)測(cè)模式編碼之間可不同。
[0048]具有一個(gè)或一個(gè)以上I3U的⑶還可包含一個(gè)或一個(gè)以上TU。在使用PU進(jìn)行預(yù)測(cè)之后,視頻編碼器可計(jì)算CU的對(duì)應(yīng)于的部分的殘余值??勺儞Q、掃描并量化一組殘余值以界定一組變換系數(shù)。TU界定包含變換系數(shù)的數(shù)據(jù)結(jié)構(gòu)。TU不一定受限于PU的大小或形狀。因此,TU可比同一⑶的對(duì)應(yīng)PU更大或更小,且TU可為正方形或非正方形。在一些實(shí)例中,TU的最大大小可對(duì)應(yīng)于對(duì)應(yīng)CU的大小。
[0049]圖2A和2B是說(shuō)明實(shí)例性四叉樹(shù)250和對(duì)應(yīng)的IXU272的概念圖。圖2A描繪實(shí)例性四叉樹(shù)250,所述四叉樹(shù)包含以分層方式布置的節(jié)點(diǎn)。在例如四叉樹(shù)250等四叉樹(shù)中的每一節(jié)點(diǎn)可為不具有子節(jié)點(diǎn)的葉節(jié)點(diǎn)或具有四個(gè)子節(jié)點(diǎn)。在圖2A的實(shí)例中,四叉樹(shù)250包含根節(jié)點(diǎn)252。根節(jié)點(diǎn)252具有四個(gè)子節(jié)點(diǎn),包含葉節(jié)點(diǎn)256A到256C(葉節(jié)點(diǎn)256)和節(jié)點(diǎn)254。因?yàn)楣?jié)點(diǎn)254不是葉節(jié)點(diǎn),所以節(jié)點(diǎn)254包含四個(gè)子節(jié)點(diǎn),所述四個(gè)子節(jié)點(diǎn)在此實(shí)例中是葉節(jié)點(diǎn)258A到258D(葉節(jié)點(diǎn)258)。
[0050]四叉樹(shù)250可包含描述對(duì)應(yīng)的IXU (例如,此實(shí)例中的IXU272)的特性的數(shù)據(jù)。舉例來(lái)說(shuō),四叉樹(shù)250通過(guò)其結(jié)構(gòu)可描述IXU分裂為子⑶。假設(shè)IXU272具有2NX2N的大小。在此實(shí)例中,LCU272具有四個(gè)子CU276A到276C(子CU276)以及274,其各自大小為NXN。子⑶274進(jìn)一步分裂為四個(gè)子⑶278A到278D (子⑶278),其各自大小為N / 2XN / 2。在此實(shí)例中,四叉樹(shù)250的結(jié)構(gòu)對(duì)應(yīng)于IXU272的分裂。也就是說(shuō),根節(jié)點(diǎn)252對(duì)應(yīng)于IXU272,葉節(jié)點(diǎn)256對(duì)應(yīng)于子⑶276,節(jié)點(diǎn)254對(duì)應(yīng)于子⑶274,且葉節(jié)點(diǎn)258對(duì)應(yīng)于子⑶278。
[0051]四叉樹(shù)250的節(jié)點(diǎn)的數(shù)據(jù)可描述對(duì)應(yīng)于節(jié)點(diǎn)的⑶是否分裂。如果⑶分裂,那么在四叉樹(shù)250中可存在四個(gè)額外節(jié)點(diǎn)。在一些實(shí)例中,可類(lèi)似于以下偽碼來(lái)實(shí)施四叉樹(shù)的節(jié)點(diǎn):
[0052]
【權(quán)利要求】
1.一種對(duì)視頻數(shù)據(jù)進(jìn)行譯碼的方法,所述方法包括: 確定視頻數(shù)據(jù)塊的幀內(nèi)預(yù)測(cè)模式; 基于針對(duì)所述視頻數(shù)據(jù)塊而確定的所述幀內(nèi)預(yù)測(cè)模式來(lái)識(shí)別最大概率變換,其中所述最大概率變換是非正方形變換; 對(duì)所述最大概率變換是否為用于對(duì)所述視頻數(shù)據(jù)塊進(jìn)行編碼的變換的指示進(jìn)行譯碼。
2.根據(jù)權(quán)利要求1所述的方法,其中所述方法包括對(duì)視頻數(shù)據(jù)進(jìn)行編碼的方法,且其中對(duì)所述最大概率變換是否為用于對(duì)所述視頻數(shù)據(jù)塊進(jìn)行編碼的所述變換的所述指示進(jìn)行譯碼包括產(chǎn)生指示所述最大概率變換是否為用于對(duì)所述視頻數(shù)據(jù)塊進(jìn)行編碼的所述變換的旗標(biāo)。
3.根據(jù)權(quán)利要求2所述的方法,其進(jìn)一步包括: 響應(yīng)于所述最大概率變換不是用于對(duì)所述視頻數(shù)據(jù)塊進(jìn)行編碼的所述變換,產(chǎn)生除了所述最大概率變換之外的變換的指示,其中除了所述最大概率變換之外的所述變換是用于對(duì)所述視頻數(shù)據(jù)塊進(jìn)行編碼的所述變換。
4.根據(jù)權(quán)利要求1所述的方法,其中所述方法包括對(duì)視頻數(shù)據(jù)進(jìn)行解碼的方法,且其中對(duì)所述最大概率變換是否為用于對(duì)所述視頻數(shù)據(jù)塊進(jìn)行編碼的所述變換的所述指示進(jìn)行譯碼包括接收指示所述最大概率變換是否為用于對(duì)所述視頻數(shù)據(jù)塊進(jìn)行編碼的所述變換的旗標(biāo)。
5.根據(jù)權(quán)利要求4所述的方法,其進(jìn)一步包括: 響應(yīng)于所述 旗標(biāo)指示所述最大概率變換是用于對(duì)所述視頻數(shù)據(jù)塊進(jìn)行編碼的所述變換,基于所述最大概率變換來(lái)重構(gòu)所述視頻數(shù)據(jù)塊。
6.根據(jù)權(quán)利要求4所述的方法,其進(jìn)一步包括: 響應(yīng)于所述最大概率變換不是用于對(duì)所述視頻數(shù)據(jù)塊進(jìn)行編碼的所述變換,接收除了所述最大概率變換之外的變換的指示; 基于除了所述最大概率變換之外的所述變換來(lái)重構(gòu)所述視頻數(shù)據(jù)塊。
7.根據(jù)權(quán)利要求1所述的方法,其進(jìn)一步包括: 維持最大概率變換到幀內(nèi)預(yù)測(cè)模式的映射。
8.根據(jù)權(quán)利要求7所述的方法,其中所述映射是固定的。
9.根據(jù)權(quán)利要求7所述的方法,其中用信號(hào)通知所述映射以作為經(jīng)譯碼位流的一部分。
10.根據(jù)權(quán)利要求7所述的方法,其中所述映射是基于已在特定幀內(nèi)預(yù)測(cè)模式下針對(duì)先前經(jīng)編碼視頻塊選擇變換的頻繁度的頻率。
11.根據(jù)權(quán)利要求7所述的方法,其中所述映射是自適應(yīng)的。
12.根據(jù)權(quán)利要求11所述的方法,其中所述映射是基于塊大小而自適應(yīng)的。
13.根據(jù)權(quán)利要求1所述的方法,其中從由NXN、hNX2N和2NXhN組成的群組選擇所述變換,其中N表示變換的尺寸的大小,hN表示N的值的一半,且2N表示N的值的兩倍。
14.一種視頻譯碼裝置,所述裝置包括: 視頻譯碼器,其經(jīng)配置以:確定視頻數(shù)據(jù)塊的幀內(nèi)譯碼模式;基于針對(duì)所述視頻數(shù)據(jù)塊而確定的所述幀內(nèi)預(yù)測(cè)模式來(lái)識(shí)別最大概率變換,其中所述最大概率變換是非正方形變換;以及,對(duì)所述最大概率變換是否為用于對(duì)所述視頻數(shù)據(jù)塊進(jìn)行編碼的變換的指示進(jìn)行譯碼。
15.根據(jù)權(quán)利要求14所述的視頻譯碼裝置,其中所述視頻譯碼器包括視頻編碼器,且其中對(duì)所述最大概率變換是否為用于對(duì)所述視頻數(shù)據(jù)塊進(jìn)行編碼的所述變換的所述指示進(jìn)行譯碼包括產(chǎn)生指示所述最大概率變換是否為用于對(duì)所述視頻數(shù)據(jù)塊進(jìn)行編碼的所述變換的旗標(biāo)。
16.根據(jù)權(quán)利要求15所述的視頻譯碼裝置,其中所述視頻譯碼器進(jìn)一步經(jīng)配置以響應(yīng)于所述最大概率變換不是用于對(duì)所述視頻數(shù)據(jù)塊進(jìn)行編碼的所述變換而產(chǎn)生除了所述最大概率變換之外的變換的指示,其中除了所述最大概率變換之外的所述變換是用于對(duì)所述視頻數(shù)據(jù)塊進(jìn)行編碼的所述變換。
17.根據(jù)權(quán)利要求14所述的視頻譯碼裝置,其中所述視頻譯碼器包括視頻解碼器,且其中對(duì)所述最大概率變換是否為用于對(duì)所述視頻數(shù)據(jù)塊進(jìn)行編碼的所述變換的所述指示進(jìn)行譯碼包括接收指示所述最大概率變換是否為用于對(duì)所述視頻數(shù)據(jù)塊進(jìn)行編碼的所述變換的旗標(biāo)。
18.根據(jù)權(quán)利要求17所述的視頻譯碼裝置,其中所述視頻譯碼器進(jìn)一步經(jīng)配置以 響應(yīng)于所述旗標(biāo)指示所述最大概率變換是用于對(duì)所述視頻數(shù)據(jù)塊進(jìn)行編碼的所述變換,基于所述最大概率變換來(lái)重構(gòu)所述視頻數(shù)據(jù)塊。
19.根據(jù)權(quán)利要求17所述的視頻譯碼裝置,其進(jìn)一步包括: 響應(yīng)于所述最大概率變換不是用于對(duì)所述視頻數(shù)據(jù)塊進(jìn)行編碼的所述變換,接收除了所述最大概率變換之外的變換的指示; 基于除了所述最大概率變換之外的所述變換來(lái)重構(gòu)所述視頻數(shù)據(jù)塊。
20.根據(jù)權(quán)利要求14所述的視頻譯碼裝置,其中所述視頻譯碼器進(jìn)一步經(jīng)配置以維持最大概率變換到幀內(nèi)預(yù)測(cè)模式的映射。
21.根據(jù)權(quán)利要求20所述的視頻譯碼裝置,其中所述映射是固定的。
22.根據(jù)權(quán)利要求20所述的視頻譯碼裝置,其中所述映射被用信號(hào)通知以作為經(jīng)譯碼位流的一部分。
23.根據(jù)權(quán)利要求20所述的視頻譯碼裝置,其中所述映射是基于已在特定幀內(nèi)預(yù)測(cè)模式下針對(duì)先前經(jīng)編碼視頻塊選擇變換的頻繁度的頻率。
24.根據(jù)權(quán)利要求20所述的視頻譯碼裝置,其中所述映射是自適應(yīng)的。
25.根據(jù)權(quán)利要求24所述的視頻譯碼裝置,其中所述映射是基于塊大小而自適應(yīng)的。
26.根據(jù)權(quán)利要求14所述的視頻譯碼裝置,其中所述變換選自由NXN、hNX2N和2NXhN組成的群組,其中N表示變換的尺寸的大小,hN表示N的值的一半,且2N表示N的值的兩倍。
27.根據(jù)權(quán)利要求14所述的視頻譯碼裝置,其中所述視頻譯碼裝置包括以下各者中的至少一者: 集成電路; 微處理器;以及, 包含所述視頻譯碼器的無(wú)線(xiàn)通信裝置。
28.一種用于視頻譯碼的裝置,所述裝置包括: 用于確定視頻數(shù)據(jù)塊的幀內(nèi)預(yù)測(cè)模式的裝置;用于基于針對(duì)所述視頻數(shù)據(jù)塊而確定的所述幀內(nèi)預(yù)測(cè)模式來(lái)識(shí)別最大概率變換的裝置,其中所述最大概率變換是非正方形變換; 用于對(duì)所述最大概率變換是否為用于對(duì)所述視頻數(shù)據(jù)塊進(jìn)行編碼的變換的指示進(jìn)行譯碼的裝置。
29.根據(jù)權(quán)利要求28所述的裝置,其中所述裝置包括視頻編碼器,且其中所述用于對(duì)所述最大概率變換是否為用于對(duì)所述視頻數(shù)據(jù)塊進(jìn)行編碼的所述變換的所述指示進(jìn)行譯碼的裝置包括用于產(chǎn)生指示所述最大概率變換是否為用于對(duì)所述視頻數(shù)據(jù)塊進(jìn)行編碼的所述變換的旗標(biāo)的裝置。
30.根據(jù)權(quán)利要求29所述的裝置,其進(jìn)一步包括: 用于響應(yīng)于所述最大概率變換不是用于對(duì)所述視頻數(shù)據(jù)塊進(jìn)行編碼的所述變換而產(chǎn)生除了所述最大概率變換之外的變換的指示的裝置,其中除了所述最大概率變換之外的所述變換是用于對(duì)所述視頻數(shù)據(jù)塊進(jìn)行編碼的所述變換。
31.根據(jù)權(quán)利要求28所述的裝置,其中所述裝置包括視頻解碼器,且其中所述用于對(duì)所述最大概率變換是否為用于對(duì)所述視頻數(shù)據(jù)塊進(jìn)行編碼的所述變換的所述指示進(jìn)行譯碼的裝置包括用于接收指示所述最大概率變換是否為用于對(duì)所述視頻數(shù)據(jù)塊進(jìn)行編碼的所述變換的旗標(biāo)的裝置。
32.根據(jù)權(quán)利要求31所述的裝置,其進(jìn)一步包括: 用于響應(yīng)于所述旗標(biāo)指示所述最大概率變換是用于對(duì)所述視頻數(shù)據(jù)塊進(jìn)行編碼的所述變換而基于所述最大概率變換來(lái)重構(gòu)所述視頻數(shù)據(jù)塊的裝置。
33.根據(jù)權(quán)利要求32所述的裝置,其進(jìn)一步包括: 用于響應(yīng)于所述最大概率變換不是`用于對(duì)所述視頻數(shù)據(jù)塊進(jìn)行編碼的所述變換而接收除了所述最大概率變換之外的變換的指示的裝置; 用于基于除了所述最大概率變換之外的所述變換來(lái)重構(gòu)所述視頻數(shù)據(jù)塊的裝置。
34.根據(jù)權(quán)利要求28所述的裝置,其進(jìn)一步包括: 用于維持最大概率變換到幀內(nèi)預(yù)測(cè)模式的映射的裝置。
35.根據(jù)權(quán)利要求34所述的裝置,其中所述映射是固定的。
36.根據(jù)權(quán)利要求34所述的裝置,其中所述映射被用信號(hào)通知以作為經(jīng)譯碼位流的一部分。
37.根據(jù)權(quán)利要求34所述的裝置,其中所述映射是基于已在特定幀內(nèi)預(yù)測(cè)模式下針對(duì)先前經(jīng)編碼視頻塊選擇變換的頻繁度的頻率。
38.根據(jù)權(quán)利要求34所述的裝置,其中所述映射是自適應(yīng)的。
39.根據(jù)權(quán)利要求38所述的裝置,其中所述映射是基于塊大小而自適應(yīng)的。
40.根據(jù)權(quán)利要求28所述的裝置,其中所述變換選自由NXN、hNX2N和2NXhN組成的群組,其中N表示變換的尺寸的大小,hN表示N的值的一半,且2N表示N的值的兩倍。
41.一種計(jì)算機(jī)可讀存儲(chǔ)媒體,其存儲(chǔ)可操作以致使一個(gè)或一個(gè)以上處理器進(jìn)行以下操作的指令 確定視頻數(shù)據(jù)塊的幀內(nèi)預(yù)測(cè)模式; 基于針對(duì)所述視頻數(shù)據(jù)塊而確定的所述幀內(nèi)預(yù)測(cè)模式來(lái)識(shí)別最大概率變換,其中所述最大概率變換是非正方形變換;對(duì)所述最大概率變換是否為用于對(duì)所述視頻數(shù)據(jù)塊進(jìn)行編碼的變換的指示進(jìn)行譯碼。
【文檔編號(hào)】H04N19/61GK103891279SQ201280049694
【公開(kāi)日】2014年6月25日 申請(qǐng)日期:2012年10月10日 優(yōu)先權(quán)日:2011年10月11日
【發(fā)明者】郭立威, 馬爾塔·卡切維奇, 翔林·王 申請(qǐng)人:高通股份有限公司