專利名稱:用于解碼/編碼視頻信號(hào)的方法及裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種視頻信號(hào)編/解碼方案。
技術(shù)背景壓縮編/解碼是指一系列的信號(hào)處理技術(shù),用于通過(guò)通信電路傳輸數(shù) 字化信息,或者以合適的存儲(chǔ)媒介的形式存儲(chǔ)此數(shù)字化信息。壓縮編/解 碼的對(duì)象有音頻、視頻、字符等。尤其是,對(duì)視頻執(zhí)行壓縮編碼的技術(shù)被 稱為視頻序列壓縮。通常,視頻序列的特征在于包含空間冗余或時(shí)間冗余??缮炜s視頻編碼比特流可被選擇性地只部分解碼。例如,具有低復(fù)雜 度的解碼器能夠解碼基本層,低數(shù)據(jù)率的比特流可被提取以用于通過(guò)有限 容量的網(wǎng)絡(luò)被傳輸。為了能進(jìn)一步逐漸地生成高分辨率的圖像,需要逐步 提高序列的圖像質(zhì)量。發(fā)明內(nèi)容技術(shù)目的本發(fā)明的目的在于提高視頻信號(hào)的編/解碼效率。 技術(shù)手段因此,本發(fā)明是針對(duì)一種編/解碼視頻信號(hào)的方法,其充分避免了因 相關(guān)技術(shù)的限制和缺點(diǎn)而導(dǎo)致的一個(gè)或多個(gè)問(wèn)題。本發(fā)明的一個(gè)目的在于定義一種對(duì)于編碼解碼器(codec)的兼容性
的語(yǔ)法,由此提高不同類型的編碼解碼器間的兼容性。本發(fā)明的另一個(gè)目的在于定義一種用于可伸縮視頻編碼比特流的重構(gòu)(recomposition)語(yǔ)法,從而提高編碼解碼器間的兼容性。本發(fā)明的另一個(gè)目的在于限定一種語(yǔ)法,此語(yǔ)法用于表示是否于適當(dāng) 位置存儲(chǔ)參考基本圖像,從而提高編碼解碼器間的兼容性。本發(fā)明的另一個(gè)目的在于定義一種語(yǔ)法,此語(yǔ)法用于表示是否在適當(dāng) 位置存儲(chǔ)參考基本圖像,從而有效地管理解碼圖像緩存區(qū)(decoded picture buffer)。本發(fā)明的另一個(gè)目的在于通過(guò)用于表示是否在適當(dāng)位置存儲(chǔ)參考基 本圖像的語(yǔ)法,有效地執(zhí)行解碼圖像標(biāo)記。本發(fā)明的另一個(gè)目的在于提供一種解碼方法,由此,最小化因傳輸過(guò) 程中產(chǎn)生的錯(cuò)誤而導(dǎo)致的視頻信號(hào)解碼過(guò)程中的問(wèn)題。本發(fā)明的另一個(gè)目的在于提供一種方法,通過(guò)最小化視頻信號(hào)的解碼 過(guò)程中所產(chǎn)生的問(wèn)題的解碼方案來(lái)管理解碼圖像緩存區(qū),其中此問(wèn)題由傳 輸過(guò)程產(chǎn)生的錯(cuò)誤所導(dǎo)致。有益效果因此,本發(fā)明提供以下效果或優(yōu)點(diǎn)。首先,編/解碼視頻信號(hào)時(shí),通過(guò)定義用于編碼解碼器的兼容性的語(yǔ) 法,本發(fā)明可提高不同類型的編碼解碼器間的兼容性。例如,用于把可伸 縮視頻編碼比特流變換為AVC (先進(jìn)視頻編碼)的編碼解碼器所編碼的比 特流從而增強(qiáng)編碼解碼器間的兼容性的語(yǔ)法結(jié)構(gòu)。第二,解碼圖像緩存區(qū)(DPB)通過(guò)本發(fā)明被更加有效地管理;從而 減少解碼圖像緩存區(qū)上所施加的負(fù)擔(dān)。因此,可提高編/解碼速度。第三,通過(guò)使用關(guān)于可伸縮視頻序列的各種配置信息,本發(fā)明可實(shí)現(xiàn) 更加有效的編/解碼。
本發(fā)明所包括的附圖用于提供對(duì)本發(fā)明的進(jìn)一步理解,它們被結(jié)合在 此并構(gòu)成了本說(shuō)明書的一部分,這些附圖示出了本發(fā)明的實(shí)施例,并且與 說(shuō)明書一起用于解釋本發(fā)明的原理。 附圖中圖1為根據(jù)本發(fā)明的可伸縮視頻編/解碼系統(tǒng)的示意框圖;圖2為根據(jù)本發(fā)明的一個(gè)實(shí)施例的可增加至可伸縮視頻編碼比特流的可伸縮序列的配置信息圖;圖3為根據(jù)本發(fā)明的一個(gè)實(shí)施例的用于解釋存儲(chǔ)和使用參考基本圖 像的過(guò)程的可伸縮視頻編碼的各種可伸縮結(jié)構(gòu)的圖;圖4為根據(jù)本發(fā)明的一個(gè)實(shí)施例的參考基本圖像的存儲(chǔ)過(guò)程的流程圖;圖5為根據(jù)本發(fā)明的一個(gè)實(shí)施例的用于存儲(chǔ)和標(biāo)記參考基本圖像的 語(yǔ)法的結(jié)構(gòu)圖;圖6為根據(jù)本發(fā)明的一個(gè)實(shí)施例的用于存儲(chǔ)和標(biāo)記參考基本圖像的 語(yǔ)法的結(jié)構(gòu)圖;以及圖7至圖12分別為根據(jù)本發(fā)明的一個(gè)實(shí)施例的獲得用于表示是否在 緩存區(qū)中存儲(chǔ)當(dāng)前NAL單元的標(biāo)志信息的語(yǔ)法的結(jié)構(gòu)圖。最佳模式本發(fā)明的其他優(yōu)點(diǎn)及特征將在下面的描述中被說(shuō)明,且其部分將可從 描述中被了解,或可通過(guò)實(shí)施本發(fā)明而得到。本發(fā)明的目的及其他優(yōu)點(diǎn)將 可通過(guò)說(shuō)明書及其權(quán)利要求以及附圖中所具體指出的結(jié)構(gòu)來(lái)實(shí)現(xiàn)并獲得。為了實(shí)現(xiàn)這些和其他優(yōu)點(diǎn),并根據(jù)如同包括并廣泛描述的本發(fā)明的目 的,在通過(guò)利用時(shí)域和可伸縮域上的部分參考圖像來(lái)解碼可伸縮視頻信號(hào)
中,本發(fā)明包括獲得第一時(shí)間點(diǎn)上的第一部分圖像;參考該第一部分圖像解碼完整圖像,該完整圖像位于第二時(shí)間點(diǎn),該第二時(shí)間點(diǎn)位于該第一時(shí)間點(diǎn)之后;其中,該第一部分圖像的可伸縮域上的級(jí)別低于該完整圖像 的可伸縮域上的級(jí)別。優(yōu)選地,上述方法進(jìn)一步包括利用第二部分圖像的可伸縮解碼來(lái)解碼 該完整圖像,該第二部分圖像位于該第二時(shí)間點(diǎn),并且相應(yīng)于該第一時(shí)間 點(diǎn)上的該第一部分圖像。優(yōu)選地,上述方法進(jìn)一步包括獲得用于限制語(yǔ)法的限制標(biāo)志信息,該 語(yǔ)法相應(yīng)于比特流中的部分參考信息。為了進(jìn)一步實(shí)現(xiàn)這些和其他優(yōu)點(diǎn),并根據(jù)本發(fā)明的目的,根據(jù)本發(fā)明 的方法包括獲得當(dāng)前NAL單元的質(zhì)量級(jí)別;確定該當(dāng)前NAL單元是否包 含參考圖像的條帶;當(dāng)該當(dāng)前NAL單元相應(yīng)于最低質(zhì)量級(jí)別和該當(dāng)前NAL 單元包含該參考圖像的條帶時(shí),獲得表示是否在緩存區(qū)中存儲(chǔ)該當(dāng)前NAL 單元的第一標(biāo)志信息;和基于該第一標(biāo)志信息把解碼圖像標(biāo)記為參考基本 圖像,其中,該當(dāng)前NAL單元被包括在該解碼圖像中。為了進(jìn)一步實(shí)現(xiàn)這些和其他優(yōu)點(diǎn),并根據(jù)本發(fā)明的目的,根據(jù)本發(fā)明 的用于解碼視頻信號(hào)的裝置包括識(shí)別信息檢査單元,用于檢查當(dāng)前NAL 單元的質(zhì)量級(jí)別,并且用于檢查該當(dāng)前NAL單元是否包括參考圖像的條帶; 和解碼圖像緩存區(qū)單元,如果根據(jù)該識(shí)別信息檢查單元的檢査結(jié)果,該當(dāng) 前NAL單元相應(yīng)于最低質(zhì)量級(jí)別并且包含該參考圖像的片段,該解碼圖像 緩存區(qū)單元基于表示是否在緩存區(qū)中存儲(chǔ)該當(dāng)前NAL單元的第一標(biāo)志信 息,標(biāo)記包含該NAL單元的解碼圖像為參考基本圖像。可以理解的是以上的一般描述和以下的詳細(xì)描述都是示例的和解釋 性的,并且可以提供對(duì)本發(fā)明的權(quán)利要求的進(jìn)一步說(shuō)明。發(fā)明的實(shí)施方式
現(xiàn)在將參考本發(fā)明優(yōu)選實(shí)施例進(jìn)行詳細(xì)說(shuō)明,其例子已表示在附圖中。首先,對(duì)視頻信號(hào)數(shù)據(jù)的壓縮編/解碼考慮空間冗余、時(shí)間冗余、可 伸縮冗余、視角間冗余??紤]可伸縮冗余的壓縮編/解碼只是本發(fā)明的一 個(gè)實(shí)施例。但是本發(fā)明的技術(shù)構(gòu)思可適用于時(shí)間冗余、空間冗余、視角間 冗余等。本說(shuō)明書中所指的"編/解碼(coding)"包含編碼(encoding)和解 碼(decoding)兩個(gè)概念,可以根據(jù)本發(fā)明的技術(shù)構(gòu)思和技術(shù)范圍靈活地 進(jìn)行解釋。在視頻信號(hào)的比特序列配置中,存在稱之為NAL (Network Abstraction Layer,網(wǎng)絡(luò)提取層)的分離的層結(jié)構(gòu),其位于執(zhí)行運(yùn)動(dòng)圖 像編碼過(guò)程的VCL(Video Code Layer,視頻編碼層)和傳輸并存儲(chǔ)編碼信 息的低層系統(tǒng)之間。編碼過(guò)程的輸出為VCL數(shù)據(jù),傳輸或存儲(chǔ)之前通過(guò)NAL 單元被映射。各個(gè)NAL單元包含壓縮的視頻數(shù)據(jù)或相應(yīng)于頭信息的數(shù)據(jù) RBSP (Raw Byte Sequence Payload,原始字節(jié)序列載荷運(yùn)動(dòng)圖像壓縮 的結(jié)果數(shù)據(jù))。NAL單元主要包括NAL單元頭和RBSP兩部分。NAL單元頭包括表示是 否包含作為該NAL單元的參考圖像的條帶的標(biāo)志信息(nal—ref—idc)和 表示NAL單元的類型的識(shí)別符(nal一unit一type)。在RBSP中存儲(chǔ)經(jīng)過(guò)壓 縮的原始數(shù)據(jù)。并且,為了使RBSP的長(zhǎng)度表示為8比特的倍數(shù),在RBSP 的末尾加入RBSP拖尾比特(RBSP trailing bit)。 NAL單元的類型有IDR (Instantaneous Decoding Refresh,即時(shí)解碼刷新)圖像,SPS(Sequence Parameter Set,序歹慘數(shù)集),PPS (Picture Parameter Set,圖像參數(shù)集) SEI (Supplemental Enhancement Information,補(bǔ)充增強(qiáng)信息)等。因此,如果表示上述NAL單元的類型的信息(nal—unit—type)表現(xiàn) 為可伸縮視頻編碼條帶的話,可通過(guò)增加與上述可伸縮編/解碼有關(guān)的各 種配置信息來(lái)提高編/解碼效率。舉例來(lái)說(shuō),可以增加表示當(dāng)前接入單元是否為即時(shí)解碼刷新(以下簡(jiǎn)稱為IDR)接入單元的標(biāo)志信息,表示空間 可伸縮性的依賴關(guān)系識(shí)別信息(d印endency identification information),質(zhì)量識(shí)別信息,表示參考基本圖像是否被用作參考圖像的 標(biāo)志信息,優(yōu)先級(jí)識(shí)別信息等。為了更加有效地管理解碼圖像緩存區(qū),可 以使用各種可伸縮編/解碼的配置信息,下面將參考圖2對(duì)其進(jìn)行詳細(xì)說(shuō) 明。在標(biāo)準(zhǔn)中,為了能以適當(dāng)?shù)馁M(fèi)用購(gòu)買目標(biāo)產(chǎn)品,規(guī)定了對(duì)于各種簡(jiǎn)表 和級(jí)別的要求。這種情況下,解碼器必須滿足根據(jù)相應(yīng)簡(jiǎn)表和級(jí)別中所確 定的要求。因此,定義了 "簡(jiǎn)表"和"級(jí)別"兩種概念來(lái)表示函數(shù)或參數(shù), 其用于表示解碼器可以處理的被壓縮序列的范圍的大小。簡(jiǎn)表識(shí)別符 (profile一idc)可以識(shí)別比特流基于預(yù)定的簡(jiǎn)表。簡(jiǎn)表識(shí)別符是表示比 特流所基于的簡(jiǎn)表的標(biāo)志。舉例來(lái)說(shuō),H.264/AVC中,簡(jiǎn)表識(shí)別符為66, 這是指比特流基于基準(zhǔn)簡(jiǎn)表;簡(jiǎn)表識(shí)別符為77的話,是指以主要簡(jiǎn)表為 基礎(chǔ),簡(jiǎn)表識(shí)別符為88的話,是指比特流以擴(kuò)展簡(jiǎn)表為基礎(chǔ)。而且,上 述簡(jiǎn)表識(shí)別符包含在序列參數(shù)集中。因此,為了處理可伸縮序列,需要識(shí)別輸入比特流是否為用于可伸縮 序列的簡(jiǎn)表,如果輸入比特流識(shí)別為用于可伸縮序列的簡(jiǎn)表的話,有必要 增加語(yǔ)法使得用于可伸縮序列的一個(gè)以上的附加信息可被傳輸。這里用于 可伸縮序列的簡(jiǎn)表,作為H.264/AVC的附加方案,表示用于處理可伸縮視 頻的簡(jiǎn)表模式。因?yàn)閷?duì)于傳統(tǒng)AVC技術(shù)來(lái)說(shuō),SVC為附加方案,所以,和無(wú)條件增加 語(yǔ)法相比,增加語(yǔ)法作為用于SVC模式的附加信息更為有效。舉例來(lái)說(shuō), 當(dāng)AVC的簡(jiǎn)表識(shí)別符表示為用于可伸縮序列的簡(jiǎn)表時(shí),如果增加關(guān)于可伸 縮序列的信息的話,則可提高編/解碼效率。序列參數(shù)集表示頭信息,其中頭信息包含存在于整個(gè)序列的編碼中的
信息,例如簡(jiǎn)表、級(jí)別等。整個(gè)壓縮運(yùn)動(dòng)圖像,即序列應(yīng)該開(kāi)始于序列頭 處。因此,相應(yīng)于頭信息的序列參數(shù)集應(yīng)該在依賴于此參數(shù)集的數(shù)據(jù)到達(dá)之前先到達(dá)解碼器。即,序列參數(shù)集RBSP承擔(dān)用于運(yùn)動(dòng)圖像壓縮的結(jié)果 數(shù)據(jù)的頭信息的角色。 一旦輸入比特流,簡(jiǎn)表識(shí)別符優(yōu)先識(shí)別出輸入的比 特流基于多個(gè)簡(jiǎn)表中的哪一個(gè)。以下解釋有效的視頻信號(hào)解碼方法的多個(gè)實(shí)施例。 圖1為根據(jù)本發(fā)明的可伸縮視頻編碼系統(tǒng)的示意框圖。 為了提供對(duì)于各種通信環(huán)境和各種終端的優(yōu)化序列,提供到終端的序 列應(yīng)該是多樣化的。如果某個(gè)終端的優(yōu)化序列被提供到相應(yīng)終端的話,則 表示針對(duì)各種參數(shù)(包括每秒的傳輸幀數(shù),分辨率,每像素的比特?cái)?shù)等) 的組合值來(lái)準(zhǔn)備單個(gè)序列源。因此,優(yōu)化序列對(duì)內(nèi)容提供商施加了負(fù)擔(dān)。 因此,內(nèi)容提供商把原始序列編碼為高比特率的壓縮序列數(shù)據(jù)。在接 收到由終端做出的序列請(qǐng)求時(shí),內(nèi)容提供商解碼原始序列,把其編碼為適 合于終端的序列處理能力的序列數(shù)據(jù),并且然后把該編碼數(shù)據(jù)提供給終 端。因?yàn)樵摯a轉(zhuǎn)化伴隨著編碼-解碼-編碼過(guò)程,所以在提供序列的過(guò)程 中不可避免地產(chǎn)生時(shí)間延遲。因此,另外需要復(fù)雜的硬件設(shè)備和算法。可伸縮視頻編碼(SVC)是一種以最佳圖像質(zhì)量編碼視頻信號(hào)的編碼 方案,以使得所產(chǎn)生的圖像序列的部分序列能通過(guò)解碼表現(xiàn)為序列。這里, 部分序列是指由從整個(gè)序列中被間歇地挑選出來(lái)的幀構(gòu)成的序列。對(duì)于由 SVC編碼的圖像序列,對(duì)于低比特率利用空間可伸縮性,可縮減序列尺寸, 并且也可使用質(zhì)量可伸縮性降低序列的圖像質(zhì)量。這里,具有小屏幕和/ 或低的每秒幀數(shù)的圖像序列可被稱為基本層,且具有相對(duì)大屏幕和/或相 對(duì)高的每秒幀數(shù)的序列可被稱為被增強(qiáng)的或增強(qiáng)層。上述可伸縮方案所編碼的圖像序列通過(guò)僅接收和處理部分序列的方 式以實(shí)現(xiàn)低圖像質(zhì)量的序列表示。如果比特率被降低,則圖像質(zhì)量也降低 地相當(dāng)大。 為了解決圖像質(zhì)量的降低問(wèn)題,可提供低比特率的分離的輔助圖像序 列,例如包含小屏幕和/或每秒較少幀數(shù)的圖像序列。這種輔助序列可被 稱為基本層,而主圖像序列可被稱為被增強(qiáng)的或增強(qiáng)層。以下詳細(xì)解釋可伸縮視頻編碼系統(tǒng)。首先,可伸縮視頻編碼系統(tǒng)包含編碼器102和解碼器110。編碼器102包含基本層編碼單元104、增強(qiáng)層編碼單元106以及復(fù)用單元108。解碼器110可包含去復(fù)用單元112、基本層解碼單元114以及增強(qiáng)層解碼單元116。通過(guò)壓縮輸入的序列信號(hào)X(n),基本層編碼單元104能夠產(chǎn)生基本比特流。使用輸入的序列信號(hào)X(n)和基本層編碼單元104所產(chǎn)生的信息,增 強(qiáng)層編碼單元106可以產(chǎn)生增強(qiáng)層比特流。并且,使用基本層比特流和增強(qiáng)層比特流,復(fù)用單元108能夠產(chǎn)生可 伸縮比特流。所產(chǎn)生的可伸縮比特流通過(guò)指定信道被傳送至解碼器110。通過(guò)解碼 器110的去復(fù)用單元112,傳輸?shù)目缮炜s比特流可被分離為增強(qiáng)層比特流 和基本層比特流?;緦咏獯a單元114接收并解碼基本層比特流為輸出序列信號(hào) Xb(n)。增強(qiáng)層解碼單元116接收增強(qiáng)層比特流,并且參考基本層解碼單元 114所重建的信號(hào),解碼增強(qiáng)層比特流為輸出序列信號(hào)Xe(n)。這里,輸 出序列信號(hào)Xb(n)是具有比之后的輸出序列信號(hào)Xe(n)低的圖像質(zhì)量或分 辨率的序列信號(hào)。可伸縮視頻編碼過(guò)程中,當(dāng)特定圖像通過(guò)編碼增強(qiáng)層而被傳輸時(shí),增 強(qiáng)層比特流可能在相應(yīng)的傳輸期間被部分損壞。這種情況下,因?yàn)榻獯a器 110使用損壞的增強(qiáng)層比特流解碼相應(yīng)圖像,因此原始序列與解碼序列在
圖像質(zhì)量方面有所不同。特別地,如果存在這種問(wèn)題的圖像是為具有最低 時(shí)間級(jí)別的解碼另一圖像所需的參考圖像的話,則此問(wèn)題會(huì)愈加嚴(yán)重。因此,具有最低時(shí)間級(jí)別的圖像需要更加有效地被管理。這將在下面通過(guò)參考圖3和圖4來(lái)加以詳細(xì)解釋。根據(jù)本發(fā)明的一個(gè)實(shí)施例,解碼圖像緩存區(qū)(DPB)使得在可伸縮視 頻編碼中可實(shí)現(xiàn)完整圖像和部分圖像的可伸縮存儲(chǔ)或者標(biāo)記。這種情形 中,完整圖像(full picture)表示具有最高質(zhì)量級(jí)別的圖像,而部分圖 像(partial picture)表示具有最低質(zhì)量級(jí)別的圖像?;蛘?,完整圖像和部分圖像可分別被定義為表示相對(duì)高和低的質(zhì)量級(jí)別。例如,如果質(zhì)量級(jí)別被分為5級(jí)(0-4),部分圖像可屬于質(zhì)量級(jí)別為 0至3的例子。完整圖像可屬于質(zhì)量級(jí)別為4的例子。或者,只有質(zhì)量級(jí) 別為0的情形相應(yīng)于部分圖像。同時(shí),第一時(shí)間點(diǎn)處的部分圖像在用作參考圖像之前需要被存儲(chǔ)。因 此,為了解碼位于第一時(shí)間點(diǎn)之后的第二時(shí)間點(diǎn)的局部或完整圖像,第一 時(shí)間點(diǎn)處的部分圖像可被用作參考圖像。并且第一時(shí)間點(diǎn)處的完整或部分 圖像可自適應(yīng)地被用作參考圖像。圖2為根據(jù)本發(fā)明的一個(gè)實(shí)施例的可增加至可伸縮視頻編碼比特流 的可伸縮序列的配置信息的圖。圖2示出了使得可伸縮序列上的配置信息被增加于其上的NAL單元的結(jié)構(gòu)示例。NAL單元主要包含NAL單元頭和RBSP (原始字節(jié)序列載荷運(yùn)動(dòng)圖像 壓縮的結(jié)果數(shù)據(jù))。NAL單元頭可包含表示該NAL單元是否包含參考圖像的條帶的識(shí)別信 息(nal—ref—idc)和表示NAL單元的類型的信息(nal—unit—type)。并且,在一定限制下可包括NAL單元頭的擴(kuò)展區(qū)域。例如,如果用于表示NAL單元類型的信息和可伸縮視頻編碼相關(guān)或者 表示前綴NAL單元,則NAL單元可包含NAL單元頭的擴(kuò)展區(qū)域。尤其,如 果nal—unit—type等于20或14, NAL單元可包含NAL單元頭的擴(kuò)展區(qū)域。 根據(jù)能夠識(shí)別是否為SVC比特流的標(biāo)志信息(sVC_mVc_flag),多視角 (multi-view)序列的配置信息可被增加至NAL單元頭的擴(kuò)展區(qū)域。另一例子,如果用于表示NAL單元的類型的信息是表示子集序列參數(shù) 集的信息,則RBSP可包含關(guān)于子集序列參數(shù)集的信息。尤其,如果 nal_unit—type等于15,則RBSP可包含關(guān)于子集序列參數(shù)集的信息。這 種情形中,根據(jù)簡(jiǎn)表信息,子集序列參數(shù)集可包含序列參數(shù)集的擴(kuò)展區(qū)域。 例如,如果簡(jiǎn)表信息(profile—idc)為與可伸縮視頻編碼相關(guān)的簡(jiǎn)表, 子集序列參數(shù)集可包含序列參數(shù)集的擴(kuò)展區(qū)域?;蛘?,根據(jù)簡(jiǎn)表信息,序 列參數(shù)集可包含序列參數(shù)集的擴(kuò)展區(qū)域。序列參數(shù)集的擴(kuò)展區(qū)域可包含限 制標(biāo)志信息,以用于為編碼解碼器的兼容性限制特別的語(yǔ)法。以下詳細(xì)解釋關(guān)于可伸縮序列的各種配置信息,例如可包含于NAL單 元頭的擴(kuò)展區(qū)域中的配置信息,或者可包含于序列參數(shù)集的擴(kuò)展區(qū)域中的 配置信息。首先,表示空間可伸縮性的識(shí)別信息是指表示識(shí)別NAL單元的依賴關(guān) 系的信息。例如,依賴關(guān)系根據(jù)空間分辨率而變化。圖3中,Spa—LayerO 和Spa—Layerl的圖像可具有相同的分辨率。Spa—LayerO的圖像可包含通 過(guò)對(duì)Spa—Layerl中的圖像執(zhí)行下采樣而獲得的圖像。尤其,假設(shè)識(shí)別NAL單元的依賴關(guān)系的信息被命名為d印endency一id, Spa_LayerO中的圖像具有d印endencyjd二0的關(guān)系,Spa Layerl的圖像 則具有d印endency—id=l的關(guān)系??刹捎枚喾N方式定義依賴關(guān)系識(shí)別信息。因此,具有相同值的識(shí)別依 賴關(guān)系的信息NAL單元可表示為依賴關(guān)系表示(d印endency representation)。質(zhì)量識(shí)別信息表示用于識(shí)別NAL單元的質(zhì)量的信息。例如,單個(gè)圖像 可被編碼為質(zhì)量不同的圖像。圖3中,Spa—Layer0和Spa_Layerl中的圖 像可被編碼為彼此質(zhì)量不同的圖像。尤其,假設(shè)用于識(shí)別NAL單元的質(zhì)量的信息被命名為quality—id, 圖像B1、 B2、…、BIO可被設(shè)定為quality—id = 0。并且,圖像Ql、 Q2、、 Q10可被設(shè)定為quality—id=l。即,圖像Bl、 B2、、 BIO表示包含最 低圖像質(zhì)量的圖像。這些被稱為基本圖像。圖像Q1、 Q2、…、QIO可以包 含圖像B1、 B2、…、B10,并且圖像質(zhì)量好于圖像Bl、 B2、…、B10???采用多種方式定義質(zhì)量識(shí)別信息。例如,質(zhì)量識(shí)別信息可表示為16個(gè)級(jí) 別。同時(shí),根據(jù)識(shí)別依賴關(guān)系的信息和質(zhì)量識(shí)別信息,可定義單個(gè)層。這 種情況下,具有相同數(shù)值的識(shí)別依賴關(guān)系的信息和質(zhì)量識(shí)別信息的NAL單 元可表達(dá)為層表示(layer representation)。用于表示時(shí)間可伸縮性的識(shí)別信息是指用于識(shí)別NAL單元的時(shí)間級(jí) 別的信息??梢栽诜旨?jí)B圖像結(jié)構(gòu)中解釋時(shí)間級(jí)別。例如,Spa—LayerO中的圖像(Bl, Ql)和圖像(B3, Q3)可包含相 同的時(shí)間級(jí)別Tem—LayerO。如果圖像(B5, Q5)參考于圖像(Bl, Ql)和 圖像(B3, Q3),則圖像(B5, Q5)可具有比圖像(Bl, Ql)或圖像(B3, Q3)的時(shí)間級(jí)別Tem—LayerO更高的時(shí)間級(jí)別Tem—Layerl。同樣,如果圖 像(B7, Q7)參考于圖像(Bl, Ql)和圖像(B5, Q5),則圖像(B7, Q7) 可具有比圖像(B5, Q5)的時(shí)間級(jí)別Tem—Layerl更高的時(shí)間級(jí)別Tem_ Layer2。單個(gè)存取單元內(nèi)的全部NAL單元可包含相同的時(shí)間級(jí)別。IDR存 取單元的例子中,時(shí)間級(jí)別值可變?yōu)镺。標(biāo)志信息用于表示參考基本圖像是否被用作參考圖像,此標(biāo)志信息表 示幀間預(yù)測(cè)(inter-prediction)過(guò)程中參考基本圖像是否用作參考圖像 或者解碼圖像是否被用作參考圖像。相同層的NAL單元,即包含相同的識(shí) 別依賴關(guān)系的信息的NAL單元的標(biāo)志信息可包含相同的值。
優(yōu)先級(jí)識(shí)別信息表示用于識(shí)別NAL單元的優(yōu)先級(jí)的信息。使用優(yōu)先級(jí) 識(shí)別信息可提供層間(inter-layer )可擴(kuò)展性或者圖像間 (inter-picture)可擴(kuò)展性。例如,通過(guò)使用優(yōu)先級(jí)識(shí)別信息可為用戶 提供各種時(shí)間和空間級(jí)別的序列。因此,用戶可僅僅根據(jù)不同的限制條件 就可看到特定時(shí)間和空間的序列或視圖。優(yōu)先級(jí)信息可根據(jù)其參考條件采用多種方式而形成。優(yōu)先級(jí)信息可隨 機(jī)形成而無(wú)須采用特別參考。并且,優(yōu)先級(jí)信息可由解碼器決定。NAL單元頭的擴(kuò)展區(qū)域中包含的配置信息可包含用于表示當(dāng)前存取單 元是否為IDR存取單元的標(biāo)志信息。圖3為根據(jù)本發(fā)明的一個(gè)實(shí)施例的用于解釋存儲(chǔ)和使用參考基本圖 像過(guò)程的可伸縮視頻編碼的各種可伸縮性結(jié)構(gòu)的圖。首先,時(shí)間可伸縮性中,可根據(jù)幀速率決定視頻序列的層。請(qǐng)參考圖3,每層中沿向上方向的話,則指更高的時(shí)間可伸縮層以表 示幀率變得更高。通過(guò)把分級(jí)B圖像或分級(jí)P圖像的概念應(yīng)用至H. 264視頻編碼,可實(shí) 現(xiàn)時(shí)間可伸縮視頻編碼。例如,在預(yù)測(cè)屬于時(shí)間級(jí)別Tem—Layerl中的圖 像(B5,Q5)的例子中,圖像(B7,Q7,B9,Q9)屬于具有比時(shí)間級(jí)別Tem_Layerl 的值更大的時(shí)間級(jí)別Tem—Layer2,所以無(wú)法用作參考圖像。然而,圖像(Bl, Ql, B3, Q3)屬于具有更低時(shí)間級(jí)別的Tem—LayerO,所以可用作參考圖像。因此,無(wú)論是否存在屬于比隨機(jī)時(shí)間層更高的層的圖像的解碼,屬于 隨機(jī)時(shí)間層的圖像可被獨(dú)立地解碼。如果根據(jù)解碼器的能力判定為可解碼 級(jí)別,則可解碼相應(yīng)幀速率的H. 264兼容視頻信號(hào)。以下解釋圖3中的空間可伸縮性。Spa_LayerO和Spa—Layerl中的圖 像分別包含相同的分辨率。Spa一LayerO的圖像是通過(guò)對(duì)Spa—Layerl中的 圖像執(zhí)行下采樣而獲得的圖像。例如,關(guān)于NAL單元的識(shí)別依賴關(guān)系的信 息被設(shè)定為d印endencyjd , Spa—Layer 0中的圖像可被設(shè)定為 d印endency—id等于0, Spa_Layerl中的圖像可被設(shè)定為d印endency—id 等于l。以下解釋質(zhì)量可伸縮性??臻g軸上每層的圖像可包含彼此質(zhì)量不同的 圖像。例如,假設(shè)用于識(shí)別NAL單元的質(zhì)量的信息被設(shè)定為quality—id, 圖像B1、 B2、…、B10可被設(shè)定為quality_id等于0,圖像Ql、 Q2…、 Q10可被設(shè)定為quality—id=l。尤其,圖像Bl、 B2、…、B10表示具有 最低圖像質(zhì)量的圖像。相反地,圖像Q1、 Q2…、Q10相應(yīng)的圖像所具有的 圖像質(zhì)量高于圖像B1、 B2、…、BIO??刹捎枚喾N方式定義質(zhì)量識(shí)別信息。 例如,質(zhì)量識(shí)別信息可表示為16個(gè)級(jí)別。以下解釋根據(jù)本發(fā)明的一個(gè)實(shí)施例的存儲(chǔ)參考基本圖像和使用所存 儲(chǔ)的參考基本圖像進(jìn)行解碼的過(guò)程。參考圖3中所示的圖像,解碼順序可設(shè)定為Bl、 Ql、 B2、 Q2、 B3、 Q3、…、B10、 Q10 (1—2—3—4—…,一9—10)。如果當(dāng)前待解碼的圖像 為B4,圖像B1、 Ql、 B2、 Q2、 B3以及Q3為事先被解碼的圖像。圖像B4 相應(yīng)于具有最低時(shí)間級(jí)別和最低質(zhì)量級(jí)別的圖像。圖像B4可參考圖像B2, 其中圖像B2為基本圖像。因此,圖像B2應(yīng)該存儲(chǔ)于解碼圖像緩存區(qū)中。這種情形中,當(dāng)解碼該已被解碼的圖像B2時(shí),需要表示圖像B2將被 存儲(chǔ)于解碼圖像緩存區(qū)中以用于以后待編碼的圖像(例如,圖像B4)的標(biāo) 志信息。例如,如果當(dāng)前NAL單元相應(yīng)于參考基本圖像,則可定義表示是 否存儲(chǔ)當(dāng)前NAL單元于緩存區(qū)中的標(biāo)志信息為 store—ref—base一pic一flag。并且可能需要用于表示圖像B2是否將被作為 基本圖像的標(biāo)記。因此,在圖像B2解碼之后,解碼圖像緩存區(qū)可標(biāo)記圖 像B2作為參考基本圖像。完成這些步驟之后,當(dāng)解碼圖像B4時(shí),根據(jù) store—ref—base—pic—flag,圖像B4可使用圖像B2作為參考圖像,其中 圖像B2存儲(chǔ)于解碼圖像緩存區(qū)中,并且被標(biāo)記為參考基本圖像。根據(jù)本發(fā)明的另一實(shí)施例,當(dāng)前NAL單元相應(yīng)于最低質(zhì)量級(jí)別并且包
含參考圖像的條帶時(shí),以下解釋獲得標(biāo)志信息的過(guò)程,此標(biāo)志信息用于表示是否在緩存區(qū)中存儲(chǔ)當(dāng)前NAL單元。例如,此標(biāo)志信息可以僅為用于可伸縮視頻編碼比特流的語(yǔ)法元素。 因此,需要能夠限制此標(biāo)志信息的另一信息以用于編碼解碼器的兼容性。 或者,需要能夠限制此標(biāo)志信息的另一信息以使得比特流格式能被變換。 例如,可定義用于重寫可伸縮視頻編碼比特流的標(biāo)志信息,以滿足編碼解 碼器的兼容性。為了與前一編碼解碼器相容,例如,可伸縮視頻編碼比特流通過(guò)AVC 編碼解碼器被解碼的情況下,需要將可伸縮視頻編碼比特流重寫為AVC比 特流中。這樣的話,限制標(biāo)志信息僅僅可限制應(yīng)用至可伸縮視頻編碼比特 流的語(yǔ)法信息。通過(guò)限定,使用簡(jiǎn)單的變換過(guò)程就可變換可伸縮視頻編碼 比特流為AVC比特流。例如,可表示為slice—header—retriction—flag。 限制標(biāo)志信息可從序列參數(shù)集或子集序列參數(shù)集中獲得?;蛘?,可從子集 序列參數(shù)集的擴(kuò)展區(qū)域中獲得限制標(biāo)志信息??上拗苾H用于特定編碼解碼器的語(yǔ)法元素。例如,當(dāng)前NAL單元相應(yīng) 于最低質(zhì)量級(jí)別并且包含參考圖像的條帶的情況下,可使用限制標(biāo)志信息 在條帶頭處限制標(biāo)志信息,其中此標(biāo)志信息用于表示是否在緩存區(qū)中存儲(chǔ) 當(dāng)前亂單元。尤其,僅僅當(dāng)slice—header—retriction—flag二0時(shí),可 獲得store—ref_base—pic_flag信息。如果slice—header—retriction— flag二l,則無(wú)法獲得store—ref—base—pic—flag信息。這扮演了使可伸 縮視頻編碼比特的條帶頭相等于AVC比特流的頭的角色,從而可由AVC編 碼解碼器實(shí)現(xiàn)解碼。圖4為根據(jù)本發(fā)明的一個(gè)實(shí)施例的存儲(chǔ)參考基本圖像的過(guò)程的流程圖。首先,以下描述中將用到圖3。在試圖解碼與當(dāng)前圖像相對(duì)應(yīng)的圖像 B4的情況下,圖像B4相應(yīng)于包含最低時(shí)間級(jí)別和最低質(zhì)量級(jí)別的圖像。
即,圖像B4可相應(yīng)于由基本表示(baser印resentation)所表示的基本 圖像。因此,圖像B4可參考圖像B2作為基本圖像。為了參考圖像B2,需 要事先將圖像B2存儲(chǔ)于解碼圖像緩存區(qū)中。以下描述中解釋把圖像B2存儲(chǔ)于解碼圖像緩存區(qū)中以使用圖像B2作為參考圖像的過(guò)程。解碼圖像B2時(shí),可從當(dāng)前NAL單元頭的擴(kuò)展區(qū)域中獲得質(zhì)量識(shí)別信 息。質(zhì)量識(shí)別信息表示如同圖2所述的最低值時(shí),圖像B2的當(dāng)前NAL單 元可相應(yīng)于基本圖像。因此,需要根據(jù)所獲得的質(zhì)量識(shí)別信息檢査圖像B2 的當(dāng)前NAL單元是否相應(yīng)于基本圖像(S410)。因?yàn)閳D像B2將被用作參考圖像,這可由NAL單元頭被通知。例如, 可獲得識(shí)別信息(nal—ref—idc),此識(shí)別信息(nal—ref—idc)用于表示 當(dāng)前NAL單元是否包含參考圖像的條帶。根據(jù)此識(shí)別信息,需要檢查圖像 B2的當(dāng)前NAL單元是否包含參考圖像的條帶(S420)。根據(jù)此識(shí)別信息, 如果當(dāng)前NAL單元為基本圖像并且包含參考圖像的條帶,則當(dāng)前NAL單元 可相應(yīng)于參考基本圖像。因此,如果當(dāng)前NAL單元相應(yīng)于最低質(zhì)量級(jí)別并且包含參考圖像的條 帶的話,則執(zhí)行參考圖像標(biāo)記過(guò)程。解碼圖像緩存區(qū)的圖像標(biāo)記過(guò)程中, 參考基本圖像可額外地被標(biāo)記為參考基本圖像。這種情形中,可獲得用于 表示是否存儲(chǔ)此參考基本圖像的標(biāo)志信息。為了獲得此標(biāo)志信息,則不應(yīng) 該存在其他標(biāo)志信息以限制此標(biāo)志信息。例如,需要檢査用于限制對(duì)于編 碼解碼器的兼容性的特別語(yǔ)法的限制標(biāo)志信息(S430)。標(biāo)志信息可以是從子集序列參數(shù)集的擴(kuò)展區(qū)域中獲得的信息。尤其, 假設(shè)用于重寫可伸縮視頻編碼比特流為AVC比特流以用于編碼解碼器的兼 容性的限制標(biāo)志信息為slice—header—retriction—flag。使用此限制標(biāo)志 信息,可表示涉及到序列參數(shù)集的特別語(yǔ)法是否存在于條帶頭內(nèi)?;诖?限制標(biāo)志信息,可獲得用于表示是否在緩存區(qū)中存儲(chǔ)當(dāng)前NAL單元的標(biāo)志
信息(S440)。根據(jù)用于表示是否在緩存區(qū)中存儲(chǔ)當(dāng)前NAL單元的標(biāo)志信息,如果當(dāng) 前網(wǎng)絡(luò)提取層單元被存儲(chǔ),并且如果當(dāng)前網(wǎng)絡(luò)提取層單元并非為IDR圖像, 則可執(zhí)行解碼基本層的參考圖像的標(biāo)記過(guò)程。根據(jù)用于表示是否在緩存區(qū)中存儲(chǔ)當(dāng)前NAL單元的標(biāo)志信息,如果當(dāng) 前NAL單元被存儲(chǔ),并且如果包含此存儲(chǔ)NAL單元的解碼圖像被標(biāo)記為參 考基本圖像,則可使用此參考基本圖像解碼視頻信號(hào)(S450)。例如,如 果根據(jù)標(biāo)志信息圖像B2被存儲(chǔ)并且被標(biāo)記為參考基本圖像,則在解碼作 為當(dāng)前圖像的圖像B4時(shí),可使用圖像B2作為參考圖像。圖5為根據(jù)本發(fā)明的一個(gè)實(shí)施例的用于存儲(chǔ)和標(biāo)記參考基本圖像的 語(yǔ)法結(jié)構(gòu)圖。圖5表示圖4中所解釋的流程圖的技術(shù)構(gòu)思的語(yǔ)法結(jié)構(gòu)的示例。首先,需要在條帶頭中根據(jù)質(zhì)量識(shí)別信息檢査當(dāng)前NAL單元是否相應(yīng) 于基本圖像(S510)。根據(jù)用于表示當(dāng)前NAL單元是否包含參考圖像的條帶的識(shí)別信息 nal—ref—idc,需要檢査當(dāng)前NAL單元是否包含參考圖像的條帶(S520)。如果當(dāng)前NAL單元為基本圖像并且包含參考圖像的條帶,則當(dāng)前NAL 單元可相應(yīng)于參考基本圖像。因此,如果當(dāng)前NAL單元相應(yīng)于此參考基本 圖像,則執(zhí)行參考圖像標(biāo)記過(guò)程(S530)。在解碼圖像緩存區(qū)的圖像標(biāo)記 過(guò)程中,此參考基本圖像可被額外地標(biāo)記為參考基本圖像。這種情形中,可獲得表示是否存儲(chǔ)該參考基本圖像的標(biāo)志信息。為了 獲得此標(biāo)志信息,需要檢查用于限制對(duì)于編碼解碼器的兼容性的特定語(yǔ)法 的限制標(biāo)志信息(S540)。標(biāo)志信息可為從子集序列參數(shù)集的擴(kuò)展區(qū)域中獲得的信息。例如,用 于重寫可伸縮視頻編碼比特流為AVC比特流以用于編碼解碼器的兼容性的 限制標(biāo)志信息可被設(shè)定為slice—header_retriction—flag,通過(guò)限制標(biāo)志 信息,可表示涉及到序列參數(shù)集的特別語(yǔ)法是否存在于條帶頭中。根據(jù)該限制標(biāo)志信息,可獲得用于表示是否存儲(chǔ)此參考基本圖像的標(biāo)志信息(S550)。根據(jù)用于表示是否存儲(chǔ)此參考基本圖像的標(biāo)志信息,如果此參考基本 圖像被存儲(chǔ),并且如果此參考基本圖像并非為IDR圖像(S560),則可執(zhí) 行標(biāo)記解碼的基本層的參考圖像的過(guò)程(S570)?;蛘?,可以檢查表示參考基本圖像是否被用作幀間預(yù)測(cè)過(guò)程中的參考 圖像或者解碼圖像是否被用作參考圖像的標(biāo)志信息。作為檢查的結(jié)果,如 果參考基本圖像被用作參考圖像并且此參考基本圖像并非為IDR圖像 (S560),則可執(zhí)行對(duì)于標(biāo)記解碼的基本層的參考圖像的過(guò)程(S570)。圖6為根據(jù)本發(fā)明的一個(gè)實(shí)施例的用于參考基本圖像的存儲(chǔ)和標(biāo)記 的語(yǔ)法結(jié)構(gòu)的圖。通過(guò)NAL單元處理信號(hào)時(shí),當(dāng)前NAL單元之前的另一 NAL單元可被使 用。此另一NAL單元被稱為"前綴NAL (prefix NAL)"。此前綴NAL單元可用于把僅可被應(yīng)用至SVC的信息傳送到基本層,并 且維持基本層比特流和AVC編碼解碼器之間的兼容性。例如,圖5中所解釋的表示是否存儲(chǔ)參考基本圖像的標(biāo)志信息可包含 于前綴NAL單元中。尤其,根據(jù)表示當(dāng)前NAL單元是否包含參考圖像的條 帶的識(shí)別信息nal—refjdc,需要檢査當(dāng)前NAL單元是否包含參考圖像的 條帶。根據(jù)識(shí)別信息,如果當(dāng)前NAL單元包含參考圖像的條帶,則可獲得 用于表示是否存儲(chǔ)參考基本圖像的標(biāo)志信息。根據(jù)表示是否存儲(chǔ)參考基本圖像的標(biāo)志信息,如果參考基本圖像被存 儲(chǔ)并且參考圖像并非為IDR圖像,則可執(zhí)行標(biāo)記解碼的基本層的參考圖像 的過(guò)程。或者,可檢査表示參考基本圖像是否被用作幀間預(yù)測(cè) (inter-prediction)過(guò)程中的參考圖像或者解碼圖像是否被用作參考圖
像的標(biāo)志信息。作為檢查的結(jié)果,如果參考基本圖像被用作參考圖像,并且如果該參考基本圖像并非為IDR圖像,則可執(zhí)行對(duì)于解碼的基本層的參 考圖像的標(biāo)記過(guò)程。圖7至圖12分別為根據(jù)本發(fā)明的一個(gè)實(shí)施例的用于獲得表示是否在 緩存區(qū)中存儲(chǔ)當(dāng)前NAL單元的標(biāo)志信息的語(yǔ)法結(jié)構(gòu)的圖。圖7所示的實(shí)施例中,用于存儲(chǔ)參考基本圖像的標(biāo)志信息可被定義為 store_base_ref—flag。此標(biāo)志信息可從條帶頭中獲得(S710)。預(yù)定條件可被給出以獲得此標(biāo)志信息。例如,條帶類型并非為PR的 例子,也就是說(shuō),不是表示增強(qiáng)質(zhì)量級(jí)別的條帶類型的例子,其可被稱為 質(zhì)量級(jí)別最低的例子??蓹z査表示是否限制當(dāng)前條帶的特定語(yǔ)法以用于編碼解碼器的兼容 性的信息。例如,可檢查能夠限制此標(biāo)志信息的另一信息,從而使得比特 流的格式能夠被變換。此外,可定義標(biāo)志信息,用于重寫可伸縮視頻編碼比特流以滿足編碼 解碼器的兼容性。如前所述,如果條帶類型并非為PR并且如果沒(méi)有被標(biāo)志信息所限制, 則可獲得用于存儲(chǔ)參考基本圖像的標(biāo)志信息。圖8所示的實(shí)施例中,可定義另一標(biāo)志信息以獲得表示是否在緩存區(qū) 中存儲(chǔ)當(dāng)前NAL單元的標(biāo)志信息。例如,可定義表示參考基本圖像是否被 用作參考圖像的標(biāo)志信息。此標(biāo)志信息表示在幀間預(yù)測(cè)的過(guò)程中參考基本 圖像是否被作參考圖像或者解碼圖像是否被用作參考圖像。對(duì)于具有相同 識(shí)別依賴關(guān)系的信息的NAL單元,此標(biāo)志信息可具有相同值。可在NAL單 元頭的擴(kuò)展區(qū)域中定義該標(biāo)志信息(S810)。可檢査當(dāng)前條帶是否相應(yīng)基本層并且包含最低的質(zhì)量級(jí)別(S820)??蓹z查當(dāng)前條帶是否被用作參考圖像(S830)。可檢査參考基本圖像是否被用作參考圖像(S840)。如果參考基本圖 像被用作參考圖像,則可獲得用于表示是否在緩存區(qū)中存儲(chǔ)當(dāng)前NAL單元 的標(biāo)志信息(S850)。當(dāng)前NAL單元被存儲(chǔ)于緩存區(qū)中之后,如果NAL單元的類型和SVC有 關(guān)(S860),可執(zhí)行解碼圖像的標(biāo)記過(guò)程,其中此解碼圖像包含用作參考 基本圖像的當(dāng)前NAL單元(S870)??蓮臈l帶頭中獲得表示一定條件下是否在緩存區(qū)中存儲(chǔ)當(dāng)前NAL單 元的標(biāo)志信息。例如,如果條帶類型表示增強(qiáng)質(zhì)量級(jí)別的條帶,且相應(yīng)于 劃分質(zhì)量層時(shí)的第一部份,并且如果參考基本圖像被用作參考圖像(S880),可獲得表示是否存儲(chǔ)當(dāng)前NAL單元于緩存區(qū)中的標(biāo)志信息(S890)。圖9所示的實(shí)施例中,表示是否在緩存區(qū)中存儲(chǔ)當(dāng)前NAL單元的標(biāo)志 信息(S930)可采用不同的方式被定義。例如,此標(biāo)志信息可與表示參考 基本圖像是否用作參考圖像的另一標(biāo)志信息(S910) —同被定義于NAL單 元頭的擴(kuò)展區(qū)域中。圖IO所示的實(shí)施例中,通過(guò)使用另一標(biāo)志信息可獲得用于表示是否 在緩存區(qū)中儲(chǔ)存當(dāng)前NAL單元的標(biāo)志信息。例如,可定義用于表示參考基 本圖像是否用作參考圖像的標(biāo)志信息。該標(biāo)志信息可定義于NAL單元頭的 擴(kuò)展區(qū)域中(SIOIO)??蓹z査當(dāng)前條帶是否相應(yīng)于基本層以及當(dāng)前條帶的質(zhì)量級(jí)別是否最 低(S1020)??蓹z査當(dāng)前條帶是否用作參考圖像(S1030)。如果當(dāng)前條帶被用作參考圖像,然后可獲得用于表示是否儲(chǔ)存當(dāng)前 NAL單元于緩存區(qū)中的標(biāo)志信息(S1040)。如果當(dāng)前NAL單元存儲(chǔ)于緩存區(qū)中并且當(dāng)前NAL單元的類型和SVC有 關(guān)(S1050),可執(zhí)行標(biāo)記解碼圖像為參考基本圖像的過(guò)程,其中解碼圖像 包含當(dāng)前NAL單元(S1060)。 表示在一定條件下是否在緩存區(qū)中存儲(chǔ)當(dāng)前NAL 單元的標(biāo)志信息。例如,如果條帶類型不相應(yīng)于增強(qiáng)質(zhì)量級(jí)別的條帶,當(dāng) 前條帶的特定語(yǔ)法不限制對(duì)編碼解碼器的兼容性,并且參考基本圖像用作 參考圖像(S1070),可獲得用于表示是否在緩存區(qū)中存儲(chǔ)當(dāng)前NAL單元的 標(biāo)志信息(S1080)。圖ll所示的實(shí)施例中,使用另一標(biāo)志信息可獲得用于表示是否在緩 存區(qū)中存儲(chǔ)當(dāng)前NAL單元的標(biāo)志信息。例如,可使用表示參考基本圖像是 否用作參考圖像的標(biāo)志信息。例如,如果條帶類型不相應(yīng)于增強(qiáng)質(zhì)量級(jí)別的條帶,并且參考基本圖 像被用作參考圖像,則可獲得用于表示是否在緩存區(qū)中存儲(chǔ)當(dāng)前NAL單元 的標(biāo)志信息(a)。如果參考基本圖像被用作參考圖像,而且沒(méi)有限制對(duì)于編碼解碼器的 兼容性的當(dāng)前條帶的特別語(yǔ)法,則可獲得用于表示是否在緩存區(qū)中存儲(chǔ)當(dāng) 前NAL單元的標(biāo)志信息(b)。檢査參考基本圖像是否被用作參考圖像之后,則可獲得用于表示是否 在緩存區(qū)中存儲(chǔ)當(dāng)前NAL單元的標(biāo)志信息(c)。圖12所示的實(shí)施例中,使用另一標(biāo)志信息可獲得表示是否在緩存區(qū) 中存儲(chǔ)當(dāng)前NAL單元的標(biāo)志信息。例如,如果條帶類型表示增強(qiáng)質(zhì)量級(jí)別的條帶,如果質(zhì)量層被劃分則 可檢査條帶類型是否相應(yīng)第一部份(S1210)??蓹z查參考基本圖像是否用作參考圖像或者當(dāng)前條帶的質(zhì)量級(jí)別是 否表示第一增強(qiáng)質(zhì)量級(jí)別(S1230)。因此,可獲得表示是否在緩存區(qū)中存儲(chǔ)當(dāng)前NAL單元的標(biāo)志信息 (S1250)。如前所述,本發(fā)明的解碼器/編碼器被提供至多媒體廣播,例如固B (數(shù)字多媒體廣播)的廣播發(fā)射機(jī)/接收機(jī),以用于解碼視頻信號(hào)、數(shù)據(jù)信
號(hào)等。多媒體廣播的發(fā)射機(jī)/接收機(jī)可包含移動(dòng)通信終端。一種應(yīng)用本發(fā)明的解碼/編碼方法,被作為用于計(jì)算機(jī)執(zhí)行的程序, 并且存儲(chǔ)在計(jì)算機(jī)可讀記錄介質(zhì)中。并且,具有本發(fā)明的數(shù)據(jù)結(jié)構(gòu)的多媒 體數(shù)據(jù)可以被存儲(chǔ)在計(jì)算機(jī)可讀記錄介質(zhì)中。計(jì)算機(jī)可讀記錄介質(zhì)包括用 于存儲(chǔ)計(jì)算機(jī)系統(tǒng)可讀數(shù)據(jù)的各種類型的存儲(chǔ)設(shè)備。計(jì)算機(jī)可讀記錄介質(zhì)包括R0M、 RAM、 CD-R0M、磁帶、軟盤、光盤存儲(chǔ)設(shè)備等,并且還包括用載 波實(shí)現(xiàn)的設(shè)備(例如,通過(guò)因特網(wǎng)的傳輸)。并且,由編碼方法所生成的 比特流被存儲(chǔ)在計(jì)算機(jī)可讀介質(zhì)中或通過(guò)有線/無(wú)線通信網(wǎng)絡(luò)被傳輸。工業(yè)實(shí)用性盡管本發(fā)明已參照其優(yōu)選實(shí)施例進(jìn)行了描述及說(shuō)明,很明顯本領(lǐng)域的 技術(shù)人員可對(duì)其進(jìn)行各種修改及變化,而不脫離本發(fā)明的精神或范疇。因 此,本發(fā)明覆蓋所附的權(quán)利要求書及其等同的范圍中所提供本發(fā)明的修改 及變化。
權(quán)利要求
1、一種利用時(shí)域和可伸縮域上的部分參考來(lái)解碼可伸縮視頻信號(hào)的方法,所述方法包括獲得第一時(shí)間點(diǎn)上的第一部分圖像;參考所述第一部分圖像解碼完整圖像,所述完整圖像位于第二時(shí)間點(diǎn),所述第二時(shí)間點(diǎn)位于所述第一時(shí)間點(diǎn)之后;其中,所述第一部分圖像的可伸縮域上的級(jí)別低于所述完整圖像的可伸縮域上的級(jí)別。
2、 根據(jù)權(quán)利要求1所述的方法,其中,利用對(duì)第二部分圖像的可伸 縮解碼來(lái)解碼所述完整圖像,所述第二部分圖像位于所述第二時(shí)間點(diǎn),并 且相應(yīng)于所述第一時(shí)間點(diǎn)上的所述第一部分圖像。
3、 根據(jù)權(quán)利要求1所述的方法,進(jìn)一步包括獲得用于限制語(yǔ)法的 限制標(biāo)志信息,所述語(yǔ)法相應(yīng)于比特流中的部分參考信息。
4、 一種解碼視頻信號(hào)的方法,所述方法包括獲得當(dāng)前NAL單元的質(zhì)量級(jí)別;確定所述當(dāng)前NAL單元是否包含參考圖像的條帶;當(dāng)所述當(dāng)前NAL單元相應(yīng)于最低質(zhì)量級(jí)別且所述當(dāng)前NAL單元包含所 述參考圖像的條帶時(shí),獲得表示是否在緩存區(qū)中存儲(chǔ)所述當(dāng)前NAL單元的 第一標(biāo)志信息;和基于所述第一標(biāo)志信息把解碼圖像標(biāo)記為參考基本圖像,其中,所述 當(dāng)前NAL單元被包括在所述解碼圖像中。
5、 根據(jù)權(quán)利要求4所述的方法,進(jìn)一步包括通過(guò)利用所述被標(biāo)記 的參考基本圖像來(lái)解碼視頻信號(hào)。
6、 根據(jù)權(quán)利要求4所述的方法,其中,所述參考基本圖像相應(yīng)于最低時(shí)間級(jí)別。
7、 根據(jù)權(quán)利要求4所述的方法,其中,從條帶頭獲得所述第一標(biāo)志 信息。
8、 根據(jù)權(quán)利要求4所述的方法,其中,從所述當(dāng)前NAL單元之前的 NAL單元的RBSP獲得所述第一標(biāo)志信息。
9、 根據(jù)權(quán)利要求4所述的方法,進(jìn)一步包括檢查限制標(biāo)志信息,所 述限制標(biāo)志信息用于限制對(duì)于編碼解碼器的兼容性的特定語(yǔ)法,其中,基 于所述限制標(biāo)志信息獲得所述第一標(biāo)志信息。
10、 根據(jù)權(quán)利要求9所述的方法,其中,從子集序列參數(shù)集的擴(kuò)展區(qū)域獲得所述限制標(biāo)志信息。
11、 根據(jù)權(quán)利要求9所述的方法,其中,如果根據(jù)所述第一標(biāo)志信息 存儲(chǔ)所述NAL單元,并且如果所述當(dāng)前NAL單元為非IDR圖像,那么包含 所述NAL單元的解碼圖像被標(biāo)記為所述參考基本圖像。
12、 根據(jù)權(quán)利要求9所述的方法,進(jìn)一步包括獲得表示所述參考基本 圖像是否被用作參考圖像的第二標(biāo)志信息,進(jìn)一步基于所述第二標(biāo)志信息 當(dāng)所述參考基本圖像為非IDR圖像時(shí)標(biāo)記所述解碼圖像。
13、 根據(jù)權(quán)利要求4所述的方法,進(jìn)一步包括 獲得用于限制對(duì)于編碼解碼器的兼容性的特定語(yǔ)法的限制標(biāo)志信息;禾口基于所述限制標(biāo)志信息,獲得劃分質(zhì)量層所需的信息; 其中,所述信息是對(duì)于變換系數(shù)級(jí)別的掃描位置信息。
14、 根據(jù)權(quán)利要求4所述的方法,其中,所述視頻信號(hào)以廣播信號(hào)被接收。
15、 根據(jù)權(quán)利要求4所述的方法,其中,所述視頻信號(hào)通過(guò)數(shù)字媒體 被接收。
16、 一種介質(zhì),其上記錄了用于執(zhí)行權(quán)利要求4的方法的程序,所述介質(zhì)被配置來(lái)通過(guò)電腦被讀出。
17、 一種用于解碼視頻信號(hào)的裝置,所述裝置包括-識(shí)別信息檢査單元,用于檢查當(dāng)前NAL單元的質(zhì)量級(jí)別,并且用于檢 查所述當(dāng)前NAL單元是否包含參考圖像的條帶;和解碼圖像緩存區(qū)單元,根據(jù)所述識(shí)別信息檢査單元的檢查結(jié)果,如果 所述當(dāng)前NAL單元相應(yīng)于最低質(zhì)量級(jí)別并且包含所述參考圖像的條帶,所 述解碼圖像緩存區(qū)單元基于表示是否在緩存區(qū)中存儲(chǔ)所述當(dāng)前NAL單元的 第一標(biāo)志信息,標(biāo)記包含所述NAL單元的解碼圖像為參考基本圖像。
全文摘要
本發(fā)明提供一種通過(guò)利用時(shí)域和可伸縮域上的部分圖像參考來(lái)解碼可伸縮視頻信號(hào)的方法,其包括獲得第一時(shí)間點(diǎn)上的第一部分圖像;參考該第一部分圖像解碼完整圖像,該完整圖像位于第二時(shí)間點(diǎn),該第二時(shí)間點(diǎn)位于該第一時(shí)間點(diǎn)之后;其中,該第一部分圖像的可伸縮域上的級(jí)別低于該完整圖像的可伸縮域上的級(jí)別。
文檔編號(hào)H04N7/26GK101401433SQ200780008303
公開(kāi)日2009年4月1日 申請(qǐng)日期2007年9月7日 優(yōu)先權(quán)日2006年9月7日
發(fā)明者全柄文, 樸志皓, 樸勝煜 申請(qǐng)人:Lg電子株式會(huì)社