專利名稱:基于碼率控制的可伸縮多描述視頻編碼結(jié)構(gòu)設(shè)計(jì)方法
技術(shù)領(lǐng)域:
本發(fā)明屬于視頻編碼及網(wǎng)絡(luò)傳輸領(lǐng)域。特別涉及基于碼率控制的可伸縮 多描述視頻編碼結(jié)構(gòu)設(shè)計(jì)方法。
背景技術(shù):
Internet的無(wú)連接包轉(zhuǎn)發(fā)機(jī)制主要是為了解決突發(fā)性的數(shù)據(jù)傳輸而設(shè) 計(jì)的,帶寬變化、網(wǎng)絡(luò)擁塞均將造成包數(shù)據(jù)的丟失,其本身并不能很好地適 應(yīng)可伸縮視頻碼流的傳輸。對(duì)于傳統(tǒng)的可伸縮視頻碼流(Scalable Video Coding , SVC) —旦丟失了基本層的數(shù)據(jù),即使接收再多的增強(qiáng)層數(shù)據(jù)也 無(wú)法正常解碼出視頻。可伸縮多描述編碼是一種在信源編碼端利用碼流間冗 余度,換取穩(wěn)定性傳輸?shù)挠行Х椒ā?缮炜s多描述編碼技術(shù)的基本思想是 把視頻序列編碼成兩個(gè)或多個(gè)重要性相同的視頻編碼碼流,即視頻描述。每 個(gè)描述都可獨(dú)立打包成可伸縮碼流并在相互獨(dú)立的信道上傳輸。只要這些描 述不是同時(shí)受到數(shù)據(jù)丟失的影響,那么在接收端根據(jù)這些描述所包含的信息 可獲得質(zhì)量可接受的視頻。為了保證從任意一個(gè)描述中都可以恢復(fù)出一定質(zhì) 量的視頻,各個(gè)描述之間將會(huì)含有一定的冗余信息,并假設(shè)同一視頻在多路 徑傳輸過(guò)程中多個(gè)描述同時(shí)丟失信息(尤其是丟失基本層信息)的概率非常 小。這使得可伸縮多描述編碼成為一種可靠的視頻編碼方法。
目前的可伸縮多描述視頻編碼技術(shù)可以分為基于量化的可伸縮多描述 編碼技術(shù)是對(duì)同一信源使用多個(gè)不同的量化過(guò)程,以產(chǎn)生不同的量化結(jié)果; 在基于變換的可伸縮多描述編碼的過(guò)程中通過(guò)成對(duì)的相關(guān)性變換或普通變換產(chǎn)生不同的描述;基于運(yùn)動(dòng)矢量的可伸縮多描述編碼技術(shù)是將運(yùn)動(dòng)矢量信 息包含在不同的描述中;基于運(yùn)動(dòng)補(bǔ)償?shù)目缮炜s多描述編碼技術(shù)通常采用高 階預(yù)測(cè)來(lái)增強(qiáng)預(yù)測(cè)之間的相關(guān)性,然后將編碼得到的數(shù)據(jù)打上奇幀或偶幀的 標(biāo)記,平均分配到不同的描述中。
現(xiàn)在的大多數(shù)可伸縮多描述算法都是在視頻序列的時(shí)間和空間冗余度 上作處理,很少有通過(guò)碼率控制實(shí)現(xiàn)可伸縮多描述視頻編碼的。基于碼率控 制的可伸縮多描述技術(shù)就是從碼率截?cái)喾矫嬷值囊环N技術(shù),其通過(guò)將熵編 碼之后的碼流按照不同的方式打包以形成可伸縮多描述視頻碼流。這種技術(shù) 在寞體實(shí)施中較為簡(jiǎn)單方便,多描述的解碼和單描述解碼可以融為一體,是 一種有效的可伸縮多描述視頻編碼技術(shù)。
發(fā)明內(nèi)容
'
本發(fā)明的目的在于克服上述現(xiàn)有技術(shù)不足,提供一種基于碼率控制的可 伸縮多描述視頻編碼結(jié)構(gòu)設(shè)計(jì)方法,該方法能夠減小有損網(wǎng)絡(luò)傳輸對(duì)視頻觀 看效果的影響,使得客戶端接收到相對(duì)穩(wěn)定的視頻觀看效果。
為了實(shí)現(xiàn)上述任務(wù),本發(fā)明采用的技術(shù)解決方案是
實(shí)現(xiàn)基于拉格朗日碼率控制的可伸縮多描述視頻編碼設(shè)計(jì)方法,
首先對(duì)原始視頻進(jìn)行傳統(tǒng)的沿象素運(yùn)動(dòng)軌跡的時(shí)域運(yùn)動(dòng)補(bǔ)償濾波,消除 視頻幀之間的時(shí)域相關(guān)性;
然后對(duì)時(shí)域?yàn)V波得到的時(shí)域高低頻幀進(jìn)行空域二維離散小波變換,并對(duì)
小波分解后的小波系數(shù)進(jìn)行量化以及熵編碼;
隨后通過(guò)將編碼后的碼流結(jié)果以碼塊為基本單位分成兩類或多類,對(duì)不 同的碼塊采用不同的碼率進(jìn)行截?cái)嗲度胧酱a率控制,形成兩個(gè)或多個(gè)描述子 碼流,從而得到在時(shí)間、空間和質(zhì)量上均可伸縮的多描述視頻描述碼流;
最后將不同的視頻描述碼流在相互獨(dú)立的信道上進(jìn)行多路徑傳輸。
4所述的在對(duì)編碼后的結(jié)果進(jìn)行分類,利用拉格朗日不等式的性質(zhì)以及視 頻中的碼率一失真特性將視頻幀中碼塊分為兩類或者多類,并針對(duì)不同類的 碼塊分配不同的最大可容碼率,首先根據(jù)利用拉格朗日不等式的性質(zhì)以及視
頻中的碼率一失真特性將視頻幀中碼塊分為兩類,任一類A為描述一 的精細(xì)
描述,包括低頻子帶,另一類B為描述一的粗糙描述;同樣類B包括低頻子
帶為描述二的精細(xì)描述,類A為描述二的粗糙描述,所謂精細(xì)描述是指對(duì)相
應(yīng)碼塊分配較多得碼率,使得其可以有較小的失真,粗糙描述是指對(duì)相應(yīng)碼
塊分配較少得碼率,使得其可以有較大的失真,對(duì)于精細(xì)描述,采用較大的
碼率進(jìn)行三維碼率控制;對(duì)于粗糙描述,采用較小得碼率進(jìn)行三維碼率控制;
碼率控制后按照視頻流的格式對(duì)兩個(gè)描述分別打包,即形成了兩個(gè)重要性相
同的可伸縮多描述視頻編碼結(jié)果。
本發(fā)明是一種在信源編碼端利用碼流間冗余度,提高穩(wěn)定性傳輸?shù)挠行Х?br>
法。該技術(shù)提供了支持基于拉格朗日碼率控制的多描述可伸縮數(shù)字視頻編解碼結(jié)
構(gòu)設(shè)計(jì)方法,使得客戶端可以從不同的傳輸信道中獲得一定質(zhì)量的視頻碼流,從
而獲得較為穩(wěn)定的觀看質(zhì)量,更加適應(yīng)新型視頻媒體應(yīng)用的發(fā)展。
圖l是本發(fā)明系統(tǒng)結(jié)構(gòu)示意圖2是本發(fā)明可伸縮多描述碼流的多路徑傳輸示意圖。
圖3是本發(fā)明運(yùn)動(dòng)補(bǔ)償時(shí)域?yàn)V波技術(shù)。
圖4是本發(fā)明基于拉格朗日方法的幀碼塊劃分示意圖。
圖4(a)表示碼率截?cái)嗪蜻x截?cái)帱c(diǎn)的選取。
圖4(b)表示碼率截?cái)嗪笄度胧酱a流的結(jié)構(gòu)。
圖5是本發(fā)明可截?cái)嗲度胧酱a率控制技術(shù)。圖6是本發(fā)明基于拉格朗日碼率控制方法的碼率控制流程圖。 下面結(jié)合附圖對(duì)本發(fā)明的內(nèi)容作進(jìn)一步詳細(xì)說(shuō)明。
具體實(shí)施例方式
本發(fā)明在空間可伸縮、時(shí)間可伸縮、質(zhì)量可伸縮技術(shù)的基礎(chǔ)上進(jìn)一步實(shí) 現(xiàn)視頻碼流的不同插述編碼。
由于碼塊間的碼率-失真曲線擁有一定的聯(lián)系性,可以將視頻幀中的碼 塊分為兩類,該編碼技術(shù)通過(guò)在碼率控制部分對(duì)視頻幀中不同類的碼塊采用 不同的碼率控制約束條件,從而獲得同一視頻內(nèi)容重要性相同的不同編碼碼 流,這些碼流在網(wǎng)絡(luò)中利用不同的信道單獨(dú)傳輸。如果一個(gè)視頻描述的數(shù)據(jù) 包因?yàn)榫W(wǎng)絡(luò)帶寬變化、網(wǎng)絡(luò)擁塞造成丟失、延遲,客戶端可以根據(jù)另一個(gè)描 述進(jìn)行視頻的解碼,從而提高客戶端觀看的可靠性;如果客戶端可以接收到
多個(gè)視頻描述,由于描述間擁有不同的信息內(nèi)容,那么客戶端將會(huì)獲得更好 的主觀和客觀視覺(jué)效果。
本發(fā)明實(shí)現(xiàn)了以上基于拉格朗日碼率控制的可伸縮多描述編解碼技術(shù), 并將其應(yīng)用于網(wǎng)絡(luò)傳輸中,用戶可根據(jù)網(wǎng)絡(luò)傳輸?shù)木唧w情況來(lái)獲取相應(yīng)質(zhì)量 以及穩(wěn)定性的視頻碼流。
按照上述技術(shù)方案,發(fā)明人在編解碼系統(tǒng)中,采用運(yùn)動(dòng)補(bǔ)償時(shí)域?yàn)V波
(MCTF),濾波器選取5-3小波或Haar小波??沼虿捎昧?5-3小波,9-7小 波或Haar小波。編碼時(shí)采用嵌入式碼塊優(yōu)化截?cái)嗑幋a技術(shù)、位平面編碼和 上下文自適應(yīng)熵編碼技術(shù)。
參照?qǐng)D1所示,首先對(duì)原始視頻進(jìn)行傳統(tǒng)的沿象素運(yùn)動(dòng)軌跡的時(shí)域運(yùn)動(dòng)
補(bǔ)償濾波(MCTF),消除視頻序列的時(shí)域相關(guān)性,然后對(duì)時(shí)域?yàn)V波得到的
時(shí)域高低頻幀進(jìn)行空域二維小波變換(DWT),并經(jīng)過(guò)嵌入式編碼器編碼對(duì)
小波系數(shù)進(jìn)行量化以及編碼。隨后將編碼后的結(jié)果分成兩個(gè)不同的描述通過(guò)"三維碼率控制(3DEBCOT)"對(duì)已生成的嵌入式碼流在時(shí)間、空間和質(zhì)量
上進(jìn)行不同的碼流截?cái)?。生成的每個(gè)描述碼流在不同的碼塊中所含的信息是 擁有一定冗余的,僅僅單獨(dú)依靠單個(gè)描述也可以恢復(fù)出一定質(zhì)量的視頻,如 果可以同時(shí)接收到兩個(gè)描述,那么客戶端的主觀以及客觀觀看效果要比僅接 受到一個(gè)描述的效果有一定的提高。
參照?qǐng)D2所示,0節(jié)點(diǎn)是服務(wù)器端,負(fù)責(zé)向其它節(jié)點(diǎn)傳輸不同的視頻碼 流;1、 2節(jié)點(diǎn)分別接受0節(jié)點(diǎn)傳輸出的一種視頻描述,并將其所接收到的 描述通過(guò)網(wǎng)絡(luò)傳輸給3、 4節(jié)點(diǎn)。根據(jù)不同的網(wǎng)絡(luò)穩(wěn)定性,對(duì)于3, 4節(jié)點(diǎn)分 別有三種不同的接收情況,即只接收視頻描述一或者描述二的情況以及兩個(gè) 描述均接收到的情況。
參照?qǐng)D3所示,對(duì)于每一組幀,首先通過(guò)運(yùn)動(dòng)估計(jì)確定運(yùn)動(dòng)軌跡,然后
沿運(yùn)動(dòng)軌跡進(jìn)行完全可重構(gòu)的時(shí)域小波分解得到時(shí)域低頻幀和高頻幀,將能 量集中到低頻幀,而運(yùn)動(dòng)細(xì)節(jié)用高頻幀表示,從而消除幀間的相關(guān)性,同時(shí) 還可以提供時(shí)域可伸縮性。圖中黑色視頻幀為運(yùn)動(dòng)補(bǔ)償時(shí)域?yàn)V波技術(shù)的最終 輸出結(jié)果,而陰影視頻幀為中間計(jì)算結(jié)果。
參照?qǐng)D4所示,.圖中所示為一個(gè)視頻組(GOP)中各個(gè)幀的碼塊劃分情 況。其中幀內(nèi)實(shí)線表示二維小波分解后的子帶劃分情況,虛線為子帶內(nèi)的碼 塊劃分情況。
首先建立一個(gè)最為簡(jiǎn)單的多路徑傳輸結(jié)構(gòu),如圖2。圖2中的0節(jié)點(diǎn)是 服務(wù)器端,負(fù)責(zé)向其它節(jié)點(diǎn)傳輸不同的視頻碼流;1、 2節(jié)點(diǎn)分別接受0節(jié) 點(diǎn)傳輸出的一種視頻描述,并將其所接收到的描述通過(guò)網(wǎng)絡(luò)傳輸給3、 4節(jié) 點(diǎn)。根據(jù)不同的網(wǎng)絡(luò)穩(wěn)定性,對(duì)于3, 4節(jié)點(diǎn)分別有三種不同的接收情況, 即只接收視頻描述一或者描述二的情況以及兩個(gè)描述均接收到的情況。設(shè)A和A分別為只收到描述一和描述二時(shí)的失真度,A和^為只收到描述一和描述二時(shí)的概率,D。為兩個(gè)描述均接收到時(shí)的失真度,^為兩個(gè)描述均接收到的概率,《和A'為兩個(gè)描述的實(shí)際碼率,i ;和《為兩個(gè)描述的最大可容
碼率。如果要使這兩個(gè)節(jié)點(diǎn)滿足冗余度最小且編碼效果較好的條件,則需要
輛足:
1) 平均失真度5 = ;^0。+;^1+/721)2最小。
2) a《。
根據(jù)拉格朗日原理,如果要滿足上述兩個(gè)要求,要只需要求式i)的最小
值'
■/ = /VD0 +jPlA +P2"2 -iO + p2(i 2 -《)
由于式(i)中i ;和《均為常數(shù),可以將式(i)化簡(jiǎn)為:
(i)
J" = +52D2+/ 2i 2 (2)
如果式(2)中的每一個(gè)部分均由各個(gè)碼塊數(shù)據(jù)之和表示,則推導(dǎo)出式
(3)
_ _ JV JV JV
7 = 2《+1^2,+《1]《+《1^2,+^1^'+^1^2,
/e/2 ,=1 ,=2 z=l /=2
(3)
其中《表示描述一中各個(gè)碼塊的失真度,《表示描述二中各個(gè)碼塊的失真度,化表示描述一中各個(gè)碼塊的碼流長(zhǎng)度,同理&表示描述二中各個(gè)碼塊的碼流長(zhǎng)度。對(duì)式(3)求其偏導(dǎo)并令其結(jié)果為O。可以得到式(4)
l +《
碼塊屬于該描述碼塊不屬于該描述
因此可以將碼塊按照碼率失真特性分為兩個(gè)子類^、 ^。"描述-
(4)'"中^類碼塊利用i ;值進(jìn)行可伸縮碼流截?cái)?,^類碼塊利用《進(jìn)行可伸縮碼流截 斷;"描述二"則反之。這樣就形成了兩個(gè)不同的可伸縮描述。
由于這種方法需要先遍歷視頻幀中的所有碼塊,所消耗的時(shí)間復(fù)雜度比 較高,且運(yùn)算較為復(fù)雜,在此方法基礎(chǔ)上可以選用較為簡(jiǎn)單的方法,如圖2 所示,對(duì)于描述一,深色部分用《>《進(jìn)行碼率截?cái)啵瑴\色部分用《進(jìn)行碼
率截?cái)?,由于i 一《則可認(rèn)為利用i ;進(jìn)行碼率截?cái)嗟牟糠譃槊枋鲆坏木?xì)描 述,利用《進(jìn)行碼率截?cái)酁槊枋鲆坏拇致悦枋?。同理?duì)于描述二,對(duì)深色部
分進(jìn)行粗略描述,對(duì)淺色部分進(jìn)行精細(xì)描述。由于LL子帶的信息非常重要,
且對(duì)解碼后視頻的主觀、客觀觀看效果有很大的影響,因此無(wú)論描述一還是
描述二都對(duì)LL子帶進(jìn)行精細(xì)描述碼率截?cái)唷?br>
參照?qǐng)D5所示,視頻幀中每一個(gè)碼塊都對(duì)應(yīng)一條碼率-失真度曲線。一 般來(lái)說(shuō),失真度會(huì)隨著碼率的增大而減小,即碼率-失真度曲線的斜率會(huì)單 調(diào)遞減。根據(jù)此可以選擇嵌入式編碼碼率控制的候選截?cái)帱c(diǎn),如圖5(a),所 有的候選解斷點(diǎn)均是可能的碼率控制截?cái)帱c(diǎn)。選取候選解斷點(diǎn)之后按照希望 碼率-失真度閾值將熵編碼后的碼流分成不同的層,如圖5(b)所示。每一層
都是根據(jù)客戶端網(wǎng)絡(luò)傳輸路徑中對(duì)碼率的需求,去分配不超過(guò)傳輸路徑中設(shè) 定的碼流大小的熵編碼碼字。在客戶端解碼時(shí),客戶所獲取的累計(jì)層數(shù)的碼 流越多,解碼出來(lái)的圖像質(zhì)量越好。
參照?qǐng)D6所示,首先,按照?qǐng)D4所示方法劃分精細(xì)粗糙描述,然后分別 對(duì)每個(gè)描述的各個(gè)碼塊進(jìn)行精細(xì)粗糙碼塊的判斷。所述精細(xì)描述為分配了較 多碼率的碼塊,解碼后其所含信息主觀效果更為清晰;所述粗糙描述為分配 了較少碼率的碼塊,解碼后其所含信息的主觀效果相對(duì)模糊。若是精細(xì)碼塊 則采用較大碼率經(jīng)行碼率控制,否則采用較小碼率經(jīng)行碼率控制。最后對(duì)每個(gè)描述的各個(gè)碼塊按照標(biāo)準(zhǔn)掃描次序(Z字型掃描)依次打包,從而形成不 同的描述。
本發(fā)明提供的具有時(shí)間、空間、質(zhì)量及復(fù)雜度可伸縮及聯(lián)合可伸縮的多 描述視頻編碼設(shè)計(jì)方法,可以滿足視頻流媒體異構(gòu)傳輸網(wǎng)絡(luò)服務(wù)和用戶多樣 性的需求。具體包括
1) 通過(guò)"運(yùn)動(dòng)補(bǔ)償時(shí)域?yàn)V波技術(shù)",對(duì)原始視頻消除幀間的時(shí)域冗余。
2) 通過(guò)"熵編碼技術(shù)",對(duì)消除時(shí)域冗余后的視頻紋理信息的進(jìn)行有效 的編碼。
3) 通過(guò)"拉格朗日特性的碼率控制技術(shù)",對(duì)編碼后的信息分成兩個(gè)或 者多個(gè)不同的類別。
4) 通過(guò)"三維可截?cái)嗲度胧酱a率控制技術(shù)",對(duì)分類后的編碼信息根據(jù) 不同的需求實(shí)現(xiàn)碼流的任意截?cái)?,以?shí)現(xiàn)不同視頻描述的生成;
5) 通過(guò)"多路徑傳輸技術(shù)",將生成的多個(gè)視頻描述子獨(dú)立傳輸。
6) 以上的步驟整體稱為"拉格朗日碼率控制的可伸縮多描述編解碼技 術(shù)系統(tǒng)架構(gòu)",對(duì)原始視頻碼流進(jìn)行可伸縮多描述視頻編碼。
所述"拉格朗日碼率控制的可伸縮多描述編解碼技術(shù)體系統(tǒng)架構(gòu)"是指,
把視頻序列編碼成多個(gè)描述子,每個(gè)描述子的比特流具有完全可分級(jí)性的視 頻編碼方法。它通過(guò)一次編碼將視頻組成不同描述子的碼流,在這樣多樣化 需求的環(huán)境下,可以根據(jù)用戶的需求自適應(yīng)的選擇需要傳輸?shù)拇a流,即實(shí)現(xiàn) 一次編碼多描述多層解碼。這種靈活的碼流組織模式既能充分利用當(dāng)前的網(wǎng) 絡(luò)帶寬的條件,又可以滿足終端的多樣性、網(wǎng)絡(luò)的異構(gòu)性等視頻通信和網(wǎng)絡(luò) 傳輸需求。
所述"運(yùn)動(dòng)補(bǔ)償時(shí)域?yàn)V波技術(shù)"是指,通過(guò)運(yùn)動(dòng)估計(jì)確定運(yùn)動(dòng)軌跡,然 后沿運(yùn)動(dòng)軌跡進(jìn)行完全可重構(gòu)的時(shí)域小波分解得到時(shí)域低頻幀和高頻幀,將能量集中到低頻幀,而運(yùn)動(dòng)細(xì)節(jié)用高頻幀表示,從而消除幀間的相關(guān)性。
所述"熵編碼技'術(shù)"是指,通過(guò)位平面編碼技術(shù)和算術(shù)編碼技術(shù),對(duì)時(shí) 域空域小波變換后的小波系數(shù)進(jìn)行不定長(zhǎng)編碼,以獲得視頻紋理信息的編碼 碼流。其主要?dú)i驟包括兩部分,首先利用位平面編碼產(chǎn)生對(duì)應(yīng)每個(gè)碼字的上 下文,然后采取基于上下文的自適應(yīng)算術(shù)編碼實(shí)現(xiàn)壓縮編碼。
所述"基于拉格朗日特性的碼率控制技術(shù)"是指,利用拉格朗日不等式 的性質(zhì)以及視頻中的碼率一失真特性將視頻幀中碼塊分為兩類或者多類,并 針對(duì)不同類的碼塊分配不同的最大可容碼率以產(chǎn)生重要性相同但內(nèi)容不同 的視頻編碼碼流,即視頻描述編碼(視頻中的每一幀均可劃分為互相獨(dú)立的 碼塊)。然后將每一個(gè)視頻描述單獨(dú)打包,并在相互獨(dú)立的信道上向客戶端 傳輸。生成的每個(gè)描述碼流在不同的碼塊中所含的信息是擁有一定冗余的, 僅僅單獨(dú)依靠單個(gè)描述也可以恢復(fù)出一定質(zhì)量的視頻,如果可以同時(shí)接收到 兩個(gè)描述,那么客戶端的主觀以及客觀觀看效果要比僅接受到一個(gè)描述的效 果有一定的提高。
所述"可截?cái)嗲度胧酱a率控制技術(shù)"是指,把壓縮生成的碼流可劃分成 若干子集,每一個(gè)子集表示對(duì)源視頻圖像的一個(gè)壓縮。嵌入式碼流可在任意 一處候選截?cái)帱c(diǎn)被截?cái)?,得到不同碼率或質(zhì)量的重構(gòu)圖像。根據(jù)傳輸路徑和 客戶端的需求對(duì)編碼結(jié)果進(jìn)行截?cái)?,將原始視頻碼流分成不同的層表示,以 達(dá)到在相同碼流長(zhǎng)度時(shí)的最優(yōu)編碼結(jié)果。
所述"多路徑傳輸技術(shù)"是指,把視頻的每個(gè)描述子按照不同的傳輸路 徑傳輸?shù)侥康墓?jié)點(diǎn),從而實(shí)現(xiàn)視頻的多個(gè)描述子的獨(dú)立傳輸。目的節(jié)點(diǎn)根據(jù) 接收到的描述子數(shù)目進(jìn)行解碼,隨著描述子數(shù)目的增多,是視頻的解碼質(zhì)量 也隨之提高。
權(quán)利要求
1. 基于碼率控制的可伸縮多描述視頻編碼結(jié)構(gòu)設(shè)計(jì)方法,其特征在于,具體包括下列步驟首先對(duì)原始視頻進(jìn)行傳統(tǒng)的沿象素運(yùn)動(dòng)軌跡的時(shí)域運(yùn)動(dòng)補(bǔ)償濾波,消除視頻幀之間的時(shí)域相關(guān)性;然后對(duì)時(shí)域?yàn)V波得到的時(shí)域高低頻幀進(jìn)行空域二維離散小波變換,并對(duì)小波分解后的小波系數(shù)進(jìn)行量化以及熵編碼;隨后通過(guò)將編碼后的碼流結(jié)果以碼塊為基本單位分成兩類或多類,對(duì)不同的碼塊采用不同的碼率進(jìn)行截?cái)嗲度胧酱a率控制,形成兩個(gè)或多個(gè)描述子碼流,從而得到在時(shí)間、空間和質(zhì)量上均可伸縮的多描述視頻描述碼流;最后將不同的視頻描述碼流在相互獨(dú)立的信道上進(jìn)行多路徑傳輸。
2、 根據(jù)權(quán)利要求1所述的基于碼率控制的可伸縮多描述視頻編碼結(jié)構(gòu)設(shè)計(jì)方法,其特征在于,所述的在對(duì)編碼后的結(jié)果進(jìn)行分類,利用拉格朗日不等式的性質(zhì)以及視頻中的碼率一失真特性將視頻幀中碼塊分為兩類或者多類,并針對(duì)不同類的碼塊分配不同的最大可容碼率,首先根據(jù)利用拉格朗日不等式的性質(zhì)以及視頻中的碼率一失真特性將視頻幀中碼塊分為兩類,任一類A為描述一的精細(xì)描述,包括低頻子帶,另一類B為描述一的粗糙描述;同樣類B包括低頻子帶為描述二的精細(xì)描述,類A為描述二的粗糙描述,所謂精細(xì)描述是指對(duì)相應(yīng)碼塊分配較多得碼率,使得其可以有較小的失真,粗糙描述是指對(duì)相應(yīng)碼塊分配較少得碼率,使得其可以有較大的失真,對(duì)于精細(xì)描述,采用較大的碼率進(jìn)行三維碼率控制;對(duì)于粗糙描述,采用較小得碼率進(jìn)行三維碼率控制;碼率控制后按照視頻流的格式對(duì)兩個(gè)描述分別打包,即形成了兩個(gè)重要性相同的可伸縮多描述視頻編碼結(jié)果。
全文摘要
本發(fā)明公開(kāi)了一種基于碼率控制的可伸縮多描述視頻編碼結(jié)構(gòu)設(shè)計(jì)方法。是對(duì)同一個(gè)視頻采用兩個(gè)或多個(gè)重要性相同的描述。通過(guò)“運(yùn)動(dòng)補(bǔ)償時(shí)域?yàn)V波技術(shù)”,消除時(shí)域冗余;通過(guò)“熵編碼技術(shù)”,實(shí)現(xiàn)三維小波系數(shù)的多描述視頻紋理信息的有效編碼;通過(guò)“拉格朗日特性的碼率控制技術(shù)”,實(shí)現(xiàn)不同視頻描述的形成;通過(guò)“三維可截?cái)嗲度胧酱a率控制技術(shù)”,實(shí)現(xiàn)碼流的任意截?cái)?,以滿足不同質(zhì)量的視頻解碼結(jié)果;通過(guò)“多路徑傳輸技術(shù)”,實(shí)現(xiàn)多個(gè)描述子的獨(dú)立傳輸。
文檔編號(hào)H04N7/26GK101478677SQ20081023644
公開(kāi)日2009年7月8日 申請(qǐng)日期2008年12月24日 優(yōu)先權(quán)日2008年12月24日
發(fā)明者蘭旭光, 苗 惠, 策 李, 斌 王, 薛建儒, 趙松霖, 鄭南寧 申請(qǐng)人:西安交通大學(xué)