作為到視頻序列的附加通道的深度代碼化的制作方法

文檔序號：7914770閱讀：228來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>電子通信裝置的制造及其應(yīng)用技術(shù)

專利名稱：作為到視頻序列的附加通道的深度代碼化的制作方法
技術(shù)領(lǐng)域：
本申請涉及諸如3D視頻圖像的視頻圖像中的深度代碼化。
背景技術(shù)：
3D再次變?yōu)槲说募夹g(shù)，并且這次，其獲得來自內(nèi)容提供商的支持。還具有3D能力的大多數(shù)新動畫電影和很多影片將被發(fā)布并且可以廣泛遍及全國在3D電影院中觀看。而且，存在對體育事件的實時廣播的多種測試，例如NBA和NFL比賽。為了使3D在平面屏幕中被察覺到，使用了立體影像，其模仿人類視覺系統(tǒng)并且分別顯示由到左眼和右眼的立體攝像機(jī)捕捉的左眼視圖和右眼視圖。因此，其要求2D序列所要求的帶寬的兩倍。3DTV (3DTV)或3D視頻(3DV)是使用立體影像將3D感知遞送至觀看者的應(yīng)用。然而，因為僅在3DTV中遞送用于每只眼睛的兩個視圖，所以用戶不能改變由內(nèi)容提供商固定的視點。自由視點TV(FTV)是另一種3D應(yīng)用，其使用戶能夠?qū)Ш酵ㄟ^不同視點并且選擇他們想要的觀看那一個。為了使多個視點可用，多視圖視頻序列被傳送至用戶。實際上，如果鄰近視圖之間的距離滿足用于立體影像的條件，則3DTV所要求的立體序列可以被認(rèn)為是多視圖視頻序列的子集。因為數(shù)據(jù)的量根據(jù)視圖的數(shù)目線性地增加，所以多視圖視頻圖像需要被有效地壓縮以用于廣泛使用。作為減少多視圖視頻序列的比特率的努力，JVT —直致力于多視圖視頻代碼化(MVC)并且將其落定為對H. 264/AVC的修改。在MVC中，使用用于較高代碼化效率的時間和交叉視圖相關(guān)性，對多視圖視頻序列進(jìn)行編碼，同時增加在時間上以及跨過視圖兩者的幀之間的依賴性。因此，當(dāng)用戶想要觀看特定視圖時，應(yīng)當(dāng)根據(jù)依賴性來解碼不必要的視圖。而且，當(dāng)存在由相機(jī)視差導(dǎo)致的幾何失真并且鄰近視圖之間的相關(guān)性很小時，MVC的壓縮效率是不令人滿意的。

發(fā)明內(nèi)容
根據(jù)本發(fā)明的原理，本發(fā)明的裝置可以包括編碼器，該編碼器被配置成通過對視圖數(shù)據(jù)和深度數(shù)據(jù)的組合集合編碼來對視頻數(shù)據(jù)編碼。視圖數(shù)據(jù)和深度數(shù)據(jù)的組合集合可以包括以下中的一個RGBD、YUVD、或YCbCrD。視圖數(shù)據(jù)和深度數(shù)據(jù)的組合集合可以包含在以下至少一個中圖片組、圖片、片段、塊組、宏塊、或子宏塊。該裝置可以進(jìn)一步包括深度格式單元，該深度格式單元被配置成識別視頻數(shù)據(jù)的深度格式。當(dāng)深度格式被設(shè)置為0時，編碼器可以選擇將視頻數(shù)據(jù)編碼為不包括深度數(shù)據(jù)的多個二維圖像，或者當(dāng)深度格式被設(shè)置為預(yù)定級別時，編碼器可以選擇將視頻數(shù)據(jù)編碼為視圖數(shù)據(jù)和深度數(shù)據(jù)的組合集合。編碼器可以進(jìn)一步包括代碼化成本計算器，該代碼化成本計算器確定所述視圖數(shù)據(jù)和深度數(shù)據(jù)的組合集合的聯(lián)合編碼和所述視圖數(shù)據(jù)和深度數(shù)據(jù)的組合集合的單獨(dú)編碼的代碼化成本，并且基于所述代碼化成本來在聯(lián)合編碼和單獨(dú)編碼之間確定編碼模式。當(dāng)編碼成本小于對視圖數(shù)據(jù)和深度數(shù)據(jù)單獨(dú)編碼的編碼成本時，編碼器可以將視頻數(shù)據(jù)編碼為視圖數(shù)據(jù)和深度數(shù)據(jù)的聯(lián)合編碼。視頻數(shù)據(jù)可以是以下中的一個具有深度的多視圖、沒有深度的多視圖、具有深度的單視圖、沒有深度的單視圖。根據(jù)本發(fā)明的原理，對視頻數(shù)據(jù)編碼的方法可以包括在編碼器處通過對視圖數(shù)據(jù)和深度數(shù)據(jù)的組合集合編碼來對視頻數(shù)據(jù)編碼。視圖數(shù)據(jù)和深度數(shù)據(jù)的組合集合可以包括以下中的一個RGBD、YUVD、或YCbCrD。視圖數(shù)據(jù)和深度數(shù)據(jù)的組合集合包含在以下至少一個中圖片組、圖片、片段、塊組、宏塊、或子宏塊。該方法可以進(jìn)一步包括識別視頻數(shù)據(jù)的深度格式。當(dāng)深度格式被設(shè)置為0時，視頻數(shù)據(jù)可以被編碼為不包括深度數(shù)據(jù)的多個二維圖像。當(dāng)深度格式被設(shè)置為預(yù)定級別時，視頻數(shù)據(jù)可以被編碼為視圖數(shù)據(jù)和深度數(shù)據(jù)的組合集合。該方法可以進(jìn)一步包括確定對所述視圖數(shù)據(jù)和深度數(shù)據(jù)的組合集合聯(lián)合編碼和對所述視圖數(shù)據(jù)和深度數(shù)據(jù)的組合集合單獨(dú)編碼的代碼化成本，以及基于所述代碼化成本來在聯(lián)合編碼和單獨(dú)編碼之間確定編碼模式。當(dāng)編碼成本小于對視圖數(shù)據(jù)和深度數(shù)據(jù)單獨(dú)編碼的編碼成本時，視頻數(shù)據(jù)可以被編碼為視圖數(shù)據(jù)和深度數(shù)據(jù)的聯(lián)合編碼。視頻數(shù)據(jù) 可以是以下中的一個具有深度的多視圖、沒有深度的多視圖、具有深度的單視圖、沒有深度的單視圖。根據(jù)本發(fā)明的原理，承載用于編碼器對視頻數(shù)據(jù)編碼的指令的非暫時性計算機(jī)可讀介質(zhì)可以包括用于執(zhí)行以下步驟的指令通過對視圖數(shù)據(jù)和深度數(shù)據(jù)的組合集合編碼來對視頻數(shù)據(jù)編碼。視圖數(shù)據(jù)和深度數(shù)據(jù)的組合集合可以包括以下中的一個RGBD、YUVD、或YCbCrD0視圖數(shù)據(jù)和深度數(shù)據(jù)的組合集合包含在以下至少一個中圖片組、圖片、片段、塊組、宏塊、或子宏塊。指令可以進(jìn)一步包括識別視頻數(shù)據(jù)的深度格式。當(dāng)深度格式被設(shè)置為0時，視頻數(shù)據(jù)可以被編碼為不包括深度數(shù)據(jù)的多個二維圖像。當(dāng)深度格式被設(shè)置為預(yù)定級別時，視頻數(shù)據(jù)可以被編碼為視圖數(shù)據(jù)和深度數(shù)據(jù)的組合集合。指令可以進(jìn)一步包括確定對所述視圖數(shù)據(jù)和深度數(shù)據(jù)的組合集合聯(lián)合編碼和對所述視圖數(shù)據(jù)和深度數(shù)據(jù)的組合集合單獨(dú)編碼的代碼化成本，以及基于所述代碼化成本來在聯(lián)合編碼和單獨(dú)編碼之間確定編碼模式。當(dāng)編碼成本小于對視圖數(shù)據(jù)和深度數(shù)據(jù)單獨(dú)編碼的編碼成本時，視頻數(shù)據(jù)可以被編碼為視圖數(shù)據(jù)和深度數(shù)據(jù)的聯(lián)合編碼。視頻數(shù)據(jù)可以是以下中的一個具有深度的多視圖、沒有深度的多視圖、具有深度的單視圖、沒有深度的單視圖。根據(jù)本發(fā)明的原理，用于對視頻數(shù)據(jù)解碼的裝置包括解碼器，該解碼器被配置成通過對視圖數(shù)據(jù)和深度數(shù)據(jù)的組合集合解碼來對視頻數(shù)據(jù)解碼。視圖數(shù)據(jù)和深度數(shù)據(jù)的組合集合可以包括以下中的一個RGBD、YUVD、或YCbCrD。視圖數(shù)據(jù)和深度數(shù)據(jù)的組合集合可以包含在以下至少一個中圖片組、圖片、片段、塊組、宏塊、或子宏塊。該裝置可以進(jìn)一步包括深度格式單元，該深度格式單元被配置成識別視頻數(shù)據(jù)的深度格式。當(dāng)深度格式被設(shè)置為0時，解碼器可以選擇將視頻數(shù)據(jù)解碼為不包括深度數(shù)據(jù)的多個二維圖像。當(dāng)深度格式被設(shè)置為預(yù)定級別時，解碼器可以選擇將視頻數(shù)據(jù)解碼為視圖數(shù)據(jù)和深度數(shù)據(jù)的組合集合。當(dāng)所述組合集合被聯(lián)合編碼時，所述解碼器可以對視圖數(shù)據(jù)和深度數(shù)據(jù)的組合集合選擇性地聯(lián)合解碼，或者當(dāng)所述組合集合被單獨(dú)編碼時，對所述視圖數(shù)據(jù)和深度數(shù)據(jù)的組合集合解碼。視頻數(shù)據(jù)可以是以下中的一個具有深度的多視圖、沒有深度的多視圖、具有深度的單視圖、沒有深度的單視圖。根據(jù)本發(fā)明的原理，對視頻數(shù)據(jù)解碼的方法包括在解碼器處通過對視圖數(shù)據(jù)和深度數(shù)據(jù)的組合集合解碼來對視頻數(shù)據(jù)解碼。視圖數(shù)據(jù)和深度數(shù)據(jù)的組合集合可以包括以下中的一個RGBD、YUVD、或YCbCrD。視圖數(shù)據(jù)和深度數(shù)據(jù)的組合集合包含在以下至少一個中圖片組、圖片、片段、塊組、宏塊、或子宏塊。該方法可以進(jìn)一步包括識別視圖數(shù)據(jù)的深度格式。當(dāng)深度格式被設(shè)置為0時，視圖數(shù)據(jù)可以被編碼為不包括深度數(shù)據(jù)的多個二維圖像。當(dāng)深度格式被設(shè)置為預(yù)定級別時，視頻數(shù)據(jù)可以被解碼為視圖數(shù)據(jù)和深度數(shù)據(jù)的組合集合。該方法可以進(jìn)一步包括當(dāng)所述組合集合被聯(lián)合編碼時，對所述視圖數(shù)據(jù)和深度數(shù)據(jù)的組合集合選擇性地聯(lián)合解碼，或者當(dāng)所述組合集合被單獨(dú)編碼時，對所述視圖數(shù)據(jù)和深度數(shù)據(jù)的組合集合解碼。視頻數(shù)據(jù)可以是以下中的一個具有深度的多視圖、沒有深度的多視圖、具有深度的單視圖、沒有深度的單視圖。根據(jù)本發(fā)明的原理，可以承載用于解碼器對視頻數(shù)據(jù)解碼的非暫時性計算機(jī)可讀介質(zhì)包括用于執(zhí)行以下步驟的指令通過對視圖數(shù)據(jù)和深度數(shù)據(jù)的組合集合編碼來對視頻數(shù)據(jù)解碼。視圖數(shù)據(jù)和深度數(shù)據(jù)的組合集合可以包括以下中的一個RGBD、YUVD、或 YCbCrD0視圖數(shù)據(jù)和深度數(shù)據(jù)的組合集合包含在以下至少一個中圖片組、圖片、片段、塊組、宏塊、或子宏塊。指令可以進(jìn)一步包括識別視頻數(shù)據(jù)的深度格式。當(dāng)深度格式被設(shè)置為0時，視頻數(shù)據(jù)可以被解碼為不包括深度數(shù)據(jù)的多個二維圖像。當(dāng)深度格式被設(shè)置為預(yù)定級別時，視頻數(shù)據(jù)可以被解碼為視圖數(shù)據(jù)和深度數(shù)據(jù)的組合集合。指令可以進(jìn)一步包括當(dāng)所述組合集合被聯(lián)合編碼時，對所述視圖數(shù)據(jù)和深度數(shù)據(jù)的組合集合選擇性地聯(lián)合解碼，或者當(dāng)所述組合集合被單獨(dú)編碼時，對所述視圖數(shù)據(jù)和深度數(shù)據(jù)的組合集合解碼。視頻數(shù)據(jù)可以是以下中的一個具有深度的多視圖、沒有深度的多視圖、具有深度的單視圖、沒有深度的單視圖。本發(fā)明允許深度參數(shù)與視圖信息聯(lián)合的3D編碼。本發(fā)明允許與2D的兼容性并且可以基于在與視圖聯(lián)合或單獨(dú)地對深度編碼的RD成本來提供優(yōu)化編碼。而且，根據(jù)視頻格式的新定義，我們提供3D視頻信號的自適應(yīng)代碼化方法。在3D信號的自適應(yīng)代碼化中的YCbCrD的組合代碼化期間，我們從開始就將深度看做是視頻分量，在幀間預(yù)測中，除了運(yùn)動矢量之外，塊模式和參考索引在視圖和深度之間共享。在幀內(nèi)預(yù)測中，也可以共享幀內(nèi)預(yù)測模式。注意，可以通過與視圖一起考慮深度信息來進(jìn)一步優(yōu)化組合代碼化的代碼化結(jié)果。在視圖和深度的單獨(dú)代碼化中，深度獨(dú)立于視圖被代碼化。還可以具有對深度幀內(nèi)代碼化，而對視圖幀間代碼化。

圖I圖示了端到端3D/FTV系統(tǒng)。圖2圖示了用于深度估計的方法。圖3A-圖3D圖示了多種形式的采樣視頻圖像。圖4圖示了根據(jù)本發(fā)明的原理的編碼器和解碼器布置。圖5圖示了根據(jù)本發(fā)明的原理的在組合代碼化和單獨(dú)代碼化之間的每個宏塊中的RD最優(yōu)化(RDO)的流程圖。圖6圖示了根據(jù)本發(fā)明的原理的用于3D視頻的自適應(yīng)代碼化的流程圖。
圖7A-圖7D圖示了視圖和深度的PSNR的采樣圖像和圖表。圖8A和圖8B圖示了在時間0和時間I的Lovebird (恩愛夫妻)1、視圖2的深度。圖9A和圖9B示出了用于Lovebirdl和Pantomime (啞劇)的合成視圖的RD曲線。圖IOA和圖IOB圖示了來自圖3的Lovebirds的亮度和深度。圖IlA和圖IlB圖不了包括Lovebird2和Pantomime的其他米樣圖像。
具體實施例方式為了簡單和說明目的，本發(fā)明通過主要參考其示例性實施例來描述。在以下描述中，闡述大量具體細(xì)節(jié)，以提供對本發(fā)明的透徹理解。然而，對本領(lǐng)域普通技術(shù)人員將顯而易見的是，可以在沒有這些具體細(xì)節(jié)的限制的情況下實施本發(fā)明。在其他實例中，不詳細(xì)地描述眾所周知的方法和結(jié)構(gòu)，以避免不必要地模糊本發(fā)明。圖I示出用于端到端3D/FTV系統(tǒng)的示例性示意圖。如圖I中所示，由多個相機(jī)2捕捉景色或?qū)ο驣的多個視圖。由多個相機(jī)2捕捉的視圖被校正或調(diào)整，并且在由傳送器3傳送之前被發(fā)送至處理器和存儲系統(tǒng)7。處理器可以包括編碼器，其將圖像數(shù)據(jù)編碼為指定格式。在編碼器處，多個視圖可用，其可以用于更有效地和正確地估計深度。如圖I中所示，用戶側(cè)通常包括接收器6，其接收從傳送器3傳送和編碼的圖像。所接收到的數(shù)據(jù)被提供至通常包括解碼器的處理器/緩沖器。解碼以及另外處理后的圖像數(shù)據(jù)被提供至顯示器5用于用戶觀看。MPEG開始搜索用于多視圖視頻序列代碼化的新標(biāo)準(zhǔn)。在MPEG活動中，利用深度信息來改進(jìn)整體代碼化效率。代替發(fā)送所有多視圖視頻序列，子采樣視圖，2或3關(guān)鍵視圖與對應(yīng)深度信息一起被發(fā)送，并且中間視圖使用關(guān)鍵視圖和深度被合成。假設(shè)在編碼器處進(jìn)行壓縮之前，深度被估計(如果不被捕捉)，并且在解碼器處的解壓縮之后，中間視圖被合成。注意，在本方案中，不是所有捕捉的視圖都被壓縮和傳送。為了定義合適的參考技術(shù)，在MPEG中已經(jīng)建立四個探索實驗(EE1-EE4)。EEl從鄰近視圖探索深度估計，并且EE2探索視圖合成技術(shù)，其使用從EEl估計的深度來合成中間視圖。EE3基于分層深度視頻(LDV)表示來搜索用于生成中間視圖的技術(shù)。EE4探索深度圖代碼化如何影響合成視圖的質(zhì)量。在圖2中，描述了用于深度估計的EEl和用于視圖合成的EE2。對于多視圖序列，例如，從視圖I至5，如圖2中的行21中所示，可以選擇任何兩個視圖來估計它們之間的深度。例如，視圖I和視圖5被用于估計深度2和深度4，如行23中所示。然后，視圖2、深度2、視圖4和深度4可以被編碼并且傳送至用戶，并且可以使用深度2和深度4將視圖2和視圖4之間的中間視圖與對應(yīng)相機(jī)參數(shù)合成。在圖2中，視圖3被合成，如行25中所示，并且與原始視圖3相比較。在0. Stankiewicz, K. Wegner 和 K. Klimaszewski, “Results of3DV/FTVExploration Experiments, described in w 10173，，，IS0/IECJTC1/SC29/WG1IMPEGDocument M16026, Lausanne, Switzerland, Feb. 2009 中，觀察到，合成視圖的質(zhì)量更多取決于編碼視圖的質(zhì)量而不是編碼深度的質(zhì)量。在S. Tao, Y. Chen, M. Hannuksela和H. Li，“Depth Map Coding Quality Analysis for View Synthesis, ，，IS0/IECJTC1/SC29/WGlIMPEG Document M16050, Lausanne, Switzerland, Feb. 2009 中，根據(jù)以不同比特率編碼的深度來合成視圖。它們提供比率和失真(R-D)曲線，其中，比率以Kbps為單位被示出以用于深度代碼化，并且失真以PSNR被示出以用于合成視圖。從Tao等人的文中可以看出，合成視圖的質(zhì)量在用于深度的比特率的大多數(shù)范圍內(nèi)不明顯地改變。在C. Cheng，Y.Huo 和 Y.Liu, “3DV EE44results on Dog sequence,，，ISO/IEC JTC1/SC29/WG IlMPEGDocument M16047, Lausanne, Switzerland, Feb. 2009 中，多視圖視頻代碼化(MVC)被用于對立體視圖和深度編碼，并且當(dāng)a 264/AVC被用于獨(dú)立地對每個視圖編碼時與代碼化結(jié)果相比較。MVC示出與由H. 264/AVC的同時聯(lián)播相比少5%的代碼化增益。對于深度壓縮，在B. Zhu. G. Jiang, M. Yu. P. An和 Z. Zhang,“Depth Map Compression for View Synthesis inFTV,，，ISO/IEC JTC1/SC29/WG11MPEG Document M16021, Lausanne, Switzerland, Feb.2009中，深度被分段并且不同區(qū)域被定義為邊緣(A)、運(yùn)動(B)、移動對象(C)和背景(D)的內(nèi)部。根據(jù)區(qū)域類型，應(yīng)用了不同的塊模式，其在深度壓縮中得到較少編碼復(fù)雜性和改進(jìn)的代碼化效率。在2D視頻捕捉期間，3D空間中的景色或?qū)ο蟊煌队暗较鄼C(jī)的圖像平面中，其中，像素強(qiáng)度表示對象的紋理。在深度圖中，像素強(qiáng)度表示對應(yīng)3D對象到/從圖像平面的距離。因此，視圖和深度都被捕捉(或被估計用于深度)用于相同景色或?qū)ο?，因此它們共?br> 對象的邊緣或周線。圖3a示出原始視圖0,圖3b-圖3d示出序列Lovebirds的對應(yīng)Cb、Cr和深度，Lovebirds 來自 ETRI/MPEG 韓國論壇“Call for Proposals on Multi-view VideoCoding,，，ISO/IEC JTCI/SC29/WG1IMPEG Document N7327, Poznan, Poland, Jul. 2005,通過引用將其合并于此。圖IlA和圖IlB示出了其他視圖，包括Lovebird 2視圖7和Pantomime視圖37。參考圖3b-圖3d,根據(jù)Cb/Cr與深度的比較，可以看出，Cb/Cr和深度都共享對象邊界。例如，因為顏色通道共享對象邊界的信息，所以基于用于視差(深度)估計的顏色來將圖像分段，G. Um, T. Kim, N. Hur 和 J. Kim, "Segment-based DisparityEstimation using Foreground Separation, 〃IS0/IEC JTC1/SC29/WG IIMPEG DocumentM15191, Antelya, Trukey, Jan. 2008。根據(jù)0. Stankiewicz等人、Tao等人、Cheng等人和Zhu等人,可以得出，深度的質(zhì)量不顯著改變合成視圖的質(zhì)量。然而，這些貢獻(xiàn)中的所有結(jié)果都使用用于深度估計和視圖合成的MPEG參考軟件來獲得，其通常不是最新水平技術(shù)。所估計的深度通常甚至對于相同光滑對象也是不同的，并且容易觀測到時間不一致性。因此，不能推斷，合成視圖的質(zhì)量不取決于深度的質(zhì)量。而且，考慮到視圖合成中的對象邊界周圍的I個像素錯誤可能導(dǎo)致不同合成結(jié)果，在MPEG活動中當(dāng)前假設(shè)的8比特深度質(zhì)量可能不足夠。然而，通過所有這些不確定性，深度應(yīng)當(dāng)被編碼并且與用于3D服務(wù)的視圖一起被傳送，并且需要定義有效和靈活的代碼化方案。注意，可以利用視圖和深度之間的相關(guān)性，就像在從單色到彩色的過渡期間利用亮度和色度之間的相關(guān)性一樣，我們提供新的靈活深度格式和代碼化方案，其是反向兼容的并且適用于新3D服務(wù)的不同目標(biāo)?？梢酝ㄟ^上述技術(shù)或另一種合適方法來執(zhí)行深度數(shù)據(jù)的確定。我們將深度看作對于常規(guī)2D視頻格式的附加分量，作出新3D視頻格式。因此，例如，將RGB或YCbCr格式擴(kuò)展到RGBD或YCbCrD以包括深度。在H. 264/AVC中，可以通過chroma_format_idc標(biāo)記來選擇用于單色或彩色的格式。類似地,我們可以使用depth_format」dc標(biāo)記來指定信號是2D的還是3D的。表I示出了如何使用chroma_format_idc和depth_format_idc來發(fā)信號2D/3D和單色/彩色的視頻格式。表I.通過 depth_format_idc 和 chroma_format_idc 定義的不同視頻格式
權(quán)利要求
1.一種用于對視頻數(shù)據(jù)編碼的裝置，包括編碼器，所述編碼器被配置成通過對視圖數(shù)據(jù)和深度數(shù)據(jù)的組合集合編碼來對所述視頻數(shù)據(jù)編碼。
2.根據(jù)權(quán)利要求I所述的裝置，其中，所述視圖數(shù)據(jù)和深度數(shù)據(jù)的組合集合包括以下中的一個RGBD、YUVD、或 YCbCrD。
3.根據(jù)權(quán)利要求2所述的裝置，其中，所述視圖數(shù)據(jù)和深度數(shù)據(jù)的組合集合包含在以下的至少一個中圖片組、圖片、片段、塊組、宏塊、或子宏塊。
4.根據(jù)權(quán)利要求I所述的裝置，進(jìn)一步包括深度格式單元，所述深度格式單元被配置成識別所述視頻數(shù)據(jù)的深度格式。
5.根據(jù)權(quán)利要求4所述的裝置，其中，當(dāng)所述深度格式被設(shè)置為O時，所述編碼器選擇將所述視頻數(shù)據(jù)編碼為不包括深度數(shù)據(jù)的多個二維圖像。
6.根據(jù)權(quán)利要求4所述的裝置，其中，當(dāng)所述深度格式被設(shè)置為預(yù)定級別時，所述編碼器選擇將所述視頻數(shù)據(jù)編碼為所述視圖數(shù)據(jù)和深度數(shù)據(jù)的組合集合。
7.根據(jù)權(quán)利要求I所述的裝置，其中，所述編碼器進(jìn)一步包括代碼化成本計算器，所述代碼化成本計算器確定對所述視圖數(shù)據(jù)和深度數(shù)據(jù)的組合集合的聯(lián)合編碼以及對所述視圖數(shù)據(jù)和深度數(shù)據(jù)的組合集合的單獨(dú)編碼的代碼化成本，并且基于所述代碼化成本來在聯(lián)合編碼和單獨(dú)編碼之間確定編碼模式。
8.根據(jù)權(quán)利要求7所述的裝置，其中，當(dāng)所述編碼成本小于對所述視圖數(shù)據(jù)和深度數(shù)據(jù)單獨(dú)編碼的編碼成本時，所述編碼器將所述視頻數(shù)據(jù)編碼為視圖數(shù)據(jù)和深度數(shù)據(jù)的聯(lián)合編碼。
9.根據(jù)權(quán)利要求I所述的裝置，其中，所述視頻數(shù)據(jù)是以下中的一個具有深度的多視圖、沒有深度的多視圖、具有深度的單視圖、沒有深度的單視圖。
10.一種對視頻數(shù)據(jù)編碼的方法，包括在編碼器處通過對視圖數(shù)據(jù)和深度數(shù)據(jù)的組合集合編碼來對所述視頻數(shù)據(jù)編碼。
11.根據(jù)權(quán)利要求10所述的方法，其中，所述視圖數(shù)據(jù)和深度數(shù)據(jù)的組合集合包括以下中的一個RGBD、YUVD、或 YCbCrD。
12.根據(jù)權(quán)利要求11所述的方法，其中，所述視圖數(shù)據(jù)和深度數(shù)據(jù)的組合集合包含在以下的至少一個中圖片組、圖片、片段、塊組、宏塊、或子宏塊。
13.根據(jù)權(quán)利要求10所述的方法，進(jìn)一步包括識別所述視頻數(shù)據(jù)的深度格式。
14.根據(jù)權(quán)利要求13所述的方法，其中，當(dāng)所述深度格式被設(shè)置為O時，所述視頻數(shù)據(jù)被編碼為不包括深度數(shù)據(jù)的多個二維圖像。
15.根據(jù)權(quán)利要求13所述的方法，其中，當(dāng)所述深度格式被設(shè)置為預(yù)定級別時，所述視圖數(shù)據(jù)和深度數(shù)據(jù)的組合集合被編碼。
16.根據(jù)權(quán)利要求10所述的方法，進(jìn)一步包括確定對所述視圖數(shù)據(jù)和深度數(shù)據(jù)的組合集合聯(lián)合編碼以及對所述視圖數(shù)據(jù)和深度數(shù)據(jù)的組合集合單獨(dú)編碼的代碼化成本，以及基于所述代碼化成本在聯(lián)合編碼和單獨(dú)編碼之間確定編碼模式。
17.根據(jù)權(quán)利要求16所述的方法，其中，當(dāng)所述編碼成本小于對所述視圖數(shù)據(jù)和深度數(shù)據(jù)單獨(dú)編碼的編碼成本時，所述視頻數(shù)據(jù)被編碼為視圖數(shù)據(jù)和深度數(shù)據(jù)的聯(lián)合編碼。
18.根據(jù)權(quán)利要求10所述的方法，其中，所述視頻數(shù)據(jù)是以下中的一個具有深度的多視圖、沒有深度的多視圖、具有深度的單視圖、沒有深度的單視圖。
19.一種承載用于編碼器對視頻數(shù)據(jù)編碼的指令的非暫時性計算機(jī)可讀介質(zhì)，包括用于執(zhí)行以下步驟的指令通過對視圖數(shù)據(jù)和深度數(shù)據(jù)的組合集合編碼來對所述視頻數(shù)據(jù)編碼。
20.根據(jù)權(quán)利要求19所述的計算機(jī)可讀介質(zhì)，其中，所述視圖數(shù)據(jù)和深度數(shù)據(jù)的組合集合包括以下中的一個RGBD、YUVD、或YCbCrD。
21.根據(jù)權(quán)利要求20所述的計算機(jī)可讀介質(zhì)，其中，所述視圖數(shù)據(jù)和深度數(shù)據(jù)的組合集合包含在以下的至少一個中圖片組、圖片、片段、塊組、宏塊、或子宏塊。
22.根據(jù)權(quán)利要求19所述的計算機(jī)可讀介質(zhì)，進(jìn)一步包括識別所述視頻數(shù)據(jù)的深度格式。
23.根據(jù)權(quán)利要求22所述的計算機(jī)可讀介質(zhì)，其中，當(dāng)所述深度格式被設(shè)置為O時，所述視頻數(shù)據(jù)被編碼為不包括深度數(shù)據(jù)的多個二維圖像。
24.根據(jù)權(quán)利要求22所述的計算機(jī)可讀介質(zhì)，其中，當(dāng)所述深度格式被設(shè)置為預(yù)定級別時，所述視圖數(shù)據(jù)和深度數(shù)據(jù)的組合集合被聯(lián)合編碼。
25.根據(jù)權(quán)利要求19所述的計算機(jī)可讀介質(zhì)，進(jìn)一步包括確定對所述視圖數(shù)據(jù)和深度數(shù)據(jù)的組合集合聯(lián)合編碼以及對所述視圖數(shù)據(jù)和深度數(shù)據(jù)的組合集合單獨(dú)編碼的代碼化成本，以及基于所述代碼化成本來在聯(lián)合編碼和單獨(dú)編碼之間確定編碼模式。
26.根據(jù)權(quán)利要求25所述的計算機(jī)可讀介質(zhì)，其中，當(dāng)所述編碼成本小于對所述視圖數(shù)據(jù)和深度數(shù)據(jù)單獨(dú)編碼的編碼成本時，所述視頻數(shù)據(jù)被編碼為視圖數(shù)據(jù)和深度數(shù)據(jù)的聯(lián)合編碼。
27.根據(jù)權(quán)利要求19所述的計算機(jī)可讀介質(zhì)，其中，所述視頻數(shù)據(jù)是以下中的一個具有深度的多視圖、沒有深度的多視圖、具有深度的單視圖、沒有深度的單視圖。
28.一種用于對視頻數(shù)據(jù)解碼的裝置，包括解碼器，所述解碼器被配置成通過對視圖數(shù)據(jù)和深度數(shù)據(jù)的組合集合解碼來對所述視頻數(shù)據(jù)解碼。
29.根據(jù)權(quán)利要求28所述的裝置，其中，所述視圖數(shù)據(jù)和深度數(shù)據(jù)的組合集合包括以下中的一個RGBD、YUVD、或 YCbCrD。
30.根據(jù)權(quán)利要求29所述的裝置，其中，所述視圖數(shù)據(jù)和深度數(shù)據(jù)的組合集合包含在以下的至少一個中圖片組、圖片、片段、塊組、宏塊、或子宏塊。
31.根據(jù)權(quán)利要求28所述的裝置，進(jìn)一步包括深度格式單元，所述深度格式單元被配置成識別所述視頻數(shù)據(jù)的深度格式。
32.根據(jù)權(quán)利要求31所述的裝置，其中，當(dāng)所述深度格式被設(shè)置為O時，所述解碼器選擇將所述視頻數(shù)據(jù)解碼為不包括深度數(shù)據(jù)的多個二維圖像。
33.根據(jù)權(quán)利要求31所述的裝置，其中，當(dāng)所述深度格式被設(shè)置為預(yù)定級別時，所述解碼器選擇將所述視頻數(shù)據(jù)解碼為所述視圖數(shù)據(jù)和深度數(shù)據(jù)的組合集合。
34.根據(jù)權(quán)利要求28所述的裝置，其中，當(dāng)所述組合集合被聯(lián)合編碼時，所述解碼器對所述視圖數(shù)據(jù)和深度數(shù)據(jù)的組合集合選擇性地聯(lián)合解碼，或者當(dāng)所述組合集合被單獨(dú)編碼時，所述解碼器對所述視圖數(shù)據(jù)和深度數(shù)據(jù)的組合集合解碼。
35.根據(jù)權(quán)利要求28所述的裝置，其中，所述視頻數(shù)據(jù)是以下中的一個具有深度的多視圖、沒有深度的多視圖、具有深度的單視圖、沒有深度的單視圖。
36.一種對視頻數(shù)據(jù)解碼的方法，包括在解碼器處通過對視圖數(shù)據(jù)和深度數(shù)據(jù)的組合集合解碼來對所述視頻數(shù)據(jù)解碼。
37.根據(jù)權(quán)利要求36所述的方法，其中，所述視圖數(shù)據(jù)和深度數(shù)據(jù)的組合集合包括以下中的一個RGBD、YUVD、或 YCbCrD。
38.根據(jù)權(quán)利要求37所述的方法，其中，所述視圖數(shù)據(jù)和深度數(shù)據(jù)的組合集合包含在以下的至少一個中圖片組、圖片、片段、塊組、宏塊、或子宏塊。
39.根據(jù)權(quán)利要求36所述的方法，進(jìn)一步包括識別所述視頻數(shù)據(jù)的深度格式。
40.根據(jù)權(quán)利要求39所述的方法，其中，當(dāng)所述深度格式被設(shè)置為O時，所述視頻數(shù)據(jù)被解碼為不包括深度數(shù)據(jù)的多個二維圖像。
41.根據(jù)權(quán)利要求39所述的方法，其中，當(dāng)所述深度格式被設(shè)置為預(yù)定級別時，所述視圖數(shù)據(jù)和深度數(shù)據(jù)的組合集合被聯(lián)合解碼。
42.根據(jù)權(quán)利要求36所述的方法，進(jìn)一步包括當(dāng)所述組合集合被聯(lián)合編碼時，對所述視圖數(shù)據(jù)和深度數(shù)據(jù)的組合集合選擇性地聯(lián)合解碼，或者當(dāng)所述組合集合被單獨(dú)編碼時，對所述視圖數(shù)據(jù)和深度數(shù)據(jù)的組合集合解碼。
43.根據(jù)權(quán)利要求36所述的方法，其中，所述視頻數(shù)據(jù)是以下中的一個具有深度的多視圖、沒有深度的多視圖、具有深度的單視圖、沒有深度的單視圖。
44.一種承載用于解碼器對視頻數(shù)據(jù)解碼的指令的非暫時性計算機(jī)可讀介質(zhì)，包括用于執(zhí)行以下步驟的指令通過對視圖數(shù)據(jù)和深度數(shù)據(jù)的組合集合編碼來對所述視頻數(shù)據(jù)解碼。
45.根據(jù)權(quán)利要求44所述的計算機(jī)可讀介質(zhì)，其中，所述視圖數(shù)據(jù)和深度數(shù)據(jù)的組合集合包括以下中的一個RGBD、YUVD、或YCbCrD。
46.根據(jù)權(quán)利要求45所述的計算機(jī)可讀介質(zhì)，其中，所述視圖數(shù)據(jù)和深度數(shù)據(jù)的組合集合包含在以下的至少一個中圖片組、圖片、片段、塊組、宏塊、或子宏塊。
47.根據(jù)權(quán)利要求44所述的計算機(jī)可讀介質(zhì)，進(jìn)一步包括識別所述視頻數(shù)據(jù)的深度格式。
48.根據(jù)權(quán)利要求47所述的計算機(jī)可讀介質(zhì)，其中，當(dāng)所述深度格式被設(shè)置為O時，所述視頻數(shù)據(jù)被解碼為不包括深度數(shù)據(jù)的多個二維圖像。
49.根據(jù)權(quán)利要求47所述的計算機(jī)可讀介質(zhì)，其中，當(dāng)所述深度格式被設(shè)置為預(yù)定級別時，所述視圖數(shù)據(jù)和深度數(shù)據(jù)的組合集合被聯(lián)合解碼。
50.根據(jù)權(quán)利要求44所述的計算機(jī)可讀介質(zhì),進(jìn)一步包括當(dāng)所述組合集合被聯(lián)合編碼時，對所述視圖數(shù)據(jù)和深度數(shù)據(jù)的組合集合選擇性地聯(lián)合解碼，或者當(dāng)所述組合集合被單獨(dú)編碼時，對所述視圖數(shù)據(jù)和深度數(shù)據(jù)的組合集合解碼。
51.根據(jù)權(quán)利要求44所述的計算機(jī)可讀介質(zhì)，其中，所述視頻數(shù)據(jù)是以下中的一個具有深度的多視圖、沒有深度的多視圖、具有深度的單視圖、沒有深度的單視圖。
全文摘要
一種3D視頻代碼化裝置和方法，其選擇性地對來自多個視頻源的視頻數(shù)據(jù)代碼化以包括深度信息。代碼化可以通過將深度信息與諸如RGB、YCrCb、或YUV的視圖信息相組合，并且與如RGBD、RCrCbD、或YUVD的視圖信息一起代碼化來執(zhí)行。裝置可以基于深度格式標(biāo)記對深度信息選擇性地代碼化，以不包括深度信息(例如，2D格式)或包括深度信息作為色度通道。深度信息可以基于代碼化成本或比率失真估計被單獨(dú)地代碼化或與YCrCb一起代碼化，以對視頻信息進(jìn)行編碼來獲得最高質(zhì)量。
文檔編號H04N13/00GK102792699SQ201080052987
公開日2012年11月21日申請日期2010年11月23日優(yōu)先權(quán)日2009年11月23日
發(fā)明者杰伊·胡恩·金, 王利民申請人:通用儀表公司

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：杰伊·胡恩·金;王利民
技術(shù)所有人：通用儀表公司
我是此專利的發(fā)明人

上一篇：具有多發(fā)射器和多接收器的x-mimo系統(tǒng)的制作方法
上一篇：Ack/nack傳輸方法及其裝置的制作方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點此查看客服電話進(jìn)行咨詢。
1、王老師：1.數(shù)字信號處理 2.傳感器技術(shù)及應(yīng)用 3.機(jī)電一體化產(chǎn)品開發(fā) 4.機(jī)械工程測試技術(shù) 5.逆向工程技術(shù)研究
2、王老師：1.機(jī)器人 2.嵌入式控制系統(tǒng)開發(fā)
3、孫老師：1.振動信號時頻分析理論與測試系統(tǒng)設(shè)計 2.汽車檢測系統(tǒng)設(shè)計 3.汽車電子控制系統(tǒng)設(shè)計
4、畢老師：機(jī)構(gòu)動力學(xué)與控制
5、袁老師：1.計算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

深度優(yōu)先遍歷序列相關(guān)技術(shù)

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

作為到視頻序列的附加通道的深度代碼化的制作方法