一種視訊編碼方法

文檔序號(hào)：7731332閱讀：295來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專(zhuān)利>電子通信裝置的制造及其應(yīng)用技術(shù)

專(zhuān)利名稱(chēng)：一種視訊編碼方法
技術(shù)領(lǐng)域：
本發(fā)明關(guān)于一種視訊編碼方法，特別關(guān)于一種具有支持編輯場(chǎng)景改變功能的視訊編碼方法。
背景技術(shù)：
在MPEG(Moving Pictures Experts Group)規(guī)格中有三種圖像類(lèi)型(picture type)，包括I-圖像、P-圖像、以及B-圖像。I-圖像在編碼時(shí)沒(méi)有參考任何其它圖像。I-圖像可提供編碼順序的起始點(diǎn)，亦即可以開(kāi)始譯碼的位置，但是僅能以一般壓縮(moderate compression)進(jìn)行編碼。P-圖像參考剛過(guò)去的I-圖像或P-圖像使用移動(dòng)補(bǔ)償預(yù)測(cè)(motion compensated prediction)來(lái)編碼，因此編碼較有效率，而且一般被用來(lái)作為更進(jìn)一步預(yù)測(cè)的參考。B-圖像提供了最高等級(jí)的壓縮，但是需要過(guò)去以及未來(lái)的圖像作為移動(dòng)補(bǔ)償。B-圖像是不被使用為預(yù)測(cè)的參考圖像。此三種類(lèi)型的圖像的構(gòu)造(organization)在順序上是相當(dāng)有彈性的。順序的選擇是由編碼器決定，且依據(jù)應(yīng)用的需求決定順序。
由于B-圖像必須參考過(guò)去以及未來(lái)的圖像，所以必須等到未來(lái)的圖像編碼完后，才進(jìn)行編碼。因此，圖像的顯示順序與編碼順序是不同的，且被稱(chēng)為B-圖像的重新排序(reordering)。
在MPEG-1規(guī)格中，編碼器使用圖像群組(group-of-pictures，以下簡(jiǎn)稱(chēng)GOP)包裝一群圖像成為一組來(lái)巧妙運(yùn)用。每個(gè)GOP一般包含一個(gè)I-圖像、數(shù)個(gè)P-圖像、以及數(shù)個(gè)B-圖像，且編碼順序上是以I-圖像為開(kāi)始，下一個(gè)I-圖像之前結(jié)束。而在MPEG-2規(guī)格中，GOP的架構(gòu)就具有選擇性。
通常，編碼器使用固定的GOP架構(gòu)(fixed GOP structure)。每個(gè)GOP的長(zhǎng)度(size)被定義成N，且兩個(gè)參考圖像的距離定義成M。圖1顯示N＝15、M＝3的GOP。
一般而言，若輸入的信號(hào)為NTSC格式(29.97fps)，亦即每秒29.97個(gè)圖框，則使用N＝15、M＝3的GOP架構(gòu)。若輸入的信號(hào)為PAL格式(25fps)或電影格式(film format)(24fps)，亦即每秒25個(gè)圖框或24個(gè)圖框，則使用N＝12、M＝3的GOP架構(gòu)。這些固定的默認(rèn)值可以在編碼器的復(fù)雜度以及大部分的編碼特性之間取得一個(gè)好的平衡點(diǎn)。
一般而言，影像編輯處理(editing process)會(huì)將整個(gè)影像順序(videosequence)根據(jù)場(chǎng)景(scene)切割成幾個(gè)部分(pieces)，之后再重新排列(rearrange)這些部分形成一個(gè)新的影像順序。若一個(gè)影像順序以?xún)H包含I-圖像與P-圖像的固定式樣來(lái)編碼，例如...IPPPPIPPPP...，此種狀態(tài)是很單純的。若場(chǎng)景改變(scene change)發(fā)生于I-圖像，則影像順序可被切割成兩個(gè)部分，且不會(huì)有任何損失(loss)。若場(chǎng)景改變(scene change)發(fā)生于P-圖像，則前一部份不會(huì)有問(wèn)題，但剩余的部分必須重新編碼。首先，P-圖像必須先被譯碼后，再將其重新編碼成I-圖像。然而，由于重新編碼成I-圖像與原始的P-圖像之間會(huì)有差異性，所以會(huì)產(chǎn)生失真?zhèn)鬟f(error propagation)。重新編碼整個(gè)剩余部分至下一個(gè)I-圖像會(huì)是較好的解決方式，但會(huì)嚴(yán)重衰減(degrade)影像品質(zhì)。
若編碼的影像順序還包含了B-圖像，則影像編輯處理會(huì)更為復(fù)雜。圖2顯示了包含B-圖像的影像順序的例子。若場(chǎng)景改變剛好發(fā)生于I-圖像之后，如圖所示的圖像B4，則可輕易地將影像順序從圖像I6切成兩個(gè)場(chǎng)景部分。然而，即使圖像P3與圖像B4歸屬于不同場(chǎng)景，但是圖像B4、B5仍有一些宏區(qū)塊必須參考圖像P3。因此，圖像B4、B5必須以?xún)H參考圖像I6的方式重新編碼。當(dāng)然，拋棄圖像B4、B5是最簡(jiǎn)單的方式，但是遺失一個(gè)場(chǎng)景開(kāi)頭部分圖像是無(wú)法被接受的。
若場(chǎng)景改變發(fā)生于圖像B5，則該GOP的前面部分與剩余部分均需要被重新編碼。圖像B4必須被重新編碼成P-圖像，并添加于前面部分。而對(duì)于剩余部分，圖像B4的編碼資料必須被移除，且圖像B5必須被重新編碼。
若場(chǎng)景改變發(fā)生于圖像I6，則該GOP的剩余部分只需要移除圖像B4與圖像B5的編碼資料，但該GOP的前面部分則需要復(fù)雜的處理。一個(gè)處理方式是將圖像B5重新編碼成P-圖像，并將圖像B4以參考圖像P3與圖像B5的方式重新編碼。另一個(gè)處理方式是將圖像B4與圖像B5重新編碼成P-圖像。
若場(chǎng)景改變發(fā)生于圖像B7，則該GOP的前面部分不需任何處理，但是一個(gè)新的I-圖像必須被產(chǎn)生于該GOP的剩余部分。一個(gè)選擇是將圖像B7變更成I-圖像，并重新編碼該GOP的剩余部分。然而，由于B-圖像以低于I-圖像與P-圖像的影像品質(zhì)進(jìn)行編碼，因此較好的選擇是將圖像P9變更為I-圖像，并重新編碼該GOP的剩余部分。圖像B4與圖像B5僅為后方參考的B-圖像。此方法亦可減少P-圖像的數(shù)量，藉以減少參考到重新編碼的圖像所造成的失真。
若場(chǎng)景改變發(fā)生于圖像B8，則該GOP的前面部分僅需將圖像B7重新編碼成P-圖像。而該GOP的剩余部分可將圖像P9變更為I-圖像，并重新編碼該GOP的剩余部分。
最后，若場(chǎng)景改變發(fā)生于圖像P9，則該GOP的前面部分的處理可與場(chǎng)景改變發(fā)生于圖像I6時(shí)相同。而對(duì)于該GOP的剩余部分，可將圖像P9變更為I-圖像，并重新編碼該GOP的剩余部分。
因此，其它情形可以如同上述的方法進(jìn)行處理，即使在兩個(gè)參考圖像之間的B-圖像數(shù)量增加為3或是更多。
一般而言，I-圖像設(shè)計(jì)的目的是可以隨機(jī)存取以及防止失真向后傳遞。而P-圖像是使用移動(dòng)補(bǔ)償(motion compensation)來(lái)移除目前圖像與參考圖像之間的時(shí)間重復(fù)性(temporal redundancy)，藉以改善壓縮率。然而，當(dāng)目前圖像與參考圖像之間沒(méi)有任何時(shí)間重復(fù)性，例如場(chǎng)景改變，則將目前圖像編碼成P-圖像并無(wú)任何好處。在此情形下，將目前圖像編碼成I-圖像反而可以較少的位元得到相同的編碼品質(zhì)。因此，一個(gè)編碼器必須去偵測(cè)是否有場(chǎng)景改變的情形，若有則激活一個(gè)新的GOP。目前已有許多偵測(cè)場(chǎng)景改變的研究，以及如何調(diào)整使用率控制的算法。一般的想法是偵測(cè)目前圖像與參考圖像的移動(dòng)預(yù)測(cè)的差異性。若超過(guò)一定比例的宏區(qū)塊選擇自身編碼模式(intra-coded mode)，則編碼器判定僅存在一些時(shí)間重復(fù)性，而認(rèn)為場(chǎng)景改變。
然而，當(dāng)場(chǎng)景改變時(shí)，若編碼器僅激活一個(gè)新的GOP而沒(méi)有任何其它處理動(dòng)作，則在進(jìn)行影像編輯處理時(shí)仍無(wú)法避免一些圖像的重新編碼，而造成失真?zhèn)鬟f，影像品質(zhì)衰減。

發(fā)明內(nèi)容
有鑒于上述問(wèn)題，本發(fā)明的目的是提出一種具有支持編輯場(chǎng)景改變功能的視訊編碼方法。
為達(dá)成上述目的，本發(fā)明視訊編碼方法包含下列步驟擷取圖像，以顯示順序擷取圖像數(shù)據(jù)并儲(chǔ)存；偵測(cè)場(chǎng)景改變，偵測(cè)圖像PICn是否發(fā)生場(chǎng)景改變，若沒(méi)有發(fā)生場(chǎng)景改變，則以編碼順序編碼圖像，若有發(fā)生場(chǎng)景改變，則進(jìn)行特殊編碼處理。特殊編碼處理包含下列步驟確認(rèn)上一張圖像PICn-1是否為參考圖像，若上一張圖像PICn-1不為參考圖像時(shí)，則進(jìn)行第一與第三階段編碼，否則進(jìn)行第二與第三階段編碼。第一階段編碼將上一張圖像PICn-1重新編碼為P-圖像；第二階段編碼編碼上一張圖像PICn-1之前的B-圖像；第三階段編碼則激活一個(gè)新的圖像群組，并將圖像PICn+M-1編碼為I-圖像，之后將圖像PICn至PICn+M-2編碼為B-圖像，且該等B-圖像僅參考圖像PICn+M-1。
由于本發(fā)明在編碼時(shí)已經(jīng)考慮場(chǎng)景改變的狀態(tài)，而重新激活一個(gè)新的GOP，因此影像編輯處理時(shí)可以直接切割不同的GOP，而不需重新編碼，不但使編輯速度可以提升，且不會(huì)因編輯而造成影像失真。

圖1顯示習(xí)知N＝15、M＝3的圖像群組。
圖2顯示習(xí)知包含B-圖像的影像順序的例子。
圖3顯示固定圖像群組架構(gòu)。
圖4顯示第一種包含顯示與編碼順序的圖像群組。
圖5顯示第二種包含顯示與編碼順序的圖像群組。
圖6顯示第三種包含顯示與編碼順序的圖像群組。
圖7顯示本發(fā)明具有支持編輯場(chǎng)景改變功能的視訊編碼方法的流程圖具體實(shí)施方式
以下參考附圖并結(jié)合具體實(shí)施例詳細(xì)說(shuō)明本發(fā)明具有支持編輯場(chǎng)景改變功能的視訊編碼方法。
首先，使用本發(fā)明的具有支持編輯場(chǎng)景改變功能的視訊編碼方法的編碼器必須具有場(chǎng)景改變的偵測(cè)功能，而且該偵測(cè)功能必須應(yīng)用于顯示順序(displayorder)。這是因?yàn)榫幋a器必須知道場(chǎng)景改變所發(fā)生的地方，以便將場(chǎng)景改變的前、后編碼成兩個(gè)GOP。
當(dāng)編碼器沒(méi)有偵測(cè)到任何場(chǎng)景改變時(shí)，編碼器以固定GOP架構(gòu)進(jìn)行編碼。一旦偵測(cè)到任何場(chǎng)景改變時(shí)，則編碼器根據(jù)剛完成編碼的圖像的類(lèi)別以及位置來(lái)決定如何編碼接下來(lái)的圖像。必須注意的是，由于B-圖像必須在未來(lái)參考圖像編碼完成后才能進(jìn)行編碼，因此場(chǎng)景改變必須在編碼實(shí)際發(fā)生以前被偵測(cè)出來(lái)。圖2即顯示出習(xí)知技術(shù)的一種例子。編碼器是以顯示順序來(lái)擷取圖像并儲(chǔ)存于緩沖器。圖像B4與B5被擷取之后，一直等到圖像I6編碼完成后才被編碼。假設(shè)編碼器可以在每個(gè)擷取圖像的周期中編碼一張圖像，則圖像I6可以在相同周期中被擷取與編碼。而在下一周期中，圖像B4被編碼，同時(shí)圖像B7被擷取。圖像B5在圖像B8被擷取的同一周期被編碼。由于圖像P9僅需要圖像I6做參考，因此圖像P9可在同一周期中被擷取與編碼。
如圖3所示，對(duì)于一個(gè)以固定GOP架構(gòu)編碼的編碼器而言，將兩個(gè)參考圖像的距離定義為M，并將參考圖像(I-圖像與P-圖像)定義為R。在前方參考圖像RX之后的第一個(gè)B-圖像(顯示順序)被稱(chēng)為BX1，第二個(gè)被稱(chēng)為BX2，以此類(lèi)推。在后方參考圖像之前的最后一個(gè)B-圖像被稱(chēng)為BXM-1。以下分別說(shuō)明在不同位置發(fā)生場(chǎng)景改變時(shí)，編碼器的編碼方法。
一、場(chǎng)景改變發(fā)生在第一個(gè)B-圖像當(dāng)圖像BA1至RB都沒(méi)有場(chǎng)景改變時(shí)，則圖像BA1至BAM-1被擷取后儲(chǔ)存在緩沖器，直到圖像RB被擷取并編碼完后才進(jìn)行編碼。但是當(dāng)場(chǎng)景改變發(fā)生在圖像BB1，則圖像RB以及之前的圖像是歸屬于前方GOP，而圖像BB1以及之后的圖像是歸屬于后方GOP。在編碼完圖像BAM-1后，若編碼器激活一個(gè)新的GOP并對(duì)后續(xù)的圖像以不參考圖像RB來(lái)編碼，則可完全地將影像順序切成兩個(gè)部分。所以，影像編輯處理時(shí)可以從新的GOP切割，而不需任何的重新編碼。
有兩種方式可以激活一個(gè)新的GOP。第一種方式如圖4所示，從I-圖像激活一個(gè)固定GOP架構(gòu)。在上述例子中，原始圖像BB1被變更成I-圖像RC、接著M-1個(gè)圖像為B-圖像BC1-BCM-1、接著為P-圖像RD、接著為B-圖像BD1-BDM-1等。。
然而，一個(gè)新的GOP并不需要在顯示順序上以I-圖像開(kāi)始。從觀察圖4的編碼順序可以了解，在圖像RC與RD之間并無(wú)任何的B-圖像。B-圖像比起I-圖像與P-圖像，可以較低的品質(zhì)與較少的位元率來(lái)編碼。若在短的區(qū)間有太多的參考圖像，其結(jié)果是每個(gè)參考圖像無(wú)法獲得足夠的位元來(lái)達(dá)成較高的品質(zhì)。因此，第二種方式如圖5所示，以試著保持B-圖像數(shù)目與參考圖像數(shù)目的比例來(lái)激活一個(gè)新的GOP。最先的M-1個(gè)圖像為B-圖像、接著為一個(gè)I-圖像、接著為M-1個(gè)B-圖像、接著為一個(gè)P-圖像，以此類(lèi)推。
雖然每個(gè)圖像的類(lèi)別似乎與沒(méi)有發(fā)生場(chǎng)景改變時(shí)相同，但其差別是圖像BB1-BBM-1僅參考后方的參考圖像RC。事實(shí)上，在圖像RC之前不一定要有M-1個(gè)B-圖像，而可以隨意調(diào)整。
二、場(chǎng)景改變發(fā)生在第二個(gè)B-圖像如圖3所示，當(dāng)場(chǎng)景改變發(fā)生在第二個(gè)B-圖像BB2，則圖像BB1以及之前的圖像是歸屬于前方GOP，而圖像BB2以及之后的圖像是歸屬于后方新的GOP。新的GOP可以利用上述的第一情形的方法進(jìn)行編碼，而要特別處理的是前方的GOP。
一個(gè)GOP必須以一個(gè)參考圖像來(lái)結(jié)尾。因此，圖像BB1必須被編碼成一個(gè)參考圖像。沒(méi)有理由不將圖像BB1編碼成P-圖像，而編碼成I-圖像。圖6顯示此種例子。
三、場(chǎng)景改變發(fā)生在第n個(gè)B-圖像當(dāng)場(chǎng)景改變發(fā)生在參考圖像RX后之后的第n個(gè)B-圖像BXn，其中2＜n＜M，則圖像BXn-1以及之前的圖像是歸屬于前方GOP，而圖像BXn以及之后的圖像是歸屬于后方新的GOP。新的GOP可以利用上述的第一情形的方法進(jìn)行編碼。
根據(jù)第二情形的方法，編碼器會(huì)將BXn-1編碼成P-圖像，以及將圖像BX1-BXn-2(若存在)以參考RX與新編碼成的P-圖像來(lái)編碼成B-圖像。
四、場(chǎng)景改變發(fā)生在參考圖像再參考圖3。當(dāng)場(chǎng)景改變發(fā)生在參考圖像RB，則圖像BAM-1以及之前的圖像是歸屬于前方GOP，而圖像RB以及之后的圖像是歸屬于后方新的GOP。前方GOP可以利用第三情形所描述的方法進(jìn)行編碼，而新的GOP可以利用第一情形所描述的方法進(jìn)行編碼。
圖7顯示本發(fā)明具有支持編輯場(chǎng)景改變功能的視訊編碼方法的流程圖。該具有支持編輯場(chǎng)景改變功能的視訊編碼方法的步驟如下步驟S702以顯示順序擷取圖像PICn并偵測(cè)場(chǎng)景是否改變。一般而言，在進(jìn)行場(chǎng)景改變偵測(cè)時(shí)，大都以未編碼的圖像來(lái)偵測(cè)。
步驟S704若場(chǎng)景沒(méi)有改變，則跳至步驟S706，若場(chǎng)景有改變，則跳至步驟S708的特殊編碼處理。
步驟S706以編碼順序編碼圖像。若沒(méi)有發(fā)生場(chǎng)景改變，則以編碼順序編碼圖像，并跳回步驟S702。
步驟S708若場(chǎng)景有改變，則確認(rèn)上一張圖像PICn-1是否被編碼為參考圖像(reference picture)？若不是被編碼為參考圖像，則跳至步驟S710的第一階段編碼，若是被編碼為參考圖像，則跳至步驟S716的第二階段編碼。
步驟S710若上一張參考圖像的前還存在有B-圖像，則結(jié)束該等B-圖像的編碼。
步驟S712將圖像PICn-1編碼為P-圖像。
步驟S714若上一張圖像PICn-1的前存在其它B-圖像，則編碼這些B-圖像，并跳至步驟S718的第三階段編碼。
步驟S716編碼上一張圖像PICn-1的前的B-圖像。
步驟S718激活一個(gè)新的GOP并將PICn+m-1編碼為I-圖像。
步驟S720將圖像PICn～PICn+m-2之間的圖像編碼為B-圖像且僅參考圖像PICn+m-1。
由于本發(fā)明在編碼時(shí)已經(jīng)考慮場(chǎng)景改變的狀態(tài)，而重新激活一個(gè)新的GOP，因此影像編輯處理時(shí)可以直接切割不同的GOP，而不需重新編碼，不但使編輯速度可以提升，且不會(huì)因編輯而造成影像失真。
以上雖以實(shí)施例說(shuō)明本發(fā)明，但并不因此限定本發(fā)明的范圍，只要不脫離本發(fā)明的要旨，該行業(yè)者所進(jìn)行的各種變形或變更，皆屬于本發(fā)明的保護(hù)范圍，本發(fā)明的保護(hù)范圍以權(quán)利要求書(shū)所限定的范圍為準(zhǔn)。
權(quán)利要求
1.一種視訊編碼方法，該編碼方法的圖像群組中，將兩個(gè)參考圖像距離定義為M，其特征在于所述的視訊編碼方法包括擷取圖像，以顯示順序擷取圖像數(shù)據(jù)并儲(chǔ)存；以及偵測(cè)場(chǎng)景改變，偵測(cè)圖像PICn是否發(fā)生場(chǎng)景改變，若沒(méi)有發(fā)生場(chǎng)景改變，則以編碼順序編碼圖像，若發(fā)生場(chǎng)景改變，則進(jìn)行特殊編碼處理；所述的特殊編碼處理包括確認(rèn)上一張圖像PICn-1是否為參考圖像，若上一張圖像PICn-1不為參考圖像時(shí)，則進(jìn)行第一與第三階段編碼；否則進(jìn)行第二與第三階段編碼；所述的第一階段編碼，將上一張圖像PICn-1重新編碼為P-圖像；所述的第二階段編碼，編碼上一張圖像PICn-1之前的B-圖像；所述的第三階段編碼，激活一個(gè)新的圖像群組，并將圖像PICn+M-1編碼為I-圖像，之后將圖像PICn至PICn+M-2編碼為B-圖像，且該等B-圖像僅參考圖像PICn+M-1。
2.根據(jù)權(quán)利要求1所述的視訊編碼方法，其特征在于所述的第一階段編碼還包括若上一個(gè)參考圖像之前存在B-圖像，則結(jié)束該等B-圖像的編碼。
3.根據(jù)權(quán)利要求1所述的視訊編碼方法，其特征在于所述的第一階段編碼還包括若上一張圖像PICn-1之前存在B-圖像，則對(duì)這些B-圖像編碼。
全文摘要
一種具有支持編輯場(chǎng)景改變功能的視訊編碼方法。該方法包括以顯示順序擷取圖像數(shù)據(jù)并儲(chǔ)存；偵測(cè)圖像PIC
文檔編號(hào)H04N7/50GK1581974SQ0314971
公開(kāi)日2005年2月16日申請(qǐng)日期2003年8月6日優(yōu)先權(quán)日2003年8月6日
發(fā)明者張永清申請(qǐng)人:矽統(tǒng)科技股份有限公司

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專(zhuān)利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：張永清
技術(shù)所有人：矽統(tǒng)科技股份有限公司
我是此專(zhuān)利的發(fā)明人

該領(lǐng)域下的技術(shù)專(zhuān)家
如您需求助技術(shù)專(zhuān)家，請(qǐng)點(diǎn)此查看客服電話(huà)進(jìn)行咨詢(xún)。
1、王老師：1.數(shù)字信號(hào)處理 2.傳感器技術(shù)及應(yīng)用 3.機(jī)電一體化產(chǎn)品開(kāi)發(fā) 4.機(jī)械工程測(cè)試技術(shù) 5.逆向工程技術(shù)研究
2、王老師：1.機(jī)器人 2.嵌入式控制系統(tǒng)開(kāi)發(fā)
3、孫老師：1.振動(dòng)信號(hào)時(shí)頻分析理論與測(cè)試系統(tǒng)設(shè)計(jì) 2.汽車(chē)檢測(cè)系統(tǒng)設(shè)計(jì) 3.汽車(chē)電子控制系統(tǒng)設(shè)計(jì)
4、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
5、袁老師：1.計(jì)算機(jī)視覺(jué) 2.無(wú)線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專(zhuān)家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢(xún)問(wèn)留言已有0條留言

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

天威視訊終端編碼相關(guān)技術(shù)

天翼視訊免流量的方法相關(guān)技術(shù)

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種視訊編碼方法