欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種視訊編碼方法

文檔序號(hào):7731332閱讀:295來(lái)源:國(guó)知局
專(zhuān)利名稱(chēng):一種視訊編碼方法
技術(shù)領(lǐng)域
本發(fā)明關(guān)于一種視訊編碼方法,特別關(guān)于一種具有支持編輯場(chǎng)景改變功能的視訊編碼方法。
背景技術(shù)
在MPEG(Moving Pictures Experts Group)規(guī)格中有三種圖像類(lèi)型(picture type),包括I-圖像、P-圖像、以及B-圖像。I-圖像在編碼時(shí)沒(méi)有參考任何其它圖像。I-圖像可提供編碼順序的起始點(diǎn),亦即可以開(kāi)始譯碼的位置,但是僅能以一般壓縮(moderate compression)進(jìn)行編碼。P-圖像參考剛過(guò)去的I-圖像或P-圖像使用移動(dòng)補(bǔ)償預(yù)測(cè)(motion compensated prediction)來(lái)編碼,因此編碼較有效率,而且一般被用來(lái)作為更進(jìn)一步預(yù)測(cè)的參考。B-圖像提供了最高等級(jí)的壓縮,但是需要過(guò)去以及未來(lái)的圖像作為移動(dòng)補(bǔ)償。B-圖像是不被使用為預(yù)測(cè)的參考圖像。此三種類(lèi)型的圖像的構(gòu)造(organization)在順序上是相當(dāng)有彈性的。順序的選擇是由編碼器決定,且依據(jù)應(yīng)用的需求決定順序。
由于B-圖像必須參考過(guò)去以及未來(lái)的圖像,所以必須等到未來(lái)的圖像編碼完后,才進(jìn)行編碼。因此,圖像的顯示順序與編碼順序是不同的,且被稱(chēng)為B-圖像的重新排序(reordering)。
在MPEG-1規(guī)格中,編碼器使用圖像群組(group-of-pictures,以下簡(jiǎn)稱(chēng)GOP)包裝一群圖像成為一組來(lái)巧妙運(yùn)用。每個(gè)GOP一般包含一個(gè)I-圖像、數(shù)個(gè)P-圖像、以及數(shù)個(gè)B-圖像,且編碼順序上是以I-圖像為開(kāi)始,下一個(gè)I-圖像之前結(jié)束。而在MPEG-2規(guī)格中,GOP的架構(gòu)就具有選擇性。
通常,編碼器使用固定的GOP架構(gòu)(fixed GOP structure)。每個(gè)GOP的長(zhǎng)度(size)被定義成N,且兩個(gè)參考圖像的距離定義成M。圖1顯示N=15、M=3的GOP。
一般而言,若輸入的信號(hào)為NTSC格式(29.97fps),亦即每秒29.97個(gè)圖框,則使用N=15、M=3的GOP架構(gòu)。若輸入的信號(hào)為PAL格式(25fps)或電影格式(film format)(24fps),亦即每秒25個(gè)圖框或24個(gè)圖框,則使用N=12、M=3的GOP架構(gòu)。這些固定的默認(rèn)值可以在編碼器的復(fù)雜度以及大部分的編碼特性之間取得一個(gè)好的平衡點(diǎn)。
一般而言,影像編輯處理(editing process)會(huì)將整個(gè)影像順序(videosequence)根據(jù)場(chǎng)景(scene)切割成幾個(gè)部分(pieces),之后再重新排列(rearrange)這些部分形成一個(gè)新的影像順序。若一個(gè)影像順序以?xún)H包含I-圖像與P-圖像的固定式樣來(lái)編碼,例如...IPPPPIPPPP...,此種狀態(tài)是很單純的。若場(chǎng)景改變(scene change)發(fā)生于I-圖像,則影像順序可被切割成兩個(gè)部分,且不會(huì)有任何損失(loss)。若場(chǎng)景改變(scene change)發(fā)生于P-圖像,則前一部份不會(huì)有問(wèn)題,但剩余的部分必須重新編碼。首先,P-圖像必須先被譯碼后,再將其重新編碼成I-圖像。然而,由于重新編碼成I-圖像與原始的P-圖像之間會(huì)有差異性,所以會(huì)產(chǎn)生失真?zhèn)鬟f(error propagation)。重新編碼整個(gè)剩余部分至下一個(gè)I-圖像會(huì)是較好的解決方式,但會(huì)嚴(yán)重衰減(degrade)影像品質(zhì)。
若編碼的影像順序還包含了B-圖像,則影像編輯處理會(huì)更為復(fù)雜。圖2顯示了包含B-圖像的影像順序的例子。若場(chǎng)景改變剛好發(fā)生于I-圖像之后,如圖所示的圖像B4,則可輕易地將影像順序從圖像I6切成兩個(gè)場(chǎng)景部分。然而,即使圖像P3與圖像B4歸屬于不同場(chǎng)景,但是圖像B4、B5仍有一些宏區(qū)塊必須參考圖像P3。因此,圖像B4、B5必須以?xún)H參考圖像I6的方式重新編碼。當(dāng)然,拋棄圖像B4、B5是最簡(jiǎn)單的方式,但是遺失一個(gè)場(chǎng)景開(kāi)頭部分圖像是無(wú)法被接受的。
若場(chǎng)景改變發(fā)生于圖像B5,則該GOP的前面部分與剩余部分均需要被重新編碼。圖像B4必須被重新編碼成P-圖像,并添加于前面部分。而對(duì)于剩余部分,圖像B4的編碼資料必須被移除,且圖像B5必須被重新編碼。
若場(chǎng)景改變發(fā)生于圖像I6,則該GOP的剩余部分只需要移除圖像B4與圖像B5的編碼資料,但該GOP的前面部分則需要復(fù)雜的處理。一個(gè)處理方式是將圖像B5重新編碼成P-圖像,并將圖像B4以參考圖像P3與圖像B5的方式重新編碼。另一個(gè)處理方式是將圖像B4與圖像B5重新編碼成P-圖像。
若場(chǎng)景改變發(fā)生于圖像B7,則該GOP的前面部分不需任何處理,但是一個(gè)新的I-圖像必須被產(chǎn)生于該GOP的剩余部分。一個(gè)選擇是將圖像B7變更成I-圖像,并重新編碼該GOP的剩余部分。然而,由于B-圖像以低于I-圖像與P-圖像的影像品質(zhì)進(jìn)行編碼,因此較好的選擇是將圖像P9變更為I-圖像,并重新編碼該GOP的剩余部分。圖像B4與圖像B5僅為后方參考的B-圖像。此方法亦可減少P-圖像的數(shù)量,藉以減少參考到重新編碼的圖像所造成的失真。
若場(chǎng)景改變發(fā)生于圖像B8,則該GOP的前面部分僅需將圖像B7重新編碼成P-圖像。而該GOP的剩余部分可將圖像P9變更為I-圖像,并重新編碼該GOP的剩余部分。
最后,若場(chǎng)景改變發(fā)生于圖像P9,則該GOP的前面部分的處理可與場(chǎng)景改變發(fā)生于圖像I6時(shí)相同。而對(duì)于該GOP的剩余部分,可將圖像P9變更為I-圖像,并重新編碼該GOP的剩余部分。
因此,其它情形可以如同上述的方法進(jìn)行處理,即使在兩個(gè)參考圖像之間的B-圖像數(shù)量增加為3或是更多。
一般而言,I-圖像設(shè)計(jì)的目的是可以隨機(jī)存取以及防止失真向后傳遞。而P-圖像是使用移動(dòng)補(bǔ)償(motion compensation)來(lái)移除目前圖像與參考圖像之間的時(shí)間重復(fù)性(temporal redundancy),藉以改善壓縮率。然而,當(dāng)目前圖像與參考圖像之間沒(méi)有任何時(shí)間重復(fù)性,例如場(chǎng)景改變,則將目前圖像編碼成P-圖像并無(wú)任何好處。在此情形下,將目前圖像編碼成I-圖像反而可以較少的位元得到相同的編碼品質(zhì)。因此,一個(gè)編碼器必須去偵測(cè)是否有場(chǎng)景改變的情形,若有則激活一個(gè)新的GOP。目前已有許多偵測(cè)場(chǎng)景改變的研究,以及如何調(diào)整使用率控制的算法。一般的想法是偵測(cè)目前圖像與參考圖像的移動(dòng)預(yù)測(cè)的差異性。若超過(guò)一定比例的宏區(qū)塊選擇自身編碼模式(intra-coded mode),則編碼器判定僅存在一些時(shí)間重復(fù)性,而認(rèn)為場(chǎng)景改變。
然而,當(dāng)場(chǎng)景改變時(shí),若編碼器僅激活一個(gè)新的GOP而沒(méi)有任何其它處理動(dòng)作,則在進(jìn)行影像編輯處理時(shí)仍無(wú)法避免一些圖像的重新編碼,而造成失真?zhèn)鬟f,影像品質(zhì)衰減。

發(fā)明內(nèi)容
有鑒于上述問(wèn)題,本發(fā)明的目的是提出一種具有支持編輯場(chǎng)景改變功能的視訊編碼方法。
為達(dá)成上述目的,本發(fā)明視訊編碼方法包含下列步驟擷取圖像,以顯示順序擷取圖像數(shù)據(jù)并儲(chǔ)存;偵測(cè)場(chǎng)景改變,偵測(cè)圖像PICn是否發(fā)生場(chǎng)景改變,若沒(méi)有發(fā)生場(chǎng)景改變,則以編碼順序編碼圖像,若有發(fā)生場(chǎng)景改變,則進(jìn)行特殊編碼處理。特殊編碼處理包含下列步驟確認(rèn)上一張圖像PICn-1是否為參考圖像,若上一張圖像PICn-1不為參考圖像時(shí),則進(jìn)行第一與第三階段編碼,否則進(jìn)行第二與第三階段編碼。第一階段編碼將上一張圖像PICn-1重新編碼為P-圖像;第二階段編碼編碼上一張圖像PICn-1之前的B-圖像;第三階段編碼則激活一個(gè)新的圖像群組,并將圖像PICn+M-1編碼為I-圖像,之后將圖像PICn至PICn+M-2編碼為B-圖像,且該等B-圖像僅參考圖像PICn+M-1。
由于本發(fā)明在編碼時(shí)已經(jīng)考慮場(chǎng)景改變的狀態(tài),而重新激活一個(gè)新的GOP,因此影像編輯處理時(shí)可以直接切割不同的GOP,而不需重新編碼,不但使編輯速度可以提升,且不會(huì)因編輯而造成影像失真。


圖1顯示習(xí)知N=15、M=3的圖像群組。
圖2顯示習(xí)知包含B-圖像的影像順序的例子。
圖3顯示固定圖像群組架構(gòu)。
圖4顯示第一種包含顯示與編碼順序的圖像群組。
圖5顯示第二種包含顯示與編碼順序的圖像群組。
圖6顯示第三種包含顯示與編碼順序的圖像群組。
圖7顯示本發(fā)明具有支持編輯場(chǎng)景改變功能的視訊編碼方法的流程圖具體實(shí)施方式
以下參考附圖并結(jié)合具體實(shí)施例詳細(xì)說(shuō)明本發(fā)明具有支持編輯場(chǎng)景改變功能的視訊編碼方法。
首先,使用本發(fā)明的具有支持編輯場(chǎng)景改變功能的視訊編碼方法的編碼器必須具有場(chǎng)景改變的偵測(cè)功能,而且該偵測(cè)功能必須應(yīng)用于顯示順序(displayorder)。這是因?yàn)榫幋a器必須知道場(chǎng)景改變所發(fā)生的地方,以便將場(chǎng)景改變的前、后編碼成兩個(gè)GOP。
當(dāng)編碼器沒(méi)有偵測(cè)到任何場(chǎng)景改變時(shí),編碼器以固定GOP架構(gòu)進(jìn)行編碼。一旦偵測(cè)到任何場(chǎng)景改變時(shí),則編碼器根據(jù)剛完成編碼的圖像的類(lèi)別以及位置來(lái)決定如何編碼接下來(lái)的圖像。必須注意的是,由于B-圖像必須在未來(lái)參考圖像編碼完成后才能進(jìn)行編碼,因此場(chǎng)景改變必須在編碼實(shí)際發(fā)生以前被偵測(cè)出來(lái)。圖2即顯示出習(xí)知技術(shù)的一種例子。編碼器是以顯示順序來(lái)擷取圖像并儲(chǔ)存于緩沖器。圖像B4與B5被擷取之后,一直等到圖像I6編碼完成后才被編碼。假設(shè)編碼器可以在每個(gè)擷取圖像的周期中編碼一張圖像,則圖像I6可以在相同周期中被擷取與編碼。而在下一周期中,圖像B4被編碼,同時(shí)圖像B7被擷取。圖像B5在圖像B8被擷取的同一周期被編碼。由于圖像P9僅需要圖像I6做參考,因此圖像P9可在同一周期中被擷取與編碼。
如圖3所示,對(duì)于一個(gè)以固定GOP架構(gòu)編碼的編碼器而言,將兩個(gè)參考圖像的距離定義為M,并將參考圖像(I-圖像與P-圖像)定義為R。在前方參考圖像RX之后的第一個(gè)B-圖像(顯示順序)被稱(chēng)為BX1,第二個(gè)被稱(chēng)為BX2,以此類(lèi)推。在后方參考圖像之前的最后一個(gè)B-圖像被稱(chēng)為BXM-1。以下分別說(shuō)明在不同位置發(fā)生場(chǎng)景改變時(shí),編碼器的編碼方法。
一、場(chǎng)景改變發(fā)生在第一個(gè)B-圖像當(dāng)圖像BA1至RB都沒(méi)有場(chǎng)景改變時(shí),則圖像BA1至BAM-1被擷取后儲(chǔ)存在緩沖器,直到圖像RB被擷取并編碼完后才進(jìn)行編碼。但是當(dāng)場(chǎng)景改變發(fā)生在圖像BB1,則圖像RB以及之前的圖像是歸屬于前方GOP,而圖像BB1以及之后的圖像是歸屬于后方GOP。在編碼完圖像BAM-1后,若編碼器激活一個(gè)新的GOP并對(duì)后續(xù)的圖像以不參考圖像RB來(lái)編碼,則可完全地將影像順序切成兩個(gè)部分。所以,影像編輯處理時(shí)可以從新的GOP切割,而不需任何的重新編碼。
有兩種方式可以激活一個(gè)新的GOP。第一種方式如圖4所示,從I-圖像激活一個(gè)固定GOP架構(gòu)。在上述例子中,原始圖像BB1被變更成I-圖像RC、接著M-1個(gè)圖像為B-圖像BC1-BCM-1、接著為P-圖像RD、接著為B-圖像BD1-BDM-1等。。
然而,一個(gè)新的GOP并不需要在顯示順序上以I-圖像開(kāi)始。從觀察圖4的編碼順序可以了解,在圖像RC與RD之間并無(wú)任何的B-圖像。B-圖像比起I-圖像與P-圖像,可以較低的品質(zhì)與較少的位元率來(lái)編碼。若在短的區(qū)間有太多的參考圖像,其結(jié)果是每個(gè)參考圖像無(wú)法獲得足夠的位元來(lái)達(dá)成較高的品質(zhì)。因此,第二種方式如圖5所示,以試著保持B-圖像數(shù)目與參考圖像數(shù)目的比例來(lái)激活一個(gè)新的GOP。最先的M-1個(gè)圖像為B-圖像、接著為一個(gè)I-圖像、接著為M-1個(gè)B-圖像、接著為一個(gè)P-圖像,以此類(lèi)推。
雖然每個(gè)圖像的類(lèi)別似乎與沒(méi)有發(fā)生場(chǎng)景改變時(shí)相同,但其差別是圖像BB1-BBM-1僅參考后方的參考圖像RC。事實(shí)上,在圖像RC之前不一定要有M-1個(gè)B-圖像,而可以隨意調(diào)整。
二、場(chǎng)景改變發(fā)生在第二個(gè)B-圖像如圖3所示,當(dāng)場(chǎng)景改變發(fā)生在第二個(gè)B-圖像BB2,則圖像BB1以及之前的圖像是歸屬于前方GOP,而圖像BB2以及之后的圖像是歸屬于后方新的GOP。新的GOP可以利用上述的第一情形的方法進(jìn)行編碼,而要特別處理的是前方的GOP。
一個(gè)GOP必須以一個(gè)參考圖像來(lái)結(jié)尾。因此,圖像BB1必須被編碼成一個(gè)參考圖像。沒(méi)有理由不將圖像BB1編碼成P-圖像,而編碼成I-圖像。圖6顯示此種例子。
三、場(chǎng)景改變發(fā)生在第n個(gè)B-圖像當(dāng)場(chǎng)景改變發(fā)生在參考圖像RX后之后的第n個(gè)B-圖像BXn,其中2<n<M,則圖像BXn-1以及之前的圖像是歸屬于前方GOP,而圖像BXn以及之后的圖像是歸屬于后方新的GOP。新的GOP可以利用上述的第一情形的方法進(jìn)行編碼。
根據(jù)第二情形的方法,編碼器會(huì)將BXn-1編碼成P-圖像,以及將圖像BX1-BXn-2(若存在)以參考RX與新編碼成的P-圖像來(lái)編碼成B-圖像。
四、場(chǎng)景改變發(fā)生在參考圖像再參考圖3。當(dāng)場(chǎng)景改變發(fā)生在參考圖像RB,則圖像BAM-1以及之前的圖像是歸屬于前方GOP,而圖像RB以及之后的圖像是歸屬于后方新的GOP。前方GOP可以利用第三情形所描述的方法進(jìn)行編碼,而新的GOP可以利用第一情形所描述的方法進(jìn)行編碼。
圖7顯示本發(fā)明具有支持編輯場(chǎng)景改變功能的視訊編碼方法的流程圖。該具有支持編輯場(chǎng)景改變功能的視訊編碼方法的步驟如下步驟S702以顯示順序擷取圖像PICn并偵測(cè)場(chǎng)景是否改變。一般而言,在進(jìn)行場(chǎng)景改變偵測(cè)時(shí),大都以未編碼的圖像來(lái)偵測(cè)。
步驟S704若場(chǎng)景沒(méi)有改變,則跳至步驟S706,若場(chǎng)景有改變,則跳至步驟S708的特殊編碼處理。
步驟S706以編碼順序編碼圖像。若沒(méi)有發(fā)生場(chǎng)景改變,則以編碼順序編碼圖像,并跳回步驟S702。
步驟S708若場(chǎng)景有改變,則確認(rèn)上一張圖像PICn-1是否被編碼為參考圖像(reference picture)?若不是被編碼為參考圖像,則跳至步驟S710的第一階段編碼,若是被編碼為參考圖像,則跳至步驟S716的第二階段編碼。
步驟S710若上一張參考圖像的前還存在有B-圖像,則結(jié)束該等B-圖像的編碼。
步驟S712將圖像PICn-1編碼為P-圖像。
步驟S714若上一張圖像PICn-1的前存在其它B-圖像,則編碼這些B-圖像,并跳至步驟S718的第三階段編碼。
步驟S716編碼上一張圖像PICn-1的前的B-圖像。
步驟S718激活一個(gè)新的GOP并將PICn+m-1編碼為I-圖像。
步驟S720將圖像PICn~PICn+m-2之間的圖像編碼為B-圖像且僅參考圖像PICn+m-1。
由于本發(fā)明在編碼時(shí)已經(jīng)考慮場(chǎng)景改變的狀態(tài),而重新激活一個(gè)新的GOP,因此影像編輯處理時(shí)可以直接切割不同的GOP,而不需重新編碼,不但使編輯速度可以提升,且不會(huì)因編輯而造成影像失真。
以上雖以實(shí)施例說(shuō)明本發(fā)明,但并不因此限定本發(fā)明的范圍,只要不脫離本發(fā)明的要旨,該行業(yè)者所進(jìn)行的各種變形或變更,皆屬于本發(fā)明的保護(hù)范圍,本發(fā)明的保護(hù)范圍以權(quán)利要求書(shū)所限定的范圍為準(zhǔn)。
權(quán)利要求
1.一種視訊編碼方法,該編碼方法的圖像群組中,將兩個(gè)參考圖像距離定義為M,其特征在于所述的視訊編碼方法包括擷取圖像,以顯示順序擷取圖像數(shù)據(jù)并儲(chǔ)存;以及偵測(cè)場(chǎng)景改變,偵測(cè)圖像PICn是否發(fā)生場(chǎng)景改變,若沒(méi)有發(fā)生場(chǎng)景改變,則以編碼順序編碼圖像,若發(fā)生場(chǎng)景改變,則進(jìn)行特殊編碼處理;所述的特殊編碼處理包括確認(rèn)上一張圖像PICn-1是否為參考圖像,若上一張圖像PICn-1不為參考圖像時(shí),則進(jìn)行第一與第三階段編碼;否則進(jìn)行第二與第三階段編碼;所述的第一階段編碼,將上一張圖像PICn-1重新編碼為P-圖像;所述的第二階段編碼,編碼上一張圖像PICn-1之前的B-圖像;所述的第三階段編碼,激活一個(gè)新的圖像群組,并將圖像PICn+M-1編碼為I-圖像,之后將圖像PICn至PICn+M-2編碼為B-圖像,且該等B-圖像僅參考圖像PICn+M-1。
2.根據(jù)權(quán)利要求1所述的視訊編碼方法,其特征在于所述的第一階段編碼還包括若上一個(gè)參考圖像之前存在B-圖像,則結(jié)束該等B-圖像的編碼。
3.根據(jù)權(quán)利要求1所述的視訊編碼方法,其特征在于所述的第一階段編碼還包括若上一張圖像PICn-1之前存在B-圖像,則對(duì)這些B-圖像編碼。
全文摘要
一種具有支持編輯場(chǎng)景改變功能的視訊編碼方法。該方法包括以顯示順序擷取圖像數(shù)據(jù)并儲(chǔ)存;偵測(cè)圖像PIC
文檔編號(hào)H04N7/50GK1581974SQ0314971
公開(kāi)日2005年2月16日 申請(qǐng)日期2003年8月6日 優(yōu)先權(quán)日2003年8月6日
發(fā)明者張永清 申請(qǐng)人:矽統(tǒng)科技股份有限公司
網(wǎng)友詢(xún)問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
麻栗坡县| 南丹县| 台中县| 兴国县| 东兴市| 嘉义县| 重庆市| 青阳县| 定日县| 朝阳区| 白银市| 云安县| 工布江达县| 西藏| 吉林省| 延寿县| 温宿县| 华池县| 班玛县| 白朗县| 陈巴尔虎旗| 绥化市| 西宁市| 大悟县| 新巴尔虎右旗| 五寨县| 海宁市| 武夷山市| 汾西县| 女性| 手游| 永平县| 天全县| 平江县| 浠水县| 永德县| 阿克陶县| 磐安县| 南阳市| 松溪县| 利辛县|