專利名稱:對(duì)壓縮的視頻信號(hào)的處理的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及對(duì)可以是視頻和/或音頻信號(hào)的壓縮信號(hào)的處理。
背景技術(shù):
MPEG是眾所周知的信號(hào)壓縮格式,但是某些版本的MPEG易受分塊假象(blocking artefact)的影響。在MPEG壓縮/解壓縮的視頻信號(hào)中通常有兩種類型的分塊假象。在空間上高度活動(dòng)的圖片區(qū)域中,當(dāng)量化達(dá)到高水平時(shí)會(huì)出現(xiàn)分塊,并且沒有足夠的離散余弦變換(DCT)系數(shù)來代表圖片的完整細(xì)節(jié)??梢酝ㄟ^可位于編碼器和解碼器預(yù)測(cè)回路(prediction loop)內(nèi)的空間低通濾波器,或者可以通過作為對(duì)壓縮的視頻信號(hào)進(jìn)行解碼之后的后處理操作的空間低通濾波器,來減少這種類型的分塊。
第二種類型的分塊有時(shí)被稱為最低有效位(LSB)馬賽克噪聲(block noise)或“色調(diào)分離(posterisation)”。這種第二類型的分塊出現(xiàn)在空間上不活動(dòng)的圖片區(qū)域中,即沒有細(xì)節(jié)但是存在亮度和/或顏色的精細(xì)變化的區(qū)域,諸如天空。在源信號(hào)中,通常存在著傾向于掩藏亮度差和色差信號(hào)僅改變一個(gè)最低有效位(LSB)的圖像區(qū)域之間的輪廓的少量噪聲。然而,對(duì)于除了極低量化因子外的量化因子,在壓縮處理中會(huì)除去該噪聲。在最普通的工作條件下,即在普通比特率下,這些不活動(dòng)區(qū)域中的每個(gè)分塊是在沒有任何AC系數(shù)的情況下進(jìn)行編碼的,因而被解碼成具有恒定亮度差和色差信號(hào)的分塊。空間低通濾波器不能消除這種類型的分塊假象,因?yàn)椴淮嬖谠摓V波器能夠除去的頻率分量,即,該濾波器的輸出將會(huì)改變與輸入相同的LSB。因此,任何這樣的濾波器都無法觸及該分塊假象。
該問題存在于以小于10比特的數(shù)字表示視頻分量信號(hào)的所有基于分塊的壓縮系統(tǒng)中,例如,MPEG-2、MPEG-4 part 2、MPEG-4 part 10(主類(main profile))和SMPTE421M(VC-1)全都使用8比特?cái)?shù)字用于亮度和色度信號(hào)。然而,在壓縮算法本身中也存在著能夠影響色調(diào)分離效果的可見度的差別。已經(jīng)發(fā)現(xiàn)在MPEG-2和MPEG-4 part 2系統(tǒng)中,該問題的嚴(yán)重性要輕于諸如MPEG-4 part 10和VC-1的更高級(jí)的編碼算法。原因是逆向DCT較小的不精確度以及MPEG-2和MPEG-4 part 2中定義的失配控制(mismatch control)算法,在被解碼的圖片中重新引入了少量噪聲,其中該圖片傾向于將LSB分塊噪聲掩藏到一定程度。由于在MPEG-4 part 10和VC-1中的變換和逆變換是精確定義的整數(shù)運(yùn)算,所以采用這些系統(tǒng)的變換不會(huì)受到DCT不精確的影響,因此不需要失配控制。由于MPEG-4 part 10和VC-1具有比特精確的逆變換,所以它們能夠經(jīng)受許多預(yù)測(cè)階段(predictiongeneration)而不需要內(nèi)編碼圖片。缺點(diǎn)是因?yàn)闆]有在解碼處理中加入噪聲,所以不能掩藏LSB噪聲。
發(fā)明內(nèi)容
本發(fā)明試圖克服關(guān)于MPEG-4 part 10和VC-1編碼系統(tǒng)的上述缺點(diǎn)。
根據(jù)本發(fā)明的第一方面,提供了一種如本文的權(quán)利要求1所述的方法。
根據(jù)本發(fā)明的第二方面,提供了一種如本文的權(quán)利要求6所述的設(shè)備。
本發(fā)明的優(yōu)選特征由從屬權(quán)利要求定義。
現(xiàn)將參考附圖,以舉例的方式來描述本發(fā)明,在附圖中圖1以圖形的形式示出了具有抖動(dòng)的輸出視頻信號(hào)如何比原始解碼視頻信號(hào)更接近圍繞所關(guān)注的像素的像素的平均值,并且圖2以示意性框圖的形式示出了用于實(shí)現(xiàn)根據(jù)本發(fā)明的方法的設(shè)備。
具體實(shí)施例方式
通過使用稱為“抖動(dòng)”的系統(tǒng)添加少量噪聲來掩藏圖像中的輪廓假象(contouring artefact)是已知的。抖動(dòng)是在信號(hào)變量的動(dòng)態(tài)范圍低于觀察者/收聽者的感覺的音頻和視頻處理兩者中使用的眾所周知的信號(hào)處理技術(shù)。在已知系統(tǒng)中,在編碼信號(hào)時(shí)采用抖動(dòng)。
相區(qū)別地,本發(fā)明針對(duì)解碼信號(hào)。在解壓縮之后遭遇的困難是,如果應(yīng)用抖動(dòng),則可能不容易控制抖動(dòng)的量。即,可能不容易決定應(yīng)該在圖像中的何處以及在什么樣的條件下加入特定量的抖動(dòng)噪聲。如果不管圖片內(nèi)容和量化因子如何而加入恒定量的抖動(dòng)噪聲,那么這將會(huì)不合需要。
在本發(fā)明中,僅在具有低空間細(xì)節(jié)的區(qū)域中并且僅在局部量化因子(local quantization factor)高于預(yù)定閾值的情況下施加抖動(dòng)。局部量化因子被賦給宏塊,即四個(gè)8×8像素構(gòu)成的分塊。因此,抖動(dòng)幅度取決于局部量化因子。
是否應(yīng)該施加抖動(dòng)以及抖動(dòng)信號(hào)的極性,是以如下方式受到控制的使得最終輸出信號(hào)的空間平均值是比原始信號(hào)更接近周圍像素的平均值的近似值。
圖1是具有相對(duì)于時(shí)間的DC亮度坐標(biāo)軸的圖形表示,其中曲線(a)代表MPEG原始解碼信號(hào),曲線(b)代表所關(guān)注的像素的周圍像素的平均值,而曲線(c)示出了被施加了抖動(dòng)的輸出視頻信號(hào)。從這些曲線中可以觀察出,盡管抖動(dòng)信號(hào)是隨機(jī)的,但是1和0的概率是取決于周圍像素的平均值而變化的,從而產(chǎn)生使最低有效位水平之間變化更平滑的平均值。人類眼睛觀察到的正是該平均值,因?yàn)槿祟惖囊曈X系統(tǒng)傾向于“過濾掉”抖動(dòng)噪聲。
現(xiàn)參考圖2,其示出了用于執(zhí)行本發(fā)明的硬件的一個(gè)實(shí)施例。壓縮的視頻信號(hào)在終端1處被施加給MPEG解碼器2。使用線延遲(linedelay)和像素延遲10-17的矩陣,來分析以當(dāng)前像素C為中心而圍繞的3×3像素的圖像區(qū)域,并且邏輯電路21-23計(jì)算周圍像素的最大值、最小值和平均值。這些值連同當(dāng)前像素C、局部量化參數(shù)QP和由隨機(jī)數(shù)發(fā)生器4生成的隨機(jī)數(shù)A一起被饋送給抖動(dòng)邏輯電路3。
考慮以下3×3像素的矩陣。
S00S10S20S01C S21
S02S12S22其中Sxx是當(dāng)前處理的像素C上方、下方、左邊和右邊的周圍像素。
從這些像素中,計(jì)算以下中間變量,它們是8比特的亮度值。
Max=maximum(S00..S22)Min=minimum(S00..S22)Mean=∑(S00..S22)/8P=Mean-CIf(P<0)thenP=-PSign=-1elseSign=1注意平均值和P都是浮點(diǎn)變量。
這樣,P是樣本C相對(duì)于周圍像素的極性的表示,并且將會(huì)是正或負(fù)值。
在上述實(shí)例中,抖動(dòng)幅度被固定為1 LSB并且可取決于周圍像素是正或負(fù)值。抖動(dòng)信號(hào)除去LSB噪聲。如果當(dāng)前像素信號(hào)在周圍像素平均值的1 LSB之內(nèi),則P將代表應(yīng)該施加抖動(dòng)校正的概率。此外,如果施加了抖動(dòng)信號(hào),則抖動(dòng)信號(hào)應(yīng)該等于值“sign”。然而,僅當(dāng)3×3像素塊不包含更高幅度的細(xì)節(jié)時(shí),即,當(dāng)max-min<3,表示存在例如天空的簡(jiǎn)單景象并且平均像素亮度與像素C亮度的差別很小時(shí),才施加抖動(dòng)信號(hào)。此外,還要求量化參數(shù)必須高于預(yù)定閾值。這些條件確保僅在將使LSB噪聲可視的那些圖片區(qū)域中施加抖動(dòng)噪聲。
If((P<1)AND(A<P)AND((Max-Min)<3AND(QP>T))thendither=Signelsedither=0其中A=在0和1之間具有均勻的概率密度的隨機(jī)數(shù)QP=量化參數(shù)T=為了施加抖動(dòng)信號(hào),QP必須超過的閾值這個(gè)后面的計(jì)算由抖動(dòng)邏輯電路3執(zhí)行,然后抖動(dòng)邏輯電路3在終端5處提供由下式給出的視頻輸出信號(hào)VopVop=C+dither注意為了有效地降低LSB分塊噪聲,應(yīng)對(duì)所有三個(gè)視頻分量信號(hào)Y、Cr和Cb獨(dú)立地施加上述算法。
由抖動(dòng)邏輯電路3執(zhí)行的計(jì)算被設(shè)置成去除LSB分塊噪聲。然而,本領(lǐng)域的技術(shù)人員將會(huì)理解,上面定義的閾值和幅度可以如下方式變化更高幅度的分塊噪聲可由更高幅度的抖動(dòng)信號(hào)處理。
在圖2中,可以有典型為1個(gè)時(shí)鐘脈沖的各種采樣延遲10-15和一條線的延遲16、17,以便提供樣本S00-S22的適當(dāng)?shù)亩〞r(shí)(timing)。邏輯電路21計(jì)算樣本S00-S22的平均值,邏輯電路22計(jì)算樣本S00-S22的最大值,而邏輯電路23計(jì)算樣本S00-S22的最小值。來自邏輯電路21-23的輸出、當(dāng)前像素C和從MPEG解碼器2輸出的量化參數(shù)QP,連同上述的隨機(jī)數(shù)A一起全部被輸入到抖動(dòng)邏輯電路3中。
權(quán)利要求
1.一種處理壓縮的視頻信號(hào)的方法,其包括下列步驟解壓縮所述視頻信號(hào)以提供具有圍繞所關(guān)注的像素(C)的像素的亮度樣本的原始解碼信號(hào)(a),計(jì)算所述樣本的平均值、最大值和最小值,以及將所述樣本的所述平均值、最大值和最小值,連同所關(guān)注的像素(C)的值、量化參數(shù)(QP)和隨機(jī)數(shù)(A)一起施加到邏輯電路(3),其中僅在場(chǎng)景中具有低空間細(xì)節(jié)的區(qū)域中對(duì)所關(guān)注的像素的值施加抖動(dòng)信號(hào),并且其中,所述量化參數(shù)高于預(yù)定閾值。
2.如權(quán)利要求1所述的方法,其中,所述樣本是從直接圍繞所關(guān)注的像素的樣本的矩陣中取得的。
3.如權(quán)利要求1或2所述的方法,其中,所述抖動(dòng)信號(hào)的幅度被固定為一個(gè)有效位。
4.如權(quán)利要求1所述的方法,其中,僅在像素矩陣的亮度樣本的最大值和最小值之間的差不超過3的情況下,施加所述抖動(dòng)信號(hào)。
5.如權(quán)利要求1所述的方法,其中,所述視頻信號(hào)包括亮度差和色差分量,并且每個(gè)分量被解壓縮并被施加了所述抖動(dòng)信號(hào)。
6.一種設(shè)備,其包括視頻解碼器裝置(2),其被設(shè)置成輸出原始解碼信號(hào)(a)和量化參數(shù)(QP);采樣延遲裝置(10-15)和線延遲裝置(16、17),其被設(shè)置成對(duì)圍繞所述原始解碼信號(hào)(a)的感興趣的像素的像素進(jìn)行采樣;平均值計(jì)算裝置(21),其被設(shè)置成計(jì)算樣本像素的平均值;第一比較器裝置(22),其被設(shè)置成確定所述樣本像素的最大值;第二比較器裝置(23),其被設(shè)置成確定所述樣本像素的最小值;隨機(jī)數(shù)發(fā)生器裝置(4);和邏輯裝置(3),其被設(shè)置成在以下情況下對(duì)感興趣的像素施加抖動(dòng)所述平均值和感興趣的像素的值之間的差小于1;由所述隨機(jī)數(shù)發(fā)生器產(chǎn)生的隨機(jī)數(shù)小于所述平均值和感興趣的像素的值之間的差;所述最大值和所述最小值之間的差小于第一閾值;并且所述量化參數(shù)(QP)大于第二閾值。
7.如權(quán)利要求6所述的設(shè)備,其中,所述第一閾值為3。
8.如權(quán)利要求6或7所述的設(shè)備,其中,所述采樣延遲裝置和線延遲裝置被設(shè)置成對(duì)直接圍繞感興趣的像素的像素進(jìn)行采樣。
9.如權(quán)利要求6所述的設(shè)備,其中,所述抖動(dòng)信號(hào)的幅度被固定為一個(gè)有效位。
全文摘要
本發(fā)明公開了一種用于處理壓縮的視頻信號(hào)以除去分塊假象的方法和設(shè)備,包括解壓縮視頻信號(hào)以提供原始解碼信號(hào)和量化參數(shù)QP;確定圍繞所關(guān)注的像素C的像素的樣本的平均值、最大值和最小值;將平均值、最大值和最小值、量化參數(shù)和隨機(jī)數(shù)A輸入到邏輯電路3中,以確定是否對(duì)所關(guān)注的像素的值施加抖動(dòng)信號(hào),使得僅在低空間細(xì)節(jié)的區(qū)域中施加抖動(dòng)信號(hào),其中具有低空間細(xì)節(jié)的區(qū)域由最大值和最小值的差小于第一預(yù)定閾值來表示,并且其中量化參數(shù)高于第二預(yù)定閾值。
文檔編號(hào)H04N9/77GK1968415SQ200610143728
公開日2007年5月23日 申請(qǐng)日期2006年11月3日 優(yōu)先權(quán)日2005年11月3日
發(fā)明者A·博克 申請(qǐng)人:泰德廣播電視公司