專利名稱:用于編碼和/或解碼運(yùn)動(dòng)圖像的方法和裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種用于編碼和/或解碼運(yùn)動(dòng)圖像的方法和裝置,尤其涉及一種能夠通過(guò)考慮輸入到運(yùn)動(dòng)圖像編碼器的圖像特性而適應(yīng)性地選擇量化矩陣從而提高編碼運(yùn)動(dòng)圖像的效率的編碼和/或解碼運(yùn)動(dòng)圖像的方法和裝置。
背景技術(shù):
圖1是用于編碼運(yùn)動(dòng)圖像的編碼單元120和用于解碼被編碼的運(yùn)動(dòng)圖像的解碼單元140的方框圖。
為了提供視頻點(diǎn)播(VOD)服務(wù)或進(jìn)行運(yùn)動(dòng)圖像的通信,編碼單元120創(chuàng)建通過(guò)壓縮技術(shù)編碼的位流,而解碼單元140從輸入到其中的位流來(lái)恢復(fù)原始圖像。
為了去除來(lái)自輸入圖像數(shù)據(jù)的空間相關(guān)性,離散余弦變換(DCT)單元122以8×8的象素塊為單元對(duì)輸入到其中的圖像數(shù)據(jù)進(jìn)行DCT操作。量化單元(Q)124通過(guò)使用由DCT單元122獲得的DCT系數(shù)對(duì)輸入圖像數(shù)據(jù)進(jìn)行量化和用幾個(gè)代表值來(lái)表示量化數(shù)據(jù)來(lái)執(zhí)行高效的有損數(shù)據(jù)壓縮。
逆量化單元(IQ)126對(duì)由量化單元124提供的量化的圖像數(shù)據(jù)進(jìn)行逆量化。逆離散余弦變換(IDCT)單元128對(duì)由逆量化單元126提供的逆量化的圖像數(shù)據(jù)進(jìn)行IDCT運(yùn)算。幀存儲(chǔ)器單元130以逐幀的方式存儲(chǔ)由IDCT單元128提供的IDCT變換后的圖像數(shù)據(jù)。
運(yùn)動(dòng)估計(jì)和補(bǔ)償單元(ME/MC)132通過(guò)使用輸入至其中的當(dāng)前幀的圖像數(shù)據(jù)和存儲(chǔ)在幀存儲(chǔ)器單元130中的前一幀的圖像數(shù)據(jù),來(lái)估計(jì)關(guān)于每個(gè)宏塊的運(yùn)動(dòng)向量(MV)和相應(yīng)于每一個(gè)塊品配誤差的絕對(duì)差的總和(SAD)。
可變長(zhǎng)度編碼單元(VLC)134根據(jù)由運(yùn)動(dòng)估計(jì)和補(bǔ)償單元132提供的估計(jì)的運(yùn)動(dòng)向量來(lái)從數(shù)字余弦變換和量化后的圖像數(shù)據(jù)中去掉統(tǒng)計(jì)冗余。
通過(guò)解碼單元140解碼由編碼單元120編碼的位流。解碼單元140包括可變長(zhǎng)度解碼單元(VLD)142、逆量化單元144、IDCT單元146、幀存儲(chǔ)器單元148和運(yùn)動(dòng)估計(jì)單元150。
美國(guó)專利申請(qǐng)第No.6480539號(hào)公開了用于編碼運(yùn)動(dòng)圖像的裝置的一個(gè)例子。
最近開發(fā)了一種機(jī)頂盒,其接收模擬地面廣播節(jié)目并隨后使用諸如MPEG2或MPEG4的數(shù)據(jù)壓縮方法來(lái)解碼和存儲(chǔ)所接收到的節(jié)目。然而,在地面廣播的情形下,到達(dá)接收終端的圖像會(huì)由于信道噪聲而被扭曲。舉個(gè)例子來(lái)說(shuō),圖像會(huì)看起來(lái)似乎向其中加入了白高斯噪聲。如果這樣壓縮圖像的話,壓縮圖像的效率將會(huì)因?yàn)榘赘咚乖肼暤挠绊懚兊梅浅5牡汀?br>
因此,為了去除傳統(tǒng)的編碼運(yùn)動(dòng)圖像的方法中的噪聲,在編碼器的輸入端口處提供了一個(gè)預(yù)處理濾波器。然而,如果使用該預(yù)處理濾波器,就需要一個(gè)附加的對(duì)運(yùn)動(dòng)圖像進(jìn)行編碼的計(jì)算過(guò)程。
另外,在這一傳統(tǒng)的編碼運(yùn)動(dòng)圖像的方法中,不考慮輸入圖像的特性而確定量化矩陣,并且通過(guò)以逐個(gè)圖像的方式將量化矩陣應(yīng)用至輸入圖像來(lái)對(duì)輸入圖像進(jìn)行量化,在這一情形中編碼輸入圖像的效率是很低的。
發(fā)明內(nèi)容
本發(fā)明提供了一種用于編碼和/或解碼運(yùn)動(dòng)圖像的方法和裝置,其能夠提高壓縮運(yùn)動(dòng)圖像的效率和性能。
本發(fā)明還提供了一種用于編碼和/或解碼運(yùn)動(dòng)圖像的方法和裝置,其能夠去除噪聲而不增加所進(jìn)行計(jì)算次數(shù)。
根據(jù)本發(fā)明的一個(gè)方面,提供了一種利用多個(gè)量化矩陣編碼運(yùn)動(dòng)圖像的方法。該方法包括(a)考慮輸入圖像的至少一個(gè)特征來(lái)選擇多個(gè)量化矩陣中的一個(gè);(b)變換所述輸入圖像;(c)利用所選擇的量化矩陣來(lái)量化變換后的輸入圖像。
根據(jù)本發(fā)明的另一個(gè)方面,提供了一種利用多個(gè)量化矩陣來(lái)編碼運(yùn)動(dòng)圖像的方法。該方法包括(a)對(duì)編碼的圖像數(shù)據(jù)進(jìn)行可變長(zhǎng)度解碼;(b)從可變長(zhǎng)度解碼后的圖像數(shù)據(jù)中提取指定根據(jù)輸入圖像的至少一個(gè)特征進(jìn)行分類的多個(gè)量化矩陣中的一個(gè)的索引信息;(c)基于所提取的索引信息選擇多個(gè)量化矩陣中的一個(gè);(d)使用所選擇的量化矩陣對(duì)可變長(zhǎng)度解碼后的圖像數(shù)據(jù)的每一個(gè)宏塊進(jìn)行逆量化。
根據(jù)本發(fā)明的另一個(gè)方面,提供了一種利用多個(gè)量化矩陣來(lái)編碼運(yùn)動(dòng)圖像的裝置。該裝置包括量化矩陣確定單元,其考慮輸入圖像的至少一個(gè)特征來(lái)為每一個(gè)宏塊選擇多個(gè)量化矩陣中的一個(gè),并關(guān)于每一個(gè)宏塊產(chǎn)生指示所選擇的量化矩陣的索引信息;量化矩陣存儲(chǔ)單元,其存儲(chǔ)根據(jù)輸入圖像的特征分類的多個(gè)量化矩陣,并且根據(jù)由所述量化矩陣確定單元產(chǎn)生的索引信息來(lái)為每一個(gè)宏塊輸出一個(gè)量化矩陣;圖像變換單元,其變換所述輸入圖像;量化單元,利用所選擇的量化矩陣來(lái)量化變換后的輸入圖像。
根據(jù)本發(fā)明的另一個(gè)方面,提供了一種利用多個(gè)量化矩陣來(lái)解碼運(yùn)動(dòng)圖像的裝置。該裝置包括可變長(zhǎng)度解碼單元,其接收編碼的圖像流、對(duì)輸入圖像流進(jìn)行可變長(zhǎng)度解碼、從可變長(zhǎng)度解碼后的圖像流的每一個(gè)宏塊中提取指示根據(jù)輸入圖像的至少一個(gè)特征分類的多個(gè)的量化矩陣中的一個(gè)的索引信息;量化矩陣存儲(chǔ)單元,其存儲(chǔ)多個(gè)量化矩陣、基于所提取的索引信息選擇多個(gè)量化矩陣中的一個(gè)、輸出所選擇的量化矩陣;逆量化單元,其利用從所述量化矩陣存儲(chǔ)單元輸出的量化單元來(lái)逆量化可變長(zhǎng)度解碼的圖像流的每一個(gè)宏塊。
本發(fā)明的其它方面和/或優(yōu)點(diǎn)的一部分將在以下的說(shuō)明中闡明,一部分將從說(shuō)明書中顯而易見,或者可以從本發(fā)明的實(shí)際應(yīng)用中領(lǐng)會(huì)。
結(jié)合附圖,通過(guò)下面對(duì)實(shí)施例的詳細(xì)描述,本發(fā)明的這些和/或其他方面和特征將變得更加清楚和明白,其中圖1是傳統(tǒng)的MPEG編碼器和傳統(tǒng)的MPEG解碼器的方框圖;圖2是對(duì)平均值不為0的圖像進(jìn)行處理的近似廣義維納(Wiener)濾波器的方框圖;圖3是在DCT塊中對(duì)平均值不為0的圖像進(jìn)行處理的近似廣義維納濾波器的方框圖;圖4A到圖4C是用于內(nèi)部塊編碼的不同類型的近似廣義維納濾波器的大致的框圖;圖5是用于中間塊編碼的典型視頻編碼器的框圖;圖6是用于根據(jù)本發(fā)明的實(shí)施例來(lái)編碼運(yùn)動(dòng)圖像的裝置的方框圖;圖7是用于根據(jù)本發(fā)明的實(shí)施例來(lái)編碼運(yùn)動(dòng)圖像的裝置的方框圖;圖8是用于根據(jù)本發(fā)明的實(shí)施例來(lái)編碼運(yùn)動(dòng)圖像的裝置的方框圖;
具體實(shí)施例方式
下面將對(duì)在附圖中圖示了其示例的本發(fā)明的實(shí)施例進(jìn)行詳細(xì)的介紹,其中相同的參考數(shù)字始終表示相同的元件。以下將通過(guò)參照附圖對(duì)實(shí)施例進(jìn)行說(shuō)明以便解釋本發(fā)明。
在編碼運(yùn)動(dòng)圖像時(shí),預(yù)處理濾波是很重要的,因?yàn)樗芡ㄟ^(guò)從圖像中去除噪聲而提高編碼運(yùn)動(dòng)圖像的效率。傳統(tǒng)的用于從圖像中去除噪聲的預(yù)處理濾波技術(shù)通常在空間像素塊中執(zhí)行,而在本發(fā)明中,在用于編碼運(yùn)動(dòng)圖像的裝置的DCT塊中執(zhí)行噪聲去除技術(shù)。
在本發(fā)明中,使用近似廣義維納濾波處理方法從圖像中去除噪聲。在近似廣義維納濾波處理方法中,通過(guò)利用例如離散余弦變換(DCT)的快速酉變換(unitary transformation)來(lái)實(shí)現(xiàn)維納濾波。然而,可以選擇性地使用除了近似廣義維納濾波處理方法之外的、在DCT塊中執(zhí)行濾波的濾波方法。
圖2是對(duì)平均值不為0的圖像進(jìn)行處理的近似廣義維納濾波器的方框圖。
在圖2中,v代表一個(gè)包含噪聲的圖像塊, 代表濾波后的圖像塊的按行排列的列向量。因?yàn)閳D像塊v的平均值不為0,因此平均值估計(jì)單元210估計(jì)圖像塊v的平均值 并且減法單元220從圖像塊v中減去該估計(jì)的平均值 通過(guò)濾波單元230對(duì)從減法單元220中輸出的作為相減結(jié)果的z進(jìn)行濾波,并且濾波單元230輸出濾波后的數(shù)據(jù) 作為濾波的結(jié)果。加法單元240將圖像塊v的估計(jì)平均值 加入到該濾波后的數(shù)據(jù)中,并隨后輸出期望的濾波數(shù)據(jù) 作為相加的結(jié)果。
下文中,將對(duì)用于處理平均值為0的圖像模式的近似廣義維納濾波方法進(jìn)行更詳細(xì)的描述。
用于處理平均值為0的圖像模式的近似廣義維納濾波方法可以通過(guò)下面的等式(1)來(lái)表達(dá) 在等式(1)中,L~=ALA*T,L=[I+σn2R-1]-1,]]>R=E[yyT],Z=Az,并且σn2代表噪聲變化量。另外,在等式(1)中,A表示酉變換。由于在本實(shí)施例中,DCT被用作酉變換,因此此處A代表DCT。假設(shè)C8和 代表8×8的DCT矩陣和Kronecher算子,則A=C8⊗C8.]]>由于在大多數(shù)情況下,在酉變換中將 對(duì)角化,因此等式(1)可以改寫為下面的等式(2)。
y^=A*TY^...(2)]]>在等式(2)中,Y^=L~Z[DiagL~]Z.]]>因此,通過(guò)將等式(2)應(yīng)用到一個(gè)8×8的塊中可以得到下面的等式(3)。
p~(k,l)≅11+σn2σ2ψ(k,l)-1...(4)]]>在等式(4)中,ψ(k,l)代表沿著ALA*T的對(duì)角線放置的標(biāo)準(zhǔn)化的元素,σ2代表原始圖像y的變化量。通常,σ2是未知的。因此,用從變化量z中減去噪聲變化量σn2的結(jié)果來(lái)代替σ2。
如等式(3)所示,通過(guò)用 乘以二維DCT系數(shù)Z(k,l)來(lái)對(duì)平均值為0的圖像塊進(jìn)行近似廣義維納濾波。一旦確定了 ,則通過(guò)將 加到 來(lái)得到最終的濾波的圖像。
下文中,將對(duì)用于處理平均值不為0的圖像模式的近似廣義維納濾波方法進(jìn)行更詳細(xì)的描述。
假定通過(guò)用S(k,l),即滿足下述等式(5)的平均塊乘以一個(gè)包含噪聲的輸入DCT塊而得到平均值。然后,在DCT塊中進(jìn)行加法和減法運(yùn)算的圖3中的近似廣義維納濾波器方法可以被重新調(diào)整為圖4A,4B或4C中的近似廣義維納濾波器。
通過(guò)使用等式(3)和等式(5),可以通過(guò)下面的等式(6)來(lái)表示在DCT塊中濾波的圖像塊。
=F(k,l)·V(k,l)]]>等式(6)中的F(k,l)可以由下面的等式(7)來(lái)表達(dá)。
F(k,l)=p~(k,l)·(1-S(k,l))+S(k,l)=1+S(k,l)·σn2σ21ψ(k,l)1+σn2σ2·1ψ(k,l)...(7)]]>如等式(6)所示,整個(gè)的濾波過(guò)程可以被簡(jiǎn)化為F(k,l)的乘法。等式(7)顯示F(k,l)是由信噪比(SNR)、協(xié)方差矩陣、平均值矩陣共同確定的。
為了確定F(k,l),必須獲得平均值矩陣S(k,l)。在本實(shí)施例中,在關(guān)于平均值矩陣S(k,l)的所有可能候選中,選擇滿足等式(5)的一個(gè)??梢杂孟旅娴牡仁?8)來(lái)表示平均矩陣S(k,l)。等式(8)顯示了可以在DCT塊中采用的平均矩陣S(k,l)的多種形式中最簡(jiǎn)單的一種。
S(k,l)=1000000000000000000000000000000000000000000000000000000000000000...(8)]]>下文中,將參考圖4和5更加詳細(xì)地描述在用于編碼運(yùn)動(dòng)圖像的裝置中進(jìn)行的預(yù)處理過(guò)程。
如上所述,可以通過(guò)將圖像塊與DCT值相乘來(lái)對(duì)平均值不為0的圖像塊進(jìn)行近似廣義維納濾波處理。
圖4A到4C是在用于編碼運(yùn)動(dòng)圖像的裝置中的幾種不同類型的近似廣義維納濾波器的方框圖。更特別的是,圖4A到4C描述了一種處理內(nèi)部塊的編碼裝置的結(jié)構(gòu)。圖4A和4B描述了通過(guò)對(duì)DCT塊的內(nèi)部塊進(jìn)行濾波,并對(duì)濾波后的內(nèi)部塊進(jìn)行量化和可變長(zhǎng)度編碼(VLC)而不對(duì)該濾波后的內(nèi)部塊進(jìn)行逆DCT來(lái)編碼內(nèi)部塊。換句話說(shuō),圖4A和4B描述了通過(guò)用F(k,l)乘以DCT系數(shù)來(lái)完成濾波。同時(shí),通過(guò)參考量化表用某一數(shù)值去乘或去除DCT系數(shù)來(lái)執(zhí)行量化。如圖4C所示,通過(guò)用F(k,l)乘以DCT系數(shù)來(lái)進(jìn)行的濾波和通過(guò)用某一數(shù)值乘以DCT系數(shù)來(lái)進(jìn)行的量化可以結(jié)合為一個(gè)操作。
如圖5所示,在圖4A到4C中所描述的本發(fā)明的構(gòu)想可以直接應(yīng)用到當(dāng)用于編碼運(yùn)動(dòng)圖像的裝置處理一個(gè)中間塊的場(chǎng)合,只要已經(jīng)從運(yùn)動(dòng)補(bǔ)償塊信息P(m,n)中去除了噪聲。
依賴于輸入圖像塊是中間塊還是內(nèi)部塊來(lái)確定協(xié)方差值ψ(k,l)。因此,圖5中的F(k,l)可以依賴于所述輸入圖像塊是中間塊還是內(nèi)部塊而變化。
下文中,將參考下面的等式(9)詳細(xì)描述一種獲取多個(gè)內(nèi)部塊或中間塊的估計(jì)的變化量的方法,其中已從所述多個(gè)內(nèi)部塊或中間塊的每一個(gè)中減去了它們的平均值。假設(shè)S表示一個(gè)已經(jīng)從其中減去了相應(yīng)塊的平均值的N×N(其中N=8)的塊,可以使用等式(9)獲得該N×N塊的可變矩陣。
C^=12N2trace(STS)(STS+SST)...(9)]]>W.Niehsen和M.Brunig在“運(yùn)動(dòng)補(bǔ)償?shù)膸町惖膮f(xié)方差分析(CovarianceAnalysis of Motion-compensated Frame Differences)”,IEEE Trans.Circ.Syst.ForVideo Technol.,1999年6月,中已經(jīng)公開了等式(9)。
通過(guò)將等式(9)應(yīng)用于實(shí)驗(yàn)圖像的變化,可以得到一個(gè)估計(jì)的變化量。當(dāng)原始圖像塊為內(nèi)部塊時(shí),原始圖像被劃分為8×8的塊,并且隨后計(jì)算出每個(gè)8×8的塊的變化量。另一方面,當(dāng)原始圖像塊為中間塊時(shí),通過(guò)將上面的等式(9)應(yīng)用于每一個(gè)被確定為中間塊的圖像塊來(lái)計(jì)算估計(jì)的變化量。
通過(guò)使用估計(jì)的協(xié)方差值,可以得到等式R=E[yyT]。下面,通過(guò)對(duì)R執(zhí)行DCT,可以得到等式ψ=ARA*T。
下面將描述一種計(jì)算等式(7)中的 的方法。
在等式7中,可以通過(guò)使用噪聲測(cè)量器來(lái)獲取噪聲變化量σn2。假定噪聲和原始圖像象素是獨(dú)立的隨機(jī)變量,則可以使用下面的等式(10)計(jì)算出原始圖像的變化量σ2的估計(jì)值 在等式(10)中,σz2表示每一個(gè)宏塊(MB)的變化量。在用于編碼運(yùn)動(dòng)圖像的典型裝置中,以逐個(gè)宏塊的方式來(lái)計(jì)算σz2。在本實(shí)施例中,假定相同宏塊中的8×8的塊具有相同的變化量。從而,不需要進(jìn)行附加的計(jì)算以獲得每一個(gè)8×8塊的變化量。
圖6是根據(jù)本發(fā)明的實(shí)施例來(lái)編碼運(yùn)動(dòng)圖像的裝置的框圖,其考慮輸入圖像的特征而對(duì)該輸入圖像進(jìn)行編碼。
在本實(shí)施例中,在量化矩陣中適當(dāng)?shù)姆从沉税谳斎雸D像中的噪聲的級(jí)別。
下文中,將參考圖1到圖6詳細(xì)描述根據(jù)本發(fā)明優(yōu)選實(shí)施例的、用于編碼運(yùn)動(dòng)圖像的裝置的結(jié)構(gòu)和操作。
圖6所示的裝置包括分別對(duì)應(yīng)于圖1的編碼單元120中的DCT單元122、量化單元124、VLC單元134、逆量化單元126、逆DCT單元128、幀存儲(chǔ)器130以及運(yùn)動(dòng)估計(jì)和補(bǔ)償單元132的離散余弦變換單元610、量化單元(Q)620、可變長(zhǎng)度編碼單元(VLC)670、逆量化單元(IQ)630、逆DCT單元(IDCT)640、幀存儲(chǔ)器單元650以及運(yùn)動(dòng)估計(jì)和補(bǔ)償單元660。另外,該裝置進(jìn)一步包括噪聲估計(jì)單元680、量化加權(quán)矩陣確定單元692和量化加權(quán)矩陣存儲(chǔ)單元694。
因?yàn)镈CT單元610、逆DCT單元(IDCT)640、幀存儲(chǔ)器單元650以及運(yùn)動(dòng)估計(jì)和補(bǔ)償單元660提供和圖1中它們各自的對(duì)應(yīng)部分相同的功能,因此不再重復(fù)它們的描述。
量化加權(quán)矩陣確定單元692基于從噪聲估計(jì)單元680接收到的噪聲變化量σn2以及從運(yùn)動(dòng)估計(jì)和補(bǔ)償單元660接收到的預(yù)定的宏塊的變化量σz2,來(lái)確定相應(yīng)于預(yù)定的宏塊的量化加權(quán)矩陣。然后,量化加權(quán)矩陣確定單元692將相應(yīng)于確定的量化加權(quán)矩陣的索引信息發(fā)送到量化加權(quán)矩陣存儲(chǔ)單元694和VLC單元670。
下面,將對(duì)基于從噪聲估計(jì)單元680接收到的σn2以及從運(yùn)動(dòng)估計(jì)和補(bǔ)償單元660接收到的σz2來(lái)確定相應(yīng)于預(yù)定的宏塊的量化加權(quán)矩陣的方法進(jìn)行詳細(xì)的描述。
如上面參考等式(8)以及圖4和圖5所描述的,可以通過(guò)等式(7)來(lái)確定F(k,l)。一旦確定了F(k,l),則在量化過(guò)程中,用F(k,l)去乘8×8塊的DCT系數(shù)V(k,l),并用預(yù)定的量化加權(quán)矩陣去除所得的相乘結(jié)果 圖6所示的裝置將用DCT系數(shù)V(k,l)去乘F(k,l)的處理和用預(yù)定的量化加權(quán)矩陣去除 的處理合并為一個(gè)單一處理,并執(zhí)行這一處理。換句話說(shuō),如果用Q(k,l)來(lái)表示加權(quán)矩陣QT的(k,l)的位置分量,那么(k,l)的位置在新的量化加權(quán)矩陣QT’中為Q(k,l)/F(k,l)。
在本實(shí)施例中,通過(guò)將兩個(gè)分離的處理合并為一個(gè)單一的處理,預(yù)先計(jì)算出利用σn2和σz2獲得的多個(gè)F矩陣,然后利用所述多個(gè)F矩陣來(lái)計(jì)算新的量化加權(quán)矩陣QT’并隨后將其存儲(chǔ)在量化加權(quán)矩陣存儲(chǔ)單元694中。
另外,在本實(shí)施例中,利用σn2和σz2所獲得的五個(gè)新的量化加權(quán)矩陣被存儲(chǔ)在量化加權(quán)矩陣存儲(chǔ)單元694中。一旦σn2和σz2被確定,則可以使用等式(10)計(jì)算 的值。
如等式(7)所示,F(xiàn)(k,l)由S(k,l),ψ(k,l)和 來(lái)確定。使用等式(8)計(jì)算S(k,l),并取決于輸入圖像是內(nèi)部塊還是中間塊來(lái)變化地設(shè)定ψ(k,l)。因此,只剩一個(gè)變量來(lái)確定F(k,l),即 在本實(shí)施例中,提供了 的五個(gè)不同的估計(jì)值以及它們各自的量化加權(quán)矩陣QT’。所提供的量化加權(quán)矩陣QT’存儲(chǔ)在量化加權(quán)矩陣存儲(chǔ)單元694中。
量化加權(quán)矩陣確定單元692基于從噪聲估計(jì)單元680接收的σn2以及從運(yùn)動(dòng)估計(jì)和補(bǔ)償單元660接收的σz2來(lái)量化 將量化后的結(jié)果作為相應(yīng)于預(yù)定的宏塊的量化矩陣的索引信息發(fā)送到量化加權(quán)矩陣存儲(chǔ)單元692和VLC單元670。
舉例來(lái)說(shuō),如果存儲(chǔ)在量化加權(quán)矩陣存儲(chǔ)單元694中的量化加權(quán)矩陣根據(jù) 被分為五個(gè)不同的類型,則以五個(gè)級(jí)別來(lái)執(zhí)行 的量化,并且五個(gè)量化加權(quán)矩陣的每一個(gè)的索引信息被設(shè)置為0、1、2、3或4。
在一個(gè)存在有大量噪聲的圖像中,特別是對(duì)于具有很小的變化量的塊來(lái)說(shuō), 是非常大的。當(dāng) 非常大時(shí),F(xiàn)(k,l)接近0,導(dǎo)致嚴(yán)重的區(qū)塊現(xiàn)象(blockingphenomenon)。為了防止所述區(qū)塊現(xiàn)象,如下面的等式(11)所示使用了Tcutoff。
σn2σ2=min(Tcutoff,σn2σ2)...(11)]]>通常,Tcutoff具有介于1和2之間的數(shù)值。
量化加權(quán)矩陣存儲(chǔ)單元694將與從量化加權(quán)矩陣確定單元692接收到的索引信息相對(duì)應(yīng)的量化加權(quán)矩陣發(fā)送到量化單元620和逆量化單元630。
量化單元620使用從量化加權(quán)矩陣存儲(chǔ)單元694接收到的量化加權(quán)矩陣來(lái)量化預(yù)定的宏塊。
逆量化單元630使用接收到的量化加權(quán)值來(lái)逆量化預(yù)定的宏塊。
VLC單元670對(duì)由量化單元620量化后的輸入圖像數(shù)據(jù)執(zhí)行VLC,并將從量化加權(quán)矩陣確定單元692中接收到的量化加權(quán)矩陣的索引信息插入到宏塊的首部。
在本實(shí)施例中,將相應(yīng)的量化加權(quán)矩陣的索引信息插入到宏塊的首部并發(fā)送該宏塊的首部。如果在量化加權(quán)矩陣存儲(chǔ)單元694中存儲(chǔ)有十個(gè)量化加權(quán)矩陣,那么每一個(gè)宏塊需要4位數(shù)據(jù)。
假定相鄰的宏塊之間有相似的圖像特征并且按照推測(cè)在它們的索引值之間存在相關(guān)性。因此,可以將一個(gè)宏塊的索引值和相鄰宏塊的索引值之間的差異用作索引信息。在將單一的量化加權(quán)矩陣應(yīng)用至整個(gè)序列的情況下,將被傳送的索引信息的數(shù)量會(huì)大大的縮減。
在本實(shí)施例中,存儲(chǔ)在量化加權(quán)矩陣存儲(chǔ)單元694中的多個(gè)量化加權(quán)矩陣還應(yīng)當(dāng)被存儲(chǔ)在解碼單元中。也可以使用基于逐個(gè)圖像的方式利用圖像擴(kuò)展首部發(fā)送到解碼單元或者基于逐個(gè)序列的方式利用序列擴(kuò)展首部發(fā)送到解碼單元的多個(gè)量化加權(quán)矩陣。
如上所述,可以從輸入圖像中去除噪聲,并且根據(jù)包含在輸入圖像中的噪聲的級(jí)別通過(guò)適當(dāng)?shù)貙⒘炕仃噾?yīng)用到每一個(gè)宏塊來(lái)提高對(duì)輸入圖像進(jìn)行編碼的效率。
對(duì)于用戶來(lái)說(shuō),也可以任意地確定量化加權(quán)矩陣。在本實(shí)施例中,已經(jīng)將噪聲去除描述為是對(duì)DCT塊中的輸入圖像塊的Y分量進(jìn)行的。然而,噪聲去除也可以應(yīng)用到輸入圖像塊的U或V分量,在這種情況下,對(duì)于輸入圖像塊的U或V分量來(lái)說(shuō),還專門地需要附加的量化加權(quán)矩陣。
圖7是根據(jù)本發(fā)明的另外一個(gè)優(yōu)選實(shí)施例的、用于編碼運(yùn)動(dòng)圖像的裝置的方框圖,其考慮輸入圖像的特征而對(duì)輸入圖像進(jìn)行編碼。
更為特別的是,在輸入圖像的不同的特征中,本實(shí)施例中考慮了輸入圖像的每一個(gè)宏塊的邊緣特征。
參照?qǐng)D7,根據(jù)本發(fā)明的另一個(gè)實(shí)施例的、用于編碼運(yùn)動(dòng)圖像的裝置包括分別與圖1的編碼單元120中的DCT單元122、量化單元124、VLC單元134、逆量化單元126、逆DCT單元128、幀存儲(chǔ)器130以及運(yùn)動(dòng)估計(jì)和補(bǔ)償單元132相對(duì)應(yīng)的DCT單元710、量化單元720、VLC單元770、逆量化單元730、逆DCT單元740、幀存儲(chǔ)器單元750以及運(yùn)動(dòng)估計(jì)和補(bǔ)償單元760。另外,該裝置進(jìn)一步包括量化矩陣確定單元780和量化矩陣存儲(chǔ)單元790。因?yàn)镈CT單元710、逆DCT單元740、幀存儲(chǔ)器單元750、運(yùn)動(dòng)估計(jì)和補(bǔ)償單元760以及VLC單元770提供和圖1中他們各自的對(duì)應(yīng)部分相同的功能,因此不再重復(fù)它們的描述。
量化矩陣確定單元780考慮輸入圖像的特征為每一個(gè)宏塊選擇最佳量化矩陣,然后將所選擇的量化矩陣的索引信息發(fā)送到量化矩陣存儲(chǔ)單元790和VLC單元770。
量化矩陣確定單元780考慮每一個(gè)宏塊的邊緣特征,將其作為從預(yù)定數(shù)量的量化矩陣中選擇一個(gè)的基準(zhǔn)。
下面將詳細(xì)描述考慮宏塊的邊緣特征來(lái)選擇一個(gè)量化矩陣的方法。
當(dāng)輸入圖像的預(yù)定的宏塊是內(nèi)部塊時(shí),將邊緣檢測(cè)器用作蘇貝爾(sobel)算子來(lái)計(jì)算預(yù)定的宏塊的每一個(gè)象素中的邊緣的大小和方向。等式(12)可以表示所述sobel運(yùn)算。
H1=-101-202-101,H2=-1-2-1002121...(12)]]>量化矩陣確定單元780使用等式(12)來(lái)計(jì)算垂直邊的長(zhǎng)度和水平邊的長(zhǎng)度,并且使用水平邊和垂直邊的長(zhǎng)度來(lái)計(jì)算預(yù)定的宏塊的邊緣的強(qiáng)度和方向。之后,量化矩陣確定單元780考慮預(yù)定宏塊的邊緣的強(qiáng)度和方向以及編碼效率,從預(yù)定數(shù)量的量化矩陣中選擇一個(gè)。換句話說(shuō),在預(yù)定的宏塊包含水平或者垂直邊的情況下,量化矩陣確定單元780全面考慮預(yù)定宏塊的水平或者垂直邊來(lái)選擇一個(gè)能夠使能量化的量化矩陣。
在預(yù)定的宏塊為中間塊的情形下,將這樣的邊緣檢測(cè)器用作sobel算子也可以獲得預(yù)定的宏塊中包含的一個(gè)邊的強(qiáng)度和方向。
在本實(shí)施例中,將sobel檢測(cè)器用來(lái)計(jì)算在預(yù)定宏塊中包含的一個(gè)邊的強(qiáng)度和方向。然而,也可以使用例如差分濾波器或羅波特濾波器的空間濾波器來(lái)計(jì)算在預(yù)定宏塊中包含的邊的強(qiáng)度和方向。
另外,在本實(shí)施例中,考慮預(yù)定的宏塊的邊緣特征來(lái)選擇量化矩陣。然而,在為預(yù)定宏塊適當(dāng)?shù)剡x擇最優(yōu)的量化矩陣時(shí),可以考慮會(huì)影響編碼效率或輸出圖像質(zhì)量的預(yù)定宏塊的其它特征。
量化矩陣存儲(chǔ)單元790基于從量化矩陣確定單元780接收到的索引信息來(lái)選擇量化矩陣,并將所選擇的量化矩陣傳送到量化單元720和逆量化單元730。
量化單元720使用從量化矩陣存儲(chǔ)單元790接收到的量化矩陣來(lái)進(jìn)行量化。
逆量化單元730使用從量化矩陣存儲(chǔ)單元790接收到的量化矩陣來(lái)進(jìn)行逆量化。
VLC單元770對(duì)從量化單元720接收到的量化后的輸入數(shù)據(jù)以及從量化加權(quán)矩陣確定單元780接收到的對(duì)應(yīng)于預(yù)定宏塊的量化矩陣的索引信息進(jìn)行VLC。所述索引信息被插入到宏塊的首部。
在本實(shí)施例中,將對(duì)應(yīng)于預(yù)定宏塊的量化加權(quán)矩陣的索引信息插入到預(yù)定的宏塊的首部,并隨后進(jìn)行發(fā)送??梢詫⒁粋€(gè)宏塊的索引值和相鄰的宏塊的索引值之間的差異用作索引信息。
在本實(shí)施例中,存儲(chǔ)在量化矩陣存儲(chǔ)單元790中的多個(gè)量化加權(quán)矩陣也存儲(chǔ)在解碼單元中。但是,也可以使用以逐圖像的方式使用圖像擴(kuò)展首部發(fā)送到解碼單元或者以逐序列的方式使用序列擴(kuò)展首部發(fā)送到解碼單元的多個(gè)量化加權(quán)矩陣。
圖8是根據(jù)本發(fā)明一個(gè)實(shí)施例的用于解碼運(yùn)動(dòng)圖像的裝置的框圖。參照?qǐng)D8,該裝置包括分別與圖1的解碼單元140中的可變長(zhǎng)度解碼單元142、逆量化單元144、逆DCT單元146、幀存儲(chǔ)器單元148和運(yùn)動(dòng)補(bǔ)償單元150相對(duì)應(yīng)的可變長(zhǎng)度解碼單元810、逆量化單元820、逆DCT單元830、幀存儲(chǔ)單元840和運(yùn)動(dòng)補(bǔ)償單元850。另外,該裝置進(jìn)一步包括量化加權(quán)矩陣確定單元860。逆DCT單元830、幀存儲(chǔ)器單元840和運(yùn)動(dòng)補(bǔ)償單元850提供和圖1中他們各自的對(duì)應(yīng)部分相同的功能,因此不再重復(fù)他們的描述。
可變長(zhǎng)度解碼單元810對(duì)輸入流進(jìn)行可變長(zhǎng)度解碼、從預(yù)定的宏塊的首部提取與該輸入流相對(duì)應(yīng)的預(yù)定宏塊的量化加權(quán)矩陣的索引信息,并且輸出該提取的索引信息至量化加權(quán)矩陣存儲(chǔ)單元860。
量化加權(quán)矩陣存儲(chǔ)單元860將與從可變長(zhǎng)度解碼單元810接收的索引信息相對(duì)應(yīng)的量化加權(quán)矩陣輸出到逆量化單元820。量化加權(quán)矩陣存儲(chǔ)單元860存儲(chǔ)根據(jù)由編碼單元處理的輸入圖像的特征來(lái)分類的多個(gè)量化加權(quán)矩陣,所述由編碼單元處理的輸入圖像的特征例如作為輸入圖像變化量和該輸入圖像的邊緣特征之間的比值的噪聲變化量。
可以以逐圖像的方式使用圖像擴(kuò)展首部來(lái)發(fā)送在量化加權(quán)矩陣存儲(chǔ)單元860中存儲(chǔ)的多個(gè)量化加權(quán)矩陣,或以逐序列的方式使用序列擴(kuò)展首部將所述量化加權(quán)矩陣發(fā)送到解碼單元。如由圖8中的虛線所標(biāo)記的,將多個(gè)量化加權(quán)矩陣從可變長(zhǎng)度解碼單元810發(fā)送到量化加權(quán)矩陣存儲(chǔ)單元860。
本發(fā)明能夠應(yīng)用到不同類型的用于編碼和/或解碼運(yùn)動(dòng)圖像的方法和裝置中,例如MPEG-1,MPEG-2或MPEG-4。另外,本發(fā)明可以實(shí)現(xiàn)為寫入在計(jì)算機(jī)可讀的記錄介質(zhì)上的計(jì)算機(jī)可讀代碼。所述計(jì)算機(jī)可讀記錄介質(zhì)包括任何類型的、可以以計(jì)算機(jī)可讀方式在其上寫入數(shù)據(jù)的記錄設(shè)備。舉例來(lái)說(shuō),計(jì)算機(jī)可讀記錄介質(zhì)包括ROM、RAM、CD-ROM、磁帶、硬盤、軟盤、閃存、光數(shù)據(jù)存儲(chǔ)器和載波(例如通過(guò)因特網(wǎng)進(jìn)行的數(shù)據(jù)傳輸)。另外,計(jì)算機(jī)可讀的記錄介質(zhì)可以經(jīng)由相互通過(guò)網(wǎng)絡(luò)方式連接的多個(gè)計(jì)算機(jī)系統(tǒng)來(lái)分發(fā),以便以分散的方式將計(jì)算機(jī)可讀代碼存儲(chǔ)在計(jì)算機(jī)可讀記錄介質(zhì)上。
如上所述,在根據(jù)本發(fā)明實(shí)施例的編碼和/或解碼運(yùn)動(dòng)圖像的方法中,考慮輸入圖像的特征將量化矩陣適當(dāng)?shù)貞?yīng)用到該輸入圖像的每一個(gè)宏塊中。因此,可能提高編碼輸入圖像的效率和性能。
雖然已經(jīng)示出和描述了本發(fā)明的一些實(shí)施例,但本領(lǐng)域的技術(shù)人員應(yīng)當(dāng)明白,可以在不背離本發(fā)明的原理和精神的前提下對(duì)這些實(shí)施例作出改變,其中本發(fā)明的范圍由隨后的權(quán)利要求及其等價(jià)物所限定。
權(quán)利要求
1.一種利用多個(gè)量化矩陣來(lái)編碼運(yùn)動(dòng)圖像的方法,該方法包括考慮輸入圖像的至少一個(gè)特征來(lái)選擇多個(gè)量化矩陣中的一個(gè);變換所述輸入圖像;利用所選擇的量化矩陣來(lái)量化變換后的輸入圖像。
2.如權(quán)利要求1所述的方法,其中所述考慮的輸入圖像的至少一個(gè)特征是噪聲信息或者是該輸入圖像的空間特征。
3.如權(quán)利要求2所述的方法,其中所述噪聲信息是噪聲變化量和輸入圖像的變化量之間的比值。
4.如權(quán)利要求2所述的方法,其中所述空間特征是在輸入圖像中包含的邊的長(zhǎng)度。
5.如權(quán)利要求1所述的方法,其中所述變換包括從離散傅立葉變換方法、離散余弦變換方法和哈得曼方法中選擇和使用。
6.如權(quán)利要求1所述的方法,其中根據(jù)輸入圖像的至少一個(gè)特征來(lái)對(duì)多個(gè)量化矩陣進(jìn)行分類。
7.如權(quán)利要求1所述的方法,其中選擇過(guò)程包括考慮所述輸入圖像的至少一個(gè)特征來(lái)為該輸入圖像的每一個(gè)宏塊選擇多個(gè)量化矩陣中的一個(gè),并關(guān)于每一個(gè)宏塊產(chǎn)生所選擇的量化矩陣的索引信息;以及根據(jù)所產(chǎn)生的索引信息為每一個(gè)宏塊輸出所選擇的量化矩陣。
8.如權(quán)利要求7所述的方法,進(jìn)一步包括通過(guò)將所選擇的量化矩陣的索引信息插入到宏塊的首部來(lái)對(duì)量化的輸入圖像進(jìn)行可變長(zhǎng)度的解碼。
9.如權(quán)利要求8所述的方法,其中所述進(jìn)行可變長(zhǎng)度的解碼包括將多個(gè)量化矩陣的每一個(gè)的索引信息插入到序列擴(kuò)展首部或者圖像擴(kuò)展首部。
10.如權(quán)利要求7所述的方法,其中所述索引信息是對(duì)應(yīng)于一個(gè)宏塊的量化矩陣的索引值和對(duì)應(yīng)于相鄰宏塊的量化矩陣的索引值之間的差異。
11.一種利用多個(gè)量化矩陣來(lái)解碼運(yùn)動(dòng)圖像的方法,該方法包括對(duì)編碼的圖像數(shù)據(jù)進(jìn)行可變長(zhǎng)度解碼;從可變長(zhǎng)度解碼后的圖像數(shù)據(jù)中提取指定根據(jù)輸入圖像的至少一個(gè)特征進(jìn)行分類的多個(gè)量化矩陣中的一個(gè)的索引信息;基于所提取的索引信息選擇多個(gè)量化矩陣中的一個(gè);以及使用所選擇的量化矩陣對(duì)可變長(zhǎng)度解碼后的圖像數(shù)據(jù)的每一個(gè)宏塊進(jìn)行逆量化。
12.如權(quán)利要求11所述的方法,其中所述考慮的輸入圖像的至少一個(gè)特征是噪聲信息或者是該輸入圖像的空間特征。
13.如權(quán)利要求12所述的方法,其中所述噪聲信息是噪聲變化量和輸入圖像的變化量之間的比值。
14.如權(quán)利要求12所述的方法,其中所述空間特征是在所述輸入圖像中包含的邊的長(zhǎng)度。
15.如權(quán)利要求11所述的方法,其中從宏塊的首部提取所述索引信息。
16.一種利用多個(gè)量化矩陣來(lái)編碼運(yùn)動(dòng)圖像的裝置,該裝置包括量化矩陣確定單元,考慮輸入圖像的至少一個(gè)特征來(lái)為每一個(gè)宏塊選擇多個(gè)量化矩陣中的一個(gè),并關(guān)于每一個(gè)宏塊產(chǎn)生指示所選擇的量化矩陣的索引信息;量化矩陣存儲(chǔ)單元,存儲(chǔ)根據(jù)輸入圖像的特征分類的多個(gè)量化矩陣,并且根據(jù)由所述量化矩陣確定單元產(chǎn)生的索引信息來(lái)為每一個(gè)宏塊輸出一個(gè)量化矩陣;圖像變換單元,用于變換所述輸入圖像;以及量化單元,利用所選擇的量化矩陣來(lái)量化變換后的輸入圖像。
17.如權(quán)利要求16所述的裝置,其中所述考慮的輸入圖像的至少一個(gè)特征是噪聲信息或者是該輸入圖像的空間特征。
18.如權(quán)利要求17所述的裝置,其中所述噪聲信息是噪聲變化量和輸入圖像的變化量之間的比值。
19.如權(quán)利要求17所述的裝置,其中所述空間特征是在所述輸入圖像中包含的邊的長(zhǎng)度。
20.如權(quán)利要求16所述的裝置,進(jìn)一步包括一個(gè)可變長(zhǎng)度編碼單元,用于對(duì)由量化單元量化的輸入圖像進(jìn)行可變長(zhǎng)度編碼,并且將由量化矩陣確定單元產(chǎn)生的索引信息插入到一個(gè)宏塊的首部。
21.如權(quán)利要求20所述的裝置,其中所述可變長(zhǎng)度編碼單元將每一個(gè)量化矩陣的索引信息插入到序列擴(kuò)展首部或者圖像擴(kuò)展首部。
22.如權(quán)利要求16所述的方法,其中所述索引信息是對(duì)應(yīng)于一個(gè)宏塊的量化矩陣的索引值和對(duì)應(yīng)于相鄰宏塊的量化矩陣的索引值之間的差異。
23.一種利用多個(gè)量化矩陣來(lái)解碼運(yùn)動(dòng)圖像的裝置,該裝置包括可變長(zhǎng)度解碼單元,用于接收編碼的圖像流、對(duì)輸入圖像流進(jìn)行可變長(zhǎng)度解碼、從可變長(zhǎng)度解碼后的圖像流的每一個(gè)宏塊中提取指示根據(jù)輸入圖像的至少一個(gè)特征分類的多個(gè)的量化矩陣中的一個(gè)的索引信息;量化矩陣存儲(chǔ)單元,用于存儲(chǔ)多個(gè)量化矩陣、基于所提取的索引信息選擇多個(gè)量化矩陣中的一個(gè)、輸出所選擇的量化矩陣;以及逆量化單元,用于利用從所述量化矩陣存儲(chǔ)單元輸出的量化單元來(lái)逆量化可變長(zhǎng)度解碼的圖像流的每一個(gè)宏塊。
24.如權(quán)利要求23所述的裝置,其中所述考慮的輸入圖像的至少一個(gè)特征是噪聲信息或者是該輸入圖像的空間特征。
25.如權(quán)利要求24所述的裝置,其中所述噪聲信息是噪聲變化量和輸入圖像的變化量之間的比值。
26.如權(quán)利要求24所述的裝置,其中所述空間特征是在所述輸入圖像中包含的邊的長(zhǎng)度。
27.如權(quán)利要求24所述的裝置,其中所述索引信息包含在輸入圖像流的宏塊的首部。
全文摘要
一種利用多個(gè)量化矩陣來(lái)編碼運(yùn)動(dòng)圖像的方法。該方法包括考慮輸入圖像的至少一個(gè)特征來(lái)選擇多個(gè)量化矩陣中的一個(gè)、變換該輸入圖像、利用所選擇的量化矩陣來(lái)量化變換后的輸入圖像。
文檔編號(hào)H04N7/24GK1527607SQ20041003303
公開日2004年9月8日 申請(qǐng)日期2004年1月14日 優(yōu)先權(quán)日2003年1月14日
發(fā)明者宋秉哲, 千畺旭 申請(qǐng)人:三星電子株式會(huì)社