專利名稱:一種圖像及數(shù)字視頻編碼及解碼方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種圖像及數(shù)字視頻編碼及解碼方法,屬于數(shù)字圖像處理技術(shù)領(lǐng)域。
技術(shù)背景
由于圖像數(shù)據(jù)在空間域上具有較強(qiáng)的相關(guān)性,而二維離散正交變換則是去除圖像 殘差塊空間域冗余度的有效方法,因此被廣泛應(yīng)用于傳統(tǒng)的圖像編碼標(biāo)準(zhǔn)(如JPEG等) 和傳統(tǒng)的視頻編碼標(biāo)準(zhǔn)(如H. ^4,AVS等)。圖像或視頻編解碼的過程通常包括以下幾個(gè) 步驟
編碼過程
1、輸入圖像或視頻數(shù)據(jù);
2、將輸入的圖像或視頻數(shù)據(jù)分成互不重疊的小數(shù)據(jù)塊并分別對(duì)小數(shù)據(jù)塊進(jìn)行二 維正向離散正交變換,得到變換域系數(shù);
3、對(duì)得到的變換域系數(shù)矩陣進(jìn)行量化處理;
4、對(duì)經(jīng)過量化后的系數(shù)進(jìn)行熵編碼,即利用哈夫曼編碼,游程編碼,算術(shù)編碼等編 碼方法進(jìn)行壓縮編碼,得到編碼后的數(shù)據(jù);此時(shí)即可將編碼后的數(shù)據(jù)存儲(chǔ)在存儲(chǔ)介質(zhì)中或 進(jìn)行傳輸。
解碼過程
1、對(duì)編碼后的數(shù)據(jù)進(jìn)行反熵編碼,即利用反哈夫曼編碼,反游程編碼,反算術(shù)編碼 等方式進(jìn)行解碼;
2、對(duì)反熵編碼后的數(shù)據(jù)進(jìn)行反量化處理;
3、對(duì)經(jīng)過反量化處理的數(shù)據(jù)進(jìn)行二維反向離散正交變換,從而得到原來的圖像或 視頻數(shù)據(jù);
4、將經(jīng)過二維反向離散正交變換得到的圖像或視頻數(shù)據(jù)進(jìn)行輸出或者顯示。
目前最常用的二維離散正交變換是離散余弦變換(DCT),它來源于連續(xù) Tchebichef多項(xiàng)式,因?yàn)槠淠芰考行阅芊浅=咏y(tǒng)計(jì)最佳的K-L變換,因此常被用于圖 像數(shù)據(jù)和視頻數(shù)據(jù)的塊變換編碼。但是DCT有一個(gè)缺點(diǎn)就是矩陣中的部分系數(shù)是無理數(shù)。 在計(jì)算機(jī)上用迭代的方法進(jìn)行浮點(diǎn)正變換和反變換后,不能得到一模一樣的初始值。
為了解決這個(gè)問題,人們提出了基于DCT的整數(shù)變換。利用正交性和歸一化等一 系列原則,在DCT理論矩陣的基本框架下,構(gòu)造一個(gè)整數(shù)矩陣與縮放矩陣的“點(diǎn)積”得到的 矩陣來近似原來的浮點(diǎn)DCT矩陣。但是這種技術(shù)有兩個(gè)缺點(diǎn)第一,構(gòu)造出來的縮放矩陣與 整數(shù)矩陣的“點(diǎn)積”(即矩陣間對(duì)應(yīng)元素相乘)得到的矩陣僅僅是原來理論浮點(diǎn)DCT矩陣的 近似,壓縮性能可能有差別;第二,可擴(kuò)展性不強(qiáng),對(duì)于每一個(gè)變換長度沒有一個(gè)統(tǒng)一的矩 陣生成方式,比如4X4,8X8,16X16等都需要單獨(dú)構(gòu)造矩陣。變換長度越長,可選的整數(shù) 矩陣越多,矩陣構(gòu)造也越難。表1給出了一些常見的圖像編碼標(biāo)準(zhǔn)及其采用的二維正交變 換方法。
權(quán)利要求
1.一種圖像及數(shù)字視頻編碼方法,包括對(duì)輸入數(shù)據(jù)進(jìn)行二維正向離散正交變換的步 驟,其特征在于,所述二維正向正交變換采用二維整數(shù)正向離散iTchebichef變換。
2.如權(quán)利要求1所述圖像及數(shù)字視頻編碼方法,其特征在于,所述二維整數(shù)正向離散 Tchebichef變換采用“行列算法”實(shí)現(xiàn),具體包括以下步驟步驟A、將輸入的圖像或視頻數(shù)據(jù)分為互不重疊的大小為 FxiV的數(shù)據(jù)塊,F(xiàn)表示數(shù)據(jù)塊長或?qū)挿较蛏舷袼攸c(diǎn)的個(gè)數(shù),其取值為大于等于2的偶數(shù); 步驟B、將FxiV的數(shù)據(jù)塊的每一列分別作為輸入向量進(jìn)行一維整數(shù)正向離散 Tchebichef變換,并將得到的F列結(jié)果組合,得到二維整數(shù)正向離散Tchebichef變換域的 中間矩陣;一維整數(shù)正向離散Tchebichef變換具體按照以下公式,
3.如權(quán)利要求2所述圖像及數(shù)字視頻編碼方法,其特征在于,N的取值為8。
4.如權(quán)利要求3所述圖像及數(shù)字視頻編碼方法,其特征在于,所述一維整數(shù)正向離散 Tchebichef變換ζ = | ^采用快速算法實(shí)現(xiàn),該快速算法將九中的元素表示成2的整數(shù)次 冪的數(shù)之間的加減法的形式,然后進(jìn)行項(xiàng)的拆分或合并,具體過程如下將一維整數(shù)正向離散Tchebichef變換矩陣知中的元素表示成2的整數(shù)次冪的數(shù)之間 的加減法的形式
5.一種圖像及數(shù)字視頻解碼方法,包括對(duì)反量化后的變換域系數(shù)進(jìn)行二維反向離散正 交變換的步驟,其特征在于,所述二維反向正交變換采用二維整數(shù)反向離散Tchebichef變 換。
6.如權(quán)利要求5所述圖像及數(shù)字視頻解碼方法,其特征在于,所述二維整數(shù)反向離散 Tchebichef變換采用“行列算法”實(shí)現(xiàn),具體包括以下步驟步驟E、將反量化后的Tchebichef變換域系數(shù)分為互不重疊的大小為i/xiM"的數(shù)據(jù) 塊〗表示數(shù)據(jù)塊長或?qū)挿较蛏舷袼攸c(diǎn)的個(gè)數(shù),其取值為大于等于2的偶數(shù);步驟F、將IxM的數(shù)據(jù)塊的每一列分別作為輸入向量進(jìn)行一維整數(shù)反向離散 Tchebichef變換,并將得到的Af列結(jié)果組合,得到二維空間域圖像或視頻數(shù)據(jù)的中間矩 陣;一維整數(shù)反向離散Tchebichef變換具體按照以下公式,式中
7.如權(quán)利要求6所述圖像及數(shù)字視頻解碼方法,其特征在于〗'的取值為8。
8.如權(quán)利要求7所述圖像及數(shù)字視頻解碼方法,其特征在于,所述一維整數(shù)反向離散
全文摘要
本發(fā)明公開了一種圖像及數(shù)字視頻編碼及解碼方法,屬于數(shù)字圖像處理技術(shù)領(lǐng)域。本發(fā)明的編碼及解碼方法在進(jìn)行二維正向/反向離散正交變換時(shí),采用二維整數(shù)正向/反向離散Tchebichef變換。本發(fā)明利用二維整數(shù)離散Tchebichef變換來替代現(xiàn)有技術(shù)所使用的其它整數(shù)變換方法,可以有效解決解碼器失配問題,實(shí)現(xiàn)無損編碼,而且具有較高的壓縮性能以及更好的可擴(kuò)展性。本發(fā)明還進(jìn)一步提出了一種8×8整數(shù)離散Tchebichef變換矩陣的快速算法,該算法只需要進(jìn)行移位和加法操作,降低了硬件資源消耗,有利于硬件實(shí)現(xiàn)。
文檔編號(hào)H04N7/26GK102036075SQ201010611318
公開日2011年4月27日 申請(qǐng)日期2010年12月29日 優(yōu)先權(quán)日2010年12月29日
發(fā)明者伍家松, 李松毅, 王膂, 羅立民, 舒華忠 申請(qǐng)人:東南大學(xué)