一種基于視頻編碼模式的方向變換方法與流程

文檔序號(hào)：12498304閱讀：365來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專(zhuān)利>電子通信裝置的制造及其應(yīng)用技術(shù)

本發(fā)明屬于視頻壓縮編碼的技術(shù)領(lǐng)域，具體地涉及一種與視頻相關(guān)的基于預(yù)測(cè)模式的方向變換的幀內(nèi)編解碼方法。

背景技術(shù)：

從MPEG-2,H.263,MPEG-4到H.264/AVC,編碼效率更高的技術(shù)一直是人們追求的更高目標(biāo)。近些年來(lái)，隨著大量的高清視頻與日劇增，一種更高效率的編碼框架--HEVC應(yīng)運(yùn)而生。

HEVC采用了許多新的技術(shù)，其中重要的一項(xiàng)技術(shù)為基于編碼單元的自適應(yīng)四叉樹(shù)分割，最大的編碼單元為64×64，其作為樹(shù)根分割為4個(gè)32×32的編碼單元，而且每一個(gè)32×32的編碼單元可以繼續(xù)分割，直至4×4的編碼單元。對(duì)每一個(gè)編碼單元，對(duì)其進(jìn)行不同的預(yù)測(cè)得到不同的殘差單元(變換單元)。每一個(gè)殘差單元(變換單元)需要進(jìn)行變換以及量化操作，根據(jù)RDO從這些不同的預(yù)測(cè)模式選取最優(yōu)的預(yù)測(cè)模式以及分割模式。

盡管HEVC比H.264/AVC得到50％以上的增益，然而，由于預(yù)測(cè)時(shí)使用此編碼單元周?chē)南袼刂祵?duì)當(dāng)前預(yù)測(cè)單元進(jìn)行預(yù)測(cè)，僅僅利用到像素之間的局部相關(guān)性，并沒(méi)有利用到像素之間的非局部信息，所以利用序列間的非局部信息提高壓縮效率成為近些年研究的一個(gè)熱點(diǎn)。

研究人員利用外部圖像的相關(guān)性對(duì)圖像壓縮進(jìn)行了一次探索性的嘗試。對(duì)一副高分辨的圖像I進(jìn)行下采樣之后得到低分辨率圖像D，對(duì)D進(jìn)行壓縮，同時(shí)在解碼端將壓縮過(guò)的低分辨率圖像D進(jìn)行上采樣，得到高分辨率圖像然而由于壓縮之前對(duì)原始圖像進(jìn)行的下采樣操作造成了信息的損失，通過(guò)簡(jiǎn)單的三次線性差值很難得到高質(zhì)量的高分辨率圖像，那么利用與外部的圖像數(shù)據(jù)庫(kù)進(jìn)行匹配，對(duì)其增強(qiáng)重構(gòu)得到了高質(zhì)量的高分辨率圖像匹配時(shí)利用了與外部的圖像數(shù)據(jù)庫(kù)的SIFT特征的相關(guān)性。但此種方法對(duì)大量數(shù)據(jù)庫(kù)的需求成為了弊端，一旦數(shù)據(jù)庫(kù)與所壓縮的圖像相關(guān)性不強(qiáng)，那么并不能對(duì)一些圖像的細(xì)節(jié)信息進(jìn)行很好的恢復(fù)。

眾所周知，KLT能夠最大化使信號(hào)能量集中，而DCT在信號(hào)滿(mǎn)足一階馬爾科夫模型能夠很好的逼近KLT。但是DCT是固定的變換，而且并非所有信號(hào)均滿(mǎn)足一階馬爾科夫模型，所以近些年來(lái)，KLT對(duì)于一類(lèi)數(shù)據(jù)的表達(dá)能力再次被人們得到重視，所以如何設(shè)計(jì)滿(mǎn)足一類(lèi)數(shù)據(jù)的KLT便成為研究的課題之一。而基于編碼模式的方向變換(MDDT)便是根據(jù)預(yù)測(cè)方向?qū)⑾嚓P(guān)性較強(qiáng)的一類(lèi)數(shù)據(jù)共同使用一個(gè)KLT，從而得到更優(yōu)的壓縮效率。MDDT最早在H.264/AVC上提出，其方法觀察到使用同一個(gè)預(yù)測(cè)模式的殘差數(shù)據(jù)有相似的方向性，如圖1，這種具有相似方向性的數(shù)據(jù)可以用來(lái)生成一組分離的KLT，在編碼端，通過(guò)對(duì)傳統(tǒng)DCT進(jìn)行RDO選取更好的變換。

MDDT提供了一種理念，其以后的離線變換的一些研究中對(duì)其進(jìn)行了改進(jìn)?；诰幋a模式的稀疏變換(MDST)產(chǎn)生了更加魯棒的行和列變換，解決了當(dāng)外點(diǎn)存在于訓(xùn)練數(shù)據(jù)集中時(shí)MDDT不夠高效的問(wèn)題。另外，一些研究人員觀察到即使使用同一個(gè)預(yù)測(cè)模式的殘差數(shù)據(jù)仍舊有很多殘差之間并不存在很強(qiáng)的相關(guān)性，如圖2所示，對(duì)于均為垂直預(yù)測(cè)模式下的殘差塊，其方向性仍舊區(qū)分很大。RDOT通過(guò)對(duì)同一個(gè)模式的殘差數(shù)據(jù)更好的分類(lèi)，對(duì)同一個(gè)預(yù)測(cè)模式的殘差使用更多的變換，從而提高了編碼效率。同時(shí)，將MDDT中的分離KLT變?yōu)榉欠蛛xKLT也成為了改進(jìn)MDDT的途徑之一。

盡管基于MDDT的改進(jìn)方法都取得了一定的增益，但是，MDDT，MDST，RDOT均為離線訓(xùn)練，其預(yù)定義的變換并不能適應(yīng)于越來(lái)越多的不同分辨率下以及各種各樣的視頻序列。而且，不同的視頻序列殘差塊像素之間的相關(guān)性也不盡相同，這造成了預(yù)定義的變換訓(xùn)練時(shí)需要的數(shù)據(jù)集的包容性變得至關(guān)重要。然而對(duì)于KLT變換，其訓(xùn)練集自身內(nèi)部的差異性越大，得到的KLT變換越接近于DCT變換。那么，如何使訓(xùn)練集滿(mǎn)足同一類(lèi)特性同時(shí)生成與其相關(guān)的變換變得至關(guān)重要。

基于信號(hào)的自適應(yīng)變換(SDT)采用在線訓(xùn)練的方法。對(duì)于每一個(gè)編碼單元，SDT通過(guò)模版匹配(TM)在已重構(gòu)的序列中找出與當(dāng)前殘差塊有高度相關(guān)性的數(shù)據(jù)集，得到基于此編碼單元的自適應(yīng)KLT，從而改進(jìn)編碼效率。此種方法避免了訓(xùn)練集的預(yù)選取造成的當(dāng)訓(xùn)練集與當(dāng)前編碼單元相關(guān)性較弱的問(wèn)題。盡管如此，在編碼時(shí)，由于對(duì)每一塊編碼單元均使用TM進(jìn)行逐像素搜索，其編碼復(fù)雜度較高。

技術(shù)實(shí)現(xiàn)要素：

本發(fā)明的技術(shù)解決問(wèn)題是：克服現(xiàn)有技術(shù)的不足，提供一種基于視頻編碼模式的方向變換方法，其能夠根據(jù)當(dāng)前序列不同模式的殘差的統(tǒng)計(jì)特性，使得殘差數(shù)據(jù)在變換之后能量更加集中，從而得到更小的碼流，提升編碼效率。

本發(fā)明的技術(shù)解決方案是：這種基于視頻編碼模式的方向變換方法，該方法包括編碼和解碼，在編碼端，首先對(duì)其進(jìn)行數(shù)據(jù)的收集，對(duì)其進(jìn)行訓(xùn)練，得到KLT集合；在編碼時(shí)，通過(guò)RDO在KLT和DCT中選取對(duì)于當(dāng)前編碼單元更好的變換方法；在解碼端，首先對(duì)傳輸?shù)浇獯a端的字典進(jìn)行解碼，再進(jìn)行整個(gè)視頻的解碼。

本發(fā)明充分地利用了同一個(gè)視頻序列中非局部信息之間的相關(guān)性，從而得到性能更好的KLT集合，同時(shí)避免了過(guò)高的計(jì)算復(fù)雜度。本發(fā)明中，對(duì)于同一模式下，不同塊大小的殘差塊進(jìn)行訓(xùn)練得到非分離或分離的KLT集合，此KLT集合能夠使其對(duì)于當(dāng)前序列的殘差塊能量更加集中，在量化之后得到更小的碼流，從而提升了編碼效率。

附圖說(shuō)明

圖1示出了殘差絕對(duì)值量級(jí)標(biāo)準(zhǔn)化分布。

圖2示出了使用垂直預(yù)測(cè)模式下的殘差塊。

圖3是根據(jù)本發(fā)明的基于視頻編碼模式的方向變換方法的流程圖。

圖4是根據(jù)本發(fā)明的編碼的一個(gè)優(yōu)選實(shí)施例的流程圖。

圖5是根據(jù)本發(fā)明的解碼的一個(gè)優(yōu)選實(shí)施例的流程圖。

圖6示出了相同序列以及不同序列之間殘差的像素間的相關(guān)性。

具體實(shí)施方式

如圖3所示，這種基于視頻編碼模式的方向變換方法，該方法包括編碼和解碼，在編碼端，首先對(duì)其進(jìn)行數(shù)據(jù)的收集，對(duì)其進(jìn)行訓(xùn)練，得到KLT集合；在編碼時(shí)，通過(guò)RDO在KLT和DCT中選取對(duì)于當(dāng)前編碼單元更好的變換方法；在解碼端，首先對(duì)傳輸?shù)浇獯a端的字典進(jìn)行解碼，再進(jìn)行整個(gè)視頻的解碼。

優(yōu)選地，所述編碼包括以下步驟：

(1)數(shù)據(jù)的收集：通過(guò)HEVC壓縮得到需要訓(xùn)練的殘差集，其根據(jù)QP、塊大小、模式進(jìn)行分類(lèi)，得到每一類(lèi)的殘差數(shù)據(jù)集；

(2)變換的生成：在全I(xiàn)幀編碼時(shí)，對(duì)QP數(shù)據(jù)集進(jìn)行訓(xùn)練，分別得到每一種塊大小的每一種模式的KLT,從而形成KLT集合；形成的分?jǐn)?shù)非分離KLT將其使用尺度為2¹⁰進(jìn)行放大變?yōu)檎蚄LT，而分離KLT使用尺度為2⁵進(jìn)行放大變?yōu)檎蚄LT,作為需要傳輸?shù)淖儞Q；

(3)變換的使用：在RDO對(duì)KLT集和DCT進(jìn)行比較時(shí)，在使用量化前，根據(jù)當(dāng)前模式選取的掃描方法對(duì)其進(jìn)行排序，使掃描時(shí)先掃到統(tǒng)計(jì)意義上能量更加集中的系數(shù)；對(duì)其量化，得到需要傳輸?shù)拇a流；對(duì)其量化過(guò)的碼流進(jìn)行反量化，反量化之后的數(shù)據(jù)，根據(jù)排序方法，使其符合掃描的順序，進(jìn)而反變換，得到重建的圖像；

(4)變換的傳輸：傳輸KLT時(shí)，將KLT寫(xiě)入到二進(jìn)制碼流，從而對(duì)此二進(jìn)制碼流使用行程編碼進(jìn)行壓縮。

優(yōu)選地，所述解碼包括以下步驟：

(5)解碼得到整型KLT集合，讀取二進(jìn)制碼流，將其轉(zhuǎn)化為整型KLT集合；

(6)根據(jù)解碼出來(lái)的標(biāo)識(shí)位，來(lái)選取DCT或者KLT集合中的對(duì)應(yīng)此塊大小以及模式的KLT，對(duì)于選取KLT的已反量化的殘差的系數(shù)，根據(jù)掃描方式對(duì)其進(jìn)行排序，從而對(duì)此得到的量化之后的殘差塊進(jìn)行反變換重構(gòu)。

優(yōu)選地，所述步驟(2)中，對(duì)大小為32×32的殘差塊采用分離KLT的同時(shí)對(duì)其他大小的殘差塊采用非分離KLT，并對(duì)大小為16×16的殘差塊所對(duì)應(yīng)的256×256的變換采用了降維技術(shù)，從而在KLT集合傳輸中使用的碼流更小。

優(yōu)選地，所述步驟(3)中，編寫(xiě)一個(gè)標(biāo)識(shí)位來(lái)區(qū)別選中的變換，0代表DCT，1代表KLT集合。

優(yōu)選地，所述步驟(4)中，使用WINRAR進(jìn)行壓縮。

具體做法如下：

由于之前的離線訓(xùn)練變換方法其中的訓(xùn)練集固定造成與當(dāng)前需要編碼的序列之間的不相關(guān)性，使得離線訓(xùn)練的變換對(duì)于相關(guān)性不強(qiáng)的視頻序列并沒(méi)有得到很好的效果，而同一個(gè)視頻序列之間相同預(yù)測(cè)模式下殘差數(shù)據(jù)之間的相關(guān)性要比不同視頻序列之間相同預(yù)測(cè)模式下殘差數(shù)據(jù)之間的相關(guān)性要強(qiáng)很多，在此，定義了像素間的相關(guān)性(Correlat ion coeffi c i ent)，

為了更好地觀察像素間的在空域上的相關(guān)性，像素間的曼哈頓距離(Manhattan distance)作為統(tǒng)計(jì)的標(biāo)尺。

通過(guò)圖6，即使使用同一預(yù)測(cè)模式，相同序列的殘差像素間的相關(guān)性達(dá)到一致的特性，而對(duì)于不同序列，其殘差像素間的相關(guān)性有所差異。同時(shí)，其生成的KLT變換也不盡相同，RaceHorses以及BasketballDrill的序列不同預(yù)測(cè)模式訓(xùn)練得到的非分離KLT變換也有很大不同，存在差異性。

因此，本發(fā)明提出了一種基于視頻編碼模式的方向變換，本發(fā)明充分地利用了同一個(gè)視頻序列中非局部信息之間的相關(guān)性，從而得到性能更好的KLT集合，同時(shí)避免了過(guò)高的計(jì)算復(fù)雜度。本發(fā)明中，對(duì)于同一模式下，不同塊大小的殘差塊進(jìn)行訓(xùn)練得到非分離或分離的KLT集合，此KLT集合能夠使其對(duì)于當(dāng)前序列的殘差塊能量更加集中，從而在量化之后得到更小的碼流，從而提升了編碼效率。

本發(fā)明利用了同一個(gè)視頻的非局部信息，從而得到對(duì)當(dāng)前序列殘差塊具有更好變換的KLT集合，提升了編碼效率。其編碼端以及解碼端的示意圖如圖3。

在編碼端，本發(fā)明首先對(duì)其進(jìn)行數(shù)據(jù)的收集，對(duì)其進(jìn)行訓(xùn)練，得到KLT集合，在編碼時(shí)，通過(guò)RDO在此KLT和DCT中選取對(duì)于當(dāng)前編碼單元更好的變換方法。在解碼端，首先對(duì)傳輸?shù)浇獯a端的字典進(jìn)行解碼，之后再進(jìn)行整個(gè)視頻的解碼工作。

在此發(fā)明中，數(shù)據(jù)的收集、變換的生成、變換的使用、變換的傳輸為其主要組成部分。

數(shù)據(jù)的收集：對(duì)于當(dāng)前序列片段首先使用HEVC框架進(jìn)行壓縮，得到其關(guān)于當(dāng)前量化步長(zhǎng)(QP)的每一種塊大小的每一個(gè)預(yù)測(cè)模式下的數(shù)據(jù)集。

變換的生成：非分離的KLT變換與分離的KLT變換相比，能夠使得殘差塊的能量更加集中，同時(shí)卻帶來(lái)更高的計(jì)算復(fù)雜度以及傳輸時(shí)所需要的更多碼流。對(duì)于N×N的編碼塊，其非分離的KLT變換系數(shù)的個(gè)數(shù)為N⁴，那么對(duì)于4×4以及8×8的塊，這樣的規(guī)模可以接受，然而，對(duì)于16×16大小的殘差塊，其規(guī)模為256×256，如果對(duì)于此大小的塊需要傳輸?shù)淖儞Q的規(guī)模太大，從而會(huì)抵消掉引入16×16變換帶來(lái)的增益。幸運(yùn)的是，256×256的非分離字典中并不是所有的變換基元均在變換當(dāng)中占據(jù)主導(dǎo)作用，在此減少256×256的規(guī)模變?yōu)?56×32，從而減少傳輸所需的額外開(kāi)銷(xiāo)的同時(shí)，基本保持了此變換的原本的變換特性。

然而對(duì)于32×32的塊，對(duì)于每一個(gè)基元的長(zhǎng)度為1024，即使利用對(duì)16×16塊的處理方法其規(guī)模仍舊很大，所以對(duì)于32×32的塊，本發(fā)明采用兩種方法：1.不使用KLT；2.使用更小規(guī)模的分離KLT。

變換的使用：在HEVC框架中通過(guò)RDO在DCT和KLT集中選取編碼效率更高的變換。

變換的傳輸：采用行程編碼技術(shù)對(duì)其進(jìn)行傳輸，比如WINRAR。

此發(fā)明已經(jīng)在HEVC的HM12.1版本中被證明對(duì)于全I(xiàn)幀編碼時(shí)能夠得到很高的增益效果，如表1。

表1

在此編碼框架中，測(cè)試了前150幀的實(shí)驗(yàn)結(jié)果(每150幀可以作為一個(gè)變換生成的單元)，在圖表中，“直到16×16”表示在此方法中，僅僅對(duì)4×4、8×8、16×16訓(xùn)練了非分離的KLT集，“直到32×32”表示在此方法中，不僅對(duì)小于32×32的三種大小的塊采用非分離的KLT變換，而且對(duì)32×32大小的殘差塊采用了分離的KLT變換。對(duì)此發(fā)明與SDT進(jìn)行了比較，在表中，很明顯可以看到，相較于HEVC的標(biāo)準(zhǔn)，得到了更高的壓縮效率。

對(duì)于序列BasketballDrill，采用“直到16×16”方法時(shí)，在較高碼率下，此發(fā)明達(dá)到接近1db的增益。

對(duì)于塊大小為4×4的殘差塊，不同的模式采用的KLT集合的個(gè)數(shù)也做了統(tǒng)計(jì)。在不具備方向信息的模式0(Planar模式)和模式1(DC模式)，KLT集合被選中的概率仍舊接近于50％。

整個(gè)測(cè)試序列集對(duì)于不同大小選取KLT集合所占的百分比如表2，

表2

觀察到，對(duì)于4×4、8×8、16×16大小的殘差塊，選取KLT集合作為變換所占的百分比均超過(guò)了50％，且8×8大小的殘差塊比較DCT更加傾向與選取KLT集合中的變換。

圖4為本發(fā)明編碼端實(shí)施例的結(jié)構(gòu)示意圖,具體包括：

1.首先通過(guò)HEVC壓縮得到需要訓(xùn)練的殘差集，其根據(jù)QP、塊大小、模式進(jìn)行分類(lèi)，得到每一類(lèi)的殘差數(shù)據(jù)集。

2.由于在全I(xiàn)幀編碼時(shí)，QP已經(jīng)固定，對(duì)此數(shù)據(jù)集進(jìn)行訓(xùn)練，分別得到每一種塊大小的每一種模式的KLT,從而形成KLT集合。在此步驟中，形成的分?jǐn)?shù)非分離KLT將其使用尺度為2¹⁰進(jìn)行放大變?yōu)檎蚄LT，而分離KLT由于對(duì)于當(dāng)前編碼塊有行變換和列變換，使用尺度為2⁵進(jìn)行放大變?yōu)檎蚄LT,作為需要傳輸?shù)淖儞Q。

3.在RDO對(duì)KLT集和DCT進(jìn)行比較時(shí)，由于訓(xùn)練的KLT均具有將能量集中而且按照遞減的次數(shù)排列的特性，所以在使用量化前，根據(jù)當(dāng)前模式選取的掃描方法對(duì)其進(jìn)行排序，使掃描時(shí)先掃到統(tǒng)計(jì)意義上能量更加集中的系數(shù)。之后對(duì)其量化，得到需要傳輸?shù)拇a流。為了編解碼匹配，在此對(duì)其量化過(guò)的碼流進(jìn)行反量化，反量化之后的數(shù)據(jù)，仍舊根據(jù)排序方法，使其符合掃描的順序，進(jìn)而反變換，得到重建的圖像。同時(shí)，需要編寫(xiě)一個(gè)標(biāo)識(shí)位來(lái)區(qū)別選中的哪種變換，在此發(fā)明中，0代表DCT，1代表KLT集合。

4.傳輸KLT時(shí)，需要先將KLT寫(xiě)入到二進(jìn)制碼流，從而對(duì)此二進(jìn)制碼流使用行程編碼進(jìn)行壓縮，比如WINRAR。

圖5為本發(fā)明解碼端的流程示意圖，具體包括：

5.先解碼得到整型KLT集合，讀取二進(jìn)制碼流，將其轉(zhuǎn)化為整型KLT集合。

6.根據(jù)解碼出來(lái)的標(biāo)識(shí)位，來(lái)選取DCT或者KLT集合中的對(duì)應(yīng)此塊大小以及模式的KLT，對(duì)于選取KLT的已反量化的殘差的系數(shù)，首先根據(jù)掃描方式對(duì)其進(jìn)行排序，從而對(duì)此得到的量化之后的殘差塊進(jìn)行反變換重構(gòu)。

以上所述，僅是本發(fā)明的較佳實(shí)施例，并非對(duì)本發(fā)明作任何形式上的限制，凡是依據(jù)本發(fā)明的技術(shù)實(shí)質(zhì)對(duì)以上實(shí)施例所作的任何簡(jiǎn)單修改、等同變化與修飾，均仍屬本發(fā)明技術(shù)方案的保護(hù)范圍。

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁(yè)1 2 3

該技術(shù)已申請(qǐng)專(zhuān)利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：施云惠;李曉雷;丁文鵬;尹寶才
技術(shù)所有人：北京工業(yè)大學(xué)
我是此專(zhuān)利的發(fā)明人

上一篇：具有整理雜物功能的辦公桌的制作方法與工藝
上一篇：鋁電解槽料箱排氣裝置的制作方法

該領(lǐng)域下的技術(shù)專(zhuān)家
如您需求助技術(shù)專(zhuān)家，請(qǐng)點(diǎn)此查看客服電話(huà)進(jìn)行咨詢(xún)。
1、王老師：1.數(shù)字信號(hào)處理 2.傳感器技術(shù)及應(yīng)用 3.機(jī)電一體化產(chǎn)品開(kāi)發(fā) 4.機(jī)械工程測(cè)試技術(shù) 5.逆向工程技術(shù)研究
2、王老師：1.機(jī)器人 2.嵌入式控制系統(tǒng)開(kāi)發(fā)
3、孫老師：1.振動(dòng)信號(hào)時(shí)頻分析理論與測(cè)試系統(tǒng)設(shè)計(jì) 2.汽車(chē)檢測(cè)系統(tǒng)設(shè)計(jì) 3.汽車(chē)電子控制系統(tǒng)設(shè)計(jì)
4、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
5、袁老師：1.計(jì)算機(jī)視覺(jué) 2.無(wú)線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專(zhuān)家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢(xún)問(wèn)留言已有0條留言

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

視頻編碼模式相關(guān)技術(shù)

ps變換方向相關(guān)技術(shù)

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種基于視頻編碼模式的方向變換方法與流程