專利名稱:一種視頻數(shù)據(jù)壓縮方法
技術領域:
本發(fā)明涉及視頻編碼技術領域,尤其涉及一種視頻數(shù)據(jù)壓縮方法。
背景技術:
數(shù)字電視、新一代移動通信、寬帶網(wǎng)絡通信和家庭消費電子技術等蓬勃發(fā)展為高科技產(chǎn)業(yè)群,其共性集中在以視音頻為主要內(nèi)容的多媒體信息處理技術,特別是數(shù)據(jù)壓縮技術上。高效的視頻編碼技術是實現(xiàn)高質(zhì)量、低成本多媒體數(shù)據(jù)存儲與傳輸?shù)年P鍵。現(xiàn)在常用的編碼有MPEG(Moving PictureExperts Group,移動圖片專家組)2/MPEG4/H.264等,運用的編碼技術主要包括預測編碼、變換編碼、向量量化編碼等,這些視頻編碼標準以及相關技術在工業(yè)界得到了廣泛應用。
現(xiàn)有技術中視頻編碼標準都采用了HVC(Hybrid Video Coding,混合視頻編碼)策略,編碼設備中通常包括預測模塊、變換模塊、量化模塊和信息熵編碼模塊等主要模塊。其中,預測模塊的主要功能是利用已經(jīng)編碼并重建的圖像塊對當前要編碼的圖像塊進行預測(幀內(nèi)預測);變換模塊利用圖像中已經(jīng)編碼并重建的圖像塊變換到另外一個空間,使輸入信號的能量盡可能地集中在低頻變換系數(shù)上,進而降低圖像塊內(nèi)元素之間的相關性,有利于壓縮;量化模塊的主要功能是將變換的系數(shù)映射到一個有利于編碼的有限元素集上;信息熵編碼模塊的主要功能是根據(jù)統(tǒng)計規(guī)律,將量化后的變換系數(shù)用變長碼表示。視頻解碼設備包含反變換、反量化、信息熵編碼等模塊,主要是將輸入的碼流通過熵編碼、反量化、反變換等過程重建解碼圖像。除了上述模塊,視頻編解碼系統(tǒng)中通常還包含一些輔助的編碼工具,這些工具也會對整個系統(tǒng)的編碼性能做出貢獻。
視頻編碼的大部分效率來自于基于運動補償?shù)念A測。但是,由于大量采用運動矢量預測的方法,對一些相對靜止的畫面可能會出現(xiàn)大量運動矢量為零的預測單元,并且這些零向量也要被傳輸?shù)浇獯a器端,進行解碼,這樣本來不需要傳輸?shù)男畔?零向量信息)既消耗了傳輸資源,也消耗了編解碼資源。
針對上述問題,在現(xiàn)有的視頻編碼方案中,MPEG壓縮是根據(jù)運動圖像相鄰幀之間有一定的相似性,通過運動預測,參考前一幀圖像與這一幀圖像的相似情況,去掉與前一幀相似的冗余數(shù)據(jù),而只記錄這一幀與上一幀不同的數(shù)據(jù),從而大大提高了視頻數(shù)據(jù)的壓縮效率,這種壓縮方法也稱為幀相關壓縮。MPEG壓縮是以GOP(Group of Picture,圖像組)為一個單元的,有I幀、P幀和B幀三種模式的幀結構,其中,I幀為幀內(nèi)編碼,主要運用了幀內(nèi)預測作為主要的預測方式,P幀為預測編碼,主要運用了幀間預測再求殘差的方式,B幀為雙向預測編碼,同P幀相同也是先預測再求殘差。一般情況下一個GOP由15幀組成,第一幀為一個I幀, 依次為1個P幀,2個B幀,由此構成I PBB PBB PBB......結構。I幀稱為參考幀,該參考幀是其它幀都參考的起始幀,所以I幀是一個能夠完全記載這一幀全部圖像數(shù)據(jù)的幀,亦稱作全幀;P幀是前向預測幀,是根據(jù)與前一幀圖像的比較,去掉與前幀相似的數(shù)據(jù)而構成的幀;B幀是雙向預測幀,是根據(jù)與前后一幀圖像的比較而得到的幀,P、B幀是不完全幀,需要依靠I幀而成立。
然而,現(xiàn)有的編碼技術中,先做預測,在進行殘差運算,使得預測時也涉及到了冗余信息,降低了預測效率。另外,現(xiàn)有技術中先將視頻幀分為若干宏塊,通過將相鄰幀間相對應的宏塊分別進行比較,去掉冗余信息,而整個幀中包括多個宏塊,運算量將會非常大。
發(fā)明內(nèi)容
本發(fā)明實施例要解決的問題是提供視頻數(shù)據(jù)壓縮方法,以解決現(xiàn)有技術中編碼效率不高、運算量大的缺陷。
為了實現(xiàn)上述目的,本發(fā)明的實施例提供了一種視頻數(shù)據(jù)壓縮的方法,包括以下步驟編碼設備獲取需要編碼的原始視頻幀序列;利用所述原始視頻幀序列進行幀之間算術運算,壓縮冗余信息,獲得編碼信息,并將所述編碼信息發(fā)送給解碼設備;解碼設備從所述編碼設備獲得所述編碼信息;并通過從所述編碼設備獲得的或與所述編碼設備預先約定的算術運算信息、及從所述編碼設備獲得的編碼信息還原出原始視頻幀序列。
通過梯形層次壓縮實現(xiàn)所述利用原始視頻幀序列進行幀之間算術運算,壓縮冗余信息,獲得編碼信息。
所述梯形層次壓縮具體包括利用所述原始視頻幀序列進行幀之間殘差運算,獲得第一層殘差幀;采用迭代和/或閾值算法方式判斷所述第一層殘差幀的信息量是否小于閾值,如果小于,則所述第一層殘差幀為待傳輸?shù)臍埐顜瑢?,否則對所述第一層殘差幀進行殘差運算,獲得第二層殘差幀,重復上述步驟,直至底層殘差幀;對所述原始視頻幀的首尾幀、每層殘差幀的首尾幀及待傳輸殘差幀層或底層殘差幀進行編碼。
所述判斷第一層殘差幀的信息量是否小于閾值具體包括殘差幀中包含的信息冗余量小于閾值;或殘差幀中包含的信息冗余量大于閾值,但經(jīng)過再次殘差運算,也不能消除所述信息冗余量。
所述獲取需要編碼的原始視頻幀序列之后還包括確定原始視頻幀首幀I幀的過程采用獲取的原始視頻幀中的第一幀作為原始視頻幀首幀I幀,并對原始視頻幀中的每一幀與相鄰幀進行比較,如果相鄰兩幀內(nèi)容差異大于預設門限,則將后一視頻幀設為原始幀首幀I幀。
所述對原始視頻幀進行殘差運算具體包括確定所述原始視頻幀序列中除首尾幀之外的原始視頻幀對應的預測幀;根據(jù)所述原始視頻幀與對應的預測幀之差,獲得第一層殘差幀。
所述獲得原始視頻幀對應的預測幀方法具體為與第n幀視頻幀接近的預測幀=[第(n-1)幀+第(n+1)幀]/α。
用絕對差或計算方差的方法來確定α的值,即通過查找絕對差和/或方差中最小的值、或門限值來確定α的值。
所述α確定的具體步驟為首先確定兩參考幀間線段,中點位置處和當前幀比較的傳統(tǒng)SAD或新SAD值,如果為正,則當前幀位置靠近后一個參考幀,為負則靠近前一個參考幀;如果靠近前一個參考幀,則再在中點位置和后一參考幀之間中點位置再取傳統(tǒng)SAD或新SAD,然后看當前幀和這個位置比較,如果當前幀和這個位置比為負,則在該位置和左邊最近點取中點再進行比較;通過指數(shù)增長獲得適當?shù)腶的位置,使這個位置和當前幀的傳統(tǒng)SAD或新SAD差值最小;其中,新SAD算法為統(tǒng)計殘差為0的象素點的數(shù)目,當殘差為0最多時,兩幀最近似,SAD最?。粋鹘y(tǒng)的SAD是看個象素點差值的絕對值之和最小。
對發(fā)送編碼信息之前還包括對所述編碼信息進行預測、變換、量化及熵編碼;所述解碼設備解碼之前還包括熵編碼、反量化、反變換及反預測。
與現(xiàn)有技術相比,本發(fā)明實施例具有以下優(yōu)點本發(fā)明實施例中,通過對整幀數(shù)據(jù)先進行殘差運算,消除了視頻編碼中零向量,再進行預測、變換、量化和信息熵編碼等,盡可能的消除了預測、變換、量化和信息熵編碼的計算數(shù)量,節(jié)省了編解碼資源和傳輸帶寬。
另外,本發(fā)明實施例可以通過多級殘差運算,進一步降低了冗余數(shù)據(jù)的編解碼運算和占用有限的傳輸帶寬。
圖1是本發(fā)明實施例一種視頻數(shù)據(jù)壓縮的方法流程圖;圖2是本發(fā)明實施例二示意圖;圖3是本發(fā)明實施例三示意圖;圖4是本發(fā)明實施例一種視頻數(shù)據(jù)編碼設備結構圖;圖5是本發(fā)明實施例一種視頻數(shù)據(jù)解碼設備結構圖。
具體實施例方式
本發(fā)明中編碼設備獲取需要編碼的原始視頻幀序列;利用所述原始視頻幀序列進行幀之間算術運算,壓縮冗余信息,獲得編碼信息,并將所述編碼信息及幀之間算術運算信息發(fā)送給解碼設備,當然,該算術運算信息也不一定發(fā)送給解碼設備,有可能通過事先標準約定,也就是說編碼使用固定的算術運算法則,而且解碼器知道這一法則;解碼設備從所述編碼設備獲得所述編碼信息;并通過所述從編碼設備獲得的或與編碼設備預先約定的算術運算信息及編碼信息還原出原始視頻幀序列。
下面結合具體實施例對本發(fā)明進行詳細說明。
本發(fā)明實施例中,通過梯形層次壓縮實現(xiàn)利用原始視頻幀序列進行幀之間算術運算,壓縮冗余信息,獲得編碼信息。具體可以采用整幀視頻幀的殘差方式實現(xiàn)視頻數(shù)據(jù)的壓縮效率提高,具體為在編碼方,對需要壓縮的視頻幀進行多層殘差運算,設要傳輸?shù)囊曨l幀為原始視頻幀,經(jīng)過一次殘差運算得到的視頻幀為第一層殘差幀,經(jīng)過二次殘差運算得到的視頻幀為第二層殘差幀,以此類推。隨著需要傳輸視頻幀數(shù)量的增加,可以進行的殘差運算級別也會增加,當然,多層次殘差的殘差運算可以將視頻幀中的冗余信息減少到最小,從而達到最高的壓縮性能。但有些情況下,并不需要將將殘差運算進行到最后一層,當殘差運算進行到某一層次時,通過某些判斷機制,檢測到此時的冗余信息已經(jīng)非常小,可以達到忽略不計的程度,或者達到殘差運算的復雜度與信息冗余的相對均衡點時,就可以不再進行下一層次的殘差運算,而是將經(jīng)過該層次殘差運算得到的視頻幀作為底層殘差幀。編碼方只需將底層殘差幀,和其它層每層的首尾幀傳送到解碼方,同時要將編碼方采用的壓縮算法通知解碼方。在解碼方,獲得底層殘差幀,和其它層每層的首尾幀后,利用編碼時采用殘差公式進行計算,可以獲得原始視頻幀。
本發(fā)明一種視頻數(shù)據(jù)壓縮的方法實施例,如圖1所示,包括以下步驟步驟s101,獲取需要編碼的原始視頻幀序列。從計算機或其它視頻設備讀取某個視頻幀序列,輸入的視頻幀序列為YUV格式,本實施例針對亮度分量(或色度分量)進行處理,因此需要從該視頻幀序列中提取亮度(或色度)分量。其中,YUV格式中,Y表示明亮度(Luminance或Luma),也就是灰階值;而U和V表示的則是色度(Chrominance或Chroma),作用是描述影像色彩及飽和度,用于指定像素的顏色。亮度通過RGB輸入信號來創(chuàng)建的,方法是將RGB信號的特定部分疊加到一起;色度定義了顏色的兩個方面色調(diào)與飽和度,分別用Cr和CB來表示,Cr反映了GB輸入信號紅色部分與RGB信號亮度值之間的差異,CB反映RGB輸入信號藍色部分與RGB信號亮度值之同的差異。
步驟s102,利用原始視頻幀序列進行幀間殘差運算,獲得第一層殘差幀。其中,所述幀間的含義有可能是兩幀或兩幀以上,有可能是間隔一幀的兩幀,或間隔一幀的多幀,或間隔多幀的兩幀,或間隔多幀的多幀。首先確定原始視頻幀序列中除首尾幀之外的原始視頻幀對應的預測幀,然后根據(jù)原始視頻幀與對應的預測幀之差,獲得第一層殘差幀。本步驟中還應該包括確定原始視頻幀首幀的過程采用獲取的原始視頻幀中的第一幀作為原始視頻幀首幀,并對原始視頻幀中的每一幀與相鄰幀進行比較,如果相鄰兩幀內(nèi)容差異大于預設門限,則將后一視頻幀設為原始幀首幀。
其中,獲得原始視頻幀對應的預測幀方法具體為與第n幀視頻幀接近的預測幀=[第(n-1)幀+第(n+1)幀]/α,用絕對差或計算方差的方法來確定α的值,即通過查找絕對差和/或方差中最小的值、或門限值來確定α的值。α值可以確定一個正負的方向,從而決定下一個位置可以往那邊移動,確定α的具體步驟為首先計算兩參考幀間線段,中點位置處和當前幀比較的傳統(tǒng)SAD或新SAD值,如果為正,說明當前幀位置靠近后一個參考幀,為負則靠近前一個參考幀;如果靠近前一個參考幀,則再在中點位置和后一參考幀之間中點位置再取傳統(tǒng)SAD或新的SAD,然后看當前幀和這個位置比較,如果當前幀和這個位置比為負,則在這個位置和左邊最近點取中點再進行比較;最后,這樣1/2的指數(shù)(當然實際也可以采用其它指數(shù)增長)增長來最快尋找適當?shù)腶的位置,使這個位置和當前幀的傳統(tǒng)SAD或新的SAD差值最小,這個時候的位置就可以得到α的值。其中,新的SAD算法為統(tǒng)計殘差為0的象素點的數(shù)目,當殘差為0最多時,認為此時兩幀最近似;傳統(tǒng)的SAD是看個象素點差值的絕對值之和最小。
例如設當前視頻幀為C,前一個參考幀為A,后一個參考幀為B,A幀中每個像素點和B幀中相同位置的像素點對應;又設A幀中某個像素點a和B幀中某個像素點b對應,a的色度或亮度值和b的色度或亮度值為a1=|a-b|2---(1)]]>b1=-|a-b|2---(2)]]>其中a1和b1為參考值,可以根據(jù)實際情況調(diào)整。
對于當前幀C,每一個像素都可以在A幀和B幀中找到相應的點與其對應,設與a,b對應的點為c;計算出c在ab之間的權重位置c1=c-b-|a-b|2---(3)]]>如果c1對應的坐標為(n,m)點,權重用cnm表示,則統(tǒng)計加權值S=Σ0n-1Σ0m-1cnm---(4)]]>加一個搜索單位的量,在計算該位置和當前幀的統(tǒng)計加權值的大小比較,直到找到最接近當前幀統(tǒng)計加權值的位置D為止,則α=ADAB---(5).]]>步驟s103,因為在減小域值時有可能連續(xù)幾幀差異過大,導致迭代多次之后冗余信息還是大于域值,并且因為由于迭代次數(shù)過多導致計算復雜度加大以及公式變得更為復雜,因此可以采用迭代和/或閾值判斷第一層殘差幀的信息量是否小于閾值,如果小于,則第一層殘差幀為待傳輸?shù)臍埐顜瑢樱駝t根據(jù)第一層殘差幀進行殘差運算,獲得第二層殘差幀,重復閾值判斷步驟,如果該層殘差幀小于閾值,則該層為待傳輸殘差幀,否則繼續(xù)運算,直至底層殘差幀。其中,判斷第一層殘差幀的信息量是否小于閾值具體包括殘差幀中包含的信息冗余量小于閾值;或殘差幀中包含的信息冗余量大于閾值,但經(jīng)過再次殘差運算,也不能消除信息冗余量。
步驟s104,對原始視頻幀的首尾幀、每層殘差幀的首尾幀及待傳輸殘差幀層或底層殘差幀進行編碼。為了提高編碼效率,在殘差運算后,對需要傳輸?shù)臍埐顜性谝粋€區(qū)域或整個幀中統(tǒng)計運動矢量,將相同運動矢量進行合并,然后統(tǒng)一編碼。
步驟s105,將編碼后的每層首尾幀和底層殘差幀發(fā)送到解碼設備,解碼設備根據(jù)編碼信息解碼獲得原始視頻幀序列。對發(fā)送編碼信息之前還包括對每層首尾幀和底層殘差幀進行預測、變換、量化及熵編碼;解碼設備解碼之前還包括反熵編碼、反量化、反變換及反預測。
本發(fā)明實施例二以需要傳輸?shù)脑家曨l幀4幀為例,如圖2所示,需要傳輸?shù)囊曨l幀為A、B、C、D等一些連續(xù)的視頻幀,其中,A、B、C、D幀不一定是相鄰關系,但需要具有一定的順序關系。采用本發(fā)明的殘差處理方法對A、B、C、D幀進行壓縮處理通過公式(6)至(9)得到E、F、H、I幀,發(fā)送方只需要向接收方傳輸?shù)谝粚觾啥藥?jié)點A和D幀、第二層所有幀節(jié)點F和I幀。
E=A+Cα---(6)]]>F=B-E(7)H=B+Dα---(8)]]>I=C-H(9)接收方獲得A、F、I、D幀后,則可以根據(jù)公式(6)至(9)計算得到原B和C幀C=α2I+A+αF+αDα2-1---(10)]]>B=α2F+2A+αI+Dα2-1---(11)]]>由于F幀由B幀和E幀的差獲得,而E幀為B幀前幀A和后幀C均衡得到,應該與B幀最為接近,因此B幀與E幀的差應該非常小,即F幀需要編碼的數(shù)據(jù)明顯小于B幀;同理I幀需要編碼的數(shù)據(jù)明顯小于C幀,這樣傳輸A、F、I、D幀的信息量小于傳輸A、B、C、D幀的信息量,就達到了壓縮視頻編碼的目的。
其中,α是一個系數(shù),獲得方法為將當前幀C的前一個參考幀設為A,后一個參考幀設為B幀,A幀中每個像素點和B幀中相同位置的像素點對應,又設A幀中某個像素點a和B幀中某個像素點b對應,a的值(色度或亮度值)和b的值(色度或亮度值)可以重新定義為假定a的值為正,b的值為負;a1=|a-b|2---(12)]]>b1=-|a-b|2---(13)]]>對于當前幀C來說,每一個象素都可以在A幀和B幀中找到相應的點與其對應,設與a,b對應的點為c;由于運動的相關性,大多數(shù)類似c的點的值都在a與b之間,因此可以計算出c在ab之間的權重位置c1=c-b-|a-b|2---(14)]]>如果c1對應的坐標為(n,m)點,權重用cnm表示,則統(tǒng)計加權值S=Σ0n-1Σ0m-1cnm---(15)]]>由于a1+b12=0---(16)]]>在 的位置所有AB幀對應的點的集合統(tǒng)計值也是0;之所以這樣做,是為了可以用正負號來確定方向矢量,因為1/2的位置正好是0,即兩個參考幀中當前幀位置處用上述算法計算出的統(tǒng)計加權,如果統(tǒng)計加權值為正,即應該往A的方向(正的方向搜索),相反,往B的方向(負的方向)搜索。然后,加一個搜索單位的量,在計算該位置和當前幀的統(tǒng)計加權值的大小比較,直到找到最接近當前幀統(tǒng)計加權值的位置D為止,則α=ADAB---(17)]]>其中,α值可以是一組遞減的序列,如2,1,0.5,0.25等。
本發(fā)明實施例三以需要傳輸?shù)脑家曨l幀5幀為例,如圖3所示,該算法在編碼時,只需要將第一層兩端幀節(jié)點A和E幀、第二層兩端幀節(jié)點F和H幀、一直到最后一層幀全部傳輸。由于F和H幀比B和D幀攜帶的信息量少很多,I幀也比C幀攜帶的信息量少很多,因此壓縮后需要傳輸?shù)臄?shù)據(jù)比原始數(shù)據(jù)少很多,可以達到最大的壓縮比。其中,以α=2為例,F(xiàn)=B-A+C2---(18)]]>H=C-C+E2---(19)]]>I=C-B+D2-F+H2=C-B+D2-B-A+C2+C-C+E22---(20)]]>
然后在解碼的時候,通過A、E、F、H、I幀可以計算出ABCDE幀來。
C=2H+E(21)B+F-A+2H+E2---(22)]]>D=5H+3E-3F-A-2I2---(23)]]>本發(fā)明實施例還提供了一種視頻數(shù)據(jù)編碼設備,如圖4所示,包括原始視頻幀獲取單元11、殘差運算單元12、冗余信息判斷單元13、編碼單元14和編碼信息發(fā)送單元15。其中,原始視頻幀獲取單元11,用于從計算機或其它視頻設備讀取某個需要傳輸?shù)囊曨l幀序列;殘差運算單元12,利用視頻幀序列進行殘差運算,獲得殘差幀;冗余信息判斷單元13,用于判斷第一層殘差幀的信息量是否小于閾值,如果小于,則第一層殘差幀為待傳輸?shù)臍埐顜瑢?,否則根據(jù)第一層殘差幀進行殘差運算,獲得第二層殘差幀,重復閾值判斷步驟,如果該層殘差幀小于閾值,則該層為待傳輸殘差幀,否則繼續(xù)運算,直至底層殘差幀;編碼單元14,用于對原始視頻幀的首尾幀、每層殘差幀的首尾幀及待傳輸殘差幀層或底層殘差幀進行編碼,例如預測、變換、量化及熵編碼;編碼信息發(fā)送單元15將編碼后的編碼信息發(fā)送的解碼設備。
本發(fā)明實施例還提供了一種視頻數(shù)據(jù)解碼設備,如圖5所示,包括編碼信息獲取單元21和解碼單元22。其中,編碼信息獲取單元21用于獲取編碼單元發(fā)送來的編碼信息;解碼單元22用于先對編碼信息進行熵編碼、反量化、反變換及反預測,然后根據(jù)編碼信息中的殘差公式信息及每層視頻幀的首尾幀和殘差幀解碼獲得原始視頻幀。
本發(fā)明實施例通過對整幀數(shù)據(jù)先進行殘差運算,消除了視頻編碼中零向量,再進行預測、變換、量化和信息熵編碼等,盡可能的消除了預測、變換、量化和信息熵編碼的計算數(shù)量,節(jié)省了編解碼資源和傳輸帶寬。另外,本發(fā)明實施例可以通過多級殘差運算,進一步降低了冗余數(shù)據(jù)的編解碼運算和占用有限的傳輸帶寬。
本發(fā)明實施例所描述的技術可以用硬件、軟件、或組合執(zhí)行。如果用軟件執(zhí)行,則該技術可以直接指包含程序代碼的計算機可讀介質(zhì),該程序代碼在對視頻序列進行編碼的設備中執(zhí)行,進行該實施例中的一個或多個殘差編碼技術。在該種情況下,計算機可讀介質(zhì)可以包括RAM(Random AccessMemory,隨機存儲器)、SDRAM(Synchronous Dynamic RAM,同步動態(tài)隨機存儲器)、ROM(Read Only Memory,只讀存儲器)、NVRAM(non-volatileRAM非易失性隨機存儲器)、EEPROM(Electrically-Erasable ProgrammableRead-Only Memory,電可擦除只讀存儲器)、FLASH(閃存)等。
程序編碼可以以計算機可讀指令的形式存儲在存儲器中。在該情況下,一個或多個處理器可以執(zhí)行存儲在存儲器中的指令,從而執(zhí)行一個或多個殘差編碼技術。在一些情況下,處理器可以用DSP(Digital Signal Processing,數(shù)字信號處理)設備執(zhí)行,DSP使用各種硬件元件來加速編碼處理;在其它情況下,編碼設備可以作為一個或多個微處理器,一個或多個或者多個ASIC(application-specific integrated circuit,專用集成電路)、FPGA(FieldProgrammable Gate Array,現(xiàn)場可編程門陣列)、或一些其它等效集成或分立邏輯電路或硬件軟件組合來執(zhí)行。
以上公開的僅為本發(fā)明的幾個具體實施例,但是,本發(fā)明并非局限于此,任何本領域的技術人員能思之的變化都應落入本發(fā)明的保護范圍。
權利要求
1.一種視頻數(shù)據(jù)壓縮方法,其特征在于,包括以下步驟編碼設備獲取需要編碼的原始視頻幀序列;利用所述原始視頻幀序列進行幀之間算術運算,壓縮冗余信息,獲得編碼信息,并將所述編碼信息發(fā)送給解碼設備;解碼設備從所述編碼設備獲得所述編碼信息;并通過從所述編碼設備獲得的或與所述編碼設備預先約定的算術運算信息、及從所述編碼設備獲得的編碼信息還原出原始視頻幀序列。
2.如權利要求1所述視頻數(shù)據(jù)壓縮方法,其特征在于,通過梯形層次壓縮實現(xiàn)所述利用原始視頻幀序列進行幀之間算術運算,壓縮冗余信息,獲得編碼信息。
3.如權利要求2所述視頻數(shù)據(jù)壓縮方法,其特征在于,所述梯形層次壓縮具體包括利用所述原始視頻幀序列進行幀之間殘差運算,獲得第一層殘差幀;判斷所述第一層殘差幀的信息量是否小于閾值,如果小于,則所述第一層殘差幀為待傳輸?shù)臍埐顜瑢?,否則對所述第一層殘差幀進行殘差運算,獲得第二層殘差幀,重復上述步驟,直至底層殘差幀;對所述原始視頻幀的首尾幀、每層殘差幀的首尾幀及待傳輸殘差幀層或底層殘差幀進行編碼。
4.如權利要求3所述視頻數(shù)據(jù)壓縮方法,其特征在于,采用迭代次數(shù)和/或閾值的方法判斷第一層殘差幀的信息量是否小于閾值。
5.如權利要求1所述視頻數(shù)據(jù)壓縮方法,其特征在于,所述獲取需要編碼的原始視頻幀序列之后還包括確定原始視頻幀首幀I幀的過程采用獲取的原始視頻幀中的第一幀作為原始視頻幀首幀I幀,并對原始視頻幀中的每一幀與相鄰幀進行比較,如果相鄰兩幀內(nèi)容差異大于預設門限,則將后一視頻幀設為原始幀首幀I幀。
6.如權利要求3所述視頻數(shù)據(jù)壓縮方法,其特征在于,所述對原始視頻幀進行殘差運算具體包括確定所述原始視頻幀序列中除首尾幀之外的原始視頻幀對應的預測幀;根據(jù)所述原始視頻幀與對應的預測幀之差,獲得第一層殘差幀。
7.如權利要求6所述視頻數(shù)據(jù)壓縮方法,其特征在于,所述獲得原始視頻幀對應的預測幀方法具體為與第n幀視頻幀接近的預測幀=[第(n-1)幀+第(n+1)幀]/α。
8.如權利要求7所述視頻數(shù)據(jù)壓縮方法,其特征在于,用絕對差SAD或計算方差的方法來確定α的值,即通過查找絕對差和/或方差中最小的值、或門限值來確定α的值。
9.如權利要求8所述視頻數(shù)據(jù)壓縮方法,其特征在于,所述α確定的具體步驟為首先確定兩參考幀間線段,中點位置處和當前幀比較的傳統(tǒng)SAD或新SAD值,如果為正,則當前幀位置靠近后一個參考幀,為負則靠近前一個參考幀;如果靠近前一個參考幀,則再在中點位置和后一參考幀之間中點位置再取傳統(tǒng)SAD或新SAD,然后看當前幀和這個位置比較,如果當前幀和這個位置比為負,則在該位置和左邊最近點取中點再進行比較;通過指數(shù)增長獲得適當?shù)腶的位置,使這個位置和當前幀的傳統(tǒng)SAD或新SAD差值最??;其中,新SAD算法為統(tǒng)計殘差為0的象素點的數(shù)目,當殘差為0最多時,兩幀最近似,SAD最??;傳統(tǒng)的SAD是看個象素點差值的絕對值之和最小。
10.如權利要求1所述視頻數(shù)據(jù)壓縮方法,其特征在于,對發(fā)送編碼信息之前還包括對所述編碼信息進行預測、變換、量化及熵編碼;所述解碼設備解碼之前還包括熵編碼、反量化、反變換及反預測。
全文摘要
本發(fā)明公開了一種視頻數(shù)據(jù)壓縮的方法編碼設備獲取需要編碼的原始視頻幀序列;利用所述原始視頻幀序列進行幀之間算術運算,壓縮冗余信息,獲得編碼信息,并將所述編碼信息發(fā)送給解碼設備;解碼設備從所述編碼設備獲得所述編碼信息;通過從所述編碼設備獲得的或與所述編碼設備預先約定的算術運算信息,及從所述編碼設備獲得的所述編碼信息還原出原始視頻幀序列。本發(fā)明實施例中,通過對整幀數(shù)據(jù)先進行殘差運算,消除了視頻編碼中零向量,再進行預測、變換、量化和信息熵編碼等,節(jié)省了編解碼資源和傳輸帶寬;并且在一個區(qū)域或整個幀中統(tǒng)計運動矢量,把相同的運動矢量塊合并之后統(tǒng)一編碼,提高編碼效率和解碼效率。
文檔編號H04N7/32GK101014129SQ20071007968
公開日2007年8月8日 申請日期2007年3月6日 優(yōu)先權日2007年3月6日
發(fā)明者孟智平 申請人:孟智平