專利名稱:用于視頻壓縮的基于超完備基變換的運(yùn)動(dòng)殘余幀編碼方法和裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及壓縮領(lǐng)域,尤其涉及視頻壓縮方法和裝置。
背景技術(shù):
當(dāng)圖像序列以非壓縮數(shù)字形式表示時(shí),可能占用巨大的存儲空間,并需要極高的傳輸帶寬。幾年前,隨著計(jì)算機(jī)網(wǎng)絡(luò)和信號壓縮技術(shù)的進(jìn)步,點(diǎn)對點(diǎn)數(shù)字視頻通信變得可實(shí)行。
針對數(shù)字視頻壓縮的標(biāo)準(zhǔn)化工作大概于1988年啟動(dòng)。目前,1SO/IEC下屬的運(yùn)動(dòng)圖像專家組(MPEG)委員會已完成了MPEG-1和MPEG-2標(biāo)準(zhǔn);MPEG-4標(biāo)準(zhǔn)也已經(jīng)完成,但仍在接受新的提議。此外,CCITT提出了一系列建議-H.261、H.262和H.263+-其焦點(diǎn)集中于低比特率應(yīng)用。所有這些標(biāo)準(zhǔn)化的嘗試都是利用兩步程序來壓縮視頻序列。第一步利用運(yùn)動(dòng)估計(jì)和補(bǔ)償算法,用前一視頻幀建立當(dāng)前視頻幀的預(yù)測視頻幀,其中計(jì)算當(dāng)前視頻幀與預(yù)測視頻幀之間的差,該差被稱為運(yùn)動(dòng)殘余圖像(MRP)。標(biāo)準(zhǔn)程序的第二步是利用離散余弦變換(DCT)將MRP編碼。像這種基于DCT的系統(tǒng)并非在所有情形下都表現(xiàn)良好。在個(gè)人視頻通信所需的低比特率下,基于DCT的系統(tǒng)會引起顯著的失真和可見的區(qū)塊效應(yīng)(blockartifact)。對于像DVD這樣的高質(zhì)量可視應(yīng)用,所獲得的壓縮率可能相當(dāng)?shù)汀?br>
運(yùn)動(dòng)殘余圖像可利用基于其他變換的技術(shù)進(jìn)行編碼。例如,也可使用離散小波變換(DWT)和超完備基變換。Zakhor和Neff在美國專利No.5,699,121中提出了基于被稱為匹配跟蹤(matching pursuit)的超完備基變換算法的運(yùn)動(dòng)殘余編碼系統(tǒng)。這由Mallat和Zhang在IEEETransaction in Signal Processing,第41卷,第12期,1993年12月,中首次提出。與基于標(biāo)準(zhǔn)DCT的視頻編碼器相比,Zakhor和Neff的視頻編碼器改善了視頻質(zhì)量和PNSR。但是,他們的系統(tǒng)很慢,并且由于針對匹配基位置編碼和變換系數(shù)的量化的特定設(shè)計(jì),其壓縮性能不是最優(yōu)化的。因此,需要一種基于新的超完備(overcomplete)變換的視頻編碼方法,其能提供速度和效率。
提供該背景信息,目的是使申請人認(rèn)為可能與本發(fā)明有關(guān)的信息已知。并非意味著,也不應(yīng)該解釋成,任何前述信息構(gòu)成本發(fā)明的現(xiàn)有技術(shù)。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種用于視頻壓縮的、基于超完備基變換的運(yùn)動(dòng)殘余幀編碼方法和裝置。根據(jù)本發(fā)明的一個(gè)方面,提供了一種利用來自過完備庫的基函數(shù)將殘余圖像編碼的方法,所述方法包括步驟獲得殘余圖像,所述殘余圖像具有尺寸和能量;以及,將所述殘余圖像分解成一個(gè)單原子或多原子列表(list),每個(gè)原子代表來自過完備庫的一個(gè)基函數(shù),所述將所述殘余圖像分解的步驟包括步驟(i)利用殘余能量分割算法,識別殘余圖像中的替換區(qū)域供用原子表示;(ii)建立來自過完備庫的基函數(shù)子集,子集中的每個(gè)基函數(shù)在預(yù)定閾值內(nèi)與替換區(qū)域匹配;(iii)識別基函數(shù)子集內(nèi)的原子,所述原子用于表示替換區(qū)域,并且所述原子具有參數(shù);(iv)量化所述原子,并將原子的參數(shù)調(diào)整成一種適于編碼的形式;(v)將所述量化原子編碼,從殘余圖像中的替換區(qū)域中減去所述原子,從而減小殘余圖像的能量并利用基于四叉樹(quadtree)的原子編碼器減小殘余圖像的尺寸;以及,(vi)將殘余圖像的減小尺寸或殘余圖像的減小能量與預(yù)定標(biāo)準(zhǔn)比較,并重復(fù)步驟(i)-(vi)直到達(dá)到預(yù)定標(biāo)準(zhǔn);從而將所述殘余圖像編碼并將其尺寸減小到預(yù)定水平。
根據(jù)本發(fā)明的另一方面,提供了一種利用來自過完備庫的基函數(shù)將殘余圖像編碼的裝置,所述裝置包括獲得殘余圖像的裝置,所述殘余圖像具有尺寸和能量;和,將所述殘余圖像分解成一個(gè)單原子或多原子列表的裝置,每個(gè)原子代表來自過完備庫的一個(gè)基函數(shù),所述將所述殘余圖像分解的裝置包括(i)利用殘余能量分割算法、識別殘余圖像中的替換區(qū)域供用原子表示的裝置;(ii)建立來自過完備庫的基函數(shù)子集的裝置,子集中的每個(gè)基函數(shù)在預(yù)定閾值內(nèi)與替換區(qū)域匹配;(iii)識別基函數(shù)子集內(nèi)的原子的裝置,所述原子用于表示替換區(qū)域,并且所述原子具有參數(shù);(iv)量化所述原子、并將原子的參數(shù)調(diào)整成一種適于編碼的形式的裝置;(v)將所述量化原子編碼、從殘余圖像中的替換區(qū)域中減去所述原子、從而減小殘余圖像的能量并利用基于四叉樹的原子編碼器減小殘余圖像的尺寸的裝置;以及,(vi)將殘余圖像的減小尺寸或殘余圖像的減小能量與預(yù)定標(biāo)準(zhǔn)比較的裝置;從而將所述殘余圖像編碼并將其尺寸減小到預(yù)定水平。
根據(jù)本發(fā)明的另一方面,提供了一種包括計(jì)算機(jī)可讀介質(zhì)的計(jì)算機(jī)程序產(chǎn)品,計(jì)算機(jī)可讀介質(zhì)具有記錄在其上的計(jì)算機(jī)程序用于執(zhí)行利用來自過完備庫的基函數(shù)將殘余圖像編碼的方法,所述方法包括步驟獲得殘余圖像,所述殘余圖像具有尺寸和能量;以及,將所述殘余圖像分解成一個(gè)單原子或多原子列表,每個(gè)原子代表來自過完備庫的一個(gè)基函數(shù),所述將所述殘余圖像分解的步驟包括步驟(i)利用殘余能量分割算法,識別殘余圖像中的替換區(qū)域供用原子表示;(ii)建立來自過完備庫的基函數(shù)子集,子集中的每個(gè)基函數(shù)在預(yù)定閾值內(nèi)與替換區(qū)域匹配;(iii)識別基函數(shù)子集內(nèi)的原子,所述原子用于表示替換區(qū)域,并且所述原子具有參數(shù);(iv)量化所述原子,并將原子的參數(shù)調(diào)整成一種適于編碼的形式;(v)將所述量化原子編碼,從殘余圖像中的替換區(qū)域中減去所述原子,從而減小殘余圖像的能量并利用基于四叉樹的原子編碼器減小殘余圖像的尺寸;以及,(vi)將殘余圖像的減小尺寸或殘余圖像的減小能量與預(yù)定標(biāo)準(zhǔn)比較,并重復(fù)步驟(i)-(vi)直到達(dá)到預(yù)定標(biāo)準(zhǔn);從而將所述殘余圖像編碼并將其尺寸減小到預(yù)定水平。
附圖簡述
圖1圖解了利用根據(jù)本發(fā)明的一個(gè)實(shí)施方案的超完備基變換和相關(guān)編碼方法的視頻壓縮系統(tǒng)的總圖。
圖2是本發(fā)明的一個(gè)實(shí)施方案所處理的運(yùn)動(dòng)殘余圖像的例子。
圖3圖解了供本發(fā)明的一個(gè)實(shí)施方案使用的、具有16個(gè)基(base)的簡單字典。
圖4描述了基于根據(jù)本發(fā)明的一個(gè)實(shí)施方案的超完備基的整個(gè)原子分解過程。
圖5描述了根據(jù)本發(fā)明的一個(gè)實(shí)施方案的殘余能量分割算法(RESA)所執(zhí)行的基本步驟。
圖6圖解了根據(jù)本發(fā)明的一個(gè)實(shí)施方案的RESA的第一步。
圖7圖解了根據(jù)本發(fā)明的一個(gè)實(shí)施方案的RESA的第二步水平生長(grow)方案。
圖8圖解了根據(jù)本發(fā)明的一個(gè)實(shí)施方案的RESA的第三步垂直生長方案。
圖9描述了利用根據(jù)本發(fā)明的一個(gè)實(shí)施方案的逐次消除算法(PEA)的匹配跟蹤原子搜索。
圖10圖解了如何形成根據(jù)本發(fā)明的一個(gè)實(shí)施方案的匹配基和搜索位置候選的子字典。
圖11圖解了根據(jù)本發(fā)明的一個(gè)實(shí)施方案的區(qū)域能量的快速計(jì)算。
圖12圖解了根據(jù)本發(fā)明的一個(gè)實(shí)施方案的一個(gè)原子的參數(shù)。
圖13是根據(jù)本發(fā)明的一個(gè)實(shí)施方案的原子位置圖(map)的例子。
圖14是說明根據(jù)本發(fā)明的一個(gè)實(shí)施方案的原子編碼過程的流程圖。
圖15是說明根據(jù)本發(fā)明的一個(gè)實(shí)施方案的壓縮殘余信號的解碼的流程圖。
具體實(shí)施例方式
本發(fā)明是針對基于超完備變換的殘余圖像編碼的新編碼器,用于運(yùn)動(dòng)補(bǔ)償視頻壓縮系統(tǒng)中。本發(fā)明與早先的匹配跟蹤視頻編碼器類似,它們都將殘余圖像分解成原子列表,原子代表來自過完備字典的基函數(shù)。不過,原子搜尋過程是利用殘余能量分割算法((Residual EnergySegmentation Algorithm)RESA)和逐次消除算法((ProgressiveElimination Algorithm)PEA)實(shí)現(xiàn)的。為描述在運(yùn)動(dòng)殘余圖像中頻繁出現(xiàn)的特征的特性,基字典可能非常大。為了搜尋原子,RESA識別運(yùn)動(dòng)殘余圖像中具有高能量的區(qū)域的大致形狀和位置,以便可通過與字典中的較小基子集比較來找到良好匹配。而且,PEA通過預(yù)計(jì)算搜索窗口的能量從考慮項(xiàng)中逐次去掉模式候選,從而縮短了找到最好匹配所需的計(jì)算時(shí)間。一找到匹配原子,就通過去掉以該原子為特征的部分來更新殘余圖像。重復(fù)前述搜尋原子和更新殘余圖像的步驟直到達(dá)到所需的壓縮比特率或質(zhì)量。
本發(fā)明提出了一種新的模量化方案用于借助超完備基進(jìn)行匹配跟蹤,其改變了原子搜尋過程。直接從變換產(chǎn)生的系數(shù)是連續(xù)浮點(diǎn)值,需要量化用于在一比特預(yù)算下進(jìn)行最佳數(shù)字編碼。在匹配跟蹤算法中,有必要使用環(huán)內(nèi)量化器(in-loop quantizer)-其中每個(gè)被找到的原子先被量化,然后被用來更新殘余圖像。照這樣,每個(gè)原子會影響后續(xù)原子的選擇。如果,同在早先的匹配跟蹤方法中所進(jìn)行的一樣,在編碼開始之前就規(guī)定量化器,則難以使量化方案最優(yōu)化,因?yàn)樽罴蚜炕髟O(shè)計(jì)取決于所選原子模列表的統(tǒng)計(jì)(statistics)。本發(fā)明的量化方案在原子搜索過程中自適應(yīng)地選擇量化器。
除原子模以外,所選基的索引和原子的位置也需要在基于超完備變換的編碼器中傳輸。本發(fā)明包括一種將原子位置信息有效編碼的方法。原子位置分布形成2D圖,其中像素值1和0分別表示各個(gè)位置有原子或沒有原子。類似四叉樹的技術(shù)使得將位置圖編碼成為可能。模和基索引信息被嵌入位置編碼中。不同的彩色視頻通道(Y,U,V)的原子獨(dú)立編碼。
所有原子參數(shù)先被編碼成殘余圖像的壓縮形式,然后被傳輸。對于解碼過程,解碼器通過將編碼比特流譯碼為原子參數(shù)并將原子信息組合起來形成殘余圖像的重建流,重建殘余圖像,然后殘余圖像與運(yùn)動(dòng)補(bǔ)償圖像組合形成重建視頻流。
本發(fā)明是將運(yùn)動(dòng)殘余圖像編碼的方法,該方法包括步驟利用改進(jìn)的匹配跟蹤算法在超完備基空間形成殘余圖像的原子分解;選擇模量化器;將原子位置圖、模以及所選基的索引編碼。本發(fā)明還提供將利用以上編碼方法編碼的殘余信號解碼的方法。
圖1圖解了視頻壓縮裝置10所執(zhí)行的相關(guān)處理,視頻壓縮裝置10利用了根據(jù)本發(fā)明的一個(gè)實(shí)施方案的殘余圖像編碼器20。視頻幀最初由運(yùn)動(dòng)估計(jì)器30處理,運(yùn)動(dòng)估計(jì)器30將當(dāng)前幀與一個(gè)或兩個(gè)參考幀進(jìn)行比較。在大多數(shù)情況下,在相繼幀中,視頻中的物體會改變它們的位置,而背景保持不變。因?yàn)閰⒖紟驯粋鬏斀o視頻解碼器12,所以參考幀中的一些區(qū)域可用來構(gòu)造當(dāng)前幀。運(yùn)動(dòng)估計(jì)器30識別參考幀內(nèi)那些與當(dāng)前幀內(nèi)的區(qū)域類似的區(qū)域。運(yùn)動(dòng)補(bǔ)償器32產(chǎn)生那些相似區(qū)域的差,并將它們組合成運(yùn)動(dòng)殘余圖像。相似區(qū)域之間的位置關(guān)系用運(yùn)動(dòng)矢量表示,運(yùn)動(dòng)矢量由運(yùn)動(dòng)矢量編碼器34處理。首先原子分解器40處理殘余圖像,然后原子編碼器42壓縮所得的原子。編碼運(yùn)動(dòng)矢量和原子由多路復(fù)用器22組合成一個(gè)比特流。壓縮視頻由裝置24傳輸或存儲起來,裝置24可將壓縮格式的視頻輸送給視頻解碼器12。
圖1的下部圖解了解碼器12,其中多路分解器26分離壓縮視頻信號,將相應(yīng)的比特分別發(fā)送給運(yùn)動(dòng)矢量解碼器36和殘余圖像解碼器28。運(yùn)動(dòng)重建器38根據(jù)參考幀和運(yùn)動(dòng)矢量生成預(yù)測幀。殘余圖像解碼器28重建殘余圖像。這兩個(gè)信號,即預(yù)測幀和殘余幀,相加產(chǎn)生最終的重建視頻幀。
圖2是Y彩色通道的運(yùn)動(dòng)殘余圖像的例子。原始?xì)堄鄨D像既有正值又有負(fù)值。為了將殘余圖像適當(dāng)?shù)仫@示為256級灰度圖像,將殘余圖像中的像素值進(jìn)行平移和縮放(scaled)使得純灰表示零,黑色和白色分別表示負(fù)值和正值。例如,殘余圖像包括若干個(gè)高能量區(qū)域,這若干個(gè)高能量區(qū)域?qū)?yīng)視頻中物體的運(yùn)動(dòng)。
大多數(shù)信號壓縮技術(shù)通過不同類型的數(shù)學(xué)變換將原始數(shù)據(jù)變換成某種更緊湊的格式。一些數(shù)學(xué)變換,如DCT和DWT等,利用完備基,完備基形成一個(gè)可逆變換矩陣。最近,超完備基和相關(guān)的變換算法受到了相當(dāng)?shù)淖⒁狻3陚浠值渲谢臄?shù)量比原始數(shù)據(jù)的維大得多。超完備基的好處是變換系數(shù)在表示原始信號中的真實(shí)特征方面更有效。有許多種數(shù)學(xué)方法可為不同的信號建立基字典。已經(jīng)設(shè)計(jì)了幾種針對視頻運(yùn)動(dòng)殘余圖像的字典,并已證實(shí)它們很好地包含了殘余圖像中的特征。例如,基于可分加博函數(shù)(separable Gabor function)的基字典由Neff和Zakhor在“Very Low Bit Rate Video Coding Based on MatchingPursuits”,IEEE Transactions on Circuits and Systems for VideoTechnology,1997年2月,158-171,一文中進(jìn)行了描述,基于Haar函數(shù)的基字典由Vleeschouwer和Macq在“New dictionaries formatching pursuit video coding”,Proc.of the 1998 InternationalConference on Image Processing,第1卷,764-768,中進(jìn)行了描述。圖3是包含16個(gè)基的簡單示例字典。任何上述字典都可用于本發(fā)明。特別注意上面提及的加博字典,其中明確提到了400個(gè)2D函數(shù)。然而,因?yàn)檫@400個(gè)2D函數(shù)中的每一個(gè)都可放在圖像內(nèi)的所有可能位置上,所以它實(shí)際上隱含地包括許多基結(jié)構(gòu)。若利用176×144像素的幀尺寸,則意味著該字典實(shí)際上包括400×176×144=5.7百萬個(gè)基結(jié)構(gòu)—這使得該字典是高度超完備的。若直接利用由S.Mallat和Z.Zhang在“MatchingPursuits With Time-Frequency Dictionaries”,IEEE Transaction inSignal Processing,第41卷,第12期,1993年12月,一文中描述的“匹配跟蹤算法”進(jìn)行變換,將需要極其大量的計(jì)算來確定變換系數(shù)。Zakhor和Neff為發(fā)明人的、美國專利No.5,699,121中的用于視頻壓縮的匹配跟蹤雖然減輕了計(jì)算負(fù)擔(dān),但計(jì)算上仍是昂貴的。本發(fā)明提供了一種基于總(general)字典變換殘余圖像的方法以及一種將變換系數(shù)編碼的方法,前者由原子分解器40執(zhí)行,后者由原子編碼器42執(zhí)行。
在圖4中將根據(jù)一個(gè)實(shí)施方案詳盡描述原子分解器40的操作。原子分解器40執(zhí)行的第一步(塊61)是搜尋起始搜索區(qū)域。這一步利用殘余能量分割算法(RESA)實(shí)現(xiàn),其中RESA的一個(gè)實(shí)施方案在圖5中示出。RESA基于總區(qū)域生長思想。它首先選擇一個(gè)2×2區(qū)塊作為區(qū)域生長的起始點(diǎn)(塊70)。這步需要將殘余圖像分成16×16個(gè)區(qū)塊,如圖6所示。計(jì)算每個(gè)區(qū)塊的能量,即所有像素強(qiáng)度的平方和,并將具有最高能量的區(qū)塊識別為例如圖6中示出的區(qū)塊71。進(jìn)一步將區(qū)塊71分成4個(gè)8×8子區(qū)塊,并識別出具有最高能量的子區(qū)塊72。在該8×8子區(qū)塊72內(nèi),識別出能量最高的2×2區(qū)塊73,其中這個(gè)區(qū)塊將被用作區(qū)域生長的起始點(diǎn)。
RESA的下一步(圖5中示出的塊74)是檢查位于當(dāng)前區(qū)域左側(cè)的2×2區(qū)塊。圖7圖解了RESA的這一步驟。將閾值動(dòng)態(tài)計(jì)算為T=AE*max(7-AU,5)/10其中,AU是起始區(qū)塊左側(cè)已累加區(qū)塊的數(shù)量,AE是當(dāng)前區(qū)域的每2×2區(qū)塊的平均能量。如果所檢查的2×2區(qū)塊的能量大于當(dāng)前閾值,則將所測試的2×2區(qū)塊與當(dāng)前區(qū)域合并在一起,形成一個(gè)更大的新當(dāng)前區(qū)域。否則,找到了這一側(cè)的停止點(diǎn),而不將區(qū)塊合并在一起。以一種類似的對稱方式,檢查位于當(dāng)前區(qū)域右側(cè)的2×2區(qū)塊。首先在左側(cè)繼續(xù)生長,然后在右側(cè)繼續(xù)生長,直到找到兩側(cè)的停止點(diǎn)或者矩形寬度達(dá)到32(無論哪種情形先出現(xiàn))。完成這步之后,會形成水平帶矩形75,其中帶的尺寸為2*2m,1<=m<=16。
RESA的最后一步(圖5中的塊76)是以帶75為基礎(chǔ)垂直地生長區(qū)域,如圖8所示。假設(shè)帶75的寬度是W。結(jié)合閾值,考慮當(dāng)前區(qū)域上方的2*W帶矩形Ts=AEs*max(7-AUs,5)/10其中AUs是已累加在起始帶上方的2*W矩形的數(shù)量,AEs是包含在當(dāng)前區(qū)域中的每2*W矩形的平均能量。如果所測試的2*W矩形具有的能量大于閾值,則將其合并到當(dāng)前區(qū)域中。否則,找到了這一側(cè)的停止點(diǎn)。以一種類似的對稱方式,檢查位于當(dāng)前區(qū)域下方的2*W矩形。首先在上方繼續(xù)生長,然后在下方繼續(xù)生長,直到找到兩側(cè)的停止點(diǎn)或者當(dāng)前區(qū)域的高度達(dá)到32(無論哪種情形先出現(xiàn))。最后,我們得到矩形77,其尺寸為2n*2m,1<=n,m<=16。
再參照圖4,其圖解了從給定字典中搜尋最接近匹配基的過程(塊62)。基與殘余圖像之間的匹配度用它們的內(nèi)積的絕對值(模)表示,該模稱為原子模,其中大的模表示良好匹配。確定該模的過程需要計(jì)算許多次內(nèi)積,以及選擇具有最大模的內(nèi)積作為當(dāng)前原子。這個(gè)過程可能是匹配跟蹤算法中最慢的部分。在經(jīng)典匹配跟蹤算法中,需要通過計(jì)算殘余圖像與字典中數(shù)百萬個(gè)元素中每一個(gè)元素之間的內(nèi)積來確定模。在現(xiàn)有技術(shù)中,例如,簡單地選擇殘余圖像中具有最高能量的16*16區(qū)塊作為起始搜索區(qū)域—每個(gè)基結(jié)構(gòu)以所選區(qū)塊中的各個(gè)位置為中心,計(jì)算基結(jié)構(gòu)與對應(yīng)的殘余區(qū)域之間的內(nèi)積。對具有400個(gè)基的字典來說,這個(gè)過程需要進(jìn)行256×400=102400次內(nèi)積計(jì)算。圖9圖解了根據(jù)本發(fā)明的新匹配跟蹤過程。
圖8中作為結(jié)果產(chǎn)生的RESA矩形為高能量特征的形狀提供初始估計(jì)。它用來過濾掉字典中形狀與RESA矩形大不相同的基。然后形成匹配基候選子集(塊80)。假定矩形77的寬度和高度分別為w和h,則形成的子字典包含形狀分別由width(寬度)和height(高度)規(guī)定時(shí)滿足以下條件的所有基w-tw1<=width<=w+tw2且h-th1<=height<=h+th2其中tw1、tw2、th1和th2為被設(shè)置用以限制基尺寸的值。這些值可根據(jù)字典結(jié)構(gòu)進(jìn)行變化和調(diào)整。被測試基的最大和最小尺寸在圖10中用矩形90和91示出。例如,區(qū)塊B80是包含四個(gè)基的簡單子字典的例子。
RESA還能估計(jì)殘余圖像中高能量特征所在的位置。圍繞RESA矩形77的中心選擇匹配基的位置候選(塊81)。圖10示出了小矩形92,其中心與RESA矩形77的中心相同。假設(shè)矩形92中的所有像素都將充當(dāng)被測試殘余圖像的中心。圖10中的矩形94是一個(gè)以點(diǎn)93或矩形92的左上角為中心的例子。假設(shè)矩形92的寬度(ws)和高度(hs)可隨RESA矩形77變化。關(guān)系為ws=2*min(w/2+1,6)且hs=2*min(h/2+1,6)在一種實(shí)現(xiàn)方法中,矩形92的尺寸可通過其他準(zhǔn)則確定或者簡單地是固定的。基本思想是良好匹配位于RESA矩形77的中心附近。而且,矩形92內(nèi)已經(jīng)包含原子的中心的所有位置都不會被考慮用于任何新原子。圖10中的點(diǎn)95就是一個(gè)例子。應(yīng)該注意到,現(xiàn)有技術(shù)沒有施加這樣的限制。這種限制的思想是如果一個(gè)原子提供了良好擬合,它理應(yīng)移走圍繞其中心的能量而不會在它的邊界上引入過多額外能量。同樣地,不期望匹配跟蹤算法回到同樣的位置產(chǎn)生第二原子。這一強(qiáng)迫無位置重復(fù)的限制幾乎對編碼性能沒有影響,并能使原子位置信息的編碼更簡單。
下一個(gè)處理步驟(圖9的塊89)稱為用于殘余匹配跟蹤的逐次消除算法(PEA)。它與用來形成測試基子字典和測試位置集的方法無關(guān)。例如,如果子字典是整個(gè)字典且位置候選集是包括整個(gè)殘余圖像的候選集,PEA將仍然起作用。PEA是一種更有效地搜尋最接近匹配基的方法,其通過從考慮項(xiàng)中逐次地去掉比較候選進(jìn)行搜尋。這與經(jīng)典匹配跟蹤形成對照,經(jīng)典匹配跟蹤是在所有可能位置比較所有基候選。首先,將最大模Mm設(shè)為零(塊82)。接下來,考慮基b(k,1)(塊83),其中k和1表示2D基函數(shù)的寬度和高度。在殘余圖像中以一個(gè)位置候選為中心形成相同尺寸的區(qū)域r(k,1,p)。塊85將r(k,1,p)的能量||r(k,1,p)||與當(dāng)前最大模(Mm)進(jìn)行比較以確定是否需要計(jì)算r(k,1,p)與b(k,1)之間的內(nèi)積。為了解釋這一操作,回憶一下數(shù)學(xué)三角不等式|<r(k,1,p),b(k,1)>|<=||r(k,1,p)||||b(k,1)||匹配跟蹤的目的是找到最大值|<r(k,1,p),b(k,1)>|。假定當(dāng)前最大模是Mm。如果,對于位置p處的基b(k,1),對應(yīng)的殘余r(k,1,p)滿足||r(k,1,p)||||b(k,1)||<=Mm,則|<r(k,1,p),b(k,1)>|<=||r(k,1,p)||||b(k,1)||<=Mm在這種情況下,沒有必要計(jì)算內(nèi)積<r(k,1,p),b(k,1)>,并將區(qū)域r(k,1,p)移到下一個(gè)位置?;鵿|b(k,1)||的范數(shù)(norm)可事先計(jì)算(實(shí)際上大多數(shù)基都是歸一化的,即||b(k,1)||=1),這一測試的唯一開銷是計(jì)算r(k,1,p)的能量。確定||r(k,1,p)||的有效算法在下面描述。
假設(shè)有n個(gè)大小不同的基高度{v1,v2,…,vn}和m個(gè)大小不同的基寬度{h1,h2,…,hm},它們遞增排列。搜索矩形尺寸為hs*ws,搜索矩形的左上點(diǎn)為p(x,y)。通過以下四步可計(jì)算hs*ws*n*m個(gè)能量值。
步驟1計(jì)算s=hm+k列的能量(圖11示出了列的例子)。這些列的中心位于(x-hm/2+i,y),i=0,1,2,…,s-1。它們的高度為v1。它們的能量表示為C1,0(0),C1,1(0),…,C1,s(0),計(jì)算如下C1,i(0)=e(x-hm/2+i,y-v1/2)+…+e(x-hm/2+i,y)+…+e(x-hm/2+i,y+v1/2)其中e(x,y)表示位置(x,y)處像素的能量。
可計(jì)算具有與上面的帶相同的坐標(biāo)和長度v2的下一個(gè)s列的能量C2,i(0)=C1,i(0)+Extra(v2-v1)Pixels Energy,i=1,2,…,s一般地,我們得到Cj,i(0)=Cj-1,i(0)+Extra(vj-v(j-1))Pixels Energy,i=1,2,…,s;j=1,2,…,n步驟2計(jì)算相對步驟1中的列垂直平移的列的能量,如下Cj,i(a)=Cj,i(a-1)+e(x-hm/2+i,y-v1/2+a-1)+e(x-hm/2+i,y+v1/2+a),a=1,…,hs其中a表示與y對應(yīng)的垂直平移量。
步驟3計(jì)算具有高度vj,(j=1,…,n)、寬度h1,h2,…,hm以及中心(x,y+a),(v=0,1,…,hs)的區(qū)域的能量,如下Sj,1(0,a)=Cj,(hm-h1)/2(a)+…+Cj,hm/2(a)+…+Cj,(hm+h1)/2(a)Sj,2(0,a)=Sj,1(0,a)+Extra(h2-h1)columns’energy一般地,Sj,i(0,a)=Sj,i-1(0,a)+Extra(hi-h(i-1))columns’energy,i=1,…,m步驟4計(jì)算具有垂直基長度vj,(j=1,…,n)、水平基長度hi,(i=1,…,m)以及中心(x+b,y+a),(b=1,…,ws且a=1,…,hs)的第一區(qū)域集的能量,如下Sj,i(b,a)=Sj,i(b-1,a)-Cj,(hm-hi)/2+b-1(a)+Cj,(hm+hi)/2+b(a)最大??稍谄ヅ涓欉^程中連續(xù)更新;這能逐次地限制搜索空間。若干個(gè)基可能具有相同的尺寸,因而一次能量計(jì)算可避免若干次內(nèi)積計(jì)算。PEA的性能還與多快找到良好匹配(未必是最好匹配)有關(guān)。因?yàn)榇髤^(qū)域總是包含較多能量,所以首先測試較大尺寸的基。
如果||r(k,1,p)|1>Mm,則執(zhí)行塊86以計(jì)算r(k,1,p)與b(k,1)之間的內(nèi)積(p)。塊87將p的絕對值與當(dāng)前最大模Mm進(jìn)行比較。如果|p|>Mm,則將新Mm設(shè)為|p|,并記錄對應(yīng)的基索引和位置。不管怎樣,我們始終返回塊84直到檢查完所有搜索位置。然后,重復(fù)運(yùn)行塊83-塊88,直到測試完所有基候選。最后,產(chǎn)生一個(gè)原子,該原子包括三個(gè)參數(shù)1.字典中給出最好匹配的基的索引;2.用(x,y)坐標(biāo)表示的最好匹配在殘余圖像中的位置;以及,3.基與殘余圖像之間的內(nèi)積(p)。圖12示出了殘余圖像上一個(gè)原子的例子。
再參照圖4,找到原子之后的步驟是記錄原子參數(shù)(塊63)。注意到,在這個(gè)階段,不對原子的模進(jìn)行量化。決策塊64將決定何時(shí)開始進(jìn)行原子量化。它的操作取決于視頻壓縮系統(tǒng)所定義的比率(rate)控制目標(biāo)。如果壓縮率是固定的,則塊64將檢查是否還有比特可用于更多原子。因?yàn)樯形赐瓿蓪?shí)際編碼,所以必須估計(jì)編碼當(dāng)前原子所用的比特。設(shè)“Bip”表示用于編碼基索引和位置的平均比特,“Bm(i)”表示第i個(gè)原子的模不量化所用的實(shí)際比特。若為內(nèi)積(p)的符號分配一個(gè)比特,則估計(jì)n個(gè)原子所用的比特為Used Bits=n*(Bip+1)+∑(Bm(1)+Bm(2)+…+Bm(n))其中“Bip”根據(jù)第一殘余幀的經(jīng)驗(yàn)數(shù)據(jù)進(jìn)行初始化,并將其設(shè)為最近(last)幀的實(shí)際值。每個(gè)模的Bm(i)可以是精確已知的。一個(gè)重要事實(shí)是隨后模將被量化,并會導(dǎo)致待使用的比特比當(dāng)前估計(jì)的少。因而,在這個(gè)階段,原子數(shù)一般比能編碼的原子少。如果視頻系統(tǒng)希望達(dá)到一定的質(zhì)量,該質(zhì)量由編碼殘余圖像與實(shí)際殘余圖像相比的均方差(MSE)定義,則塊64將達(dá)到的當(dāng)前MSE與MSE目標(biāo)進(jìn)行比較。引入一個(gè)原子后,根據(jù)以下等式更新MSEMSE(n)=MSE(n-1)-p(n)*p(n)其中MSE(n)表示使用n個(gè)原子后的MSE,p(n)表示第n個(gè)原子的內(nèi)積。最初,將MSE或MSE(0)設(shè)為原始?xì)堄鄨D像的能量。進(jìn)行量化后,MSE(n)很可能增加,因此將不再滿足MSE目標(biāo)??傊绻斜忍乜捎没蛘呱形催_(dá)到質(zhì)量目標(biāo),則基于當(dāng)前原子更新殘余圖像(塊65),接著在塊61重新開始以搜索另一個(gè)原子。否則,如果實(shí)現(xiàn)了比特或質(zhì)量目標(biāo),則執(zhí)行塊66進(jìn)行量化設(shè)計(jì)。殘余圖像更新,標(biāo)準(zhǔn)匹配跟蹤算法的一個(gè)步驟,可在數(shù)學(xué)上描述為r(k,1,p)=r(k,1,p)-p(n)*b(k,1)當(dāng)前原子未覆蓋的所有區(qū)域?qū)⒉桓淖儭?br>
量化器的設(shè)計(jì)(塊66)基于到目前為止找到的最小模(Minm)值進(jìn)行。量化步長(QS)設(shè)為 利用上面的QS以一種簡單的中等讀數(shù)(mid-read)標(biāo)量量化方案,對到目前為止找到的所有原子進(jìn)行量化。接下來,根據(jù)現(xiàn)在的原子模量化列表再更新殘余圖像67。假定量化前后的原子系數(shù)分別為p(i)、q(i),(i=1,2,…,n)。假定對應(yīng)的基為b(i),(i=1,2,…,n)。引入n個(gè)未量化原子之后的殘余圖像是E(n)=(0riginal Residual)-p(1)b(1)-p(2)b(2)-…-p(n)b(n)它的能量||E(n)||也是已知的。有兩種方法計(jì)算量化后的殘余能量。第一種方法是簡單地將量化后的殘余圖像計(jì)算為EQ(n)=(0riginal Residual)-q(1)b(1)-q(2)b(2)-…-q(n)b(n)另一種方法是遞歸地更新殘余圖像。假定p(i)的量化誤差是Δp(i)。那么,僅p(n)被量化時(shí)的殘余圖像是EQ(1)=E(n)-Δp(n)b(n)且||EQ(1)||=||E(n)||+Δp(n)*Δp(n)-2Δp(n)<E(n),b(n)>p(n)和p(n-1)被量化時(shí)的殘余變?yōu)镋Q(2)=EQ(1)-Δp(n-1)g(n-1)這一關(guān)系是真正遞歸的,可寫作EQ(i)=EQ(i-1)-Δp(n-i+1)g(n-i+1),i=l,2,…,n,EQ(0)=E(n)對應(yīng)的能量為||EQ(i)||=||EQ(i-1)||+Δp(n-i+1)Δp(n-i+1)-2*Δp(n-i+1)<EQ(i-1),g(n-i+1)>最后,我們將得到EQ(n)和||EQ(n)||,這是進(jìn)一步搜尋原子的起始點(diǎn)。重要的是,原子列表可以任何順序進(jìn)行遞歸更新—不需按找到原子的順序進(jìn)行更新。
因?yàn)樵拥哪R驯涣炕?,現(xiàn)在為達(dá)到比率控制或質(zhì)量目標(biāo)更多原子將是必要的。因此,執(zhí)行塊68以找到附加原子。過程與塊61-63相同。不過,在這個(gè)階段,原子模將立即被量化?,F(xiàn)在,我們需要處理模小于(QS-QS/4)的原子,而不是通過將它們的量化值設(shè)為零而不顯示(throw out)它們。所使用的方案如下1.如果原子模大于(QS-QS/4),則量化器在使用QS;2.否則,如果原子模大于(QS/2-QS/8),則將其量化為值QS/2;3.否則,如果原子模大于(QS/4-QS/16),則將其量化為值QS/4;4.否則,如果原子模大于(QS/8-QS/32),則將其量化為值QS/8。
實(shí)際上,一般來說,向下有三個(gè)層次就足夠了,不過可使用更多個(gè)層次。
執(zhí)行塊68后,執(zhí)行實(shí)際比率控制邏輯單元(塊69)。在這個(gè)階段,因?yàn)閷υ舆M(jìn)行環(huán)內(nèi)量化,所以可估計(jì)達(dá)到的質(zhì)量或使用的實(shí)際比特?cái)?shù)。當(dāng)達(dá)到壓縮目標(biāo)時(shí),系統(tǒng)將進(jìn)入原子編碼器42。否則,將基于量化原子模更新殘余圖像,并且系統(tǒng)將返回塊68以搜尋下一個(gè)原子。對于彩色視頻,殘余圖像包括幾個(gè)通道,即Y、U和V通道。將針對每個(gè)通道獨(dú)立使用原子分解器40。用這種方案,每個(gè)通道可具有它自己的比特預(yù)算或期望質(zhì)量目標(biāo)。有一些比特分配方法,可用來為不同通道分配比特預(yù)算。
所有原子被傳給原子編碼器42供以壓縮形式輸出。本發(fā)明將每個(gè)通道的原子分布看作雙值(bi-value)圖,如圖13所示。黑色像素代表其相應(yīng)位置的原子,白色像素代表其所在的位置沒有原子??墒褂妙愃扑牟鏄涞募夹g(shù)將包含原子的位置編碼,不過,容易理解的是,也可使用其他技術(shù)進(jìn)行編碼。在編碼原子位置信息之后,可利用例如可變長度編碼將每個(gè)原子的其他參數(shù)編碼,不過,如本領(lǐng)域的技術(shù)人員所知曉的,也可使用其他編碼方法進(jìn)行。原子參數(shù)信號的編碼過程在圖14中示出,下面將作更詳細(xì)的描述。
原子編碼的第一步是將整個(gè)原子圖分解成,例如,圖13所示的n*n區(qū)塊(塊101)。值n可為16(對于Y通道)或8(對于U和V通道)。對于每個(gè)n*n區(qū)塊,如果區(qū)塊中沒有原子,則輸出零比特;否則,輸出1比特,并進(jìn)一步處理該區(qū)塊以將原子定位(locate)到解碼器中。四叉樹分解過程供該目的使用,歸納為以下四步步驟1.用一個(gè)元素-n*n區(qū)塊本身,將原子區(qū)塊列表(LAB)初始化。
步驟2.從LAB中挑選一個(gè)元素e。如果e的尺寸是1*1,則輸出除位置以外的所有原子參數(shù)即基索引、模和e的內(nèi)積符號,然后進(jìn)行步驟4;否則,進(jìn)行步驟3。
步驟3.輸出e的四個(gè)子區(qū)塊的原子模式比特a1a2a3a4,其中如果對應(yīng)的子區(qū)塊中有原子,則ai(i=1,2,3,4)為1,否則為零。將所有ai值等于1的子區(qū)塊i放到LAB的末尾,回到步驟2。
步驟4.檢查LAB是否為空。如果非空,則返回步驟2;否則結(jié)束所述一個(gè)n*n區(qū)塊的編碼。
基索引和原子??衫每勺冮L度編碼器進(jìn)行編碼以節(jié)省比特,因?yàn)檫@些信號參數(shù)可能不是均勻分布的。通過用0/1比特?cái)?shù)據(jù)記錄分解過程,可對原子位置信息進(jìn)行隱含編碼??衫每勺冮L度編碼方法來編碼四個(gè)子區(qū)塊的原子模式比特a1a2a3a4。原子模式比特a1a2a3a4有15種模式,其中應(yīng)該注意到0000是不可能的。然而,有些模式,如1000等,發(fā)生的概率比其他模式高。不同模式的概率可通過實(shí)驗(yàn)進(jìn)行估計(jì),并用來創(chuàng)建可變長度表設(shè)計(jì)。此外,應(yīng)該注意到,對于不同的通道和不同的原子密度,概率分布是可變的。因此,可使用多個(gè)表,并可首先將區(qū)塊的類別信息編碼以使解碼器知曉應(yīng)該用哪個(gè)表進(jìn)行解碼。
圖15圖解了原子解碼器46,其執(zhí)行的操作與原子編碼器42所執(zhí)行的操作相反。首先,原子解碼器46接收一個(gè)表示當(dāng)前n*n區(qū)塊的狀態(tài)的比特。如果值為1,則通過對稱的四叉樹分解過程進(jìn)行處理。最初,將n*n區(qū)塊分成四個(gè)子區(qū)塊。利用逆向可變長度編碼(VLC),將四個(gè)子區(qū)塊的原子模式比特解碼。然后,將所有值為1的子區(qū)塊放到原子區(qū)塊表(LAB)中。通過遞歸地分解LAB中的每個(gè)元素并獲得其原子模式比特,動(dòng)態(tài)更新LAB。如果來自LAB的元素是1*1區(qū)塊,則應(yīng)利用逆向VLC表將原子基索引和模解碼;然后,應(yīng)寫入表示內(nèi)積符號的比特。如果LAB變空,則原子編碼器結(jié)束對一個(gè)n*n區(qū)塊的解碼。
然后將解碼原子參數(shù)信號傳給殘余重建器48,其利用經(jīng)典匹配跟蹤方法逐個(gè)通道地形成殘余圖像。最初,將殘余圖像中的所有像素設(shè)為零。然后,利用如下過程將各個(gè)原子逐個(gè)累加設(shè)q(i)和b(i,k,1)分別表示第i個(gè)原子系數(shù)和對應(yīng)的2D基矩陣。如果(x(i),y(i))表示第i個(gè)原子的位置,則在位置(x(i),y(i))處將矩陣q(i)*b(i,k,1)增加到目前為止所構(gòu)造的殘余圖像中,以得到新的當(dāng)前殘余圖像。重復(fù)該過程直到累加了該通道的所有原子。一旦各個(gè)通道被分解完,該過程就結(jié)束,殘余圖像得以被重建。
那些熟悉先前基于匹配跟蹤的視頻編碼技術(shù)的人將會認(rèn)識到與本發(fā)明的方法有關(guān)的許多優(yōu)點(diǎn)。通過更準(zhǔn)確的能量區(qū)域估計(jì)過程和逐次候選消除算法,加快了基于超完備基空間的原子分解過程。原子模量化器設(shè)計(jì)是利用原子分解方案進(jìn)行無縫選擇得到的,而早先的技術(shù)在變換開始之前就規(guī)定了量化器。最后,因?yàn)榻柚l(fā)明的基于四叉樹的分解方案利用了原子之間的空間關(guān)系,所以原子編碼過程更有效。特別是,現(xiàn)有技術(shù)將所有原子收集到一個(gè)1D列表中,從而使得與本發(fā)明相比,更難將它們有效編碼。
既然這樣描述了本發(fā)明的實(shí)施方式,顯然所述實(shí)施方式可以多種方式進(jìn)行改變。這樣的變更不被視為脫離本發(fā)明的精神和范圍,并且旨在所有這些對本領(lǐng)域的技術(shù)人員而言明顯的變型都落入以下權(quán)利要求的范圍內(nèi)。
權(quán)利要求
1.一種利用來自過完備庫的基函數(shù)將殘余圖像編碼的方法,所述方法包括步驟a)獲得殘余圖像,所述殘余圖像具有尺寸和能量;以及,b)將所述殘余圖像分解成一個(gè)單原子或多原子列表,每個(gè)原子代表來自過完備庫的一個(gè)基函數(shù),所述將所述殘余圖像分解的步驟包括步驟(i)利用殘余能量分割算法,識別殘余圖像中的替換區(qū)域供用原子表示;(ii)建立來自過完備庫的基函數(shù)子集,子集中的每個(gè)基函數(shù)在預(yù)定閾值內(nèi)與替換區(qū)域匹配;(iii)識別基函數(shù)子集內(nèi)的原子,所述原子用于表示替換區(qū)域,并且所述原子具有參數(shù);(iv)量化所述原子,并將原子的參數(shù)調(diào)整成一種適于編碼的形式;(v)將所述量化原子編碼,從殘余圖像中的替換區(qū)域中減去所述原子,從而減小殘余圖像的能量并利用基于四叉樹的原子編碼器減小殘余圖像的尺寸;以及,(vi)將殘余圖像的減小尺寸或殘余圖像的減小能量與預(yù)定標(biāo)準(zhǔn)比較,并重復(fù)步驟(i)-(vi)直到達(dá)到預(yù)定標(biāo)準(zhǔn);從而將所述殘余圖像編碼并將其尺寸減小到預(yù)定水平。
2.如權(quán)利要求1所述的方法,其特征在于,識別基函數(shù)子集內(nèi)的原子的步驟是利用逐次消除算法進(jìn)行的。
3.如權(quán)利要求1所述的方法,其特征在于,識別替換區(qū)域的步驟包括生成RESA矩形。
4.如權(quán)利要求3所述的方法,其特征在于,識別替換區(qū)域的步驟包括識別殘余圖像內(nèi)具有最高能量的起始區(qū)域和自該起始區(qū)域生長RESA矩形。
5.如權(quán)利要求1所述的方法,其特征在于,識別基函數(shù)子集內(nèi)的原子的步驟包括確定基函數(shù)與替換區(qū)域之間的內(nèi)積,其中內(nèi)積的最大絕對值表示最好匹配。
6.如權(quán)利要求3所述的方法,其特征在于,將RESA矩形與過完備庫內(nèi)的基函數(shù)比較,并將足以匹配RESA矩形的基函數(shù)放在基函數(shù)子集中。
7.如權(quán)利要求2所述的方法,其特征在于,逐次消除算法通過將當(dāng)前被評價(jià)的基函數(shù)與前一被評價(jià)的基函數(shù)比較,從基函數(shù)子集中去掉基函數(shù)。
8.如權(quán)利要求1所述的方法,其特征在于,量化原子的步驟包括基于原子與替換區(qū)域之間的比較確定量化器。
9.如權(quán)利要求1所述的方法,其特征在于,所述預(yù)定標(biāo)準(zhǔn)基于所需比特流尺寸確定。
10.一種利用來自過完備庫的基函數(shù)將殘余圖像編碼的裝置,所述裝置包括a)獲得殘余圖像的裝置,所述殘余圖像具有尺寸和能量;和,b)將所述殘余圖像分解成一個(gè)單原子或多原子列表的裝置,每個(gè)原子代表來自過完備庫的一個(gè)基函數(shù),所述將所述殘余圖像分解的裝置包括(i)利用殘余能量分割算法、識別殘余圖像中的替換區(qū)域供用原子表示的裝置;(ii)建立來自過完備庫的基函數(shù)子集的裝置,子集中的每個(gè)基函數(shù)在預(yù)定閾值內(nèi)與替換區(qū)域匹配;(iii)識別基函數(shù)子集內(nèi)的原子的裝置,所述原子用于表示替換區(qū)域,并且所述原子具有參數(shù);(iv)量化所述原子、并將原子的參數(shù)調(diào)整成一種適于編碼的形式的裝置;(v)將所述量化原子編碼、從殘余圖像中的替換區(qū)域中減去所述原子、從而減小殘余圖像的能量并利用基于四叉樹的原子編碼器減小殘余圖像的尺寸的裝置;以及,(vi)將殘余圖像的減小尺寸或殘余圖像的減小能量與預(yù)定標(biāo)準(zhǔn)比較的裝置;從而將所述殘余圖像編碼并將其尺寸減小到預(yù)定水平。
11.一種包括計(jì)算機(jī)可讀介質(zhì)的計(jì)算機(jī)程序產(chǎn)品,計(jì)算機(jī)可讀介質(zhì)具有記錄在其上的計(jì)算機(jī)程序用于執(zhí)行利用來自過完備庫的基函數(shù)將殘余圖像編碼的方法,所述方法包括步驟a)獲得殘余圖像,所述殘余圖像具有尺寸和能量;以及,b)將所述殘余圖像分解成一個(gè)單原子或多原子列表,每個(gè)原子代表來自過完備庫的一個(gè)基函數(shù),所述將所述殘余圖像分解的步驟包括步驟(i)利用殘余能量分割算法,識別殘余圖像中的替換區(qū)域供用原子表示;(ii)建立來自過完備庫的基函數(shù)子集,子集中的每個(gè)基函數(shù)在預(yù)定閾值內(nèi)與替換區(qū)域匹配;(iii)識別基函數(shù)子集內(nèi)的原子,所述原子用于表示替換區(qū)域,并且所述原子具有參數(shù);(iv)量化所述原子,并將原子的參數(shù)調(diào)整成一種適于編碼的形式;(v)將所述量化原子編碼,從殘余圖像中的替換區(qū)域中減去所述原子,從而減小殘余圖像的能量并利用基于四叉樹的原子編碼器減小殘余圖像的尺寸;以及,(vi)將殘余圖像的減小尺寸或殘余圖像的減小能量與預(yù)定標(biāo)準(zhǔn)比較,并重復(fù)步驟(i)-(vi)直到達(dá)到預(yù)定標(biāo)準(zhǔn);從而將所述殘余圖像編碼并將其尺寸減小到預(yù)定水平。
全文摘要
本發(fā)明提供了一種利用改進(jìn)的匹配跟蹤算法、基于超完備基變換壓縮數(shù)字運(yùn)動(dòng)圖像或視頻信號的方法。更具體而言,本發(fā)明的焦點(diǎn)集中在運(yùn)動(dòng)殘余圖像的有效編碼上,運(yùn)動(dòng)殘余圖像是通過運(yùn)動(dòng)估計(jì)和補(bǔ)償過程生成的。殘余能量分割算法(RESA)可用來獲得對殘余圖像中高能量區(qū)域的形狀和位置的初始估計(jì)。逐次消除算法(PEA)可用來減少匹配跟蹤過程中匹配評價(jià)的數(shù)量。RESA和PEA可將編碼器從預(yù)先規(guī)定的過完備基字典中搜尋匹配基的速度加快許多倍。匹配模式的三個(gè)參數(shù)生成一個(gè)原子,該原子定義進(jìn)入字典的索引、所選基的位置以及所選基模式與殘余信號之間的內(nèi)積。本發(fā)明提供了一種利用類似四叉樹的技術(shù)的新原子位置編碼方法和一種新的原子模量化方案。提供了用于量化和位置編碼設(shè)計(jì)的、簡單有效的自適應(yīng)機(jī)制,以使根據(jù)本發(fā)明的系統(tǒng)能在低級介質(zhì)和高比特率情形下正常運(yùn)行。與先前基于匹配跟蹤的視頻編碼器相比,這些新算法成員可使編碼過程更快以及改進(jìn)壓縮性能。
文檔編號G06T9/00GK1802667SQ200480014589
公開日2006年7月12日 申請日期2004年3月29日 優(yōu)先權(quán)日2003年3月28日
發(fā)明者熊億, M·索爾, 王蒙, P·寇特 申請人:數(shù)字加速器公司