專(zhuān)利名稱(chēng):可變塊匹配運(yùn)動(dòng)估算裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及用在圖象信號(hào)編碼系統(tǒng)中的一種運(yùn)動(dòng)估算裝置;更具體地,涉及根據(jù)一種塊匹配算法檢測(cè)一個(gè)可變塊的運(yùn)動(dòng)矢量的一種運(yùn)動(dòng)估算裝置。
當(dāng)用數(shù)字形式表示包含一序列圖象“幀”的一個(gè)圖象信號(hào)時(shí),要生成可觀數(shù)量的數(shù)據(jù)需要傳輸,尤其是在高清晰度電視系統(tǒng)的情況中。然而,由于一條傳統(tǒng)的傳輸信道的可利用的頻帶寬度是有限的,為了通過(guò)該有限的頻帶寬度發(fā)送這些可觀數(shù)量的數(shù)字?jǐn)?shù)據(jù),不可避免地要壓縮或減少傳輸?shù)臄?shù)據(jù)量。在各種視頻壓縮技術(shù)中,一種將兩個(gè)鄰接的視頻幀之間的視頻信號(hào)的時(shí)間冗余用于信號(hào)壓縮的運(yùn)動(dòng)補(bǔ)償幀間編碼技術(shù)是已知的有效壓縮技術(shù)之一。
在運(yùn)動(dòng)補(bǔ)償幀間編碼方案中,當(dāng)前幀數(shù)據(jù)是根據(jù)當(dāng)前與前面幀間的運(yùn)動(dòng)的一種估算從前面幀數(shù)據(jù)中預(yù)測(cè)的。這種估算的運(yùn)動(dòng)可用表示前面與當(dāng)前幀之間的象素的位移的二維運(yùn)動(dòng)矢量來(lái)描述。
本技術(shù)中提出過(guò)的運(yùn)動(dòng)矢量估算方案之一為塊匹配算法。按照塊匹配算法,將一個(gè)當(dāng)前幀分成多個(gè)大小相等的搜索塊。一個(gè)搜索塊的大小通常在8×8與32×32個(gè)象素之間的范圍內(nèi)。為了確定來(lái)自當(dāng)前幀的一個(gè)給定的搜索塊的位移,在當(dāng)前幀的搜索塊與包含在前一幀內(nèi)的一個(gè)通常較大的搜索區(qū)中多個(gè)大小相等的候選塊中的每一個(gè)之間執(zhí)行相似性計(jì)算。在進(jìn)行相似性測(cè)定中,有許多誤差函數(shù)可供利用,諸如MSE(均方誤差)或MAE(平均絕對(duì)誤差)。
按照定義,一個(gè)運(yùn)動(dòng)矢量表示搜索塊與得出一個(gè)最小誤差函數(shù)值的候選塊之間的位移。然后在接收機(jī)中利用該運(yùn)動(dòng)矢量從前一幀中在逐塊的基礎(chǔ)上重構(gòu)一個(gè)畫(huà)面。
在這種逐塊基礎(chǔ)上的運(yùn)動(dòng)估算中,利用大小相等的搜索塊是合意或方便的。有時(shí),在當(dāng)前幀中的若干相鄰的塊上可能有一個(gè)沒(méi)有任何邊線的一個(gè)目標(biāo)的平滑的畫(huà)面模式或者其中只有輕微的邊線。在前一情況中,塊匹配運(yùn)動(dòng)估算可能為各塊得出互相不同的運(yùn)動(dòng)矢量;而在后情況中,可能生成一個(gè)與沒(méi)有邊線的平滑畫(huà)面模式的一運(yùn)動(dòng)矢量相同的運(yùn)動(dòng)矢量。
因此,本發(fā)明的一個(gè)主要目的為提供一種通過(guò)利用一種可變的塊能夠精確地檢測(cè)出一個(gè)運(yùn)動(dòng)矢量的改進(jìn)的運(yùn)動(dòng)估算裝置。
按照本發(fā)明,提供了利用一種塊匹配運(yùn)動(dòng)估算方法檢測(cè)視頻信號(hào)的當(dāng)前幀與前一幀之間的運(yùn)動(dòng)矢量的一種裝置,其中的當(dāng)前幀是分成若干大小相等的搜索塊的,而前一幀則是分成對(duì)應(yīng)數(shù)目的搜索區(qū)的,每一個(gè)搜索區(qū)具有多個(gè)所述相等大小的候選塊,該裝置包括一個(gè)可變塊形成部分,用于從當(dāng)前塊中定義一個(gè)可變搜索塊,所述可變搜索塊是從當(dāng)前幀中沒(méi)有目標(biāo)邊線的一個(gè)平滑畫(huà)面塊的選中的搜索塊擴(kuò)展而成的;以及一個(gè)運(yùn)動(dòng)估算部分,用于相對(duì)于各候選塊估算該可變搜索塊的運(yùn)動(dòng)以提供與之對(duì)應(yīng)的一個(gè)運(yùn)動(dòng)矢量及一個(gè)誤差函數(shù),所述運(yùn)動(dòng)矢量表示該搜索塊與得出最小誤差函數(shù)值的一個(gè)候選塊之間的象素的位移。
從以下結(jié)合附圖給出的較佳實(shí)施例的描述中,本發(fā)明的上述及其它目的與特征將是顯而易見(jiàn)的,附圖中
圖1示出用于按照本發(fā)明的一種運(yùn)動(dòng)估算系統(tǒng)中的可變塊運(yùn)動(dòng)矢量測(cè)定裝置的示意性方框圖;圖2示出圖1中所示的可變塊形成部分的詳細(xì)方框圖;以及圖3A與3B表示說(shuō)明在象素基礎(chǔ)上擴(kuò)展一個(gè)可變塊的示例性圖。
參見(jiàn)圖1,其中示出了包含在一種運(yùn)動(dòng)估算方案中的一種可變塊運(yùn)動(dòng)矢量測(cè)定裝置的一個(gè)較佳實(shí)施例,該方案利用接連的幀,即當(dāng)前幀與其鄰接幀即前一幀,之間的冗余性來(lái)實(shí)現(xiàn)明顯的數(shù)據(jù)壓縮。這便是說(shuō),在當(dāng)前幀與前一幀之間可能存在著由一個(gè)目標(biāo)的位移或運(yùn)動(dòng)引發(fā)的差別;然而,這種差別可以局限在一個(gè)幀內(nèi)的一個(gè)相對(duì)地小的區(qū)域中。因此,沒(méi)有必要將當(dāng)前幀的全部圖象數(shù)據(jù)發(fā)送給一臺(tái)接收機(jī)(未示出)。反之,只要發(fā)送位移信息即運(yùn)動(dòng)矢量便足夠了。然后,接收機(jī)從其圖象數(shù)據(jù)存儲(chǔ)在該接收機(jī)內(nèi)的一個(gè)幀存儲(chǔ)器中的前一幀中,利用這些運(yùn)動(dòng)矢量重構(gòu)當(dāng)前幀。
當(dāng)前幀信號(hào)是通過(guò)一條線路12提供給可變塊形成部分100的。方差檢測(cè)部分100用于將當(dāng)前幀分成若干大小相等的待用于在一個(gè)序列中進(jìn)行塊匹配的搜索塊。在圖3中,總體上作為一個(gè)參照數(shù)字200描繪的當(dāng)前幀示出為具有諸如20個(gè)分開(kāi)的搜索塊S1至S20,各塊包含H×V個(gè)象素。為了說(shuō)明,當(dāng)前幀200中的每一塊象素的H與V兩者都是相等的數(shù)目16。再者,可變塊形成部分100順序地選擇表示當(dāng)前幀內(nèi)不包含目標(biāo)邊線的一個(gè)平滑的畫(huà)面塊的一個(gè)搜索塊,并在逐個(gè)象素的基礎(chǔ)上擴(kuò)充所選擇的搜索塊直到搜索塊的邊界包含一條邊線為止。從圖3B中可見(jiàn),當(dāng)順序選擇了諸如S7與S14這兩個(gè)搜索塊時(shí),便將搜索塊S7與S14分別擴(kuò)展到包含目標(biāo)202與204的一個(gè)邊線部分的邊界E7與E14為止。
將各擴(kuò)展的象素塊順序地提供給若干塊匹配部分41至49。按照本發(fā)明,可為擴(kuò)展的塊計(jì)算一個(gè)方差(variance)來(lái)檢測(cè)是否包含一條邊線,這一點(diǎn)將在下面參照?qǐng)D3進(jìn)一步描述。
圖2示出可變塊形成部分100的詳細(xì)方框圖。為了選擇一個(gè)表示平滑畫(huà)面的搜索塊,可變塊形成部分100通過(guò)一系列塊形成階段(其中只示例性地示出了它們中的三個(gè)111、112與119)將線路12上的當(dāng)前幀分成若干搜索塊,如圖3A中所示。在各塊形成階段111、112與119中,一個(gè)搜索塊在其水平與垂直方向上從步驟1至n每步一個(gè)象素地遞增擴(kuò)展。更具體地,第一塊形成階段111生成H×V個(gè)象素模式的搜索塊;第二塊形成階段112將該搜索塊擴(kuò)展成(H+1)×(V+1)個(gè)象素的模式;而最后一個(gè)塊形成階段119生成(H+n)×(V+n)個(gè)象素模式的搜索塊。由塊形成階段111至119生成與擴(kuò)展的搜索塊被饋送給一個(gè)可變塊選擇器160及一系列方差檢測(cè)器121至129,它們分別計(jì)算這些搜索塊的方差以檢測(cè)其中是否存在邊線。方差檢測(cè)器121至129所計(jì)算的各方差的定義如下var(i,j)=1EH×EVΣi=1EHΣj=1EV(I(i,j)-mean)2]]>其中var(i,j)表示搜索塊中坐標(biāo)(i,j)上的一個(gè)象素的方差;EH×EV為一個(gè)擴(kuò)展塊的大??;I(i,j)為擴(kuò)展塊中坐標(biāo)(i,j)上的一個(gè)象素的亮度級(jí);而mean則表示擴(kuò)展塊中的象素的平均亮度級(jí)。
平均亮度級(jí)的定義如下mean=1EH×EVΣi=1EHΣj=1EVI(i,j)]]>將計(jì)算出的全部方差作用在一個(gè)方差選擇器150上。方差選擇器150將這些方差與一個(gè)預(yù)定的閾值進(jìn)行比較。按照本發(fā)明,該預(yù)定的閾值是選定為具有大于且最接近于表示平滑畫(huà)面的搜索塊的方差的一個(gè)值的。從而,方差選擇器150選擇一個(gè)滿足該閾值的方差,并生成一個(gè)指示該選擇的方差的選擇信號(hào)到可變塊選擇器160。具有一個(gè)傳統(tǒng)的多路復(fù)用器的可變塊選擇器160響應(yīng)這一選擇信號(hào),選擇與所選定的方差對(duì)應(yīng)的搜索塊。然后,將來(lái)自可變塊選擇器160的搜索塊提供給塊匹配部分41至49,如圖1中所示。
參見(jiàn)圖1,此時(shí),通過(guò)一條線路13將存儲(chǔ)在一個(gè)存儲(chǔ)器(未示出)中的前一幀饋送給一個(gè)搜索區(qū)形成部分10。該搜索區(qū)形成部分10以相同的大小、形狀與搜索模式定義一個(gè)前一幀中的通常較大的搜索區(qū),借此進(jìn)行搜索或比較。
在搜索區(qū)形成部分10中確定了搜索區(qū)之后,還將搜索區(qū)數(shù)據(jù)作用在對(duì)應(yīng)數(shù)目的候選塊形成部分上,圖1中只示例性地示出了其中的三個(gè)21、22與29。在各候選塊形成部分中,當(dāng)搜索塊自最左上位置的搜索區(qū)每次水平地移動(dòng)一個(gè)象素位置,然后垂直向下通過(guò)搜索區(qū)每次移動(dòng)一條掃描線,直到最終到達(dá)該搜索區(qū)內(nèi)最右下位置為止時(shí),便從該搜索區(qū)中生成了一塊候選象素。在該確定的搜索區(qū)內(nèi)便形成了具有H×V個(gè)象素大小的所有可能的候選塊。然后推算出對(duì)應(yīng)于由可變塊形成部分100提供的搜索塊的位置的各候選塊的相對(duì)位移,并隨后通過(guò)線路31至39作為該候選塊的一個(gè)運(yùn)動(dòng)矢量提供給一個(gè)多路復(fù)用器60。
還將各候選塊的象素?cái)?shù)據(jù)從各該候選塊形成部分21至29提供給各塊匹配部分41至49。在各該塊匹配部分41至49中,計(jì)算來(lái)自可變塊形成部分100的搜索塊與來(lái)自各該候選塊形成部分21至29的候選塊之間的誤差函數(shù)。傳統(tǒng)地,執(zhí)行搜索塊與候選塊的對(duì)應(yīng)象素之間的亮度級(jí)或光強(qiáng)度的比較,以得出該候選塊的誤差函數(shù)。該誤差函數(shù)表示搜索塊與選擇的候選塊之間的相似程度。
將來(lái)自塊匹配部分41至49的所有誤差函數(shù)作用在一個(gè)最小誤差檢測(cè)器50上。該最小誤差檢測(cè)器50比較這些誤差函數(shù),從中選擇一個(gè)具有最小誤差的誤差函數(shù)。
最小誤差檢測(cè)器50輸出一個(gè)指示與該最小誤差函數(shù)對(duì)應(yīng)的塊的選擇信號(hào)到運(yùn)動(dòng)矢量選擇器60。具有一個(gè)傳統(tǒng)的多路復(fù)用器的運(yùn)動(dòng)矢量選擇器60選擇與最小誤差函數(shù)對(duì)應(yīng)的候選塊的位移矢量。如上所述,如果一個(gè)候選塊具有最小的誤差函數(shù),該候選塊便是最相似于搜索塊的;結(jié)果,便選擇該候選塊的位移矢量作為運(yùn)動(dòng)矢量。
就此而論,將在一臺(tái)發(fā)送機(jī)及一臺(tái)接收機(jī)中執(zhí)行的運(yùn)動(dòng)補(bǔ)償是相對(duì)于該搜索塊而不是擴(kuò)展塊達(dá)到的,后者的主要目的為用來(lái)精確地測(cè)定一個(gè)搜索塊與一個(gè)候選塊之間的一個(gè)運(yùn)動(dòng)位移。
再者,雖然由于這是在本技術(shù)中顯而易見(jiàn)的而未示出或說(shuō)明,應(yīng)能注意到,有關(guān)一個(gè)擴(kuò)展塊的范圍的信息是提供給候選塊形成部分的。
雖然本發(fā)明是參照特定的實(shí)施例展示與描述的,熟悉本技術(shù)的人員將會(huì)理解,可以在不脫離所附權(quán)利要求書(shū)中所定義的本發(fā)明的精神與范圍的條件下,作出許多的改變與修正。
權(quán)利要求
1.一種利用塊匹配運(yùn)動(dòng)估算法檢測(cè)視頻信號(hào)中的一個(gè)當(dāng)前幀與前一幀之間的運(yùn)動(dòng)矢量的裝置,其中該當(dāng)前幀是分成大小相等的若干搜索塊的,而前一幀是分成對(duì)應(yīng)數(shù)目的搜索區(qū)的,各搜索區(qū)具有多個(gè)所述相等大小的候選塊,該裝置包括用于擴(kuò)展當(dāng)前幀內(nèi)的沒(méi)有目標(biāo)邊線的一個(gè)平滑畫(huà)面塊的搜索塊的裝置;以及用于估算擴(kuò)展的搜索塊相對(duì)于各候選塊的運(yùn)動(dòng)以提供與之對(duì)應(yīng)的一個(gè)運(yùn)動(dòng)矢量與一個(gè)誤差函數(shù)的裝置,所述運(yùn)動(dòng)矢量表示該搜索塊與一個(gè)候選塊之間的象素產(chǎn)生最小誤差的位移。
2.權(quán)利要求1的裝置,其中所述搜索塊擴(kuò)展裝置包括用于在逐個(gè)象素的基礎(chǔ)上在水平與垂直方向上擴(kuò)展搜索塊直到該搜索塊的邊界包含一條邊線為止,借此生成一個(gè)擴(kuò)展的搜索塊的裝置;用于推算該擴(kuò)展的塊的方差以檢測(cè)其中存在一條邊線的裝置;用于將各方差與一個(gè)預(yù)定的閾值進(jìn)行比較以選擇一個(gè)小于該預(yù)定的閾值的方差的裝置,其中該預(yù)定的閾值是選擇為具有一個(gè)高于并最接近于該搜索塊的方差的;以及響應(yīng)方差的選擇,用于選擇一個(gè)與之對(duì)應(yīng)的可變擴(kuò)展塊并將其提供給該運(yùn)動(dòng)估算裝置的裝置。
3.權(quán)利要求1的裝置,其中的方差的定義如下(i,j)=1EH×EVΣi=1RHΣj=1EV(I(i,j)-mean)2]]>其中Var(i,j)表示一個(gè)搜索塊中的坐標(biāo)(i,j)上的一個(gè)象素的方差;EH×EV為一個(gè)擴(kuò)展塊的大小;I(i,j)為該擴(kuò)展塊中象素坐標(biāo)(i,j)上的亮度級(jí);而mean則表示該擴(kuò)展塊中的象素的平均亮度級(jí)。
4.權(quán)利要求3的裝置,其中該平均亮度級(jí)的定義如下mean=1EH×EVΣi=1EHΣj=1EVI(i,j)]]>
全文摘要
一種根據(jù)塊匹配運(yùn)動(dòng)估算法檢測(cè)視頻信號(hào)中的一個(gè)當(dāng)前幀與前一幀之間的運(yùn)動(dòng)矢量的裝置,包括一個(gè)可變塊形成部分,用于從當(dāng)前幀中定義一個(gè)可變搜索塊,所述可變搜索塊是從當(dāng)前幀內(nèi)沒(méi)有目標(biāo)邊線的平滑畫(huà)面塊的一個(gè)選擇的搜索塊擴(kuò)展的;以及一個(gè)運(yùn)動(dòng)估算部分,用于估算該可變搜索塊相對(duì)于包含在前一幀中的各候選塊的運(yùn)動(dòng),以提供與之對(duì)應(yīng)的若干運(yùn)動(dòng)矢量及誤差函數(shù),所述運(yùn)動(dòng)矢量表示搜索塊與得出最小誤差函數(shù)的一個(gè)候選塊之間的象素的位移。
文檔編號(hào)H04N7/32GK1127971SQ9510168
公開(kāi)日1996年7月31日 申請(qǐng)日期1995年1月27日 優(yōu)先權(quán)日1995年1月27日
發(fā)明者丁海默 申請(qǐng)人:大宇電子株式會(huì)社