專利名稱:用于在基于分段的編碼系統(tǒng)中檢測運動矢量的方法
技術(shù)領(lǐng)域:
本發(fā)明涉及運動矢量檢測方法,更具體地涉及用于在基于分段的編碼系統(tǒng)中高效地檢測運動矢量的一種改進的運動矢量檢測方法。
在諸如可視電話、電視會議或高清晰度電視等數(shù)字視頻系統(tǒng)中,由于視頻幀信號中的一個視頻行信號包含一序列稱作象素值的數(shù)字數(shù)據(jù),而需要大量的數(shù)字數(shù)據(jù)來定義各視頻幀信號。然而,由于一個傳統(tǒng)的傳輸信道可利用的頻帶寬度是有限的,為了通過它來發(fā)送可觀數(shù)量的數(shù)字數(shù)據(jù),不可避免地要使用各種數(shù)據(jù)壓縮方法來壓縮或減少數(shù)據(jù)量,尤其是在諸如可視電話及電視會議裝置等低比特率視頻編碼解碼系統(tǒng)的情況中。
用在低比特率編碼系統(tǒng)中的這種編碼視頻信號方法之一便是所謂的基于分段的編碼方法。
在基于分段的編碼方法的第一步中,為了更容易地分段圖象而簡化它們。在稱作特征抽取步驟的下一步中,生成與簡化的圖象的均勻區(qū)(即分段的區(qū))內(nèi)部對應(yīng)的標記。一旦得到了標記,便能利用稱作流域算法(watershed algorithm)的高效形態(tài)學(xué)工具找出在特征抽取步驟中檢測到的分段區(qū)的精確輪廓。
然后編碼各分段區(qū)的輪廓與實質(zhì)信息。輪廓信息中包含兩種信息形狀與位置。形狀信息指各輪廓的形式而言,而位置信息則對圖象內(nèi)的各輪廓的位置而言。作為實質(zhì)信息,所編碼的是包含在各分段區(qū)中的象素的平均灰度級。
與此同時,幀間編碼法是壓縮視頻序列中的數(shù)據(jù)的高效編碼方法之一。尤其是,已提出了運動補償?shù)膸g編碼法來改進用于壓縮數(shù)據(jù)傳輸?shù)膱D象編碼的效率。這一方法用于根據(jù)一個當(dāng)前的及一個前一幀之間的運動的估算從前一幀數(shù)據(jù)中預(yù)測當(dāng)前幀數(shù)據(jù)。這一估算的運動可利用表示前一幀與當(dāng)前幀的對應(yīng)象素之間的位移的二維運動矢量來描述。
在傳統(tǒng)的基于分段的編碼技術(shù)中提出過的運動矢量估算法之一便是基于特征點的運動估算法。
在基于特征點的運動估算法中,將一組選定的象素,即特征點的運動矢量發(fā)送到接收機,其中這些特征點定義為能代表一個目標的運動的當(dāng)前幀中的象素,從而在接收機上能從這些特征點的運動矢量中恢復(fù)或逼近當(dāng)前幀中的象素的全體運動矢量。通常,這些特征點是利用已知的網(wǎng)格技術(shù)從一個分段區(qū)的輪廓上的點中選擇的,這種網(wǎng)格技術(shù)采用多種網(wǎng)格之一,諸如矩形網(wǎng)格。這便是,選擇網(wǎng)格與各區(qū)的輪廓的交點作為特征點。并通過采用傳統(tǒng)的塊匹配技術(shù)確定當(dāng)前幀中選定的特征點的運動矢量,其中各該運動矢量表示當(dāng)前幀中的一個特征點與前一幀中一個對應(yīng)的匹配點,即一個最相似的象素,之間的空間位移。具體地,各特征點的匹配點是在前一幀中的一個搜索區(qū)內(nèi)的所有分段區(qū)的輪廓上搜索到的。
然而由于在大多數(shù)情況中,當(dāng)前幀的一個分段區(qū)對應(yīng)于搜索區(qū)內(nèi)的分段區(qū)之一,為了減少與運動估算相關(guān)的計算負擔(dān),不是相對于搜索區(qū)中的所有分段區(qū)都執(zhí)行運動估算,而是最好在搜索區(qū)中選擇一個分段區(qū)作為當(dāng)前幀的分段區(qū)的一個候選區(qū),然后在它們之間執(zhí)行運動估算。
因此,本發(fā)明的主要目的為提供一種用于在一基于分段的編碼系統(tǒng)中高效地檢測運動矢量的改進的運動矢量檢測法。
按照本發(fā)明,提供了一種用于在一個基于分段的編碼系統(tǒng)中檢測一個數(shù)字視頻信號的當(dāng)前幀與前一幀之間的運動矢量的方法,其中該當(dāng)前幀包含多個分段的區(qū)且前一幀包含許多候選區(qū),該方法包括下述步驟(a)為各分段區(qū)生成分段數(shù)據(jù),分段數(shù)據(jù)中包含表示各分段區(qū)的形狀與位置的輪廓信息及表示包含在各分段區(qū)中的所有象素的一個平均灰度級的實質(zhì)信息;(b)為各該候選區(qū)生成候選分段數(shù)據(jù),候選分段數(shù)據(jù)中包含表示各候選區(qū)的形狀與位置的輪廓信息及包含在各候選區(qū)中的所有象素的平均灰度級的實質(zhì)信息;(c)生成一個用于包圍一分段區(qū)的最小尺寸的預(yù)定幾何圖形,以借此生成其尺寸信息;(d)生成一個用于包圍各候選區(qū)的最小尺寸的預(yù)定幾何圖形,以借此生成其尺寸信息;(e)根據(jù)分段區(qū)及各候選區(qū)的分段數(shù)據(jù)與尺寸信息計算分段區(qū)與各候選區(qū)之間的誤差值,借此為該分段區(qū)提供一組誤差值;(f)選擇一個在該組誤差值中產(chǎn)生最小誤差值的候選區(qū)作為與該分段區(qū)具有最接近的相似性的一個搜索區(qū);(g)檢測該分段區(qū)與該搜索區(qū)之間的一個或多個運動矢量;以及(h)為所有分段區(qū)重復(fù)所述步驟(c)至(g)。
從下面結(jié)合附圖給出的較佳實施例的描述中,本發(fā)明的上述及其它目的與特征將是顯而易見的,附圖中
圖1表示按照本發(fā)明的運動矢量檢測器的方框圖;及圖2示出圖1的搜索塊判定部件的詳細方框圖。
參見圖1,其中示出了按照本發(fā)明的運動矢量檢測器的方框圖。該運動矢量檢測器包括一個分段部件100、一個幀存儲器120、一個搜索區(qū)判定部件140及一個運動矢量檢測部件160。
將當(dāng)前幀信號提供給分段部件100與運動矢量檢測部件160。
分段部件100將當(dāng)前幀分段成多個區(qū),而為各該分段區(qū)生成分段數(shù)據(jù),即輪廓與實質(zhì)信息,其中各分段區(qū)的輪廓信息表示所述各分段區(qū)的形狀與位置,而其實質(zhì)信息則表示包含在所述各分段區(qū)中的所有象素的一個平均灰度級值M。響應(yīng)一個控制器(未示出)饋入的第一控制信號,分段部件100在逐個區(qū)的基礎(chǔ)上順序地提供分段數(shù)據(jù)即,將各分段件區(qū)的實質(zhì)信息通過線路L13提供給幀存儲器120及搜索區(qū)判定部件140;并將其輪廓信息經(jīng)由線路L14提供給幀存儲器120、搜索區(qū)判定部件140及運動矢量檢測部件160。
在幀存儲器120處,將來自分段部件100的分段數(shù)據(jù)作為前一幀的候選區(qū)的分段數(shù)據(jù)存儲。并且響應(yīng)該控制器(未示出)饋入的一個第二控制信號,幀存儲器120將候選區(qū)的分段數(shù)據(jù)提供給搜索區(qū)判定部件140,其中,分別通過線路L15與L16提供各候選區(qū)的實質(zhì)與輪廓信息。
搜索區(qū)判定部件140根據(jù)線路L13與L14上的當(dāng)前分段區(qū)的分段數(shù)據(jù)及線路L15與L16上的候選區(qū)的分段數(shù)據(jù)計算一個當(dāng)前分段區(qū)與各候選區(qū)之間的誤差值,并判定一個產(chǎn)生最小誤差值的候選區(qū)作為用于估算當(dāng)前分段區(qū)中的象素的運動矢量的一個搜索區(qū)。下面參照圖2描述搜索區(qū)判定部件140的細節(jié)。
參見圖2,其中詳細展示了圖1中所示的搜索區(qū)判定部件140。搜索區(qū)判定部件140包括圖形構(gòu)成單元210與220、一個誤差值計算部件230、一個比較部件240及一個寄存器250。
圖形構(gòu)成單元210通過線路L14接收當(dāng)前分段區(qū)的輪廓信息且生成一個包圍當(dāng)前分段區(qū)的最小尺寸的預(yù)定的幾何圖形,諸如矩形,借此為其提供圖形信息;并且還為當(dāng)前分段區(qū)生成尺寸信息Ss,其中的圖形信息是用矩形的寬度Ws與高度Hs表示的,而尺寸信息則是由當(dāng)前分段區(qū)中的象素數(shù)目表示的。將圖形信息與尺寸信息饋送到誤差值計算部件230中。
同時,圖形構(gòu)成單元220以圖形構(gòu)成單元210中類似的方式,通過線路L16接收候選區(qū)的輪廓信息并為各候選區(qū)生成一個預(yù)定的幾何圖形,諸如矩形;并向誤差值計算部件230提供各候選區(qū)的圖形與尺寸信息,其中的圖形信息是用各候選區(qū)的一個矩形的寬度Wc與高度Hc表示的,而尺寸信息則由包含在各候選區(qū)中的象素的數(shù)目表示。
在誤差值計算部件230處,根據(jù)線路L13與L15上的實質(zhì)信息以及來自圖形構(gòu)成單元210與220的尺寸、寬度與高度數(shù)據(jù)Ss、Sc、Ws、Wc、Hs、Hc,用下式計算當(dāng)前分段區(qū)與各候選區(qū)之間的誤差值EE=ω1Ds+ω2Dt+ω3Dg其中Ds=|Ss-Sc|,Dt=|Ms-Mc|,Dg=|(Ws-Wc)2+(Hs-Sc)2|,且ω1、ω2與ω3為加權(quán)因子,Ms與Mc分別為當(dāng)前分段區(qū)與各候選區(qū)的實質(zhì)信息。
將如上計算出的誤差值順序地提供給比較部件240。
比較部件240的作用為將一個存儲值與輸入到其中的一個誤差值進行比較。并且比較部件240用輸入誤差值更新存儲值,并且在輸入誤差值小于存儲值時生成一個輸入允許信號。當(dāng)接收到一個第一誤差值時,比較部件240便將第一誤差值與預(yù)先存儲在一個存儲器(未示出)中的誤差值進行比較。預(yù)先存儲的誤差值是一個比任何可能的誤差值都大的數(shù),因此比較部件240該第一誤差值更新預(yù)先存儲的誤差值,并生成輸入允許信號。隨后,在比較部件240處,將誤差值計算部件230新提供的一個誤差值與更新后的誤差值進行比較;如果新誤差值小于更新后的誤差值,比較部件240便用新誤差值更新存儲器并生成輸入允許信號。
在此期間,順序地將候選區(qū)的輪廓信息提供給寄存器250。響應(yīng)從比較部件240饋入的各輸入允許信號,用新接收到的輪廓信息更新寄存器250。
當(dāng)對所有的候選區(qū)完成了當(dāng)前分段區(qū)的上述過程時,控制器(未示出)向寄存器250提供一個輸出允許信號。響應(yīng)該輸出允許信號,寄存器250提供所存儲的輪廓信息作為當(dāng)前分段區(qū)的搜索區(qū)信息。
再參見圖1,將當(dāng)前幀信號及來自存儲器(未示出)的前一幀信號、線路L14上的當(dāng)前分段區(qū)的輪廓信息以及來自搜索區(qū)判定部件140的搜索區(qū)信息饋送到運動矢量檢測部件160。在運動矢量檢測部件160處,用諸如傳統(tǒng)的基于特征點的運動估算技術(shù)在當(dāng)前分段區(qū)與搜索區(qū)之間檢測當(dāng)前分段區(qū)的運動矢量。將檢測到的特征點運動矢量作為當(dāng)前分段區(qū)的運動矢量輸出。
雖然相對于特定的實施例描述了本發(fā)明,但對于熟悉本技術(shù)的人員而言,顯然可以作出各種改變與修正而仍不脫離以下權(quán)利要求中所定義的發(fā)明范圍。
權(quán)利要求
1.一種用于在一個基于分段的編碼系統(tǒng)中檢測數(shù)字視頻信號的當(dāng)前幀與前一幀之間的運動矢量的方法,其中該當(dāng)前幀包含多個分段區(qū)而前一幀包含許多候選區(qū),所述方法包括下述步驟(a)為各分段區(qū)生成分段數(shù)據(jù),分段數(shù)據(jù)中包含表示各分段區(qū)的形狀與位置的輪廓信息及表示包含在各分段區(qū)中的所有象素的一個平均灰度級的實質(zhì)信息;(b)為各候選區(qū)生成候選分段數(shù)據(jù),候選分段數(shù)據(jù)包含表示各候選區(qū)的形狀與位置的輪廓信息及表示包含在各候選區(qū)中的所有象素的一個平均灰度級的實質(zhì)信息;(c)生成用于包圍一個分段區(qū)的一個最小尺寸的預(yù)定幾何圖形,以借此生成其尺寸信息;(d)生成用于包圍各候選區(qū)的最小尺寸的預(yù)定幾何圖形,以借此生成其尺寸信息;(e)根據(jù)分段區(qū)與各候選區(qū)的分段數(shù)據(jù)與尺寸信息計算分段區(qū)與各候選區(qū)之間的一個誤差值,從而為該分段區(qū)提供一組誤差值;(f)選擇產(chǎn)生該組誤差值中最小誤差值的一個候選區(qū),作為具有最接近于該分段區(qū)的相似性的一個搜索區(qū);(g)檢測該分段區(qū)與該搜索區(qū)之間的一個或多個運動矢量;以及(h)為所有分段區(qū)重復(fù)所述步驟(c)至(g)。
全文摘要
在基于分段的編碼系統(tǒng)中檢測運動矢量的方法,包括步驟(a)為各分段區(qū)生成分段數(shù)據(jù),(b)為各候選區(qū)生成候選分段數(shù)據(jù),(c)生成用于包圍一個分段區(qū)的最小尺寸的預(yù)定幾何圖形,(d)生成用于包圍各候選區(qū)的最小尺寸的預(yù)定幾何圖形,(e)計算分段區(qū)與各候選區(qū)之間的誤差值,(f)選擇產(chǎn)生最小誤差值的一個候選區(qū)作為搜索區(qū),(g)檢測分段區(qū)與搜索區(qū)之間的一個或多個運動矢量以及(h)為所有分段區(qū)重復(fù)所述步驟(c)至(g)。
文檔編號H04N7/32GK1130845SQ95119440
公開日1996年9月11日 申請日期1995年12月29日 優(yōu)先權(quán)日1994年12月29日
發(fā)明者李敏燮 申請人:大宇電子株式會社