專利名稱:檢測(cè)一序列視頻圖象中的靜止區(qū)域的方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種用來(lái)檢測(cè)一序列數(shù)字視頻圖象中的靜止區(qū)域的方法。這樣一種方法通??梢员挥糜谝曨l信號(hào)處理設(shè)備中,來(lái)檢測(cè)一序列視頻圖象的中的運(yùn)動(dòng)情況。更具體地說(shuō),本發(fā)明的一種應(yīng)用是瞬時(shí)視頻格式轉(zhuǎn)換領(lǐng)域,這種瞬時(shí)視頻格式轉(zhuǎn)換可以是運(yùn)動(dòng)補(bǔ)償型的,也可以不是。這包括用于視頻信號(hào)上變頻轉(zhuǎn)換的算法,如在裝有50Hz至100Hz上變頻裝置的電視接收機(jī)中。這一應(yīng)用領(lǐng)域包括低端上變頻算法和高端上變頻算法,在低端上變頻算法中,簡(jiǎn)單的場(chǎng)(半幀)/幀重復(fù)被用來(lái)生成中間場(chǎng)/幀,在高端上變頻算法中,采用運(yùn)動(dòng)補(bǔ)償技術(shù)對(duì)中間場(chǎng)/幀進(jìn)行計(jì)算。另一個(gè)應(yīng)用領(lǐng)域是視頻標(biāo)準(zhǔn)轉(zhuǎn)換,主要是50Hz(赫茲)至60Hz和60Hz至50Hz的轉(zhuǎn)換。其它重要的應(yīng)用領(lǐng)域是MPEG視頻編碼和隔行掃描到逐行連續(xù)掃描的轉(zhuǎn)換。
有了一序列視頻圖象中的靜止區(qū)域的映象圖,才可以實(shí)現(xiàn)對(duì)非運(yùn)動(dòng)區(qū)域的象素的具體處理。其效果例如可以是這樣的,在采用運(yùn)動(dòng)補(bǔ)償技術(shù)用于插入圖象(轉(zhuǎn)換技術(shù))或用于復(fù)構(gòu)圖象(壓縮技術(shù))時(shí)保持一幅圖象中的靜止區(qū)域的完整分辨率。關(guān)于靜止區(qū)域的信息通??捎糜跈z測(cè)視頻圖象序列中的運(yùn)動(dòng)的所有算法,因?yàn)榱氵\(yùn)動(dòng)的區(qū)域就是視頻廣播場(chǎng)景中按統(tǒng)計(jì)結(jié)果出現(xiàn)最頻繁的區(qū)域。
在一個(gè)上變頻轉(zhuǎn)換或視頻標(biāo)準(zhǔn)轉(zhuǎn)換中,輸出序列的分辨率可以在非運(yùn)動(dòng)區(qū)域進(jìn)行優(yōu)化,其方式是將運(yùn)動(dòng)補(bǔ)償處理關(guān)閉并簡(jiǎn)單地將源象素復(fù)制到輸出中。
在MPEG視頻解碼領(lǐng)域,傳輸被劃分為靜止區(qū)域的象素塊中的最小量的信息,可以節(jié)省比特速率。的確,如果運(yùn)動(dòng)補(bǔ)償作用于兩幀或具有同樣奇偶性的兩個(gè)場(chǎng),對(duì)于靜止象素塊來(lái)說(shuō),只要傳輸象素塊為靜止的信息就足夠了。這意味著象素塊的運(yùn)動(dòng)矢量為0,而且所有的預(yù)測(cè)誤差(這種說(shuō)法是針對(duì)MPEG視頻標(biāo)準(zhǔn))應(yīng)該為0(它們可能并不正好是0,但如果確定了象素塊是靜止的,那么很明顯,非零預(yù)測(cè)誤差代表著不應(yīng)被傳輸?shù)脑肼暯M份)。
另一個(gè)好處來(lái)自于一種自然現(xiàn)象,即,人的眼睛對(duì)靜止區(qū)域的缺陷比對(duì)運(yùn)動(dòng)區(qū)域中的缺陷更敏感,這樣,有關(guān)圖象中靜止區(qū)域的位置的信息顯得非常重要,因?yàn)橹灰?jiǎn)單地復(fù)制靜止區(qū)域的源象素,因運(yùn)動(dòng)補(bǔ)償處理所造成的缺陷就可以避免了。
本發(fā)明的目的在于提供一種用于檢測(cè)一序列視頻圖象中的靜止區(qū)域的可靠的算法。這一目的是通過(guò)本發(fā)明的權(quán)利要求1中所提供的方法來(lái)實(shí)現(xiàn)的。
本發(fā)明所提供的方法原則上包括5個(gè)步驟第一,計(jì)算連續(xù)幀或具有相同的奇偶性的連續(xù)場(chǎng)相應(yīng)的象素之間的象素差異;第二,針對(duì)視頻圖象的象素塊,累計(jì)象素差異的幅度;第三,針對(duì)所述象素塊,計(jì)算累計(jì)象素差異的閾值;第四,把所述閾值與累計(jì)象素差異進(jìn)行比較,得到靜止象素塊的一個(gè)初步映象圖;第五,通過(guò)消除孤立的靜止象素塊或小組的相鄰靜止象素塊,對(duì)靜止區(qū)域的初步映象圖進(jìn)行清理。
本發(fā)明在隔行掃描源條件下可以取得具有良好可靠性的靜止象素塊的檢測(cè),因?yàn)樗诰哂邢嗤媾夹缘膬蓚€(gè)場(chǎng)上操作。這樣,也避免了由于隔行掃描效果而帶來(lái)的不需要的擾動(dòng)。通過(guò)累計(jì)相應(yīng)象素的差異值的幅度,有噪聲存在條件下靜止區(qū)域檢測(cè)的強(qiáng)度得到提高,因?yàn)樵肼暯M份的隨機(jī)變化被消除了。
從屬權(quán)要求中所表達(dá)的方法進(jìn)一步改進(jìn)了權(quán)利要求1中(也即上面)所描述的方法。如權(quán)利要求2所述的,通過(guò)把象素塊的閾值匹配于幀或場(chǎng)的一個(gè)估計(jì)的噪聲水平和一個(gè)象素塊梯度的量,本方法的可靠性進(jìn)一步提高??紤]象素塊梯度的原因是攝象機(jī)即使發(fā)生非常小的移動(dòng),也會(huì)在存在很高空間頻率的區(qū)域造成巨大的象素差異。所以用來(lái)確定閾值的公式包括一個(gè)與象素塊梯度成正比的“懲罰”項(xiàng)。
考慮到這一因素后計(jì)算閾值的一個(gè)簡(jiǎn)單的公式由權(quán)利要求3給出。如果在一個(gè)象素塊中存在許多較高空間頻率組份與/或明顯的噪聲,那么,將要與象素塊的累計(jì)象素差異進(jìn)行比較的相應(yīng)閾值將會(huì)高。有了這些方法,劃分一個(gè)象素塊為靜止的或非靜止的決定就比正?;?,就是說(shuō),可以不受噪聲和圖象內(nèi)容的影響。
權(quán)利要求4提供了檢測(cè)象素塊梯度的一個(gè)最佳實(shí)施例。
權(quán)利要求5給出了用于計(jì)算閾值的公式中的比例常數(shù)α、β的最佳實(shí)施例。這些數(shù)值是針對(duì)估計(jì)噪聲水平σ被作為一個(gè)標(biāo)準(zhǔn)偏差來(lái)計(jì)算、并用灰度水平進(jìn)行表達(dá)的情況而優(yōu)化的。
權(quán)利要求6給出了把閾值用于累計(jì)幀差異的一個(gè)簡(jiǎn)單的實(shí)施例。
權(quán)利要求7提供了用來(lái)對(duì)靜止區(qū)域的初步映象圖進(jìn)行清理的優(yōu)選方案。其中,孤立的靜止象素塊或小組的鄰近象素塊被從靜止/非靜止象素塊的初步映象圖中消除。
權(quán)利要求9至11提出了可以采用本發(fā)明技術(shù)方案的重要的設(shè)備。
對(duì)本發(fā)明的實(shí)施例的詳細(xì)描述是結(jié)合下述附圖進(jìn)行的,其中
圖1是用來(lái)檢測(cè)一個(gè)視頻圖象序列中的靜止區(qū)域的算法的流程圖;圖2a)是用來(lái)解釋相應(yīng)象素之間的象素差異的計(jì)算方法的連續(xù)視頻幀的示意圖;圖2b)是用來(lái)解釋具有相同奇偶性的場(chǎng)中的相應(yīng)象素之間的象素差異的計(jì)算方法的連續(xù)視頻場(chǎng)的示意圖;圖3是幀被再分成等大小的象素塊的幀的片段;圖4是靜止區(qū)域的一個(gè)初步映象圖的片段;圖5是用于靜止區(qū)域的一個(gè)初步映象圖的清理過(guò)程的水平與垂直鄰近區(qū)域的示例;以及圖6是與相應(yīng)于圖4的一個(gè)靜止區(qū)域最終映象圖的片段。
本發(fā)明所提供的用于檢測(cè)兩幅連續(xù)視頻圖象中的靜止區(qū)域的新方法需要一個(gè)前提,即視頻圖象必須是以數(shù)字形式存在的,就是說(shuō),模擬源的視頻圖象必須被進(jìn)行離散取值和數(shù)字化處理。如此生成的數(shù)字象素值被存儲(chǔ)于幀或場(chǎng)存儲(chǔ)器中,這是本領(lǐng)域所公知的內(nèi)容。如果源視頻信號(hào)比如是一個(gè)標(biāo)準(zhǔn)NTSC信號(hào),那么離散取值的頻率是13.5MHz,幀重復(fù)速率是每秒30幀。一個(gè)水平線周期持續(xù)63.5毫秒。所以,在每個(gè)水平線中生成858個(gè)象素。由于NTSC制式中每幀含有525個(gè)水平掃描線,一幀就有858×525=450450個(gè)象素。通常用8個(gè)比特來(lái)表示一個(gè)象素,對(duì)于幀存儲(chǔ)器來(lái)說(shuō),一個(gè)幀存儲(chǔ)器必須提供858×262.5=225225字節(jié)的存儲(chǔ)容量。
本發(fā)明的方法適用于逐行掃描和隔行掃描視頻圖象。其差別將在下面加以詳述。
本發(fā)明所提供的用來(lái)檢測(cè)連續(xù)視頻圖象中的靜止區(qū)域的新方法含有幾個(gè)必須一一順次進(jìn)行的步驟。所有的步驟都可以由一個(gè)處理單元來(lái)執(zhí)行,該處理單元比如可以含有一個(gè)執(zhí)行一個(gè)相應(yīng)的計(jì)算機(jī)程序的微處理器。下面結(jié)合圖1對(duì)這樣的一個(gè)程序加以解釋。毋需解釋的是,該方法還可以用一個(gè)專用集成電路來(lái)實(shí)施,如一個(gè)具有用來(lái)執(zhí)行不同的步驟和任務(wù)的專用硬件的ASIC電路。
在步驟10中,對(duì)于逐行連續(xù)掃描視頻系統(tǒng),第一幀N-1被讀入一個(gè)第一幀存儲(chǔ)器;對(duì)于隔行掃描視頻系統(tǒng)來(lái)說(shuō),一個(gè)奇/偶場(chǎng)被讀入一個(gè)第一場(chǎng)存儲(chǔ)器。在步驟11中,對(duì)于連續(xù)掃描視頻系統(tǒng)來(lái)說(shuō),下一幀N被讀入一個(gè)第二幀存儲(chǔ)器;對(duì)于隔行掃描視頻系統(tǒng)來(lái)說(shuō),與步驟10中被讀入的場(chǎng)具有同樣的奇偶性的下一個(gè)奇/偶場(chǎng)被讀入一個(gè)第二場(chǎng)存儲(chǔ)器。當(dāng)這些步驟完成的時(shí)候,兩個(gè)平行的分支程序開(kāi)始被執(zhí)行。
采用第一種對(duì)圖象進(jìn)行模型化的方法,圖象可以被模型化為一個(gè)代表圖象信息的第一信號(hào)組份與一個(gè)噪聲組份的疊合。在非移動(dòng)圖象部分,相應(yīng)象素間的差異正是場(chǎng)間或幀間噪聲差異的樣本。在移動(dòng)圖象部分,由一個(gè)特定的象素位置所表示的場(chǎng)景目標(biāo)中的坐標(biāo)點(diǎn)在一幅圖象與下一幅圖象中是不同的,所以一個(gè)額外的信號(hào)差異組份將被加入到噪聲差異中。因此,從均值角度來(lái)說(shuō),移動(dòng)部分的差異幅度大于靜止部分的差異幅度。這就是為什么本發(fā)明的方法中象素差異被與閾值進(jìn)行比較以區(qū)分靜止與移動(dòng)象素的原因。
回到圖1中的流程圖,第一分支含有步驟12至15,在這些步驟中,對(duì)兩個(gè)幀/場(chǎng)的差異進(jìn)行分析。第二個(gè)分支含有步驟16至21,在這些步驟中,對(duì)閾值進(jìn)行計(jì)算以決定圖象的哪個(gè)部分是靜止的或非靜止的。
先對(duì)含有步驟12至15的第一分支進(jìn)行說(shuō)明。這里所提出的方法是基于對(duì)連續(xù)幀/場(chǎng)的象素內(nèi)的差異進(jìn)行分析。所說(shuō)的差異被定義為占據(jù)同一位置的象素的灰度的差異,包括兩種情況逐行連續(xù)輸入源條件下的兩個(gè)連續(xù)幀,隔行輸入源條件下的具有相同奇偶性的兩個(gè)場(chǎng),即兩個(gè)場(chǎng)周期分開(kāi)的兩個(gè)場(chǎng)。
在步驟12中,對(duì)存儲(chǔ)于幀/場(chǎng)存儲(chǔ)器中的兩個(gè)幀或兩個(gè)場(chǎng)進(jìn)行象素差異計(jì)算。圖2的上半部分給出的是兩個(gè)連續(xù)幀N-1和N。其中,幀N-1所關(guān)心的是前一幀,而幀N所關(guān)心的是當(dāng)前幀。這些幀都含有一定數(shù)目的線,如圖2所示。每線都含有一定數(shù)目的象素,前面已有所描述。在幀N-1和幀N中都分別給出了一個(gè)象素30。這兩個(gè)象素的差異可以由下列公式來(lái)計(jì)算PD(x,y)=LN(x,y)-LN-1(x,y)其中,LN(x,y)代表當(dāng)前幀中(x,y)位置象素30的亮度值,LN-1(x,y)代表前一幀中(x,y)位置象素30的亮度值。
在圖2的下半部分,給出了隔行掃描視頻圖象條件下的3個(gè)連續(xù)的場(chǎng)N-2、N-1、N。場(chǎng)N-2與場(chǎng)N具有相同的奇偶性,而場(chǎng)N-1具有相反的奇偶性。這也可以通過(guò)圖2中的實(shí)線與虛線清楚地看出來(lái)。仍然用參考序號(hào)30來(lái)表示將要計(jì)算差異值的象素,這一次的計(jì)算用下面的公式來(lái)進(jìn)行PD(x,y)=LN(x,y)-LN-2(x,y)在步驟13中,象素差異計(jì)算的結(jié)果被存儲(chǔ)于相應(yīng)的存儲(chǔ)器位置。存儲(chǔ)有最舊的幀N-1/場(chǎng)N-2的幀/場(chǎng)存儲(chǔ)器可以用于這一用途。在存儲(chǔ)器中等于是存儲(chǔ)了一幅象素差異的映象圖。
步驟14中,象素差異的幅度被累加到預(yù)先確定的象素塊上,可以是交迭的,也可以是不交迭的。圖3給出了非交迭象素塊中幀或場(chǎng)的再分示例。在這個(gè)例子中,每個(gè)象素塊含有16×8個(gè)象素。自然,其它的例子也可用,如8×8象素塊等。采用非交迭式象素塊簡(jiǎn)化了存儲(chǔ)器組織。
對(duì)于每個(gè)象素塊B(i,j),計(jì)算組成象素塊的每個(gè)象素的象素差異PD(i,j)的絕對(duì)值的總和,作為累計(jì)象素差異APD(i,j)。這提高了在有噪聲存在的情況下靜止象素塊檢測(cè)的魯棒性,因?yàn)閳D象中的噪聲組份的隨機(jī)變化可以被累計(jì)操作的過(guò)程消除。
在步驟15中,累計(jì)象素差異值A(chǔ)PD(i,j)被收集于相應(yīng)的存儲(chǔ)器位置。注意,數(shù)字i和j決定了幀或場(chǎng)內(nèi)象素塊的位置。
下面對(duì)圖1中含有步驟16至21的第二分支加以說(shuō)明。在此分支中,計(jì)算前述每個(gè)象素塊的閾值T(i,j)。注意,在這個(gè)分支中,只考慮當(dāng)前幀或場(chǎng)的象素?cái)?shù)據(jù)。在步驟16中,計(jì)算一個(gè)“象素塊梯度”g(i,j)。所謂的象素塊梯度是指存在于當(dāng)前象素塊B(i,j)中的空間梯度。在本發(fā)明的最佳實(shí)施例中,g(i,j)的計(jì)算方式是從水平gx(i,j)與垂直gy(i,j)梯度組份中選取大的那個(gè),用如下公式表示g(i,j)=MA×[gx(i,j),gy(i,j)]其中,水平梯度組份gx(i,j)被估計(jì)為水平相鄰的象素的亮度差異的絕對(duì)值的平均,垂直梯度組份gy(i,j)被估計(jì)為垂直相鄰的象素的亮度差異的絕對(duì)值的平均,計(jì)算的對(duì)象包括組成當(dāng)前象素塊B(i,j)的N個(gè)象素P(k,l),其灰度用L(k,1)表示。計(jì)算公式如下{gy(i,j)=1NΣL(k,l)∈B(i,j)|L(k,l)-L(k,l-1)|gx(i,j)=1NΣL(k,l)∈B(i,j)|L(k,l)-L(k-1,l)|]]>在步驟17中,如此算得的象素塊梯度被存儲(chǔ)于相應(yīng)的存儲(chǔ)位置。只所以考慮象素塊梯度是因?yàn)榧词箶z象機(jī)發(fā)生非常小的移動(dòng),到了存在很高的空間頻率的區(qū)域,也會(huì)導(dǎo)致巨大的象素差別。
在步驟18中計(jì)算閾值。閾值T(i,j)被設(shè)計(jì)成與象素塊梯度相匹配,相匹配的方式是它包含一個(gè)與象素塊梯度成正比的“懲罰項(xiàng)”。這些閾值還被設(shè)計(jì)成與當(dāng)前幀或場(chǎng)的噪聲水平的估計(jì)值相匹配。噪聲水平是被作為步驟18的一個(gè)外部輸入。噪聲水平的估計(jì)是在視頻處理領(lǐng)域一個(gè)眾所周知的問(wèn)題。例如,號(hào)碼為EP-A-0 562407的專利申請(qǐng)就公開(kāi)了一種用于噪聲測(cè)量的方法與裝置。所以,在此不必詳細(xì)解釋噪聲估計(jì)的過(guò)程。但上述專利申請(qǐng)可以作為參考。另外一個(gè)有用的信息是,本專利申請(qǐng)的發(fā)明人在本專利申請(qǐng)的同一申請(qǐng)日提交了另一份有關(guān)噪聲估計(jì)的一種新方法的發(fā)明申請(qǐng),其內(nèi)部參考號(hào)是PF980012。
設(shè)一個(gè)象素塊中的象素?cái)?shù)是N,σ是可能的噪聲水平的估計(jì)值,每個(gè)閾值都可以由σ和g(i,j)的加權(quán)平均來(lái)獲得T(i,j)=N(ασ+βg(i,j))數(shù)值α和β取決于噪聲水平σ和象素塊g(i,j)被表達(dá)的精確度。出于此目的,一個(gè)由不同數(shù)值的α和β所組成的表格可以被存儲(chǔ)于存儲(chǔ)器中。如果按照本發(fā)明的最佳實(shí)施例算得g(i,j),如上所述,并且如果σ代表了被表達(dá)成了一個(gè)灰度水平的標(biāo)準(zhǔn)偏差,那么α和β的最佳選擇分別是1.4與1/8。
在步驟21中,這些閾值被收集到相應(yīng)的存儲(chǔ)器位置中。
步驟22中,針對(duì)每個(gè)象素塊B(i,j)把累計(jì)幀差異APD(i,j)與閾值T(i,j)進(jìn)行比較,以提供靜止區(qū)域的一個(gè)初步映象圖PM。該映象圖的每個(gè)象素PM(i,j)都與一個(gè)象素塊B(i,j)相關(guān)聯(lián)并代表一個(gè)為這個(gè)象素塊所采取的二重(靜止的或非靜止的)決定。按照慣常的作法,數(shù)值1代表靜止象素塊,0代表非靜止象素塊,PM(i,j)可以由如下公式給出
比較是在步驟22內(nèi)進(jìn)行的,其結(jié)果在步驟23被輸入存儲(chǔ)器。當(dāng)步驟23執(zhí)行完成后,在存儲(chǔ)器中已經(jīng)有了一個(gè)初步的靜止區(qū)域映象圖。圖4所示是這樣一個(gè)初步映象圖的示例。
值得注意的是,在多個(gè)非靜止象素塊所組成的區(qū)域內(nèi)會(huì)有一些靜止的象素塊。通常這些象素塊的尺寸遠(yuǎn)遠(yuǎn)小于圖象中的真實(shí)物體的相應(yīng)尺寸。這種情況下,孤立的象素塊或小組孤立的象素塊一定是誤檢測(cè)的結(jié)果,不能代表靜止物體。所以,在初步映象圖中的這些靜止象素塊相關(guān)聯(lián)的象素必須有表示非靜止象素塊的象素來(lái)替代。
出于這種目的,在下一個(gè)步驟24中執(zhí)行一個(gè)對(duì)映象圖進(jìn)行腐蝕的步驟,即把孤立的靜止象素塊或小組的相鄰靜止象素塊去掉,就象進(jìn)行對(duì)映象圖進(jìn)行腐蝕一樣,從而提供一個(gè)最后的靜止區(qū)域映象圖FM。這一步驟主要起作用于象素塊的尺寸遠(yuǎn)遠(yuǎn)小于圖象中真實(shí)物體的尺寸的情況。
在本發(fā)明的最佳實(shí)施例中,腐蝕過(guò)程的實(shí)現(xiàn)過(guò)程是處理初步映象圖中的每個(gè)輸入(等同于當(dāng)前場(chǎng)或幀中的每個(gè)象素塊),具體過(guò)程如下如果當(dāng)前象素塊B(i,j)已經(jīng)被劃分為非靜止的,即PM(i,j)=0,那么,也設(shè)定FM(i,j)=0(即,什么也不做),而如果PM(i,j)=1,則1.考慮一個(gè)以當(dāng)前象素塊為中心的水平鄰近區(qū)域,并把MX個(gè)象素塊作為水平鄰近它的象素塊;2.?dāng)?shù)出在這個(gè)鄰近區(qū)域內(nèi)被劃分為靜止態(tài)的象素塊的數(shù)目SX。
3.如果比值SX/MX小于一個(gè)預(yù)先設(shè)定的閾值TX,那么設(shè)定FM(i,j)=0,即說(shuō)明這一象素塊為非靜止的。
4.考慮一個(gè)以當(dāng)前象素塊為中心的垂直鄰近區(qū)域,并把MY個(gè)象素塊作為垂直鄰近它的象素塊;5.?dāng)?shù)出在這個(gè)鄰近區(qū)域內(nèi)被劃分為靜止態(tài)的象素塊的數(shù)目SY。
6.如果比值SY/MY小于一個(gè)預(yù)先設(shè)定的閾值TY,那么設(shè)定FM(i,j)=0。
數(shù)值MX、MY、TX、TY應(yīng)該與象素塊和圖象的尺寸相匹配。圖5給出了用于在NTSC、PAL、SECAM和16×8象素的標(biāo)準(zhǔn)電視圖象中對(duì)映象圖進(jìn)行腐蝕的過(guò)程所采用的水平與豎直鄰近區(qū)域的一個(gè)示例。參考標(biāo)號(hào)40表示含有3個(gè)相鄰象素塊的豎直鄰近區(qū)域。參考標(biāo)號(hào)41表示含有5個(gè)相鄰象素塊的豎直鄰近區(qū)域。當(dāng)前象素塊由參考標(biāo)號(hào)42表示。在這個(gè)例子中,TX值被確定為3/5,TY值被確定為2/3。
對(duì)于位于場(chǎng)或幀的邊界的象素塊來(lái)說(shuō),可以改變對(duì)初步映象圖進(jìn)行腐蝕的步驟。例如,對(duì)于頂部和底部邊界的象素塊來(lái)說(shuō),步驟4至6可以被省略。對(duì)于左右邊界的象素塊來(lái)說(shuō),步驟1至3可以被省略。
在映象腐蝕步驟24之后,在步驟25中獲得靜止象素塊的最終映象圖。圖6所示即是在對(duì)圖4中的初步映象圖進(jìn)行清理之后而獲得的最終映象圖。
權(quán)利要求
1.一種用來(lái)檢測(cè)一序列視頻圖象中的靜止區(qū)域的方法,其特征在于,它包括以下步驟a)計(jì)算連續(xù)幀或具有相同奇偶性的連續(xù)場(chǎng)的相應(yīng)象素(30)之間的象素差異;b)針對(duì)視頻幀的象素的象素塊(B(i,j))累計(jì)象素差異的幅度;c)計(jì)算象素塊的閾值T(i,j);d)把閾值T(i,j)用于相應(yīng)的象素塊的累計(jì)象素差異,提供靜止區(qū)域的一個(gè)初步映象圖(PM);e)通過(guò)消除孤立的靜止象素塊和小組的相鄰靜止象素塊,修正所述初步映象圖(PM)。
2.如權(quán)利要求1所述的方法,其特征在于,所述的每個(gè)象素塊的閾值T(i,j)被匹配于a)當(dāng)前場(chǎng)或幀的一個(gè)估計(jì)的噪聲水平(σ),和b)一個(gè)象素塊梯度的量值(g(i,j))。
3.如權(quán)利要求1或2所述的方法,其特征在于,所述的閾值水平T(i,j)是通過(guò)如下公式計(jì)算的T(i,j)=N(ασ+βg(i,j))其中N是一個(gè)象素塊中的象素?cái)?shù),數(shù)值α和β是基于如何確定估計(jì)的噪聲水平σ和象素塊g(i,j)所選擇。
4.如權(quán)利要求2或3所述的方法,其特征在于,象素塊梯度g(i,j)的計(jì)算方式是從水平gx(i,j)與垂直gy(i,j)梯度組份中選取大的那個(gè),即g(i,j)=MAX[gx(i,j),gy(i,j)]其中,i,j是一幀或場(chǎng)的一行和一列中的象素塊數(shù),水平梯度組份gx(i,j)和垂直梯度組份gy(i,j)被分別計(jì)算為水平相鄰的象素的亮度差異的絕對(duì)值的平均,計(jì)算是根據(jù)象素塊B(i,j)的灰度值L(k,l)對(duì)N個(gè)象素P(k,l)進(jìn)行的,即{gy(i,j)=1NΣL(k,l)∈B(i,j)|L(k,l)-L(k,l-1)|gx(i,j)=1NΣL(k,l)∈B(i,j)|L(k,l)-L(k-1,l)|]]>
5.如權(quán)利要求4所述的方法,其特征在于,如果所述幀的噪聲水平σ代表一個(gè)由灰度水平表示的標(biāo)準(zhǔn)偏差,α被取值為1.4,β被取值為1/8。
6.如權(quán)利要求1至5所述的方法,其特征在于,把象素塊B(i,j)的累計(jì)幀差異APD(i,j)與相應(yīng)的閾值T(i,j)進(jìn)行比較,而且,為每個(gè)象素塊B(i,j)指定一個(gè)代表該象素塊是靜止或非靜止的的數(shù)值,最好按以下公式進(jìn)行
其中PM(i,j)是靜止區(qū)域的一個(gè)初步映象圖的一個(gè)輸入,數(shù)值1代表靜止象素塊,0代表非靜止象素塊。
7.如權(quán)利要求1至6所述的方法,其特征在于,所述靜止區(qū)域的初步映象圖被如下處理a)如果當(dāng)前象素塊B(i,j)已經(jīng)在靜止區(qū)域的初步映象圖中被劃分為非靜止的,即PM(i,j)=0,那么,相應(yīng)的輸入在靜止區(qū)域的最終映象圖中也被劃分為非靜止的,即FM(i,j)=0;b)如果當(dāng)前象素塊B(i,j)已經(jīng)被劃分為靜止的,則進(jìn)行如下步驟ⅰ)造成一個(gè)以當(dāng)前象素塊(42)為中心的、具有MX個(gè)象素塊的水平鄰近區(qū)域(41);ⅱ)數(shù)出在這個(gè)鄰近區(qū)域內(nèi)被劃分為靜止態(tài)的象素塊的數(shù)目SX;ⅲ)分析比值SX/MX是否小于一個(gè)預(yù)先設(shè)定的閾值TX,如果是這樣,那么在靜止區(qū)域的最終映象圖中把當(dāng)前象素塊劃分為非靜止的,即FM(i,j)=0;ⅳ)造成一個(gè)以當(dāng)前象素塊為中心的、具有MY個(gè)象素塊的垂直鄰近區(qū)域(40);ⅴ)數(shù)出在這個(gè)鄰近區(qū)域內(nèi)被劃分為靜止態(tài)的象素塊的數(shù)目SY。ⅵ)分析比值SY/MY是否小于一個(gè)預(yù)先設(shè)定的閾值TY,如果是這樣,那么在靜止區(qū)域的最終映象圖中把當(dāng)前象素塊劃分為非靜止的,即FM(i,j)=0。
8.如權(quán)利要求7所述的方法,其特征在于,其中所述的數(shù)值MX、MY、TX、TY與象素塊的尺寸、幀或場(chǎng)的尺寸相匹配。
9.如權(quán)利要求1至8中任何一個(gè)所述的方法,其特征在于,它們是應(yīng)用于一種用于視頻圖象的運(yùn)動(dòng)補(bǔ)償編碼的設(shè)備的方法。
10.如權(quán)利要求1至8中任何一個(gè)所述的方法,其特征在于,它們是應(yīng)用于一個(gè)用于視頻圖象的運(yùn)動(dòng)補(bǔ)償編碼的設(shè)備,尤其用于50Hz至100Hz上變頻、50Hz至60Hz標(biāo)準(zhǔn)轉(zhuǎn)換、或60Hz至50Hz標(biāo)準(zhǔn)轉(zhuǎn)換的方法。
11.如權(quán)利要求1至8中任何一個(gè)所述的方法,其特征在于,它們是應(yīng)用于一種用于隔行掃描到逐行連續(xù)掃描轉(zhuǎn)換的視頻信號(hào)處理設(shè)備的方法。
全文摘要
本發(fā)明公開(kāi)了一種用來(lái)檢測(cè)一序列視頻圖象中的靜止區(qū)域的方法,它包括以下步驟:計(jì)算連續(xù)幀或具有相同奇偶性的連續(xù)場(chǎng)的相應(yīng)象素(30)之間的象素差異;針對(duì)視頻幀的象素的象素塊(B(i,j))累計(jì)象素差異的幅度;計(jì)算象素塊的閾值T(i,j);把閾值T(i,j)用于相應(yīng)在象素塊的累計(jì)象素差異,提供靜止區(qū)域的一個(gè)初步映象圖(PM);通過(guò)消除弧立的靜止象素塊和小組的相鄰靜止象素塊,修正所述初步映象圖(PM)。
文檔編號(hào)H04N5/44GK1234691SQ9910329
公開(kāi)日1999年11月10日 申請(qǐng)日期1999年3月31日 優(yōu)先權(quán)日1998年4月14日
發(fā)明者弗朗西斯·勒克萊爾 申請(qǐng)人:湯姆森多媒體公司