專利名稱:畫面切換檢測(cè)中減少錯(cuò)誤認(rèn)定的方法和裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明的背景本發(fā)明一般地涉及一種裝置,它檢測(cè)出一個(gè)信源視頻中的各個(gè)重要場(chǎng)景,并從中選擇出代表性的關(guān)鍵幀。本發(fā)明具體涉及作出一種判定,即是否檢測(cè)到的一個(gè)場(chǎng)景變化確實(shí)是一個(gè)場(chǎng)景變化,或者只是圖像亮度的一個(gè)均勻變化,諸如在新聞廣播節(jié)目等場(chǎng)合中發(fā)生的照相機(jī)之閃光燈閃光造成的亮度均勻變化。
用戶往往會(huì)在磁帶上記錄家庭視頻節(jié)目,或者記錄電視節(jié)目、電影、音樂會(huì)、體育比賽、等等,用于以后觀看或重復(fù)觀看。然而,用戶可能沒有寫下已錄磁帶上的內(nèi)容,或者沒有記住在磁帶上錄制了什么內(nèi)容,或是沒有記住特定的場(chǎng)景、電影、事件記錄在磁帶上什么地方。因此,用戶可能必須坐下來觀看整個(gè)的磁帶,并記憶磁帶上有什么內(nèi)容。
視頻內(nèi)容分析裝置應(yīng)用自動(dòng)和半自動(dòng)方法來提取出可描述已錄材料內(nèi)容的信息。視頻內(nèi)容索引和分析裝置從視頻內(nèi)容中的可視提示內(nèi)提取出圖像的結(jié)構(gòu)和含義。通常,通過對(duì)反映出視頻中不同場(chǎng)景的一些幀作出選擇,以從一個(gè)電視節(jié)目或家庭錄像中取出一個(gè)視頻剪輯。
1995年出版的Multimedia Tools and Applications(多媒體工具與應(yīng)用)第89-111頁(yè)中,Hongjiang Zhang、Chien Yong Low和Stephen W.Smoliar在“Video Parsing and Browsing UsingCompressed Data(應(yīng)用壓縮數(shù)據(jù)的視頻解析和瀏覽)”文章中敘述的一種場(chǎng)景變化檢測(cè)系統(tǒng)內(nèi),對(duì)兩個(gè)視頻幀之間相應(yīng)的像塊作出比較,在不分離開像塊類型下就全部像塊之間的差值在整個(gè)視頻幀上總加起來。如果在兩幀之間有一定數(shù)目的像塊發(fā)生了變化,便檢測(cè)到一個(gè)場(chǎng)景變化。然而,如果兩幀的有關(guān)像塊之間的差值就彩色或亮度而言近似地相同,則Zhang的檢測(cè)系統(tǒng)可能產(chǎn)生出曲解的結(jié)果。此種場(chǎng)合下,檢測(cè)系統(tǒng)會(huì)檢測(cè)出一個(gè)場(chǎng)景變化,而事實(shí)上只是在新聞廣播期間發(fā)生了照相機(jī)的閃光燈閃光。
本發(fā)明的概要需要有一種系統(tǒng),對(duì)于先前記錄或正在記錄的視頻源可創(chuàng)建一個(gè)可視的索引,它在選擇重要的關(guān)鍵幀中便于應(yīng)用且更為精確,同時(shí)向用戶提供出一種可應(yīng)用的信息量。該系統(tǒng)可檢測(cè)出場(chǎng)景變化,并從每種場(chǎng)景中選擇出一個(gè)關(guān)鍵幀,則對(duì)于幀內(nèi)實(shí)質(zhì)上所有像塊或宏塊亮度方面實(shí)際中僅僅的均勻變化,在它所產(chǎn)生出的兩幀之間的信息變化里,可棄置其場(chǎng)景變化的檢知和關(guān)鍵幀的選取。
本發(fā)明的一個(gè)目的是比較兩個(gè)視頻幀以檢測(cè)一個(gè)場(chǎng)景變化,但若兩幀之間的差別僅僅是亮度方面實(shí)質(zhì)上的均勻變化,則本發(fā)明將判定,未檢測(cè)到一個(gè)場(chǎng)景變化。
本發(fā)明的另一個(gè)目的是比較兩幀中對(duì)應(yīng)像塊的直流(DC)系數(shù)。如果直流系數(shù)的變化在幀內(nèi)實(shí)際中的所有像塊上近似相同,則將判定,沒有發(fā)生場(chǎng)景變化,而不選擇出另一個(gè)關(guān)鍵幀。
為了更好地理解本發(fā)明、其運(yùn)行優(yōu)點(diǎn),以及應(yīng)用它能達(dá)到的特定目的,須參考附圖和其說明,附圖中,示例和描述了本發(fā)明的諸優(yōu)選附圖的簡(jiǎn)要說明為了更好地理解,對(duì)下面各圖作出解說。
圖1示明一種視頻歸檔處理;圖2A和圖2B是按照本發(fā)明的一種優(yōu)選實(shí)施例在創(chuàng)建一個(gè)可視索引中所使用裝置的方框圖;圖3示明了一個(gè)幀、一個(gè)宏塊和幾個(gè)像塊;圖4示明了一個(gè)像塊的若干DCT系數(shù);圖5示明了帶有DCT系數(shù)的一個(gè)宏塊和幾個(gè)像塊;以及圖6示例出一種視頻流圖像,這里,亮度方面發(fā)生了變化。
優(yōu)選實(shí)施例的說明在視頻內(nèi)容索引處理中存在兩個(gè)階段歸檔和檢索。當(dāng)歸檔處理期間,在視頻解析處理中分析視頻的內(nèi)容,并創(chuàng)建一個(gè)可視索引。在視頻解析處理時(shí),進(jìn)行自動(dòng)的重要場(chǎng)景檢測(cè)、均勻亮度變化檢測(cè)和關(guān)鍵幀選擇。重要場(chǎng)景檢測(cè)是一種識(shí)別場(chǎng)景變化的處理,也就是,“切換”(視頻切換檢測(cè)或分段檢測(cè))和識(shí)別靜態(tài)場(chǎng)景(靜態(tài)場(chǎng)景檢測(cè))。對(duì)于每個(gè)檢測(cè)到的場(chǎng)景,提取出稱為關(guān)鍵幀的一個(gè)特定的代表性幀。所以,正確識(shí)別場(chǎng)景變化的發(fā)生十分重要,否則,對(duì)于單個(gè)的場(chǎng)景會(huì)選擇出過多的關(guān)鍵幀,或者對(duì)于多個(gè)的場(chǎng)景變化未選擇出足夠的關(guān)鍵幀。均勻亮度檢測(cè)是對(duì)兩幀之間亮度方面識(shí)別出變化的一種處理,將在下面進(jìn)一步詳細(xì)地?cái)⑹觥?用一種信源磁帶作為參考顯然是明晰的,但信源視頻也可以來自一個(gè)文件、磁盤、DVD、其它存儲(chǔ)裝置,或者直接來自傳輸?shù)男盘?hào)源(例如,在記錄一個(gè)家庭錄像時(shí)))。
圖1中示明的一種視頻歸檔處理應(yīng)用于先前記錄了信源視頻圖像的信源磁帶上,它可以包括有音頻和/或文本,不過,對(duì)先前存儲(chǔ)了可視信息諸如一個(gè)MPEG文件的其它存儲(chǔ)部件,也可實(shí)施類似的處理。此種處理中,是基于信源視頻創(chuàng)建一個(gè)可視索引。在信源磁帶上用戶對(duì)于記錄所作的第二處理,是想創(chuàng)建一個(gè)與記錄同時(shí)完成的可視索引。
圖1示明一個(gè)用于視頻磁帶的第一種處理(用于先前已記錄了節(jié)目的信源磁帶)的一個(gè)例子。步驟101中,當(dāng)需要時(shí)可通過一個(gè)諸如是VCR(盒式磁帶錄像機(jī))的重放/記錄裝置,將信源視頻盒帶倒帶。步驟102中,重放信源視頻盒帶。自信源視頻盒帶給出的信號(hào)由電視機(jī)、VCR或其它處理裝置接收。步驟103中,由該處理裝置中的一個(gè)媒體處理器或者一個(gè)外部處理器接收此視頻信號(hào),并將視頻信號(hào)格式化成代表像素?cái)?shù)據(jù)的各幀(幀采集)。
步驟104中,一個(gè)主處理器將每幀分離成各個(gè)像塊,使像塊和它們相關(guān)的數(shù)據(jù)實(shí)現(xiàn)變換,產(chǎn)生出DCT(離散余弦變換)系數(shù);實(shí)施重要場(chǎng)景檢測(cè),亮度均勻變化檢測(cè),以及關(guān)鍵幀選擇;將關(guān)鍵幀作為一個(gè)數(shù)據(jù)結(jié)構(gòu)建立和存儲(chǔ)入存儲(chǔ)器、磁盤或其它存儲(chǔ)媒體內(nèi)。步驟105中,將信源磁帶倒帶至它的始端,并在步驟106中,將信源磁帶設(shè)置為記錄信息。步驟107中,自存儲(chǔ)器來的數(shù)據(jù)結(jié)構(gòu)轉(zhuǎn)換成信源磁帶,產(chǎn)生出可視索引。然后,將磁帶倒帶,觀看可視索引。(不采用磁帶時(shí),也可以應(yīng)用任何其它媒體,或是索引可以在服務(wù)器上存儲(chǔ)和/或產(chǎn)生。)當(dāng)用戶希望在記錄的同時(shí)于磁帶上創(chuàng)建可視索引時(shí),上面的處理稍為有改變。不用步驟101和102而取代以圖1中所示的步驟112,然后象視頻(影片等)記錄那樣實(shí)現(xiàn)步驟103中的幀采集。
步驟103和104更具體地示明于圖2A和圖2B中。視頻信號(hào)以模擬形式(連續(xù)數(shù)據(jù))或數(shù)字形式(離散數(shù)據(jù))存在。本例子運(yùn)行于數(shù)字領(lǐng)域,因而應(yīng)用數(shù)字形式進(jìn)行處理。信源視頻或視頻信號(hào)是一連串各別的圖像或視頻幀,以足夠高的速率顯示(本例子中為每秒30幀),因而顯示的圖像序列呈現(xiàn)為一個(gè)連續(xù)的圖像流。這些視頻幀可以是不壓縮的(NTSC或原始視頻)數(shù)據(jù),或者是諸如MPEG、MPEG2、MPEG4、M-JPEG(運(yùn)動(dòng)JPEG)或其它之類格式的壓縮數(shù)據(jù)。
不壓縮視頻中的信息首先在媒體處理器202中分段成各幀,它應(yīng)用了諸如出現(xiàn)在Intel Smart Video Recorder III中的一種幀采集技術(shù)204。雖然,有其它的幀尺寸可以應(yīng)用,但圖3上所示的本例子中,幀302表示一個(gè)電視、視頻或其它可視圖像,包括有352×240個(gè)像素。
幀302其每一個(gè)在主處理器210(圖2A)中分割成諸像塊304,在本例子中為8×8像素的像塊304。應(yīng)用這些像塊304和通行的廣播標(biāo)準(zhǔn)GCIR-601,由宏塊產(chǎn)生器(圖2A)產(chǎn)生出各個(gè)亮度塊,并對(duì)彩色信息進(jìn)行亞取樣而產(chǎn)生出各個(gè)色度塊。由亮度塊和色度塊組成宏塊308。本例子中,采用了4∶2∶0的格式,盡管如此,本技術(shù)領(lǐng)域內(nèi)的熟練人員可以方便地應(yīng)用其它格式,諸如是4∶1∶1或4∶2∶0。在4∶2∶0中,一個(gè)宏塊308包含6個(gè)像塊,即4個(gè)亮度像塊Y1、Y2、Y3和Y4,以及兩個(gè)色度像塊Cr和Cb,一個(gè)宏塊內(nèi)的每個(gè)像塊由8×8像素組成。
應(yīng)用一種壓縮標(biāo)準(zhǔn),諸如M-JPEG(JPEG,聯(lián)合攝影專家組)標(biāo)準(zhǔn)和MPEG(運(yùn)動(dòng)圖像專家組)標(biāo)準(zhǔn),視頻信號(hào)也可以表示一種壓縮的圖像。如果視頻信號(hào)是一個(gè)MPEG信號(hào)或者其它壓縮的信號(hào),則如圖2B中所示,該MPEG信號(hào)由幀解析器205應(yīng)用一種幀或比特流解析技術(shù)將MPEG信號(hào)分割成各幀。然后,將各幀傳送至媒體處理器203中的熵解碼器214上,并傳送至表格說明符216上。熵解碼器214應(yīng)用表格說明符216中的數(shù)據(jù),利用例如是霍夫曼解碼或者另外的解碼技術(shù)將MPEG信號(hào)解碼。
解碼的信號(hào)隨后供給一個(gè)去量化器218,它應(yīng)用表格說明符216來的數(shù)據(jù)使解碼的信號(hào)去量化。雖然,圖2B中所示的工作發(fā)生于媒體處理器203內(nèi),但取決于所用的裝置,這些步驟(步驟214-218)或是可以發(fā)生在媒體處理器203、主處理器211中,或是甚至可以發(fā)生在另一個(gè)外部裝置中。
另一種情況,如果一個(gè)系統(tǒng)具有編碼能力(例如,在媒體處理器中編碼),它容許訪問不同的處理級(jí),則DCT系數(shù)可以直接傳輸至主處理器上。在所有這些方法中,處理是能實(shí)時(shí)地實(shí)現(xiàn)的。
圖1的步驟104中,由主處理器210實(shí)施重要場(chǎng)景檢測(cè)、關(guān)鍵幀選擇,以及建立和存儲(chǔ)數(shù)據(jù)結(jié)構(gòu)至一個(gè)索引存儲(chǔ)器中,該存儲(chǔ)器諸如是一個(gè)硬盤、文件、磁帶、DVD或其它存儲(chǔ)媒體,而主處理器例如可以是一個(gè)IntelPentiumTM芯片或者其它處理器或多處理器,可以是一個(gè)PhilipsTrimediaTM芯片或者其它多媒體處理器,可以是一臺(tái)計(jì)算機(jī)、一臺(tái)增強(qiáng)型VCR、記錄/重放裝置,或是電視機(jī)或任何其它處理器。
重要場(chǎng)景檢測(cè)/亮度均勻變化檢測(cè)對(duì)于自動(dòng)重要場(chǎng)景檢測(cè),當(dāng)一個(gè)視頻的場(chǎng)景已變化或者發(fā)生了一個(gè)靜態(tài)場(chǎng)景時(shí),本發(fā)明將努力予以檢測(cè)。一個(gè)場(chǎng)景可以代表一個(gè)或多個(gè)有關(guān)的圖像。在重要場(chǎng)景檢測(cè)中,將兩個(gè)接連的幀進(jìn)行比較,如果判定為兩幀間有顯著不同,則確定出這兩幀之間發(fā)生了場(chǎng)景變化;而如果判定為它們明顯地相似,則實(shí)施處理以確定,是否發(fā)生了一種靜態(tài)場(chǎng)景。在均勻亮度變化檢測(cè)中,如果檢測(cè)到一個(gè)場(chǎng)景變化,則將兩幀的亮度值進(jìn)行比較,如果亮度的均勻變化即屬兩幀之間的主要變化,則可以判定,在這兩幀之間并沒有發(fā)生場(chǎng)景變化。
圖2A示明一個(gè)主處理器210的例子,它帶有亮度變化檢測(cè)器240。DCT像塊由宏塊產(chǎn)生器206和DCT變換器220提供出。圖2B示明一個(gè)主處理器211的例子,它帶有重要場(chǎng)景檢測(cè)器230和亮度變化檢測(cè)器240。DCT像塊由去量化器218提供出。重要場(chǎng)景處理器230檢測(cè)兩幀之間的場(chǎng)景變化,然后由亮度變化檢測(cè)器240判定,事實(shí)上是否發(fā)生了場(chǎng)景變化,或者兩幀之間的差別是否是由于亮度均勻變化的結(jié)果。如果選擇出一個(gè)發(fā)生了場(chǎng)景變化的關(guān)鍵幀,并提供給幀存儲(chǔ)器234,于是供給至索引存儲(chǔ)器260中。如果檢測(cè)出亮度上有均勻變化,則從這個(gè)相同的場(chǎng)景中不選擇出另一個(gè)關(guān)鍵幀。
本發(fā)明要解決的問題在于,將兩幀進(jìn)行比較,檢測(cè)出兩幀之間重大的差別。有著許多原因會(huì)使這種重大差別的產(chǎn)生可能不是場(chǎng)景變化造成的。例如,視頻信號(hào)可以是一種新聞廣播節(jié)目,視頻記錄者在錄制記者招待會(huì)的節(jié)目帶。這種記者招待會(huì)上,許多照相機(jī)在閃光,它使得兩幀之間的亮度發(fā)生變化。本發(fā)明檢測(cè)到亮度的均勻變化后將它作為相同場(chǎng)景的圖像來對(duì)待,而不是檢知為一種場(chǎng)景變化并選擇出另一個(gè)關(guān)鍵幀。類似地,如果房間中的燈光打開,或是迪斯科舞廳中燈光閃爍,不應(yīng)檢測(cè)成一種場(chǎng)景變化,因?yàn)閮蓭g的差別僅僅是亮度的均勻變化。
本方法和裝置應(yīng)用了DCT(離散余弦變換)系數(shù)的比較來檢測(cè)亮度的均勻變化,但是,其它方法也可以采用。首先,在主處理器210中各別地處理每個(gè)接收到的幀302,產(chǎn)生出8×8數(shù)值的系數(shù)塊440。主處理器210應(yīng)用離散余弦變換器220處理其中包含有空間信息的每個(gè)8×8系數(shù)塊440,提取出DCT系數(shù)并建立起宏塊308。
當(dāng)接收的視頻信號(hào)是MPEG之類壓縮的視頻格式時(shí),DCT系數(shù)可以在去量化之后提取出,不需要由離散余弦變換器進(jìn)行處理。另外,如前面所述,取決于使用的裝置,DCT系數(shù)可以自動(dòng)提取得到。
DCT變換器對(duì)每個(gè)像塊440(圖4)也即Y1、Y2、Y3、Y4、Cr和Cb提供出DCT系數(shù)值。按照此標(biāo)準(zhǔn),每個(gè)系數(shù)塊的左上角包含直流信息(DC值),其余的DCT系數(shù)包含了交流信息(AC值)。如圖4中部分地所示,從DC值右邊起的“Z”字形順序中AC值序號(hào)按空間頻率而增加,其次到達(dá)DC值正下方的DCT系數(shù)。圖4中的各個(gè)Y值是各個(gè)亮度值。
在接著的方法中,進(jìn)行的處理限于對(duì)兩幀內(nèi)相應(yīng)塊之間各DC值的變化予以檢測(cè),以更快地產(chǎn)生出結(jié)果,并且這種有限的處理在效率上并無重大損失;然而,很明顯,本技術(shù)領(lǐng)域內(nèi)的熟練人員也可以對(duì)相應(yīng)之宏塊間亮度上的差別進(jìn)行比較,或是采用任何其它方法來檢測(cè)亮度變化。
按照本發(fā)明優(yōu)選實(shí)施例的方法和裝置,通過比較兩幀的相關(guān)像塊之DC值來判定,亮度是否發(fā)生了實(shí)質(zhì)上均勻的變化。
假定,n是一幀內(nèi)像塊的數(shù)目。又假定,F(xiàn)1為第一幀,F(xiàn)2為第二幀,F(xiàn)1[i]是第一幀內(nèi)的第i像塊,F(xiàn)2[i]是第二幀內(nèi)的第i像塊。再假定,diffmin首先設(shè)定至某個(gè)高值上,諸如1,000,000,diffmax首先設(shè)定至某個(gè)低值上,諸如-9,000,000,然后,作出如下的比較
For i=0 to nDiff=ABS(F1[i]-F2[i])If diff<diffmin then diffmin=diff;If diff>diffmax then diffmax=diff;i=i+1endIf(diffmax-diffmin)<閾值,則無場(chǎng)景變化發(fā)生。
上面的計(jì)算法是計(jì)算兩個(gè)直流系數(shù)之間差值的絕對(duì)值,一個(gè)直流系數(shù)是第一幀內(nèi)每個(gè)像塊的直流系數(shù),另一個(gè)是第二幀內(nèi)其相關(guān)像塊的直流系數(shù)。然后,將此差值與diffmin和diffmax進(jìn)行比較,以尋找出兩幀之間相應(yīng)直流系數(shù)間的最小差值和最大差值。如果最大差值(diffmax)與最小差值(diffmin)之間的差值小于某一個(gè)閾值,則所有DC值已經(jīng)改變了大約相同的量值,它指明亮度有變化。本發(fā)明的一個(gè)優(yōu)選實(shí)施例中,閾值在任何地方選擇為最后的diffmax值的0至10%之間,但依賴于應(yīng)用情況而此閾值可變動(dòng)。
如果判定,在兩幀之間發(fā)生了亮度均勻變化,則對(duì)兩個(gè)幀序列不選擇出一個(gè)關(guān)鍵幀。應(yīng)當(dāng)指出,可以應(yīng)用檢測(cè)亮度變化的其它方法,諸如應(yīng)用直方圖法和小波變換法等,本發(fā)明不限制于上面說明的實(shí)施例。亮度變化之比率與色度變化之比率間的比較可應(yīng)用來確定亮度變化,或者任何其它的公式可應(yīng)用來確定亮度變化。
圖6A至圖6D示明檢測(cè)場(chǎng)景變化的兩種方案,兩幀之間的差別只是亮度有變化。圖6A是照相機(jī)閃光時(shí)的一個(gè)圖像例子。圖6B示明在照相機(jī)閃光后的該同一圖像。類似地,圖6C中示明在燈光關(guān)掉時(shí)迪斯科舞廳的場(chǎng)景,圖6D中示明在燈光打開時(shí)的該同一場(chǎng)景。
本發(fā)明的說明中應(yīng)用了DCT系數(shù),但人們可以用其它代表性的值來取代,諸如小波系數(shù)、直方圖等,或是運(yùn)算于圖像子區(qū)域上的一個(gè)函數(shù),它對(duì)該子區(qū)域可給出一個(gè)代表性的值。此外,本發(fā)明以一種視頻索引系統(tǒng)為基準(zhǔn)作出了說明,然而,總體上它屬于檢測(cè)兩幀之間的亮度均勻變化,所以它也可以用作一種搜索裝置來檢測(cè)各場(chǎng)景哪兒有照相機(jī)閃光,或是另一種情況下它用作一種歸檔方法來采集有代表性的各幀。
雖然,結(jié)合優(yōu)選實(shí)施例已經(jīng)說明了本發(fā)明,但應(yīng)理解到,本技術(shù)領(lǐng)域內(nèi)的熟練人員顯然可以在上面勾畫出的原理內(nèi)作出修改,因此,本發(fā)明不限制于優(yōu)選實(shí)施例,而預(yù)定包羅及此類的修改。
權(quán)利要求
1.一種用于在兩幀之間檢測(cè)亮度均勻變化的系統(tǒng),包含有一個(gè)接收機(jī)(210,202),它接收信源視頻,而信源視頻中具有由亮度值構(gòu)成的各幀;以及一個(gè)比較器(230,240),它將第一幀內(nèi)的亮度值與第二幀內(nèi)相關(guān)的亮度值進(jìn)行比較,以檢測(cè)第一幀中的所有亮度值與第二幀中的相比較時(shí),是否顯著地變化了實(shí)質(zhì)上相同的量值。
2.權(quán)利要求1的系統(tǒng),其中,亮度值轉(zhuǎn)換成DCT(離散余弦變換)系數(shù)的形式。
3.權(quán)利要求1的系統(tǒng),其中,亮度值轉(zhuǎn)換成小波系數(shù)的形式。
4.權(quán)利要求1的系統(tǒng),其中,亮度值轉(zhuǎn)換成直方圖值的形式。
5.權(quán)利要求1的系統(tǒng),還包括一個(gè)比較器(230,240),它計(jì)算出第一幀和第二幀中所有對(duì)應(yīng)的亮度值之間的一個(gè)最大差值(diffmax),以及第一幀和第二幀中所有對(duì)應(yīng)的亮度值之間的一個(gè)最小差值(diffmin),然后,將ABS(diffmax-diffmin)與一個(gè)閾值進(jìn)行比較,以判定是否已經(jīng)發(fā)生了亮度均勻變化。
6.權(quán)利要求5的系統(tǒng),其中,所述閾值大約為diffmax的0至10%。
7.一種視頻索引系統(tǒng),用于檢測(cè)場(chǎng)景變化,并對(duì)每個(gè)場(chǎng)景選擇出關(guān)鍵幀,系統(tǒng)中包含有場(chǎng)景變化檢測(cè)器(230),它檢測(cè)在兩個(gè)視頻幀之間的場(chǎng)景變化;以及均勻亮度變化檢測(cè)器(240),當(dāng)檢測(cè)到場(chǎng)景變化時(shí),它接收這兩個(gè)視頻幀,并判定兩幀之間的差別是否實(shí)際上只是亮度均勻變化。
8.權(quán)利要求7的系統(tǒng),其中,亮度值轉(zhuǎn)換成DCT系數(shù)形式。
9.權(quán)利要求7的系統(tǒng),其中,亮度值轉(zhuǎn)換成小波系數(shù)形式。
10.權(quán)利要求7的系統(tǒng),其中,亮度值轉(zhuǎn)換成直方圖值形式。
11.權(quán)利要求7的系統(tǒng),還包括一個(gè)比較器,它計(jì)算出第一幀和第二幀中所有對(duì)應(yīng)亮度值之間的最大差值(diffmax),以及第一幀和第二幀中所有對(duì)應(yīng)亮度值之間的最小差值(diffmin),然后,將ABS(diffmax-diffmin)與一個(gè)閾值進(jìn)行比較,以判定是否發(fā)生了亮度均勻變化。
12.權(quán)利要求11的系統(tǒng),其中,所述閾值為diffmax的0至10%。
13.一種用于鑒別場(chǎng)景變化檢測(cè)的錯(cuò)誤認(rèn)定的方法,它包含有接收至少兩個(gè)視頻幀,每幀具有各個(gè)亮度值,這兩幀已被檢知為從第一幀到第二幀發(fā)生了場(chǎng)景變化;將第一幀內(nèi)各個(gè)亮度值與第二幀內(nèi)相應(yīng)的亮度值進(jìn)行比較;以及計(jì)算第一幀內(nèi)的所有亮度值是否與第二幀中的相比較顯著地變化了實(shí)質(zhì)上相同的量值,如果如此,則判定在這兩幀之間發(fā)生了錯(cuò)誤認(rèn)定的場(chǎng)景變化。
14.權(quán)利要求13的系統(tǒng),其中,亮度值轉(zhuǎn)換成DCT系數(shù)形式。
15.權(quán)利要求13的系統(tǒng),其中,亮度值轉(zhuǎn)換成小波系數(shù)形式。
16.權(quán)利要求13的系統(tǒng),其中,亮度值轉(zhuǎn)換成直方圖值方式。
17.權(quán)利要求13的系統(tǒng),還包括一個(gè)比較器,它計(jì)算出第一幀和第二幀中所有對(duì)應(yīng)的亮度值之間的最大差值(diffmax),以及第一幀和第二幀中所有對(duì)應(yīng)的亮度值之間的最小差值(diffmin),然后,將ABS(diffmax-diffmin)與一個(gè)閾值進(jìn)行比較,以判定是否發(fā)生了亮度均勻變化。
18.權(quán)利要求17的系統(tǒng),其中,所述閾值為diffmax的0至10%。
全文摘要
一種視頻圖像索引方法和裝置,用于對(duì)視頻中每個(gè)檢測(cè)出的場(chǎng)景選擇關(guān)鍵幀。本方法和裝置可判定,在兩個(gè)視頻幀之間是否發(fā)生了場(chǎng)景變化,或者兩個(gè)視頻幀之間的變化僅僅是亮度值的均勻變化。
文檔編號(hào)G11B27/28GK1349711SQ00807006
公開日2002年5月15日 申請(qǐng)日期2000年12月15日 優(yōu)先權(quán)日1999年12月30日
發(fā)明者T·麥格, N·蒂米特羅瓦 申請(qǐng)人:皇家菲利浦電子有限公司