專利名稱:使用外延插值技術對具有目標的圖象信號編碼的方法及裝置的制作方法
技術領域:
本發(fā)明涉及以對低比特率圖象信號編碼的方法及裝置,更具體地,涉及使用外延插值(“E-I”)技術對具有目標的圖象信號編碼的方法及裝置。
在諸如高清晰度電視及電視電話系統(tǒng)的各種電子應用方面,視頻信號采用數(shù)字方式傳輸。當包括一序列的視頻“幀”用數(shù)字形式表達時,將產(chǎn)生大量的數(shù)字數(shù)據(jù)對于視頻幀的每行用一個序列的被稱為“象素”的數(shù)字數(shù)據(jù)單元來定義。但是,由于在傳統(tǒng)傳輸頻道中可獲得的頻帶寬度是有限的,為了要通過固定的頻道傳輸大量的數(shù)字數(shù)據(jù),通常使用視頻信號編碼方法來壓縮數(shù)字數(shù)據(jù)。
對于低比特率編碼系統(tǒng),用來對圖象信號編碼的這類方法之一是所謂的面向目標的分析綜合編碼技術(見Michael/Hotter著“基于移動二維目標的面向目標的分析綜合編碼”,信號處理圖象通信(SignalProcessingImage Communication)2,409-428(1990))。
根據(jù)面向目標的分析綜合編碼技術,具有移動目標的輸入圖象信號被劃分成多個目標;對于每個目標的用于確定運動、輪廓及象素數(shù)據(jù)的三組參數(shù)通過不同的編碼通道來處理。
在處理位于一目標內(nèi)的圖象數(shù)據(jù)或象素的情況下,在面向目標的分析綜合編碼技術中主要用來使包含在圖象數(shù)據(jù)中的空間冗余減小的變換編碼技術。最經(jīng)常使用的用于圖象數(shù)據(jù)壓縮的變換編碼技術之一是基于DCT(離散余弦變換)的塊變換編碼,它將一塊數(shù)字圖象數(shù)據(jù)例如一個8×8象素塊轉(zhuǎn)換成一組變換系數(shù)數(shù)據(jù)。這種方法如描述在Chen和Pratt著的“場景自適應編碼器”(IEEE通信學報,COM-32,第三期第225-232頁(1984年3月))中。
在基于DCT的塊變換編碼中,一個塊中的背景或無目標區(qū)域被填以如零、塊中目標區(qū)域的平均象素值或鏡象,然后進行變換。參見
圖1B及1C,它們表示對于1維情況的填充背景區(qū)域的傳統(tǒng)方法。具體地,在圖1B中,背景區(qū)域被填以0;而在圖1C中,背景區(qū)域被填以目標區(qū)域中的平均象素值。
雖然這些方法具有能使用在傳統(tǒng)方法(例如聯(lián)合攝影專家組JPEG,活動圖象專家組MPEG,H.261等)中應用的兩維DCT塊的優(yōu)點,但在圖象的背景區(qū)域中還包含不需要的或不期望的數(shù)據(jù),因此,從數(shù)據(jù)壓縮的觀點來看是低效率的。
因此,本發(fā)明的主要目的是使用外延插值技術對具有目標的圖象幀信號進行有效編碼的方法,由此改善其數(shù)據(jù)壓縮效率。
本發(fā)明的另一目的是提供一種圖象編碼裝置,它使用以塊為基礎的變換及外延插值技術對具有目標的視頻幀信號進行編碼。
根據(jù)本發(fā)明的一個方面,提供了將包含在具有目標的圖象幀信號中的處理塊轉(zhuǎn)換成外延處理塊的方法,其中處理塊由分類成目標象素及背景象素的N×N個象素組成,N為正整數(shù),目標象素位于目標內(nèi)部,而背景象素位于目標的外部,該方法包括以下步驟(A)基于處理塊中目標象素的形狀,確定具有優(yōu)先權的水平或垂直外延;(B)在水平外延具有優(yōu)先權的情況下,選擇多個目標行,每個目標行是具有至少一個目標象素的處理塊的行,并對于每個目標行設置第一矢量,第一矢量的每個元素是包括在所述每個目標行中的每個目標象素的值,而垂直外延具有優(yōu)先權的情況下,選擇多個目標列,每個目標列是具有至少一個目標象素的處理塊的列,并對于每個目標列設置第一矢量,第一矢量的每個元素是包括在所述每個目標列中的每個目標象素值,由此提供L個第一矢量,L是在從0至N范圍中的一個整數(shù),并表示目標行或目標列的數(shù)目;(C)對于每個第一矢量,基于所述每個第一矢量的元素數(shù)及N,在多個預定處延矩陣中選擇一個外延矩陣,并將選出的外延矩陣乘以所述每個第一矢量,由此提供L個外延第一矢量,L個外延第一矢量的每個具有N個元素;(D)在水平外延具有優(yōu)先權的情況下,設置包括L行的第一外延處理塊,每行具有N個象素,其值為每個外延第一矢量的元素,并對于第一外延處理塊的每列設置L維第二矢量,第二矢量的元素是包括在第一外延塊的所述每列中的象素值,而在垂直外延具有優(yōu)先權的情況,設置包括L列的第一外延處理塊,每列具有N個象素,其值為每個外延第一矢量的元素,并對于第一外延處理塊的每行設置L維第二矢量,第二矢量的元素是包括在第一外延塊的所述每行中的象素值;(E)基于L及N的值在多個預定外延矩陣中選擇一個外延矩陣;(F)將在步驟(E)中選擇出的外延矩陣乘以每個第二矢量,由此提供N個外延第二矢量,N個外延第二矢量的每個具有N個元素;及(G)在水平外延具有優(yōu)先權的情況下,提供包括N列的外延處理塊,每個列具有N個象素,其值為每個外延第二矢量的元素,而在垂直外延具有優(yōu)先權的情況下,提供包括N行的外延處理塊,每個行具有N個象素,其值為每個外延第二矢量的元素。
根據(jù)本發(fā)明的另一方面,提供了一種對具有目標的視頻幀信號編碼的裝置,其中圖象幀信號由目標象素及背景象素組成,目標象素位于目標內(nèi)部,而背景象素位于目標外部,該裝置包括(A)用于檢測包括在圖象幀中的目標邊界,以產(chǎn)生提供邊界信息以便跟蹤目標邊界的輪廓信號的裝置;(B)用于對輪廓信號編碼以產(chǎn)生第一編碼圖象幀信號的裝置;(C)用于將圖象幀分成多個處理塊的裝置,每個處理塊具有N×N個象素,N是正整數(shù);(D)用于產(chǎn)生指示是否目標邊界的一部分存在于每個處理塊中的控制信號的裝置;(E)用于響應控制信號將處理塊分成第一及第二組處理塊的裝置,其中目標邊界的一部分存在于第一組的每個處理塊中;(F)用于將每個第一組的處理塊轉(zhuǎn)換為外延處理塊的裝置;(G)對外延處理塊或第二組的處理塊編碼,由此產(chǎn)生第二編碼圖象幀信號的裝置;及
(H)用于將第一及第二編碼圖象信號格式化的裝置;其中所述用于轉(zhuǎn)換的裝置包括(F1)用于基于每個第一組的處理塊中的目標象素的形狀確定是水平還是垂直外延具有優(yōu)先權的裝置;(F2)在水平外延具有優(yōu)先權時,選擇多個物體行,每個目標行是具有至少一個目標象素的處理塊的行,并對于每個目標行設置第一矢量,第一矢量的每個元素是包括在所述每個目標行中的每個目標象素的值,而在垂直外延具有優(yōu)先權的情況下,選擇多個目標列,每個目標列是具有至少一個目標象素的處理塊的列,并對于每個目標列設置第一矢量,第一矢量的每個元素是包括在所述每個目標列中的每個目標象素值,由此提供L個第一矢量的裝置,L是在從0至N范圍中的一個整數(shù),并表示目標行或目標列的數(shù)目;(F3)對于每個第一矢量,基于所述每個第一矢量的元素數(shù)及N,在多個預定外延矩陣中選擇一個外延矩陣,并將選出的外延矩陣乘以所述每個第一矢量,由此提供L個外延第一矢量的裝置,L個外延第一矢量的每個具有N個元素;(F4)在水平外延具有優(yōu)先權的情況下,設置包括L行的第一外延處理塊,每行具有N個象素,其值為每個外延第一矢量的元素,并對于第一外延處理塊的每列設置L維第二矢量,第二矢量的元素是包括在第一外延塊的所述每列中象素值,而在垂直外延具有優(yōu)先權的情況下,設置包括L列的第一外延處理塊,每列具有N個象素,其值為每個外延第一矢量的元素,并對于第一外延處理塊的每行設置L維第二矢量的裝置,第二矢量的元素是包括在第一外延塊的所述每行中的象素值;
(F5)基于L及N的值在多個預定外延矩陣中選擇一個外延矩陣的裝置;(F6)將在用于選擇的裝置上選擇出的外延矩陣乘以每個第二矢量,由此提供N個外延第二矢量的裝置,N個外延第二矢量的每個具有N個元素;及(F7)一種裝置,它在水平外延具有優(yōu)先權的情況下,設置包括N列的外延處理塊,每個列具有N個象素,其值為每個外延第二矢量的元素,而在垂直外延具有優(yōu)先權的情況下,設置包括N行的外延處理塊,每個行具有N個象素,其值為每個外延第二矢量的元素。
從以下結合附圖對優(yōu)先實施例的描述中,將會使本發(fā)明的上述及另外目的及特征更加闡明了,附圖為圖1A至1D表示填充背景區(qū)域的不同方法;圖2A至2C表示根據(jù)本發(fā)明的外延插值技術;圖3表示線性插值方法;圖4為表示根據(jù)本發(fā)明的圖象信號編碼裝置的電路框圖;及圖5表示圖4中所示的外延插值裝置的詳細電路框圖。
參照圖2A,它表示一個包括8×8個象素的數(shù)字圖象信號塊,它們中的每個用一方塊表示。該塊包括由陰影象素表示的目標區(qū)域及剩余背景區(qū)域。陰影象素被稱為目標象素,而另外的象素被稱為背景象素。使用本發(fā)明的外延插值(“E-I”)技術使目標象素填滿整個塊,如圖2B至2C所示。為實現(xiàn)這個,將分別單獨地執(zhí)行水平及垂直外延,如圖2B及2C中所示。或是水平外延或是垂直外延優(yōu)先于另一個執(zhí)行,該優(yōu)先權將根據(jù)圖象特征來確定。水平或垂直外延將逐行或逐列地進行。在一個塊包括N×N個象素的情況下,對于每行或每列,將M維(“M-D”)矢量轉(zhuǎn)換為N維(“N-D”)矢量,其中M是從1至N范圍中的一個整數(shù),M-D矢量的元素是包括在每行或每列中的目標象素值,而N-D矢量的元素是N外延象素值。例如,在圖2A中所示塊的第三行的情況下,5維矢量被轉(zhuǎn)換為代表水平外延塊第三行的8維矢量,如圖2B中所示。
通過將M點1維(“1-D”)DCT施加給M-D矢量f1所獲得的變換M-D矢量F1被表示如下 式中f1(n1)是f1的第n1元素;F1(k1)是F1的k1元素;n1及k1是從0至M-1范圍中的整數(shù);及bij被表示為1Mi=0]]>2Mcos[π(2j+1)i2M]i≠0]]>類似地,當使用本發(fā)明的E-I技術將M-D矢量f1外延形成N-D矢量f2時,通過將N點1-D DCT施加給N-D矢量f2所獲得的變換N-D矢量F2被表示如下 式中f2(n2)是f2的第n2元素;F2(k2)是F2的第k2元素;n2及k2是從0至N-1范圍中的整數(shù);及aij被表示為1Ni=0]]>2Ncos[π(2j+1)i2N]i≠0]]>以下將描述將M-D矢量外延成N-D矢量的兩種方式一種是最優(yōu)E-I方法,而另一種是線性插值方法。
根據(jù)最優(yōu)E-I方法,M-D矢量f1被外延成N-D矢量f2不用產(chǎn)生任何附加的頻域數(shù)據(jù)。這就是,將滿足下式
式(3)式中μo是用于使f2的DC分量等于f1的DC分量的比例系數(shù),并給定為μo=NM]]>當式(3)被滿足時,E-I方法是最優(yōu)的,因為在頻域中不產(chǎn)生附加數(shù)據(jù)。
由式(1)及(2),可推導出f2將如下地由f1獲得 或f2=A-1Bf1式(4B)式中A及B分別表示N×N及N×M矩陣,它們的元素為式(4A)中使用的aij及bij。式(4A)及(4B)可進一步簡化如下 或f2-cf1式(5B)式中C是N×M矩陣并等于A-1B通過使用上述關系,任意形狀的目標可被外延到填滿N×N塊,而不產(chǎn)生附加頻域成分。
相反地,圖2A中的原始數(shù)據(jù)可從圖2C中所示的N×N塊被還原出來。
在N與M相等的情況下,C是一個單位矩陣,因此外延過程沒有改變原始矢量f1,故可被省略。
用于使M-D矢量外延成N-D矢量的另一種方法是眾知的線性插值方法。因為在該外延程序中不涉及矩陣乘法,該線性插值方法從計算的復雜性的觀點來看更簡單些。參見圖3,它表示M及N分別為3和8的情況下的線性插值方法。
在圖2A至2C所描繪的例中,圖2A所示塊的第三至第八行首先使用最優(yōu)E-I或線性插值方法被水平地外延成圖2B中所示塊的那些行。類似地,圖2B中所示塊的各列使用最優(yōu)E-I或線性插值方法被垂直地外延成圖2C中所示塊的那些列。
參照圖4,它表示根據(jù)本發(fā)明的用于對數(shù)字圖象信號編碼的裝置的電路框圖。該編碼裝置包括第一及第二編碼通道100及500,及一個外延插值裝置400,用于產(chǎn)生外延處理塊,以便有效地對圖象信號中的目標邊界部分編碼,其中第一編碼通道100用于對目標的輪廓信號編碼,及第二編碼通道500用于在逐塊的基礎上對數(shù)字圖象信號編碼。
由已知圖象源(未示出),例如一硬盤或CD盤產(chǎn)生的數(shù)字圖象信號被輸入到幀存儲器50用于對其存儲。數(shù)字圖象信號的一幀具有目標,并包括位于目標內(nèi)部的目標象素及位于目標外部的背景象素。背景象素可被表示為它們的值比普通象素值的范圍大得多或小得多的象素。然后,來自于幀存儲器50的圖象幀信號被取到第一編碼通道100中的輪廓檢測器110及一個塊發(fā)生器200中。
第一編碼通道100包括輪廓檢測器110及輪廓編碼器120,它使用公知的輪廓檢測及編碼技術對來自幀存儲器50的圖象幀信號中目標的輪廓信號進行檢測及編碼,以產(chǎn)生編碼的輪廓信號。如該技術領域中公知的,目標的輪廓信號可從被規(guī)定為圖象幀信號的實際特性發(fā)生顯著變化以形成其目標的象素位置的邊緣點來取得。然后,在輪廓檢測器110上檢測出的輪廓信號被提供給輪廓編碼器120,用于它的編碼。
在輪廓編碼器120上,來自輪廓檢測器110的輪廓信號例如使用JPEG(聯(lián)合攝影專家組)的二進制算術碼來進行編碼,接著,編碼的輪廓信號被提供給格式化電路600。
與此同時,塊發(fā)生器200將來自存儲器50的圖象幀信號分成多個具有相同大小即N×N個象素的處理塊,N為正整數(shù),并將這些處理塊逐塊地提供給開關電路300。在開關電路300上,響應來自系統(tǒng)控制器(未示出)的控制信號CS,將來自塊發(fā)生器200的每個處理塊選擇地連接到E-I裝置400或第二編碼通道500。系統(tǒng)控制器基于圖象幀信號中目標的輪廓信息產(chǎn)生控制信號CS,該控制信號CS指示是否在圖象幀中目標邊界的一部分存在于處理塊中。如果目標邊界的一部分存在于處理塊中,也就是,處理塊同時具有目標區(qū)域及背景區(qū)域,處理塊就被連接到E-I裝置400,用于產(chǎn)生外延處理塊;否則它被送到第二編碼通道500。
根據(jù)本發(fā)明,E-I裝置400將來自開關電路300的每個處理塊轉(zhuǎn)換為外延處理塊,以便改善在第二編碼通道500處的數(shù)據(jù)壓縮效率。具體地,提供給E-I裝置400的處理塊類似于圖2A中所示的塊,并在該裝置中,如參照圖2A至2C所解釋的那樣被轉(zhuǎn)換成外延處理塊。
第二編碼通道500包括變換編碼器510,量化器520及熵編碼器530,它用于對包括在來自E-I裝置400的每個外延處理塊中的圖象數(shù)據(jù)或來自開關電路300的非外延處理塊中的圖象數(shù)據(jù)使用傳統(tǒng)變換及統(tǒng)計編碼技術進行編碼。這就是,變換編碼器510使用譬如離散余弦變換(DCT)將來自E-I裝置400或開關電路300的空間域中的每個處理塊的圖象數(shù)據(jù)變換成一組頻域中的變換系數(shù),并將這組變換系數(shù)提供給量化器520。在量化器520上,使用公知的量化方法使這組變換系數(shù)量化;然后,將這組量化的變換系數(shù)提供到熵編碼器530,以便進一步處理。
熵編碼器530使用譬如行程長度及可變長度編碼的組合對來自量化器520的用于每個非外延或外延處理塊的這組量化的變換系數(shù)進行編碼,以產(chǎn)生編碼的圖象幀信號。然后,將被熵編碼器530編碼的圖象幀信號送到格式化電路600。
格式化電路600使來自于第一編碼通道100中輪廓編碼器120的編碼輪廓信號及來自于第二編碼通道500中熵編碼器530的編碼圖象幀信號格式化,由此將格式化數(shù)字圖象信號提供給發(fā)送器(未示出)用于將其發(fā)送。
如以上所說明的,本發(fā)明使用了最優(yōu)E-I或線性插值方法能顯著地降低在編碼過程中存在于目標內(nèi)部的象素和目標外部象素之間的高頻分量,由此改善整體編碼效率。
參見圖5,它表示根據(jù)最優(yōu)外延插值方法的E-I裝置400的詳細電路框圖,該裝置包括控制器410,第一及第二外延單元420和421,及外延矩陣存儲器430。來自開關電路300的處理塊及來自輪廓檢測器110的輪廓信號被連接到控制器410,它產(chǎn)生出用于控制E-I裝置400中另外部分的控制信號。例如,控制器410可基于如處理塊中目標區(qū)域的形狀產(chǎn)生指示是垂直還是水平外延優(yōu)先另一個作出的H/V優(yōu)先權信號;代表目前要在第一或第二外延單元420、421中處理的一行或一列中目標象素數(shù)目的M值信號;和/或識別目前要在第一或第二外延單元420、421中處理的行或列中第一目標象素位置的目標象素開始信號。由控制器410產(chǎn)生的控制信號被連接到外延矩陣存儲器430、第一及第二外延單元420及421。
外延矩陣存儲器430存儲外延矩陣,即式(5B)中的C,用于將M-D矢量轉(zhuǎn)換成N-D矢量。N是根據(jù)系統(tǒng)設計預定的,并在許多情況下為8。因此,可以預先計算用于所有M值的、即1至N的外延矩陣C,并將它們存儲在外延矩陣存儲器430。通過將存儲在外延矩陣存儲器430中的合適外延矩陣乘以由行(或列)中目標象素值構成的M-D矢量可以方便地實現(xiàn)用于處理塊的行(或列)的外延插值。
來自開關電路300的處理塊及來自控制器410的控制信號被提供給第一外延單元420。為了說明起見,將假定水平外延具有優(yōu)先權。在第一外延單元420上,響應來自控制器410的控制信號,選擇待處理的M-D矢量。在圖2A中所示處理塊的情況下,首先選擇出第三行的第三至第七象素值。響應來自控制器410的M值信號,將M值為5的外延矩陣從外延矩陣存儲器430提供給第一外延單元420,并乘以代表第三行目標象素的5-D矢量。對圖2A中所示的處理塊中第四至第八行以類似方式進行處理。
在水平外延結束后,類似于圖2B中所示塊的水平處延處理塊被提供給第二外延單元421。第二外延單元421以基本上與第一外延單元420相似的方式,將由水平外延處理塊的8個列中獲得的8個M-D矢量的每個乘以由外延矩陣存儲器430提供的相應外延矩陣。
來自第二外延單元421的外延處理塊被提供給圖4中所示的第二編碼通道500,并在其中被編碼。
同時,在使用線性插值方法將處理塊轉(zhuǎn)換成外延處理塊的情況下,將不需要外延矩陣存儲器430。此外,取代矩陣乘法,第一及第二外延單元420和421將對由處理塊的每行或每列獲得的M-D矢量進行1-D線性插值以形成N-D矢量,如圖3中所示。除這些以外,圖5中所示E-I裝置的整體功能類似于以上根據(jù)優(yōu)化E-I方法所解釋的功能。
雖然本發(fā)明是針對具體的實施例進行描述的,但顯然,對于本技術領域中的熟練技術人員來說,在不偏離由以下權利要求書限定的精神和范圍的情況下可以作出各種變化和改型。
權利要求
1.用于將包含在具有目標的圖象幀信號中的處理塊轉(zhuǎn)換成外延處理塊的方法,其中處理塊由分類成目標象素及背景象素的N×N個象素組成,N為正整數(shù),目標象素位于目標內(nèi)部,而背景象素位于目標外部,該方法包括以下步驟(A)基于處理塊中目標象素的形狀,確定具有優(yōu)先權的水平或垂直外延;(B)在水平外延具有優(yōu)先權的情況下,選擇多個目標行,每個目標行是具有至少一個目標象素的處理塊的行,并對于每個目標行設置第一矢量,第一矢量的每個元素是包括在所述每個目標行中的每個目標象素的值而在垂直外延具有優(yōu)先權的情況下,選擇多個目標列,每個目標列是至少具有一個目標象素的處理塊的列,并對于每個目標列設置第一矢量,第一矢量的每個元素是包括在所述每個目標列中的每個目標象素值,由此提供L個第一矢量,L是在從0至N范圍中的一個整數(shù),并表示目標行或目標列的數(shù)目;(C)對于每個第一矢量,基于所述每個第一矢量的元素數(shù)目及N,在多個預定外延矩陣中選擇一個外延矩陣,并將選出的外延矩陣乘以所述每個第一矢量,由此提供L個外延第一矢量,L個外延第一矢量的每個具有N個元素;(D)在水平外延具有優(yōu)先權的情況下,設置包括L行的第一外延處理塊,每行具有N個象素,其值為每個外延第一矢量的元素,并對于第一外延處理塊的每列設置L維第二矢量,第二矢量的元素是包括在第一外延塊的所述每列中的象素值,而在垂直外延具有優(yōu)先權的情況下,設置包括L列的第一外延處理塊,每列具有N個象素,其值為每個外延第一矢量的元素,并對于第一外延處理塊的每行設置L維第二矢量,第二矢量的元素是包括在第一外延塊的所述每行中的象素值;(E)基于L及N的值在多個預定外延矩陣中選擇一個外延矩陣;(F)將在步驟(E)中選擇出的外延矩陣乘以每個第二矢量,由此提供N個外延第二矢量,N個外延第二矢量的每個具有N個元素;及(G)在水平外延具有優(yōu)先權的情況下,提供包括N列的外延處理塊,每個列具有N個象素,其值為每個外延第二矢量的元素,而在垂直外延具有優(yōu)先權的情況下,提供包括N行的外延處理塊,每個行具有N個象素,其值為每個外延第二矢量的元素。
2.根據(jù)權利要求1所述的方法,其中用以將M維矢量轉(zhuǎn)換成N維外延矢量的外延矩陣被確定為 式中M為從1至N范圍中的一個整數(shù),bij表示如下1Mi=0]]>2Mcos[π(2j+1)i2M]i≠0]]>aij表示如下1Ni=0]]>2Ncos[π(2j+1)i2N]i≠0]]>及μo給定為μ0=NM]]>
3.用于將包含在具有目標的圖象幀信號中的處理塊轉(zhuǎn)換成外延處理塊的方法,其中處理塊由分類成目標象素及背景象素的N×N個象素組成,N為正整數(shù),目標象素位于目標內(nèi)部,而背景象素位于目標外部,該方法包括以下步驟(A)基于處理塊中目標象素的形狀,確定具有優(yōu)先權的水平或垂直外延;(B)在水平外延具有優(yōu)先權的情況下,選擇多個目標行,每個目標行是具有至少一個目標象素的處理塊的行,并對于每個目標行設置第一矢量,第一矢量的每個元素是包括在所述每個目標行中的每個目標象素的值,而在垂直外延具有優(yōu)先權的情況下,選擇多個目標列,每個目標列是具有至少一個目標象素的處理塊的列,并對于每個目標列設置第一矢量,第一矢量的每個元素是包括在所述每個目標列中的每個目標象素值,由此提供L個第一矢量,L是在從0至N范圍中的一個整數(shù),并表示目標行或目標列的數(shù)目;(C)使用線性插值法將每個第一矢量轉(zhuǎn)換成外延第一矢量,由此提供L個外延第一矢量,L個外延第一矢量的每個具有N個元素;(D)在水平外延具有優(yōu)先權的情況下,設置包括L行的第一外延處理塊,每行具有N個象素,其值為每個外延第一矢量的元素,并對于第一外延處理塊的每列設置L維第二矢量,第二矢量的元素是包括在第一外延塊的所述每列中的象素值,而在垂直外延具有優(yōu)先權的情況下,設置包括L列的第一外延處理塊,每列具有N個象素,其值為每個外延第一矢量的元素,并對于第一外延處理塊的每行設置L維第二矢量,第二矢量的元素是包括在第一外延塊的所述每行中象素值;(E)使用線性插值法將每個第二矢量轉(zhuǎn)換成外延第二矢量,由此提供N個外延第二矢量,N個外延第二矢量的每個具有N個元素;及(F)在水平外延具有優(yōu)先權的情況下,提供包括N列的外延處理塊,每個列具有N個象素,其值為每個外延第二矢量的元素,而在垂直外延具有優(yōu)先權的情況下,提供包括N行的外延處理塊,每個行具有N個象素,其值為每個外延第二矢量的元素。
4.用于將包含在具有目標的圖象幀信號中的處理塊轉(zhuǎn)換成外延處理塊的方法,其中處理塊由分類成目標象素及背景象素的N×N個象素組成,N為正整數(shù),目標象素位于目標內(nèi)部,而背景象素位于目標外部,該方法包括下列步驟(A)選擇處理塊的L行,L行的每個具有至少一個目標象素,L是從0至N范圍中的一個整數(shù);(B)對于在步驟(A)中選擇出的每行,確定表示包含在所述每行中的目標象素數(shù)目的M值,并設置第一矢量,第一矢量的每個元素是M個目標象素中每個的值,M是從1至N范圍中的一個整數(shù);(C)對于每個第一矢量,基于M及N的值,從多個預定外延矩陣中選擇一個外延矩陣,并將選擇出的外延矩陣乘以第一矢量以提供外延第一矢量;(D)設置包括L行的第一外延處理塊,每行具有N個象素,其值為每個外延第一矢量的元素;(E)對第一外延處理塊的每列,設置L維第二矢量,第二矢量的元素是包含在第一外延處理塊所述每列中的象素值;(F)基于L及N的值,在多個預定外延矩陣中選擇一個外延矩陣;及(G)將在步驟(F)上選擇出的外延矩陣乘以每個第二矢量,以提供N個外延第二矢量,并由此提供包括N列的外延處理塊,每列具有N個象素,其值是每個外延第二矢量的元素。
5.根據(jù)權利要求4所述的方法,其中用于將M維矢量轉(zhuǎn)換成N維矢量的外延矩陣被確定為 式中bij表示如下1Mi=0]]>2Mcos[π(2j+1)i2M]i≠0]]>aij表示如下1Ni=0]]>2Ncos[π(2j+1)i2N]i≠0]]>及μo給定為μo=NM]]>
6.用于對具有目標的視頻信號編碼的裝置,其中圖象幀信號由目標象素及背景象素組成,目標象素位于目標內(nèi)部,而背景象素位于目標外部,該裝置包括(A)用于檢測包括在圖象幀中的目標邊界,以產(chǎn)生提供邊界信息以便跟蹤目標邊界的輪廓信號的裝置;(B)用于對輪廓信號編碼以產(chǎn)生第一編碼圖象幀信號的裝置;(C)用于將圖象幀分成多個處理塊的裝置,每個處理塊具有N×N個象素,N是正整數(shù);(D)用于產(chǎn)生指示是否目標邊界的一部分存在于每個處理塊中的控制信號的裝置;(E)用于響應控制信號將處理塊分成第一及第二組處理塊的裝置,其中目標邊界的一部分存在于第一組的每個處理塊中;(F)用于將每個第一組處理塊轉(zhuǎn)換為外延處理塊的裝置;(G)對外延處理塊或第二組的處理塊編碼的,由此產(chǎn)生第二編碼圖象幀信號的裝置;及(H)用于將第一及第二編碼圖象信號格式化的裝置;其中所述用于轉(zhuǎn)換的裝置包括(F1)用于基于每個第一組處理塊中的目標象素的形狀確定是水平還是垂直外延具有優(yōu)先權的裝置;(F2)在水平外延具有優(yōu)先權時,選擇多個目標行,每個目標行是具有至少一個目標象素的處理塊的行,并對于每個目標行設置第一矢量,第一矢量的每個元素是包括在所述每個目標行中的每個目標象素的值,而在垂直外延具有優(yōu)選權的情況下,選擇多個目標列,每個目標列是具有至少一個目標象素的處理塊的列,并對于每個目標列設置第一矢量,第一矢量的每個元素是包括在所述每個目標列中的每個目標象素值,由此提供L個第一矢量的裝置,L是在從0至N范圍中的一個整數(shù),并表示目標行或目標列的數(shù)目;(F3)對于每個第一矢量,基于所述每個第一矢量的元素數(shù)及N,在多個預定外延矩陣中選擇一個外延矩陣,并將選出的外延矩陣乘以所述每個第一矢量,由此提供L個外延第一矢量的裝置,L個外延第一矢量的每個具有N個元素;(F4)在水平外延具有優(yōu)先權的情況下,設置包括L行的第一外延處理塊,每行具有N個象素,其值為每個外延第一矢量的元素,并對于第一外延處理塊的每列設置L維第二矢量,第二矢量的元素是包括在第一外延塊的所述每列中的象素值,而在垂直外延具有優(yōu)先權的情況下,設置包括L列的第一外延處理塊,每列具有N個象素,其值為每個外延第一矢量的元素,并對于第一外延處理塊的每行設置L維第二矢量的裝置,第二矢量的元素是包括在第一外延塊的所述每行中的象素值;(F5)基于L及N的值在多個預定外延矩陣中選擇一個外延矩陣的裝置;(F6)將在用于選擇的裝置上選擇出的外延矩陣乘以每個第二矢量,由此提供N個外延第二矢量的裝置,N個外延第二矢量的每個具有N個元素;及(F7)一種裝置,它在水平外延具有優(yōu)先權的情況下,設置包括N列的外延處理塊,每個列具有N個象素,其值為每個外延第二矢量的元素,而在垂直外延具有優(yōu)先權的情況下,設置包括N行的外延處理塊,每個行具有N個象素,其值為每個外延第二矢量的元素。
7.根據(jù)權利要求6所述的裝置,其中用以將M維矢量轉(zhuǎn)換成N維矢量的外延矩陣被確定為 式中的M為從1至N范圍中的一個整數(shù),bij表示如下1Mi=0]]>2Mcos[π(2j+1)i2M]i≠0]]>aij表示如下1Ni=0]]>2Ncos[π(2j+1)i2N]i≠0]]>及μo給定為μo=NM]]>
全文摘要
用外延插值法對N*N處理塊進行處理,該方法包括a.選擇處理塊的L行;b.對各選擇行確定表示含在各行中的目標象素數(shù)目的M值并設置代表M個目標象素的第一矢量;c.對各第一矢量,基于M及N值,從多個預定外延矩陣中選擇一個,并用其乘以第一矢量以提供外延第一矢量;d.設置包括L行的第一外延處理塊,每行代表每個外延第一矢量;e.對第一外延處理塊的每列設置L維第二矢量;f.基于L及N的值,在多個預定外延矩陣中選擇一個;g.用其乘以各第二矢量提供N個外延第二矢量。
文檔編號H04N7/32GK1139353SQ9610455
公開日1997年1月1日 申請日期1996年4月8日 優(yōu)先權日1995年4月8日
發(fā)明者趙順濟, 崔在覺, 李時雄, 金二漢, 金圣大, 丁海默 申請人:大宇電子株式會社