專利名稱:利用目標形狀編碼具有一個目標的圖象信號的方法和設備的制作方法
技術領域:
本發(fā)明涉及在低比特速率下編碼圖象信號的方法和設備,更具體地,涉及利用目標的形狀編碼具有一個目標的圖象信號的方法和設備。
在諸如高清晰度電視和可視電話系統(tǒng)之類的各種電子設備中,視頻信號可以以數(shù)字形式發(fā)送。當包含一系列視頻幀的視頻信號被表示為數(shù)字形式時,存在著大量的數(shù)字數(shù)據(jù)因為一個視頻幀的每一行是被一系列稱為“象素”的數(shù)字數(shù)據(jù)單元來確定的。然而,因為常規(guī)的傳輸信道的可用頻帶寬是受到限制的。為了通過固定的信道傳輸該大量的數(shù)字數(shù)據(jù),通常利用一視頻信號編碼方法來壓縮數(shù)字數(shù)據(jù)。
用于低速率編碼系統(tǒng)的編碼圖象信號的這種方法之一使用了稱為目標取向分析-綜合編碼技術(參見Michael Hotter,”O(jiān)bject-Oriented Analysis-Synthesis Coding BasedOn Moving Two-Dimensional Objects”,Signal ProccessingImage Communication,2,409-428(1990))。
按照目標取向分析-綜合編碼技術,具有運動著的目標的輸入圖象信號被分割為多個目標;且三組參數(shù),即,確定每個目標的運動、輪廓、和象素數(shù)據(jù)的參數(shù)是通過不同的編碼信道予以處理。
在對圖象數(shù)據(jù)或位于一個目標之內(nèi)的象素進行處理的情況下,在目標取向分析-綜合編碼技術中可以使用用于減少含在圖象數(shù)據(jù)中的的空間冗余度的編碼變換技術。用于圖象數(shù)據(jù)壓縮的最經(jīng)常使用的編碼變換技術之一是基于塊變換編碼技術的DCT(離散余弦變換),該技術將一個數(shù)字圖象數(shù)據(jù)塊,例如,8×8象素的塊變換為一組變換系數(shù)數(shù)據(jù)。這種方法描述在例如,作者為Chen和Pratt的“Scene Adaptive Coder”(IEEETransactions on Communications,COM-32,No.3 pp.225-232(March 1984))的文章中。
在基于塊變換編碼技術的DCT中,背景或在塊中的非目標區(qū)被填充以例如0、平均象素值、或該塊中目標區(qū)的鏡象圖象,然后進行變換。
圖1A表示在塊中的目標區(qū)和背景區(qū)。參照圖1B和1C,表示出對于一維情況的用于填充背景區(qū)的常規(guī)方法。具體來講,在圖1B中,背景區(qū)被填充以0;而在圖1C中,背景區(qū)被填充以目標區(qū)的平均象素值。
即使這些方法具有能夠使用常規(guī)方法(諸如,聯(lián)合攝影專家組JPEG,運動圖象專家組MPEG,H.261等等)中使用的兩維DCT塊的優(yōu)點,但是還是要在圖象的背景區(qū)中引入不必要的或不希望的數(shù)據(jù),因此,從數(shù)據(jù)壓縮的觀點來看,壓縮是不充分的。
因此,本發(fā)明的主要目的是提供一種利用目標的形狀有效地編碼具有一個目標的圖象信號的方法和設備,從而改善其數(shù)據(jù)壓縮效率。
按照本發(fā)明的一個方面,提供一種使用在具有一個目標的數(shù)字圖象幀信號的編碼器中的方法,其中數(shù)字圖象幀信號被分為多個N×N象素的大小相等的塊,并且包括含在目標中的目標象素和位于目標之外的背景象素,N是正整數(shù),該方法包括以下步驟
(a)對在數(shù)字圖象幀信號中的目標的形狀信號進行編碼,該形狀信號包括該目標的大小、位置、和輪廓的數(shù)據(jù);(b)解碼已編碼的形狀信號,以提供一個重建的形狀信號;(c)變換數(shù)字圖象幀信號中的背景象素值為利用目標象素值得到的延伸值,由此提供延伸圖象幀信號;(d)根據(jù)重建的形狀信號構成在延伸圖象幀信號中的重建目標并檢測包括一個或多個重建目標象素的目標塊,每個重建目標象素表示一個包括在重建目標中的象素;(e)構成具有L×L象素大小且包括每個目標塊中所有重建目標象素的最小處理塊,L是一個正整數(shù);以及(f)編碼該最小處理塊。
本發(fā)明的上述的和其它的目的和特點從下面結合各附圖對各優(yōu)選實施例的描述中會變得顯而易見,其中圖1A到1C表示填充背景區(qū)的不同方法;圖2提供一個說明按照本發(fā)明的數(shù)字圖象幀信號編碼設備的方框圖;圖3A到3D表示常規(guī)的重復填充技術。
一個數(shù)字圖象幀信號具有多個相等大小的塊,其中塊的典型大小在8×8和32×32象素之間。具有一個目標的數(shù)字圖象幀信號包括含在目標中的目標象素和位于目標之外的背景象素。背景象素可以由遠大于或小于普通象素值的那樣的值來表示。
參照圖2,其中表示出用于根據(jù)本發(fā)明的編碼數(shù)字圖象幀信號的設備20的方框圖。該編碼設備20包括第一和第二編碼信道200和500、填充裝置300、處理塊發(fā)生器400、格式化電路600。第一編碼信道200包括形狀編碼器210和形狀解碼器220,第二編碼信道500包括變換編碼器510、量化器520、和熵編碼器530。
如圖2所示,包括表征數(shù)字圖象幀信號中的目標形狀的大小、位置、和輪廓數(shù)據(jù)的形狀信號被從形狀檢測器(未示出)提供到第一編碼信道200,在那里將被編碼。在形狀編碼器210中,形狀信號首先利用例如,JPEG(聯(lián)合攝影專家組)的二進制運算碼進行編碼,然后該已編碼的形狀信號被饋送到形狀解碼器220和格式化電路600。形狀解碼器220將已編碼的形狀信號變換回為重建的形狀信號。再將重建的形狀信號提供到處理塊發(fā)生器400。
與此同時,填充裝置300對于輸入到其中的數(shù)字圖象幀信號執(zhí)行填充處理,這種處理是利用常規(guī)的重復填充技術將該信號變換為一種延伸的圖象幀信號,由此在第二編碼信道500中改善數(shù)據(jù)的壓縮效率。參照圖3A,其中表示出一種數(shù)字圖象幀,其中黑色區(qū)域表示一個目標區(qū)域。在如圖3所示的目標的輪廓上的象素值在水平和垂直方向上被延伸,分別如圖3B和3C所示填充背景區(qū)域,其中執(zhí)行水平和垂直延伸的順序可以根據(jù)圖象的特性來決定。水平延伸可以按逐行地執(zhí)行,而垂直延伸可以逐列地執(zhí)行。如圖3D所示的在水平和垂直延伸以后剩下的未填充的背景區(qū)域可以利用水平和垂直延伸區(qū)的象素值來填充。從填充塊300得到的延伸圖象幀信號被提供到處理塊發(fā)生器400。
首先,處理塊發(fā)生器400根據(jù)從形狀解碼器220提供的重建形狀信號在延伸圖象幀中形成一個重建目標,并檢測其中包括一個或多個重建目標象素的目標塊,其中該重建目標象素表示包括在重建目標中的一個象素。處理塊發(fā)生器400構成包括每個目標塊中所有重建目標象素并具有L×L的大小的一個最小的處理塊,L是正整數(shù)。該最小處理塊被提供到在第二編碼信道500中的變換編碼器510。
變換編碼器510利用例如離散余弦變換(DCT),將來自處理塊400的空間域的最小處理塊的圖象信號變換為在頻域的一組變換系數(shù),并把這組變換系數(shù)提供到量化器520。在量化器520中,該組變換系數(shù)利用公知的量化方法被量化;然后該組已量化的變換系數(shù)被饋送到熵編碼器530進行進一步的處理。
熵編碼器530利用例如行程編碼和可變步長編碼技術的組合,編碼來自量化器520的一組已量化的變換系數(shù),產(chǎn)生編碼的圖象幀信號。來自熵編碼器530的已編碼圖象幀信號然后被提供到格式化電路600。
格式化電路600格式化來自在第一編碼信道200中的形狀編碼器210的已編碼形狀信號和來自在第二編碼信道500中的熵編碼器530的已編碼圖象幀信號,由此提供一個格式化的數(shù)字圖象幀信號到發(fā)送機,以便將其發(fā)送。
已經(jīng)參照具體的實施例對本發(fā)明進行了描述,在不脫離按下列的權利要求書限定的本發(fā)明的范圍的前提下,對于本專業(yè)的技術人員來說做出各種變化和改進是顯而易見的。
權利要求
1.一種用于編碼具有一個目標的數(shù)字圖象幀信號的方法,其中該數(shù)字圖象幀信號被分為多個N×N象素的等大小的塊,并包括含在目標中的目標象素和位于目標外的背景象素,N是一個正整數(shù),該方法包括以下步驟(a)對在數(shù)字圖象幀信號中的目標的形狀信號進行編碼,該形狀信號包括該目標的大小、位置、和輪廓的數(shù)據(jù);(b)解碼已編碼的形狀信號,以提供一個重建的形狀信號;(c)將數(shù)字圖象幀信號中的背景象素值變換為利用目標象素值得到的延伸值,由此提供延伸圖象幀信號;(d)根據(jù)重建的形狀信號構成在延伸圖象幀信號中的重建目標并檢測包括一個或多個重建目標象素的目標塊,每個重建目標象素表示一個包括在重建目標中的象素;(e)構成具有L×L象素大小且包括每個目標塊中所有重建目標象素的最小處理塊,L是一個正整數(shù);以及(f)編碼該最小處理塊。
2.一種用于編碼具有一個目標的數(shù)字圖象幀信號的設備,其中該數(shù)字圖象幀信號被分為多個N×N象素的等大小的塊,并包括含在目標中的目標象素和位于目標外的背景象素,N是一個正整數(shù),該設備包括用于對在數(shù)字圖象幀信號中的目標的形狀信號進行編碼的裝置,該形狀信號包括該目標的大小、位置、和輪廓的數(shù)據(jù);用于解碼已編碼的形狀信號,以提供一個重建的形狀信號的裝置;用于將數(shù)字圖象幀信號中的背景象素值變換為利用目標象素值得到的延伸值,由此提供延伸圖象幀信號的裝置;用于根據(jù)重建的形狀信號構成在延伸圖象幀信號中的重建目標并檢測包括一個或多個重建目標象素的目標塊的裝置,每個重建目標象素表示一個包括在重建目標中的象素;用于構成具有L×L象素大小且包括每個目標塊中所有重建目標象素的最小處理塊的裝置,L是一個正整數(shù);以及(f)用于編碼該最小處理塊的裝置。
全文摘要
一種圖象幀信號的編碼方法,該方法編碼數(shù)字圖象幀信號中的目標的形狀信號,并解碼已編碼的形狀信號,以提供一個重建的形狀信號,并變換數(shù)字圖象幀信號中的背景象素為延伸值,由此提供延伸的圖象幀信號。和圖象幀信號的編碼方法,該方法檢測包括一個或多個重建目標象素的目標塊并編碼具有L×L象素大小且包括每個塊中所有的重建目標象素的最小處理塊。
文檔編號H04N7/26GK1165455SQ9611990
公開日1997年11月19日 申請日期1996年9月11日 優(yōu)先權日1996年5月10日
發(fā)明者金鐘一 申請人:大宇電子株式會社