專利名稱:對(duì)于視頻信號(hào)中的目標(biāo)輪廓圖象進(jìn)行編碼的方法和裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及對(duì)于視頻信號(hào)中的目標(biāo)輪廓圖象進(jìn)行編碼的方法和裝置,尤其是涉及通過(guò)使用根據(jù)卦限和等距頂點(diǎn)編碼技術(shù)的自適應(yīng)編碼方案而能夠?qū)τ趫D象的輪廓進(jìn)行編碼的方法和裝置。
在如可視電話、電視會(huì)議和高清晰度電視系統(tǒng)的數(shù)字電視傳送系統(tǒng)中,由于在視頻的幀信號(hào)中的視頻行信號(hào)包括有被稱之為象素值的數(shù)字?jǐn)?shù)據(jù)的序列,因此需要用大量的數(shù)字?jǐn)?shù)據(jù)來(lái)定義每一個(gè)視頻幀信號(hào)。但是,由于一個(gè)普通的發(fā)送頻道的可用頻帶寬度是有限的,因此為了經(jīng)其發(fā)送大量的數(shù)字?jǐn)?shù)據(jù),有必要通過(guò)使用各種數(shù)字壓縮技術(shù)來(lái)壓縮或降低數(shù)據(jù)量,尤其是在可視電話和電視會(huì)議系統(tǒng)中采用低碼率的視頻信號(hào)編碼的情況中。
針對(duì)一個(gè)低比特速率編碼系統(tǒng)對(duì)于視頻信號(hào)進(jìn)行編碼的技術(shù)之一是所謂的面向目標(biāo)的分解-綜合編碼技術(shù),其中的輸入視頻圖象被分成若干個(gè)目標(biāo),且用于定義每一個(gè)目標(biāo)的運(yùn)動(dòng)、輪廓和象素?cái)?shù)據(jù)的三組參數(shù)通過(guò)不同的編碼頻道而被處理。
在對(duì)于一個(gè)目標(biāo)的輪廓進(jìn)行處理的過(guò)程中,對(duì)于目標(biāo)的形狀的分解和綜合來(lái)說(shuō),輪廓信息是重要的。用于表示輪廓信息的一個(gè)經(jīng)典的編碼方法是一個(gè)鏈?zhǔn)骄幋a方法,其中將所有的輪廓象素的位置信息編碼。但是,這種鏈?zhǔn)骄幋a方法要求相當(dāng)大的數(shù)據(jù)量,盡管這種方法不會(huì)招致在輪廓信息中的任何損失。
為了克服這種鏈?zhǔn)骄幋a方法的缺點(diǎn),已經(jīng)提出幾種方法來(lái)編碼輪廓信息,例如多邊形近似方法、B-旋轉(zhuǎn)近似方法和與多邊形近似技術(shù)相結(jié)合的DST(離散正弦變換)。在這些近似技術(shù)中,用直線或曲線線段近似輪廓,每一條線段連接著在輪廓上定義的相鄰的一對(duì)頂點(diǎn);并且這些頂點(diǎn)被根據(jù)例如所謂的區(qū)域自適應(yīng)卦限編碼技術(shù)而被編碼(見國(guó)際標(biāo)準(zhǔn)化組織,運(yùn)動(dòng)圖象和音頻信息的編碼,ISO/IEC JTCI/SC29/WG11,形狀編碼AHG,1996年7月30日,標(biāo)題是"S4a的修訂的描述幾何表示方法"作者是K.O′Connell,P.Gerken和J.H.Kim)。
參考
圖1,其中示出了傳統(tǒng)的根據(jù)以卦限為基礎(chǔ)的頂點(diǎn)編碼方法對(duì)于在一個(gè)視頻信號(hào)中的目標(biāo)的輪廓進(jìn)行頂點(diǎn)編碼的裝置的框圖。
二進(jìn)制的掩碼被輸入到一個(gè)輪廓提取框10,根據(jù)一個(gè)象素是存在于一個(gè)目標(biāo)區(qū)域還是存在于一個(gè)背景區(qū)域中,在二進(jìn)制掩碼中的每一個(gè)象素用二進(jìn)制值0或1表示。
輪廓提取框10從該二進(jìn)制掩碼提取一個(gè)目標(biāo)的輪廓,并將該輪廓提供到一個(gè)頂點(diǎn)選擇框20。該輪廓是由輪廓象素構(gòu)成,每一個(gè)象素都是位于目標(biāo)的邊界上的一個(gè)目標(biāo)象素。
利用傳統(tǒng)的迭代求精方法,例如多邊形近似技術(shù),頂點(diǎn)選擇框20選擇多個(gè)頂點(diǎn),其中首先確定由最大距離相分離的一對(duì)輪廓象素作為起始頂點(diǎn);其它的輪廓象素被選擇作為頂點(diǎn),直到從連接每一對(duì)相鄰頂點(diǎn)的線段到由該對(duì)相鄰頂點(diǎn)所定義的輪廓線段的垂直距離不超過(guò)一個(gè)預(yù)定的閾值Dmax為止,該對(duì)相鄰的頂點(diǎn)是沿著該輪廓彼此相鄰的。因此,在多邊形近似技術(shù)中,近似的程度是由閾值Dmax的幅度決定的。
在頂點(diǎn)編碼框30中,在頂點(diǎn)選擇框20中確定的頂點(diǎn)被根據(jù)例如所謂的以卦限為基礎(chǔ)的編碼技術(shù)進(jìn)行編碼。
在以卦限為基礎(chǔ)的頂點(diǎn)編碼技術(shù)中,要計(jì)算在每一對(duì)相鄰頂點(diǎn)之間的位移R的一個(gè)X分量和一個(gè)Y分量R(X)和R(Y),以及它們的幅度X-mag和Y-mag。隨后,對(duì)應(yīng)于在所有的X-mag和Y-mag當(dāng)中的最大的幅度的兩個(gè)頂點(diǎn)被選作為該輪廓的初始頂點(diǎn)和結(jié)束頂點(diǎn)。隨后,如圖2所示,沿著該輪廓從初始頂點(diǎn)向結(jié)束頂點(diǎn)順序地對(duì)于N個(gè)(例如8個(gè))頂點(diǎn)作索引。在圖2中,對(duì)應(yīng)于一對(duì)頂點(diǎn)V1和V8的X-mag在從頂點(diǎn)V1到V8獲得的8對(duì)X-mag和Y-mag中是最大的。
在確定了初始和結(jié)束頂點(diǎn)之后,表示位移R1的X-mag和Y-mag的最大值的X-max-mag和Y-max-mag被分別地確定為該輪廓的X的動(dòng)態(tài)范圍和Y的動(dòng)態(tài)范圍,其中R1=Vi+1Vi,而i=1、2、…N-1,其中的Vi是表示頂點(diǎn)Vi的位置矢量。隨后,該X動(dòng)態(tài)范圍和Y動(dòng)態(tài)范圍和初始頂點(diǎn)V1的絕對(duì)位置被編碼,而其余的矢量的每一個(gè),即對(duì)于i=1到(N-1)的Vi+1則根據(jù)從其先前頂點(diǎn)Vi的位移Ri而被編碼。
具體地說(shuō),如圖3所示,頂點(diǎn)Vi+1所屬的卦限是根據(jù)位移Ri的X是分量Ri(X)和Y分量Ri(Y)在卦限0到卦限7當(dāng)中確定的,其中與原點(diǎn)(圖3中用閉合的圓圈表示)最為接近的8個(gè)相鄰的頂點(diǎn)表示這8個(gè)卦限的開始的點(diǎn)。
在確定了針對(duì)于頂點(diǎn)Vi+1的這些卦限之后,利用傳統(tǒng)的差分鏈編碼技術(shù)對(duì)于這些卦限的索引進(jìn)行編碼;并且利用根據(jù)X的動(dòng)態(tài)范圍和Y的動(dòng)態(tài)范圍確定的比特對(duì)于表示相對(duì)于先前的頂點(diǎn)Vi+2的相關(guān)位置的分量Ri(X)和Ri(Y)的幅度進(jìn)行編碼。
這種以卦限為基礎(chǔ)的頂點(diǎn)編碼的另一個(gè)例子是通過(guò)使用所謂的語(yǔ)法自適應(yīng)算術(shù)編碼(SAAC)技術(shù)對(duì)于卦限索引和Ri進(jìn)行編碼。在SAAC中,可能的符號(hào)的數(shù)目取決于動(dòng)態(tài)范圍的最大值,即最大的X動(dòng)態(tài)范圍和Y動(dòng)態(tài)范圍。對(duì)于以卦限為基礎(chǔ)的頂點(diǎn)編碼技術(shù)的更詳細(xì)的了解請(qǐng)參見上述K.O′Connell等人的文章。
如上所述,借助于對(duì)于這些頂點(diǎn)進(jìn)行分級(jí)處理,由于除去初始頂點(diǎn)之外的每一個(gè)頂點(diǎn)都是由該頂點(diǎn)所屬的卦限及Ri(X)和Ri(Y)的幅度所表示的,所以,在卦限為基礎(chǔ)的頂點(diǎn)編碼技術(shù)中表示頂點(diǎn)的數(shù)據(jù)量能夠被有效地降低;并且對(duì)于幅度進(jìn)行編碼所需的比特?cái)?shù)目直接地取決于X動(dòng)態(tài)范圍和Y動(dòng)態(tài)范圍。
但是,這種傳統(tǒng)的輪廓編碼方法仍然需要太大的比特?cái)?shù)據(jù)量來(lái)表示頂點(diǎn),尤其是當(dāng)多數(shù)的X-mag和Y-mag要比X動(dòng)態(tài)范圍和Y動(dòng)態(tài)范圍小得多的情況,或其中存在大量的閉合位移的頂點(diǎn)的情況中,在當(dāng)閾值Dmax是一個(gè)小幅度時(shí)易于出現(xiàn)這種情況。
因此,本發(fā)明的首要目的是提供一個(gè)改進(jìn)的方法和裝置,用于編碼一個(gè)目標(biāo)的輪廓,它能夠有效地對(duì)于該輪廓進(jìn)行編碼。
根據(jù)本發(fā)明,其中提供了一種編碼目標(biāo)的輪廓的方法,該輪廓包括其上的輪廓象素,該方法包括以下的步驟(a)確定該輪廓上的多個(gè)主頂點(diǎn),其中的輪廓被分成多個(gè)主輪廓段,每一個(gè)主輪廓段在其兩端具有一對(duì)主頂點(diǎn),并且把該對(duì)主頂點(diǎn)連接起來(lái)的一條線段到所說(shuō)的每一個(gè)主輪廓段的任何點(diǎn)的垂直距離小于一個(gè)閾值Dmax;(b)順序地在輪廓上確定次頂點(diǎn),其中該輪廓以多個(gè)次輪廓段作劃分,每一個(gè)次輪廓段在其兩端具有一對(duì)次頂點(diǎn),一個(gè)次頂點(diǎn)被定位在遠(yuǎn)距先前確定的次頂點(diǎn)的一組預(yù)定的位置之一處,并且兩個(gè)相鄰的次頂點(diǎn)之間的距離大于一個(gè)象素;(c)對(duì)于主頂點(diǎn)的位置信息進(jìn)行編碼,以便提供編碼的主頂點(diǎn)數(shù)據(jù);(d)對(duì)于次頂點(diǎn)的位置信息進(jìn)行編碼,以便提供編碼的次頂點(diǎn)數(shù)據(jù);(e)估計(jì)一個(gè)編碼的誤差以便與閾值TH作比較;和(f)如果編碼的誤差大于該閾值TH,則提供該編碼的主頂點(diǎn)數(shù)據(jù)作為編碼的輪廓數(shù)據(jù),反之,則提供編碼的次頂點(diǎn)數(shù)據(jù)作為編碼的輪廓數(shù)據(jù)。
從下列結(jié)合附圖對(duì)于最佳實(shí)施例的描述,本發(fā)明的上述和其它的目的和特征將變得顯而易見。
圖1是用于編碼一個(gè)目標(biāo)輪廓的傳統(tǒng)裝置的一個(gè)示意框圖;圖2示出了將一個(gè)優(yōu)先級(jí)賦給頂點(diǎn)的過(guò)程的示意圖;圖3描述了一個(gè)以卦限為基礎(chǔ)的編碼技術(shù);圖4A和4B是根據(jù)本發(fā)明的最佳實(shí)施例的用于對(duì)一個(gè)目標(biāo)的輪廓進(jìn)行編碼的裝置的示意框圖;圖5描述了在圖4A和4B中一個(gè)等距頂點(diǎn)編碼框的詳細(xì)框圖;圖6A和6B示出了在圖4A和4B中的等距頂點(diǎn)編碼框選擇次頂點(diǎn)的一個(gè)過(guò)程;圖7是圖5中的一個(gè)差分鏈編碼框的詳細(xì)框圖;和圖8A和8B展示出圖7中的量化框的實(shí)例量化過(guò)程。
參考圖4,其中示出了根據(jù)本發(fā)明的最佳實(shí)施例的用于對(duì)一個(gè)目標(biāo)的輪廓進(jìn)行編碼的裝置100的示意框圖。
以二進(jìn)制掩碼的形式,一個(gè)目標(biāo)的輪廓圖象被輸入到一個(gè)輪廓提取框40。在輪廓提取框40,提取一個(gè)目標(biāo)的輪廓,其中的輪廓是由目標(biāo)的邊界上的輪廓象素構(gòu)成。從輪廓提取框40提取的輪廓被輸入到一個(gè)第一頂點(diǎn)選擇框50和一個(gè)等距頂點(diǎn)編碼框90。
在第一頂點(diǎn)選擇框50,通過(guò)使用傳統(tǒng)的多邊形近似技術(shù)在輪廓上確定多個(gè)主頂點(diǎn),從而經(jīng)過(guò)線路L20將主頂點(diǎn)數(shù)據(jù)提供到一個(gè)主頂點(diǎn)編碼框80。在輪廓上的主頂點(diǎn)的確定過(guò)程中,首先確定相距最大距離的一對(duì)輪廓象素作為起始頂點(diǎn);其它的輪廓象素被重復(fù)地選擇作為頂點(diǎn),直到從連接每一對(duì)相鄰頂點(diǎn)的一條線段到由該對(duì)頂點(diǎn)確定的一個(gè)輪廓段的垂直距離不超過(guò)一個(gè)預(yù)定的閾值Dmax為止。該確定的頂點(diǎn)于是被設(shè)置為主頂點(diǎn)。
在確定了主頂點(diǎn)之后,從連接每?jī)蓚€(gè)相鄰主頂點(diǎn)的每一條線段沿著該輪廓到與之對(duì)應(yīng)的一個(gè)輪廓段的最大垂直距離在第一頂點(diǎn)選擇框50被確定,并經(jīng)過(guò)線路L10提供到誤差檢測(cè)框60。
誤差檢測(cè)框60從第一頂點(diǎn)選擇框50接收針對(duì)每一個(gè)線段的最大距離并在其中選擇一最大者,將其提供到一個(gè)比較器70作為近似誤差。
比較器70將該近似誤差與一個(gè)預(yù)定的閾值TH1相比較并且如果該近似誤差大于該閾值TH的話,則將第一選擇信號(hào)提供到一個(gè)選擇器95,否則將第二選擇信號(hào)提供到一個(gè)選擇器95。
同時(shí),通過(guò)使用參照?qǐng)D1描述的傳統(tǒng)的卦限為基礎(chǔ)的編碼技術(shù),來(lái)自第一頂點(diǎn)選擇框50的主頂點(diǎn)在主頂點(diǎn)編碼框80被編碼,從而將一個(gè)編碼的主頂點(diǎn)數(shù)據(jù)提供到選擇器95。
響應(yīng)來(lái)自輪廓提取框40的輪廓,該等距頂點(diǎn)編碼框90確定輪廓上的次頂點(diǎn)并對(duì)其編碼,以便將編碼的次頂點(diǎn)數(shù)據(jù)提供到選擇器95。
參考圖5,其中示出了等距頂點(diǎn)編碼框90的詳細(xì)的框圖,其中包括一個(gè)次頂點(diǎn)選擇框110和一個(gè)差分鏈編碼框120。
次頂點(diǎn)選擇框110在從輪廓提取框40接收的輪廓上確定多個(gè)次頂點(diǎn),每一個(gè)次頂點(diǎn)是在遠(yuǎn)距它的相鄰次頂點(diǎn)的一組預(yù)定位置之一處存在的一個(gè)象素。在對(duì)輪廓上的次頂點(diǎn)進(jìn)行確定的過(guò)程中,輪廓的最長(zhǎng)線性部分被檢測(cè),且處在該部分的兩個(gè)端點(diǎn)的輪廓象素之一被設(shè)置成第一次頂點(diǎn)。隨后,建立第一次頂點(diǎn)的搜尋窗口,其中該搜尋窗口的尺寸是(2M+1)×(2N+1)個(gè)象索,并且該搜尋窗口將先前確定的次頂點(diǎn)放置在中心,而M和N是在多邊形近似中根據(jù)閾值Dmax確定的大于1的正整數(shù)。隨后,核查該窗口的任何邊界象素是否與先前沒(méi)有被確定為次頂點(diǎn)的輪廓象素相重合。如果只存在一個(gè)這樣的輪廓象素,該輪廓象素將新選為一個(gè)次頂點(diǎn)。但是如果在邊界象素位置有多于一個(gè)這樣的輪廓象素,則根據(jù)對(duì)于每一個(gè)邊界位置的一個(gè)優(yōu)先級(jí)指定,將這些輪廓象素之一選擇為附加的次頂點(diǎn)。
如圖6A所示,如果由粗線所圍繞的象素RV是該輪廓的第一次頂點(diǎn)的話,就要檢驗(yàn)一個(gè)5×5的搜尋窗口65的16個(gè)陰影邊界象素的每一個(gè)是否為一個(gè)輪廓象素。示范性的邊界象素位置的方向索引1-15表示一個(gè)頂點(diǎn)選擇的優(yōu)先級(jí)。例如,如果在邊界象素位置,例如2到5,發(fā)現(xiàn)多于一個(gè)輪廓象素,則在位置2的輪廓象素被確定為下一個(gè)次頂點(diǎn)。對(duì)于新選擇的次頂點(diǎn)重復(fù)上述的次頂點(diǎn)的確定過(guò)程,直到兩個(gè)初始確定的頂點(diǎn),即第一和第二次頂點(diǎn),分別地在兩個(gè)隨后的搜尋窗口中被檢測(cè)為止。在圖6B中,描繪出一個(gè)示范性的輪廓67的一部分,其中具有利用5×5的象素搜尋窗口所確定的次頂點(diǎn)SV1至SV4。在確定了該輪廓上的這些次頂點(diǎn)之后,第一次頂點(diǎn)位置信息和其余的次頂點(diǎn)的方向索引經(jīng)線路L32和L30被分別地提供到差分鏈編碼框120,它包括量化(Q)框220、量化參數(shù)(QP)確定框222、差分解碼框230和240,如圖7所示。
QP確定框222經(jīng)過(guò)線路L40監(jiān)視在圖4中所示的一個(gè)發(fā)送緩存器96中的緩存滿度或占據(jù)水平,并按照與傳統(tǒng)的量化參數(shù)確定方案相似的方式確定一個(gè)QP。確定的QP被傳送到量化框220。
響應(yīng)該QP,在Q框220對(duì)于接收到的來(lái)自次頂點(diǎn)選擇框110的線路L30上的方向參數(shù)進(jìn)行量化。
圖8A和8B分別地示出了在搜尋窗口是5×5和7×7的情況中的方向索引的量化處理的示意圖。在圖8A和圖8B中,陰影的矩形描繪出代表性的邊界象素,其中的邊界象素被定位在角落處,并且是在各自的搜尋窗口的邊緣的預(yù)定位置。在量化過(guò)程中,非代表性的邊界象素的位置處的次頂點(diǎn)的方向索引用點(diǎn)來(lái)標(biāo)記,例如b和f,由它們相鄰的代表性的邊界象素,例如c和g的方向索引所表示。這些代表性邊界象素的方向索引隨即被重新索引,以便提供代表性的方向索引。通過(guò)以這種方式對(duì)于方向索引的量化,如圖8A和8B中分別所示,將總共16和24個(gè)方向索引減少到8個(gè)代表性的方向索引。
代表性的象素或代表性的索引的數(shù)目是由QP控制的。就是說(shuō),如果QP指示緩存器充滿或占據(jù)水平是高的情況下,就減少代表性邊界象素的數(shù)目,反之亦然。在本發(fā)明的最佳實(shí)施例中,代表性邊界象素的數(shù)目的上界被設(shè)置成在搜尋窗口中的全部邊界象素的數(shù)目,下界設(shè)置成8。在此種情況中,任何次頂點(diǎn)是由定位在四個(gè)角落和在該搜尋窗口的四個(gè)邊緣的中心的8個(gè)代表性的邊界象素之一所表示,而與圖8A和8B中示出的搜尋窗口的大小無(wú)關(guān)。
根據(jù)來(lái)自Q框220的代表性的索引,差分決定框230確定一個(gè)差分索引,從而將該差分索引提供到差分編碼框240,這些差分索引的每一個(gè)表示在兩個(gè)連續(xù)代表性索引的幅度之間的差。
根據(jù)傳統(tǒng)的可變長(zhǎng)度編碼技術(shù)或以合成為基礎(chǔ)的算術(shù)編碼方法,差分編碼框240編碼線路L32上的第一次頂點(diǎn)的位置信息和差分索引,從而提供編碼的次頂點(diǎn)數(shù)據(jù)到選擇器95。
選擇器95應(yīng)第一選擇信號(hào)選擇編碼的主頂點(diǎn)數(shù)據(jù),如果第二選擇信號(hào)被輸入的話,選擇器95選擇編碼的次頂點(diǎn)數(shù)據(jù);并把選擇的數(shù)據(jù)提供到發(fā)送緩存器96作為編碼的輪廓數(shù)據(jù)。編碼的輪廓數(shù)據(jù)經(jīng)過(guò)發(fā)送緩存器96發(fā)送到一個(gè)發(fā)射機(jī)(沒(méi)示出)以便從其發(fā)送。
參考圖4B,其中示出了根據(jù)本發(fā)明的另一個(gè)最佳實(shí)施例的裝置100的示意框圖。
取代在最佳實(shí)施例中的近似誤差,比較器75將閾值Dmax與閾值TH1相比較,如果Dmax大于TH1則通過(guò)線路L25發(fā)送第一選擇信號(hào),反之發(fā)送第二選擇信號(hào)。響應(yīng)該選擇信號(hào),第一和第二選擇器95A和95B執(zhí)行各自的操作。就是說(shuō),響應(yīng)該第一選擇信號(hào),從輪廓提取框40提取的輪廓經(jīng)過(guò)第一選擇器95A傳遞到第一頂點(diǎn)選擇框50,并通過(guò)響應(yīng)第二選擇信號(hào)耦合到等距頂點(diǎn)編碼框90。同時(shí),第二選擇器95B的選擇過(guò)程于圖4A中的選擇器95的選擇過(guò)程完全一樣。在圖4A中和圖4B中,具有相同的參考符號(hào)的框執(zhí)行相同的操作,并因此省略相應(yīng)的說(shuō)明。
雖然本發(fā)明已經(jīng)參考特定的實(shí)施例進(jìn)行了描述,但是對(duì)于本專業(yè)的技術(shù)人員來(lái)說(shuō),在所附的權(quán)利要求的范圍內(nèi)進(jìn)行各種修改和變換是顯然的。
權(quán)利要求
1.一種編碼目標(biāo)的輪廓的方法,該輪廓包括其上的輪廓象素,該方法包括以下的步驟;(a)確定該輪廓上的多個(gè)主頂點(diǎn),其中的輪廓被分成多個(gè)主輪廓段,每一個(gè)主輪廓段在其兩端具有一對(duì)主頂點(diǎn),并且從把該對(duì)主頂點(diǎn)連接的一條線段到所說(shuō)的每一個(gè)主輪廓段的任何點(diǎn)的垂直距離小于一個(gè)閾值Dmax;(b)順序地確定輪廓上的多個(gè)次頂點(diǎn),其中該輪廓以多個(gè)次輪廓段作劃分,每一個(gè)次輪廓段在其兩端具有一對(duì)次頂點(diǎn),一個(gè)次頂點(diǎn)被定位在遠(yuǎn)距先前確定的次頂點(diǎn)的一組預(yù)定的位置之一處,并且兩個(gè)相鄰的次頂點(diǎn)之間的距離大于一個(gè)象素;(c)對(duì)于主頂點(diǎn)的位置信息進(jìn)行編碼,以便提供編碼的主頂點(diǎn)數(shù)據(jù);(d)對(duì)于次頂點(diǎn)的位置信息進(jìn)行編碼,以便提供編碼的次頂點(diǎn)數(shù)據(jù);(e)估計(jì)一個(gè)編碼的誤差以與一閾值TH作比較;和(f)如果編碼的誤差大于該閾值TH,則提供該編碼的主頂點(diǎn)數(shù)據(jù)作為編碼的輪廓數(shù)據(jù),反之,則提供編碼的次頂點(diǎn)數(shù)據(jù)作為編碼的輪廓數(shù)據(jù)。
2.根據(jù)權(quán)利要求1的方法,其中的編碼誤差等于該閾值Dmax。
3.根據(jù)權(quán)利要求1的方法,其中的確定步驟(b)包括以下的步驟(b1)設(shè)置輪廓象素之一作為第一次頂點(diǎn);(b2)形成針對(duì)第一次頂點(diǎn)的一個(gè)搜尋窗口,該搜尋窗口具有(2M+1)×(2N+1)的象素并在中心具有第一次頂點(diǎn),M和N分別是大于1的正整數(shù);(b3)將在該搜尋窗口的中心和邊緣的象素設(shè)置為邊界象素;(b4)將在邊界象素位置之一的一個(gè)輪廓象素設(shè)置為一個(gè)最新確定的次頂點(diǎn);和(b5)對(duì)于最新確定的次頂點(diǎn)重復(fù)步驟(b2)到(b4)。
4.根據(jù)權(quán)利要求3的方法,其中的確定步驟(b)還進(jìn)一步包括在步驟(b5)之后的步驟(b6)利用在搜尋窗口中的預(yù)定邊界象素之一表示每一個(gè)非第一次頂點(diǎn),每一個(gè)預(yù)定的邊界象素具有一個(gè)代表性的索引;(b7)產(chǎn)生預(yù)定的邊界象素的代表性的索引,把該非第一次頂點(diǎn)表示為次頂點(diǎn)信息;和(b8)提供第一次頂點(diǎn)的位置數(shù)據(jù)和次頂點(diǎn)的信息作為次頂點(diǎn)位置信息。
5.根據(jù)權(quán)利要求4的方法,其中的M和N是根據(jù)該閾值Dmax確定的。
6.根據(jù)權(quán)利要求5的方法,其中的編碼步驟(C)是通過(guò)一種以卦限為基礎(chǔ)的編碼技術(shù)執(zhí)行的。
7.根據(jù)權(quán)利要求6的方法,具中的編碼步驟(b)包括對(duì)于計(jì)算相鄰次頂點(diǎn)的代表性索引之間的差值的步驟。
8.根據(jù)權(quán)利要求1的方法,其中的估計(jì)步驟(e)包括步驟(e1)計(jì)算在每一個(gè)主輪廓段和它的對(duì)應(yīng)線段之間的一個(gè)最大的垂直距離,以便提供多個(gè)最大的垂直距離;和(e2)把一個(gè)最大的垂直距離設(shè)置為編碼誤差。
9.根據(jù)權(quán)利要求8的方法,具中的編碼步驟(C)是通過(guò)一種以卦限為基礎(chǔ)的編碼技術(shù)執(zhí)行的。
10.根據(jù)權(quán)利要求9的方法,其中的編碼步驟(d)包括步驟(d1)選擇次頂點(diǎn)之一作為第一次頂點(diǎn);(d2)針對(duì)其余的次頂點(diǎn)確定代表性的索引,每一個(gè)代表性的索引表示一個(gè)次頂點(diǎn)相對(duì)于相鄰的次頂點(diǎn)之一的相對(duì)位置;和(d3)對(duì)于第一次頂點(diǎn)的位置信息和其余次頂點(diǎn)代表性索引進(jìn)行編碼,從而提供編碼的數(shù)據(jù)作為編碼的次頂點(diǎn)的數(shù)據(jù)。
11.一種編碼目標(biāo)的輪廓的方法,該輪廓包括其上的輪廓象素,該方法包括以下的步驟(a)把輪廓象素之一確定為第一頂點(diǎn);(b)針對(duì)該第一頂點(diǎn)形成一個(gè)搜尋窗口,該搜尋窗口具有(2M+1)×(2N+1)的象素,沿著其周邊該搜尋窗口具有2×(2M+2N)的邊界象素并包括位于中心的第一頂點(diǎn);(c)檢測(cè)放置在邊界象素位置之一的一個(gè)輪廓象素并將其確定為下一個(gè)頂點(diǎn);(d)把預(yù)定的邊界象素選擇為代表性的象素并針對(duì)每一個(gè)代表性的象素指定一個(gè)方向索引,該方向索引表示相對(duì)于第一頂點(diǎn)的每一個(gè)代表性象素的相關(guān)的方向;(e)利用針對(duì)代表性象素之一的一個(gè)方向索引表示下一個(gè)頂點(diǎn);(f)針對(duì)下一個(gè)頂點(diǎn)重復(fù)步驟(b)到步驟(e),從而產(chǎn)生對(duì)該輪廓逼近的多個(gè)頂點(diǎn);和(g)對(duì)于第一個(gè)頂點(diǎn)的位置信息和其余的頂點(diǎn)的方向索引進(jìn)行編碼,從而提供該編碼作為編碼的頂點(diǎn)數(shù)據(jù)。
12.根據(jù)權(quán)利要求11的方法,其中的第一頂點(diǎn)是在該輪廓的最長(zhǎng)的線性部分兩端處的兩個(gè)輪廓象素之一。
13.根據(jù)權(quán)利要求11的方法,其中如果在步驟(a)和(c)確定的兩個(gè)頂點(diǎn)在檢測(cè)附加的頂點(diǎn)的過(guò)程中在搜尋窗口中被隨后再次發(fā)現(xiàn),則終止重復(fù)步驟(f)。
14.根據(jù)權(quán)利要求13的方法,其中的編碼步驟(g)包括步驟(g1)計(jì)算每一對(duì)頂點(diǎn)的方向索引之間的差值;和(g2)對(duì)于針對(duì)第一頂點(diǎn)的位置信息、第二頂點(diǎn)的方向索引和針對(duì)其余頂點(diǎn)的差分值進(jìn)行編碼,從而提供編碼的頂點(diǎn)數(shù)據(jù)。
15.根據(jù)權(quán)利要求14的方法,其中的差分值是由可變長(zhǎng)度編碼技術(shù)或合成句法為基礎(chǔ)的算術(shù)編碼技術(shù)所編碼。
16.一種編碼目標(biāo)的輪廓的裝置,該輪廓包括其上的輪廓象素,該裝置包括裝置,響應(yīng)第一控制信號(hào),利用多個(gè)主頂點(diǎn)對(duì)輪廓進(jìn)行多邊形近似,其中的輪廓被分成多個(gè)第一輪廓段,每一個(gè)在兩端具有兩個(gè)主頂點(diǎn)并由連接這兩個(gè)主頂點(diǎn)的一條線段所表示,并且在每一個(gè)第一輪廓段和線段之間的垂直距離小于一個(gè)預(yù)定的閾值Dmax;第一編碼器,用于編碼該主頂點(diǎn)的位置信息,從而提供該位置信息作為編碼的輪廓數(shù)據(jù);裝置,響應(yīng)第二控制信號(hào),用于順序地在該輪廓上確定多個(gè)次頂點(diǎn)并提供該次頂點(diǎn)的位置信息,一個(gè)次頂點(diǎn)是被放置在相距其先前確定的次頂點(diǎn)多于一個(gè)象素遠(yuǎn)的預(yù)定的位置之一;一個(gè)第二編碼器,用于編碼次頂點(diǎn)的位置信息,以便提供該位置信息作為編碼的輪廓數(shù)據(jù);和裝置,用于對(duì)該Dmax和一個(gè)閾值TH相比較,并且如果該Dmax是大于該TH則產(chǎn)生第一控制信號(hào),反之則產(chǎn)生第二控制信號(hào)。
17.根據(jù)權(quán)利要求16的裝置,其中所述的用于順序地確定次頂點(diǎn)的裝置包括裝置,用于將輪廓象素之一確定為第一個(gè)次頂點(diǎn);裝置,用于對(duì)于在遠(yuǎn)離先前確定的次頂點(diǎn)的一組預(yù)先設(shè)置的位置之一的一個(gè)輪廓象素進(jìn)行順序地選擇,作為下一個(gè)次頂點(diǎn);裝置,利用預(yù)定位置之一表示選擇的象素,該預(yù)定的位置是預(yù)先設(shè)置的位置的一個(gè)子集;裝置,用于對(duì)于所說(shuō)的預(yù)定位置之一提供一個(gè)方向索引,作為下一個(gè)次頂點(diǎn)的位置信息;和裝置,用于提供作為次頂點(diǎn)的位置信息、第一次頂點(diǎn)的位置和針對(duì)包括第二次頂點(diǎn)的其余次頂點(diǎn)的位置數(shù)據(jù)。
18.根據(jù)權(quán)利要求17的裝置,其中的第二編碼器包括裝置,用于計(jì)算在順序確定的第二頂點(diǎn)的每一對(duì)的方向索引之間的差分值;和裝置,用于對(duì)第一次頂點(diǎn)的位置、第二次頂點(diǎn)的方向索引和針對(duì)其余次頂點(diǎn)的差分值進(jìn)行編碼,從而提供編碼的數(shù)據(jù)作為編碼的輪廓數(shù)據(jù)。
全文摘要
一種編碼一個(gè)目標(biāo)的輪廓的方法。根據(jù)多邊形近似技術(shù)確定輪廓上的多個(gè)主頂點(diǎn),并確定在該輪廓上而處在遠(yuǎn)距先前確定的次頂點(diǎn)的一組預(yù)定位置之一的多個(gè)次頂點(diǎn)。隨后,該方法對(duì)次頂點(diǎn)的位置信息編碼以提供編碼的主頂點(diǎn)數(shù)據(jù),并對(duì)次頂點(diǎn)的位置信息編碼,以提供編碼的次頂點(diǎn)數(shù)據(jù)。最終,響應(yīng)通過(guò)利用一個(gè)閾值TH對(duì)于編碼誤差進(jìn)行估計(jì)而產(chǎn)生的一個(gè)選擇信號(hào)將編碼的主頂點(diǎn)數(shù)據(jù)、或是編碼的次頂點(diǎn)數(shù)據(jù)選擇為編碼的輪廓數(shù)據(jù),并將其提供到發(fā)射機(jī)發(fā)送。
文檔編號(hào)H04N1/41GK1187731SQ9711249
公開日1998年7月15日 申請(qǐng)日期1997年6月18日 優(yōu)先權(quán)日1997年1月10日
發(fā)明者金鎮(zhèn)憲 申請(qǐng)人:大宇電子株式會(huì)社