專利名稱:改良式鉆石搜尋動(dòng)態(tài)估計(jì)方法
技術(shù)領(lǐng)域:
本發(fā)明是有關(guān)于一種視訊影像處理(Video image processing)技術(shù)的移動(dòng)估計(jì)(Motion estimation)方法,特別是涉及一種改良式鉆石搜尋移動(dòng)估計(jì)方法。
背景技術(shù):
如圖1所示,目前在MPEG視訊編碼影像的數(shù)據(jù)流(Data stream)中,其數(shù)據(jù)結(jié)構(gòu)皆是由一個(gè)或一個(gè)以上的序列(Sequence)所構(gòu)成,而在每個(gè)序列之中則包含了復(fù)數(shù)個(gè)圖像群組(Group ofPictures,GOP),而所謂的圖像群組指的是由許多畫面(Frame)或稱為圖像(Picture)所構(gòu)成的群組,畫面依其屬性可區(qū)分幅內(nèi)編碼畫面(I Frame)、預(yù)測編碼畫面(P Frame),以及雙向編碼畫面(B Frame)影像三種型態(tài)。
上述每一種畫面均可加以編碼,一般是以幅內(nèi)編碼(I)畫面作為起始影像壓縮的切入點(diǎn),藉由移動(dòng)向量(Motion Vector)的估算,預(yù)測編碼(P)畫面可以幅內(nèi)編碼(I)畫面或預(yù)測編碼(P)畫面作為參考畫面來進(jìn)行預(yù)測,而雙向編碼(B)畫面則是以幅內(nèi)編碼(I)畫面與預(yù)測編碼(P)畫面二者或兩預(yù)測編碼(P)畫面作為參考畫面所產(chǎn)生的移動(dòng)向量推估,如此將畫面連續(xù)播放后,呈現(xiàn)在使用者面前即為動(dòng)態(tài)的MPEG視訊影像。
而在MPEG的壓縮標(biāo)準(zhǔn)中,是將每個(gè)畫面細(xì)分為數(shù)個(gè)像條(Slice),像條中又可再分為數(shù)個(gè)巨集像塊(Macro Block),而巨集像塊可由四個(gè)亮度(Luminance)像塊及數(shù)個(gè)彩度(Chrominance)像塊所組成,最后,將每一像塊(Block)定義為MPEG的數(shù)據(jù)結(jié)構(gòu)中的最小編碼單位。對應(yīng)移動(dòng)向量的估算(Motion Estimation),即所謂的移動(dòng)補(bǔ)償(Motion Compensation)。一般移動(dòng)向量估算最直接的作法,便是紀(jì)錄巨集像塊或像塊中每一畫素的亮度,并以全找搜尋(Full Search)方式紀(jì)錄兩者變化向量,但是此舉將耗費(fèi)大量資源。
配合移動(dòng)向量的估算,目前畫面便可藉由具有的各像塊以及從先前畫面找出最佳匹配像塊,以計(jì)算出的移動(dòng)向量與差值資料將先前畫面的像塊加以調(diào)整而成為目前畫面,依據(jù)移動(dòng)向量可將像塊轉(zhuǎn)移至適當(dāng)位置,由于無須紀(jì)錄大部分的重復(fù)資料,因此可節(jié)省儲(chǔ)存的資料量達(dá)到數(shù)據(jù)壓縮的目的。目前估算移動(dòng)向量的方法,有全找搜尋(Full Search;FS)、三步搜尋(Three Step Search;TSS)、四步搜尋(Four Step Search;FSS)及鉆石搜尋(Diamond Shape Search;DSS)等動(dòng)態(tài)估計(jì)方式。
其中,目前的鉆石搜尋判斷方式,是以一菱形(Rhombus)外框作為搜尋區(qū)域,其步驟說明如下步驟1找尋一搜尋起始點(diǎn)及以起始點(diǎn)為中心的空心菱形外框共九點(diǎn),若最相似點(diǎn)在菱形中心則進(jìn)行步驟4,若最相似點(diǎn)在菱形外框則進(jìn)行步驟2。
步驟2以最相似點(diǎn)為中心點(diǎn),重復(fù)以一菱形外框作為搜尋區(qū)域。
步驟3若最相似點(diǎn)仍在中心點(diǎn),則進(jìn)行步驟4,若最相似點(diǎn)在菱形外框上,則重復(fù)步驟2。
步驟4縮小搜尋區(qū)域的搜尋范圍為小實(shí)心菱形,最后找到最相似點(diǎn)后,即結(jié)束搜尋。
如圖2所示,說明步驟1中,發(fā)現(xiàn)最相似點(diǎn)在菱形中心1’,因此進(jìn)行步驟4,縮小搜尋區(qū)域的搜尋范圍為小實(shí)心菱形,最后找到最相似點(diǎn)2’后結(jié)束搜尋。
如圖3所示,說明步驟1中,最相似點(diǎn)在菱形外框1”,因此進(jìn)行步驟2,以最相似點(diǎn)1”為中心點(diǎn),重復(fù)以一菱形外框作為搜尋區(qū)域,接著進(jìn)行步驟3,因?yàn)樽钕嗨泣c(diǎn)2”在菱形外框上,故重復(fù)步驟2,重復(fù)以一菱形外框作為搜尋區(qū)域,發(fā)現(xiàn)最相似點(diǎn)仍在菱形中心2”,因此進(jìn)行步驟4,縮小搜尋區(qū)域的搜尋范圍為小實(shí)心菱形,最后找到最相似點(diǎn)4”后結(jié)束搜尋。
然而,現(xiàn)有的鉆石搜尋動(dòng)態(tài)估計(jì)方法由于是以起始點(diǎn)為中心的空心菱形外框?yàn)樗褜し秶?,大范圍搜尋后再縮小搜尋范圍,往往錯(cuò)失了落在起始點(diǎn)附近的畫素才是出現(xiàn)機(jī)率最大的搜尋范圍。
發(fā)明內(nèi)容
因此,本發(fā)明的一目的,即在提供一種提高搜尋效率的改良式鉆石搜尋動(dòng)態(tài)估計(jì)方法。
于是,本發(fā)明改良式鉆石搜尋動(dòng)態(tài)估計(jì)方法是從一第一畫面所具有的一預(yù)定像塊,搜尋鄰近的一第二畫面中對應(yīng)預(yù)定像塊相匹配的像塊以估算預(yù)定像塊的移動(dòng)向量,其特征在于所述的方法是設(shè)定第二畫面中依一預(yù)定原則選擇的一像塊為一起始點(diǎn),并以起始點(diǎn)為中心的一實(shí)心菱形區(qū)域?yàn)槠鹗妓褜し秶?,由?nèi)往外逐漸擴(kuò)展搜尋相匹配的像塊以估算預(yù)定像塊的移動(dòng)向量。
由于一般移動(dòng)向量常是以放射狀分布的方式出現(xiàn),本發(fā)明改良式鉆石搜尋動(dòng)態(tài)估計(jì)方法以實(shí)心菱形區(qū)域?yàn)槠鹗妓褜し秶捎谑窍茸猿霈F(xiàn)機(jī)率大的實(shí)心區(qū)域內(nèi)開始搜尋,因此可節(jié)省不必要的搜尋時(shí)間,并進(jìn)一步提升了搜尋的效率。
下面結(jié)合附圖及實(shí)施例對本發(fā)明進(jìn)行詳細(xì)說明圖1是一示意圖,說明目前在MPEG視訊編碼影像的數(shù)據(jù)數(shù)據(jù)結(jié)構(gòu);圖2是一示意圖,說明現(xiàn)有的一種鉆石搜尋判斷方式;圖3是一示意圖,說明現(xiàn)有的一種鉆石搜尋判斷方式;圖4是一電路方塊圖,說明使用本發(fā)明方法的系統(tǒng)是一用以執(zhí)行MPEG視訊編碼功能的視訊編碼裝置;圖5是一示意圖,說明本發(fā)明改良式鉆石搜尋動(dòng)態(tài)估計(jì)方法的移動(dòng)向量估算方式;圖6是一流程圖,說明本發(fā)明改良式鉆石搜尋動(dòng)態(tài)估計(jì)方法的各步驟;圖7是一示意圖,說明本發(fā)明改良式鉆石搜尋動(dòng)態(tài)估計(jì)方法的較佳實(shí)施例;圖8是一示意圖,說明本發(fā)明改良式鉆石搜尋動(dòng)態(tài)估計(jì)方法的較佳實(shí)施例;圖9說明本發(fā)明改良式鉆石搜尋動(dòng)態(tài)估計(jì)方法的較佳實(shí)施例的變形一,先由內(nèi)部的小實(shí)心菱形五點(diǎn)找起,若最相似點(diǎn)在菱形邊上,再往其外部的菱形框的八點(diǎn)尋找;圖10說明本發(fā)明改良式鉆石搜尋動(dòng)態(tài)估計(jì)方法的較佳實(shí)施例的變形二,先由內(nèi)部的小實(shí)心菱形五點(diǎn)找起,若最相似點(diǎn)在菱形邊上,再往其外部的半菱形框的五點(diǎn)尋找;圖11是一示意圖,說明本發(fā)明改良式鉆石搜尋動(dòng)態(tài)估計(jì)方法的較佳實(shí)施例的變形三,先由內(nèi)部的小實(shí)心菱形五點(diǎn)找起,若最相似點(diǎn)在菱形邊上,再往其外部的半菱形框的三點(diǎn)尋找。
具體實(shí)施例方式
有關(guān)本發(fā)明之前述及其它技術(shù)內(nèi)容、特點(diǎn)與功效,在以下配合參考圖式的一較佳實(shí)施例的詳細(xì)說明中,將可清楚的呈現(xiàn)。在本發(fā)明被詳細(xì)描述之前,要注意的是,在以下的說明內(nèi)容中,類似的元件是以相同的編號來表示。
如圖4所示,使用本發(fā)明方法的系統(tǒng)是一用以執(zhí)行MPEG視訊壓縮功能的視訊編碼裝置1,然而,其它實(shí)施例中,或可應(yīng)用在執(zhí)行類似的視訊壓縮功能的處理系統(tǒng)。
視訊編碼裝置1具有一前處理單元(Preprocessor Unit)10、一移動(dòng)估算單元(MotionEstimation Unit)11、一移動(dòng)補(bǔ)償單元12、一移動(dòng)向量編碼單元(Motion Vector EncodingUnit)13、一紋理編碼模組(Texture Encoding Unit)14、一比特流組合單元(Bit-StreamComposer Unit)15及一記憶體16。
欲將一原始的輸入影像100輸入至視訊編碼裝置1時(shí),是由視訊編碼裝置1的一前處理單元10先將一給定畫面中的每一個(gè)巨塊資料定義出來,并暫存至記憶體16;接著由移動(dòng)估算單元11對于輸入影像100中畫面所具有的巨塊資料進(jìn)行計(jì)算,例如運(yùn)算前、后畫面中對應(yīng)的像塊資料后,可求得全畫面的各像塊資料的移動(dòng)向量資料102;接著將其輸入至移動(dòng)補(bǔ)償單元12,由移動(dòng)補(bǔ)償單元12利用所述的移動(dòng)向量擷取先前或后一畫面中的影像巨塊資料以得到一參考資料104;再將前處理單元10得到輸入影像100具有的影像巨塊資料減去移動(dòng)補(bǔ)償單元12得到的參考數(shù)據(jù)104后,便得到一差值數(shù)據(jù)103,由紋理編碼模組14對差值數(shù)據(jù)103進(jìn)行運(yùn)算以獲得壓縮的紋理及重建的參考資料。
其中,紋理編碼模組14的一離散余弦轉(zhuǎn)換單元141是是對每一像塊的畫素資料施以離散余弦轉(zhuǎn)換(DCT),接著以頻域轉(zhuǎn)換單元142把畫素?cái)?shù)據(jù)由時(shí)域轉(zhuǎn)換為頻域,接著由量化單元143施以量化(Quantize)步驟,使得許多經(jīng)過離散余弦轉(zhuǎn)換的DCT系數(shù)量化為零,并去除掉高頻部分;并需再經(jīng)反量化單元144、反離散余弦轉(zhuǎn)換單元145進(jìn)行反量化以及反離散余弦轉(zhuǎn)換運(yùn)算,如此再反饋至移動(dòng)估算單元11。并可由移動(dòng)向量編碼單元13將各移動(dòng)向量加以編碼輸出至比特流組合單元15具有的一可變長度編碼器151。
同時(shí),需以交流/直流預(yù)測單元146(AC/DC Prediction Unit)依照同一畫面中各像塊(Block)重復(fù)的累贅信息去除,再由交錯(cuò)掃描單元147進(jìn)行交錯(cuò)掃描(Zig-zag scan)來將量化后的DCT系數(shù)重新排列,將低頻系數(shù)排列在前而高頻系數(shù)排列在后,最后在經(jīng)交錯(cuò)掃描過后的DCT系數(shù)進(jìn)行動(dòng)態(tài)長度編碼(Run Length Encoding;RLE),最后再由比特流組合單元15具有的另一可變長度編碼器152對二者進(jìn)行可變長度編碼(Variable Length Coding;VLC),由比特流組合單元15加以組合,便可完成MPEG壓縮格式的輸出。
配合圖4、5所示,本發(fā)明改良式鉆石搜尋動(dòng)態(tài)估計(jì)方法的較佳實(shí)施例,是在視訊編碼裝置1中的移動(dòng)估算單元11進(jìn)行,所述的方法是從一第一畫面501(又稱為目前畫面;Current Frame)所具有的一預(yù)定像塊51,并搜尋鄰近的一第二畫面502(又稱為參考畫面;Reference Frame)對應(yīng)預(yù)定像塊51所相匹配的畫素以估算預(yù)定像塊51的移動(dòng)向量53,所述的方法是以第二畫面502中的一預(yù)定點(diǎn)520為起始點(diǎn),并以起始位置為中心的一實(shí)心菱形區(qū)域(圖未示)為搜尋范圍,由內(nèi)往外逐漸擴(kuò)展搜尋相匹配的像塊以估算移動(dòng)向量53。
本實(shí)施例中,所欲搜尋鄰近的第二畫面502的位置,可以是位在第一畫面501前、后時(shí)序多數(shù)畫面其中任一畫面,此外,所述的方法由內(nèi)往外逐漸擴(kuò)展搜尋的方式,是順時(shí)針、逆時(shí)針其中任一種螺旋搜尋方式。
如圖6所示,說明本發(fā)明改良式鉆石搜尋動(dòng)態(tài)估計(jì)方法,首先,搜尋最接近起始點(diǎn)的實(shí)心菱形十三個(gè)點(diǎn)(步驟601)接著進(jìn)行最相似點(diǎn)判定(步驟602),若最相似點(diǎn)為內(nèi)部五點(diǎn)之一(步驟603),則結(jié)束搜尋(步驟610),若搜尋到的最相似點(diǎn)為外部八點(diǎn)之一(步驟604),則以該點(diǎn)為新的搜尋中心,找尋菱形邊上尚未搜尋的三點(diǎn)或五點(diǎn)(步驟605)。
接著進(jìn)行最相似點(diǎn)判定(步驟606),若最相似點(diǎn)在菱形邊上(步驟607),則以該點(diǎn)為新的搜尋中心,找尋菱形邊上尚未搜尋的三點(diǎn)或五點(diǎn)(步驟605),若最相似點(diǎn)為中心點(diǎn)(步驟608),則搜尋最接近中心點(diǎn)的小實(shí)心菱形四點(diǎn)(步驟609),如獲得最相似點(diǎn)則結(jié)束搜尋,并傳回最相似點(diǎn)的移動(dòng)向量(步驟610)。
配合圖6及圖7~8所示,說明本發(fā)明改良式鉆石搜尋動(dòng)態(tài)估計(jì)方法的較佳實(shí)施例的各種搜尋狀況圖7說明第一次搜尋時(shí),先自接近原點(diǎn)的實(shí)心菱形十三個(gè)點(diǎn)開始找尋(步驟601),并進(jìn)行最相似點(diǎn)判定(步驟602),由于相似點(diǎn)1’為實(shí)心菱形內(nèi)部五點(diǎn)之一(步驟603),因此第一次搜尋即可找出并結(jié)束搜尋(步驟610)。
圖8說明第一次搜尋時(shí),先自接近原點(diǎn)的實(shí)心菱形十三個(gè)點(diǎn)開始找尋(步驟601),并進(jìn)行最相似點(diǎn)判定(步驟602),由于搜尋到的相似點(diǎn)1’為外部八點(diǎn)之一(步驟604),因此第二次搜尋時(shí),以該點(diǎn)1’為新的搜尋中心,找尋菱形邊上尚未搜尋的三點(diǎn)或五點(diǎn)(步驟605)。
接著進(jìn)行最相似點(diǎn)判定(步驟606),若最相似點(diǎn)2’在菱形邊上(步驟607),第三次搜尋時(shí),則以該點(diǎn)2’為新的搜尋中心,找尋菱形邊上尚未搜尋的三點(diǎn)(步驟605),若最相似點(diǎn)仍為中心點(diǎn)2’(步驟608),第四次搜尋時(shí),則搜尋最接近中心點(diǎn)的小實(shí)心菱形四點(diǎn)(步驟609),如獲得最相似點(diǎn)4’則結(jié)束搜尋,并傳回最相似點(diǎn)的移動(dòng)向量(步驟610)。
如圖9~11所示,說明本發(fā)明改良式鉆石搜尋動(dòng)態(tài)估計(jì)方法的較佳實(shí)施例的變形,其搜尋范圍的概念,均是由內(nèi)往外搜尋,并且為部分實(shí)心菱形的集合。
如圖9所示,此方法是是先由內(nèi)部的小實(shí)心菱形五點(diǎn)找起,若最相似點(diǎn)1’在菱形邊上,則再往未搜尋的外部的菱形框81的八點(diǎn)尋找,并以步驟602~610的方式逐步由內(nèi)往外擴(kuò)展搜尋,直至搜尋到最相似點(diǎn)為止。
如圖10所示,此方法也是先由內(nèi)部的小實(shí)心菱形五點(diǎn)找起,若最相似點(diǎn)1’在菱形邊上,則以該相似點(diǎn)1’為搜尋起始點(diǎn)中心,再往其外部的半菱形框82的五點(diǎn)尋找,并以步驟602~610的方式逐步由內(nèi)往外擴(kuò)展搜尋,直至搜尋到最相似點(diǎn)為止。
如圖11所示,類似于圖10的半菱形框搜尋法,此方法也是先由內(nèi)部的小實(shí)心菱形五點(diǎn)找起,若最相似點(diǎn)1’在菱形邊上,則以該相似點(diǎn)1’為搜尋起始點(diǎn)中心,再往其外部的半菱形框83的三點(diǎn)尋找,并以步驟602~610的方式逐步由內(nèi)往外擴(kuò)展搜尋,直至搜尋到最相似點(diǎn)為止。
歸納上述,由于一般移動(dòng)向量常是以放射狀分布的方式出現(xiàn),本發(fā)明改良式鉆石搜尋動(dòng)態(tài)估計(jì)方法以實(shí)心菱形區(qū)域?yàn)槠鹗妓褜し秶又M(jìn)一步擴(kuò)大至最近似點(diǎn)為中心的空心菱形外框?yàn)樗褜^(qū)域范圍,最后再縮小為四點(diǎn)的搜尋區(qū)域范圍,由于是先自出現(xiàn)機(jī)率大的實(shí)心區(qū)域內(nèi)開始搜尋,因此可節(jié)省不必要的搜尋時(shí)間,并進(jìn)一步提升了搜尋的效率。
權(quán)利要求
1.一種改良式鉆石搜尋動(dòng)態(tài)估計(jì)方法,是從一第一畫面所具有的一預(yù)定像塊,搜尋鄰近的一第二畫面中對應(yīng)預(yù)定像塊相匹配的像塊以估算預(yù)定像塊的移動(dòng)向量,其特征在于所述的方法是設(shè)定第二畫面中依一預(yù)定原則選擇的一像塊為一起始點(diǎn),并以起始點(diǎn)為中心的一實(shí)心菱形區(qū)域?yàn)槠鹗妓褜し秶?,由?nèi)往外逐漸擴(kuò)展搜尋相匹配的像塊以估算預(yù)定像塊的移動(dòng)向量。
2.如權(quán)利要求1所述的改良式鉆石搜尋動(dòng)態(tài)估計(jì)方法,其特征在于所述的實(shí)心菱形區(qū)域是包括一具有起始點(diǎn)及起始點(diǎn)鄰近的四點(diǎn)的小菱形區(qū)域。
3.如權(quán)利要求2所述的改良式鉆石搜尋動(dòng)態(tài)估計(jì)方法,其特征在于所述的實(shí)心菱形區(qū)域更包括小菱形區(qū)域周圍的八點(diǎn)。
4.如權(quán)利要求3所述的改良式鉆石搜尋動(dòng)態(tài)估計(jì)方法,其特征在于若搜尋到相匹配的像塊在實(shí)心菱形區(qū)域的邊上任一點(diǎn),則搜尋范圍更擴(kuò)展至與該點(diǎn)外緣平行的三點(diǎn)。
5.如權(quán)利要求4所述的改良式鉆石搜尋動(dòng)態(tài)估計(jì)方法,其特征在于若搜尋到相匹配的像塊在搜尋范圍的中心點(diǎn)上,則搜尋范圍以相匹配的像塊為中心,搜尋與該像塊鄰近的四點(diǎn)。
6.如權(quán)利要求3所述的改良式鉆石搜尋動(dòng)態(tài)估計(jì)方法,其特征在于若搜尋到相匹配的像塊在該實(shí)心菱形區(qū)域的任一端點(diǎn),則搜尋范圍更擴(kuò)展至該端點(diǎn)外緣呈一三角形外框的五點(diǎn)。
7.如權(quán)利要求6所述的改良式鉆石搜尋動(dòng)態(tài)估計(jì)方法,其特征在于若搜尋到相匹配的像塊在搜尋范圍的中心點(diǎn)上,則搜尋范圍以相匹配的像塊為中心,搜尋與該像塊鄰近的四點(diǎn)。
8.如權(quán)利要求1所述的改良式鉆石搜尋動(dòng)態(tài)估計(jì)方法,其特征在于所欲搜尋鄰近的該第二畫面的位置,是位在第一畫面前、后時(shí)序的多數(shù)畫面中的任一畫面。
9.如權(quán)利要求1所述的改良式鉆石搜尋動(dòng)態(tài)估計(jì)方法,其特征在于所述的由內(nèi)往外逐漸擴(kuò)展搜尋的方式是順時(shí)針或逆時(shí)針的螺旋搜尋方式。
全文摘要
本發(fā)明公開了一種改良式鉆石搜尋動(dòng)態(tài)估計(jì)方法,是從一第一畫面所具有的一預(yù)定像塊,搜尋鄰近的一第二畫面中對應(yīng)預(yù)定像塊相匹配的像塊以估算預(yù)定像塊的移動(dòng)向量,其特征在于所述的方法是設(shè)定第二畫面中依一預(yù)定原則選擇的一像塊為一起始點(diǎn),并以起始點(diǎn)為中心的一實(shí)心菱形區(qū)域?yàn)槠鹗妓褜し秶蓛?nèi)往外逐漸擴(kuò)展搜尋相匹配的像塊以估算預(yù)定像塊的移動(dòng)向量,由于一般移動(dòng)向量常是以放射狀分布的方式出現(xiàn),而本發(fā)明所述的方法是先自出現(xiàn)機(jī)率大的實(shí)心區(qū)域內(nèi)開始搜尋,因此相較于以前的搜尋技術(shù)可節(jié)省不必要的搜尋時(shí)間。
文檔編號H04N7/32GK1960494SQ200510115480
公開日2007年5月9日 申請日期2005年11月4日 優(yōu)先權(quán)日2005年11月4日
發(fā)明者蔡彰哲, 林志新, 李宜方, 趙子毅 申請人:原相科技股份有限公司