專利名稱:運動向量解交錯的方法
技術領域:
本發(fā)明涉及一種運動向量解交錯的方法,特別關于一種對MPEG-2影像的解碼方法。
背景技術:
目前,多媒體的來源對于我們而言是相當廣泛的,舉凡電視節(jié)目、電影、激光視盤片(VCD)及數(shù)字多功能光盤片(DVD)等等。在如此多的來源中,我們不乏發(fā)現(xiàn)可以將這些來源大致分為逐行(非交錯式)影像及隔行(交錯式)影像兩大類。這些影像大都跟隨MPEG-2的編碼原則來編碼這些影像。
在MPEG-2的影像編/解碼的過程中,將交錯式影片內容成為解交錯格式(De-interlacing)是目前一般處理的方式,而解交錯格式中比較常見就是場合并格式(Weave)和單場插值格式(BOB),場合并格式(Weave)是簡單的將兩場的數(shù)據合為一幀,而單場插值格式(BOB)是用一場的數(shù)據來生成一幀(Frame)。
顯然,用場合并格式(Weave)的方法生成的幀含有更多的信息量,圖像會更清晰,而單場插值格式(BOB)生成的幀會比較模糊,且對于一些靜止的區(qū)域會出現(xiàn)一定的跳動,比如電視臺的標志(Logo)。當然,場合并格式(Weave)也有其弊端,當視頻宏塊是基于交錯的(Interlaced),那么場合并格式(Weave)合成的幀圖像中,在運動的區(qū)域往往會出現(xiàn)一些梳狀的瑕疵,又稱之為老鼠牙(Mice Teeth)。
在一定程度上,我們可以利用這兩種方法的優(yōu)點,將它們結合起來,在圖像運動的區(qū)域使用單場插值格式(BOB),從而達到消除老鼠牙的目的,而在圖像相對靜止的區(qū)域使用場合并格式(Weave)從而得到更多的清晰度。這就是所謂的運動自適應式解交錯(Motion Adaptive De-interlacing)。
如美國專利第6269484號“在壓縮的視頻流上使用運動向量來解除交錯的內容的方法及裝置”,該專利利用MPEG碼流中的運動向量(MotionVector)和一些運動預測(Motion Estimation)的殘余量,去判斷一個宏塊(Macro Block)的區(qū)域是否有運動。事實上,在MPEG編碼器中使用的運動預測算法,是為了在參考圖中按一定標準去尋找一個最相似的宏塊,從而得到最大的壓縮率,也就是說,運動預測算法并不是用來判斷當前宏塊是否運動的。所以,簡單的利用這種算法得出的一些結果(如碼流中的運動向量和殘余量),來判斷當前一個宏塊是否有運動的是不太可靠的。
圖1為現(xiàn)有的使用動態(tài)向量解碼影像視頻流的方框圖,也就是上述專利的代表圖,包括一音頻/視頻解交錯影像編碼器10,一編碼壓縮音頻/視頻影像102,一音頻/視頻解交錯裝置104,一音頻/視頻解交錯影像解碼器106,一音頻/視頻解碼器的運動向量截取單元108,一基于運動向量的解交錯決定單元110,一基于運動向量的解交錯位圖單元112,一宏塊數(shù)據的子集合信息114,一解碼運動向量數(shù)據116,一解壓縮的宏塊數(shù)據118,一使用解碼運動向量位圖的解交錯影像轉換單元120及一顯示單元122。
該音頻/視頻解交錯影像編碼器10為一MPEG-2編碼器,根據MPEG-2標準來編碼交錯式圖形數(shù)據,將該編碼壓縮音頻/視頻影像102傳輸至該音頻/視頻解交錯裝置104內,該音頻/視頻解交錯裝置104包含音頻/視頻解交錯影像解碼器106,及使用解碼運動向量位圖的解交錯影像轉換單元120,該音頻/視頻解交錯影像解碼器106包括該音頻/視頻解碼器的運動向量截取單元108,該基于運動向量解交錯決定單元110,及該基于運動向量的解交錯位圖單元112。
其中,該音頻/視頻解碼器的運動向量截取單元108在解碼階段產生并且輸出該宏塊數(shù)據的子集合信息114及該解碼運動向量數(shù)據116,傳輸給該基于運動向量的解交錯決定單元110。該基于運動向量的解交錯決定單元110產生該基于運動向量的解交錯位圖單元112,該基于運動向量的解交錯位圖單元112包含兩位,來代表一圖片的每一個宏塊是否為運動的或非運動的。
該音頻/視頻解碼器的運動向量截取單元108解碼該壓縮的宏塊數(shù)據和輸出解壓縮的宏塊數(shù)據118,到該使用解碼運動向量位圖的解交錯影像轉換單元120,最后將處理過的影像傳送至該顯示單元122上。
發(fā)明內容
本發(fā)明即為解決上述現(xiàn)有技術的缺失,而提供了一種運動向量解交錯的方法。
為了達到本發(fā)明的目的,本發(fā)明提供了一種運動向量解交錯的方法,該方法包括解碼一圖像內容成為多個宏塊數(shù)據(Macro Block);計算圖像內容的該多個宏塊數(shù)據的運動向量,且將該運動向量成為一判斷值;依據該判斷值產生多個解交錯標志;實現(xiàn)時態(tài)延伸動作(Temporal Extension),是依據該判斷值將該多個宏塊數(shù)據間作該時態(tài)延伸動作;及執(zhí)行破壞性動作(Devour),將該多個孤立的解交錯標志破壞并使之在空間運動上有其相關性。
其中,該圖像內容可為一靜態(tài)圖像或一動態(tài)圖像;該實現(xiàn)時態(tài)延伸動作步驟中,進一步包括下列步驟設多個標志緩沖器,判斷第一個解交錯標志是否為場合并格式(Weave),判斷其余標志緩沖器是否都為單場插值格式(BOB),及設定該解交錯標志為衍生單場插值格式(BOB2);該執(zhí)行破壞性動作步驟中,進一步包括下列步驟設定該宏塊數(shù)據的影像垂直及水平大小;計算該影像中當前宏塊附近一定范圍內的單場插值格式(BOB)的數(shù)量值;及設定該解交錯標志為場合并格式(Weave);該設定該宏塊數(shù)據步驟中還包含判斷解交錯標志是否為單場插值格式,并且當判斷的結果為是,則進行下一個步驟,若所判斷的結果為否,則進一步包括下列步驟計算該影像中當前宏塊附近一定范圍內的場合并格式的數(shù)量值,檢測計算值是否小于該場合并格式的判斷值;及設定該解交錯標志為單場插值格式;該計算步驟中還包含檢測計算值是否小于該單場插值格式的判斷值式。
本發(fā)明的特點為利用編/解碼流中的運動向量的信息來判斷宏塊(MacroBlock)級的運動。由于本發(fā)明利用運動的連續(xù)性和相關性加入了一時態(tài)延伸動作(Temporal Extension)及破壞性動作(Devour)模塊,從而使得判斷更保守,更大程度地杜絕了老鼠牙(Mice Teeth)的現(xiàn)象。
圖1為現(xiàn)有的使用動態(tài)向量解碼影像視頻流的方框圖;圖2為本發(fā)明的運動向量解交錯的方法的流程圖;圖3為視頻流的幀圖片結構解交錯標志產生及時態(tài)延伸的流程圖;圖4A及圖4B為視頻流的場圖片結構解交錯標志產生的流程圖;及圖5為本發(fā)明的破壞性動作的流程圖。
其中,附圖標記說明如下10 音頻/視頻解交錯影像編碼器102 編碼壓縮音頻/視頻影像104 音頻/視頻解交錯裝置106 音頻/視頻解交錯影像解碼器108 音頻/視頻解碼器的運動向量截取單元110 基于運動向量解交錯決定單元112 基于運動向量的解交錯位圖單元114 宏塊數(shù)據的子集合信息116 解碼運動向量數(shù)據118 解壓縮的宏塊數(shù)據120 使用解碼運動向量位圖的解交錯影像轉換單元122 顯示單元具體實施方式
為了使本發(fā)明為達成發(fā)明目的所采取的技術、手段及功效得到進一步地了解,以下結合附圖對本發(fā)明作詳細說明,然而所附圖式僅提供參考與說明用,并非用來對本發(fā)明加以限制。
圖2為本發(fā)明的運動向量解交錯的方法的流程圖,該方法包括將圖像內容解碼成為多個宏塊數(shù)據(S200),將該多個宏塊數(shù)據中計算圖像的運動向量并成為一判斷值(S202),依據該判斷值來判斷該宏塊位置是否為活動的(S204),若判斷的結果為是,將所得的該判斷值做為多個解交錯標志產生的依據(S206),實現(xiàn)時態(tài)延伸動作(S208),及執(zhí)行破壞性動作(S210)。
圖3為視頻流的幀圖片結構解交錯標志產生及時態(tài)延伸的流程圖,包括設多個解交錯標志緩沖器儲存影像數(shù)據(S300),判斷是否為I圖像(S302),若判斷結果為否,則檢測是否為圖像內的宏塊數(shù)據(S304),若判斷結果為是,則將解交錯標志設為單場插值格式(S306)。
該判斷是否為I圖像(S302)中,若判斷結果為是,則進一步包括判斷該圖像是否為第一幀(Frame)(S316),若所判斷結果為是,則將解交錯標志設為衍生單場插值格式(BOB2)(S318),若所判斷結果為否,則將解交錯標志設為先前幀標志(S320),判斷解交錯標志是否等于場合并格式(S322),若判斷結果為否,則結束本流程。若判斷結果為是,則檢測該多個解交錯標志緩沖器的相同位置是否存在一定數(shù)量的單場插值格式(S310),若判斷結果為是,則將解交錯標志設為單場插值格式(S314),否則將解交錯標志設為場合并格式(S312)。
其中,該檢測是否為圖像內的宏塊(Intra Macro Block)數(shù)據(S304)中,若判斷結果為否則進一步包括判斷取絕對值的運動向量值是否大于判斷值且為存在(S308),若判斷結果為是,則將解交錯標志設為單場插值格式(S306),若判斷結果為否,則檢測該多個標志緩沖器的相同位置是否存在一定數(shù)量的單場插值格式(S310),若判斷結果為是,則將解交錯標志設為單場插值格式(S314),否則將解交錯標志設為場合并格式(S312)。另一方面,圖3所示的檢測該多個解交錯標志緩沖器的相同位置是否存在一定數(shù)量的單場插值格式(S310)的步驟,將解交錯標志設為場合并格式(S312)的步驟以及將解交錯標志設為單場插值格式(S314)的步驟等,亦即為之后的圖4中的將解交錯標志設為時態(tài)延伸標志(S410)步驟的求解方法。
圖4A及圖4B為視頻流的場圖片結構解交錯標志產生的流程圖,包括判斷是否為I圖像(S400),若判斷結果為是,則檢測是否為第一幀(S402),若判斷結果為是,則將解交錯標志設為衍生單場插值格式(S406),若判斷結果為否,則將解交錯標志設為先前幀標志(S404),判斷解交錯標志是否等于場合并格式(S408),若判斷結果為否,則結束本流程。若判斷結果為是,則將解交錯標志設為時態(tài)延伸標志(S410),將解交錯標志的垂直坐標加一階或減一階并存入該解交錯標志(S412)。
該判斷是否為I圖像(S400)中,若判斷結果為否,則進一步包括檢測是否為圖像內的宏塊數(shù)據(S414),若判斷結果為是,則判斷該宏塊數(shù)據是否為頂場(S416),若判斷結果為是,則將宏塊解交錯標志設為單場插值格式(S418),將宏塊解交錯標志的垂直坐標加一階并設為單場插值格式(S420),若判斷結果為否,則將宏塊解交錯標志設為單場插值格式(S422),將宏塊解交錯標志的垂直坐標減一階并設為單場插值格式(S424)。
該檢測是否為圖像內的宏塊(Intra Macro Block)數(shù)據(S414)中,若判斷結果為否,則包括判斷取絕對值的運動向量值是否大于判斷值且為存在(S426),若判斷結果為是,則判斷該宏塊數(shù)據是否為頂場(S416),若判斷結果為是,則將宏塊解交錯標志設為單場插值格式(S418),將宏塊解交錯標志的垂直坐標加一階并設為單場插值格式(S420),若判斷結果為否,則將宏塊解交錯標志設為單場插值格式(S422),將宏塊解交錯標志的垂直坐標減一階并設為單場插值格式(S424)。
該判斷取絕對值的運動向量值是否大于判斷值且為存在(S426)中,若判斷結果為否,則判斷該宏塊數(shù)據是否為頂場(S428),若判斷結果為是,則將解交錯標志設為時態(tài)延伸標志(S430),將解交錯標志的垂直坐標加一階并存入該解交錯標志(S432),若判斷結果為否,則判斷解交錯標志是否等于場合并格式(S434),若判斷結果為否,則結束本流程,若判斷結果為是,將解交錯標志設為時態(tài)延伸標志(S436),將解交錯標志的垂直坐標減一階并存入該解交錯標志(S438)。
圖5為本發(fā)明的破壞性動作的流程圖,包括設定宏塊數(shù)據的影像垂直大小(S500),設定宏塊數(shù)據的影像水平大小(S502),判斷解交錯標志是否為單場插值格式(S504),若判斷結果為是,則計算該影像中當前宏塊附近一定范圍內的單場插值格式的數(shù)量值(S506),檢測計算值是否小于該單場插值格式的判斷值(S508),將解交錯標志設為場合并格式(S510)。
其中,在該判斷解交錯標志是否為單場插值格式(S504)中,若所判斷的結果為否,則計算該影像中當前宏塊附近一定范圍內的場合并格式的數(shù)量值(S512),檢測計算值是否小于該場合并格式的判斷值(S514),將解交錯標志設為衍生單場插值格式(S516)。
上述所公開的附圖、實施方式僅為說明本發(fā)明而已,并非用以限制本發(fā)明,凡本領域的技術人員當可依據上述的說明作其它種種的改良,而這些改變仍屬于本發(fā)明的發(fā)明精神及權利要求書所界定的專利保護范圍中。
權利要求
1.一種運動向量解交錯的方法,該方法包括解碼一圖像內容成為多個宏塊數(shù)據;計算圖像內容的該多個宏塊數(shù)據的運動向量,且將該運動向量成為一判斷值;依據該判斷值產生多個解交錯標志;實現(xiàn)時態(tài)延伸動作,是依據該判斷值將該多個宏塊數(shù)據間作該時態(tài)延伸動作;及執(zhí)行破壞性動作,是將該多個孤立的解交錯標志破壞并使之在空間運動上有其相關性。
2.如權利要求1所述的運動向量解交錯的方法,其中,該圖像內容可為一靜態(tài)圖像或一動態(tài)圖像。
3.如權利要求1所述的運動向量解交錯的方法,其中,該實現(xiàn)時態(tài)延伸動作步驟中,進一步包括下列步驟設多個標志緩沖器;判斷第一個解交錯標志是否為場合并格式;判斷其余標志緩沖器是否都為單場插值格式;及設定該解交錯標志為衍生單場插值格式。
4.如權利要求1所述的運動向量解交錯的方法,其中,該執(zhí)行破壞性動作步驟中,進一步包括下列步驟設定該宏塊數(shù)據的影像垂直及水平大??;計算該影像中當前宏塊附近一定范圍內的單場插值格式的數(shù)量值;及設定該解交錯標志為場合并格式。
5.如權利要求4所述的運動向量解交錯的方法,其中,該設定該宏塊數(shù)據步驟中還包含判斷解交錯標志是否為單場插值格式。
6.如權利要求5所述的運動向量解交錯的方法,其中,該判斷的結果為是,則進行下一個步驟,若所判斷的結果為否,則進一步包括下列步驟計算該影像中當前宏塊附近一定范圍內的場合并格式的數(shù)量值;檢測計算值是否小于該場合并格式的判斷值;及設定該解交錯標志為單場插值格式。
7.如權利要求4所述的運動向量解交錯的方法,其中,該計算步驟中還包含檢測計算值是否小于該單場插值格式的判斷值式。
全文摘要
本發(fā)明涉及一種運動向量解交錯的方法,該方法包括將一圖像內容解碼成為多個宏塊數(shù)據,由該多個宏塊數(shù)據計算一運動向量且該運動向量成為一判斷值,由該判斷值產生多個解交錯標志,然后對生成的解交錯標志實現(xiàn)時態(tài)延伸動作,其中該時態(tài)延伸動作進一步包括設多個解交錯標志緩沖器,判斷當前解交錯標志是否為場合并格式(Weave),判斷其余解交錯標志緩沖器是否都為單場插值格式(BOB),及設定該解交錯標志為衍生單場插值格式(BOB2);及執(zhí)行破壞性動作,將該多個孤立的解交錯標志破壞并使之在空間運動上有其相關性。通過本發(fā)明,可以更大程度地避免老鼠牙的現(xiàn)象。
文檔編號H04N7/01GK1652598SQ20041000350
公開日2005年8月10日 申請日期2004年2月2日 優(yōu)先權日2004年2月2日
發(fā)明者陳岳勇, 朱健 申請人:揚智科技股份有限公司