專(zhuān)利名稱(chēng):音頻-視頻同步方法以及音頻-視頻同步模塊的制作方法
技術(shù)領(lǐng)域:
本發(fā)明相關(guān)于一種音頻-視頻同步(audio-video synchronization)處理技術(shù),尤指ー種參照可表示當(dāng)前視頻巾貞(video frame)運(yùn)動(dòng)幅度的指示信息來(lái)執(zhí)行音頻-視頻同步的音頻-視頻同步方法以及音頻-視頻同步模塊。
背景技術(shù):
現(xiàn)有的多媒體播放器(例如數(shù)字視頻盤(pán)(Digital Video Disc, DVD)或是計(jì)算機(jī)軟件)會(huì)由光盤(pán)或是硬盤(pán)中接收并處理視頻(video)以及音頻(audio)來(lái)播放影音(audio-video,AV)數(shù)據(jù)。當(dāng)視頻與音頻彼此不同步時(shí),所播放的聲音將可能會(huì)領(lǐng)先或是落后所播放的影像,嚴(yán)重影響到觀賞者的體驗(yàn)。一般來(lái)說(shuō),現(xiàn)有的多媒體播放器提供了僅基于視頻以及音頻的時(shí)序(timing)信·息的同步機(jī)制,即,視頻與音頻是依據(jù)公用頻率信號(hào)(global clock signal)來(lái)同步播放的。而在另一種常見(jiàn)的同步機(jī)制中,視頻與音頻其中之一的播放時(shí)序是依據(jù)視頻與音頻之中另外ー個(gè)的播放時(shí)序來(lái)加以調(diào)整的。舉例來(lái)說(shuō),當(dāng)視頻的播放落后于音頻的播放時(shí),現(xiàn)有的多媒體播放器可能選擇丟掉(drop) —張或是多張經(jīng)由視頻串流傳輸?shù)囊曨l幀來(lái)追上音頻信號(hào);另ー方面來(lái)說(shuō)當(dāng)視頻的播放領(lǐng)先于音頻的播放時(shí),現(xiàn)有的多媒體播放器可能選擇重復(fù)(repeat) —張或是多張經(jīng)由視頻串流傳輸?shù)囊曨l幀來(lái)等待音頻信號(hào)追上。請(qǐng)參照?qǐng)D1,其為現(xiàn)有視頻-音頻同步方法的示意圖。如圖所示,連續(xù)四張視頻幀F(xiàn)fF4展示了ー顆球落下并靜止停在地面上的過(guò)程。假若在過(guò)程中因音頻領(lǐng)先于視頻而導(dǎo)致同步錯(cuò)誤,現(xiàn)有的視頻-音頻同步方法會(huì)跳過(guò)第二張視頻幀F(xiàn)2而依序播放視頻幀F(xiàn)1、F3以及F4。然而,在一些案例之中,這樣的同步機(jī)制可能會(huì)帶給觀賞者糟糕的視聽(tīng)感受。當(dāng)播放的視頻帶有快速運(yùn)動(dòng)的內(nèi)容且落后于該音頻時(shí),現(xiàn)有的同步機(jī)制會(huì)決定丟掉(drop)視頻串流中部分的視頻幀以達(dá)到影音同歩;然而,跳過(guò)這些帶有快速運(yùn)動(dòng)的物體的視頻可能會(huì)對(duì)觀賞者造成不協(xié)調(diào)、不連續(xù)的視覺(jué)感受。舉例來(lái)說(shuō),在圖I的例子中,跳過(guò)第二張視頻幀F(xiàn)2會(huì)使得落下的球突然出現(xiàn)在地面上,球的運(yùn)動(dòng)過(guò)程對(duì)觀賞者來(lái)說(shuō)會(huì)是一種令人困惑且荒唐的視覺(jué)感受。更明確地來(lái)說(shuō),當(dāng)視頻串流包含有人眼較敏感的元素,例如快速移動(dòng)的物體或是迅速變化的亮度之類(lèi),現(xiàn)有的影音同步技術(shù)(例如丟掉或是重復(fù)視頻幀)會(huì)對(duì)觀賞者造成不愉快的視覺(jué)體驗(yàn)。
發(fā)明內(nèi)容
為了解決現(xiàn)有技術(shù)中影音同步的效果不理想的技術(shù)問(wèn)題,本發(fā)明提供一種影音同步方法以及ー種影音同步模塊來(lái)解決上述的問(wèn)題。依據(jù)本發(fā)明的第一實(shí)施方式,其提供了 ー種音頻-視頻同步(audio-videosynchronization)方法,用以同步視頻串流(bitstream)與音頻串流的播放,視頻串流包含有多個(gè)視頻巾貞(video frame),音頻-視頻同步方法包含有得出對(duì)應(yīng)視頻串流中當(dāng)前視頻幀的指示信息以及時(shí)序信息,其中指示信息表示當(dāng)前視頻幀的運(yùn)動(dòng)幅度;以及參照指示信息、時(shí)序信息以及系統(tǒng)頻率來(lái)處理當(dāng)前視頻幀,以同步視頻串流與音頻串流的播放。依據(jù)本發(fā)明的第二實(shí)施方式,其提供了ー種音頻-視頻同步方法,用以同步視頻串流與音頻串流的播放,視頻串流包含有多個(gè)視頻幀,音頻-視頻同步方法包含有得出對(duì)應(yīng)視頻串流中當(dāng)前視頻幀的指示信息以及時(shí)序信息,其中指示信息為當(dāng)前視頻幀的譯碼后信息;以及參照指示信息、時(shí)序信息以及系統(tǒng)頻率來(lái)處理當(dāng)前視頻幀,以同步視頻串流與音頻串流的播放。依據(jù)本發(fā)明的第三實(shí)施方式,其提供了一種音頻-視頻同步模塊,用以同步視頻串流與音頻串流的播放,視頻串流包含有多個(gè)視頻幀,音頻-視頻同步模塊包含有偵測(cè)單元以及處理單元。偵測(cè)單元用以得出對(duì)應(yīng)該視頻串流中當(dāng)前視頻幀的指示信息以及時(shí)序信息,其中指示信息表示當(dāng)前視頻幀的運(yùn)動(dòng)幅度。處理單元耦接于偵測(cè)單元,用以參照指示信息、時(shí)序信息以及系統(tǒng)頻率來(lái)處理當(dāng)前視頻幀,以同步視頻串流與音頻串流的播放。依據(jù)本發(fā)明的第四實(shí)施方式提供了一種音頻-視頻同步模塊,用以同步視頻串流·與音頻串流的播放,視頻串流包含有多個(gè)視頻幀,音頻-視頻同步模塊包含有偵測(cè)單元以及處理單元。偵測(cè)單元用以得出對(duì)應(yīng)該視頻串流中當(dāng)前視頻幀的指示信息以及時(shí)序信息,其中指示信息為當(dāng)前視頻幀的譯碼后信息。處理單元耦接于偵測(cè)單元,用以參照指示信息、時(shí)序信息以及系統(tǒng)頻率來(lái)處理當(dāng)前視頻幀,以同步視頻串流與音頻串流的播放。本發(fā)明各個(gè)范例中的音頻-視頻同步方法以及音頻-視頻同步模塊可提供對(duì)人類(lèi)感官而言更加自然的影音播放質(zhì)量。
圖I其為現(xiàn)有技術(shù)的視頻-音頻同步方法的示意圖。圖2為依據(jù)本發(fā)明的實(shí)施方式所實(shí)現(xiàn)的多媒體處理系統(tǒng)的范例架構(gòu)示意圖。圖3為本發(fā)明的實(shí)施方式中音頻-視頻同步模塊對(duì)視頻幀執(zhí)行影音同步的范例示意圖。圖4為本發(fā)明的另ー實(shí)施方式中音頻-視頻同步模塊對(duì)視頻幀執(zhí)行影音同步的范例示意圖。圖5是依據(jù)本發(fā)明的另ー實(shí)施方式所實(shí)現(xiàn)的多媒體處理系統(tǒng)的范例架構(gòu)示意圖。
具體實(shí)施例方式在說(shuō)明書(shū)及權(quán)利要求書(shū)當(dāng)中使用了某些詞匯來(lái)稱(chēng)呼特定的元件。本領(lǐng)域的技術(shù)人員應(yīng)可理解,硬件制造商可能會(huì)用不同的名詞來(lái)稱(chēng)呼同一個(gè)元件。本說(shuō)明書(shū)及權(quán)利要求書(shū)并不以名稱(chēng)的差異來(lái)作為區(qū)分元件的方式,而是以元件在功能上的差異來(lái)作為區(qū)分的準(zhǔn)貝U。在通篇說(shuō)明書(shū)及權(quán)利要求書(shū)當(dāng)中所提及的“包含”是開(kāi)放式的用語(yǔ),故應(yīng)解釋成“包含但不限定干”。此外,“耦接”ー詞在此是包含任何直接及間接的電氣連接手段。因此,若文中描述第一裝置耦接于第二裝置,則代表第一裝置可直接電氣連接于第二裝置,或通過(guò)其它裝置或連接手段間接地電氣連接到第二裝置。參照?qǐng)D2,其為依據(jù)本發(fā)明的實(shí)施方式所實(shí)現(xiàn)的多媒體處理系統(tǒng)200的范例架構(gòu)示意圖。多媒體處理系統(tǒng)200包含有(但不限定于)音頻-視頻同步(au dio-videosynchronization)模塊 210、譯碼器(decoder) 220、顯不引擎(display engine) 230 以及音頻播放単元240。音頻-視頻同步模塊210會(huì)將音頻串流(bitstream)BS_A與包含有多個(gè)視頻幀的視頻串流BS_V同歩。音頻-視頻同步模塊210包含有(但不限定干)偵測(cè)單元211以及處理單元212。譯碼器220可包含有對(duì)接收進(jìn)來(lái)的音頻串流BS_A-行譯碼的音頻譯碼電路(未繪示于圖中)以及對(duì)接收進(jìn)來(lái)的視頻串流BS_V-行譯碼的視頻譯碼電路(未繪示于圖中)。顯示引擎230則用以驅(qū)動(dòng)視頻輸出裝置(例如顯示屏幕),依據(jù)音頻-視頻同步模塊210的決定輸出來(lái)顯示由視頻譯碼電路對(duì)視頻串流BS_V譯碼后的視頻幀。音頻播放単元240則用以驅(qū)動(dòng)音頻輸出裝置(例如音響)來(lái)播放由音頻譯碼電路對(duì)音頻串流BSA處理后的音頻樣本。在這個(gè)實(shí)施方式中,經(jīng)由音頻-視頻同步模塊210的決定輸出的幫助,顯示引擎230可選擇性地重復(fù)當(dāng)前視頻幀以進(jìn)行影音同步、丟掉當(dāng)前視頻幀以進(jìn)行影音同步,或是照常播放當(dāng)前視頻幀。偵測(cè)單元211用以處理視頻串流BS_V來(lái)得到對(duì)應(yīng)該當(dāng)前視頻幀的指示信息SI以及對(duì)應(yīng)當(dāng)前視頻巾貞的時(shí)序信息(video pre sentation time stamp, VPTS),其中指示信息SI表示當(dāng)前視頻幀的運(yùn)動(dòng)幅度。舉例來(lái)說(shuō),指示信息SI可從處理視頻串流BS_V的譯碼結(jié) 果的過(guò)程中得到。每ー譯碼后的當(dāng)前視頻幀以及每一譯碼后的先前視頻幀均是ー張完整的圖片,而偵測(cè)單元211會(huì)比較譯碼后的當(dāng)前視頻幀與譯碼后的先前視頻幀來(lái)辨識(shí)出對(duì)應(yīng)當(dāng)前視頻幀的運(yùn)動(dòng)幅度,并產(chǎn)生對(duì)應(yīng)當(dāng)前視頻幀的指示信息SI。在另ー個(gè)設(shè)計(jì)之中,指示信息SI可由視頻串流BS_V中的內(nèi)容相關(guān)信息(其為譯碼器220對(duì)視頻串流BS_V中的當(dāng)前視頻幀譯碼所得到)來(lái)得到。更明確地來(lái)說(shuō),當(dāng)對(duì)當(dāng)前視頻幀譯碼時(shí),譯碼器220中的視頻譯碼電路會(huì)辨識(shí)出前述的內(nèi)容相關(guān)信息(例如當(dāng)前視頻幀的向量)。經(jīng)過(guò)計(jì)算當(dāng)前視頻幀的向量,可得出參數(shù),而偵測(cè)電路211可接著參照參數(shù)來(lái)決定對(duì)應(yīng)當(dāng)前視頻幀的指示信息SI。舉例來(lái)說(shuō),當(dāng)視頻串流BS_V在傳送快速運(yùn)動(dòng)的視頻幀吋,幅度大的運(yùn)動(dòng)向量會(huì)被偵測(cè)到,而指示信息SI也是如此。在又另ー設(shè)計(jì)中,指示信息SI可能會(huì)從當(dāng)前視頻幀的報(bào)頭(header)所得到,而報(bào)頭可以提供粗略但快速的結(jié)果。舉例來(lái)說(shuō),指示信息SI可以是指出當(dāng)前視頻幀的幀類(lèi)型(frame type),巾貞類(lèi)型可指出當(dāng)前視頻巾貞是巾貞內(nèi)編碼視頻巾貞(intra-coded frame, I畫(huà)面)或是巾貞間編碼視頻巾貞(inter-coded frame, P畫(huà)面或是B畫(huà)面)。請(qǐng)注意,巾貞類(lèi)型可以用來(lái)表示運(yùn)動(dòng)幅度。幀內(nèi)編碼畫(huà)面(即,I畫(huà)面)代表了當(dāng)前視頻幀的譯碼過(guò)程與先前視頻幀或后續(xù)視頻巾貞無(wú)關(guān)。預(yù)測(cè)畫(huà)面(pre dieted frame, P畫(huà)面)則與先前視頻巾貞相關(guān),所以可能代表當(dāng)前視頻巾貞有涉及快速移動(dòng)的內(nèi)容。而雙向編碼畫(huà)面(bi-direction frame, B畫(huà)面)則與包含有先前視頻幀或后續(xù)視頻幀的多個(gè)視頻幀相關(guān),是故可推得當(dāng)前視頻幀具有大量快速移動(dòng)的內(nèi)容在其中。然而,這些并非用來(lái)限定本發(fā)明的內(nèi)容。舉例來(lái)說(shuō),指示信息SI可以設(shè)定為可指出當(dāng)前視頻幀的運(yùn)動(dòng)幅度的任意參數(shù),例如當(dāng)前視頻幀的運(yùn)動(dòng)信息、當(dāng)前視頻幀的亮度變化信息、當(dāng)前視頻幀的幀類(lèi)型或是上述信息的組合。這些設(shè)計(jì)均符合本發(fā)明的精神并落在本發(fā)明的范疇之內(nèi)。處理單元212耦接于偵測(cè)單元211,用以接收指示信息SI并參照指示信息SI、時(shí)序信息(例如VPTS)以及系統(tǒng)頻率STC來(lái)處理當(dāng)前視頻幀,以控制視頻串流BS_V與音頻串流BS_A的播放同步化。本領(lǐng)域內(nèi)技術(shù)人員應(yīng)可輕易了解如何依據(jù)經(jīng)由傳輸流(transportstream)傳輸?shù)某绦蝾l率參考源(program clock reference,PCR),來(lái)在譯碼器端產(chǎn)生系統(tǒng)頻率STC,為簡(jiǎn)明起見(jiàn),詳細(xì)敘述在此便不再贅述。當(dāng)指示信息SI指出當(dāng)前視頻幀的運(yùn)動(dòng)幅度小于ー個(gè)閾值時(shí),處理單兀212會(huì)如同傳統(tǒng)的同步裝置一般運(yùn)作,在系統(tǒng)頻率STC與時(shí)序信息VPTS出現(xiàn)岐異時(shí),決定丟掉或是重復(fù)當(dāng)前視頻幀。在這種情況下,視頻與音頻的播放僅有極小的差異,并不會(huì)對(duì)觀賞者的視覺(jué)感受有重大的影響,而現(xiàn)有的同步技術(shù)足以有效率地彌平這些微小的差異。然而,當(dāng)指示信息SI指出當(dāng)前視頻幀的運(yùn)動(dòng)幅度超過(guò)閾值吋,處理單元212會(huì)以不同的方式運(yùn)作。舉例來(lái)說(shuō),處理單元212會(huì)停止影音同步以使得當(dāng)前視頻幀經(jīng)由顯示引擎230正常顯示出來(lái)。此外,影音同步的運(yùn)作是暫時(shí)停止的,當(dāng)前視頻幀的運(yùn)動(dòng)幅度降低至小于閾值吋,處理單元212便可能決定重新開(kāi)始影音同步的運(yùn)作。請(qǐng)參照?qǐng)D3,其為本發(fā)明的實(shí)施方式中音頻-視頻同步模塊210對(duì)視頻幀F(xiàn)fF4執(zhí)行影音同步的范例示意圖。請(qǐng)參照與圖I相似的影音同步情況,當(dāng)在處理第二視頻幀F(xiàn)2時(shí),偵測(cè)到同步錯(cuò)誤,在此情況下,現(xiàn)有影音同步方法會(huì)打算跳過(guò)第二視頻幀F(xiàn)2來(lái)完成影音同步,而相對(duì)應(yīng)的指示信息SI也會(huì)指出第二視頻幀F(xiàn)2具有極大的運(yùn)動(dòng)向量;于是處理單元212將不會(huì)丟掉第二視頻幀F(xiàn)2,而是正常地顯示它。接下來(lái),當(dāng)譯碼器220在處理第三視頻幀F(xiàn)3,相對(duì)應(yīng)的指示信息SI指出第三視頻幀F(xiàn)3的運(yùn)動(dòng)幅度降低至小于閾值吋,處理單元212會(huì)繼續(xù)影音同步并丟掉第三視頻幀F(xiàn)3。如圖3所示,第三視頻幀F(xiàn)3為靜止的情境。·所以,對(duì)人眼視覺(jué)而言,跳過(guò)第三視頻幀F(xiàn)3會(huì)比跳過(guò)第二視頻幀F(xiàn)2來(lái)得自然許多。如此ー來(lái),觀賞者便可享有較平順而愉快的影音播放體驗(yàn)。如同之前所敘述的,本發(fā)明的指示信息SI并不限定于運(yùn)動(dòng)信息。指示信息SI可以是另一表示運(yùn)動(dòng)幅度的參數(shù),例如當(dāng)前視頻幀的亮度變化信息。請(qǐng)參照?qǐng)D4,其為本發(fā)明的另ー實(shí)施方式中音頻-視頻同步模塊210對(duì)視頻幀GfG4執(zhí)行影音同步的范例示意圖。連續(xù)的視頻幀GfG4展示了一個(gè)手電筒在黑暗的環(huán)境中漸漸由關(guān)閉狀態(tài)轉(zhuǎn)至開(kāi)啟狀態(tài)。在此情況下,偵測(cè)單元211會(huì)取得載有當(dāng)前視頻幀亮度變化信息的指示信息SI以指示運(yùn)動(dòng)幅度。當(dāng)在處理第二視頻幀G2而發(fā)現(xiàn)同步錯(cuò)誤吋,處理單元212不會(huì)決定馬上丟掉第二視頻幀G2,而是選擇丟掉第三視頻幀G3,這是因?yàn)槟玫艉罄m(xù)的第三視頻幀G3所造成的亮度變化遠(yuǎn)小于丟掉當(dāng)前的第二視頻幀G2。雖然音頻-視頻同步模塊210可經(jīng)由延遲影音同步的時(shí)序來(lái)提供較合適的視頻/音頻播放給觀賞者,然而,影音同步不應(yīng)該被延遲超過(guò)太多幀數(shù);否則,其所呈現(xiàn)的不同步的視頻/音頻播放令人難以忍受。所以,當(dāng)不同步程度(即是系統(tǒng)頻率STC與時(shí)序信息VPTS的差異)大于預(yù)定時(shí)間閾值(或是預(yù)定幀數(shù)閾值)吋,處理單元212會(huì)決定仍舊執(zhí)行影音同步而不論指示信息為何。請(qǐng)參照?qǐng)D5,其為依據(jù)本發(fā)明的另ー實(shí)施方式所實(shí)現(xiàn)的多媒體處理系統(tǒng)500的范例架構(gòu)示意圖。多媒體處理系統(tǒng)500包含有(但不限定干)音頻-視頻同步模塊510、譯碼器220、顯示引擎230以及音頻播放単元240。處理單元212、譯碼器220、顯示引擎230以及音頻播放単元240與圖2中的對(duì)照組件本質(zhì)上均相同,為簡(jiǎn)明起見(jiàn),相關(guān)敘述在此便不再贅述。音頻-視頻同步模塊510包含有(但不限定干)偵測(cè)單元511以及處理單元212。在圖2中,偵測(cè)單元211可依據(jù)譯碼器220所提供的信息來(lái)得到指示信息SI,而圖5中的偵測(cè)単元511則是可處理所接收的視頻串流BS_V并在內(nèi)部便得到指示信息SI。由于譯碼后的數(shù)據(jù)僅有一小部分(例如報(bào)頭中的巾貞類(lèi)型或是巾貞運(yùn)動(dòng)信息(frame motion information))是必要的,偵測(cè)單元511的應(yīng)用可因此省下不少時(shí)間。此外,當(dāng)處理單元212決定丟掉當(dāng)前視頻幀,處理単元212可通知譯碼器220跳過(guò)處理被丟掉的當(dāng)前視頻幀,以節(jié)省系統(tǒng)資源。綜上所述,經(jīng)由偵測(cè)ー些運(yùn)動(dòng)幅度信息,可因此而避免重復(fù)或是丟掉具有較大運(yùn)動(dòng)幅度的視頻幀之類(lèi)的影音同步操作。是故,本發(fā)明各個(gè)范例中的音頻-視頻同步方法以及音頻-視頻同步模塊可提供對(duì)人類(lèi)感官而言更加自然的影音播放質(zhì)量。
本領(lǐng)域中技術(shù)人員應(yīng)能理解,在不脫離本發(fā)明的精神和范圍的情況下,可對(duì)本發(fā)明做許多更動(dòng)與改變。因此,上述本發(fā)明的范圍具體應(yīng)以后附的權(quán)利要求界定的范圍為準(zhǔn)。
權(quán)利要求
1.一種音頻-視頻同步方法,用以同步視頻串流與音頻串流的播放,所述視頻串流包含有多個(gè)視頻幀,所述音頻-視頻同步方法包含有 得出對(duì)應(yīng)所述視頻串流中當(dāng)前視頻幀的指示信息以及時(shí)序信息,其中所述指示信息表示所述當(dāng)前視頻幀的運(yùn)動(dòng)幅度;以及 參照所述指示信息、所述時(shí)序信息以及系統(tǒng)頻率來(lái)處理所述當(dāng)前視頻幀,以同步所述視頻串流與所述首頻串流的播放。
2.如權(quán)利要求I所述的音頻-視頻同步方法,其特征在于,所述指示信息包含有所述當(dāng)前視頻幀的運(yùn)動(dòng)信息、所述當(dāng)前視頻幀的亮度信息以及所述當(dāng)前視頻幀的幀類(lèi)型至少其中之一 O
3.如權(quán)利要求I所述的音頻-視頻同步方法,其特征在于,所述指示信息由所述視頻串流譯碼所得到。
4.如權(quán)利要求I所述的音頻-視頻同步方法,其特征在于,所述指示信息為所述視頻串流的譯碼結(jié)果。
5.如權(quán)利要求I所述的音頻-視頻同步方法,其特征在于,所述指示信息由所述當(dāng)前視頻幀的報(bào)頭所得到。
6.如權(quán)利要求I所述的音頻-視頻同步方法,其特征在于,參照所述指示信息、所述時(shí)序信息以及所述系統(tǒng)頻率來(lái)處理所述當(dāng)前視頻幀的步驟包含有 當(dāng)所述指示信息指出所述當(dāng)前視頻幀的所述運(yùn)動(dòng)幅度超過(guò)閾值時(shí),停止音頻-視頻同步的運(yùn)作。
7.如權(quán)利要求6所述的音頻-視頻同步方法,其特征在于,參照所述指示信息、所述時(shí)序信息以及所述系統(tǒng)頻率來(lái)處理所述當(dāng)前視頻幀的步驟包含有 當(dāng)所述指示信息指出所述當(dāng)前視頻幀的所述運(yùn)動(dòng)幅度低于所述閾值時(shí),重新開(kāi)始音頻-視頻同步的所述運(yùn)作。
8.一種音頻-視頻同步方法,用來(lái)同步視頻串流與音頻串流的播放,所述視頻串流包含有多個(gè)視頻幀,所述音頻-視頻同步方法包含有 得出對(duì)應(yīng)所述視頻串流中當(dāng)前視頻幀的指示信息以及時(shí)序信息,其中所述指示信息為所述當(dāng)前視頻幀的譯碼后信息;以及 參照所述指示信息、所述時(shí)序信息以及系統(tǒng)頻率來(lái)處理所述當(dāng)前視頻幀,以同步所述視頻串流與所述首頻串流的播放。
9.如權(quán)利要求8所述的音頻-視頻同步方法,其特征在于,參照所述指示信息、所述時(shí)序信息以及所述系統(tǒng)頻率來(lái)處理所述當(dāng)前視頻幀的步驟包含有 當(dāng)所述指示信息指出所述當(dāng)前視頻幀的所述運(yùn)動(dòng)幅度超過(guò)閾值時(shí),停止音頻-視頻同步的運(yùn)作。
10.如權(quán)利要求9所述的音頻-視頻同步方法,其特征在于,參照所述指示信息、所述時(shí)序信息以及所述系統(tǒng)頻率來(lái)處理所述當(dāng)前視頻幀的步驟包含有 當(dāng)所述指示信息指出所述當(dāng)前視頻幀的所述運(yùn)動(dòng)幅度低于所述閾值時(shí),重新開(kāi)始音頻-視頻同步的運(yùn)作。
11.一種音頻-視頻同步模塊,用以同步視頻串流與音頻串流的播放,所述視頻串流包含有多個(gè)視頻幀,所述音頻-視頻同步模塊包含有偵測(cè)單元,用以得出對(duì)應(yīng)所述視頻串流中當(dāng)前視頻幀的指示信息以及時(shí)序信息,其中所述指示信息表示所述當(dāng)前視頻幀的運(yùn)動(dòng)幅度; 以及 處理單元,耦接于所述偵測(cè)單元,用以參照所述指示信息、所述時(shí)序信息以及系統(tǒng)頻率來(lái)處理所述當(dāng)前視頻幀,以同步所述視頻串流與所述音頻串流的播放。
12.如權(quán)利要求11所述的音頻-視頻同步模塊,其特征在于,所述指示信息包含有所述當(dāng)前視頻幀的運(yùn)動(dòng)信息、所述當(dāng)前視頻幀的亮度信息以及所述當(dāng)前視頻幀的幀類(lèi)型的至少其中之一。
13.如權(quán)利要求11所述的音頻-視頻同步模塊,其特征在于,所述指示信息由所述視頻串流的譯碼結(jié)果所得到。
14.如權(quán)利要求11所述的音頻-視頻同步模塊,其特征在于,所述指示信息為所述視頻串流的譯碼結(jié)果。
15.如權(quán)利要求11所述的音頻-視頻同步模塊,其特征在于,所述指示信息由所述當(dāng)前視頻幀的報(bào)頭所得到。
16.如權(quán)利要求11所述的音頻-視頻同步模塊,其特征在于,當(dāng)所述指示信息指出所述當(dāng)前視頻幀的所述運(yùn)動(dòng)幅度超過(guò)閾值時(shí),所述處理單元決定停止音頻-視頻同步的運(yùn)作。
17.如權(quán)利要求16所述的音頻-視頻同步模塊,其特征在于,所述指示信息指出所述當(dāng)前視頻幀的所述運(yùn)動(dòng)幅度低于所述閾值時(shí),所述處理單元決定重新開(kāi)始音頻-視頻同步的所述運(yùn)作。
18.一種音頻-視頻同步模塊,用以同步視頻串流與音頻串流的播放,所述視頻串流包含有多個(gè)視頻幀,所述音頻-視頻同步模塊包含有 偵測(cè)單元,用以得出對(duì)應(yīng)所述視頻串流中當(dāng)前視頻幀的指示信息以及時(shí)序信息,其中所述指示信息為所述當(dāng)前視頻幀的譯碼后信息; 以及 處理單元,耦接于所述偵測(cè)單元,用以參照所述指示信息、所述時(shí)序信息以及系統(tǒng)頻率來(lái)處理所述當(dāng)前視頻幀,以同步所述視頻串流與所述音頻串流的播放。
19.如權(quán)利要求18所述的音頻-視頻同步模塊,其特征在于,當(dāng)所述指示信息指出所述當(dāng)前視頻幀的所述運(yùn)動(dòng)幅度超過(guò)閾值時(shí),所述處理單元決定停止音頻-視頻同步的運(yùn)作。
20.如權(quán)利要求19所述的音頻-視頻同步模塊,其特征在于,所述指示信息指出所述當(dāng)前視頻幀的所述運(yùn)動(dòng)幅度低于所述閾值時(shí),所述處理單元決定重新開(kāi)始音頻-視頻同步的所述運(yùn)作。
全文摘要
本發(fā)明提供一種音頻-視頻同步方法,用以同步視頻串流與音頻串流的播放,所述視頻串流包含有多個(gè)視頻幀,所述音頻-視頻同步方法包含有得出對(duì)應(yīng)所述視頻串流中當(dāng)前視頻幀的指示信息以及時(shí)序信息,其中所述指示信息表示所述當(dāng)前視頻幀的運(yùn)動(dòng)幅度;以及參照所述指示信息、所述時(shí)序信息以及系統(tǒng)頻率來(lái)處理所述當(dāng)前視頻幀,以同步所述視頻串流與所述音頻串流的播放。本發(fā)明提出的音頻-視頻同步方法以及音頻-視頻同步模塊可提供對(duì)人類(lèi)感官而言更加自然的影音播放質(zhì)量。
文檔編號(hào)G11B27/10GK102789798SQ20121015107
公開(kāi)日2012年11月21日 申請(qǐng)日期2012年5月15日 優(yōu)先權(quán)日2011年5月17日
發(fā)明者蕭哲民 申請(qǐng)人:聯(lián)發(fā)科技股份有限公司