專利名稱:一種視頻壓縮方法及使用該方法的視頻系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及數(shù)字圖像處理領(lǐng)域,特別是一種視頻壓縮方法及使用該方法的視頻系統(tǒng)。
背景技術(shù):
隨著因特網(wǎng)的發(fā)展,視頻系統(tǒng)漸漸的被廣泛應(yīng)用到各個(gè)領(lǐng)域。視頻會(huì)議系統(tǒng),是利用視頻、音頻壓縮技術(shù)及點(diǎn)到點(diǎn)或點(diǎn)到多點(diǎn)的通信技術(shù),構(gòu)筑在IP網(wǎng)絡(luò)上的全新會(huì)議解決方案。該系統(tǒng)不同于傳統(tǒng)的基于會(huì)議室的會(huì)議系統(tǒng),它不需要固定的線路和固定的會(huì)議地點(diǎn)、不依賴于固定的設(shè)備和昂貴的硬件投資,與會(huì)者只需安坐在會(huì)議室、教室、辦公室里或家中,隨時(shí)隨地,隨便用一臺(tái)筆記本電腦或PC,連上一條網(wǎng)絡(luò)連接線,通過公用網(wǎng)絡(luò),連接到虛擬的會(huì)議呼叫中心(會(huì)議管理服務(wù)器),就可以隨時(shí)和各地的伙伴和同行進(jìn)行數(shù)據(jù)、音頻及視頻的交流通訊。其中視頻壓縮技術(shù)是將視頻數(shù)據(jù)根據(jù)用戶對(duì)圖像質(zhì)量的要求及傳輸帶寬的要求進(jìn)行壓縮的一種技術(shù),以求在滿足圖像質(zhì)量要求的同時(shí)實(shí)現(xiàn)占用較小的帶寬,其中現(xiàn)有的視頻壓縮技術(shù)包括有H.263系列、MPEG-4、motionJPEG等。這些壓縮標(biāo)準(zhǔn)的基本方法是將視頻以幀為單位,對(duì)每一幀分別按I幀、P幀或B幀進(jìn)行壓縮,并與壓縮后的語音數(shù)據(jù)一起傳輸。盡管現(xiàn)有的視頻壓縮方法已經(jīng)有很高的壓縮比,但是其中的視頻流仍然占據(jù)了很大的比重。另外在很多應(yīng)用場合,如一般家庭中的播號(hào)上網(wǎng)、手機(jī)等無線終端設(shè)備等其可用帶寬在目前還十分有限,因此現(xiàn)有的這些視頻壓縮技術(shù)的應(yīng)用仍不能滿足用戶對(duì)畫面質(zhì)量的要求。
因此,亟待提出一種可以有效解決上述問題的視頻壓縮方法及使用該方法視頻系統(tǒng)。
發(fā)明內(nèi)容
有鑒于此,本發(fā)明的目的在于提供一種視頻壓縮方法及使用該方法視頻系統(tǒng),其可以有效的降低特定應(yīng)用中的視頻流的碼率。
為了達(dá)到上述目的,根據(jù)本發(fā)明的一方面,一種視頻壓縮方法,包括以下步驟獲取視頻圖像序列,并確定當(dāng)前幀圖像及參考幀圖像;對(duì)所述視頻圖像序列進(jìn)行運(yùn)動(dòng)檢測,根據(jù)預(yù)先設(shè)定的閾值來確定當(dāng)前幀圖像相對(duì)參考幀圖像是否有大幅運(yùn)動(dòng);如果是,則對(duì)當(dāng)前幀圖像進(jìn)行數(shù)據(jù)壓縮及傳送;如果否,則不對(duì)當(dāng)前幀圖像數(shù)據(jù)進(jìn)行壓縮及傳送。
優(yōu)選的,獲取的視頻圖像主要是發(fā)言者正面人臉的圖像。
優(yōu)選的,對(duì)當(dāng)前幀圖像關(guān)于是否有大幅運(yùn)動(dòng)的運(yùn)動(dòng)檢測中,當(dāng)前幀圖像與參考幀圖像的運(yùn)動(dòng)檢測結(jié)果大于預(yù)先設(shè)定的閾值,則確定當(dāng)前幀圖像發(fā)生大幅運(yùn)動(dòng),當(dāng)前幀圖像與參考幀圖像的運(yùn)動(dòng)檢測結(jié)果小于預(yù)先設(shè)定的閾值,則確定當(dāng)前幀圖像未發(fā)生大幅運(yùn)動(dòng),其中大幅運(yùn)動(dòng)是指可能發(fā)生發(fā)言者轉(zhuǎn)頭、低頭、仰頭等動(dòng)作等,沒有大幅運(yùn)動(dòng)是指僅有包括表情動(dòng)作、嘴形動(dòng)作、眼睛動(dòng)作等在內(nèi)的面部動(dòng)作。
優(yōu)選的,所述對(duì)當(dāng)前幀圖像進(jìn)行數(shù)據(jù)壓縮是指按照H.263或MPEG-4等壓縮標(biāo)準(zhǔn)進(jìn)行壓縮。
優(yōu)選的,該方法還包括音頻獲取、音頻壓縮、音頻數(shù)據(jù)傳輸、音頻數(shù)據(jù)接受及音頻數(shù)據(jù)解壓縮步驟。
優(yōu)選的,該方法進(jìn)一步包括如下步驟視頻數(shù)據(jù)接受;判斷是否有當(dāng)前幀圖像,如果有,則對(duì)此幀圖像進(jìn)行解壓縮并將解壓結(jié)果進(jìn)行圖像顯示,如果沒有,將最近解壓縮的一幀圖像作為模板,然后基于解壓出的語音信息及模板圖像合成出隨語音數(shù)據(jù)變化的面部圖像。
優(yōu)選的,圖像合成步驟中還要對(duì)模板圖像進(jìn)行分析,包括檢測出面部主要特征區(qū)域,如眼睛、嘴巴、下顎等,及主要特點(diǎn)。
根據(jù)本發(fā)明的另一方面,一種視頻系統(tǒng)包括視頻攝入模塊,可以攝入畫面主要包括正面人臉的圖像序列;運(yùn)動(dòng)檢測模塊,用于對(duì)所述視頻圖像序列進(jìn)行運(yùn)動(dòng)檢測,根據(jù)預(yù)先設(shè)定的閾值來確定當(dāng)前幀圖像相對(duì)參考幀圖像中正面人臉是否有大幅運(yùn)動(dòng);視頻壓縮模塊,根據(jù)運(yùn)動(dòng)檢測結(jié)果來確定是否對(duì)當(dāng)前幀圖像進(jìn)行壓縮,如果確定當(dāng)前幀圖像與參考幀圖像相比正面人臉有大幅運(yùn)動(dòng),則對(duì)當(dāng)前幀圖像進(jìn)行壓縮;如果確定當(dāng)前幀圖像與參考幀圖像相比正面人臉沒有大幅運(yùn)動(dòng),則不對(duì)視頻攝入模塊攝入的當(dāng)前幀圖像進(jìn)行壓縮。
優(yōu)選的,該系統(tǒng)還包括用于攝入音頻的音頻攝入模塊、將音頻數(shù)據(jù)進(jìn)行壓縮的音頻壓縮模塊及接收視頻壓縮模塊及音頻壓縮模塊的數(shù)據(jù)并將其協(xié)調(diào)發(fā)送的數(shù)據(jù)發(fā)送模塊。
優(yōu)選的,該系統(tǒng)進(jìn)一步包括有接受并分離視頻數(shù)據(jù)及音頻數(shù)據(jù)的數(shù)據(jù)接收模塊、對(duì)音頻數(shù)據(jù)進(jìn)行解壓的音頻解壓模塊、對(duì)視頻數(shù)據(jù)進(jìn)行解壓的視頻解壓模塊及視頻合成模塊,其中視頻解壓模塊解壓數(shù)據(jù)時(shí)首先碼流中是否有當(dāng)前幀圖像數(shù)據(jù),如果有,則對(duì)此幀圖像進(jìn)行解壓縮并進(jìn)行圖像顯示;如果沒有當(dāng)前幀圖像,視頻合成模塊會(huì)將視頻解壓模塊最近輸出的一幀圖像作為模板,并對(duì)該模板圖像進(jìn)行分析主要特征區(qū)域及主要特點(diǎn),然后視頻合成模塊基于音頻解壓模塊解壓出的語音信息及模板圖像中面部圖像合成出隨語音數(shù)據(jù)變化的面部圖像。
對(duì)于本發(fā)明的視頻系統(tǒng)通過特別設(shè)置運(yùn)動(dòng)檢測模塊來對(duì)攝入的發(fā)言者面部圖像進(jìn)行運(yùn)動(dòng)檢測,并以檢測結(jié)果來最終確定是否對(duì)當(dāng)前幀圖像進(jìn)行壓縮,如果發(fā)言者面部圖像沒有大幅運(yùn)動(dòng)可以實(shí)現(xiàn)連續(xù)多幀圖像不進(jìn)行壓縮傳輸,改變了現(xiàn)有技術(shù)中將當(dāng)前幀圖像統(tǒng)統(tǒng)作壓縮處理的做法,從而有效的降低了視頻流的碼率,并進(jìn)一步降低了音視頻流共同占用的帶寬。另外,通過增設(shè)視頻圖像合成模塊,利用模板幀圖像及與此對(duì)應(yīng)的語音信息合成出被省略的隨著語音變化的面部圖像,以滿足用戶的對(duì)畫面質(zhì)量的高要求。
圖1是本發(fā)明視頻系統(tǒng)的方框示意圖;圖2是本發(fā)明視頻壓縮方法的壓縮過程流程圖;及圖3是本發(fā)明視頻壓縮方法的解壓過程流程圖。
具體實(shí)施例方式
在進(jìn)行視頻會(huì)議或其它視頻應(yīng)用時(shí),在特定的一段時(shí)間內(nèi),需要將攝像機(jī)固定對(duì)準(zhǔn)某位發(fā)言者,攝像機(jī)攝入的圖像主要是發(fā)言者正面人臉的圖像。針對(duì)此種情況,本發(fā)明提出了一種視頻壓縮方法及基于該方法的視頻系統(tǒng)。但是需要指出的是,本發(fā)明的視頻壓縮方法及基于該方法的視頻系統(tǒng)并不僅限于此種情況下的應(yīng)用。
請(qǐng)參閱圖1所示,本發(fā)明提出的視頻系統(tǒng)至少包括數(shù)據(jù)發(fā)送端及數(shù)據(jù)接受端,其中數(shù)據(jù)發(fā)送端包括有視頻攝入模塊11、音頻攝入模塊12、運(yùn)動(dòng)檢測模塊13、視頻壓縮模塊14、音頻壓縮模塊15及數(shù)據(jù)發(fā)送模塊16,數(shù)據(jù)接受端包括有數(shù)據(jù)接受模塊21、視頻解壓模塊22、音頻解壓模塊23、視頻合成模塊24、視頻輸出模塊25及音頻輸出模塊26。
視頻攝入模塊11用于以指定幀率獲取視頻圖像序列,比如24幀/秒或30幀/秒。通常,所述視頻攝入模塊11內(nèi)置有用于感應(yīng)外部光線以將光信號(hào)轉(zhuǎn)換為模擬電信號(hào)的視頻傳感器及將模擬電信號(hào)轉(zhuǎn)化為數(shù)字信號(hào)的模數(shù)轉(zhuǎn)換器。因此,所述視頻攝入模塊11可以輸出數(shù)字圖像數(shù)據(jù)以供后續(xù)處理。在一個(gè)特定的實(shí)施例中,所述視頻攝入模塊11可以是一個(gè)攝像頭或攝像機(jī)等。關(guān)于攝入圖像并將模數(shù)轉(zhuǎn)換的技術(shù)已經(jīng)是所屬技術(shù)領(lǐng)域內(nèi)普通技術(shù)人員所能易于思及的,此處不再做進(jìn)一步描述。
由于在進(jìn)行視頻會(huì)議或其它視頻應(yīng)用時(shí),在特定的一段時(shí)間內(nèi),需要將視頻輸入模塊固定對(duì)準(zhǔn)某位發(fā)言者面部,視頻輸入模塊攝入的圖像主要是發(fā)言者正面人臉的圖像,也就是說在此段時(shí)間內(nèi),視頻攝入模塊11攝入的圖像序列之間可能除了發(fā)言者正面人臉的面部動(dòng)作之外并沒有其它的大的變化。針對(duì)這種情況,請(qǐng)結(jié)合參考圖2,所述視頻系統(tǒng)還特別提供了一個(gè)運(yùn)動(dòng)檢測模塊13,用于判斷當(dāng)前幀圖像(第N幀)與參考幀圖像相比發(fā)言者面部是否有大幅運(yùn)動(dòng),如果沒有,即可能只有包括表情動(dòng)作、嘴形動(dòng)作、眼睛動(dòng)作等在內(nèi)的面部動(dòng)作,則不對(duì)當(dāng)前幀圖像進(jìn)行后文將要提到的圖像壓縮及數(shù)據(jù)傳輸,并將此次參考幀圖像作為下次運(yùn)動(dòng)檢測的參考幀圖像;如果有,即可能發(fā)生發(fā)言者轉(zhuǎn)頭、低頭、仰頭等動(dòng)作或視頻攝入模塊11被移向別處,則對(duì)當(dāng)前幀圖像進(jìn)行后文將要提到的圖像壓縮,并將當(dāng)前幀圖像更新為參考幀圖像,將N自動(dòng)加1并重復(fù)上述步驟,這樣如果發(fā)言者面部圖像在一段時(shí)間之內(nèi)沒有大幅運(yùn)動(dòng)可以實(shí)現(xiàn)連續(xù)多幀圖像不進(jìn)行數(shù)據(jù)壓縮及傳輸,前述內(nèi)容即是本發(fā)明提出的視頻壓縮方法的壓縮步驟的核心。關(guān)于圖像的運(yùn)動(dòng)檢測技術(shù)已經(jīng)記載于中星微電子有限公司的中國第200510076954.1號(hào)及第200510093336.8號(hào)專利申請(qǐng)中,此處僅做簡要介紹。在一個(gè)實(shí)施例中,運(yùn)動(dòng)檢測模塊13將當(dāng)前攝入的發(fā)言者面部圖像確定為當(dāng)前幀圖像(第N幀),并指定視頻攝入模塊11攝入的另一幀圖像為參考幀圖像,然后統(tǒng)計(jì)參考幀圖像及當(dāng)前幀圖像內(nèi)的運(yùn)動(dòng)信息并將兩者的運(yùn)動(dòng)信息進(jìn)行對(duì)比,再后將參考幀圖像及當(dāng)前幀圖像內(nèi)的運(yùn)動(dòng)信息的比較結(jié)果與預(yù)先設(shè)定的閾值相比較,如果超過了預(yù)先設(shè)定的閾值則確定當(dāng)前幀圖像與參考幀圖像相比發(fā)言者面部有大幅運(yùn)動(dòng),同時(shí)將并將當(dāng)前幀圖像更新為參考幀圖像,如果未超過預(yù)先設(shè)定的閾值則確定當(dāng)前幀圖像與參考幀圖像相比發(fā)言者面部沒有大幅運(yùn)動(dòng),將N自動(dòng)加1并重復(fù)上述步驟。關(guān)于如何確定視頻攝入模塊11攝入的圖像是否主要為發(fā)言者面部的圖像可通過人臉檢測技術(shù)來判斷,比如可以判斷人臉圖像區(qū)域占整個(gè)圖像區(qū)域的百分比,以百分比是否超過預(yù)定的閾值來判斷是否主要為發(fā)言者面部的圖像,所述的人臉檢測技術(shù)已經(jīng)是所屬技術(shù)領(lǐng)域內(nèi)的普通技術(shù)人員所能輕易獲得的技術(shù),此處不作贅述。
所述視頻壓縮模塊14根據(jù)所述運(yùn)動(dòng)檢測模塊13的運(yùn)動(dòng)檢測結(jié)果對(duì)視頻攝入模塊11攝入的當(dāng)前幀圖像進(jìn)行壓縮并將壓縮后的數(shù)據(jù)輸送至發(fā)送模塊16。如果確定當(dāng)前幀圖像與參考幀圖像相比發(fā)言者面部有大幅運(yùn)動(dòng),則對(duì)視頻攝入模塊11攝入的當(dāng)前幀圖像進(jìn)行壓縮;如果確定當(dāng)前幀圖像與參考幀圖像相比發(fā)言者面部沒有大幅運(yùn)動(dòng),則不對(duì)視頻攝入模塊11攝入的當(dāng)前幀圖像進(jìn)行壓縮。其中視頻壓縮模塊14所采用的壓縮技術(shù)可以是現(xiàn)有技術(shù)中的一些通用的圖像壓縮標(biāo)準(zhǔn),比如,H.263系列、MPEG-4、或motion JPEG等。
所述音頻攝入模塊12用于采集視頻會(huì)議時(shí)的聲音信號(hào),音頻壓縮模塊15將視頻輸入模塊12采集到的聲音信號(hào)進(jìn)行壓縮以便于數(shù)據(jù)傳送,然后將壓縮后的數(shù)據(jù)輸送給發(fā)送模塊16。其中音頻攝入模塊12及音頻壓縮模塊15均屬于所屬領(lǐng)域內(nèi)的普通技術(shù)人員所顯而易見的技術(shù),所以此處不作贅述。
發(fā)送模塊16用來協(xié)調(diào)接受到的視頻壓縮數(shù)據(jù)及音頻壓縮數(shù)據(jù)并將這些數(shù)據(jù)通過媒介發(fā)送出去,可以采用無線上網(wǎng)的方式發(fā)送,也可以采用有線上網(wǎng)的方式發(fā)送,只要能發(fā)送至互聯(lián)網(wǎng)上即可。本發(fā)明的視頻系統(tǒng)通過特別設(shè)置運(yùn)動(dòng)檢測模塊來對(duì)攝入的發(fā)言者面部圖像進(jìn)行運(yùn)動(dòng)檢測,并以檢測結(jié)果來最終確定是否對(duì)當(dāng)前幀圖像進(jìn)行壓縮,如果發(fā)言者面部圖像一段時(shí)間內(nèi)沒有大幅運(yùn)動(dòng)可以實(shí)現(xiàn)連續(xù)多幀圖像不進(jìn)行壓縮傳輸,改變了現(xiàn)有技術(shù)中將當(dāng)前幀圖像統(tǒng)統(tǒng)作壓縮處理的做法,從而有效的降低了視頻流的碼率,并進(jìn)一步降低了音視頻流共同占用的帶寬。
接收模塊21用于從互聯(lián)網(wǎng)上接受發(fā)送模塊16發(fā)送的數(shù)據(jù),并將數(shù)據(jù)分離成視頻數(shù)據(jù)及音頻數(shù)據(jù),后將數(shù)據(jù)分別傳送給視頻解壓模塊22及音頻解壓模塊23。其中音頻數(shù)據(jù)經(jīng)過音頻解壓模塊23便直接通過音頻輸出模塊輸出26進(jìn)行輸出,同樣,關(guān)于音頻解壓及音頻輸出技術(shù)此處亦不作贅述。
所述視頻解壓模塊22也是通過通用的圖像壓縮標(biāo)準(zhǔn)進(jìn)行解壓縮,比如,H.263系列、MPEG-4、或motion JPEG等。然而由于數(shù)據(jù)發(fā)送端并沒有對(duì)每一幀圖像都進(jìn)行壓縮傳輸,所以本發(fā)明的在所述視頻解壓模塊22圖像解壓之前,需要進(jìn)行一個(gè)判斷步驟。請(qǐng)結(jié)合參閱圖3,解壓數(shù)據(jù)時(shí)首先碼流中是否有第N幀圖像數(shù)據(jù),如果有,則通過視頻解壓模塊22對(duì)此幀圖像進(jìn)行解壓縮并將解壓結(jié)果輸出給視頻輸出模塊25進(jìn)行圖像顯示;如果沒有第N幀圖像,視頻合成模塊24會(huì)將視頻解壓模塊22最近輸出的一幀圖像作為模板,并對(duì)該模板圖像進(jìn)行分析,包括檢測出面部主要特征區(qū)域,如眼睛、嘴巴、下顎等,及主要特點(diǎn),然后視頻合成模塊24基于音頻解壓模塊23解壓出的語音信息及模板圖像中面部主要特征區(qū)域及主要特點(diǎn)合成出隨語音數(shù)據(jù)變化的面部圖像;將N自動(dòng)加1并重復(fù)上述步驟,上述內(nèi)容為本發(fā)明提供的視頻壓縮方法的解壓步驟的核心。其中對(duì)模板圖像進(jìn)行分析的步驟中可采用現(xiàn)有技術(shù)中的人臉檢測技術(shù),基于語音信息合成隨語音數(shù)據(jù)變化的面部圖像的技術(shù)請(qǐng)參考中星微電子有限公司的中國第200510082755.1號(hào)專利申請(qǐng),此處不做進(jìn)一步描述。
對(duì)于本發(fā)明的視頻系統(tǒng)通過特別設(shè)置運(yùn)動(dòng)檢測模塊13來對(duì)攝入的發(fā)言者面部圖像進(jìn)行運(yùn)動(dòng)檢測,并以檢測結(jié)果來最終確定是否對(duì)當(dāng)前幀圖像進(jìn)行壓縮,如果發(fā)言者面部圖像沒有大幅運(yùn)動(dòng)可以實(shí)現(xiàn)連續(xù)多幀圖像不進(jìn)行壓縮傳輸,改變了現(xiàn)有技術(shù)中將當(dāng)前幀圖像統(tǒng)統(tǒng)作壓縮處理的做法,從而有效的降低了視頻流的碼率,并進(jìn)一步降低了音視頻流共同占用的帶寬。另外,通過增設(shè)視頻圖像合成模塊24,利用模板幀圖像及與此對(duì)應(yīng)的語音信息合成出被省略的隨著語音變化的面部圖像,以滿足用戶的對(duì)畫面質(zhì)量的高要求。
在介紹本發(fā)明視頻系統(tǒng)時(shí)對(duì)本發(fā)明的視頻壓縮方法一并介紹,所屬領(lǐng)域內(nèi)的普通技術(shù)人員通過查看對(duì)本發(fā)明視頻系統(tǒng)介紹均可以獲知本發(fā)明的視頻壓縮方法,所以此處也就不對(duì)本發(fā)明視頻壓縮方法進(jìn)行獨(dú)立介紹。
以上所述僅為本發(fā)明的較佳實(shí)施例而已,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。
權(quán)利要求
1.一種視頻壓縮方法,其特征為,包括以下步驟獲取視頻圖像序列,并確定當(dāng)前幀圖像及參考幀圖像;對(duì)所述視頻圖像序列進(jìn)行運(yùn)動(dòng)檢測,根據(jù)預(yù)先設(shè)定的閾值來確定當(dāng)前幀圖像相對(duì)參考幀圖像是否有大幅運(yùn)動(dòng);如果是,則對(duì)當(dāng)前幀圖像進(jìn)行數(shù)據(jù)壓縮及傳送;如果否,則不對(duì)當(dāng)前幀圖像數(shù)據(jù)進(jìn)行壓縮及傳送。
2.根據(jù)權(quán)利要求1所述的方法,其特征為獲取的視頻圖像主要是發(fā)言者正面人臉的圖像。
3.根據(jù)權(quán)利要求2所述的方法,其特征為大幅運(yùn)動(dòng)是指可能發(fā)生發(fā)言者轉(zhuǎn)頭、低頭、仰頭等動(dòng)作幅度大的動(dòng)作,沒有大幅運(yùn)動(dòng)是指可能僅有包括表情動(dòng)作、嘴形動(dòng)作、眼睛動(dòng)作等在內(nèi)的面部動(dòng)作,其中對(duì)當(dāng)前幀圖像關(guān)于是否有大幅運(yùn)動(dòng)的運(yùn)動(dòng)檢測中,當(dāng)前幀圖像與參考幀圖像的運(yùn)動(dòng)檢測結(jié)果大于預(yù)先設(shè)定的閾值,則確定當(dāng)前幀圖像發(fā)生大幅運(yùn)動(dòng),當(dāng)前幀圖像與參考幀圖像的運(yùn)動(dòng)檢測結(jié)果小于預(yù)先設(shè)定的閾值,則確定當(dāng)前幀圖像未發(fā)生大幅運(yùn)動(dòng)。
4.根據(jù)權(quán)利要求1所述的方法,其特征為所述對(duì)當(dāng)前幀圖像進(jìn)行數(shù)據(jù)壓縮是指按照H.263或MPEG-4或motion JPEG等壓縮標(biāo)準(zhǔn)進(jìn)行壓縮。
5.根據(jù)權(quán)利要求2所述的方法,其特征為其還包括音頻獲取、音頻壓縮、音頻數(shù)據(jù)傳輸、音頻數(shù)據(jù)接受及音頻數(shù)據(jù)解壓縮步驟。
6.根據(jù)權(quán)利要求5所述的方法,其特征為其還包括如下步驟視頻數(shù)據(jù)接受;判斷是否有當(dāng)前幀圖像,如果有,則對(duì)此幀圖像進(jìn)行解壓縮并將解壓結(jié)果進(jìn)行圖像顯示,如果沒有,將最近解壓縮的一幀圖像作為模板,然后基于解壓出的語音信息及模板圖像合成出隨語音數(shù)據(jù)變化的發(fā)言者面部圖像。
7.根據(jù)權(quán)利要求6所述的方法,其特征為圖像合成步驟中還要對(duì)模板圖像進(jìn)行分析,包括檢測出面部主要特征區(qū)域,如眼睛、嘴巴、下顎等,及主要特點(diǎn)。
8.一種視頻系統(tǒng),其特征為其包括視頻攝入模塊,可以攝入畫面主要包括正面人臉的圖像序列;運(yùn)動(dòng)檢測模塊,用于對(duì)所述視頻圖像序列進(jìn)行運(yùn)動(dòng)檢測,根據(jù)預(yù)先設(shè)定的閾值來確定當(dāng)前幀圖像相對(duì)參考幀圖像中正面人臉是否有大幅運(yùn)動(dòng);視頻壓縮模塊,根據(jù)運(yùn)動(dòng)檢測結(jié)果來確定是否對(duì)當(dāng)前幀圖像進(jìn)行壓縮,如果確定當(dāng)前幀圖像與參考幀圖像相比正面人臉有大幅運(yùn)動(dòng),則對(duì)當(dāng)前幀圖像進(jìn)行壓縮;如果確定當(dāng)前幀圖像與參考幀圖像相比正面人臉沒有大幅運(yùn)動(dòng),則不對(duì)視頻攝入模塊攝入的當(dāng)前幀圖像進(jìn)行壓縮。
9.根據(jù)權(quán)利要求1所述的視頻系統(tǒng),其特征為其還包括用于攝入音頻的音頻攝入模塊、將音頻數(shù)據(jù)進(jìn)行壓縮的音頻壓縮模塊及接收視頻壓縮模塊及音頻壓縮模塊的數(shù)據(jù)并將其協(xié)調(diào)發(fā)送的數(shù)據(jù)發(fā)送模塊。
10.根據(jù)權(quán)利要求9所述的方法,其特征為其還包括有接受并分離視頻數(shù)據(jù)及音頻數(shù)據(jù)的數(shù)據(jù)接收模塊、對(duì)音頻數(shù)據(jù)進(jìn)行解壓的音頻解壓模塊、對(duì)視頻數(shù)據(jù)進(jìn)行解壓的視頻解壓模塊及視頻合成模塊,其中視頻解壓模塊解壓數(shù)據(jù)時(shí)首先判斷碼流中是否有當(dāng)前幀圖像數(shù)據(jù),如果有,則對(duì)此幀圖像進(jìn)行解壓縮并進(jìn)行圖像顯示;如果沒有當(dāng)前幀圖像,視頻合成模塊會(huì)將視頻解壓模塊最近輸出的一幀圖像作為模板,然后視頻合成模塊基于音頻解壓模塊解壓出的語音信息及模板圖像中面部圖像合成出隨語音數(shù)據(jù)變化的面部圖像。
全文摘要
本發(fā)明公開了一種視頻壓縮方法及視頻系統(tǒng),該視頻系統(tǒng)包括視頻攝入模塊,可以攝入畫面主要包括正面人臉的圖像序列;運(yùn)動(dòng)檢測模塊,用于對(duì)所述視頻圖像序列進(jìn)行運(yùn)動(dòng)檢測,來確定當(dāng)前幀圖像相對(duì)參考幀圖像中正面人臉是否有大幅運(yùn)動(dòng);視頻壓縮模塊,根據(jù)運(yùn)動(dòng)檢測結(jié)果來確定是否對(duì)當(dāng)前幀圖像進(jìn)行壓縮,如果確定當(dāng)前幀圖像與參考幀圖像相比正面人臉有大幅運(yùn)動(dòng),則對(duì)當(dāng)前幀圖像進(jìn)行壓縮;如果確定當(dāng)前幀圖像與參考幀圖像相比正面人臉沒有大幅運(yùn)動(dòng),則不對(duì)當(dāng)前幀圖像進(jìn)行壓縮。通過設(shè)置運(yùn)動(dòng)檢測模塊來對(duì)攝入的發(fā)言者面部圖像進(jìn)行運(yùn)動(dòng)檢測,如果發(fā)言者面部圖像一段時(shí)間內(nèi)沒有大幅運(yùn)動(dòng)可以實(shí)現(xiàn)連續(xù)多幀圖像不進(jìn)行壓縮傳輸從而降低了視頻流的碼率。
文檔編號(hào)H04N7/15GK1731859SQ20051009835
公開日2006年2月8日 申請(qǐng)日期2005年9月9日 優(yōu)先權(quán)日2005年9月9日
發(fā)明者王浩, 黃英 申請(qǐng)人:北京中星微電子有限公司