專利名稱:一種基于人臉檢測(cè)的視頻壓縮容錯(cuò)方法及編解碼方法
技術(shù)領(lǐng)域:
本發(fā)明涉及視頻壓縮技術(shù)領(lǐng)域,尤其涉及一種基于人臉檢測(cè)的視頻壓縮 容錯(cuò)方法及編解碼方法。
背景技術(shù):
視頻壓縮編碼技術(shù)使視頻數(shù)據(jù)獲得了極高的壓縮效率,但壓縮后的碼流 在傳輸過(guò)程中,尤其是無(wú)線信道上的傳輸中,仍然存在著一些棘手的問(wèn)題,其中比較突出的是 一方面,這些壓縮后的碼流對(duì)信道比特誤碼非常敏感; 另一方面,無(wú)線信道由于多徑反射和衰落引入了大量的隨機(jī)誤碼和突發(fā)誤 碼,影響了碼流的正常傳輸。尤其是當(dāng)采用了變長(zhǎng)編碼(Variable Length Coding, VLC)技術(shù)后,碼流更加容易受到誤碼的影響,導(dǎo)致解碼時(shí)遇到下 一個(gè)同步碼字之前無(wú)法對(duì)VLC碼字進(jìn)行正確的解碼,使數(shù)據(jù)在解碼端失去 與編碼端的同步;同時(shí)預(yù)測(cè)編碼技術(shù)會(huì)將錯(cuò)誤擴(kuò)散到整個(gè)視頻序列中,極大 地降低重建圖像的質(zhì)量。因此,為了實(shí)現(xiàn)良好質(zhì)量的視頻傳輸,必須結(jié)合實(shí) 際應(yīng)用信道的傳輸特性,采取一定的容錯(cuò)措施。容錯(cuò)算法主要可分為基于編碼器的容錯(cuò)算法、基于解碼器的容錯(cuò)算法和 基于反饋信道的容錯(cuò)算法。其中(1 )基于編碼器的容錯(cuò)算法,是指通過(guò)在編碼比特流中添加冗余信息。 這些冗余信息被添加在信源或信道編碼器中,降低編碼的效率,增加實(shí)現(xiàn)的 復(fù)雜度,以換取編碼的容錯(cuò)性能,大致包括分層編碼、多描述編碼、獨(dú)立 分段編碼、再同步編碼和前向糾錯(cuò)編碼(Forward Error Correction, FEC )等。(2)基于解碼器的容錯(cuò)算法,是指利用被損壞的宏塊與其相鄰的宏塊 之間的相關(guān)性來(lái)完成恢復(fù)工作,包括錯(cuò)誤檢測(cè)和錯(cuò)誤恢復(fù)。對(duì)于錯(cuò)誤檢測(cè), 一般采用針對(duì)語(yǔ)法的檢錯(cuò)和嵌入數(shù)據(jù)的檢錯(cuò);對(duì)于錯(cuò)誤恢復(fù),可采用時(shí)域和臺(tái)aa^^-;旦瞎^古法
(3)基于反饋信道的容錯(cuò)算法,是指利用解碼器獲得誤碼信息,并通 過(guò)反饋信道,傳送給編碼器進(jìn)行誤碼處理的一種方式。主要包括誤碼跟蹤, 有條件的ARQ ( Automatic Repeat R叫uest,自動(dòng)請(qǐng)求重傳),幀內(nèi)/幀間編 碼模式選擇和參考圖像選擇模式等。
具有人臉檢測(cè)功能的視頻采集產(chǎn)品已經(jīng)有很多實(shí)用產(chǎn)品,目前在IP (Internet Protocol,互聯(lián)網(wǎng)協(xié)議)信道和無(wú)線信道中經(jīng)常出現(xiàn)網(wǎng)絡(luò)擁塞和錯(cuò) 誤丟包導(dǎo)致實(shí)時(shí)的視頻傳輸?shù)囊曈X(jué)效果較差的問(wèn)題,為了實(shí)現(xiàn)可靠傳輸可通 過(guò)錯(cuò)誤重傳的機(jī)制來(lái)實(shí)現(xiàn)的。這種機(jī)制雖然可以保證可靠的端到端通信,但 是在網(wǎng)絡(luò)負(fù)載嚴(yán)重的情況下會(huì)帶來(lái)更糟的結(jié)果,所以需要一種視頻壓縮容錯(cuò) 方法,使圖像數(shù)據(jù)具有較強(qiáng)的容錯(cuò)能力,使視頻數(shù)據(jù)在網(wǎng)絡(luò)負(fù)載嚴(yán)重的情況 下傳輸,也可以在解碼端得到使用者能夠接收的圖像效果。
發(fā)明內(nèi)容
本發(fā)明要解決的技術(shù)問(wèn)題是提供一種基于人臉檢測(cè)的視頻壓縮容錯(cuò)方 法及編解碼方法,使視頻圖像數(shù)據(jù)在網(wǎng)絡(luò)負(fù)載嚴(yán)重的情況下傳輸也具有較強(qiáng) 的容錯(cuò)能力。
為了解決上述技術(shù)問(wèn)題,本發(fā)明提供了 一種基于人臉檢測(cè)的視頻壓縮容 4昔方法,包括
編碼端對(duì)視頻圖像數(shù)據(jù)進(jìn)行編碼后得到圖像壓縮數(shù)據(jù)并向解碼端發(fā)送, 所述編碼端對(duì)視頻圖像進(jìn)行人臉檢測(cè),確定人臉區(qū)域和人臉區(qū)域位置信息, 將人臉區(qū)域?qū)?yīng)的圖像壓縮數(shù)據(jù)和所述人臉區(qū)域位置信息作為冗余數(shù)據(jù)向 解碼端發(fā)送;
所述解碼端對(duì)收到的圖像壓縮數(shù)據(jù)進(jìn)行解碼,正常解碼時(shí),根據(jù)解碼后 的圖像數(shù)據(jù)確定背景圖像數(shù)據(jù);解碼錯(cuò)誤且冗余數(shù)據(jù)正確時(shí),將收到的所述 冗余數(shù)據(jù)中人臉區(qū)域?qū)?yīng)的圖像壓縮數(shù)據(jù)解碼后得到的人臉區(qū)域圖像數(shù)據(jù) 與保存的背景圖像數(shù)據(jù)對(duì)應(yīng)疊加后作為解碼后的視頻圖像數(shù)據(jù)。
進(jìn)一步地,編碼端發(fā)送冗余數(shù)據(jù)的方式為以下情況中的一種將每幀視頻圖像對(duì)應(yīng)的冗余數(shù)據(jù)與每幀視頻壓縮數(shù)據(jù)一起發(fā)送;解碼端判斷視頻壓縮 數(shù)據(jù)出現(xiàn)解碼錯(cuò)誤時(shí),進(jìn)一步判斷所述冗余數(shù)據(jù)出現(xiàn)錯(cuò)誤后,向編碼端發(fā)送 冗余數(shù)據(jù)重傳請(qǐng)求,編碼端收到所述冗余數(shù)據(jù)傳送請(qǐng)求后,將下一幀視頻圖 像對(duì)應(yīng)的冗余數(shù)據(jù)與下一幀視頻壓縮數(shù)據(jù)一起發(fā)送。
進(jìn)一步地,所述人臉區(qū)域?qū)?yīng)的圖像壓縮數(shù)據(jù)指編碼端對(duì)當(dāng)前幀視頻圖 像進(jìn)行編碼后得到的圖像壓縮數(shù)據(jù)中人臉區(qū)域?qū)?yīng)的壓縮數(shù)據(jù)。
進(jìn)一步地,所述人臉區(qū)域?qū)?yīng)的圖像壓縮數(shù)據(jù)指所述編碼端根據(jù)對(duì)當(dāng)前 幀視頻圖像進(jìn)行編碼時(shí)的量化步長(zhǎng)確定人臉區(qū)域量化步長(zhǎng)后,采用所述人臉 區(qū)域量化步長(zhǎng)對(duì)人臉區(qū)域?qū)?yīng)的圖像數(shù)據(jù)進(jìn)行編碼得到的人臉區(qū)域壓縮數(shù)
據(jù);
所述解碼端采用人臉區(qū)域量化步長(zhǎng)對(duì)所述人臉區(qū)域?qū)?yīng)的圖像壓縮數(shù) 據(jù)進(jìn)行解碼。
進(jìn)一步地,所述人臉區(qū)域量化步長(zhǎng)是對(duì)視頻圖像數(shù)據(jù)編碼時(shí)采用的量化 步長(zhǎng)與加權(quán)系數(shù)的乘積,所述加權(quán)系數(shù)是系統(tǒng)設(shè)定的大于l的實(shí)數(shù)。
進(jìn)一步地,所述解碼端對(duì)收到的圖像壓縮數(shù)據(jù)解碼正確后,進(jìn)一步判斷 是否收到冗余數(shù)據(jù),若收到,在解碼后的圖像數(shù)據(jù)中將冗余數(shù)據(jù)的人臉區(qū)域 位置信息表示的人臉區(qū)域位置之外的數(shù)據(jù)保存為背景圖像數(shù)據(jù);若沒(méi)收到, 則將解碼后的圖像數(shù)據(jù)作為背景圖像數(shù)據(jù)。
進(jìn)一步地,所述解碼端在以下情況之一時(shí)認(rèn)為冗余數(shù)據(jù)出現(xiàn)錯(cuò)誤人臉 區(qū)域量化步長(zhǎng)超出系統(tǒng)設(shè)定的范圍內(nèi);人臉區(qū)域位置信息中人臉區(qū)域的長(zhǎng)度 大于原視頻圖象的長(zhǎng)度或人臉區(qū)域的寬度大于原視頻圖象的寬度;在解碼過(guò) 程中解碼出的人臉區(qū)域圖像數(shù)據(jù)出現(xiàn)不符合編解碼方法的數(shù)據(jù);在解碼過(guò)程 中解碼出的人臉區(qū)域圖像數(shù)據(jù)大小與人臉區(qū)域位置信息對(duì)應(yīng)的數(shù)據(jù)大小不 一致。
為了解決上述技術(shù)問(wèn)題,本發(fā)明還提供了一種基于人臉檢測(cè)的視頻編解 碼方法,包括以下步驟
編碼時(shí),編碼端對(duì)視頻圖像數(shù)據(jù)進(jìn)行編碼后得到圖像壓縮數(shù)據(jù)并向解碼端發(fā)送,所述編碼端對(duì)#見(jiàn)頻圖<象進(jìn)行人臉才企測(cè),確定人臉區(qū)域和人臉區(qū)域位 置信息,將人臉區(qū)域?qū)?yīng)的圖像壓縮數(shù)據(jù)和所述人臉區(qū)域位置信息作為冗余
數(shù)據(jù)向解碼端發(fā)送;
解碼時(shí),所述解碼端對(duì)收到的圖像壓縮數(shù)據(jù)進(jìn)行解碼,正常解碼時(shí),根 據(jù)解碼后的圖像數(shù)據(jù)確定背景圖像數(shù)據(jù);解碼錯(cuò)誤且冗余數(shù)據(jù)正確時(shí),將收 到的所述冗余數(shù)據(jù)中人臉區(qū)域?qū)?yīng)的圖像壓縮數(shù)據(jù)解碼后得到的人臉區(qū)域 圖像數(shù)據(jù)與保存的背景圖像數(shù)據(jù)對(duì)應(yīng)疊加后作為解碼后的視頻圖像數(shù)據(jù)。
進(jìn)一步地,編碼端發(fā)送冗余數(shù)據(jù)的方式為以下情況中的一種將每幀視 頻圖像對(duì)應(yīng)的冗余數(shù)據(jù)與每幀視頻壓縮數(shù)據(jù)一起發(fā)送;解碼端判斷視頻壓縮 數(shù)據(jù)出現(xiàn)解碼錯(cuò)誤時(shí),進(jìn)一步判斷所述冗余數(shù)據(jù)出現(xiàn)錯(cuò)誤后,向編碼端發(fā)送 兀余數(shù)據(jù)重傳請(qǐng)求,編瑪端收到所迷冗余數(shù)揚(yáng)傳送請(qǐng)水后,將下一幀^L頻圖 像對(duì)應(yīng)的冗余數(shù)據(jù)與下一幀視頻壓縮數(shù)據(jù)一起發(fā)送。
進(jìn)一步地,所述人臉區(qū)域?qū)?yīng)的圖像壓縮數(shù)據(jù)指所述編碼端根據(jù)對(duì)當(dāng)前 幀視頻圖像進(jìn)行編碼時(shí)的量化步長(zhǎng)確定人臉區(qū)域量化步長(zhǎng)后,采用所述人臉 區(qū)域量化步長(zhǎng)對(duì)人臉區(qū)域?qū)?yīng)的圖像數(shù)據(jù)進(jìn)行編碼得到的人臉區(qū)域壓縮數(shù) 據(jù);所述人臉區(qū)域量化步長(zhǎng)是對(duì)視頻圖像編碼時(shí)采用的量化步長(zhǎng)與加權(quán)系數(shù) 的乘積,所述加權(quán)系數(shù)是系統(tǒng)設(shè)定的大于1的實(shí)數(shù);
所述解碼端采用人臉區(qū)域量化步長(zhǎng)對(duì)所述人臉區(qū)域?qū)?yīng)的圖像壓縮數(shù) 據(jù)進(jìn)行解碼。
采用本發(fā)明的方法,使圖像數(shù)據(jù)具有較強(qiáng)的容錯(cuò)能力,視頻數(shù)據(jù)在網(wǎng)絡(luò) 負(fù)載嚴(yán)重的情況下傳輸,也可以在解碼端得到使用者能夠接收的圖像效果。
圖l是現(xiàn)有技術(shù)中視頻壓縮的流程示意圖; 圖2是本發(fā)明中視頻壓縮容錯(cuò)方法的流程示意圖; 圖3是本發(fā)明中視頻壓縮編碼部分的流程圖; 圖4是本發(fā)明中視頻壓縮解碼部分的流程圖。
具體實(shí)施例方式
如圖1所示,視頻壓縮編碼的過(guò)程包括,對(duì)原視頻圖像依次進(jìn)行預(yù)測(cè)、 變換、量化、編碼處理后,得到編碼后的碼流數(shù)據(jù)。其中量化環(huán)節(jié)對(duì)壓縮碼 流的大小起著重要作用,量化時(shí)變換輸出的變換系數(shù)需除以量化步長(zhǎng),量化 步長(zhǎng)越大輸出的量化后的系數(shù)就越小,視頻圖像壓縮效率越高,壓縮后的碼 流越小。
本發(fā)明的核心思想是利用現(xiàn)有攝像裝置中已實(shí)現(xiàn)的人臉檢測(cè)功能,進(jìn) 行量化步長(zhǎng)調(diào)整確定人臉區(qū)域量化步長(zhǎng)后,采用人臉區(qū)域量化步長(zhǎng)對(duì)圖像中 人臉區(qū)域的數(shù)據(jù)進(jìn)行壓縮后作為冗余信息和原圖像壓縮數(shù)據(jù)一同傳輸;解碼 時(shí)根據(jù)解碼的圖像構(gòu)建背景信息,在發(fā)生解碼錯(cuò)誤時(shí)利用冗余信息和實(shí)時(shí)更 新的背景信息進(jìn)行解碼錯(cuò)誤恢復(fù)并顯示,使視頻壓縮數(shù)據(jù)能夠在惡劣的無(wú)線 環(huán)境下傳輸,并在接收端得到質(zhì)量較好的視頻。本發(fā)明的方法主要針對(duì)實(shí)時(shí) 視頻會(huì)話在IP信道和無(wú)線信道傳輸中的錯(cuò)誤修正,這種情況下圖像中檢測(cè) 到的人臉具有更高的容錯(cuò)要求。
如圖2所示,視頻壓縮容錯(cuò)方法包括
步驟201,編碼端對(duì)視頻圖像數(shù)據(jù)進(jìn)行編碼后得到圖像壓縮數(shù)據(jù)并向解 碼端發(fā)送,編碼端對(duì)視頻圖像進(jìn)行人臉檢測(cè),確定人臉區(qū)域和人臉區(qū)域位置 信息,將人臉區(qū)域?qū)?yīng)的圖像壓縮數(shù)據(jù)和人臉區(qū)域位置信息作為冗余數(shù)據(jù)向 解碼端發(fā)送;
步驟202,解碼端對(duì)收到的圖像壓縮數(shù)據(jù)進(jìn)行解碼,正常解碼時(shí),根據(jù) 解碼后的圖像數(shù)據(jù)確定背景圖像數(shù)據(jù);解碼錯(cuò)誤且冗余數(shù)據(jù)正確時(shí),將收到 的冗余數(shù)據(jù)中人臉區(qū)域?qū)?yīng)的圖像壓縮數(shù)據(jù)解碼后得到的人臉區(qū)域圖像數(shù) 據(jù)與保存的背景圖像數(shù)據(jù)對(duì)應(yīng)疊加后作為解碼后的視頻圖像數(shù)據(jù)。
如圖3所示,對(duì)于每幀圖像數(shù)據(jù),基于人臉檢測(cè)的視頻壓縮容錯(cuò)方法的 編碼方法包括以下步驟步驟301,編碼端對(duì)原始視頻圖像進(jìn)行壓縮編碼,得到圖像編碼數(shù)據(jù);
步驟302,編碼端對(duì)原始視頻圖像進(jìn)行人臉檢測(cè),判斷是否檢測(cè)到人臉, 如果是,執(zhí)行下一步;否則,轉(zhuǎn)到步驟307;
步驟303 ,編碼端根據(jù)檢測(cè)到的人臉確定人臉區(qū)域和人臉區(qū)域位置信息;
編碼端將包含人臉的矩形區(qū)域或沿人臉邊緣包含人臉的不規(guī)則區(qū)域確 定為人臉區(qū)域,并用人臉區(qū)域位置信息表示此人臉區(qū)域的位置。例如,人臉 區(qū)域?yàn)榫匦螀^(qū)域時(shí),人臉區(qū)域位置信息為相應(yīng)矩形的四個(gè)頂點(diǎn)坐標(biāo)或者兩個(gè) 對(duì)角頂點(diǎn)的坐標(biāo)。
步驟304,編碼端根據(jù)量化步長(zhǎng)確定人臉區(qū)域量化步長(zhǎng);
編碼端根據(jù)原始視頻圖像進(jìn)行壓縮編碼時(shí)所用的量化步長(zhǎng)Q進(jìn)行調(diào)整 得到人臉區(qū)域量化步長(zhǎng)Q,,調(diào)整時(shí)通常將原量化步長(zhǎng)Q放大,例如將原量 化步長(zhǎng)乘以一個(gè)加權(quán)系數(shù),上述加權(quán)系數(shù)是系統(tǒng)設(shè)定的大于1的實(shí)數(shù);其中, 加權(quán)系數(shù)的值由系統(tǒng)設(shè)定或者根據(jù)圖像質(zhì)量通過(guò)算法得到。
步驟305,編碼端采用人臉區(qū)域量化步長(zhǎng)對(duì)人臉區(qū)域的圖像數(shù)據(jù)進(jìn)行編 碼,將得到的人臉區(qū)域編碼數(shù)據(jù)連同人臉區(qū)域量化步長(zhǎng)Q,和人臉區(qū)域位置 信息構(gòu)成冗余數(shù)據(jù);
用人臉區(qū)域量化步長(zhǎng)Q,作為量化參數(shù)對(duì)人臉區(qū)域數(shù)據(jù)進(jìn)行壓縮,比用 量化步長(zhǎng)Q作為量化參數(shù)對(duì)人臉區(qū)域凄t據(jù)進(jìn)行壓縮得到的壓縮效率更高, 壓縮后的碼流數(shù)據(jù)更小,所以冗余數(shù)據(jù)遠(yuǎn)小于圖像的壓縮數(shù)據(jù),在進(jìn)行傳輸 時(shí)的可靠性較高。
步驟306,編碼端將圖像編碼數(shù)據(jù)和冗余數(shù)據(jù)作為一幀視頻壓縮數(shù)據(jù)發(fā) 送,流程結(jié)束。
步驟307,編碼端將圖像編碼數(shù)據(jù)作為一幀視頻壓縮數(shù)據(jù)發(fā)送;流程結(jié)束。
如圖4所示,對(duì)于每幀圖像數(shù)據(jù),基于人臉檢測(cè)的視頻壓縮容錯(cuò)方法的 解碼方法包括以下步驟
步驟401, 解碼端對(duì)接收到的視頻壓縮數(shù)據(jù)進(jìn)行解碼;步驟402,判斷是否出現(xiàn)圖像數(shù)據(jù)解碼錯(cuò)誤,如果是,執(zhí)行步驟407, 否則,執(zhí)行步驟403;步驟403,判斷當(dāng)前幀壓縮數(shù)據(jù)中是否包含冗余數(shù)據(jù),如果是,進(jìn)行下 一步,否則,轉(zhuǎn)到步驟405;步驟404,解碼端根據(jù)冗余數(shù)據(jù)中包含的人臉區(qū)域量化步長(zhǎng),對(duì)人臉區(qū) 域數(shù)據(jù)進(jìn)行解碼,并進(jìn)行背景更新,轉(zhuǎn)到步驟406;解碼端根據(jù)冗余數(shù)據(jù)中的人臉區(qū)域量化步長(zhǎng),對(duì)冗余數(shù)據(jù)中的人臉區(qū)域 的壓縮數(shù)據(jù)進(jìn)行解碼,得到人臉區(qū)域的圖像數(shù)據(jù)。將解碼后圖像中人臉區(qū)域位置信息表示的人臉區(qū)域位置之外的數(shù)據(jù)信 息對(duì)應(yīng)保存為背景信息,背景信息中人臉區(qū)域處對(duì)應(yīng)的數(shù)據(jù)設(shè)置為相同數(shù)值 的數(shù)據(jù)。解碼端在對(duì)圖像壓縮數(shù)據(jù)解碼的過(guò)程中對(duì)背景信息進(jìn)行實(shí)時(shí)更新。 上述步驟中,解碼端還可以參考當(dāng)前幀之前的多幀解碼圖像數(shù)據(jù)進(jìn)行背景更 新,當(dāng)人臉移動(dòng)幅度較大時(shí),可通過(guò)多幀的更新獲得完整的背景圖像信息; 若人臉移動(dòng)幅度比較小,則背景中人臉區(qū)域中沒(méi)有圖像數(shù)據(jù),然而此部分更 容易在圖像恢復(fù)時(shí)被新的人臉遮擋,參考當(dāng)前幀之前的多幀解碼圖像數(shù)據(jù)進(jìn) 行背景更新的方法需要在解碼端保存多幀先前圖像數(shù)據(jù),且背景更新的運(yùn)算 量較大。步驟405, 把此幀圖像數(shù)據(jù)做為背景數(shù)據(jù);步驟406, 顯示解碼后的圖像數(shù)據(jù),流程結(jié)束;步驟407,判斷冗余數(shù)據(jù)是否出現(xiàn)錯(cuò)誤,如果是,執(zhí)行下一步;否則, 轉(zhuǎn)到步驟409;冗余數(shù)據(jù)包含三部分人臉區(qū)域量化步長(zhǎng)Q,、人臉區(qū)域位置信息(人 臉區(qū)域通常是矩形)和人臉區(qū)域編碼數(shù)據(jù)。當(dāng)出現(xiàn)以下情況之一時(shí),認(rèn)為冗 余數(shù)據(jù)出現(xiàn)錯(cuò)誤(1)人臉區(qū)域量化步長(zhǎng)不在系統(tǒng)設(shè)定的范圍內(nèi);(2 )人臉區(qū)域位置信息中人臉區(qū)域的長(zhǎng)度大于原視頻圖象的長(zhǎng)度或人 臉區(qū)域的寬度大于原視頻圖象的寬度;(3 )在解碼過(guò)程中解碼出的人臉區(qū)域圖像數(shù)據(jù)出現(xiàn)不符合編解碼方法ii的數(shù)據(jù);(4 )在解碼過(guò)程中解碼出的人臉區(qū)域圖像數(shù)據(jù)大小與人臉區(qū)域位置信 息對(duì)應(yīng)的數(shù)據(jù)大小不 一致。步驟408,向編碼端發(fā)送冗余數(shù)據(jù)重傳消息;流程結(jié)束;步驟409,解碼端對(duì)解碼圖像進(jìn)行錯(cuò)誤恢復(fù);解碼端將冗余數(shù)據(jù)中人臉區(qū)域數(shù)據(jù)進(jìn)行解碼后得到人臉區(qū)域的圖像數(shù) 據(jù),并根據(jù)冗余數(shù)據(jù)中人臉區(qū)域位置信息將此人臉區(qū)域的圖像數(shù)據(jù)和已保存 的背景信息進(jìn)行相應(yīng)疊加,做為錯(cuò)誤恢復(fù)后的當(dāng)前幀圖像數(shù)據(jù)。步驟410,顯示錯(cuò)誤碼恢復(fù)后的圖像數(shù)據(jù);流程結(jié)束。在其它實(shí)施例中,解碼端檢測(cè)到圖像數(shù)據(jù)解碼錯(cuò)誤時(shí),向編碼端發(fā)送冗 余數(shù)據(jù)傳送請(qǐng)求,編碼端收到所述冗余數(shù)據(jù)傳送請(qǐng)求后,將冗余數(shù)據(jù)與下一 幀視頻壓縮數(shù)據(jù)一起發(fā)送,解碼端收到冗余數(shù)據(jù)后進(jìn)行圖像恢復(fù),這樣可不 必如上述方法中在每幀數(shù)據(jù)傳輸中都要傳輸冗余數(shù)據(jù),減少數(shù)據(jù)傳輸量。上述方法還可以作為一種^L頻編解碼方法,與上述方法同理,此處不再贅述。本發(fā)明還可有其他多種實(shí)施例,在不背離本發(fā)明精神及其實(shí)質(zhì)的情況 些相應(yīng)的改變和變形都應(yīng)屬于本發(fā)明所附的權(quán)利要求的保護(hù)范圍。
權(quán)利要求
1、一種基于人臉檢測(cè)的視頻壓縮容錯(cuò)方法,其特征在于,包括編碼端對(duì)視頻圖像數(shù)據(jù)進(jìn)行編碼后得到圖像壓縮數(shù)據(jù)并向解碼端發(fā)送,所述編碼端對(duì)視頻圖像進(jìn)行人臉檢測(cè),確定人臉區(qū)域和人臉區(qū)域位置信息,將人臉區(qū)域?qū)?yīng)的圖像壓縮數(shù)據(jù)和所述人臉區(qū)域位置信息作為冗余數(shù)據(jù)向解碼端發(fā)送;所述解碼端對(duì)收到的圖像壓縮數(shù)據(jù)進(jìn)行解碼,正常解碼時(shí),根據(jù)解碼后的圖像數(shù)據(jù)確定背景圖像數(shù)據(jù);解碼錯(cuò)誤且冗余數(shù)據(jù)正確時(shí),將收到的所述冗余數(shù)據(jù)中人臉區(qū)域?qū)?yīng)的圖像壓縮數(shù)據(jù)解碼后得到的人臉區(qū)域圖像數(shù)據(jù)與保存的背景圖像數(shù)據(jù)對(duì)應(yīng)疊加后作為解碼后的視頻圖像數(shù)據(jù)。
2、 如權(quán)利要求l所述的方法,其特征在于,編碼端發(fā)送冗余數(shù)據(jù)的方式為以下情況中的一種將每幀視頻圖像對(duì)應(yīng) 的冗余數(shù)據(jù)與每幀視頻壓縮數(shù)據(jù)一起發(fā)送;解碼端判斷視頻壓縮數(shù)據(jù)出現(xiàn)解 碼錯(cuò)誤時(shí),進(jìn)一步判斷所述冗余數(shù)據(jù)出現(xiàn)錯(cuò)誤后,向編碼端發(fā)送冗余數(shù)據(jù)重 傳請(qǐng)求,編碼端收到所述冗余數(shù)據(jù)傳送請(qǐng)求后,將下一幀視頻圖像對(duì)應(yīng)的冗 余數(shù)據(jù)與下一幀視頻壓縮數(shù)據(jù)一起發(fā)送。
3、 如權(quán)利要求2所述的方法,其特征在于,所述人臉區(qū)域?qū)?yīng)的圖像壓縮數(shù)據(jù)指編碼端對(duì)當(dāng)前幀視頻圖像進(jìn)行編 碼后得到的圖像壓縮數(shù)據(jù)中人臉區(qū)域?qū)?yīng)的壓縮數(shù)據(jù)。
4、 如權(quán)利要求2所述的方法,其特征在于,所述人臉區(qū)域?qū)?yīng)的圖像壓縮數(shù)據(jù)指所述編碼端根據(jù)對(duì)當(dāng)前幀視頻圖 像進(jìn)行編碼時(shí)的量化步長(zhǎng)確定人臉區(qū)域量化步長(zhǎng)后,采用所述人臉區(qū)域量化 步長(zhǎng)對(duì)人臉區(qū)域?qū)?yīng)的圖像數(shù)據(jù)進(jìn)行編碼得到的人臉區(qū)域壓縮數(shù)據(jù);所述解碼端采用人臉區(qū)域量化步長(zhǎng)對(duì)所述人臉區(qū)域?qū)?yīng)的圖像壓縮數(shù) 據(jù)進(jìn)行解碼。
5、 如權(quán)利要求4所述的方法,其特征在于,所述人臉區(qū)域量化步長(zhǎng)是對(duì)視頻圖像數(shù)據(jù)編碼時(shí)采用的量化步長(zhǎng)與加 權(quán)系數(shù)的乘積,所述加權(quán)系數(shù)是系統(tǒng)設(shè)定的大于1的實(shí)數(shù)。
6、 如權(quán)利要求3或4所述的方法,其特征在于,所述解碼端對(duì)收到的圖像壓縮數(shù)據(jù)解碼正確后,進(jìn)一步判斷是否收到冗 余數(shù)據(jù),若收到,在解碼后的圖像數(shù)據(jù)中將冗余數(shù)據(jù)的人臉區(qū)域位置信息表 示的人臉區(qū)域位置之外的數(shù)據(jù)保存為背景圖像數(shù)據(jù);若沒(méi)收到,則將解碼后 的圖像數(shù)據(jù)作為背景圖像數(shù)據(jù)。
7、 如權(quán)利要求2所述的方法,其特征在于,所述解碼端在以下情況之一時(shí)認(rèn)為冗余數(shù)據(jù)出現(xiàn)錯(cuò)誤人臉區(qū)域量化步 長(zhǎng)超出系統(tǒng)設(shè)定的范圍內(nèi);人臉區(qū)域位置信息中人臉區(qū)域的長(zhǎng)度大于原視頻 圖象的長(zhǎng)度或人臉區(qū)域的寬度大于原視頻圖象的寬度;在解碼過(guò)程中解碼出 的人臉區(qū)域圖像數(shù)據(jù)出現(xiàn)不符合編解碼方法的數(shù)據(jù);在解碼過(guò)程中解碼出的 人臉區(qū)域圖像數(shù)據(jù)大小與人臉區(qū)域位置信息對(duì)應(yīng)的數(shù)據(jù)大小不一致。
8、 一種基于人臉檢測(cè)的視頻編解碼方法,其特征在于,包括以下步驟編碼時(shí),編碼端對(duì)視頻圖像數(shù)據(jù)進(jìn)行編碼后得到圖像壓縮數(shù)據(jù)并向解碼 端發(fā)送,所述編碼端對(duì)視頻圖像進(jìn)行人臉檢測(cè),確定人臉區(qū)域和人臉區(qū)域位 置信息,將人臉區(qū)域?qū)?yīng)的圖像壓縮數(shù)據(jù)和所述人臉區(qū)域位置信息作為冗余 數(shù)據(jù)向解碼端發(fā)送;解碼時(shí),所述解碼端對(duì)收到的圖像壓縮數(shù)據(jù)進(jìn)行解碼,正常解碼時(shí),根 據(jù)解碼后的圖像數(shù)據(jù)確定背景圖像數(shù)據(jù);解碼錯(cuò)誤且冗余數(shù)據(jù)正確時(shí),將收 到的所述冗余數(shù)據(jù)中人臉區(qū)域?qū)?yīng)的圖像壓縮數(shù)據(jù)解碼后得到的人臉區(qū)域 圖像數(shù)據(jù)與保存的背景圖像數(shù)據(jù)對(duì)應(yīng)疊加后作為解碼后的視頻圖像數(shù)據(jù)。
9、 如權(quán)利要求8所述的視頻編解碼方法,其特征在于,編碼端發(fā)送冗余數(shù)據(jù)的方式為以下情況中的一種將每幀視頻圖像對(duì)應(yīng) 的冗余數(shù)據(jù)與每幀視頻壓縮數(shù)據(jù)一起發(fā)送;解碼端判斷視頻壓縮數(shù)據(jù)出現(xiàn)解 碼錯(cuò)誤時(shí),進(jìn)一步判斷所述冗余數(shù)據(jù)出現(xiàn)錯(cuò)誤后,向編碼端發(fā)送冗余數(shù)據(jù)重 傳請(qǐng)求,編碼端收到所述冗余數(shù)據(jù)傳送請(qǐng)求后,將下一幀視頻圖像對(duì)應(yīng)的冗余數(shù)據(jù)與下一幀視頻壓縮數(shù)據(jù)一起發(fā)送。
10、如權(quán)利要求9所述的^L頻編解碼方法,其特征在于,所述人臉區(qū)域?qū)?yīng)的圖像壓縮數(shù)據(jù)指所述編碼端根據(jù)對(duì)當(dāng)前幀視頻圖 像進(jìn)行編碼時(shí)的量化步長(zhǎng)確定人臉區(qū)域量化步長(zhǎng)后,采用所述人臉區(qū)域量化 步長(zhǎng)對(duì)人臉區(qū)域?qū)?yīng)的圖像數(shù)據(jù)進(jìn)行編碼得到的人臉區(qū)域壓縮數(shù)據(jù);所述人 臉區(qū)域量化步長(zhǎng)是對(duì)視頻圖像編碼時(shí)采用的量化步長(zhǎng)與加權(quán)系數(shù)的乘積,所 述加權(quán)系數(shù)是系統(tǒng)設(shè)定的大于1的實(shí)數(shù);所述解碼端采用人臉區(qū)域量化步長(zhǎng)對(duì)所述人臉區(qū)域?qū)?yīng)的圖像壓縮數(shù) 據(jù)進(jìn)行解碼。
全文摘要
本發(fā)明公開(kāi)了一種基于人臉檢測(cè)的視頻壓縮容錯(cuò)方法及編解碼方法編碼端對(duì)視頻圖像數(shù)據(jù)進(jìn)行編碼后得到圖像壓縮數(shù)據(jù)向解碼端發(fā)送,編碼端對(duì)視頻圖像進(jìn)行人臉檢測(cè),確定人臉區(qū)域和人臉區(qū)域位置信息,將人臉區(qū)域?qū)?yīng)的圖像壓縮數(shù)據(jù)和人臉區(qū)域位置信息作為冗余數(shù)據(jù)向解碼端發(fā)送;解碼端對(duì)收到的圖像壓縮數(shù)據(jù)進(jìn)行解碼,正常解碼時(shí),根據(jù)解碼后的圖像數(shù)據(jù)確定背景圖像數(shù)據(jù);解碼錯(cuò)誤且冗余數(shù)據(jù)正確時(shí),將收到的冗余數(shù)據(jù)中人臉區(qū)域?qū)?yīng)的圖像壓縮數(shù)據(jù)解碼后得到的人臉區(qū)域圖像數(shù)據(jù)與保存的背景圖像數(shù)據(jù)對(duì)應(yīng)疊加后作為解碼后的視頻圖像數(shù)據(jù)。本方法使圖像數(shù)據(jù)具有較強(qiáng)的容錯(cuò)能力,在網(wǎng)絡(luò)負(fù)載嚴(yán)重時(shí)也可以在解碼端得到使用者能夠接收的圖像效果。
文檔編號(hào)H04N7/66GK101257635SQ20081010251
公開(kāi)日2008年9月3日 申請(qǐng)日期2008年3月21日 優(yōu)先權(quán)日2008年3月21日
發(fā)明者飛 高 申請(qǐng)人:北京中星微電子有限公司