專利名稱:基于欠定型盲信號(hào)分離的視頻壓縮編解碼系統(tǒng)及方法
技術(shù)領(lǐng)域:
本發(fā)明涉及多媒體技術(shù)領(lǐng)域,特別涉及一種基于欠定型盲信號(hào)分離的視頻壓縮編解碼系統(tǒng)及方法。
背景技術(shù):
在多媒體傳感器網(wǎng)絡(luò)中,視頻流需要利用相當(dāng)穩(wěn)定的帶寬量才能以足夠高的質(zhì)量每秒傳輸足夠多的幀數(shù),以使終端能夠獲得可以接受的視頻流。這個(gè)帶寬量一般是可觀的,例如對(duì)于640X480,每秒30幀,4:2:0制式的視頻流的原始數(shù)據(jù)量為276Mbps ;而對(duì)于超清1920X1080,每秒30幀,4:2:0制式的視頻流原始數(shù)據(jù)量為746. 5Mbps。從以上數(shù)據(jù)中可以看出,視頻壓縮技術(shù)是視頻網(wǎng)絡(luò)傳輸?shù)暮诵募夹g(shù)。特別在一些特殊的應(yīng)用場(chǎng)景中,如視頻監(jiān)控領(lǐng)域,這種穩(wěn)定的視頻流將每天M小時(shí)流動(dòng),而且隨著監(jiān)控節(jié)點(diǎn)的增加,對(duì)帶寬的要求更加苛刻。目前常用的視頻壓縮標(biāo)準(zhǔn)有M-JPEG(Motion-Join Photographic Experts Group,一禾中g(shù)云力圖、MPEG_2 (Moving Picture Experts Group-2, 一種視頻壓縮編解碼標(biāo)準(zhǔn))、H. 264 ( 一種視頻壓縮編解碼標(biāo)準(zhǔn))、AVS (Audio Video coding Standard, 一種視頻壓縮編解碼標(biāo)準(zhǔn))等。盲信號(hào)處理問題(Blind Signal Processing)是由法國學(xué)者J Herault和C Jutten在1985年左右第一次提出的,這是最早的盲處理研究。人們熟悉的雞尾酒會(huì)問題就是一個(gè)典型的盲信號(hào)分離的例子。在各種聲音嘈雜的雞尾酒會(huì)上,人總是能夠挑選出想要聽到的對(duì)話,并將注意力集中在這個(gè)說話人身上。這個(gè)過程其實(shí)是人類的大腦對(duì)其他對(duì)話進(jìn)行了某種程度的判斷,然后決定把這些聲音屏蔽掉。而對(duì)于機(jī)器來說,就需要設(shè)計(jì)相應(yīng)的算法實(shí)現(xiàn)這種分離混合信號(hào)的能力。這是盲信號(hào)分離在語音信號(hào)處理中的一個(gè)典型應(yīng)用。信源混合主要有兩種形式線性無記憶混合和卷積混合。線性無記憶混合是盲信號(hào)分離問題的基礎(chǔ)問題,分離理論也較卷積混合簡(jiǎn)單。以下提到的盲信號(hào)分離如無特殊說明,均屬于前種。盲信號(hào)分離(Blind Source Separation,BSS)的任務(wù)是由多通道系統(tǒng)的輸出數(shù)據(jù) χ (這里稱作觀察信號(hào)),來估計(jì)其輸入s (這里稱作源信號(hào))和系統(tǒng)的混合矩陣A。所謂的 “盲”是指原理上不要求對(duì)源信號(hào)和混合系統(tǒng)具有任何先驗(yàn)知識(shí)。盲信號(hào)分離的混合過程可以用如下公式1表示,分離過程可以用如下公式2表示χ = As(1)y = Wx = WAs = Cs (2)其中S為輸入源信號(hào);A為混合矩陣;χ為觀察信號(hào);W為分離矩陣;y為分離信號(hào), 是對(duì)源信號(hào)s的估計(jì);C = WA,稱為混合-分離復(fù)合矩陣。圖1是盲信號(hào)分離的基本框圖。Si為未知的源信號(hào),A為未知的混合矩陣,Xi為已知的觀察信號(hào),W為希望求得的分離矩陣,Yi為希望求得對(duì)源信號(hào)近似的分離信號(hào)。根據(jù)源信號(hào)個(gè)數(shù)(η)與觀察信號(hào)個(gè)數(shù)(m)的關(guān)系,盲信源分離問題可以分為三大類n = m的問題稱為標(biāo)準(zhǔn)型盲信源分離問題、η < m的問題稱為超定型盲信源分離問題,η> m的問題稱為欠定型盲信源分離問題。對(duì)于欠定型盲信源分離問題,由于源信號(hào)個(gè)數(shù)大于觀察信號(hào)個(gè)數(shù),所以可以實(shí)現(xiàn)壓縮的目的。
發(fā)明內(nèi)容
(一)要解決的技術(shù)問題本發(fā)明要解決的技術(shù)問題是如何提供一種基于欠定型盲信號(hào)分離的視頻壓縮編解碼系統(tǒng)及方法,以便在保證視頻質(zhì)量的情況對(duì)視頻進(jìn)行壓縮。(二)技術(shù)方案為解決上述技術(shù)問題,本發(fā)明提供一種基于欠定型盲信號(hào)分離的視頻壓縮編解碼系統(tǒng),其包括混合模塊、編碼模塊、解碼模塊和分離模塊;所述混合模塊,設(shè)置在視頻發(fā)送端,用于對(duì)原始視頻按照欠定型盲信號(hào)分離算法進(jìn)行混合處理;所述編碼模塊,連接所述混合模塊,用于對(duì)混合處理后的視頻進(jìn)行壓縮和編碼處理;所述解碼模塊,設(shè)置在視頻接收端,用于對(duì)接收到的視頻進(jìn)行解壓縮和解碼處理;所述分離模塊,連接所述解碼模塊,用于對(duì)解壓縮和解碼處理后的視頻按照欠定型盲信號(hào)分離算法進(jìn)行分離處理,得到所述原始視頻。為解決上述技術(shù)問題,本發(fā)明還提供一種基于欠定型盲信號(hào)分離的視頻壓縮編解碼方法,其包括步驟A 在視頻發(fā)送端,對(duì)原始視頻按照欠定型盲信號(hào)分離算法進(jìn)行混合處理;B 對(duì)混合處理后的視頻進(jìn)行壓縮和編碼處理;C 在視頻接收端,對(duì)接收到的視頻進(jìn)行解壓縮和解碼處理;D 對(duì)解壓縮和解碼處理后的視頻按照欠定型盲信號(hào)分離算法進(jìn)行分離處理,得到所述原始視頻。優(yōu)選地,所述步驟A具體包括步驟Al 在視頻發(fā)送端,將原始視頻分為a組,每組包含η個(gè)視頻幀;Α2 將每組的η個(gè)視頻幀與欠定型盲信號(hào)分離算法的混合矩陣A做乘運(yùn)算,得到a 組混合幀,每組包含m個(gè)混合幀;所述a、η、m均為大于0的自然數(shù),并且η > m。優(yōu)選地,所述步驟B具體包括對(duì)所述步驟A2得到WaXm個(gè)混合幀,按照MPEG-2、 H. 264或者AVS壓縮標(biāo)準(zhǔn)進(jìn)行壓縮和編碼處理。優(yōu)選地,所述步驟C具體包括在視頻接收端,對(duì)接收到的視頻按照MPEG_2、H. 264 或者AVS解壓縮標(biāo)準(zhǔn)進(jìn)行解壓縮和解碼處理,得到a組混合幀,每組包含m個(gè)混合幀。優(yōu)選地,所述步驟D具體包括步驟Dl 將每組的m個(gè)混合幀按照欠定型盲信號(hào)分離算法進(jìn)行分離處理,得到a組視頻幀,每組包含η個(gè)視頻幀;D2 將a組視頻幀中的共計(jì)aXn個(gè)視頻幀組合,得到所述原始視頻。優(yōu)選地,所述步驟Dl具體包括步驟Dll 讓每組的m個(gè)混合幀構(gòu)成觀察信號(hào)向量χ ;
5
D12 將所述混合矩陣A的廣義逆矩陣W與所述觀察信號(hào)向量χ做乘運(yùn)算,得到當(dāng)前源信號(hào)向量S;D13 根據(jù)當(dāng)前源信號(hào)向量s,利用高斯混合模型,得到當(dāng)前源信號(hào)向量s的先驗(yàn)概率 P (S);D14 根據(jù)當(dāng)前源信號(hào)向量s的先驗(yàn)概率P(S),利用MAP算法,得到當(dāng)前源信號(hào)向量估值S ;D15:判斷當(dāng)前源信號(hào)向量估值§是否收斂,如果是,執(zhí)行步驟D16,否則,將當(dāng)前源信號(hào)向量s更新為當(dāng)前源信號(hào)向量估值§ ,然后執(zhí)行步驟D13 ;D16 根據(jù)當(dāng)前源信號(hào)向量估值§ ,得到每組的m個(gè)混合幀對(duì)應(yīng)的η個(gè)視頻幀。優(yōu)選地,所述步驟D13中,當(dāng)前源信號(hào)向量s的先驗(yàn)概率P (s)的計(jì)算公式如下
k kP(S)= Y4Piq = q\π )p(s \ q, μ q, β J =》qN (s \ μ q, β工
q=lq=\其中,k表示高斯混合模型中高斯分量的個(gè)數(shù),并且k的取值為3、4或者5 ;q表示高斯混合模型中觀察信號(hào)向量X的分量標(biāo)號(hào);η ,表示每個(gè)高斯分量產(chǎn)生觀察信號(hào)向量X的概率;μ ,表示q的均值;β ,表示q的方差逆。優(yōu)選地,所述步驟D14中,當(dāng)前源信號(hào)向量估值§的計(jì)算公式如下s = argmaxx=^p(s);其中,p(s)表示當(dāng)前源信號(hào)向量s的先驗(yàn)概率。優(yōu)選地,所述η的取值為4,所述m的取值為3或者2。(三)有益效果本發(fā)明所述基于欠定型盲信號(hào)分離的視頻壓縮編解碼系統(tǒng)及方法,通過與傳統(tǒng)的壓縮方法相結(jié)合能夠達(dá)到進(jìn)一步壓縮視頻的目的,且不會(huì)使視頻質(zhì)量產(chǎn)生不可容忍的畸變;并且,所述方法及系統(tǒng)非常適用于視頻監(jiān)控領(lǐng)域。
圖1是盲信號(hào)分離的基本框圖;圖2是本發(fā)明實(shí)施例所述基于欠定型盲信號(hào)分離的視頻壓縮編解碼系統(tǒng)模塊結(jié)構(gòu)圖;圖3是本發(fā)明實(shí)施例所述基于欠定型盲信號(hào)分離的視頻壓縮編解碼方法流程圖;圖4是本發(fā)明實(shí)施例所述基于欠定型盲信號(hào)分離的視頻壓縮編解碼方法應(yīng)用于視頻監(jiān)控領(lǐng)域時(shí)的結(jié)構(gòu)示意圖。
具體實(shí)施例方式下面結(jié)合附圖和實(shí)施例,對(duì)本發(fā)明的具體實(shí)施方式
作進(jìn)一步詳細(xì)描述。以下實(shí)施例用于說明本發(fā)明,但不用來限制本發(fā)明的范圍。圖2是本發(fā)明實(shí)施例所述基于欠定型盲信號(hào)分離的視頻壓縮編解碼系統(tǒng)模塊結(jié)構(gòu)圖。如圖2所示,所述系統(tǒng)包括混合模塊100、編碼模塊200、解碼模塊400和分離模塊300。所述混合模塊100,設(shè)置在視頻發(fā)送端,用于對(duì)原始視頻按照欠定型盲信號(hào)分離算法進(jìn)行混合處理。所述編碼模塊200,連接所述混合模塊100,用于對(duì)混合處理后的視頻進(jìn)行壓縮和編碼處理。經(jīng)過壓縮和編碼處理后的視頻,經(jīng)傳輸信道500被發(fā)送至設(shè)置在視頻接收端所述解碼模塊400。所述解碼模塊400,用于對(duì)接收到的視頻進(jìn)行解壓縮和解碼處理。所述分離模塊300,連接所述解碼模塊400,用于對(duì)解壓縮和解碼處理后的視頻按照欠定型盲信號(hào)分離算法進(jìn)行分離處理,得到所述原始視頻。圖3是本發(fā)明實(shí)施例所述基于欠定型盲信號(hào)分離的視頻壓縮編解碼方法流程圖。 如圖3所示,所述方法包括步驟A 在視頻發(fā)送端,混合模塊100對(duì)原始視頻按照欠定型盲信號(hào)分離算法進(jìn)行混合處理。所述步驟A具體包括 步驟Al 在視頻發(fā)送端,混合模塊100將原始視頻分為a組,每組包含η個(gè)視頻幀。步驟Α2 混合模塊100將每組的η個(gè)視頻幀與欠定型盲信號(hào)分離算法的混合矩陣 A做乘運(yùn)算,得到a組混合幀,每組包含m個(gè)混合幀;所述a、n、m均為大于0的自然數(shù),并且 η > m。所述η的取值優(yōu)選為4,所述m的取值優(yōu)選為3或者2。步驟B 對(duì)混合處理后的視頻進(jìn)行壓縮和編碼處理。所述步驟B具體包括對(duì)所述步驟A2得到的aXm個(gè)混合幀,按照現(xiàn)有壓縮標(biāo)準(zhǔn), 比如MPEG-2、H. 264或者AVS壓縮標(biāo)準(zhǔn),進(jìn)行壓縮和編碼處理。步驟C 在視頻接收端,對(duì)接收到的視頻進(jìn)行解壓縮和解碼處理。所述步驟C具體包括在視頻接收端,對(duì)接收到的視頻按照與發(fā)送端相對(duì)應(yīng)的解壓縮標(biāo)準(zhǔn),比如MPEG-2、H. 264或者AVS解壓縮標(biāo)準(zhǔn),進(jìn)行解壓縮和解碼處理,得到a組混合幀,每組包含m個(gè)混合幀。步驟D 對(duì)解壓縮和解碼處理后的視頻按照欠定型盲信號(hào)分離算法進(jìn)行分離處理,得到所述原始視頻。所述步驟D具體包括步驟Dl 將每組的m個(gè)混合幀按照欠定型盲信號(hào)分離算法進(jìn)行分離處理,得到a 組視頻幀,每組包含η個(gè)視頻幀。所述步驟Dl具體包括步驟步驟Dll 讓每組的m個(gè)混合幀構(gòu)成觀察信號(hào)向量χ。步驟D12 將 所述混合矩陣A的廣義逆矩陣W與所述觀察信號(hào)向量χ做乘運(yùn)算,得到當(dāng)前源信號(hào)向量S。本實(shí)施例中將盲信號(hào)分離中未知的混合過程轉(zhuǎn)化為了人為的混合過程,所以在混合時(shí)可以采用視頻發(fā)送端和視頻接收端都已知的混合矩陣Α,那么在視頻接收端進(jìn)行分離混合幀時(shí)就可以省略掉估計(jì)混合矩陣A的計(jì)算,一方面簡(jiǎn)化了計(jì)算;另一方面也消除了盲信號(hào)分離中會(huì)存在的分離信號(hào)順序的不確定性,保存了原始視頻幀原有的時(shí)間信息。這是因?yàn)榈湫偷拿ば盘?hào)分離完全丟失了混合矩陣A的信息,雖然通過算法可以恢復(fù)出混合矩陣A的每一列,但是卻不能確定混合矩陣A原始列的排列順序,才會(huì)使得求得的混合-分離復(fù)合矩陣C為一廣義排列矩陣,而非對(duì)角矩陣,造成分離信號(hào)的順序與源信號(hào)的順序不同。而在本實(shí)施例中由于混合矩陣A為已知的,所以可以消除這種不確定性。
步驟D13:根據(jù)當(dāng)前源信號(hào)向量s,利用高斯混合模型,得到當(dāng)前源信號(hào)向量s的先
驗(yàn)概率P (S)。所述當(dāng)前源信號(hào)向量s的先驗(yàn)概率P (s)的計(jì)算公式如下 k k
權(quán)利要求
1.一種基于欠定型盲信號(hào)分離的視頻壓縮編解碼系統(tǒng),其特征在于,包括混合模塊、 編碼模塊、解碼模塊和分離模塊;所述混合模塊,設(shè)置在視頻發(fā)送端,用于對(duì)原始視頻按照欠定型盲信號(hào)分離算法進(jìn)行混合處理;所述編碼模塊,連接所述混合模塊,用于對(duì)混合處理后的視頻進(jìn)行壓縮和編碼處理; 所述解碼模塊,設(shè)置在視頻接收端,用于對(duì)接收到的視頻進(jìn)行解壓縮和解碼處理; 所述分離模塊,連接所述解碼模塊,用于對(duì)解壓縮和解碼處理后的視頻按照欠定型盲信號(hào)分離算法進(jìn)行分離處理,得到所述原始視頻。
2.一種基于欠定型盲信號(hào)分離的視頻壓縮編解碼方法,其特征在于,包括步驟 A 在視頻發(fā)送端,對(duì)原始視頻按照欠定型盲信號(hào)分離算法進(jìn)行混合處理;B 對(duì)混合處理后的視頻進(jìn)行壓縮和編碼處理; C 在視頻接收端,對(duì)接收到的視頻進(jìn)行解壓縮和解碼處理;D 對(duì)解壓縮和解碼處理后的視頻按照欠定型盲信號(hào)分離算法進(jìn)行分離處理,得到所述原始視頻。
3.如權(quán)利要求2所述的系統(tǒng),其特征在于,所述步驟A具體包括步驟 Al 在視頻發(fā)送端,將原始視頻分為a組,每組包含η個(gè)視頻幀;Α2 將每組的η個(gè)視頻幀與欠定型盲信號(hào)分離算法的混合矩陣A做乘運(yùn)算,得到a組混合幀,每組包含m個(gè)混合幀;所述a、η、m均為大于0的自然數(shù),并且η > m。
4.如權(quán)利要求3所述的系統(tǒng),其特征在于,所述步驟B具體包括對(duì)所述步驟A2得到的aXm個(gè)混合幀,按照MPEG-2、H. 264或者AVS壓縮標(biāo)準(zhǔn)進(jìn)行壓縮和編碼處理。
5.如權(quán)利要求4所述的方法,其特征在于,所述步驟C具體包括在視頻接收端,對(duì)接收到的視頻按照MPEG-2、H. 264或者AVS解壓縮標(biāo)準(zhǔn)進(jìn)行解壓縮和解碼處理,得到a組混合幀,每組包含m個(gè)混合幀。
6.如權(quán)利要求5所述的方法,其特征在于,所述步驟D具體包括步驟Dl 將每組的m個(gè)混合幀按照欠定型盲信號(hào)分離算法進(jìn)行分離處理,得到a組視頻幀, 每組包含η個(gè)視頻幀;D2 將a組視頻幀中的共計(jì)aXn個(gè)視頻幀組合,得到所述原始視頻。
7.如權(quán)利要求6所述的方法,其特征在于,所述步驟Dl具體包括步驟 Dll 讓每組的m個(gè)混合幀構(gòu)成觀察信號(hào)向量χ ;D12 將所述混合矩陣A的廣義逆矩陣W與所述觀察信號(hào)向量χ做乘運(yùn)算,得到當(dāng)前源信號(hào)向量S;D13 根據(jù)當(dāng)前源信號(hào)向量s,利用高斯混合模型,得到當(dāng)前源信號(hào)向量s的先驗(yàn)概率P(S);D14:根據(jù)當(dāng)前源信號(hào)向量s的先驗(yàn)概率p(S),利用MAP算法,得到當(dāng)前源信號(hào)向量估值§ ;D15 判斷當(dāng)前源信號(hào)向量估值§是否收斂,如果是,執(zhí)行步驟D16,否則,將當(dāng)前源信號(hào)向量s更新為當(dāng)前源信號(hào)向量估值§ ,然后執(zhí)行步驟D13 ;D16 根據(jù)當(dāng)前源信號(hào)向量估值得到每組的m個(gè)混合幀對(duì)應(yīng)的η個(gè)視頻幀。
8.如權(quán)利要求7所述的方法,其特征在于,所述步驟D13中,當(dāng)前源信號(hào)向量s的先驗(yàn)概率P (s)的計(jì)算公式如下
9.如權(quán)利要求7所述的方法,其特征在于,所述步驟D14中,當(dāng)前源信號(hào)向量估值§的計(jì)算公式如下s = argmaxx=^p(s);其中,P(S)表示當(dāng)前源信號(hào)向量s的先驗(yàn)概率。
10.如權(quán)利要求3所述的方法,其特征在于,所述η的取值為4,所述m的取值為3或者
全文摘要
本發(fā)明公開了一種基于欠定型盲信號(hào)分離的視頻壓縮編解碼系統(tǒng)及方法,涉及多媒體領(lǐng)域。所述方法包括步驟在視頻發(fā)送端,對(duì)原始視頻按照欠定型盲信號(hào)分離算法進(jìn)行混合處理;對(duì)混合處理后的視頻進(jìn)行壓縮和編碼處理;在視頻接收端,對(duì)接收到的視頻進(jìn)行解壓縮和解碼處理;對(duì)解壓縮和解碼處理后的視頻按照欠定型盲信號(hào)分離算法進(jìn)行分離處理,得到所述原始視頻。所述基于欠定型盲信號(hào)分離的視頻壓縮編解碼系統(tǒng)及方法,通過與傳統(tǒng)的壓縮方法相結(jié)合能夠達(dá)到進(jìn)一步壓縮視頻的目的,且不會(huì)使視頻質(zhì)量產(chǎn)生不可容忍的畸變;并且,所述方法及系統(tǒng)非常適用于視頻監(jiān)控領(lǐng)域。
文檔編號(hào)H04N7/26GK102413333SQ20111042147
公開日2012年4月11日 申請(qǐng)日期2011年12月15日 優(yōu)先權(quán)日2011年12月15日
發(fā)明者喬飛, 劉靜, 吳澤邦, 楊華中, 魏琦 申請(qǐng)人:清華大學(xué)