專利名稱:一種保護(hù)多媒體視頻數(shù)據(jù)的方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種多媒體視頻數(shù)據(jù)保護(hù)方法,是一種基于小波變換、數(shù)字通信技術(shù)的數(shù)字水印技術(shù),屬于多媒體信號(hào)處理領(lǐng)域。
近幾年來,數(shù)字水印技術(shù)在許多應(yīng)用領(lǐng)域體現(xiàn)了它的重要性,并得到了廣泛的重視。盡管目前大多數(shù)數(shù)據(jù)隱藏的研究和文獻(xiàn)集中于圖象水印,數(shù)字視頻水印和信息隱藏技術(shù)也正在受到越來越多的重視。
數(shù)字水印算法中隱藏信息的類型可以是隨機(jī)序列,也可以是有意義的內(nèi)容(如文本、圖象、視頻、音頻等)。由前者構(gòu)成的水印只能給出“有水印”或“無水印”的回答,也即只提供1bit的秘密信息,從而使其應(yīng)用受到限制。在大多數(shù)應(yīng)用場(chǎng)合,要求嵌入的信息是可讀的或可視的,如有意義的字符串(所有者的姓名、地址、標(biāo)志等)、圖象(商標(biāo)、印鑒等)、視頻(有特定訪問權(quán)限的電視用戶才能看到的場(chǎng)景)等,因此有意義數(shù)據(jù)的隱藏有著更廣泛的應(yīng)用場(chǎng)合。
數(shù)字水印算法可以分為兩類需要原始媒體的私有系統(tǒng)和不需要原始媒體的公有系統(tǒng)。通常,由于有原始媒體的輔助,私有系統(tǒng)的穩(wěn)健性要比盲檢測(cè)系統(tǒng)好,然而由于在大多數(shù)應(yīng)用場(chǎng)合,原始媒體的獲取都比較困難,使盲檢測(cè)系統(tǒng)具有更多的應(yīng)用價(jià)值。由于視頻龐大的數(shù)據(jù)量,盲檢測(cè)算法對(duì)于視頻水印尤其重要。
視頻水印算法根據(jù)嵌入水印的數(shù)據(jù)域分為兩種壓縮域算法和非壓縮域算法。其中大部分算法屬于后者。目前的多數(shù)視頻水印算法采用隨機(jī)序列為主,即使是有意義的水印算法也存在著隱藏?cái)?shù)據(jù)量較小,且不夠穩(wěn)健的不足。其中一個(gè)著名的方法是Hartungand Girod提出的一種直接在非壓縮視頻中嵌入水印的方法,對(duì)于NTSC視頻,水印的數(shù)據(jù)率為528byte/s,每幀所能嵌入的數(shù)據(jù)為17.6byte。在沒有受到攻擊的情況下,檢測(cè)數(shù)據(jù)的比特錯(cuò)誤率為5×10-7。另一個(gè)著名的壓縮視頻域上的水印算法是Hartung andGirod提出的,對(duì)于NTSC視頻,嵌入水印的數(shù)據(jù)率是每秒鐘幾個(gè)bytes,在MPEG-2壓縮碼流為7Mbps時(shí),比特差錯(cuò)率為5×10-3。另外,現(xiàn)有的大多數(shù)視頻水印算法是將圖象上的算法直接擴(kuò)展到視頻而得到的。因此缺乏有效的幀同步技術(shù),對(duì)抗時(shí)間軸攻擊的性能較弱。
本發(fā)明的目的是提出一種多媒體信號(hào)處理方法,使隱藏信息的檢測(cè)不需要原始媒體;降低了檢測(cè)信息的差錯(cuò)率;同時(shí)解決視頻水印特有的穩(wěn)健性問題。
為了實(shí)現(xiàn)上述目的,本發(fā)明方法采用如下的水印嵌入和提取兩個(gè)過程,水印嵌入過程步驟如下1)將視頻序列中每幀的亮度分量進(jìn)行3級(jí)2-D DWT(Discrete WaveletTransform),抽取DWT低頻子帶系數(shù);2)將水印進(jìn)行糾錯(cuò)編碼;3)視頻各幀的DWT低頻子帶系數(shù)進(jìn)行3-D(Dimension)交織;4)將預(yù)處理后的數(shù)字水印嵌入到3-D交織后的DWT低頻子帶系數(shù)中;5)將嵌入數(shù)字水印之后的DWT低頻子帶系數(shù)進(jìn)行3-D反交織;6)在低頻子帶系數(shù)圖的四角嵌入經(jīng)過糾錯(cuò)編碼的同步信息;7)小波逆變換得到嵌入水印的視頻幀;水印提取過程步驟如下1)將視頻序列中每幀的亮度分量進(jìn)行3級(jí)2-D DWT(Discrete Wavelet Transform),抽取DWT低頻子帶系數(shù);2)提取同步信息并譯碼,根據(jù)同步信息恢復(fù)同步;3)視頻各幀的DWT低頻子帶系數(shù)進(jìn)行3-D(Dimension)交織;4)提取嵌入的信息;5)進(jìn)行糾錯(cuò)譯碼,得到水印。
水印可以是文本、數(shù)字、圖形或簽名的數(shù)字文檔,在嵌入時(shí)按一定的掃描順序?qū)⑵浣M成一維的數(shù)據(jù)。
下面對(duì)本發(fā)明方法作進(jìn)一步描述。
本發(fā)明的水印嵌入過程是1)將視頻序列中每幀的亮度分量進(jìn)行3級(jí)2-D DWT變換,得到10個(gè)子帶{LHi,HLi,HHi,LL3,i=1-3},其中LL3子帶是原始視頻幀的低通近似,本發(fā)明選擇LL3子帶系數(shù)嵌入信息;2)將水印W進(jìn)行BCH糾錯(cuò)編碼,生成X。本發(fā)明采用(r,8)形式的BCH碼,其中r表示BCH碼長(zhǎng)。本發(fā)明用一個(gè)具有256個(gè)BCH碼字的碼書,Sm,0≤m<256,來對(duì)應(yīng)一個(gè)字節(jié)的256個(gè)可能值。待隱藏?cái)?shù)據(jù)的每個(gè)字節(jié)Wi,對(duì)應(yīng)于信號(hào)集中的一個(gè)原型信號(hào)Sm,被映射為一個(gè)BCH碼字r的確定需要折衷考慮視頻幀的容量和糾錯(cuò)能力。r越大,兩個(gè)碼字間的漢明距離越大,糾錯(cuò)能力越強(qiáng),但同時(shí)可隱藏的數(shù)據(jù)量會(huì)越小。本發(fā)明選擇r為61。以十六進(jìn)制表示,BCH的生成多項(xiàng)式為g(z)={2759262D5D 506D}根據(jù)糾錯(cuò)編碼原理,上述任意兩個(gè)BCH碼字之間的漢明距離為27,能糾正13個(gè)隨機(jī)錯(cuò)誤。X{Xi}可以看作一個(gè)比特流。
3)在每幀LL3子帶系數(shù)圖中部抽取一個(gè)N×N的系數(shù)塊,其中N是2的冪次方,再將N幀的系數(shù)塊放在一起,形成一個(gè)N×N×N的三維系數(shù)塊B,對(duì)這樣一個(gè)三維系數(shù)塊采用三維滑動(dòng)窗交織的方法進(jìn)行交織,得到交織了的N×N×N系數(shù)塊B′。如果嵌入的是有意義的信息,而非隨機(jī)序列,則丟幀或大范圍的視頻截?cái)?,將?dǎo)致隱藏信息位的連續(xù)錯(cuò)誤(許多嵌入的信息位都丟失了),對(duì)應(yīng)于通信中的突發(fā)錯(cuò)誤。交織編碼技術(shù)是通信理論中抵抗突發(fā)錯(cuò)誤的有效方法。因此本發(fā)明引入3-D交織技術(shù)以增強(qiáng)水印信號(hào)對(duì)抗突發(fā)錯(cuò)誤的穩(wěn)健性。
4)將X按比特依次嵌入到B′中,生成B″;本發(fā)明提出用代表待嵌入的信息位“0”和“1”的值置換小波變換系數(shù)整數(shù)部分的最低4個(gè)有效位。其中代表信息位“1”和“0”的值分別是“1100b”和“0100b”。如果水印圖象遭遇攻擊出現(xiàn)失真,只要隱藏?cái)?shù)據(jù)的小波系數(shù)的變化在-4~3的范圍內(nèi),則嵌入數(shù)據(jù)都可以被正確地檢測(cè)到。
5)將B″進(jìn)行3-D反交織,反交織方法與交織方法相同;6)將用一個(gè)字節(jié)表示的幀號(hào)fn進(jìn)行如步驟2中相同的BCH糾錯(cuò)編碼,生成長(zhǎng)度為61個(gè)比特的fn′,并在各幀的低頻子帶系數(shù)圖的四角嵌入。本發(fā)明分別用“11000b”和“01000b”置換小波變換系數(shù)的最低5個(gè)有效位來嵌入同步信息位“0”和“1”。
7)小波逆變換得到嵌入水印的視頻幀。
本發(fā)明中水印的提取過程不需要原始視頻,步驟如下1)DWT。將待檢測(cè)的視頻每一幀的亮度分量進(jìn)行3級(jí)小波分解得到10個(gè)子帶。選擇低頻子帶系數(shù)。
2)提取同步信息,恢復(fù)幀同步。提取每一幀DWT低頻子帶四角部分的61個(gè)系數(shù)整數(shù)部分的第5個(gè)最低有效位作為同步信息,然后進(jìn)行BCH譯碼得到幀號(hào)。按照幀號(hào)遞增的原則將各幀的順序進(jìn)行調(diào)整。設(shè)調(diào)整后相鄰兩幀的幀號(hào)分別為I和J,若J-I≠1,把I幀的LL3子帶插補(bǔ)入I幀與J幀的LL3子帶之間,重復(fù)J-I-1次,以實(shí)現(xiàn)正確的同步。
3)3-D交織。在同步處理過的LL3小波系數(shù)中抽取N×N的塊,其中N是2的冪次方,N幀的N×N的塊組成一個(gè)N×N×N的三維系數(shù)塊B*,對(duì)B*進(jìn)行3-D交織,生成B**;4)檢測(cè)實(shí)際嵌入的信息。記coef*為B**中待檢測(cè)的小波系數(shù),x*為檢出水印信息。Coef*的絕對(duì)值的整數(shù)部分的第4個(gè)有效位即是x*,所有的x*組成比特流x**。
5)BCH解碼。如果嵌入數(shù)據(jù)是字符串,則將x**分割成長(zhǎng)度為61位的子序列,對(duì)于每一個(gè)子系列通過在Sm中搜索與其漢明距離最小的碼字,可以得到水印字節(jié)。
本發(fā)明與現(xiàn)有視頻水印技術(shù)比較有以下優(yōu)點(diǎn)1)將數(shù)字通信理論中的技術(shù),如BCH信道編碼、3-D交織技術(shù)、和同步技術(shù)結(jié)合起來引入視頻水印算法中,降低了檢測(cè)信息的差錯(cuò)率。
2)提出了一種有效的幀同步技術(shù)。使檢測(cè)過程能夠自同步,有效地對(duì)抗視頻水印可能遭到的時(shí)間軸上的攻擊,如丟幀、幀交換、幀替換等。
3)本發(fā)明提出的算法嵌入的數(shù)據(jù)量較大,穩(wěn)健性很好。對(duì)于CIF格式序列,每幀可嵌入約16.8個(gè)字節(jié)(不包含BCH編碼的冗余部分)。實(shí)驗(yàn)中,我們?cè)?6幀的352×288的序列中,嵌入了1150個(gè)字符。在沒有遭受攻擊的情況下,嵌入水印可以無差錯(cuò)地得到恢復(fù)。嵌入水印的視頻序列經(jīng)MPEG-2編碼后的穩(wěn)健性為對(duì)于運(yùn)動(dòng)比較小的Salesman序列,當(dāng)壓縮碼率為2.7Mb,CR(CompressionRatio)=11.16,PSNR=41.12dB時(shí),可以無差錯(cuò)地檢測(cè)到嵌入的字符串。對(duì)于運(yùn)動(dòng)復(fù)雜,運(yùn)動(dòng)范圍較大的Mobile序列,當(dāng)壓縮碼率為6Mb,CR=5.07,PSNR=37.19dB時(shí),可以無差錯(cuò)地檢測(cè)到嵌入的字符串。
圖1-5是視頻標(biāo)準(zhǔn)測(cè)試序列Salesman和Mobile(每幀大小為352×288,共96幀)的實(shí)驗(yàn)結(jié)果圖。水印是長(zhǎng)度為1150字節(jié)的文本。
圖1是本發(fā)明提出的視頻水印算法對(duì)視頻序列Salesman的數(shù)字水印圖。
圖2是本發(fā)明提出的視頻水印算法對(duì)視頻序列Mobile的數(shù)字水印圖。
圖3是本發(fā)明提出的視頻水印算法對(duì)丟幀的穩(wěn)健性測(cè)試圖(橫軸是丟幀率,縱軸是字符差錯(cuò)率)。
(a)Salesman中水印對(duì)連續(xù)丟幀的穩(wěn)健性;(b)Salesman中水印對(duì)間隔丟幀的穩(wěn)健性。
圖4是本發(fā)明提出的視頻水印算法對(duì)丟幀的穩(wěn)健性測(cè)試(橫軸是丟幀率,縱軸是字符差錯(cuò)率)(a)Mobile中水印對(duì)連續(xù)丟幀的穩(wěn)健性;(b)Mobile中水印對(duì)間隔丟幀的穩(wěn)健性。
圖5是本發(fā)明提出的視頻水印算法對(duì)MPEG-2編碼的穩(wěn)健性(橫軸是解碼視頻的平均峰值信噪比,縱軸是字符差錯(cuò)率)(a)Salesman中水印對(duì)MPEG-2編碼的穩(wěn)健性(b)Mobile中水印對(duì)MPEG-2編碼的穩(wěn)健性。
圖1中,(a)為Salesman序列的第20幀的原始圖,嵌入水印的視頻幀顯示在圖1(b)中,其PSNR(Peak Signal Noise Ratio)為49.23dB。由圖可知嵌入了水印的幀在視覺上與原始幀無感覺差異。滿足不可見性的要求。
圖2中,(a)是Mobile序列的第17幀的原始圖,嵌入水印的視頻幀效果顯示在圖2(b)中,其PSNR(Peak Signal Noise Ratio)為49.26dB。由圖可知嵌入了水印的幀在視覺上與原始幀無感覺差異。滿足不可見性的要求。
圖3和圖4分別為Salesman和Mobile視頻序列丟幀后的水印檢測(cè)性能。按說明書中的水印嵌入過程得到水印視頻,然后丟幀。分連續(xù)丟幀和間隔丟幀。設(shè)一組由32幀組成,則丟幀率為 圖3(a)和3(b)分別顯示了Salesman在連續(xù)丟幀和間隔丟幀的各種丟幀率下檢測(cè)得到的水印的字符差錯(cuò)率。圖4(a)和4(b)分別顯示了Mobile在連續(xù)丟幀和間隔丟幀的各種丟幀率下檢測(cè)得到的水印的字符差錯(cuò)率。各圖中對(duì)比了采用3-D交織技術(shù)(圖3(a)和4(a)中對(duì)應(yīng)于interleave consecutive frame loss,圖3(b)和4(b)中對(duì)應(yīng)于interleavediscrete frame loss)和不采用交織技術(shù)(圖3(a)和4(a)中對(duì)應(yīng)于original consecutiveframe loss,圖3(b)和4(b)中對(duì)應(yīng)于original discrete frame loss)時(shí)的穩(wěn)健性。由圖可知1)對(duì)于連續(xù)丟幀,在fr<0.5時(shí),采用3-D交織技術(shù)比不采用交織技術(shù)時(shí)的穩(wěn)健性有明顯改善。采用3-D交織后,在32幀中連續(xù)丟失幀的數(shù)目大于12時(shí),檢測(cè)到的水印才出現(xiàn)差錯(cuò)。
2)對(duì)于間隔丟幀,同樣地,在fr<0.5時(shí),采用3-D交織技術(shù)都比不采用交織技術(shù)時(shí)的穩(wěn)健性有明顯改善。
3)在對(duì)抗時(shí)間軸上的攻擊時(shí),在利用同步信息恢復(fù)同步的基礎(chǔ)上,采用交織算法比不采用交織算法時(shí)的穩(wěn)健性有明顯改善。而且實(shí)驗(yàn)表明本發(fā)明提出的方法對(duì)于丟幀具有很好的穩(wěn)健性。
圖5是本發(fā)明提出的方法對(duì)MPEG-2壓縮的穩(wěn)健性測(cè)試結(jié)果。對(duì)于Salesman序列,當(dāng)壓縮碼率為2.7Mb,CR=11.16,PSNR=41.12dB時(shí),可以無差錯(cuò)地檢測(cè)到嵌入的字符串。當(dāng)壓縮倍數(shù)在13.81倍之內(nèi)時(shí),檢測(cè)到的嵌入的字符串的字符差錯(cuò)率小于1%。圖5(a)給出了穩(wěn)健性能曲線。對(duì)于Mobile序列,當(dāng)壓縮碼率為6Mb,CR=5.07,PSNR=37.19dB時(shí),可以無差錯(cuò)地檢測(cè)到嵌入的字符串。圖5(b)給出了穩(wěn)健性能曲線。由實(shí)驗(yàn)結(jié)果可知,本發(fā)明提出的方法對(duì)于MPEG-2編碼的穩(wěn)健性優(yōu)于某些已有的算法。
對(duì)視頻水印常見的處理還有空域放大。本文提出的算法在嵌入水印的視頻序列被放大之后,能夠無差錯(cuò)的檢測(cè)到嵌入的信息。
權(quán)利要求
1.一種保護(hù)多媒體視頻數(shù)據(jù)的方法,其特征在于該方法采用如下的水印嵌入和提取兩個(gè)過程,水印嵌入過程步驟如下1)將視頻序列中每幀的亮度分量進(jìn)行3級(jí)2-D DWT,抽取DWT低頻子帶系數(shù);2)將水印進(jìn)行糾錯(cuò)編碼;3)視頻各幀的DWT低頻子帶系數(shù)進(jìn)行3-D交織;4)將步驟2中預(yù)處理后的數(shù)字水印嵌入到3-D交織后的DWT低頻子帶系數(shù)中;5)將嵌入數(shù)字水印之后的DWT低頻子帶系數(shù)進(jìn)行3-D反交織;6)在低頻子帶系數(shù)圖的四角嵌入經(jīng)過糾錯(cuò)編碼的同步信息;7)小波逆變換得到嵌入水印的視頻幀;水印提取過程步驟如下1)將視頻序列中每幀的亮度分量進(jìn)行3級(jí)2-D DWT,抽取DWT低頻子帶系數(shù);2)提取同步信息并進(jìn)行糾錯(cuò)譯碼,根據(jù)同步信息恢復(fù)同步;3)視頻各幀的DWT低頻子帶系數(shù)進(jìn)行3-D交織;4)提取嵌入的信息;5)進(jìn)行糾錯(cuò)譯碼,得到水印。
2.根據(jù)權(quán)利要求1所述的一種保護(hù)多媒體視頻數(shù)據(jù)的方法,其特征是水印嵌入過程步驟如下1)對(duì)視頻序列中每幀的亮度分量進(jìn)行3級(jí)2-D DWT,得到10個(gè)子帶{LHi,HLi,HHi,LL3,i=1-3},其中LL3子帶是原始視頻幀的低通近似,選擇LL3子帶系數(shù)嵌入信息;2)將待嵌入的水印W進(jìn)行BCH糾錯(cuò)編碼,將原始信號(hào)集中的一個(gè)原型信號(hào),映射到一個(gè)BCH碼字,得到W′,用比特流表示;3)在每幀LL3子帶系數(shù)中部抽取一個(gè)N×N的二維系數(shù)塊,再將N幀的系數(shù)塊放在一起,形成一個(gè)N×N×N的三維系數(shù)塊B,對(duì)這樣一個(gè)三維系數(shù)塊進(jìn)行三維滑動(dòng)窗交織,得到交織了的N×N×N系數(shù)塊B′;4)依次掃描B′中的系數(shù)和W′中的信息位,通過修改系數(shù)整數(shù)部分的最低4個(gè)有效位的值嵌入信息位;5)采用相同的三維滑動(dòng)窗交織算法對(duì)N×N×N系數(shù)塊進(jìn)行反交織;6)在LL3子帶的四角嵌入經(jīng)過BCH編碼的視頻幀號(hào)作為同步信息;7)通過2-D IDWT得到嵌入水印的各視頻幀;水印提取過程步驟如下1)對(duì)待檢測(cè)的視頻序列中每幀的亮度分量進(jìn)行3級(jí)2-D DWT,得到10個(gè)子帶{LHi,HLi,HHi,LL3,i=1-3},抽取其中LL3子帶;2)抽取LL3子帶四角嵌入的同步信息,并進(jìn)行BCH譯碼,得到視頻幀號(hào),根據(jù)幀號(hào)進(jìn)行幀插補(bǔ)、幀交換,恢復(fù)幀同步;3)在恢復(fù)同步的視頻各幀的LL3子帶系數(shù)中部抽取一個(gè)N×N的二維系數(shù)塊,再將N幀的系數(shù)塊放在一起,形成一個(gè)N×N×N的三維系數(shù)塊B*,對(duì)這樣一個(gè)三維系數(shù)塊進(jìn)行三維滑動(dòng)窗交織,得到交織了的N×N×N系數(shù)塊B**;4)依次提取系數(shù)塊B**中系數(shù)整數(shù)部分的第4個(gè)最低有效位作為信息位,得到用比特流表示的W*;5)將W*進(jìn)行BCH譯碼,得到可能失真的水印W**。
3.根據(jù)權(quán)利要求1或2所述的一種保護(hù)多媒體視頻數(shù)據(jù)的方法,其特征是將視頻每幀的幀號(hào)作為同步信息嵌入視頻中,提取過程中利用該信息進(jìn)行自同步。
全文摘要
本發(fā)明涉及一種多媒體視頻數(shù)據(jù)保護(hù)方法,是一種基于小波變換、數(shù)字通信技術(shù)的數(shù)字水印技術(shù),屬于多媒體信號(hào)處理領(lǐng)域。本發(fā)明利用小波變換將視頻數(shù)據(jù)進(jìn)行分解,采用數(shù)字通信技術(shù)對(duì)水印進(jìn)行預(yù)處理,在小波變換域嵌入水印。最后通過小波逆變換得到嵌入水印的視頻數(shù)據(jù)。與原始視頻數(shù)據(jù)相比,人眼無法區(qū)別兩者的差別。而數(shù)字水印則為這個(gè)問題提供了一種區(qū)別的手段。水印可以是任何有意義的數(shù)字文檔。本發(fā)明可使通過網(wǎng)絡(luò)傳播的視頻數(shù)據(jù)或文件獲得保護(hù)。
文檔編號(hào)H04N5/278GK1377180SQ0211510
公開日2002年10月30日 申請(qǐng)日期2002年4月19日 優(yōu)先權(quán)日2002年4月19日
發(fā)明者劉紅梅, 黃繼武 申請(qǐng)人:中山大學(xué)