欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種抗同步攻擊的音頻水印處理方法

文檔序號:6759646閱讀:394來源:國知局
專利名稱:一種抗同步攻擊的音頻水印處理方法
技術領域
本發(fā)明屬于多媒體信號處理領域,具體涉及一種基于時域統(tǒng)計特征(直方圖及均值)的抗同步攻擊的音頻水印處理方法。
背景技術
在音頻版權保護中,如何對抗同步攻擊是一個需要考慮的難題,根據(jù)IFPI、STEP2000和SDMI對穩(wěn)健性的定義,音頻水印除了對一些常規(guī)的信號處理穩(wěn)健之外,應能抵抗大約±10%時域伸縮、隨機裁剪等同步攻擊。然而,目前的音頻水印算法僅僅針對一種同步攻擊,且抗這種攻擊的性能不是很理想。
在近年來的音頻研究中,如何抵抗一些常見的音頻信號處理和攻擊已經(jīng)得到很好的解決,如MP3壓縮、重采樣、重量化和一定程度的疊加噪聲等。然而,音頻水印對于TSM、隨機裁剪等同步攻擊的穩(wěn)健性一直沒有得到很好的解決。如何設計對同步攻擊穩(wěn)健的音頻水印仍然是一個具有挑戰(zhàn)性的研究課題。主要原因在于同步攻擊導致了水印在時域嵌入位置的迷失,使得已嵌入的水印無處可尋,造成檢測失敗?;趲降囊纛l水印技術可以抵抗裁剪(cropping)攻擊,通過搜索同步碼來達到裁剪后重同步的目的。然而,這種水印框架對于其它同步攻擊是非常敏感的,如即便是±1%的TSM攻擊,嵌入的同步碼已無法進行檢測。
在許多常見的音頻編輯處理工具中,TSM是一種常見的音頻信號處理操作,如GoldWave v4.26和CoolEditPro v2.1.等。通常,即便是在±10%的TSM操作下,音頻的聽覺質(zhì)量仍然相當完美,這主要是由于人類聽覺系統(tǒng)(Human Auditory System,HAS)對TSM攻擊不是很敏感。因此,TSM攻擊成為了音頻水印中一種常見的攻擊操作。主要有兩種可改變音頻長度的TSM攻擊模式1)保持音調(diào)不變(Pitch-invariant)的TSM攻擊;2)基于重采樣(Resample)模式的TSM攻擊,相當于用一個較慢或較快的速度來重新播放和錄制音頻。Pitch-invariant模式在更改音頻長度的同時保持音調(diào)不變,是一種常見的攻擊模式。而Resample模式則通過插值的形式來改變音頻的長度,在許多情況下可能碰到,如DA/AD變換中的時間軸上的線性伸縮等。
以往針對同步攻擊的音頻水印算法主要圍繞一種或幾種可能遭遇的攻擊類型來設計,如有的僅僅針對Pitch-invariant的TSM攻擊、有的僅僅針對基于重采樣TSM攻擊、也有的有的僅僅針對裁剪攻擊等。目前,尚未發(fā)現(xiàn)能同時有效地抵抗各種常見的同步攻擊的音頻水印算法。

發(fā)明內(nèi)容
本發(fā)明的目的是提出一種基于音頻時域統(tǒng)計特征(直方圖及均值)對同步攻擊非常穩(wěn)健的音頻水印處理方法。該方法能夠在保持水印不可察覺的情況下,可以抵抗近±30%的TSM攻擊以及大幅度的隨機裁剪、編輯和抖動等同步攻擊。
本發(fā)明方法的技術方案如下該方法包括水印嵌入和水印檢測兩個過程;水印嵌入過程步驟如下1)計算音頻的均值A;2)根據(jù)均值選擇一個用于嵌入水印信息的幅值區(qū)間B=[-λA,λA],λ為一個正數(shù);3)計算B的直方圖;4)通過重新分配每三個BIN中的樣本數(shù)量來嵌入一個水印比特;5)重復第4步直到水印信息全部嵌入;水印檢測過程如下1)與嵌入時相同,計算音頻的均值;2)根據(jù)均值提取直方圖;3)計算每三個BIN中的樣本數(shù)量關系來提取水印比特;4)重復第3步直到水印信息全部提取出來。
所述水印嵌入過程的詳細步驟如下1)計算音頻的均值A;2)根據(jù)均值選擇一個用于嵌入水印信息的幅值區(qū)間B=[-λA,λA],λ為一個正數(shù),大量的實驗表明取值一般在[1.5,2.5]之間比較好;3)根據(jù)嵌入的信息量L=L1+L2來計算B的直方圖,嵌入信息的結構由同步序列(長L1)和水印信息(長L2)組成直方圖BIN的尺寸大小相同,BIN的數(shù)量為3L;4)通過重新分配每三個BIN中的樣本數(shù)量來嵌入一個水印比特;5)重復第4步直到信息全部嵌入。
所述水印檢測過程的詳細步驟如下1)與嵌入時相同,計算音頻的均值,由于均值在TSM攻擊后會產(chǎn)生一定的偏差,需要在這個偏差的范圍內(nèi)C利用嵌入的同步序列(長L1)來消除這種影響;2)根據(jù)均值提取直方圖;3)計算每三個BIN中的樣本數(shù)量關系來提取水印比特;4)重復步驟3)直到水印信息全部提取出來;5)比較嵌入時的同步序列和提取到的同步比特,如匹配則提取水印比特,否則根據(jù)一定的步長來改變均值,再重復本過程2)、3)、4)步;6)直到在范圍C內(nèi)搜索完畢,根據(jù)最好的匹配結果提取水印信息。
本發(fā)明的主要思想在于利用音頻時域的兩個統(tǒng)計特征1)不同BIN中的音頻樣本其數(shù)目在線性伸縮的前后其比例關系具有理論上不變的特性。從直方圖的角度來說,就是時間軸上的線性伸縮不會改變音頻直方圖的形狀;2)音頻幅度的均值(Mean)在線性伸縮的前后也是理論不變的。對于可改變音頻長度的TSM攻擊而言,Pitch-invariant模式可以看成一種近似的在時間軸上的線性伸縮,而Resample模式則可以看成是一種基于插值算法的線性伸縮。因而,上述的兩個特征對于TSM攻擊來說是非常穩(wěn)健的。從統(tǒng)計上講,自由裁剪、復制或抖動等同步攻擊所去除或增添的音頻樣本與原始音頻具有近似相同的幅值分布,因而也可以看成一種近似的線性伸縮。顯然,利用上述兩個統(tǒng)計特征對線性伸縮的不變性,所設計的音頻水印對這些常見的同步攻擊將具有非常好的穩(wěn)健性。本發(fā)明方法的主要思想如下1)根據(jù)直方圖形狀對同步攻擊的特點,水印比特被嵌入在三個連續(xù)BIN中樣本數(shù)量的比例關系上;2)針對幅值伸縮攻擊,根據(jù)音頻的均值來選擇一個幅值區(qū)間,用于計算音頻直方圖。仿真結果表明,所設計的音頻水印對常見的各種同步攻擊(如TSM、裁剪、抖動等)是非常穩(wěn)健的,對于常見音頻信號處理或操作(如MP3壓縮、重采樣、能量變化等)也具有很好的穩(wěn)健性。


圖1是本發(fā)明水印嵌入過程的流程框圖;圖2是pitch-invariant模式TSM攻擊(從70%和130%)下BIN中樣本數(shù)目變化的相對情況;圖3是Resample模式TSM攻擊(從70%和130%)下BIN中樣本數(shù)目變化的相對情況;圖4是在70%~130%TSM攻擊下音頻均值的變化曲線;圖5是每三個連續(xù)BIN中樣本數(shù)量的相對關系在水印嵌入前后的變化情況。
具體實施例方式
下面結合附圖對本發(fā)明方法作進一步說明。
該方法包括水印嵌入和水印檢測兩個過程;1.水印嵌入水印嵌入的基本思想是1)根據(jù)音頻的均值選擇一個用于嵌入水印信息的幅值區(qū)間,并根據(jù)嵌入量來確定直方圖的BIN數(shù);2)每三個BIN一組,通過調(diào)整每組中樣本數(shù)量的大小來嵌入一個水印比特。根據(jù)嵌入規(guī)則,水印音頻通過直接對原始音頻的樣本值進行修改所得。
圖1所示為水印嵌入的流程框圖,從圖1可以看出根據(jù)音頻的均值A及參數(shù)λ計算用于嵌入水印信息的幅值區(qū)間B,并根據(jù)嵌入量來確定直方圖的BIN數(shù)L,每三個BIN一組,通過調(diào)整BIN樣本數(shù)的大小來嵌入一個水印比特。詳細的嵌入過程描述如下。假設打算將一個二進制水印序列W={wi|i=1,…,Lw}嵌入到音頻載體F={f(i)|i=1,…,N}中。其中,Lw是嵌入信息的長度,N表示音頻的長度。首先計算音頻的幅值均值AA‾=Σi=1N|f(i)|...(1)]]>參照A,從F中選擇一個幅值范圍B=[-λA,λA]。然后根據(jù)W的長度計算B的直方圖H={h(i)|i=1,…,L},一般令L=3Lw。λ是一個正數(shù),用于滿足在提取的直方圖中,BIN中的樣本數(shù)目滿足h(i)>>L。對不同類型的音頻進行測試表明,λ∈[1.5,2.5]是一個較為理想的取值范圍,在此區(qū)間內(nèi)取值的λ可滿足從B計算的直方圖中,BIN具有足夠的樣本數(shù)目。
在提取直方圖后,假設三個連續(xù)的BIN(表示為Bin_1,Bin_2和Bin_3)中的樣本數(shù)分別為a,b和c,可采用如下的關系來嵌入水印比特
2b/(a+c)≥Tifw(i)=1(a+c)/2b≥Tifw(i)=0...(2)]]>其中,T是一個閾值,作為嵌入強度用于控制嵌入信息的穩(wěn)健性和嵌入失真,使之達到一個平衡。圖2和圖3分別是pitch-invariant模式及Resample模式TSM攻擊(從70%和130%)下BIN中樣本數(shù)目變化的相對情況。可以看出音頻直方圖的形狀對這兩種伸縮攻擊是非常穩(wěn)健的。其中,左邊的子圖顯示了BIN的中樣本數(shù)目的變化與伸縮因子成近似的線性關系,公式表示為αk=h′(k)h(k);]]>右邊的子圖顯示了三個連續(xù)BIN中樣本數(shù)量的相對關系在水印嵌入前后的變化情況,公式表示為βk=2·h(k)h(k-1)+h(k+1),]]>可以看出變化的范圍在0.9到1.1之間。參考圖2和圖3可知,為了能抵抗±30%的TSM攻擊,T的取值應在1.1以上。
如果要嵌入的信息w(i)為‘1’并且2b/(a+c)≥T,無需任何操作。否則如果2b/(a+c)<T,通過調(diào)整三個連續(xù)BIN中的樣本數(shù)量來滿足2b/(a+c)≥T,以嵌入水印比特‘1’。同理,如果要嵌入的信息w(i)為‘0’并且(a+c)/2b≥T,無需任何操作。否則如果(a+c)/2b<T,通過調(diào)整這三個連續(xù)BIN中的樣本數(shù)量來滿足(a+c)/2b≥T,以嵌入水印比特‘0’。如何更改BIN中的樣本數(shù)目來嵌入水印比特的詳情,可以參考公式(3),(4),(5)和(6)。
參考嵌入方程(2),如果要嵌入的信息w(i)為‘1’并且2b/(a+c)<T,從Bin_1和Bin_3分別選出I1和I3個樣本,通過更改這些樣本的值使之落入到Bin_2中,以達到2b′/(a′+c′)≥T的目的。考慮到安全性,這些樣本可通過一個隨機的密鑰選出。a′,b′,c′為更改后三個BIN中相應的樣本數(shù)目。更改規(guī)則表示如下
f1′(i)=f1(i)+M,1≤i≤I1f3′(i)=f3(i)-M,1≤i≤I3...(3)]]>其中,f1(i)和f3(i)為Bin_1和Bin_3中第i個樣本值,f1′(i)和f3′(i)為相應更改后的值,M為BIN所包括的幅值區(qū)間。顯然,更改后的樣本值已經(jīng)轉移到Bin_2之中。如何確定I1和I3的大小是一個需要考慮的問題,一個理想的做法是讓需要更改的樣本數(shù)I1和I3同BIN中的樣本數(shù)目a和c成比例關系,這樣可避免BIN中的樣本數(shù)目不夠更改的情況。I1和I3的計算表達式如下I1=I·a/(a+c),I3=I·c/(a+c),I≥[T(a+c)-2b]/(2+T) (4)同嵌入比特‘1’類似,如果要嵌入的信息w(i)為‘0’并且(a+c)/2b<T,需要從Bin_2中采用同樣的密鑰挑出I1和I3個樣本分別更改到Bin_1和Bin_3中,以達到(a′+c)/2b′≥T的目的。相應更改規(guī)則表示如下f2′(i)=f2(i)-M,1≤i≤I1f2′(i)=f2(i)+M,1≤i≤I3...(5)]]>其中,f2(i)為Bin_2中第i個樣本值,f2′(i)為相應更改后的值。顯然,在Bin_2中共有(I1+I3)個樣本被更改,I1和I3樣本分別轉移到Bin_1和Bin_3中之中。
類似地,采用如下的表達式來確定I1和I3的大小I1=I·a/(a+c),I3=I·c/(a+c),I≥[2Tb-(a+c)]/(1+2T) (6)每三個BIN一組重復以上的過程直到嵌入所有的水印比特。在所提出的嵌入策略中,一旦確定需要更改音頻樣本之后,直接更改原始音頻即可得到嵌入信息后的水印音頻。因而,重構水印音頻非常簡單。水印音頻表示為F′={f′(i)|i=1,…,N′}。顯然,有N′=N。
計算表達式(4)和(6)可以采用如下方法證明如果要嵌入的信息w(i)為‘1’并且2b/(a+c)<T,需要重新調(diào)配從Bin_1,Bin_2和Bin_3中的樣本數(shù)以達到2b′/(a′+c′)≥T的目的。假設分別從Bin_1和Bin_3中選出I1和I3個樣本,通過公式(4)更改這些樣本的值使其轉移到Bin_2中,于是有a′=a-I1,c′=c-I3,b′=b+I1+I3。a′,b′,c′是a,b,c在嵌入水印比特后的相應樣本數(shù)。不失一般性,讓I=I1+I3并且a/c=I1/I3,使得被更改的樣本數(shù)目與BIN中的原樣本數(shù)成線性關系。參考方程組(2),可有如下的數(shù)學推導2b′/(a′+c′)≥T2(b+I1+I3)≥T(a+c-I1-I3)I≥[T(a+c)-2b]/(2+T)方程(4)證明完成。
類似地,如果要嵌入的信息w(i)為‘0’并且(a+c)/2b<T,可從Bin_2中分別選擇I1和I3個樣本,通過方程(6)更改這些使其轉移到Bin_1和Bin_3中,以達到(a′+c′)/2b′≥T的目的。于是有a′=a+I1,c′=c+I3,b′=b-I1-I3。同樣,讓I=I1+I3并且a/c=I1/I3,于是有如下相應的數(shù)學推導(a′+c′)/2b′≥T(a+c+I1+I3)≥2T(b-I1-I3)I≥[2Tb-(a+c)]/(1+2T)方程(6)的數(shù)學證明完成。
2.水印檢測在檢測過程中,考慮到TSM對音頻均值的影響,需要根據(jù)TSM的影響定義一個關于均值的搜索空間[A″(1-Δ1),A″(1+Δ2)]。這里A″用來表示待檢測音頻F″={f″(i)|i=1,…,N″}的均值。圖4是在70%~130%TSM攻擊下音頻均值的變化曲線,從圖4可以看出,音頻均值對TSM攻擊是比較穩(wěn)健的,在±30%的拉伸下導致的均值誤差比率在±5%之間。參照在圖4中的實驗結果,Δ1和Δ2根據(jù)TSM攻擊對音頻均值可能造成的最大誤差比來設計,一般為5%即可。在搜索過程中,涉及到匹配和收斂的問題,這里可將嵌入信息的一部分用作同步匹配,另一部分即為隱藏的水印比特。嵌入信息的結構如下表1所示表1

表1中,同步信息為一PN(Pseudo-random Noise)序列,表示為{Syn(i)},緊跟的水印信息表示為{Wmk(i)}。
搜索的目的是從F″中以最小誤碼的形式來獲取水印信息的最佳估計W′={w′i|i=1,…,Lw}。與嵌入過程類似,在搜索空間[A″(1-Δ1),A″(1+Δ2)]中,根據(jù)搜索步長S來一一決定用于計算的均值A1,進而由參數(shù)λ計算幅值區(qū)間B1=[-λA1,λA1],再生成直方圖H1={h1(i)|i=1,…,L1},L1=3Lw。假設三個連續(xù)的BIN中的樣本數(shù)分別為a1″,b1″and c1″,用如下的公式即可提取隱藏的水印比特w′i=1if2b1′′/(a1′′+c1′′)≥10other...(7)]]>每三個為BIN一組重復以上過程直到提取所有隱藏的水印比特。一旦同步碼{Syn(i)}與提取到的同步序列{Syn1(i)}匹配或者搜索過程結束,根據(jù)最佳的匹配即可得到隱藏在同步序列后的水印比特{Wmk1(i)}。在搜索過程中,參數(shù)Lw,λ和同步序列{Syn(i)}是預知的,無需原始音頻信息參與,因此本發(fā)明方法是盲檢測的。
圖5是直方圖BIN中的樣本數(shù)量的相互關系在水印嵌入前后的示意圖。從圖5可以看出,在嵌入前,βk的范圍在0.9到1.1之間;在嵌入后變化的范圍在0.7到1.3之間。表1顯示了音頻水印在不同常規(guī)信號處理操作或攻擊下的穩(wěn)健性能。表2顯示了音頻水印在裁剪和抖動攻擊下的穩(wěn)健性能。表3顯示了音頻水印TSM攻擊下的穩(wěn)健性能。
圖5中,實驗參數(shù)λ=2.4,結合音頻的均值用于選擇幅值嵌入?yún)^(qū)間。水印信息的長度為100比特(31比特的同步信息和69比特的水印),生成的直方圖共300個BIN用于隱藏這些信息。以一段長為20秒的單聲道、雙極性44.1kHz采樣率的輕音樂‘多瑙河’(Danube.wav)為例,當嵌入閾值T=1.3時,在嵌入100比特的信息后,水印音頻的SNR為46.30dB。音頻在嵌入信息的前后均值幾乎保持不變,分別為4001.3和4001.4,這是由于在嵌入過程中,那些用于嵌入信息的音頻樣本值被增加和減小的數(shù)目在概率上是大致相同的。由于更改的幅度相同,所以嵌入前后均值改變很小??紤]到TSM對音頻均值的影響一般在±5%之間,所以參數(shù)Δ1=Δ2=5%。水印嵌入前后三個連續(xù)BIN間樣本數(shù)量關系βk的示意圖如圖5所示。
從下表2可看出,算法對一些常規(guī)的信號處理操作是穩(wěn)健的,如±50%的幅值伸縮攻擊、80kbps的MP3壓縮和截止頻率為8kHz的低通濾波等。
表2

下表3為算法對自由裁剪的穩(wěn)健性測試結果。在測試中,平均10個樣本隨機剪取1個共剪去20000個樣本,或者在20秒的音頻中隨機裁剪掉5秒的音頻,水印仍可完全地正確提取。至于抖動(jitter)攻擊,相當于一種特殊的裁剪攻擊,算法也顯示很好的穩(wěn)健性。算法能抗自由裁剪的原因在于,無論是隨機抽取的樣本還是隨機剪掉的音頻部分,在概率上具有同原始音頻類似的幅值分布。也就是說,裁剪很少改變直方圖的形狀,這是算法對裁剪穩(wěn)健的原因。
表3

基于Resample模式的TSM攻擊和基于Pitch-invariant模式的TSM攻擊都可改變音頻在時間軸的長度從而造成水印的去同步。下表4列出了Danube.wav在兩種TSM模式下用-30%到+30%的伸縮幅度提取信息的誤碼率??梢钥闯?,本發(fā)明中的音頻水印技術可以抵抗將近±30%的TSM攻擊。
表4

權利要求
1.一種抗同步攻擊的音頻水印處理方法,其特征在于該方法包括水印嵌入和水印檢測兩個過程;水印嵌入過程步驟如下1)計算音頻的均值A;2)根據(jù)均值選擇一個用于嵌入水印信息的幅值區(qū)間B=[-λA,λA],λ為一個正數(shù);3)計算B的直方圖;4)通過重新分配每三個BIN中的樣本數(shù)量來嵌入一個水印比特;5)重復第4步直到水印信息全部嵌入;水印檢測過程如下1)與嵌入時相同,計算音頻的均值;2)根據(jù)均值提取直方圖;3)計算每三個BIN中的樣本數(shù)量關系來提取水印比特;4)重復第3步直到水印信息全部提取出來。
2.根據(jù)權利要求1所述的音頻水印處理方法,其特征是所述水印嵌入過程的詳細步驟如下1)計算音頻的均值A;2)根據(jù)均值選擇一個用于嵌入水印信息的幅值區(qū)間B=[-λA,λA],λ為一個正數(shù),大量的實驗表明取值一般在[1.5,2.5]之間比較好;3)根據(jù)嵌入的信息量L=L1+L2來計算B的直方圖,嵌入信息的結構由同步序列(長L1)和水印信息(長L2)組成直方圖BIN的尺寸大小相同,BIN的數(shù)量為3L;4)通過重新分配每三個BIN中的樣本數(shù)量來嵌入一個水印比特;5)重復第4步直到信息全部嵌入。
3.根據(jù)權利要求1所述的音頻水印處理方法,其特征是所述水印提取過程的詳細步驟如下1)與嵌入時相同,計算音頻的均值,由于均值在TSM攻擊后會產(chǎn)生一定的偏差,需要在這個偏差的范圍內(nèi)C利用嵌入的同步序列(長L1)來消除這種影響;2)根據(jù)均值提取直方圖;3)計算每三個BIN中的樣本數(shù)量關系來提取水印比特;4)重復步驟3)直到水印信息全部提取出來;5)比較嵌入時的同步序列和提取到的同步比特,如匹配則提取水印比特,否則根據(jù)一定的步長來改變均值,再重復本過程2)、3)、4)步;6)直到在范圍C內(nèi)搜索完畢,根據(jù)最好的匹配結果提取水印信息。
全文摘要
本發(fā)明是一種抗同步攻擊的音頻水印處理方法,屬于多媒體信息安全領域。本發(fā)明方法包括水印嵌入和水印檢測兩個過程,利用音頻在時域的直方圖形狀和均值對時域伸縮攻擊的穩(wěn)健性,實現(xiàn)了一種可抗大幅度時域伸縮攻擊、裁剪和抖動等同步攻擊的穩(wěn)健音頻水印處理方法。在水印嵌入失真不可察覺的情況下,本發(fā)明方法可抗±30%的TSM攻擊,對裁剪和抖動等常見同步攻擊也有很好的穩(wěn)健性。該發(fā)明方法解決了以往音頻水印算法中很難抵抗同步攻擊的技術難題,是一種對同步攻擊非常穩(wěn)健的音頻水印技術,可用于音頻媒體版權保護領域。
文檔編號G11B20/00GK1928991SQ20061003660
公開日2007年3月14日 申請日期2006年7月20日 優(yōu)先權日2006年7月20日
發(fā)明者項世軍, 黃繼武 申請人:中山大學
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
红安县| 乐安县| 衡南县| 融水| 重庆市| 惠东县| 开鲁县| 金溪县| 彭泽县| 巴东县| 株洲县| 资兴市| 邵阳县| 翁牛特旗| 柘城县| 浠水县| 巨鹿县| 银川市| 大田县| 西藏| 长寿区| 广元市| 仁怀市| 石林| 公主岭市| 九龙县| 博客| 马关县| 常宁市| 互助| 舟山市| 天津市| 秦皇岛市| 乌兰浩特市| 镇巴县| 融水| 象山县| 东海县| 托克托县| 偏关县| 蒙自县|