專利名稱:一種針對回聲隱寫的隱寫分析方法
技術(shù)領(lǐng)域:
本發(fā)明屬于信息隱藏檢測領(lǐng)域,特別是涉及一種針對回聲隱寫的隱寫分析 方法。
背景技術(shù):
近年來,隱寫術(shù)和數(shù)字水印技術(shù)的研究得到較大的發(fā)展。許多隱秘術(shù)和數(shù)字 水印軟件能夠從網(wǎng)上直接下載,使普通人利用這些技術(shù)實(shí)現(xiàn)"隱蔽"通訊成為 可能。這種現(xiàn)象客觀上要求隱寫分析技術(shù)的進(jìn)步,以便檢測和阻止不法信息隱 藏在看似無異動普通載體(圖像、音頻和視頻等)中傳遞。
在眾多的音頻信息隱藏方法中,回聲隱藏以其隱藏算法簡單,算法不易產(chǎn)生 噪聲,隱藏效果好,對同步的要求不高等優(yōu)點(diǎn)而被廣泛應(yīng)用。因此,對回聲信 息隱藏進(jìn)行有效、準(zhǔn)確而又可靠的檢測,對于保護(hù)信息安全、防止隱秘通信有 著十分重要的意義。
目前公開報道的回聲隱寫分析的方法很少,比較典型的有HamzaOzer等人 在2003年提出了一種基于音頻質(zhì)量和分類器的音頻隱寫分析方法。對19種音 頻質(zhì)量的指標(biāo)度量進(jìn)行了考察,按照加性噪聲模型,對待測音頻進(jìn)行了小波去 噪得到的估計(jì)的原始音頻,計(jì)算待測音頻與小波去噪后的音頻的各項(xiàng)指標(biāo)的改 變量,發(fā)現(xiàn)不含秘密數(shù)據(jù)的音頻載體與包含秘密數(shù)據(jù)的音頻隱寫體的各項(xiàng)指標(biāo) 的改變是不同的。但檢測準(zhǔn)確性直接決定了音頻數(shù)據(jù)庫中對音頻質(zhì)量指標(biāo)的訓(xùn) 練結(jié)果,使其可靠性和準(zhǔn)確性受限而且算法實(shí)現(xiàn)的計(jì)算量很大。OktayAlttm等
4人提出了基于形態(tài)學(xué)失真的隱寫分析方法,對加性高斯白噪聲進(jìn)行了檢測,并 指出了二次回聲隱寫會引起過零率的較大改變,但作者并未指出具體的分析方 法和實(shí)驗(yàn)結(jié)果。因此,如何實(shí)現(xiàn)高質(zhì)量的回聲隱寫檢測分析是本技術(shù)領(lǐng)域亟待 解決的技術(shù)問題。
發(fā)明內(nèi)容
本發(fā)明目的在于針對現(xiàn)有技術(shù)的不足,提出一種針對音頻載體的回聲隱寫 的隱寫檢測方法,能夠?qū)γ孛苄畔⑶度耄瑢?shí)現(xiàn)高質(zhì)量的檢測。
本發(fā)明的技術(shù)方案為提取隱寫樣本音頻文件和干凈樣本音頻文件的峰值 特征作為支持向量機(jī)的特征值,提取待測音頻文件的峰值特征輸入支持向量機(jī); 支持向量機(jī)根據(jù)特征值生成訓(xùn)練模型,訓(xùn)練待測音頻文件的峰值特征,判斷待 測音頻文件是否含有隱寫信息;所述提取峰值特征包括以下步驟,
短窗截取分析步驟,用于對音頻文件進(jìn)行分幀處理,得到的每個幀信號包含 樣點(diǎn)數(shù)相同;
峰值出現(xiàn)頻率分析步驟,即計(jì)算每幀信號的功率倒譜,根據(jù)功率倒譜分析 幀信號的峰值出現(xiàn)情況;
峰值特征構(gòu)造步驟,包括為音頻文件創(chuàng)建數(shù)組,數(shù)組元素與幀信號的半幀樣 點(diǎn)對應(yīng);根據(jù)音頻文件內(nèi)所有幀信號的峰值出現(xiàn)情況確定數(shù)組元素的值,所述 確定數(shù)組元素的值具體方式為,遍歷音頻文件內(nèi)所有幀信號的半幀,若其中某 幀信號內(nèi)某樣點(diǎn)相應(yīng)的功率倒譜出現(xiàn)峰值,則與該樣點(diǎn)所對應(yīng)數(shù)組元素的值加 1,否則不變;數(shù)組元素的值確定后,求取數(shù)組的中心矩作為該音頻信號的峰值 特征。而且,所述峰值特征構(gòu)造步驟中,對音頻文件的相應(yīng)數(shù)組求取2 9階共8 個中心距。
而且,所述短窗截取分析步驟中,按256個樣點(diǎn)的標(biāo)準(zhǔn)進(jìn)行分幀處理,得 到的幀信號幀長為256。
而且,每幀信號的功率倒譜根據(jù)公式^[/]^/FFr[bglFFr(^[/])l2j求取,其
中&[/]表示待測音頻文件x[q分幀處理得到的幀信號,x[^]長度為/,其中 l"", ^[/]的幀長為7V, 1"AU^"L,」。
而且所述分析幀信號的峰值出現(xiàn)情況的具體方式為,從第一個樣點(diǎn)開始向 右遍歷幀信號內(nèi)所有樣點(diǎn),若一個樣點(diǎn)的功率倒譜值比相鄰點(diǎn)大一個閥值,則
該點(diǎn)被認(rèn)為是峰值。
而且,所述閥值的取值方式為,D££7^ = 10*
廣W/2 、
'=1_
AV2
,其中l(wèi)化iV/2。
本發(fā)明提供了一種針對音頻回聲隱寫的盲的主動分析檢測方式,具有檢測的 高效性,檢測結(jié)果正確率高,虛警率和漏檢率低。本發(fā)明能夠適用于對多種類 型的音頻文件測試,性能穩(wěn)健;實(shí)施簡便,運(yùn)行復(fù)雜性低,資源開銷小。
圖l為本發(fā)明的特征值輸入示意圖; 圖2為本發(fā)明的待測音頻文件分析示意圖; 圖3為本發(fā)明實(shí)施例的峰值特征提取流程圖。
具體實(shí)施例方式
本發(fā)明提供的分析技術(shù)方案框架參見圖1和圖2:提取隱寫樣本音頻文件和干凈樣本音頻文件的峰值特征作為支持向量機(jī)的特征值,提取待測音頻文件的
峰值特征輸入支持向量機(jī);支持向量機(jī)根據(jù)特征值生成訓(xùn)練模型,訓(xùn)練待測音 頻文件的峰值特征,判斷待測音頻文件是否含有隱寫信息。支持向量機(jī)簡稱SVM, 是現(xiàn)有分類器的一種,本發(fā)明選用支持向量機(jī)進(jìn)行分類操作,而分類標(biāo)準(zhǔn)采用 音頻文件的峰值特征構(gòu)成的特征值向量。本發(fā)明注意到,如果音頻文件中含有 回聲隱寫信息,就會產(chǎn)生延遲,在峰值表現(xiàn)上會不同于干凈的音頻文件。因此 本發(fā)明提出,提取隱寫樣本音頻文件和干凈樣本音頻文件的峰值特征作為支持 向量機(jī)的特征值,隱寫樣本音頻文件和干凈樣本音頻文件的數(shù)量一般相當(dāng)。支 持向量機(jī)以峰值頻率為訓(xùn)練向量特征,即可根據(jù)待測音頻文件的峰值特征得到 待測音頻文件是否含有隱寫信息的結(jié)論。為了保證準(zhǔn)確率,隱寫樣本音頻文件 和干凈樣本音頻文件的數(shù)量都應(yīng)當(dāng)有數(shù)千個,將多個隱寫樣本音頻文件和干凈 樣本音頻文件的峰值特征輸入支持向量機(jī),就可生成訓(xùn)練模型。
無論是對隱寫樣本音頻文件和干凈樣本音頻文件,還是待測音頻文件,采 用統(tǒng)一的峰值特征提取方式,才能夠方便進(jìn)行分類判斷。參見附圖3,本發(fā)明的 關(guān)鍵在于獨(dú)特的峰值特征提取方式,包括以下步驟,
(1) 短窗截取分析步驟,用于對音頻文件進(jìn)行分幀處理,得到的每個幀信 號包含樣點(diǎn)數(shù)相同;
為了便于理解,該步驟可以用符號表示音頻文件;c[it]分幀處理得到幀信號
xp]長度為/,其中BA:S/, ^W的幀長為7V, 1S"AU^"4〃〃」。 為了避免漏檢,分幀不宜過長,本發(fā)明實(shí)施例的W取值為256,意即每個幀 信號應(yīng)當(dāng)包括256個樣點(diǎn)。
(2) 峰值出現(xiàn)頻率分析步驟,即計(jì)算每幀信號的功率倒譜,根據(jù)功率倒譜分析幀信號的峰值出現(xiàn)情況;
信號的功率倒譜£ [/] = /F,r bglFFrk[/])|
,直接根據(jù)現(xiàn)有技術(shù),首先
對&[/]進(jìn)行FFT變換,取FFT幅值的平方,然后對其求log值,最后計(jì)算IFFT 變換,并對得到的值取模再求平方,即為信號&[/]的功率倒譜。
分析幀信號的峰值出現(xiàn)情況的具體方式可以為,從第一個樣點(diǎn)開始向右遍 歷幀信號內(nèi)所有樣點(diǎn),若一個樣點(diǎn)的功率倒譜值比相鄰點(diǎn)大一個閥值,則該點(diǎn) 被認(rèn)為是峰值;或者反向從右向左同理進(jìn)行遍歷操作。
選取合適的閾值,可以快速準(zhǔn)確的尋找到峰值,本發(fā)明提供了進(jìn)一步技術(shù)
方案閥值£>五丄7^ = 10*
AV2
,其中1^、A72。這是因?yàn)镕FT具有對稱性,故
只考察前W2個樣點(diǎn)即可,即A[l:iV/2]的峰值情況。具體實(shí)施時也可考慮幀信號 內(nèi)全部樣點(diǎn),但效率比較低。
(3)包括為音頻文件創(chuàng)建數(shù)組,數(shù)組元素與幀信號的半幀樣點(diǎn)對應(yīng);根據(jù) 音頻文件內(nèi)所有幀信號的峰值出現(xiàn)情況確定數(shù)組元素的值,所述確定數(shù)組元素 的值具體方式為,遍歷音頻文件內(nèi)所有幀信號的半幀,若其中某幀信號內(nèi)某樣 點(diǎn)相應(yīng)的功率倒譜出現(xiàn)峰值,則與該樣點(diǎn)所對應(yīng)數(shù)組元素的值加l,否則不變; 數(shù)組元素值確定后,求取數(shù)組的中心矩作為該音頻信號的峰值特征。
因?yàn)檫M(jìn)行功率倒譜后的幀信號具有對稱性,創(chuàng)建數(shù)組時也只需考察半幀樣 點(diǎn),若考察全幀樣點(diǎn),則結(jié)果相同而處理過程復(fù)雜。本發(fā)明實(shí)施例創(chuàng)建數(shù)組尸, 數(shù)組元素的個數(shù)為AV2-128,若幀信號內(nèi)某樣點(diǎn)對應(yīng)功率倒譜處出現(xiàn)峰值,則 相應(yīng)數(shù)組元素的值加l,否則不變。最后求取數(shù)組尸的2 9階中心矩。這8個中心距即可表現(xiàn)該幀信號的峰值特征。具體實(shí)施時,在2 12階中心距中任意 選取多個也是可行的,也應(yīng)當(dāng)在本發(fā)明所要求的保護(hù)范圍之內(nèi)。如果確定數(shù)組 元素的值標(biāo)記采用其他方式,例如若幀信號內(nèi)某樣點(diǎn)對應(yīng)功率倒譜處出現(xiàn)峰值, 則相應(yīng)數(shù)組元素的值加2,最終仍然得到統(tǒng)計(jì)峰值頻率的效果,屬于等同替代方 案。本發(fā)明的技術(shù)方案可以采用計(jì)算機(jī)技術(shù)實(shí)現(xiàn)自動化處理,例如創(chuàng)建數(shù)組戶時,
可以通過軟件編程進(jìn)行如下操作設(shè)定P[/], ;若《,[/]是峰值,則
尸[,'卜P[/] + l;若&[/]不是峰值,P[/]不變。
權(quán)利要求
1.一種針對回聲隱寫的隱寫分析方法,其特征在于提取隱寫樣本音頻文件和干凈樣本音頻文件的峰值特征作為支持向量機(jī)的特征值,提取待測音頻文件的峰值特征輸入支持向量機(jī);支持向量機(jī)根據(jù)特征值生成訓(xùn)練模型,訓(xùn)練待測音頻文件的峰值特征,判斷待測音頻文件是否含有隱寫信息;所述提取峰值特征包括以下步驟,短窗截取分析步驟,用于對音頻文件進(jìn)行分幀處理,得到的每個幀信號包含樣點(diǎn)數(shù)相同;峰值出現(xiàn)頻率分析步驟,即計(jì)算每幀信號的功率倒譜,根據(jù)功率倒譜分析幀信號的峰值出現(xiàn)情況;峰值特征構(gòu)造步驟,包括為音頻文件創(chuàng)建數(shù)組,數(shù)組元素與幀信號的半幀樣點(diǎn)對應(yīng);根據(jù)音頻文件內(nèi)所有幀信號的峰值出現(xiàn)情況確定數(shù)組元素的值,所述確定數(shù)組元素的值具體方式為,遍歷音頻文件內(nèi)所有幀信號的半幀,若其中某幀信號內(nèi)某樣點(diǎn)相應(yīng)的功率倒譜出現(xiàn)峰值,則與該樣點(diǎn)所對應(yīng)數(shù)組元素的值加1,否則不變;數(shù)組元素的值確定后,求取數(shù)組的中心矩作為該音頻信號的峰值特征。
2. 根據(jù)權(quán)利要求l所述的隱寫分析方法,其特征在于所述峰值特征構(gòu)造步驟中,對音頻文件的相應(yīng)數(shù)組求取2 9階共8個中心距。
3. 根據(jù)權(quán)利要求1所述的隱寫分析方法,其特征在于所述短窗截取分析步驟中,按256個樣點(diǎn)的標(biāo)準(zhǔn)進(jìn)行分幀處理,得到的幀信號幀長為256。
4. 根據(jù)權(quán)利要求1或2或3所述的隱寫分析方法,其特征在于每個幀信號的功率倒譜根據(jù)公式£ [/] = {/^^[^|7^7^ "')|2]}求取,其中&[/]表示音頻文件4M分幀處理得到的幀信號,^W長度為/,其中b"/, U。的幀長為jv,
5. 根據(jù)權(quán)利要求4所述的隱寫分析方法,其特征在于所述分析幀信號的峰值 出現(xiàn)情況的具體方式為,從第一個樣點(diǎn)開始向右遍歷幀信號內(nèi)所有樣點(diǎn),若一 個樣點(diǎn)的功率倒譜值比相鄰點(diǎn)大一個閥值,則該點(diǎn)被認(rèn)為是峰值。
6. 根據(jù)權(quán)利要求5所述的隱寫分析方法,其特征在于所述閥值的取值方式為,
全文摘要
本發(fā)明提供一種針對回聲隱寫的隱寫分析方法提取隱寫樣本音頻文件和干凈樣本音頻文件的峰值特征作為支持向量機(jī)的特征值,提取待測音頻文件的峰值特征輸入支持向量機(jī);支持向量機(jī)根據(jù)特征值生成訓(xùn)練模型,訓(xùn)練待測音頻文件的峰值特征,判斷待測音頻文件是否含有隱寫信息;所述提取峰值特征包括短窗截取分析步驟,峰值出現(xiàn)頻率分析步驟,峰值特征構(gòu)造步驟。這種技術(shù)方案具有高效性,檢測結(jié)果正確率高,虛警率和漏檢率低;并且能夠適用于對多種類型的音頻文件測試,性能穩(wěn)健;實(shí)施簡便,運(yùn)行復(fù)雜性低,資源開銷小。
文檔編號G10L19/00GK101676992SQ20081019698
公開日2010年3月24日 申請日期2008年9月17日 優(yōu)先權(quán)日2008年9月17日
發(fā)明者偉 曾, 胡瑞敏, 艾浩軍, 尚 高 申請人:武漢大學(xué)