欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

計(jì)算機(jī)實(shí)現(xiàn)的音頻數(shù)據(jù)隱藏的方法和裝置的制作方法

文檔序號(hào):2829612閱讀:354來(lái)源:國(guó)知局
專利名稱:計(jì)算機(jī)實(shí)現(xiàn)的音頻數(shù)據(jù)隱藏的方法和裝置的制作方法
技術(shù)領(lǐng)域
本發(fā)明一般涉及計(jì)算機(jī)實(shí)現(xiàn)的數(shù)據(jù)隱藏。更具體地說(shuō),本發(fā)明涉及計(jì)算機(jī)實(shí)現(xiàn)的音頻數(shù)據(jù)隱藏。
電子媒體發(fā)行對(duì)內(nèi)容保護(hù)機(jī)制提出了高要求,以保證媒體發(fā)行的安全。主要由于因特網(wǎng)上極為突出的電子媒體發(fā)行,用于數(shù)字媒體的復(fù)制控制及版權(quán)保護(hù)的不易察覺(jué)的數(shù)據(jù)隱藏正逐步受到廣泛重視。
尤其是,數(shù)字?jǐn)?shù)據(jù)能夠通過(guò)因特網(wǎng)方便地傳輸,以及能夠制作和發(fā)行原始數(shù)據(jù)的無(wú)條件完整拷貝的事實(shí),主要引起了對(duì)知識(shí)產(chǎn)權(quán)管理的憂慮。需要著手進(jìn)行版權(quán)保護(hù)和重放/記錄控制,使得產(chǎn)權(quán)人同意數(shù)字媒體的電子發(fā)行。諸如DVD-RAM,CD-R,CD-RW,DTV的數(shù)字拷貝技術(shù)、以及高質(zhì)量壓縮和數(shù)字多媒體信號(hào)處理軟件的廣泛應(yīng)用,增加了知識(shí)產(chǎn)權(quán)方面的問(wèn)題。例如,使用MP3壓縮(MPEG-I第3層音頻編碼標(biāo)準(zhǔn))使得用戶能夠通過(guò)因特網(wǎng)上未經(jīng)許可的web網(wǎng)站下載CD(compact disc)質(zhì)量的音樂(lè)。
音頻媒體中數(shù)據(jù)隱藏的以往方法集中于將隱藏?cái)?shù)據(jù)嵌入基域(原始時(shí)域)。這些方法導(dǎo)致對(duì)音頻信號(hào)同步結(jié)構(gòu)的攻擊和失真。這種攻擊和失真(例如,時(shí)標(biāo)偏差和聲調(diào)移動(dòng)偏差的攻擊)能夠根本上改變時(shí)域中音頻信號(hào)的結(jié)構(gòu),但對(duì)聲音質(zhì)量幾乎沒(méi)有影響。因此,它們通常被視為音頻數(shù)據(jù)隱藏中最具有挑戰(zhàn)性的問(wèn)題。
本發(fā)明目的在于克服前述不足。本發(fā)明將隱藏?cái)?shù)據(jù)嵌入變換域,優(yōu)先地,嵌入對(duì)數(shù)倒頻譜或線性預(yù)測(cè)剩余域。本發(fā)明的要義是,提供將隱藏?cái)?shù)據(jù)嵌入音頻信號(hào)的計(jì)算機(jī)實(shí)現(xiàn)的方法和裝置。在基域接收音頻信號(hào)。所接收的音頻信號(hào)被變換到非基域。在變換的非基域音頻信號(hào)中嵌入隱藏?cái)?shù)據(jù)。對(duì)于嚴(yán)格同步的破壞性攻擊,變換域表示法可以顯示出比基域表示法更為強(qiáng)健。例如,音頻信號(hào)重要的知覺(jué)特征,諸如聲調(diào)或聲道,能夠在某變換域中被適當(dāng)?shù)貐?shù)化。通常的信號(hào)處理攻擊很少修正這些特征,除非根據(jù)透明要求對(duì)性能惡化,即話音聽(tīng)覺(jué)質(zhì)量顯著下降,進(jìn)行補(bǔ)償。
在變換域中,本發(fā)明采用統(tǒng)計(jì)平均值控制嵌入方案。此方案基于選擇的變換系數(shù)的統(tǒng)計(jì)平均值在大多數(shù)常用信號(hào)處理后通常發(fā)生小擾動(dòng)。通過(guò)控制統(tǒng)計(jì)平均值,將以二值格式隱藏的數(shù)據(jù)一幀一幀的嵌入話音。對(duì)正平均(比某預(yù)設(shè)閾值大)強(qiáng)制進(jìn)位“1”位。引入的失真由心理聲學(xué)模型控制以滿足透明要求。此外,通過(guò)使用由產(chǎn)權(quán)人持有作為安全密鑰的加密濾波器對(duì)變換系數(shù)施用加密技術(shù),此方案的安全等級(jí)能夠進(jìn)一步提高。使用這些新技術(shù),本發(fā)明在滿足透明(指嵌入數(shù)據(jù)不會(huì)引入任何顯著可聽(tīng)見(jiàn)的失真)要求的條件下使嵌入數(shù)據(jù)存留得最久。
連同附圖一起所作的后續(xù)描述以及所附權(quán)利要求將使附加的優(yōu)點(diǎn)和特征更為明確,附圖中相同參考數(shù)字代表相同部件。


圖1為描述音頻數(shù)據(jù)隱藏系統(tǒng)的方框圖;圖2a-2c描述的曲線圖說(shuō)明了使用本發(fā)明的線性預(yù)測(cè)剩余域技術(shù)處理音頻信號(hào);圖3是說(shuō)明利用對(duì)數(shù)倒頻譜域處理音頻數(shù)據(jù)信號(hào)的方框流程圖;圖4a-4d是描述某段聲音信號(hào)的對(duì)數(shù)倒頻譜表示的x-y曲線圖;圖5是描述例示的二值調(diào)制的曲線圖;圖6a-4b是描述使用本發(fā)明的線性預(yù)測(cè)剩余域技術(shù)進(jìn)行嵌入處理的x-y曲線圖;圖7a-7b是描述使用本發(fā)明的對(duì)數(shù)倒頻譜域技術(shù)進(jìn)行嵌入處理的x-y曲線圖;以及圖8是用作本發(fā)明中加密技術(shù)的、包含一個(gè)示明N個(gè)極點(diǎn)隨機(jī)分布于其上的單位圓的曲線圖。
用于隱藏音頻信號(hào)中次要數(shù)據(jù)的本發(fā)明系統(tǒng)示于圖1。音頻信號(hào)x(n)20通過(guò)輸入裝置在時(shí)域被接收,并通過(guò)變換處理28映射為變換域中一個(gè)等價(jià)表示X(n)24。變換處理28產(chǎn)生描述信號(hào)X(n)特性的變換域系數(shù)29。數(shù)據(jù)嵌入器模塊32在變換域中將隱藏?cái)?shù)據(jù)36(諸如識(shí)別數(shù)據(jù))嵌入信號(hào)X(n)24以產(chǎn)生Y(n)信號(hào)40。優(yōu)選地,數(shù)據(jù)嵌入器32利用系數(shù)控制器模塊41控制變換域系數(shù),以嵌入數(shù)據(jù)。
通過(guò)逆變換處理44Y(n)信號(hào)40被映射回時(shí)域,以恢復(fù)標(biāo)記的音頻信號(hào)y(n)48。使用變換域中的心理聲學(xué)模型52以控制嵌入數(shù)據(jù)具有不被聽(tīng)見(jiàn)性,以使y(n)信號(hào)48在感覺(jué)上與x(n)信號(hào)20無(wú)顯著區(qū)別。經(jīng)過(guò)由塊60表示的可能的攻擊后,播放信號(hào)z(n)64以致能聽(tīng)見(jiàn)音頻信號(hào)。通過(guò)全球通信網(wǎng)(如因特網(wǎng))傳輸?shù)男盘?hào)z(n)64可以在一臺(tái)遠(yuǎn)處計(jì)算機(jī)上聽(tīng)見(jiàn)。為了取出信號(hào)z(n)64中的隱藏?cái)?shù)據(jù),將信號(hào)z(n)64通過(guò)變換塊68映射為要通過(guò)處理76進(jìn)行數(shù)據(jù)提取的變換域信號(hào)Z(n)71。為了從信號(hào)Z(n)71中產(chǎn)生提取數(shù)據(jù),提取處理76本質(zhì)上與塊32的嵌入處理相反。
尤其是,本發(fā)明采用一種在變換域使用的音頻定期隱藏的新方法。變換域系數(shù)(通過(guò)非基本變換域產(chǎn)生的,并且在對(duì)數(shù)倒頻譜域例示描述的特征)對(duì)于各種不同的攻擊更為有效。例如,攻擊會(huì)顯著改變時(shí)域中音頻同步結(jié)構(gòu),但是其變換域表示受到的擾動(dòng)少得多。因此,對(duì)于音頻數(shù)據(jù)隱藏方案,本發(fā)明包括但不限于以下組成部分參數(shù)表示,數(shù)據(jù)嵌入策略,以及心理聲學(xué)模型。
變換域在優(yōu)選實(shí)施例中,變換處理28和68均使用一個(gè)非基本域變換處理100。某變換域表示能夠提供一種等價(jià)的、但常常更標(biāo)準(zhǔn)的音頻信號(hào)表示。例如,音頻信號(hào)的對(duì)數(shù)倒頻分析從激勵(lì)信息中清楚地分離出聲道信息,并且頻域表示準(zhǔn)確包含了不同頻率處具有物理意義的相同的音頻信息。表示方法的選擇取決于特定的應(yīng)用和問(wèn)題的組成。在數(shù)據(jù)隱藏方案中,本發(fā)明目標(biāo)在于具有盡可能多的“攻擊不變式”的變換域,即經(jīng)過(guò)常用的信號(hào)處理或甚至蓄意的攻擊后,變換域表示比原始時(shí)域表示產(chǎn)生的變化小得多。本發(fā)明的優(yōu)選實(shí)施例產(chǎn)生的變換域系數(shù)能夠被分為兩種情況線性預(yù)測(cè)剩余域處理104和對(duì)數(shù)倒頻譜域處理108。
LP剩余域線性預(yù)測(cè)分析104將信號(hào)x(n)20表示為兩部分線性卷積全作用(AR)濾波器a(n)和剩余序列e(n)。AR濾波器a(n)幾乎包含了x(n)包絡(luò)的全部信息,并且剩余e(n)包括其精細(xì)結(jié)構(gòu)的信息。圖2a-2c示出對(duì)于某段話音信號(hào)所作的一個(gè)具有示范階數(shù)N=50的線性預(yù)測(cè)分析的實(shí)例。圖2a描繪了原始音頻信號(hào)X(n)20的示例曲線圖。圖2b描繪了應(yīng)用AR濾波器a(n)后圖2a的原始音頻信號(hào)X(n)20的示例曲線圖。結(jié)果信號(hào)由參考數(shù)120示出。圖2c是描述圖2a原始音頻信號(hào)X(n)20的剩余信號(hào)e(n)124的曲線圖。甚至在攻擊信號(hào)x(n)后,信號(hào)a(n)和e(n)在保持x(n)的音頻質(zhì)量期間幾乎不受影響。因此,本發(fā)明能夠?qū)(n)和e(n)用于數(shù)據(jù)隱藏域。
在優(yōu)選實(shí)施例中,選擇剩余域而不是a(n)是出于以下理由1)e(n)與原始信號(hào)x(n)具有相同的維數(shù),而a(n)通常與預(yù)測(cè)階數(shù)具有相同的維數(shù)。較大維數(shù)更適于數(shù)據(jù)隱藏目的;2)從感官上a(n)更為重要,并且它允許的擾動(dòng)比e(n)少得多。因而,LP合成和LP分析均依賴于a(n)。隨著a(n)被變形,變換不再是線性的,并且通常難以用解碼器恢復(fù)a(n)。
對(duì)數(shù)倒頻譜域?qū)?shù)倒頻譜分析將聲道信息從激勵(lì)信息中分離,并且分離出包括物理聲譜特征的頻率分量。各由三個(gè)線性運(yùn)算組成的對(duì)數(shù)倒頻譜域變換108和其逆處理204在圖3中示出。對(duì)數(shù)倒頻譜域變換108的線性運(yùn)算包括對(duì)信號(hào)x(n)20的一個(gè)快速付里葉變換(FFT),一個(gè)對(duì)數(shù)運(yùn)算,隨后一個(gè)快速付里葉逆變換。對(duì)數(shù)倒頻譜域變換108的結(jié)果為對(duì)數(shù)倒頻譜域中的信號(hào)X(n)24。逆對(duì)數(shù)倒頻譜變換204的線性運(yùn)算為信號(hào)X(n)24的一個(gè)快速付里葉變換,一個(gè)指數(shù)運(yùn)算,以及一個(gè)快速付里葉逆變換。逆對(duì)數(shù)倒頻譜變換204的結(jié)果為時(shí)域中的x′(n)。優(yōu)選地,本發(fā)明使用復(fù)對(duì)數(shù)倒頻譜的實(shí)部。
對(duì)數(shù)倒頻譜分析的一個(gè)特征是,對(duì)數(shù)將頻域中的乘積(時(shí)域中的卷積)變?yōu)閷?duì)數(shù)頻率域的和。因此,它將一個(gè)線性化結(jié)構(gòu)施加于此系統(tǒng)。圖4a-4d示出了對(duì)于某段話音信號(hào)的對(duì)數(shù)倒頻譜表示法。更具體地,圖4a-4d描述所記錄的復(fù)對(duì)數(shù)倒頻譜X(n)的實(shí)部。值得注意的是,在中心附近的大的對(duì)數(shù)倒頻譜系數(shù)包含x(n)包絡(luò)的重要信息;而在兩邊的小的對(duì)數(shù)倒頻譜系數(shù)包含精細(xì)結(jié)構(gòu)。由圖4c和4d可以看出,在時(shí)域中經(jīng)過(guò)嚴(yán)重的攻擊后它們大部分受到小的擾動(dòng)(即1%的抖動(dòng))。
數(shù)據(jù)嵌入方案結(jié)合變換域處理及本發(fā)明的其它特征方面,本發(fā)明采用了一種新穎的數(shù)據(jù)嵌入方法。本發(fā)明利用變換域系數(shù)以嵌入數(shù)據(jù)。通過(guò)利用選定特征的統(tǒng)計(jì)平均值控制嵌入位,實(shí)現(xiàn)優(yōu)選的嵌入。例如,在對(duì)數(shù)倒頻譜域嵌入中,通過(guò)強(qiáng)制正平均值,嵌入“1”,并且如果嵌入“0”則零平均值保持不變。
注意到,選定特征常常遵守其平均值為或幾乎為零的單一形式的分布。如果平均值mI不精確為零,一個(gè)II=II-mI處理將除去偏離的平均值而不影響音頻質(zhì)量。
統(tǒng)計(jì)平均值處理技術(shù)能被視為一種基于所選定特征的統(tǒng)計(jì)平均值的調(diào)制方法。如上所述,這種平均值通常無(wú)需調(diào)制即位于零附近。因此,通過(guò)將統(tǒng)計(jì)平均值取為某預(yù)設(shè)值,特別的信息被載入解碼器。(注意盡管為了數(shù)據(jù)隱藏目的,此值必須足夠小以使調(diào)制后不會(huì)出現(xiàn)可聽(tīng)出的人為效果。)例如,本發(fā)明的二值調(diào)制方案使用如下H1使E{XI}=TH0使E{XI}=-T其中E{XI}代表XI的期待值,并且T>0為某預(yù)設(shè)值。
在解碼器,通過(guò)計(jì)算XI的統(tǒng)計(jì)平均值,嵌入的數(shù)據(jù)值“0”或“1”被解碼。為了得到更高的精度,常常需要將圖5中的區(qū)域T和-T盡可能地分開(kāi),即保持盡可能少的重疊區(qū)域。也可以采用其它調(diào)制方案。例如,在傳統(tǒng)的擴(kuò)頻方案中,調(diào)制是通過(guò)將一個(gè)作為識(shí)別標(biāo)志的偽隨機(jī)序列插入主信號(hào)而實(shí)現(xiàn)的,并且識(shí)別標(biāo)志攜帶了一位信息。與傳統(tǒng)的基于擴(kuò)頻相關(guān)檢測(cè)方案相比,本發(fā)明具有對(duì)在攻擊中引入的失真的統(tǒng)計(jì)行為的不太嚴(yán)格的假設(shè)。它假設(shè)引入的失真具有零平均值,而基于相關(guān)的方法常常要求在識(shí)別標(biāo)志和主信號(hào)間進(jìn)行校正,這在實(shí)際上并不總是可行的。在涉及時(shí)標(biāo)偏差和聲調(diào)移動(dòng)偏差的寬域攻擊方面,本發(fā)明的實(shí)驗(yàn)結(jié)果表現(xiàn)得極為強(qiáng)健。
以下各節(jié)詳細(xì)討論本發(fā)明在LP剩余域和對(duì)數(shù)倒頻譜域這兩個(gè)變換域的嵌入。
LP(線性預(yù)測(cè))剩余域中的嵌入信號(hào)e(n)用于表示經(jīng)LP分析后的剩余信號(hào)。參考圖6a和6b,當(dāng)預(yù)計(jì)階數(shù)足夠大時(shí),e(n)非常接近于白噪聲,因此常常能夠以零平均值單形態(tài)概率函數(shù)模擬。為了在e(n)中嵌入一位(一個(gè)bit),對(duì)e(n)進(jìn)行如下操作為嵌入“1”:e’(n)=e(n)+th,如果e(n)≤0;為嵌入“0“:e’(n)=e(n)-th,如果e(n)≤0;其中th是正數(shù),用于控制心理聲學(xué)分析決定的引入失真的量值。一遍操作不能保證解碼器產(chǎn)生的剩余數(shù)與解碼器中的數(shù)遵從同樣的分布。因此,優(yōu)選地采用重復(fù)操作以保證其收斂。通常重復(fù)K=3足夠得到收斂結(jié)果。
完成上述操作后,e(n)的統(tǒng)計(jì)平均值可能偏離其原始值,并且其符號(hào)代表嵌入位。圖6a和6b示出了上述操作對(duì)e(n)統(tǒng)計(jì)平均值的直方圖的影響。圖6a的原始單形態(tài)分布250被分開(kāi)為圖7b的一個(gè)雙形態(tài)分布254一個(gè)其中心位于左半平面的峰258,以及一個(gè)其中心位于右半平面的峰262。因此,通過(guò)選擇閾值為零,可以確定哪一位已被嵌入解碼器。
對(duì)數(shù)倒頻譜域的嵌入在本發(fā)明的對(duì)數(shù)倒頻譜域變換實(shí)施例中,偏離中心(|i-N/2|>d)的對(duì)數(shù)倒頻譜系數(shù)的統(tǒng)計(jì)平均值能夠由零平均值單形態(tài)概率函數(shù)模擬。同樣地,使用其平均值以隱藏附加信息。可是,由實(shí)驗(yàn)發(fā)現(xiàn)對(duì)數(shù)倒頻譜表示法具有不對(duì)稱特性完成某種信號(hào)處理后,負(fù)平均值常常得到比正平均值大得多的差別,即正平均值比負(fù)平均值強(qiáng)健得多。因此,優(yōu)選地對(duì)以上平均值操作進(jìn)行如下補(bǔ)充為嵌入“1”:e’(n)=e(n)+th,如果e(n)...0;為嵌入“0”:e’(n)=e(n)其中th又是正數(shù),它由心理聲學(xué)模型控制。本發(fā)明優(yōu)先避免使用負(fù)平均值,并且使用正平均值以表示符號(hào)的存在。數(shù)據(jù)隱藏前的統(tǒng)計(jì)平均值直方圖示于圖7a,并且圖7b示出了數(shù)據(jù)隱藏后的直方圖。同樣地,試驗(yàn)統(tǒng)計(jì)學(xué)的雙形態(tài)分布能夠正確檢測(cè)嵌入位。應(yīng)該認(rèn)為本發(fā)明不局限于只處理統(tǒng)計(jì)平均值,而是包括處理其它統(tǒng)計(jì)測(cè)量值(例如標(biāo)準(zhǔn)偏差)。
加密方案有意的攻擊者也許能夠使用類似的平均值操作方案消除或修改嵌入數(shù)據(jù)。為了對(duì)付此種情況,使用加密技術(shù)能夠提高其安全性。加密濾波器由產(chǎn)權(quán)人選擇并保密。參照?qǐng)D8,長(zhǎng)度為N的加密濾波器f(n)是具有隨機(jī)分布于單位圓上的N個(gè)極點(diǎn)的全通濾波器。加密/解密操作被定義為y=ifft(fft(x).*f)x=ifft(fft(y).*conj(f))加密解密由于控制加密濾波器的“密鑰”遠(yuǎn)離攻擊者,因此難以攻擊上述系統(tǒng)。同時(shí),測(cè)試結(jié)果表明,對(duì)于LP剩余域方法,加密還顯示了生成更良好聲音質(zhì)量的優(yōu)點(diǎn)。
心理聲學(xué)模型引入的失真直接由定標(biāo)因子控制。為保持嵌入的識(shí)別標(biāo)志不被聽(tīng)見(jiàn),由心理聲學(xué)模型控制偏移因子th。頻率域中的心理聲學(xué)模型先前已得到研究并已提出。例如,在MPEG音頻譯碼中指定了一種普遍接受的子頻帶域的優(yōu)良模型。在LP剩余域或?qū)?shù)倒頻譜域中,仍然缺乏系統(tǒng)的心理聲學(xué)模型來(lái)控制引入失真的不被聽(tīng)見(jiàn)。解決此問(wèn)題的一個(gè)途徑是,在頻率域或通過(guò)使用頻率域模型對(duì)閾值進(jìn)行控制。本發(fā)明中采用LP剩余域和對(duì)數(shù)倒頻譜域中的直觀模型。它們根據(jù)生成閾值表的主觀聽(tīng)力測(cè)試構(gòu)成。
如上所述,引入的失真由選定特征所被偏移的正數(shù)值th進(jìn)行控制。該數(shù)選擇得越大,此方案越優(yōu)異,但引入的噪聲越可能是可聽(tīng)見(jiàn)的。為了保證標(biāo)記的音頻從聽(tīng)覺(jué)上與原音無(wú)區(qū)別,本發(fā)明采用一種心理聲學(xué)模型,即由調(diào)節(jié)th的主觀聽(tīng)力測(cè)試生成的上述閾值表。對(duì)于各幀音頻抽樣,根據(jù)閾值表中設(shè)立的值調(diào)整th。根據(jù)對(duì)不同類型的音頻信號(hào)的測(cè)試結(jié)果,采用以下特定模型1)LP剩余域當(dāng)涉及加密和迭代時(shí),將th選擇為th=max(const,var(e))其中常數(shù)取值范圍為0.5~1e-4,并且項(xiàng)“e”代表LP剩余信號(hào),它使用“var”表示標(biāo)準(zhǔn)偏差函數(shù)。噪聲音樂(lè)如搖滾樂(lè)的常數(shù)值普遍比輕柔音樂(lè)的大。
2)對(duì)數(shù)倒頻譜域與音頻信號(hào)的不同符號(hào)對(duì)應(yīng)的對(duì)數(shù)倒頻譜系數(shù)具有不同的允許失真。中心附近(大系數(shù))的這些系數(shù)普遍比遠(yuǎn)離中心的系數(shù)能承受更大的失真th=1~2e-3用于小的對(duì)數(shù)倒頻譜系數(shù);1~2e-2用于大的系數(shù)。
當(dāng)然,上述選擇僅僅是對(duì)于以上無(wú)限制示例的示范。以上示例描述了20~40bps容量范圍的音頻數(shù)據(jù)隱藏(音頻以44,100Hz采樣并且以16bits數(shù)字化)。如果較低的嵌入容量是足夠的,那么本發(fā)明在透明度和容量間取得了較好均衡。
試驗(yàn)結(jié)果1.透明度測(cè)試定量測(cè)量音頻信號(hào)的聽(tīng)覺(jué)質(zhì)量常常是困難的。可是,由信噪比(SNR)衡量的測(cè)試信號(hào)與原信號(hào)之間的差別能夠部分地表明引入失真的能量。下表所示為數(shù)據(jù)隱藏方案與流行的MP3壓縮技術(shù)的信噪比的比較。
具體地,此表將標(biāo)記音頻的信噪比與不同比特率的解碼音頻的信噪比進(jìn)行比較。包括搖滾樂(lè)及經(jīng)典柔和音樂(lè)的小測(cè)試臺(tái),對(duì)于所述系統(tǒng)給出了至少21.9dB的信噪比。普遍認(rèn)為,以64kbps壓縮的MP3具有透明的音質(zhì)。盡管本數(shù)據(jù)隱藏測(cè)方案的信噪比值比以64kbps壓縮的MP3的信噪比大約低4~5dB,家庭、辦公室、以及實(shí)驗(yàn)室環(huán)境中的主觀聽(tīng)力測(cè)試表明,在聽(tīng)覺(jué)上標(biāo)記的話音與原音無(wú)差別。
2.容量本發(fā)明具有足夠的嵌入容量以滿足多數(shù)實(shí)際應(yīng)用的需要。本發(fā)明的數(shù)據(jù)隱藏容量達(dá)到40bps。考慮普通歌曲的間隔大約為2~4分鐘,本發(fā)明能具有高達(dá)1,200bytes的容量,它足夠用于嵌入一個(gè)Java小應(yīng)用程序。因此,本發(fā)明具有很多的應(yīng)用,以致它能用于(但不限于)重放和錄音控制、以及要求嵌入現(xiàn)用數(shù)據(jù)的任何應(yīng)用中。
3.耐久性本發(fā)明通過(guò)將音頻信號(hào)的常規(guī)攻擊分為兩類,提出了提取階段的同步化問(wèn)題。類型-Ⅰ攻擊包括MPEG-Ⅰ編碼/解碼、低通/帶通濾波、相加/相乘噪聲、迭加回聲以及重新抽樣/重新量化。這類攻擊通常不顯著改變?cè)捯舻耐浇Y(jié)構(gòu),而僅僅由某些隨機(jī)抽樣數(shù)全局移動(dòng)整個(gè)序列。類型-Ⅱ攻擊包括抖動(dòng)、時(shí)標(biāo)變形、聲調(diào)移動(dòng)變形以及上抽樣/下抽樣。此類攻擊通常破壞話音的同步結(jié)構(gòu)。采用本發(fā)明的初步實(shí)驗(yàn)結(jié)果表明,嵌入數(shù)據(jù)顯示出超過(guò)上述兩類攻擊的高耐久性。例如,它能耐久64kbps MP3壓縮、8kHz低通濾波器、音量達(dá)40%并且延遲0.1s的回聲迭加,5%的抖動(dòng)、以及因子為0.8的時(shí)標(biāo)偏差。
顯然,如上描述的本發(fā)明可以具有許多變化形式。這些改變并沒(méi)有背離本發(fā)明的實(shí)質(zhì)和范圍,并且所有本領(lǐng)域中的技術(shù)改良形式顯然均屬于以下權(quán)利要求的范圍。
權(quán)利要求
1.一種計(jì)算機(jī)實(shí)現(xiàn)的、用于在音頻信號(hào)中嵌入隱藏?cái)?shù)據(jù)的方法包括步驟接收基域中的音頻信號(hào);將所接收的音頻信號(hào)變換到非基域;并且由音頻信號(hào)的參數(shù)表示法將隱藏?cái)?shù)據(jù)嵌入變換的非基域中。
2.根據(jù)權(quán)利要求1的方法進(jìn)一步包括步驟將所接收的音頻信號(hào)變換到非基域,以便生成由變換的非基域音頻信號(hào)表示的變換域系數(shù)。
3.根據(jù)權(quán)利要求1的方法進(jìn)一步包括步驟將所接收的音頻信號(hào)變換到非基域,以便生成由變換的非基域音頻信號(hào)表示的變換域系數(shù);并且對(duì)變換域系數(shù)的選定子集的統(tǒng)計(jì)測(cè)量進(jìn)行控制,以嵌入隱藏?cái)?shù)據(jù)。
4.根據(jù)權(quán)利要求3的方法進(jìn)一步包括步驟由變換的非基域音頻信號(hào)的至少一個(gè)預(yù)定統(tǒng)計(jì)特征調(diào)制嵌入數(shù)據(jù)。
5.根據(jù)權(quán)利要求3的方法進(jìn)一步包括步驟增加變換的非基域音頻信號(hào)的至少一個(gè)預(yù)定特征的幅值,使得預(yù)定特征的統(tǒng)計(jì)平均值為正以在音頻信號(hào)中嵌入一位“1”。
6.根據(jù)權(quán)利要求1的方法進(jìn)一步包括步驟將所接收的音頻信號(hào)變換到線性預(yù)測(cè)剩余域;并且將隱藏?cái)?shù)據(jù)嵌入線性預(yù)測(cè)剩余域。
7.根據(jù)權(quán)利要求1的方法進(jìn)一步包括步驟將所接收的音頻信號(hào)變換到對(duì)數(shù)倒頻譜域;并且將隱藏?cái)?shù)據(jù)嵌入對(duì)數(shù)倒頻譜域。
8.根據(jù)權(quán)利要求1的方法進(jìn)一步包括步驟使用偽聲學(xué)模型控制嵌入數(shù)據(jù)不被聽(tīng)見(jiàn)。
9.根據(jù)權(quán)利要求1的方法進(jìn)一步包括步驟將所接收的音頻信號(hào)變換到非基域,其中非基域從由線性預(yù)測(cè)剩余域和對(duì)數(shù)倒頻譜域構(gòu)成的群中選??;使用變換的非基域音頻信號(hào)中的嵌入隱藏?cái)?shù)據(jù)生成一個(gè)逆變換信號(hào);接收對(duì)生成的逆變換信號(hào)的攻擊;將被攻擊的逆變換信號(hào)變換到非基域,以生成一個(gè)非基域中的第二變換音頻信號(hào);以及從非基域的第二變換音頻信號(hào)中提取嵌入的隱藏?cái)?shù)據(jù)。
10.根據(jù)權(quán)利要求1的方法進(jìn)一步包括步驟將所接收的音頻信號(hào)變換到對(duì)數(shù)倒頻譜域;將隱藏?cái)?shù)據(jù)嵌入對(duì)數(shù)倒頻譜域;以及強(qiáng)制正平均值嵌入一個(gè)“1”,并且保持零平均值不動(dòng)以在對(duì)數(shù)倒頻譜域中嵌入一個(gè)“0”。
11.一種計(jì)算機(jī)實(shí)現(xiàn)的將隱藏?cái)?shù)據(jù)嵌入音頻信號(hào)的裝置,包括步驟一個(gè)用于接收基域中的音頻信號(hào)的數(shù)據(jù)輸入裝置;一個(gè)連接于數(shù)據(jù)輸入裝置、用于將所接收的音頻信號(hào)變換到非基域的信號(hào)變換器;一個(gè)連接于信號(hào)變換器、用于將隱藏?cái)?shù)據(jù)嵌入已變換的音頻信號(hào)非基域的嵌入器。
12.根據(jù)權(quán)利要求11的裝置,其特征在于,信號(hào)變換器將所接收的音頻信號(hào)變換到非基域,以致生成表示已變換的非基域音頻信號(hào)的變換域系數(shù),所述嵌入器為了嵌入隱藏?cái)?shù)據(jù)對(duì)變換域系數(shù)的選定子集的統(tǒng)計(jì)測(cè)量進(jìn)行控制。
13.根據(jù)權(quán)利要求11的裝置,其特征在于,信號(hào)變換器將所接收的音頻信號(hào)變換到線性預(yù)測(cè)剩余域,所述嵌入器將隱藏?cái)?shù)據(jù)嵌入線性預(yù)測(cè)剩余域。
14.根據(jù)權(quán)利要求11的裝置,其特征在于,變換器將所接收的音頻信號(hào)變換到對(duì)數(shù)倒頻譜域,所述嵌入器將隱藏?cái)?shù)據(jù)嵌入對(duì)數(shù)倒頻譜域。
15.根據(jù)權(quán)利要求11的裝置進(jìn)一步包括一個(gè)用以控制所嵌入的數(shù)據(jù)不被聽(tīng)見(jiàn)的偽聲學(xué)模型。
16.根據(jù)權(quán)利要求11的裝置,其特征在于,變換器將所接收的音頻信號(hào)變換到對(duì)數(shù)倒頻譜域,通過(guò)強(qiáng)制正平均值嵌入“1”以及保持零平均值不動(dòng)以在對(duì)數(shù)倒頻譜域中嵌入一個(gè)“0”,所述嵌入器將隱藏?cái)?shù)據(jù)嵌入對(duì)數(shù)倒頻譜域。
全文摘要
一種計(jì)算機(jī)實(shí)現(xiàn)的將隱藏?cái)?shù)據(jù)嵌入音頻信號(hào)的方法和裝置。在基域接收一個(gè)音頻信號(hào),隨后將其變換到諸如對(duì)數(shù)倒頻譜域或線性預(yù)測(cè)剩余域的非基域。對(duì)所選定的變換系數(shù)進(jìn)行統(tǒng)計(jì)平均值操作,以嵌入隱藏?cái)?shù)據(jù)。引入的失真由心理聲學(xué)模型控制以保證所嵌入的隱藏?cái)?shù)據(jù)不被察覺(jué)。插入加密技術(shù)能夠進(jìn)一步提高數(shù)據(jù)隱藏系統(tǒng)的安全性。對(duì)于廣域的常規(guī)信號(hào)處理攻擊,本新穎的音頻數(shù)據(jù)隱藏方案提供透明的音質(zhì)、足夠的嵌入容量、以及高耐久性。
文檔編號(hào)G10L11/00GK1311581SQ0110325
公開(kāi)日2001年9月5日 申請(qǐng)日期2001年2月8日 優(yōu)先權(quán)日2000年2月10日
發(fā)明者洪·H·于(音譯), 李欣(音譯) 申請(qǐng)人:松下電器產(chǎn)業(yè)株式會(huì)社
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
水城县| 若尔盖县| 抚宁县| 临湘市| 隆化县| 应城市| 石嘴山市| 巨鹿县| 二连浩特市| 固原市| 山东省| 宁远县| 云浮市| 八宿县| 翁源县| 侯马市| 西华县| 乌审旗| 雷波县| 肇东市| 永春县| 鹤峰县| 错那县| 格尔木市| 铜陵市| 南城县| 朔州市| 恭城| 西安市| 蒲江县| 云梦县| 黔江区| 全州县| 武邑县| 彭阳县| 梁河县| 比如县| 金乡县| 汝南县| 松滋市| 西城区|