專利名稱:音頻電信系統(tǒng)和方法
技術(shù)領(lǐng)域:
本發(fā)明涉及音頻加水印i殳備和方法。
背景技術(shù):
目。該標(biāo)準(zhǔn)涵蓋數(shù)字電影的許多方面,包括實(shí)現(xiàn)保密措施以便阻止對(duì) 電影內(nèi)容的未經(jīng)授權(quán)復(fù)制、編輯和回放。
DCI中使用的保密性要求之一是在放映期間在內(nèi)容的音頻數(shù)據(jù) 中插入水印。音頻水印包括時(shí)戳和其它數(shù)據(jù),例如指明在其上復(fù)制電 影內(nèi)容的系統(tǒng)的標(biāo)識(shí)的信息。同樣,插入視頻數(shù)據(jù)的視覺上顯而易見
的水印是不合需要的,可聽到的音頻水印也是不合需要的。因此, DCI標(biāo)準(zhǔn)對(duì)音頻水印提出嚴(yán)格要求,其中音頻水印在嚴(yán)格收聽A/B 測(cè)試中必須是聽不見的。
如果音頻信號(hào)包含在窄范圍的頻率范圍內(nèi)的突起頻率分量,則一 些自適應(yīng)加水印系統(tǒng)可努力以成功地掩蔽音頻信號(hào)中的水印的存在。 這通過系統(tǒng)中歸因于不理想濾波的不可避免信號(hào)擴(kuò)展所引起。這類加 水印系統(tǒng)可能不滿足DCI標(biāo)準(zhǔn)中對(duì)于音頻水印的可聽度所提出的要 求。增加加水印系統(tǒng)中存在的音頻濾波器的數(shù)量和分辨率可能解決這 個(gè)問題。但是,這將增加成本和復(fù)雜度,并且本身可將不希望的濾波 器偽信號(hào)加入所嵌入的水印中。這個(gè)問題通過本發(fā)明的實(shí)施例來解 決。
發(fā)明內(nèi)容
根據(jù)本發(fā)明,提供一種用于在音頻信號(hào)中嵌入水印的設(shè)備,該設(shè)備包括;輸入端,可操作以接收音頻信號(hào);水印適配單元,可操作以 接收來自水印生成單元的水印,并且將水印的頻譜輪廓適配成與輸入 音頻信號(hào)的頻語輪廓對(duì)應(yīng);以及水印嵌入部件,可操作以在音頻信號(hào) 中嵌入已適配水印,水印嵌入部件包括水印增益放大器,它可操作以 在將水印嵌入音頻信號(hào)之前根據(jù)水印增益值生成器所生成的增益信 號(hào)對(duì)水印應(yīng)用增益,其中水印增益值生成器可操作以調(diào)整應(yīng)用于水印 的增益,增益根據(jù)具有高于閾值的幅度的至少一個(gè)峰的分量的存在來 確定。
本發(fā)明識(shí)別音頻信號(hào)中可能引起信號(hào)擴(kuò)展到人類聽覺系統(tǒng)的掩 蔽限值之外、因而增加水印的能聽度的有問題部分,并且作為響應(yīng)而 對(duì)于有問題部分的持續(xù)時(shí)間調(diào)整水印增益。因此,在常規(guī)加水印系統(tǒng) 將會(huì)努力掩蔽嵌入的水印的情況的音頻信號(hào)的部分中,根據(jù)本發(fā)明的 設(shè)備和方法降低了水印的能聽度。作為另一個(gè)優(yōu)點(diǎn),電影音頻內(nèi)容的 性質(zhì)是使得在窄范圍的頻率范圍內(nèi)的突起頻率分量的出現(xiàn)通常很少 發(fā)生。因此,使因低級(jí)水印引起的加水印健壯度的任何降低為最小, 因?yàn)樗‰娖降慕档椭皇菚簳r(shí)的。
各或該峰的頻率范圍可以是使得峰將會(huì)引起輸入音頻信號(hào)中擴(kuò) 展,使得嵌入水印的音頻信號(hào)中的水印對(duì)人耳是可聽見的,以及如果 檢測(cè)到這種(這些)峰,則水印增益值生成器可以可操作以修改增益信 號(hào),使得由水印增益放大器應(yīng)用于水印的增益被減'J 、。
該設(shè)備可以進(jìn)一步包括多個(gè)包絡(luò)濾波器(envelopefilter),各濾 波器可操作以接收輸入音頻信號(hào)以及輸出對(duì)應(yīng)于橫跨輸入音頻信號(hào) 的頻譜子集的能量分布的包絡(luò)信號(hào),針對(duì)各濾波器各子集是不同的。
增益信號(hào)可通過預(yù)定增益曲線來確定,增益曲線根據(jù)分量峰的幅 度為最大處的頻率來限定增益信號(hào)。
從增益信號(hào)的第 一值到增益信號(hào)的第二值的轉(zhuǎn)變可遞增式進(jìn)行, 各遞增具有預(yù)定值和在持續(xù)時(shí)間中的預(yù)定時(shí)間長(zhǎng)度。
遞增可以是階躍式遞增或漸變式遞增其中之一。
6水印增益值生成器可以進(jìn)一步可操作以根據(jù)高于閾值的峰(或多 個(gè)峰)中包含的能量與輸入音頻信號(hào)中的能量之間的比較來確定增 益。
根據(jù)另一個(gè)方面,提供一種數(shù)字電影放映機(jī),包括解碼器,用 于對(duì)于解碼來自數(shù)據(jù)源的音頻數(shù)據(jù);根據(jù)本發(fā)明的任何實(shí)施例的加水 印設(shè)備,用于將水印插入音頻數(shù)據(jù);以及用于輸出加水印的音頻數(shù)據(jù) 的單元。
根據(jù)另一個(gè)方面,提供一種在音頻信號(hào)中嵌入水印的方法,該方 法包括接收音頻信號(hào);接收來自水印生成單元的水印,并且將水印 的頻譜輪廓適配成與輸入音頻信號(hào)的頻譜輪廓對(duì)應(yīng);以及在音頻信號(hào) 中嵌入已適配水印,其中,在嵌入音頻信號(hào)中之前,在將水印嵌入音 頻信號(hào)之前根據(jù)增益信號(hào)將增益應(yīng)用于水印,其中增益根據(jù)具有高于 閾值的幅度的至少 一個(gè)峰的分量的存在來確定。
各或者該峰的頻率范圍可以是使得峰將會(huì)引起輸入音頻信號(hào)中 的擴(kuò)展,使得嵌入水印的音頻信號(hào)中的水印是對(duì)于人耳可聽見的,以 及如果檢測(cè)到這種(這些)峰,則可修改增益信號(hào),使得應(yīng)用于水印的 增益被減小。
可提供多個(gè)包絡(luò)濾波器,各濾波器可操作以接收輸入音頻信號(hào)以 及輸出對(duì)應(yīng)于橫跨輸入音頻信號(hào)的頻譜子集的能量分布的包絡(luò)信號(hào), 針對(duì)各濾波器各子集是不同的。
增益信號(hào)可通過預(yù)定增益曲線來確定,增益曲線根據(jù)分量峰的幅 度為最大處的頻率來限定增益信號(hào)。
從增益信號(hào)的第一值到增益信號(hào)的第二值的轉(zhuǎn)變可遞增式進(jìn)行, 各遞增具有預(yù)定值和在持續(xù)時(shí)間中的預(yù)定時(shí)間長(zhǎng)度。
遞增可以是階躍式遞增或漸變式遞增其中之一。
增益可根據(jù)高于閾值的峰(或多個(gè)峰)中包含的能量與輸入音頻 信號(hào)中的能量之間的比較來確定。
本發(fā)明的其它各個(gè)相應(yīng)方面和特征在所附權(quán)利要求書中限定。
通過以下結(jié)合附圖對(duì)說明性實(shí)施例的詳細(xì)描述,本發(fā)明的上述和
其它特征及優(yōu)點(diǎn)將會(huì)非常明顯,附圖包括
圖1提供允許音頻流被嵌入水印的影院系統(tǒng)的示意圖; 圖2提供示出加水印單元的示意圖3提供示出圖2所示的加水印單元所處理的各種信號(hào)的頻譜的 示意圖4提供示出圖1所示的設(shè)備所處理的各種信號(hào)的頻譜的示意 圖,其中音頻數(shù)據(jù)單元包含超過窄范圍的頻率的突出頻率分量; 圖5提供根據(jù)本發(fā)明的實(shí)施例設(shè)置的加水印單元的示意圖; 圖6提供示出經(jīng)過本發(fā)明的實(shí)施例中的選通過程的各種信號(hào)的 頻鐠的示意圖7示出圖5的加水印單元中^f吏用的示例增益減小曲線; 圖8示出圖5的加水印單元中使用的另一個(gè)示例增益減小曲線; 圖9示出包括一系列離散階躍值的增益的變化; 圖10示出根據(jù)本發(fā)明的實(shí)施例的增益變化輸出的一些示例平滑 內(nèi)插;
圖11提供示出根據(jù)本發(fā)明的一個(gè)實(shí)施例的三級(jí)流水線的部分的 示意圖;以及
圖12提供本發(fā)明的實(shí)施例的實(shí)現(xiàn)中包含的步驟的概述。
具體實(shí)施例方式
圖1提供允許對(duì)音頻流嵌入水印的影院系統(tǒng)的示意圖。解碼器l 從數(shù)據(jù)源(未示出)提取音頻數(shù)據(jù)和視頻數(shù)據(jù)。將視頻數(shù)據(jù)發(fā)送給放映 單元2供進(jìn)一步處理,例如添加一見頻水印然后再放映。將4是耳又的音頻 數(shù)據(jù)發(fā)送給加水印單元3。將發(fā)送給加水印單元3的音頻信號(hào)劃分成 具有預(yù)定持續(xù)時(shí)間的單元。音頻單元的持續(xù)時(shí)間例如可以是以48kHz取樣、由8192個(gè)樣本的塊所形成的大約170 ms。每個(gè)音頻數(shù)據(jù)單元 順序地;敗處理,并且具有對(duì)其添加的水印。然后將加水印的音頻^t據(jù) 發(fā)送給音響系統(tǒng)4,它將音頻數(shù)據(jù)作為音響輸出。
圖2提供更詳細(xì)地示出加水印單元3的示意圖。加水印單元3設(shè) 置成使得在將水印添加到音頻信號(hào)之前,相對(duì)于音頻數(shù)據(jù)來適配水 印,以在將它嵌入音頻數(shù)據(jù)時(shí)減小其可感覺性。
在圖2所示的加水印單元中,輸入音頻數(shù)據(jù)可采取如上所述的預(yù) 定長(zhǎng)度的輸入音頻數(shù)據(jù)塊的形式。將各輸入音頻塊發(fā)送給第一帶通濾 波器(bandfilter) 21,它將塊劃分成多個(gè)頻帶,并且輸出對(duì)應(yīng)數(shù)量的 頻帶劃分塊(band divided block)。各頻帶劃分塊表示具體頻帶范圍 中的能量。在一個(gè)說明性示例中,將輸入音頻塊頻帶濾波成范圍從大 約160Hz至5kHz的16個(gè)頻帶。加水印單元3還包括多個(gè)包絡(luò)跟隨 濾波器22、 23、 24、 25。將第一帶通濾波器21所輸出的每個(gè)頻帶劃 分的信號(hào)輸入到包絡(luò)跟隨濾波器22、 23、 24、 25之一。大家會(huì)理解, 包絡(luò)跟隨濾波器的數(shù)量對(duì)應(yīng)于輸出頻帶劃分塊的數(shù)量。各包絡(luò)跟隨濾 波器配置成提供表示各對(duì)應(yīng)頻帶劃分塊中的能量的輸出信號(hào)。
水印生成器26生成頻域中的水印信號(hào),該信號(hào)然后由逆FFT單 元216轉(zhuǎn)換成時(shí)域,并且輸入到第二帶通濾波器27。在一個(gè)說明性 示例中,水印是在快速傅立葉變換(FFT)域中創(chuàng)建的四分之一取樣速 率(即,對(duì)音頻取樣的速率的四分之一)、塊大小為2048的偽隨機(jī)高 斯流,它在音響中類似噪聲。 一旦已經(jīng)在頻域生成水印,則由逆FFT 單元216將它轉(zhuǎn)換成時(shí)域。在一個(gè)實(shí)施例中,水印生成器接收音頻輸 入塊的FFT,并且使用音頻輸入塊的FFT來提供相位值和水印以提 供量值(magnitude value),以及將組合輸入逆FFT單元216。然后 將結(jié)果加入處于時(shí)域的輸入音頻塊,因而減少使音頻輸入經(jīng)過正向 FFT然后再經(jīng)過逆FFT所引起的音頻品質(zhì)的任何可能的損失。第二 帶通濾波器27以類似于笫一帶通濾波器21的方式進(jìn)行工作,以及將 水印信號(hào)劃分成多個(gè)頻帶塊,并且輸出對(duì)應(yīng)數(shù)量的頻帶劃分水印塊。將水印信號(hào)劃分成的那些頻帶對(duì)應(yīng)于將輸入音頻塊劃分成的那些頻
帶。隨后,多個(gè)乘法器28、 29、 210、 211把來自各包絡(luò)跟隨濾波器 22、 23、 24、 25的輸出與來自第二帶通濾波器27的水印信號(hào)輸出的 對(duì)應(yīng)頻帶劃分部分相乘。然后,乘法器28、 29、 210、 211的^T出由 第一組合器212相加,因而形成完整的已適配水印。然后,第一組合 器212的輸出由增益;^文大器215相乘,并且由第二組合器213與原始 音頻數(shù)據(jù)的輸入音頻塊組合。所有操作通常在時(shí)域中進(jìn)行。因此,形 成原始音頻數(shù)據(jù)單元的加水印的版本。
水印信號(hào)的各頻帶劃分塊與輸入音頻塊的對(duì)應(yīng)包絡(luò)濾波頻帶的 輸出相乘具有在水印與原始音頻數(shù)據(jù)組合時(shí)減小水印的可感覺性的 效果。這如圖3所示,圖3示出圖2所示的加水印單元所處理的各種 信號(hào)的頻譜。圖3包括示出輸入音頻塊的頻譜的一部分的第一圖表 31。虛線之間的音頻塊頻譜的部分311表示帶通濾波器21將音頻數(shù) 據(jù)塊劃分成的那些頻帶其中之一。第二圖表32示出由第一帶通濾波 器21濾波之后的輸入音頻塊的對(duì)應(yīng)頻帶劃分部分311。將頻帶劃分 塊32輸入到包絡(luò)濾波器22、 23、 24、 25之一。第三圖表33示出包 絡(luò)濾波器的輸出的頻譜,它示出橫跨第二圖表32中所示的頻帶劃分 塊的頻譜的能量分布。笫四圖表34示出第二帶通濾波器27所輸出的 頻帶劃分水印塊的一部分的頻譜。水印34的頻帶劃分塊與對(duì)應(yīng)包絡(luò) 濾波器的輸出的時(shí)域相乘產(chǎn)生具有如第五圖表35所示的頻譜的信 號(hào)。如第五圖表所示,頻帶劃分水印塊的頻譜已經(jīng)適配成使得它對(duì)應(yīng) 于包絡(luò)濾波器33的頻譜輪廓。第六圖表36示出頻域中水印的已適配 部分和音頻信號(hào)的頻帶劃分部分的組合的結(jié)果。可以看到,水印塊的 已適配部分的頻譜輪廓與音頻數(shù)據(jù)的頻帶劃分塊的頻譜輪廓相似。人 類聽覺系統(tǒng)(HAS)在其頻譜響應(yīng)中具有某種程度的重疊,由此頻率的 感覺可通過另一個(gè)附近頻率(如果其電平較大的話)來掩蔽。因此, 通過適配水印,使得其頻鐠輪廓對(duì)應(yīng)于音頻lt悟單元的,水印在嵌入 音頻數(shù)據(jù)單元時(shí)的能聽度因而以及可感覺性被減小。例如,在第六圖表36的點(diǎn)312,水印的頻譜電平已經(jīng)減小到適應(yīng)音頻信號(hào)的頻譜電 平的對(duì)應(yīng)下降。
水印的適配適用于大多數(shù)音頻信號(hào),特別是包含部分電影音軌的 音頻信號(hào)。但是,圖2所示的系統(tǒng)有一個(gè)問題。如果音頻信號(hào)包含在 窄范圍的頻率范圍內(nèi)的突出頻率分量,則圖2的系統(tǒng)沒有成功地掩蔽 音頻信號(hào)中的水印的存在(HAS可掩蔽窄范圍的頻率,但是這個(gè)范圍 可隨頻率和電平而改變,并且還是不對(duì)稱的)。例如,這類頻率可在 長(zhǎng)笛發(fā)出的聲音的錄制中出現(xiàn)。這個(gè)問題如圖4所示,圖4示出圖1 所示的設(shè)備所處理的各種信號(hào)的頻譜,但是其中音頻數(shù)據(jù)單元包含在 窄范圍的頻率范圍內(nèi)的突出頻率分量。這種情況如第 一圖表41所示。 例如,這類頻率的范圍可顯著小于包絡(luò)跟隨濾波器22、 23、 24、 25 的帶寬。此外,這類頻率可以是輸入音頻信號(hào)的中心頻率的+/-7.5%。 虛線之間的音頻數(shù)據(jù)塊的部分411表示帶通濾波器21將輸入音頻數(shù) 據(jù)塊劃分成的那些頻帶之一??梢钥吹?,這個(gè)頻帶包含具有在窄范圍 的頻率范圍內(nèi)的突出頻率分量的音頻數(shù)據(jù)單元的部分。第二圖表42 示出由第一帶通濾波器21濾波之后的音頻信號(hào)的對(duì)應(yīng)頻帶劃分塊 411的頻譜。如前所述,將頻帶劃分塊42輸入到包絡(luò)跟隨濾波器22、 23、 24、 25之一。第三圖表43示出包絡(luò)跟隨濾波器的輸出的頻譜。 由于濾波器的響應(yīng),超出輸入信號(hào)的包絡(luò)的某種擴(kuò)展是不可避免的。 該擴(kuò)展在包絡(luò)濾波器的輸出的頻譜上通過陰影區(qū)域412、 413來表示。 為了有助于清晰性,帶通濾波器21的截止頻率Fi和F2已經(jīng)在第一、 第二和第三圖表41、 43、 43上指明。包絡(luò)濾波器43的頻譜輸出的擴(kuò) 展的結(jié)果在于,當(dāng)包絡(luò)濾波器輸出43在時(shí)域中與頻帶劃分水印塊的 對(duì)應(yīng)部分相乘時(shí)(如第四圖表44在頻域所示),所得已適配水印(如第 五圖表45在頻域所示)包括超出存在于頻帶劃分塊42中那些頻率之 外的頻率。因此,當(dāng)組合水印和音頻數(shù)據(jù)單元時(shí),如圖表46所示, 該擴(kuò)展產(chǎn)生沒有被音頻信號(hào)掩蔽的水印的附加頻率分量414、 415。 這些未掩蔽頻率分量可以是HAS可感覺的。
ii這個(gè)問題可通過使用更多數(shù)量的更窄包絡(luò)跟隨濾波器以減弱擴(kuò) 展來解決。但是,這需要更加處理器密集的濾波,并且還可能將不希 望的濾波器偽信號(hào)引入包絡(luò)跟隨濾波器的輸出。根據(jù)本發(fā)明的實(shí)施 例,檢測(cè)到有問題的刺激、如高電平窄帶信號(hào),以及隨后在那個(gè)刺激 的持續(xù)時(shí)間期間將應(yīng)用于水印的總增益減小到某個(gè)水平,由此水印是 感覺不到的。
圖5提供根據(jù)本發(fā)明設(shè)置的加水印單元的示意圖。加水印單元與
圖2所示的相似,但是它包括將輸入音頻塊變換為頻域FFT塊的FFT 單元52以及控制由增益放大器215應(yīng)用于水印的增益量的增益值生 成器51。對(duì)于常見元件如何操作的細(xì)節(jié),讀者參閱圖2的描述的相 關(guān)段落。增益值生成器215分析輸入音頻塊(、換言之為當(dāng)前將水印 嵌入其中的塊)的FFT版本的特性。如果檢測(cè)到不可能成功地掩蔽 嵌入的水印的窄帶內(nèi)容,則增益值生成器向增益放大器215發(fā)送信 號(hào),以便減少應(yīng)用于水印的增益。這降低嵌入的水印的電平,以及因 而降低可感覺性。
下面描述由增益值生成器51對(duì)當(dāng)前被加水印的輸入音頻塊執(zhí)行 的分析。
該過程中的第一步驟是從輸入音頻塊的FFT版本獲取信息,以 確定源數(shù)據(jù)是否可能在包絡(luò)跟隨濾波器中產(chǎn)生不希望的擴(kuò)展。增益值 生成器51包括用于去除FFT塊中的除主要峰之外的所有峰的選通電 路(g ate)。這種概念如圖6所示。圖6示出包含F(xiàn)FT塊的信號(hào)的第 一圖表61。然后將對(duì)信號(hào)應(yīng)用選通,如第二圖表62所示。選通電路 被設(shè)置在的電平通過信號(hào)的各種屬性以及選通電路本身的參數(shù)來確 定。選擇這些屬性和參數(shù)(下面進(jìn)行論述)以便隔離難以按照上述方式 來掩蔽的FFT塊的頻率分量。第三圖表63示出經(jīng)過選通電路而處理 之后的信號(hào)。可以看到,低于選通電路的設(shè)置電平的所有頻率已經(jīng)減 小到零。在第三圖表63所示的示例中,這留下兩個(gè)峰。這些峰對(duì)應(yīng) 于音頻信號(hào)的兩個(gè)窄帶分量,它們?nèi)绲谝粓D表61所示。在一個(gè)實(shí)施例中,音頻信號(hào)包括以四分之一的耳又樣速率(對(duì)音頻
信號(hào)取樣的速率)的FFT數(shù)據(jù)的2048樣本塊,以及該選通降低至將 具有小于整個(gè)FFT塊的平均值五倍的幅度的任何頻率歸零。另外, 將下限(例如大約-40dB)應(yīng)用于平均值,由此,如果平均值下降到低 于這個(gè)值,則整個(gè)塊減小到零,以避免例如下降取樣(down sampling) 期間引入的假信號(hào)分量所引起的增益減小。在選通之后,音頻信號(hào)的 所有明顯窄帶頻率分量顯示為可辨別峰。然后分析已選通的頻語63 的峰。分析包括下列值的集合
峰編號(hào) 為了便于標(biāo)識(shí)而歸于各峰的整數(shù)索? 1號(hào) 峰能量 指明各峰中包含的總能量的值,換言之為那個(gè)峰中 的所有樣本值之和。
峰寬度 各峰的以樣本計(jì)的寬度。
峰起始位置指明各峰開始處的值,例如FFT塊中峰開始處的 樣本。
峰中心位置指明各峰的最高點(diǎn)處的值,例如FFT中具有峰中 的最多能量的樣本。
由這個(gè)數(shù)據(jù),可計(jì)算音頻數(shù)據(jù)中存在的兩個(gè)最高峰的能量連同它 們中心位置。在一些實(shí)施例中,如果最大峰的峰能量比第二最大峰的 峰能量大9dB以上,則第二最大峰減小到零。此后,其余頻譜能量 可計(jì)算為分析數(shù)據(jù)中的峰能量值之和減去兩個(gè)最大峰(在如上所述已 經(jīng)調(diào)整第二最大峰之后)。
為了確定增益值生成器51是否將增益減小應(yīng)用于水印,分析峰 數(shù)據(jù)以便確定它是否滿足其它標(biāo)準(zhǔn)。例如,如果滿足下列條件的一個(gè) 或多個(gè),則將增益減小應(yīng)用于水印
-如果在已經(jīng)選通音頻信號(hào)之后僅剩下一個(gè)峰;
-如果最大峰的能量是已選通的音頻信號(hào)中的剩余頻鐠能量的 兩倍;
-如果最大峰的能量大于已選通的音頻信號(hào)中的剩余頻譜能量的一半,并且大于臨界范圍下限、如700Hz;
-如果第二最大峰的能量大于已選通的音頻信號(hào)的剩余頻譜能 量的某個(gè)比例、如30%,并且大于臨界范圍下限、如700Hz。
換言之,有可能分析高于閣值的峰的能量分布,并且將這個(gè)值與 輸入音頻信號(hào)的能量進(jìn)行比較。作為這種比較的結(jié)果,調(diào)整水印的增 益。
如果沒有滿足上述標(biāo)準(zhǔn),換言之,如果確定不需要降低水印的電 平,則增益值生成器61將增益值設(shè)置為一。但是,可以不將增益值 立即設(shè)置為一,而是按照下面論述的每最大轉(zhuǎn)變率來增加。
假定前面所述的測(cè)試標(biāo)準(zhǔn)已經(jīng)確定增益減小是必要的,下一個(gè)步 驟是確定將由增益放大器215減小水印的量。增益減小根據(jù)預(yù)定增益 減小曲線來計(jì)算。大家會(huì)理解,HAS能夠檢測(cè)某些頻率比其它要好。 因此,增益減小曲線可根據(jù)經(jīng)驗(yàn)、例如通過進(jìn)行收聽測(cè)試以確定在多 個(gè)固定頻率處的水印能聽度的閾值來得出。固定頻率之間的頻率的增 益減小可使用線性內(nèi)插來識(shí)別。圖7示出示例增益減小曲線。為了確 定增益減小,識(shí)別存在最大峰處的頻率,并且從增益曲線確定對(duì)應(yīng)增 益值。例如,如圖7所示,如果在x Hz處存在最大峰,則識(shí)別增益 減小y。
圖8示出增益減小曲線的更加特定的示例。圖8中的圖表示出根 據(jù)FFT樣本數(shù)相對(duì)峰頻率的增益減小值。這個(gè)曲線僅指定到FFT取 樣信號(hào)的尼奎斯特頻率。
每當(dāng)處理各FFT塊時(shí)計(jì)算一次增益值。在一些實(shí)施例中,可設(shè) 置最大轉(zhuǎn)變率,它逐塊限制增益的變化。例如,可設(shè)置每塊0.11的 最大增益轉(zhuǎn)變率(增益值生成器所產(chǎn)生的增益值范圍從O至1)。大家 會(huì)理解,可取多個(gè)塊以達(dá)到新的增益值。另外,對(duì)于最近的塊所計(jì)算 的增益值將蓋寫(orverride)對(duì)于前一個(gè)塊所確立的任何增益值。
當(dāng)逐塊計(jì)算增益值生成器51所輸出的增益值時(shí),這表示增益的 變化可包括一系列離散階躍值。這如圖9所示。增益的這種陡然階躍
14本身是可聽見的,因而將不希望的噪聲或失真引入加水印的音頻信 號(hào)。因此,在一些實(shí)施例中,將平滑應(yīng)用于這種增益變化。在圖5所 示的實(shí)施例中,這種平滑在增益值生成單元51中進(jìn)行,但是本發(fā)明 并不局限于此。圖10示出可應(yīng)用于增益值生成器51的輸出以使嵌入水印可能的 能聽度為最小的一些示例平滑內(nèi)插。在圖IO中可以看到,平滑的增 益變化信號(hào)(斷線)設(shè)置成使得增益變化轉(zhuǎn)變僅不斷地位于階躍式增 益變化塊中。這確保水印增益的任何轉(zhuǎn)變決不超過增益值生成器61 所確定的增益值,因而確保通過平滑水印信號(hào)而沒有將可聽見的分量 加入水印。圖10所示的平滑要求三個(gè)連續(xù)的增益變化值、即前一個(gè)、當(dāng)前 和下一個(gè)FFT塊的增益值是已知的。因此,可存在設(shè)置于第一帶通 濾波器21與FFT幀輸入之間的塊延遲。但是,在一些實(shí)施例中,圖 5所示的加水印單元可在使用其中不需要額外延遲的"流水線"架構(gòu)的 硬件中來實(shí)現(xiàn)。在一個(gè)實(shí)施例中,水印的嵌入可分為3級(jí)(即三個(gè)流 水線),用于順序處理數(shù)據(jù)。例如,如果第三流水線正處理"當(dāng)前"輸 入音頻塊,則第二流水線將處理"將來"輸入音頻塊,依此類推。當(dāng)新 輸入音頻塊到達(dá)時(shí),流水線將相關(guān)數(shù)據(jù)移動(dòng)到下一個(gè)對(duì)應(yīng)流水線。如上所述,為了實(shí)現(xiàn)圖IO的平滑內(nèi)插模式,前一個(gè)、當(dāng)前和將 來增益值必須是已知的。圖11示出來自包括流水線架構(gòu)的示例實(shí)施 例的第二流水線111和第三流水線112。可以看到,通過從第二流水 線提取FFT數(shù)據(jù),并且對(duì)其應(yīng)用上述分析以確定增益值,來取(從第 二流水線輸出的)數(shù)據(jù)的"將來,,塊的增益值。第三流水線設(shè)置成使得 第三流水線112有權(quán)訪問"前一個(gè)"增益值113和"當(dāng)前"增益值114(先 前計(jì)算)以及"將來,,增益值115。因此,這些值可在第三流水線112中 組合,以便生成平滑增益值。圖12提供概述本發(fā)明的實(shí)施例中包含的步驟的流程圖。在步驟 Sl,將音頻數(shù)據(jù)劃分成預(yù)定長(zhǎng)度的單元。在步驟S2,針對(duì)音頻信號(hào)中可能無法掩蔽已適配水印的窄帶分量順序地分析所得輸入音頻塊。在步驟S3,根據(jù)步驟S2識(shí)別的任何窄帶分量的屬性來生成增益值。 在步驟S4,平滑增益值,以降低應(yīng)用于水印的增益變化的可感覺性。 如上所述,這可考慮先前和將來增益值。在步驟S5,將平滑增益模 式應(yīng)用于嵌入原始音頻信號(hào)的水印。可對(duì)本文前面所述的實(shí)施例進(jìn)行各種修改。雖然在加水印單元和 流水線架構(gòu)方面描述了本發(fā)明的實(shí)施例,但是也設(shè)想其它實(shí)現(xiàn)。例如, 加水印過程可在計(jì)算機(jī)上運(yùn)行。計(jì)算機(jī)可設(shè)置成通過由存儲(chǔ)介質(zhì)上存 儲(chǔ)的計(jì)算機(jī)程序進(jìn)行編程來實(shí)現(xiàn)本發(fā)明,其中存儲(chǔ)介質(zhì)包含用于在計(jì) 算機(jī)上執(zhí)行本發(fā)明的指令。此外,本發(fā)明不一定限制于在數(shù)字影院的上下文中使用。本發(fā)明 可在其中需要將水印插入音頻內(nèi)容的任何適當(dāng)應(yīng)用中使用。
權(quán)利要求
1.一種用于在音頻信號(hào)中嵌入水印的設(shè)備,所述設(shè)備包括輸入端,其可操作以接收所述音頻信號(hào);水印適配單元,其可操作以接收來自水印生成單元的所述水印,并且將所述水印的頻譜輪廓適配成與所述輸入音頻信號(hào)的頻譜輪廓對(duì)應(yīng),以及水印嵌入器,其可操作以將已適配的水印嵌入所述音頻信號(hào),所述水印嵌入器包括可操作以在將所述水印嵌入所述音頻信號(hào)之前根據(jù)水印增益值生成器所生成的增益信號(hào)而將增益應(yīng)用于所述水印的水印增益放大器,其中所述水印增益值生成器可操作以調(diào)整應(yīng)用于所述水印的增益,所述增益根據(jù)具有高于閾值的幅度的至少一個(gè)峰的分量的存在來確定。
2. 如權(quán)利要求1所述的設(shè)備,其中,所述峰或各峰的頻率范圍 為使得所述峰會(huì)引起所述輸入音頻信號(hào)中的擴(kuò)展,使得嵌入水印的音 頻信號(hào)中的所述水印對(duì)于人耳是可聽見的,以及如果4企測(cè)到這樣的 峰,則所述水印增益值生成器可操作以修改所述增益信號(hào),使得由所 述水印增益放大器應(yīng)用于所述水印的增益減小。
3. 如權(quán)利要求1所述的設(shè)備,包括多個(gè)包絡(luò)濾波器,各濾波 器可操作以接收所述輸入音頻信號(hào)以及輸出對(duì)應(yīng)于橫跨所述輸入音 頻信號(hào)的頻譜子集的能量分布的包絡(luò)信號(hào),針對(duì)各濾波器各子集是不 同的。
4. 如權(quán)利要求1所述的設(shè)備,其中,所述增益信號(hào)通過預(yù)定增 益曲線來確定,所述增益曲線根據(jù)所述分量峰的幅度為最大處的頻率 來限定所述增益信號(hào)。
5. 如權(quán)利要求1所述的設(shè)備,其中,從增益信號(hào)的第一值到增 益信號(hào)的第二值的轉(zhuǎn)變遞增式進(jìn)行,各遞增具有預(yù)定值和持續(xù)時(shí)間中 的預(yù)定時(shí)間長(zhǎng)度。
6. 如權(quán)利要求5所述的設(shè)備,其中,所述遞增是階躍式遞增或漸變式遞增其中之一。
7. 如權(quán)利要求1所述的設(shè)備,其中,所述水印增益值生成器還 可操作以根據(jù)高于所述閾值的峰中包含的能量與所述輸入音頻信號(hào) 中的能量之間的比較來確定所述增益。
8. —種數(shù)字電影放映機(jī),包括解碼器,用于對(duì)來自數(shù)據(jù)源的音頻數(shù)據(jù)進(jìn)行解碼; 如權(quán)利要求1所述的加水印設(shè)備,用于將水印插入所述音頻數(shù) 據(jù);以及用于輸出加水印的音頻數(shù)據(jù)的單元。
9. 一種在音頻信號(hào)中嵌入水印的方法,所述方法包括 接收所述音頻信號(hào);接收來自水印生成單元的所述水印,并且將所述水印的頻譜輪廓 適配成與所述輸入音頻信號(hào)的頻譜輪廓對(duì)應(yīng),以及將已適配的水印嵌入所述音頻信號(hào),其中,在嵌入所述音頻信號(hào) 中之前,在將所述水印嵌入所述音頻信號(hào)之前根據(jù)增益信號(hào)將增益應(yīng) 用于所述水印,其中所述增益根據(jù)具有高于閾值的幅度的至少 一 個(gè)峰的分量的存在 來確定。
10. 如權(quán)利要求9所述的方法,其中,所述峰或各峰的頻率范圍 是使得所述峰將會(huì)引起所述輸入音頻信號(hào)中的擴(kuò)展,使得嵌入水印的 音頻信號(hào)中的所述水印對(duì)于人耳是可聽見的,以及如果檢測(cè)到這樣的 峰,則修改所述增益信號(hào),使得應(yīng)用于所述水印的增益減小。
11. 如權(quán)利要求9所述的方法,包括提供多個(gè)包絡(luò)濾波器,各 濾波器可操作以接收所述輸入音頻信號(hào)以及輸出對(duì)應(yīng)于橫跨所述輸 入音頻信號(hào)的頻語子集的能量分布的包絡(luò)信號(hào),針對(duì)各濾波器各子集 是不同的。
12. 如權(quán)利要求9所述的方法,其中,所述增益信號(hào)通過預(yù)定增益曲線來確定,所述增益曲線根據(jù)所述分量峰的幅度為最大處的頻率 來限定所述增益信號(hào)。
13. 如權(quán)利要求9所述的方法,其中,從增益信號(hào)的第一值到增 益信號(hào)的第二值的轉(zhuǎn)變遞增式進(jìn)行,各遞增具有預(yù)定值和持續(xù)時(shí)間中 的預(yù)定時(shí)間長(zhǎng)度。
14. 如權(quán)利要求13所述的方法,其中,所述遞增是階躍式遞增 或漸變式遞增其中之一。
15. 如權(quán)利要求9所述的方法,包括根據(jù)高于閾值的峰中包含 的能量與所述輸入音頻信號(hào)中的能量之間的比較來確定所述增益。
16. —種包含計(jì)算機(jī)可讀指令的計(jì)算機(jī)程序,所述計(jì)算機(jī)可讀指 令在加載到計(jì)算機(jī)上時(shí)將所述計(jì)算機(jī)配置成執(zhí)行如權(quán)利要求9所述 的方法。
17. —種存儲(chǔ)介質(zhì),配置成在其中或其上存儲(chǔ)如權(quán)利要求16所 述的計(jì)算機(jī)程序。
全文摘要
本發(fā)明涉及音頻電信系統(tǒng)和方法。描述了一種用于在音頻信號(hào)中嵌入水印的設(shè)備,該設(shè)備包括輸入端,可操作以接收音頻信號(hào);水印適配單元,可操作以接收來自水印生成單元的水印,并且將水印的頻譜輪廓適配成對(duì)應(yīng)于輸入音頻信號(hào)的頻譜輪廓,以及水印嵌入單元,可操作以將已適配水印嵌入音頻信號(hào),水印嵌入單元包括可操作以在將水印嵌入音頻信號(hào)之前根據(jù)水印增益值生成器所生成的增益信號(hào)將增益應(yīng)用于水印的水印增益放大器,其中水印增益值生成器可操作以調(diào)整應(yīng)用于水印的增益,增益根據(jù)具有高于閾值的至少一個(gè)峰的分量的存在來確定。
文檔編號(hào)G10L19/00GK101667437SQ20091017360
公開日2010年3月10日 申請(qǐng)日期2009年9月1日 優(yōu)先權(quán)日2008年9月1日
發(fā)明者C·斯拉特, M·J·拉塞爾, S·M·基廷 申請(qǐng)人:索尼株式會(huì)社