透明無損音頻加水印的制作方法

文檔序號(hào)：11142443閱讀：692來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

本發(fā)明涉及將可聽透明可逆水印插入到PCM音頻信號(hào)中，尤其參照流式傳輸。

背景技術(shù)：

在本千禧年，已經(jīng)提出了若干用于音頻的可逆加水印方案，盡管在檢查時(shí)，可逆性經(jīng)常存在于數(shù)值分析的意義上，并且在算法內(nèi)存在不可避免的量化的情況下，原始PCM(脈沖編碼調(diào)制)信號(hào)的重構(gòu)不是無損的，即，位對位準(zhǔn)確的。我們認(rèn)為確實(shí)無損的兩個(gè)算法是在WO2004066272中由M.Van Der Veen(M·萬德文)、A.Bruekers(A·布魯克)、A.Van Leest(A·萬力特)和S.Cavin(S·卡文)公開的“Reversible Watermarking of Digital Signals(數(shù)字信號(hào)的可逆加水印)”以及在WO2013061062中由P.Craven(P·克萊文)和M.Law(M·勞爾)公開的“Lossless Buried Data(無損埋入數(shù)據(jù))”。

WO2004066272公開了一種通過操縱音頻直方圖而對數(shù)字信號(hào)進(jìn)行可逆加水印的方法。根據(jù)一種方法，S形增益函數(shù)C被應(yīng)用到原始16位PCM音頻信號(hào)，該P(yáng)CM音頻信號(hào)然后被重新量化為15位，在最低有效位(Isb)中留下1位空位。插入到此Isb空位中的數(shù)據(jù)包括所需要的水印數(shù)據(jù)、開銷以及使相應(yīng)的解碼器將加水印過程逆轉(zhuǎn)并恢復(fù)原始音頻的精確復(fù)制品的重構(gòu)數(shù)據(jù)。

S形增益函數(shù)具有超過1接近0的增益，并且將音頻信號(hào)的范圍映射到其自身。從而必須具有小于1接近全范圍的增益。在C的增益小于2的任何信號(hào)值范圍上，需要重構(gòu)數(shù)據(jù)，因?yàn)镃將位于此范圍內(nèi)的16位值映射到更低的不同的15位值。當(dāng)C的增益還大于1時(shí)，每個(gè)重構(gòu)數(shù)據(jù)樣本需要少于一位，并且當(dāng)該增益小于1時(shí)，需要多于一位重構(gòu)數(shù)據(jù)。該方案可行，因?yàn)樾盘?hào)值音頻的PDF(概率密度函數(shù))不是水平的，小信號(hào)值(其中C的S形狀具有大于1的增益)比大信號(hào)值(其中C具有小于1的增益)更常見。由此，平均來說，每個(gè)重構(gòu)數(shù)據(jù)樣本小于1位(通常更少)，使Isb空位內(nèi)存在用于開銷和水印的足夠空間。

盡管此方法在嵌入大量水印數(shù)據(jù)時(shí)是有效的，但是存在透明度小于可能需要的情況的許多方面。水印數(shù)據(jù)被加到此信號(hào)，所以其中的圖案可以是可聽的，并且信號(hào)修改在耳朵最敏感的頻率區(qū)域中就像耳朵不敏感的頻率區(qū)域中那樣大聲。此方法不具有提供減少的噪聲交換減少的水印容量的靈活性。

WO2013061062公開了s形增益函數(shù)可以如何被實(shí)現(xiàn)為線性增益和削波單元的組合，該削波單元在對信號(hào)峰值進(jìn)行削波時(shí)生成重構(gòu)數(shù)據(jù)。其還公開了分離的無損濾波可以如何有利地結(jié)合該方案來修改信號(hào)的PDF，從而減少削波單元所生成的重構(gòu)數(shù)據(jù)量。無論如何，看到可以如何使用WO2004066272或WO2013061062的方法實(shí)現(xiàn)與音頻信號(hào)不相關(guān)并且優(yōu)選地是頻譜成形的低和常量噪聲本底的音樂發(fā)燒友理想是比較困難的。

M.Gerzon(M·格爾茲)和P.Craven(P·克萊文)在“A High Rate Buried Data Channel for Audio CD(音頻CD的高速率埋入數(shù)據(jù))”(發(fā)表于1993年第94屆AES柏林會(huì)議的預(yù)印本3551)(以下稱為Gerzon)中描述了一種透明有損加水印方案。包括每個(gè)樣本n個(gè)二進(jìn)制位的水印數(shù)據(jù)是隨機(jī)化的，并且然后被用于噪聲成形(16-n)位量化器的減法顫振。這具有丟棄音頻的n個(gè)Isb并且用隨機(jī)化水印替換它們的實(shí)際效果，但是與常規(guī)的位替換相比對音頻具有更小的傷害。描述了使n是1/2的奇數(shù)倍的兩個(gè)立體聲通道的聯(lián)合量化以及更復(fù)雜的量化方案。

音頻材料的流式傳輸現(xiàn)在非常流行，并且提出了這樣的技術(shù)要求：解碼器必須能夠在未看到編碼項(xiàng)目或“音軌”的開始的情況下開始解碼。在經(jīng)濟(jì)地編碼的流的無損重構(gòu)的情境中，該要求可造成顯著的技術(shù)障礙，以后將會(huì)明顯。

技術(shù)實(shí)現(xiàn)要素：

根據(jù)本申請的透明無損音頻加水印，本發(fā)明的目的是提供一種無損加水印方法，該方法與WO2004066272的方法相比具有改進(jìn)的透明度，如在未并入本發(fā)明的特征的標(biāo)準(zhǔn)的“傳統(tǒng)”PCM解碼裝置上聽到的，同時(shí)保留了現(xiàn)有技術(shù)系統(tǒng)的從編碼流的中間部分開始解碼的能力。這是通過減少引入的量化誤差量、對誤差進(jìn)行頻譜成形并且將信號(hào)更改從原始音頻完全地解除關(guān)聯(lián)來完成的，由此使誤差更類似于加性噪聲。本公開還致力于更改水印的容易化。

如將更詳細(xì)描述的，根據(jù)本發(fā)明的編碼器兩次將原始PCM信號(hào)量化，每次量化是量化到量化格柵。因?yàn)镻CM信號(hào)本身已經(jīng)量化，需要考慮三個(gè)量化格柵，第一是原始PCM信號(hào)的量化格柵，第二是加水印的信號(hào)的量化格柵，以及第三量化格柵是中間信號(hào)的量化格柵。

通常，加水印的信號(hào)被遞送為具有與原始信號(hào)相同的位深度的PCM信號(hào)，但是這并不意味著第一和第二量化格柵是相同的。通常，信號(hào)的量化格柵可能不是通過在PCM內(nèi)將可能的位組合解釋為二進(jìn)制數(shù)所獲得的值集。我們應(yīng)當(dāng)考慮被限制為僅由上述值集的更粗略子集執(zhí)行的一些信號(hào)。相反地，我們還應(yīng)當(dāng)考慮其值從上述值集中的值偏置不是量化步長的整數(shù)倍的某個(gè)量的信號(hào)。假如信號(hào)的發(fā)送器和接收器都知道此偏置，例如，如果此偏置是從這兩者都知道的數(shù)據(jù)或者從這兩者都知道的偽隨機(jī)序列生成器生成的，此偏置可以從不同樣本間變化。

這些考慮適用于單通道信號(hào)和多通道信號(hào)兩者，該信號(hào)的樣本值是位于多維格柵的格柵點(diǎn)上的多維向量。向量情況下另一個(gè)興趣點(diǎn)是：n維格柵可以是簡單的矩形、立方體或超立方體格柵，換言之，n個(gè)一維格柵的笛卡爾積，或者其可以是某個(gè)更常見的東西，例如，源自以下約束：n個(gè)通道的最低位的異或?yàn)榱?。PCM通道可以被視為具有其自身的量化格柵的容器，并且通過該通道傳輸?shù)腜CM信號(hào)的量化格柵可以更粗略。因此，無法簡單地從其位深度的知識(shí)推斷PCM信號(hào)的量化格柵。

量化通常被認(rèn)為是丟棄信息的過程，但是如果已經(jīng)被量化的信號(hào)被重新量化為不比原始量化格柵更粗略的量化格柵的話，不見得是這種情況。我們應(yīng)當(dāng)使用術(shù)語“量化”來指代信號(hào)值在量化格柵上到附近值的映射，不管信息是否丟失。

當(dāng)引用‘噪聲’或‘信噪比’時(shí)，我們認(rèn)為是在標(biāo)準(zhǔn)的PCM設(shè)備上再現(xiàn)加水印的信號(hào)時(shí)聽到的噪聲。當(dāng)然，如果加水印的信號(hào)被根據(jù)本發(fā)明無損地解碼，則不存在來自加水印的附加噪聲。

在第一方面，本發(fā)明提供了一種用于對原始或“第一”音頻信號(hào)無損地加水印以便生成“第二”音頻信號(hào)的方法，這兩個(gè)信號(hào)都是脈沖編碼調(diào)制‘PCM’信號(hào)，并且各自被量化到其對應(yīng)的“第一”或“第二”量化格柵。所述方法包括以下步驟：

接收作為在第一量化格柵上量化的樣本的所述第一音頻信號(hào)；

確定比所述第一量化格柵粗略的第三量化格柵；

向所述第一音頻信號(hào)應(yīng)用量化映射以提供第三音頻信號(hào)，所述第三音頻信號(hào)具有取決于所述第三量化格柵的樣本值；

當(dāng)所述第一量化格柵的多個(gè)值將通過所述量化映射被映射到所述第三音頻信號(hào)的值時(shí)生成第一數(shù)據(jù)，其中，所述第一數(shù)據(jù)是重構(gòu)數(shù)據(jù)，指示所述多個(gè)值中的哪個(gè)值是所述第一信號(hào)的值；

組合所述第一數(shù)據(jù)和水印數(shù)據(jù)以產(chǎn)生第二數(shù)據(jù)；

根據(jù)所述第二數(shù)據(jù)確定不同于所述第一和第三量化格柵的第二量化格柵；以及

根據(jù)所述第二音頻信號(hào)的先前樣本通過將所述第三音頻信號(hào)量化到所述第二量化格柵上生成所述第二音頻信號(hào)的樣本。

在其最基本的形式下，前四個(gè)步驟“接收”、“確定”、“應(yīng)用”和“生成”與在WO2004066272中描述的現(xiàn)有技術(shù)過程的運(yùn)算類似。“量化映射”在第三量化格柵上將原始信號(hào)量化為“第三”信號(hào)，該第三量化格柵通常比第一量化格柵更粗略，導(dǎo)致信號(hào)分辨率丟失，這樣使第一信號(hào)的后續(xù)無損恢復(fù)需要附加的重構(gòu)數(shù)據(jù)。該重構(gòu)數(shù)據(jù)是在應(yīng)用量化映射的過程中生成的“第一”數(shù)據(jù)。

第二音頻信號(hào)呈現(xiàn)為PCM信號(hào)，但是如所討論的，PCM信號(hào)可以具有比包含它的PCM通道的量化格柵更粗略的量化格柵。如果第二量化格柵是固定的，這將意味著與該通道相關(guān)聯(lián)的量化格柵的一些點(diǎn)將永不被執(zhí)行。這提供了將第三信號(hào)量化為變化的第二量化信號(hào)的機(jī)會(huì)，并且根據(jù)本發(fā)明，第二量化格柵是根據(jù)“第二”數(shù)據(jù)確定的，該第二數(shù)據(jù)包括以上提及的水印和“第一”重構(gòu)數(shù)據(jù)。以此方式，第二數(shù)據(jù)被“埋入”在加水印的信號(hào)內(nèi)，并且后續(xù)的解碼器可以通過檢查已經(jīng)執(zhí)行過該通道的量化格柵的哪些點(diǎn)而恢復(fù)被埋入的數(shù)據(jù)。

如果量化映射具有整體性的大信號(hào)增益，將要因此被埋入的并且后續(xù)被恢復(fù)的“第二”數(shù)據(jù)的最大量將與“第一”重構(gòu)數(shù)據(jù)的量相同，并且將沒有機(jī)會(huì)傳送水印。然而，在正常運(yùn)算中，在覆蓋最經(jīng)常發(fā)生的信號(hào)值的信號(hào)范圍上，量化映射被配置成提供大于整體性的增益。這減少了所需的重構(gòu)數(shù)據(jù)的量，由此使第二數(shù)據(jù)攜帶所需要的水印數(shù)據(jù)和任何必要的系統(tǒng)開銷。

由此，量化映射通常不是線性的。如在WO2004066272中討論的，其可以具有S形?？商娲兀缭赪O2013061062中討論的，其可以是線性的，在信號(hào)范圍的中心部分上具有大于整體性的增益，但是具有特殊配置以避免信號(hào)范圍的極值附近的超載。

當(dāng)?shù)谝灰纛l信號(hào)取第一映射的增益小于整體性的值時(shí)，重構(gòu)數(shù)據(jù)臨時(shí)地大于可以被埋入的最大第二數(shù)據(jù)?？梢酝ㄟ^緩沖重構(gòu)數(shù)據(jù)容納過量數(shù)據(jù)。由于緩沖造成延遲，通過簡單的緩沖，解碼器將需要讀取流并且在稍后的某個(gè)時(shí)間開始解碼；可替代地，編碼器可以在第三信號(hào)中插入延遲，從而使解碼器將在正確的時(shí)間接收所緩沖的重構(gòu)數(shù)據(jù)。

根據(jù)第二和第三音頻信號(hào)中的至少的先前樣本執(zhí)行第三格柵到第二格柵的量化，以提供頻譜成形，并減少所得量化噪聲的感知重要性。該技術(shù)被廣泛地用于其他情境中，但是在可能在流式音頻的情境中需要無損重構(gòu)時(shí)使用該技術(shù)是不明顯的，因?yàn)閷ο惹皹颖镜囊蕾嚂?huì)使難以或不可能從流的半路開始重構(gòu)。

在一些系統(tǒng)實(shí)施例中，所述依賴取決于第三音頻信號(hào)和第二音頻信號(hào)的有限數(shù)量n的先前樣本。解碼器直接接收第二音頻信號(hào)，所以僅僅通過等待n個(gè)樣本周期解決對第二音頻信號(hào)的先前樣本的依賴。第三音頻信號(hào)不是這種情況，所以在優(yōu)選實(shí)施例中，編碼器通過將與包括n個(gè)連續(xù)樣本的第三音頻信號(hào)的一部分有關(guān)的初始化數(shù)據(jù)包括在第二數(shù)據(jù)內(nèi)來支持從“重啟點(diǎn)”解碼。

重啟輔助數(shù)據(jù)可以直接包括第三音頻信號(hào)的n個(gè)先前樣本的二進(jìn)制表示，但是在提供16位音頻分辨率的系統(tǒng)中，將在流中的可能開始解碼的每個(gè)位置處針對每個(gè)音頻通道可能需要至少n*16位“重啟輔助數(shù)據(jù)”。注意到假設(shè)合適的噪聲成形濾波器，可以對第三音頻信號(hào)和第二音頻信號(hào)之間的差異進(jìn)行嚴(yán)格的約束，該要求可以被非常顯著地減少。由此，在已經(jīng)得知第二音頻信號(hào)的樣本時(shí)，可以從限定其位選擇的信息完全地重構(gòu)第三音頻信號(hào)的相應(yīng)的樣本。

在另一個(gè)優(yōu)選實(shí)施例中，編碼器從而提供僅與第三音頻信號(hào)的位選擇有關(guān)的初始化數(shù)據(jù)，所述選擇具有例如少于八位。因此第三音頻信號(hào)的與具體的重啟點(diǎn)有關(guān)的位總數(shù)不超過通道數(shù)乘以該部分中的n個(gè)連續(xù)樣本的八倍乘以通道數(shù)。

優(yōu)選地，所述第一和第三量化格柵中的至少一個(gè)格柵在不同樣本間變化。如果不是這種情況，這兩個(gè)格柵將具有固定的關(guān)系并且到第三的量化映射將需要并入顫振以表面量化偽影，但是顫振引發(fā)噪聲懲罰。

在優(yōu)選實(shí)施例中，第三量化格柵根據(jù)偽隨機(jī)序列生成器的輸出而變化，以確保由量化格柵引入的量化誤差與第一音頻信號(hào)解除關(guān)聯(lián)。

在優(yōu)選實(shí)施例中，所述第一音頻信號(hào)是多通道的，并且所述第二和第三量化格柵中的至少一個(gè)格柵未被形成為每個(gè)通道上的單獨(dú)量化格柵的笛卡爾積。使用已知的量化方法，相比于單獨(dú)的通道量化，來自信號(hào)重新量化的附加噪聲可以然后被減少。

同樣提供其大信號(hào)行為緊密地匹配原始信號(hào)的加水印的信號(hào)，本發(fā)明還引入了信號(hào)修改和具體地濾波以調(diào)整頻率響應(yīng)。無損濾波器在現(xiàn)有技術(shù)中是已知的，例如WO 96/37048，但是不可避免的是，它們需要量化到與正在處理的信號(hào)相同位深度，并且在“傳統(tǒng)”設(shè)備上再現(xiàn)時(shí)不可避免地增加噪聲。本發(fā)明允許使用更精細(xì)的量化的濾波器，更精細(xì)量化用來最小化所增加的噪聲。

因此，在一些實(shí)施例中，所述量化映射之前是濾波器，該濾波器的輸出比所述第一量化格柵更精細(xì)地被量化。在優(yōu)選實(shí)施例中，濾波器被配置為將調(diào)整值加到前向信號(hào)路徑的側(cè)鏈，其中，調(diào)整值是濾波器的輸入和輸出的先前樣本的線性或非線性確定性函數(shù)。這種添加可以被無損地逆轉(zhuǎn)，即使調(diào)整值被比前向信號(hào)路徑更精細(xì)地量化。精細(xì)量化減少了來自濾波的附加噪聲。

在第二方面，本發(fā)明提供了一種用于從第二音頻信號(hào)的一部分恢復(fù)第一音頻信號(hào)和水印數(shù)據(jù)的方法，其中，所述第一和第二音頻信號(hào)是脈沖編碼調(diào)制‘PCM’信號(hào)，并且其中，所述第二音頻信號(hào)是被無損地加水印的PCM信號(hào)，并且所述第一音頻信號(hào)具有取決于第一量化格柵的樣本，所述方法包括：

確定第三量化格柵；

接收所述第二音頻信號(hào)作為量化樣本；

從所述第二音頻信號(hào)恢復(fù)第一數(shù)據(jù)和所述水印數(shù)據(jù)，其中，所述第一數(shù)據(jù)是用于恢復(fù)所述第一音頻信號(hào)的重構(gòu)數(shù)據(jù)；

通過根據(jù)所述第二音頻信號(hào)和第三音頻信號(hào)中的至少一個(gè)的先前樣本量化所述第二音頻信號(hào)的樣本來生成被量化到所述第三量化格柵上的第三音頻信號(hào)的樣本；

根據(jù)所述第一數(shù)據(jù)向所述第三音頻信號(hào)應(yīng)用量化映射以提供映射信號(hào)；以及

根據(jù)所述映射信號(hào)提供所述第一音頻信號(hào)。

通常，所述第一音頻信號(hào)無損地復(fù)制被呈獻(xiàn)給編碼器的原始PCM音頻信號(hào)的一部分，并且所述第二音頻信號(hào)是所述原始PCM音頻信號(hào)的加水印版本。該信號(hào)具有量化樣本，第一音頻信號(hào)具有取決于第一量化格柵的樣本。第三量化格柵通常被選擇為比第一量化格柵更粗略，如果第三信號(hào)與水印無關(guān)的話，該特征通常是必要的，從而使第三信號(hào)僅攜帶來自第一信號(hào)的音頻信息。更粗略的分辨率意味著丟失某些原始音頻信息，但是該信息被攜帶在第一數(shù)據(jù)內(nèi)，同樣被稱為“重構(gòu)數(shù)據(jù)”。在應(yīng)用量化映射的步驟中，第一數(shù)據(jù)內(nèi)的重構(gòu)信息與更粗略地量化的第三信號(hào)組合，從而使映射信號(hào)具有全分辨率。

直接地，映射信號(hào)等于第一信號(hào)，所以“提供”方法步驟是空運(yùn)算。然而，在一些實(shí)施例中，提供可以并入其他功能，諸如添加調(diào)整樣本，如以下將解釋的。

優(yōu)選地，所述第一和第三量化格柵中的至少一個(gè)格柵從不同樣本間變化。如果不是這種情況，這兩個(gè)格柵將具有固定的關(guān)系，并且相應(yīng)的編碼器中的相應(yīng)的兩個(gè)格柵也將需要具有固定的關(guān)系，如果解碼方法是無損的話。結(jié)果，相應(yīng)的編碼器中的量化映射將需要并入顫振以避免量化偽影，但是如果加水印的信號(hào)在標(biāo)準(zhǔn)PCM設(shè)備上再現(xiàn)的話，顫振引起噪聲懲罰。

在優(yōu)選實(shí)施例中，所述第三量化格柵是根據(jù)偽隨機(jī)序列生成器的輸出確定的。與上述類似，該要求需要確保由相應(yīng)的編碼器中的量化映射引入的量化誤差與第一音頻信號(hào)解除關(guān)聯(lián)。

在優(yōu)選實(shí)施例中，所述第一、第二和第三音頻信號(hào)是多通道的，并且所述第二和第三量化格柵中的至少一個(gè)格柵未被形成為每個(gè)通道上的單獨(dú)量化格柵的笛卡爾積。再次，通過與上述類似的爭論，使用已知的量化方法，相比于單獨(dú)的通道量化，來自相應(yīng)的編碼器中的信號(hào)重新量化的附加噪聲可以然后被減少。

在一些實(shí)施例中，第一信號(hào)直接由量化映射產(chǎn)生，所以第一信號(hào)等于映射信號(hào)。然而，為了避免提供從已經(jīng)修改的第一信號(hào)導(dǎo)出的加水印的信號(hào)的無損重構(gòu)，所述方法可以進(jìn)一步包括以下步驟：

確定比所述第一量化格柵更精細(xì)的第四量化格柵；根據(jù)所述第一音頻信號(hào)和所述映射信號(hào)中的至少一個(gè)信號(hào)的先前樣本計(jì)算調(diào)整樣本，所述調(diào)整樣本具有取決于所述第四量化格柵上的值；以及

將所述調(diào)整加到所述映射信號(hào)。

這種實(shí)施例允許使用加水印的信號(hào)，這種加水印的信號(hào)是使用從第一信號(hào)減去相應(yīng)的調(diào)整的編碼器編碼的，從而提供濾波器功能。如以上解釋的，這使加水印的信號(hào)在被解釋為普通的PCM信號(hào)時(shí)具有與原始“第一”信號(hào)不同的頻率響應(yīng)，但是具有比已經(jīng)使用分離的無損濾波器執(zhí)行的頻率響應(yīng)修改更少的噪聲。對于無損的解碼方法，調(diào)整值還需要被傳達(dá)到量化映射，如以下將解釋的。

在優(yōu)選實(shí)施例中，第二方面的解碼方法包括以下附加步驟：

從所述第二音頻信號(hào)恢復(fù)初始化數(shù)據(jù)；以及

使用所述初始化數(shù)據(jù)確定從所述第三音頻信號(hào)的連續(xù)樣本選擇的位。

該特征與從“重啟點(diǎn)”而不是從開始處解碼流有關(guān)。如早先解釋的，一旦已經(jīng)確定了每個(gè)連續(xù)樣本內(nèi)的位選擇，第三音頻信號(hào)的連續(xù)樣本可以被完整地重構(gòu)。由于第二音頻信號(hào)的樣本被直接接收到，這提供了足以允許解碼器中的噪聲成形或其他濾波器的初始化數(shù)據(jù)以精確地模擬編碼器中的相應(yīng)濾波器的運(yùn)算，如其他地方解釋的，這足以使得解碼器從那個(gè)時(shí)間向前確定第三音頻信號(hào)。

優(yōu)選地，本系統(tǒng)被配置為使為了確定第三音頻信號(hào)而接收的初始化數(shù)據(jù)不大于通道數(shù)乘以第三音頻信號(hào)的值數(shù)的8位倍。這最小化了流開銷，并且如早先解釋的，這是通過使用合適的噪聲成形濾波器，并且預(yù)先確定第三音頻信號(hào)與第二音頻信號(hào)之間的差異的嚴(yán)格約束促成的。

第三方面，本發(fā)明還提供了一種用于更改第二音頻信號(hào)中的水印的方法，所述第二音頻信號(hào)是根據(jù)第一方面的方法生成的無損地加水印的PCM信號(hào)。該更改是在無需完全地恢復(fù)原始信號(hào)和重新編碼的情況下實(shí)現(xiàn)的，這種恢復(fù)和重新編碼將在計(jì)算上是更昂貴的。

第三方面，所述方法包括以下步驟：

接收所述第二音頻信號(hào)作為量化樣本；

從所述第二音頻信號(hào)恢復(fù)包括嵌入式水印數(shù)據(jù)的第二數(shù)據(jù)；

通過根據(jù)所述第二和第三音頻信號(hào)中的至少一個(gè)的先前樣本量化所述第二音頻信號(hào)來生成被量化到第三量化格柵上的第三音頻信號(hào)的樣本；

通過更改所述第二數(shù)據(jù)中的所述嵌入式水印產(chǎn)生第四數(shù)據(jù)；

根據(jù)第四數(shù)據(jù)確定第四量化格柵；根據(jù)所述第四和第三音頻信號(hào)中的至少一個(gè)音頻信號(hào)的先前樣本在第四量化格柵上將所述第三音頻信號(hào)量化為第四音頻信號(hào)。

由此可見，此第三方面的方法步驟基本上對應(yīng)于第二方面的前幾個(gè)步驟和第一方面的最后幾個(gè)步驟。

為了提供與第一和第二方面的實(shí)施例的兼容性，優(yōu)選地，第三量化格柵從一個(gè)采樣時(shí)刻到另一個(gè)采樣時(shí)刻變化。類似地，優(yōu)選地，所述第三量化格柵是根據(jù)偽隨機(jī)序列生成器的輸出確定的。

在其中所述第二、第三和第四音頻信號(hào)是多通道的應(yīng)用中，優(yōu)選地，所述第二、第三或第四量化格柵中的至少一個(gè)格柵未被形成為每個(gè)通道上的單獨(dú)量化格柵的笛卡爾積。該優(yōu)選是為了與具有類似的優(yōu)選特性的編碼器和解碼器兼容。

第四方面，本發(fā)明提供了一種被適配成使用第一方面的方法對PCM音頻信號(hào)無損地加水印的編碼器。還提供了一種被適配成使用第三方面的方法更改水印的水印修改器。

第五方面，本發(fā)明提供了一種被適配成使用第二方面所述的方法從被無損地加水印的PCM信號(hào)恢復(fù)PCM音頻信號(hào)和水印數(shù)據(jù)的解碼器。

第六方面，本發(fā)明提供了一種包括根據(jù)第四方面的編碼器結(jié)合根據(jù)第五方面的解碼器的編解碼器。

第七方面，本發(fā)明提供了一種包括使用第一方面的方法無損地加水印的PCM音頻信號(hào)的數(shù)據(jù)載體。

第八方面，一種計(jì)算機(jī)程序產(chǎn)品包括指令，當(dāng)被信號(hào)處理器執(zhí)行時(shí)，所述指令使所述信號(hào)處理器執(zhí)行第一至第三方面中任一方面所述的方法。

盡管根據(jù)第三方面的方法可以有利地用于更改已經(jīng)根據(jù)第一方面的方法生成的無損地加水印的PCM音頻，其還能夠獨(dú)立地用于更改任何合適的無損地加水印的PCM音頻。再次，該更改是在無需完全地恢復(fù)原始信號(hào)和重新編碼的情況下實(shí)現(xiàn)的，這種恢復(fù)和重新編碼將在計(jì)算上更昂貴。

相應(yīng)地，第九方面，本發(fā)明提供了一種用于更改輸入音頻信號(hào)中的水印的方法，所述輸入音頻信號(hào)是無損地加水印的PCM信號(hào)，所述方法包括以下步驟：

接收所述輸入音頻信號(hào)作為量化樣本；

從所述輸入音頻信號(hào)恢復(fù)包括嵌入式水印數(shù)據(jù)的輸入數(shù)據(jù)；

通過根據(jù)所述輸入音頻信號(hào)和中間音頻信號(hào)中的至少一個(gè)音頻信號(hào)的先前樣本量化所述輸入音頻信號(hào)來生成量化到中間量化格柵上的所述中間音頻信號(hào)的樣本；

通過更改所述輸入數(shù)據(jù)中的所述嵌入式水印產(chǎn)生輸出數(shù)據(jù)；

根據(jù)所述輸出數(shù)據(jù)確定輸出量化格柵；

根據(jù)所述輸出和中間音頻信號(hào)中的至少一個(gè)音頻信號(hào)的先前樣本在所述輸出量化格柵上將所述第三音頻信號(hào)量化為輸出音頻信號(hào)。

在一些實(shí)施例中，所述中間量化格柵從一個(gè)采樣時(shí)刻到另一個(gè)采樣時(shí)刻變化。

在一些實(shí)施例中，所述中間量化格柵是根據(jù)偽隨機(jī)序列生成器的輸出確定的。

在其他方面，本發(fā)明提供了一種被適配成使用第九方面的方法更改水印的水印修改器，并且還提供了一種包括指令的計(jì)算機(jī)程序產(chǎn)品，當(dāng)被信號(hào)處理器執(zhí)行時(shí)，所述指令使所述信號(hào)處理器執(zhí)行第九方面的方法。

如將所理解的，本發(fā)明提供了用于用水印無損地編碼和解碼PCM音頻信號(hào)以及用于更改無損地加水印的PCM信號(hào)中的水印的各種方法和設(shè)備。其他變化和修飾將在本公開中對本領(lǐng)域技術(shù)人員明顯。

附圖說明

下面參照附圖，詳細(xì)地描述本發(fā)明的示例，在附圖中：

圖1A是根據(jù)本發(fā)明的實(shí)施例的編碼器的信號(hào)流示意圖；

圖1B是與圖1A的編碼器相對應(yīng)的解碼器的信號(hào)流示意圖；

圖2示出了圖1B中的用于雙通道信號(hào)的量化器211的運(yùn)算的細(xì)節(jié)；

圖3示出了圖1A中的用于雙通道信號(hào)的量化器112的運(yùn)算的細(xì)節(jié)；

圖4示出了圖1B中的用于雙通道信號(hào)的量化器212的運(yùn)算的細(xì)節(jié)；

圖5A示出了圖1A的量化器111的當(dāng)被適配成用于雙通道信號(hào)的維羅尼區(qū)域的曲線圖，以及圖5B示出了維羅尼區(qū)域的擴(kuò)展曲線圖；

圖6示出了根據(jù)本發(fā)明加水印的PCM音頻流，示出了兩個(gè)重啟點(diǎn)和在這兩個(gè)重啟點(diǎn)中的每一個(gè)重啟點(diǎn)之前編碼的重啟輔助數(shù)據(jù)；

圖7示出了在圖1B中示出的解碼器部分的可替代配置，用于立即在重啟點(diǎn)之后使用；

圖8A示出了可以如何通過向PCM音頻信號(hào)添加先前樣本值的更精細(xì)量化的函數(shù)來修改此信號(hào)；

圖8B示出了可以如何修改在圖1B中示出的解碼器的后一級以修改無損地逆轉(zhuǎn)圖8A的信號(hào)；

圖9示出了可以如何修改在圖8B中示出的解碼器部分，以在未接收到提供圖8A中示出的無損重構(gòu)所需的重啟信號(hào)時(shí)，臨時(shí)地提供原始信號(hào)的無損重構(gòu)；以及

圖10示出了如何從根據(jù)本發(fā)明加水印的流提取水印數(shù)據(jù)以及然后如何用可替代的加水印數(shù)據(jù)對此流加水印而無需完全地解碼和重新編碼音頻信號(hào)。

具體實(shí)施方式

在被稱為“減法顫振”的過程中，向信號(hào)添加隨機(jī)偏置，接下來將結(jié)果值量化，并且然后再次減去相同的偏置。減法震顫已知用于通過使得量化誤差類似于噪聲并獨(dú)立于所量化的信號(hào)而增加量化的透明度，如在M.Gerzon和P.Craven在“A High Rate Buried Data Channel for Audio CD(音頻CD的高速率埋入數(shù)據(jù))”(發(fā)表于1993年第94屆AES柏林會(huì)議的預(yù)印本3551)(以下稱為Gerzon)中所討論的。

如Gerzon所指出的，減法顫振要求從連續(xù)的分布的隨機(jī)偏離。在我們的實(shí)施例中，我們將需要使得偏離具有有限數(shù)量的位以控制將被用作乘法器的輸入的被減法顫振的信號(hào)的字寬。8位的隨機(jī)偏離對于我們的目的來說是足夠的，將任何量化偽影從16位水平附近向下移動(dòng)到24位水平附近，同時(shí)仍允許32位字中存在用于16位音頻的大量空間。

通常，使用晶格量化器，從而使在減法之前量化值取決于量化晶格。人們還可以僅僅在量化之前進(jìn)行減法并且在之后進(jìn)行加法。在這種情況下，結(jié)果值取決于量化晶格，并且具有由隨機(jī)偏離給出的偏置。這提供了對減法顫振的可替代視角，即，全部的運(yùn)算是一次量化到隨機(jī)化格柵上。

我們應(yīng)當(dāng)使用術(shù)語“量化偏置”來表示該格柵從限定量化的晶格的偏置。我們應(yīng)當(dāng)頻繁地考慮從音頻信號(hào)的不同樣本間變化的量化偏置，該音頻信號(hào)通常是通過偽隨機(jī)序列生成器生成的，但是有時(shí)需要某些修改，并且有時(shí)通過其他方式生成。

我們還應(yīng)當(dāng)使用術(shù)語“量化格柵”來指代量化器將輸出的點(diǎn)集，該點(diǎn)集是量化晶格與偏置的組合。如何量化偏置從不同樣本間變化，則量化格柵也將這樣。

當(dāng)我們說使用偽隨機(jī)數(shù)生成器時(shí)，我們將要求其輸出在編碼器和解碼器之間匹配。這可以通過將樣本數(shù)量數(shù)據(jù)包括在開銷中，從而與水印一起傳送而實(shí)現(xiàn)。當(dāng)解碼器在音軌的半路開始運(yùn)算時(shí)，其可以使用樣本數(shù)量數(shù)據(jù)來尋求偽隨機(jī)序列中的正確位置，從而使其偽隨機(jī)數(shù)生成器的后續(xù)輸出將匹配在編碼器中使用的輸出。

現(xiàn)在將參照處理2通道16位PCM音頻的實(shí)施例解釋本發(fā)明。然而，數(shù)量16并不存在任何特殊之處并且本領(lǐng)域技術(shù)人員將容易將本公開適用于其他位深度或量化方案。熟悉Gerzon的人也應(yīng)當(dāng)容易一般化到一個(gè)或多個(gè)通道。

加水印器的輸入可以來自諸如CD等源，其在每個(gè)通道上的樣本在晶格{2^-16k}上被量化，由2^-16的所有整數(shù)倍組成。然而，我們不排除以下可能性：其已經(jīng)由減法顫振過程生成并且具有加水印器已知的并且被編程到水印恢復(fù)器或解碼器的偽隨機(jī)量化偏置。我們由此將加水印器的輸入和來自后續(xù)恢復(fù)器的輸出說成具有“第一量化偏置”。如果是CD，這對于所有樣本將是零，在音頻是通過減法顫振過程提供的情況下，其將由商定的偽隨機(jī)序列給出。

我們的加水印器將遵循WO2013061062來將g^-1增益(其中g(shù)<l)應(yīng)用到音頻，并且通過對結(jié)果音頻進(jìn)行軟削波(使用削波單元133和求逆運(yùn)算，解除削波單元233)來處理任何結(jié)果超載。增益和削波的組合對應(yīng)于WO2004066272的S形增益函數(shù)。

將參照圖1A和圖1B描述本發(fā)明。雙通道16位PCM音頻信號(hào)被認(rèn)為包括樣本，每個(gè)樣本是分量被量化到16位的二維向量。在圖1A中，被量化到具有量化偏置O₁的晶格的信號(hào)101呈獻(xiàn)給編碼器。PCM信號(hào)的樣本值除以131增益g(其中g(shù)<1)，并且然后被量化111到粗略量化晶格以生成中間信號(hào)103。該粗略格柵聯(lián)合地將兩個(gè)通道量化至15.5位級，其中，量化晶格定義為{[2^-16，2^-16]，[2^-16，-2^-16]}，其中，偽隨機(jī)偏置為O₃。因此，量化格柵為[2^-16(j+k)，2^-16(j-k)]+O₃，其中j，

現(xiàn)在假設(shè)削波單元133未調(diào)整該信號(hào)(對于大部分范圍成立)，則信號(hào)104是信號(hào)103的復(fù)制。信號(hào)104然后再次被量化112到相同15.5位晶格，但是具有根據(jù)數(shù)據(jù)143(包括水印)選擇的偏置以生成具有將數(shù)據(jù)143嵌入到輸出信號(hào)102中的效果的輸出信號(hào)102。偏置是[0,0]以嵌入0并且是[0，2^-16]以嵌入1，所以數(shù)據(jù)143被以類似于在Gerzon中描述的方式包含在這兩個(gè)通道的Isb的奇偶校驗(yàn)中。

如圖1B所示，相應(yīng)的解碼器從編碼器接收音頻輸出102的復(fù)制202。通過檢查樣本值以確定哪一個(gè)量化偏置O₂被使，從而恢復(fù)數(shù)據(jù)243(143的復(fù)制品)。信號(hào)202然后被量化212到上述15.5位晶格，其中量化偏置為O₃，從而使量化器212所引入的量化誤差與量化器112所引入的量化誤差相反，從而使信號(hào)204復(fù)制信號(hào)104。解除削波單元233對削波單元133求逆，從而信號(hào)203復(fù)制信號(hào)103。接下來使用g對該信號(hào)進(jìn)行加乘231，并且該信號(hào)被量化211到具有量化偏置O₁的16位晶格。量化器211不總是將最近的量化值輸出到其輸入，如以下將參照圖2描述的。其接收可以在每個(gè)通道上將其輸出調(diào)整±2^-16的重構(gòu)數(shù)據(jù)，該重構(gòu)數(shù)據(jù)被設(shè)置成在確立無損運(yùn)算的信號(hào)101上復(fù)制該值。

同時(shí)，設(shè)置了濾波器121、221、122、222，使解碼器版本接收復(fù)制編碼器中的那些輸入信號(hào)的輸入信號(hào)，并且因此在啟動(dòng)時(shí)受到適合的初始化，其輸出同樣匹配。其效果是成形量化器引入的量化誤差，從而使加水印的信號(hào)102中的全部量化誤差被頻譜地成形，以減少可聽性，并且由此增加水印的透明度。其用全極傳遞函數(shù)將白量化器噪聲成形，如圖7中的Gerzon。對于44.1kHz運(yùn)算的合理的濾波器G(z)是：

G(Z)＝1+1.2097z^-1+0.2578z^-2+0.1742z^-3+0.0192z^-4-0.2392z^-5

為了稍后引用，1/G(z)的脈沖響應(yīng)的絕對值之和小于27。

15.5位量化比編碼器輸入信號(hào)的16位量化更粗略。因此，即使g<l，有時(shí)存在到111的多個(gè)輸入值，這些輸入值被量化到與103相同的值。當(dāng)這種情況發(fā)生時(shí)，歧義解析器113(接收信號(hào)105，即，由111所引入的量化器誤差的縮放版本)輸出指示實(shí)際上呈現(xiàn)了哪個(gè)可能的輸入值的數(shù)據(jù)141。伴隨著格式化開銷，該重構(gòu)數(shù)據(jù)141與所需要的水印被復(fù)用至數(shù)據(jù)143中。

相應(yīng)地，解碼器從243提取重構(gòu)數(shù)據(jù)241，并且在到111的多個(gè)輸入值可能已經(jīng)產(chǎn)生相同值103的情況下使用該數(shù)據(jù)來調(diào)整來自211的輸出。在圖2中擴(kuò)展了量化器211。圖2示出了輸入信號(hào)如何首先被量化213到最近的值并且量化誤差205如何被饋送到調(diào)整器215。事實(shí)證明，對于任何增益值g，量化誤差205足以指示多少至111的輸入值可能已經(jīng)產(chǎn)生103。如果答案是多于一個(gè)，調(diào)整器215消耗來自241的數(shù)據(jù)，以確定將加到213的輸出的調(diào)整207。因此，該輔助數(shù)據(jù)241確保201即使在某個(gè)其他量化值可能稍微更接近量化器211的輸入時(shí)也能復(fù)制101。

與在WO2004066272中描述的15位量化器相比，使用上述15.5位量化器確實(shí)使運(yùn)算復(fù)雜化。然而，這是有用的，因?yàn)檫@意味著加水印添加了就像使用15位量化器使加水印器更透明那樣一半的噪聲?？梢赃M(jìn)一步例如使用聯(lián)合量化4個(gè)樣本的15.75位量化器進(jìn)行該過程，4個(gè)樣本各自上的1個(gè)或者2個(gè)通道中的每一通道上2個(gè)連續(xù)樣本將再次將所添加的噪聲減半。然而，我們的實(shí)施例僅處理2個(gè)通道并且在聯(lián)合量化連續(xù)樣本時(shí)將存在更大的復(fù)雜性。

圖3示出了15.5位量化器112的示例。框301實(shí)現(xiàn)了采取其雙通道輸入的15.5位晶格量化器，并且通過元件304-307形成通道之和與之差的一半。16位量化器308和309然后量化通道，并且通過進(jìn)一步的求和求差形成輸出。301的可能輸出是其Isb都是0或者都是1的多對整數(shù)。

通過在框301之前從一個(gè)通道減去302位數(shù)據(jù)143并且將其在之后加回去303而將框301擴(kuò)展到框112。如果該位是零，則112以偏置[0,0]量化到晶格量化格柵上。如果該位是一，則112以偏置[0,2^-16]量化到晶格格柵上，其中Isb的一個(gè)通道是0，另一個(gè)是1。

返回參照圖1B，通過檢查來自兩個(gè)通道的相應(yīng)樣本的多對Isb的奇偶校驗(yàn)來產(chǎn)生數(shù)據(jù)243以確定在15.5位量化中使用過哪一個(gè)偏置。如果這些通道具有相同的Isb，則零被生成至243中，或者如果這些通道具有不同的Isb，則生成一。

量化器212量化到與112相同的分辨率。如圖4所示，這與量化器112非常類似，除了偏置O₃是偽隨機(jī)地選擇的，而不是兩個(gè)偏置之間的數(shù)據(jù)驅(qū)使的選擇。相應(yīng)地，來自生成介于0和2^-15之間的值的偽隨機(jī)數(shù)生成器(PRNG)的兩個(gè)樣本用于為來自301量化到其上的常量格柵的量化格柵G₃創(chuàng)建2D偏置。從至301的輸入減去該偏置并且在301的輸出加入該偏置。

有實(shí)現(xiàn)相同的效果的其他方式，例如，312和313的輸出可以在量化器308和309之前被立即減去，并且之后被立即加回來。然而，這種方案的不同之處在于來自312和313的值之間的映射與偏置O₃的選擇，所以需要在解碼器量化器212與編碼器量化器111之間進(jìn)行兼容選擇。

只要在112和212中使用的晶格量化器308和309彼此兼容，解碼器量化器212將移除112所引入的量化誤差，將信號(hào)203恢復(fù)為信號(hào)103的復(fù)制。然而，兼容并不意味著完全相同。在本實(shí)施例中，Q₁₁₂(x)＝Δ(ceiling(Δ^-1x-0.5))并且Q₂₁₂(x)＝Δ(floor(Δ^-1x+0.5))，其中，Δ是步長2^-16。充分的兼容性條件是對于所有x存在Q₁₁₂(x)＝-Q₂₁₂(-x)＝Q₁₁₂(x-Δ)+Δ。

同樣，量化器111以偏置O₃量化到15.5位，并且架構(gòu)應(yīng)當(dāng)與212的架構(gòu)匹配，從而使其具有從偽隨機(jī)數(shù)到O₃的相同映射。偏置O₃的選擇需要在編碼器和解碼器中都匹配，所以212中的偽隨機(jī)數(shù)生成器必須被同步為匹配111中的那些生成器。這可以通過周期性地將同步信息(諸如樣本數(shù))嵌入在數(shù)據(jù)143中來實(shí)現(xiàn)。

圖5A和圖5B示出了如何從縮放誤差量化器誤差信號(hào)105產(chǎn)生數(shù)據(jù)141。(為了避免混淆示意圖，來自噪聲成形濾波器121的輸出假設(shè)為零)。

圖5A中示出的曲線圖中，軸線是信號(hào)101的左通道和右通道，其中，水平線和豎直線組成的格柵對應(yīng)于可以在輸入上呈現(xiàn)的可允許的量化值(由16位晶格和偏置O₁給出)。

這些交點(diǎn)之一被標(biāo)記為表示在這個(gè)說明性場景上呈現(xiàn)的實(shí)際值。在除以g、由111量化并且乘以g之后，示出了信號(hào)106的示意性值。上述量化器111的維羅尼(Veroni)區(qū)域是菱形。圖5A的曲線圖上示出了通過g縮放。當(dāng)然，由于信號(hào)101除以g被量化到信號(hào)106，101的實(shí)際值位于該區(qū)域內(nèi)。如果該值是可行的唯一值，則相應(yīng)的解碼器將能夠從106的值唯一地標(biāo)識(shí)101的實(shí)際值。在所示出的情況下，示出了一個(gè)其他可能的值，該值也將已經(jīng)產(chǎn)生106的給定值，所以解碼器將需要附加信息位141來解析位于維羅尼區(qū)域中的哪一個(gè)量化值應(yīng)當(dāng)被輸出。

圖5B中示出的曲線圖擴(kuò)展了維羅尼區(qū)域，該區(qū)域的中心在信號(hào)105＝0上。如果信號(hào)105位于任何虛線菱形內(nèi)，則存在另一個(gè)可能值位于相對的虛線菱形中的信號(hào)101(該值在一維中由±g轉(zhuǎn)換)，并且歧義解析器113需要發(fā)送數(shù)據(jù)141中的一位信息以解析解碼器應(yīng)當(dāng)產(chǎn)生這兩個(gè)相反值中的哪一個(gè)值。例如，如果信號(hào)105位于左側(cè)菱形中，則可以發(fā)送零，而如果其位于右側(cè)菱形中，則可以發(fā)送1。同樣，可以針對底部菱形發(fā)送0并且可以針對頂部菱形發(fā)送1。可替代地，如果信號(hào)105的值位于非虛線菱形中，則其必須位于中央交叉區(qū)域中。在此，信號(hào)101不存在任何選擇可能性并且不需要發(fā)送任何數(shù)據(jù)。對于該量化器選擇，永遠(yuǎn)不存在多于2個(gè)值位于維羅尼區(qū)域中的任何可能性，所以數(shù)據(jù)141每個(gè)樣本最多具有1位。

每個(gè)虛線菱形的寬度是2g-1，所以如果g<0.5，則虛線菱形消失并且永遠(yuǎn)不存在需要解析的任何歧義。同樣，對于g＝1，交叉消失并且所以141上的數(shù)據(jù)速率總是每個(gè)樣本1位，這使量化器112的數(shù)據(jù)容量飽和，不存在用于開銷或水印的富裕容量。因此，要求g<l。

在某些情況下，可以容忍計(jì)算虛線區(qū)域的不準(zhǔn)確性。重要的是編碼器計(jì)算必須精確地匹配在解碼器中執(zhí)行的計(jì)算(否則編碼器和解碼器運(yùn)算將不同)。同樣重要的是虛線區(qū)域不被計(jì)算的太小，否則可能存在信號(hào)201的解碼器無法產(chǎn)生的值。但是，如果虛線區(qū)域稍微比嚴(yán)格要求的大的話則不是大問題。這種不準(zhǔn)確性的后果是數(shù)據(jù)141偶爾攜帶不需要的數(shù)據(jù)位，稍微浪費(fèi)數(shù)據(jù)容量。

信號(hào)105的計(jì)算的小誤差(諸如精細(xì)量化，如果解碼器乘以231g產(chǎn)生較大字寬的話)可以由此被容忍，只要解碼器作出匹配近似(在231中)并且它們都拉長虛線菱形的大小，以容忍最壞情況下不準(zhǔn)確性。

在解碼器中，量化器213的輸出是可能已經(jīng)被呈獻(xiàn)給編碼器的一個(gè)可能值。調(diào)整器215可以向歧義解析器113作出有關(guān)重構(gòu)位是否需要從數(shù)據(jù)241拉入的相應(yīng)決定。如果需要，并且該位指示與205位于其中的虛線菱形相對的虛線菱形，則調(diào)整器215輸出調(diào)整信號(hào)207，以將量化器211的輸出調(diào)整到正確值，從而復(fù)制信號(hào)101。任何在左側(cè)通道或右側(cè)通道上的調(diào)整將是±1Isb。

削波

由于增益元件131，信號(hào)103將超過16位音頻的可表示范圍，并且削波122在此將信號(hào)帶回可表示范圍中，從而使加水印的輸出102不會(huì)超載。

對于大部分信號(hào)范圍，削波單元122不對信號(hào)進(jìn)行任何修改。接近±全范圍，其具有<l的小信號(hào)增益，并且將其輸入的多個(gè)值映射到其輸出的特定值。當(dāng)這種情況發(fā)生時(shí)，其生成指示了實(shí)際上呈現(xiàn)了該多個(gè)值中的哪一個(gè)值的削波重構(gòu)數(shù)據(jù)142。削波重構(gòu)數(shù)據(jù)142與重構(gòu)數(shù)據(jù)141和水印組合以形成數(shù)據(jù)143。

解除削波單元233與削波單元相逆。對于大部分信號(hào)范圍，這對信號(hào)沒有任何修改。接近±全范圍，其具有<l的小信號(hào)增益，并且將其輸入的特定值映射到其輸出的多個(gè)值。當(dāng)這種情況發(fā)生時(shí)，其使用削波重構(gòu)數(shù)據(jù)242以選擇實(shí)際上輸出了該多個(gè)值中的哪一個(gè)值。從數(shù)據(jù)243一起提取削波重構(gòu)數(shù)據(jù)242、重構(gòu)數(shù)據(jù)141以及水印。在WO2013061062中描述了該運(yùn)算，例如，如其圖11所示。

為了本實(shí)施例的簡潔，我們將信號(hào)103和104都量化到15位晶格(沒有偏置)，該晶格是15.5位晶格的子集，并且因此不會(huì)更改信號(hào)104的量化偏置。當(dāng)通道未進(jìn)行削波時(shí)，我們希望它通過削波而保持完全地未被修改，并且所以當(dāng)通道進(jìn)行削波時(shí)，我們選擇以2^-15的倍乘更改該信號(hào)，從而使我們保持在相同的量化偏置而不會(huì)更改另一個(gè)通道。

由于削波所造成的調(diào)整的15位量化像其他噪聲源被放在一起時(shí)那樣大聲，并且未噪聲成形。我們認(rèn)為在我們尋求更高的透明度的過程中這是可接受的，因?yàn)槠鋬H在信號(hào)大聲時(shí)的削波期間發(fā)生并且從軟削波經(jīng)歷失真。此外，在稍后的實(shí)施例中，我們描述了濾波的使用，可以極大地減少信號(hào)削波的發(fā)生率。增益和削波的組合給出了WO2004066272的S形傳遞函數(shù)C。人們可能好奇我們?yōu)槭裁催x擇組合線性增益和S形削波函數(shù)，而不是在一個(gè)階段中全部執(zhí)行，尤其就像在一個(gè)階段中執(zhí)行，將不會(huì)引入附加的15位噪聲源那樣。

答案是我們希望從樣本到樣本更改增益g并且相信尤其是假定我們的隨機(jī)化15.5位聯(lián)合量化格柵G₃構(gòu)建歧義解析器113和調(diào)整器215的復(fù)雜性將超過此方法引入的噪聲的缺點(diǎn)。

初始化

如上所述，信號(hào)201的無損重構(gòu)需要來自濾波器221和222的輸出匹配編碼器中的濾波器121和122的輸出。如果解碼器在先前樣本上無損地運(yùn)算的話，則滿足該要求，并且當(dāng)編碼器和解碼器都能夠?qū)⑵涓髯缘臑V波器狀態(tài)初始化至通用值(諸如零)時(shí)，也可以在編碼軌開始時(shí)滿足該要求。然而，解碼器的有用運(yùn)算還要求經(jīng)由編碼流半路啟動(dòng)的能力，這使得將量化噪聲頻譜成形比人們可能剛開始假設(shè)的情況更棘手。

在我們的實(shí)施例中，我們提供了流中的某些點(diǎn)作為重啟點(diǎn)，如圖6所示。示出了加水印的音頻102，其中數(shù)據(jù)通道143作為其Isb的異或XOR。400、401和402是重啟點(diǎn)，其中，解碼器將能夠開始原始音頻的無損解碼。重啟點(diǎn)在音軌的開始處，并且在此濾波器221和222可以被初始化到0，匹配編碼器處的類似重置。然而，重啟點(diǎn)401和402在音軌中間并且因此埋入數(shù)據(jù)143必須包含重啟輔助信息411和412，這些輔助信息將用于初始化用于啟動(dòng)解碼器從401或402無損地解碼的濾波器狀態(tài)。

現(xiàn)在，在相應(yīng)的重啟點(diǎn)401之前埋入重啟輔助信息411，從而使當(dāng)解碼器需要使用該數(shù)據(jù)來在401初始化濾波器狀態(tài)時(shí)，解碼器可以配備該數(shù)據(jù)?，F(xiàn)在，在某個(gè)點(diǎn)更改埋入數(shù)據(jù)143影響112的量化和濾波器122意味著此更改后的數(shù)據(jù)同樣影響后續(xù)量化。如果重啟輔助數(shù)據(jù)411取決于濾波器122在重啟點(diǎn)401的狀態(tài)，我們將具有用于編碼器進(jìn)行解析的笨拙循環(huán)性，因?yàn)樵摖顟B(tài)取決于早先的埋入數(shù)據(jù)。

幸運(yùn)的是，其中(G-1)是有線脈沖響應(yīng)(FIR)濾波器的全極噪聲成形架構(gòu)允許了避免這種循環(huán)性。濾波器122的狀態(tài)是中間信號(hào)104與加水印的信號(hào)102的最近值之間的差異。隨著解碼器接近重啟點(diǎn)401，其已經(jīng)在重啟點(diǎn)之前觸及信號(hào)202，即，102的復(fù)制。所以這對于重啟信息倆說足以使允許在401之前立即針對n個(gè)樣本重構(gòu)中間信號(hào)104，其中，濾波器122的輸出是其輸入的先前n個(gè)值的函數(shù)。由于信號(hào)104不取決于埋入數(shù)據(jù)143，循環(huán)性得以避免。

重啟信息可以包含信號(hào)104的這些n個(gè)樣本的完整拷貝，但是如果重啟點(diǎn)比較頻繁，則這可能是不方便的大量數(shù)據(jù)?，F(xiàn)在我們呈現(xiàn)一種允許非常少的重啟信息即以足夠的方法。

信號(hào)104和102的不同之處僅僅在于噪聲成形量化，并且所以其不同被界限?？梢詮脑肼暢尚蝹鬟f函數(shù)的脈沖響應(yīng)和量化誤差的大小計(jì)算該界限。在我們的實(shí)施例中，量化器211在通道上產(chǎn)生2^-16g<2^-16的最大絕對誤差。并且，噪聲成形濾波器1/G(z)的脈沖響應(yīng)的絕對值之和小于27。所以信號(hào)104與102之差在范圍(-27×2^-16，27×2^-16)內(nèi)。此外，對于解碼器來說，信號(hào)104在任何樣本上的Isb是從所定義的量化格柵G₃是已知的。因此，僅每個(gè)樣本需要6位的重啟輔助數(shù)據(jù)(這是非常保守的約束，并且通常更少的比位足夠使用)。

圖7中示出了濾波器222的重啟運(yùn)算。與常規(guī)運(yùn)算相比，忽略了來自濾波器222的輸出。而是，量化器431通過量化202到15.5位量化的粗略子集來生成204，其中偏置為O₃，如下所述。通過計(jì)算信號(hào)204的正確值，我們具有濾波器222的正確輸入，并且在n個(gè)樣本之后，稍后濾波器222具有正確的狀態(tài)并且我們可以回到常規(guī)運(yùn)算。

在我們的示例中，量化器431是10位晶格量化器，并且偏置由6位的重啟輔助數(shù)據(jù)由2^-16擴(kuò)展之后以及PRNG 312(或?qū)τ诹硪粋€(gè)通道是313)的輸出之和給出。與15.5位量化相比，PRNG 312確保信號(hào)204具有正確的偏置O₃，并且重啟輔助選擇靠近輸入信號(hào)202的正確值。

該編碼側(cè)將理想地需要將信號(hào)104的11到16位推送到重啟輔助。然而，PRNG值的范圍高達(dá)2^-15，所以PRNG和輔助之間存在一位的重疊。由于解碼器將這些值相加，編碼器必須從信號(hào)104的11到16位的Isb端減去PRNG輸出的頂位。濾波器221可以按照類似的方式被初始化。

濾波

如WO2013061062中所討論的，在這種直方圖更改無損加水印器之前進(jìn)行預(yù)強(qiáng)調(diào)濾波會(huì)是有用的。在此，這被實(shí)現(xiàn)為完全分離的預(yù)處理，其必要地涉及重新量化回到16位水平。

根據(jù)本發(fā)明的另一個(gè)實(shí)施例，編碼器之前是濾波器，該濾波器具有單一第一脈沖響應(yīng)并且其輸出被量化到比16位更精細(xì)的精度，諸如24位。

圖8A中示出了這種濾波器的一般化形式。函數(shù)520由濾波器輸入501和輸出503的n個(gè)延遲值計(jì)算出，并且結(jié)果被量化530以產(chǎn)生信號(hào)502，該信號(hào)的值在任何時(shí)刻都被稱為A(為了調(diào)整)。通過將信號(hào)502與信號(hào)501相加來形成濾波器輸出503。如果量化器530將量化到編碼器進(jìn)行運(yùn)算的16位精度，則這與WO2013061062中的無損預(yù)強(qiáng)調(diào)濾波器沒有實(shí)質(zhì)性的不同。然而，量化器503在接下來是所不期望的未成形的16位噪聲的額外源。

然而，意外的是，濾波器編碼器組合將仍是可逆的，即使量化器530量化到更精細(xì)的精度，例如24位?，F(xiàn)在，量化器530所引入的噪聲低很多，并且不會(huì)對本發(fā)明所引入的總體噪聲做出實(shí)質(zhì)性的貢獻(xiàn)。

信號(hào)501被量化到16位晶格，其中偏置為O₁，并且A是先前樣本的函數(shù)。盡管A具有更高的精度，信號(hào)503可以由此被認(rèn)為量化到16位量化格柵(O₁+Α)。這不會(huì)影響后續(xù)編碼器運(yùn)算(由于歧義解析器113的運(yùn)算僅取決于使用16晶格的輸入，而不是量化偏置)，但是這確實(shí)影響解碼器運(yùn)算。

在圖8B中示出了解碼器運(yùn)算，此圖示出了對在圖1B中示出的解碼器的左手側(cè)的修改。假設(shè)先前無損運(yùn)算，解碼器可以計(jì)算所復(fù)制的先前樣本的與編碼器相同的函數(shù)521并且執(zhí)行相同的量化531以產(chǎn)生信號(hào)512，該信號(hào)的值也是A，復(fù)制信號(hào)502。

然而，這并不從量化器211的輸出減去A，因?yàn)檫@將改變量化偏置。而是，其在量化器211之前減去A。由此，量化器211的輸出是經(jīng)濾波的信號(hào)、用信號(hào)511復(fù)制信號(hào)501所需的偏置O₁量化并且用作解碼器輸出和到函數(shù)521的輸入中的一個(gè)輸入。

接下來加A，這給出了具有量化偏置(O₁+A)的復(fù)制信號(hào)503的信號(hào)，這正是到函數(shù)501的另一個(gè)輸入以及減法節(jié)點(diǎn)饋送噪聲成形濾波器221所需要的。為了引起關(guān)注，我們指出虛線框214形成具有量化偏置(O₁+A)的16位量化器。

盡管有噪聲成形，當(dāng)在音軌的中間部分啟動(dòng)解碼器運(yùn)算時(shí)，上述邏輯失效，并且需要重啟輔助數(shù)據(jù)來引導(dǎo)無損運(yùn)算。最簡單地，重啟輔助將包括正確的濾波器狀態(tài)的快照(snapshot)，但是如果重啟點(diǎn)比較頻繁，則這將是不方便的大量數(shù)據(jù)。

我們現(xiàn)在解析可以如何實(shí)質(zhì)性地減少重啟輔助數(shù)據(jù)量。我們進(jìn)行以下初步觀察：

●將信號(hào)512反饋給量化器214意味著量化器和濾波器需要作為組合單元引導(dǎo)。如果我們不引導(dǎo)濾波器的話，初始化214的噪聲就沒有意義，因?yàn)樾盘?hào)512的誤差值致使量化器214量化到誤差的格柵并且因此不以無損的方式運(yùn)算。這是與WO2013061062中的預(yù)強(qiáng)調(diào)的關(guān)鍵不同，此預(yù)強(qiáng)調(diào)未被集成到量化器中。

●由于具有噪聲成形，如果信號(hào)513和511對于n個(gè)樣本是正確的，則信號(hào)512將是正確的，并且如果量化器214的噪聲成形也是正確的話，將繼續(xù)無損運(yùn)算。

●信號(hào)513也需要是正確的信號(hào)以便引導(dǎo)噪聲成形。

信號(hào)513接近信號(hào)206，不同之處僅在于量化器214所引入的噪聲成形更改。然而，信號(hào)511是513的濾波版本并且具有實(shí)質(zhì)性不同。

如果在流中的任意點(diǎn)啟動(dòng)解碼器，通常不會(huì)立即看到在其處提供重啟輔助數(shù)據(jù)的“重啟點(diǎn)”，并且此重啟點(diǎn)將初始地以有損方式運(yùn)算，如圖9所示。通過消除噪聲成形量化214、減去調(diào)整A并且最終量化結(jié)果來從圖8B導(dǎo)出圖9，所以輸出符合具有偏置O₁的16位，即使其不復(fù)制提供給編碼器的信號(hào)501。

我們以有損方式運(yùn)算足夠長的時(shí)間從而使信號(hào)511朝向其將在無損運(yùn)算中具有的正確值會(huì)聚。這需要多長時(shí)間與濾波器的脈沖響應(yīng)的長度有關(guān)，由于函數(shù)521和量化器531附近的反饋路徑，該長度通常是IIR。但是，信號(hào)511將會(huì)聚到多近存在限制，由其輸入不正確限定，因?yàn)榱炕?14在有損模式下不可操作。在重啟點(diǎn)處需要重啟輔助以便將511和513的延遲值快速近似為正確值。

如在僅初始化噪聲成形的以上討論的情況一樣，重啟信息可以是無損信號(hào)的逐個(gè)位。對于信號(hào)511，16以下的位由量化偏置O₁定義，所以每個(gè)延遲數(shù)據(jù)需要向上指定的第16位的某個(gè)數(shù)量的Isb，其中數(shù)量取決于近似信號(hào)511中可能存在多少誤差。八個(gè)比特可能足夠使用，如果包括函數(shù)521和量化器531的IIR濾波器已經(jīng)具有足夠的時(shí)間來穩(wěn)定，并且不具有過度的響應(yīng)。對于信號(hào)513，我們需要比僅噪聲成形情況更多的位，因?yàn)?，該信?hào)在格柵上被量化(O₁+A)，并且我們不準(zhǔn)確地知道A。所以，如果6位將足夠噪聲成型器使用并且A被量化到24位，我們現(xiàn)在需要每個(gè)數(shù)據(jù)14位，傳送無損信號(hào)的第11到24位。

散布器

圖10示出了本發(fā)明的另一個(gè)實(shí)施例，其中，無損地加水印的音頻文件202的水印被更改以產(chǎn)生不同的無損地加水印的音頻文件102。

這是通過使用來自圖1B的解碼器的初始部分重新生成被量化到格柵G₃的內(nèi)部信號(hào)204實(shí)現(xiàn)的，該內(nèi)部信號(hào)然后傳送到來自圖1A的編碼器的后一部分以嵌入經(jīng)更改的數(shù)據(jù)143。僅僅數(shù)據(jù)143的水印部分被更改，重構(gòu)數(shù)據(jù)和重啟輔助通路保持不變。

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁1 2 3

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：彼得·格雷厄姆·克雷文;馬爾科姆·羅;
技術(shù)所有人：彼得·格雷厄姆·克雷文;馬爾科姆·羅;
我是此專利的發(fā)明人

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

透明無損音頻加水印的制作方法