專利名稱:音頻信號的線性預(yù)測編碼的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及音頻信號的線性預(yù)測編碼。
背景技術(shù):
各種源信號的數(shù)字編碼在過去幾十年來已經(jīng)變得越來越重要了,因 為數(shù)字信號的表示和通信已經(jīng)逐漸替換了模擬的表示和通信。例如,諸 如全球移動通信系統(tǒng)之類的移動電話系統(tǒng)基于數(shù)字語音編碼。此外,諸 如視頻和音樂之類的媒體內(nèi)容的分發(fā)也更多地基于數(shù)字內(nèi)容編碼。
在內(nèi)容編碼中以及特別地在音頻和語音編碼中,線性預(yù)測編碼是一 種經(jīng)常采用的工具,因為它針對低數(shù)據(jù)率提供了高質(zhì)量。線性預(yù)測編碼 過去主要應(yīng)用于單獨的信號,但是也可以用于多通道信號,例如立體音 頻信號。
線性預(yù)測編碼通過降低信號中的冗余并且在預(yù)測參數(shù)中捕獲這些 冗余來實現(xiàn)有效的數(shù)據(jù)率。這些預(yù)測參數(shù)包含在編碼的信號中,并且所 述冗余在解碼器中通過線性預(yù)測合成濾波器來復(fù)原。
此外,線性預(yù)測還作為預(yù)處理工具而提出,以用于包括非語音編碼 應(yīng)用的音頻編碼。特別地,根據(jù)建議,最佳的線性預(yù)測方案應(yīng)當(dāng)反映心 理聲學(xué)知識以便更精確地反映聽眾的感知。特別地,已經(jīng)提出了巻曲
(warped)線性預(yù)測(WLP )和純線性預(yù)測(PLP )技術(shù)。兩種技術(shù)都 包括依照心理聲學(xué)對頻率尺度進行巻曲,從而使得建模能力集中在最關(guān) 鍵的頻帶處。特別地,WLP和PLP允許以類似于基底膜上的帶寬分布 的方式著重于較低的頻率。這也意味著在WLP和PLP中譜峰加寬可以 在心理聲學(xué)相關(guān)尺度上有效地實現(xiàn)。
此外,根據(jù)建議,預(yù)測系數(shù)可以從像響度譜或掩蔽閾值(或掩蔽誤 差功率)那樣的感知激發(fā)的頻譜中導(dǎo)出。因此,在所提出的系統(tǒng)中,將
待編碼的信號饋送到心理聲學(xué)模型中,所述心理聲學(xué)模型為特定信號段 產(chǎn)生反映感興趣的心理聲學(xué)量的頻譜(例如掩蔽閾值)。這個頻譜然后 用于為所迷線性預(yù)測濾波器產(chǎn)生預(yù)測系數(shù)。
然而,盡管該方法允許將線性預(yù)測用于考慮了心理聲學(xué)掩蔽效應(yīng)的音頻編碼,但是它也具有許多缺點。特別地,該方法要求為每個信號段 執(zhí)行心理聲學(xué)模型,這是復(fù)雜且計算昂貴的。此外,該方法傾向于不靈
活,并且特別地要求預(yù)測濾波器是巻曲的或拉蓋爾(Laguerre)濾波器 以便工作于心理聲學(xué)相關(guān)頻率尺度上。
因此,改進的線性預(yù)測編碼將是有利的,特別地,允許靈活性增加、 復(fù)雜度降低、實現(xiàn)方式易化、編碼質(zhì)量和/或性能提高的方法將是有利的。
發(fā)明內(nèi)容
相應(yīng)地,本發(fā)明尋求優(yōu)選地單獨或以任意組合緩解、減輕或消除上 述缺點中的一個或多個。
依照本發(fā)明的一個方面,提供了用于音頻信號的線性預(yù)測編碼的設(shè) 備,該設(shè)備包括用于為該音頻信號產(chǎn)生信號段的裝置;用于為每個信 號段產(chǎn)生第一自相關(guān)序列的裝置;用于通過響應(yīng)于至少一個心理聲學(xué)特 性而修改第 一 自相關(guān)序列來為每個信號段產(chǎn)生第二自相關(guān)序列的修改 裝置;以及用于響應(yīng)于第二自相關(guān)序列而為每個信號段確定線性預(yù)測編 碼系數(shù)的確定裝置。
本發(fā)明允許實現(xiàn)改進的線性預(yù)測編碼,其反映了聽眾的感知,從而 針對給定編碼率提供了改進的編碼質(zhì)量。本發(fā)明可以允許獲得降低的復(fù) 雜度、降低的計算資源要求和/或易化的實現(xiàn)方式。此外,本發(fā)明還可以 允許將心理聲學(xué)因素與各種不同的線性預(yù)測編碼方法一起使用。
特別地,本發(fā)明可以允許計算根據(jù)第 一 自相關(guān)序列確定的心理聲學(xué) 加權(quán)自相關(guān)序列。該計算可能復(fù)雜度較低,但是提供了對于心理聲學(xué)性 質(zhì)的有效適應(yīng)。
所述設(shè)備此外還可以包括用于產(chǎn)生包含線性預(yù)測編碼系數(shù)的編碼 數(shù)據(jù)流的裝置。該設(shè)備還可以包括用于將編碼的數(shù)據(jù)流例如作為數(shù)據(jù)文 件來發(fā)送的裝置。此外,該設(shè)備還可以包括采用線性預(yù)測編碼系數(shù)的線 性預(yù)測濾波器以及用于產(chǎn)生誤差信號的裝置。該設(shè)備還可以包括用于編 碼誤差信號并且用于將其包含于編碼的數(shù)據(jù)流中的裝置。
依照本發(fā)明的一個可選特征,修改裝置被設(shè)置成執(zhí)行對笫一自相關(guān) 序列的加窗。
這可以允許獲得改進的性能、更高的質(zhì)量、降低的復(fù)雜度和/或易化 的實現(xiàn)方式。特別地,所述加窗可以允許實現(xiàn)與心理聲學(xué)知識一致的頻譜擴展。所述加窗可以通過將第一自相關(guān)序列與時域窗序列相乘來實現(xiàn)。
依照本發(fā)明的一個可選特征,所述加窗相應(yīng)于與巴克(Bark)帶寬 相應(yīng)的心理聲學(xué)帶寬。
這可以允許獲得改進的性能和/或更高的質(zhì)量。
依照本發(fā)明的 一 個可選特征,所述加窗相應(yīng)于與等效矩形帶寬 (ERB)相應(yīng)的心理聲學(xué)帶寬。
這可以允許獲得改進的性能和/或更高的質(zhì)量。
依照本發(fā)明的一個可選特征,修改裝置被設(shè)置成通過最小值自相關(guān) 序列來界定第二自相關(guān)序列。
這可以允許獲得改進的性能、更高的質(zhì)量、降低的復(fù)雜度和/或易化 的實現(xiàn)方式。特別地,該特征可以允許獲得一種以低信號量提供改進質(zhì) 量的線性預(yù)測編碼的低復(fù)雜度方式。
依照本發(fā)明的一個可選特征,修改裝置被設(shè)置成將第二自相關(guān)序列 確定為至少第一項與第二項之和,所述第一項與最小值自相關(guān)序列相 應(yīng),所述第二項響應(yīng)于第一自相關(guān)序列而纟皮確定。
這可以允許獲得改進的性能、更高的質(zhì)量、降低的復(fù)雜度和/或易化 的實現(xiàn)方式。
依照本發(fā)明的 一 個可選特征,修改裝置被設(shè)置成按照縮放因子縮放 第一項和第二項中的至少一個,所述縮放因子與第一項相對于第二項的
心理聲學(xué)顯著性相應(yīng)。
這可以允許獲得改進的性能、更高的質(zhì)量、降低的復(fù)雜度和/或易化 的實現(xiàn)方式。特別地,所述縮放因子允許獲得一種加權(quán)所迷不同心理聲 學(xué)效應(yīng)的低復(fù)雜度方式。
依照本發(fā)明的一個可選特征,最小值自相關(guān)序列與安靜閾值 (threshold-in-quiet)曲線相應(yīng)。
這可以允許獲得改進的性能、更高的質(zhì)量、降低的復(fù)雜度和/或易化 的實現(xiàn)方式。
依照本發(fā)明的 一個可選特征,線性預(yù)測編碼為拉蓋爾線性預(yù)測編 碼,并且所述確定裝置祐 沒置成響應(yīng)于第二自相關(guān)序列而確定音頻信號 和該音頻信號的拉蓋爾濾波版本之間的協(xié)方差序列。
這可以允許獲得拉蓋爾線性預(yù)測編碼的改進的性能、更高的質(zhì)量、降低的復(fù)雜度和/或易化的實現(xiàn)方式。
依照本發(fā)明的一個可選特征,第一自相關(guān)序列是巻曲自相關(guān)序列。 這可以允許獲得改進的性能、更高的質(zhì)量、降低的復(fù)雜度和/或易化
的實現(xiàn)方式。所述線性預(yù)測編碼可以是巻曲線性預(yù)測編碼。
依照本發(fā)明的一個可選特征,第一自相關(guān)序列是濾波的巻曲自相關(guān)序列。
這可以允許獲得改進的性能、更高的質(zhì)量、降低的復(fù)雜度和/或易化 的實現(xiàn)方式。所述線性預(yù)測編碼可以是拉蓋爾線性預(yù)測編碼。
依照本發(fā)明的一個可選特征,所述確定裝置被設(shè)置成通過最小化與 采用線性預(yù)測編碼系數(shù)的線性預(yù)測濾波器的輸入信號關(guān)聯(lián)的誤差信號 的信號功率度量來確定這些線性預(yù)測系數(shù),所述輸入信號由第二自相關(guān)
序列表征。
這可以允許獲得改進的性能、更高的質(zhì)量、降低的復(fù)雜度和/或易化 的實現(xiàn)方式。所述輸入信號可以是具有與第二自相關(guān)序列相應(yīng)的自相關(guān) 序列的輸入信號,并且所述誤差信號可以確定為線性預(yù)測分析濾波器的輸出。
依照本發(fā)明的一個可選特征,所述確定裝置被設(shè)置成通過求解下式給出的線性方程來確定線性預(yù)測系數(shù)
Q <x = P
式中,Q為包含響應(yīng)于第二自相關(guān)序列而確定的系數(shù)的矩陣,P為 包含響應(yīng)于第二自相關(guān)序列而確定的系數(shù)的矢量,a為包含所述線性預(yù) 測系數(shù)的矢量。
這可以允許獲得改進的性能、更高的質(zhì)量、降低的復(fù)雜度和/或易化 的實現(xiàn)方式。
依照本發(fā)明的一個可選特征,所述修改裝置被設(shè)置成基本上依照下 式來確定第二自相關(guān)序列
式中,r(k)為第二自相關(guān)序列,卩為縮放因子,w(k)為加窗序列,t(k) 為安靜閾值自相關(guān)序列。
這可以允許獲得改進的性能、更高的質(zhì)量、降低的復(fù)雜度和/或易化 的實現(xiàn)方式。
依照本發(fā)明的另 一 個方面,提供了用于編碼音頻信號的線性預(yù)測編碼器,該編碼器包括用于為該音頻信號產(chǎn)生信號段的裝置;用于為每 個信號段產(chǎn)生第一自相關(guān)序列的裝置;用于通過響應(yīng)于至少一個心理聲 學(xué)特性而修改第一自相關(guān)序列來為每個信號段產(chǎn)生第二自相關(guān)序列的 修改裝置;以及用于響應(yīng)于第二自相關(guān)序列而為每個信號段確定線性預(yù) 測編碼系數(shù)的確定裝置。
依照本發(fā)明的另一個方面,提供了包括如上所述的編碼器的音頻記 錄設(shè)備。
依照本發(fā)明的另一個方面,提供了用于發(fā)送音頻信號的發(fā)送器,該 發(fā)送器包括用于接收該音頻信號的裝置;用于為該音頻信號產(chǎn)生信號 段的裝置;用于為每個信號段產(chǎn)生第一自相關(guān)序列的裝置;用于通過響 應(yīng)于至少一個心理聲學(xué)特性而修改第一自相關(guān)序列來為每個信號段產(chǎn) 生第二自相關(guān)序列的修改裝置;用于響應(yīng)于第二自相關(guān)序列而為每個信 號段確定線性預(yù)領(lǐng),J編碼系數(shù)的線性預(yù)測編碼裝置;用于為該音頻信號產(chǎn) 生編碼的數(shù)據(jù)的裝置,所述編碼的數(shù)據(jù)包含所述線性預(yù)測編碼系數(shù);以 及用于發(fā)送該編碼的數(shù)據(jù)的裝置。
依照本發(fā)明的另 一 個方面,提供了用于傳輸音頻信號的傳輸系統(tǒng), 該傳輸系統(tǒng)包括發(fā)送器,該發(fā)送器包括用于接收該音頻信號的裝置, 用于為該音頻信號產(chǎn)生信號段的裝置,用于為每個信號段產(chǎn)生第一自相 關(guān)序列的裝置,用于通過響應(yīng)于至少一個心理聲學(xué)特性而修改第一自相 關(guān)序列來為每個信號段產(chǎn)生第二自相關(guān)序列的修改裝置,用于響應(yīng)于第 二自相關(guān)序列而為每個信號段確定線性預(yù)測編碼系數(shù)的線性預(yù)測編碼 裝置,用于為該音頻信號產(chǎn)生編碼的數(shù)據(jù)的裝置,所述編碼的數(shù)據(jù)包含 所述線性預(yù)測編碼系數(shù),以及用于向接收器發(fā)送該編碼的數(shù)據(jù)的裝置; 以及接收器,該接收器包括用于接收所述編碼的數(shù)據(jù)的裝置,用于產(chǎn)生 解碼的信號的線'性預(yù)測濾波器,以及用于響應(yīng)于所述編碼的數(shù)據(jù)的線'性 預(yù)測編碼系數(shù)而設(shè)置線'性預(yù)測合成濾波器的系數(shù)的裝置。
依照本發(fā)明的另 一 個方面,提供了音頻信號的線性預(yù)測編碼方法, 該方法包括為該音頻信號產(chǎn)生信號段;為每個信號段產(chǎn)生第一自相關(guān) 序列;通過響應(yīng)于至少一個心理聲學(xué)特性而4奮改第一自相關(guān)序列來為每 個信號段產(chǎn)生第二自相關(guān)序列;以及響應(yīng)于第二自相關(guān)序列而為每個信 號段確定線性預(yù)測編碼系數(shù)。
依照本發(fā)明的另一個方面,提供了發(fā)送音頻信號的方法,該方法包括接收該音頻信號;為該音頻信號產(chǎn)生信號段;為每個信號段產(chǎn)生第 一自相關(guān)序列;通過響應(yīng)于至少一個心理聲學(xué)特性而修改第一自相關(guān)序 列來為每個信號段產(chǎn)生第二自相關(guān)序列;響應(yīng)于第二自相關(guān)序列而為每 個信號段確定線性預(yù)測編碼系數(shù);為該音頻信號產(chǎn)生編碼的數(shù)據(jù),所述 編碼的數(shù)據(jù)包含所述線性預(yù)觀'J編碼系數(shù);以及發(fā)送該編碼的數(shù)據(jù)。
依照本發(fā)明的另一個方面,提供了發(fā)送和接收音頻信號的方法,該 方法包括發(fā)送器執(zhí)行步驟接收該音頻信號,為該音頻信號產(chǎn)生信號 段,為每個信號段產(chǎn)生第一自相關(guān)序列,通過響應(yīng)于至少一個心理聲學(xué) 特性而修改第一自相關(guān)序列來為每個信號段產(chǎn)生第二自相關(guān)序列,響應(yīng) 于第二自相關(guān)序列而為每個信號段確定線性預(yù)測編碼系數(shù),為該音頻信 號產(chǎn)生編碼的數(shù)據(jù),所述編碼的數(shù)據(jù)包含所述線性預(yù)測編碼系數(shù),以及 向接收器發(fā)送該編碼的數(shù)據(jù);以及接收器執(zhí)行步驟接收所述編碼的數(shù) 據(jù),使用線性預(yù)測濾波器產(chǎn)生解碼的信號,以及響應(yīng)于所述編碼的數(shù)據(jù) 的線性預(yù)測編碼系數(shù)而設(shè)置線性預(yù)測合成濾波器的系數(shù)。
本發(fā)明的這些和其他方面、特征和優(yōu)點根據(jù)以下描述的實施例將是 清楚明白的,并且將參照這些實施例來進行闡迷。
現(xiàn)在將僅通過舉例的方式參照附圖來描述本發(fā)明的實施例,在附圖
中
圖1示出了依照本發(fā)明一些實施例的用于音頻信號通信的傳輸系
統(tǒng);
圖2示出了依照本發(fā)明一些實施例的線性預(yù)測編碼器; 圖3示出了線性預(yù)測解碼器;
圖4示出了依照本發(fā)明一些實施例的線性預(yù)測編碼器的元件;以及 圖5示出了依照本發(fā)明一些實施例的音頻信號線性預(yù)測編碼方法。
具體實施例方式
圖1示出了依照本發(fā)明一些實施例的用于音頻信號通信的傳輸系統(tǒng) 100。傳輸系統(tǒng)100包括通過網(wǎng)絡(luò)105耦合到接收器103的發(fā)送器101, 所述網(wǎng)絡(luò)105特別地可以為因特網(wǎng)。
在這個特定的實例中,發(fā)送器101為信號記錄設(shè)備,并且接收器為信號播放設(shè)備103,但是應(yīng)當(dāng)理解的是,在其他實施例中,發(fā)送器和接 收器可以用于其他應(yīng)用中以及用于其他目的。例如,發(fā)送器101和/或接 收器103可以是譯碼功能的一部分,并且可以例如提供到其他信號源或 目的;也的^妻口 。
在其中支持信號記錄功能的這個特定的實例中,發(fā)送器101包括接 收模擬信號的數(shù)字化器107,所述模擬信號通過采樣和模數(shù)轉(zhuǎn)換被轉(zhuǎn)換 成數(shù)字PCM信號。
數(shù)字化器107耦合到圖1的線性預(yù)測(LP)編碼器109,該線性預(yù) 測編碼器109依照線性預(yù)測編碼算法對該PCM信號進行編碼。LP編碼 器109耦合到接收編碼的信號并且通過接口連接到因特網(wǎng)105的網(wǎng)絡(luò)發(fā) 送器111。該網(wǎng)絡(luò)發(fā)送器可以通過因特網(wǎng)105向接收器103發(fā)送所述編 碼的信號。
圖2更加詳細地示出了該LP編碼器109。
編碼器109接收數(shù)字化的(采樣的)音頻信號。為了清楚且簡潔起 見,假設(shè)輸入信號僅僅包含實值,但是應(yīng)當(dāng)理解的是,在一些實施例中 所述值可以為復(fù)數(shù)。
所述編碼器包括分段處理器201,其將接收的信號分割成單獨的段 幀。特別地,將輸入信號分割成若干例如相應(yīng)于20毫秒間隔的給定尺 寸的樣本塊。然后,所述編碼器接著為每個單獨的幀產(chǎn)生預(yù)測數(shù)據(jù)和殘 余信號。
特別地,這些段被饋送到預(yù)測控制器203,該預(yù)測控制器為預(yù)測濾 波器確定要在編碼和解碼過程期間應(yīng)用的參數(shù)。特別地,預(yù)測控制器203 為結(jié)合了線性預(yù)測分析(LPA)濾波器的線性預(yù)測分析器205確定濾波
器系數(shù)。
線性預(yù)測分析器205此外還接收輸入信號樣本并且確定預(yù)測值和實 際輸入樣本之間的誤差信號。
這些誤差信號被饋送到編碼單元207,該編碼單元207編碼和量化 所述誤差信號并且產(chǎn)生相應(yīng)的比特流。
編碼單元207和預(yù)測控制器203耦合到將由所述編碼器產(chǎn)生的數(shù)據(jù) 組合成組合的編碼信號的復(fù)用器209。
接收器103包括網(wǎng)絡(luò)接收器113,該網(wǎng)絡(luò)接收器113通過接口連接 到因特網(wǎng)105并且被設(shè)置成接收來自發(fā)送器101的編碼的信號。網(wǎng)絡(luò)接收器lll耦合到線性預(yù)測(LP)解碼器115。 LP解碼器115 接收所述編碼的信號并且依照線性預(yù)測解碼算法對它進行解碼。
圖3更加詳細地示出了 LP解碼器115。 LP解碼器115包括解復(fù)用 器301,該解復(fù)用器將線性預(yù)測系數(shù)和編碼的誤差信號樣本從接收的比 特流中分離出來。這些誤差信號樣本被饋送到重新產(chǎn)生誤差信號的解碼 處理器303。解復(fù)用器301和解碼處理器303耦合到包含線性預(yù)測合成 (LPS )濾波器的線性預(yù)測合成器(305 )。將該LPS濾波器的系數(shù)設(shè)置 成接收的系數(shù)值,并且向該濾波器饋送重新產(chǎn)生的誤差信號,從而(基 本上)重新創(chuàng)建原始的音頻信號。
在其中支持信號播放功能的這個特定的實例中,接收器103還包括 信號播放器117,該信號播放器從解碼器115處接收解碼的音頻信號并 且將其呈現(xiàn)給用戶。特別地,信號播放器113可以包括輸出解碼的音頻 信號所需的數(shù)模轉(zhuǎn)換器、放大器和揚聲器。
不同的線性預(yù)測編碼算法可以用于圖1的系統(tǒng)中。特別地,可以采 用標(biāo)準(zhǔn)的線性預(yù)測、巻曲線性預(yù)測或拉蓋爾線性預(yù)測編碼技術(shù)。所述 LPA濾波器的傳遞函數(shù)H(z)為
<formula>formula see original document page 13</formula>
其中在這些實例中,G"z)如下給定 標(biāo)準(zhǔn)線性預(yù)測
并且因此//(》=1-;f 巻曲線性預(yù)測(討1LP):
<formula>formula see original document page 13</formula>并且因此
基于拉蓋爾的線性預(yù)測
G刺:
1 —Xz—'
并且因此卿=1- , 、 一'
、"
4=1
參數(shù)人稱為巻曲或拉蓋爾參數(shù),允許依照不同頻率的心理聲學(xué)相關(guān)
性來對頻率尺度進行巻曲。K稱為預(yù)測濾波器的階。所述LPS濾波器具 有的傳遞函數(shù)是LPA濾波器的傳遞函數(shù)的倒數(shù),即1/H(z)。在該濾波器 內(nèi),部分傳遞Gk(z)通過Yk(z^Gk(z)X(z)給出的z變換耦合到信號yk,其 中X(z)是輸入信號x的z變換。
在所述系統(tǒng)中,LPA濾波器因此設(shè)法根據(jù)在先的樣本估計當(dāng)前的樣 本值。特別地,記輸入樣本為x,那么用于簡單的標(biāo)準(zhǔn)線性預(yù)測的LPA 濾波器內(nèi)部產(chǎn)生樣本
式中,c^為預(yù)測系數(shù)。LPA濾波器的輸出為該估計產(chǎn)生的誤差樣本 e(n),并且等于
—)=X(W)—傘)
式中,x(n)為輸入信號樣本值。
預(yù)測控制器203確定預(yù)測系數(shù)ap以便對于給定的信號段而言,最 小化針對誤差信號e(n)的信號功率度量。
特別地,預(yù)測控制器203被設(shè)置成確定預(yù)測系數(shù)o^,以便最小化所
述段中的樣本的最小均方誤差被最小化。本領(lǐng)域技術(shù)人員應(yīng)當(dāng)理解,所
述最小值可以通過確定誤差信號度量函數(shù)(特別地為最小均方誤差)并
且將預(yù)測系數(shù) 的偏導(dǎo)數(shù)置為零來找到。本領(lǐng)域技術(shù)人員還應(yīng)當(dāng)理解的
是,這導(dǎo)致下式表示的K個線性方程
Q a = P
式中,Q為KxK矩陣,其包含與來自所述信號的自相關(guān)序列的自 相關(guān)值相應(yīng)的系數(shù),P為K元素矢量,其包含來自所述信號的自相關(guān)序 列的自相關(guān)值,a為包含線性預(yù)測系數(shù)的矢量。 特別地,Q可以由下式給出
>(o) Ki) K2) …
Ki) , Ki) K"2)
2= K2) Ki) K0) K^一3)式中,r(k)為適當(dāng)?shù)淖韵嚓P(guān)序列。
在常規(guī)的標(biāo)準(zhǔn)線性預(yù)測中,r(k)表示輸入信號的自相關(guān)序列,其可 以根據(jù)輸入信號直接地測量出來。在常規(guī)的巻曲線性預(yù)測中,序列r(k) 表示所謂的巻曲自相關(guān)序列,其也可以根據(jù)輸入信號來確定。
為了包括心理聲學(xué)因素,已經(jīng)提出了為輸入信號確定像掩蔽閾值那 樣的感知激發(fā)的頻譜,并且在Q和P中使用與該頻譜關(guān)聯(lián)的自相關(guān)來確 定線性預(yù)測系數(shù)。然而,這是極端復(fù)雜的,因為它要求為每段計算心理 聲學(xué)模型并且將該心理聲學(xué)模型產(chǎn)生的頻譜變換成關(guān)聯(lián)的自相關(guān)序列。
在圖1的系統(tǒng)中,預(yù)測控制器203確定心理聲學(xué)加權(quán)自相關(guān)序列并 且使用該序列來確定線性預(yù)測系數(shù)。心理聲學(xué)加權(quán)自相關(guān)序列是通過直 接而非常簡單的運算從所述信號的自相關(guān)序列確定的。因此,圖2的LP 編碼器允許使用心理聲學(xué)因素來改進線性預(yù)測編碼,同時維持低復(fù)雜度 和計算資源要求,特別地不必為每個段計算心理聲學(xué)模型。
圖4更加詳細地示出了預(yù)測控制器203。
預(yù)測控制器203包括根據(jù)接收的輸入信號確定自相關(guān)序列,(a)的自 相關(guān)處理器401 。新的自相關(guān)序列針對信號的每個段來確定。
自相關(guān)處理器401耦合到根據(jù)信號的自相關(guān)序列r'W確定心理聲學(xué) 加權(quán)自相關(guān)序列FOO的修改處理器403 。
然后,將所述心理聲學(xué)加權(quán)自相關(guān)序列發(fā)送到為LPA (以及LPS) 濾波器確定預(yù)測系數(shù)的預(yù)測系數(shù)處理器405。在標(biāo)準(zhǔn)線性預(yù)測的實例中, 預(yù)測系數(shù)處理器405使用輸入信號的心理聲學(xué)加權(quán)自相關(guān)序列求解線性 方程
q a = p
這樣,在這個實例中,Ka)=^W。應(yīng)當(dāng)理解,可以使用任何用于求 解這些方程的適當(dāng)算法,例如本領(lǐng)域技術(shù)人員眾所周知的萊文森
(Levinson )遞歸算法。
應(yīng)當(dāng)理解,可以使用任何用于心理聲學(xué)加權(quán)所述自相關(guān)序列的適當(dāng)
并且P可以如下《合出
尸=運算或函數(shù)。
特別地,可以在每個信號段中將加窗運算應(yīng)用到自相關(guān)序列。例如, 輸入信號的自相關(guān)序列可以通過與預(yù)定窗口 w(k)的時域乘法來修改。時 域中的這個乘法將相應(yīng)于頻域中的巻積,從而提供了可以反映人的聲覺
的頻譜擴展。
特別地,可能有利的是,將自相關(guān)序列與具有反映心理聲學(xué)相關(guān)距 離的頻譜帶寬的窗函數(shù)相乘,特別是可以將該窗口選擇成在某個特定頻
率下具有巴克或等效矩形帶寬(ERB)頻帶的帶寬。特別地,這可以允 許實現(xiàn)反映心理聲學(xué)特性的頻譜成形。
此外或者可替換地,修改處理器403可以對心理聲學(xué)加權(quán)自相關(guān)序 列的值施加下限。例如,可以確定與較低信號幅度下的人類感知相應(yīng)的 自相關(guān)序列。這種特性一般稱為安靜閾值曲線。于是,安靜閾值曲線相 應(yīng)于被認(rèn)為可由用戶察覺的最小信號水平??梢源_定相應(yīng)于該安靜閾值 曲線的自相關(guān)序列,并且將其用作心理聲學(xué)加權(quán)自相關(guān)序列的最小值。
例如,在對信號的自相關(guān)序列執(zhí)行加窗運算之后,可以將每個得到 的樣本與相應(yīng)于安靜閾值的序列進行比較,如果任何確定的值低于安靜
閾值的相應(yīng)值,那么就改為使用該安靜閾值。舉另一個實例而言,可以 在確定心理聲學(xué)加權(quán)自相關(guān)序列時將安靜閾值自相關(guān)序列作為 一項添
加進來。
通過最小值自相關(guān)序列來界定心理聲學(xué)加權(quán)自相關(guān)序列確保了得 到的自相關(guān)序列更密切地與根據(jù)心理聲學(xué)模型導(dǎo)出的自相關(guān)序列相應(yīng), 并且尤其是對于低幅度水平的輸入信號而言,實現(xiàn)了編碼增益的提高。
舉一個特定的實例而言,修改處理器403可以將心理聲學(xué)加權(quán)自相 關(guān)序列基本上確定為
<formula>formula see original document page 16</formula>
式中,F(xiàn)(O為心理聲學(xué)加權(quán)自相關(guān)序列,(3為縮放因子,w(k)為加窗 序列,t(k)為特別地可以是安靜閾值自相關(guān)序列的最小值自相關(guān)序列。
在這個實例中,縮放因子P為允許對所述加窗和安靜閾值自相關(guān)序 列的相對影響進行調(diào)節(jié)的設(shè)計參數(shù)。
這種方法特別地可以基于以下認(rèn)識高能量強度下的掩蔽曲線按照 一階近似在形狀上是與水平無關(guān)的。因此,在高強度水平下,當(dāng)使用適 當(dāng)?shù)木€性預(yù)測系統(tǒng)(例如WLP或PLP)并且使用適當(dāng)?shù)念l譜平滑時,線性預(yù)測應(yīng)當(dāng)能夠給出對于掩蔽曲線形狀的相當(dāng)良好的近似。此外,在 低強度水平下,安靜閾值是掩蔽曲線的重要部分。
用于確定線性預(yù)測系數(shù)的自相關(guān)序列的心理聲學(xué)加權(quán)允許實現(xiàn)大 為改進的線性預(yù)測,其能夠更加精確地反映出編碼的信號如何被用戶所 感知。此外,該方法要求非常少且簡單的運算,并且能夠易于實現(xiàn),而 沒有任何明顯的復(fù)雜度或計算資源的增加。
以額外的計算復(fù)雜度為代價,可以結(jié)合許多精心的改進。例如,可 以對自相關(guān)序列進行濾波以便強調(diào)特定頻率區(qū)域;可以使得因子卩與輸 入水平有關(guān),等等。
上面的實例著重于使用標(biāo)準(zhǔn)線性預(yù)測的實例。然而,應(yīng)當(dāng)理解,所 描述的原理同樣^艮好地適用于其他以及更復(fù)雜的線性預(yù)測,例如巻曲線 性預(yù)測和拉蓋爾線性預(yù)測。
特別地,對于巻曲線性預(yù)測而言,自相關(guān)序列將是巻曲自相關(guān)序列。
因此,初始時自相關(guān)處理器401可以確定該巻曲自相關(guān)序列,然后,可
以如上所述處理該巻曲自相關(guān)序列以便產(chǎn)生巻曲的心理聲學(xué)加權(quán)自相
關(guān)序列。該巻曲自相關(guān)序列定義為KO) = J>(")x(")
并且
其中k=l,...,K,并且yk為輸入信號x的巻曲線性預(yù)測器中的濾波器 Gk(z)的響應(yīng)。然后,使用該序列來確定線性預(yù)測系數(shù)。特別地,應(yīng)當(dāng)理 解,所執(zhí)行的巻曲相當(dāng)于通過 一 系列全通濾波器對到來的信號進行濾 波,并且?guī)喦韵嚓P(guān)序列被確定為這些全通濾波器的輸出的協(xié)方差。
在拉蓋爾線性預(yù)測的情況下,序列r(k)如下給出
k= 1,... ,K-1, yk為輸入信號x的拉蓋爾線性預(yù)測器中的濾波器Gk(z) 的響應(yīng)。將巻曲線性預(yù)測器的Gk和拉蓋爾線性預(yù)測器的Gk進行比較可 知,拉蓋爾情況下的r(k)可以認(rèn)為是x的濾波版本的巻曲自相關(guān)序列, 其中濾波器Go(z)由下式給出
"、z一VT^
df Z、 =-:~對于拉蓋爾線性預(yù)測而言,Q因此變成特普利茨(Toepl i tz )矩陣, 其包括拉蓋爾濾波信號的心理聲學(xué)加權(quán)自相關(guān)的值。然而,P和Q之間
的關(guān)系稍微更復(fù)雜一些,因為P包含若干值,這些值是輸入信號以及音 頻信號的拉蓋爾濾波版本的協(xié)方差序列的值。因此,
尸=禍
一,). 式中
k=l,...,K, yk為輸入信號x的拉蓋爾線性預(yù)測器中的濾波器Gk(z)
的響應(yīng)。
對于kM, Q和P的值之間的關(guān)系由下式給出 式中
并且
入
i
7T^
其中X為拉蓋爾參數(shù)。此外
K0)"(0) + 2ClP(l)
式中,p(0)相應(yīng)于輸入信號的能量
特別地,對于拉蓋爾線性預(yù)測而言,預(yù)測控制器203能夠執(zhí)行以下步驟。
初始時,確定序列p(k), k=0...K。 將p(K+l)設(shè)為零。
使用上面的方程根據(jù)p(k)確定第 一 自相關(guān)r,(k)。 根據(jù)下式確定心理聲學(xué)加權(quán)自相關(guān)F&)
可以例如將w(k)確定為L 0 其他
其中,給定采樣頻率和拉蓋爾參數(shù)X,確定5,使得w(k)的頻譜表 示具有例如1巴克的帶寬。像漢寧(Hanning)、漢明(Hamming)那 樣的其他窗口選擇也是可行的。
然后,使用上面給出的p(k)和r(k)之間的關(guān)系根據(jù)F(W計算補償?shù)膮f(xié) 方差序列》(yfc)。
然后,預(yù)測系數(shù)處理器405根據(jù)下式為LPA濾波器確定預(yù)測系數(shù)
Q a =P
式中,Q和P的系數(shù)取自F("和》(A)。 圖5示出了音頻信號的線性預(yù)測編碼方法。 該方法在步驟501中啟動,其中為音頻信號產(chǎn)生信號段。 步驟501之后是步驟503,其中為每個信號段產(chǎn)生第一自相關(guān)序列。 步驟503之后是步驟505,其中通過響應(yīng)于至少一個心理聲學(xué)特性 而修改第一自相關(guān)序列來為每個信號段產(chǎn)生第二自相關(guān)序列。
步驟505之后是步驟507,其中響應(yīng)于第二自相關(guān)序列而為每個信 號段確定線性預(yù)測編碼系數(shù)。
應(yīng)當(dāng)理解,為了清楚起見,上面的描述參照了不同的功能單元和處 理器來描述本發(fā)明的實施例。然而,顯然可以使用不同功能單元或處理 器之間的任何適當(dāng)?shù)墓δ芊植?,而不會脫離于本發(fā)明。例如,被說明由 單獨的處理器或控制器實現(xiàn)的功能可以由相同的處理器或控制器來實 現(xiàn)。因此,對特定功能單元的引用應(yīng)當(dāng)僅被看作對用于提供所描述的功 能的適當(dāng)裝置的引用,而不表示嚴(yán)格的邏輯或物理的結(jié)構(gòu)或組織。
本發(fā)明可以以包括硬件、軟件、固件或其任意組合的任何適當(dāng)?shù)男?式來實現(xiàn)??蛇x地,本發(fā)明可以至少部分地實現(xiàn)為運行在一個或多個數(shù) 據(jù)處理器和/或數(shù)字信號處理器上的計算機軟件。本發(fā)明實施例的元件和 部件可以以任何適當(dāng)?shù)姆绞絹碓谖锢砩稀⒐δ苌弦约斑壿嬌蠈崿F(xiàn)。事實 上,所迷功能可以在單個單元中、在多個單元中或者作為其他功能單元 的一部分來實現(xiàn)。同樣地,本發(fā)明可以在單個單元中實現(xiàn)或者可以在物 理上和功能上分布于不同的單元和處理器之間。
盡管已經(jīng)結(jié)合一些實施例描述了本發(fā)明,但是本發(fā)明并非意在限于 本文給出的特定形式。相反,本發(fā)明的范圍僅由隨附的權(quán)利要求所限制。此外,盡管看起來特征是結(jié)合特定的實施例來進行描述的,但是本領(lǐng)域 技術(shù)人員應(yīng)當(dāng)認(rèn)識到,依照本發(fā)明,可以對所描述的實施例的各種特征 進行組合。在權(quán)利要求中,措詞"包括"并沒有排除其他元件或步驟的存在。
此外,盡管單獨地列舉出來,但是多個裝置、元件或方法步驟可以 通過例如單個單元或處理器來實現(xiàn)。另外,盡管單獨的特征可能包含于 不同的權(quán)利要求中,但是可以對這些特征進行有利的組合,并且包含于 不同的權(quán)利要求中并不意味著特征的組合不是可行的和/或有利的。同 樣,特征包含于一類權(quán)利要求中并不意味著限于該類別,而是表明該特 征同樣可以在合適時應(yīng)用于其他權(quán)利要求類別。此外,權(quán)利要求中特征 的順序并不意味著其中特征發(fā)揮作用必須遵循的任何特定順序,并且特 別地,方法權(quán)利要求中單獨的步驟的順序并不意味著這些步驟必須按照 該順序來執(zhí)行。相反,這些步驟可以以任何適當(dāng)?shù)捻樞騺韴?zhí)行。此外, 單數(shù)引用并沒有排除復(fù)數(shù)。因此,對于"一"、"一個"、"第一"、"第二" 等等的引用并沒有排除復(fù)數(shù)。權(quán)利要求中的附圖標(biāo)記僅僅提供來清楚闡 明實例,絕不應(yīng)當(dāng)不應(yīng)當(dāng)視為限制了權(quán)利要求的范圍。
權(quán)利要求
1. 一種用于音頻信號的線性預(yù)測編碼的設(shè)備,該設(shè)備包括-用于為該音頻信號產(chǎn)生信號段的裝置(201);-用于為每個信號段產(chǎn)生第一自相關(guān)序列的裝置(401);-用于通過響應(yīng)于至少一個心理聲學(xué)特性而修改第一自相關(guān)序列來為每個信號段產(chǎn)生第二自相關(guān)序列的修改裝置(403);以及-用于響應(yīng)于第二自相關(guān)序列而為每個信號段確定線性預(yù)測編碼系數(shù)的確定裝置(405)。
2. 權(quán)利要求1的設(shè)備,其中修改裝置(403 )被設(shè)置成執(zhí)行對第一自相關(guān)序列的加窗。
3. 權(quán)利要求2的設(shè)備,其中所述加窗相應(yīng)于與巴克帶寬相應(yīng)的心理聲學(xué)帶寬。
4. 權(quán)利要求2的設(shè)備,其中所述加窗相應(yīng)于與等效矩形帶寬(ERB )相應(yīng)的心理聲學(xué)帶寬。
5. 權(quán)利要求1的設(shè)備,其中修改裝置(403 )被設(shè)置成通過最小值自相關(guān)序列來界定第二自相關(guān)序列。
6. 權(quán)利要求5的設(shè)備,其中修改裝置(403 )被設(shè)置成將第二自相關(guān)序列確定為至少第一項與第二項之和,所述第一項與最小值自相關(guān)序列相應(yīng),所述第二項響應(yīng)于第一自相關(guān)序列而^皮確定。
7. 權(quán)利要求6的設(shè)備,其中修改裝置(403 )被設(shè)置成按照縮放因子縮放所述第一項和第二項中的至少一個,所述縮放因子與第一項相對于第二項的心理聲學(xué)顯著性相應(yīng)。
8. 權(quán)利要求4的設(shè)備,其中最小值自相關(guān)序列與安靜閾值曲線相應(yīng)。
9. 權(quán)利要求1的設(shè)備,其中所述線性預(yù)測編碼為拉蓋爾線性預(yù)測編碼,并且所述確定裝置被設(shè)置成響應(yīng)于第二自相關(guān)序列而確定所述音頻信號和該音頻信號的拉蓋爾濾波版本之間的協(xié)方差序列。
10. 權(quán)利要求l的設(shè)備,其中第一自相關(guān)序列是巻曲自相關(guān)序列。
11. 權(quán)利要求l的設(shè)備,其中第一自相關(guān)序列是濾波的巻曲自相關(guān)序列。
12. 權(quán)利要求1的設(shè)備,其中所述確定裝置(405 )被設(shè)置成通過最小化與采用線性預(yù)測編碼系數(shù)的線性預(yù)測濾波器的輸入信號關(guān)聯(lián)的誤差信號的信號功率度量來確定這些線性預(yù)測系數(shù),所述輸入信號由第二自相關(guān)序列表征。
13. 權(quán)利要求1的設(shè)備,其中所述確定裝置(405 )被設(shè)置成通過求解下式給出的線性方程來確定線性預(yù)測系數(shù)<formula>formula see original document page 3</formula>式中,Q為包含響應(yīng)于第二自相關(guān)序列而確定的系數(shù)的矩陣,P為包含響應(yīng)于第二自相關(guān)序列而確定的系數(shù)的矢量,a為包含所述線性預(yù)測系數(shù)的矢量。
14. 權(quán)利要求1的設(shè)備,其中所述修改裝置(405 )被設(shè)置成基本上依照下式來確定第二自相關(guān)序列式中,r(k)為第二自相關(guān)序列,卩為縮放因子,w(k)為加窗序列,t(k)為安靜閾值自相關(guān)序列。
15. —種用于編碼音頻信號的線性預(yù)測編碼器,該編碼器包括-用于為該音頻信號產(chǎn)生信號段的裝置(201);-用于為每個信號段產(chǎn)生第一自相關(guān)序列的裝置(401);-用于通過響應(yīng)于至少一個心理聲學(xué)特性而修改第一自相關(guān)序列來為每個信號段產(chǎn)生第二自相關(guān)序列的修改裝置(4(B);以及-用于響應(yīng)于第二自相關(guān)序列而為每個信號段確定線性預(yù)測編碼系數(shù)的確定裝置(405 )。
16. —種音頻記錄設(shè)備,包括依照權(quán)利要求15的編碼器。
17. —種用于發(fā)送音頻信號的發(fā)送器(101),該發(fā)送器包括-用于接收該音頻信號的裝置(107);-用于為該音頻信號產(chǎn)生信號段的裝置(201);-用于為每個信號段產(chǎn)生第一自相關(guān)序列的裝置(401);-用于通過響應(yīng)于至少一個心理聲學(xué)特性而修改第一自相關(guān)序列來為每個信號段產(chǎn)生第二自相關(guān)序列的修改裝置(403 );-用于響應(yīng)于第二自相關(guān)序列而為每個信號段確定線性預(yù)測編碼系數(shù)的線性預(yù)測編碼裝置(405 );-用于為該音頻信號產(chǎn)生編碼的數(shù)據(jù)的裝置(209),所述編碼的數(shù)據(jù)包含所述線性預(yù)測編碼系數(shù);以及-用于發(fā)送該編碼的數(shù)據(jù)的裝置(111)。
18. —種用于傳輸音頻信號的傳輸系統(tǒng),該傳輸系統(tǒng)包括-發(fā)送器(101 ),包括-用于接收該音頻信號的裝置(107),-用于為該音頻信號產(chǎn)生信號段的裝置(201),-用于為每個信號段產(chǎn)生第一自相關(guān)序列的裝置(401),-用于通過響應(yīng)于至少一個心理聲學(xué)特性而修改第一自相關(guān)序列來為每個信號段產(chǎn)生第二自相關(guān)序列的修改裝置(403 ),-用于響應(yīng)于第二自相關(guān)序列而為每個信號段確定線性預(yù)測編碼系數(shù)的線性預(yù)測編碼裝置(405 ),-用于為該音頻信號產(chǎn)生編碼的數(shù)據(jù)的裝置(209),所述編碼的數(shù)據(jù)包含所述線性預(yù)測編碼系數(shù),以及-用于向接收器發(fā)送(111)該編碼的數(shù)據(jù)的裝置;以及-接收器(103),包括-用于接收所述編碼的數(shù)據(jù)的裝置(113),-用于產(chǎn)生解碼的信號的線性預(yù)測濾波器(305 ),以及-用于響應(yīng)于所述編碼的數(shù)據(jù)的線性預(yù)測編碼系數(shù)而設(shè)置線性預(yù)測合成濾波器(305 )的系數(shù)的裝置(301)。
19. 一種音頻信號的線性預(yù)測編碼方法,該方法包括-為該音頻信號產(chǎn)生(501)信號段;-為每個信號段產(chǎn)生(503 )第一自相關(guān)序列;-通過響應(yīng)于至少一個心理聲學(xué)特性而修改第一自相關(guān)序列來為每個信號段產(chǎn)生(505 )第二自相關(guān)序列;以及-響應(yīng)于第二自相關(guān)序列而為每個信號段確定(507 )線性預(yù)測編碼系數(shù)。
20. —種發(fā)送音頻信號的方法,該方法包括-接收該音頻信號;-為該音頻信號產(chǎn)生(501)信號段;-為每個信號段產(chǎn)生(503 )第一自相關(guān)序列;-通過響應(yīng)于至少一個心理聲學(xué)特性而修改第一自相關(guān)序列來為每個信號段產(chǎn)生(505 )第二自相關(guān)序列;-響應(yīng)于第二自相關(guān)序列而為每個信號段確定(507 )線性預(yù)測編碼系數(shù);-為該音頻信號產(chǎn)生編碼的數(shù)據(jù),所述編碼的數(shù)據(jù)包含所述線性預(yù)測編碼系數(shù);以及-發(fā)送該編碼的數(shù)據(jù)。
21. —種發(fā)送和接收音頻信號的方法,該方法包括發(fā)送器(901 )執(zhí)行步驟-接收該音頻信號,-為該音頻信號產(chǎn)生(501)信號段,-為每個信號段產(chǎn)生(503 )第一自相關(guān)序列,-通過響應(yīng)于至少一個心理聲學(xué)特性而修改第一自相關(guān)序列來為每個信號段產(chǎn)生(505 )第二自相關(guān)序列,-響應(yīng)于第二自相關(guān)序列而為每個信號段確定(507)線性預(yù)測編碼系數(shù),-為該音頻信號產(chǎn)生編碼的數(shù)據(jù),所述編碼的數(shù)據(jù)包含所述線性預(yù)測編碼系數(shù),以及-向接收器發(fā)送該編碼的數(shù)據(jù);以及-接收器執(zhí)行步驟-接收所述編碼的數(shù)據(jù),-使用線性預(yù)測濾波器產(chǎn)生解碼的信號,以及-響應(yīng)于所述編碼的數(shù)據(jù)的線性預(yù)測編碼系數(shù)而設(shè)置線性預(yù)測合成濾波器的系數(shù)。
22. —種計算機程序產(chǎn)品,用于執(zhí)行權(quán)利要求19-21中任何一項的方法。
全文摘要
一種用于音頻信號的線性預(yù)測編碼的設(shè)備包括為該音頻信號產(chǎn)生信號段的分割處理器(201)。自相關(guān)處理器(401)為每個信號段產(chǎn)生第一自相關(guān)序列,修改處理器(403)通過響應(yīng)于至少一個心理聲學(xué)特性而修改第一自相關(guān)序列來為每個信號段產(chǎn)生第二自相關(guān)序列。預(yù)測系數(shù)處理器(405)響應(yīng)于第二自相關(guān)序列而為每個信號段確定線性預(yù)測編碼系數(shù)。本發(fā)明允許實現(xiàn)低復(fù)雜度的線性編碼,其考慮了心理聲學(xué)因素,從而針對給定的數(shù)據(jù)率允許獲得改進的感知編碼質(zhì)量。
文檔編號G10L21/02GK101460998SQ200780020345
公開日2009年6月17日 申請日期2007年5月15日 優(yōu)先權(quán)日2006年5月30日
發(fā)明者A·C·登布林克 申請人:皇家飛利浦電子股份有限公司