專利名稱:音頻編碼器和解碼器及用于音頻信號的編碼和解碼的方法
技術(shù)領域:
本發(fā)明涉及音頻信號編碼和解碼領域。
背景技術(shù):
移動通信系統(tǒng)呈現(xiàn)了用于話音傳送服務的挑戰(zhàn)性環(huán)境。話音呼叫實際上能夠在任何地方進行,并且周圍背景噪聲和聲學條件將對傳送的語音的質(zhì)量和可理解性有影響。同時,存在用于限制每個通信裝置消耗的傳送資源的強烈的動機。移動通信服務因此采用壓縮技術(shù)以便降低話音信號消耗的傳送帶寬。低帶寬消耗在移動裝置和基站中均產(chǎn)生了低功耗。這轉(zhuǎn)化成了移動運營商的能量和成本節(jié)約,同時最終用戶將體驗到延長的電源壽命和 增大的通話時間。此外,通過每用戶更少消耗的帶寬,移動網(wǎng)絡能夠同時服務于更大數(shù)量的用戶。今天,用于移動話音服務的主導壓縮技術(shù)是例如在“極低比特率的碼激勵線性預測(CELP)高質(zhì)量語音’’("Code-Excited Linear Prediction (CELP) high-quality speechat very low bit rates", M. R. Schroeder and B. Atal, IEEE ICASSP 1985)中所述的碼激勵線性預測(CELP)。CELP是根據(jù)合成式分析過程操作的編碼方法。在用于話音編碼的CELP中,使用了線性預測分析以便基于要編碼的音頻信號確定表示人聲道的慢速變化線性預測(LP)濾波器A(z)。將音頻信號分割成信號段,并且使用確定的A(Z)過濾信號段,過濾產(chǎn)生過濾的信號段,經(jīng)常稱為LP殘差。隨后,形成目標信號x(n),一般是通過加權(quán)合成濾波器
過濾LP殘差以形成在加權(quán)域中的目標信號x(n)。目標信號X (η)用作用于合成式分析過程的參考信號,其中,搜索自適應碼本以查找在通過加權(quán)合成濾波器過濾時將提供目標信號的良好近似的過去激勵樣本的序列。隨后,通過從過濾的信號段減去所選擇的自適應碼本信號,推導次要目標信號χ2 (η)。次要目標信號又用作用于又一合成式分析過程的參考信號,其中,搜索固定碼本以查找脈沖的向量,脈沖的向量通過加權(quán)合成濾波器過濾時將提供次要目標信號的良好近似。隨后,通過所選擇的自適應碼本向量和所選擇的固定碼本向量的線性組合更新自適應碼本。通過使用CELP,良好的語音質(zhì)量一般在適度低帶寬得以實現(xiàn),并且該方法在諸如GSM-EFR、AMR和AMR-WB等部署的編解碼器中廣泛使用。然而,對于極低比特率,CELP編碼技術(shù)的限制開始顯現(xiàn)。雖然有聲語音的段仍表現(xiàn)良好,但諸如摩擦音等更多噪聲類輔音開始聽起來更差。在背景噪聲中也能夠感覺到質(zhì)量下降。如上所看到的一樣,CELP技術(shù)使用基于脈沖的激勵信號。對于有聲信號段,過濾的信號段(目標激勵信號)集中在對應于語音段的基頻的定期間隔出現(xiàn)的所謂喉脈沖周圍。此結(jié)構(gòu)能夠通過脈沖的向量很好地建模。另一方面,對于噪聲類段,目標激勵信號結(jié)構(gòu)更松散,表現(xiàn)在能量在整個向量內(nèi)更分散。此類能量分布未通過脈沖的向量很好地捕捉,并且尤其在低比特率未很好地捕捉。在比特率低時,脈沖只是變得太少而不能適當?shù)夭蹲皆肼曨愋盘柕哪芰糠植?,并且結(jié)果合成語音將具有經(jīng)常稱為CELP編解碼器的稀疏假象的雜音失真。因此,對于例如在傳送信道條件差時能夠有利的極低比特率,要求使用CELP的備選以便獲得聲音良好的合成信號。幾個技術(shù)已開發(fā)以便處理在低比特率的CELP稀疏假象。W099/12156公開了一種解碼已編碼信號的方法,其中,防稀疏濾波器應用為在語音信號的解碼中的后處理步驟。此類防稀疏處理降低了稀疏假象,但最后結(jié)果仍能夠聽起來有點不自然。技術(shù)領域熟知的減輕稀疏假象的另一種方法經(jīng)常稱為噪聲激勵線性預測(NELP)。在NELP中,使用噪聲信號作為激勵信號來處理信號段。噪聲激勵只適用于噪聲類聲音的表示。因此,使用NELP的系統(tǒng)經(jīng)常將例如CELP等不同激勵方法用于聲調(diào)或有聲段。因此,NELP技術(shù)依賴為音頻信號的無聲和有聲部分使用不同編碼策略的語音段的分類。這些編碼策略之間的差別在有聲與無聲切換策略之間切換時引發(fā)切換假象。此外,噪聲激勵一般將不能成功地為復雜的噪聲類信號的激勵建模,并且防稀疏假象的部分因此一般將保持不變。如從上面所述能夠看到的一樣,需要改進的編解碼器,由此即使在為低比特率傳送將編碼的信號編碼時,也能夠獲得高質(zhì)量合成音頻信號。
發(fā)明內(nèi)容
本發(fā)明的目的涉及在以低比特率傳送編碼信號時改進合成音頻信號的質(zhì)量。此目的通過編碼方法、解碼方法、音頻編碼器、音頻解碼器及用于音頻信號的編碼和解碼的計算機程序而得以解決。提供了一種將音頻信號編碼和解碼的方法,其中,通過編碼時間域信號段的頻率域表示,更新編碼器及解碼器的自適應譜碼本。編碼器分析收到的時間域信號段以產(chǎn)生頻率域表示,并且搜索編碼器中的自適應譜碼本以查找提供獲得的頻率域表示的第一近似的ASCB向量。選擇此ASCB向量。從頻率域表示與所選擇的ASCB向量之間的差生成殘差頻率表示。隨后,搜索編碼器中的固定譜碼本以查找提供殘差頻率表示的近似的FSCB向量。也選擇此FSCB向量。從兩個所選擇的向量可生成合成頻率域表示。編碼器還生成信號表示,信號表示指示引用所選擇的ASCB向量的索引和引用所選擇的FSCB向量的索引。線性組合的增益也能夠有利地在信號表示中指示。通過使用從信號表示取回的ASCB索引和FSCB索引,識別ASCB向量和FSCB向量,能夠解碼如上所述由編碼器生成的信號表示。在信號表示的解碼中,識別的ASCB向量和識別的FSCB向量的線性組合提供要合成的時間域信號段的合成頻率域表示。從合成頻率域表不生成合成時間域信號。通過在音頻信號的編碼中使用時間域信號段的頻率域表示,也能夠在低比特率有效獲得噪聲類聲音的譜分布的控制,并且在編碼器與解碼器之間的傳送信道提供低比特率時,也能夠改進此類聲音的合成。由于為語音信號的編碼考慮的時間域信號段的長度較短,因此,對應頻率域表示將可能顯示在時間鄰近幀之間的大變化。通過提供經(jīng)常更新的自適應譜碼本,確保能夠找到頻率域表示的適合近似,而不管在時間域信號段的時間鄰近頻率域表示之間的預期差相關。在一個實施例中,通過執(zhí)行時間域信號段的時間到頻率域變換分析,由此獲得段譜,來獲得頻率域表示。頻率域表示作為段譜的至少一部分獲得。時間到頻率域變換例如能夠是離散傅立葉變換(DFT),其中,獲得的段譜包括幅度譜和相位譜。頻率域表示隨后能夠?qū)诙巫V的幅度譜部分。時間到頻率域變換分析的另一示例是修改的離散余弦變換分析,該分析生成單個實值MDCT譜。在此情況下,頻率域表示能夠?qū)贛DCT譜。備選,可使用其它分析。在另一實施例中,通過執(zhí)行時間域信號段的線性預測分析,獲得頻率域表示。在一個實施例中,應用到時間域信號段的編碼/解碼方法取決于段攜帶的聲音信息的相位靈敏度。在此實施例中,應將段作為相位不靈敏還是相位靈敏處理的指示能夠例如作為信號表示的一部分發(fā)送到解碼器。對于攜帶相位不靈敎信息的段,從合成頻率域表示的合成時間域信號的生成能夠包括能夠在解碼器中有利地生成的隨機分量。例如,在編碼器中執(zhí)行的頻率分析是DFT時,相位譜能夠在解碼器中隨機生成,或者在頻率分析是LP分析時,時間域激勵信號能夠在解碼器中隨機生成。對于攜帶相位靈敎信息的段的編碼,將使用諸如CELP等基于時間域的編碼方法。備選,使用自適應譜碼本的基于頻率域的編碼方法也能夠用于相位靈敎信號段的編碼,其中,信號表示包括用于相位靈敏信號段的信息多于用于相位不靈敏的信息。例如,如果一些信息在用于相位不靈敏段的解碼器中隨機生成,則至少部分此類信息對于相位靈敏段轉(zhuǎn)而由編碼器參數(shù)化,并且作為信號表示的一部分傳輸?shù)浇獯a器。通過為不同類型的聲音使用編碼/解碼方法,能夠保持用于信號表示的傳送的低帶寬要求,同時允許借助于使用自適應譜碼本的基于頻率域的編碼方法,編碼噪聲類聲音。諸如段譜的相位或時間域激勵信號等隨機生成的信息在一個實施例中能夠用于所有信號段,而與相位靈敏度無關。在頻率分析是DFT,并且隨機生成相位譜在段的解碼中使用時,隨機譜的DC分量的符號例如能夠根據(jù)段譜的DC分量的符號進行調(diào)整,由此改進在鄰近段之間能量演化的穩(wěn)定性。因此,段譜的DC分量的符號能夠包括在信號表示中。通過在合成段譜時使用隨機生成的相位信息,能夠大幅減少或者在一些實施例中甚至消除要從編碼器傳送到解碼器的相位信息量。在一個實施例中,編碼方法可包括頻率域表示的第一近似的質(zhì)量估計。如果此類質(zhì)量估計指示質(zhì)量不充分,則編碼器能夠進入快速收斂模式,其中,頻率域表示通過至少兩個FSCB向量而不是一個FSCB向量和一個ASCB向量來近似。由于在自適應譜碼本中存儲的ASCB向量可因此不那么適合用于近似頻率域表示,因此,在要編碼的音頻信號快速更改或者在自適應譜碼本已啟動后立即更改的情況下,這能夠是有用的??焖偈諗磕J侥軌蚶缱鳛樾盘柋硎镜囊徊糠滞ㄟ^信號發(fā)送到解碼器。編碼器和解碼器的自適應譜碼本也能夠有利地在快速收斂模式中更新。編碼器和解碼器的自適應譜碼本的更新能夠以相關性指示符超過相關性閾值為條件,相關性指示符為將來時間域信號段的編碼性提供特定頻率域表示的相關性的值。段的全局增益例如能夠用作相關性指示符。在解碼器中,相關性指示符的值在一個實施例中能夠由解碼器本身確定,或者相關性指示符的值能夠例如作為信號表示的一部分從編碼器接收。本發(fā)明的其它方面在下面的詳細描述和附圖中陳述。
圖1是包括編碼器和解碼器的音頻編解碼器系統(tǒng)的示意圖。圖2是示出將音頻信號編碼成信號表示的方法的流程圖。圖3是示出解碼信號表示和合成音頻信號的方法的流程圖。圖4以示意圖方式示出音頻編碼器的一實施例。圖5以不意圖方式不出音頻解碼器的一實施例。圖6是示出編碼和解碼方法的一實施例的特征的流程圖。圖7以示意圖方式示出編解碼器的一實施例的特征。圖8是示出編碼方法的一實施例的特征的流程圖。圖9以示意圖方式示出編碼器的一實施例的特征。圖10以示意圖方式示出對應于圖9所示編碼器特征的解碼器特征。圖11是示出編碼方法的一實施例的特征的流程圖,由此編碼器能夠進入相位靈敏或相位不靈敏編碼模式之一。圖12是示出圖2的編碼方法的一實施例的流程圖。圖13是示出圖3的解碼方法的一實施例的流程圖。圖14以示意圖方式示出編碼器的一實施例。圖15以示意圖方式示出解碼器的一實施例。圖16以示意圖方式示出編碼器的一實施例。圖17以示意圖方式示出解碼器的一實施例。圖18是編碼器或解碼器的備選圖示。
具體實施例方式圖1以示意圖方式示出編解碼器系統(tǒng)100,包括具有編碼器110的第一用戶設備105a及具有解碼器112的第二用戶設備105b。在一些實現(xiàn)中,用戶設備105a/b能夠包括編碼器110和解碼器112。通常引用任何用戶設備時,將使用標號105。編碼器110配置成接收輸入音頻信號115和將輸入信號115編碼成壓縮音頻信號表不120。另一方面,解碼器112配置成接收音頻信號表不120,并且將音頻信號表不120解碼成合成音頻信號125,其因此是輸入音頻信號115的再現(xiàn)。輸入音頻信號115 —般由編碼器110或在信號到達編碼器110前由其它設備分割成輸入信號段序列,并且編碼器110/解碼器112執(zhí)行的編碼/解碼一般在逐段基礎上執(zhí)行。兩個連續(xù)的信號段可具有時間重疊,使得一些信號信息在兩個信號段中攜帶,或備選,兩個連續(xù)信號段可表示兩個完全不同且一般鄰近的時間期。信號段例如能夠是信號幀、不止一個信號幀的序列或信號幀的一部分。根據(jù)本發(fā)明,通過使用以下編碼/解碼技術(shù),能夠避免在上面相對于CELP編碼技術(shù)論述的在低比特率的稀疏假象的效應其中,輸入音頻信號從時間域變換到頻率域中,使得生成信號譜。通過帶來直接控制信號段的譜能量分布的可能性,噪聲類信號段能夠甚至在低比特率更準確地再現(xiàn)。攜帶非周期性信息的信號段能夠視為噪聲類。此類信號段的示例是攜帶摩擦聲音和噪聲類背景噪聲的信號段。從例如W095/28699和“使用變換編碼激勵(TCX)的寬帶音頻信號的高質(zhì)量編碼,,(,Tlfgi Quality Coding of Wideband Audio Signals using Transform CodedExcitation (TCX) 〃,R· Lefebvre et al., ICASSP 1994, pp. 1/193 - 1/196 vol.I)中知道作為編碼過程的一部分,將輸入音頻信號變換到頻率域中。稱為TCX并且其中輸入音頻信號變換成頻率域中的信號譜的這些出版物中公開的方法被提議作為在高比特率CELP的備選,其中,CELP要求高處理能力一CELP的計算要求隨比特率呈指數(shù)增大。在R. Lefebvre 的TCX編碼方法中,信號譜的預測通過從變換以前的信號段獲得的以前的信號譜提供。預測殘差隨后作為信號譜的預測與信號譜本身之間的差獲得。隨后,搜索譜預測殘差碼本以查找提供預測殘差的良好近似的殘差向量。已為要求高比特且其中在鄰近信號段之間譜能量分布中存在高相關的信號的編碼開發(fā)了 TCX方法。此類信號的示例是音樂。另一方面,對于表示諸如摩擦音等噪聲類聲音的信號段,在使用對話音編碼典型的段長度時(例如,其中5 ms是話音編碼信號段的經(jīng)常使用的持續(xù)時間),鄰近信號段的譜能量分布通常不那么相關。由于更長的時間窗口將降低 時間分辨率,并且可能在噪聲類短暫音上具有拖尾效應,因此,更長的信號段持續(xù)時間經(jīng)常是不當?shù)?。然而,根?jù)本發(fā)明,噪聲類聲音的譜分布的控制能夠通過使用編碼/解碼技術(shù)獲得,其中,將源于音頻信號的時間域信號段變換到頻率域中,使得生成段譜,以及其中自適應譜碼本(ASCB)用于搜索能夠提供段譜的近似的向量。ASCB包括表示以前合成的段譜的多個自適應譜碼本向量,將提供段譜的第一近似的其中一個向量被選中。隨后,生成表示在段譜與第一譜近似之間差的殘差譜。隨后,搜索固定譜碼本(FSCB)以識別和選擇能夠提供殘差譜的近似的FSCB向量。隨后,通過使用所選擇的ASCB向量和所選擇的FSCB向量的線性組合,能夠合成信號段。隨后,通過將表示合成幅度譜的向量包括在譜自適應碼本向量集中,更新ASCB。通過使用時間對頻率域變換與用于將音頻信號段編碼的自適應譜碼本組合,實現(xiàn)了能夠獲得音頻信號的有效編碼和解碼,其中,噪聲類聲音以令人滿意的方式再現(xiàn)。實驗研究顯示,雖然在時間域中自適應碼本一般用于促進強周期信號的編碼,但一般是非周期性的噪聲類信號的編碼能夠通過使用自適應譜碼本有效執(zhí)行。時間對頻率域變換有利于信號段的譜能量分布的準確控制,而自適應譜碼本確保能夠找到段譜的適合近似,而不管在攜帶噪聲類聲音的信號段的時間鄰近段譜之間的可能差的相關。根據(jù)本發(fā)明的一實施例的編碼方法在圖2中示出。圖2所示的方法將稱為基于變換的自適應編碼方法。在步驟200,在編碼器110接收包括N個樣本的時間域(TD)信號段f5'其中,m指示段號。在圖2和3的以下描述中,描述了特定信號段的編碼和解碼,并且將從描述中省略段號m。TD信號段F例如能夠是音頻信號115的段,或者TD信號段能夠是音頻信號115的量化和預處理段。音頻信號的預處理例如能夠包括通過線性預測濾波器過濾音頻信號和/或感知加權(quán)。在一些實現(xiàn)中,量化,分段和/或任何其它預處理在編碼器110中執(zhí)行,或者此類信號處理能夠已在編碼器HO的輸入連接到的其它設備中執(zhí)行。在步驟205中,應用時間到頻率變換到TD信號段f,使得生成段譜S。時間到頻率變換例如能夠是例如實現(xiàn)為快速傅立葉變換的離散傅立葉變換
Innk
S(k) = J] =o T(n)e ⑴,,其中,τ (η)是TD信號段樣本,!1則.0,1., 洱一11,并且3(10是復DFT的第k個分量,k E [O, I,... j N — 11 ο備選能夠在步驟205中使用的其它可能變換包括離散余弦變換、Hadamard變換、Kariwm-Loew變換、奇值分解(SVD)變換、正交鏡像濾波器(QMF)濾波器組等。此類變換算法在技術(shù)領域中已知,并且此處將不再進一步描述。步驟205 —般包括確定幅度譜Jr
其中,M=N/2 +1 (假設N是偶數(shù))。如果只要求幅度譜,則因此將足以使k從k=0運行到k=M,而如果需要完全相位譜,則k將有利地從k=0運行到k=N-l。在步驟210中,搜索ASCB以查找能夠提供幅度譜f的第一近似及因此段譜S的第
一近似的向量。ASCB能夠視為具有維數(shù)NascbXM (或MXNascb)的矩陣己,其中,Nascb表示在ASCB中包括的自適應譜碼本向量的數(shù)量,其中,Nascb的典型值能夠位于范圍[16,128]內(nèi)(備選能夠使用Nascb的其它值)。矩陣的每行(或列)表示以前段的合成幅度譜,使得Ca,i,k(CA,k,i)表示用于段 m_i 的頻率箱(frequency bin), ke
, i=l, 2, 3...,Nascb,其中,m表示當前段。為便于描述,在下述內(nèi)容中將假設以前合成譜由ASCB矩陣^的行而不是列表示。此外,為便于說明,將假設^的行已歸一化,使得
權(quán)利要求
1.一種將音頻信號編碼的方法,所述方法包括 在音頻編碼器中接收源于所述音頻信號的時間域信號段; 在所述音頻編碼器中執(zhí)行所述時間域信號段的頻率分析,以便獲得所述信號段的頻率域表示; 搜索所述音頻編碼器的自適應譜碼本以查找提供所述頻率域表示的第一近似的自適應譜碼本向量,所述自適應譜碼本包括多個自適應譜碼本向量; 選擇提供第一近似的所述自適應譜碼本向量; 從所述頻率域表示與所選擇的自適應譜碼本向量之間的差生成殘差頻率表示; 搜索所述音頻編碼器的固定譜碼本以查找提供所述殘差頻率表示的近似的固定譜碼本向量,所述固定譜碼本包括多個固定譜碼本向量; 選擇提供所述殘差頻率表示的近似的所述固定譜碼本向量; 通過包括作為所選擇的固定譜碼本向量和所選擇的自適應譜碼本向量的線性組合獲得的向量,更新所述音頻編碼器的所述自適應譜碼本;以及 在所述音頻編碼器中生成所述收到時間域信號段的信號表示,所述信號表示指示引用所選擇的固定譜碼本向量的索引和引用所選擇的固定譜碼本向量的索引,所述信號表示要傳輸?shù)浇獯a器。
2.如權(quán)利要求I所述的編碼方法,其中 所選擇的自適應譜碼本向量在最小均方誤差意義上匹配所述頻率域表示以最小化所述殘差頻率表示;以及 所選擇的固定譜碼本向量在最小均方誤差意義上匹配所述殘差頻率表示。
3.如權(quán)利要求I或2所述的編碼方法,還包括 在所述音頻編碼器中為將來頻率域表示的編碼性確定所述線性組合的相關性;以及其中 所述自適應譜碼本的所述更新以所述相關性超過預確定的相關性閾值為條件。
4.如權(quán)利要求3所述的編碼方法,其中 通過確定所述段的全局增益,確定所述線性組合的所述相關性;以及 所述自適應譜碼本的所述更新以所述全局增益超過全局增益閾值為條件。
5.如前面權(quán)利要求任一項所述的編碼方法,其中 所述段被分類為相位靈敏段或相位不靈敏段,以及其中段的所述編碼取決于所述段是被分類為相位靈敏還是相位不靈敏。
6.如權(quán)利要求5所述的編碼方法,其中 所述段是相位不靈敏段; 被分類為相位靈敏的任何其它收到信號段將借助于基于時間域的編碼方法進行編碼。
7.如權(quán)利要求5所述的編碼方法,其中在所述段是相位靈敏時,所述信號表示包括比在所述段是相位不靈敏時與所述執(zhí)行的頻率分析的結(jié)果有關的更多信息。
8.如前面權(quán)利要求任一項所述的編碼方法,其中 所述頻率分析是線性預測分析,以及所述頻率域表示是線性預測濾波器。
9.如權(quán)利要求1-7任一項所述的編碼方法,其中 所述頻率分析是時間到頻率域變換,借助于所述時間到頻率域變換獲得段譜;以及如果從所述段譜的至少一部分形成,則所述頻率域表示。
10.如權(quán)利要求9所述的編碼方法,還包括 在所述音頻編碼器中識別所述段譜的實值DC分量的符號;以及其中執(zhí)行表示所述收到時間域信號段的信號的所述生成,使得所述信號指示所述DC分量的所述符號。
11.如權(quán)利要求8或9所述的編碼方法,還包括 在所述音頻編碼器中確定所述段譜的相位;以及其中 執(zhí)行表示所述收到時間域信號段的信號的所述生成,使得所述信號指示所述段譜的所述相位的至少一部分的參數(shù)化表示。
12.如在從屬于權(quán)利要求5時的權(quán)利要求11所述的編碼方法,其中 所述段譜的所述相位的所述確定以所述段已被分類為相位靈敏段為條件。
13.如前面權(quán)利要求任一項所述的方法,還包括 在所述音頻編碼器中接收源于所述音頻信號的又一時間域信號段; 在所述音頻編碼器中執(zhí)行所述又一時間域信號段的所述頻率分析,以便獲得表示所述又一時間域信號的又一頻率域表不; 確定由任何所述自適應譜碼本向量提供的所述又一頻率域表示的第一近似的質(zhì)量將是否充分;以及如果不充分 則搜索所述固定譜碼本以查找至少兩個其它固定譜碼本向量,其線性組合提供所述又一頻率域表示的近似,以及選擇所述至少兩個其它固定譜碼本向量; 通過包括作為所述至少兩個其它固定譜碼本向量的線性組合獲得的向量,更新所述自適應譜碼本;以及 在所述音頻編碼器中,生成表示所述又一時間域信號段并且指示其它固定碼本索引的信號,每個索引引用所述至少兩個其它所選擇的固定碼本向量之一。
14.如前面權(quán)利要求任一項所述的方法,其中 所述時間域信號段源于已通過使用線性預測濾波器過濾的所述音頻信號的段。
15.如前面權(quán)利要求任一項所述的方法,其中 在執(zhí)行所述搜索前,在所述音頻編碼器中應用感知加權(quán)到所述時間域信號段和/或所述頻率域表示。
16.一種將已借助于如權(quán)利要求1-15任一項所述編碼方法編碼的音頻信號解碼的方法,所述方法包括 在音頻解碼器中接收表示所述音頻信號的時間域信號段的信號,所述表示指示自適應譜碼本索引和固定譜碼本索引; 在所述音頻解碼器的自適應譜碼本中識別所述自適應譜碼本索引引用的自適應譜碼本向量,所述自適應譜碼本包括多個自適應譜碼本向量; 在所述音頻解碼器的固定譜碼本中識別所述固定譜碼本索引引用的固定譜碼本向量,所述固定譜碼本包括多個固定譜碼本向量; 在所述音頻解碼器中從所述識別的固定譜碼本向量和所述識別的自適應譜碼本向量的線性組合生成所述信號段的合成頻率域表示; 在所述音頻解碼器中通過使用所述合成頻率域表示,生成合成時間域信號段;以及通過包括對應于所述識別的自適應譜碼本向量和所述識別的固定譜碼本向量線性組合的線性組合的向量,更新所述自適應譜碼本。
17.如權(quán)利要求16所述的解碼方法,還包括 在所述音頻解碼器中為將來頻率域表示的編碼性確定所述線性組合的相關性;以及其中 所述自適應譜碼本的所述更新以所述線性組合的所述相關性超過預確定的相關性閾值為條件。
18.如權(quán)利要求16或17所述的解碼方法,還包括 在所述音頻解碼器中接收要合成的所述段是相位不靈敏段的指示。
19.如權(quán)利要求16-18任一項所述的解碼方法,其中所述頻率域表示對應于在時間域中適用的濾波器,以及通過應用所述濾波器到激勵信號,執(zhí)行合成時間域信號段的所述生成。
20.如權(quán)利要求16-18任一項所述的解碼方法,其中 所述生成的合成頻率域表示是段譜的合成幅度譜;以及 通過應用頻率到時間變換到所述段譜,執(zhí)行合成時間域信號段的所述生成。
21.如在從屬于權(quán)利要求18時的權(quán)利要求20所述的解碼方法,還包括 在執(zhí)行所述頻率到時間變換之前借助于隨機數(shù)生成器在所述音頻解碼器中確定偽隨機相位譜;以及 在應用所述頻率到時間變換到所述段譜之前將所述偽隨機相位譜指派到所述段譜。
22.如權(quán)利要求21所述的解碼方法,其中 所述信號表示還包括所述段譜的實值DC分量的符號的指示;以及所述方法還包括 在應用所述頻率到時間變換到所述段譜之前,在所述解碼器中將所述指示的符號指派到所述偽隨機相位譜的所述實值DC分量。
23.如權(quán)利要求20所述的解碼方法,其中 表示所述時間域信號段的所述信號指示所述段譜的所述相位譜的至少一部分的參數(shù)化表示;所述方法還包括 在應用所述頻率到時間變換到所述段譜之前,根據(jù)所述相位參數(shù)化,在所述解碼器中指派相位譜到所述段譜。
24.如權(quán)利要求20-23任一項所述的解碼方法,其中 所述識別的自適應譜碼本向量和所述識別的固定譜碼本向量是量化的譜; 所述段譜的所述合成包括 識別合成所述段譜的所述兩個碼本向量的所述幅度之和取負值的任何頻率箱;以及在應用所述頻率到時間變換到所述段譜之前,為此類頻率箱將所述段譜的所述幅度設成O。
25.如權(quán)利要求16-24任一項所述的解碼方法,還包括 在與又一時間域信號段的所述合成有關的所述音頻編碼器中,接收所述又一信號段應借助于至少兩個固定譜碼本向量來合成的指示,以及接收至少兩個固定譜碼本索引; 借助于所述收到的至少兩個固定譜碼本索引在所述固定譜碼本中,識別對應的至少兩個固定譜碼本向量;在所述音頻解碼器中從所述至少兩個識別的固定譜碼本索引的線性組合生成又一合成頻率域表示; 在所述音頻解碼器中通過使用所述合成頻率域表示,生成合成時間域信號段;以及通過包括對應于所述至少兩個識別的固定譜碼本向量的所述線性組合的向量,更新所述自適應譜碼本。
26.一種用于將音頻信號編碼的音頻編碼器,所述編碼器包括 輸入,配置成接收源于音頻信號的時間域信號段; 自適應譜碼本,配置成存儲和更新多個自適應譜碼本向量; 固定譜碼本,配置成存儲多個固定譜碼本向量; 處理器,連接到所述輸入,所述處理器還連接到所述自適應譜碼本、所述固定譜碼本及 輸出,所述處理器可通過編程配置成 執(zhí)行在所述輸入收到的時間域信號段的頻率分析,以便獲得所述信號段的頻率表示;搜索所述自適應譜碼本以查找能夠提供頻率域表示的第一近似的自適應譜碼本向量,以及選擇能夠提供所述第一近似的所述自適應譜碼本向量; 從頻率域表示與對應所選擇的自適應譜碼本向量之間的差生成殘差頻率表示; 搜索所述固定譜碼本以識別提供所述殘差頻率表示的近似的固定譜碼本向量; 從識別的固定譜碼本向量和識別的自適應譜碼本向量的線性組合生成合成頻率域表示; 通過在所述自適應譜碼本中存儲對應于所述線性組合的向量,更新所述自適應譜碼本;以及 生成收到的時間域信號段的信號表示,所述信號表示指示引用識別的自適應譜碼本向量的自適應譜碼本索引和引用識別的固定譜碼本向量的固定譜碼本索引,所述信號表示要傳輸?shù)浇獯a器;其中 所述輸出連接到所述處理器并且配置成輸送從所述處理器收到的信號表示。
27.如權(quán)利要求26所述的音頻編碼器,其中 所述處理器還可通過編程配置成 為將來頻率域表示的編碼性確定線性組合的相關性;以及僅在所述確定的相關性超過預確定的相關性閾值時,通過對應于識別的固定譜碼本向量和識別的自適應譜碼本向量的線性組合的向量更新所述自適應譜碼本。
28.如權(quán)利要求26或27所述的音頻編碼器,其中 所述處理器還可通過編程配置成 確定收到的時間域信號段是相位靈敏信號段還是相位不靈敏信號段,以及使時間域信號段的所述編碼的至少一部分適應所述時間域信號段是相位靈敏還是相位不靈敏。
29.如權(quán)利要求28所述的音頻編碼器,其中 所述處理器還可通過編程配置成 借助于基于時間域的編碼方法,將任何收到的相位靈敏時間域信號段編碼。
30.如權(quán)利要求28所述的音頻編碼器,其中 所述處理器配置成在所述段是相位靈敏時,包括比在所述段是相位不靈敏時與所述執(zhí)行的頻率分析的結(jié)果有關的更多信息。
31.如權(quán)利要求26-30任一項所述的音頻編碼器,其中所述處理器可通過編程配置成通過執(zhí)行所述信號段的線性預測分析,執(zhí)行時間域信號段的頻率分析。
32.如權(quán)利要求26-30任一項所述的音頻編碼器,其中 所述處理器可通過編程配置成 通過應用時間到頻率變換到所述信號段,使得頻率域表示作為段譜的至少一部分而獲得,來執(zhí)行時間域信號段的頻率分析。
33.如權(quán)利要求32所述的音頻編碼器,其中 所述處理器還可通過編程配置成 識別段譜的實值DC分量的符號;以及 生成所述收到的時間域信號段的信號表示,使得所述信號表示指示表示所述時間域信號段的所述段譜的所述DC分量的所述符號。
34.如權(quán)利要求32或33所述的音頻編碼器,其中 所述處理器還可通過編程配置成 確定段譜的所述相位譜; 參數(shù)化確定的相位譜;以及 生成所述收到的時間域信號段的信號表示,使得所述信號表示指示表示所述時間域信號段的參考化相位譜的至少一部分。
35.如權(quán)利要求34所述的音頻編碼器,其中所述處理器還可通過編程配置成僅在所述信號段是相位靈敏時才參數(shù)化信號段的所述相位譜。
36.如權(quán)利要求26-35任一項所述的音頻編碼器,其中 所述處理器還可通過編程配置成 確定段譜的所述第一近似的所述質(zhì)量是否充分,以及如果不充分,則搜索所述固定譜碼本以查找至少兩個固定譜碼本向量,其線性組合提供所述段譜的近似。
37.一種用于從表示編碼音頻信號的信號合成音頻信號的音頻解碼器,所述解碼器包括 輸入,配置成接收時間域信號段的信號表示,所述信號包括自適應譜碼本索引和固定譜碼本索引; 自適應譜碼本,配置成存儲多個自適應譜碼本向量; 固定譜碼本,配置成存儲多個固定譜碼本向量; 處理器,連接到所述輸入,所述處理器還連接到所述自適應譜碼本、固定譜碼本及輸出,所述處理器可通過編程配置成 通過使用收到的自適應譜碼本索引在所述自適應譜碼本中識別自適應譜碼本向量; 通過使用收到的固定譜碼本索引在所述固定譜碼本中識別固定譜碼本向量; 從識別的自適應譜碼本向量和識別的固定譜碼本向量的線性組合生成合成頻率域表示; 通過使用所述合成頻率域表示,生成合成時間域信號段;以及通過在所述自適應譜碼本中存儲對應于所述線性組合的向量,更新所述自適應譜碼本;其中 所述輸出連接到所述處理器并且配置成輸送從所述處理器收到的合成時間域信號段。
38.如權(quán)利要求37所述的音頻解碼器,其中 所述處理器還可通過編程配置成 為將來段譜的編碼性確定所述合成頻率域表示的相關性;以及僅在所述確定的相關性超過預確定的相關性閾值時,通過對應于識別的自適應譜碼本向量和識別的固定譜碼本向量的線性組合的向量更新所述自適應譜碼本。
39.如權(quán)利要求37或38所述的音頻解碼器,其中 所述處理器還可通過編程配置成 從收到的信號取回信號段是相位靈敏信號段還是相位不靈敏信號段的指示,以及使所述解碼的至少一部分適應所述時間域信號段是相位靈敏還是相位不靈敏。
40.如權(quán)利要求37-39任一項所述的音頻解碼器,其中 頻率域表示對應于在時間域中適用的濾波器;以及 所述處理器可通過編程配置成通過應用所述濾波器到激勵信號,生成合成時間域信號段。
41.如權(quán)利要求37-39任一項所述的音頻解碼器,其中 所述處理器可通過編程配置成通過應用頻率到時間變換到所述合成頻率域表示,生成合成時間域信號段,以及生成的合成頻率域表示是段譜的合成幅度譜。
42.如在從屬于權(quán)利要求39時的權(quán)利要求41所述的音頻解碼器,其中 所述處理器還可通過編程配置成 借助于隨機數(shù)生成器,確定偽隨機相位譜;以及 如果已取回所述信號段是相位不靈敏的指示,則在應用所述頻率到時間變換到段譜之前,指派偽隨機相位譜到所述段譜。
43.如權(quán)利要求42所述的音頻解碼器,其中 所述處理器還可通過編程配置成 從所述信號表示取回段譜的實值DC分量的符號的指示;以及在應用所述頻率到時間變換到所述段譜之前,將所述指示的符號指派到偽隨機相位譜的所述實值DC分量。
44.如權(quán)利要求41-43所述的音頻解碼器,其中 所述處理器還可通過編程配置成 從收到的信號表示取回段譜的所述相位譜的至少一部分的參考化表示的指示;以及 在應用所述頻率到時間變換到段譜之前,根據(jù)所述相位參數(shù)化,指派相位譜到所述段-i'TfeP曰。
45.一種用于在移動無線電通信系統(tǒng)中通信的用戶設備,所述用戶設備包括如權(quán)利要求26-36任一項所述的音頻編碼器和/或如權(quán)利要求37-44任一項所述的音頻解碼器。
46.一種用于音頻信號的編碼的計算機程序,所述計算機程序包括計算機程序代碼部分,所述計算機程序代碼部分在編碼器的處理器上運行時,促使所述編碼器執(zhí)行以下操作 執(zhí)行時間域信號段的頻率分析,以便獲得所述信號段的頻率表示; 搜索自適應譜碼本以查找能夠提供所述頻率域表示的第一近似的自適應譜碼本向量,以及選擇能夠提供所述第一近似的所述自適應譜碼本向量;從所述頻率域表示與所選擇的自適應譜碼本向量之間的差生成殘差頻率表示; 搜索所述固定譜碼本以識別提供所述殘差頻率表示的近似的固定譜碼本向量; 通過包括作為所選擇的固定譜碼本向量和所選擇的自適應譜碼本向量的線性組合獲得的向量,更新所述自適應譜碼本;以及 生成所述時間域信號段的信號表示,所述信號表示指示引用所述識別的自適應譜碼本向量的索引和引用所述識別的固定譜碼本向量的索引,所述信號表示要傳輸?shù)浇獯a器。
47.一種用于音頻信號的解碼的計算機程序,所述計算機程序包括計算機程序代碼部分,所述計算機程序代碼部分在解碼器的處理器上運行時,促使所述解碼器執(zhí)行以下操作 從表示所述音頻信號的時間域信號段的收到信號表示取回自適應譜碼本索引和固定譜碼本索引; 借助于所述取回的自適應譜碼本索引在自適應譜碼本中識別自適應譜碼本向量; 借助于所述取回的固定譜碼本索引在固定譜碼本中識別固定譜碼本向量; 從所述識別的自適應譜碼本向量和所述識別的固定譜碼本向量的線性組合生成所述信號段的合成頻率域表示; 通過使用所述合成頻率域表示,生成合成時間域信號段;以及通過包括對應于所述識別的自適應譜碼本向量和所述識別的固定譜碼本向量的線性組合的向量,更新所述自適應譜碼本。
48.一種計算機程序產(chǎn)品,包括計算機可讀部件和在所述計算機可讀部件上存儲的如權(quán)利要求46或47所述計算機程序。
全文摘要
本發(fā)明涉及將音頻信號編碼和解碼的基于頻率域的方法,其中,使用時間域信號段的合成頻率域表示,更新自適應譜碼本。執(zhí)行收到時間域信號段的頻率分析以便獲得頻率域表示,并且搜索自適應譜碼本以查找頻率域表示的第一近似。搜索固定譜碼本以查找殘差頻率表示的近似值。從這兩個近似可生成合成頻率域表示。
文檔編號G10L19/12GK102985966SQ201080068091
公開日2013年3月20日 申請日期2010年7月16日 優(yōu)先權(quán)日2010年7月16日
發(fā)明者E.諾韋爾, S.布魯恩, H.波布洛特 申請人:瑞典愛立信有限公司