欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

用于快速celp參數映射的方法和裝置的制作方法

文檔序號:2821426閱讀:257來源:國知局
專利名稱:用于快速celp參數映射的方法和裝置的制作方法
技術領域
本發(fā)明總地涉及電信技術。更具體而言,本發(fā)明提供了用于快速映射碼激勵線性預測(CELP)模型參數的方法和裝置。本發(fā)明僅以示例的方式被應用于從一種CELP編碼器/解碼器(編解碼器)到另一CELP編解碼器的語音轉碼(transcode),但是將會認識到,本發(fā)明具有更廣闊的應用范圍。
背景技術
碼激勵線性預測(CELP)語音編碼技術被廣泛應用于語音編解碼器。這樣的編解碼器將語音信號建模為源濾波器模型。源/激勵信號經由自適應和固定碼本產生,并且濾波器按照短期線性預測編碼器(LPC)來建模。然后,用一組參數來代表被編碼的語音,這組參數指定了濾波器參數和激勵的類型。CELP編解碼器的參數包括線譜對(LSP)參數、自適應碼本參數和固定碼本參數。
使用CELP技術的工業(yè)標準編解碼器包括全球移動通信(GSM)增強型全速率(EFR)編解碼器、自適應多速率窄帶(AMR-NB)編解碼器、自適應多速率寬帶(AMR-WB)、G.723.1、G.729、增強型可變速率編解碼器(EVRC)、可選擇模式聲碼器(SMV)、QCELP和MPEG-4。轉碼過程可以將CELP參數從一種語音壓縮格式轉換成另一種語音壓縮格式。一些轉碼技術將被壓縮的信號完全解碼回脈沖編碼調制(PCM)表示,然后再對信號進行重新編碼。這些技術通常使用大量的處理,并且招致相當大的延時。其他轉碼技術將CELP參數從一種壓縮格式轉換成另一壓縮格式,同時保持在參數空間中。這些技術通常使用復雜的計算,這種復雜計算容易發(fā)生溢出錯誤。
因此就期望改善CELP轉碼技術。

發(fā)明內容
本發(fā)明總地涉及電信技術。更具體而言,本發(fā)明提供了用于碼激勵線性預測(CELP)模型參數的快速映射的方法和裝置。本發(fā)明僅以示例的方式被應用于從一種CELP編碼器/解碼器(編解碼器)到另一CELP編解碼器的語音轉碼,但是將會認識到,本發(fā)明具有更廣闊的應用范圍。
根據本發(fā)明的實施方式,在語音轉碼器中用于映射CELP參數的裝置接收作為輸入的源編解碼器CELP參數以及中間信號,這些中間信號已被內插為與目的地編解碼器的幀尺寸、子幀尺寸或其他特性相匹配。該裝置包括將內插LSP參數映射為量化LSP參數的LSP映射模塊、以快速方式將內插自適應碼本參數映射為量化自適應碼本參數的自適應碼本映射模塊,以及以快速方式將內插固定碼本參數映射為量化固定碼本參數的自適應碼本映射模塊。LSP映射模塊檢查內插LSP參數在轉碼信號被設備或系統(tǒng)所解碼時是否可能發(fā)生信號溢出,如果預測出信號溢出,則調整LSP參數,并且量化LSP參數。自適應碼本映射模塊產生自適應碼本目標信號,從自適應碼本中產生用于一個或多個候選基音延遲值的自適應碼本候選矢量信號,計算自適應碼本目標信號和候選信號之間的一組簡化的自相關和互相關點積項,并且搜索簡化的增益矢量量化碼本中的一個或多個條目,以找到能夠提供自相關和互相關點積項的矢量中的最大點積的條目。固定碼本映射模塊產生固定碼本信號,處理固定碼本信號以創(chuàng)建經修改的目標信號,執(zhí)行非常快速的脈沖搜索以找到用于估計固定碼本增益的初始脈沖位置和符號,使用快速脈沖位置搜索技術再次搜索代數碼本,構建固定碼矢,并且輸出固定碼本索引。
根據本發(fā)明的另一實施方式,用于在語音轉碼器中映射CELP參數的方法包括將內插LSP參數映射為量化LSP參數、將內插自適應碼本參數映射為量化自適應碼本參數,以及將內插固定碼本參數映射為量化固定碼本參數。
根據本發(fā)明的又一實施方式,提供了用于為自適應碼本映射構建簡化的基音增益碼本的方法。該方法包括分組增益點積項以及減小基音增益碼本的尺寸。
根據本發(fā)明的又一實施方式,用于固定代數碼本的快速脈沖位置搜索的方法包括選擇將搜索的下一音軌,確定(locate)一個或多個脈沖的位置,從目標中減去當前音軌中脈沖的成分并且處理用于搜索剩余脈沖的目標信號。
根據本發(fā)明的又一實施方式,用于在源編解碼器和目的地編解碼器之間映射CELP參數的裝置包括LSP映射模塊、耦合到LSP映射模塊的自適應碼本映射模塊,以及耦合到LSP映射模塊和自適應碼本映射模塊的固定碼本映射模塊。所述LSP映射模塊包括LP溢出模塊,該模塊被配置為處理與多個內插LSP參數相關聯(lián)的信息,并且至少基于與多個內插LSP參數相關聯(lián)的信息來產生溢出信號。另外,LSP映射模塊包括LSP參數修改模塊,該模塊被配置為響應于溢出信號,來修改多個內插LSP參數中的至少一個內插LSP參數的至少一個頻率。所述自適應碼本映射模塊包括第一基音增益碼本。該第一基音增益碼本包括第一多個條目,所述第一多個條目中的每一個條目都包括多個項以及與所述多個項相關聯(lián)的多個和。所述固定碼本映射模塊包括第一目標處理模塊,該模塊被配置為處理第一目標信號并且產生第一修改目標信號。另外,所述固定碼本映射模塊包括脈沖搜索模塊,該模塊被配置為至少基于與第一修改目標信號相關聯(lián)的信息,來確定子幀中多個脈沖的第一多個脈沖位置和符號。此外,所述固定碼本映射模塊包括固定碼本增益估計模塊,該模塊被配置為至少基于與第一多個脈沖位置和符號相關聯(lián)的信息來估計所述子幀的固定碼本增益。所述固定碼本映射模塊還包括脈沖位置搜索模塊,該模塊被配置為接收第一修改目標信號、沖激響應信號和已估計的固定碼本增益,并且輸出所述多個脈沖的第二多個脈沖位置和符號。
根據本發(fā)明的又一實施方式,用于在源編解碼器和目的地編解碼器之間映射LSP參數的裝置包括LP溢出模塊,該模塊被配置為處理與多個內插LSP參數相關聯(lián)的信息,并且至少基于與所述多個內插LSP參數相關聯(lián)的信息來產生溢出信號。另外,該裝置包括LSP參數修改模塊,該模塊被配置為響應于所述溢出信號,來修改所述多個內插LSP參數中的至少一個內插LSP參數的至少一個頻率。此外,該裝置包括LSP量化模塊,該模塊被配置為至少基于與目的地編解碼器所涉及的多個量化表相關聯(lián)的信息,來量化所述多個內插LSP參數。該裝置還包括LSP解碼器及穩(wěn)定性檢查模塊,該模塊被配置為對已量化的多個內插LSP參數進行解碼。
根據本發(fā)明的又一實施方式,用于在源編解碼器和目的地編解碼器之間映射自適應碼本的裝置包括被配置為產生目標信號的自適應碼本目標產生模塊以及基音增益碼本。該基音增益碼本包括多個條目。所述多個條目中的每個條目都包括多個項和與所述多個項相關聯(lián)的多個和。此外,該裝置包括候選延遲選擇模塊,該模塊被配置為接收開環(huán)基音延遲,并且產生候選基音延遲值。該裝置還包括候選矢量信號產生模塊,該模塊被配置為至少基于與所述自適應碼本和所述候選基音延遲值相關聯(lián)的信息,來產生多個候選信號。此外,該裝置包括自相關和互相關模塊,該模塊被配置為計算所述目標信號和所述多個候選信號的延遲版本之間或者所述多個候選信號的所述延遲版本之間的一組點積,并且輸出至少與這組點積相關聯(lián)的矢量信號。此外,該裝置包括增益碼矢選擇模塊,該模塊被配置為接收矢量信號,從而估計與第一基音增益碼本相關聯(lián)的條目和接收到的矢量信號之間的點積,至少處理與所述點積以及預定值相關聯(lián)的信息,并且輸出被選碼矢的索引和與被選碼矢相關聯(lián)的自適應碼本基音延遲。該裝置還包括緩沖區(qū)模塊,該模塊用于存儲所述被選碼矢的索引以及所述自適應碼本基音延遲。
根據本發(fā)明的又一實施方式,用于在源編解碼器和目的地編解碼器之間映射固定碼本的裝置包括固定碼本目標產生模塊,該模塊被配置為產生目標信號,以及目標處理模塊,該模塊被配置為處理目標信號和產生第一修改目標信號。另外,該裝置包括脈沖搜索模塊,該模塊被配置為至少基于與所述第一修改目標信號相關聯(lián)的信息,來確定子幀中多個脈沖的第一多個脈沖位置和符號。此外,該裝置包括固定碼本增益估計模塊,該模塊被配置為至少基于與所述第一多個脈沖位置和符號相關聯(lián)的信息來估計所述子幀的固定碼本增益。該裝置還包括脈沖位置搜索模塊,該模塊被配置為接收所述第一修改目標信號、沖激響應信號和已估計的固定碼本增益,并且輸出所述多個脈沖的第二多個脈沖位置和符號。另外,該裝置包括碼矢構建模塊,該模塊被配置為接收所述第二多個脈沖位置和符號,從而產生固定碼本矢量,并且確定用于所述子幀的固定碼本索引。
根據本發(fā)明的又一實施方式,用于在源編解碼器和目的地編解碼器之間映射CELP參數的方法包括接收多個內插LSP參數、多個內插自適應碼本參數和多個內插固定碼本參數。另外,該方法包括至少基于與多個內插LSP參數相關聯(lián)的信息來產生多個量化LSP參數,至少基于與多個內插自適應碼本參數相關聯(lián)的信息來產生多個量化自適應碼本參數,以及至少基于與多個內插固定碼本參數相關聯(lián)的信息來產生多個量化固定碼本參數。所述產生多個量化LSP參數的步驟包括至少基于與所述多個內插LSP參數相關聯(lián)的信息來產生溢出信號。所述產生多個量化自適應碼本參數的步驟包括估計與基音增益碼本相關聯(lián)的條目和矢量信號之間的點積。所述基音增益碼本包括多個條目。所述多個條目中的每個條目都包括多個項以及與所述多個項相關聯(lián)的多個和。所述產生多個量化固定碼本參數的步驟包括至少基于與第一目標信號相關聯(lián)的信息來產生第一修改目標信號、至少基于與第一修改目標信號相關聯(lián)的信息來確定子幀中多個脈沖的第一多個脈沖位置和符號、至少基于與第一多個脈沖位置和符號相關聯(lián)的信息來估計所述子幀的固定碼本增益,以及至少基于與第一修改目標信號、沖激響應信號和估計出的固定碼本增益來產生多個脈沖的第二多個脈沖位置和符號。
使用本發(fā)明可以獲得比其他技術更多的優(yōu)勢。本發(fā)明的某些實施方式提供了用于快速LSP映射、快速自適應碼本映射和快速固定碼本映射的裝置和方法。該裝置和方法可以調整被映射的線性預測參數,以防止目的地編解碼器的解碼器中的信號溢出。本發(fā)明的某些實施方式可以減少計算量以及計算復雜性的復雜度。例如,減少用于測試候選碼矢的計算,或者減少用于產生基音增益碼本中的條目的計算。在本發(fā)明的某些實施方式中,還減少了所需存儲器的量。例如,簡化的基音增益碼本的每個碼矢條目中包含更少的元素。在本發(fā)明的某些實施方式中,自相關和互相關計算單元以與簡化的基音增益碼本中的條目中的項相匹配的格式輸出長度被縮短的點積元素矢量。在某些實施方式中,由于基音增益碼本的簡化,計算出的相關點積數目的減小,計算出的殘差信號數目的減少以及計算出的延時加權合成信號數目的減少,因此本發(fā)明的自適應碼本搜索的復雜度要低于其他自適應碼本搜索的復雜度。
依賴于論述中的實施方式,可以實現(xiàn)這些優(yōu)勢中的一個或多個。參考以下的詳細描述和附圖可以全面了解本發(fā)明的這些優(yōu)勢和各種其他的目的、特征和優(yōu)點。


圖1是用在兩種基于CELP的語音編解碼器之間的轉碼器的簡圖;圖2是根據本發(fā)明一種實施方式的CELP參數映射模塊的簡圖;圖3是根據本發(fā)明一種實施方式的快速LSP映射模塊的簡圖;圖4是根據本發(fā)明一種實施方式的快速LSP映射的方法的簡圖;圖5是根據本發(fā)明一種實施方式的用于10階穩(wěn)態(tài)LP分析濾波器的LSP參數的簡圖;圖6是可能在目的地編解碼器中產生非穩(wěn)態(tài)LP濾波器或者導致信號溢出的LSP參數的簡圖;圖7是N抽頭基音預測濾波器的簡圖;圖8示出了用于確定CELP編解碼器中的自適應碼本參數的誤差最小化過程的簡圖;圖9是用于確定基于CELP的語音編解碼器中的基音參數的程序的簡圖;圖10是根據本發(fā)明一種實施方式的快速自適應碼本映射模塊的簡圖;圖10A是根據本發(fā)明一種實施方式的快速自適應碼本映射模塊的另一簡圖;圖11是根據本發(fā)明一種實施方式的用于利用快速自適應碼本搜索來確定基音參數的方法的簡圖;圖12是根據本發(fā)明一種實施方式將一個自適應碼本與另一自適應碼本進行比較的簡圖;圖13是用于執(zhí)行CELP編解碼器中的代數碼本搜索的裝置的簡化框圖;圖14是根據本發(fā)明一種實施方式的快速固定碼本映射模塊的簡圖;圖15是根據本發(fā)明一種實施方式的快速脈沖位置搜索模塊的簡圖;圖16是根據本發(fā)明一種實施方式的快速脈沖位置搜索的簡圖。
具體實施例方式
本發(fā)明總地涉及電信技術。更具體而言,本發(fā)明提供了用于碼激勵線性預測(CELP)模型參數的快速映射的方法和裝置。本發(fā)明僅以示例的方式被應用于從一種CELP編碼器/解碼器(編解碼器)到另一CELP編解碼器的語音轉碼,但是將會認識到,本發(fā)明具有更廣闊的應用范圍。
圖1是用在兩種基于CELP的語音編解碼器之間的轉碼器的簡圖。參見美國申請序列號No.10/339,790以及公布No.US2003/0177004,這里為所有目的并入其內容以作為參考。該轉碼器包括源編解碼器拆包模塊110、CELP參數內插模塊120、CELP參數映射模塊130和目的地編解碼器打包模塊140。CELP參數內插模塊120內插CELP參數,以匹配目的地編解碼器的幀長和子幀長,并且利用CELP參數映射模塊130對所產生的內插CELP參數進行映射以形成目的地編解碼器參數。目的地編解碼器打包模塊140將所述參數打包為具有所需格式的比特流。
圖2是根據本發(fā)明一種實施方式的CELP參數映射模塊的簡圖。該圖僅僅是一個實施例,該實施例不應不適當地限制本發(fā)明的范圍。本領域普通技術人員將會想到很多變化、替代和修改。CELP參數映射模塊200包括LSP映射模塊210、自適應碼本映射模塊220和固定碼本映射模塊230。雖然已經使用各種模塊示出了上述CELP參數映射模塊,但是可以存在很多替代、修改和變化。例如,這些模塊中的一些可以被擴展和/或組合??梢詫⑵渌K插入到上述這些模塊中??梢愿鶕鰧嵤┓绞絹硖鎿Q具體的模塊。在整個說明書中,可以找到這些模塊的更多詳細內容。
在一個實施例中,快速映射技術被應用于這些模塊中的每一個模塊,以便在不降低信號質量的情況下,減少用于映射的計算需求。這些技術包括用于自適應碼本映射和固定碼本映射的快速處理。另外,這些技術包括用于防止由于來自源到目的地(source-to-destination)編解碼器的LSP參數的快速映射而引起的信號溢出。這些技術可被一起使用,或者與其他參數映射技術結合使用。例如,CELP參數映射模塊200被用作CELP參數映射模塊130。
在從一種基于線性預測的語音編解碼器到另一基于線性預測的語音編解碼器的有效率的轉碼過程中,經常使用對來自源到目的地編解碼器的線譜對(LSP)參數的內插。這消除了重新計算線性預測(LP)參數的需要。由于不同的編解碼器可以使用不同的幀長、子幀長、超前延遲、預測階數、帶寬擴展或LP分析窗類型,因此來自一個編解碼器的LSP參數可能不適合于另一編解碼器。在某些情況下,來自一個編解碼器的已解碼LSP參數會由于不匹配的LP分析而導致質量衰退,甚至導致信號溢出,所述已解碼LSP參數被內插,并用于重建第二編解碼器中的語音。
通過沿著單位圓周進行搜索并且對過零點內插,將LP系數轉換為LSP系數。可以利用下列關系將LSP轉換為在范圍
中的以Hz為單位的線譜頻率(LSF)LSFj=fs2πarccos(LSPj)j=0,...,N]]>(等式1)其中fs是采樣頻率,并且N是預測階數。在頻率上彼此靠近的LSF會導致LP濾波器中的強烈共振,這種強烈共振會導致信號溢出。在很多基于CELP的語音編解碼器中,執(zhí)行檢查來測試LP濾波器的穩(wěn)定性。這樣可以確保LSF被適當地排列,并且在鄰近的LSF之間存在最小距離Δmin。典型的濾波器穩(wěn)定標準是LSFj+1-LSFj≥Δmin1≤j≤N-1(等式2)但是,在從一個編解碼器到另一個編解碼器的轉碼過程中,即使兩個編解碼器的穩(wěn)定標準都得到滿足,也可能發(fā)生信號溢出。當使用語音解碼器的定點實現(xiàn)時,這是很明顯的。
例如,在GSM-AMR到G.723.1的轉碼器中,LSF被線性內插,以補償GSM-AMR的20ms幀尺寸與G.723.1的30ms幀尺寸。然后利用G.723.1對內插后的LSF進行量化,并將其輸出到比特流。但是,當利用G.723.1標準定點實現(xiàn)的解碼器對LSF進行解碼時,即使?jié)M足GSM-AMR和G.723.1兩者的穩(wěn)定標準,不匹配的LP分析也會導致G.723.1解碼器中LSP到線性預測系數(LPC)轉換中的中間變量溢出。在轉碼期間需要采取預防措施,以避免解碼器中的信號溢出。
圖3是根據本發(fā)明一種實施方式的快速LSP映射模塊的簡圖。該圖僅僅是一個實施例,該實施例不應不適當地限制本發(fā)明的范圍。本領域普通技術人員將會想到很多變化、替代和修改。快速LSP映射模塊300包括LP溢出預測模塊310、LSP參數修改模塊320、LSP量化模塊330和LSP解碼器及穩(wěn)定性檢查模塊340。雖然已經使用各種模塊示出了上述快速LSP映射模塊,但是可以存在很多替代、修改和變化。例如,這些模塊中的一些可以被擴展和/或組合。可以將其他模塊插入到上述這些模塊中??梢愿鶕鰧嵤┓绞絹硖鎿Q具體的模塊。在整個說明書中,可以找到這些模塊的更多詳細內容。
快速LSP映射模塊300執(zhí)行從源到目的地編解碼器內插后的LSP參數到目的地編解碼器量化后的LSP參數的轉換。另外,模塊300可以檢測可能的解碼器溢出情況,并且通過LSF調整來避免由內插后的LSF所引起的這種信號溢出。
圖4是根據本發(fā)明一種實施方式的快速LSP映射的方法的簡圖。該圖僅僅是一個實施例,該實施例不應不適當地限制本發(fā)明的范圍。本領域普通技術人員將會想到很多變化、替代和修改。如圖4所示,快速LSP映射的方法400包括過程410、420、430、440、450、460、470和480。雖然已經使用所選的過程序列示出了上述快速LSP映射的方法,但是可以存在很多替代、修改和變化。例如,這些過程中的一些可以被擴展和/或組合??梢詫⑵渌^程插入到上述這些過程中。可以根據所述實施方式來交換具體的步驟順序。方法400可以由快速LSP映射模塊300來執(zhí)行。另外,方法400可以調整LSF的頻率以避免信號溢出,并且不會對語音質量產生重大影響。在整個說明書中,可以找到這些過程的更多詳細內容。
如圖3和4所示,內插后的LSP參數350被輸入到LP溢出預測模塊310中,該模塊310檢查解碼器中可能的LP溢出問題。如果預測出信號溢出,則在LSP參數修改模塊320中修改LSF。該修改可以利用各種方法來執(zhí)行。例如,在過程410和420處,LP溢出預測模塊310將內插后的LSP用作輸入,并且以如下方式計算前K個LSP的數量和E1,以及后K個LSP的數量和E2E1=Σi=1K|LSP(i)|]]>(等式3)E2=Σi=M-K-1M-1|LSP(i)|]]>(等式4)其中,K≤M2]]>并且M是預測階數。K是正整數。
在過程430和440處,分別將E1與Thr1進行比較,將E2與Thr2進行比較。如果E1>Thr1或E2>Thr2(其中Thr1和Thr2是預定閾值),則預測在解碼器中將發(fā)生信號溢出,并且隨后在過程450處,在LSP參數修改模塊320中修改LSP。如果E1>Thr1,則提高內插后的LSP中的至少一個LSP的至少一個頻率。如果E2>Thr2,則降低內插后的LSP中的至少一個LSP的至少一個頻率。
然后在過程460處,由LPS量化模塊330使用目的地編解碼器的量化表和方法對LSP參數進行量化。在過程470和480處,由LSP解碼器及穩(wěn)定性檢查模塊340對量化后的LSP參數進行解碼,并且執(zhí)行穩(wěn)定性檢查。穩(wěn)定性檢查通常可以確保相鄰LSP之間的正確排序和最小頻率間隔。在轉碼器內的進一步處理中,要使用被解碼的目的地編解碼器LSP參數。例如,快速LSP映射模塊300被用作快速LSP映射模塊210。
10階線性預測濾波器一般被用在使用8kHz采樣頻率的語音編解碼器中。圖5是根據本發(fā)明一種實施方式的用于10階穩(wěn)態(tài)LP分析濾波器的LSP參數的簡圖。該圖僅僅是一個實施例,該實施例不應不適當地限制本發(fā)明的范圍。本領域普通技術人員將會想到很多變化、替代和修改。每個方框的垂直分量是落在-1<LSPi<+1范圍內的LSP值,并且水平分量是落在0<LSPi<π范圍內的歸一化LSF值。
圖6是可以在目的地編解碼器中產生非穩(wěn)態(tài)LP濾波器或者導致信號溢出的LSP參數的簡圖。前五個LSP參數具有緊密間隔的LSF值,并且具有靠近1的LSP值。雖然這些LSP參數滿足相鄰LSF之間的最小距離為31.25Hz的標準,但是會在標準解碼器中導致信號溢出。相比之下,根據本發(fā)明的一種實施方式,LSP參數修改不僅避免了由來自具有不同LP分析參數的編解碼器的內插后LSP所引起的信號溢出,而且保持了語音質量。如圖5所示,對于10階預測濾波器,由于前三個LSP參數會影響感官上重要的第一共振峰頻率的位置,因此避免修改前三個LSP參數,否則會降低信號質量。因此,當前四個LSP的平均值超過0.91時,該修改分別利用f4Hz、f5Hz和f6Hz來提高第4、第5和第6個LSF的頻率??梢詫SF應用不同的閾值、頻移和修改以降低解碼器模塊中的信號溢出的可能性。
本發(fā)明的某些實施方式還提供了用于在語音轉碼中執(zhí)行快速自適應碼本映射技術的方法和裝置。在諸如ITU-T建議G.723.1的一些基于CELP的語音編解碼器中,使用多抽頭基音預測濾波器。由于多抽頭基音預測器的頻率響應可以在多個整數延遲(lag)之間進行內插,因此它可以獲得比單抽頭預測器更高的預測增益。
圖7是N抽頭基音預測濾波器的簡圖。多抽頭濾波器的傳輸函數如下T(z)=Σj=0N-1βjz-(L+j)]]>(等式5)其中,j是基音預測器的系數,N是濾波器抽頭數目,并且L是基音延遲。在CELP編碼中,產生目標信號s(n),該目標信號可以位于語音域、激勵域或者經濾波的激勵域中。在激勵域中消除短期線性預測成分。對于長度為lsf的子幀,在目標信號s(n)和基音預測成分之間的誤差信號如下e(n)=s(n)-Σj=0N-1βjs′(n-L-N2+j),n=0,1,...,lsf]]>(等式6)其中s′(n)可以是目標信號的延時版本,或者通過利用加權的沖激響應對自適應碼本信號或過去的激勵信號進行濾波來獲得。均方誤差可以被寫作
ϵ=eTe=Σn=0lsf[s(n)-β0s′(n-L-N2)-β1s′(n-L-N2+1)-...-βN-1s′(n-L+N2)]2]]>(等式7)進一步展開上述等式,我們可以得到ϵ=Rss(0,0)-[Σi=0N-1βiRSS′(0,i)-2Σi=0N-1βi2RS′S′(i,j)-2Σi=1N-1Σj=0i-1βiβjRS′S′(i,j)]]>(等式8)其中,Rss(x,y)、Rss′(x,y)、Rs′s′(x,y)是如下的自相關和互相關點積項Rss(0,0)=Σn=0lsf-1s(n)2]]>(等式9)Rss′(0,i)=Σn=0lsf-1s(n)s′(n-L-N2+i)]]>(等式10)Rs′s′(i,j)=Σn=0lsf-1s′(n-L-N2+i)s′(n-L-N2+j)]]>(等式11)圖8示出了用于確定CELP編解碼器中的自適應碼本參數的誤差最小化過程的簡圖。為了確定最優(yōu)的基音參數,要使均方誤差最小化。這包括找到使等式8的第二項產生最大值的最佳增益系數β={β0,β1,...,βN-1},以及相關聯(lián)的基音延遲L。雖然基音預測器的階數越高,獲得的性能越好,但是需要計算的Rs′s(i,j)項的數目呈指數增長。為了減輕計算負擔,通常預先計算增益乘積項βiβj,并且將其存儲在增益碼本中。對于5抽頭濾波器,需要15個附加的增益乘積項。因此每個碼本矢量包含20個元素,這20個元素是每個抽頭的增益系數以及預先計算的增益系數的乘積,這20個元素如下首先5個元素 β0β1β2β3β4其次5個元素 -β02-β12-β22-β32-β42最后10個元素-β0β1-β0β2-β1β2-β0β3-β1β3-β2β3-β0β4-β1β4-β2β4-β3β4圖9是用于確定基于CELP的語音編解碼器中的基音參數的程序的簡圖。對于特定延遲值,計算出的Rss矢量包含CL個自相關和互相關點積項。通過利用索引k的Rss矢量和增益矢量的點積計算來評價等式8的第二項。對于給定范圍內的所有碼本索引以及給定范圍內的所有延遲值,重復該計算,并且存儲產生點積結果最大值的索引kbest和延遲值lagbest。
如圖9所示,自適應碼本映射模塊900包括增益碼本910、增益碼矢選擇模塊920、獲取候選延遲模塊930、自適應碼本940、獲取候選矢量模塊950、自相關和互相關模塊960以及緩沖區(qū)模塊980。自相關和互相關模塊960輸出Rss矢量970。
在本發(fā)明的某些實施方式中,降低了用于在編碼基音參數期間使預測誤差最小化所需的復雜性。該方法可應用于如下的語音編碼器,該語音編碼器使用多抽頭基音濾波器以及增益系數和預先計算的增益乘積項的碼本。該方法包括將相似的Rs′s(i,j)項分組。在具體實施方式
中,將具有公共延遲差的自相關點積項分組在一起。例如,如果基音預測器具有5個抽頭,那么Rs′s(i,j)項可以被如下分組組1Rs′s(0,0),Rs′s(1,1),Rs′s(2,2),Rs′s(3,3),Rs′s(4,4)組2Rs′s(0,1),Rs′s(1,2),Rs′s(2,3),Rs′s(3,4)組3Rs′s(0,2),Rs′s(1,3),Rs′s(2,4)組4Rs′s(0,3),Rs′s(1,4)組5Rs′s(0,4),這種排列將具有相似延遲差的元素的自相關點積分組在一起。在其他具體實施方式
中,可以假設同一組內的Rs′s(i,j)項大致相等。因此,只需要計算5項,而不是計算15個Rs′s(i,j)項。因此,Rss矢量將只包含10項。
圖10是根據本發(fā)明一種實施方式的快速自適應碼本映射模塊的簡圖。該圖僅僅是一個實施例,該實施例不應不適當地限制本發(fā)明的范圍。本領域普通技術人員將會想到很多變化、替代和修改。快速自適應碼本映射模塊1000包括增益碼本1010、增益碼矢選擇模塊1020、獲取候選延遲模塊1030、自適應碼本1040、獲取候選矢量模塊1050、自相關和互相關模塊1060以及緩沖區(qū)模塊1080。雖然已經使用各種模塊示出了上述快速自適應碼本映射模塊,但是可以存在很多替代、修改和變化。例如,這些模塊中的一些可以被擴展和/或組合??梢詫⑵渌K插入到上述這些模塊中??梢愿鶕鰧嵤┓绞絹硖鎿Q具體的模塊。在整個說明書中,可以找到這些模塊的更多詳細內容。
如上所述,如圖10所示的簡化增益碼本1010的每個碼矢中的元素數目CL′小于如圖9所示的標準增益碼本910的每個碼矢中的元素數目CL。在一個實施例中,快速自適應碼本映射模塊1000被用作快速自適應碼本映射模塊220。
圖10A是根據本發(fā)明一種實施方式的快速自適應碼本映射模塊的另一簡圖。該圖僅僅是一個實施例,該實施例不應不適當地限制本發(fā)明的范圍。本領域普通技術人員將會想到很多變化、替代和修改??焖僮赃m應碼本映射模塊1090包括簡化增益碼本1091、增益碼矢選擇模塊1092、候選延遲選擇模塊1093、自適應碼本1094、候選矢量產生模塊1095、自相關和互相關模塊1096、緩沖區(qū)模塊1098以及自適應碼本目標產生模塊1099??焖僮赃m應碼本映射模塊1090可以與快速自適應碼本映射模塊1000相同或不同。雖然已經使用各種模塊示出了上述快速自適應碼本映射模塊,但是可以存在很多替代、修改和變化。例如,這些模塊中的一些可以被擴展和/或組合??梢詫⑵渌K插入到上述這些模塊中??梢愿鶕鰧嵤┓绞絹硖鎿Q具體的模塊。在整個說明書中,可以找到這些模塊的更多詳細內容。
自適應碼本1094存儲了多個激勵信號。候選延遲選擇模塊1093接收開環(huán)基音延遲,并且產生候選基音延遲值。至少基于與自適應碼本1094和候選基音延遲值相關聯(lián)的信息,候選矢量信號產生模塊1095輸出多個候選信號。例如,多個候選信號與殘差(residual)域目標信號相關聯(lián),并且沒有經過合成。自適應碼本目標產生模塊1099產生自適應碼本目標信號。例如,自適應碼本目標信號處于語音域、經加權的語音域、激勵域或者經濾波的激勵域中。自相關和互相關模塊1096執(zhí)行一組簡化的點積,并且產生Rss矢量1097。在一個實施例中,Rss矢量1097與Rss矢量1070相同。Rss矢量1097被傳遞到增益碼矢選擇模塊1092,該模塊1092搜索增益碼本1091的至少一個索引,以找到最佳增益碼矢的索引kbest。產生該Rss值的候選基音延遲值是lagbest。kbest和lagbest與增益碼本1091中的條目以及由候選延遲選擇模塊1093得到的候選延遲相關聯(lián),其能夠提供自相關和互相關點積項的矢量中的最大點積。
圖11是根據本發(fā)明一種實施方式的用于利用快速自適應碼本搜索來確定基音參數的方法的簡圖。該圖僅僅是一個實施例,該實施例不應不適當地限制本發(fā)明的范圍。本領域普通技術人員將會想到很多變化、替代和修改。用于確定基音參數的方法1100包括用于獲取開環(huán)基音(OLP)的過程1110、用于獲取OLP范圍內的候選延遲Lc的過程1120、用于以延遲Lc從自適應碼本中獲取候選矢量的過程1130、用于計算候選矢量的自相關點積的過程1140、用于計算目標和候選矢量之間的互相關點積的過程1150、用于構建Rss矢量的過程1160、用于從簡化的增益碼本中選出最佳增益碼矢的過程1170、用于將最佳碼本索引kbest和最好延遲lagbest存儲在緩沖區(qū)中的過程1172、用于判斷是否搜索了有限的基音范圍的過程1180以及用于輸出最佳碼本索引和最佳延遲值比特流的過程1190。雖然已經使用所選的過程序列示出了上述方法,但是可以存在很多替代、修改和變化。例如,這些過程中的一些可以被擴展和/或組合。可以將其他過程插入到上述這些過程中??梢愿鶕嵤┓绞絹斫粨Q具體的步驟順序。在整個說明書中,可以找到這些過程的更多詳細內容。
對于基音增益碼本的存儲需求以及用于測試每個候選碼本矢量所需的乘法次數被減少了 并且點積項的數目和需要計算的合成殘差信號的數目被減少了 在一個實施例中,由快速自適應碼本映射模塊1000來實現(xiàn)用于確定基音參數的方法1100。
圖12是根據本發(fā)明一種實施方式將一個自適應碼本與另一自適應碼本進行比較的簡圖。該圖僅僅是一個實施例,該實施例不應不適當地限制本發(fā)明的范圍。本領域普通技術人員將會想到很多變化、替代和修改。如圖12所示,基音增益碼本1210可被用于GSM自適應多速率(AMR)編解碼器和G.723.1雙速率語音編解碼器之間的轉碼器。G.723.1使用5抽頭基音預測濾波器。對于子幀0和2,閉環(huán)基音延遲是以±1個抽樣的距離而從適當的開環(huán)基音延遲中選出的。對于子幀1和3,其基音延遲可以只與在前子幀的延遲相差-1、0、+1或+2個抽樣。基音預測器增益是依賴于比特率和延遲值而使用85條目的碼本或170條目的碼本進行量化的矢量。每個碼本條目都是具有預先計算的增益系數項的20元素矢量,并且被排列如下首先5個元素 β0β1β2β3β4其次5個元素 -β02-β12-β22-β32-β42最后10個元素-β0β1-β0β2-β1β2-β0β3-β1β3-β2β3-β0β4-β1β4-β2β4-β3β4根據本發(fā)明的一種實施方式,如圖2中的85條目的基音增益碼本1220所示,基音增益碼本1210被重建為使得每個條目只具有10個元素。對于170條目的基音增益碼本,也可以執(zhí)行這種重建。例如,在基音增益碼本1210中的多個條目與目的地編解碼器中的另一基音增益碼本中的另外多個條目相關。
對于基音增益碼本1210中的每個條目,其后5個元素通過對基音增益碼本1210中的適當項求和來計算。所產生的簡化基音增益碼本1220具有如下格式前5個元素β0β1β2β3β4后5個元素β0β4這種近似和簡化使得用于基音增益碼本的存儲器存儲需求減半,使得用于測試每個候選碼本所需的乘法和加法次數減半,并且將Rs′s(i,j)點積項的數目和需要計算的合成殘差信號的數目減少了3倍。
在快速自適應碼本搜索期間,使以下等式最大化maxΣj=0P-1Ci·RSS′(0,i)-C5·RS′S′(2,2)-2C6·RS′S′(0,1)-2C7·RS′S′(0,2)-2C8·RS′S′(0,3)-2C9RS′S′(0,4)]]>(等式12)其中Ci是簡化增益碼本中的一個條目的第i個元素。選出Rs′s(i,j)項來代表其各自的組,并且Rs′s(i,j)項可以用同一組中的另一自相關點積項來代替。
本發(fā)明的某些實施方式還提供了用于語音轉碼器中的快速固定碼本映射技術的方法和裝置。一些CELP語音編碼算法使用代數結構的固定碼本來降低所需存儲器的存儲量。代數碼矢是稀疏的,并且在某些位置上具有其振幅為±1的脈沖。在不同編碼算法之間,用于碼矢的脈沖數目和候選脈沖位置有所不同。
例如,在用于GSM-AMR 12.2kbps和10.2kbps模式的表1和2中分別示出了子幀中的每個脈沖的可能脈沖位置。

表1

表2在這些情況下,音軌(track)是相互交織的,并且不共享公共的脈沖位置。如表1所示,對于12.2kbps模式,在具有40個抽樣的子幀內存在5條音軌,并且在每條音軌中具有8個可能的脈沖位置。碼矢具有10個脈沖,在每條音軌中存在2個脈沖。如圖2所示,對于10.2kbps模式,在具有40個抽樣的子幀內存在4條音軌,并且每條音軌允許具有2個脈沖。
圖13是用于執(zhí)行CELP編解碼器中的代數碼本搜索的裝置的簡化框圖。例如,該裝置用于尋找固定碼本中的碼矢ck,該碼矢ck可以最佳地匹配目標信號。目標信號x2(n)是通過從加權的輸入語音信號中減去自適應碼本成分而產生的。通過使以下項最大化來搜索代數碼本Tk=ExyEyy=(dtck)2ckΦck]]>(等式13)其中d=Htx2是目標信號和加權合成濾波器的沖激響應h(n)之間的相關,H=hTh是下三角Toeplitz矩陣,該矩陣具有對角線h(0)和下對角線h(1),...,h(39),ck是具有索引k的碼矢,并且Φ=HTH是h(n)的自相關矩陣。通常利用Tk的計算次數或者被測試的候選碼本的數目來測量計算負擔。全部ACELP搜索具有很高的計算需求,并且搜索的復雜度可以通過測試更少量候選碼本來降低。每個碼矢中的不同代數結構和脈沖數目會依賴于不同的標準,以及每個標準中用于降低復雜度的搜索方法而有所不同。例如,G.729使用集中搜索,并且在8192個候選碼本中測試1440個候選碼本。GSM-AMR在將第一脈沖固定在局部最大之后,使用深度優(yōu)先樹搜索,并且用于最高模式測試的候選碼本數目是1024。即使利用這些快速方法,計算復雜度也仍舊很大,并且高達轉碼器的總計算復雜度的40%。
圖14是根據本發(fā)明一種實施方式的快速固定碼本映射模塊的簡圖。該圖僅僅是一個實施例,該實施例不應不適當地限制本發(fā)明的范圍。本領域普通技術人員將會想到很多變化、替代和修改??焖俟潭ùa本映射模塊1400包括目標處理模塊1410、快速脈沖搜索模塊1420、固定碼本(FCB)增益估計模塊1430、快速脈沖位置搜索模塊1440和碼矢構建模塊1450。雖然已經使用各種模塊示出了上述快速固定碼本映射模塊,但是可以存在很多替代、修改和變化。例如,這些模塊中的一些可以被擴展和/或組合??梢詫⑵渌K插入到上述這些模塊中??梢愿鶕鰧嵤┓绞絹硖鎿Q具體的模塊。在整個說明書中,可以找到這些模塊的更多詳細內容。
在一個實施例中,模塊1400對目標信號的每個子幀執(zhí)行快速固定碼本映射。在另一實施例中,快速固定碼本映射模塊1400被用作快速固定碼本映射模塊230。例如,快速固定碼本映射模塊1400與固定碼本相關聯(lián),固定碼本是代數固定碼本或多脈沖固定碼本。在另一實施例中,快速固定碼本映射模塊1400與包括稀疏固定碼本的目的地編解碼器相關聯(lián)。
固定碼本目標信號1460,即x2(n)可以由固定碼本目標產生模塊產生。例如,目標信號1460位于語音域、經加權的語音域、激勵域或經濾波的激勵域中。信號1460與LP濾波器的沖激響應信號1462,即h(n)相關,從而以如下方式在目標處理模塊1410中形成經修改的目標信號1464,即A(n)A(n)=∑x2(j)·h(j+n),n=0,....,lsf(等式14)然后,快速脈沖搜索模塊1420采用經修改的目標信號1464,即A(n),并且將碼矢中所需的所有Np個脈沖的位置都設置在相關碼本音軌的Pt個最高位置上,其中Pt是在音軌t中允許的非零脈沖的數目。脈沖的符號被設置為在脈沖位置上的A(n)的符號。然后,F(xiàn)CB增益估計模塊1430使用這些脈沖位置的初始值1466和符號來形成固定碼本增益的估計gest。然后,固定碼本增益估計1468、經修改的目標信號1464和沖激響應信號1470被用在快速脈沖位置搜索模塊1440中,該模塊1440用于確定最終的脈沖位置和符號1472。沖激脈沖信號1470可以與沖激脈沖信號1462相同或不同。最后,由碼矢構建模塊1450來構建用于固定碼字矢量和固定碼本索引的信號1474。信號1474被輸出為比特流。
圖15是根據本發(fā)明一種實施方式的快速脈沖位置搜索模塊的簡圖。該圖僅僅是一個實施例,該實施例不應不適當地限制本發(fā)明的范圍。本領域普通技術人員將會想到很多變化、替代和修改。速脈沖位置搜索模塊1500包括音軌選擇模塊1510、單個音軌脈沖搜索模塊1520、目標更新模塊1530、目標處理模塊1540以及緩沖區(qū)模塊1580。例如,快速脈沖位置搜索模塊1500被用作快速脈沖位置搜索模塊1440。雖然已經使用各種模塊示出了上述快速脈沖位置搜索模塊,但是可以存在很多替代、修改和變化。例如,這些模塊中的一些可以被擴展和/或組合??梢詫⑵渌K插入到上述這些模塊中??梢愿鶕鰧嵤┓绞絹硖鎿Q具體的模塊。在整個說明書中,可以找到這些模塊的更多詳細內容。
音軌選擇模塊1510是可選的,并且可以被調諧,從而以特定順序來搜索脈沖或音軌。例如,可能希望根據最高振幅抽樣或最高能量優(yōu)先來設置音軌中的脈沖。單個音軌脈沖搜索模塊1520將經修改的目標信號1550(即A(n)和音軌號t用作輸入,所述音軌號t用于確定子幀中的候選脈沖位置,并且定位Pt個最大抽樣的位置。目標更新模塊1530通過將當前音軌中的Pt個脈沖與沖激響應信號1560,即h(n)做卷積,并且使用gest調整增益,來確定當前音軌中的Pt個脈沖的語音域成分。由于在ACELP中,脈沖是具有振幅+1或-1的簡單沖激脈沖,因此其語音域成分只不過是位于被選位置處并經過增益調整的Pt個沖激脈沖的和。從固定碼本目標信號1460,即x2(n)中減去該成分。目標處理模塊1540通過使該結果與沖激響應信號1560進行相關運算來產生另一經修改的目標信號1570。經修改的目標信號1570可以被用作音軌選擇模塊1510和單個音軌脈沖搜索模塊1520的輸入,以作為經修改的目標信號1550做進一步的處理。緩沖區(qū)模塊存儲了已經搜索的音軌的位置和符號,并且一旦已經搜索了所有的音軌,就輸出子幀中所有脈沖的位置和符號。
依賴于語音編碼標準,可以包括前向和/或后向脈沖增強的影響。
x2(n)←x2(n)-gest·sign(k)Σk=0Pth(n-p(k)),n=0,...,lsf]]>(等式15)A(n)←∑x2(j)·h(j+n),n=0,....,lsf(等式16)由于本發(fā)明實施方式的搜索算法在單個音軌中一次搜索Pt個脈沖,因此如果編解碼器的標準允許,則可以對相同位置上的多個脈沖應用已修改的約束。該算法還可以被修改為在每次疊代中只選擇一個脈沖位置,而不是選擇音軌中的所有脈沖。
圖16是根據本發(fā)明一種實施方式的快速脈沖位置搜索的簡圖。該圖僅僅是一個實施例,該實施例不應不適當地限制本發(fā)明的范圍。本領域普通技術人員將會想到很多變化、替代和修改。用于快速脈沖位置搜索的方法1600包括用于產生經修改的目標信號的過程1610、用于通過搜索經修改的目標信號中的峰值來執(zhí)行快速搜索的過程1620、用于估計固定碼本增益的過程1630、用于選擇下一音軌以尋找脈沖的過程1640、用于尋找音軌中的一個或多個脈沖的位置的過程1650、用于尋找音軌中的一個或多個脈沖的符號的過程1660、用于將脈沖位置和符號存儲在緩沖區(qū)中的過程1670、用于通過減去當前音軌中脈沖的成分來更新目標信號的過程1680、用于為剩余音軌創(chuàng)建經修改的目標信號的過程1690、用于判斷是否已經處理了所有脈沖或音軌的過程1692以及用于建立碼矢的過程1694。在一個實施例中,用于快速脈沖位置搜索的方法1600是由快速固定碼本映射模塊1400來實現(xiàn)。雖然已經使用所選過程序列示出了上述方法,但是可以存在很多替代、修改和變化。例如,這些過程中的一些可以被擴展和/或組合??梢詫⑵渌^程插入到上述這些過程中。可以根據所述實施方式來交換具體的步驟順序。在整個說明書中,可以找到這些過程的更多詳細內容。
作為實施例,快速脈沖位置搜索的方法1600被應用于G.723.1到GSM-AMR轉碼器中的GSM-AMR的12.2kbps模式中。使用根據本發(fā)明一種實施方式的搜索程序,對于每個子幀只需要五次相關和四次卷積,來確定10脈沖碼矢的脈沖位置和符號。這五次相關對應于每條音軌中的一次相關,并且四次卷積對應于除了最后一條音軌之外的每條音軌中的一次卷積。卷積被簡化為卷積中的一個信號,該信號只具有兩個非零抽樣。該信號是只包含當前音軌中的脈沖的矢量ctemp(n)。但是,相關發(fā)生在具有子幀長度lsf=40的兩個非稀疏矢量之間。這通常需要相當多的乘法/加法運算。利用之前計算的值以及改變運算順序的能力,可以簡化該算法實現(xiàn)方式。可以使用下述捷徑來替代等式14到16中所執(zhí)行的計算。在A(n)和更新后的A(n)之間的差是b(n)是經濾波和增益調整后的ctemp(n)與h(n)之間的相關。
首先,b(n)=gest·∑ctemp,filt(j)·h(j+n),n=0,....,lsf(等式17)其中ctemp,filt(n)=∑ctemp(j)·h(n-j),n=0,....,lst(等式18)因此可以如下從A(n)中減去b(n)來減少計算A(n)←A(n)-b(n),n=0,....,lsf(等式19)為了進一步減小計算的復雜度,等式17可以被重新排列為b(n)=gest·∑ctemp(j)·autocorrh(n-j),n=0,....,lst(等式20)其中autocorrh(n)=∑h(j)·h(j+n),n=0,....,lsf(等式21)h(n)的自相關autocorrh(n)可以在每個子幀開始時預先計算。這樣,僅需要在預先計算的矢量和只具有2個非零脈沖的ctemp(n)之間進行卷積就可以有效地計算出b(n)。這將計算減少到每個子幀只需一次自相關、一次互相關和四次利用稀疏矢量ctemp(n)的“卷積”。
具體實施方式
中,如果滿足某個標準,就可以將音軌中的兩個脈沖放置在相同的位置上。該標準可以采用多種形式,例如,音軌中的最高脈沖的振幅是否大于子幀中所有音軌中的最大目標振幅的0.9倍,并且大于其他脈沖振幅的10倍。
根據本發(fā)明某些實施方式的快速固定碼本搜索方法可被應用于具有代數碼本的CELP編解碼器,或者那些適合于具有代數型結構的稀疏多脈沖編解碼器。與其他搜索方法相比,該方法無需將被測試的脈沖位置的多種組合,就可以降低復雜性。
根據本發(fā)明某些實施方式的CELP參數映射可被至少應用于基于CELP的語音編解碼器,以及現(xiàn)有編解碼器G.723.1、GSM-AMR、EVRC、G.728、G.729、G.729A、QCELP、MPEG-4、SMV、SMR-WB和VMR之間的語音轉碼器。在本發(fā)明的某些實施方式中,快速固定碼本映射模塊可以適合于使代數或多脈沖固定碼本符合任意的音軌方向、脈沖數目和子幀尺寸。在本發(fā)明的某些實施方式中,快速自適應碼本映射模塊可應用于目的地編解碼器使用多抽頭基音濾波器的任意轉碼器構架。在本發(fā)明的某些實施方式中,LSP參數映射模塊、快速固定碼本映射模塊和快速自適應碼本映射模塊彼此獨立地進行操作。
使用本發(fā)明可以獲得比其他技術更多的優(yōu)勢。本發(fā)明的某些實施方式提供了用于快速LSP映射、快速自適應碼本映射和快速固定碼本映射的裝置和方法。該裝置和方法可以調整被映射的線性預測參數,以防止目的地編解碼器的解碼器中的信號溢出。本發(fā)明的某些實施方式可以減少計算量以及計算復雜性的復雜度。例如,減少用于測試候選碼矢的計算,或者減少用于產生基音增益碼本中的條目的計算。在本發(fā)明的某些實施方式中,還減少了所需存儲器的量。例如,簡化的基音增益碼本的每個碼矢條目中包含更少的元素。在本發(fā)明的某些實施方式中,自相關和互相關計算單元以與簡化的基音增益碼本的條目中的項相匹配的格式輸出長度被縮短的點積元素矢量。在某些實施方式中,由于基音增益碼本的簡化,計算出的相關點積數目的減小,計算出的殘差信號數目的減少以及計算出的延時加權合成信號數目的減少,因此本發(fā)明的自適應碼本搜索的復雜度要低于其他自適應碼本搜索的復雜度。
雖然已經描述了本發(fā)明的具體實施方式
,但是本領域的技術人員將會理解,還存在與所述實施方式等同的其他實施方式。因此,將會理解,本發(fā)明并不受限于具體的所示實施方式,而是受限于所附權利要求書的范圍。
本申請要求保護2002年10月25日遞交的美國臨時申請No.60/421446、No.60/421449和No.60/421270的優(yōu)先權,這里并入了其內容以作為參考。
權利要求
1.一種用于在源編解碼器和目的地編解碼器之間映射CELP參數的裝置,該裝置包括LSP映射模塊;耦合到所述LSP映射模塊的自適應碼本映射模塊;耦合到所述LSP映射模塊和所述自適應碼本映射模塊的固定碼本映射模塊;其中所述LSP映射模塊包括LP溢出模塊,該模塊被配置為處理與多個內插LSP參數相關聯(lián)的信息,并且至少基于與所述多個內插LSP參數相關聯(lián)的信息來產生溢出信號;LSP參數修改模塊,該模塊被配置為響應于所述溢出信號,來修改所述多個內插LSP參數中的至少一個內插LSP參數的至少一個頻率;其中所述自適應碼本映射模塊包括第一基音增益碼本,該第一基音增益碼本包括第一多個條目,所述第一多個條目中的每一個條目都包括多個項以及與所述多個項相關聯(lián)的多個和;其中所述固定碼本映射模塊包括第一目標處理模塊,該模塊被配置為處理第一目標信號并且產生第一修改目標信號;脈沖搜索模塊,該模塊被配置為至少基于與所述第一修改目標信號相關聯(lián)的信息,來確定子幀中多個脈沖的第一多個脈沖位置和符號;固定碼本增益估計模塊,該模塊被配置為至少基于與所述第一多個脈沖位置和符號相關聯(lián)的信息來估計所述子幀的固定碼本增益;脈沖位置搜索模塊,該模塊被配置為接收所述第一修改目標信號、沖激響應信號和已估計的固定碼本增益,并且輸出所述多個脈沖的第二多個脈沖位置和符號。
2.如權利要求1所述的裝置,其中所述LSP參數修改模塊還被配置為響應于所述溢出信號,來增大或減小所述多個內插LSP參數中的至少一個內插LSP參數的至少一個頻率。
3.如權利要求2所述的裝置,其中所述LSP參數修改模塊基本上不發(fā)生信號質量的降低。
4.如權利要求2所述的裝置,其中所述目的地編解碼器的解碼器不會發(fā)生信號溢出。
5.如權利要求1所述的裝置,其中所述多個項與基音濾波器的第一抽頭的第一增益系數所涉及的至少一個元素相關聯(lián),并且所述多個和與多個乘積相關聯(lián),所述多個乘積至少與所述基音濾波器的第二抽頭的第二增益系數和所述基音濾波器的第三抽頭的第三增益系數相關聯(lián)。
6.如權利要求5所述的裝置,其中所述基音濾波器的第二抽頭與所述基音濾波器的第三抽頭相同。
7.如權利要求1所述的裝置,其中所述自適應碼本映射模塊與包括多抽頭基音濾波器在內的目的地編解碼器相關聯(lián)。
8.如權利要求1所述的裝置,其中所述脈沖位置搜索模塊包括單個音軌脈沖搜索模塊,該模塊被配置為確定第一音軌中的至少一個脈沖的至少一個位置和一個符號;目標更新模塊,該模塊被配置為從所述第一目標信號中除去所述至少一個脈沖的成分,并且輸出第一更新目標信號;第二目標處理模塊,該模塊被配置為接收所述第一更新目標信號,并且輸出第二修改目標信號;緩沖區(qū)模塊,該模塊被配置為存儲所述第一音軌中的所述至少一個脈沖的所述至少一個位置和一個符號,并且輸出所述多個脈沖的第二多個脈沖位置和符號。
9.如權利要求8所述的裝置,其中所述脈沖位置搜索模塊還包括被配置來選擇所述第一音軌的音軌選擇模塊。
10.如權利要求1所述的裝置,其中所述固定碼本映射模塊與固定碼本相關聯(lián),所述固定碼本是代數固定碼本或多脈沖固定碼本。
11.如權利要求1所述的裝置,其中所述固定碼本映射模塊與包括稀疏固定碼本在內的目的地編解碼器相關聯(lián)。
12.如權利要求1所述的裝置,其中所述LSP映射模塊、所述自適應碼本映射模塊和所述固定碼本映射模塊與涉及G.723.1的目的地編解碼器相關聯(lián)。
13.如權利要求1所述的裝置,其中所述LSP映射模塊、所述自適應碼本映射模塊和所述固定碼本映射模塊與涉及GSM-AMR的目的地編解碼器相關聯(lián)。
14.如權利要求1所述的裝置,其中所述LSP映射模塊還包括LSP量化模塊,該模塊被配置為至少基于與目的地編解碼器所涉及的多個量化表相關聯(lián)的信息,來量化所述多個內插LSP參數;LSP解碼器及穩(wěn)定性檢查模塊,該模塊被配置為對已量化的多個內插LSP參數進行解碼。
15.如權利要求14所述的裝置,其中所述LSP解碼器及穩(wěn)定性檢查模塊還被配置為處理與所述已解碼的多個內插LSP參數中的第一參數和第二參數之間的順序和間隔相關聯(lián)的信息,所數第一參數和第二參數彼此相鄰。
16.如權利要求1所述的裝置,其中所述自適應碼本映射模塊還包括自適應碼本目標產生模塊,該模塊被配置為產生第二目標信號;自適應碼本,該自適應碼本被配置為存儲多個激勵信號;候選延遲選擇模塊,該模塊被配置為接收開環(huán)基音延遲,并且產生候選基音延遲值;候選矢量信號產生模塊,該模塊被配置為至少基于與所述自適應碼本和所述候選基音延遲值相關聯(lián)的信息,來產生多個候選信號;自相關和互相關模塊,該模塊被配置為計算所述第二目標信號和所述多個候選信號的延遲版本之間或者所述多個候選信號的所述延遲版本之間的一組點積,并且輸出至少與所述這組點積相關聯(lián)的矢量信號;增益碼矢選擇模塊,該模塊被配置為接收所述矢量信號,從而估計與所述第一基音增益碼本相關聯(lián)的條目和所述接收到的矢量信號的點積,至少處理與所述點積以及預定值相關聯(lián)的信息,并且輸出被選碼矢的索引和與所述被選碼矢相關聯(lián)的自適應碼本基音延遲;緩沖區(qū)模塊,該模塊存儲所述被選碼矢的索引以及所述自適應碼本基音延遲。
17.如權利要求16所述的裝置,其中所述預定值是預定的最大值。
18.如權利要求16所述的裝置,其中所述第一多個條目與目的地編解碼器的第二基音增益碼本的第二多個條目進行相關。
19.如權利要求16所述的裝置,其中所述矢量信號與所述多個項和所述多個和相關聯(lián)。
20.如權利要求1所述的裝置,其中所述固定碼本映射模塊包括固定碼本目標產生模塊,該模塊被配置為產生所述第一目標信號;碼矢構建模塊,該模塊被配置為接收所述第二多個脈沖位置和符號,從而至少基于與所述第二多個脈沖位置和符號相關聯(lián)的信息來產生固定碼本矢量,并且至少基于與所述第二多個脈沖位置和符號相關聯(lián)的信息來確定所述子幀的固定碼本索引。
21.如權利要求1所述的裝置,其中所述LSP映射模塊、所述自適應碼本映射模塊和所述固定碼本映射模塊被配置為彼此獨立操作。
22.一種用于在源編解碼器和目的地編解碼器之間映射LSP參數的裝置,該裝置包括LP溢出模塊,該模塊被配置為處理與多個內插LSP參數相關聯(lián)的信息,并且至少基于與所述多個內插LSP參數相關聯(lián)的信息來產生溢出信號;LSP參數修改模塊,該模塊被配置為響應于所述溢出信號,來修改所述多個內插LSP參數中的至少一個內插LSP參數的至少一個頻率;LSP量化模塊,該模塊被配置為至少基于與目的地編解碼器所涉及的多個量化表相關聯(lián)的信息,來量化所述多個內插LSP參數;LSP解碼器及穩(wěn)定性檢查模塊,該模塊被配置為對已量化的多個內插LSP參數進行解碼。
23.一種用于在源編解碼器和目的地編解碼器之間映射自適應碼本的裝置,該裝置包括自適應碼本目標產生模塊,該模塊被配置為產生目標信號;基音增益碼本,該基音增益碼本包括多個條目,所述多個條目中的每個條目都包括多個項和與所述多個項相關聯(lián)的多個和;候選延遲選擇模塊,該模塊被配置為接收開環(huán)基音延遲,并且產生候選基音延遲值;候選矢量信號產生模塊,該模塊被配置為至少基于與所述自適應碼本和所述候選基音延遲值相關聯(lián)的信息,來產生多個候選信號;自相關和互相關模塊,該模塊被配置為計算所述目標信號和所述多個候選信號的延遲版本之間或者所述多個候選信號的所述延遲版本之間的一組點積,并且輸出至少與所述這組點積相關聯(lián)的矢量信號;增益碼矢選擇模塊,該模塊被配置為接收所述矢量信號,從而計算與所述基音增益碼本相關聯(lián)的條目和所述接收到的矢量信號的點積,至少處理與所述點積以及預定值相關聯(lián)的信息,并且輸出被選碼矢的索引和與被選碼矢相關聯(lián)的自適應碼本基音延遲;緩沖區(qū)模塊,該模塊存儲所述被選碼矢的索引以及所述自適應碼本基音延遲。
24.一種用于在源編解碼器和目的地編解碼器之間映射固定碼本的裝置,該裝置包括固定碼本目標產生模塊,該模塊被配置為產生目標信號;目標處理模塊,該模塊被配置為處理所述目標信號并且產生第一修改目標信號;脈沖搜索模塊,該模塊被配置為至少基于與所述第一修改目標信號相關聯(lián)的信息,來確定子幀中多個脈沖的第一多個脈沖位置和符號;固定碼本增益估計模塊,該模塊被配置為至少基于與所述第一多個脈沖位置和符號相關聯(lián)的信息來估計所述子幀的固定碼本增益;脈沖位置搜索模塊,該模塊被配置為接收所述第一修改目標信號、沖激響應信號和已估計的固定碼本增益,并且輸出所述多個脈沖的第二多個脈沖位置和符號;碼矢構建模塊,該模塊被配置為接收所述第二多個脈沖位置和符號,從而產生固定碼本矢量,并且確定所述子幀的固定碼本索引。
25.如權利要求23所述的裝置,其中所述脈沖位置搜索模塊包括單個音軌脈沖搜索模塊,該模塊被配置為確定第一音軌中的至少一個脈沖的至少一個位置和一個符號;目標更新模塊,該模塊被配置為從所述第一目標信號中除去所述至少一個脈沖的成分,并且輸出第一更新目標信號;第二目標處理模塊,該模塊被配置為接收所述第一更新目標信號,并且輸出第二修改目標信號;緩沖區(qū)模塊,該模塊被配置為存儲所述第一音軌中的所述至少一個脈沖的所述至少一個位置和一個符號,并且輸出所述多個脈沖的所述第二多個脈沖位置和符號。
26.一種用于在源編解碼器和目的地編解碼器之間映射CELP參數的方法,該方法包括接收多個內插LSP參數、多個內插自適應碼本參數和多個內插固定碼本參數;至少基于與所述多個內插LSP參數相關聯(lián)的信息來產生多個量化LSP參數;至少基于與所述多個內插自適應碼本參數相關聯(lián)的信息來產生多個量化自適應碼本參數;至少基于與所述多個內插固定碼本參數相關聯(lián)的信息來產生多個量化固定碼本參數;其中所述產生多個量化LSP參數的步驟包括至少基于與所述多個內插LSP參數相關聯(lián)的信息來產生溢出信號;其中所述產生多個量化自適應碼本參數的步驟包括估計與基音增益碼本相關聯(lián)的條目和矢量信號之間的點積,所述基音增益碼本包括多個條目,所述多個條目中的每個條目都包括多個項以及與所述多個項相關聯(lián)的多個和;其中所述產生多個量化固定碼本參數的步驟包括至少基于與第一目標信號相關聯(lián)的信息來產生第一修改目標信號;至少基于與所述第一修改目標信號相關聯(lián)的信息來確定子幀中的多個脈沖的第一多個脈沖位置和符號;至少基于與所述第一多個脈沖位置和符號相關聯(lián)的信息來估計所述子幀的固定碼本增益;至少基于與所述第一修改目標信號、沖激響應信號和所述估計出的固定碼本增益來產生所述多個脈沖的第二多個脈沖位置和符號。
27.如權利要求26所述的方法,其中所述產生多個量化LSP參數的步驟還包括響應于所述溢出信號來修改所述多個內插LSP參數中的至少一個內插LSP參數的至少一個頻率。
28.如權利要求27所述的方法,其中所述修改多個內插LSP參數中的至少一個內插LSP參數的至少一個頻率的步驟包括如果與所述多個內插LSP參數中最前K個LSP參數相關聯(lián)的第一和大于第一預定值,則增大所述至少一個頻率;如果與所述多個內插LSP參數中最后K個LSP參數相關聯(lián)的第二和大于第二預定值,則減小所述至少一個頻率;其中K為正整數。
29.如權利要求27所述的方法,其中所述修改多個內插LSP參數中的至少一個內插LSP參數的至少一個頻率的步驟基本上不發(fā)生信號質量的降低。
30.如權利要求27所述的方法,其中所述目的地編解碼器的解碼器不會發(fā)生信號溢出。
31.如權利要求26所述的方法,其中所述產生多個量化LSP參數的步驟還包括至少基于與目的地編解碼器所涉及的多個量化表相關聯(lián)的信息來量化所述多個內插LSP參數;對所述已量化的多個內插LSP參數進行解碼;處理與所述已解碼的多個內插LSP參數中的第一參數和第二參數之間的順序和間隔相關聯(lián)的信息,所述第一參數和第二參數彼此相鄰。
32.如權利要求31所述的方法,其中所述產生多個量化LSP參數的步驟還包括修改所述已解碼的多個內插LSP參數。
33.如權利要求26所述的方法,其中所述產生多個量化自適應碼本參數的步驟包括產生第二目標信號;產生多個候選基音延遲值;至少基于與所述自適應碼本和所述多個候選基音延遲值相關聯(lián)的信息來產生多個候選信號;確定所述第二目標信號和所述多個候選信號的延遲版本之間或者所述多個候選信號的所述延遲版本之間的一組點積;產生至少與所述這組點積相關聯(lián)的矢量信號;確定與所述第一音調增益碼本相關聯(lián)的條目和所述接收到的矢量信號之間的點積;至少處理與所述點積和預定值相關聯(lián)的信息;輸出被選碼矢的索引以及與所述被選碼矢相關聯(lián)的自適應碼本基音延遲;存儲所述被選碼矢的索引以及所述自適應碼本基音延遲。
34.如權利要求33所述的方法,其中所述第二目標信號位于語音域、經加權的語音域、激勵域或者經濾波的激勵域中。
35.如權利要求33所述的方法,其中所述多個候選信號與殘差域目標信號相關聯(lián),并且沒有經過合成。
36.如權利要求26所述的方法,其中所述產生多個量化固定碼本參數的步驟包括至少基于與自適應碼本成分和自適應碼本目標信號相關聯(lián)的信息來產生所述第一目標信號;至少基于與所述第二多個脈沖位置和符號相關聯(lián)的信息來產生固定碼本矢量;至少基于與所述第二多個碼沖位置和符號相關聯(lián)的信息來確定所述子幀的固定碼本索引。
37.如權利要求26所述的方法,其中所述產生多個脈沖的第二多個脈沖位置和符號的步驟包括確定音軌中的至少一個脈沖的至少一個位置和一個符號;產生第一更新目標信號,從而從所述第一目標信號中除去所述至少一個脈沖的成分;至少基于與所述第一更新目標信號相關聯(lián)的信息來產生第二修改目標信號;存儲所述至少一個脈沖的至少一個位置和一個符號;輸出所述多個脈沖的所述第二多個脈沖位置和符號。
38.如權利要求26所述的方法,其中所述第一目標信號位于語音域、經加權的語音域、激勵域或者經濾波的激勵域中。
全文摘要
本發(fā)明提供了一種用于在源編解碼器和目的地編解碼器之間映射CELP參數的裝置,該裝置包括LSP映射模塊、耦合到LSP映射模塊的自適應碼本映射模塊以及耦合到LSP映射模塊和自適應碼本映射模塊的固定碼本映射模塊。LSP映射模塊包括LP溢出模塊和LSP參數修改模塊。自適應碼本映射模塊包括第一基音增益碼本。固定碼本映射模塊包括第一目標處理模塊、脈沖搜索模塊、固定碼本增益估計模塊和脈沖位置搜索模塊。
文檔編號G10L19/10GK1708907SQ200380102078
公開日2005年12月14日 申請日期2003年10月24日 優(yōu)先權日2002年10月25日
發(fā)明者馬爾萬·A·賈布里, 尼古拉·昌雄-懷特, 王建偉 申請人:達麗星網絡有限公司
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
巫山县| 乌什县| 和平区| 彩票| 梅州市| 阿拉善右旗| 阿巴嘎旗| 马鞍山市| 芜湖县| 兰州市| 丽江市| 哈巴河县| 聂拉木县| 巴南区| 丰镇市| 东乡族自治县| 基隆市| 荣成市| 彝良县| 牟定县| 明星| 淮阳县| 元阳县| 济南市| 绿春县| 汝南县| 锡林郭勒盟| 阿克陶县| 夹江县| 方城县| 马龙县| 崇明县| 贵定县| 高邑县| 漳浦县| 潜山县| 麻阳| 渑池县| 库伦旗| 平乐县| 左云县|