用于電信多速率語音編碼器中的語音速率轉(zhuǎn)換的方法和裝置的制作方法

文檔序號(hào)：2829024閱讀：298來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專利名稱：用于電信多速率語音編碼器中的語音速率轉(zhuǎn)換的方法和裝置的制作方法
技術(shù)領(lǐng)域：
本發(fā)明一般地涉及處理電信信號(hào)。更具體而言，本發(fā)明涉及用于從一個(gè)數(shù)據(jù)速率編碼方法的第一語音壓縮比特流到另一個(gè)不同的數(shù)據(jù)速率的第二語音壓縮比特流的語音速率轉(zhuǎn)換(trans-rating)的方法和裝置。僅作為示例，本發(fā)明已被應(yīng)用到了多速率或多模式的基于代碼激勵(lì)線性預(yù)測(cè)(CELP)的語音壓縮編解碼器中的語音速率轉(zhuǎn)換中，但是將會(huì)意識(shí)到本發(fā)明也可包括其他應(yīng)用。
背景技術(shù)：
速率轉(zhuǎn)換是用于銜接兩個(gè)在不同速率下工作的終端之間的差距的數(shù)字信號(hào)處理技術(shù)。這一般發(fā)生在這樣的情況下，即兩個(gè)或更多個(gè)終端包括能夠在活動(dòng)話音模式和非活動(dòng)話音的SID和DTX幀的8個(gè)不同速率下工作的多速率語音編解碼器，例如GSM-AMR編解碼器。當(dāng)工作在12.2kbps的最高速率下的GSM-AMR終端試圖與工作在另一個(gè)不同速率(4.95kbps或其他)下的另一個(gè)GSM-AMR終端通信時(shí)，就需要速率轉(zhuǎn)換。
一種傳統(tǒng)的速率轉(zhuǎn)換方法通過將輸入比特流解碼為話音信號(hào)，然后根據(jù)另一速率語音壓縮方法對(duì)話音信號(hào)重新編碼，來執(zhí)行速率轉(zhuǎn)換。這一解碼和重新編碼的過程涉及大量計(jì)算，其中包括進(jìn)行比特拆包(bit-unpacking)以獲得壓縮參數(shù)、重構(gòu)激勵(lì)信號(hào)、合成脈沖編碼調(diào)制(PCM)格式的語音信號(hào)、對(duì)語音信號(hào)進(jìn)行后濾波以及再次分析PCM話音信號(hào)以獲得語音壓縮參數(shù)并根據(jù)第二速率語音編碼方法對(duì)諸如LSP、自適應(yīng)碼書參數(shù)、自適應(yīng)碼書增益、固定碼書索引參數(shù)和固定碼書增益之類的語音壓縮參數(shù)進(jìn)行重新編碼。
傳統(tǒng)的速率轉(zhuǎn)換過程還有一個(gè)缺點(diǎn)是由于重編碼過程中的預(yù)測(cè)而造成延遲至少會(huì)增大一個(gè)額外的幀算法延遲。
智能速率轉(zhuǎn)換不是解碼和重新編碼的傳統(tǒng)方式，更確切地說智能速率轉(zhuǎn)換工作在完全不同的域。智能速率轉(zhuǎn)換執(zhí)行僅限于壓縮參數(shù)域的比特流轉(zhuǎn)換。在許多情況下，從原始比特流到目的比特流，對(duì)于不同速率的某種已定義的數(shù)學(xué)映射被應(yīng)用到CELP參數(shù)索引。這些參數(shù)適用于LPC、自適應(yīng)碼書參數(shù)、自適應(yīng)碼書增益、固定碼書索引參數(shù)和固定碼書增益參數(shù)。
所需要的是一種克服傳統(tǒng)速率轉(zhuǎn)換的局限性并有效地應(yīng)用智能速率轉(zhuǎn)換原理的技術(shù)。

發(fā)明內(nèi)容
因此，本發(fā)明針對(duì)多速率語音編碼器比特流速率轉(zhuǎn)換裝置和用于將第一速率語音分組數(shù)據(jù)轉(zhuǎn)換為第二速率語音分組數(shù)據(jù)的方法，其采用了輸入比特流拆包器、一個(gè)或多個(gè)速率轉(zhuǎn)換對(duì)、直通模塊、配置模塊和輸出比特流打包器。每個(gè)速率轉(zhuǎn)換對(duì)包括用于直接空間域映射、激勵(lì)域映射中的分析和經(jīng)濾波的激勵(lì)域映射中的分析的模塊中的至少一個(gè)語音壓縮參數(shù)映射模塊。最后，該裝置包括用于混合部分直通和部分映射的模塊。速率轉(zhuǎn)換的方法包括在輸入點(diǎn)對(duì)經(jīng)編碼的分組進(jìn)行比特拆包或去量化以獲得根據(jù)第一速率語音壓縮方法的速率信息和語音壓縮參數(shù)。關(guān)于第一速率和所需輸出速率(即第二速率類型)的信息以及外部控制命令隨后被用于確定速率轉(zhuǎn)換對(duì)的轉(zhuǎn)換策略。接下來，第一速率的壓縮參數(shù)的一部分或全部被直通，或者以與第二速率語音壓縮方法兼容的方式被映射到第二速率的壓縮參數(shù)。
可以改變變換方法，并且可以基于第一速率壓縮方法和第二速率壓縮方法這一對(duì)的特性來進(jìn)一步優(yōu)化變換方法。最后，第二速率語音壓縮參數(shù)被打包成與多速率語音編碼器標(biāo)準(zhǔn)的第二速率相兼容的比特流。
根據(jù)本發(fā)明的裝置例如包括·語音壓縮代碼參數(shù)拆包模塊，其將根據(jù)第一速率語音編解碼器壓縮方法的輸入第一速率語音分組提取為第一速率信息及其語音經(jīng)壓縮參數(shù)。在基于CELP的編解碼器的情況下，這些參數(shù)可以是線頻譜頻率參數(shù)、自適應(yīng)碼書參數(shù)、自適應(yīng)碼書增益參數(shù)、固定碼書增益參數(shù)和固定碼書索引參數(shù)，以及其他參數(shù)；·速率轉(zhuǎn)換控制器模塊，其取得輸入比特流數(shù)據(jù)速率或模式、輸入比特流幀差錯(cuò)標(biāo)志、所需的輸出比特流數(shù)據(jù)速率或模式以及外部控制命令，并且輸出關(guān)于輸出數(shù)據(jù)速率或模式的判決，以生成關(guān)于速率轉(zhuǎn)換策略的判決；·至少一個(gè)速率轉(zhuǎn)換對(duì)模塊，其將從源比特流拆包器生成的第一速率的輸入話音參數(shù)轉(zhuǎn)換為第二速率編解碼器的經(jīng)量化的話音參數(shù)；·至少一個(gè)直通模塊，其將輸入的經(jīng)編碼的參數(shù)直接傳遞到輸出的經(jīng)編碼的參數(shù)，如果輸出第二速率編解碼器與輸入第一速率編解碼器相同的話；以及·語音壓縮編解碼器比特流打包器，用于將第二速率的經(jīng)轉(zhuǎn)換和經(jīng)量化的話音參數(shù)歸組成輸出比特流分組。
本發(fā)明具有以下目的·在經(jīng)壓縮的語音參數(shù)域中在多速率語音編碼器的不同語音編解碼器速率比特流之間執(zhí)行智能語音速率轉(zhuǎn)換；·通過在參數(shù)空間中映射參數(shù)來提高語音質(zhì)量；·通過速率轉(zhuǎn)換過程降低延遲；·降低速率轉(zhuǎn)換過程的計(jì)算復(fù)雜度；·降低速率轉(zhuǎn)換過程所需的計(jì)算機(jī)存儲(chǔ)量；·在相同速率比特流轉(zhuǎn)換或不同速率比特流轉(zhuǎn)換(但具有可從輸入比特流推斷的輸出速率的輸出比特流)中支持直通特征；·提供可適應(yīng)于當(dāng)前和未來的多速率語音編解碼器的通用速率轉(zhuǎn)換體系結(jié)構(gòu)。
根據(jù)本發(fā)明的一個(gè)方面，速率轉(zhuǎn)換模塊裝置還包括適合于基于多個(gè)策略選擇CELP參數(shù)映射策略的判決模塊，以及至少一個(gè)轉(zhuǎn)換模塊，所述至少一個(gè)轉(zhuǎn)換模塊包括·用于語音壓縮參數(shù)直接空間映射的模塊，其在沒有任何迭代的情況下利用簡(jiǎn)單解析公式產(chǎn)生目的數(shù)據(jù)速率壓縮參數(shù)；·用于激勵(lì)空間域映射中的分析的模塊，其在激勵(lì)空間域中執(zhí)行搜索來產(chǎn)生目的數(shù)據(jù)速率壓縮參數(shù)；·用于經(jīng)濾波的激勵(lì)空間域映射中的分析的模塊，其通過在激勵(lì)空間中搜索閉環(huán)的自適應(yīng)碼書并在經(jīng)濾波的激勵(lì)空間中搜索固定碼書來產(chǎn)生目的數(shù)據(jù)速率壓縮參數(shù)；·用于直通混合映射的模塊，其混合部分經(jīng)量化的參數(shù)直通，其中輸入數(shù)據(jù)速率比特流的參數(shù)的一部分具有與輸出數(shù)據(jù)速率比特流的參數(shù)相同的經(jīng)量化的值。
特定速率轉(zhuǎn)換對(duì)中選擇的映射模塊可以是預(yù)先選擇的或者是通過判決動(dòng)態(tài)選擇的。
在本發(fā)明的另一個(gè)方面中，一種用于進(jìn)行多速率語音編碼器的第一速率比特流到第二速率比特流的速率轉(zhuǎn)換的方法，包括以下步驟·處理輸入第一速率語音編解碼器比特流的頭部，以識(shí)別輸入編解碼器比特流的第一速率或模式或錯(cuò)誤分組；·將第一速率編解碼器的輸入比特流拆包為至少一組語音壓縮參數(shù)；·配置速率轉(zhuǎn)換對(duì)，以將第一速率輸入比特流轉(zhuǎn)換為所需的第二速率編解碼器輸出比特流；·將一個(gè)或多個(gè)語音經(jīng)編碼參數(shù)的第一速率轉(zhuǎn)換為第二組速率經(jīng)編碼壓縮參數(shù)；·如果輸入第一速率編解碼器的語音壓縮參數(shù)的量化與輸出第二速率編解碼器相同，則將輸入的一組或多組經(jīng)編碼的參數(shù)直接傳遞到輸出；·將一組或多組輸出的第二速率的經(jīng)編碼的參數(shù)打包為輸出第二速率編解碼器比特流。
應(yīng)當(dāng)理解，以上概括描述和以下詳細(xì)描述都是示例性和說明性的，并且想要提供對(duì)所要求保護(hù)的發(fā)明的進(jìn)一步說明。
通過結(jié)合附圖參考以下描述，可以最充分地理解本發(fā)明的組織和操作方式以及更多目的和優(yōu)點(diǎn)。

圖1是用于示出多速率語音編碼器的速率轉(zhuǎn)換的現(xiàn)有技術(shù)過程的框圖。
圖2是示出用于通過解碼和重新編碼過程將比特流從一個(gè)編解碼器速率比特流轉(zhuǎn)換到另一速率比特流的一般速率轉(zhuǎn)換連接的現(xiàn)有技術(shù)系統(tǒng)的框圖。
圖3是示出用于在沒有完全的解碼和重新編碼的情況下將比特流從一個(gè)編解碼器速率比特流轉(zhuǎn)換到另一速率比特流的一般速率轉(zhuǎn)換連接的框圖。
圖4是示出對(duì)于每個(gè)20ms幀的現(xiàn)有技術(shù)自適應(yīng)多速率(AMR，也稱為GSM-AMR)語音編碼器多速率比特分配的表。
圖5是示出本發(fā)明的代表性實(shí)施例的語音速率轉(zhuǎn)換的框圖。
圖6是示出包括分組類型檢測(cè)和參數(shù)去量化的輸入比特流拆包的框圖。
圖7是進(jìn)一步示出基于代碼激勵(lì)線性預(yù)測(cè)(CELP)的語音編解碼器中的參數(shù)去量化的框圖。
圖8是示出速率轉(zhuǎn)換模塊的框圖。
圖9是示出通過直接CELP參數(shù)空間映射進(jìn)行的速率轉(zhuǎn)換過程的框圖。
圖10是示出通過CELP激勵(lì)參數(shù)空間映射進(jìn)行的速率轉(zhuǎn)換過程的框圖。
圖11是示出激勵(lì)向量校準(zhǔn)的框圖。
圖12是示出通過CELP激勵(lì)參數(shù)空間和經(jīng)濾波的激勵(lì)參數(shù)空間映射進(jìn)行的速率轉(zhuǎn)換過程的框圖。
圖13是示出參數(shù)直通和映射的混合模塊的框圖。
圖14是示出從AMR中的速率5.15kbps到速率4.75kbps的利用參數(shù)直通和映射的混合的速率轉(zhuǎn)換的示例的框圖。
圖15是示出從AMR中的速率4.75kbps到速率5.15kbps的利用參數(shù)直通和映射的混合的速率轉(zhuǎn)換的示例的框圖。
圖16是示出從AMR中的速率12.2kbps到速率4.75kbps的利用經(jīng)濾波的激勵(lì)方法中的分析的速率轉(zhuǎn)換的示例的框圖。
圖17是示出從AMR中的速率4.75kbps到速率12.2kbps的利用經(jīng)濾波的激勵(lì)方法中的分析的速率轉(zhuǎn)換的示例的框圖。
具體實(shí)施例方式
在下面的描述中，出于說明目的，闡述了許多具體細(xì)節(jié)以便徹底理解本發(fā)明。多速率語音編碼器GSM-AMR不同速率的速率轉(zhuǎn)換的情形被用作示例以便進(jìn)行說明。這里描述的方法一般地適用于任何一對(duì)多速率語音編解碼器之間的速率轉(zhuǎn)換。本領(lǐng)域的技術(shù)人員將會(huì)意識(shí)到，在不脫離本發(fā)明的精神和范圍的情況下，可以使用其他步驟、配置和布置。
本發(fā)明包括用于在多速率語音編碼器中的不同代碼速率的兩個(gè)編解碼器之間執(zhí)行智能速率轉(zhuǎn)換的方法。本發(fā)明還包括速率轉(zhuǎn)換直通的特殊情形，其中所需的輸出比特流與輸入比特流具有相同速率編解碼器。下面的部分描述本發(fā)明的細(xì)節(jié)。
圖5是示出根據(jù)本發(fā)明的第一實(shí)施例的多速率語音編碼器速率轉(zhuǎn)換裝置10的框圖。該設(shè)備包括輸入比特流拆包模塊12、智能插值引擎14和輸出比特流打包模塊30，該智能插值引擎14包括至少一個(gè)速率轉(zhuǎn)換對(duì)模塊16、18、20，至少一個(gè)直通模塊22，以及控制路線選擇切換裝置26和28的速率轉(zhuǎn)換控制命令模塊24。裝置10接收第一速率語音編解碼器比特流，作為到輸入比特流拆包模塊12的輸入，并將速率信息的結(jié)果傳遞到配置控制命令模塊24。配置控制命令模塊24取得輸入速率信息、所需的輸出速率信息和外部網(wǎng)絡(luò)命令，以判決特定的速率轉(zhuǎn)換對(duì)模塊16或直通模塊22，并控制從輸入比特流拆包模塊12到輸出比特流打包模塊30的數(shù)據(jù)流切換。速率轉(zhuǎn)換對(duì)模塊16將輸入速率編解碼器經(jīng)壓縮參數(shù)轉(zhuǎn)換為輸出速率編解碼器經(jīng)量化語音經(jīng)壓縮參數(shù)。直通模塊22將輸入速率編解碼器經(jīng)量化參數(shù)直接傳遞到輸出速率編解碼器經(jīng)量化參數(shù)，或者甚至直接傳遞到輸入比特流分組。輸出比特流打包模塊30將經(jīng)轉(zhuǎn)換且經(jīng)量化的輸出速率編解碼器參數(shù)歸組為輸出比特流分組。
圖6示出輸入比特流拆包模塊12的結(jié)構(gòu)，其包括輸入比特流檢測(cè)模塊32和CELP經(jīng)壓縮參數(shù)去量化模塊34。比特流識(shí)別器模塊32執(zhí)行速率信息插值和差錯(cuò)檢測(cè)。它輸出比特流的數(shù)據(jù)速率信息，并將比特流的有效載荷傳遞到語音經(jīng)壓縮參數(shù)去量化模塊(未示出)。如果在比特流中檢測(cè)到差錯(cuò)，模塊32則發(fā)出幀差錯(cuò)標(biāo)志。
圖7進(jìn)一步示出輸入比特流拆包模塊12中的基于CELP的語音經(jīng)壓縮參數(shù)去量化模塊34的框圖。去量化模塊34包括代碼分離器單元36和不同的壓縮參數(shù)去量化器單元，即LSP去量化器38、基音滯后代碼去量化器40、自適應(yīng)碼書增益代碼去量化器42、固定碼書增益代碼去量化器44、固定碼書代碼去量化器46、速率代碼去量化器48、幀能量代碼去量化器50和代碼索引直通52。去量化器分別被應(yīng)用來將每個(gè)幀的比特流有效載荷代碼分離成LSP代碼、基音滯后代碼、自適應(yīng)碼書增益代碼、固定碼書增益代碼、固定碼書向量代碼、速率代碼和幀能量代碼，每個(gè)選擇都是基于源編解碼器的編碼方法的。實(shí)際可用的參數(shù)代碼取決于編解碼器本身、比特速率以及(如果適用的話)幀類型。這些代碼被輸入到適當(dāng)?shù)拇a去量化器，這些去量化器分別輸出LSP、基音滯后、自適應(yīng)碼書增益、固定碼書增益、固定碼書向量、速率和幀能量。通常，由于許多CELP代碼器中使用的多子幀激勵(lì)處理，在每個(gè)代碼去量化的輸出處有多于一個(gè)值可用。幀的CELP參數(shù)隨后被輸入到下一級(jí)。
速率轉(zhuǎn)換控制模塊接收輸入比特流的分組類型和數(shù)據(jù)速率，以及第二編解碼器速率的輸出的外部控制命令，如圖5所示。它基于輸入比特流和輸出速率要求控制切換模塊選擇速率轉(zhuǎn)換對(duì)模塊之一。如果所要求的輸出速率與輸入比特流速率相同，則可以選擇直通模塊。例如，如果輸入比特流是靜默描述幀類型，并且對(duì)于所要求的輸出速率編解碼器，靜默描述的類型和格式相同，則在速率轉(zhuǎn)換過程期間速率轉(zhuǎn)換控制模塊將會(huì)選擇直通模塊來執(zhí)行靜默描述幀。
圖8示出執(zhí)行特定速率轉(zhuǎn)換的速率轉(zhuǎn)換對(duì)模塊16的結(jié)構(gòu)。可以使用若干種映射方法，包括利用輸入速率編解碼器經(jīng)量化參數(shù)的混合直通部分來輸出速率代碼參數(shù)并且映射參數(shù)的其他部分的元件56；用于在沒有任何進(jìn)一步的分析或迭代的情況下將輸入速率編解碼器經(jīng)去量化參數(shù)直接映射到相應(yīng)的輸出速率編解碼器參數(shù)的元件58；用于激勵(lì)域中的分析的元件60；以及用于經(jīng)濾波的激勵(lì)域中的分析或這些策略的組合的元件62，所述組合例如是搜索激勵(lì)空間中的自適應(yīng)碼書(未示出)和經(jīng)濾波的激勵(lì)空間中的固定代碼碼書(未示出)。這四種類型的映射由模塊16內(nèi)被視為切換控制單元24的速率轉(zhuǎn)換判決策略所控制。
速率轉(zhuǎn)換控制命令模塊24(圖5)(也稱為策略判決模塊24(圖8))確定要應(yīng)用哪個(gè)映射策略。判決可以是基于特定輸入速率和輸出速率編解碼器速率轉(zhuǎn)換對(duì)之間的相似之處和不同之處的特性而預(yù)先定義的。如果輸入速率編解碼器的壓縮參數(shù)的一部分具有與選中的輸出速率編解碼器類似的量化方法和量化表，則直通和映射的混合模式可能就是速率轉(zhuǎn)換的合適選擇。
判決可以基于可用計(jì)算資源或最低質(zhì)量要求以動(dòng)態(tài)方式改變。輸入速率編解碼器經(jīng)壓縮參數(shù)可以多種方式被映射，以給出質(zhì)量越來越好的輸出，其代價(jià)是計(jì)算復(fù)雜度。在最高質(zhì)量下，代碼轉(zhuǎn)換算法的計(jì)算復(fù)雜度仍然低于強(qiáng)制串聯(lián)方法的計(jì)算復(fù)雜度。由于這四種方法犧牲質(zhì)量來換取計(jì)算負(fù)載的降低，因此在裝置因大量同時(shí)存在的信道而過載的情況下它們可被用于提供適度的質(zhì)量降低。從而，速率轉(zhuǎn)換的性能可適應(yīng)可用的資源。
圖9、10、11和12詳細(xì)示出四種不同的基于語音壓縮參數(shù)的映射策略。從圖9中最簡(jiǎn)單的情形開始，它們是以漸變的計(jì)算復(fù)雜度和輸出質(zhì)量的順序給出的。此外，圖13示出了部分直通和部分映射的方法。該方法被應(yīng)用于共享相同的量化算法和量化表的輸入速率編解碼器和輸出速率編解碼器中的選中的壓縮參數(shù)。本發(fā)明的一個(gè)關(guān)鍵特征是多速率語音編碼器中的語音壓縮參數(shù)可被直接映射，而無需重構(gòu)話音信號(hào)。這意味著在閉環(huán)碼書搜索期間大量計(jì)算得以節(jié)省，因?yàn)樾盘?hào)不需要像傳統(tǒng)串聯(lián)技術(shù)所要求的那樣被短期沖擊響應(yīng)所濾波。這一映射能起作用，因?yàn)檩斎胨俾时忍亓鳈C(jī)制先前已經(jīng)確定了生成話音的最優(yōu)經(jīng)壓縮參數(shù)。本發(fā)明利用這一事實(shí)來允許激勵(lì)域而不是整個(gè)話音域中的迅速直通，或直接映射，或搜索。
具體參考圖9，其中是直接空間映射102的框圖。它接收輸入速率編解碼器比特流104的各種經(jīng)量化的經(jīng)壓縮參數(shù)，并直接執(zhí)行經(jīng)壓縮參數(shù)映射。在典型的CELP編解碼器中，它映射LSP參數(shù)、自適應(yīng)碼書參數(shù)、自適應(yīng)碼書增益參數(shù)、固定碼書參數(shù)和固定碼書增益參數(shù)。在每種類型的參數(shù)映射之后，它根據(jù)輸出速率編解碼器重新量化這些參數(shù)，并發(fā)送到輸出速率代碼比特流打包的下一級(jí)。
除了直通或部分直通方法外，直接空間映射是最簡(jiǎn)單的速率轉(zhuǎn)換方案。該映射是基于輸入速率編解碼器和輸出速率編解碼器參數(shù)之間的物理裝置的相似性的，并且速率轉(zhuǎn)換是在不進(jìn)行任何迭代或廣泛搜索的情況下利用解析公式直接執(zhí)行的。此方案的優(yōu)點(diǎn)是它不需要大量存儲(chǔ)器并且消耗的MIPS幾乎為零，但它仍生成清晰的(雖然質(zhì)量有所降低)的聲音。此方法是通用的，并且就不同的子幀大小或不同的經(jīng)壓縮參數(shù)表示形式而言適用于所有種類的多速率語音編解碼器速率轉(zhuǎn)換。
圖10示出激勵(lì)映射104中的分析的框圖。它接收來自輸入速率編解碼器比特流的經(jīng)去量化的LSP參數(shù)，并執(zhí)行到輸出速率編解碼器格式的映射。除了在不進(jìn)行任何搜索和迭代的情況下將自適應(yīng)碼書和固定碼書參數(shù)從輸入比特流拆包直接映射到輸出速率編解碼器格式的直接空間映射方法之外，激勵(lì)信號(hào)被重構(gòu)。激勵(lì)的重構(gòu)需要自適應(yīng)碼書、自適應(yīng)碼書增益、固定碼書和固定碼書增益的參數(shù)。
此方法比起直接空間映射方法102更為先進(jìn)，因?yàn)樗阉髁俗赃m應(yīng)和固定碼書，并且以輸出速率編解碼器所定義的通常方式估計(jì)了增益，只不過它們是在激勵(lì)域而不是話音域完成的。首先通過用來自輸入編解碼器比特流的經(jīng)去量化的自適應(yīng)碼書參數(shù)作為初始估計(jì)進(jìn)行局部搜索，來確定自適應(yīng)碼書。該搜索是在初始估計(jì)的小間隔內(nèi)以目的編解碼器所要求的精度(整數(shù)或分?jǐn)?shù)基音)進(jìn)行的。隨后為最佳碼字向量確定自適應(yīng)碼書增益。一旦找到，就從激勵(lì)和通過到殘余的最優(yōu)匹配所確定的固定碼書中減去自適應(yīng)碼書向量貢獻(xiàn)。比起傳統(tǒng)串聯(lián)方法來，優(yōu)點(diǎn)在于開環(huán)自適應(yīng)碼書估計(jì)不需要從CELP標(biāo)準(zhǔn)所使用的自校正方法計(jì)算，而是可從輸入比特流的經(jīng)去量化的參數(shù)確定。此外，搜索是在激勵(lì)域而不是話音域執(zhí)行的，從而不需要自適應(yīng)碼書和固定碼書搜索期間的沖擊響應(yīng)濾波。這節(jié)省了大量的計(jì)算，而不會(huì)對(duì)輸出語音質(zhì)量造成任何損害。
考慮輸入速率編解碼器和輸出速率編解碼器之間的LSP參數(shù)的差異，重構(gòu)的激勵(lì)可被校準(zhǔn)，以補(bǔ)償LSP參數(shù)的影響。圖11示出了激勵(lì)校準(zhǔn)方法106。輸入的經(jīng)去量化的參數(shù)的重構(gòu)的激勵(lì)向量形式被輸入速率編解碼器的LPC系數(shù)合成以轉(zhuǎn)換到話音域，然后被用輸出速率編解碼器的重新經(jīng)量化的LPC參數(shù)濾波以形成映射中的目標(biāo)信號(hào)。此校準(zhǔn)是可選的，并且在輸入和輸出速率編解碼器之間的LPC參數(shù)中存在顯著差異的情況下可大大提高感知話音質(zhì)量。
圖12示出經(jīng)濾波的激勵(lì)空間直接空間映射分析方法108的框圖。在此情況下，LPC參數(shù)仍被從輸入速率編解碼器直接映射到輸出速率代碼，并且經(jīng)去量化的自適應(yīng)碼書參數(shù)被用作輸出速率編解碼器的初始估計(jì)。自適應(yīng)碼書搜索仍在激勵(lì)域或經(jīng)校準(zhǔn)的激勵(lì)域中執(zhí)行。但是，固定碼書搜索是在經(jīng)濾波的激勵(lì)空間域中執(zhí)行的?？梢詰?yīng)用各種濾波器，包括用于平滑任何不規(guī)則之處的低通濾波器，補(bǔ)償輸入和輸出編解碼器中的激勵(lì)向量的特性之間的差異的濾波器，以及增益在感知上重要的信號(hào)特征的濾波器。一個(gè)優(yōu)點(diǎn)在于濾波器的參數(shù)(階數(shù)、頻率加強(qiáng)/去加強(qiáng)、相位)是完全可調(diào)的。這與使用加權(quán)LP合成濾波器的標(biāo)準(zhǔn)編碼中的目標(biāo)信號(hào)計(jì)算相反。從而，此策略允許了進(jìn)行調(diào)節(jié)以提高特定的輸入和輸出編解碼器對(duì)之間的速率轉(zhuǎn)換的質(zhì)量，并且允許了提供質(zhì)量和復(fù)雜度之間的折衷。
在某些特定的速率轉(zhuǎn)換對(duì)中，輸入和輸出編解碼器在某些壓縮參數(shù)中具有相同的壓縮算法和相同的量化表。上述映射方法可被簡(jiǎn)化為部分直通和部分映射過程。圖13示出了組合的直通和映射組合方法110的框圖。如果輸出速率編解碼器的某些經(jīng)量化的參數(shù)具有與輸入速率編解碼器的某些經(jīng)量化的參數(shù)相同的量化過程和量化表，則參數(shù)可通過直通單元112從輸入比特流直接被映射，而無需任何搜索或量化過程。輸出速率編解碼器的其余經(jīng)量化的參數(shù)可利用直接空間映射、激勵(lì)空間映射中的分析和經(jīng)濾波的激勵(lì)空間映射中的分析的映射方法之一來映射。
注意，也可使用上述方法的任何組合。實(shí)現(xiàn)高質(zhì)量和低復(fù)雜度兩者的最佳方法將取決于輸入速率和輸出速率編解碼器之間的平衡。
輸出速率比特流打包模塊通過配置控制命令模塊24連接速率轉(zhuǎn)換對(duì)模塊或直通模塊(圖5)。打包模塊根據(jù)輸出速率編解碼器將輸出速率的經(jīng)轉(zhuǎn)換且經(jīng)量化的參數(shù)歸組為輸出比特流分組。
第一實(shí)施例-AMR5.15KBPS-＞4.75KBPS速率轉(zhuǎn)換現(xiàn)在描述根據(jù)本發(fā)明的合適的系統(tǒng)的示例。多速率語音編碼器(自適應(yīng)多速率或AMR，也稱為GSM-AMR)被作為示例以示出本發(fā)明的原理。AMR編解碼器使用具有12.2、10.2、7.95、7.40、6.70、5.90、5.15和4.75kbps比特率的八個(gè)源編解碼器。圖4示出AMR編碼算法中的8個(gè)比特率的比特分配。
編解碼器基于代碼激勵(lì)線性預(yù)測(cè)(CELP)編碼模型。使用了10階線性預(yù)測(cè)(LP)或短期合成濾波器。利用所謂的自適應(yīng)碼書方法實(shí)現(xiàn)了長(zhǎng)期或基音合成濾波器。
在CELP話音合成模型中，通過將來自自適應(yīng)和固定(創(chuàng)新)碼書的兩個(gè)激勵(lì)向量相加來構(gòu)造短期線性預(yù)測(cè)(LP)合成濾波器的輸入處的激勵(lì)信號(hào)。通過將來自這些碼書的兩個(gè)適當(dāng)選取的向量饋送經(jīng)過短期合成濾波器來合成話音。利用綜合分析搜索過程選取碼書中的最優(yōu)激勵(lì)序列，在該過程中，根據(jù)經(jīng)感知加權(quán)的失真度量來最小化原始話音和合成話音之間的誤差。綜合分析搜索技術(shù)中使用的感知加權(quán)濾波器使用經(jīng)去量化的LP參數(shù)。
編碼器以8,000樣本每秒的采樣頻率在與160個(gè)樣本相對(duì)應(yīng)的20ms的話音幀上工作。在每160個(gè)話音樣本處，話音信號(hào)被分析，以提取CELP模型的參數(shù)(LP濾波器系數(shù)、自適應(yīng)和固定碼書的索引和增益)。這些參數(shù)被編碼和發(fā)送。在解碼器處，對(duì)這些參數(shù)進(jìn)行解碼，并且通過經(jīng)由LP合成濾波器對(duì)重構(gòu)的激勵(lì)信號(hào)進(jìn)行濾波來合成話音。
GSM-AMR話音幀被劃分為各為5ms(40個(gè)樣本)的子幀。自適應(yīng)和固定碼書參數(shù)在每個(gè)子幀都被發(fā)送。根據(jù)子幀使用經(jīng)量化和經(jīng)去量化的LP參數(shù)或它們的經(jīng)插值的版本?；诮?jīng)感知加權(quán)的話音信號(hào)，每隔一個(gè)子幀(除了5.15和4.75kb/s模式外，其中每幀進(jìn)行一次)估計(jì)開環(huán)基音滯后。
圖14是基于從AMR5.15kbps比特流到AMR4.75kbps比特流的速率轉(zhuǎn)換的部分直通和部分直接空間映射混合方法的框圖。兩個(gè)速率(5.15和4.75)共享相同的線性預(yù)測(cè)系數(shù)(LPC)量化表和相同的量化過程，因而兩個(gè)速率的索引是相同的(一對(duì)一映射)。類似地，兩個(gè)速率共享相同的自適應(yīng)(或基音)和固定(或代數(shù))碼書索引。
在5.15和4.75之間的速率轉(zhuǎn)換中，線性預(yù)測(cè)系數(shù)(LPC)、自適應(yīng)碼書參數(shù)和固定碼書參數(shù)這三個(gè)參數(shù)可在沒有任何計(jì)算復(fù)雜度的情況下被從原始比特流直接映射到目的比特流。
在自適應(yīng)碼書增益和固定碼書增益的情況下，壓縮方法和表是不同的，因此這些參數(shù)的表示形式對(duì)于5.15和4.75kbps是不同的。如圖4所示，輸入AMR5.15kbps編解碼器在每個(gè)子幀間有6比特聯(lián)合增益量化索引，而輸出AMR4.75kbps編解碼器在每?jī)蓚€(gè)子幀間有8比特聯(lián)合增益量化索引。輸出速率AMR4.75kbps需要映射以將自適應(yīng)碼書增益和固定碼書增益的5.15kbps表示形式轉(zhuǎn)換到輸出比特流格式。
直接空間映射方法可被用來映射自適應(yīng)碼書增益和固定碼書增益兩者。輸入速率聯(lián)合自適應(yīng)碼書和固定碼書最初被去量化。該方法對(duì)每個(gè)子幀獲得經(jīng)去量化的自適應(yīng)碼書增益和固定碼書增益。然后這些增益分別被映射到每?jī)蓚€(gè)子幀。最后，根據(jù)4.75kbps編解碼器的輸出，每?jī)蓚€(gè)子幀重新量化自適應(yīng)碼書增益和固定碼書增益。4.75kbps的聯(lián)合增益索引的映射結(jié)果被與LSP、自適應(yīng)碼書參數(shù)和固定碼書參數(shù)的直通結(jié)果歸組在一起，以形成4.75kbps比特流的輸出。
可以選擇激勵(lì)空間映射中的分析或經(jīng)濾波的激勵(lì)空間映射中的分析以搜索自適應(yīng)碼書和固定碼書增益的經(jīng)量化的聯(lián)合增益。由于4.75kbps和5.15kbps兩者具有相同的LPC索引表示形式，因此不必校準(zhǔn)作為目標(biāo)信號(hào)的來自輸入編解碼器的重構(gòu)的激勵(lì)向量。
第二實(shí)施例-AMR4.75KBPS-＞5.15KBPS速率轉(zhuǎn)換圖15示出根據(jù)本發(fā)明第二實(shí)施例的從AMR4.75kbps比特流到AMR5.15kbps比特流速率轉(zhuǎn)換的示例。該速率轉(zhuǎn)換過程與第一實(shí)施例中描述的相反方向速率轉(zhuǎn)換非常類似。輸出編解碼器5.15kbps在LPC系數(shù)、自適應(yīng)碼書參數(shù)和固定碼書參數(shù)間具有相同的量化過程和表?？赏ㄟ^速率轉(zhuǎn)換對(duì)中的直通單元直接獲得這些輸出的經(jīng)去量化的參數(shù)。
可通過直接空間映射、激勵(lì)空間映射中的分析或經(jīng)濾波的激勵(lì)空間映射的分析這些映射方法中的一種從5.15kbps的去量化自適應(yīng)碼書增益和固定碼書增益獲得4.75kbps的聯(lián)合增益索引。圖15示出了基于直接空間映射的方法。
第三實(shí)施例-AMR12.2KBPS->4.75KBPS速率轉(zhuǎn)換注意到以下這點(diǎn)是很重要的對(duì)于AMR12.2kbps，每幀執(zhí)行兩次LP分析，而對(duì)于直到4.75kbps的其他模式只執(zhí)行一次。對(duì)于12.2kbps模式，兩組LP參數(shù)被轉(zhuǎn)換成線頻譜對(duì)(LSP)，并被利用分離矩陣量化(SMQ)38比特聯(lián)合量化。對(duì)于其他模式，單組LP參數(shù)被轉(zhuǎn)換成線頻譜對(duì)(LSP)，并被利用分離向量量化(SVQ)(對(duì)于4.75kbps為23比特)向量量化。
圖16示出根據(jù)本發(fā)明第三實(shí)施例的從12.2kbps到4.75kbps的速率轉(zhuǎn)換的框圖。速率轉(zhuǎn)換對(duì)模塊選擇經(jīng)濾波的激勵(lì)空間映射中的分析的方法來執(zhí)行速率轉(zhuǎn)換。
首先，從傳入的12.2kbps比特流中提取LSF參數(shù)的索引，然后通過查找表和先前的LSP殘余向量獲得經(jīng)去量化的LSP參數(shù)。對(duì)經(jīng)去量化的LSP參數(shù)進(jìn)行插值并將其映射到每個(gè)子幀。根據(jù)AMR標(biāo)準(zhǔn)中指定的4.75kbps編解碼器重新量化這些LSP參數(shù)，并將其轉(zhuǎn)換為4.75kbps的LSP表示形式。
然后，通過經(jīng)去量化的自適應(yīng)碼書參數(shù)v[n]、自適應(yīng)碼書增益、固定碼書參數(shù)c[n]和固定碼書增益重構(gòu)輸入編解碼器12.2kbps的激勵(lì)向量。重構(gòu)的激勵(lì)向量被表示為在重構(gòu)的激勵(lì)向量變?yōu)樗俾兽D(zhuǎn)換過程中的目標(biāo)信號(hào)之前，可應(yīng)用如圖11所示的激勵(lì)向量校準(zhǔn)過程。該過程包括利用輸入12.2kbps的LPC去量化參數(shù)的合成步驟和利用輸出4.75kbps的LPC量化參數(shù)的濾波步驟。它校準(zhǔn)由于12.2kbps和4.75kbps編解碼器之間的LSP參數(shù)差異引起的假象。
經(jīng)校準(zhǔn)的激勵(lì)向量隨后被用作針對(duì)輸出速率4.75kbps的激勵(lì)空間映射中的分析的目標(biāo)信號(hào)。12.2kbps的經(jīng)去量化的自適應(yīng)碼書參數(shù)作為4.75kbps的閉環(huán)自適應(yīng)碼書搜索中的初始估計(jì)。該搜索獲得經(jīng)量化的自適應(yīng)碼書參數(shù)和自適應(yīng)碼書增益。由于4.75kbps編解碼器使用聯(lián)合增益索引來表示自適應(yīng)碼書和固定碼書增益，因此4.75kbps的自適應(yīng)碼書增益的量化是在固定碼書搜索之后執(zhí)行的。
從經(jīng)校準(zhǔn)的激勵(lì)中去除自適應(yīng)碼書向量貢獻(xiàn)。利用濾波器對(duì)該結(jié)果濾波以產(chǎn)生固定碼書搜索的目標(biāo)信號(hào)。然后通過快速技術(shù)搜索由形成碼字向量的兩個(gè)脈沖構(gòu)成的4.75kbps的固定碼書向量。從而，獲得4.75kbps的固定碼書索引。
與12.2kbps編解碼器不同，4.75kbps對(duì)自適應(yīng)碼書增益( )和固定碼書增益( )兩者都組合聯(lián)合搜索。利用計(jì)算出的自適應(yīng)碼書向量v[n]以及固定碼書向量c[n]，執(zhí)行基音增益和固定碼書增益上的雙重搜索，以使關(guān)系‖x-gpv-gcc‖達(dá)到最小，其中x是目標(biāo)激勵(lì)。在4.75kbps的第一和第三子幀中對(duì)自適應(yīng)和固定碼書的公共表索引進(jìn)行編碼。
如前所述，另兩種方法，即直接空間映射或激勵(lì)空間映射中的分析可被應(yīng)用到從12.2kbps到4.75kbps的速率轉(zhuǎn)換。這些不同的方法犧牲質(zhì)量來換取計(jì)算負(fù)載的降低，在裝置由于大量同時(shí)存在的信道而過載的情況下它們可被用來提供適度的質(zhì)量降低。
第四實(shí)施例-AMR4.75KBPS-＞12.2KBPS速率轉(zhuǎn)換圖17示出根據(jù)本發(fā)明第四實(shí)施例用于從4.75kbps到12.2kbps的速率轉(zhuǎn)換的系統(tǒng)120的框圖。速率轉(zhuǎn)換選擇經(jīng)濾波的激勵(lì)空間映射方法中的分析來將4.75kbps轉(zhuǎn)換到12.2kbps。
首先，從傳入的4.75kb/s比特流中提取LSF參數(shù)的索引，然后通過查找表和先前的LSP殘余向量獲得經(jīng)去量化的LSP參數(shù)。對(duì)經(jīng)去量化的LSP參數(shù)進(jìn)行插值并將其映射到每個(gè)子幀。對(duì)每?jī)蓚€(gè)子幀根據(jù)AMR標(biāo)準(zhǔn)中指定的12.2kbps編解碼器重新量化這些LSP參數(shù)，并將其轉(zhuǎn)換為12.2kbps的LSP表示形式。
然后，通過經(jīng)去量化的自適應(yīng)碼書參數(shù)v[n]、自適應(yīng)碼書增益、固定碼書參數(shù)c[n]和固定碼書增益重構(gòu)輸入編解碼器4.75kbps的激勵(lì)向量。重構(gòu)的激勵(lì)向量被表示為在重構(gòu)的激勵(lì)向量變?yōu)樗俾兽D(zhuǎn)換過程中的目標(biāo)信號(hào)之前，可應(yīng)用如圖11所示的激勵(lì)向量校準(zhǔn)過程。該過程包括利用輸入4.75kbps的LPC去量化參數(shù)的合成步驟和利用輸出12.2kbps的LPC量化參數(shù)的濾波步驟。它校準(zhǔn)由于4.75kbps和12.2kbps編解碼器之間的LSP差異引起的假象。
經(jīng)校準(zhǔn)的激勵(lì)向量隨后被用作針對(duì)12.2kbps的輸出速率的激勵(lì)空間映射中的分析的目標(biāo)信號(hào)。4.75kbps的經(jīng)去量化的自適應(yīng)碼書參數(shù)作為12.2kbps的閉環(huán)自適應(yīng)碼書搜索中的初始估計(jì)。以12.2kbps編解碼器所要求的1/6的精度在初始估計(jì)的小間隔內(nèi)搜索自適應(yīng)碼書。然后針對(duì)最佳代碼向量確定自適應(yīng)碼書增益，并從經(jīng)校準(zhǔn)的激勵(lì)中去除自適應(yīng)碼書向量貢獻(xiàn)。利用濾波器對(duì)該結(jié)果濾波以產(chǎn)生固定碼書搜索的目標(biāo)信號(hào)。
然后通過快速技術(shù)在經(jīng)濾波的激勵(lì)空間中搜索固定碼書，以獲得用于根據(jù)12.2kbps編解碼器形成10脈沖碼字向量的索引。并且經(jīng)濾波的激勵(lì)空間也被用于計(jì)算12.2kbps編解碼器的固定碼書增益。
從4.75kbps到12.2kbps的速率轉(zhuǎn)換也可采用其他提到的映射方法。這允許了速率轉(zhuǎn)換適應(yīng)于實(shí)時(shí)應(yīng)用中的可用計(jì)算資源。
其他CELP代碼轉(zhuǎn)換器本文獻(xiàn)中描述的自適應(yīng)碼書計(jì)算的發(fā)明通用于所有多速率語音編碼器，并且適用于諸如G.723.1、G.728、AMR、EVRC、QCELP、MPEG-4CELP、SMV、AMR-WB、VMR之類的已知的多速率語音編解碼器以及未來所有其他利用多速率編碼的基于CELP的語音編解碼器中的任何語音速率轉(zhuǎn)換。
已經(jīng)參考具體實(shí)施例說明了本發(fā)明，以使本領(lǐng)域的技術(shù)人員能夠作出或使用本發(fā)明。各種修改對(duì)于本領(lǐng)域的技術(shù)人員來說都是顯而易見的，并且這里定義的通用原理可被應(yīng)用到其他實(shí)施例，而無需創(chuàng)造能力。從而，本發(fā)明并不想要被局限于這里示出的實(shí)施例，而是想要符合與權(quán)利要求所指示的這里公開的原理和新穎特征相一致的最寬范圍。
權(quán)利要求
1.一種用于執(zhí)行從表示根據(jù)一種語音壓縮標(biāo)準(zhǔn)的基于第一速率的模式編碼的數(shù)據(jù)幀的第一源比特流到表示根據(jù)第二語音壓縮標(biāo)準(zhǔn)的基于第二速率的模式編碼的數(shù)據(jù)幀的第二目的比特流的語音速率轉(zhuǎn)換的裝置，包括源比特流拆包器，用于將來自處于輸入數(shù)據(jù)速率的所述第一比特流的語音代碼分離成單獨(dú)的表示話音參數(shù)的代碼；速率轉(zhuǎn)換控制器模塊，其可對(duì)所述第一比特流進(jìn)行操作以輸出所需的比特流數(shù)據(jù)速率模式，并且可對(duì)外部控制命令進(jìn)行操作，以輸出關(guān)于輸出數(shù)據(jù)速率的判決；多對(duì)速率轉(zhuǎn)換模塊，用于對(duì)輸入比特流數(shù)據(jù)進(jìn)行速率轉(zhuǎn)換，所述速率轉(zhuǎn)換模塊可進(jìn)行操作以接收從所述源比特流拆包器生成的輸入數(shù)據(jù)速率的關(guān)于話音參數(shù)的輸入，并且能夠進(jìn)行操作以輸出輸出數(shù)據(jù)速率的經(jīng)量化的話音參數(shù)；直通模塊，其可進(jìn)行操作以將輸入的經(jīng)編碼的索引直接傳遞到輸出；以及目的比特流打包器，用于將處于所述輸出數(shù)據(jù)速率的輸出的經(jīng)量化的話音參數(shù)歸組成目的比特流分組。
2.如權(quán)利要求1所述裝置，其中所述源比特流拆包器包括比特流數(shù)據(jù)速率識(shí)別器，其接收來自根據(jù)語音壓縮標(biāo)準(zhǔn)以數(shù)據(jù)速率編碼的數(shù)據(jù)的比特流幀的輸入，并輸出所述分組的數(shù)據(jù)速率；以及源比特流有效載荷數(shù)據(jù)去量化器，其對(duì)話音壓縮參數(shù)的代碼進(jìn)行解量化。
3.如權(quán)利要求1所述的裝置，其中所述源比特流拆包器是多個(gè)并行模塊。
4.如權(quán)利要求1所述的裝置，其中所述速率轉(zhuǎn)換控制器模塊包括參數(shù)緩沖器，其可進(jìn)行操作以存儲(chǔ)在前幀的輸入速率和輸出速率、所述在前幀的差錯(cuò)標(biāo)記以及多個(gè)在前幀的外部命令；以及判決模塊，其可進(jìn)行操作以接受外部控制命令以輸入數(shù)據(jù)速率在前幀輸出數(shù)據(jù)速率，以便輸出最終的速率轉(zhuǎn)換判決。
5.如權(quán)利要求1所述的裝置，其中所述速率轉(zhuǎn)換控制器模塊是多個(gè)模塊。
6.如權(quán)利要求1所述的裝置，其中所述速率轉(zhuǎn)換模塊之一包括判決模塊，該判決模塊適合于基于多個(gè)策略選擇代碼激勵(lì)線性預(yù)測(cè)參數(shù)映射策略；用于語音壓縮參數(shù)直接空間映射的模塊，其可進(jìn)行操作以在沒有迭代的情況下利用解析公式產(chǎn)生所述目的數(shù)據(jù)速率壓縮參數(shù)；用于激勵(lì)空間域映射中的分析的模塊，其可進(jìn)行操作以通過搜索激勵(lì)空間域來產(chǎn)生所述目的數(shù)據(jù)速率壓縮參數(shù)；用于經(jīng)濾波的激勵(lì)空間域映射中的分析的模塊，其可進(jìn)行操作以通過經(jīng)由激勵(lì)空間中的自適應(yīng)閉環(huán)且經(jīng)由經(jīng)濾波的激勵(lì)空間中的固定碼書的搜索來產(chǎn)生所述目的數(shù)據(jù)速率壓縮參數(shù)；用于直通混合映射的模塊，其混合部分經(jīng)量化的參數(shù)直通，其中輸入數(shù)據(jù)速率比特流的參數(shù)的一部分具有與所述輸出數(shù)據(jù)速率比特流的參數(shù)相同的經(jīng)量化的值。
7.如權(quán)利要求1所述的裝置，其中所述多速率對(duì)速率轉(zhuǎn)換模塊是多個(gè)模塊。
8.如權(quán)利要求1所述的裝置，其中所述直通模塊是單多個(gè)模塊。
9.如權(quán)利要求1所述的裝置，其中所述目的編解碼器打包器包括多個(gè)幀打包元件，每個(gè)幀打包元件可進(jìn)行操作以適應(yīng)于來自多速率語音壓縮編碼器的預(yù)先選擇的數(shù)據(jù)速率。
10.如權(quán)利要求1所述的裝置，其中所述語音壓縮標(biāo)準(zhǔn)是多速率/多模式編解碼器，其在其比特流中包含關(guān)于數(shù)據(jù)速率、基音增益、固定碼書增益和頻譜形狀參數(shù)的信息，所述頻譜形狀參數(shù)包括線頻譜頻率。
11.如權(quán)利要求2所述的裝置，其中所述源比特流有效載荷數(shù)據(jù)去量化器包括代碼分離器，該代碼分離器可進(jìn)行操作以接收來自根據(jù)語音壓縮標(biāo)準(zhǔn)以數(shù)據(jù)速率編碼的數(shù)據(jù)的比特流幀的輸入，并分離表示話音壓縮參數(shù)的索引；至少一個(gè)解量化器模塊，其可進(jìn)行操作以對(duì)每個(gè)壓縮參數(shù)的代碼進(jìn)行解量化；以及代碼索引直通模塊，其可進(jìn)行操作以將輸入的經(jīng)量化的參數(shù)索引傳遞到之后的級(jí)。
12.如權(quán)利要求6所述的裝置，其中所述語音壓縮參數(shù)直接空間映射模塊包括LSP系數(shù)轉(zhuǎn)換器，其可進(jìn)行操作以對(duì)目的速率LSP系數(shù)進(jìn)行編碼；自適應(yīng)碼書參數(shù)轉(zhuǎn)換器，其可進(jìn)行操作以對(duì)目的速率自適應(yīng)碼書參數(shù)進(jìn)行編碼；自適應(yīng)碼書增益參數(shù)轉(zhuǎn)換器，其可進(jìn)行操作以對(duì)目的速率自適應(yīng)碼書增益參數(shù)進(jìn)行編碼；固定碼書參數(shù)轉(zhuǎn)換器，其可進(jìn)行操作以對(duì)目的速率固定碼書參數(shù)進(jìn)行編碼；固定碼書增益參數(shù)轉(zhuǎn)換器，其可進(jìn)行操作以對(duì)目的速率固定碼書增益參數(shù)進(jìn)行編碼。
13.如權(quán)利要求6所述的裝置，其中所述激勵(lì)空間域映射中分析模塊包括LSP系數(shù)轉(zhuǎn)換器，其可進(jìn)行操作以對(duì)目的速率LSP系數(shù)進(jìn)行編碼；激勵(lì)向量模塊，其可進(jìn)行操作以從輸入的經(jīng)壓縮的話音參數(shù)構(gòu)造激勵(lì)參數(shù)；自適應(yīng)碼書參數(shù)轉(zhuǎn)換器，其可進(jìn)行操作以通過在激勵(lì)空間中執(zhí)行第一搜索來對(duì)目的速率自適應(yīng)碼書參數(shù)進(jìn)行編碼；自適應(yīng)碼書增益參數(shù)轉(zhuǎn)換器，其可進(jìn)行操作以通過在激勵(lì)空間中執(zhí)行第二搜索來對(duì)目的速率自適應(yīng)碼書增益參數(shù)進(jìn)行編碼；固定碼書參數(shù)轉(zhuǎn)換器，其可進(jìn)行操作以通過在激勵(lì)空間中執(zhí)行第三搜索來對(duì)目的速率固定碼書參數(shù)進(jìn)行編碼；固定碼書增益參數(shù)轉(zhuǎn)換器，其可進(jìn)行操作以通過在激勵(lì)空間中執(zhí)行第四搜索來對(duì)目的速率固定碼書增益參數(shù)進(jìn)行編碼。
14.如權(quán)利要求6所述的裝置，其中所述用于經(jīng)濾波的激勵(lì)空間域映射模塊中的分析的模塊包括LSP系數(shù)轉(zhuǎn)換器，其可進(jìn)行操作以對(duì)目的速率LSP系數(shù)進(jìn)行編碼；經(jīng)濾波的激勵(lì)向量模塊，其可進(jìn)行操作以從輸入的經(jīng)壓縮的話音參數(shù)構(gòu)造激勵(lì)參數(shù)；自適應(yīng)碼書參數(shù)轉(zhuǎn)換器，其可進(jìn)行操作以通過在激勵(lì)空間中執(zhí)行搜索來對(duì)目的速率自適應(yīng)碼書參數(shù)進(jìn)行編碼；自適應(yīng)碼書增益參數(shù)轉(zhuǎn)換器，其可進(jìn)行操作以通過在激勵(lì)空間和經(jīng)濾波的激勵(lì)空間中的至少一個(gè)中執(zhí)行搜索來對(duì)目的速率自適應(yīng)碼書增益參數(shù)進(jìn)行編碼；固定碼書參數(shù)轉(zhuǎn)換器，其可進(jìn)行操作以通過在經(jīng)濾波的激勵(lì)空間中執(zhí)行搜索來對(duì)目的速率固定碼書參數(shù)進(jìn)行編碼；固定碼書增益參數(shù)轉(zhuǎn)換器，其可進(jìn)行操作以通過在經(jīng)濾波的激勵(lì)空間中執(zhí)行搜索來對(duì)目的速率固定碼書參數(shù)進(jìn)行編碼。
15.如權(quán)利要求6所述的裝置，其中所述直通混合映射模塊包括參數(shù)直通模塊，其可進(jìn)行操作以將部分輸入的經(jīng)編碼的經(jīng)壓縮的話音參數(shù)傳遞到目的速率的經(jīng)編碼的經(jīng)壓縮的話音參數(shù)；以及參數(shù)轉(zhuǎn)換器模塊，其可進(jìn)行操作以從輸入的經(jīng)壓縮的話音參數(shù)編碼出目的速率壓縮話音參數(shù)。哈
16.如權(quán)利要求13所述的裝置，其中所述激勵(lì)向量模塊還包括輸入速率編解碼器激勵(lì)緩沖器，其可進(jìn)行操作以基于至少用于一個(gè)代碼激勵(lì)線性預(yù)測(cè)參數(shù)的輸入速率編解碼器存儲(chǔ)重構(gòu)的激勵(lì)向量；激勵(lì)向量校準(zhǔn)單元，其可進(jìn)行操作以通過利用輸入速率編解碼器經(jīng)量化LPC系數(shù)和輸出速率代碼經(jīng)編碼LPC系數(shù)來校準(zhǔn)輸入激勵(lì)向量；以及經(jīng)校準(zhǔn)激勵(lì)緩沖器，其可進(jìn)行操作以存儲(chǔ)用于所述輸出速率編解碼器編碼過程中的目標(biāo)的經(jīng)校準(zhǔn)的激勵(lì)向量。
17.如權(quán)利要求15所述的裝置，其中所述參數(shù)直通模塊是多個(gè)模塊。
18.如權(quán)利要求15所述的裝置，其中所述參數(shù)轉(zhuǎn)換器模塊是多個(gè)模塊。
19.如權(quán)利要求15所述的裝置，其中所述參數(shù)轉(zhuǎn)換器模塊是所述語音壓縮參數(shù)直接空間映射模塊、所述激勵(lì)空間域映射中分析模塊和所述激勵(lì)空間域映射中分析模塊中的至少一個(gè)的一部分。
20.一種用于將語音壓縮分組從表示在源編解碼器中根據(jù)第一語音壓縮標(biāo)準(zhǔn)的基于第一速率的模式編碼的數(shù)據(jù)幀的第一源比特流轉(zhuǎn)換到表示在輸出速率編解碼器中根據(jù)第二語音壓縮標(biāo)準(zhǔn)的基于第二速率的模式編碼的數(shù)據(jù)幀的第二目的比特流的方法，包括處理源編解碼器輸入比特流的頭部，以識(shí)別數(shù)據(jù)流的特性，包括數(shù)據(jù)速率、模式以及輸入比特流的分組類型中的至少一種；處理源編解碼器輸入比特流以從所述輸入比特流中拆包至少一個(gè)參數(shù)；配置速率轉(zhuǎn)換對(duì)，以轉(zhuǎn)換處于識(shí)別出的輸入速率的所述輸入比特流，以輸出處于所需的輸出速率的所述目的比特流；轉(zhuǎn)換所述識(shí)別出的輸入速率的至少一個(gè)經(jīng)編碼的參數(shù)的輸入，以生成所述所需的輸出速率的至少一個(gè)相應(yīng)參數(shù)作為輸出；如果所述經(jīng)編碼的參數(shù)的量化與所述輸出速率編解碼器處采用的相同，則將至少一個(gè)編碼參數(shù)直通到所述輸出速率編解碼器；以及通過打包用于所述輸出速率編解碼器的至少一個(gè)參數(shù)來處理所述輸出比特流。
21.如權(quán)利要求20所述的方法，其中所述源編解碼器輸入處理步驟包括將輸入比特流幀轉(zhuǎn)換成與至少一個(gè)代碼激勵(lì)線性預(yù)測(cè)參數(shù)相關(guān)聯(lián)的信息；將所述關(guān)聯(lián)信息解碼成至少一個(gè)輸入比特流，所述輸入比特流是代碼激勵(lì)線性預(yù)測(cè)比特流；以及輸出代碼激勵(lì)線性預(yù)測(cè)參數(shù)到插值器。
22.如權(quán)利要求21所述的方法，其中所述速率轉(zhuǎn)換對(duì)配置步驟包括從所述輸入代碼激勵(lì)線性預(yù)測(cè)比特流的頭部提取關(guān)于輸入速率和模式中的至少一個(gè)的源信息；從所述輸出比特流取出外部控制命令和所需速率中的至少一個(gè)，所述輸出比特流是代碼激勵(lì)線性預(yù)測(cè)比特流；檢查先前的速率轉(zhuǎn)換狀態(tài)；以及輸出速率轉(zhuǎn)換對(duì)選擇判決。
23.如權(quán)利要求20所述的方法，其中所述轉(zhuǎn)換步驟是從多種轉(zhuǎn)換方法之一中選擇出來的，所述多種轉(zhuǎn)換方法包括直接代碼激勵(lì)線性預(yù)測(cè)參數(shù)空間映射；激勵(lì)空間域映射中的分析；經(jīng)濾波的激勵(lì)空間映射中的分析；以及部分直通和部分參數(shù)映射。
24.如權(quán)利要求20所述的方法，其中所述速率轉(zhuǎn)換對(duì)配置步驟是用于在預(yù)備過程期間選擇的預(yù)定應(yīng)用的。
25.如權(quán)利要求20所述的方法，其中所述轉(zhuǎn)換方法還包括插值步驟，如果在所述所需輸出速率編解碼器格式的子幀大小和所述輸入速率編解碼器格式的子幀大小之間存在差異的話。
26.如權(quán)利要求20所述的方法，其中所述直通步驟包括將來自比特流拆包器的輸入速率編解碼器的經(jīng)編碼的參數(shù)轉(zhuǎn)達(dá)為輸出速率編解碼器的經(jīng)編碼的參數(shù)。
27.如權(quán)利要求21所述的方法，其中所述代碼激勵(lì)線性預(yù)測(cè)目的速率比特流處理步驟包括多個(gè)幀打包子處理步驟，每個(gè)子處理步驟能夠適應(yīng)于來自用于選中的目的速率編解碼器的多個(gè)應(yīng)用的預(yù)先選擇的應(yīng)用，所述選中的目的速率編解碼器是多個(gè)多速率編解碼器之一。
28.如權(quán)利要求23所述的方法，其中所述直接代碼激勵(lì)線性預(yù)測(cè)參數(shù)空間映射步驟包括以下步驟將來自所述輸入速率編解碼器的至少一個(gè)LSP系數(shù)轉(zhuǎn)換為用于所述輸出速率編解碼器的至少一個(gè)LSP系數(shù)；從所述輸入速率編解碼器自適應(yīng)碼書參數(shù)編碼出自適應(yīng)碼書參數(shù)；從所述輸入速率編解碼器自適應(yīng)碼書增益參數(shù)編碼出所述自適應(yīng)碼書增益參數(shù)；從所述輸入速率編解碼器固定碼書參數(shù)編碼出固定碼書參數(shù)；以及從所述輸入速率編解碼器固定碼書增益參數(shù)編碼出所述固定碼書增益參數(shù)。
29.如權(quán)利要求23所述的方法，其中所述激勵(lì)空間域映射分析步驟包括以下步驟將來自所述輸入速率編解碼器的至少一個(gè)LSP系數(shù)轉(zhuǎn)換為用于所述輸出速率編解碼器的至少一個(gè)LSP系數(shù)；如果校準(zhǔn)選項(xiàng)被選中，則校準(zhǔn)作為映射目標(biāo)向量的輸入速率編解碼器激勵(lì)向量；從輸入速率編解碼器自適應(yīng)碼書參數(shù)選擇自適應(yīng)碼書參數(shù)作為初始值；在激勵(lì)空間中的閉環(huán)中搜索所述自適應(yīng)碼書參數(shù)；在激勵(lì)空間中搜索自適應(yīng)碼書增益；構(gòu)造固定碼書搜索的目標(biāo)信號(hào)；在經(jīng)濾波的激勵(lì)空間中搜索固定碼書參數(shù)；在經(jīng)濾波的激勵(lì)空間中搜索固定碼書增益；并且隨即利用經(jīng)更新的參數(shù)更新所述激勵(lì)向量，作為輸入速率編解碼器重構(gòu)激勵(lì)向量。
30.如權(quán)利要求23所述的方法，其中所述經(jīng)濾波的激勵(lì)空間域映射分析步驟包括以下步驟將來自所述輸入速率編解碼器的至少一個(gè)LSP系數(shù)轉(zhuǎn)換為用于所述輸出速率編解碼器的至少一個(gè)LSP系數(shù)；如果校準(zhǔn)選項(xiàng)被選中，則校準(zhǔn)作為映射目標(biāo)向量的所述輸入速率編解碼器激勵(lì)向量；從輸入速率編解碼器自適應(yīng)碼書參數(shù)選擇自適應(yīng)碼書參數(shù)作為初始值；在激勵(lì)空間中的閉環(huán)中搜索自適應(yīng)碼書；在激勵(lì)空間中搜索自適應(yīng)碼書增益；構(gòu)造固定碼書搜索的目標(biāo)信號(hào)表示形式；在經(jīng)濾波的激勵(lì)空間中搜索固定碼書參數(shù)；在經(jīng)濾波的激勵(lì)空間中搜索固定碼書增益；并且利用經(jīng)更新的參數(shù)，更新所述激勵(lì)向量。
31.如權(quán)利要求23所述的方法，其中所述部分直通步驟和部分參數(shù)映射步驟包括以下步驟將所述輸入速率編解碼器參數(shù)分類成直通類和映射類，所述輸入速率編解碼器參數(shù)在所述輸入速率編解碼器中具有共同的編碼方法和索引，所述輸出速率編解碼器被分類為直通類，并且所有其他輸入速率編解碼器參數(shù)被分類為映射類；將所述輸入速率編解碼器的直通類參數(shù)直通到所述輸出速率編解碼器的參數(shù)；以及通過利用直接代碼激勵(lì)線性預(yù)測(cè)參數(shù)空間映射方法、激勵(lì)空間域映射分析方法和經(jīng)濾波的激勵(lì)空間映射分析方法中的至少一種，將所述輸入速率編解碼器的映射類參數(shù)轉(zhuǎn)換為所述輸出速率編解碼器的相應(yīng)參數(shù)。
32.如權(quán)利要求23所述的方法，其中所述多種轉(zhuǎn)換方法被組合為一種轉(zhuǎn)換方法。
33.如權(quán)利要求23所述的方法，其中特定速率轉(zhuǎn)換對(duì)中的轉(zhuǎn)換方法是動(dòng)態(tài)選擇的。
34.如權(quán)利要求25所述的方法，其中所述插值步驟包括將來自所述輸入速率編解碼器的LSP系數(shù)中的至少一個(gè)插值到用于所述輸出速率編解碼器的相應(yīng)LSP系數(shù)；將除了來自所述輸入速率編解碼器的LSP系數(shù)之外的代碼激勵(lì)線性預(yù)測(cè)參數(shù)插值到用于所述輸出速率編解碼器的相應(yīng)代碼激勵(lì)線性預(yù)測(cè)參數(shù)。
35.如權(quán)利要求29所述的方法，其中所述校準(zhǔn)激勵(lì)向量校準(zhǔn)步驟還包括通過利用所述輸入速率編解碼器經(jīng)編碼LPC系數(shù)中的至少一個(gè)將所述輸入速率編解碼器重構(gòu)激勵(lì)向量轉(zhuǎn)換為合成話音向量；通過至少利用所述經(jīng)量化的輸出速率編解碼器LPC系數(shù)將所述合成話音向量轉(zhuǎn)換回經(jīng)校準(zhǔn)的激勵(lì)向量；以及傳送用于激勵(lì)空間映射分析和經(jīng)濾波的激勵(lì)空間映射分析的目標(biāo)信號(hào)的所述經(jīng)校準(zhǔn)的激勵(lì)向量。
36.如權(quán)利要求33所述的方法，其中所述控制信號(hào)是基于選中的速率轉(zhuǎn)換映射策略的計(jì)算資源特性來提供的。
37.如權(quán)利要求33所述的方法，還包括在切換模塊處接收所述控制信號(hào)，所述切換模塊被耦合到可進(jìn)行操作以執(zhí)行所述映射策略的多個(gè)元件中的每一個(gè)。
38.如權(quán)利要求33所述的方法，其中所述多個(gè)映射策略中的至少一個(gè)是從存儲(chǔ)器中的庫提供的。
39.如權(quán)利要求34所述的方法，還包括利用線性變換過程轉(zhuǎn)換所述LSP系數(shù)中的至少一個(gè)。
40.如權(quán)利要求1所述的裝置，還包括用于改變所述速率轉(zhuǎn)換策略以提供在有負(fù)載的情況下適應(yīng)于可用計(jì)算資源并允許適度質(zhì)量降低的機(jī)制的元件。
41.如權(quán)利要求1所述的裝置，還包括靜默幀代碼轉(zhuǎn)換單元，其可進(jìn)行操作以執(zhí)行從輸入速率活動(dòng)話音格式到輸出靜默幀的靜默幀迅速轉(zhuǎn)換和從輸入靜默幀到輸出所需速率活動(dòng)話音幀的靜默幀迅速轉(zhuǎn)換中的至少一個(gè)，其中包括舒適噪聲參數(shù)的映射。
42.如權(quán)利要求1所述的裝置，還包括用于激勵(lì)映射的元件，其可操作以在不回到話音信號(hào)域的情況下被執(zhí)行。
全文摘要
用于通過多速率語音編碼器對(duì)數(shù)據(jù)比特流進(jìn)行速率轉(zhuǎn)換的方法和裝置，其將表示根據(jù)第一速率的第一語音壓縮方法編碼的數(shù)據(jù)幀的比特流轉(zhuǎn)換成根據(jù)第二速率的第二語音壓縮方法。速率轉(zhuǎn)換對(duì)包括語音壓縮參數(shù)映射模塊。速率轉(zhuǎn)換方法包括在輸入點(diǎn)對(duì)經(jīng)編碼的分組進(jìn)行比特拆包或去量化以獲得根據(jù)第一速率語音壓縮方法的速率信息和語音壓縮參數(shù)。關(guān)于第一速率和所需輸出速率(即第二速率類型)的信息以及外部控制命令隨后被用于確定速率轉(zhuǎn)換對(duì)的轉(zhuǎn)換策略。接下來，第一速率的壓縮參數(shù)中至少一些被直通，或者以與第二速率語音壓縮方法兼容的方式被映射到第二速率的壓縮參數(shù)。
文檔編號(hào)G10L19/00GK1954366SQ200580015171
公開日2007年4月25日申請(qǐng)日期2005年5月10日優(yōu)先權(quán)日2004年5月11日
發(fā)明者馬爾萬·A·賈布里, 王建偉, 薩梅·喬治申請(qǐng)人:達(dá)麗星網(wǎng)絡(luò)有限公司

完整全部詳細(xì)技術(shù)資料下載