專利名稱:語音解碼器和一種語音解碼方法
技術(shù)領(lǐng)域:
本發(fā)明一般涉及對數(shù)字化編碼語音進(jìn)行解碼的技術(shù)。特別是,本發(fā)明涉及從窄頻帶編碼輸入信號產(chǎn)生寬頻帶解碼輸出信號的技術(shù)。
數(shù)字電話系統(tǒng)傳統(tǒng)上依賴于具有固定采樣率的標(biāo)準(zhǔn)化語音編碼和解碼程序,以保證在隨意選取的發(fā)射機(jī)一接收機(jī)對之間的兼容性。第二代數(shù)字蜂窩網(wǎng)的發(fā)展和它們的功能上增強(qiáng)的終端已經(jīng)導(dǎo)致這樣一種狀況,即關(guān)于采樣率的完全一對一的兼容性不可能被保證,也就是在發(fā)射終端中的語音編碼器可以使用與終端中語音解碼器的輸出采樣率不同的輸入采樣率。由于復(fù)雜性的制約也可以對具有比實際輸入信號窄的頻帶的信號實施對原始語音信號的線性預(yù)測或LP分析。一種先進(jìn)的接收終端的語音解碼器必須能夠產(chǎn)生具有比在分析中所用的頻帶寬的LP濾波器并從窄頻帶輸入?yún)?shù)產(chǎn)生寬帶輸出信號。從現(xiàn)有的窄帶信息產(chǎn)生寬帶LP濾波器也有較寬的適用性。
圖1說明用于將窄帶編碼語音信號變換成寬帶解碼樣本流的一種已知的原理,可用在具有高采樣率的語音合成中。在發(fā)送端,原始語音信號已經(jīng)在方框101中經(jīng)受過低通濾波(LPF)。在低頻子帶上得到的信號已在窄帶編碼器102中編碼。在接收端,將該編碼信號送入窄帶解碼器103。它的輸出是表示具有較低采樣率的低頻子帶的樣本流。為了增加采樣率,將該信號送入采樣率內(nèi)插器104。
通過從方框103采用LP濾波器(未分開示出)估計從該信號中失去的較高頻率并利用它作為聲碼器105的一部分實現(xiàn)LP濾波器,該聲碼器105使用白噪聲信號作為它的輸入。換句話說,在低頻子帶中的LP濾波器頻響曲線在頻率軸方向中被延伸,以便在合成產(chǎn)生高頻子帶的生成中覆蓋較寬的頻帶。調(diào)節(jié)該白噪聲的功率,使得該聲碼器輸出的功率是適當(dāng)?shù)?。聲碼器105的輸出在方框106中被高通濾波(HPF)以防止與低頻子帶上的實際語音信號過多的重迭。在相加方框107中將該低和高頻子帶組合,將該組合送到語音合成器(未示出)用以產(chǎn)生最后的聲頻輸出信號。
我們可以考慮一種示范性的情況,其中語音信號的原始采樣率為12.8KHz,在解碼器輸出上的采樣率應(yīng)為16KHz。對于從0到6400Hz的頻率,也就是從零到奈奎斯特頻率已履行過LP分析,奈奎斯特頻率是原始采樣率的一半。因此,窄帶解碼器103實現(xiàn)一種其頻響從0到6400Hz的LP濾波器。為了產(chǎn)生高頻子帶,該LP濾波器的頻響在聲碼器105中被延伸,以便覆蓋從0到8000Hz的頻帶,現(xiàn)在,在其中上限是考慮所希望的較高采樣率的奈奎斯特頻率。
在低和高頻子帶之間的某種程度的重迭通常是希望的,雖然并非必要;該重迭可以幫助達(dá)到最佳的主觀聲頻質(zhì)量。讓我們假定目標(biāo)定為重迭10%。這意味著在窄帶解碼器103中使用LP濾波器的整個頻響0到6400Hz(當(dāng)采樣率Fs=12.8KHz時也就是0-0.5Fs),在聲碼器105中有效使用的只有LP濾波器頻響的5600到8000Hz(當(dāng)采樣率Fs=16KHz時也就是0.35Fs-0.5Fs)。在此“有效地”意思是由于高通濾波器106的存在,頻響的低端并不影響高端信號處理分支的輸出。在5600到8000Hz范圍內(nèi)寬帶LP濾波器的頻響是4480到6400Hz范圍內(nèi)窄帶LP濾波器的頻響的被展寬的復(fù)制品。
窄帶LP濾波器的頻響在靠近原始的奈奎斯特頻率的高端區(qū)域中有峰值的情況下,現(xiàn)有技術(shù)方案的缺陷變得顯著了。圖2用作說明這樣一種情況。細(xì)曲線201表示0到8000Hz LP濾波器的頻響??捎糜诜治鼍哂胁蓸勇?6KHz的語音信號。粗曲線202表示圖1的方案將產(chǎn)生的組合頻響。在4480Hz和6400Hz上的虛線203和204分別將窄帶LP濾波器頻響的部分定界線,在聲碼器中實施的寬帶LP濾波器中被復(fù)制并展寬到5600Hz到8000Hz的間隔內(nèi)。在窄帶頻響中近似4400Hz處的峰值和由此趨向頻帶上限的連續(xù)下坡使得組合頻響曲線202與理想的寬帶LP濾波器的頻響201顯著地不同。
為了實現(xiàn)圖1的原理克服上面提出的缺陷,已知各種各樣現(xiàn)有技術(shù)的方案。專利公布US 5,978,759公開了一種設(shè)備,使用一種編碼簿或查找表將窄帶語音展寬為寬帶語音。一組表征窄帶LP濾波器的參數(shù)被抽出,并作為對查找表的一個搜查密鑰,使相應(yīng)的寬帶LP濾波器的特征參數(shù)可從查找表中的匹配的或接近匹配的項目(cntry)讀出。從專利公布號JP 10124089A知道一種類似的解決方案。從專利公布號US 5,455,888知道一種稍有不同的方法,其中通過使用一種濾波器組產(chǎn)生較高的頻率,而該濾波器組是通過使用一種查找表選取的。專利公布號US5,581,652提出通過使用編碼簿從窄帶語音重建寬帶語音,使得信號的波形性質(zhì)被利用。另外在所公開的國際專利申請?zhí)朩O99/49454中還公開了一種方法,在其中語音信號被變換到頻率域,識別該頻率域信號的特征峰值,根據(jù)一種轉(zhuǎn)換表選取一組寬帶濾波器參數(shù)。
在搜索適當(dāng)?shù)膶拵V波器特征中使用查找表可以幫助避免圖2中所示種類的災(zāi)害,但同時引入相當(dāng)大的不靈活度?;蛘咧挥杏邢迶?shù)量的可能的寬帶濾波器可被實施,或者僅僅為此目的必須配置非常大的存儲器。增加從中選取所存儲的寬帶濾波器的數(shù)目也增加了為搜索和建立其中的正確配置必須分配的時間,在實時操作如語音電話中是不希望的。
本發(fā)明的一個目的是提出一種語音解碼器和一種用于對語音解碼的方法,其中頻帶展寬用一種靈活的方式完成,在計算上是經(jīng)濟(jì)的,并良好地仿制出原先用較寬的帶寬獲得的特性。
通過從窄帶LP濾波器產(chǎn)生寬帶LP濾波器實現(xiàn)本發(fā)明的這些目的,從而根據(jù)在窄帶LP濾波器極點(diǎn)方面的某些規(guī)律性運(yùn)用外插法。
依據(jù)本發(fā)明一種語音處理設(shè)備包括-用于接收表示第一頻帶的線性預(yù)測編碼的語音信號的輸入。
-用于從線性預(yù)測編碼的語音信號抽取描述與第一頻帶有關(guān)的第一線性預(yù)測濾波器的信息的裝置,和-用于將輸入信號變換成表示第二頻帶的輸出信號的聲碼器其特征在于包括-根據(jù)描述第一線性預(yù)測濾波器的信息產(chǎn)生在第二頻帶上由聲碼器使用的第二線性預(yù)測濾波器的裝置。
本發(fā)明也適用于數(shù)字無線電話,其特征在于它包括至少一種上述種類的語音處理設(shè)備。
另外,本發(fā)明適用于一種包括以下步驟的語音解碼方法-從線性預(yù)測編碼語音信號抽取描述與第一頻帶有關(guān)的第一線性預(yù)測濾波器的信息,和-將輸入信號變換成表示第二頻帶的輸出信號其特征在于它包括以下步驟-根據(jù)描述與第一頻帶有關(guān)的第一線性預(yù)測濾波器所抽取的信息,產(chǎn)生在將輸入信號變換成輸出信號中使用的第二線性預(yù)測濾波器。
對于LP濾波器存在幾種眾所周知的表示形式。特別是已知一種所謂的頻率域表示法,在其中一個LP濾波器可以用一個LSF(LineSpectral Frequency)向量或一個ISF(Immettance SpectralFrequency)向量表示。頻率域表示法具有與采樣率無關(guān)的優(yōu)點(diǎn)。
依據(jù)本發(fā)明一個窄帶LP濾波器被動態(tài)地用作通過外插法構(gòu)成一個寬帶LP濾波器的基礎(chǔ)。特別是本發(fā)明包含將窄帶LP濾波器變換成頻率域表示并通過將頻率域表示的窄帶LP濾波器外插形成頻率域表示的寬帶LP濾波器。最好一種足夠高階的IIR(Infinite ImpulseResponse)濾波器被用于外插,以便利用表征窄帶LP濾波器的規(guī)律性。寬帶LP濾波器的階最好這樣選取,使寬帶和窄帶LP濾波器階的比率基本上等于寬帶和窄帶采樣頻率之比。對于IIR濾波器需要一組系數(shù)最好通過分析反映窄帶LP濾波器向量表示中相鄰元素之間的差的差向量自相關(guān)來得到。
為了保證寬帶LP濾波器在靠近奈奎斯特頻率處不產(chǎn)生過多的放大,對寬帶LP濾波器的向量表示的最后的元素設(shè)置某些限制是有利的。特別是在向量表示中的最后的元素和與采樣頻率成比例的奈奎斯特頻率之間的差應(yīng)該保持接近相同。很容易通過微分的定義規(guī)定這些限制,使得向量表示中相鄰元素之間的差受到控制。
在所附的權(quán)利要求中具體地陳述了作為本發(fā)明特征的新特征。然而通過以下結(jié)合附圖的特定實施方案的描述,本發(fā)明本身無論關(guān)于它的結(jié)構(gòu)還是它的操作方法以及它的附加的目的和優(yōu)點(diǎn)都將得到最好的理解。
圖1示出一種已知的語音解碼器。
圖2示出一種已知的寬帶LP濾波器的不利的頻響。
圖3a用作說明本發(fā)明的原理。
圖3b用作說明將圖3a的原理應(yīng)用到一種語音解碼器中。
圖4示出圖3b方案的細(xì)節(jié)。
圖5示出圖4方案的細(xì)節(jié)。
圖6示出依據(jù)本發(fā)明的一種LP濾波器的有利的頻響,和圖7示出一種依據(jù)本發(fā)明的實施方案的數(shù)字無線電話。
圖1和2已經(jīng)在先前技術(shù)的描述中作了描述,所以以下的本發(fā)明和它的有利的實施方案的描述集中到圖3a到6上。相同的參考標(biāo)記用于附圖中類似的部件。
圖3a用作說明在抽取方框310中使用窄帶輸入信號抽取窄帶LP濾波器的參數(shù)。窄帶LP濾波器參數(shù)被帶入外插方框301,在其中使用外插產(chǎn)生相應(yīng)的寬帶LP濾波器的參數(shù)。這些參數(shù)被帶入聲碼器105。聲碼器使用某種寬帶信號作為它的輸入。聲碼器105從這些參數(shù)產(chǎn)生寬帶LP濾波器,并利用它們將寬帶輸入信號變換成寬帶輸出信號。抽取方框310也可給出輸出,它是一種窄帶輸出。
圖3b示出如何可把圖3a的原理應(yīng)用到一種其他的已知的語音解碼器中。在圖1和圖3b之間的比較示出將本發(fā)明引入用于變換窄帶編碼語音信號為寬帶解碼樣本流與其他已知的原理相比的添加內(nèi)容。本發(fā)明并不影響發(fā)送端原始的語音信號在方框101中被低通濾波,在低頻子帶上所得到的信號在窄帶編碼器102中被編碼。在接收端中較低的分支也可以是相當(dāng)一致的編碼信號被送入窄帶解碼器103,為了增加低頻子帶輸出的采樣率,信號被帶入采樣率內(nèi)插器104。然而,在方框103中所用的窄帶LP濾波器并未被直接帶入聲碼器105,而是帶入外插方框301,在其中產(chǎn)生寬帶LP濾波器。
在低頻子帶中LP濾波器的頻響曲線并未被簡單地延展來覆蓋較寬的頻帶不是被用作對任何以前產(chǎn)生的寬帶LP濾波器庫的一種搜索密鑰的窄帶LP濾波器特性。在方框301中實施的外插意味著產(chǎn)生一種唯一的寬帶LP濾波器,并不只從一組選擇物中選擇最接近的匹配值。在這種意義上講這是一種真正的自適應(yīng)方法,即通過選擇一種適當(dāng)?shù)耐獠逅惴?。保證在每個窄帶LP濾波器輸入和相應(yīng)的寬帶LP濾波器輸出之間的唯一關(guān)系是可能的。即使事先作為輸入信息將遇到的窄帶LP濾波器的有關(guān)信息了解甚少,外插法也工作。這是對于基于查找表的所有的解決方案一個明顯的優(yōu)點(diǎn),因為只有當(dāng)或多或少對它有了解時,才能構(gòu)成這樣的表,而窄帶LP濾波器將落在這些目錄中。另外,依據(jù)本發(fā)明的外插法只需要有限數(shù)量的存儲器,因為只有算法本身才需要被存儲。
在生成合成產(chǎn)生的高頻子帶中使用從方框301獲得的寬帶LP濾波器可以遵循從先前技術(shù)得知的模式。白噪聲被作為輸入數(shù)據(jù)送入聲碼器105,在產(chǎn)生表示高頻子帶的樣本流中使用寬帶LP濾波器。白噪聲的功率被調(diào)節(jié),使得聲碼器輸出的功率是合適的。在方框106中聲碼器105的輸出被高通濾波,在相加方框107中低和高頻子帶被組合。組合結(jié)果準(zhǔn)備給語音合成器(未示出)用以產(chǎn)生最終的聲頻輸出信號。
圖4示出一種實現(xiàn)外插方框301的示范性方法。LP到LSF變換方框401將從解碼器103獲得的窄帶LP濾波器變換到頻率域。由外插方框402在頻率域中完成實際的外插。它的輸出被連到LSF到LP變換方框403,與在方框401中完成的變換相比,它實施一種逆變換。另外在方框403的輸出和聲碼器105的控制輸入之間連接一個增益控制器方框403,它的任務(wù)是將寬帶LP濾波器的增益定標(biāo)到適當(dāng)?shù)乃健?br>
圖5說明實現(xiàn)外插器402的一種示范性方法。它的輸入被連到LP到LSF變換方框401的輸出,所以作為對外插器402的一個輸入得到窄帶LP濾波器的向量表示fn。為了實施外插,通過分析濾波器產(chǎn)生器方框501中的向量fn生成外插濾波器。濾波器也可用一個向量描述,在此被標(biāo)記為向量b。通過使用在方框501中生成的濾波器,窄帶LP濾波器的向量表示fn在方框502中被變換為寬帶LP濾波器的向量表示fw。最后,為了保證寬帶LP濾波器在靠近對于較高采樣率的奈奎斯特頻率處不包含過多的放大,在將寬帶LP濾波器遞交到LSF到LP變換方框403以前,在方框503中需經(jīng)受某些限制性的功能的作用。
現(xiàn)在我們將提供在以上圖4和5中引入的各種功能方框內(nèi)實施的操作的詳細(xì)分析。作為一個事實,在對窄帶語音信號解碼過程中解碼器103實現(xiàn)并使用一個LP濾波器。LP濾波器被指定為窄帶LP濾波器,并通過一組LP濾波器系數(shù)為表征。同樣也是一個事實,即實際上所有高質(zhì)量語音解碼器(和編碼器)使用某些稱為LSF或ISF的向量將LP濾波器系數(shù)量子化,所以在功能上如圖4中方框401所示的LP到LSF變換甚至可以是解碼器103的一部分。在整個這份描述中為了一致起見我們談?wù)揕SF向量,但對于本領(lǐng)域的技術(shù)人員是明確的,本描述也適用于使用ISF向量。
LSF向量可被表示在余弦域中,在其中向量實際上被稱為LSP(Line Spectral Pair)向量,或者被表示在頻率域中。余弦域表示法(LSP向量)與采樣率有關(guān)但頻率域表示法則不同,所以如果,例如解碼器103是某種現(xiàn)有的語音解碼器,在其中只提供LSP向量作為對外插方框301的輸入信息,最好將LSP向量首先變換成LSF向量。依據(jù)已知的公式很容易完成變換fn(i)=arccos(qn(i))Fs.nπ,i=0,...,nn-1.---(1)]]>其中下標(biāo)n一般表示“窄帶”,fn(i)是窄帶LSF向量的第i個元素,gn(i)是窄帶LSF向量的第i個元素,fs、n是窄帶采樣率,nn是窄帶LP濾波器的階數(shù)。遵照LSP和LSF向量的定義,nn也是在窄帶LSP和LSF向量中元素的數(shù)目。
在圖3b,4和5所示的實施方案中,通過使用在方框501中生成的L階外插濾波器在方框502中進(jìn)行實際的外插。目前我們只假定方框501提供方框502一個濾波器向量b;隨后我們將回到產(chǎn)生濾波器向量。用于產(chǎn)生寬帶LSF向量fw的一個有利的公式是 其中下標(biāo)w一般表示“寬帶”fw(i)是寬帶LSF向量的第i個元素,k是相加指數(shù),L是外插濾波器的階數(shù),b(i-1)-k)是外插濾波器向量的第((i-1)-k)個元素。換句話說,與窄帶LSF向量中的元素數(shù)目一樣多,這在寬帶LSF向量的開頭是精確地相同的。在寬帶LSF向量中的其余的元素被這樣計算,使得每個新元素是在寬帶LSF向量中以前的L個元素的加權(quán)和。在卷積順序中權(quán)重是外插濾波器向量的元素,使得在計算fw(i)中,對于和作貢獻(xiàn)最遠(yuǎn)的以前的元素fw(i-L)被用b(L-1)加權(quán),對于和作貢獻(xiàn)最近的以前的元素fw(i-1)被用b(o)加權(quán)。
外插公式(2)并不限制nw的值,也就是寬帶LP濾波器的階數(shù)。為了保持外插的精確度,這樣選擇nw的值是有利的,使得nw=nnFs.wFs.n.---(3)]]>意思是LP濾波器的階數(shù)是按照采樣頻率的相對大小定標(biāo)的。
寬帶LP濾波器在接近奈奎斯特頻率0.5Fs.w的頻率上不應(yīng)該產(chǎn)生過多的放大的要求可藉助于每個LP濾波器向量的最后的元素和相應(yīng)的奈奎斯特頻率之間的差進(jìn)行公式化,其中差值被進(jìn)一步用采樣頻率定標(biāo),依據(jù)公式0.5Fs.w-fw(nw-1)Fs.w≥0.5Fs.n-fn(nn-1)Fs.n.---(4)]]>以上給出的對寬帶LP濾波器的限制(3)和(4)限定了nw的選擇和外插濾波器的定義。如何精確地實施這些限定是一件例行的工作站實驗的問題。一種有利的方法是規(guī)定一個差向量D,使得D(k)=fw(k)-fn(k-1),k=nn.....nn-1 (5)為了用某種方式限制差向量,例如,通過要求在差向量D中沒有元素D(k)可以大于預(yù)先確定的限制值,或者差向量D的平方元素(D(k)2)之和不可以大于預(yù)定確定的限制值來達(dá)到。LP濾波器典型情況下具有低或高通濾波器特性,而不是帶通或帶阻濾波器特性。預(yù)先確定的限制值可用這樣一種方式與這個事實有關(guān)系,即如果窄帶LP濾波器具有低通濾波器特性,則限制值被增加,否則,如果窄帶LP濾波器具有高通濾波器特性,則限制值被減小。其他涉及差向量D的可采用的限制很容易被本領(lǐng)域的技術(shù)人員想出來。
接著我們將描述產(chǎn)生濾波器向量b的某些有利的方法。LP濾波器極點(diǎn)的位置趨向于相互具有某種相關(guān)性,使得差向量D,它的元素描述相鄰LP向量元素之間的差,包含某種規(guī)律性。我們可以計算自相關(guān)函數(shù)。ACD(k)=Σi=knn(D(i)-μD)(D(i-k)-μD),k=1,...,L---(6)]]>其中μD=Σi=1nD(i)nn---(7)]]>并找出它的最大值,也就是產(chǎn)生最高自相關(guān)度的指數(shù)k的值。我們可以將這個指數(shù)k的值標(biāo)記為m。那末一種定義濾波器向量D的有利的方法為 濾波器向量b用這種方式遵循窄帶LP濾波器的規(guī)律性。甚至外插的寬帶LP濾波器的新元素通過在外插步驟中使用濾波器b繼承了這種特性。
自相關(guān)函數(shù)(6)不具有明顯的最大值自然是可能的。為了考慮這些情況我們可以規(guī)定外插濾波器向量b必須按照它們的重要性模擬窄帶LP濾波器中所有的規(guī)律性。自相關(guān)可被用作這樣一種定義的媒介物,例如依據(jù)公式 如果在自相關(guān)函數(shù)中有明顯的最大值峰值,比較通用的定義(9)向以上給出的較簡單的定義收斂。
寬帶LP濾波器的LSF向量表示式準(zhǔn)備被變換成實際的寬帶LP濾波器,它可被用于處理具有采樣率Fs.w的信號。對于寬帶LP濾波器的LSP向量表示式是優(yōu)選的情況。可依據(jù)以下的公式實現(xiàn)LSF到LSP的變換qw(i)=cos(fw(i)πFs.w),i=0,...,nw-1.---(10)]]>應(yīng)該指出,實施變換(10)所進(jìn)入的余弦域具有奈奎斯特頻率為0.5Fs.w,而由此完成窄帶變換(1)的余弦域具有奈奎斯特頻率為0.5Fs.n。
所獲得的寬帶LP濾波器的總增益必須用從先前技術(shù)的解決方案已知的方法進(jìn)行調(diào)節(jié)。如圖4中子方框404所示的那樣,可以在外插方框301中進(jìn)行對增益的調(diào)節(jié),或者可以是聲碼器105的一部分。作為與圖1的先前技術(shù)解決方案的一個差別,可以指出,依據(jù)本發(fā)明產(chǎn)生的寬帶LP濾波器的總增益可以允許大于先前技術(shù)寬帶LP濾波器的總增益,因為象圖2中所示的那樣與理想響應(yīng)大的偏差不可能發(fā)生因而也不需要防衛(wèi)。
圖6示出一種利用由依據(jù)本發(fā)明的外插法產(chǎn)生的寬帶LP濾波器可以得到的典型的頻響601。頻響601非常緊密地跟隨理想曲線201,該理想曲線201表示0到8000Hz LP濾波器的頻響,可被用在對具有采樣率16KHz的語音信號的分析中。外插法趨向于非常精確地模擬幅度譜的較大尺度的趨勢,正確地確定頻響中峰值的位置。本發(fā)明對于圖1和2中所示的先前技術(shù)方案的一個重大的優(yōu)點(diǎn)也在于寬帶LP濾波器的頻響是連續(xù)的,也就是它并沒有任何象在先前技術(shù)寬帶LP濾波器的頻響中5600Hz處那樣的瞬時的幅度變化。
為了將本發(fā)明的精神轉(zhuǎn)化為對使用人可想像到的優(yōu)點(diǎn),單單一個語音解碼器是不夠的。圖7示出一種數(shù)字無線電話,其中天線701被連到一個雙工濾波器702,依次既連到一個接收方框703又連到一個發(fā)送方框704,用于在在無線電界面上接收和發(fā)送數(shù)字化的編碼語音。接收方框703和發(fā)送方框704都被連到一個控制器方框704,分別用于傳遞接收到的控制信息和要發(fā)送的控制信息。另外,接收方框703和發(fā)送方框704被連到一個基帶方框705,它包括分別用于處理接收到的語音和要發(fā)送的語音的基帶頻率的功能。基帶方框705和控制器方框707被連到一個用戶接口706,典型情況下由一個話筒,一個揚(yáng)聲器,一個鍵板和一個顯示器組成(未在圖7中專門示出)。
圖7中較詳細(xì)地示出基帶方框705的一部分。接收方框703的最后部分是一個信道解碼器,它的輸出由信道解碼的語音幀組成,需要經(jīng)受語音解碼和合成。從信道解碼器獲得的語音幀被暫時存儲在幀緩存器710中,并由此讀到實際的語音解碼器711。后者實施從存儲器712讀出的語音解碼算法。依據(jù)本發(fā)明,當(dāng)語音解碼器711發(fā)覺輸入的語音信號的采樣率應(yīng)該提高,就采用以上描述的LP濾波器外插方法產(chǎn)生在生成合成產(chǎn)生的高頻子帶中需要的寬帶LP濾波器。
典型情況下基帶方框705是一個比較大的ASIC(ApplicationSpecific Integrated circuit)。本發(fā)明的使用有助于降低ASIC的復(fù)雜性和功率消耗。因為為了使用語音解碼器只需要有限數(shù)量的存儲器和部分?jǐn)?shù)量的存儲器存取,尤其是當(dāng)與那些先前技術(shù)解決方案相比較時,它們?yōu)榱舜鎯Ω鞣N各樣的預(yù)先計算的寬帶LP濾波器,要使用很大的查找表。本發(fā)明并不對ASIC的性能提出過多的要求,因為以上所描述的計算是比較容易實施的。
權(quán)利要求
1.一種語音處理設(shè)備,包括-用于接收表示第一頻帶的線性預(yù)測編碼語音信號的輸入。-用于從線性預(yù)測編碼語音信號抽取描述與第一頻帶有關(guān)的第一線性預(yù)測濾波器的信息的裝置(103,310)和-用于將輸入信號變換為表示第二頻帶的輸出信號的聲碼器(105),其特征在于它包括-用于根據(jù)描述第一線性預(yù)測濾波器的信息生成由聲碼器(105)在第二頻帶上使用的第二線性預(yù)測濾波器的裝置(301)。
2.一種依據(jù)權(quán)利要求1的語音處理設(shè)備,其特征在于它包括-用于將描述第一線性預(yù)測濾波器的信息變換成頻率域中的第一參數(shù)表達(dá)式的裝置(401),-用于將所述的第一參數(shù)表達(dá)式外插成頻率域中的第二參數(shù)表達(dá)式的裝置(402),和-用于將所述的第二參數(shù)表達(dá)式變換成第二線性預(yù)測濾波器的裝置(403)。
3.一種依據(jù)權(quán)利要求2的語音處理設(shè)備,其特征在于所述的用于將所述的第一參數(shù)表達(dá)式外插成頻率域中第二參數(shù)表達(dá)式的裝置(402)包括一個無限脈沖響應(yīng)濾波器(502)。
4.一種依據(jù)權(quán)利要求3的語音處理設(shè)備,其特征在于它包括用于從所述的第一參數(shù)表達(dá)式導(dǎo)出所述的無限脈沖響應(yīng)濾波器的向量表達(dá)式的裝置(501)。
5.一種依據(jù)權(quán)利要求2的語音處理設(shè)備,其特征在于它包括用于限制所述的第二參數(shù)表達(dá)式的裝置(404,503)。
6.一種依據(jù)權(quán)利要求1的語音處理設(shè)備,其特征在于它包括-用于將線性預(yù)測編碼語音信號變換成具有第一采樣率和表示第一頻帶的第一樣本流的解碼器(103)。-用于將輸入信號變換成具有第二采樣率和表示第二頻帶的第二樣本流的聲碼器(105)。-用于將第一和第二樣本流以所處理的形式組合的組合裝置(107),和-用于根據(jù)由解碼器(103)在第一頻帶上使用的第一線性預(yù)測濾波器生成由聲碼器(105)在第二頻帶上使用的第二線性預(yù)測濾波器的裝置(301)。
7.一種依據(jù)權(quán)利要求6的語音處理設(shè)備,其特征在于它包括-連接在解碼器(103)和組合裝置(107)之間的采樣率內(nèi)插器(104),和-連接在聲碼器(105)和組合裝置(107)之間的高通濾波器(106)。
8.一種數(shù)字無線電話,其特征在于它包括一種依據(jù)權(quán)利要求1的語音處理設(shè)備(711)。
9.一種用于處理數(shù)字編碼語音的方法,包括以下步驟-從線性預(yù)測編碼語音信號抽取(103)描述與第一頻帶有關(guān)的第一線性預(yù)測濾波器的信息,和-將輸入信號變換(105)成表示第二頻帶的輸出信號,其特征在于它包括以下步驟-根據(jù)所抽取的描述與第一頻帶有關(guān)的第一線性預(yù)測濾波器的信息,生成(301)在將輸入信號變換成輸出信號中要使用的第二線性預(yù)測濾波器。
10.一種依據(jù)權(quán)利要求9的方法,包括以下步驟-將線性預(yù)測編碼語音信號變換(103)成具有第一采樣率和表示第一頻帶的第一樣本流。-將輸入信號變換成(105)具有第二采樣率和表示第二頻帶的第二樣本流,和-將第一和第二樣本流以所處理的形式組合(107),其特征在于它包括以下步驟-根據(jù)由解碼器在第一頻帶上使用的第一線性預(yù)測濾波器,生成由聲碼器在第二頻帶上使用的第二線性預(yù)測濾波器。
11.一種依據(jù)權(quán)利要求10的方法,其特征在于它包括以下步驟-將第一線性預(yù)測濾波器變換(401)成頻率域中的第一參數(shù)表達(dá)式。-將所述的第一參數(shù)表達(dá)式外插(402)成頻率域中的第二參數(shù)表達(dá)式,和-將所述的第二參數(shù)表達(dá)式變換(403)成第二線性預(yù)測濾波器。
12.一種依據(jù)權(quán)利要求10的方法,其特征在于將所述的第一參數(shù)表達(dá)式外插(402)為頻率域中第二參數(shù)表達(dá)式的步驟包括利用一個無限脈沖響應(yīng)濾波器對所述的第一參數(shù)表達(dá)式濾波器(502)的子步驟。
13.一種依據(jù)權(quán)利要求12的方法,其特征在于它包括從所述的第一參數(shù)表達(dá)式中觀察到的規(guī)律性計算(501)對于所述的無限脈沖響應(yīng)的向量表達(dá)式的步驟。
14.一種依據(jù)權(quán)利要求13的方法,其特征在于將所述的第一參數(shù)表達(dá)式外插(402)為頻率域中第二參數(shù)表達(dá)式的步驟包括按以下公式確定(502)所述的第二參數(shù)表達(dá)式的值的子步驟 其中fw(i)是所述的第二參數(shù)表達(dá)式的第i個值,k是相加指數(shù),L是所述的無限脈沖響應(yīng)濾波器的階數(shù)和b((i-1)-k)是對于所述的無限脈沖響應(yīng)濾波器的向量表達(dá)式中第((i-1)-k)個元素。
15.一種依據(jù)權(quán)利要求14的方法,其特征在于它包括計算(501)對于所述的無限脈沖響應(yīng)濾波器的向量表達(dá)式的子步驟,使得 和m是指數(shù)k的值,產(chǎn)生自相關(guān)函數(shù)的最大值A(chǔ)CD(k)=Σi=kn(D(i)-μD)(D(i-k)-μD),k=1,......,L]]>其中μD=Σi=1nD(i)nn,]]>D(k)=fn(k)-fn(k-1),k=0,...nn-1。fn(i)是第一參數(shù)表達(dá)式的第i個元素。nn是第一參數(shù)表達(dá)式中的元素數(shù)目。
16.一種依據(jù)權(quán)利要求14的方法,其特征在于它包括計算(501)對于所述的無限脈沖響應(yīng)濾波器的向量表達(dá)式的子步驟,使得 其中ACD(k)=Σi=kn(D(i)-μD)(D(i-k)-μD).k=1,...,L.]]>μD=Σi=1nD(i)nn.]]>D(k)=fn(k)-fn(k-1),k=0,...nn-1。fn(i)是第一參數(shù)表達(dá)式的第i個元素,nn是第一參數(shù)表達(dá)式中的元素的數(shù)目。
17.一種依據(jù)權(quán)利要求14的方法,其特征在于它包括限制(503)所述的第二向量表達(dá)式以滿足以下條件的步驟nn≈nnFs.wFs.n]]>和0.5Fs.n-fw(nw-1)Fs.w≥0.5Fs.n-fn(nn-1)Fs.n.]]>其中nw是第二參數(shù)表達(dá)式中的元素數(shù)目,nn是第一參數(shù)表達(dá)式中的元素數(shù)目,F(xiàn)s.w是第二采樣頻率,F(xiàn)s.n是第一采樣頻率,fn(i)是第一參數(shù)表達(dá)式中第i個元素,fw(i)是第二參數(shù)表達(dá)式中第i個元素。
全文摘要
一種語音解碼器包括一個解碼器(103),用于將線性預(yù)測編碼語音信號變換成具有第一采樣率和表示第一頻帶的第一樣本流。另外,它包括一個聲碼器(105),用于將輸入信號變換成具有第二采樣率和表示第二頻帶的第二樣本流,和組合裝置(107),用于按被處理的形式組合第一和第二樣本流。它也包括裝置(301),用于根據(jù)解碼器(103)在第一頻帶上使用的第一線性預(yù)測濾波器生成由聲碼器(105)在第二頻帶上使用的第二線性預(yù)測濾波器。通過無限脈沖響應(yīng)濾波器外插是生成第二線性預(yù)測濾波器的優(yōu)選方法。
文檔編號G10L19/16GK1416561SQ01806171
公開日2003年5月7日 申請日期2001年3月6日 優(yōu)先權(quán)日2000年3月7日
發(fā)明者J·羅托拉-普基拉, J·韋尼奧, H·米科拉 申請人:諾基亞有限公司