欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

綜合分析語音編碼方法

文檔序號:2820023閱讀:228來源:國知局

專利名稱::綜合分析語音編碼方法
技術(shù)領(lǐng)域
:本發(fā)明涉及綜合分析語音編碼。本申請公司已在它的歐洲專利申請第0195487,0347307和0469997號中,特別描述了這種已開發(fā)的語音編碼。在綜合分析語音編碼器中,為了獲得模型化聲音區(qū)域的傳送函數(shù)的短期合成濾波器系數(shù),執(zhí)行一個語音信號的線性預測。這些系數(shù)和具有用于激勵短期合成濾波器特性的參數(shù)一起被傳送到譯碼器。在當前的大多數(shù)編碼器中,為了重視語音音調(diào)的長期綜合濾波器的特性,也要尋找語音信號的長期相互關(guān)系。當信號被話音化時,這種激勵實際上包括一個可以由過去的激勵表示的推斷成份,由語音信號TP取樣延遲以及受到增益gp控制。長期綜合濾波器也在譯碼器中設(shè)置,且具有一個1/B(z)形式的傳遞函數(shù),其中B(z)=1-gp·z-TP。其余部分,激勵的不可預測部分稱為隨機的激勵。在稱為CELP(激勵編碼的線性預測)編碼器的編碼器中,隨機激勵包括在預定字典中查找到的矢量。在稱為MPLPC(“多脈沖線性預測編碼”)編碼器的編碼器中,隨機激勵包括一定的由編碼器查尋位置脈沖的數(shù)量。通常,CELP編碼器更適用于低數(shù)據(jù)傳輸速度,但它比MPLPC編碼器執(zhí)行起來更復雜。為了確定長期預測的延遲,常使用一個閉合環(huán)路分析,它有助于直接減少在語音信號和合成信號之間感知加權(quán)的不同。這個閉合環(huán)路分析的缺點是它依據(jù)計算總量的要求,因為一個延遲的選擇含有對一定數(shù)量的候選延遲的估計,一個延遲的每個估算要求對感知加權(quán)合成濾波器的延遲激勵和脈沖響應間的卷積結(jié)果的計算。上述的缺點對隨機激勵的查尋也存在,它也是一個閉合回路過程,在這個過程中,包括與這個脈沖響應的卷積的結(jié)果。這個激勵比短期合成濾波器的頻譜參數(shù)特性變化得更快。這個激勵(預測的和隨機的)可以每5ms子幀被典型地確定一次,而頻譜參數(shù)每20ms幀被確定一次。就有關(guān)語音編碼器中所需的計算速度而言,對激勵的閉合環(huán)路查尋的復雜性和頻率使得這個階段成為最重要的部分。本發(fā)明的主要目的是就有關(guān)閉合環(huán)路分析或解析而言,提供一種減少復雜性的語音編碼方法。因此,本發(fā)明提供了一種編碼語音信號的一種綜合分析方法,這個語音信號數(shù)字化成分解為包含一個定義的采樣數(shù)量的子幀的連續(xù)幀,其中,為確定短期綜合濾波器的系數(shù),對每個幀,執(zhí)行語音信號的一個線性預測分析;為確定這幀的語音等級,對每個幀,執(zhí)行一個開環(huán)回路分析;為確定一個提交的短期綜合濾波器,產(chǎn)生一個語音信號的同步信號表征的激勵序列,對每個子幀,執(zhí)行至少一個閉合回路分析。每個閉合環(huán)路分析利用合成濾波器的脈沖響應,這個合成過程器包括短期綜合濾波器和感知加權(quán)濾波器。在每次閉合回路分析期間,用到了上述脈沖響應,把它縮短到一個縮短長度,這個長度至多等于每個子幀的采樣量,依賴上述響應的能量分配和這個幀的語音等級。通常,縮短的長度會比大多數(shù)語音幀更大??赡茉诓粨p失編碼質(zhì)量的情況下,依靠匹配語音信號的特征,減少閉合環(huán)路分析的復雜性。本發(fā)明的其它特性和優(yōu)點,將參數(shù)附圖在下述對優(yōu)選但不限制可仿效的實施例的下述描述中體現(xiàn),其中圖1是一個結(jié)合實施本發(fā)明的語音編碼器的無線通信站的框圖;圖2是一個能接收由圖1的站產(chǎn)生的信號的一個無線通信站的框圖;圖3到6是說明用在圖1的語音編碼中開環(huán)回路LTP分析的一個處理過程的流圖;圖7是說明用于確定用于圖1的語音編碼器的加權(quán)綜合濾波器過程的一個流圖;圖8到11是說明在圖1的語音編碼器中用于隨機激勵查尋過程的流圖。實施本發(fā)明的語音編碼器依賴一個數(shù)字壓縮技術(shù)的適用于不同類型的語音傳輸和/或存儲系統(tǒng),在圖1的例子中,語音編碼器16形成移動無線通信站的部分。語音信號S是一個0以典型地等于8KHz的頻率取樣的數(shù)字信號。這個信號S從送話器20接收的被放大和濾波的輸出信號通過模擬數(shù)字轉(zhuǎn)換器18輸出。轉(zhuǎn)換器18使這個語音信號S的自身子分割成1st采樣的nst子幀的連續(xù)幀的形式。一個20ms幀典型地包括以8KHz的16位1st=40采樣的nst=4個子幀。編碼器16的上數(shù)據(jù)流,語音信號S也可以用于傳統(tǒng)的形式處理,如海明濾波。語音編碼器16以實際上小于語音信號S的數(shù)據(jù)速度傳送一個二進制序列,并且把這個序列用于信道編碼器22,信道編碼器22的功能是把冗余位引入信號中,以便允許任何傳輸誤差的檢測和/或糾正。然后,信道編碼器22的輸出信號由調(diào)制器24調(diào)制成一個載波頻率,并把被調(diào)制信號傳送到在空間接口上。語音編碼器16是一個綜合分析編碼器。一方面,編碼器16確定具有模型化揚聲器的聲音區(qū)域的短期綜合濾波器特征的參數(shù),另一方面,用于短期綜合濾波器的一個激勵序列,根據(jù)感知加權(quán)準則,提供一個構(gòu)成一個語音信號S的估算值的一個綜合信號。短期綜合濾波器具有一個1/A(z)形式的傳遞函數(shù)A(Z)=1-&Sigma;i=1qai&CenterDot;z-i]]>系數(shù)ai由用于語音信號S的短期線性預測分析的模塊26確定的。ai是語音信號S的線性預測的系數(shù)。線性預測的階q典型地是階10??梢杂捎糜诙唐诰€性預測的模塊26采用的方法,這在語音編碼領(lǐng)域中已廣為人知。例如,模塊26執(zhí)行Durbin-LevinS0n算法(見J.Makhoul的“線性預測指導評論”,IEEE的1975年4月4期63卷p.561-580)。獲得的系數(shù)ai用于把它們轉(zhuǎn)換成線性頻譜參數(shù)(LSP)的模塊28。由LSP參數(shù)表示的預測參數(shù)ai頻繁用于綜合分析語音編碼器。LSP的參數(shù)是以降序排列的q數(shù)cos(2πfi),q的正?;€性頻譜頻率(LSF)f1(1≤i≤q),也就是復數(shù)exp(2πfi),其中,i=1,3,…,q-1,q+1并且fq+1=0.5,是由Q(z)=A(z)+z-(q+1)、A(z-1)定義的多項式Q(z)的根,復數(shù)exp(2πjffi),其中i=0,2,4…q和f0=0,是由Q*(z)=A(z)-z-(q+1).A(z-1)定義的多項式Q*(z)的根。LSP參數(shù)可以用切比雪夫多項式的傳統(tǒng)方法通過換算模塊28獲得(見P.Kabal和R.PRamachandran“使用Chebyshev多項式的線光譜頻率的計算”,IEEETransASSP卷346期1986年1419-1426頁)。它是由量化模塊30獲得的LSP參數(shù)的量化值,這些值被送往用來恢復短期綜合濾波器的系數(shù)ai的譯碼器。系數(shù)ai可以簡單地恢復,如下Q(Z)=(1+z-1)&Pi;i=1,3,...q-1(1-2cos(2&pi;fi)z-1+z-2)]]>Q*(z)=(1-z-1)&Pi;i=2,4,...,q(1-2cos(2&pi;fi)z-1+z-2)]]>A(z)=[Q(z)+Q*(z)]/2為了避免短期綜合濾波器的傳遞函數(shù)發(fā)生突然變化,LSP的參數(shù)用于在預測系數(shù)ai從它們中推演出來前進行插入。這個插入在信號的每幀的第一個子幀上執(zhí)行。例如,如果LSPt和LSPt-1分別表示為幀t和預測幀t-1計算的一個LSP參數(shù),那么對于幀t的子幀0,1,2,…,nst-1,LSPt(0)=0.5LSPt-1+0.5LSPt,LSPt(1)=0.25LSPt-1+0.75LSPt以及LSPt(2)=……=LSPt(nst-1)=LSPt。這個1/A(z)濾波器的系數(shù)ai在插入LSP參數(shù)的基礎(chǔ)上通過逐字幀確定。非量化的LSP參數(shù)由模塊28提供給計算一個感知加權(quán)濾波器34系數(shù)的模塊32。感知加權(quán)濾波器34具有公式W(z)=A(z/γ1)/A(z/γ2)的傳遞函數(shù),其中γ1和γ2是系數(shù),γ1>γ2>0(例如r=0.9和r2=0.6)。感知加權(quán)濾波器的系數(shù)在從模塊28接收的LSP參數(shù)插入后,由用于每子幀的模塊32計算。感知加權(quán)濾波器34接收語音信號S并傳送一個由模塊36,38,40為確定激勵序列而分解的感知加權(quán)信號SW。短期濾波器的激勵序列包括可以由模型化語音音調(diào)的一個長期綜合濾波器預測的激勵和一個非預測隨機激勵,或創(chuàng)新序列。模塊36在開環(huán)回路中,執(zhí)行一個長期預測(LTP),也就是說,它不直接用于最小化加權(quán)誤差,在這種情況下,加權(quán)濾波器34位于開環(huán)回路分析模塊的上游,但它也可以放在別處模塊36可以用傳遞函數(shù)A(z)直接操縱語音信號S,甚至通過濾波器除去與它的短期相關(guān)部分直接操縱語音信號S。另一方面,模塊38和40在閉環(huán)回路上操縱,也就是說,它直接用于最小化感知加權(quán)誤差。長期綜合濾波器具有公式1/B(z)的一個傳遞函數(shù),B(z)=1-gp·z-TP,其中,gp表示一個長期預測增益,TP表示一個長期預測延遲。這個長期預延遲可以典型地取位于rmin和rmax取樣間的值N=256。分解的分解率提供給延遲的最小值,以便避免在語音頻率方面,由于具有太多感知造成的不同。例如,使用介于rmin=21和33+5/6之間的1/6分解率,一個介于34和47+2/3的1/3分解,上介于48和88+1/2的1/2分解率,一個介于89和rmax=142的整數(shù)分解率。每個可能的延遲都由位于0和N-1=255的整數(shù)索引量化。長期預測延遲在兩個階段確定。第一階段中,開環(huán)回路LTP分析模塊36檢測語音信號的話音幀,并且為每個話音幀確定話音等級MV和一個長期預測延遲的查尋間隔。一個話音幀的話音等級MV可以取三個值1是輕話音幀,2是中話音幀,3是高話音幀。在下面使用的注示中,MV=0的話音等級用于非話音幀。查尋間隔仍賴于話音MV的等級,由其量化索引ZP和量化索引域中的寬度表示的中心值來定義。對于輕度或中度話音幀(MV=1或2),查尋間隔的寬度是N1索引,也就是說,若N1=32,則將在ZP-16和ZP+15間查尋長期預測延遲。對于高話音幀(MV=3),查尋間隔的寬度是N3索引,也就是說,若N3=16,則長期預測延遲的索引將在ZP-8和ZP+7間查尋。一但一個幀的話音等級MV已由模塊36確定,模塊30執(zhí)行一個前面已為此幀確定的LSP參數(shù)的量化過程。例如,這個量化是垂直的,也就是說,在從一個或更多個預定量化表中選擇的情況下,它包括展示與由模塊28提供的LSP參數(shù)值之間的一個最小距離的一個量化參數(shù)LSPQ集合。用一個已知的方法,量化表隨由開環(huán)分析器36提供給量化模塊30的話音等級MV而變化。在前面提到的近似解中,確定話音等級MV的一個量化表集合,以便可以靜態(tài)地表示具有此等級MV的幀。這些集合存儲在本發(fā)明實施例的編碼器和譯碼器中。模塊30傳送量化參數(shù)LSPQ的集合和在申請的量化表中的索引值Q一樣。語音編碼器16還包括一個模塊42,它用于計算短期綜合濾波器和感知加權(quán)濾波器的合成濾波器的脈沖響應。這個合成濾波器具有一個傳遞函數(shù)的W(z)/A(z),它用于在一個子幀期間,計算其脈沖響應h=(h(0),h(1),…,h(1st-1)),模塊42完成對感知加權(quán)濾波器W(z),它根據(jù)已插入但非量化的LSP參數(shù),也就是說,已由模塊32計算的那個系數(shù),并對綜合濾波器1/A(z),它根據(jù)量化的和已插入的LSP參數(shù),也就是說,可以實際上由編碼器重新構(gòu)成的那一個。在長期預測延遲TP確定的第二階段中,閉環(huán)回路LTP分析模塊38為每個話音幀(MV=1,2,或3)的每個子幀確定延遲TP。這個延遲TP由在量化索引的域中的一個差分值DP為特性,這個量化索引如果在MV=1或2(N1=32)時,以5位編碼,若在MV=3(N3=16)時以4位編碼。延遲TP的索引引等于ZP+DP。在已知的方法中,閉環(huán)回路LTP分析在于在長期預測延遲T的查尋間隔內(nèi),它延遲TP為一個話音幀的每個子幀最大限度的歸一化相互關(guān)系[&Sigma;i=0lst-1x(i).yT(i)]2&Sigma;i=0lst-1[yT(i)]2]]>其中,X(i)表示這個子幀的加權(quán)語音信號SW,這個子幀已經(jīng)從加權(quán)綜合濾波器的存儲器中減去。(也就是說,由于起始狀態(tài),對由模塊42計算的脈沖響應h的濾波器的零信號的響應),YT(i)表示一個卷積的結(jié)果yT(i)=u(i-T)*h(i)=&Sigma;j=0iu(j-T).h(i-j).....(1)]]>U(j-T)由T采用延遲表示通過已知自適應碼本技術(shù)估算的激勵序列的預測成份。對于此子幀長度短的延遲T,U(j-T)的丟失值可以從前面的值中推斷出來。通過進一步采樣自適應的碼本中的信號U(j-T),考慮到小數(shù)部分的延遲。由因子m進一步取樣是通過插入多相濾波器的方法獲得的。通過使用已知公式gp=&Sigma;i=0lst-1x(i).yTP(i)&Sigma;i=0lst-1[yTP(i)]2]]>長期預測增益gp可以對每個子幀由模塊38確定。但是,在本發(fā)明的一個優(yōu)選版本,增益是由隨機分析模塊40計算的。由模塊40為每個子幀確定的隨機激勵是多脈沖類型。一個1st采樣的更新序列包括具有位置P(n)和振幅g(n)的np脈沖。換句話說,脈沖具有一個為1的振幅,并且分配一個各自獨立的增益g(n)。給出LTP延遲對非話音幀的子幀沒有確定,對于這些子幀相關(guān)的隨機激勵,可以采用更高數(shù)量的脈沖,例如,若MV=1,2或3,則np=5,若MV=0,np=6。由隨機分析模塊40計算的位置和增益由模塊44量化。一個位排列次序模塊46接收對譯碼器有用的不同參數(shù),并且編碼前向信道編碼器22的二進制序列。這些參數(shù)是-為每幀量化的LST參數(shù)的索引Q;-每個幀的話音等級MV;-每個話音幀的LTP延遲查尋間隔中心的索引ZP;-每個話音幀的子幀的LTP延遲和分配的增益gp的差分索引Dp;-每個子幀的隨機激勵的脈沖的位置P(n)和增益g(n)。這些參數(shù)的一部分在語音再生質(zhì)量上是特別重要的,或者對傳輸差錯特別敏感。因此,在編碼器中提供了一個模塊48,這個模塊接收不同的參數(shù)并把冗余位加到其中的某個部分,它可能檢測和/或糾正任何傳輸差錯。例如,作為兩位編碼的話音等級MV是一個關(guān)鍵性的參數(shù),它需要以盡可能少的差錯到所述譯碼器。由于這個原因,冗余位由模塊48加到這個參數(shù)中。例如,可能增加一個奇偶位到這兩個MV編碼位并復制一次獲得的三個位。這個冗余的例子可能檢測所有單個或雙個的誤差,并校正所有的成單差錯和75%的成雙差錯。例如,在表I中指示的每20ms幀的二進制數(shù)據(jù)速度的分配。在這里考慮的例子中,信道編碼器22是用于移動無線通信(GMS)的泛歐洲系統(tǒng)的編碼器。這個信道編碼器,在GSM建議05.03中詳細描述已經(jīng)對每20ms幀也產(chǎn)生260位的RPE-LTP型13kbit/s語音編碼器的開發(fā)。這260位的每位的敏感度在收聽測試的基礎(chǔ)上已被確定了。從源編碼器輸出的比特被一起分為三組類型。這些類IA的第一分組50個比特將在給定的一半冗余的生成器多項式的基礎(chǔ)上,與一個強制長度為5的進行卷積編碼。三個奇偶位在卷積編碼前計算并加到類型IA的50位中。第二類(IB)用與前面類型相同的多項式,保護一個一半水平的132位編號。第三類(II)包含78個非保護位。在卷積編碼應用之后,這些位(每幀456)用于主觀的交替掃描。實施本發(fā)明的新信源編碼器的排序模塊46在主觀上有重要意義的這些位的基礎(chǔ)上,把這些位分配成三個類型。</tables>表I移動無線通信站能夠接收通過在圖2中圖解表示的信源編碼器16處理的語音信號。接收的無線信號首先是通過解調(diào)器50,然后由執(zhí)行調(diào)制器24和信道編碼器22的信號雙工操作的信道譯碼器52處理。信道譯碼器52提供給語音譯碼器54一個二進制序列,在忽略傳輸誤差或當任何誤差已由信道譯碼器52糾正時,對應的這個二進制序列交付給在編碼器16的排序模塊46。譯碼器54包括接收這個二進制序列并標識與不同話音幀和子幀有關(guān)參數(shù)的模塊56。模塊56也在接收參數(shù)基礎(chǔ)上執(zhí)行一些檢測。特別是,為了結(jié)合冗余位檢測和/或糾正誤差影響的這個參數(shù),模塊56檢查由編碼器的模塊48插入的冗余位。對于合成的每個語音幀,譯碼器的模塊58接收話音等級MV和LSP參數(shù)的量化Q索引。模塊58從對應MV值的表中,恢復量化的LSP參數(shù),并在插入之后,把它們轉(zhuǎn)換成用于短期綜合濾波器60的系數(shù)ai。對于每個合成的語音子幀,一個脈沖生成器62接收隨機激勵的np脈沖的位置P(n)。生成器62傳送每個由相應的增益g(n)以64多路復用的單元振幅的脈沖。放大器64的輸出用于長期綜合濾波器66。這個濾波器66具有一個自適應的碼本結(jié)構(gòu)。濾波器66的輸出采樣u存在自適應碼本68的存儲器中,以便對序列子幀可以合用。從量化索引ZP和DP計算的與子幀有關(guān)的延遲TP被提供給自適應碼本68,以產(chǎn)生適當延遲的信號u。放大器70多路復用信號由長期預測增益gp延遲的。最后,長期濾波器66包括一個加法器72,它把放大器64和70相加的輸出提供激勵序列u。例如,當LTP分析在編碼器中未執(zhí)行時,若MV=0,在用于相關(guān)子幀的放大器70中,采用零預測增益gp。為了形成合成語音信號S’,激勵序列用于短期綜合濾波器60,并用已知的方法還能夠把結(jié)果信號提送給一個后置濾波器74,這個濾波器的系數(shù)依賴接收的合成參數(shù)。然后,為了驅(qū)動大音量揚聲器78,譯碼器54的輸出信號S’在放大之前,由轉(zhuǎn)換器76轉(zhuǎn)換成模擬量。根據(jù)本發(fā)明的第一觀點,現(xiàn)在參照圖3至6將要描述由編碼器模塊36執(zhí)行的開環(huán)回路分析過程。在第一階段90中,模塊36為當前幀的每個子幀st=0,1,…,nst-1計算并存儲位于rmin和rmax之間的整數(shù)延遲的加權(quán)語音信號SW的自相關(guān)函數(shù)Cst(k)和延遲能量函數(shù)Gst(k)Cst(k)=&Sigma;i=st.lst(st+1).lst-1SW(i).SW(i-k)]]>Gst(k)=&Sigma;i=st.lst(st+1).lst-1[SW(i-k)]2]]>每個子幀的能量R0st也被計算為ROst=&Sigma;i=st.lst(st+1).lst-1[SW(i)]2]]>在階段90中,另外在考慮自相關(guān)函數(shù)Cst(k)為正或比子幀的能量R0st的一個小比例ε小的那些延遲K的情況下,模塊36為每個子幀st確定最大化在子幀st的長期預測增益的開環(huán)回路估計值pst(k)的整數(shù)延遲Kst。用分貝表示的估計值pst(k)表達為pst(k)=20log10[R0st/(R0st-Cst2(k)/gst(k))]這樣最大化Rst(k)相當于最大化在圖6中所示的表達式Xst(k)=Cst2(k)/Gst(k)。整數(shù)延遲Kst是子幀st的整數(shù)分解中的基本延遲。在階段90之后是在當前幀上的綜合預測增益的一個第一個開環(huán)回路估計值和典型的位于1和2分貝之間的預定門限S0(例如,S0=1.5dB)。綜合預定增益的第一估計值等于,20.log10[RO/[RO-&Sigma;st=0nst-1Xst(Kst)]]]]>其中,R0是幀的能量總合(R0=R00+R01+…R0nst-1)和Xst(Kst)=Cst2(Kst)/Gst(Kst)表示在階段90上相關(guān)的與子幀st確定的最大值。如圖6所示,不用計算這個對數(shù),就可以執(zhí)行這個比較92。若比較92表示低于門限S0的預定增益的第一估計值,則認為語音信號包含太少的話音的長期相關(guān)性,當前幀的話音等級MV在階段94被置為0。在這種情況下,階段94終止在此幀上由模塊36執(zhí)行的操作。與此對照,若門限值S0在階段92被交替,當前幀被檢測為話音和等級MV等于1,2或3。然后,模塊36對每個子幀st計算包含候選延遲的表Ist,以構(gòu)成長期預測延遲的查尋間隔的中心ZP。由模塊36為話音幀的每個子幀st(st在階段96初始化為0)執(zhí)行的操作,等于在子幀上以分貝為單位的預定增益的估計值pst(Kst)的一個定義比例β,在級90被最大化(典型的β=0.75)以分貝為單位的選擇門限SEst的確定98開始。對于話音幀的每個子幀st,模塊36為剩余的過程確定以整數(shù)分解率的基本延遲rbf。這個基本延遲可以置為在階段90獲得的整數(shù)Kst。但是,以圍繞Kst的小數(shù)分解率依據(jù)精確增益查尋基本延遲的實現(xiàn),階段100是圍繞著在階段90獲得的整數(shù)延遲Kst,查尋最大化表達式Cst2/Gst的分數(shù)延遲。即使整數(shù)延遲Kst不在這個最大分解率所用的域中,這個查尋也可以用小數(shù)延遲的最大分解率(在這里描述的例子中為1/6)。例如,最大化Cst2(Kst+δ/6)/Gst(Kst+δ/6)的數(shù)Δst被確定為-6<δ<+6,然后,具有最大分解率的基本延遲rbf置為Kst+Ast/6。對于延遲的小數(shù)值T,自相關(guān)函數(shù)Cst(T)和延遲的能量函數(shù)Gst(T)是在用于整數(shù)延遲的階段90,從存貯存儲器中的值通過插入獲得的。更清楚地說,與子幀相關(guān)的基本延遲也能用從階段90得到小數(shù)分解率確定,并且在此幀的綜合預測增益的第一估計值中考慮。一旦已為一個子幀確定了基本延遲rbf,則執(zhí)行一個檢測101,它檢測此延遲的子多路復用,以便采用那些預測增益相對高的值(圖4),然后采用最小的子多路復用的多路復用(圖5)。在階段102,在表Ist中的地址j和子多路復用的索引m分別初始化為0和1。執(zhí)行子多路復用rbf/m和最小延遲rmin之間的一個比較104。檢驗子多路復用以便看其是否比rmin大。與rbf/m(階段106)最接近的量化延遲ri的索引值置為整數(shù)i,然后,在108,該子幀的量化延遲ri相關(guān)的預測增益pst(ri)的估計值與階段98中計算的選擇門限SEst相比較pst(ri)=20·log10[R0st/(R0st-Cst2(ri)/Gst(ri))]在小數(shù)延遲的情況下,是對整數(shù)延遲在階段90計算的值Cst和Gst的一個插入。如果pst(ri)<SEst,則不考慮延遲ri,且在再次執(zhí)行對下一子多路復用的比較104之前,直接進入用于增大索引m的階段110。如果測試108表示pst(ri)≥SEst,那么采用延遲ri并且索引m在階段110中增大之前執(zhí)行階段112。在階段112中,索引i存貯在表Ist中的地址j所在的存儲器中,值m置為應等于mo然后地址j增大一個單元。當比較104表示為rbf/m<rmin時,基本幀的子多路復用的檢驗被終止。然后,在圖5中說明的過程之后,檢查作為前面采用的子多路復用的最大rbf/mo的多路復用的這些延遲。這個檢查以多路復用的索引n的起始化開始n=2。在多路復用nrbf/mo和最大延遲rmax之間執(zhí)行一個比較116。如果nrbf/mo>rmax,那么為為確定最小的子多路復用的索引,mo是否是一個為n的整數(shù)的多路復用,執(zhí)行測試118。如果是這個延遲nrbf/mo已經(jīng)在rbf的子多路復用檢查期間被檢查了,并直接進入階段120,階段120用于在再次執(zhí)行下一個多路復用的比較116之前增大索引n。如果測試118表示mo不是一個n的整數(shù)多路復用,那么就需要檢查多路復用n.rbf/mo。最接近n.rbf/mo(階段122)的量化延遲ri的索引值被置為整數(shù)i,然后,在階段124,預測的增益pst(ri)的估算值與選擇的門限值SEst相比較。如果pst(riKSEst)那么就不考慮這個延遲ri,并直接進入用于增加索引的階段120。如果測試124表示pst(ri)≥SEst,就采用這個延遲ri,且在階段120增加索引n之前執(zhí)行階段126。在階段126中,索引i被存貯在表Ist中的地址j指向的存儲器中,然后地址i增大一個單元。當比較116表示n-rbf/mo>rmax時,則終止最小子多路復用的多路復用檢查。在那一點,表Ist包含候選延遲的j索引。如果對下面的階段需將表Ist的最大長度限制為jmax,那么這個表的長度jst可以等于min(j.jmax)(階段128),然后,在階段130,表Ist可以減少排序劃分增益Cst2(r1st(j))/Gst2(r1st(j))0<j<jst,以便僅保留產(chǎn)生增益最大值的jst延遲。在設(shè)想的查尋LTP延遲的有效性和復雜性的折衷方案的基礎(chǔ)上,選擇jmax值。jmax的典型值范圍從3到5。一旦子多路復用和多路復用已被檢查,且已獲得表Ist(圖3),分析模塊36計算確定整個幀上的長期預測增益和一個第二開環(huán)回路的分量Ymax,和在相位132中的索引ZP.ZP0和ZP1一樣,這個過程詳見圖6。這個相位132在測試長度N1的查尋間隔,以確定最大化幀上的全局預測增益的一個第二估計值的那個查尋間隔。測試的間隔是那些中心包含在相位101期間計算的表Ist中的候選延遲。相位132以表Ist中的地址j初始化為0的階段136開始。在階段138,檢測索引Ist(j),去判斷已通過測試中心在Ist’(j’),st’<st且0≤j’<j’st的前面的間隔。已找到它了,這樣可以避免兩次測試同樣的間隔。如果測試138揭示Ist(j)已在表Ist中,st’<st,那么地址j在階段140直接增大,然后它與表Ist的長度jst作比較。如果比較142顯示j<jst,那么地址j的新值重新進入階段138。當比較142表示j=j(luò)st時,那么與表Ist有關(guān)的所有間隔都已被測試過了并且相位132被終止。當測試138為負時,在Ist(j)中心的間隔測試,它從階段148開始,在階段148中,為每個子幀st’,確定在這個間隔上,最大化的長期預測增益的開環(huán)回路估計值pst(ri)的最佳延遲的索引值Ist’,也就是說,最大量值Yst’(i)=Cst’2(ri)/Gst’(ri),其中,ri表示索引i的量化延遲,Ist(j)-N1/2≤i<Ist(j)+N1/2且0≤i<n。在與子幀st’相關(guān)的最大化過程148期間,為了避免降低編碼,那些自相關(guān)Cst’(ri)為負的索引i被放到旁邊。如果發(fā)現(xiàn)所有位于測試間隔[I(j)-N1/2,I(j)+N1/2]的值i變?yōu)樨摰淖韵嚓P(guān)Cst’(ri),那么選擇自相關(guān)在絕對值上最小的索引Ist’。下面在150中,根據(jù)Y=&Sigma;st&prime;=0nst-1Yst&prime;(ist&prime;)]]>計算確定在Ist(j)中心間隔的全部預測增益的第二估計值的量Y,然后,與Ymax比較,其中,Ymax表示最大值。例如,值Ymax在與階段96上索引st相同時間上,初始化為0。如果Y≤Ymax,那么直接進入增大索引值j的階段140。如果比較150表示Y>Ymax,在階段140中增加地址j之前,執(zhí)行階段152。在這個階段152,索引ZP被置為Ist(j),并且索引ZP0和ZP1分別等于階段148確定的索引Ist’的最小和最大值。在與子幀st相關(guān)的相位132的尾部,索引st被增大一個單元(階段154),然后,在階段156,與每幀的子幀的值nst相比較。如果st<nst,那么重新輸入階段98執(zhí)行與下列子幀有關(guān)的操作。當比較156表示為st=nst時,這個索引ZP表示將提供給閉環(huán)回路LTP分析模塊38的查尋間隔的中心,ZP0和ZP1是索引,索引間的差值是在ZP中心的間隔內(nèi),每子幀的最優(yōu)延遲上的離差特征。在階段158,模塊36在以分貝表示的增益的第二開環(huán)回路估計值Gp=20·log10(R0/R0-Ymax)的基礎(chǔ)上,確定話音等級MV。其他兩個門限S1和S2也被用到。如果Gp≤S1,那么話音等級MV對當前幀置為1。例如,這個門限值典型地位于3到5dB之間S1=4dB。如果S1<Gp<S2,那么話音等級MV對當前幀置為2。例如,門限值S2典型地位于5和8dB之間,S2=7dB如果Gp>S2,那么檢查當前幀的不同子幀的最優(yōu)延遲的離差。如果ZP1-ZP<N3/2和ZP-ZP0≤N3/2,那么在ZP中心的長度N3的間隔要考慮所有的最優(yōu)延遲,并把話音調(diào)音等級置為3(若Gp>S2)。對于話音調(diào)音幀的預測延遲查尋間隔中心的索引ZP可能位于0到N-1=255之間,并對模塊38確定差分索引DP可能的范圍,若在MV=1或2時,是在-16到+15之間,若在MV=3(N1=32,N2=16的情況時),是在-8和-7之間。因此,最終確定的延遲Tp的索引ZP+DP,在某種情況下,可以比0更小或比255大。這些允許閉環(huán)回路LTP分析在比rmin小或比rmax大的幾個延遲TP上相等的范圍。這樣稱為變態(tài)話音和非聲音信號(由交換電話網(wǎng)使用的DTMF話音頻率和信號頻率)的再生的主觀質(zhì)量被增高了。另一種可能性是對查尋間隔,若在MV=1或2時ZP<16或ZP>240,則取值延遲的第一個或最后的一個32量化索引,若在MV=3時ZP<8或ZP>240,那么取值第1個或最后的16個索引。對于特殊話音幀減小延遲查尋間隔(典型地用MV=3的值16代替MV=1或2的值32)這個實際情況,根據(jù)公式(1)通過減少的要計算的卷積YT(i)的數(shù)量,有可能減少由模塊38執(zhí)行的閉環(huán)回路路LTP分析的復雜性。另一個優(yōu)點是保存差分索引DP的一個編碼位。當輸出數(shù)據(jù)速率是一個常量時,這些位可以重新分配給其它參數(shù)的編碼。特別是,可以分配這個補充位用于數(shù)量化由模塊40計算的長期預測增益gp。事實上,因為這個參數(shù)對特殊的語音子幀(MV=3)是具有感知的重要性,通過附加數(shù)值化位的有效在增益gp上具有更高精確度是可感知的。另一個可能性是提供給延遲和/或增益gp一個奇偶位,它可以檢測出任何影響這些參數(shù)的誤差。參照圖3至6,可以對上面描述的開環(huán)回路LTP分析過程做一個修改。根據(jù)這個過程的第一個改變,在與不同子幀有關(guān)的階段90執(zhí)行的第一最優(yōu)條件被一個覆蓋全幀的一個單個最優(yōu)條件所代替。除了在為每個子幀st計算參數(shù)Cst(k)和Gst(k)之外,自相關(guān)C(k)和延遲能量G(k)也為整個幀進行計算C(k)=&Sigma;st=0nst-1Cst(k)]]>G(k)=&Sigma;st=0nst-1Gst(k)]]>然后,為基本延遲確定具有rmin≤K≤rmax的X(k)=C2(k)/G(k)最大值的整數(shù)分解率K。階段92中在S0比較的增益的第一估計值是P(k)=20·log10〔R0/[R0-X(k)]〕。下一個單獨基本延遲被確定在小數(shù)分解率rbf的k值附近,子多路復用和多路復用的檢查101再次被執(zhí)行,并產(chǎn)生代替nst表Ist的一個單獨表I。相位132僅識別在階段148、150和152的子幀,而且對此表1執(zhí)行一個單獨時間。這個變化的實施例具有減少開環(huán)回路分析復雜性的優(yōu)點。根據(jù)開環(huán)回路LTP分析過程的第二個變化,例如,可能的延遲域[rmin,rmax]被劃分成nz子間隔,它具有相同的長度(典型的nZ=3),在與不同子幀有關(guān)的階段90執(zhí)行的第一優(yōu)化條件被替換為每個都覆蓋全部幀的不同的子間隔中nz優(yōu)化條件。這樣,以整數(shù)分解率獲得nz基本延遲K’1,…K’nz。在產(chǎn)生長期預測增益的第一開環(huán)回路估計值的最大值的基本延遲K’i之一的基礎(chǔ)上,做出話音/非話音的決定(階段92)。下一步,如果此幀是話音,基本延遲用與階段100相同的過程,用小數(shù)分解率確定,但是僅允許延遲的量化值。不執(zhí)行子多路復用和多路復用的檢查101。對于預測增益的第二估計值計算的相位132,前面確定的nz基本延遲作為候選延遲。這個第二變化可能配有通常具有可能延遲域的子分割優(yōu)點的子多路復用和多路復用的有規(guī)則的檢查。根據(jù)開環(huán)回路LTP分析處理過程的第三個變化,把相位132修改為在最優(yōu)條件階段148,一方面索引值Ist’被確定為Cst’(ri)/Gst’(ri)的最大值,Ist(j)-N1/2≤i<Ist(j)+N1/2且0≤j≤N,另一方面,在同樣的最大環(huán)路過程中,索引Kst’在一個減少的間隔Ist(j)-N3/2≤i<Ist(j)+N3/2上的最大化這個相同數(shù)量。階段152也修改為索引ZP0和ZP1不再存貯在存儲器中,但是數(shù)量Ymax’參照減少長度間隔Ymax&prime;=&Sigma;st&prime;=0nst-1Yst&prime;(kst&prime;)]]>用與Ymax相同的方法定義。在這個第三變化中,話音模式的確定158更多地導致選擇話音等級MV=3。除了在前面描述的增益GP之外,還考慮到了LTP增益的一個第三開環(huán)回路估計值,對應Ymax’GP’=20·log10[R0/R0-Ymax’]。如果GP≤S1,那么話音等級為MV=1;若GP>S2,則MV=3;若兩個條件都滿足,則MV=2。這樣,通過增加等級MV=3幀的比例,減少了閉環(huán)回路分析的平均復雜性,且增強了傳輸誤差的健狀性。開環(huán)回路LTP分析過程的第四個變化特別是涉及到輕微的話音幀(MV=1)。這些幀經(jīng)常對應于一個話音區(qū)域的開始和結(jié)束。因此,這些幀可以頻繁地包括從一到三子幀之間,對這些子幀,長期綜合濾波器的增益系數(shù)為零或為正。建議不對有問題的子幀執(zhí)行閉環(huán)回路LTP分析,以便減少編碼的平均復雜性。可以通過在圖6的階段152存貯在存儲器中nst指針來實現(xiàn),nst指針為每個子幀st’指示根據(jù)索引Ist’的延遲的自相關(guān)Cst’是否為負或更小。一旦在表Ist’中已經(jīng)有了許多間隔的參考,對于預測增益為負或可忽略不計,子幀可以通過查找nst指針來標識。如果合適,模塊38對相應的子幀是不能使用模塊38。由于對應這些子幀的預測增益將處于實際為0的情況,這些并沒有影響LTP分析的質(zhì)量。本發(fā)明的另一個觀點是關(guān)于模塊42,它計算加權(quán)綜合濾波器的脈沖響應。為了計算根據(jù)公式(1)的卷積YT(i),閉環(huán)回路LTP分析模塊38在一個子幀期間需要這個脈沖響應h。為了計算如后面所示的卷積,隨機分析模塊40也需要它。需要計算與一個子幀期間(典型地,Ist=40)擴展的響應h的卷積的事實,這意味著需要減少相對編碼復雜性,特別是,為了增加移動站的壽命。在某種情況下,已經(jīng)建議把脈沖響應縮短到一個子幀的長度(例如,到20個采樣),但是這可能降低編碼的質(zhì)量。根據(jù)本發(fā)明,建議通過一方面考慮縮短這個脈沖響應h,另一方面,考慮由開環(huán)回路LTP分析模塊36確定的有問題幀的話音等級M,縮短這個脈沖響應h的能量分布。例如,由模塊42執(zhí)行的操作對應的圖7的流圖。脈沖響應是在比子幀長度大的長度pst的階段160上計算的所有值中的第一個,并且這個響應具有足夠長度,確信所有脈沖響應能量的考慮(例如,如果短期線性預測是階q=10,那么,對于nst=4和Ist=40,pst=60)。脈沖響應縮短的能量在階段160也可以計算出來Eh(i)=&Sigma;k=0i[h(i)]2]]>通過用具有傳遞函數(shù)W(z)/A(z)的一個濾波器的方法,以零初始狀態(tài)或者甚至是遞歸,通過濾一個單元脈沖可以獲得脈沖響應成份h(i)和縮短的能量Eh(i)。f(i)=&delta;(i)+&Sigma;k=1qak[&gamma;2k.f(i-k)-&gamma;1k.&delta;(i-k)]...(2)]]>h(i)=f(i)+&Sigma;k=1qak.h(i-k)...(3)]]>Eh(i)=Eh(i-1)+[h(i)]2其中,0<i<pst,對i<0時,f(i)=h(i)=0;對i≠0時,δ(o)=f(o)=h(o)=Eh(o)=1和δ(i)=0。在表達式(2)中,系數(shù)ak是包括在感性加權(quán)濾波器中的系數(shù),也就是說被插入的倒是非量化的線性預測系數(shù)。而在表達式(3)中,系數(shù)ak是用于綜合濾波器的系數(shù),也就是量化和插入的線性預測系數(shù)。接著,模塊42確定最小長度Lα,以便使縮短到Lα采樣的脈沖響應的能量Eh(lα-1)至少等于在pst采樣上估計的總能量Eh(pst-1)的一個比例α。α的一個典型值是98%。盡管Eh(Lα-2)>α·Eh(pst-1)(測試164),在階段162,數(shù)字Lα初始化為pst,并在166減去一個單元。當測試表示Eh(Lα-2)≤α·Eh(pst-1)時,獲取查尋的長度Lα。為了考慮話音等級MV,一個校正器項Δ(MV)被加到已獲得的Lα值中(階段168)。校正器項是優(yōu)選的話音等級的擴大函數(shù)。例如,可以取值為如Δ(0)=-5,Δ(1)=0,Δ(2)=+5,并且Δ(3)=+7。在這個方法中,脈沖響應h會更精確的確定語音的話音等級。若Lα≤nst則這個脈沖響應的縮短長度Lh等于Lα,否則,就等于nst??梢詣h去脈沖響應的剩余采樣(h(i)=0,i>Lh)。隨著脈沖響應的縮短,用下列方法yT(i)=&Sigma;j=max(0,i-Lh+1)iu(j-T).h(i-j)....(1&prime;)]]>修改來自閉環(huán)回路LTP分析模塊38的卷積YT(i)的計算。獲得的這些卷積和這些卷積表示執(zhí)行運算的一個有效的部分,因此,需要重要部分的n個的多路復用和附加成分,并且當脈沖響應被縮短時,在自適應的碼本中的尋址。產(chǎn)生話音等級MV的脈沖響應的動態(tài)縮短可能在不影響編碼質(zhì)量的情況下,獲得在復雜性上的減小。同樣考慮用于由隨機分析模塊40執(zhí)行的卷積的計算。這些優(yōu)點是特別明顯的,當感知加權(quán)濾波器具有公式W(z)=A(z/γ1)/A(z/γ2)的傳遞函數(shù)時,其中o<γ2<γ1<1,這個函數(shù)產(chǎn)生比通常的綜合分析編碼器的公式W(z)=A(z)/A(z/γ)的脈沖響應大的脈沖響應。本發(fā)明的第三個方面是關(guān)于隨機分析模塊40,它服務(wù)于模塊化激勵的非預測部分。這里考慮的隨機激勵是多脈沖類型。與子幀有關(guān)的這個隨機激勵由具有位置p(n)的np脈沖和振幅或增益g(n)表示(1≤n≤np)。長期預測增益gp也可以在同樣的處理過程中計算。通常,可以認為與子幀有關(guān)的激勵序列包括分別與nc增益相關(guān)的nc影響。這些影響是由相關(guān)的和總的增益加權(quán)的Ist取樣矢量,對應短期綜合濾波器的激勵序列。影響之一是可預測的,或者在長期綜合濾波器具有幾個抽頭(“多抽頭音調(diào)綜合濾波器”)的情況下的幾個。在此情況下,其他的影響是除了振幅為1的脈沖之外,僅包括o’s的np矢量。因此,若MV=0則nc=np,若MV=0,則nc=np,若MV=1,2或3,nc=np+1。包括增益gp=g(o)計算的多脈沖分析是用一種已知的方法,對每個子幀,查找具有在語音信號和合成信號之間的最小感知加權(quán)平方誤差E的位置p(n)(1≤n≤np),以及增益g(n)(1≤n≤np),由下式給出E=(x-&Sigma;n=0nc-1g(n).Fp(n))2]]>這些增益是線性系統(tǒng)g·B=b的一個解法。在上面的符號中-X表示一個初始的目標矢量,它包括不在存儲器中的加權(quán)語音信號SW的Ist采樣X=(X(0),X(1),…,X(Ist-1)),X(i)’S已在閉環(huán)回路分析期間,如前面描述的那樣被計算出來了;-g表示np+1個增益組成的行矢量,g=(g(0)=gp,g(1),…,g(np));-行矢量Fp(n)(0≤n<nc)有加權(quán)影響,這個加權(quán)影響,如成份i(0≤i≤Ist),在激勵序列的影響n與加權(quán)綜合濾波器的脈沖響應h之間的卷積的結(jié)果;-b表示行矢量,它由矢量X和行矢量Fp(n)間的nc標量結(jié)果組成;-B表示具有nc行和nc列的一個對稱矩陣,在這個矩陣中,項Bi.j=Fp(i)·Fp(j)T(0≤i,j≤nc)等于前面定義的Fp(i)和Fp(j)的標量結(jié)果;-(·)T表示矩陣置換。對于隨機的激勵的脈沖(1≤n≤np=nc-1),這個矢量Fp(n)簡單地包括由P(n)采樣偏移的脈沖響應h的矢量組成。上面描述的縮短脈沖響應的事實可能實際上減少了用于計算包含這些矢量Fp(n)的標量結(jié)果的操作量。對于激勵的預測影響,矢量Fp(0)=Y(jié)TP具有如成份Fp(0)(i)(0≤i≤Ist),根據(jù)公式(1)或(1’),模塊38為選擇長期預測延遲Tp計算的卷積YTP(i),若MV=0,影響n=0也是脈沖類型,并且將要計算位置P(0)。上面定義的量小化的平方誤差E相當于查找最大化的正?;南嗷リP(guān)系b.B-1·bT的位置集合,然后,根據(jù)g=b·B-1計算增益。但是,對脈沖位置精確的查尋要求非常大的計算量。為了減少這個問題,多脈沖方法通常使一個近于最佳過程,這個過程是為每個影響連續(xù)地計算增益和/或脈沖位置。對于每個影響n(0≤n≤nc),確定所有位置P(n)的第一個是正?;南嗷リP(guān)系(Fp·Cn-1T)2/Fp·FpT最大的一個。增益gn(o)到gn(n)根據(jù)gn=bn·Bn-1被重新計算,其中g(shù)n=gn(0),…,gn(n),bn=(b(o),…,b(n))且Bn={Bi,j}i≤i,j≤n。然后,為下面的迭代,計算目標矢量en,相當于初始化目標矢量X減去由他們的各自增益多路復用加權(quán)綜合信號的影響0到nen=X-&Sigma;i=0ngn(i).Fp(i)]]>在完成最后一個迭代nc-1時,增益gnc-1(i)是被選擇的增益,并且最小平方誤差E等于目標矢量的能量Cnc-1。上面的方法給出滿意的結(jié)果,但是它在每次迭代時,要求矩陣Bn反轉(zhuǎn)。在他們的論文“多脈沖編碼器中振幅最佳化和音調(diào)預測”(IEEETrans,聲學,語音,信號處理,卷37,3期,1989年5月,317-327頁),S.Singhal和B.S-Atal建議通過使用Cholesky分解Bn=Mn·MnT,簡化Bn矩陣反轉(zhuǎn)問題,在上述分解中,Mn為一個比較低級的三角矩陣。因為Bn是具有正數(shù)特征值的對稱矩陣,所以這個分解具有可能性。這種方法的優(yōu)點是三角矩陣的反轉(zhuǎn)是相對簡單,Bn-1可以由Bn-1=(Mn-1)T·Mn-1獲得。但是Cholesky分解和矩陣Mn的反轉(zhuǎn)要求執(zhí)行分割和平方根計算,它需要復雜的計算操作。本發(fā)明建議通過用下列方法Bn=LnRnT=Ln(Ln·Kn-1)T修改矩陣Bn的分解,簡化最優(yōu)化的實施。其中,Kn是一個對角矩陣,Ln是僅在它的主對角線上具有I’S的一個下三角矩陣(例如,用前面的符號,Ln=MnKn1/2)。關(guān)于矩陣Bn的結(jié)構(gòu),矩陣Ln=Rn·Kn,Rn,Kn和Ln-1每個都是通過把一行簡單地加到相應的前面迭代的矩陣來構(gòu)成的。在這種條件下,Bn的分解,Ln的反轉(zhuǎn),Bn-1=Kn·(Ln-1)T·Ln-1的獲取和增益的重新計算,每閃迭代僅需要一個單獨的分割且不需要平方根計算。與一個話音幀(MV=1,2,或3)的一個子幀有關(guān)的隨機分析,此刻可以如圖8到11表示處理。為計算長期預測增益,影響索引n在階段180被初始化為0,并且矢量Fp(0)置為由模塊38提供的長期影響YTP若n>0,迭代n從脈沖n的位置P(n)的測定182開始,脈沖n的最大限度量(Fp.eT)2/(Fp.FpT)=(&Sigma;k=pmin(Lb+p,lst)-1h(k-p).e(k))2&Sigma;k=pmin(Lh+p,lst)-1h(k-p).h(k-p)]]>其中,e=(e(0)…e(Ist-1))是在前一次迭代期間計算的一個目標矢量。不同抑制條件可以用于包含在間隔中的上述量的最大限度區(qū)域。本發(fā)明優(yōu)選使用一個把激勵子幀分割成同樣長度的ns段(如Ist=40,ns=10)的一個段查尋。對于第一個脈沖(n=1),在子幀中所有可能的位置P上執(zhí)行(Fp/eT)2/Fp·FpT)的最大限度。在一個迭代n>1,在階段182中,除了前面迭代期間,分別建立脈沖的位置P(1)……P(n-1)的段之外,在所有可能的位置上執(zhí)行最大化。在當前幀已作為非話音被檢測出來的情況下,影響n=0也由位置P(0)的脈沖組成。然后階段180僅包括初始化n=0,其后是與階段182相同的最大化階段,它以e=e-1=x作為目標矢量初始值查找P(0)。需要注意的是當影響n=0是可預測時(MV=1,2,或3),因為它通過延遲特征化已經(jīng)確定長期影響,所以閉環(huán)回路LTP分析模塊38已經(jīng)執(zhí)行了與最大化182相同類型的操作,并通過以e=e-1=x作為目標矢量初始值,最大化在延遲T查尋間隔內(nèi)的量(YT·eT)2/(YT·YTT)。當影響LTP的能量很低時,也可能在重新計算增益的過程中,忽略這個影響。在階段180或182之后,模塊40執(zhí)行包括在短陣B分解中的矩陣L,R和K的行n的計算184,它使完成上面定義的矩陣Ln,Rn和Kn成為可能。矩陣B分解為位于行n和列j的成分產(chǎn)生。B(n,j)=R(n,j)+&Sigma;k=0j-1L(n,k).R(j,k)]]>然后可能是對j從0增大到n-1R(n,j)=B(n,j)-&Sigma;k=0j-1L(n,k).R(j,k)]]>L(n,j)=R(n,j).K(j)對j=nK(n)=1/R(n,n)=1/[B(n,n)-&Sigma;k=0n-1L(n,k).R(n,k)]]]>L(n,n)=1這些關(guān)系用于圖9的詳細計算184中。在階段186,列索引j首先初始化為0。對于列索31j,變量tmp首先初始化為成份B(n,j)的值,例如tmp=Fp(n)·Fp(j)T=&Sigma;k=max(p(n),p(j))min(Lh+p(n),Lh+p(j),lst)-1h(k-p(n)).h(k-p(j))]]>在階段188,整數(shù)k被另外初始化為0。然后,比較190在整數(shù)k和j之間執(zhí)行比較。若K>j,則把L(n,k)·R(j,k)項加到變量tmp,然后整數(shù)k在再次執(zhí)行比較190之前,增加一個單元(階段192)。當比較190表示k=j(luò)時,在整數(shù)j和n之間執(zhí)行比較194。若j<n,在階段196成份R(n,j)等于tmp,并且成份L(n,j)等于tmp·K(j),然后列索引j在為了計算下面的成份返回階段188之前,增加一個單元。當比較194表示j=n時,計算矩陣K的行n的成分K(n),它終止與行n有關(guān)的計算184。如果tmp≠0(階段198)時K(n)置為1/tmp,否則被置為0。注意為獲得K(n),計算184至多僅要求1次除法198。另外,因為避免被0除,任何一個單獨的矩陣Bn不會是卷入穩(wěn)定。參照圖8,L,R,K的行n的計算之后是包含矩陣L的0到n和才列的矩陣Ln的反轉(zhuǎn)200。L是在主對角線上具有I’S的三角形的事實大大地簡化了如圖10所示的反轉(zhuǎn)。實際上,它可能的狀態(tài)為L-1(n,j&prime;)=-L(n,j&prime;)-&Sigma;k&prime;=j&prime;+1nL-1(k&prime;,j&prime;).L(n,k&prime;)....(4)]]>=-L(n,j&prime;)-&Sigma;k&prime;=j&prime;+1nL(k&prime;,j&prime;).L-1(n,k&prime;).....(5)]]>對0≤j≤n且L-1(n,n)=1,也就是說,反轉(zhuǎn)不是必須執(zhí)行除法就可以執(zhí)行。另外,當L-1的行n的成份滿足對重新計算增益的需要,使用關(guān)系(5)就有可能在不需存儲整個矩陣L-1,而只存儲一個矢量Linv=(LinV(0),…Linv(n-1)),在Linv(j’)=L-1(n·j’)的情況下執(zhí)行轉(zhuǎn)換。然后,轉(zhuǎn)換200以列索引j’到n-1的從恢復202開始。在階段204中,Linv(j’)項被初始化為-L(n,j’),且整數(shù)k’被初始化為j’+1。下一個比較206在整數(shù)K’和n之間執(zhí)行的。若K’<n,則從Linv(j’)減去項L(K’,j’)·Linv(K’),然后,整數(shù)K在再次執(zhí)行比較206之前,增大一個單元。當比較206表示K’=n,j’時與0相比較(測試210)。若j’>0,則整數(shù)j’減小一個單元(階段212)并且階段204為計算下列成份再次進入階段204。當測試210表示j’=0時,終止轉(zhuǎn)置。參照圖8,反轉(zhuǎn)200之后是通過重新最優(yōu)化增益和對一個迭代目標矢量E的計算214。重新最優(yōu)化的增益計算也由矩陣B采納的分解大大簡化了。因為它可以計算矢量gn=(gn(0),…gn(n)),gn·Bn=bn的解法是根據(jù)gn(n)=[b(n)+&Sigma;i=0n-1b(i).L-1(n,i)].K(n)]]>且gn(i’)=gn-1(i’)+L-1(n,i’)·gn(n),0≤i≤n。計算214詳見圖11。首先,矢量b的成份b(n)的計算b(n)=Fp(n).XT=&Sigma;k=p(n)min(Lh+p(n),lst)-1h(k-p(n)).x(k)]]>b(n)作為變量tmp的恢復值。在階段216,索引i也被初始化為0。下一個比較218在整數(shù)i和n之間執(zhí)行。若i<n,則把項b(i)·Linv(i)加到變量tmq中,且在返回到比較218之前i增大一個單元(階段220)。當比較218表示i=n時,與影響n有關(guān)的增益根據(jù)g(n)=tmq·K(n),并且用e=X-g(n)·Fp(n)和i’=0初始化用于計算其它增益的環(huán)路和目標矢量。這個環(huán)路包括在整數(shù)i’和n之間的比較224。若i’<n,則通過把Linv(i’)·g(n)加到它在迭代n-1之上計算的值中,在階段226,增益g(i’)被重新計算,然后,從目標矢量已減去矢量g(i’).Fp(i’),階段226還包括在返回比較224之前的索引i’的增大。當比較224表示i’=n時,終止增益和目標矢量的計算214。可以看出,當僅在反轉(zhuǎn)矩陣Ln-1的行n上調(diào)用時,可以更新這個增益。計算214之后是影響的索引n通過增加228,然后是索引n和影響nc量之間的比較230。若n<nc,則為下一輪迭代重新進入階段182。當在測試230中n=nc時,終止位置和增益的最優(yōu)化。對這個脈沖的段查尋實際上減少了在隨機激勵查尋階段182的過程中估計的脈沖位置量。另外,它允許發(fā)現(xiàn)位置的有效定量。在1S=40采樣的子幀被分割為1S=4采樣的ns=10段的特殊情況下,可能的脈沖位置集合可以取得ns!,若np=5(MV=1,2,3)可取值ns!·1snp/[np!(ns-np)!]=258,048;若np=6(MV=0),取值860,160,它替代了在僅特指在兩個脈沖本不可能具有同一位置的情況下,若np=5,則取值Ist!/[np!(Ist-np)!]=658,008,或者若np=6時,取值3,838,380。換句話說,如果np=5,位置可以將原來以20位量化代之以18位量化;若np=6,則可將原來以22位量化代之以20位量化。每個子幀段量等于每個隨機激勵脈沖量的特殊情況(ns=np),導致了最簡化的隨機激勵查尋,與最低的二進制數(shù)速率一樣(若Ist=40和np=5,則那里存在85=32768個可能位置的集合,如果ns=10時僅在15位上進行量化,而不是在18位上量化)。但是,通過減少這一點可能創(chuàng)新的序列量,可能會使編碼質(zhì)量降低。對于一個給定的脈沖數(shù)量,可以根據(jù)編碼質(zhì)量和它的執(zhí)行的簡便性之間設(shè)想的折衷方法(與它要求的數(shù)據(jù)速率一樣)優(yōu)化段的數(shù)量。就脈沖位置而言,通過占用段的次序號和每個占用段的脈沖相對位置的分別量化的優(yōu)點,可以獲得ns>np展示的對傳輸誤差具有很強的健狀性的優(yōu)點。對一個脈沖n,段的次鄧號Sn和相對位置Prn分別是用一個段的長度1S進行的P(n)的歐幾里德除法的商數(shù)和余數(shù)P(n)=Sn·1S+Prn(0≤Sn≤ns,0≤Prn<1S)。若1S=4,則每個相對位置都分別以2位量化。如果發(fā)生傳輸誤差影響其中的一位,相應的脈沖僅會發(fā)生輕微的偏移,將會限制誤差的感知影響。占有段的次序號用一個ns=10位的一個二進制字標識,它對占用段的每個值為1,且對隨機激勵無脈沖的段置為0。可能的二進制字是具有一個np的海明負荷;若n=5,則他們的編號為ns!/[np!(ns-np)!]=252,或者若n=6則為210。這個二進制字可以用滿足2nb-1<ns!(ns-np)!≤2nb的nb位的索引來量化,在分析的例子中,nb=8。例如,如果隨機分析已經(jīng)把np=5提供給位置4、12、21、34、38,作為標量量化的相對位置是0,0,1,2,2并且表示占用段的二進制字是0101010011或者翻譯成十進制為339。對于譯碼器,可能的二進制字被存儲在讀取地址是接收的量化索引的一個是量化表中。在徹底地確定的表的次序可以被最優(yōu)化,以便根據(jù)一個近似判別式,影響一位索引的傳輸誤差(特別是當隔行掃描用于信道編碼器22時,最高的頻率誤差情況)平均具有最小的序列。例如,近似判別式是一個ns位的字,可以僅由“鄰近”位來替換,由至多等于一個門限值np-2δ的海明距離分離,以便在影響一個單獨位的索引的傳輸中的誤差事件中,保留除以有效位置的脈沖δ之外的所有脈沖。其它判別式可以用于替換式增補中,例如,如果一個字替換另一個不更改對應脈沖的增益的指定次序,這兩個字被認為是鄰近的。通過說明的方法,簡化的情況可以認為ns=4和np=2,例如,在nb=3位上量化的6個可能的二進制字。在這種情況下,可以檢驗在表II中的量化表允許np-1=1,它對傳送索引的每個誤差影響一位保持正確的位置脈沖。存在4個誤差情況(18個總量之外),對于那些量化索引已經(jīng)知道被錯誤的接收(用6代替2或4;用7代替3或5),但是,譯碼器可以測量限制的畸變,例如可以重復與前面子幀相關(guān)的創(chuàng)新序列,或者甚至把可采用的二進制字分配給“不存在的”索引(例如,對于索引6是1001或1010、對于索引7是1100或0110,在接收具有一個二進制誤差的6或7的事件中,再次使用np-1=1正確地位置脈沖)。在通常情況下,在運算的基礎(chǔ)上考慮,或者,如果它是不能勝任的,通過在計算機上模擬誤差現(xiàn)場(精密地或通過依賴于可能誤差情況的數(shù)量的蒙特卡羅類型的一個統(tǒng)計采樣)。為了使占用段的量化索引更可靠,特別是,如果近似準則不可能滿意地用于所有可能影響一位索引的誤差情況,可以具有由信道編碼22提供的不同的保護類型的優(yōu)點,這樣,排序模塊46可以放在最小保護分類或非保護分類中,索引的某些量hx位,如果它們由傳送誤差影響,這個索引產(chǎn)生一個有錯但又滿足具有被認為是滿足可能的近惟準則的一個字,并且,排序模塊46還把索引的其它位放置在一個更好的保護類型中。這個方法包括在量化表中的字的另一個排序。如果要求最大化分配給最少的保護的類型的索引的位的數(shù)量nx,這個排序也可以通過模擬的方法進行優(yōu)化。表II</tables>一種可能性是通過編譯由從0到2ns-1的格雷碼計算的ns位的一個字表開始,通過從不具有np的一個海明加權(quán)的詞表中刪除獲取排序的量化表。如果這個表中的索引具有用格雷碼的二進制表征,在最不重要位中的任何誤差使索引產(chǎn)生±1的變化,并且,必須由在海明距離上這個門限np-2的有意義的鄰近的一個字,替換實際的占用字。在第i個最不重要位的誤差也有大約21-i的可能性,使索引產(chǎn)生±1變化。通過在一個非保護類型的格雷碼中放置索引的這個nx最不重要數(shù)字位,任何傳輸誤差影響這些位中的一個將導致由至少等于(1+1/2+…+1/2nx-1)/nx的一個可能的鄰近字替換這個占用字。對從1增大到nb的nx,最小概率是從1降到(2/nb)(1·1/2nb)。影響索引的nb·nx的最重要數(shù)字位的誤差通常依靠用它的信道編碼保護來糾正誤差。在這種情況下的nx值排選在誤差的健狀性(小值)和保護類型的有限尺寸(大值)之間的折衷方案。就編碼器而論,可能用于表示段占用的二進制字以增序排列在表中。存貯在譯碼器的量化表中的一個索引表,為每個地址分配查找表中具有此地址的二進制字的次序號。在上面開始的簡化例中,查找表和索引表的內(nèi)容在表III中給出(以十進制值)。從隨機分析模塊40提供的np位置推演的段占用字的量化,由量化模塊44在兩個階段中執(zhí)行。為了確定要量化學的表中的地址,首先在所有的檢查表中執(zhí)行二進制查尋。以提供給位排序模塊46的索引表中的定義地址,然后獲得量化索引。表III地址檢查表索引表03015126539241045123另外,模塊44執(zhí)行由模塊40計算的增益的量化。為了考慮對高話音幀的這個參數(shù)的更高的感知重要性,增益gTP被量化,例如,在間隔,若MV=1或2,以59位量化,若MV=3,以6位量化。對于分配隨機激勵脈沖的增益編碼,增益g(1),…g(np)的最大絕對值GS以5位量化,例如,在間隔〔0,32767〕內(nèi)的幾保級數(shù)中取32值,并且每個相對增益g(1)/GS,…,g(np)/GS在間〔-1,+1〕內(nèi)被量化,若MV=1,2或3,以4位量化;如果M=0,則是以5位量化。GS的量化位由信道編碼器22放置在一個保護類型中,作為相關(guān)增益的量化索引的最重要數(shù)字位。相關(guān)增益的量化位用一種允許這些位賦予屬于由占用字安排這個段的相應脈沖的方法排序。根據(jù)本發(fā)明的段查尋還有可能更有效地保護由增益最高值分配脈沖的相對位置。在np=5和1S=4的情況下,每個子幀的十位需要量化在段中脈沖的相對位置。這個情況被認為是這10位中的5位被放置在一個局部地保護或非保護類型(II),其他5位被放置在一個更高的保護類型(IB)。最自然的分配是放置保護類型IB中的每個相對位置的最重要數(shù)字位,以便任何傳輸誤差趨向影響最重要數(shù)字位,并因此對相應脈沖僅引起一個取樣的一個偏移。但是,對相對位置的量化,在相關(guān)的增益的絕對值的降序排列中考慮脈沖,并在類型IB中放置每個第一個兩個相對位置的兩個量化位和第三個兩個相對位置的最重要數(shù)字位一樣。在這個方法中,當以高增益分配它們時,優(yōu)先保護這個脈沖的位置,這些增強了平均質(zhì)量,特別是對大多數(shù)話音子幀。為了重新配置這個激勵的脈沖影響,譯碼器54首先用接收占用字的中間項安排段;它指配這個相關(guān)的增益;然后,在增益尺寸的次序基礎(chǔ)上,它把相對位置指配這個脈沖??梢岳斫馍厦婷枋龅谋景l(fā)明的每一個不同觀點產(chǎn)生特定的改進,并且因此可以彼此間獨立地執(zhí)行它們。結(jié)合它們可以產(chǎn)生特定地有益性能的編碼器。在前面描述的說明實施例中,這個13Kbits/s的聲碼器要求在固定點模式下每秒15兆指令(Mips)。因此,這可以通過使用一個商業(yè)化合用的數(shù)字信號處理器(DSP)產(chǎn)生這個編碼器,并且同樣對這個譯碼器僅要求5MiPS指令。權(quán)利要求1.一種綜合分析語音編碼方法,用于編碼被數(shù)字化成連續(xù)幀的語音信號,這些幀被分割成包括一定數(shù)量取樣的子幀,其中,為確定一個短期綜合濾波器(60)的系數(shù),對每個幀進行語言信號的線性預測分析;為確定幀的話音等級對每個幀進行開環(huán)回路分析;為了確定向短期綜合濾波器施加并產(chǎn)生表征語音信號的綜合信號的激勵序列,對每個子幀進行至少一個閉環(huán)回路分析;每個閉環(huán)回路分析使用包括一個短期綜合濾波器和一個感知加權(quán)濾波器組成的復合濾波器的脈沖響應,其特點在于在每個閉環(huán)回路分析期間,利用上述脈沖響應,把它縮短到一個縮短的長度(Lh),這個縮短的長度至多等于每個子幀采樣量(lst),并且依賴于上述響應的能量分布和該幀的話音等級。2.根據(jù)權(quán)利要求1的方法,其特征在于合成濾波器的脈沖響應在比每個子幀采樣量(lst)大的一個總長度(pst)上計算;確定最小長度Lα,以便通過縮短對Lα取樣的上述響應而計算的脈沖響應的能量至少等于在上述總長度上計算的脈沖響應能量的一個定義的小數(shù)部分(α);并且若上述最小長度Lα和依賴該幀話音等級的校正器項(Δ(MV))之和比每子幀取樣的量(lst)小,則縮短長度(Lh)就等于這個和。3.根據(jù)權(quán)利要求2所述的方法,其特征在于上述校正器項(Δ(MV))是話音等級的遞增函數(shù)。4.根據(jù)權(quán)利要求1到3中任意任一項所述的方法,其特征在于感知加權(quán)濾波器具有化式W(z)=A(z/γ1)/A(z/γ2)的傳遞函數(shù),其中,1/A(z)表示短期綜合濾波器的傳遞函數(shù)并且γ1和γ2是兩個系數(shù),滿足0<γ2<γ1<1。5.根據(jù)權(quán)利要求4所述的方法,其特征在于短期合成濾波器的系數(shù)是由線狀譜參數(shù)(LSP)表示;上述線狀率參數(shù)被量化;為了構(gòu)成將至少與一個幀的一個子幀有關(guān)的激勵序列施加給短期綜合濾波器,在與上述幀有關(guān)的線狀譜參數(shù)和與該前一幀相關(guān)的線狀譜參數(shù)之間進行插入;為了計算合成濾波器的脈沖響應,在量化和插入的線狀譜參數(shù)的基礎(chǔ)上,計算這個短期綜合濾波器,而在被插入的但非量化的線狀譜參數(shù)的基礎(chǔ)上,計算感知加權(quán)濾波器。全文摘要為確定短期綜合濾波器的系數(shù),對每幀語音信號進行線性預測分析,并且對每個子幀確定一個激發(fā)序列,使加到短期綜合濾波器的激發(fā)序列產(chǎn)生表征語音信號的一個綜合信號,激發(fā)序列由迭代過程確定,其中,再次迭代逐漸建立對穩(wěn)矩陣Bn。矩陣Bn再次迭代通過用Ln=Rn·Kn分解模式Bn=Ln·Rn文檔編號G10L19/04GK1173940SQ9619179公開日1998年2月18日申請日期1996年1月3日優(yōu)先權(quán)日1995年1月6日發(fā)明者威廉姆·納瓦羅,米切爾·莫克申請人:馬特瑞通訊法國公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
克拉玛依市| 高台县| 永城市| 满城县| 蚌埠市| 营山县| 商河县| 青阳县| 农安县| 赤水市| 大庆市| 葵青区| 云和县| 开江县| 满城县| 新平| 启东市| 叙永县| 颍上县| 耿马| 揭阳市| 临高县| 林西县| 镇原县| 来凤县| 乳源| 封开县| 宁德市| 鄂托克前旗| 西峡县| 贡嘎县| 军事| 东港市| 南丰县| 新营市| 石景山区| 和田县| 玉山县| 察哈| 德清县| 金阳县|