雙脈沖激勵的線性測編碼的制作方法

文檔序號：2837521閱讀：318來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專利名稱：雙脈沖激勵的線性測編碼的制作方法
技術(shù)領(lǐng)域：
本發(fā)明屬于信號編碼領(lǐng)域。具體講是語音編碼領(lǐng)域；尤其是專為改進激勵信號編碼。
背景技術(shù)：
傳統(tǒng)來講，所有的參數(shù)化語音編碼方法常常都是利用語音信號本身的冗余，來減少必須傳輸?shù)男畔⒘?，并估算語音信號短時段內(nèi)的參數(shù)。這種冗余首先起因于語音波形周期性的重復(fù)和頻譜包絡(luò)慢變過程。
不同形式語音波形的冗余對應(yīng)于不同類型的語音信號，如濁聲和清聲。就濁聲語音而言，
語音信號基本上是周期性的；然而，這種周期性在語音段中是變化的，且周期波形在語音段之間緩慢變化。低比特率的語音編碼可以很大地受益于這種周期性。濁聲周期稱為基音周期 (pitch),這種基音周期性預(yù)測被命名為長項預(yù)測。至于清音，其信號更像一個隨機噪聲，周期性也較小。
在任何情況下，參數(shù)編碼通過分割頻譜包絡(luò)和語音段的激勵來減少語音段的冗余。頻譜包絡(luò)慢變過程被描述成線性預(yù)測(也稱作短項預(yù)測)。低比特率的語音編碼也同樣受益于短項預(yù)測。這種編碼的優(yōu)點就來自于參數(shù)的慢速變化。然而，在幾毫秒內(nèi)這些參數(shù)值有很大變化的可能性很小。因此，在8kHz或16kHz采樣時，語音編碼算法是將10 30毫秒語音段作為一幀。而20毫秒是最常用的幀長。在較近期的知名國際標準中，諸如G.723、 G.729、 EFR、 AMR，編碼激勵線性預(yù)測技術(shù)(CELP)已經(jīng)被廣泛采用；通常編碼激勵線性預(yù)測技術(shù)(CELP)被理解為是編碼激勵、長項預(yù)測和短項預(yù)測各技術(shù)的綜合。利用編碼激勵線性預(yù)測技術(shù)(CELP) 的語音編碼算法在語音壓縮領(lǐng)域已經(jīng)相當(dāng)流行。
圖1顯示CELP初始語音編碼器，利用綜合分析法，綜合語音102和原始語音101之間的加權(quán)誤差109被減到最小，即最小化113。 W (z)是加權(quán)濾波器110。它對誤差信號111 進行加權(quán)濾波處理。1/B(z)是長項預(yù)測濾波器105, 1/A(z)是短項預(yù)測濾波器，標為103。編碼激勵108，又被稱作固化碼本(fixedcodebook)激勵，在通過線性濾波器前乘于增益Gc (標為106)。短項預(yù)測線性濾波(標為103)通過分析原始信號101完成，并由一個線性預(yù)測系
數(shù)集合表示<formula>formula see original document page 4</formula> (1)
加權(quán)濾波器(110 )涉及和用到上面的短項預(yù)測濾波。一個典型的加權(quán)濾波器可表示為 <formula>formula see original document page 4</formula> ②
其中<formula>formula see original document page 4</formula> 。長項預(yù)測(105)取決于基音周期和基音周期增益；對基音周期的估計基于原始信號、殘留信號或者加權(quán)原始信號。長項預(yù)測函數(shù)可表示為 <formula>formula see original document page 4</formula> (3)
編碼激勵(108 )通常由類似脈沖的信號或類似噪音的信號構(gòu)成，這些信號可用數(shù)學(xué)方法實時產(chǎn)生或者存到碼本中。最后，將編碼激勵指數(shù)，量化的增益指數(shù)，量化的長項預(yù)測參數(shù)指數(shù)和量化的短項預(yù)測參數(shù)指數(shù)傳到解碼器中。
圖2顯示初始的語音解碼器，在綜合語音后添加后處理單元207。解碼器由編碼激勵201、長項預(yù)測203、短項預(yù)測205、后期處理207等幾個單元組成。除后期處理單元，其它都和圖1中的編碼器定義相同。后期處理單元由短項后期處理和長項后期處理組成。
圖3顯示基本的CELP編碼器。它和圖1的唯一不同之處在于用含有過去的綜合激勵 304的自適應(yīng)碼本307來實現(xiàn)長項預(yù)測。語音的基音周期信息用來產(chǎn)生相應(yīng)的自適應(yīng)激勵分量。這一激勵分量將乘于一增益Gp (標為305)(也稱作周期增益)。兩個由增益控制幅度的激勵分量在通過短項預(yù)測濾波器(標為303)前被加到一起。這兩個增益變量(Gp和Gc306) 需量化，然后送到解碼器。自適應(yīng)碼本307激勵分量和固化碼本308激勵分量加在一起產(chǎn)生總的激勵e「"入
圖4顯示基本的CELP解碼器，它完全對應(yīng)于圖3中的編碼器，但在綜合語音407后添加了后處理單元408。這個解碼器除自適應(yīng)碼本外，其它類似于圖2。解碼器也由幾個單元組成，包括編碼激勵402、自適應(yīng)碼本401、短項預(yù)測406和后期處理408。除了后期處理單元，每個單元都和圖3中的編碼器有相同的定義。
固化碼本激勵308的產(chǎn)生方式有一個很長歷史。編碼激勵產(chǎn)生的設(shè)計受三個主要因素的影響。第一個是感性質(zhì)量；第二個是計算的復(fù)雜性；第三個是所需存儲空間的大小。
在下一節(jié)中將給出三個現(xiàn)有典型模型，和一個不同于三個現(xiàn)有模型的新的激勵模型，相比較而言，這種新模型在感性質(zhì)量、計算量和存儲需求方面都有優(yōu)點。

發(fā)明內(nèi)容
本發(fā)明的目的是提出了一個雙脈沖激勵的線性測編碼模型；它適用于中高比特率語音編解碼，能夠提高質(zhì)量并降低復(fù)雜性的雙脈沖激勵的線性測編碼。
本發(fā)明的雙脈沖激勵的線性測編碼，可以為語音信號或普通信號進行編解碼，其特征在于編解碼系統(tǒng)包含激勵或固化碼本激勵；激勵或固化碼本激勵包含多個脈沖對，稱作雙脈沖模型；雙脈沖模型意思是每對脈沖包含兩個相互毗鄰的脈沖。
所述雙脈沖模型可以是CELP編碼技術(shù)的一部分。
所述每對脈沖的位置是從一個有限的候選位置集合中選出的最佳位置，并將其位置指數(shù) 送到解碼器；每對脈沖的候選幅值可設(shè)計為有高通效應(yīng)和/或低通效應(yīng)；每對脈沖的幅值有一定的變化，使得每對脈沖的候選位置可以限制在一個相對較小的范圍內(nèi)，從而降低了查找最佳脈沖對的計算復(fù)雜性并極小化了局部誤差。
所述每對脈沖的幅值可以產(chǎn)生不同的高通效應(yīng)；
所述每對脈沖的幅值可以產(chǎn)生不同的低通效應(yīng)；
所述每對脈沖的幅值可以產(chǎn)生不同的高通效應(yīng)和低通效應(yīng)。
所述每對脈沖的幅值有著充分的可變性。
所述脈沖中至少有一對脈沖的候選位置集合可覆蓋(O, 1, 2， 3， 4, 5， 6， 7}。所述每對脈沖的最佳位置和幅值可以聯(lián)合査找。
本發(fā)明的雙脈沖激勵的線性測編碼，由于每一對脈沖的兩個脈沖都互相毗鄰。每對脈沖只需送一個脈沖位置指數(shù)到解碼器，這就節(jié)省了給所有脈沖位置編碼的編碼位數(shù)比特數(shù)。每對脈沖的幅值具有有限的模式數(shù)量。因為兩個脈沖相互毗鄰，不同的幅值組合就可以產(chǎn)生不同的高通和/或低通效應(yīng)。由于幅值有著充分的可變性，因此便可以在一個較小的范圍內(nèi)設(shè)置每對脈沖的候選位置，從而降低査找最佳位子的復(fù)雜性。適用于中高比特率語音編解碼。

圖1是初始CELP語音編碼器方框圖2是初始CELP語音解碼器方框圖3是基本的CELP編碼器方框圖4是基本的CELP解碼器方框圖；圖5是由隨機噪音激勵501組成的初始激勵模型圖；圖6是另一種基于脈沖的知名激勵模型圖，稱作多脈沖激勵；圖7是一種變型的脈沖激勵模型圖(也稱作ACELP激勵模型或二元激勵模型)；圖8是建議的雙脈沖激勵模型圖。
具體實施例方式
結(jié)合附圖對本發(fā)明作進一步描述如下以下的描述包括了相關(guān)的編碼激勵線性預(yù)測技術(shù)CELP的詳細信息。同時，熟悉相關(guān)技術(shù)的人會發(fā)現(xiàn)本方法可以實踐于其它各種不同的語音編碼技術(shù)算法中，而非只局限于本文所討論的應(yīng)用。此外，為了突出本發(fā)明的特性，本文對一些本技術(shù)領(lǐng)域內(nèi)的一般性知識細節(jié)并沒有討論。
本文附圖及其附帶說明也只是針對本發(fā)明的一些舉例。為了簡明扼要，其它應(yīng)用本發(fā)明的相關(guān)方法的實體將不一一詳細敘述或給出圖示。
圖3舉了一個能說明本發(fā)明的編碼器示例。參照圖3和圖4，對短項預(yù)測濾波器303的總激勵是由二個分量組成。一個來自于自適應(yīng)碼本307。另一個來自于編碼激勵108 :編碼激勵又被稱作固化碼本(fixed codebook)激勵。長項預(yù)測在濁音編碼中扮演著重要角色，這是由于濁音的強周期性。同時，相鄰的語音基音周期非常相似，這就導(dǎo)致下面表達式中激勵的基音周期增益G 305數(shù)值上很高。編碼激勵分量無論對濁音還是清音都很重要。組合后的總激勵可表達為
= G,^(") + GcA(") (4)
上式中ep"J)是以n為取樣序數(shù)的一個子幀，它從包含過去激勵304的自適應(yīng)碼本307得來&來自于作用于當(dāng)前激勵的編碼激勵碼本308 (又叫固化碼本fixed codebook)。對于濁音，e,的作用更顯著，周期增益^ 305是一個1附近的值。一般情況下激勵每一子幀更新一次。典型的幀長為20毫秒；子幀長為5毫秒。
固化碼本激勵308的產(chǎn)生方式有一個很長歷史。編碼激勵產(chǎn)生的設(shè)計受三個主要因素的影響。第一個是感性質(zhì)量；第二個是計算的復(fù)雜性；第三個是所需存儲空間的大小。下面將給出三個現(xiàn)有典型模型，和一個不同于三個現(xiàn)有模型的新的激勵模型。
圖5顯示由隨機噪音激勵501組成的初始激勵模型。該噪音激勵可以產(chǎn)生高質(zhì)量的清
音語音，但濁音語音的質(zhì)量卻不盡人意。由于假定每個取樣均為非零態(tài)，因此搜索最佳噪音
矢量的計算就相當(dāng)復(fù)雜。理論上，所有噪音候選矢量都需要存儲，以便選擇最佳的噪音矢量，并將其指數(shù)發(fā)送到解碼器。
圖6顯示另一種基于脈沖的知名激勵模型，稱作多脈沖'激勵，其中每個可能脈沖的脈沖位置和幅度都需要編碼并發(fā)送到解碼器。該脈沖激勵可以產(chǎn)生高質(zhì)量的濁音語音，但是此模型需要相對較高的比特率來對所有可能的脈沖位置和脈沖幅度進行編碼。
圖7顯示一種變型的脈沖激勵模型(也稱作ACELP激勵模型或二元激勵模型)，其中每個脈沖位置指數(shù)都需要發(fā)送到解碼器；但除了需要發(fā)送到解碼器的幅度符號(+l或-l)外，所有幅度都賦予常數(shù)值1。由于幅度是常數(shù)，因此節(jié)省了對幅度進行編碼的比特數(shù)，還節(jié)省了搜索最佳脈沖位置的計算量。同樣由于幅度是常數(shù)，需要對最佳二進制矢量進行更多的全局搜索，這在比特率增加時可能會降低效率。這是目前最流行的一種激勵模型，應(yīng)用于多個國際標準中，例如，ITU G. 729。
本發(fā)明將給出一個不同于上述三個現(xiàn)有模型的新的激勵模型，相比較而言，這種新模型在感性質(zhì)量、計算量和存儲需求方面都有優(yōu)點。這種新模型在此稱為雙脈沖激勵模型。
從圖8顯示的雙脈沖激勵模型中可以看到每對脈沖的兩個脈沖相互田比鄰，且僅需要向解碼器發(fā)送一個位置指數(shù)，與發(fā)送兩個脈沖位置相比，在對位置進行編碼時可以節(jié)省編碼位數(shù) (比持數(shù))。假設(shè)子幀長度有40個取樣；下面示例給出6對脈沖的候選位置(即每對脈沖的第一個脈沖位置)
第1對脈沖的候選位置
0，1, 2, 3， 4,5， 6, 7 第2對脈沖的候選位置
6， 7, 8， 9，10,11，12, 13 第3對脈沖的候選位置
12,13，14，15,16，17，18， 19 第4對脈沖的候選位置
18'19, 20, 21,22, 23， 24, 25 第5對脈沖的候選位置
25, 26， 27, 28' 29, 30， 31' 32
第6對脈沖的候選位置
32， 33, 34, 35, 36， 37, 38, 39 這組示例中，每對脈沖的位置編碼需要3位(比持)，并且要向解碼器發(fā)送最佳位置指數(shù)。
每對脈沖的幅值有有限的模式數(shù)量。幅值模式指數(shù)要送到解碼器。下面的例子為每對脈沖給出4組幅值模式(Pl， P2):
(1. ， -0.2)， (0.5， -0.2) , (1. , -0.85) ， (0.5, -0.85) 這組示例中，每對脈沖的幅值編碼需要2位(比持)，將最佳幅值編碼送到解碼器。因為兩個脈沖相互比鄰，不同的脈沖組合就可以產(chǎn)生不同的高通和低通效應(yīng)。圖8中脈沖對801和 804有低通效應(yīng)；脈沖對802和803有高通效應(yīng)。因此在設(shè)計語音編碼時，如果高通效應(yīng)要加強，脈沖對幅值的候選組合可以包含更多的高通模式，反之如果低通效應(yīng)要加強，脈沖對幅值的候選組合可以包含更多的低通模式。由于幅值不是常數(shù)，它們就有能量上的變化。這就使得可以在小范圍內(nèi)為每對脈沖指派合適的候選位置，而且可以在小范圍內(nèi)查找最佳雙脈沖組合并極小化加權(quán)誤差。例如，在位置集{0,1,2，3，4，5,6,7}中査找的復(fù)雜度要低于位置集{0，5， 10, 15, 20, 25, 30, 35}中査找的復(fù)雜度。每對脈沖的最佳位置和幅值可以進行聯(lián)合査找。
本發(fā)明可以有其他具體的不偏離其精髓或本質(zhì)特征的表現(xiàn)形式。文中所述的實例也只是具有說明性的而非嚴格限制性的意義。因此，較前面的敘述，后面的附加權(quán)利要求更明顯地體現(xiàn)了本發(fā)明的范圍。全部與權(quán)利要求的意義等價的變化都包含在這權(quán)利要求的范圍內(nèi)。
權(quán)利要求
1、一種雙脈沖激勵的線性測編碼，可以為語音信號或普通信號進行編解碼，其特征在于編解碼系統(tǒng)包含激勵或固化碼本激勵；激勵或固化碼本激勵包含多個脈沖對，稱作雙脈沖模型；雙脈沖模型意思是每對脈沖包含兩個相互毗鄰的脈沖。
2、如權(quán)利要求1所述的雙脈沖激勵的線性測編碼，其特征在于所述雙脈沖模型可以是 CELP編碼技術(shù)的一部分。
3、如權(quán)利要求1所述的雙脈沖激勵的線性測編碼其特征在于所述每對脈沖的位置是從一個有限的候選位置集合中選出的最佳位置，并將其位置指數(shù)送到解碼器；每對脈沖的候選幅值可設(shè)計為有高通效應(yīng)和/或低通效應(yīng)；每對脈沖的幅值有一定的變化，使得每對脈沖的候選位置可以限制在一個相對較小的范圍內(nèi)，從而降低了查找最佳脈沖對的計算復(fù)雜性并極小化了局部誤差。
4、如權(quán)利要求3所述的雙脈沖激勵的線性測編碼其特征在于所述每對脈沖的幅值可以產(chǎn)生不同的高通效應(yīng)；
5、如權(quán)利要求3所述的雙脈沖激勵的線性測編碼其特征在于所述每對脈沖的幅值可以產(chǎn)生不同的低通效應(yīng)；
6、如權(quán)利要求3所述的雙脈沖激勵的線性測編碼其特征在于所述每對脈沖的幅值可以產(chǎn)生不同的高通效應(yīng)和低通效應(yīng)。
7、如權(quán)利要求3所述的雙脈沖激勵的線性測編碼其特征在于所述每對脈沖的幅值有著充分的可變性。
8、如權(quán)利要求3所述的雙脈沖激勵的線性測編碼其特征在于至少有一對脈沖的候選位置集合可覆蓋{0， 1, 2, 3, 4, 5， 6, 7}。
9、如權(quán)利要求3所述的雙脈沖激勵的線性測編碼其特征在于所述每對脈沖的最佳位置和幅值可以聯(lián)合査找。
全文摘要
本發(fā)明的雙脈沖激勵的線性測編碼，可以為語音信號或普通信號進行編解碼，所述編解碼系統(tǒng)包含激勵或固化碼本激勵；激勵或固化碼本激勵包含多個脈沖對，稱作雙脈沖模型；雙脈沖模型意思是每對脈沖包含兩個相互毗鄰的脈沖。由于每一對脈沖的兩個脈沖都互相毗鄰，每對脈沖只需送一個脈沖位置指數(shù)到解碼器，這就節(jié)省了給所有脈沖位置編碼的編碼位數(shù)比特數(shù)，又因每對脈沖的幅值具有有限的模式數(shù)量，利用不同的幅值組合就可以產(chǎn)生不同的高通和/或低通效應(yīng)。使幅值有著充分的可變性，因此便可以在一個較小的范圍內(nèi)設(shè)置每對脈沖的候選位置，從而降低查找最佳位置的復(fù)雜性。
文檔編號G10L19/00GK101286321SQ20071019427
公開日2008年10月15日申請日期2007年12月12日優(yōu)先權(quán)日2006年12月26日
發(fā)明者揚高申請人:揚高

完整全部詳細技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：高揚
技術(shù)所有人：高揚
我是此專利的發(fā)明人

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

脈沖編碼器檢測線速度相關(guān)技術(shù)

線性預(yù)測編碼相關(guān)技術(shù)

lpc線性預(yù)測編碼相關(guān)技術(shù)

碼激勵線性預(yù)測相關(guān)技術(shù)

線性調(diào)頻信號脈沖壓縮相關(guān)技術(shù)

線性調(diào)頻脈沖相關(guān)技術(shù)

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

雙脈沖激勵的線性測編碼的制作方法