欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

使用共振峰增強(qiáng)提取話音共振峰軌跡的方法

文檔序號:2837061閱讀:1275來源:國知局
專利名稱:使用共振峰增強(qiáng)提取話音共振峰軌跡的方法
技術(shù)領(lǐng)域
本發(fā)明涉及一種語音信號共振峰軌跡的提取方法,尤其涉及一種能夠同時(shí)準(zhǔn)確提取第一、第二、第三、第四和第五共振峰軌跡的簡便方法。
背景技術(shù)
共振峰是表征語音信號特征的基本參數(shù)之一,它在語音信號合成、語音識別和語音編碼等方面起著重要作用。共振峰可以等效為聲道系統(tǒng)函數(shù)的復(fù)極點(diǎn)對,由于人的聲道平均長度約為17cm,而語音信號的能量主要集中在0~5kHz,因此語音通常包含4到5個(gè)穩(wěn)定的幅度較強(qiáng)的共振峰。
目前,線性預(yù)測分析(LPC)法仍然是計(jì)算速度比較快而又較為有效的共振峰頻率估計(jì)方法之一。聲道的系統(tǒng)函數(shù)可以由一組線性預(yù)測系數(shù)(LPC)唯一確定,因此通過LPC分析能估計(jì)出聲道調(diào)制的效果,即獲得共振峰參數(shù)。具體來說,LPC分析共振峰頻率有兩種方式,一種是通過求解逆濾波器A(z)的分母多項(xiàng)式的復(fù)根來得到共振峰。但是,高階多項(xiàng)式的根無統(tǒng)一表達(dá)式,只能用近似法(例如牛頓法、林士鄂-趙訪熊法等)求解,因而該方法的運(yùn)算量較大,且求根的遞歸過程有可能發(fā)散,所以已不被廣泛使用;另一種是峰值檢測法,即利用LPC系數(shù)求出聲道系統(tǒng)函數(shù)的LPC譜,然后通過搜索LPC譜中的峰值位置來得到共振峰頻率。由于共振峰可出現(xiàn)在任何頻率上,所以現(xiàn)有技術(shù)已嘗試在確認(rèn)最有可能的共振峰之前,限制查找空間。在現(xiàn)有技術(shù)的其它共振峰軌跡提取系統(tǒng)中,也已嘗試通過將語音幀的頻譜內(nèi)容與一組已由專家識別出其共振峰的頻譜模板相比較來減少查找空間。雖然減少查找空間的系統(tǒng)運(yùn)行得很高效,但是它們易于發(fā)生錯(cuò)誤,因?yàn)樵跍p少查找空間的同時(shí)它們也會把真正的共振峰頻率排除在外。
LPC分析在大多數(shù)情況下能成功提取語音的共振峰參數(shù),但是在某些情況下會發(fā)生下列現(xiàn)象,從而造成共振峰頻率的誤判或漏判。(1)假峰干擾語音信號的LPC譜峰一般是由共振峰引起的,但有時(shí)也會出現(xiàn)假峰。例如,為近視聲門、唇輻射和鼻腔的譜效應(yīng),通常會在LPC模型中附加2~4個(gè)極點(diǎn),這就有可能在LPC頻譜上造成假峰。這個(gè)假峰有時(shí)會被當(dāng)作共振峰,從而引起各階共振峰的誤判。雖然共振峰的帶寬比較窄,一般小于300Hz,可以設(shè)置門限來排除假峰,但由于LPC算法對共振峰帶寬的估計(jì)并不精確,所以效果不甚理想。(2)共振峰丟失有些語音信號的共振峰強(qiáng)度較弱,帶寬較大;或者由于鼻腔的影響,共振峰的強(qiáng)度被削弱,這種情況經(jīng)常發(fā)生在第二共振峰上。這時(shí)從頻譜上看不到明顯的峰,即使通過求根法求出相應(yīng)的極點(diǎn),也會因其Q值過小而被丟棄。(3)共振峰合并有時(shí)侯兩個(gè)共振峰靠得很近,如果它們的強(qiáng)度相近而帶寬又較大,就會合并成一個(gè)峰;如果其中一個(gè)強(qiáng)度較強(qiáng)而另一個(gè)較弱的話,那么較弱的一個(gè)就會被較強(qiáng)的一個(gè)所掩蓋,或發(fā)生“騎峰”現(xiàn)象。這在通過尋找頻譜上的極值來提取共振峰時(shí)將引起誤判。盡管可以利用FFT(快速傅立葉變換)譜輔助完成共振峰的提取和判決,但還是難以在所需頻率范圍內(nèi)精確地提取共振峰。
微軟公司申請了中國專利“使用殘差模型用于共振峰追蹤的方法和裝置”,其申請(專利)號為200410034242.9,申請日2004.04.01;公開(公告)號CN1534596;公開(公告)日2004.10.06。該發(fā)明公開了一種共振峰追蹤的方法一種追蹤共振峰的方法定義包含待查找的共振峰組的一個(gè)共振峰查找空間。通過使用碼本查找整個(gè)共振峰查找空間來確認(rèn)說話語音中第一幀的共振峰,而對余下的各幀使用碼本和相鄰幀間的連續(xù)性制約來查找同樣的空間。在一個(gè)實(shí)施例中,通過映射共振峰組到特征向量以及應(yīng)用該特征向量到一模型來確認(rèn)共振峰。也可通過應(yīng)用動(dòng)態(tài)規(guī)劃,查找最優(yōu)地滿足該模型所要求的連續(xù)性制約的最佳序列來確認(rèn)共振峰。
LG電子株式會社了中國專利“共振峰析取方法”,其申請(專利)號為200410083512.5;申請日2004.10.08;公開(公告)號CN1606062;公開(公告)日2005.04.13。該發(fā)明公開了一種共振峰析取方法在用較少計(jì)算復(fù)雜性、能夠精確地按話音的諧振頻率獲得共振峰的共振峰析取法中,所述方法包括通過譜峰值采集法搜索最大值,判斷符合獲得的最大點(diǎn)處的零點(diǎn)的共振峰數(shù)目是否為兩個(gè),并且當(dāng)共振峰數(shù)目判斷為兩個(gè)時(shí),通過根精加工分析相關(guān)根。通過應(yīng)用柯西積分公式判斷共振峰的數(shù)目,其中不重復(fù)應(yīng)用柯西積分公式,而僅在z域內(nèi)的最大值的周圍部分中應(yīng)用。
三星電子株式會社申請了中國專利“使用共振峰增強(qiáng)對話的方法和裝置”,其申請(專利)號為200410091112.9;申請日2004.11.18;公開(公告)號CN1619646;公開(公告)日2005.05.25。該發(fā)明公開了一種共振峰增強(qiáng)的方法一種提升對話區(qū)域的共振峰而不改變聲音區(qū)域的對話增強(qiáng)方法和裝置,包括基于來自輸入信號的線性預(yù)測編碼(LPC)來計(jì)算線譜對(LSP)系數(shù);基于計(jì)算出的LSP系數(shù)確定輸入信號中是否存在語音區(qū)域;和根據(jù)是否存在語音區(qū)域來從LSP系數(shù)中提取共振峰,并提升共振峰。
上面提及的獲取共振峰軌跡的傳統(tǒng)方法,可靠性差、計(jì)算復(fù)雜。

發(fā)明內(nèi)容
本發(fā)明目的是克服上述不足和問題,提出一種通過建立共振峰增強(qiáng)的語音聲管模型,有效對各階共振峰的幅度進(jìn)行增強(qiáng),從而提高檢測共振峰頻率的準(zhǔn)確性和可靠性。本發(fā)明目的在于利用傳統(tǒng)的LPC分析計(jì)算共振峰增強(qiáng)譜,并在譜峰搜索算法中采用二次搜索方法,提高共振峰頻率的檢測精度和速度。本發(fā)明目的在于通過適當(dāng)?shù)念A(yù)加重濾波器處理所接收的話音信號;以及步長移動(dòng)獲得分析幀;計(jì)算得到共振峰增強(qiáng)譜;提供一種計(jì)算相對不復(fù)雜的、可以精確提取語音信號中第一、第二、第三、第四和第五共振峰軌跡的方法。本發(fā)明在語音合成、語音編碼和語音識別方面獲得廣泛的應(yīng)用。
本發(fā)明的技術(shù)方案是使用共振峰增強(qiáng)提取話音共振峰軌跡的方法,首先建立話音的共振峰增強(qiáng)的聲管模型;設(shè)定共振峰增強(qiáng)系數(shù);獲得共振峰增強(qiáng)譜;然后直接利用線性預(yù)測分析得到共振峰增強(qiáng)譜,用二次搜索算法從共振峰增強(qiáng)譜中提取出分析幀的共振峰頻率,同時(shí)記錄下第一、第二、第三、第四和第五共振峰的頻率。最后輸出分析幀的共振峰序列就是語音信號的共振峰軌跡;使用提取的共振峰軌跡作為話音識別的特證向量。使用提取的共振峰軌跡作為說話人識別的特證向量;提取的共振峰軌跡用于共振峰聲碼器。
該發(fā)明的共振峰增強(qiáng)的話音聲管模型該模型在提高聲道諧振峰Q值的同時(shí),保持聲道的諧振頻率不變。然后得到該聲管的全極點(diǎn)模型,其系統(tǒng)函數(shù)V(z)的定義如下。其中,G為系統(tǒng)增益;μm(m=1,2,...,M-1)是聲管的能量反射系數(shù)。z=e2πf,f是頻率。
V(z)=G1-μG1-μM-1-μM-1z-1z-1···1-μ1-μ-z-1z-11-μo-μoz-1z-110---(1)]]>在共振峰增強(qiáng)的全極點(diǎn)模型中設(shè)置合適的共振峰增強(qiáng)系數(shù),得到對應(yīng)的線性預(yù)測模型。線性預(yù)測模型可用Levinson-Durbin遞推算法求解。
(1)EN0=φ^N---(0)]]>(2)ki=[φ^N(i)-Σj=1i-1aji-1φ^N(i-j)]/ENi-1]]>(3)ai1=ki]]>(4)aji=aji-1-kiai-ji-1,1≤j<i-1]]>(5)ENi=(1-ki2)ENi-1]]>(6)if i<P goto(1)(7)aj=ajP,1≤j≤P]]>其中, 為LPC預(yù)測輸出的N點(diǎn)序列{xi}的自相關(guān)函數(shù)的估計(jì)量,其表達(dá)式如下φ^N(j)=1NΣi=1N-jxixi+j,j=0,1,...,P---(2)]]>算法開始時(shí),p=0,EN0=φ^(0),]]>a0=1,逐步遞推出{ai1,i=1},EN1;{ai2,i=1,2},EN2;直到{aiP,i=1,2,...,P},ENP。
本發(fā)明利用傳統(tǒng)線性預(yù)測算法得到共振峰增強(qiáng)譜。這里的Levinson-Durbin遞推算法只是求解線性預(yù)測模型的一種方法。本發(fā)明的共振峰增強(qiáng)算法同樣適用于線性預(yù)測模型的其它求解方法。
本發(fā)明從共振峰增強(qiáng)聲管模型獲得z域系統(tǒng)函數(shù)。設(shè)定恰當(dāng)?shù)墓舱穹逶鰪?qiáng)系數(shù)。根據(jù)共振峰軌跡條數(shù)設(shè)定恰當(dāng)?shù)木€性預(yù)測階數(shù),可使用線性預(yù)測方法計(jì)算共振峰增強(qiáng)譜。在共振峰增強(qiáng)譜中用二次快速搜索算法提取共振峰。
本發(fā)明還包括接收話音信號;以適當(dāng)?shù)念A(yù)加重濾波器處理所接收的話音信號;以適當(dāng)?shù)牟介L移動(dòng)獲得分析幀;對分析幀進(jìn)行時(shí)域加窗處理;本發(fā)明在具體實(shí)施過程中,用如下數(shù)字濾波器對語音信號進(jìn)行了預(yù)加重。
H(z)=1-0.95z-1(3)本發(fā)明在具體實(shí)施過程中,采用相互重疊的語音分析幀,幀長在10ms~40ms之間,幀移在5ms~20ms之間。
本發(fā)明在具體實(shí)施過程中,分析幀的能量E用下式計(jì)算。其中,x(n)是分析幀內(nèi)的語音信號,N是幀的長度,N為正整數(shù)。
E=Σn=1Nx2(n)---(4)]]>本發(fā)明在具體實(shí)施過程中,分析幀的過零率Z用式(5)計(jì)算。其中,x(n)是分析幀內(nèi)的語音信號,N是幀的長度,N為正整數(shù)。sgn[*]是符號函數(shù),如式(6)所示。
z=Σn=1N-1|sgn[x(n)]-sgn[x(n+1)]|·u[|x(n)-x(n+1)|-δ]---(5)]]>sgn(x)=1,x>00,x=0-1,x<0---(6)]]>u(x)=1,x≥00,x<0---(7)]]>其中,δ是過零率門限參數(shù),取值范圍在0.01~0.1之間。
本發(fā)明在具體實(shí)施過程中,利用幀能量門限和過零率門限判斷幀的類別。若該幀為清音幀,則標(biāo)記為清音后轉(zhuǎn)入下一幀處理;若該幀為濁音幀,則計(jì)算其共振峰增強(qiáng)譜。并在共振峰增強(qiáng)譜中搜索譜峰極值。為進(jìn)一步提高算法的實(shí)時(shí)性,先在共振峰增強(qiáng)譜的一個(gè)較大范圍內(nèi)進(jìn)行第一次搜索,然后在第一次搜索的結(jié)果中,用一個(gè)較小的步長作最終的峰值檢測。記錄下檢測結(jié)果后轉(zhuǎn)入下一幀。當(dāng)所有分析幀都分析完成后,提取各幀的共振峰序列就得到輸入語音信號的第一、第二、第三、第四和第五共振峰的軌跡。
本發(fā)明特點(diǎn)是提出的共振峰增強(qiáng)提取共振峰軌跡的方法不同于現(xiàn)有方法。本方法首先建立共振峰增強(qiáng)的話音聲管模型,然后直接利用線性預(yù)測分析得到共振峰增強(qiáng)譜,用二次搜索算法從共振峰增強(qiáng)譜中提取出分析幀的共振峰,最后輸出分析幀的共振峰序列就是語音信號的共振峰軌跡。
該方法從建立共振峰增強(qiáng)的語音聲管模型出發(fā),利用線性預(yù)測分析得到語音信號的共振峰增強(qiáng)譜,應(yīng)用二次搜索算法從共振峰增強(qiáng)譜中快速準(zhǔn)確地提取出語音信號的第一、第二、第三、第四和第五共振峰軌跡。
本發(fā)明的優(yōu)點(diǎn)是1、通過建立共振峰增強(qiáng)的語音聲管模型,能有效對各階共振峰的幅度進(jìn)行增強(qiáng),從而提高檢測共振峰頻率的準(zhǔn)確性和可靠性。
2、算法簡便,實(shí)時(shí)性強(qiáng)。本發(fā)明利用傳統(tǒng)的LPC分析計(jì)算共振峰增強(qiáng)譜,且基本不需要在分析之后附加其它的檢錯(cuò)算法或平滑算法,因此其算法簡便,此外,在譜峰搜索算法中采用二次搜索方法,進(jìn)一步提高了共振峰頻率的檢測速度。
3、本發(fā)明中使用的共振峰增強(qiáng)方法在語音合成、語音編碼和語音識別方面有極大的應(yīng)用前景。該方法與以往技術(shù)根本不同,與已經(jīng)申請或者公開的發(fā)明無沖突。
所包含的用以提供對本發(fā)明的進(jìn)一步理解、并結(jié)合在本說明書中以構(gòu)成其一部分的附圖,顯示出本發(fā)明的實(shí)施例,并且連同說明書一起用以解釋本發(fā)明的原理。附圖中以參考標(biāo)號表示了本發(fā)明的特征、要素及方面代表了一個(gè)或多個(gè)實(shí)施例中相同、相當(dāng)、或類似的特征、要素或方面。


圖1是根據(jù)本發(fā)明的一個(gè)實(shí)施例的流程圖。
圖2是語音信號分析幀的LPC譜。
圖3是本發(fā)明中語音信號分析幀的共振峰增強(qiáng)譜。
圖4是實(shí)施例中某個(gè)待分析的語音信號x。
圖5是應(yīng)用本發(fā)明提取的語音信號x的第一、第二、第三、第四和第五共振峰軌跡。
具體實(shí)施例方式
下面將對本發(fā)明進(jìn)行具體說明,這些都是本發(fā)明具體的實(shí)際操作范例,而本發(fā)明并不僅僅局限于此。
圖1示出一個(gè)可實(shí)現(xiàn)本發(fā)明的算法流程圖。它只是合適的計(jì)算流程的一個(gè)實(shí)例,而非試圖對本發(fā)明的使用或功能范圍作出限制。本發(fā)明可運(yùn)行于許多其它基于一般或特殊目的計(jì)算機(jī)系統(tǒng)環(huán)境和配置。適合本發(fā)明使用的著名計(jì)算機(jī)系統(tǒng)環(huán)境或配置的例子包括,而非限制,個(gè)人電腦、服務(wù)器、手持式或膝上型裝置、多處理器系統(tǒng)、基于微處理器的系統(tǒng)、機(jī)頂盒、可編程消費(fèi)電子元件、網(wǎng)絡(luò)PC、微型計(jì)算機(jī)、大型主機(jī)電腦、電話系統(tǒng)和包括所有上述系統(tǒng)和裝置的分布計(jì)算環(huán)境等等。
本發(fā)明在由計(jì)算機(jī)執(zhí)行的諸如程序模塊等計(jì)算機(jī)可執(zhí)行指令的一般上下文環(huán)境中被描述。通常,程序模塊包括運(yùn)行特定任務(wù)或?qū)崿F(xiàn)特定抽象數(shù)據(jù)類型的例行程序、程序、對象、組件、數(shù)據(jù)結(jié)構(gòu)等。本發(fā)明設(shè)計(jì)運(yùn)行在分布計(jì)算環(huán)境中,由通過通信網(wǎng)絡(luò)連接的遠(yuǎn)程處理裝置來執(zhí)行任務(wù)。在分布計(jì)算環(huán)境中,程序模塊位于本地和遠(yuǎn)程的計(jì)算機(jī)存儲介質(zhì)中,包括記憶存儲裝置。
圖2是語音分析幀的LPC譜。圖3是語音分析幀的共振峰增強(qiáng)譜??梢娫谠搸盘柕腖PC譜中,第4和第5共振峰之間存在不太明顯的“騎峰”,而LPC增強(qiáng)譜的各階共振峰則很突出,且其位置與LPC譜峰的位置相同。
圖3是實(shí)施例中某個(gè)待分析的語音信號x。用共振峰增強(qiáng)算法得到的語音信號x的第一、第二、第三、第四和第五共振峰軌跡。
本發(fā)明的處理過程開始;(1)語音信號輸入、(2)預(yù)加重、(3)幀移、(4)判斷信號結(jié)束?是則進(jìn)入(15)取出共振峰序列;(5)否則進(jìn)行分幀加窗;(6)計(jì)算幀能量、(7)計(jì)算幀過零Z并進(jìn)行判斷,(8)利用幀能量門限和過零率門限判斷幀的類別,Z>ZTh;E<ETh是否成立;是則進(jìn)入(9),否則進(jìn)入(3);(9)標(biāo)記為清輔音并進(jìn)入幀移輸入端;(10)設(shè)定共振峰增強(qiáng)系數(shù);設(shè)定線性預(yù)測階數(shù);(11)獲得共振峰增強(qiáng)后的線性預(yù)測系數(shù);(12)獲得共振峰的增強(qiáng)譜;(13)搜索譜的極大值;(14)記錄該幀的共振峰頻率;(15)取出共振峰序列并結(jié)束。ZTh是幀過零的閾值,一般取值范圍為10~100;ETh定義為幀能量閾值,一般取值范圍為0.2~20。
計(jì)算分析幀的幀能量;計(jì)算分析幀的幀過零率;根據(jù)設(shè)定的幀能量門限和幀過零率門限判定分析幀的類型;當(dāng)分析幀是濁音幀時(shí),指定一個(gè)適當(dāng)?shù)墓舱穹逶鰪?qiáng)系數(shù);指定一個(gè)適當(dāng)?shù)木€性預(yù)測分析的階數(shù);計(jì)算得到共振峰增強(qiáng)譜;在共振峰增強(qiáng)譜中用二次搜索法提取多個(gè)極大值的位置;用逐幀記錄的共振峰頻率生成共振峰軌跡。
對接收的話音信號進(jìn)行頻域預(yù)加重。話音分析幀的長度范圍在10ms~40ms。話音分析幀的幀移范圍在5ms~20ms。話音分析幀的窗函數(shù)是漢明窗或矩形窗。
計(jì)算分析幀的能量和計(jì)算分析幀的過零率。根據(jù)能量門限和過零率門限判斷分析幀的類型。
對于濁音幀,設(shè)定恰當(dāng)?shù)墓舱穹逶鰪?qiáng)系數(shù)。對于濁音幀,設(shè)定恰當(dāng)?shù)木€性預(yù)測系數(shù)。
計(jì)算濁音幀的共振峰增強(qiáng)譜。對于濁音幀,用二次搜索算法在共振峰增強(qiáng)譜中提取出與共振峰頻率對應(yīng)的多個(gè)極大值的位置。從分析幀的共振峰頻率最終生成語音信號的多條共振峰軌跡。
本發(fā)明可先在共振峰增強(qiáng)譜的一個(gè)較大范圍內(nèi)進(jìn)行第一次搜索,然后在第一次搜索的結(jié)果中,用一個(gè)較小的步長作最終的峰值檢測。記錄下檢測結(jié)果后轉(zhuǎn)入下一幀。當(dāng)所有分析幀都分析完成后,提取各幀的共振峰序列就得到輸入語音信號的第一、第二、第三、第四和第五共振峰的軌跡。
權(quán)利要求
1.使用共振峰增強(qiáng)提取話音共振峰軌跡的方法,其特征是首先建立話音的共振峰增強(qiáng)的聲管模型;設(shè)定共振峰增強(qiáng)系數(shù);獲得共振峰增強(qiáng)譜;然后直接利用線性預(yù)測分析得到共振峰增強(qiáng)譜,用二次搜索算法從共振峰增強(qiáng)譜中提取出分析幀的共振峰頻率,同時(shí)記錄下第一、第二、第三、第四和第五共振峰的頻率;最后輸出分析幀的共振峰序列就是語音信號的共振峰軌跡。
2.根據(jù)權(quán)利要求1所述的使用共振峰增強(qiáng)提取話音共振峰軌跡的方法,其特征是處理過程是開始;(1)語音信號輸入、(2)預(yù)加重、(3)幀移、(4)判斷信號結(jié)束?是則進(jìn)入(15)取出共振峰序列;否則進(jìn)行(5)分幀加窗;(6)計(jì)算幀能量;(7)計(jì)算幀過零Z并進(jìn)行判斷;(8)利用幀能量門限和過零率門限判斷幀的類別,Z>ZTh; E<ETh是否成立;是則進(jìn)入(9),否則進(jìn)入(3);(9)標(biāo)記為清輔音并進(jìn)入幀移輸入端;(10)設(shè)定共振峰增強(qiáng)系數(shù);設(shè)定線性預(yù)測階數(shù);(11)獲得共振峰增強(qiáng)后的線性預(yù)測系數(shù);(12)獲得共振峰的增強(qiáng)譜;(13)搜索譜的極大值;(14)記錄該幀的共振峰頻率;(15)取出共振峰序列并結(jié)束;ZTh幀過零的閾值,取值范圍為10~100;ETh定義為幀能量閾值,取值范圍為0.2~20。
3.據(jù)權(quán)利要求1所述的使用共振峰增強(qiáng)提取話音共振峰軌跡的方法,其特征是使用提取的共振峰軌跡作為話音識別的特證向量,使用提取的共振峰軌跡作為說話人識別的特證向量;提取的共振峰軌跡用于共振峰聲碼器。
4.據(jù)權(quán)利要求1所述的使用共振峰增強(qiáng)提取話音共振峰軌跡的方法,其特征是采用的共振峰增強(qiáng)的話音聲管模型其系統(tǒng)函數(shù)V(z)的定義如下;其中,G為系統(tǒng)增益;μm(m=1,2,...,M-1)是聲管的能量反射系數(shù),z=e2πf,f是頻率V(z)=G1-μG1-μM-1-μM-1z-1z-1···1-μ1-μ1z-1z-11-μ0-μ0z-1z-110---(1)]]>在共振峰增強(qiáng)的全極點(diǎn)模型中設(shè)置合適的共振峰增強(qiáng)系數(shù),得到對應(yīng)的線性預(yù)測模型,線性預(yù)測模型用Levinson-Durbin遞推算法求解;(1)---EN0=φ^N(0)]]>(2)---ki=[φ^N(i)-Σj-1i-1aji-1φ^n(i-j)]/Eni-1]]>(3)---aii=ki]]>(4)---aji=aji-1-kiai-ji-1,1≤j<i-1]]>(5)---ENi=(1-ki2)ENi-1]]>(6)if i<P goto (1)(7)---aj=ajP,1≤j≤P]]>其中, 為LPC預(yù)測輸出的N點(diǎn)序列{xi}的自相關(guān)函數(shù)的估計(jì)量,其表達(dá)式如下φ^N(j)=1NΣi=1N-jxixi+j,j=0,1,...,P---(2)]]>算法開始時(shí),p=0,EN0=φ^(0),]]>a0=1,逐步遞推出{ai1,i=1},EN1;{ai2,i=1,2},EN2;直到{aiP,i=1,2,...,P},ENP。
5.根據(jù)權(quán)利要求1所述的使用共振峰增強(qiáng)提取話音共振峰軌跡的方法,其特征是在共振峰增強(qiáng)譜中用二次快速搜索算法提取共振峰。
6.根據(jù)權(quán)利要求1所述的使用共振峰增強(qiáng)提取話音共振峰軌跡的方法,其特征是接收話音信號;以預(yù)加重濾波器處理所接收的話音信號;以步長移動(dòng)獲得分析幀;對分析幀進(jìn)行時(shí)域加窗處理;話音分析幀的窗函數(shù)是漢明窗或矩形窗。
7.根據(jù)權(quán)利要求1所述的使用共振峰增強(qiáng)提取話音共振峰軌跡的方法,其特征是用如下數(shù)字濾波器對語音信號進(jìn)行了預(yù)加重H(z)=1-0.95z-1(3)相互重疊的語音分析幀,幀長在10ms~40ms之間,幀移在5ms~20ms之間。
8.根據(jù)權(quán)利要求1所述的使用共振峰增強(qiáng)提取話音共振峰軌跡的方法,其特征是分析幀的能量E用下式計(jì)算其中,x(n)是分析幀內(nèi)的語音信號,N是幀的長度,N為正整數(shù)。E=Σn=1Nx2(n)---(4)]]>
9.根據(jù)權(quán)利要求1所述的使用共振峰增強(qiáng)提取話音共振峰軌跡的方法,其特征是分析幀的過零率Z用式(5)計(jì)算。其中,x(n)是分析幀內(nèi)的語音信號,N是幀的長度,N為正整數(shù)。sgn[*]是符號函數(shù),如式(6)Z=Σn=1N-1|sgn[x(n)]-sgn[x(n+1)]|·u[|x(n)-x(n+1)|-δ]---(5)]]>sgn(x)=1,x>00,x=0-1,x<0---(6)]]>u(x)=1,x≥00,x<0---(7)]]>其中,δ是過零率門限參數(shù),取值范圍在0.01~0.1之間。
全文摘要
使用共振峰增強(qiáng)提取話音共振峰軌跡的方法,處理過程是(1)語音信號輸入、(2)預(yù)加重、(3)幀移、(4)判斷信號結(jié)束?是則進(jìn)入(15)取出共振峰序列;否則進(jìn)行(5)分幀加窗;(6)計(jì)算幀能量;(7)計(jì)算幀過零Z并進(jìn)行判斷;(8)利用幀能量門限和過零率門限判斷幀的類別,Z>Z
文檔編號G10L19/00GK101067929SQ200710023479
公開日2007年11月7日 申請日期2007年6月5日 優(yōu)先權(quán)日2007年6月5日
發(fā)明者王宏, 潘金貴 申請人:南京大學(xué)
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1
河北省| 建宁县| 平阳县| 顺昌县| 阳高县| 洛宁县| 马龙县| 临泉县| 靖远县| 崇阳县| 桦甸市| 岳西县| 武宁县| 田东县| 金坛市| 咸丰县| 玉门市| 岳阳县| 尚志市| 闽侯县| 泰顺县| 天全县| 浮山县| 龙州县| 丹寨县| 齐河县| 缙云县| 车致| 仪征市| 阳信县| 桃源县| 青冈县| 灵丘县| 紫阳县| 中阳县| 周至县| 互助| 屏南县| 沈丘县| 焦作市| 苏尼特左旗|