欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

語言活動性檢測器的制作方法

文檔序號:2819572閱讀:235來源:國知局
專利名稱:語言活動性檢測器的制作方法
語音活動性檢測器是一種通過向其提供信號輸入以達到檢測語音時間段或僅包含噪聲的時間段的目的的裝置。雖然本發(fā)明不局限于此,但這種檢測器特別感興趣的一種應(yīng)用是在移動無線電電話系統(tǒng)中,在這種移動無線電電話系統(tǒng)中可以利用有關(guān)語音存在與否的知識在寂靜期間關(guān)閉發(fā)射機來減小功率消耗和干擾。在這種移動無線電電話系統(tǒng)中,(車載單元的)噪聲電平通常是較高的。在無線電系統(tǒng)中的另一種可能的應(yīng)用是改善無線電頻譜的有效利用。


圖1表示在國際專利申請WO89/08910中描述的語音活動性檢測器。
在噪聲的語音信號在輸入端1被接收。存儲器2中存儲有確定噪聲頻譜的估算或模型的數(shù)據(jù);將這一數(shù)據(jù)與當(dāng)前信號的頻譜進行比較(3)來獲得與閾值進行比較(4)的相似性度量。為了跟蹤噪聲分量的變化,僅當(dāng)無語音時才根據(jù)輸入更新噪聲模型。并且,還可以調(diào)整閾值(適配器6)。
為了保證僅在只存在噪聲的期間內(nèi)進行調(diào)整,以免出現(xiàn)因錯誤判斷造成的累積的錯誤調(diào)整的危險,在輔助檢測器7的控制下進行調(diào)整,該輔助檢測器7包括非發(fā)聲語音檢測器(unvoicedspeech detector)8和發(fā)聲語音檢測器(Voiced speech detector)9如果這兩個檢測器中的任何一個識別了語音,檢測器7就認(rèn)為存在語音,并且禁止主檢測器的更新和閾值調(diào)整。一般來說,非發(fā)聲語音檢測器8獲得信號的一組LPC系數(shù)并在連續(xù)的幀周期之間比較這些系數(shù)的自相關(guān)函數(shù),發(fā)聲語音檢測器9檢測LPC殘留信號的自相關(guān)的變化。
這一裝置在區(qū)分語音期間和只接收有噪聲的期間方面非常有效。但是,產(chǎn)生了這樣的問題,即信號音(signalling tones)經(jīng)常被輔助檢測器認(rèn)為只是噪聲(即不將它們識別為語音),因此主檢測器就當(dāng)這些信號音為噪聲而去適應(yīng)它們,這些信號音的傳輸被阻止,或者至少過早地將其加以終止。
這一問題可以通過提供一些分別被調(diào)諧到某個特定信號音頻率的檢音器(tone detector)來克服;但是,不可忽視世界上的不同信號音的多種多樣性,因此,為了例如使正在打國際電話的移動電話用戶能夠可靠地聽到“占線”音而不管其來自哪一個國家,就需要大量的不同的檢測器。
根據(jù)本發(fā)明,提供了一種用于檢測輸入信號中語音的存在的語音活動性檢測器,它包括(a)存儲輸入信號噪聲分量的估算值的裝置;(b)識別輸入信號和被存儲的估算值的頻譜相似性以便產(chǎn)生一個輸出判定信號的裝置;(c)更新被存儲的估算值的裝置;(d)輔助檢測器,用于控制更新裝置,以便僅當(dāng)輔助檢測器指出在輸入信號中無語音時才進行更新;其特征在于,用于計算輸入信號的預(yù)測增益參數(shù)的裝置,以及用于在預(yù)測增益超過閾值時禁止更新的修正裝置。
現(xiàn)在參看附圖舉例描述本發(fā)明的某些實施例,附圖中圖2是根據(jù)本發(fā)明一個方面的具有語音活動性檢測器的語音編碼器的方框圖;圖3和4用圖形表示各種輸入信號的預(yù)測增益值;圖5、6和7是本發(fā)明其它實施例的方框圖。
在圖2中,傳統(tǒng)語音編碼器100具有語音輸入端101,語音信號被模數(shù)變換器102以8KHz的頻率進行取樣和變換為數(shù)字形式。開窗口單元(Windowing unit)103將語音樣值劃分成為(例如)160個樣值的幀(即20ms的幀)、并將其乘以一個可減小在幀的開始和結(jié)束處的樣值的貢獻的漢明(Hamming)窗口或其它函數(shù)。相關(guān)器104接收數(shù)字化語音樣值并產(chǎn)生每一幀的自相關(guān)系數(shù)Pi。LPC分析單元105計算具有相應(yīng)于輸入語音信號頻譜的頻率響應(yīng)的濾波器(它有時稱為綜合濾波器)的系數(shù)ai,這里,采用例如列文森-德賓(Levinson-Durbin)或肖思(schurr)算法的已知方法。
數(shù)字化輸入信號還通過被這些系數(shù)控制的反濾波器(或分析濾波器)106,以便產(chǎn)生出被長期預(yù)測器分析單元107進一步分析的殘留信號,該長期預(yù)測器分析單元107計算根據(jù)其先前值來預(yù)測LPC殘留信號的最佳延遲以及該預(yù)測值的相應(yīng)增益值。分析單元106還產(chǎn)生第二殘留信號(即當(dāng)前LPC殘留信號和被所獲得的參數(shù)延遲和定標(biāo)的LPC殘留信號之間的差值)。激勵單元108通過僅對LTP殘留信號進行量化或利用其它普通的方法來獲得用以傳送給譯碼器的激勵參數(shù)。
LPC系數(shù)ai、長期預(yù)測器延遲d和增益g、以及激勵參數(shù)e都傳送給譯碼器。
申請人先前的專利申請中的主語音活動性檢測器利用平均器110來對自相關(guān)系數(shù)Ri求平均,該平均器110產(chǎn)生當(dāng)前系數(shù)和被存儲在緩沖器111中的先前幀的系數(shù)的加權(quán)和R′i。另一自相關(guān)器112產(chǎn)生用以傳送給緩沖器113的LPC系數(shù)ai的自相關(guān)系數(shù)Bi。緩沖器的內(nèi)容只在被輔助檢測器(以下將描述)認(rèn)為只包含噪聲的期間內(nèi)才被更新,因此緩沖器113的內(nèi)容B′i代表了輸入信號噪聲頻譜的估算值。乘法/加法單元114產(chǎn)生被如下定義的、輸入信號和噪聲模型之間頻譜相似性的度量MM=B′o+2Σi=1nR′iB′iR′o]]>這里的零下標(biāo)表示零階自相關(guān)系數(shù),n是語音幀中樣值的數(shù)目。
度量M在比較器115中與閾值電平進行比較,并在輸出端116產(chǎn)生表示語音的存在或不存在的信號。閾值可以根據(jù)當(dāng)前噪聲功率電平自適應(yīng)地進行調(diào)整(117)。
由于不能識別語音將導(dǎo)致對具有語音信息的緩沖器的更新和隨后的其它識別錯誤—“鎖定”狀態(tài),所以在緩沖存儲器113中的噪聲估算值的更新不被上述檢測器的輸出端116進行控制。因此更新由輔助檢測器200進行控制。為了區(qū)分噪聲和非發(fā)聲的語音,這就產(chǎn)生出(201)輸入信號的(未平均的)自相關(guān)系數(shù)Ri和LPC系數(shù)的(未緩沖的)自相關(guān)系數(shù)Bi的乘積和。減法器202將這個和與在緩沖器203中被延遲的先前語音幀的相應(yīng)的和進行比較。表示輸入信號的連續(xù)幀之間頻譜相似性的這一差值與閾值進行比較(204)從而產(chǎn)生判決信號。
為了識別發(fā)聲的語音,長期預(yù)測器延遲d被音調(diào)分析單元205所測量。其輸出在“或”門206中與閾值級204的輸出合并—即如果單元204或205中的任何一個(或兩者)產(chǎn)生表示語音存在的輸出,輔助檢測器200就認(rèn)為存在語音。正如在引言中所論述的那樣,如果系統(tǒng)傳送信號音,則這些信號音必須被識別為語音而不是噪聲,而剛剛所述的輔助檢測器在這方面并不是非常有效。雖然它識別某些信號音,但另一些信號音(通常是具有相對純凈的頻譜內(nèi)容的信號音)不能被識別。由于在緩沖器113中的噪聲估算值此時根據(jù)信號音來進行“訓(xùn)練”,所以一旦輔助檢測器200已失效,則主檢測器也失效。
因此,提供另一輔助檢測器來檢測信號音。最好注意到人為產(chǎn)生的信號音包含少量的頻率分量(它可能是被調(diào)制的)這一事實。對于這樣的信號,LPC預(yù)測器的性能極其優(yōu)異,利用這一特性來區(qū)分基于信號音的信號(包括多信號音信號)和背景或環(huán)境噪聲信號。
LPC預(yù)測增益Gp被定義為一語音幀的輸入信號功率與輸出信號功率之比,即Gp=Σi=0n-ix2(i)Σi=0n-1y2(i)]]>這里的x是濾波器輸入而y是反濾波器輸出y(t)=x(t)+Σi=1ny(t-i)ai]]>(這里的m是濾波系數(shù)的個數(shù),一般為8或10)。信號x(i)和y(i)可分別從LPC編碼器100內(nèi)的變換器102和濾波器106的輸出端獲得。這些值被求平方(301,302),預(yù)測增益利用按照上述公式計算Gp的算術(shù)單元303來獲得。其輸出被比較器304用來與固定的閾值T作比較,如果增益超過該閾值(通常T=63或18分貝),就認(rèn)為識別了信號音。對于信號音識別有幾種可能的響應(yīng)(a)利用“或”門303來替換主檢測器的輸出;(b)利用“或”門206的第三輸入來替換輔助檢測器;(c)以上兩者(如所示)。當(dāng)然,可以不計算商而將∑x2項與被乘以閾值的∑y2進行比較。圖3以分貝為單位表示從背景環(huán)境噪聲、語音、信號音中的背景噪聲中獲得的預(yù)測增益和信號音本身的頻率分布圖,圖4表示對于不同的UK信號音,即“用戶占線”音、撥號音、振鈴音、“空號”音、“設(shè)備占用”音的預(yù)測增益相對于時間的曲線圖。實際上,用戶占線音、撥號音和“空號”音因確實是(例如來自鍵盤的)多頻音,所以被另一檢測器成功地識別。振鈴音和“設(shè)備占用”音被音調(diào)分析單元205識別。
該另一檢測器300可被認(rèn)為是對于某些類型信號音的檢測器;或者(在圖2的實施例中)它可被看作是檢測殘留信號Yi為較小的狀態(tài),所以長期預(yù)測器107(以及由此音調(diào)分析205)的操作就不是強有力的。
檢測發(fā)聲的語音的另一種選擇是用類似于301、302、303和304的部件來代替音調(diào)檢測器205,以便產(chǎn)生基于長期預(yù)測器分析107的預(yù)測增益(并將其與閾值作比較)。
現(xiàn)在參看圖5描述對圖2裝置的另外兩種改進。首先,在圖2所示的實施例中,所計算的預(yù)測增益是語音編碼器100的LPC分析單元的預(yù)測增益,它一般可以采用第8或者甚至第10階預(yù)測器。但是,應(yīng)注意到這一分析單元部件的基礎(chǔ)是信息音比環(huán)境噪聲具有更高的預(yù)測增益,并且分析單元的階次越高,則預(yù)測器模擬噪聲環(huán)境的能力就越大,已經(jīng)得知通過將增益計算限制為第4階分析,則由一個或兩個信號音組成的信息信號給出高的預(yù)測增益,同時可以減小環(huán)境噪聲的預(yù)測增益。
這在原理上可以通過與第8階單元105,106并列地提供第4階分析單元和濾波器來向輔助檢測器輸入信號從而得到實現(xiàn)。但是,根據(jù)反射系數(shù)(有時稱為Parcor相關(guān)系數(shù))計算預(yù)測增益較為簡單。在圖5中,這些反射系數(shù)是由單元400按照已知的方法根據(jù)自相關(guān)系數(shù)Ri進行計算的(雖然根據(jù)語音編碼器設(shè)計的不同,可以利用LPC分析單元105從中間點將它們?nèi)〕?。預(yù)測增益的度量、即預(yù)測誤差Pe可以如下地根據(jù)前4個反射系數(shù)Rci進行計算來獲得Pe=Πi=14(1-R2ci)]]>這一計算在401中進行。大的預(yù)測誤差相應(yīng)于小的預(yù)測增益,反之亦然,所以,如果Pe小于閾值Pth,就認(rèn)為存在信號音。這一比較403代替了圖2的比較304。
其次,移動無線電環(huán)境中的噪聲包含非常強的低頻諧振,進行進一步的測試來確定“信號音”是否低于閾頻率。閾頻率的選擇涉及到一定程度的折衷,但由于大多數(shù)信號音都高于400Hz,所以建議閾頻率為385Hz。
該進一步的測試是確定LPC濾波器的極點頻率。為降低分析單元的復(fù)雜性,最好用低階濾波器。還可以進行進一步的LPC分析,但如圖5那樣通過根據(jù)反射系數(shù)計算LPC系數(shù)就能夠容易地進行該進一步的LPC分析。假定只利用單元400的前兩個反射系數(shù),則LPC系數(shù)ai被單元404按照通常的方式進行計算,使得綜合濾波器的響應(yīng)是H(z)=l/{a0-a1z-1-a2z-2}然后極點在Z平面上的位置由二次方程的解來確定a0z2-a1z+a2=0a0=1即z=-a12=j4a2-a124]]>如果平方根內(nèi)的項是負(fù)的,則極點位于實軸上,于是該信號不是信號音。如果它是正的,但極點位置的實數(shù)部分是負(fù)的(即a1<0),則極點在Z平面的左半側(cè)。這就必然意味著該頻率比取樣速率高了25%—即對于8KHz的取樣頻率fs在2000Hz以上,這時該頻率計算是不必要的了,可以立即產(chǎn)生“>385”信號。極點頻率為f=arcran{-4a2-a12a1}×fs2π]]>f<385Hz的條件可表述為(取消平方根)(4a2-a12)/a12<tan2{2π×385fs}]]>或者(4a2-a12)/a12<0.0973]]>atfs=8kHz這一計算由單元405來進行。它的輸出在與門406中與比較器403的輸出進行合并,以便只有當(dāng)預(yù)測增益是高的并且極點頻率是大于385Hz時才作出“信號音”判定。
如果需要的話,還可以俘獲2000Hz以上的極點頻率(或者某些其它上限頻率),以便高于預(yù)期信號音范圍的高頻不會被識別為信號音。
如果求解二次方程的額外計算可被容許,就還可以利用第三和第四反射系數(shù),在這種情況下,有可能區(qū)分具有兩個相關(guān)頻率的兩個復(fù)共軛極點對,可以看出,如果這兩個頻率都低于閾頻率,就不會認(rèn)為存在信號音。
已經(jīng)指出圖2和5的實施例在自相關(guān)計算103之前采用漢明窗口(對于基于自相關(guān)的LPC分析通常如此)。如果在語音編碼器中不需要進行這種開窗口,則另一種可能的選擇就是在圖5的情形中省去開窗口103和通過將自相關(guān)值變換為協(xié)方差值來取代反射系數(shù)計算400,并修改單元401、404來使用協(xié)方差值而不是反射系數(shù)。或者,如圖6所示(它只表示相對于圖5已被改變的那些部件),開頭的處理可以由協(xié)方差分析109來完成,它的輸出提供給反射系數(shù)計算裝置400′和改進的自相關(guān)系數(shù)單元104′。LPC分析單元105可以象以上那樣與自相關(guān)單元104′連接或者如所示那樣直接與協(xié)方差分析單元109連接。
上述“信號音檢測”實施例產(chǎn)生了良好的結(jié)果;但是,它們可能對于在某些范圍內(nèi)使用的、用機械方式產(chǎn)生的信號音無效,這是由于這些信號音往往具有導(dǎo)致產(chǎn)生小的預(yù)測增益的高次諧波分量的緣故。由于濾波器的插入勢必增大所有信號的自相關(guān),并由此也使其它信號的預(yù)測增益增大,所以僅濾除高次諧濾不是一個解決方案。已發(fā)現(xiàn)預(yù)測器往往模擬濾波器的極點而不是輸入信號的特性。但是已發(fā)現(xiàn)如果能夠?qū)㈩A(yù)測增益分析局限于對只處在相應(yīng)于諧波濾波器通帶的頻率范圍內(nèi)的信號的可預(yù)測性進行評估,則利用濾波就能夠獲得良好的結(jié)果。這可以通過在預(yù)測增益分析之前以濾波器帶寬兩倍的頻率對信號進行二次取樣來實現(xiàn)。
因此在其它方面與圖5類似的圖7實施例采用了濾波器450,這是低通等波紋FIR濾波器,其零點位于單位圓上,通帶高達600(3dB點),20dB的阻帶衰減位于1200Hz。阻帶衰減不是太大將被認(rèn)為是有利的。濾波器輸出在二次取樣單元451中被以1200Hz的頻率進行二次取樣。
由于使用這種濾波,信號音檢測與語音編碼器100共用元件的可能性當(dāng)然被大大減少;因此濾波器450由模數(shù)變換器102直接提供數(shù)字化輸入信號,并如上所述地給反射系數(shù)分析單元400″或者協(xié)方差或自相關(guān)分析單元提供信號。自相關(guān)方案將如上所述地需要開窗口。
另一實施例減輕了“諧波”問題,且不會不適當(dāng)?shù)叵拗祁A(yù)測增益分析的頻率范圍;這是通過利用濾波器將信號分成兩個或多個頻帶來實現(xiàn)的,這每一個頻帶足夠窄,以至于無法包含信號音的基波和三次諧波。各個頻帶然后被二次取樣并對其進行單獨的預(yù)測增益分析。
因此,在圖8中,信號被濾波器450a、450b分成頻帶400-1200Hz和1200Hz-2000Hz,并被以1.6KHz的頻率進行二次取樣(451a、451b)。對這兩個頻帶分別進行反射系數(shù)計算400″a、b、預(yù)測誤差分析401a、b、和取閾值403a、b。比較器403a、403b的兩個輸出被傳送給“或”門206的分開的輸入端,所以在這兩個頻道的任一個之內(nèi)的高的預(yù)測增益都被認(rèn)為表示了信號音的存在。圖7的其它部件100-303沒有改變,所以不在圖8中表示。
權(quán)利要求
1.一種用于檢測輸入信號中語音的存在的語音活動性檢測器,包括(a)存儲輸入信號噪聲分量的估算值的裝置;(b)識別輸入信號和被存儲的估算值的頻譜相似性以便產(chǎn)生輸出判定信號的裝置;(c)更新被存儲的估算值的裝置;(d)輔助檢測器,用于控制更新裝置,以便僅當(dāng)輔助檢測器指出在輸入信號中無語音時才進行更新;其特征在于,用于計算輸入信號的預(yù)測增益參數(shù)的裝置,以及用于在預(yù)測增益超過閾值時禁止更新的修正裝置。
2.權(quán)利要求1的語音活動性檢測器,其特征在于,在該語音活動性檢測器中,輔助檢測器包括對從LPC殘留信號中獲得的信號作出響應(yīng)的發(fā)聲的語音檢測器。
3.權(quán)利要求1或2的語音活動性檢測器,其特征在于,在該語音活動性檢測器中,增益參數(shù)表示第6階或低于第6階的LPC預(yù)測的預(yù)測增益。
4.權(quán)利要求3的語音活動性檢測器,在該語音活動性檢測器中,增益參數(shù)表示第4階或低于第4階的LPC預(yù)測的預(yù)測增益。
5.以上任一權(quán)利要求的語音活動性檢測器,其特征在于,還包括用于檢測輸入信號的一個或多個主頻率分量的裝置,以及用于將這些頻率與預(yù)定閾頻率作比較并僅當(dāng)所述主分量超過閾頻率時才允許禁止更新的裝置。
6.以上任一權(quán)利要求的語音活動性檢測器,其特征在于,在該語音活動性檢測器中,在增益計算裝置前面設(shè)有用于濾除輸入信號頻率范圍的高頻部分的濾波器,僅對位于該濾波器通帶內(nèi)的頻率分量進行增益計算。
7.權(quán)利要求6的語音活動性檢測器,其特征在于,具有兩個濾波器,這兩個濾波器有各自的通帶和用于計算各自通帶的增益參數(shù)的增益計算裝置,該語音活動性檢測器還具有用于當(dāng)在任一通帶內(nèi)的預(yù)測增益超過閾值時禁止進行更新的修正裝置。
8.權(quán)利要求6或7的語音活動性檢測器,其特征在于,包括用于對被濾波信號進行二次取樣的裝置。
全文摘要
通過對輸入信號和存儲的噪聲估算值(113)的頻譜進行比較(114、115)來將語音與噪聲區(qū)分開來。在輔助檢測器(200)的控制下在無語音期間內(nèi)更新噪聲估算值(在緩沖器(113)中)。為了改善具有強諧波分量的信號(例如信號音)存在時的操作,根據(jù)輸入(x(i))和從在被具有與輸入的頻譜互補的響應(yīng)的濾波器(105)濾波后的輸入獲得的殘留信號(y(i))計算LPC預(yù)測增益,如果該增益超過閾值,緩沖器更新就被禁止。
文檔編號G10L25/78GK1130952SQ9419338
公開日1996年9月11日 申請日期1994年9月14日 優(yōu)先權(quán)日1993年9月14日
發(fā)明者P·A·巴列特 申請人:英國電訊公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
兴山县| 育儿| 古丈县| 湘乡市| 宁乡县| 莆田市| 金寨县| 乌海市| 漳浦县| 桐乡市| 驻马店市| 盘锦市| 施秉县| 葵青区| 平罗县| 新乐市| 原平市| 苗栗县| 新竹县| 宕昌县| 增城市| 贵南县| 彰化县| 亚东县| 双峰县| 海盐县| 区。| 平舆县| 巨鹿县| 福泉市| 牡丹江市| 永寿县| 新邵县| 克山县| 四子王旗| 全椒县| 黄冈市| 新宁县| 惠东县| 贵州省| 金山区|