專利名稱:一種變速率的聲碼器及其編碼方法
技術(shù)領(lǐng)域:
本發(fā)明涉及能改變編碼速率的碼書激勵線性預(yù)測CELP聲碼器,具體涉及到對確定聲音 信號幀編碼速率的方法。
背景技術(shù):
在線性預(yù)測編碼(LPC)技術(shù)中,應(yīng)用一個濾波器來去除信號冗余,由此壓縮聲音信號, LPC濾波器能重現(xiàn)一種頻譜包絡(luò),以試圖模仿人們的聲音。
在碼分多址(CDMA)和通用移動通信系統(tǒng)(UMTS)的聲碼器中都使用了碼書激勵線性預(yù) 測編碼器的技術(shù)。
碼書激勵線性預(yù)測(CELP)聲碼器比早先的LPC技術(shù)有兩方面的改善,第一,CELP聲 碼器應(yīng)用一個音調(diào)預(yù)測濾波器來抽取音調(diào)信息,即自適應(yīng)碼書搜索,嘗試捕獲更多的語音細(xì) 節(jié);第二, CELP聲碼器用從一個實(shí)際語音波形中產(chǎn)生的殘余信號里導(dǎo)出的類噪聲信號來激 勵LPC濾波器。
CELP聲碼器中包含三大部分1)短時預(yù)測濾波器;2)長時預(yù)測濾波器,也稱為音調(diào) 濾波器;以及3)固定碼書。第一部分應(yīng)用線性預(yù)測來去除語音信號中的短時冗余,產(chǎn)生自 短時預(yù)測濾波器的誤差(或稱為殘余信號)變?yōu)殚L時預(yù)測濾波器的目標(biāo)信號。話音信號有一 種準(zhǔn)周期性的性質(zhì),長吋預(yù)測濾波器從殘余信號中抽取出一個音調(diào)周期,并去除掉先前一個 周期中可預(yù)測的信息。在長時和短時濾波之后的殘余信號幾乎全是類噪聲信號。由固定碼書 搜索從其矢量庫中尋找與該類噪聲殘余信號的最佳匹配,代表最佳匹配的碼字便取代該類噪
聲殘余信號進(jìn)行傳輸。在代數(shù)CELP (ACELP)聲碼器中,固定碼書由少量的非零脈沖組成, 非零脈沖由其脈沖的位置和符號(例如+l或-l)來代表。
一種典型的方案中,CELP聲碼器對劃分成幀的輸入語音信號的每一幀作一次短時預(yù)測 濾波器的LPC系數(shù)更新。然后,將LPC殘余信號劃分成子幀,用于長時預(yù)測濾波器和固定 碼書搜索,例如,對于短時預(yù)測濾波器,輸入語音可以分塊成160樣本的幀。然后,形成的 幀可以分割成40樣本的四個子幀。于是,每個子幀由長時預(yù)測濾波器和固定碼書搜索進(jìn)行處 理,形成的幀也可以分割成53樣本、53樣本和54樣本的3個子幀。
CELP聲碼器實(shí)現(xiàn)壓縮的方法是為其三大部分的每一個部分指配-一定數(shù)目的比特作為輸 出,它們少于原來語音信號所用的比特?cái)?shù)目。聲碼器的編碼速率由指配給其三大部分的比特 數(shù)目所決定,當(dāng)一個聲碼器有多種編碼速率就意味著指配給其三大部分的比特?cái)?shù)目有多種方 式,例如,EVRC (增強(qiáng)型變速率語音編解碼器)全速率編碼方式下29位的LPC數(shù)據(jù)分配給 短時預(yù)測濾波器,21位音調(diào)數(shù)據(jù)分配給長時預(yù)測濾波器,120位數(shù)據(jù)分配給固定碼書;,EVRC 半速率編碼方式下22位的LPC數(shù)據(jù)分配給短時預(yù)測濾波器,16位音調(diào)數(shù)據(jù)分配給長時預(yù)測 濾波器,42位數(shù)據(jù)分配給固定碼書。
因?yàn)檎Z音本身有靜默期,可以通過降低這些靜默期間的數(shù)據(jù)速率有效壓縮語音數(shù)據(jù)的傳 輸速率,高通公司的申請?zhí)枮?2101618.9的可變速率聲碼器的專利就是關(guān)于上述方法的一個 方案。
目前的可變速率聲碼器是通過對原始輸入聲音信號或原始輸入聲音信號經(jīng)加權(quán)后得到的 信號的每一幀進(jìn)行檢測而達(dá)到編碼速率的變化的,S卩,檢測每個輸入聲音信號巾貞確定其是否 包含語音(也稱為為話音激活檢測),當(dāng)話音激活檢測(VAD)的結(jié)果是有話音則采用較高的 速率編碼,例如EVRC的全速率,當(dāng)檢測的結(jié)果是無話音時則采用較低的速率編碼,例如 EVRC的八分之一速率,也就是針對背景噪聲的編碼速率。
現(xiàn)有的變速率編碼器在對話音激活檢測的結(jié)果是無話音的輸入聲音信號幀以背景噪聲的 編碼速率編碼時只進(jìn)行短時預(yù)測濾波器的LPC系數(shù)更新,而不產(chǎn)生音調(diào)數(shù)據(jù)和固定碼書的比 特輸出,代替它們的是表示幀能量數(shù)據(jù)的比特。
一種典型的包括音調(diào)分析和固定碼書搜索的CELP聲碼器如圖1所示,輸入聲音信號幀 1輸出到LP參數(shù)分析器和短時預(yù)測濾波器,由LP參數(shù)分析器產(chǎn)牛:LPC系數(shù)傳送至短時預(yù)測 濾波器和短時預(yù)測合成濾波器,短時預(yù)測濾波器的傳輸函數(shù)為A(z),短時預(yù)測合成濾波器的 傳輸函數(shù)為
<formula>formula see original document page 10</formula>
其中a,為由LP參數(shù)分析器得到的LPC系數(shù),p為預(yù)測階數(shù)。短時預(yù)測STP濾波器輸出的殘 余信號3到音調(diào)分析器和長時預(yù)測LTP濾波器,LTP濾波器的傳輸函數(shù)P("為l-^z人"為 基音增益,丄為基音延遲,/9和£由音調(diào)分析器輸出的音調(diào)數(shù)據(jù)4所給出,音調(diào)數(shù)據(jù)4還被輸 出到長時預(yù)測合成濾波器,長時預(yù)測LTP合成濾波器的傳輸函數(shù)為1/P(z)。固定碼書搜索模 塊接收LTP濾波器輸出的殘余信號5產(chǎn)生固定碼書中的碼矢量8和固定碼書增益編碼6,碼 矢量8所表示的信號按固定碼書增益編碼6放大后輸出到長時預(yù)測合成濾波器,LTP合成濾 波器合成激勵信號7輸出到短時預(yù)測合成濾波器,短時預(yù)測合成濾波器生成合成語音信號9。 變速率CELP聲碼器工作在為背景噪聲編碼的低速率模式時長時預(yù)測濾波器和固定碼書 搜索都不工作,取而代之的是幀能量分析器,圖2示出一典型的變速率CELP聲碼器,其中的 編碼速率確定模塊根據(jù)輸入聲音信號幀1確定編碼該幀的編碼速率,如果是背景噪聲的速率 就向幀能量分析器輸出輸入聲音信號幀1,否則就向短時預(yù)測濾波器輸出輸入聲音信號幀1。 當(dāng)收到輸入聲音信號幀1后幀能量分析器計(jì)算出輸入聲音信號幀1的幀能量的數(shù)值作為向譯 碼器發(fā)送的參數(shù),而STP預(yù)測濾波器由于沒有'輸入信號不會有自適應(yīng)碼書參數(shù)和固定碼書參 數(shù)要向譯碼器發(fā)送,僅有線性預(yù)測LP參數(shù)分析器產(chǎn)生的LPC參數(shù)需要發(fā)送。
發(fā)明內(nèi)容
要解決的技術(shù)問題
在現(xiàn)有技術(shù)中,為了決定輸入聲音幀編碼速率是采用背景噪聲的編碼速率還是語音的編
ea率所采取的方案是針對輸入聲音幀或采樣輸入聲音^i經(jīng)預(yù)處理后形成的預(yù)處理后的數(shù)字
話音信號幀進(jìn)行是否有話音的檢測,這種檢測原始的加權(quán)輸入聲音幀是否有能被人耳感知的 方案有其局限性,因?yàn)橐o人耳感知的是用CELP的LPC參數(shù)、自適應(yīng)碼書參數(shù)和固定碼書參 數(shù)解碼而成的合成聲音信號幀,當(dāng)原始的加權(quán)輸入聲音幀的檢測結(jié)果是可以被人耳感知而合 成聲音信號幀的檢測結(jié)果是無法被人耳感知時,采用針對語音的編碼速率就顯得不必要了; 當(dāng)原始的加權(quán)輸入聲音幀的檢測結(jié)果是不能被人耳感知而合成聲音信號幀的檢測結(jié)果是可以 被人耳感知時,采用針對背景噪聲的編碼速率來編碼也不能算合適,因?yàn)?,給出原始的加權(quán) 輸入聲音幀中沒有語音信息這一檢測結(jié)果的針對該原始的加權(quán)輸入聲音幀的檢測方案有其局 限性。
技術(shù)方案
本發(fā)明將是否有聲音的檢測定位在應(yīng)用LPC參數(shù)、自適應(yīng)碼書參數(shù)和固定碼書參數(shù)所產(chǎn) 生的合成數(shù)字聲音信號幀上。
這樣對于每個加權(quán)輸入聲音信號幀來說,無論其最后的編碼速率是否是背景噪聲的編碼 速率,都要對它進(jìn)行CELP的三大部分(短時預(yù)測濾波器、長時預(yù)測濾波器和固定碼書)的處 理得到LPC參數(shù)、自適應(yīng)碼書參數(shù)和固定碼書參數(shù)并根敏這些參數(shù)獲得合成數(shù)字聲音信號幀, 然后對該合成數(shù)字聲音信號幀作是否有聲音的檢測,如果檢測的結(jié)果是無話音則按編碼背景 噪聲的編碼速率進(jìn)行編碼,即再對法合成數(shù)字聲音信號幀進(jìn)行幀能量分析獲得關(guān)于幀能量的 數(shù)值,向譯碼器發(fā)送LPC參數(shù)和幀能量數(shù)值參數(shù),而不發(fā)送自適應(yīng)碼書參數(shù)和固定碼書參數(shù)。
為了使本聲碼器端的合成數(shù)字聲音信號幀和解碼器解碼生成的合成數(shù)字聲音信號幀有相 類似的語音特性,本發(fā)明在下面給出能將聲碼器STP合成濾波器的輸入信號與解碼器的STP 合成濾波器的輸入信號保持一致的技術(shù)方案,該技術(shù)方案就是
若為當(dāng)前幀生成的數(shù)據(jù)包包括的比特表示了 LPC參數(shù)、自適應(yīng)碼書參數(shù)和固定碼書參 數(shù),即,除了對LPC參數(shù)編碼之外還將所述的對輸入聲音信號幀的自適應(yīng)碼書搜索和固 定碼書搜索所得到的自適應(yīng)碼書參數(shù)和固定碼書參數(shù)編碼,則根據(jù)所述自適應(yīng)碼書參數(shù) (基音增益和基音延遲)確定LTP合成濾波器,并將所述固定碼書參數(shù)中的固定碼書碼 矢量表示的信號按固定碼書參數(shù)中的固定碼書增益放大后作為該LTP合成濾波器的輸入 信號,將LTP合成濾波器的輸出信號作為當(dāng)前幀的STP合成濾波器的激勵信號;
若當(dāng)前幀的編碼方式是LPC參數(shù)和幀能量參數(shù)的編碼,編碼器使其保存的當(dāng)前幀的 激勵信號與譯碼器收到所述LPC參數(shù)和幀能量參數(shù)的編碼后輸出到其STP合成濾波器的 激勵信號一致。
接著,對下一聲音信號幀進(jìn)行線性預(yù)測、音調(diào)分析(自適應(yīng)碼書搜索)和固定碼書搜索 得到LPC系數(shù)、音調(diào)參數(shù)((自適應(yīng)碼書參數(shù)))和固定碼書參數(shù),根據(jù)LPC系數(shù)確定STP合 成濾波器,根據(jù)音調(diào)參數(shù)確定LTP合成濾波器,將下一聲音信號幀子幀的固定碼書碼矢量對 應(yīng)的信號按固定碼書增益放大后得到的固定碼書激勵信號作為LTP合成濾波器的輸入信號, LTP合成濾波器根據(jù)存儲的其對當(dāng)前幀的固定碼書激勵信號的響應(yīng)對該輸入信號作出響應(yīng), 將所述LTP合成濾波器的響應(yīng)作為STP合成濾波器的激勵信號,STP合成濾波器對該激勵信 號作出響應(yīng)生成下一聲音信號幀的合成數(shù)字聲音信號,這樣,就可以針對當(dāng)前幀的下一個幀
的合成數(shù)字聲音信號幀進(jìn)行是否有話音的檢測,如果檢測的結(jié)果是無話音則按較低的編碼速 率為下一聲音信號幀編碼,如果檢測的結(jié)果是有話音則按較高的編碼速率為下一聲音信號幀 編碼。
上述較低的編碼速率的編碼方式可以是只給出LPC系數(shù)參數(shù)和幀能量參數(shù)的方式,也可 以是給出LPC參數(shù)、自適應(yīng)碼書參數(shù)和固定碼書參數(shù)的方式,只不過在較低的編碼速率條件 下在一個編碼幀中指配給LPC參數(shù)、自適應(yīng)碼書參數(shù)和固定碼書參數(shù)的比特?cái)?shù)較少而已。
生成下一幀的合成數(shù)字聲音幀的STP合成濾波器所根據(jù)的過去的輸出響應(yīng)也是可以根據(jù) 需要設(shè)置的,例如當(dāng)STP合成濾波器是10階的濾波器,它在生成輸出信號需要最近的過去輸 出中的10 (濾波器的階數(shù))個樣本。
當(dāng)當(dāng)前幀的編碼方式是為幀能量參數(shù)和LPC系數(shù)參數(shù)編碼時,生成下一幀的合成數(shù)字聲 音幀的STP合成濾波器所根據(jù)的過去的輸出響應(yīng)可以是當(dāng)前幀的合成數(shù)字聲音幀中的最后的 濾波器的階數(shù)個樣本點(diǎn)上的值,也可以是由幀能量參數(shù)確定的隨機(jī)信號的濾波器的階數(shù)個樣 本點(diǎn)上的信號值(這樣只要譯碼器也使用幀能量參數(shù)確定的隨機(jī)信號的值就能達(dá)到雙方的一 致),還有另一種設(shè)置的方案就是用原始輸入聲音信號幀中的最后的濾波器的階數(shù)個樣本上信 號值來設(shè)置濾波器的這一狀態(tài)變量,即,根據(jù)原始輸入聲音信號幀中的最后的濾波器的階數(shù) 個樣本上信號值來設(shè)置STP合成濾波器所存儲的過去的輸出信號。
本發(fā)明的檢測是否有聲音的檢測對象是合成數(shù)字聲音幀而不是現(xiàn)有技術(shù)所給出的輸入聲 音信號幀,合成數(shù)字聲音幀雖然是輸入聲音信號幀經(jīng)過有損的CELP編碼后的譯碼所得,但這 并不意味著合成數(shù)字聲音幀不適合作為是否有聲音的檢測的檢測對象。
電子工業(yè)出版社2004年出版的作者是美國的夸特爾瑞的《離散時間語音信號處理原理 與應(yīng)用(Discrete-Time Speech Signal Processing:Principle and Practice)》的5. 3. 4節(jié) ——Levinson (萊文遜)遞歸及其相關(guān)特性中指出線性預(yù)測所使用的全極點(diǎn)模型和自相關(guān) 方法會使STP合成濾波器傳輸函數(shù)的所有極點(diǎn)落在單位圓內(nèi)是最小相位系統(tǒng);序列的自相關(guān) 法的解的傅立葉變換的相位函數(shù)是失真的;線性預(yù)測的自相關(guān)引起聲門最大相位極點(diǎn)向最小 相位極點(diǎn)的轉(zhuǎn)變;建立合成語音波形時,自相關(guān)變換造成的相位函數(shù)失真可能對語音感知有 影響,即,合成數(shù)字話音信號的波形和原來數(shù)字話音信號的波形的偏離。在該書的5.6節(jié)一 一基于全極點(diǎn)模型的語音綜合中指出基于線性預(yù)測自相關(guān)法的合成信號看起來像語音,但 同時由于其最小相位特性而失去了絕對相位結(jié)構(gòu);書中的圖5. 18中的例子所示,重建語音信
號的尖峰比原始信號更為突出,并且,假定為最小相位的理想聲門波是時間翻轉(zhuǎn)的,并具有 比實(shí)際聲門波更陡的上升沿。
由于合成數(shù)字話音信號在STP合成濾波器極點(diǎn)對應(yīng)的諧振峰處有較高的能量,在對合成
數(shù)字話音信號幀進(jìn)行是否有聲音的檢測時可以檢測其振幅,如果其波形的上升沿和下降沿的 幅度都超過或其中之一超過閾值就將該幀判決為有話音,這樣, 一旦所述的極點(diǎn)所對應(yīng)的諧 振峰反映在波形上的振蕩的幅度超過閾值,合成數(shù)字話音信號幀就不會在是否有聲音的檢測 時被檢測成無聲音信號。當(dāng)出現(xiàn)合成數(shù)字話音信號的波峰的尖峰比原始信號更為突出的現(xiàn)象 時那些突出的尖峰可以較容易地用與閾值比較的方法被檢出。用來與波形的上升沿或下降沿 比較的閾值的設(shè)定方法不是唯一的,該閾值的確定可以用固定值,也可以和波形波動所在的 合成數(shù)字話音信號幀有關(guān),比如,可以參考合成數(shù)字話音信號幀的信號電平——幀內(nèi)樣本點(diǎn)
上的信號值的絕對值的和,也可以參考合成數(shù)字話音信號幀的能量或特定的子帶的能量。
利用合成數(shù)字聲音幀的波形的尖峰比原始信號更為突出及上升沿更陡的特性,可以較輸 入信號幀更方便地檢測出上升沿和尖峰,特別是這種基于波形的檢測還可以和基于合成數(shù)字 聲音幀能量(或信號電平)的檢測相結(jié)合,對于波動很頻繁但振幅不大的合成數(shù)字聲音幀用 其能量與門限能量(或門限信號電平)比較的方案來檢測效果較好,而對波動的振幅較大但 不頻繁的合成數(shù)字聲音幀檢測上升沿或振幅的方案更為有效。
關(guān)于信號幀的能量的計(jì)算可以參照現(xiàn)有技術(shù),即,將合成數(shù)字聲音幀的自相關(guān)系數(shù)的第
一個值i ,(o)來估計(jì)其能量,i ,a)是自相關(guān)系數(shù),它的計(jì)算式如下,
兄<formula>formula see original document page 13</formula>其中L是每一幀的樣本點(diǎn)點(diǎn)數(shù)。
在基于合成數(shù)字聲音幀能量的檢測方案中的與信號幀能量相比較的門限能量的計(jì)算同樣 可以參照現(xiàn)有技術(shù),即根據(jù)相鄰上一幀的幀能量和門限能量來確定當(dāng)前幀的門限能量。
有益效果
由于采用了先執(zhí)行線性預(yù)測和碼書搜索再執(zhí)行針對合成數(shù)字話音進(jìn)行話音激活檢測的方 法,即,根據(jù)碼書搜索和線性預(yù)測所生成的激勵信號的出現(xiàn)就先于VAD操作,針對激勵信號 通過線性預(yù)測合成濾波器的輸出進(jìn)行VAD,這樣,如果原始數(shù)字聲音幀經(jīng)過線性預(yù)測、自適 應(yīng)碼書搜索和固定碼書搜索處理后的形成的合成數(shù)字信號幀的特征是有話音的,其VAD的結(jié) 果才是有話音的,譯碼方收到的包含LPC參數(shù)、自適應(yīng)碼書參數(shù)和固定碼書參數(shù)經(jīng)譯碼后產(chǎn) 生的數(shù)字語音信號幀的特征與編碼方的該編碼速率的用于檢測的合成數(shù)字語音信號的特征相 似;編碼方在無法檢測到具有活動話音的合成數(shù)字信號的情況下才有可能產(chǎn)生沒有音調(diào)參數(shù) 的編碼幀。
本發(fā)明將是否有聲音的檢測的對象直接定位在非背景噪聲編碼速率的AMR編碼幀所對應(yīng) 的合成數(shù)字話音信號幀上,因編碼速率降低會造成該編碼速率的合成數(shù)字話音信號幀的VAD 結(jié)果趨向于無話音,例如,對于具有一定數(shù)量的幀的聲音信號來說,使用本發(fā)明的方法,編 碼速率降低會使根據(jù)輸入信號能量和背景噪聲能量的估計(jì)值間差值(或輸入信號電平和背景 噪聲電平的估計(jì)值間差值)所作的VAD判決的結(jié)果為無話音的幀的個數(shù)增加。因此,本發(fā)明 還可以提高CELP編碼技術(shù)的聲音壓縮率。
由于采用了先執(zhí)行線性預(yù)測和碼書搜索再執(zhí)行VAD的方法,這樣,按自適應(yīng)碼書參數(shù)和 固定碼書參數(shù)生成的STP舍成濾波器的激勵信號的出現(xiàn)就先于VAD操作,碼書搜索的操作在 執(zhí)行的次序上先于VAD操作,當(dāng)VAD的結(jié)果是沒有話音使得生成合成數(shù)字話音信號時產(chǎn)生的 激勵信號的參數(shù)不能再用于下一幀的編碼時,就可以有選擇地棄用根據(jù)自適應(yīng)碼書搜索和固 定碼書搜索得到的STP合成濾波器的激勵信號,而不必再象現(xiàn)有技術(shù)那樣在編碼背景噪聲編 碼速率幀后放棄按非背景噪聲編碼速率執(zhí)行線性預(yù)測和碼書搜索產(chǎn)生的其它參數(shù),由于有了 這一方案,為相鄰下一輸入聲音信號幀生成的用于是否有聲音檢測的合成數(shù)字聲音信號含有
更多的輸入聲音信號的特征,因?yàn)楝F(xiàn)有技術(shù)中, 一旦遇到編碼幀不包含自適應(yīng)碼書參數(shù)和固 定碼書參數(shù)的情況,就不會為對應(yīng)的輸入聲音信號幀進(jìn)行自適應(yīng)碼書搜索和固定碼書搜索, 此刻編碼器丟失了該輸入聲音信號幀的特征。
在收到包含自適應(yīng)碼書參數(shù)和固定碼書參數(shù)的編碼幀后,接收方的譯碼器與編碼器中的 語音模式編碼模塊分別參照一致的的過去樣本點(diǎn)上的STP合成濾波器的激勵信號, 一方使用 信道上的收到的編碼幀中的參數(shù),另一方使用自己編碼到該編碼幀中去的參數(shù),分別生成各 自子幀的STP合成濾波器的激勵信號,所以接收方譯碼器的STP合成濾波器的激勵信號與所 述語音編碼模塊的STP合成濾波器的激勵信號完全一致,譯碼器使用和編碼器一致的激勵信 號使譯碼產(chǎn)生的合成語音的聽覺質(zhì)量有保證。
本發(fā)明的將合成數(shù)字話音信號的波峰的幅度同閾值比較的VAD方法可以在預(yù)測合成濾波 器極點(diǎn)對應(yīng)的諧振峰反映在波形上的波峰的幅度高于閾值時檢出該波峰所在的合成數(shù)字話音 信號幀。當(dāng)合成數(shù)字話音信號的尖峰比原始信號更為突出這一現(xiàn)象體現(xiàn)在對應(yīng)原始信號共振 峰的合成數(shù)字話音信號的波形中的尖峰的上升沿或下降沿比原始信號的更大時,上述的將合 成數(shù)字話音信號的波峰的幅度同閾值比較的方法可以檢測出無法通過檢測原始信號波形的尖 峰而檢出的幀。同樣,當(dāng)前面提到的合成數(shù)字話音信號的上升沿比原始信號更為陡這一現(xiàn)象 體現(xiàn)在對應(yīng)原始信號共振峰的合成數(shù)字話音信號的波形中的尖峰的上升沿比原始信號的更大 時,本發(fā)明的將合成數(shù)字話音信號的波峰的上升沿同閾值比較的方法可以檢測出原來無法檢 出的幀。同樣,當(dāng)前面提到的合成數(shù)字話音信號的上升沿比原始信號更為陡這一現(xiàn)象體現(xiàn)在 對應(yīng)原始信號共振峰的合成數(shù)字話音信號的波形中的尖峰的上升沿的斜率比原始信號更大 時,將合成數(shù)字話音信號的波峰的上升沿的斜率同閾值比較的方法可以檢測出原來無法檢出 的幀。
圖1是現(xiàn)有技術(shù)的典型的包括音調(diào)分析和固定碼書搜索的CELP聲碼器。 圖2是現(xiàn)有技術(shù)的典型的變速率CELP聲碼器。
圖3是根據(jù)合成數(shù)字聲音信號幀將輸入聲音幀分類成有無語音兩類之一并根據(jù)這一類別確定 編碼速率的CELP變速率聲碼器。
圖4是圖4所示的是圖3的聲碼器所對應(yīng)的譯碼器。
圖5是根據(jù)合成數(shù)字聲音信號幀將輸入聲音幀分類成有12.2kbps、 6.7kbps和1.8kbps三類之 一并根據(jù)這一類別確定該幀編碼速率的AMR-NB聲碼器。 圖6是圖5的聲碼器所對應(yīng)的譯碼器。
具體實(shí)施例方式
實(shí)施例1,本實(shí)施例的聲碼器是對IS127 EVRC (增強(qiáng)型變速率編解碼,器)CDMA (碼分多 址接入)編碼器的改進(jìn),本實(shí)施例的聲碼器的輸入聲音幀為20毫秒長160個聲音數(shù)據(jù)樣本, 意味著所提取的參數(shù)以每秒50次的脈沖傳送,分割成53樣本、53樣本和54樣本的三個子 幀。圖3示出一根據(jù)合成數(shù)字聲音信號幀將輸入聲音幀分類成有無語音兩類之一并根據(jù)這一 類別確定該幀編碼速率的變速率聲碼器,輸入聲音信號幀1輸出到LP參數(shù)分析器和短時預(yù) 測濾波器,由LP參數(shù)分析器產(chǎn)生LPC系數(shù)參數(shù)2傳送至短時預(yù)測濾波器,產(chǎn)生量化了的LPC 系數(shù)參數(shù)22傳送至短時預(yù)測合成濾波器,短時預(yù)測濾波器的傳輸函數(shù)為A(z)和短時預(yù)測合 成濾波器的傳輸函數(shù)為// (z)的計(jì)算式如下,<formula>formula see original document page 15</formula>
附為預(yù)測階數(shù)是10。本實(shí)施例中對每一幀都有一次LPC計(jì)算,分配給LPC參數(shù)22的比特的 位數(shù)是28, 1^參數(shù)分析器產(chǎn)生^(1=1,2,...,111), S卩,LPC系數(shù)參數(shù)2, LP參數(shù)分析器還產(chǎn)生 4 (i=l,2,...,m), g卩,LPC系數(shù)參數(shù)22,是根據(jù)由LPC計(jì)算得到的LPC系數(shù)2再量化編碼成 的28位LPC參數(shù)得到的。
' 短時預(yù)測STP濾波器輸出的殘余信號3到音調(diào)分析器和長時預(yù)測LTP濾波器,LTP濾波 器的傳輸函數(shù)PU)為l-y9z』,/ 為基音增益,L為基音延遲,;S和i:是由音調(diào)分析器根據(jù)殘余 信號3和誤差信號66估算出的整個幀的音調(diào)數(shù)據(jù)4,音調(diào)分析器產(chǎn)生表征整個幀的丄的7個 ACB位并輸出根據(jù)該7個AC6位產(chǎn)生的基音延遲13,以及3個ACBG位以估算第一子幀的 自適應(yīng)碼書增益A另外3個ACBG位估算第二子幀的自適應(yīng)碼書增益y5,而且,另有3個 ACBG位估算第三子幀的自適應(yīng)碼書增益^并且音調(diào)分析器為這3個子幀的每一個子幀輸 出根據(jù)ACBG位產(chǎn)生的自適應(yīng)碼書增益14,基音延遲13和自適應(yīng)碼書增益14還被輸出到長 時預(yù)測LTP合成濾波器,LTP合成濾波器的傳輸函數(shù)為1/ (l-Pz-。, 是根據(jù)3個ACBG 位的量化的子幀的自適應(yīng)碼書增益(自適應(yīng)碼書增益14),丄是根據(jù)該7個ACB位量化的基 音延遲13。
固定碼書搜索模塊接收LTP濾波器輸出的殘余信號5計(jì)算產(chǎn)生固定碼書碼矢量8和固定 碼書增益編碼6,固定碼書碼矢量8中有35個FCB位表示第一子幀的固定碼書碼矢量,另有 35個FCB位表示第二子幀的固定碼書碼矢量,而且還有35個FCB位表示第三子幀的固定碼 書碼矢量。固定碼書碼矢量8逐個子幀地輸出。固定碼書增益編碼6也是逐個子幀地輸出, 表示固定碼書增益編碼6的比特中有5個FCBG位表示第一子幀的固定碼書增益,另有5個 FCBG位表示第二子幀的固定碼書增益,而且還有5個FCBG位表示第三子幀的固定碼書增 益。
分配到以上給出的各個參數(shù)比特幀(或數(shù)據(jù)包)內(nèi)碼比特置的總數(shù)與運(yùn)行在全速率8kbps 下的聲碼器有關(guān),總之,該比特幀包括28個LPC位;7個ACB位;9個ACBG位;105
個FCB位;和15個FCBG位,所以,該比特幀內(nèi)的比特總數(shù)為164位,20毫秒164位相當(dāng) 于8.2kbps(千比特每秒)。
長時預(yù)測(LTP)合成濾波激勵生成模塊將固定碼書碼矢量8所表征的信號按固定碼書 增益編碼6放大后輸出信號11輸出到長時預(yù)測LTP合成濾波器,LTP合成濾波器合成STP 合成濾波器的激勵信號7輸出到短時預(yù)測合成濾波器,從圖中給出的LTP合成濾波器的框圖 可知,LTP合成濾波器包含了一個記憶模塊——過去的輸出信號的存儲,該模塊將LTP為當(dāng) 前和先前子幀產(chǎn)生的激勵信號7存儲起來,當(dāng)收到基音延遲£后輸出L個樣本點(diǎn)之前的STP 合成濾波器的激勵信號10,信號10按基音增益-放大后同信號11相加產(chǎn)生STP合成濾波器 的激勵信號7,短時預(yù)測合成濾波器響應(yīng)激勵信號7生成合成語音信號9。
話音激活檢測模塊接收一個幀的合成語音信號9并檢測其中是否有話音,若檢測結(jié)果有 話音其輸出的聲音類型信號12就是有話音,否則聲音類型信號12就是無話音。聲音類型信 號12輸出到參數(shù)數(shù)據(jù)包類型選擇模塊,該模塊根據(jù)聲音類型信號12的內(nèi)容選擇發(fā)送到譯碼 器的參數(shù)數(shù)據(jù)包的類型,參數(shù)數(shù)據(jù)包有兩種類型, 一種是類型A,該類型的參數(shù)數(shù)據(jù)包包括LPC 參數(shù)、音調(diào)參數(shù)和固定碼書參數(shù);另一種是類型B,該類型的參數(shù)數(shù)據(jù)包包括LPC參數(shù)和幀 能量參數(shù)。
幀能量分析器接收輸入聲音信號幀l,計(jì)算出幀能量增益并對其進(jìn)行量化,得到8個FG 位的比特表示幀能量增益,幀能量分析器向激勵信號更新控制模塊輸出包含8個FG位的幀 能量增益參數(shù)16,激勵信號更新控制模塊在參數(shù)數(shù)據(jù)包類型信號18為類型B時向LTP合成 濾波器輸出根據(jù)幀能量增益參數(shù)16對應(yīng)的量化的幀能量增益給出的偽隨機(jī)噪聲信號17, LTP 合成濾波器用該偽隨機(jī)噪聲信號17的信號值代替其過去的輸出信號存儲中存放的由其生成 對應(yīng)輸入聲音信號幀1的STP合成濾波器激勵信號。
當(dāng)聲音類型信號12是無話音時參數(shù)數(shù)據(jù)包類型選擇模塊輸出參數(shù)數(shù)據(jù)包類型信號18是 類型B,即聲碼器發(fā)送的數(shù)據(jù)包是包括LPC參數(shù)和幀能量參數(shù)的數(shù)據(jù)包,此時所有位(LPC 和FG)組合成為比特幀(bit frame),在這単分配給LPC的位數(shù)是8位(LPC系數(shù)2量化編 碼成8位);當(dāng)聲音類型信號12是有話音的,則參數(shù)數(shù)據(jù)包類型信號18是類型A,即聲碼器 發(fā)送的數(shù)據(jù)包包括了 LPC參數(shù)、音調(diào)參數(shù)和固定碼書參數(shù),此時所有位(LPC、 ACB、 ACBG、 FCB禾卩FCBG)組合成為比特幀(bitframe)。
圖3中的音調(diào)分析器(自適應(yīng)碼書搜索裝置)搜索基音增益^和基音延遲丄是經(jīng)過開環(huán) 搜索和閉環(huán)搜索得到的,在開環(huán)搜索時音調(diào)分析器根據(jù)殘佘信號3 (e(n))的相關(guān)性估算出的 整個幀的々和丄的開環(huán)值,即使下式達(dá)到最大的開環(huán)值L1及L1處的開環(huán)增益(31,
159<formula>formula see original document page 16</formula>
閉環(huán)搜索如圖3中的虛線所示,即,音調(diào)分析器給出開環(huán)延遲Ll附近的延遲值61 (可由7 個ACB位表示的)及開環(huán)增益pi附近的3個子幀的增益值(可由9個ACBG位表示的), 增益信號62包含這3個子幀的增益,LTP合成濾波器將延遲值61處的STP激勵信號67按 增益信號62中的增益值逐個子幀地放大形成LTP的零激勵響應(yīng)63,零激勵響應(yīng)63作為STP 合成濾波器的輸入產(chǎn)生合成數(shù)字聲音幀信號64,輸入聲音幀1減去合成數(shù)字聲音幀信號64
<formula>formula see original document page 16</formula>
形成誤差信號65,誤差信號65經(jīng)過感知加權(quán)濾波器的加權(quán)成為加權(quán)誤差信號66, 一旦音調(diào) 分析器在它搜索的所有延遲值61和增益信號62中增益值的配對中找到均方值最小的加權(quán)誤 差信號66,該信號對應(yīng)的延遲值61和增益信號62中增益值就分別作為基音延遲13和基音 增益14輸出,采用先開環(huán)搜索再閉環(huán)搜索的方法使得要搜索的延遲值和增益值的配對的數(shù)目 得以減少。
圖4所示的是圖3的聲碼器所對應(yīng)的譯碼器,聲碼器為輸入聲音信號幀生成的參數(shù)數(shù)據(jù) 包20輸出到參數(shù)數(shù)據(jù)包參數(shù)提取模塊,參數(shù)數(shù)據(jù)包參數(shù)提取模塊根據(jù)參數(shù)數(shù)據(jù)包20的類型 進(jìn)行參數(shù)的提取,類型A的參數(shù)數(shù)據(jù)包的長度大于類型B的長度,靠這一點(diǎn)可以區(qū)別類型A 的數(shù)據(jù)包和類型B的數(shù)據(jù)包,對于類型A的參數(shù)數(shù)據(jù)包參數(shù)數(shù)據(jù)包參數(shù)提取模塊提取出LPC 參數(shù)23、基音延遲£一參數(shù)14、基音增益-一一參數(shù)13、固定碼書碼矢量對應(yīng)的信號28 和固定碼書增益26;對于類型B的參數(shù)數(shù)據(jù)包參數(shù)數(shù)據(jù)包參數(shù)提取模塊提取出LPC參數(shù)23 和幀能量增益16。這樣,在參數(shù)數(shù)據(jù)包20是類型A時,信號28按固定碼書增益26放大后 成為信號ll,長時預(yù)測合成濾波器的過去的輸出信號的存儲模塊按照接收到的基音延遲iX參 數(shù)14)輸出長時預(yù)測合成濾波器的過去的輸出信號30,輸出信號30按基音增益- (參數(shù)13) 放大后與信號11相加成為短時預(yù)測合成濾波器的激勵信號27,短時合成濾波器是按接收到 的LPC參數(shù)23給出的LPC系數(shù)構(gòu)成的,短時合成濾波器對激勵信號27的響應(yīng)就是合成聲 音信號29。在參數(shù)數(shù)據(jù)包20是類型B時,偽隨機(jī)噪聲生成模塊按幀能量增益16生成偽高斯 白噪聲序列37,這樣偽高斯白噪聲序列37的能量和圖3中激勵信號更新控制模塊產(chǎn)生的偽 高斯白噪聲序列17的能量相同(是一致的),偽高斯白噪聲序列37作為STP合成濾波器的 激勵信號,STP合成濾波器響應(yīng)該激勵信號的輸出就是合成聲音信號29,同時該偽高斯白噪 聲序列還向LTP合成濾波器輸出并被存放在過去的輸出信號的存儲中。事實(shí)上,在參數(shù)數(shù)據(jù) 包20是類型A時,激勵信號27和聲碼器的激勵信號7也是一致的,因?yàn)榇藭r基音延遲丄一 參數(shù)14和基音增益^""參數(shù)13和聲碼器方的基音延遲£~"參數(shù)14和基音增益々^參數(shù)13相 同,此時的固定碼書碼矢量對應(yīng)的信號28和固定碼書增益26和聲碼器方的固定碼書碼矢量 8和固定碼書增益編碼6 —致,只要聲碼器方的過去的輸出信號的存儲模塊中的存放的STP 合成濾波器的激勵信號和譯碼器的一致,聲碼器的激勵信號和譯碼器的完全一致,因?yàn)閺某?始狀態(tài)開始雙方的過去的輸出信號的存儲中存放的STP合成濾波器的激勵信號都是一致的初 始值,所以之后雙方的激勵信號就是一致的。
由于聲碼器中存儲的STP合成濾波器的激勵信號和譯碼器保存的STP合成濾波器的激勵 信號一致,這樣在音調(diào)分析(自適應(yīng)碼書搜索)的閉環(huán)搜索時使用的過去的STP合成濾波器 的激勵信號也就和譯碼器的一致,自適應(yīng)碼書搜索使用由編碼速率確定的存儲的STP合成濾 波器的激勵信號使得譯碼器的合成數(shù)字聲音和聲碼器的一致提高了譯碼后的聲音的質(zhì)量。
實(shí)施例2,本實(shí)施例的聲碼器是對AMR (自適應(yīng)多速率)編碼器的改進(jìn),本實(shí)施例的聲碼 器的輸入聲音幀1為20毫秒長160個聲音數(shù)據(jù)樣本,意味著所提取的參數(shù)以每秒50次的傳 送,分割成40樣本的四個子幀。圖5示出一根據(jù)合成數(shù)字聲音信號幀將輸入聲音幀分類成有 12. 2kbps、 6. 7kbps和1. 8kbps三類編碼速率之一并根據(jù)所確定的編碼速率編碼的變速率AMR 聲碼器,輸入聲音信號幀1輸出到LP參數(shù)分析器和短時預(yù)測濾波器,由LP參數(shù)分析器產(chǎn)生 LPC系數(shù)參數(shù)2傳送至短時預(yù)測濾波器,產(chǎn)生量化了的LPC系數(shù)參數(shù)22傳送至短時預(yù)測合 —成遞波—器,短時預(yù)測濾波器的傳輸函數(shù)為A"),短時預(yù)測合成濾波器的傳輸函數(shù)為/f (z)
/ 為預(yù)測階數(shù)是10。本實(shí)施例中對每一幀都有一次LPC計(jì)算,分配給LPC參數(shù)22的位數(shù)是 38, LP參數(shù)分析器產(chǎn)生a, (i=l,2,...,m),即,LPC系數(shù)參數(shù)2, LP參數(shù)分析器還產(chǎn)生, (i=l,2,...,m),艮卩,LPC系數(shù)參數(shù)22,是根據(jù)由LPC計(jì)算得到的LPC系數(shù)2再量化編碼成的 38位LPC參數(shù)。
短時預(yù)測STP濾波器輸出的殘余信號3到音調(diào)分析器和長時預(yù)測LTP濾波器,LTP濾波 器的傳輸函數(shù)P("為l-^z』,P為基音增益,丄為基音延遲,A和丄是由音調(diào)分析器根據(jù)殘余 信號3估算出的每個子幀的音調(diào)數(shù)據(jù),音調(diào)分析器產(chǎn)生表征第一子幀的基音延遲的9個比特 和表征第三子幀的基音延遲的9個比特,音調(diào)分析器還產(chǎn)生表征第二子幀的基音延遲的6個 比特和表征第四子幀的基音延遲的6個比特;音調(diào)分析器產(chǎn)生表征第一子幀的自適應(yīng)碼書增 益的4個比特、表征第二子幀的自適應(yīng)碼書增益的4個比特、表征第三子幀的自適應(yīng)碼書增 益的4個比特和表征第四子幀的自適應(yīng)碼書增益的4個比特;根據(jù)音調(diào)分析器產(chǎn)生的表征子 幀的基音延遲的比特生成的子幀的基音延遲13被輸出到長時預(yù)測LTP合成濾波器,根據(jù)音 調(diào)分析器產(chǎn)生的表征子幀的自適應(yīng)碼書增益的比特生成的子幀的自適應(yīng)碼書增益14也被輸 出到LTP合成濾波器,LTP合成濾波器的傳輸函數(shù)為1/ ^是自適應(yīng)碼書增益14, 1是基音延遲13。 ,
固定碼書搜索模塊接收LTP濾波器輸出的殘余信號5計(jì)算產(chǎn)生固定碼書碼矢量8和固定 碼書增益編碼6,固定碼書碼矢量8中有35個比特表示第一子幀的固定碼書碼矢量,另有35 個比特表示第二子幀的固定碼書碼矢量,還有35個比特表示第三子幀的固定碼書碼矢量,而 且還有35個比特表示第四子幀的固定碼書碼矢量,固定碼書碼矢量8逐個子幀地輸出。固定 碼書增益參數(shù)也是逐個子幀地輸出,表示固定碼書增益編碼6的比特中有5個比特表示第一 子幀的固定碼書增益,另有5個比特表示第二子幀的固定碼書增益,還有5個比特表示第三 子幀的固定碼書增益,而且還有5個比特表示第四子幀的固定碼書增益,根據(jù)這些5個比特 表示產(chǎn)生的固定碼書增益編碼6逐子幀地輸tii。
分配到以上給出的各個參數(shù)比特幀(或數(shù)據(jù)包)內(nèi)碼比特置的總數(shù)與運(yùn)行在全速率 12.2kbps下的AMR聲碼器有關(guān),總之,該位幀包括38個LPC位;30個基音延遲位;16 個基音增益位;140個固定碼書碼矢量位;和20個固定碼書增益位,所以,該位幀內(nèi)的位總 數(shù)為244位,即20毫秒傳送244比特相當(dāng)于12.2kbps。
LTP合成濾波激勵生成模塊將固定碼書碼矢量8所表征的信號按固定碼書增益編碼6放 大后成為信號11輸出到長時預(yù)測LTP合成濾波器,LTP合成濾波器合成STP合成濾波器的 激勵信號7輸出到短時預(yù)測合成濾波器,從圖中給出的LTP合成濾波器的框圖可知,LTP合 成濾波器包含了一個記憶模塊——過去的輸出信號的存儲,該模塊將LTP為當(dāng)前和先前子幀 產(chǎn)生的激勵信號7 (或47)存儲起來,當(dāng)收到基音延遲i后輸出i個樣本點(diǎn)之前的STP合成 濾波器的激勵信號10,信號10按基音增益y9放大后同信號11相加產(chǎn)生STP合成濾波器的激 勵信號7,短時預(yù)測合成濾波器響應(yīng)激勵信號7生成合成語音信號9。
話音激活檢測模塊接收一個幀的合成語音信號9并檢測其中是否有話音并將檢測結(jié)果一 聲音類型信號12輸出到編碼幀類型選擇模塊,編碼幀類型選擇模塊根據(jù)聲音類型信號12和 之前收到的7個幀的檢測結(jié)果(聲音類型信號12)決定編碼幀類型信號18的值。聲音類型 信號12輸出到編碼幀類型選擇模塊,該模塊根據(jù)聲音類型信號12的內(nèi)容選擇發(fā)送到譯碼器 的參數(shù)數(shù)據(jù)包的類型,編碼幀(參數(shù)數(shù)據(jù)包)有三種類型C、 D和E,類型C和D的編碼幀 包括LPC參數(shù)、音調(diào)參數(shù)(自適應(yīng)碼書參數(shù))和固定碼書參數(shù),C和D的區(qū)別在于類型C 的編碼幀的位數(shù)是上述的244位而類型D的編碼幀的位數(shù)是134位,合成語音信號9就是按 照類型C的幀生成的;另一種是類型E,該類型的參數(shù)數(shù)據(jù)包包括LPC參數(shù)和幀能量參數(shù), 編碼幀類型選擇模塊輸出的編碼幀類型信號18的內(nèi)容就是三種類型C、 D和E之一。
若當(dāng)前幀的聲音類型信號12是有話音編碼幀類型信號18就是類型C,若當(dāng)前幀的聲音 類型信號12是有話音但前7個幀的檢測結(jié)果中有有話音則編碼幀類型信號18是類型D,若 檢測結(jié)果是無話音且前7個幀的檢測結(jié)果也都是無話音則編碼幀類型信號18是類型E。
幀能量分析器接收輸入聲音信號幀1,計(jì)算出幀能量的對數(shù)平均值并對其進(jìn)行量化,得 到6個比特的表示幀能量索引的值。
當(dāng)編碼幀類型信號18是類型E,聲碼器發(fā)送的數(shù)據(jù)包是包括LPC參數(shù)和幀能量索引的 數(shù)據(jù)包,此時所有位(LPC和幀能量索引)組合成為比特幀(bitframe),在這里分配給LPC 參數(shù)的位數(shù)是29位,激勵信號更新控制模塊在編碼幀類型信號18為類型E時向激勵信號更 新控制模塊輸出該信號,激勵信號更新控制模塊產(chǎn)生一個固定的值全為零的信號幀15, LTP 合成濾波器用該全零信號幀15的信號值代替其過去的輸出信號存儲中存放的由其生成對應(yīng) 輸入聲音信號幀1的STP合成濾波器激勵信號。
當(dāng)參數(shù)數(shù)據(jù)包類型信號18是類型C,聲碼器發(fā)送的編碼幀包括了 LPC參數(shù)、音調(diào)參數(shù) 和固定碼書參數(shù),此時所有位組合成為比特幀(bitframe),其中有38個LPC位、30個基音 延遲位、16個基音增益位、140個固定碼書碼矢量位和20個固定碼書增益位,也正是這些位 被用來產(chǎn)生用于VAD的合成語音信號聲音幀9。
當(dāng)編碼幀類型信號18是類型D,聲碼器發(fā)送的編碼幀包括了 LPC參數(shù)、音調(diào)參數(shù)和固 定碼書參數(shù),此時所有位組合成為位幀(bitframe),其中有26個LPC位、24個基音延遲位、 56個固定碼書碼矢量位、28個基音增益位和固定碼書增益位,由56個碼矢量位構(gòu)成的固定 碼書碼矢量38逐子幀地輸出至長時預(yù)測合成濾波激勵生成模塊,收到類型為D的編碼幀類 型信號18后音調(diào)分析器將按類型C量化得到的自適應(yīng)碼書增益48逐子幀地輸出到聯(lián)合量化 模塊,收到類型為D的編碼幀類型信號18后固定碼書搜索模塊將按類型C量化得到的固定 碼書增益43和預(yù)測固定碼書增益47逐子幀地輸出至聯(lián)合量化模塊,聯(lián)合量化模塊為每個子 幀的按類型C量化得到的自適應(yīng)碼書增益48和按類型C量化得到的固定碼書增益43搜索7 比特的聯(lián)合量化矢量表示,根據(jù)所述聯(lián)合量化矢量表示產(chǎn)生并輸出量化了的固定碼書增益36 和量化了的自適應(yīng)碼書增益33,收到類型為D的編碼幀類型信號18后音調(diào)分析器就將音調(diào) 參數(shù)中的基音延遲量化為上述的24個基音延遲比特,并且根據(jù)所述24個基音延遲比特產(chǎn)生 量化了的包含四個子幀基音延遲的基音延遲34,基音延遲34逐子幀地輸出至LTP合成濾波 器,長時預(yù)測合成濾波激勵生成模塊將固定碼書碼矢量38對應(yīng)的信號按量化了的固定碼書增 益36放大后成為信號31輸出至長時預(yù)測合成濾波器,LTP合成濾波器按基音延遲34重新逐
子幀地為當(dāng)前幀從過去輸出信號的存儲模塊中取出過去的激勵信號30,過去的激勵信號30 按量化了的自適應(yīng)碼書增益33放大后與信號31相加成為當(dāng)前幀的子幀的激勵信號47,當(dāng)前 幀的子幀的激勵信號47輸出至過去輸出信號的存儲模塊取代原先的激勵信號7。
圖5中的音調(diào)分析器(自適應(yīng)碼書搜索裝置)搜索基音增益P和基音延遲L是進(jìn)行閉環(huán) 搜索得到的,閉環(huán)搜索如圖3中的虛線所示,g卩,音調(diào)分析器給出17.5至lj 143個樣本點(diǎn)的范 圍內(nèi)分辨率為1/6個樣本的所有延遲值71和[O.O, 1.2]范圍的分辨率為0.075的所有增益值72, LTP合成濾波器將延遲值71處的STP激勵信號77按增益值72放大形成LTP的零激勵(即 自激勵)響應(yīng)73,零激勵響應(yīng)73作為STP合成濾波器的輸入產(chǎn)生合成數(shù)字聲音幀信號74, 輸入聲音幀1逐個子幀地與合成數(shù)字聲音幀信號74相減形成誤差信號75,誤差信號75經(jīng)過 感知加權(quán)濾波器的加權(quán)成為加權(quán)誤差信號76, 一旦音調(diào)分析器在它搜索的所有延遲值71和 增益值72的配對中找到均方值最小的加權(quán)誤差信號76該信號對應(yīng)的延遲值71和增益值72 就分別作為基音延遲13和基音增益14逐個子幀地輸出,在這里,采用分辨率為1/6個樣本 點(diǎn)的延遲值71使得信號77的生成要將存儲的STP合成濾波器的激勵信號進(jìn)行內(nèi)插。當(dāng)然, 如果采用開環(huán)搜索后再閉環(huán)搜索的方法可以使用以搜索的延遲值71和增益值72的配對的數(shù) 目得以減少。
圖6所示的是圖5的聲碼器所對應(yīng)的譯碼器,聲碼器為輸入聲音信號幀生成的編碼幀20 輸出到編碼幀參數(shù)提取模塊,編碼幀參數(shù)提取模塊根據(jù)編碼幀20的類型進(jìn)行參數(shù)的提取,類 型C的參數(shù)數(shù)據(jù)包的長度大于類型D的長度,類型D的參數(shù)數(shù)據(jù)包的長度大于類型E的長 度,靠這一點(diǎn)可以區(qū)別C、 D和E,對于類型C或D的編碼幀編碼幀參數(shù)提取模塊提取出LPC 參數(shù)23、基音延遲£~~參數(shù)24、基音增益-"^參數(shù)25、固定碼書碼矢量對應(yīng)的信號28和固 定碼書增益26;對于類型E的編碼幀編碼幀參數(shù)提取模塊提取出LPC參數(shù)23和幀能量對數(shù) 索引值16。這樣,在編碼幀20是類型C或D時,信號28按固定碼書增益26放大后成為信 號41,長時預(yù)測合成濾波器的過去的輸出信號的存儲模塊按照接收到的基音延遲丄(參數(shù)24) 輸出長時預(yù)測合成濾波器的過去的輸出信號40,輸出信號40按基音增益々(參數(shù)25)放大 后成為短時預(yù)測合成濾波器的激勵信號27,短時合成濾波器是按接收到的LPC參數(shù)23給出 的LPC系數(shù)構(gòu)成的,短時合成濾波器對激勵信號27的響應(yīng)就是合成聲音信號29。在編碼幀 20是類型E時,偽隨機(jī)噪聲生成模塊按幀能量增益16生成偽高斯白噪聲序列37,偽隨機(jī)噪 聲還生成全零的信號35輸出至長時預(yù)測合成濾波器的過去的輸出信號的存儲模塊,偽高斯白 噪聲序列37作為STP合成濾波器的激勵信號,STP合成濾波器響應(yīng)該激勵信號的輸出就是 合成聲音信號29,全零的信號35被存放在過去的輸出信號的存儲中,這樣譯碼器和聲碼器 就擁有一樣的當(dāng)前幀的STP合成濾波器的激勵信號的存儲。
在編碼幀20是類型C或D時,激勵信號27和聲碼器的激勵信號7或激勵信號47也是 一致的,因?yàn)榇藭r基音延遲Z—-參數(shù)24和基音增益"^參數(shù)25分別與聲碼器方的基音延遲/< (參數(shù)信號14或參數(shù)信號34)和基音增益^ (參數(shù)信號13或參數(shù)信號33)相同,此時的固 定碼書碼矢量對應(yīng)的信號28和固定碼書增益26和聲碼器方的固定碼書碼矢量8 (或固定碼 書碼矢量38)和固定碼書增益編碼6 (或固定碼書碼增益36) —致,只要聲碼器方的過去的 輸出信號的存儲中的存放的STP合成濾波器的激勵信號和譯碼器的一致,聲碼器的激勵信號 和譯碼器的完全一致,因?yàn)閺某跏紶顟B(tài)開始雙方的過去的輸出信號的存儲中存放的STP合成
濾波器的激勵信號都是一致的初始值,所以之后雙方的激勵信號就是一致的。
由于上述AMR編碼器中存儲的STP.合成濾波器的激勵信號和AMR譯碼器保存的STP 合成濾波器的激勵信號一致,這樣在音調(diào)分析(自適應(yīng)碼書搜索)的閉環(huán)搜索時使用的過考 的STP合成濾波器的激勵信號也就和譯碼器的一致,自適應(yīng)碼書搜索使用根據(jù)編碼速率確定 的STP合成濾波器的激勵信號的存儲使得譯碼器的合成數(shù)字聲音和聲碼器的一致,從而提高 了譯碼后的聲音的質(zhì)量。
下面以一個合成數(shù)字話音信號幀的樣本點(diǎn)上的信號值為例來說明VAD,原來輸入信號幀 上每個樣本點(diǎn)的值被表示為16比特,上述的AMR編碼器將其3個最低有效位(比特2-比特O) 置0從而形成13比特的數(shù)字話音信號,花括號內(nèi)是按先后順序表示的由AMR-NB編碼器處理 后形成的一個合成數(shù)字話音信號幀上的樣本點(diǎn)上的信號{-43, 42, 13, 15, 7, -41, -1, 33, 0' -1, 1, —6, -5, —176, -32, 215, 430, 186' -81, -74, 195, 105, 19, -29, -72, -29, -46, -235, 123, -98, -67, -72, 16, 39, 126, 71, -63, 53, 31, -153, 92, 136, 100, 2, 17, -45, 31, 45, -47, -102, -98, -44, 8, 88, 1, -41, 118, -52, 1, 59, 32' 10, -27, -41, 108, -45, -44, 55, 72, -26, 119' -110' -70, -131, 43, 54, 10, —41, -50, 16, -15, 56, 20, 13, -13, -1, —3, 6' 11, 9, -44, -119' -134, 151, 288, 104' -229, -39, -6, 25, 188, 61, —73, -27, -233, —137, 136, —2, —218, 56, 43, 139, —14, 5, —16, 246, 22, —131, 89, 76, -97, 7, 134, 9, 42' 3, —31, —102, —126, —49, —11, —36, -64, —5, 144' 201, 17, 42, 56, -146, -134, 1, -76, -153, -81, 22, 2, -39, 39, 80, 42, 80, 31, -30, -41, -52, -75, -16, 7, -17},這里的較大的上升沿有幅度為506的從-176到430 一段、幅度為358的-235到123的一段、幅度為407的-119到288的一段、幅度為417的-229 到188的一段、幅度為399的-233到136的一段和幅度為327的-126到201的一段,該幀的 能量按前述式(1)計(jì)算是1446981,該幀的平均幅度是(幀內(nèi)每個樣本點(diǎn)上的信號值的絕對 值之和)是10813。
根據(jù)該幀的能量確定VAD中上升沿閾值的方案是將幀的能量1446981平均到每個樣本 點(diǎn)上的平方根乘5(等于475. 5)作為上升沿第一閾值,將幀的能量1446981平均到每個樣本點(diǎn) 上的平方根乘4(等于360. 4)作為上升沿第二閾值,當(dāng)該幀的大于第一閾值的上升沿的個數(shù)在 1和2之間且該幀的大于第二閾值的上升沿的個數(shù)在2和4之間時該幀的檢測結(jié)果為有聲音, 這樣該幀因?yàn)橛?06、 407和417的上升沿其檢測結(jié)果就是有聲音。
上述的根據(jù)上升沿檢測是否有聲音的方案還可和根據(jù)能量檢測的方案相結(jié)合以根據(jù)能量 檢測方案的不足,在這里用來與第/幀的幀能量比較的幀能量電平閾值雙的計(jì)算式如下 5產(chǎn)附i"[及w (0), 1500000' m似(1.00547 5,.' + l)]
例如當(dāng)上一合成數(shù)字聲音幀的能量凡-,(①為1450000、上一合成數(shù)字聲音幀的幀能量電平閾 值萬,"為1440000時,根據(jù)花括號內(nèi)數(shù)據(jù)所給出的幀的幀能量電平閾值A(chǔ)就為1447876.8 (大 于1446981)無法檢測出有聲音的結(jié)果。
類似的,根據(jù)上升沿檢測是否有聲音的方案還可和根據(jù)信號電平檢測的方案相結(jié)合。
現(xiàn)有技術(shù)檢測是否有聲音的能量或電平檢測方法往往根據(jù)的是多個子帶上的能量或電 平,在本發(fā)明中也可采用根據(jù)合成數(shù)字話音信號幀的特定的子帶的能量和信號的方案,例如,
能量計(jì)算部件根據(jù)下面的公式確定所述多個子帶能量值中的每個子帶能量值
<formula>formula see original document page 22</formula>
其中L為帶通濾波器hbp(n)內(nèi)的抽頭數(shù),Rs(i)為輸入信號S(n)的自相關(guān)函數(shù),R^為帶通濾 波器hbp(n)的自相關(guān)函數(shù),p是帶通濾波器hbp(n)的階數(shù)。根據(jù)子帶能量和對應(yīng)的子帶能量 電平閾值的比較結(jié)果可以作出是否有聲音的判決,子帶能量電平閾值的確定和上述的能量電 平閾值的確定方法類似。
關(guān)于合成數(shù)字話音信號幀的特定的子帶的電平,3GPP26094-500的3. 3. 1節(jié)濾波器組與 子帶電平計(jì)算(Filter bank and computation of sub-band levels)給出了一種求子帶的 電平的方法。
本發(fā)明可由本專業(yè)的人員進(jìn)行各種的修改和變更,但其修'改和變更均在所附的專利申請 要保護(hù)的范圍內(nèi)。
權(quán)利要求
1. 一種為輸入聲音信號幀輸出數(shù)據(jù)包的碼激勵線性預(yù)測CELP編碼器,包括,由對所述輸入聲音信號幀自適應(yīng)碼書搜索得到的自適應(yīng)碼書參數(shù)所確定的長時預(yù)測LTP合成濾波器,用于接收按對所述輸入聲音信號幀進(jìn)行固定碼書搜索得到的固定碼書增益放大所述固定碼書搜索得到的固定碼書碼矢量信號而形成的信號;以及由對輸入聲音信號幀進(jìn)行線性預(yù)測得到的線性預(yù)測參數(shù)所確定的短時預(yù)測STP合成濾波器,用于將所述LTP合成濾波器的輸出信號作為其激勵信號并響應(yīng)以合成數(shù)字聲音信號幀;其特征在于,還包括,聲音信號檢測部件,用于判斷所述合成數(shù)字聲音信號幀中是否存在聲音信號;以及編碼速率及激勵信號選擇部件,用于根據(jù)所述合成數(shù)字聲音信號幀中是否存在聲音信號的判斷為所述數(shù)據(jù)包選擇編碼速率和選擇用于對與所述輸入聲音信號幀相鄰的后一輸入聲音信號幀進(jìn)行自適應(yīng)碼書搜索的所述輸入聲音信號幀的STP合成濾波器的激勵信號,即,在所述判斷是存在聲音信號時,選擇生成包含表示所述自適應(yīng)碼書參數(shù)、所述固定碼書碼矢量和所述固定碼書增益的比特的所述數(shù)據(jù)包,并選擇存儲所述LTP合成濾波器的所述輸出信號用以對與所述輸入聲音信號幀相鄰的后一輸入聲音信號幀進(jìn)行自適應(yīng)碼書搜索;在所述判斷是不存在聲音信號時,選擇生成包含表示所述輸入聲音信號幀幀能量的比特的所述數(shù)據(jù)包,并選擇存儲與該數(shù)據(jù)包譯碼后所表示的的STP合成濾波器的激勵信號一致的STP合成濾波器的激勵信號,用以對與所述輸入聲音信號幀相鄰的后一輸入聲音信號幀進(jìn)行自適應(yīng)碼書搜索。
2. —種為輸入聲音信號幀輸出數(shù)據(jù)包的碼激勵線性預(yù)測CELP編碼器,包括,由對所述輸入 聲音信號幀自適應(yīng)碼書搜索得到的自適應(yīng)碼書參數(shù)所確定的長時預(yù)測LTP合成濾波器,用 于接收按對所述輸入聲音信號幀進(jìn)行固定碼書搜索得到的固定碼書增益放大所述固定碼 書搜索得到的固定碼書碼矢量信號而形成的信號;以及由對輸入聲音信號幀進(jìn)行線性預(yù)測得到的線性預(yù)測參數(shù)所確定短時預(yù)測STP合成濾 波器,用于將所述LTP合成濾波器的輸出信號作為其激勵信號并響應(yīng)以合成數(shù)字聲音信號 幀; .其特征在于,還包括,聲音信號檢測部件,用于判斷所述合成數(shù)字聲音信號幀中是否 存在聲音信號;以及編碼速率及激勵信號選擇部件,用于根據(jù)所述合成數(shù)字聲音信號幀中是否存在聲音信 號的判斷為所述數(shù)據(jù)包選擇編碼速率和選擇用于對與所述輸入聲音信號幀相鄰的后一輸 入聲音信號幀進(jìn)行自適應(yīng)碼書搜索的所述輸入聲音信號幀的STP合成濾波器的激勵信 號,即,在所述判斷是存在聲音信號時,選擇生成包含表示所述自適應(yīng)碼書參數(shù)、所述固定碼 書碼矢量和所述固定碼書增益的所述數(shù)據(jù)包,并選擇存儲所述LTP合成濾波器的所述輸 出信號用以對與所述輸入聲音信號幀相鄰的后一輸入聲音信號幀進(jìn)行自適應(yīng)碼書搜索; 在所述判斷是不存在聲音信號時,選擇生成包含表示所述輸入聲音信號幀幀能量的比特的所述數(shù)據(jù)包或者以較少的比特?cái)?shù)表示自適應(yīng)碼書參數(shù)和固定碼書參數(shù)的所述數(shù)據(jù)包, 并且,若選擇生成的所述數(shù)據(jù)包包含了表示幀能量的比特則還選擇存儲與該數(shù)據(jù)包譯碼 后所表示的STP合成濾波器的激勵信號一致的STP合成濾波器的激勵信號,用以對與所 述輸入聲音信號幀相鄰的后一輸入聲音信號幀進(jìn)行自適應(yīng)碼書搜索;若選擇生成的所述 數(shù)據(jù)包是所述的以較少的比特?cái)?shù)表示自適應(yīng)碼書參數(shù)和固定碼書參數(shù)的數(shù)據(jù)包,則還選 擇存儲根據(jù)所述以較少比特?cái)?shù)表示的自適應(yīng)碼書參數(shù)確定的長時預(yù)測LTP合成濾波器對 所述以較少比特?cái)?shù)表示的固定碼書參數(shù)所確定的固定碼書碼矢量表示的信號按所述以較 少比特?cái)?shù)表示的固定碼書參數(shù)所確定的固定碼書增益放大后的信號的激勵的響應(yīng),用以 對與所述輸入聲音信號幀相鄰的后一輸入聲音信號幀進(jìn)行自適應(yīng)碼書搜索。
3. 根據(jù)權(quán)利要求1或2的編碼器,其特征在于, '所述與該數(shù)據(jù)包譯碼后所表示的的STP合成濾波器的激勵信號一致的STP合成濾波器 的激勵信號是偽隨機(jī)噪聲信號,該偽隨機(jī)噪聲信號的幀能量與所述該數(shù)據(jù)包譯碼后所表示 的STP合成濾波器的激勵信號的幀能量相同。
4. 根據(jù)權(quán)利要求1或2的編碼器,其特征在于,所述與該數(shù)據(jù)包譯碼后所表示的的STP合成濾波器的激勵信號一致的STP合成濾波器 的激勵信號和所述該數(shù)據(jù)包譯碼后所表示的的STP合成濾波器的激勵信號相同,都是預(yù)定 的固定信號。
5. 根據(jù)權(quán)利要求1至4中任一項(xiàng)的編碼器,其特征在于,所述聲音信號檢測部件包括多個副帶能量計(jì)算部件,用于確定所述合成數(shù)字聲音信號幀的各頻率副帶的信號能 量;以及多個副帶閾值計(jì)算部件,各副帶閾值計(jì)算部件耦合至所述多個副帶能量計(jì)算部件中的 相應(yīng)的一個,其中各副帶閾值計(jì)算部件用于使用所指定的一個頻率副帶的信號能量來判斷 在所述合成數(shù)字聲音信號幀中是否存在聲音信號。
6. 根據(jù)權(quán)利要求1至4中任一項(xiàng)的編碼器,其特征在于,所述聲音信號檢測部件包括多個副帶電平計(jì)算部件,用于確定所述合成數(shù)字聲音信號幀的各頻率副帶的信號電 平;以及多個副帶閾值計(jì)算部件,各副帶閾值計(jì)算部件耦合至所述多個副帶電平計(jì)算部件中的 相應(yīng)的一個,其中各副帶閾值計(jì)算部件用于使用所指定的一個頻率副帶的信號電平來判斷 在所述合成數(shù)字聲音信號幀中是否存在聲音信號。
7. 根據(jù)權(quán)利要求5或6的編碼器,其特征在于,所述聲音信號檢測部件還包括.振幅閾值計(jì)算部件,該部件根據(jù)所述合成數(shù)字聲音信號幀波形的振幅來判斷所述合成 數(shù)字聲音信號幀中是否存在聲音信號。
8.根據(jù)權(quán)利要求5或6的編碼器,其特征在于,所述聲音信號檢測部件還包括上升沿閾值計(jì)算部件,該部件根據(jù)所述合成數(shù)字聲音信號幀中的上升沿的幅度來判斷 所述合成數(shù)字聲音信號幀中是否存在聲音信號。
9.根據(jù)權(quán)利要求1至4中任一項(xiàng)的編碼器,其特征在于,所述聲音信號檢測部件包括能量計(jì)算部件,用于確定所述合成數(shù)字聲音信號幀的信號能量;以及振幅閾值計(jì)算部件,該部件根據(jù)所述合成數(shù)字聲音信號幀的信號能量確定振幅閾值, 并根據(jù)所述合成數(shù)字聲音信號幀波形中的振幅超過該振幅閾值的個數(shù)判斷所述合成數(shù)字 聲音信號幀中是否存在聲音信號。
10.根據(jù)權(quán)利要求1至4中任一項(xiàng)的編碼器,其特征在于,所述聲音信號檢測部件包括 能量計(jì)算部件,用于確定所述合成數(shù)字聲音信號幀的信號能量;上升沿閾值計(jì)算部件,上升沿閾值計(jì)算部件耦合至所述能量計(jì)算部件,用于根據(jù)所述 合成數(shù)字聲音信號幀中的上升沿的大小和數(shù)量以及所述信號能量來判斷在所述合成數(shù)字 聲音信號幀中是否存在聲音信號。
11.根據(jù)權(quán)利要求1至4中任一項(xiàng)的編碼器,其特征在于,所述聲音信號檢測部件包括多個副帶能量計(jì)算部件,用于確定所述合成數(shù)字聲音信號幀的各頻率副帶的信號能 量;以及 ,上升沿閾值計(jì)算部件,上升沿閾值計(jì)算部件耦合至所述能量計(jì)算部件,用于根據(jù)所述 合成數(shù)字聲音信號幀中的上升沿的大小和數(shù)量以及所述多個頻率副帶的信號能量來判斷 在所述合成數(shù)字聲音信號幀中是否存在聲音信號。
12. 根據(jù)權(quán)利要求1至11中任一項(xiàng)的編碼器,其特征在于,與所述輸入聲音信號幀相鄰的后 一輸入聲音信號幀的STP合成濾波器根據(jù)所述合成數(shù)字聲音信號幀尾部的若干個樣本點(diǎn) 上的值生成所述后一輸入聲音信號幀的合成數(shù)字聲音幀,所述若干個樣本點(diǎn)的個數(shù)與所述 STP合成濾波器的階數(shù)一致。
13. —種碼激勵線性預(yù)測CELP編碼方法,其中對輸入聲音信號幀進(jìn)行線性預(yù)測并用對所述輸入聲音信號幀進(jìn)行線性預(yù)測得到的線 性預(yù)測參數(shù)確定短時預(yù)測STP合成濾波器,對所述輸入聲音信號幀進(jìn)行自適應(yīng)碼書搜索和 固定碼書搜索,根據(jù)所述自適應(yīng)碼書搜索得到的自適應(yīng)^書參數(shù)確定長時預(yù)測LTP合成濾 波器,將所述固定碼書搜索得到的固定碼書碼矢量所表示的信號按所述固定碼書搜索得到 的固定碼書增益放大后作為所述LTP合成濾波器的輸入信號,將所述LTP合成濾波器對該 輸入信號的響應(yīng)作為所述輸入聲音信號幀的STP合成濾波器的激勵信號,該STP合成濾波 器響應(yīng)以合成數(shù)字聲音信號,其特征在于,對所述合成數(shù)字聲音信號幀進(jìn)行是否存在聲音信號的檢測,若檢測結(jié)果是有話音,為 所述輸入聲音信號幀生成包含表示所述自適應(yīng)碼書參數(shù)、所述固定碼書碼矢量和所述固 定碼書增益的比特的數(shù)據(jù)包,并存儲所述輸入聲音信號幀的STP合成濾波器的激勵信號 用以對與所述輸入聲音信號幀相鄰的后一輸入聲音信號幀進(jìn)行自適應(yīng)碼書搜索;若所述 的檢測結(jié)果是無話音,為所述輸入聲音信號幀生成包含表示所述輸入聲音信號幀幀能量 的比特的數(shù)據(jù)包,并使存儲的所述輸入聲音信號幀的STP合成濾波器的激勵信號與該數(shù) 據(jù)包所表示的譯碼后的STP合成濾波器的激勵信號一致。
14. 一種碼激勵線性預(yù)測CELP編碼方法,其中對輸入聲音信號幀進(jìn)行線性預(yù)測并用對所述輸入聲音信號幀進(jìn)行線性預(yù)測得到的線 性預(yù)測參數(shù)確定短時預(yù)測STP合成濾波器,對所述輸入聲音信號幀進(jìn)行自適應(yīng)碼書搜索和 固定碼書搜索,根據(jù)所述自適應(yīng)碼書搜索得到的自適應(yīng)碼書參數(shù)確定長時預(yù)測LTP合成濾 波器,將所述固定碼書搜索得到的固定碼書碼矢量所表示的信號按所述固定碼書搜索得到 的固定碼書增益放大后作為所述LTP合成濾波器的輸入信號,將所述LTP合成濾波器對該 輸入信號的響應(yīng)作為所述輸入聲音信號幀的STP合成濾波器的激勵信號,該STP合成濾波 器響應(yīng)以合成數(shù)字聲音信號,其特征在于,對所述合成數(shù)字聲音信號幀進(jìn)行是否存在聲音信號的檢測,若檢測結(jié)果是有話音,為 所述輸入聲音信號幀生成包含表示所述自適應(yīng)碼書參數(shù)、所述固定碼書碼矢量和所述固 定碼書增益的比特的數(shù)據(jù)包,并存儲所述輸入聲音信號幀的STP合成濾波器的激勵信號 用以對與所述輸入聲音信號幀相鄰的后一輸入聲音信號幀進(jìn)行自適應(yīng)碼書搜索;若所述 的檢測結(jié)果是無話音,為所述輸入聲音信號幀生成包含表示所述輸入聲音信號幀幀能量 的比特的數(shù)據(jù)包或?yàn)樗鲚斎肼曇粜盘枎梢暂^少的比特?cái)?shù)表示線性預(yù)測參數(shù)、自適 應(yīng)碼書參數(shù)和固定碼書參數(shù)的數(shù)據(jù)包,以及若所述的檢測結(jié)果是無話音且所述生成的數(shù)據(jù)包包含了表示幀能量的比特則使存儲 的所述輸入聲音信號幀的STP合成濾波器的激勵信號與該數(shù)據(jù)包所表示的譯碼后的STP 合成濾波器的激勵信號一致;若所述的檢測結(jié)果是無話音且所述生成的數(shù)據(jù)包是所述的以較少的比特?cái)?shù)表示線性 預(yù)測參數(shù)、自適應(yīng)碼書參數(shù)和固定碼書參數(shù)的數(shù)據(jù)包則根據(jù)所述以較少比特?cái)?shù)表示的自 適應(yīng)碼書參數(shù)確定長時預(yù)測LTP合成濾波器且將所述以較少比特?cái)?shù)表示的固定碼書參數(shù) 所確定的固定碼書碼矢量表示的信號按所述以較少比特?cái)?shù)表示的固定碼書參數(shù)所確定的 固定碼書增益放大后作為該LTP合成濾波器的輸入信號,將該LTP合成濾波器的輸出信 號作為輸入聲音信號幀的STP合成濾波器的激勵信號并將存儲該STP合成濾波器的響應(yīng) 用以對與所述輸入聲音信號幀相鄰的后一輸入聲音信號幀進(jìn)行自適應(yīng)碼書搜索。
15. 根據(jù)權(quán)利要求13或14的方法,其特征在于,所述與該數(shù)據(jù)包譯碼后所表示的的STP合成濾波器的激勵信號一致的STP合成濾波器 的激勵信號是偽隨機(jī)噪聲信號,該偽隨機(jī)噪聲信號的幀能量與所述該數(shù)據(jù)包譯碼后所表示 的的STP合成濾波器的激勵信號的幀能量相同。
16. 根據(jù)權(quán)利要求13或14的方法,其特征在于,所述與該數(shù)據(jù)包譯碼后所表示的的STP合成濾波器的激勵信號一致的STP合成濾波器 的激勵信號和所述該數(shù)據(jù)包譯碼后所表示的的STP合成濾波器的激勵信號相同,都是預(yù)定 的固定信號。
17. 根據(jù)權(quán)利要求13至16中任一項(xiàng)的方法,其特征在于,所述對所述合成數(shù)字聲音信號幀進(jìn) 行是否存在聲音信號的檢測的歩驟包括計(jì)算所述合成數(shù)字聲音信號幀的信號能量;以及使用所述合成數(shù)字聲音信號幀的的信號能量來判斷在所述合成數(shù)字聲音信號幀中是 否存在聲音信號。
18. 根據(jù)權(quán)利要求13至16中任一項(xiàng)的方法,其特征在于,所述對所述合成數(shù)字聲音信號幀進(jìn) 行是否存在聲音信號的檢測的步驟包括計(jì)算所述合成數(shù)字聲音信號幀的信號電平;以及'使用所述合成數(shù)字聲音信號幀的的信號電平來判斷在所述合成數(shù)字聲音信號幀中是 否存在聲音信號。
19. 根據(jù)權(quán)利要求13至16中任一項(xiàng)的方法,其特征在于,所述對所述合成數(shù)字聲音信號幀進(jìn) 行是否存在聲音信號的檢測的歩驟包括計(jì)算所述合成數(shù)字聲音信號幀的各頻率副帶的信號能量;以及 使用所述頻率副帶的信號能量來判斷在所述合成數(shù)字聲音信號幀中是否存在聲音信號。
20. 根據(jù)權(quán)利要求13至16中任一項(xiàng)的方法,其特征在于,所述對所述合成數(shù)字聲音信號幀進(jìn) 行是否存在聲音信號的檢測的步驟包括計(jì)算所述合成數(shù)字聲音信號幀的各頻率副帶的信號電平;以及使用所述頻率副帶的信號電平來判斷在所述合成數(shù)字聲音信號幀中是否存在聲音信號。
21. 根據(jù)權(quán)利要求17至20中任一項(xiàng)的方法,其特征在于,所述對所述合成數(shù)字聲音信號幀進(jìn) 行是否存在聲音信號的檢測的歩驟還包括使用所述合成數(shù)字聲音信號幀的波形中的振幅來判斷所述合成數(shù)字聲音信號幀中是 否存在聲音信號。
22. 根據(jù)權(quán)利要求17至20中任一項(xiàng)的方法,其特征在于,所述對所述合成數(shù)字聲音信號幀進(jìn) 行是否存在聲音信號的檢測的步驟還包括使用所述合成數(shù)字聲音信號幀中的上升沿的幅度來判斷所述合成數(shù)字聲音信號幀中 是否存在聲音信號。
23. 根據(jù)權(quán)利要求22的方法,其特征在于,所述使用所述合成數(shù)字聲音信號幀中的上升沿的幅度來判斷所述合成數(shù)字聲音信號 幀中是否存在聲音信號包括:根據(jù)所述合成數(shù)字聲音信號幀確定一個閾值,根據(jù)所述合成 數(shù)字聲音信號幀中的波形的波峰的上升沿的幅度同所述閾值比較的結(jié)果來判斷所述合成 數(shù)字聲音信號幀中是否存在話音。
24. 根據(jù)權(quán)利要求22的方法,其特征在于,所述使用所述合成數(shù)字聲音信號幀中的上升沿的幅度來判斷所述合成數(shù)字聲音信號 幀中是否存在聲音信號包括根據(jù)所述的合成數(shù)字聲音信號幀確定幅度閾值和范圍,根 據(jù)所述的合成數(shù)字聲音信號幀中的波形中的上升沿幅度超過該幅度閾值的波峰的個數(shù)是 否在所述范圍之內(nèi)來判斷所述合成數(shù)字聲音信號幀中是否存在話音。
25. 根據(jù)權(quán)利要求13至16中任一項(xiàng)的方法,其特征在于,所述對所述合成數(shù)字聲音信號幀進(jìn) 行是否存在聲音信號的檢測的步驟包括根據(jù)所述合成數(shù)字聲音信號幀的信號能量確定振幅閾值;以及根據(jù)所述合成數(shù)字聲音信號幀的波形中的振幅超過該振幅閾值的波峰或波谷的個數(shù) 是否在預(yù)定的一個范圍內(nèi)來判斷所述合成數(shù)字聲音信號幀中是否存在聲音信號。
26. 根據(jù)權(quán)利要求13至16中任一項(xiàng)的方法,其特征在于所述對所述合成數(shù)字聲音信號幀進(jìn)行 是否存在聲音信號的檢測的歩驟包括根據(jù)所述合成數(shù)字聲音信號幀的信號能量確定上升沿閾值;以及根據(jù)所述合成數(shù)字聲音信號幀的波形中的上升沿超過該上升沿閾值的波峰的個數(shù)是 否在預(yù)定的一個范圍內(nèi)來判斷所述合成數(shù)字聲音信號幀中是否存在聲音信號。
27. 根據(jù)權(quán)利要求13至16中任一項(xiàng)的方法,其特征在于,z所述對所述合成數(shù)字聲音信號幀進(jìn) 行是否存在聲音信號的檢測的步驟包括根據(jù)所述合成數(shù)字聲音信號幀的信號能量來確定若干個上升沿閾值;以及由所述若干個上升沿閾值劃分若干個上升沿幅度的范圍.;根據(jù)所述合成數(shù)字聲音信號幀中的波峰的上升沿在所述劃分的若干個上升沿幅度的 范圍中的分布來判斷所述合成聲音信號幀中是否存在聲音信號。
28. 據(jù)權(quán)利要求13至16中任一項(xiàng)的方法,其特征在于,所述對所述合成數(shù)字聲音信號幀進(jìn)行 是否存在聲音信號的檢測的步驟包括 根據(jù)所述合成數(shù)字聲音信號幀的多個頻率副帶的信號能量來確定上升沿閾值,根據(jù)所述合成數(shù)字聲音信號幀的波形中的上升沿超過該上升沿閾值的波峰的個數(shù)是 否在預(yù)定的一個范圍內(nèi)來判斷所述合成數(shù)字聲音信號幀中是否存在聲音信號。
29.根據(jù)權(quán)利要求13至28中任一項(xiàng)的方法,其特征在于,與所述輸入聲音信號幀相鄰的后一 輸入聲音信號幀的STP合成濾波器根據(jù)所述合成數(shù)字聲音信號幀尾部的若干個樣本點(diǎn)上 的值生成所述后一輸入聲音信號幀的合成數(shù)字聲音幀,所述若干個樣本點(diǎn)的個數(shù)與STP合 成濾波器的階數(shù)一致。
全文摘要
本發(fā)明提出一種新的變速率碼激勵線性預(yù)測編碼器和編碼方法,其話音激活檢測針對編碼幀對應(yīng)的合成數(shù)字話音,并且保持編碼方和譯碼方采用一致的激勵信號,根據(jù)合成數(shù)字話音幀的話音激活檢測結(jié)果確定編碼速率從而提高了檢測的效率和壓縮了語音傳送速率,所述的改變對變速率碼激勵線性預(yù)測編碼器和編碼方法作了總體上的更新,即,編碼器根據(jù)發(fā)送幀的類型確定其激勵信號使譯碼器合成的聲音信號能準(zhǔn)確地反映原始聲音的聽覺效果。
文檔編號G10L19/12GK101388214SQ20081021021
公開日2009年3月18日 申請日期2008年8月9日 優(yōu)先權(quán)日2007年9月14日
發(fā)明者為 向 申請人:為 向