專利名稱:語(yǔ)音解碼器中幀差錯(cuò)隱藏的譜參數(shù)代替方法及系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及語(yǔ)音解碼器,更具體的說,涉及用于處理語(yǔ)音解碼器接收的壞幀的方法。
背景技術(shù):
在數(shù)字蜂窩系統(tǒng)中,比特流被說成要通過將移動(dòng)臺(tái)連接至基站的通信信道經(jīng)空中接口發(fā)送。比特流被組織成幀,包括語(yǔ)音幀。傳輸期間是否出現(xiàn)錯(cuò)誤取決于主要的信道條件。檢測(cè)到包含錯(cuò)誤的語(yǔ)音幀稱為壞幀,損壞或丟失的幀即為壞幀。根據(jù)現(xiàn)有技術(shù),在出現(xiàn)壞幀時(shí),從以前的正確參數(shù)(無錯(cuò)誤語(yǔ)音幀)導(dǎo)出的語(yǔ)音參數(shù)可代替壞幀的語(yǔ)音參數(shù)。通過進(jìn)行此類代替來處理壞幀的目的是隱藏錯(cuò)誤語(yǔ)音幀的損壞的語(yǔ)音參數(shù),而不引起語(yǔ)音質(zhì)量的明顯下降。對(duì)于每一幀,編碼器確定輸入信號(hào)的參數(shù)表示。參數(shù)被量化,然后通過通信信道以數(shù)字形式發(fā)送。解碼器根據(jù)收到的參數(shù)產(chǎn)生合成語(yǔ)音信號(hào)。一般提取的編碼參數(shù)組包括用于短期預(yù)測(cè)的譜參數(shù)(S卩,線性預(yù)測(cè)編碼參數(shù))、用于信號(hào)長(zhǎng)期預(yù)測(cè)的參數(shù)(即,長(zhǎng)期預(yù)測(cè)參數(shù))、各種增益參數(shù)以及最后的激勵(lì)參數(shù)。所謂的線性預(yù)測(cè)編碼(LPC)是一種用于將語(yǔ)音編碼以便經(jīng)通信信道傳輸?shù)膹V泛使用的有效方法;它表示聲道的頻率整形屬性。LPC參數(shù)化表征短段語(yǔ)音的譜形狀。LPC參數(shù)可表示為線譜頻率(LSF)或者等價(jià)的導(dǎo)抗譜對(duì)(ISP)。ISP是通過將反濾波器傳遞函數(shù)A(z)分解為一組的一個(gè)偶對(duì)稱而另一個(gè)奇對(duì)稱的兩個(gè)傳遞函數(shù)而獲得的。ISP也稱為導(dǎo)抗譜頻率(ISF),是Z-單位圓上的這些多項(xiàng)式根。線譜對(duì)(也稱為線譜頻率)可用與導(dǎo)抗譜對(duì)相同的方法來定義;這些表示之間的差異在于變換算法,它將線性預(yù)測(cè)LP濾波器系數(shù)轉(zhuǎn)換為另一種LPC參數(shù)表示(等價(jià)線譜對(duì)LSP或ISP)。
在根據(jù)先有技術(shù)的一些方法中,用緩沖器存儲(chǔ)了最近無差錯(cuò)接收的語(yǔ)音參數(shù),當(dāng)無差錯(cuò)地接收到幀時(shí),緩沖器中的值會(huì)被更新。當(dāng)檢測(cè)到壞幀時(shí),壞幀指示符(BFI)被設(shè)為真,隨后會(huì)開始差錯(cuò)隱藏,將上一好幀的譜參數(shù)向譜參數(shù)的自適應(yīng)平均值偏移,得到的值作為差錯(cuò)幀的譜參數(shù);或者將上一好幀的譜參數(shù)向譜參數(shù)的常數(shù)平均值進(jìn)行自適應(yīng)偏移,得到的值作為差錯(cuò)幀的譜參數(shù)。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種能得到更好的解碼語(yǔ)音質(zhì)量的語(yǔ)音解碼器中幀差錯(cuò)隱藏的譜參數(shù)替代方法及系統(tǒng),從而可避免解碼語(yǔ)音質(zhì)量的明顯下降。為了達(dá)到上述目的,本發(fā)明提供了一種語(yǔ)音解碼器解中幀差錯(cuò)隱藏的譜參數(shù)替代方法,語(yǔ)音解碼器接收語(yǔ)音幀,語(yǔ)音幀提供語(yǔ)音解碼器在合成語(yǔ)音中所需使用的譜參數(shù),本發(fā)明方法基于語(yǔ)音幀的譜參數(shù)進(jìn)行,包括步驟:語(yǔ)音解碼器根據(jù)語(yǔ)音幀的譜參數(shù)判斷接收的語(yǔ)音幀是否為壞幀;若為壞幀,統(tǒng)計(jì)連續(xù)壞幀數(shù)量,并根據(jù)當(dāng)前壞幀的近鄰好幀的基音周期變化趨勢(shì)對(duì)當(dāng)前壞幀的譜參數(shù)進(jìn)行恢復(fù)。
上述對(duì)當(dāng)前壞幀的譜參數(shù)進(jìn)行恢復(fù)主要基于當(dāng)前壞幀的持續(xù)平穩(wěn)的近鄰好幀的譜參數(shù),可表示為:ISFji) = a *past_ISFji) + @ *ISFadaptiveJ1JiHMISFcmst 隱Ji)+b (I)其中,ISFq(i)是當(dāng)前壞幀的ISF向量的第i分量;past_ISFq(i)是當(dāng)前壞幀的近鄰第一好幀的ISF向量的第i分量;ISFadaptive mean(i)是當(dāng)前壞幀的持續(xù)平穩(wěn)的近鄰好幀ISF向量的第i分量的算術(shù)平均值;ISFconst fflean(i)是ISF向量的長(zhǎng)期平均值常數(shù)向量的第i分量,為經(jīng)驗(yàn)常數(shù);i為幀中變量編號(hào),i = 1,2,...,16 ;α、β、Y和b為待定系數(shù),根據(jù)當(dāng)前壞幀的近鄰好幀的基音周期變化趨勢(shì)和連續(xù)壞幀數(shù)量進(jìn)行取值。當(dāng)前壞幀的近鄰第一個(gè)好幀相對(duì)于近鄰第二個(gè)好幀變化劇烈,或當(dāng)前壞幀的近鄰好幀數(shù)量?jī)H為I時(shí),使用當(dāng)前壞幀的近鄰第一個(gè)好幀的譜參數(shù)來恢復(fù)當(dāng)前壞幀的譜參數(shù),即,公式(I)中的ISFadaptive m_(i)為當(dāng)前壞幀的近鄰第一個(gè)好幀的ISF向量的第i分量,ISFadaptive mean(i) = past_ISFq(i)。當(dāng)前壞幀的近鄰第一個(gè)好幀相對(duì)于近鄰第二個(gè)好幀變化緩慢,而近鄰第二個(gè)好幀相對(duì)于近鄰第三個(gè)好幀變化劇烈,使用當(dāng)前壞幀的近鄰第一和第二個(gè)好幀的譜參數(shù)來恢復(fù)當(dāng)前壞幀的譜參數(shù),即,公式(I)中的ISFadaptive m_(i)為當(dāng)前壞幀的近鄰第一和第二個(gè)好幀ISF向量的第i分量的算術(shù)平均值。當(dāng)前壞幀的近鄰第一個(gè)好幀相對(duì)于近鄰第二個(gè)好幀變化緩慢,近鄰第二個(gè)好幀相對(duì)于近鄰第三個(gè)好幀變化也緩慢時(shí),使用當(dāng)前壞幀的近鄰第一、第二和第三個(gè)好幀的譜參數(shù)來恢復(fù)當(dāng)前壞幀的譜參數(shù),即,公式(I)中的ISFadapti”aJi)為當(dāng)前壞幀的近鄰第一、第二和第三個(gè)好幀ISF向量的第i分量的算術(shù)平均值。本發(fā)明還提供了一種語(yǔ)音解碼器解中幀差錯(cuò)隱藏的譜參數(shù)替代系統(tǒng),包括:語(yǔ)音解碼器,用來接收語(yǔ)音幀:壞幀判斷模塊,用來判斷接收的語(yǔ)音幀是否為壞幀;壞幀統(tǒng)計(jì)模塊,用來統(tǒng)計(jì)連續(xù)壞幀數(shù)量;壞幀譜參數(shù)恢復(fù)模塊,用來根據(jù)當(dāng)前壞幀的近鄰好幀的基音周期變化趨勢(shì)對(duì)當(dāng)前壞中貞的譜參數(shù)進(jìn)行恢復(fù)。上述壞幀譜參數(shù)恢復(fù)模塊使用持續(xù)平穩(wěn)的近鄰好幀的譜參數(shù)恢復(fù)當(dāng)前壞幀的譜參數(shù),具體為:ISFq ⑴=a *past_ISFq ⑴ + β * I SFadapt iveniean (i) + Y * I SFconstmean ⑴ +b其中,ISFq(i)是當(dāng)前壞幀的ISF向量的第i分量;past_ISFq(i)是當(dāng)前壞幀的近鄰第一好幀的ISF向量的第i分量;ISFadaptive mean(i)是當(dāng)前壞幀的持續(xù)平穩(wěn)的近鄰好幀ISF向量的第i分量的算術(shù)平均值;ISFconst fflean(i)是ISF向量的長(zhǎng)期平均值常數(shù)向量的第i分量,為經(jīng)驗(yàn)常數(shù);
i為幀中變量編號(hào),i = l,2,...,16;α、β、Y和b為待定系數(shù),根據(jù)當(dāng)前壞幀的近鄰好幀的基音周期變化趨勢(shì)和連續(xù)壞幀數(shù)量進(jìn)行取值。上述壞幀譜參數(shù)恢復(fù)模塊進(jìn)一步包括第一壞幀譜參數(shù)恢復(fù)模塊、第二壞幀譜參數(shù)恢復(fù)模塊和第三壞幀譜參數(shù)恢復(fù)模塊。所述的第一壞幀譜參數(shù)恢復(fù)模塊用來使用當(dāng)前壞幀的近鄰第一個(gè)好幀的譜參數(shù)來恢復(fù)當(dāng)前壞幀的譜參數(shù),即,公式(I)中的ISFadative _n(i)為當(dāng)前壞幀的近鄰第一個(gè)好幀的ISF向量的第i分量。當(dāng)前壞幀的近鄰第一個(gè)好幀相對(duì)于近鄰第二個(gè)好幀變化劇烈,或當(dāng)前壞幀的近鄰好幀數(shù)量?jī)H為I時(shí),使用第一壞幀譜參數(shù)恢復(fù)模塊進(jìn)行壞幀譜參數(shù)恢復(fù)。所述的第二壞幀譜參數(shù)恢復(fù)模塊用來使用當(dāng)前壞幀的近鄰第一和第二個(gè)好幀的譜參數(shù)來恢復(fù)當(dāng)前壞幀的譜參數(shù),即,公式(I)中的ISFadaptive m_(i)為當(dāng)前壞幀的近鄰第一和第二個(gè)好幀ISF向量的第i分量的算術(shù)平均值。當(dāng)前壞幀的近鄰第一個(gè)好幀相對(duì)于近鄰第二個(gè)好幀變化緩慢,而近鄰第二個(gè)好幀相對(duì)于近鄰第三個(gè)好幀變化劇烈,使用第二壞幀譜參數(shù)恢復(fù)模塊進(jìn)行壞幀譜參數(shù)恢復(fù)。所述的第三壞幀譜參數(shù)恢復(fù)模塊用來使用當(dāng)前壞幀的近鄰第一、第二和第三個(gè)好幀的譜參數(shù)來恢復(fù)當(dāng)前壞幀的譜參數(shù),即,公式(I)中的ISFadaptive m_(i)為當(dāng)前壞幀的近鄰第一、第二和第三個(gè)好幀ISF向量的第i分量的算術(shù)平均值。當(dāng)前壞幀的近鄰第一個(gè)好幀相對(duì)于近鄰第二個(gè)好幀變化緩慢,近鄰第二個(gè)好幀相對(duì)于近鄰第三個(gè)好幀變化也緩慢時(shí),使用第三壞幀譜參數(shù)恢復(fù)模塊。本發(fā)明根據(jù)當(dāng)前壞幀的近鄰好幀的基音周期變化趨勢(shì),采用持續(xù)平穩(wěn)的近鄰好幀的自適應(yīng)平均值來代替壞幀的譜參數(shù),從而隱藏由語(yǔ)音解碼器經(jīng)通信信道接收的壞幀的影響,避免語(yǔ)音質(zhì)量的明顯下降。本發(fā)明可用于隱藏錯(cuò)誤幀的語(yǔ)音參數(shù),能夠?yàn)閴膸瑢ふ易钸m合的替代譜參數(shù),與現(xiàn)有的幀差錯(cuò)隱藏方法相比,本發(fā)明可提高合成語(yǔ)音的主觀質(zhì)量。
圖1為發(fā)射或存儲(chǔ)語(yǔ)音和音頻信號(hào)的系統(tǒng)框圖;圖2是本發(fā)明方法流程圖。
具體實(shí)施例方式根據(jù)本發(fā)明,在語(yǔ)音信號(hào)通過通信信道(圖1)傳輸后,語(yǔ)音解碼器檢測(cè)到壞幀時(shí),根據(jù)對(duì)最近通過通信信道傳遞的好幀的譜參數(shù)的分析,隱藏該語(yǔ)音信號(hào)的損壞譜參數(shù),即由其它譜參數(shù)來代替該語(yǔ)音信號(hào)的已損壞的譜參數(shù)。在語(yǔ)音解碼過程中,語(yǔ)音信號(hào)中損壞的譜參數(shù)可引起非自然信號(hào)(非自然信號(hào)指明顯不是語(yǔ)音的可聽見聲音),而且還會(huì)降低隨后的無差錯(cuò)語(yǔ)音幀的主觀質(zhì)量,因此,有效隱藏壞幀的損壞譜參數(shù)非常重要。參見圖2,將各語(yǔ)音幀提供給語(yǔ)音解碼器,各幀提供解碼器在合成語(yǔ)音中使用的譜參數(shù),語(yǔ)音解碼器根據(jù)語(yǔ)音幀提供的譜參數(shù)判斷接收到的語(yǔ)音幀為好幀還是壞幀,當(dāng)接收到好幀時(shí),語(yǔ)音解碼器使用正常解碼方式進(jìn)行解碼;當(dāng)接收到壞幀時(shí),則分析壞幀近鄰好幀的譜參數(shù),并根據(jù)分析結(jié)果對(duì)壞幀的譜參數(shù)執(zhí)行代替。當(dāng)語(yǔ)音解碼器接收到壞幀時(shí),本發(fā)明采用如下的方法對(duì)壞幀進(jìn)行譜參數(shù)代替。
首先,統(tǒng)計(jì)連續(xù)壞幀數(shù)。然后,根據(jù)基音周期變化趨勢(shì)判斷壞幀之前持續(xù)平穩(wěn)的近鄰好幀的幀數(shù),并根據(jù)判斷結(jié)果將之前近鄰好幀的平穩(wěn)性分為如下三種情況:(I)當(dāng)前壞幀的近鄰第一個(gè)好幀相對(duì)于近鄰第二個(gè)好幀變化劇烈時(shí),即當(dāng)前壞幀之前連續(xù)平穩(wěn)的近鄰好幀的幀數(shù)為1,使用近鄰第一個(gè)好幀的譜參數(shù)來恢復(fù)當(dāng)前壞幀的譜參數(shù):ISFji) = a *past_ISFji) + 3 *ISFadaptiveJ1JiHMISFconst _Ji)+b (I)其中:ISFq(i)是當(dāng)前壞幀的ISF向量的第i分量,即本發(fā)明中的譜參數(shù);past_ISFq(i)是當(dāng)前壞幀的近鄰第一個(gè)好幀的ISF向量的第i分量;ISFadaptive mean(·i)是當(dāng)前壞幀的近鄰第一個(gè)好幀的自適應(yīng)平均值向量的第i分量,即,ISFadaptive—-(ikpaslISF^i);ISFconst fflean(i)是ISF向量的長(zhǎng)期平均值常數(shù)向量的第i分量,根據(jù)經(jīng)驗(yàn)得到;i為幀中變量編號(hào),i = 1,2,...,16 ;α、β、Y和b是待定系數(shù),根據(jù)當(dāng)前壞幀的近鄰好幀的基音周期變化趨勢(shì)和連續(xù)壞幀數(shù)量進(jìn)行取值,具體見表I所示。當(dāng)壞幀之前的近鄰好幀數(shù)量?jī)H為I時(shí),則根據(jù)公式(I)采用該近鄰好幀的譜參數(shù)來恢復(fù)當(dāng)前壞幀的譜參數(shù)。(2)當(dāng)前壞幀的近鄰第一個(gè)好幀相對(duì)于近鄰第二個(gè)好幀變化緩慢,而近鄰第二個(gè)好幀相對(duì)于近鄰第三個(gè)好幀變化劇烈,即當(dāng)前壞幀之前連續(xù)平穩(wěn)的近鄰好幀的幀數(shù)為2,使用近鄰第一和第二個(gè)好幀的譜參數(shù)來恢復(fù)當(dāng)前壞幀的譜參數(shù):ISFji) = a *past_ISFji) + 3 *ISFadaptiveJ1JiHMISFconst _Ji)+b (2)其中ISFq(i)是當(dāng)前壞幀的ISF向量的第i分量,即本發(fā)明中的譜參數(shù);past_ISFq(i)是當(dāng)前壞幀的近鄰第一個(gè)好幀的ISF向量的第i分量;ISFadaptivemean(i)是當(dāng)前壞幀的近鄰第一和第二個(gè)好幀的自適應(yīng)平均值向量的第i分量,即當(dāng)前壞幀的近鄰第一和第二個(gè)好幀的ISF向量的第i分量的算術(shù)平均值,可表示
為/肌/ —/.svVl(/)為當(dāng)前壞幀的近鄰第
二個(gè)好幀的ISF向量的第i分量;ISFconst fflean(i)是ISF向量的長(zhǎng)期平均值常數(shù)向量的第i分量,根據(jù)經(jīng)驗(yàn)得到;i為幀中變量編號(hào),i = 1,2,...,16 ;α、β、Y和b是待定系數(shù),根據(jù)當(dāng)前壞幀的近鄰好幀的基音周期變化趨勢(shì)和連續(xù)壞幀數(shù)量進(jìn)行取值,具體取值見表2。當(dāng)壞幀之前的近鄰好幀數(shù)量?jī)H為2,且當(dāng)前壞幀的近鄰第一個(gè)好幀相對(duì)于近鄰第二個(gè)好幀變化緩慢,則根據(jù)公式(2)采用變化緩慢的近鄰第一和第二個(gè)好幀譜參數(shù)來恢復(fù)當(dāng)前壞幀的譜參數(shù)。(3)當(dāng)前壞幀的近鄰第一個(gè)好幀相對(duì)于近鄰第二個(gè)好幀變化緩慢,而近鄰第二個(gè)好幀相對(duì)于近鄰第三個(gè)好幀變化也緩慢時(shí),即當(dāng)前壞幀之前連續(xù)平穩(wěn)的近鄰好幀的幀數(shù)為3,使用近鄰第一、二、三個(gè)好幀的譜參數(shù)來恢復(fù)當(dāng)前差錯(cuò)幀的譜參數(shù):ISFji) = a *past_ISFji) + 3 *ISFadaptive _^i) +Y*ISF_st _Ji)+b (3)其中ISFq(i)是當(dāng)前壞幀的ISF向量的第i分量,即本發(fā)明中的譜參數(shù);past_ISFq(i)是當(dāng)前壞幀的近鄰第一個(gè)好幀的ISF向量的第i分量;ISFadaptivejiean(I)是當(dāng)前壞幀的近鄰第一、第二和第三個(gè)好幀的自適應(yīng)平均值向量的第i分量,即當(dāng)前壞幀的近鄰第一、第二和第三個(gè)好幀的ISF向量的第i分量的算術(shù)平
均值,可表示為:Ml:卻ive (/)=^( post — ISPii (/) + past _ ISF 丨(/) -1- past — !SI.]..(/)),past_
ISF^1(I)為當(dāng)前壞幀的近鄰第二個(gè)好幀的ISF向量的第i分量,past_ISFq.2(i)為當(dāng)前壞幀的近鄰第三個(gè)好幀的ISF向量的第i分量;ISFconst fflean(i)是ISF向量的長(zhǎng)期平均值常數(shù)向量的第i分量,根據(jù)經(jīng)驗(yàn)得到;i為幀中變量編號(hào),i = 1,2,...,16 ;α、β、Y和b是待定系數(shù),根據(jù)當(dāng)前壞幀的近鄰好幀的基音周期變化趨勢(shì)和連續(xù)壞幀數(shù)量進(jìn)行取值,具體取值見表3。上述近鄰第一、二、三個(gè)好幀分別為語(yǔ)音解碼器在當(dāng)前壞幀之前接收到的距離該壞幀最近的第一、二、三個(gè)好幀,且第一、二、三個(gè)好幀距離壞幀的距離依次從近到遠(yuǎn)。
本發(fā)明基于好幀的基音周期來判斷相鄰好幀之間變化趨勢(shì),具體如下:近鄰好幀為超幀,各超幀內(nèi)包括4個(gè)相鄰幀,計(jì)算超幀內(nèi)4個(gè)幀的基音周期最大值和最小值之差,若差大于設(shè)定閾值,認(rèn)為超幀內(nèi)部的幀變化劇烈,則該超幀與相鄰超幀之間也變化劇烈;若超幀內(nèi)4個(gè)幀的基音周期最大值和最小值之差不大于閾值,再判斷該超幀與相鄰超幀之間的變化趨勢(shì),即將相鄰兩個(gè)超幀內(nèi)4個(gè)幀的基音周期最大和最小值均提取出來,將相鄰兩超幀分別標(biāo)記為超幀A和超幀B,計(jì)算超幀A的基音周期最大值和超幀B的基音周期最小值之差,再計(jì)算超幀B的基音周期最大值和超幀A的基音周期最小值之差,如果所得差均不大于閾值,則認(rèn)為超幀A和超幀B之間變化緩慢;否則,超幀A和超幀B之間變化劇烈。本具體實(shí)施中設(shè)定閾值取為20。例如,當(dāng)前壞幀之前的三個(gè)近鄰好幀,第一個(gè)好幀內(nèi)各幀的基音周期分別為84、91、182、177,第二個(gè)好幀內(nèi)各幀的基音周期分別為193、191、66、65,第三個(gè)好幀內(nèi)各幀的基音周期分別為79、84、43、43,第一個(gè)好幀內(nèi)基音周期最大值和最小值之差為182_84>20,第一個(gè)好幀內(nèi)各幀變化激烈,則第一個(gè)好幀和第二個(gè)好幀之間也變化劇烈,此時(shí)近鄰好幀的平穩(wěn)性屬于上述第(I)種情況。當(dāng)前壞幀之前的三個(gè)近鄰好幀,第一個(gè)好幀內(nèi)各幀的基音周期分別為56、61、37、34,第二個(gè)好幀內(nèi)各幀的基音周期分別為64、59、62、70,第三個(gè)好幀內(nèi)各幀的基音周期分別為62、64、62、71,第一個(gè)好幀和第二個(gè)好幀之間變化劇烈,第二和第三個(gè)好幀之間變化緩慢,則三個(gè)近鄰好幀的平穩(wěn)性屬于上述第(2)種情況。當(dāng)前壞幀之前的三個(gè)近鄰好幀,第一個(gè)好幀內(nèi)各幀的基音周期分別為34、48、42、36,第二個(gè)好幀內(nèi)各幀的基音周期分別為35、50、43、39,第三個(gè)好幀內(nèi)各幀的基音周期分別為40、37、37、37,該三個(gè)近鄰好幀持續(xù)平穩(wěn),屬于上第(3)種情況。表廣3中的系數(shù)是通過樣本訓(xùn)練得到,具體為:
將69個(gè)測(cè)試序列拼接成一個(gè)長(zhǎng)序列,并提取長(zhǎng)序列的基音周期和ISF系數(shù)值,所述的ISF系數(shù)即為α、β、Y和b ;再根據(jù)上述三種情況,將ISF系數(shù)值對(duì)應(yīng)分成三類,對(duì)每類ISF系數(shù)值進(jìn)行線性回歸分析,從而得到上述三種情況對(duì)應(yīng)的ISF系數(shù)值,具體ISF系數(shù)值見表I 3。表IISF系數(shù)值
權(quán)利要求
1.語(yǔ)音解碼器解中幀差錯(cuò)隱藏的譜參數(shù)替代方法,語(yǔ)音解碼器接收語(yǔ)音幀,語(yǔ)音幀提供語(yǔ)音解碼器在合成語(yǔ)音中所需使用的譜參數(shù),其特征在于,包括步驟: a)判斷接收的語(yǔ)音幀是否為壞幀; b)統(tǒng)計(jì)連續(xù)壞幀數(shù)量; a)根據(jù)當(dāng)前壞幀的近鄰好幀的基音周期變化趨勢(shì)對(duì)當(dāng)前壞幀的譜參數(shù)進(jìn)行恢復(fù)。
2.如權(quán)利要求1所述的語(yǔ)音解碼器解中幀差錯(cuò)隱藏的譜參數(shù)替代方法,其特征在于: 步驟c)具體為: 根據(jù)當(dāng)前壞幀的近鄰好幀的基音周期變化趨勢(shì),使用持續(xù)平穩(wěn)的近鄰好幀的譜參數(shù)恢復(fù)當(dāng)前壞幀的譜參數(shù): ISFq (i) = a *past_ISFq (i) + β * I SFadaptivemean (i) + Y * I SFconstmean (i) +b 其中, ISFq (i)是當(dāng)前壞幀的ISF向量的第i分量; past_ISFq(i)是當(dāng)前壞幀的近鄰第一好幀的ISF向量的第i分量; ISFadaptive mean(I)是當(dāng)前壞幀的持續(xù)平穩(wěn)的近鄰好幀ISF向量的第i分量的算術(shù)平均值; ISFconst fflean(I)是ISF向量的長(zhǎng)期平均值常數(shù)向量的第i分量,為經(jīng)驗(yàn)常數(shù); i為幀中變量編號(hào),i = 1,2,..., 16 ; α、β、Y和b為待定系數(shù),根據(jù)當(dāng)前壞幀的近鄰好幀的基音周期變化趨勢(shì)和連續(xù)壞幀數(shù)量進(jìn)行取值。
3.如權(quán)利要求2所述的語(yǔ)音解碼器解中幀差錯(cuò)隱藏的譜參數(shù)替代方法,其特征在于: 當(dāng)前壞幀的近鄰第一個(gè)好幀相對(duì)于近鄰第二個(gè)好幀變化劇烈,或當(dāng)前壞幀的近鄰好幀數(shù)量?jī)H為I時(shí),使用當(dāng)前壞幀的近鄰第一個(gè)好幀的譜參數(shù)來恢復(fù)當(dāng)前壞幀的譜參數(shù),所述的ISFadaptive _(i)為當(dāng)前壞幀的近鄰第一個(gè)好幀的ISF向量的第i分量。
4.如權(quán)利要求2所述的語(yǔ)音解碼器解中幀差錯(cuò)隱藏的譜參數(shù)替代方法,其特征在于: 當(dāng)前壞幀的近鄰第一個(gè)好幀相對(duì)于近鄰第二個(gè)好幀變化緩慢,而近鄰第二個(gè)好幀相對(duì)于近鄰第三個(gè)好幀變化劇烈,使用當(dāng)前壞幀的近鄰第一和第二個(gè)好幀的譜參數(shù)來恢復(fù)當(dāng)前壞幀的譜參數(shù),所述的ISFadaptive _n(i)為當(dāng)前壞幀的近鄰第一和第二個(gè)好幀ISF向量的第i分量的算術(shù)平均值。
5.如權(quán)利要求2所述的語(yǔ)音解碼器解中幀差錯(cuò)隱藏的譜參數(shù)替代方法,其特征在于: 當(dāng)前壞幀的近鄰第一個(gè)好幀相對(duì)于近鄰第二個(gè)好幀變化緩慢,近鄰第二個(gè)好幀相對(duì)于近鄰第三個(gè)好幀變化也緩慢時(shí),使用當(dāng)前壞幀的近鄰第一第二和第三個(gè)好幀的譜參數(shù)來恢復(fù)當(dāng)前壞幀的譜參數(shù),所述的ISFadaptive m_(i)為當(dāng)前壞幀的近鄰第一、第二和第三個(gè)好幀ISF向量的第i分量的算術(shù)平均值。
6.語(yǔ)音解碼器解中幀差錯(cuò)隱藏的譜參數(shù)替代系統(tǒng),包括接收語(yǔ)音幀的語(yǔ)音解碼器,其特征在于,還包括: a)壞幀判斷模塊,用來判斷接收的語(yǔ)音幀是否為壞幀; b)壞幀統(tǒng)計(jì)模塊,用來統(tǒng)計(jì)連續(xù)壞幀數(shù)量; c)壞幀譜參數(shù)恢復(fù)模塊,用來根據(jù)當(dāng)前壞幀的近鄰好幀的基音周期變化趨勢(shì)對(duì)當(dāng)前壞幀的譜參數(shù)進(jìn)行恢復(fù)。
7.如權(quán)利要求6所述的語(yǔ)音解碼器解中幀差錯(cuò)隱藏的譜參數(shù)替代系統(tǒng),其特征在于: 所述的壞幀譜參數(shù)恢復(fù)模塊使用持續(xù)平穩(wěn)的近鄰好幀的譜參數(shù)恢復(fù)當(dāng)前壞幀的譜參數(shù): ISFq (i) = a *past_ISFq (i) + β * I SFadaptivemean (i) + Y * I SFconstmean (i) +b 其中, ISFq (i)是當(dāng)前壞幀的ISF向量的第i分量; past_ISFq(i)是當(dāng)前壞幀的近鄰第一好幀的ISF向量的第i分量; ISFdaptive mean(i)是當(dāng)前壞幀的持續(xù)平穩(wěn)的近鄰好幀ISF向量的第i分量的算術(shù)平均值; ISFconst fflean(I)是ISF向量的長(zhǎng)期平均值常數(shù)向量的第i分量,為經(jīng)驗(yàn)常數(shù); i為幀中變量編號(hào),i = 1,2,..., 16 ; α、β、Y和b為待定系數(shù),根據(jù)當(dāng)前壞幀的近鄰好幀的基音周期變化趨勢(shì)和連續(xù)壞幀數(shù)量進(jìn)行取值。
8.如權(quán)利要求7所述的語(yǔ)音解碼器解中幀差錯(cuò)隱藏的譜參數(shù)替代系統(tǒng),其特征在于: 所述 的壞幀譜參數(shù)恢復(fù)模塊包括第一壞幀譜參數(shù)恢復(fù)模塊,所述的第一壞幀譜參數(shù)恢復(fù)模塊用來使用當(dāng)前壞幀的近鄰第一個(gè)好幀的譜參數(shù)來恢復(fù)當(dāng)前壞幀的譜參數(shù),即,所述的ISFadaptive _(i)為 當(dāng)前壞幀的近鄰第一個(gè)好幀的ISF向量的第i分量。
9.如權(quán)利要求7所述的語(yǔ)音解碼器解中幀差錯(cuò)隱藏的譜參數(shù)替代系統(tǒng),其特征在于: 所述的壞幀譜參數(shù)恢復(fù)模塊包括第二壞幀譜參數(shù)恢復(fù)模塊,所述的第二壞幀譜參數(shù)恢復(fù)模塊用來使用當(dāng)前壞幀的近鄰第一和第二個(gè)好幀的譜參數(shù)來恢復(fù)當(dāng)前壞幀的譜參數(shù),即,所述的ISFadaptve m_(i)為當(dāng)前壞幀的近鄰第一和第二個(gè)好幀ISF向量的第i分量的算術(shù)平均值。
10.如權(quán)利要求7所述的語(yǔ)音解碼器解中幀差錯(cuò)隱藏的譜參數(shù)替代系統(tǒng),其特征在于: 所述的壞幀譜參數(shù)恢復(fù)模塊包括第三壞幀譜參數(shù)恢復(fù)模塊,所述的第三壞幀譜參數(shù)恢復(fù)模塊用來使用當(dāng)前壞幀的近鄰第一第二和第三個(gè)好幀的譜參數(shù)來恢復(fù)當(dāng)前壞幀的譜參數(shù),即,所述的ISFadaptive _n(i)為當(dāng)前壞幀的近鄰第一、第二和第三個(gè)好幀ISF向量的第i分量的算術(shù)平均值。
全文摘要
本發(fā)明公開了一種語(yǔ)音解碼器解中幀差錯(cuò)隱藏的譜參數(shù)替代方法及系統(tǒng),本發(fā)明方法包括步驟判斷接收的語(yǔ)音幀是否為壞幀;統(tǒng)計(jì)連續(xù)壞幀數(shù)量;根據(jù)當(dāng)前壞幀的近鄰好幀的基音周期變化趨勢(shì)對(duì)當(dāng)前壞幀的譜參數(shù)進(jìn)行恢復(fù)。本發(fā)明根據(jù)當(dāng)前壞幀的近鄰好幀的基音周期變化趨勢(shì),采用持續(xù)平穩(wěn)的近鄰好幀的自適應(yīng)平均值來代替壞幀的譜參數(shù),從而隱藏由語(yǔ)音解碼器經(jīng)通信信道接收的壞幀的影響。本發(fā)明能夠?yàn)閴膸瑢ふ易钸m合的替代譜參數(shù),可提高合成語(yǔ)音的主觀質(zhì)量。
文檔編號(hào)G10L19/005GK103117062SQ20131002422
公開日2013年5月22日 申請(qǐng)日期2013年1月22日 優(yōu)先權(quán)日2013年1月22日
發(fā)明者胡瑞敏, 楊玉紅, 董少龍, 謝松波, 余洪江, 成鴻飛 申請(qǐng)人:武漢大學(xué)