語(yǔ)音增強(qiáng)處理方法和裝置制造方法
【專利摘要】本發(fā)明實(shí)施例提供一種語(yǔ)音增強(qiáng)處理方法和裝置,該方法,包括:解碼比特流,獲取當(dāng)前待處理語(yǔ)音子幀的編碼參數(shù),編碼參數(shù)包括第一代數(shù)碼書(shū)增益和第一自適應(yīng)碼書(shū)增益;調(diào)整第一代數(shù)碼書(shū)增益,得到第二代數(shù)碼書(shū)增益;根據(jù)第一自適應(yīng)碼書(shū)增益和第二代數(shù)碼書(shū)增益,確定第二自適應(yīng)碼書(shū)增益;采用第二代數(shù)碼書(shū)增益和第二自適應(yīng)碼書(shū)增益的量化索引替換比特流中第一代數(shù)碼書(shū)增益和第一自適應(yīng)碼書(shū)增益對(duì)應(yīng)的比特。本發(fā)明的技術(shù)方案,可以有效改善消除噪音的效果,提高語(yǔ)音通話質(zhì)量。
【專利說(shuō)明】語(yǔ)音增強(qiáng)處理方法和裝置
【技術(shù)領(lǐng)域】
[0001 ] 本發(fā)明實(shí)施例涉及通信技術(shù),尤其涉及一種語(yǔ)音增強(qiáng)處理方法和裝置。
【背景技術(shù)】
[0002]語(yǔ)音增強(qiáng)的目的是從帶噪語(yǔ)音信號(hào)中壓縮背景噪音,提取純凈語(yǔ)音,改進(jìn)通話質(zhì)量。一般情況下,語(yǔ)音增強(qiáng)算法通常位于移動(dòng)通信網(wǎng)絡(luò)的終端設(shè)備中,其位置在語(yǔ)音編碼之前或者語(yǔ)音解碼器之后,但由于功耗、存儲(chǔ)空間和成本的限制,終端設(shè)備中的語(yǔ)音增強(qiáng)算法通常不能達(dá)到很好的增強(qiáng)效果,算法性能無(wú)法滿足日益提高的需求,因此,越來(lái)越多的研究者和通信運(yùn)營(yíng)商認(rèn)為工作于網(wǎng)絡(luò)設(shè)備中的語(yǔ)音增強(qiáng)算法是一種可行的解決方案。在移動(dòng)網(wǎng)絡(luò)中使用線性域語(yǔ)音增強(qiáng)技術(shù),但由此引入的附加延時(shí)、計(jì)算復(fù)雜度和語(yǔ)音質(zhì)量的降低往往是實(shí)際應(yīng)用所不能接受的,所以基于編碼參數(shù)調(diào)整的參數(shù)域語(yǔ)音增強(qiáng)方法是在移動(dòng)通信網(wǎng)絡(luò)的網(wǎng)絡(luò)端較為適用的一種語(yǔ)音增強(qiáng)的解決方案。
[0003]現(xiàn)有技術(shù)中的一種參數(shù)域語(yǔ)音增強(qiáng)方法首先對(duì)輸入含噪碼流進(jìn)行解碼,得到解碼語(yǔ)音序列,而后使用線性域語(yǔ)音增強(qiáng)方法進(jìn)行處理,將所得結(jié)果與處理前的含噪序列進(jìn)行比較,得到編碼器自適應(yīng)碼書(shū)增益和代數(shù)碼書(shū)增益兩個(gè)參數(shù)的調(diào)整因子,對(duì)其進(jìn)行調(diào)整并重新量化,替換碼流中的相應(yīng)比特,從而達(dá)到在編碼域消除噪聲的目的。
[0004]在實(shí)現(xiàn)本發(fā)明實(shí)施例的過(guò)程中,發(fā)明人發(fā)現(xiàn)上述現(xiàn)有技術(shù)中的語(yǔ)音增強(qiáng)方法對(duì)噪聲的消除效果較差,語(yǔ)音通話質(zhì)量較差。
【發(fā)明內(nèi)容】
[0005]本發(fā)明實(shí)施例提供一種語(yǔ)音增強(qiáng)處理方法和裝置,用于改善消除噪音的效果,提高語(yǔ)音通話質(zhì)量。
[0006]本發(fā)明第一方面,提供一種語(yǔ)音增強(qiáng)處理方法,所述方法包括:
[0007]解碼比特流,獲取當(dāng)前待處理語(yǔ)音子幀的編碼參數(shù),所述編碼參數(shù)包括第一代數(shù)碼書(shū)增益和第一自適應(yīng)碼書(shū)增益;
[0008]調(diào)整所述第一代數(shù)碼書(shū)增益,得到第二代數(shù)碼書(shū)增益;
[0009]根據(jù)所述第一自適應(yīng)碼書(shū)增益和所述第二代數(shù)碼書(shū)增益,確定第二自適應(yīng)碼書(shū)增
M ;
[0010]采用所述第二代數(shù)碼書(shū)增益和所述第二自適應(yīng)碼書(shū)增益的量化索引替換所述比特流中所述第一代數(shù)碼書(shū)增益和所述第一自適應(yīng)碼書(shū)增益對(duì)應(yīng)的比特。
[0011]在第一方面的第一種可能的實(shí)現(xiàn)方式中,所述編碼參數(shù)還包括第一代數(shù)碼書(shū)矢量,所述調(diào)整所述第一代數(shù)碼書(shū)增益,得到第二代數(shù)碼書(shū)增益,包括:
[0012]根據(jù)所述第一代數(shù)碼書(shū)增益確定噪聲的代數(shù)碼書(shū)增益;
[0013]根據(jù)所述噪聲的代數(shù)碼書(shū)增益和所述第一代數(shù)碼書(shū)矢量確定噪聲激勵(lì)能量估計(jì)值;
[0014]根據(jù)所述第一代數(shù)碼書(shū)增益和所述第一代數(shù)碼書(shū)矢量確定第一代數(shù)碼書(shū)激勵(lì)能量;
[0015]根據(jù)所述噪聲激勵(lì)能量估計(jì)值和所述第一代數(shù)碼書(shū)激勵(lì)能量,確定所述當(dāng)前待處理語(yǔ)音子幀的第一后驗(yàn)信噪比估計(jì)值;
[0016]根據(jù)所述當(dāng)前待處理語(yǔ)音子幀的能量和所述當(dāng)前待處理語(yǔ)音子幀的能量的最小值,確定所述當(dāng)前待處理語(yǔ)音子幀的第二后驗(yàn)信噪比估計(jì)值;
[0017]根據(jù)所述第一后驗(yàn)信噪比估計(jì)值和所述第二后驗(yàn)信噪比估計(jì)值確定所述當(dāng)前待處理語(yǔ)音子幀的先驗(yàn)信噪比估計(jì)值;
[0018]采用所述先驗(yàn)信噪比估計(jì)值確定所述當(dāng)前待處理語(yǔ)音子幀的第一調(diào)整因子;
[0019]根據(jù)所述第一調(diào)整因子調(diào)整所述第一代數(shù)碼書(shū)增益,確定所述第二代數(shù)碼書(shū)增益。
[0020]結(jié)合第一方面或第一方面的第一種可能的實(shí)現(xiàn)方式,在第一方面的第二種可能的實(shí)現(xiàn)方式中,所述編碼參數(shù)中還包括濁音度參數(shù),在所述調(diào)整所述第一代數(shù)碼書(shū)增益,得到第二代數(shù)碼書(shū)增益之前,所述方法還包括:
[0021]對(duì)所述濁音度參數(shù)進(jìn)行平滑處理,得到平滑處理后的濁音度參數(shù);
[0022]若所述平滑處理后的濁音度參數(shù)大于第一閾值,則確定所述當(dāng)前待處理語(yǔ)音子幀為第一類子幀;若所述平滑處理后的濁音度參數(shù)小于第一閾值,則確定所述當(dāng)前待處理語(yǔ)音子幀為第二類子幀,其中,所述第一類子幀為濁音幀,所述第二類子幀為清音或噪音幀。
[0023]根據(jù)第一方面的第二種可能的實(shí)現(xiàn)方式,在第一方面的第三種可能的實(shí)現(xiàn)方式中,所述對(duì)所述濁音度參數(shù)進(jìn)行平滑處理,得到平滑處理后的濁音度參數(shù),包括:
[0024]應(yīng)用以下公式對(duì)濁音度參數(shù)rv(m)在時(shí)間上進(jìn)行一階遞歸平滑生成平滑后的濁音度參數(shù)4("7):
[0025]= avrv{m-1) + (1-av)rv(m);
[0026]其中,αν為平滑因子,m為當(dāng)前待處理語(yǔ)音子幀的序號(hào),F(xiàn)V(W-1)為前一個(gè)語(yǔ)音子幀平滑處理后的濁音度參數(shù)。
[0027]結(jié)合第一方面的第二種或第三種可能的實(shí)現(xiàn)方式,在第一方面的第四種可能的實(shí)現(xiàn)方式中,所述編碼參數(shù)中還包括第一自適應(yīng)碼書(shū)矢量,所述根據(jù)所述第一自適應(yīng)碼書(shū)增益和所述第二代數(shù)碼書(shū)增益,確定第二自適應(yīng)碼書(shū)增益,包括:
[0028]若確定當(dāng)前待處理語(yǔ)音子幀為所述第一類子幀,則獲取所述當(dāng)前待處理語(yǔ)音子幀的第二代數(shù)碼書(shū)矢量以及第二自適應(yīng)碼書(shū)矢量;
[0029]根據(jù)所述第一自適應(yīng)碼書(shū)增益、所述第一自適應(yīng)碼書(shū)矢量、所述第一代數(shù)碼書(shū)增益以及所述第一代數(shù)碼書(shū)矢量,確定第一總激勵(lì)能量;
[0030]根據(jù)所述第一總激勵(lì)能量和能量調(diào)整因子,確定第二總激勵(lì)能量;
[0031]根據(jù)所述第二總激勵(lì)能量、所述第二代數(shù)碼書(shū)增益、所述第二代數(shù)碼書(shū)矢量以及所述第二自適應(yīng)碼書(shū)矢量,確定所述第二自適應(yīng)碼書(shū)增益。
[0032]結(jié)合第一方面的第一種至第四種可能的實(shí)現(xiàn)方式中任意一種,在第一方面的第五種可能的實(shí)現(xiàn)方式中,所述編碼參數(shù)中還包括第一阻抗頻率參數(shù),在所述調(diào)整所述第一代數(shù)碼書(shū)增益,得到第二代數(shù)碼書(shū)增益之前,所述方法還包括:
[0033]根據(jù)所述第一阻抗頻率參數(shù)確定譜包絡(luò)低頻能量比參數(shù);
[0034]若所述譜包絡(luò)低頻能量比參數(shù)的平均值大于第二閾值,則確定噪聲類型為低頻分布噪聲;若所述譜包絡(luò)低頻能量比參數(shù)的平均值小于所述第二閾值,則確定噪聲類型為全帶分布噪聲。
[0035]根據(jù)第一方面的第五種可能的實(shí)現(xiàn)方式,在第一方面的第六種可能的實(shí)現(xiàn)方式中,所述根據(jù)所述第一阻抗頻率參數(shù)確定譜包絡(luò)低頻能量比參數(shù),包括:
[0036]應(yīng)用以下公式確定譜包絡(luò)低頻能量比參數(shù)Rm lw:
【權(quán)利要求】
1.一種語(yǔ)音增強(qiáng)處理方法,其特征在于,所述方法包括: 解碼比特流,獲取當(dāng)前待處理語(yǔ)音子幀的編碼參數(shù),所述編碼參數(shù)包括第一代數(shù)碼書(shū)增益和第一自適應(yīng)碼書(shū)增益; 調(diào)整所述第一代數(shù)碼書(shū)增益,得到第二代數(shù)碼書(shū)增益; 根據(jù)所述第一自適應(yīng)碼書(shū)增益和所述第二代數(shù)碼書(shū)增益,確定第二自適應(yīng)碼書(shū)增益;采用所述第二代數(shù)碼書(shū)增益和所述第二自適應(yīng)碼書(shū)增益的量化索引替換所述比特流中所述第一代數(shù)碼書(shū)增益和所述第一自適應(yīng)碼書(shū)增益對(duì)應(yīng)的比特。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述編碼參數(shù)還包括第一代數(shù)碼書(shū)矢量,所述調(diào)整所述第一代數(shù)碼書(shū)增益,得到第二代數(shù)碼書(shū)增益,包括: 根據(jù)所述第一代數(shù)碼書(shū)增益確定噪聲的代數(shù)碼書(shū)增益; 根據(jù)所述噪聲的代數(shù)碼書(shū)增益和所述第一代數(shù)碼書(shū)矢量確定噪聲激勵(lì)能量估計(jì)值;根據(jù)所述第一代數(shù)碼書(shū)增益和所述第一代數(shù)碼書(shū)矢量確定第一代數(shù)碼書(shū)激勵(lì)能量;根據(jù)所述噪聲激勵(lì)能量估計(jì)值和所述第一代數(shù)碼書(shū)激勵(lì)能量,確定所述當(dāng)前待處理語(yǔ)音子幀的第一后驗(yàn)信噪比估計(jì)值; 根據(jù)所述當(dāng)前待處理語(yǔ)音子幀的能量和所述當(dāng)前待處理語(yǔ)音子幀的能量的最小值,確定所述當(dāng)前待處理 語(yǔ)音子幀的第二后驗(yàn)信噪比估計(jì)值; 根據(jù)所述第一后驗(yàn)信噪比估計(jì)值和所述第二后驗(yàn)信噪比估計(jì)值確定所述當(dāng)前待處理語(yǔ)音子幀的先驗(yàn)信噪比估計(jì)值; 采用所述先驗(yàn)信噪比估計(jì)值確定所述當(dāng)前待處理語(yǔ)音子幀的第一調(diào)整因子; 根據(jù)所述第一調(diào)整因子調(diào)整所述第一代數(shù)碼書(shū)增益,確定所述第二代數(shù)碼書(shū)增益。
3.根據(jù)權(quán)利要求1或2所述的方法,其特征在于,所述編碼參數(shù)中還包括濁音度參數(shù),在所述調(diào)整所述第一代數(shù)碼書(shū)增益,得到第二代數(shù)碼書(shū)增益之前,所述方法還包括: 對(duì)所述濁音度參數(shù)進(jìn)行平滑處理,得到平滑處理后的濁音度參數(shù); 若所述平滑處理后的濁音度參數(shù)大于第一閾值,則確定所述當(dāng)前待處理語(yǔ)音子幀為第一類子幀;若所述平滑處理后的濁音度參數(shù)小于第一閾值,則確定所述當(dāng)前待處理語(yǔ)音子幀為第二類子幀,其中,所述第一類子幀為濁音幀,所述第二類子幀為清音或噪音幀。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述對(duì)所述濁音度參數(shù)進(jìn)行平滑處理,得到平滑處理后的濁音度參數(shù),包括: 應(yīng)用以下公式對(duì)濁音度參數(shù)rv(m)在時(shí)間上進(jìn)行一階遞歸平滑生成平滑后的濁音度參Tv[m) = aν7ν(?)? -1) + (1-av)rv(m); 其中,αν為平滑因子,m為當(dāng)前待處理語(yǔ)音子幀的序號(hào),Fv(W-1)為前一個(gè)語(yǔ)音子幀平滑處理后的濁音度參數(shù)。
5.根據(jù)權(quán)利要求3或4所述的方法,其特征在于,所述編碼參數(shù)中還包括第一自適應(yīng)碼書(shū)矢量,所述根據(jù)所述第一自適應(yīng)碼書(shū)增益和所述第二代數(shù)碼書(shū)增益,確定第二自適應(yīng)碼書(shū)增益,包括: 若確定當(dāng)前待處理語(yǔ)音子幀為所述第一類子幀,則獲取所述當(dāng)前待處理語(yǔ)音子幀的第二代數(shù)碼書(shū)矢量以及第二自適應(yīng)碼書(shū)矢量; 根據(jù)所述第一自適應(yīng)碼書(shū)增益、所述第一自適應(yīng)碼書(shū)矢量、所述第一代數(shù)碼書(shū)增益以及所述第一代數(shù)碼書(shū)矢量,確定第一總激勵(lì)能量; 根據(jù)所述第一總激勵(lì)能量和能量調(diào)整因子,確定第二總激勵(lì)能量; 根據(jù)所述第二總激勵(lì)能量、所述第二代數(shù)碼書(shū)增益、所述第二代數(shù)碼書(shū)矢量以及所述第二自適應(yīng)碼書(shū)矢量,確定所述第二自適應(yīng)碼書(shū)增益。
6.根據(jù)權(quán)利要求2~5任一項(xiàng)所述的方法,其特征在于,所述編碼參數(shù)中還包括第一阻抗頻率參數(shù),在所述調(diào)整所述第一代數(shù)碼書(shū)增益,得到第二代數(shù)碼書(shū)增益之前,所述方法還包括: 根據(jù)所述第一阻抗頻率參數(shù)確定譜包絡(luò)低頻能量比參數(shù); 若所述譜包絡(luò)低頻能量比參數(shù)的平均值大于第二閾值,則確定噪聲類型為低頻分布噪聲;若所述譜包絡(luò)低頻能量比參數(shù)的平均值小于所述第二閾值,則確定噪聲類型為全帶分布噪聲。
7.根據(jù)權(quán)利要求6所述的方法,其特征在于,所述根據(jù)所述第一阻抗頻率參數(shù)確定譜包絡(luò)低頻能量比參數(shù),包括: 應(yīng)用以下公式確定譜包絡(luò)低頻能量比參數(shù)Rm—lOTt:
8.根據(jù)權(quán)利要求6或7所述的方法,其特征在于,所述根據(jù)所述噪聲激勵(lì)能量估計(jì)值和第一代數(shù)碼書(shū)激勵(lì)能量,確定所述當(dāng)前待處理語(yǔ)音子幀的第一后驗(yàn)信噪比估計(jì)值,包括: 應(yīng)用以下公式定義第一后驗(yàn)信噪比估計(jì)值YraJm):
9.根據(jù)權(quán)利要求2~8任一項(xiàng)所述的方法,其特征在于,所述采用所述先驗(yàn)信噪比估計(jì)值確定第一調(diào)整因子,包括: 應(yīng)用以下公式確定所述當(dāng)前待處理語(yǔ)音子幀的第一調(diào)整因子Ygc;(m):
10.根據(jù)權(quán)利要求2~9任一項(xiàng)所述的方法,其特征在于,所述根據(jù)所述第一調(diào)整因子調(diào)整所述第一代數(shù)碼書(shū)增益,確定第二代數(shù)碼書(shū)增益,包括: 應(yīng)用以下公式確定第二代數(shù)碼書(shū)增益^(^0:
11.根據(jù)權(quán)利要求5~10任一項(xiàng)所述的方法,其特征在于,所述根據(jù)所述第一自適應(yīng)碼書(shū)增益、所述第一自適應(yīng)碼書(shū)矢量、所述第一代數(shù)碼書(shū)增益以及所述第一代數(shù)碼書(shū)矢量,確定第一總激勵(lì)能量,包括: 應(yīng)用以下公式確定第一總激勵(lì)能量Etef_(m):
Ebefore (m) = Σ n (gp (m) d (n) +gy (m) c (η))2 ; 其中,gy(m)為第一代數(shù)碼書(shū)增益,gp(m)為第一自適應(yīng)碼書(shū)增益,c (η)和d(n)分別為第一代數(shù)碼書(shū)矢量和第一自適應(yīng)碼書(shū)矢量,η為采樣點(diǎn)的序號(hào); 所述根據(jù)所述第一總激勵(lì)能量和能量調(diào)整因子,確定第二總激勵(lì)能量,包括: 應(yīng)用以下公式確定第二總激勵(lì)能量EaftOT(m):
Eafter O11) = Q eEbefore O11);其中,Ebrftm(m)為第一總激勵(lì)能量,Cie為當(dāng)前待處理語(yǔ)音子幀的的能量調(diào)整因子。 所述根據(jù)所述第二總激勵(lì)能量、所述第二代數(shù)碼書(shū)增益、所述第二代數(shù)碼書(shū)矢量以及所述第二自適應(yīng)碼書(shū)矢量,確定所述第二自適應(yīng)碼書(shū)增益,包括: 應(yīng)用以下方程確定第二自適應(yīng)碼書(shū)增益:
12.根據(jù)權(quán)利要求6~11任一項(xiàng)所述的方法,其特征在于,在所述采用所述第二代數(shù)碼書(shū)增益和所述第二自適應(yīng)碼書(shū)增益的量化索引替換所述比特流中所述第一代數(shù)碼書(shū)增益和所述第一自適應(yīng)碼書(shū)增益對(duì)應(yīng)的比特之前,所述方法還包括: 若確定噪聲類型為低頻分布噪聲,則根據(jù)所述當(dāng)前待處理語(yǔ)音子幀的先驗(yàn)信噪比估計(jì)值和所述平滑處理后的濁音度參數(shù),確定濾波器參數(shù); 根據(jù)所述第二代數(shù)碼書(shū)增益、所述第二自適應(yīng)碼書(shū)增益、所述第二代數(shù)碼書(shū)矢量以及第二自適應(yīng)碼書(shū)矢量,確定總激勵(lì)信號(hào); 根據(jù)所述濾波器參數(shù),對(duì)所述總激勵(lì)信號(hào)進(jìn)行梳狀濾波處理。
13.根據(jù)權(quán)利要求6~12任一項(xiàng)所述的方法,其特征在于,在所述采用所述第二代數(shù)碼書(shū)增益和所述第二自適應(yīng)碼書(shū)增益的量化索引替換所述比特流中所述第一代數(shù)碼書(shū)增益和所述第一自適應(yīng)碼書(shū)增益對(duì)應(yīng)的比特之前,所述方法還包括: 若確定噪聲類型為低頻分布噪聲,則采用語(yǔ)音信號(hào)均方誤差最小的增益量化準(zhǔn)則對(duì)所述第二代數(shù)碼書(shū)增益和所述第二自適應(yīng)碼書(shū)增益進(jìn)行量化; 若確定噪聲類型為全帶分布噪聲,則采用激勵(lì)信號(hào)均方誤差最小的增益量化準(zhǔn)則對(duì)所述第二代數(shù)碼書(shū)增益和所述第二自適應(yīng)碼書(shū)增益進(jìn)行量化。
14.根據(jù)權(quán)利要求1 所述的方法,其特征在于,若確定噪聲類型為低頻分布噪聲,所述采用語(yǔ)音信號(hào)均方誤差最小的增益量化準(zhǔn)則對(duì)所述第二代數(shù)碼書(shū)增益和所述第二自適應(yīng)碼書(shū)增益進(jìn)行量化,包括: 應(yīng)用以下公式對(duì)所述第二代數(shù)碼書(shū)增益和所述第二自適應(yīng)碼書(shū)增益進(jìn)行量化,具體為:
15.根據(jù)權(quán)利要求6~14任一項(xiàng)所述的方法,其特征在于,在所述解碼比特流,獲取當(dāng)前待處理語(yǔ)音子幀的編碼參數(shù)之后,所述方法還包括:若確定當(dāng)前待處理幀為濁音幀,則根據(jù)所述第一阻抗頻率參數(shù),確定含噪語(yǔ)音的線性預(yù)測(cè)系數(shù); 估計(jì)確定噪聲的線性預(yù)測(cè)系數(shù)、噪聲的自相關(guān)系數(shù)以及純凈語(yǔ)音的自相關(guān)系數(shù); 根據(jù)所述含噪語(yǔ)音的線性預(yù)測(cè)系數(shù)、所述噪聲的線性預(yù)測(cè)系數(shù)、噪聲的自相關(guān)系數(shù)以及純凈語(yǔ)音的自相關(guān)系數(shù),確定純凈語(yǔ)音的線性預(yù)測(cè)系數(shù); 對(duì)所述純凈語(yǔ)音的線性預(yù)測(cè)系數(shù)進(jìn)行變換,得到第二阻抗頻率參數(shù); 對(duì)所述第二阻抗頻率參數(shù)進(jìn)行限定處理; 若所述當(dāng)前待處理幀的信噪比大于第三閾值,則在連續(xù)至少三個(gè)語(yǔ)音幀之后,對(duì)限定處理后的第二阻抗頻率參數(shù)進(jìn)行平滑處理,所述平滑處理為根據(jù)所述第一阻抗頻率和當(dāng)前幀之前的至少一幀的調(diào)整后的阻抗頻率參數(shù)計(jì)算加權(quán)平均值,確定第三阻抗頻率參數(shù); 采用所述第三阻抗頻率參數(shù)的量化索引替換比特流中所述第一阻抗頻率參數(shù)對(duì)應(yīng)的比特。
16.根據(jù)權(quán)利要求15所述的方法,其特征在于,所述估計(jì)確定噪聲的線性預(yù)測(cè)系數(shù)、噪聲的自相關(guān)系數(shù)以及純凈語(yǔ)音的自相關(guān)芊數(shù)包括: 應(yīng)用以下公式確定噪聲線性預(yù)測(cè)系數(shù)4
17.一種語(yǔ)音增強(qiáng)處理方法,其特征在于,包括: 確定不連續(xù)傳輸模式開(kāi)啟,若當(dāng)前待處理子幀為沉默指示幀,則解碼比特流,獲取所述沉默指示幀的加權(quán)平均阻抗頻率參數(shù)矢量和平均對(duì)數(shù)幀能量參數(shù); 對(duì)所述平均對(duì)數(shù)幀能量參數(shù)進(jìn)行衰減調(diào)整; 采用調(diào)整后的平均對(duì)數(shù)幀能量參數(shù)的量化索引替換所述比特流中平均對(duì)數(shù)幀能量參數(shù)對(duì)應(yīng)的比特。
18.根據(jù)權(quán)利要求17所述的方法,其特征在于,所述對(duì)所述平均對(duì)數(shù)幀能量參數(shù)進(jìn)行衰減調(diào)整,包括: 應(yīng)用以下公式確定平均對(duì)數(shù)幀能量參數(shù)的增益因子Gdtx:
19.一種語(yǔ)音增強(qiáng)處理方法,其特征在于,包括: 若確定出現(xiàn)錯(cuò)誤幀,則解碼比特流,獲取對(duì)所述錯(cuò)誤幀進(jìn)行恢復(fù)得到的當(dāng)前待處理子幀的編碼參數(shù),所述恢復(fù)得到的當(dāng)前待處理子幀的編碼參數(shù)包括語(yǔ)言活動(dòng)偵測(cè)標(biāo)志、第四阻抗頻率參數(shù)、基音參數(shù)、第三自適應(yīng)碼書(shū)增益; 調(diào)整所述第四阻抗頻率參數(shù),得到第五阻抗頻率參數(shù); 根據(jù)編碼速率生成隨機(jī)脈沖位置的第三代數(shù)碼書(shū)矢量; 對(duì)所述編碼參數(shù)中的第三代數(shù)碼書(shū)增益進(jìn)行調(diào)整,得到第四代數(shù)碼書(shū)增益; 對(duì)所述語(yǔ)言活動(dòng)偵測(cè)標(biāo)志、第五阻抗頻率參數(shù)、所述基音參數(shù)、所述隨機(jī)脈沖位置的第三代數(shù)碼書(shū)索引進(jìn)行量化,并采用語(yǔ)音信號(hào)均方誤差最小的增益量化準(zhǔn)則對(duì)所述第三自適應(yīng)碼書(shū)增益和所述第四代數(shù)碼書(shū)增益進(jìn)行量化; 采用所述第四代數(shù)碼書(shū)增益和所述第三自適應(yīng)碼書(shū)增益的聯(lián)合量化索引、所述第五阻抗頻率參數(shù)的量化索引以及所述基音參數(shù)替換所述比特流中各編碼參數(shù)對(duì)應(yīng)的比特。
20.根據(jù)權(quán)利要求19所述的方法,其特征在于,所述對(duì)所述編碼參數(shù)中的第三代數(shù)碼書(shū)增益進(jìn)行調(diào)整,得到第四代數(shù)碼書(shū)增益,包括: 獲取前一個(gè)正常子幀的代數(shù)碼書(shū)增益的第二調(diào)整因子paSt_SCale_g。; 應(yīng)用以下公式確定第四代數(shù)碼書(shū)增益g?!狹d: gCJlod = gcX0.9delayXpast_scale_gc ; delay為從幀錯(cuò)誤發(fā)生開(kāi)始累計(jì)的錯(cuò)誤的子幀數(shù)目,g。為第三代數(shù)碼書(shū)增益。
21.一種語(yǔ)音增強(qiáng)處理裝置,其特征在于,所述裝置包括: 第一獲取模塊,用于解碼比特流,獲取當(dāng)前待處理語(yǔ)音子幀的編碼參數(shù),所述編碼參數(shù)包括第一代數(shù)碼書(shū)增益和第一自適應(yīng)碼書(shū)增益; 第一調(diào)整模塊,用于調(diào)整所述第一代數(shù)碼書(shū)增益,得到第二代數(shù)碼書(shū)增益; 第一確定模塊,用于根據(jù)所述第一自適應(yīng)碼書(shū)增益和所述第二代數(shù)碼書(shū)增益,確定第二自適應(yīng)碼書(shū)增益; 第一處理模塊,用于采用所述第二代數(shù)碼書(shū)增益和所述第二自適應(yīng)碼書(shū)增益的量化索引替換所述比特流中所述第一代數(shù)碼書(shū)增益和所述第一自適應(yīng)碼書(shū)增益對(duì)應(yīng)的比特。
22.根據(jù)權(quán)利要求21所述的裝置,其特征在于,所述第一調(diào)整模塊,包括: 信噪比確定單元,用于根據(jù)所述第一代數(shù)碼書(shū)增益確定噪聲的代數(shù)碼書(shū)增益;根據(jù)所述噪聲的代數(shù)碼書(shū)增益和所述第一代數(shù)碼書(shū)矢量確定噪聲激勵(lì)能量估計(jì)值;根據(jù)所述第一代數(shù)碼書(shū)增益和所述第一代數(shù)碼書(shū)矢量確定第一代數(shù)碼書(shū)激勵(lì)能量;根據(jù)所述噪聲激勵(lì)能量估計(jì)值和所述第一代數(shù)碼書(shū)激勵(lì)能量,確定所述當(dāng)前待處理語(yǔ)音子幀的第一后驗(yàn)信噪比估計(jì)值;根據(jù)所述當(dāng)前待處理語(yǔ)音子幀的能量和所述當(dāng)前待處理語(yǔ)音子幀的能量的最小值,確定所述當(dāng)前待處理語(yǔ)音子幀的第二后驗(yàn)信噪比估計(jì)值;根據(jù)所述第一后驗(yàn)信噪比估計(jì)值和所述第二后驗(yàn)信噪比估計(jì)值確定所述當(dāng)前待處理語(yǔ)音子幀的先驗(yàn)信噪比估計(jì)值; 調(diào)整因子確定單元,用于采用所述先驗(yàn)信噪比估計(jì)值確定所述當(dāng)前待處理語(yǔ)音子幀的第一調(diào)整因子; 增益參數(shù)調(diào)整單元,用于根據(jù)所述第一調(diào)整因子調(diào)整所述第一代數(shù)碼書(shū)增益,確定所述第二代數(shù)碼書(shū)增益。
23.根據(jù)權(quán)利要求21或22所述的裝置,其特征在于,所述編碼參數(shù)中還包括濁音度參數(shù),所述裝置還包括判定模塊,所述判定模塊,包括: 平滑處理單元,用于在所述調(diào)整所述第一代數(shù)碼書(shū)增益,得到第二代數(shù)碼書(shū)增益之前,對(duì)所述濁音度參數(shù)進(jìn)行平滑處理,得到平滑處理后的濁音度參數(shù); 子幀類型判定單元,用于若所述平滑處理后的濁音度參數(shù)大于第一閾值,則確定所述當(dāng)前待處理語(yǔ)音子幀為第一類子幀;若所述平滑處理后的濁音度參數(shù)小于第一閾值,則確定所述當(dāng)前待處理語(yǔ)音子幀為第二類子幀,其中,所述第一類子幀為濁音幀,所述第二類子幀為清音或噪音幀。
24.根據(jù)權(quán)利要求23所述的裝置,其特征在于,所述平滑處理單元,具體用于: 應(yīng)用以下公式對(duì)濁音度參數(shù)rv(m)在時(shí)間上進(jìn)行一階遞歸平滑生成平滑后的濁音度參數(shù)/:',("7):Tv(m) = av7v(m-1) + (1-αν)ι\,(?η): 其中,Civ為平滑因子,m為當(dāng)前待處理語(yǔ)音子幀的序號(hào),4(w-1)為前一個(gè)語(yǔ)音子幀平滑處理后的濁音度參數(shù)。
25.根據(jù)權(quán)利要求23或24所述的裝置,其特征在于,所述編碼參數(shù)中還包括第一自適應(yīng)碼書(shū)矢量,所述第一確定模塊,包括: 碼書(shū)矢量獲取單元,用于若所述子幀類型判定單元確定當(dāng)前待處理語(yǔ)音子幀為所述第一類子幀,則獲取所述當(dāng)前待處理語(yǔ)音子幀的第二代數(shù)碼書(shū)矢量以及第二自適應(yīng)碼書(shū)矢量; 總激勵(lì)能量確定單元,用于根據(jù)所述第一自適應(yīng)碼書(shū)增益、所述第一自適應(yīng)碼書(shū)矢量、所述第一代數(shù)碼書(shū)增益以及所述第一代數(shù)碼書(shū)矢量,確定第一總激勵(lì)能量;根據(jù)所述第一總激勵(lì)能量和能量調(diào)整因子,確定第二總激勵(lì)能量; 增益參數(shù)確定單元,用于根據(jù)所述第二總激勵(lì)能量、所述第二代數(shù)碼書(shū)增益、所述第二代數(shù)碼書(shū)矢量以及所述第二自適應(yīng)碼書(shū)矢量,確定所述第二自適應(yīng)碼書(shū)增益。
26.根據(jù)權(quán)利要求22~25任一項(xiàng)所述的裝置,其特征在于,所述編碼參數(shù)中還包括第一阻抗頻率參數(shù),所述判定模塊,還包括: 譜包絡(luò)低頻能量比參數(shù)確定單元,用于在所述調(diào)整所述第一代數(shù)碼書(shū)增益,得到第二代數(shù)碼書(shū)增益之前,根據(jù)所述第一阻抗頻率參數(shù)確定譜包絡(luò)低頻能量比參數(shù); 噪音類型判定單元,用于若所述譜包絡(luò)低頻能量比參數(shù)的平均值大于第二閾值,則確定噪聲類型為低頻分布噪聲;若所述譜包絡(luò)低頻能量比參數(shù)的平均值小于所述第二閾值,則確定噪聲類型為全帶分布噪聲。
27.根據(jù)權(quán)利要求26所述的裝置,其特征在于,所述譜包絡(luò)低頻能量比參數(shù)確定單元,具體用于: 應(yīng)用以下公式確定譜包絡(luò)低頻能量比參數(shù)Rm—lOTt:
28.根據(jù)權(quán)利要求26或27所述的裝置,其特征在于,所述信噪比確定單元,具體用于: 應(yīng)用以下公式定義第一后驗(yàn)信噪比估計(jì)值YraJm):
29.根據(jù)權(quán)利要求22~28任一項(xiàng)所述的裝置,其特征在于,所述調(diào)整因子確定單元,具體用于: 應(yīng)用以下公式確定所述當(dāng)前待處理語(yǔ)音子幀的第一調(diào)整因子Ygc;(m):
30.根據(jù)權(quán)利要求22~29任一項(xiàng)所述的裝置,其特征在于,所述碼書(shū)增益調(diào)整單元,具體用于: 應(yīng)用以下公式確定第二代數(shù)碼書(shū)增益^(?2):gs{m) = Ygc(m)gy{m)x 其中,gy(m)為第一代數(shù)碼書(shū)增益,Yge(Hi)為第一調(diào)整因子,m為當(dāng)前待處理語(yǔ)音子幀的序號(hào)。
31.根據(jù)權(quán)利要求25~30任一項(xiàng)所述的裝置,其特征在于,所述總激勵(lì)能量確定單元,具體用于: 應(yīng)用以下公式確定第一總激勵(lì)能量Etef_(m):
32.根據(jù)權(quán)利要求26~31任一項(xiàng)所述的裝置,其特征在于,所述第一處理模塊,還用于:在所述采用所述第二代數(shù)碼書(shū)增益和所述第二自適應(yīng)碼書(shū)增益的量化索引替換所述比特流中所述第一代數(shù)碼書(shū)增益和所述第一自適應(yīng)碼書(shū)增益對(duì)應(yīng)的比特之前,若確定噪聲類型為低頻分布噪聲,則根據(jù)所述當(dāng)前待處理語(yǔ)音子幀的先驗(yàn)信噪比估計(jì)值和所述平滑處理后的濁音度參數(shù),確定濾波器參數(shù); 根據(jù)所述第二代數(shù)碼書(shū)增益、所述第二自適應(yīng)碼書(shū)增益、所述第二代數(shù)碼書(shū)矢量以及第二自適應(yīng)碼書(shū)矢量,確定總激勵(lì)信號(hào); 根據(jù)所述濾波器參數(shù),對(duì)所述總激勵(lì)信號(hào)進(jìn)行梳狀濾波處理。
33.根據(jù)權(quán)利要求26~32任一項(xiàng)所述的裝置,其特征在于,所述裝置還包括: 第一量化模塊,用于在所述采用所述第二代數(shù)碼書(shū)增益和所述第二自適應(yīng)碼書(shū)增益的量化索引替換所述比特流中所述第一代數(shù)碼書(shū)增益和所述第一自適應(yīng)碼書(shū)增益對(duì)應(yīng)的比特之前,若所述判定模塊確定噪聲類型為低頻分布噪聲,則采用語(yǔ)音信號(hào)均方誤差最小的增益量化準(zhǔn)則對(duì)所述第二代數(shù)碼書(shū)增益和所述第二自適應(yīng)碼書(shū)增益進(jìn)行量化; 若所述判定模塊確定噪聲類型為全帶分布噪聲,則采用激勵(lì)信號(hào)均方誤差最小的增益量化準(zhǔn)則對(duì)所述第二代數(shù)碼書(shū)增益和所述第二自適應(yīng)碼書(shū)增益進(jìn)行量化。
34.根據(jù)權(quán)利要求33所述的裝置,其特征在于,若所述判定模塊確定噪聲類型為低頻分布噪聲,所述第一量化模塊,具體用于: 應(yīng)用以下公式對(duì)所述第二代數(shù)碼書(shū)增益和所述第二自適應(yīng)碼書(shū)增益進(jìn)行量化,具體為:
35.根據(jù)權(quán)利要求26~34任一項(xiàng)所述的裝置,其特征在于,所述裝置還包括第二調(diào)整模塊,所述第二調(diào)整模塊,包括: 第一確定單元,用于在所述解碼比特流,獲取當(dāng)前待處理語(yǔ)音子幀的編碼參數(shù)之后,若確定當(dāng)前待處理幀為濁音幀,則根據(jù)所述第一阻抗頻率參數(shù),確定含噪語(yǔ)音的線性預(yù)測(cè)系數(shù); 第二確定單元,用于估計(jì)確定噪聲的線性預(yù)測(cè)系數(shù)、噪聲的自相關(guān)系數(shù)以及純凈語(yǔ)音的自相關(guān)系數(shù); 第三確定單元,用于根據(jù)所述含噪語(yǔ)音的線性預(yù)測(cè)系數(shù)、所述噪聲的線性預(yù)測(cè)系數(shù)、噪聲的自相關(guān)系數(shù)以及純凈語(yǔ)音的自相關(guān)系數(shù),確定純凈語(yǔ)音的線性預(yù)測(cè)系數(shù); 所述第一處理模塊,還用于:對(duì)所述純凈語(yǔ)音的線性預(yù)測(cè)系數(shù)進(jìn)行變換,得到第二阻抗頻率參數(shù); 對(duì)所述第二阻抗頻率參數(shù)進(jìn)行限定處理;若所述當(dāng)前待處理幀的信噪比大于第三閾值,則在連續(xù)至少三個(gè)語(yǔ)音幀之后,對(duì)限定處理后的第二阻抗頻率參數(shù)進(jìn)行平滑處理,所述平滑處理為根據(jù)所述第一阻抗頻率和當(dāng)前幀之前的至少一幀的調(diào)整后的阻抗頻率參數(shù)計(jì)算加權(quán)平均值,確定第三阻抗頻率參數(shù);所述第一量化模塊,還用于采用所述第三阻抗頻率參數(shù)的量化索引替換比特流中所述第一阻抗頻率參數(shù)對(duì)應(yīng)的比特。
36.根據(jù)權(quán)利要求35所述的裝置,其特征在于,所述第二確定單元,具體用于: 應(yīng)用以下公式確定噪聲線性預(yù)測(cè)系數(shù):
37.一種語(yǔ)音增強(qiáng)處理裝置,其特征在于,包括: 第二獲取模塊,用于確定不連續(xù)傳輸模式開(kāi)啟,若當(dāng)前待處理子幀為沉默指示幀,則解碼比特流,獲取所述沉默指示幀的加權(quán)平均阻抗頻率參數(shù)矢量和平均對(duì)數(shù)幀能量參數(shù);第三調(diào)整模塊,用于對(duì)所述平均對(duì)數(shù)幀能量參數(shù)進(jìn)行衰減調(diào)整; 第二處理模塊,用于采用調(diào)整后的平均對(duì)數(shù)幀能量參數(shù)的量化索引替換所述比特流中平均對(duì)數(shù)幀能量參數(shù)對(duì)應(yīng)的比特。
38.根據(jù)權(quán)利要求37所述的裝置,其特征在于,所述第三調(diào)整模塊,具體用于: 應(yīng)用以下公式確定平均對(duì)數(shù)幀能量參數(shù)的增益因子Gdtx:
39.一種語(yǔ)音增強(qiáng)處理裝置,其特征在于,包括: 第三獲取模塊,用于若確定出現(xiàn)錯(cuò)誤幀,則解碼比特流,獲取對(duì)所述錯(cuò)誤幀進(jìn)行恢復(fù)得到的當(dāng)前待處理子幀的編碼參數(shù),所述恢復(fù)得到的當(dāng)前待處理子幀的編碼參數(shù)包括語(yǔ)言活動(dòng)偵測(cè)標(biāo)志、第四阻抗頻率參數(shù)、基音參數(shù)、第三自適應(yīng)碼書(shū)增益; 第四調(diào)整模塊,用于調(diào)整所述第四阻抗頻率參數(shù),得到第五阻抗頻率參數(shù); 第二確定模塊,用于根據(jù)編碼速率生成隨機(jī)脈沖位置的第三代數(shù)碼書(shū)矢量; 所述第四調(diào)整模塊,還用于對(duì)所述編碼參數(shù)中的第三代數(shù)碼書(shū)增益進(jìn)行調(diào)整,得到第四代數(shù)碼書(shū)增益; 第二量化模塊,用于對(duì)所述語(yǔ)言活動(dòng)偵測(cè)標(biāo)志、第五阻抗頻率參數(shù)、所述基音參數(shù)、所述隨機(jī)脈沖位置的第三代數(shù)碼書(shū)索引進(jìn)行量化,并采用語(yǔ)音信號(hào)均方誤差最小的增益量化準(zhǔn)則對(duì)所述第三自適應(yīng)碼書(shū)增益和所述第四代數(shù)碼書(shū)增益進(jìn)行量化; 第三處理模塊,用于采用所述第四代數(shù)碼書(shū)增益和所述第三自適應(yīng)碼書(shū)增益的聯(lián)合量化索引、所述第五阻抗頻率參數(shù)的量化索引以及所述基音參數(shù)替換所述比特流中各編碼參數(shù)對(duì)應(yīng)的比特。
40.根據(jù)權(quán)利要求39所述的裝置,其特征在于,所述第四調(diào)整模塊,具體用于: 獲取前一個(gè)正常子幀的代數(shù)碼書(shū)增益的第二調(diào)整因子paSt_SCale_g。; 應(yīng)用以下公式確定第四代數(shù)碼書(shū)增益g?!狹d: gCJlod = gcX0.9delayXpast_scale_gc ; delay為從幀錯(cuò)誤發(fā)生開(kāi)始累計(jì)的錯(cuò)誤的子幀數(shù)目,g。為第三代數(shù)碼書(shū)增益。
【文檔編號(hào)】G10L21/02GK104021796SQ201310066421
【公開(kāi)日】2014年9月3日 申請(qǐng)日期:2013年2月28日 優(yōu)先權(quán)日:2013年2月28日
【發(fā)明者】鮑長(zhǎng)春, 夏丙寅, 楊閎博 申請(qǐng)人:華為技術(shù)有限公司