語(yǔ)音增強(qiáng)處理方法和裝置制造方法

文檔序號(hào)：2825935閱讀：190來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>樂(lè)器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

語(yǔ)音增強(qiáng)處理方法和裝置制造方法
【專利摘要】本發(fā)明實(shí)施例提供一種語(yǔ)音增強(qiáng)處理方法和裝置，該方法，包括：解碼比特流，獲取當(dāng)前待處理語(yǔ)音子幀的編碼參數(shù)，編碼參數(shù)包括第一代數(shù)碼書(shū)增益和第一自適應(yīng)碼書(shū)增益；調(diào)整第一代數(shù)碼書(shū)增益，得到第二代數(shù)碼書(shū)增益；根據(jù)第一自適應(yīng)碼書(shū)增益和第二代數(shù)碼書(shū)增益，確定第二自適應(yīng)碼書(shū)增益；采用第二代數(shù)碼書(shū)增益和第二自適應(yīng)碼書(shū)增益的量化索引替換比特流中第一代數(shù)碼書(shū)增益和第一自適應(yīng)碼書(shū)增益對(duì)應(yīng)的比特。本發(fā)明的技術(shù)方案，可以有效改善消除噪音的效果，提高語(yǔ)音通話質(zhì)量。
【專利說(shuō)明】語(yǔ)音增強(qiáng)處理方法和裝置
【技術(shù)領(lǐng)域】
[0001 ] 本發(fā)明實(shí)施例涉及通信技術(shù)，尤其涉及一種語(yǔ)音增強(qiáng)處理方法和裝置。
【背景技術(shù)】
[0002]語(yǔ)音增強(qiáng)的目的是從帶噪語(yǔ)音信號(hào)中壓縮背景噪音，提取純凈語(yǔ)音，改進(jìn)通話質(zhì)量。一般情況下，語(yǔ)音增強(qiáng)算法通常位于移動(dòng)通信網(wǎng)絡(luò)的終端設(shè)備中，其位置在語(yǔ)音編碼之前或者語(yǔ)音解碼器之后，但由于功耗、存儲(chǔ)空間和成本的限制，終端設(shè)備中的語(yǔ)音增強(qiáng)算法通常不能達(dá)到很好的增強(qiáng)效果，算法性能無(wú)法滿足日益提高的需求，因此，越來(lái)越多的研究者和通信運(yùn)營(yíng)商認(rèn)為工作于網(wǎng)絡(luò)設(shè)備中的語(yǔ)音增強(qiáng)算法是一種可行的解決方案。在移動(dòng)網(wǎng)絡(luò)中使用線性域語(yǔ)音增強(qiáng)技術(shù)，但由此引入的附加延時(shí)、計(jì)算復(fù)雜度和語(yǔ)音質(zhì)量的降低往往是實(shí)際應(yīng)用所不能接受的，所以基于編碼參數(shù)調(diào)整的參數(shù)域語(yǔ)音增強(qiáng)方法是在移動(dòng)通信網(wǎng)絡(luò)的網(wǎng)絡(luò)端較為適用的一種語(yǔ)音增強(qiáng)的解決方案。
[0003]現(xiàn)有技術(shù)中的一種參數(shù)域語(yǔ)音增強(qiáng)方法首先對(duì)輸入含噪碼流進(jìn)行解碼，得到解碼語(yǔ)音序列，而后使用線性域語(yǔ)音增強(qiáng)方法進(jìn)行處理，將所得結(jié)果與處理前的含噪序列進(jìn)行比較，得到編碼器自適應(yīng)碼書(shū)增益和代數(shù)碼書(shū)增益兩個(gè)參數(shù)的調(diào)整因子，對(duì)其進(jìn)行調(diào)整并重新量化，替換碼流中的相應(yīng)比特，從而達(dá)到在編碼域消除噪聲的目的。
[0004]在實(shí)現(xiàn)本發(fā)明實(shí)施例的過(guò)程中，發(fā)明人發(fā)現(xiàn)上述現(xiàn)有技術(shù)中的語(yǔ)音增強(qiáng)方法對(duì)噪聲的消除效果較差，語(yǔ)音通話質(zhì)量較差。

【發(fā)明內(nèi)容】

[0005]本發(fā)明實(shí)施例提供一種語(yǔ)音增強(qiáng)處理方法和裝置，用于改善消除噪音的效果，提高語(yǔ)音通話質(zhì)量。
[0006]本發(fā)明第一方面，提供一種語(yǔ)音增強(qiáng)處理方法，所述方法包括:
[0007]解碼比特流，獲取當(dāng)前待處理語(yǔ)音子幀的編碼參數(shù)，所述編碼參數(shù)包括第一代數(shù)碼書(shū)增益和第一自適應(yīng)碼書(shū)增益；
[0008]調(diào)整所述第一代數(shù)碼書(shū)增益，得到第二代數(shù)碼書(shū)增益；
[0009]根據(jù)所述第一自適應(yīng)碼書(shū)增益和所述第二代數(shù)碼書(shū)增益，確定第二自適應(yīng)碼書(shū)增
M ;
[0010]采用所述第二代數(shù)碼書(shū)增益和所述第二自適應(yīng)碼書(shū)增益的量化索引替換所述比特流中所述第一代數(shù)碼書(shū)增益和所述第一自適應(yīng)碼書(shū)增益對(duì)應(yīng)的比特。
[0011]在第一方面的第一種可能的實(shí)現(xiàn)方式中，所述編碼參數(shù)還包括第一代數(shù)碼書(shū)矢量，所述調(diào)整所述第一代數(shù)碼書(shū)增益，得到第二代數(shù)碼書(shū)增益，包括:
[0012]根據(jù)所述第一代數(shù)碼書(shū)增益確定噪聲的代數(shù)碼書(shū)增益；
[0013]根據(jù)所述噪聲的代數(shù)碼書(shū)增益和所述第一代數(shù)碼書(shū)矢量確定噪聲激勵(lì)能量估計(jì)值；
[0014]根據(jù)所述第一代數(shù)碼書(shū)增益和所述第一代數(shù)碼書(shū)矢量確定第一代數(shù)碼書(shū)激勵(lì)能量;
[0015]根據(jù)所述噪聲激勵(lì)能量估計(jì)值和所述第一代數(shù)碼書(shū)激勵(lì)能量，確定所述當(dāng)前待處理語(yǔ)音子幀的第一后驗(yàn)信噪比估計(jì)值；
[0016]根據(jù)所述當(dāng)前待處理語(yǔ)音子幀的能量和所述當(dāng)前待處理語(yǔ)音子幀的能量的最小值，確定所述當(dāng)前待處理語(yǔ)音子幀的第二后驗(yàn)信噪比估計(jì)值；
[0017]根據(jù)所述第一后驗(yàn)信噪比估計(jì)值和所述第二后驗(yàn)信噪比估計(jì)值確定所述當(dāng)前待處理語(yǔ)音子幀的先驗(yàn)信噪比估計(jì)值；
[0018]采用所述先驗(yàn)信噪比估計(jì)值確定所述當(dāng)前待處理語(yǔ)音子幀的第一調(diào)整因子；
[0019]根據(jù)所述第一調(diào)整因子調(diào)整所述第一代數(shù)碼書(shū)增益，確定所述第二代數(shù)碼書(shū)增益。
[0020]結(jié)合第一方面或第一方面的第一種可能的實(shí)現(xiàn)方式，在第一方面的第二種可能的實(shí)現(xiàn)方式中，所述編碼參數(shù)中還包括濁音度參數(shù)，在所述調(diào)整所述第一代數(shù)碼書(shū)增益，得到第二代數(shù)碼書(shū)增益之前，所述方法還包括:
[0021]對(duì)所述濁音度參數(shù)進(jìn)行平滑處理，得到平滑處理后的濁音度參數(shù)；
[0022]若所述平滑處理后的濁音度參數(shù)大于第一閾值，則確定所述當(dāng)前待處理語(yǔ)音子幀為第一類子幀；若所述平滑處理后的濁音度參數(shù)小于第一閾值，則確定所述當(dāng)前待處理語(yǔ)音子幀為第二類子幀，其中，所述第一類子幀為濁音幀，所述第二類子幀為清音或噪音幀。
[0023]根據(jù)第一方面的第二種可能的實(shí)現(xiàn)方式，在第一方面的第三種可能的實(shí)現(xiàn)方式中，所述對(duì)所述濁音度參數(shù)進(jìn)行平滑處理，得到平滑處理后的濁音度參數(shù)，包括:
[0024]應(yīng)用以下公式對(duì)濁音度參數(shù)rv(m)在時(shí)間上進(jìn)行一階遞歸平滑生成平滑后的濁音度參數(shù)4("7):
[0025]= avrv{m-1) + (1-av)rv(m)；
[0026]其中，αν為平滑因子，m為當(dāng)前待處理語(yǔ)音子幀的序號(hào)，F(xiàn)V(W-1)為前一個(gè)語(yǔ)音子幀平滑處理后的濁音度參數(shù)。
[0027]結(jié)合第一方面的第二種或第三種可能的實(shí)現(xiàn)方式，在第一方面的第四種可能的實(shí)現(xiàn)方式中，所述編碼參數(shù)中還包括第一自適應(yīng)碼書(shū)矢量，所述根據(jù)所述第一自適應(yīng)碼書(shū)增益和所述第二代數(shù)碼書(shū)增益，確定第二自適應(yīng)碼書(shū)增益，包括:
[0028]若確定當(dāng)前待處理語(yǔ)音子幀為所述第一類子幀，則獲取所述當(dāng)前待處理語(yǔ)音子幀的第二代數(shù)碼書(shū)矢量以及第二自適應(yīng)碼書(shū)矢量；
[0029]根據(jù)所述第一自適應(yīng)碼書(shū)增益、所述第一自適應(yīng)碼書(shū)矢量、所述第一代數(shù)碼書(shū)增益以及所述第一代數(shù)碼書(shū)矢量，確定第一總激勵(lì)能量；
[0030]根據(jù)所述第一總激勵(lì)能量和能量調(diào)整因子，確定第二總激勵(lì)能量；
[0031]根據(jù)所述第二總激勵(lì)能量、所述第二代數(shù)碼書(shū)增益、所述第二代數(shù)碼書(shū)矢量以及所述第二自適應(yīng)碼書(shū)矢量，確定所述第二自適應(yīng)碼書(shū)增益。
[0032]結(jié)合第一方面的第一種至第四種可能的實(shí)現(xiàn)方式中任意一種，在第一方面的第五種可能的實(shí)現(xiàn)方式中，所述編碼參數(shù)中還包括第一阻抗頻率參數(shù)，在所述調(diào)整所述第一代數(shù)碼書(shū)增益，得到第二代數(shù)碼書(shū)增益之前，所述方法還包括:
[0033]根據(jù)所述第一阻抗頻率參數(shù)確定譜包絡(luò)低頻能量比參數(shù)；
[0034]若所述譜包絡(luò)低頻能量比參數(shù)的平均值大于第二閾值，則確定噪聲類型為低頻分布噪聲；若所述譜包絡(luò)低頻能量比參數(shù)的平均值小于所述第二閾值，則確定噪聲類型為全帶分布噪聲。
[0035]根據(jù)第一方面的第五種可能的實(shí)現(xiàn)方式，在第一方面的第六種可能的實(shí)現(xiàn)方式中，所述根據(jù)所述第一阻抗頻率參數(shù)確定譜包絡(luò)低頻能量比參數(shù)，包括:
[0036]應(yīng)用以下公式確定譜包絡(luò)低頻能量比參數(shù)Rm lw:
【權(quán)利要求】
1.一種語(yǔ)音增強(qiáng)處理方法，其特征在于，所述方法包括: 解碼比特流，獲取當(dāng)前待處理語(yǔ)音子幀的編碼參數(shù)，所述編碼參數(shù)包括第一代數(shù)碼書(shū)增益和第一自適應(yīng)碼書(shū)增益；調(diào)整所述第一代數(shù)碼書(shū)增益，得到第二代數(shù)碼書(shū)增益；根據(jù)所述第一自適應(yīng)碼書(shū)增益和所述第二代數(shù)碼書(shū)增益，確定第二自適應(yīng)碼書(shū)增益；采用所述第二代數(shù)碼書(shū)增益和所述第二自適應(yīng)碼書(shū)增益的量化索引替換所述比特流中所述第一代數(shù)碼書(shū)增益和所述第一自適應(yīng)碼書(shū)增益對(duì)應(yīng)的比特。
2.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述編碼參數(shù)還包括第一代數(shù)碼書(shū)矢量，所述調(diào)整所述第一代數(shù)碼書(shū)增益，得到第二代數(shù)碼書(shū)增益，包括: 根據(jù)所述第一代數(shù)碼書(shū)增益確定噪聲的代數(shù)碼書(shū)增益；根據(jù)所述噪聲的代數(shù)碼書(shū)增益和所述第一代數(shù)碼書(shū)矢量確定噪聲激勵(lì)能量估計(jì)值；根據(jù)所述第一代數(shù)碼書(shū)增益和所述第一代數(shù)碼書(shū)矢量確定第一代數(shù)碼書(shū)激勵(lì)能量；根據(jù)所述噪聲激勵(lì)能量估計(jì)值和所述第一代數(shù)碼書(shū)激勵(lì)能量，確定所述當(dāng)前待處理語(yǔ)音子幀的第一后驗(yàn)信噪比估計(jì)值；根據(jù)所述當(dāng)前待處理語(yǔ)音子幀的能量和所述當(dāng)前待處理語(yǔ)音子幀的能量的最小值，確定所述當(dāng)前待處理語(yǔ)音子幀的第二后驗(yàn)信噪比估計(jì)值；根據(jù)所述第一后驗(yàn)信噪比估計(jì)值和所述第二后驗(yàn)信噪比估計(jì)值確定所述當(dāng)前待處理語(yǔ)音子幀的先驗(yàn)信噪比估計(jì)值；采用所述先驗(yàn)信噪比估計(jì)值確定所述當(dāng)前待處理語(yǔ)音子幀的第一調(diào)整因子；根據(jù)所述第一調(diào)整因子調(diào)整所述第一代數(shù)碼書(shū)增益，確定所述第二代數(shù)碼書(shū)增益。
3.根據(jù)權(quán)利要求1或2所述的方法，其特征在于，所述編碼參數(shù)中還包括濁音度參數(shù)，在所述調(diào)整所述第一代數(shù)碼書(shū)增益，得到第二代數(shù)碼書(shū)增益之前，所述方法還包括: 對(duì)所述濁音度參數(shù)進(jìn)行平滑處理，得到平滑處理后的濁音度參數(shù)；若所述平滑處理后的濁音度參數(shù)大于第一閾值，則確定所述當(dāng)前待處理語(yǔ)音子幀為第一類子幀；若所述平滑處理后的濁音度參數(shù)小于第一閾值，則確定所述當(dāng)前待處理語(yǔ)音子幀為第二類子幀，其中，所述第一類子幀為濁音幀，所述第二類子幀為清音或噪音幀。
4.根據(jù)權(quán)利要求3所述的方法，其特征在于，所述對(duì)所述濁音度參數(shù)進(jìn)行平滑處理，得到平滑處理后的濁音度參數(shù)，包括: 應(yīng)用以下公式對(duì)濁音度參數(shù)rv(m)在時(shí)間上進(jìn)行一階遞歸平滑生成平滑后的濁音度參Tv[m) = aν7ν(?)? -1) + (1-av)rv(m)；其中，αν為平滑因子，m為當(dāng)前待處理語(yǔ)音子幀的序號(hào),Fv(W-1)為前一個(gè)語(yǔ)音子幀平滑處理后的濁音度參數(shù)。
5.根據(jù)權(quán)利要求3或4所述的方法，其特征在于，所述編碼參數(shù)中還包括第一自適應(yīng)碼書(shū)矢量，所述根據(jù)所述第一自適應(yīng)碼書(shū)增益和所述第二代數(shù)碼書(shū)增益，確定第二自適應(yīng)碼書(shū)增益，包括: 若確定當(dāng)前待處理語(yǔ)音子幀為所述第一類子幀，則獲取所述當(dāng)前待處理語(yǔ)音子幀的第二代數(shù)碼書(shū)矢量以及第二自適應(yīng)碼書(shū)矢量；根據(jù)所述第一自適應(yīng)碼書(shū)增益、所述第一自適應(yīng)碼書(shū)矢量、所述第一代數(shù)碼書(shū)增益以及所述第一代數(shù)碼書(shū)矢量，確定第一總激勵(lì)能量；根據(jù)所述第一總激勵(lì)能量和能量調(diào)整因子，確定第二總激勵(lì)能量；根據(jù)所述第二總激勵(lì)能量、所述第二代數(shù)碼書(shū)增益、所述第二代數(shù)碼書(shū)矢量以及所述第二自適應(yīng)碼書(shū)矢量，確定所述第二自適應(yīng)碼書(shū)增益。
6.根據(jù)權(quán)利要求2~5任一項(xiàng)所述的方法，其特征在于，所述編碼參數(shù)中還包括第一阻抗頻率參數(shù)，在所述調(diào)整所述第一代數(shù)碼書(shū)增益，得到第二代數(shù)碼書(shū)增益之前，所述方法還包括: 根據(jù)所述第一阻抗頻率參數(shù)確定譜包絡(luò)低頻能量比參數(shù)；若所述譜包絡(luò)低頻能量比參數(shù)的平均值大于第二閾值，則確定噪聲類型為低頻分布噪聲；若所述譜包絡(luò)低頻能量比參數(shù)的平均值小于所述第二閾值，則確定噪聲類型為全帶分布噪聲。
7.根據(jù)權(quán)利要求6所述的方法，其特征在于，所述根據(jù)所述第一阻抗頻率參數(shù)確定譜包絡(luò)低頻能量比參數(shù)，包括: 應(yīng)用以下公式確定譜包絡(luò)低頻能量比參數(shù)Rm—lOTt:

8.根據(jù)權(quán)利要求6或7所述的方法，其特征在于，所述根據(jù)所述噪聲激勵(lì)能量估計(jì)值和第一代數(shù)碼書(shū)激勵(lì)能量，確定所述當(dāng)前待處理語(yǔ)音子幀的第一后驗(yàn)信噪比估計(jì)值，包括: 應(yīng)用以下公式定義第一后驗(yàn)信噪比估計(jì)值YraJm):

9.根據(jù)權(quán)利要求2~8任一項(xiàng)所述的方法，其特征在于，所述采用所述先驗(yàn)信噪比估計(jì)值確定第一調(diào)整因子，包括: 應(yīng)用以下公式確定所述當(dāng)前待處理語(yǔ)音子幀的第一調(diào)整因子Ygc;(m):

10.根據(jù)權(quán)利要求2~9任一項(xiàng)所述的方法，其特征在于，所述根據(jù)所述第一調(diào)整因子調(diào)整所述第一代數(shù)碼書(shū)增益，確定第二代數(shù)碼書(shū)增益，包括: 應(yīng)用以下公式確定第二代數(shù)碼書(shū)增益^(^0:
11.根據(jù)權(quán)利要求5~10任一項(xiàng)所述的方法，其特征在于，所述根據(jù)所述第一自適應(yīng)碼書(shū)增益、所述第一自適應(yīng)碼書(shū)矢量、所述第一代數(shù)碼書(shū)增益以及所述第一代數(shù)碼書(shū)矢量，確定第一總激勵(lì)能量，包括: 應(yīng)用以下公式確定第一總激勵(lì)能量Etef_(m):
Ebefore (m) = Σ n (gp (m) d (n) +gy (m) c (η))2 ；其中，gy(m)為第一代數(shù)碼書(shū)增益，gp(m)為第一自適應(yīng)碼書(shū)增益，c (η)和d(n)分別為第一代數(shù)碼書(shū)矢量和第一自適應(yīng)碼書(shū)矢量，η為采樣點(diǎn)的序號(hào)；所述根據(jù)所述第一總激勵(lì)能量和能量調(diào)整因子，確定第二總激勵(lì)能量，包括: 應(yīng)用以下公式確定第二總激勵(lì)能量EaftOT(m):
Eafter O11) = Q eEbefore O11);其中，Ebrftm(m)為第一總激勵(lì)能量，Cie為當(dāng)前待處理語(yǔ)音子幀的的能量調(diào)整因子。所述根據(jù)所述第二總激勵(lì)能量、所述第二代數(shù)碼書(shū)增益、所述第二代數(shù)碼書(shū)矢量以及所述第二自適應(yīng)碼書(shū)矢量，確定所述第二自適應(yīng)碼書(shū)增益，包括: 應(yīng)用以下方程確定第二自適應(yīng)碼書(shū)增益:

12.根據(jù)權(quán)利要求6~11任一項(xiàng)所述的方法，其特征在于，在所述采用所述第二代數(shù)碼書(shū)增益和所述第二自適應(yīng)碼書(shū)增益的量化索引替換所述比特流中所述第一代數(shù)碼書(shū)增益和所述第一自適應(yīng)碼書(shū)增益對(duì)應(yīng)的比特之前，所述方法還包括: 若確定噪聲類型為低頻分布噪聲，則根據(jù)所述當(dāng)前待處理語(yǔ)音子幀的先驗(yàn)信噪比估計(jì)值和所述平滑處理后的濁音度參數(shù)，確定濾波器參數(shù)；根據(jù)所述第二代數(shù)碼書(shū)增益、所述第二自適應(yīng)碼書(shū)增益、所述第二代數(shù)碼書(shū)矢量以及第二自適應(yīng)碼書(shū)矢量，確定總激勵(lì)信號(hào)；根據(jù)所述濾波器參數(shù)，對(duì)所述總激勵(lì)信號(hào)進(jìn)行梳狀濾波處理。
13.根據(jù)權(quán)利要求6~12任一項(xiàng)所述的方法，其特征在于，在所述采用所述第二代數(shù)碼書(shū)增益和所述第二自適應(yīng)碼書(shū)增益的量化索引替換所述比特流中所述第一代數(shù)碼書(shū)增益和所述第一自適應(yīng)碼書(shū)增益對(duì)應(yīng)的比特之前，所述方法還包括: 若確定噪聲類型為低頻分布噪聲，則采用語(yǔ)音信號(hào)均方誤差最小的增益量化準(zhǔn)則對(duì)所述第二代數(shù)碼書(shū)增益和所述第二自適應(yīng)碼書(shū)增益進(jìn)行量化；若確定噪聲類型為全帶分布噪聲，則采用激勵(lì)信號(hào)均方誤差最小的增益量化準(zhǔn)則對(duì)所述第二代數(shù)碼書(shū)增益和所述第二自適應(yīng)碼書(shū)增益進(jìn)行量化。
14.根據(jù)權(quán)利要求1 所述的方法，其特征在于，若確定噪聲類型為低頻分布噪聲，所述采用語(yǔ)音信號(hào)均方誤差最小的增益量化準(zhǔn)則對(duì)所述第二代數(shù)碼書(shū)增益和所述第二自適應(yīng)碼書(shū)增益進(jìn)行量化，包括: 應(yīng)用以下公式對(duì)所述第二代數(shù)碼書(shū)增益和所述第二自適應(yīng)碼書(shū)增益進(jìn)行量化，具體為:
15.根據(jù)權(quán)利要求6~14任一項(xiàng)所述的方法，其特征在于，在所述解碼比特流，獲取當(dāng)前待處理語(yǔ)音子幀的編碼參數(shù)之后，所述方法還包括:若確定當(dāng)前待處理幀為濁音幀，則根據(jù)所述第一阻抗頻率參數(shù)，確定含噪語(yǔ)音的線性預(yù)測(cè)系數(shù)；估計(jì)確定噪聲的線性預(yù)測(cè)系數(shù)、噪聲的自相關(guān)系數(shù)以及純凈語(yǔ)音的自相關(guān)系數(shù)；根據(jù)所述含噪語(yǔ)音的線性預(yù)測(cè)系數(shù)、所述噪聲的線性預(yù)測(cè)系數(shù)、噪聲的自相關(guān)系數(shù)以及純凈語(yǔ)音的自相關(guān)系數(shù)，確定純凈語(yǔ)音的線性預(yù)測(cè)系數(shù)；對(duì)所述純凈語(yǔ)音的線性預(yù)測(cè)系數(shù)進(jìn)行變換，得到第二阻抗頻率參數(shù)；對(duì)所述第二阻抗頻率參數(shù)進(jìn)行限定處理；若所述當(dāng)前待處理幀的信噪比大于第三閾值，則在連續(xù)至少三個(gè)語(yǔ)音幀之后，對(duì)限定處理后的第二阻抗頻率參數(shù)進(jìn)行平滑處理，所述平滑處理為根據(jù)所述第一阻抗頻率和當(dāng)前幀之前的至少一幀的調(diào)整后的阻抗頻率參數(shù)計(jì)算加權(quán)平均值，確定第三阻抗頻率參數(shù)；采用所述第三阻抗頻率參數(shù)的量化索引替換比特流中所述第一阻抗頻率參數(shù)對(duì)應(yīng)的比特。
16.根據(jù)權(quán)利要求15所述的方法，其特征在于，所述估計(jì)確定噪聲的線性預(yù)測(cè)系數(shù)、噪聲的自相關(guān)系數(shù)以及純凈語(yǔ)音的自相關(guān)芊數(shù)包括: 應(yīng)用以下公式確定噪聲線性預(yù)測(cè)系數(shù)4
17.一種語(yǔ)音增強(qiáng)處理方法，其特征在于，包括: 確定不連續(xù)傳輸模式開(kāi)啟，若當(dāng)前待處理子幀為沉默指示幀，則解碼比特流，獲取所述沉默指示幀的加權(quán)平均阻抗頻率參數(shù)矢量和平均對(duì)數(shù)幀能量參數(shù)；對(duì)所述平均對(duì)數(shù)幀能量參數(shù)進(jìn)行衰減調(diào)整；采用調(diào)整后的平均對(duì)數(shù)幀能量參數(shù)的量化索引替換所述比特流中平均對(duì)數(shù)幀能量參數(shù)對(duì)應(yīng)的比特。
18.根據(jù)權(quán)利要求17所述的方法，其特征在于，所述對(duì)所述平均對(duì)數(shù)幀能量參數(shù)進(jìn)行衰減調(diào)整，包括: 應(yīng)用以下公式確定平均對(duì)數(shù)幀能量參數(shù)的增益因子Gdtx:

19.一種語(yǔ)音增強(qiáng)處理方法，其特征在于，包括: 若確定出現(xiàn)錯(cuò)誤幀，則解碼比特流，獲取對(duì)所述錯(cuò)誤幀進(jìn)行恢復(fù)得到的當(dāng)前待處理子幀的編碼參數(shù)，所述恢復(fù)得到的當(dāng)前待處理子幀的編碼參數(shù)包括語(yǔ)言活動(dòng)偵測(cè)標(biāo)志、第四阻抗頻率參數(shù)、基音參數(shù)、第三自適應(yīng)碼書(shū)增益；調(diào)整所述第四阻抗頻率參數(shù)，得到第五阻抗頻率參數(shù)；根據(jù)編碼速率生成隨機(jī)脈沖位置的第三代數(shù)碼書(shū)矢量；對(duì)所述編碼參數(shù)中的第三代數(shù)碼書(shū)增益進(jìn)行調(diào)整，得到第四代數(shù)碼書(shū)增益；對(duì)所述語(yǔ)言活動(dòng)偵測(cè)標(biāo)志、第五阻抗頻率參數(shù)、所述基音參數(shù)、所述隨機(jī)脈沖位置的第三代數(shù)碼書(shū)索引進(jìn)行量化，并采用語(yǔ)音信號(hào)均方誤差最小的增益量化準(zhǔn)則對(duì)所述第三自適應(yīng)碼書(shū)增益和所述第四代數(shù)碼書(shū)增益進(jìn)行量化；采用所述第四代數(shù)碼書(shū)增益和所述第三自適應(yīng)碼書(shū)增益的聯(lián)合量化索引、所述第五阻抗頻率參數(shù)的量化索引以及所述基音參數(shù)替換所述比特流中各編碼參數(shù)對(duì)應(yīng)的比特。
20.根據(jù)權(quán)利要求19所述的方法，其特征在于，所述對(duì)所述編碼參數(shù)中的第三代數(shù)碼書(shū)增益進(jìn)行調(diào)整，得到第四代數(shù)碼書(shū)增益，包括: 獲取前一個(gè)正常子幀的代數(shù)碼書(shū)增益的第二調(diào)整因子paSt_SCale_g。；應(yīng)用以下公式確定第四代數(shù)碼書(shū)增益g?！狹d: gCJlod = gcX0.9delayXpast_scale_gc ； delay為從幀錯(cuò)誤發(fā)生開(kāi)始累計(jì)的錯(cuò)誤的子幀數(shù)目，g。為第三代數(shù)碼書(shū)增益。
21.一種語(yǔ)音增強(qiáng)處理裝置，其特征在于，所述裝置包括: 第一獲取模塊，用于解碼比特流，獲取當(dāng)前待處理語(yǔ)音子幀的編碼參數(shù)，所述編碼參數(shù)包括第一代數(shù)碼書(shū)增益和第一自適應(yīng)碼書(shū)增益；第一調(diào)整模塊，用于調(diào)整所述第一代數(shù)碼書(shū)增益，得到第二代數(shù)碼書(shū)增益；第一確定模塊，用于根據(jù)所述第一自適應(yīng)碼書(shū)增益和所述第二代數(shù)碼書(shū)增益，確定第二自適應(yīng)碼書(shū)增益；第一處理模塊，用于采用所述第二代數(shù)碼書(shū)增益和所述第二自適應(yīng)碼書(shū)增益的量化索引替換所述比特流中所述第一代數(shù)碼書(shū)增益和所述第一自適應(yīng)碼書(shū)增益對(duì)應(yīng)的比特。
22.根據(jù)權(quán)利要求21所述的裝置，其特征在于，所述第一調(diào)整模塊，包括: 信噪比確定單元，用于根據(jù)所述第一代數(shù)碼書(shū)增益確定噪聲的代數(shù)碼書(shū)增益；根據(jù)所述噪聲的代數(shù)碼書(shū)增益和所述第一代數(shù)碼書(shū)矢量確定噪聲激勵(lì)能量估計(jì)值；根據(jù)所述第一代數(shù)碼書(shū)增益和所述第一代數(shù)碼書(shū)矢量確定第一代數(shù)碼書(shū)激勵(lì)能量；根據(jù)所述噪聲激勵(lì)能量估計(jì)值和所述第一代數(shù)碼書(shū)激勵(lì)能量，確定所述當(dāng)前待處理語(yǔ)音子幀的第一后驗(yàn)信噪比估計(jì)值；根據(jù)所述當(dāng)前待處理語(yǔ)音子幀的能量和所述當(dāng)前待處理語(yǔ)音子幀的能量的最小值，確定所述當(dāng)前待處理語(yǔ)音子幀的第二后驗(yàn)信噪比估計(jì)值；根據(jù)所述第一后驗(yàn)信噪比估計(jì)值和所述第二后驗(yàn)信噪比估計(jì)值確定所述當(dāng)前待處理語(yǔ)音子幀的先驗(yàn)信噪比估計(jì)值；調(diào)整因子確定單元，用于采用所述先驗(yàn)信噪比估計(jì)值確定所述當(dāng)前待處理語(yǔ)音子幀的第一調(diào)整因子；增益參數(shù)調(diào)整單元，用于根據(jù)所述第一調(diào)整因子調(diào)整所述第一代數(shù)碼書(shū)增益，確定所述第二代數(shù)碼書(shū)增益。
23.根據(jù)權(quán)利要求21或22所述的裝置，其特征在于，所述編碼參數(shù)中還包括濁音度參數(shù)，所述裝置還包括判定模塊，所述判定模塊，包括: 平滑處理單元，用于在所述調(diào)整所述第一代數(shù)碼書(shū)增益，得到第二代數(shù)碼書(shū)增益之前，對(duì)所述濁音度參數(shù)進(jìn)行平滑處理，得到平滑處理后的濁音度參數(shù)；子幀類型判定單元，用于若所述平滑處理后的濁音度參數(shù)大于第一閾值，則確定所述當(dāng)前待處理語(yǔ)音子幀為第一類子幀；若所述平滑處理后的濁音度參數(shù)小于第一閾值，則確定所述當(dāng)前待處理語(yǔ)音子幀為第二類子幀，其中，所述第一類子幀為濁音幀，所述第二類子幀為清音或噪音幀。
24.根據(jù)權(quán)利要求23所述的裝置，其特征在于，所述平滑處理單元，具體用于: 應(yīng)用以下公式對(duì)濁音度參數(shù)rv(m)在時(shí)間上進(jìn)行一階遞歸平滑生成平滑后的濁音度參數(shù)/:',("7):Tv(m) = av7v(m-1) + (1-αν)ι\,(?η): 其中，Civ為平滑因子，m為當(dāng)前待處理語(yǔ)音子幀的序號(hào),4(w-1)為前一個(gè)語(yǔ)音子幀平滑處理后的濁音度參數(shù)。
25.根據(jù)權(quán)利要求23或24所述的裝置，其特征在于，所述編碼參數(shù)中還包括第一自適應(yīng)碼書(shū)矢量，所述第一確定模塊，包括: 碼書(shū)矢量獲取單元，用于若所述子幀類型判定單元確定當(dāng)前待處理語(yǔ)音子幀為所述第一類子幀，則獲取所述當(dāng)前待處理語(yǔ)音子幀的第二代數(shù)碼書(shū)矢量以及第二自適應(yīng)碼書(shū)矢量; 總激勵(lì)能量確定單元，用于根據(jù)所述第一自適應(yīng)碼書(shū)增益、所述第一自適應(yīng)碼書(shū)矢量、所述第一代數(shù)碼書(shū)增益以及所述第一代數(shù)碼書(shū)矢量，確定第一總激勵(lì)能量；根據(jù)所述第一總激勵(lì)能量和能量調(diào)整因子，確定第二總激勵(lì)能量；增益參數(shù)確定單元，用于根據(jù)所述第二總激勵(lì)能量、所述第二代數(shù)碼書(shū)增益、所述第二代數(shù)碼書(shū)矢量以及所述第二自適應(yīng)碼書(shū)矢量，確定所述第二自適應(yīng)碼書(shū)增益。
26.根據(jù)權(quán)利要求22~25任一項(xiàng)所述的裝置，其特征在于，所述編碼參數(shù)中還包括第一阻抗頻率參數(shù)，所述判定模塊，還包括: 譜包絡(luò)低頻能量比參數(shù)確定單元，用于在所述調(diào)整所述第一代數(shù)碼書(shū)增益，得到第二代數(shù)碼書(shū)增益之前，根據(jù)所述第一阻抗頻率參數(shù)確定譜包絡(luò)低頻能量比參數(shù)；噪音類型判定單元，用于若所述譜包絡(luò)低頻能量比參數(shù)的平均值大于第二閾值，則確定噪聲類型為低頻分布噪聲；若所述譜包絡(luò)低頻能量比參數(shù)的平均值小于所述第二閾值，則確定噪聲類型為全帶分布噪聲。
27.根據(jù)權(quán)利要求26所述的裝置，其特征在于，所述譜包絡(luò)低頻能量比參數(shù)確定單元，具體用于: 應(yīng)用以下公式確定譜包絡(luò)低頻能量比參數(shù)Rm—lOTt:

28.根據(jù)權(quán)利要求26或27所述的裝置，其特征在于，所述信噪比確定單元，具體用于: 應(yīng)用以下公式定義第一后驗(yàn)信噪比估計(jì)值YraJm):

29.根據(jù)權(quán)利要求22~28任一項(xiàng)所述的裝置，其特征在于，所述調(diào)整因子確定單元，具體用于: 應(yīng)用以下公式確定所述當(dāng)前待處理語(yǔ)音子幀的第一調(diào)整因子Ygc;(m):
30.根據(jù)權(quán)利要求22~29任一項(xiàng)所述的裝置，其特征在于，所述碼書(shū)增益調(diào)整單元，具體用于: 應(yīng)用以下公式確定第二代數(shù)碼書(shū)增益^(?2):gs{m) = Ygc(m)gy{m)x 其中，gy(m)為第一代數(shù)碼書(shū)增益，Yge(Hi)為第一調(diào)整因子，m為當(dāng)前待處理語(yǔ)音子幀的序號(hào)。
31.根據(jù)權(quán)利要求25~30任一項(xiàng)所述的裝置，其特征在于，所述總激勵(lì)能量確定單元，具體用于: 應(yīng)用以下公式確定第一總激勵(lì)能量Etef_(m):
32.根據(jù)權(quán)利要求26~31任一項(xiàng)所述的裝置，其特征在于，所述第一處理模塊，還用于:在所述采用所述第二代數(shù)碼書(shū)增益和所述第二自適應(yīng)碼書(shū)增益的量化索引替換所述比特流中所述第一代數(shù)碼書(shū)增益和所述第一自適應(yīng)碼書(shū)增益對(duì)應(yīng)的比特之前，若確定噪聲類型為低頻分布噪聲，則根據(jù)所述當(dāng)前待處理語(yǔ)音子幀的先驗(yàn)信噪比估計(jì)值和所述平滑處理后的濁音度參數(shù)，確定濾波器參數(shù)；根據(jù)所述第二代數(shù)碼書(shū)增益、所述第二自適應(yīng)碼書(shū)增益、所述第二代數(shù)碼書(shū)矢量以及第二自適應(yīng)碼書(shū)矢量，確定總激勵(lì)信號(hào)；根據(jù)所述濾波器參數(shù)，對(duì)所述總激勵(lì)信號(hào)進(jìn)行梳狀濾波處理。
33.根據(jù)權(quán)利要求26~32任一項(xiàng)所述的裝置，其特征在于，所述裝置還包括: 第一量化模塊，用于在所述采用所述第二代數(shù)碼書(shū)增益和所述第二自適應(yīng)碼書(shū)增益的量化索引替換所述比特流中所述第一代數(shù)碼書(shū)增益和所述第一自適應(yīng)碼書(shū)增益對(duì)應(yīng)的比特之前，若所述判定模塊確定噪聲類型為低頻分布噪聲，則采用語(yǔ)音信號(hào)均方誤差最小的增益量化準(zhǔn)則對(duì)所述第二代數(shù)碼書(shū)增益和所述第二自適應(yīng)碼書(shū)增益進(jìn)行量化；若所述判定模塊確定噪聲類型為全帶分布噪聲，則采用激勵(lì)信號(hào)均方誤差最小的增益量化準(zhǔn)則對(duì)所述第二代數(shù)碼書(shū)增益和所述第二自適應(yīng)碼書(shū)增益進(jìn)行量化。
34.根據(jù)權(quán)利要求33所述的裝置，其特征在于，若所述判定模塊確定噪聲類型為低頻分布噪聲，所述第一量化模塊，具體用于: 應(yīng)用以下公式對(duì)所述第二代數(shù)碼書(shū)增益和所述第二自適應(yīng)碼書(shū)增益進(jìn)行量化，具體為:
35.根據(jù)權(quán)利要求26~34任一項(xiàng)所述的裝置，其特征在于，所述裝置還包括第二調(diào)整模塊，所述第二調(diào)整模塊，包括: 第一確定單元，用于在所述解碼比特流，獲取當(dāng)前待處理語(yǔ)音子幀的編碼參數(shù)之后，若確定當(dāng)前待處理幀為濁音幀，則根據(jù)所述第一阻抗頻率參數(shù)，確定含噪語(yǔ)音的線性預(yù)測(cè)系數(shù)；第二確定單元，用于估計(jì)確定噪聲的線性預(yù)測(cè)系數(shù)、噪聲的自相關(guān)系數(shù)以及純凈語(yǔ)音的自相關(guān)系數(shù)；第三確定單元，用于根據(jù)所述含噪語(yǔ)音的線性預(yù)測(cè)系數(shù)、所述噪聲的線性預(yù)測(cè)系數(shù)、噪聲的自相關(guān)系數(shù)以及純凈語(yǔ)音的自相關(guān)系數(shù)，確定純凈語(yǔ)音的線性預(yù)測(cè)系數(shù)；所述第一處理模塊，還用于:對(duì)所述純凈語(yǔ)音的線性預(yù)測(cè)系數(shù)進(jìn)行變換，得到第二阻抗頻率參數(shù)；對(duì)所述第二阻抗頻率參數(shù)進(jìn)行限定處理；若所述當(dāng)前待處理幀的信噪比大于第三閾值，則在連續(xù)至少三個(gè)語(yǔ)音幀之后，對(duì)限定處理后的第二阻抗頻率參數(shù)進(jìn)行平滑處理，所述平滑處理為根據(jù)所述第一阻抗頻率和當(dāng)前幀之前的至少一幀的調(diào)整后的阻抗頻率參數(shù)計(jì)算加權(quán)平均值，確定第三阻抗頻率參數(shù)；所述第一量化模塊，還用于采用所述第三阻抗頻率參數(shù)的量化索引替換比特流中所述第一阻抗頻率參數(shù)對(duì)應(yīng)的比特。
36.根據(jù)權(quán)利要求35所述的裝置，其特征在于，所述第二確定單元，具體用于: 應(yīng)用以下公式確定噪聲線性預(yù)測(cè)系數(shù):
37.一種語(yǔ)音增強(qiáng)處理裝置，其特征在于，包括: 第二獲取模塊，用于確定不連續(xù)傳輸模式開(kāi)啟，若當(dāng)前待處理子幀為沉默指示幀，則解碼比特流，獲取所述沉默指示幀的加權(quán)平均阻抗頻率參數(shù)矢量和平均對(duì)數(shù)幀能量參數(shù)；第三調(diào)整模塊，用于對(duì)所述平均對(duì)數(shù)幀能量參數(shù)進(jìn)行衰減調(diào)整；第二處理模塊，用于采用調(diào)整后的平均對(duì)數(shù)幀能量參數(shù)的量化索引替換所述比特流中平均對(duì)數(shù)幀能量參數(shù)對(duì)應(yīng)的比特。
38.根據(jù)權(quán)利要求37所述的裝置，其特征在于，所述第三調(diào)整模塊，具體用于: 應(yīng)用以下公式確定平均對(duì)數(shù)幀能量參數(shù)的增益因子Gdtx:
39.一種語(yǔ)音增強(qiáng)處理裝置，其特征在于，包括: 第三獲取模塊，用于若確定出現(xiàn)錯(cuò)誤幀，則解碼比特流，獲取對(duì)所述錯(cuò)誤幀進(jìn)行恢復(fù)得到的當(dāng)前待處理子幀的編碼參數(shù)，所述恢復(fù)得到的當(dāng)前待處理子幀的編碼參數(shù)包括語(yǔ)言活動(dòng)偵測(cè)標(biāo)志、第四阻抗頻率參數(shù)、基音參數(shù)、第三自適應(yīng)碼書(shū)增益；第四調(diào)整模塊，用于調(diào)整所述第四阻抗頻率參數(shù)，得到第五阻抗頻率參數(shù)；第二確定模塊，用于根據(jù)編碼速率生成隨機(jī)脈沖位置的第三代數(shù)碼書(shū)矢量；所述第四調(diào)整模塊，還用于對(duì)所述編碼參數(shù)中的第三代數(shù)碼書(shū)增益進(jìn)行調(diào)整，得到第四代數(shù)碼書(shū)增益；第二量化模塊，用于對(duì)所述語(yǔ)言活動(dòng)偵測(cè)標(biāo)志、第五阻抗頻率參數(shù)、所述基音參數(shù)、所述隨機(jī)脈沖位置的第三代數(shù)碼書(shū)索引進(jìn)行量化，并采用語(yǔ)音信號(hào)均方誤差最小的增益量化準(zhǔn)則對(duì)所述第三自適應(yīng)碼書(shū)增益和所述第四代數(shù)碼書(shū)增益進(jìn)行量化；第三處理模塊，用于采用所述第四代數(shù)碼書(shū)增益和所述第三自適應(yīng)碼書(shū)增益的聯(lián)合量化索引、所述第五阻抗頻率參數(shù)的量化索引以及所述基音參數(shù)替換所述比特流中各編碼參數(shù)對(duì)應(yīng)的比特。
40.根據(jù)權(quán)利要求39所述的裝置，其特征在于，所述第四調(diào)整模塊，具體用于: 獲取前一個(gè)正常子幀的代數(shù)碼書(shū)增益的第二調(diào)整因子paSt_SCale_g。；應(yīng)用以下公式確定第四代數(shù)碼書(shū)增益g?！狹d: gCJlod = gcX0.9delayXpast_scale_gc ； delay為從幀錯(cuò)誤發(fā)生開(kāi)始累計(jì)的錯(cuò)誤的子幀數(shù)目，g。為第三代數(shù)碼書(shū)增益。
【文檔編號(hào)】G10L21/02GK104021796SQ201310066421
【公開(kāi)日】2014年9月3日申請(qǐng)日期:2013年2月28日優(yōu)先權(quán)日:2013年2月28日
【發(fā)明者】鮑長(zhǎng)春, 夏丙寅, 楊閎博申請(qǐng)人:華為技術(shù)有限公司

完整全部詳細(xì)技術(shù)資料下載