生成舒適噪聲的制作方法
【技術(shù)領(lǐng)域】
[0001] 所提出的技術(shù)大體上涉及生成舒適噪聲(CN),并具體地涉及生成舒適噪聲控制參 數(shù)。
【背景技術(shù)】
[0002] 在用于會(huì)話語(yǔ)音的編碼系統(tǒng)中,使用非連續(xù)發(fā)射(DTX)來增加編碼效率是常見 的。這是由在會(huì)話語(yǔ)音(例如,當(dāng)一個(gè)人正在講話時(shí),另一個(gè)人正在聽)中嵌入的大量暫停 來激勵(lì)的。通過使用DTX,語(yǔ)音編碼器可以平均僅在約50%的時(shí)間是活躍的。具有該特征的 編解碼器的示例是3GPP自適應(yīng)多速率窄帶(AMR NB)編解碼器和ITU-T G. 718編解碼器。
[0003] 在DTX操作中,在正常編解碼模式中對(duì)活躍幀進(jìn)行編碼,而使用舒適噪聲對(duì)活躍 區(qū)域之間的不活躍信號(hào)周期進(jìn)行表示。信號(hào)描述參數(shù)被提取并用編碼器進(jìn)行編碼并且在靜 默插入描述符(SID)幀中向解碼器發(fā)送。與用于活躍語(yǔ)音編碼模式的幀速率和比特率相 比,以減小的幀速率和降低的比特率來發(fā)送SID幀。在SID幀之間不發(fā)送關(guān)于信號(hào)特征的 信息。由于較低的SID速率,因此與活躍信號(hào)幀編碼相比,舒適噪聲只能表示相對(duì)穩(wěn)定的性 質(zhì)。在解碼器中,接收到的參數(shù)被解碼并用于表征舒適噪聲。
[0004] 對(duì)于高質(zhì)量DTX操作,S卩,在不降級(jí)語(yǔ)音質(zhì)量的情況下,檢測(cè)輸入信號(hào)中語(yǔ)音的周 期是重要的。這是通過使用語(yǔ)音活躍檢測(cè)器(VAD)或者聲音活躍檢測(cè)器(SAD)來完成的。 圖1示出了通用的VAD的框圖,其分析數(shù)據(jù)幀(5-30ms,這取決于實(shí)現(xiàn))中的輸入信號(hào),并產(chǎn) 生針對(duì)每個(gè)幀的活躍判決。
[0005] 在初始語(yǔ)音檢測(cè)器12中通過將由特征提取器10估計(jì)的當(dāng)前幀的特征與由背景 估計(jì)塊14根據(jù)先前輸入幀估計(jì)的背景特征進(jìn)行比較來做出初始的活躍判決(初始VAD判 決)。大于指定閾值的差值導(dǎo)致活躍的初始判決。在延遲附加塊16中,基于過去的初始判 決對(duì)初始判決進(jìn)行擴(kuò)展,以形成最終的活躍判決(最終VAD判決)。使用延遲的主要原因是 為了減小在語(yǔ)音段中中間和后端削波的風(fēng)險(xiǎn)。
[0006] 對(duì)于基于線性預(yù)測(cè)(LP)的語(yǔ)音編解碼器(例如G. 718),使用與活躍幀的表示類似 的表示對(duì)包絡(luò)和幀能量進(jìn)行建模是合理的。這一點(diǎn)是有利的,其原因在于可以通過在DTX 操作中的不同模式之間的公共功能來降低編解碼器的存儲(chǔ)要求和復(fù)雜度。
[0007] 對(duì)于這種編解碼器,舒適噪聲可以用其LP系數(shù)(也稱為自回歸(AR)系數(shù))以及 LP剩余部分的能量來表示,即作為L(zhǎng)P模型的輸入給出參考音頻段的信號(hào)。在解碼器中,在 激勵(lì)生成器中生成剩余信號(hào)作為隨機(jī)噪聲,通過CN參數(shù)對(duì)隨機(jī)噪聲進(jìn)行成型以形成舒適 噪聲。
[0008] LP系數(shù)通常通過根據(jù)下式計(jì)算加窗音頻段x[n],n = 0, . . .,N-1的自相關(guān)r[k] 而獲得:
【主權(quán)項(xiàng)】
1. 一種生成舒適噪聲"CN"控制參數(shù)的方法,其特征在于, 在具有預(yù)定大小(M)的緩沖器(200)中存儲(chǔ)(SI;la)靜默插入描述符"SID"幀和活躍 延遲幀的CN參數(shù)(q^,gO; 基于所存儲(chǔ)的CN參數(shù)的壽命以及剩余能量來確定(S2,lb,2)與SID幀有關(guān)的CN參數(shù) 子集(Qs,Es); 使用(S3,3,4)所確定的CN參數(shù)子集(QS,ES)來確定跟隨在活躍信號(hào)幀之后的第一SID幀"第一SID"的CN控制參數(shù)(qi,ED。
2. 根據(jù)權(quán)利要求1所述的方法,其特征在于, 針對(duì)SID幀和活躍延遲幀,用新的CN參數(shù)(存,/))來更新(la)所述緩沖器(200); 針對(duì)活躍非延遲幀,基于連續(xù)的活躍非延遲幀的數(shù)量PA來更新(lb)所存儲(chǔ)的CN參數(shù) 的壽命受限子集(QK,EK)的大小K; 基于剩余能量從所述壽命受限子集(QK,EK)中選擇(2)所述CN參數(shù)子集(QS,ES); 根據(jù)所述CN參數(shù)子集(Qs,Es)來確定(3)代表CN參數(shù)(呑,/?); 用經(jīng)解碼的CN參數(shù)(^jSiD,罵;來對(duì)所述代表CN參數(shù)(q, /7)進(jìn)行內(nèi)插。
3. 根據(jù)權(quán)利要求2所述的方法,其特征在于,針對(duì)活躍非延遲幀,根據(jù)下式來更新(lb) 所述壽命受限子集(QK,EK)的大小K: K=K0-n對(duì)于n?y彡pa<(n+1) ?y 其中 KQ是所述緩沖器(200)中存儲(chǔ)的SID幀和活躍延遲幀的CN參數(shù)的數(shù)量, y是預(yù)定常數(shù), n是非負(fù)整數(shù)。
4. 根據(jù)權(quán)利要求2或3所述的方法,其特征在于,通過僅包括滿足下式的CN參數(shù),從所 述壽命受限子集(QK,EK)中選擇(2)所述CN參數(shù)子集(QS,ES): 馬t 〈瓦£ + 匕對(duì)于k=kQ,…,kK_i 其中 <:是最新存儲(chǔ)的剩余能量, YdPy2分別是被認(rèn)為表示從活躍幀向不活躍幀過渡時(shí)的噪聲的剩余能量的預(yù)定的 下限和上限, 心,...,kK_i被分類使得k^與最新存儲(chǔ)的CN參數(shù)相對(duì)應(yīng)并且kK_i與最早存儲(chǔ)的CN參 數(shù)相對(duì)應(yīng)。
5. 根據(jù)權(quán)利要求2、3或4所述的方法,其特征在于,根據(jù)所述CN參數(shù)子集(Qs,Es)來 確定⑶代表CN參數(shù)問,亙,其中, q是所述CN參數(shù)子集(QS,ES)中的矢量集合Qs的中值矢量,所述中值矢量表示自回歸 "AR"系數(shù),以及 f是所選擇的CN參數(shù)子集(QS,ES)中的剩余能量集合^的加權(quán)平均剩余能量。
6. 根據(jù)權(quán)利要求5所述的方法,其特征在于,所述中值矢量奮將所述AR系數(shù)表示為線 譜對(duì)。
7. -種用于生成舒適噪聲"CN"控制參數(shù)的計(jì)算機(jī)程序,包括當(dāng)在計(jì)算機(jī)(60)上運(yùn)行 時(shí)使所述計(jì)算機(jī)執(zhí)行以下操作的計(jì)算機(jī)可讀代碼單元: 在具有預(yù)定大?。∕)的緩沖器(200)中存儲(chǔ)(66 ;S1 ;la)靜默插入描述符"SID"幀和 活躍延遲幀的cn參數(shù)((^,五丨勹; 基于所存儲(chǔ)的CN參數(shù)的壽命以及剩余能量來確定(68 ;S2 ;lb,2)與SID幀有關(guān)的CN參數(shù)子集(Qs,Es); 使用(68 ;S3 ;3,4)所確定的CN參數(shù)子集(Qs,Es)來確定跟隨在活躍信號(hào)幀之后的第 一SID幀"第一SID"的CN控制參數(shù)(qi,ED。
8. -種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)可讀介質(zhì)和存儲(chǔ)在所述計(jì)算機(jī)可讀介質(zhì)上的根據(jù) 權(quán)利要求7所述的計(jì)算機(jī)程序。
9. 一種用于生成舒適噪聲"CN"控制參數(shù)的舒適噪聲控制器(50),其特征在于, 具有預(yù)定大?。∕)的緩沖器(200),被配置為:存儲(chǔ)SID幀和活躍延遲幀的CN參數(shù) W); 子集選擇器(50A;54,300),被配置為:基于所存儲(chǔ)的CN參數(shù)的壽命以及剩余能量來確 定與靜默插入描述符"SID"幀有關(guān)的CN參數(shù)子集(QS,ES); 舒適噪聲控制參數(shù)提取器(50B;400,500)被配置為:使用所確定的CN參數(shù)子集(Qs,Es)來確定跟隨在活躍信號(hào)幀之后的第一SID幀"第一SID"的CN控制參數(shù)(qi,EJ。
10. 根據(jù)權(quán)利要求9所述的控制器(50),其特征在于, SID和延遲幀緩沖器更新器(52),被配置為:針對(duì)SID幀和活躍延遲幀,用新的CN參數(shù) (倉(cāng),左)來更新所述緩沖器(200); 非延遲幀緩沖器更新器(54),被配置為:針對(duì)活躍非延遲幀,基于連續(xù)的活躍非延遲 幀的數(shù)量?&來更新所存儲(chǔ)的CN參數(shù)的壽命受限子集(QK,EK)的大小K; 緩沖器元素選擇器(300),被配置為:基于剩余能量從所述壽命受限子集(QK,EK)中選 擇所述CN參數(shù)子集(QS,ES); 舒適噪聲參數(shù)估計(jì)器(400),被配置為:根據(jù)所述CN參數(shù)子集(QS,ES)來確定(3)代表CN參數(shù)(奪,互); 舒適噪聲參數(shù)內(nèi)插器(500),被配置為:用經(jīng)解碼的CN參數(shù)(^STO,i^/D)來對(duì)所述代 表CN參數(shù)C奪,進(jìn)行內(nèi)插。
11. 根據(jù)權(quán)利要求10所述的控制器(50),其特征在于,所述緩沖器元素選擇器(300) 被配置為:針對(duì)活躍非延遲幀,根據(jù)下式更新所述壽命受限子集(QK,EK)的大小K: K=K0-n對(duì)于n?y彡pa<(n+1) ?y其中 KQ是所述緩沖器(200)中存儲(chǔ)的SID幀和活躍延遲幀的CN參數(shù)的數(shù)量, y是預(yù)定常數(shù),n是非負(fù)整數(shù)。
12. 根據(jù)權(quán)利要求10或11所述的控制器(50),其特征在于,所述緩沖器元素選擇器 (300)被配置為:通過僅包括滿足下式的CN參數(shù),從所述壽命受限子集(QK,EK)中選擇所述 CN參數(shù)子集(QS,ES): 土'上-7i< 紀(jì) < 五X+ /2 對(duì)于k=k〇,? ??,kH其中 是最新存儲(chǔ)的剩余能量, YdPy2分別是被認(rèn)為表示從活躍幀向不活躍幀過渡時(shí)的噪聲的剩余能量的預(yù)定的 下限和上限, 心,...,kK_i被分類使得k^與最新存儲(chǔ)的CN參數(shù)相對(duì)應(yīng)并且kK_i與最早存儲(chǔ)的CN參 數(shù)相對(duì)應(yīng)。
13. 根據(jù)權(quán)利要求10、11或12所述的控制器(50),其特征在于,所述舒適噪聲參數(shù)估 計(jì)器(400)被配置為:根據(jù)所述CN參數(shù)子集(QS,ES)來確定代表CN參數(shù)0,!,其中, q是所述CN參數(shù)子集(QS,ES)中的矢量集合Qs的中值矢量,所述中值矢量表示自回歸 "AR"系數(shù),以及 f是所選擇的CN參數(shù)子集(QS,ES)中的剩余能量集合^的加權(quán)平均剩余能量。
14. 一種解碼器(100),包括根據(jù)前述權(quán)利要求9-13中任一項(xiàng)所述的舒適噪聲控制器 (50) 〇
15. -種網(wǎng)絡(luò)節(jié)點(diǎn)(80),包括根據(jù)權(quán)利要求14所述的解碼器(100)。
16. -種網(wǎng)絡(luò)節(jié)點(diǎn)(80),包括根據(jù)前述權(quán)利要求9-13中任一項(xiàng)所述的舒適噪聲控制器 (50) 〇
17. 根據(jù)前述權(quán)利要求14-16中任一項(xiàng)所述的網(wǎng)絡(luò)節(jié)點(diǎn)(80),其中網(wǎng)絡(luò)節(jié)點(diǎn)是移動(dòng)終 端。
【專利摘要】描述了用于生成CN(舒適噪聲)控制參數(shù)的舒適噪聲控制器(50)。具有預(yù)定大小的緩沖器(200)被配置為:存儲(chǔ)SID(靜默插入描述符)幀和活躍延遲幀的CN參數(shù)。子集選擇器(50A)被配置為:基于存儲(chǔ)的CN參數(shù)的壽命以及剩余能量來確定與SID幀有關(guān)的CN參數(shù)子集。舒適噪聲控制參數(shù)提取器(50B)被配置為:使用所確定的CN參數(shù)子集來確定跟隨在活躍信號(hào)幀之后的第一SID幀的CN控制參數(shù)。
【IPC分類】G10L19-012, G10L19-07, G10L25-78
【公開號(hào)】CN104584120
【申請(qǐng)?zhí)枴緾N201380043927
【發(fā)明人】托馬斯·詹森·托夫特戈德
【申請(qǐng)人】瑞典愛立信有限公司
【公開日】2015年4月29日
【申請(qǐng)日】2013年5月7日
【公告號(hào)】CA2884471A1, EP2823479A1, EP2823479B1, EP2927905A1, US20150235648, WO2014040763A1