可擴(kuò)展解碼裝置及丟失數(shù)據(jù)插值方法

文檔序號(hào)：2830095閱讀：403來源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專利名稱：可擴(kuò)展解碼裝置及丟失數(shù)據(jù)插值方法
技術(shù)領(lǐng)域：
本發(fā)明涉及可擴(kuò)展解碼裝置及丟失數(shù)據(jù)插值方法。
技術(shù)背景可擴(kuò)展語音編碼具有如下特征由于分層地對(duì)語音信號(hào)進(jìn)行編碼，所以即使丟失了某些分層(層layer)的編碼數(shù)據(jù)(編碼信息)，也能夠基于其它的分層的編碼數(shù)據(jù)解碼出語音信號(hào)。在可擴(kuò)展語音編碼中，將分層地對(duì)窄帶語音信號(hào)和寬帶語音信號(hào)進(jìn)行編碼的技術(shù)稱為"頻帶可擴(kuò)展語音編碼"。一般而言，在頻帶可擴(kuò)展語音編碼中，在最基本的分層對(duì)窄帶信號(hào)進(jìn)行處理，而且隨著分層的增加，將下位分層的信號(hào)以上的寬帶信號(hào)作為對(duì)象。因此，在本說明書中，將最基本(核心)的編碼/解碼處理層稱為"核心層(core layer)",而將進(jìn)行比核心層更高質(zhì)量化和寬帶化的編碼/解碼處理層稱為"擴(kuò) 展層(enhancement layer)"。另外，因?yàn)榫哂屑词箒G失了一部分的層的編碼數(shù)據(jù)也能夠進(jìn)行解碼的特征，在可擴(kuò)展編碼中使用的語音編解碼器(codec)適合于使用像IP網(wǎng)那樣的分組通信^各徑，作為數(shù)據(jù)交換語音信號(hào)的VoIP(Voice over IP)用的編碼。但是，在盡力(besteffort)型的分組通信中，傳輸頻帶一般不被保證，有因一部分的分組丟失或延遲等的原因而欠缺一部分的編碼數(shù)據(jù)的可能性。例如，如果通信路徑的業(yè)務(wù)量緣于擁塞等飽和，編碼數(shù)據(jù)因分組的丟棄而在傳輸路徑的中途失去。由于這樣的編碼數(shù)據(jù)的欠缺，在解碼裝置中發(fā)生各種各樣的狀況，諸如，完全不能進(jìn)行解碼、只接收核心層的編碼信息、以及接收直到擴(kuò)展層的所有信息。而且，由于這樣的狀況隨時(shí)間的經(jīng)過而連續(xù)不斷地發(fā)生，所以例如也會(huì)發(fā)生需要對(duì)只接收核心層的編碼信息的幀和接收包括直到擴(kuò)展層的編碼信息的幀，在時(shí)間上切換且交替地進(jìn)行解碼的狀況。在這樣的情況下，層的切換的發(fā)生會(huì)使聲音大小和頻帶擴(kuò)展感(bandspread)變得不連續(xù)，從而導(dǎo)致解碼信號(hào)的音質(zhì)惡化。例如，在非專利文獻(xiàn)1中公開了在使用單層的CELP(Code Excited Linear Prediction)的語音編解碼器中的幀丟失補(bǔ)償處理中，在幀丟失時(shí)，基于過去的信息對(duì)信號(hào)的合成所需的各個(gè)參數(shù)進(jìn)行插值的技術(shù)。在該丟失數(shù)據(jù)插值技術(shù) 中，尤其對(duì)于增益，以基于過去的被正常接收的幀的增益為基礎(chǔ)，通過對(duì)該增益使用單調(diào)減少的函數(shù)來表示對(duì)插值數(shù)據(jù)使用的增益。另外，對(duì)于從幀丟失時(shí)到編碼數(shù)據(jù)接收時(shí)為止的增益控制，作為音調(diào)增益使用解碼后的音調(diào)增益，而且關(guān)于代碼增益，對(duì)在丟失期間中的插值后的插值代碼增益和解碼后的當(dāng)前的代碼增益進(jìn)行比較，使用更小的值的代碼增益。非專利文獻(xiàn)1: "AMR Speech Codec; Error Concealment of lost frames" T S 2 6 . 0 9 1發(fā)明內(nèi)容發(fā)明要解決的問題在非專利文獻(xiàn)1中所公開的技術(shù)為關(guān)于在一般的CELP中的丟失數(shù)據(jù)的插值的技術(shù)，其在數(shù)據(jù)丟失期間，基本上僅基于過去的信息而減少插值增益。隨著插值期間的延長(zhǎng)，解碼插值語音與原來的解碼語音相差越多，所以這是為了防止異音(noise)的發(fā)生所需的動(dòng)作。但是，如果研究非專利文獻(xiàn)l的技術(shù)對(duì)可擴(kuò)展語音編解碼器的擴(kuò)展層的丟失數(shù)據(jù)插值處理的適用，則在擴(kuò)展層的數(shù)據(jù)丟失的期間中，根據(jù)核心層的解碼語音功率變動(dòng)和擴(kuò)展層的增益衰減量的狀況，插值數(shù)據(jù)有可能對(duì)正常解碼的核心層的解碼語音的質(zhì)量造成壞影響，而且給收聽者帶來異音感和變動(dòng) 感。也就是說，在擴(kuò)展層丟失時(shí)核心層的解碼語音功率急劇減少，而且擴(kuò)展層的插值增益的衰減緩慢的情況下，有時(shí)通過進(jìn)行插值反而導(dǎo)致擴(kuò)展層的解碼信號(hào)的質(zhì)量的惡化。此時(shí)，如果惡化了的擴(kuò)展層的解碼語音明顯，其結(jié)果是給收聽者帶來異音感。另外，如果在核心層的解碼語音功率的變動(dòng)不大的情況下增大擴(kuò)展層的插值增益的衰減量，則擴(kuò)展層的解碼語音會(huì)急劇地衰減，其結(jié)果是給收聽者帶來變動(dòng)感。因此，本發(fā)明的目的為提供可擴(kuò)展解碼裝置和丟失數(shù)據(jù)插值方法，在頻帶可擴(kuò)展編碼的丟失數(shù)據(jù)插值處理中，防止解碼信號(hào)的質(zhì)量惡化，而且不會(huì) 給收聽者帶來異音感和變動(dòng)感。解決問題的方案本發(fā)明的可擴(kuò)展解碼裝置釆用的結(jié)構(gòu)包括窄帶解碼單元，對(duì)窄帶信號(hào)
的編碼數(shù)據(jù)進(jìn)行解碼；寬帶解碼單元，對(duì)寬帶信號(hào)的編碼數(shù)據(jù)進(jìn)行解碼，并且在該編碼數(shù)據(jù)不存在時(shí)，生成代替的插值數(shù)據(jù)；計(jì)算單元，基于所述窄帶信號(hào)的編碼數(shù)據(jù)，計(jì)算所述窄帶信號(hào)的頻譜在頻域的衰減程度；以及控制單元，基于所述衰減程度對(duì)所述插值數(shù)據(jù)的增益進(jìn)行控制。發(fā)明效果根據(jù)本發(fā)明，在頻帶可擴(kuò)展編碼的丟失數(shù)據(jù)插值處理中，能夠防止解碼信號(hào)的質(zhì)量惡化，并能夠防止給收聽者帶來異音感和變動(dòng)感。

圖1是表示實(shí)施方式1的可擴(kuò)展解碼裝置的主要結(jié)構(gòu)的方框圖；圖2是用于說明窄帶譜的斜率的計(jì)算處理的圖；圖3是用于說明窄帶譜的斜率的計(jì)算處理的圖；圖4是表示實(shí)施方式1的窄帶譜斜率計(jì)算單元內(nèi)部的主要結(jié)構(gòu)的方框圖；圖5是表示實(shí)施方式1的擴(kuò)展層解碼單元內(nèi)部的主要結(jié)構(gòu)的方框圖；圖6是表示實(shí)施方式1的擴(kuò)展層增益解碼單元內(nèi)部的主要結(jié)構(gòu)的方框圖；圖7是用于說明頻譜功率的偏差的示意圖；圖8是表示解碼出的擴(kuò)展層的音源信號(hào)的功率的變化(transition)的圖；以及圖9是表示解碼出的擴(kuò)展層的音源信號(hào)的功率的變化的圖。
具體實(shí)施方式
以下，參照附圖詳細(xì)說明本發(fā)明的實(shí)施方式。另外，雖然在本說明書中以由兩個(gè)層構(gòu)成的分層結(jié)構(gòu)為例進(jìn)行說明，但是本發(fā)明并不限于兩個(gè)層。 (實(shí)施方式1)圖1是表示本發(fā)明的實(shí)施方式1的可擴(kuò)展解碼裝置的主要結(jié)構(gòu)的方框圖。這里，以在擴(kuò)展層對(duì)比核心層更寬的頻帶的信號(hào)進(jìn)行基于CELP(CodeExcited Linear Prediction)方式的語音編碼的情況為例進(jìn)行說明。本實(shí)施方式的可擴(kuò)展解碼裝置包括核心層解碼單元101、上采樣/相位調(diào)整單元102、窄帶譜斜率計(jì)算單元103、擴(kuò)展層丟失檢測(cè)單元104、擴(kuò)展層解碼單元105以及解碼信號(hào)加法單元106,而且對(duì)從編碼器(未圖示)發(fā)送的核心層編碼數(shù)據(jù)和擴(kuò)展層編碼數(shù)據(jù)進(jìn)行解碼。本實(shí)施方式的可擴(kuò)展解碼裝置的各個(gè)部分進(jìn)行以下的動(dòng)作。核心層解碼單元101對(duì)接收到的核心層編碼數(shù)據(jù)進(jìn)行解碼，并將得到的窄帶信號(hào)即核心層解碼信號(hào)輸出到核心層解碼信號(hào)分析單元(未圖示)和上采樣/相位調(diào)整單元102。另外，核心層解碼單元101將在上述核心層編碼數(shù) 據(jù)中包含的窄帶頻譜信息(關(guān)于窄帶譜的包絡(luò)和能源分布等的信息)輸出到窄帶譜斜率計(jì)算單元103。上采樣/相位調(diào)整單元102進(jìn)行調(diào)整(校正)核心層解碼信號(hào)和擴(kuò)展層解碼信號(hào)之間的采樣速率、延遲和相位的偏離的處理。這里，使核心層解碼信號(hào)與擴(kuò)展層解碼信號(hào)匹配而進(jìn)行變換。但是，如果核心層解碼信號(hào)和擴(kuò)展層解碼信號(hào)之間的采樣速率和相位等相同的話，則不需要校正偏離，根據(jù)必要使核心層解碼信號(hào)成常數(shù)倍并將其輸出。輸出信號(hào)被輸出到解碼信號(hào)加法單元106。窄帶譜斜率計(jì)算單元103基于從核心層解碼單元101輸出的窄帶頻語信息，計(jì)算窄帶譜在頻域的衰減直線的斜率，并將該計(jì)算結(jié)果輸出到擴(kuò)展層解碼單元105。計(jì)算出的窄帶語的衰減直線的斜率，在對(duì)擴(kuò)展層的丟失數(shù)據(jù)的插值數(shù)據(jù)的增益(擴(kuò)展層插值增益)進(jìn)行控制時(shí)使用。測(cè)擴(kuò)展層編碼數(shù)據(jù)是否丟失，即是否能夠?qū)U(kuò)展層編碼數(shù)據(jù)進(jìn)行解碼。所得到的擴(kuò)展層的幀差錯(cuò)檢測(cè)結(jié)果(擴(kuò)展層丟失信息)被輸出到擴(kuò)展層解碼單元105。另外，作為數(shù)據(jù)丟失的檢測(cè)方法，也可以對(duì)附加到編碼數(shù)據(jù)的CRC等的檢錯(cuò)碼進(jìn)行檢查，對(duì)到開始解碼的時(shí)間為止編碼數(shù)據(jù)是否未到達(dá)進(jìn)行判斷，或者^r測(cè)分組丟失和分組未到達(dá)。另外，在擴(kuò)展層解碼單元105所接收的編碼數(shù)據(jù)的解碼過程中，在基于包含在擴(kuò)展層編碼數(shù)據(jù)內(nèi)的檢錯(cuò)碼等檢測(cè)出重大的差錯(cuò)的情況下，也可以由擴(kuò)展層解碼單元105將該差錯(cuò)信息輸入到擴(kuò)展層丟失檢測(cè)單元104。擴(kuò)展層解碼單元105 —般對(duì)接收到的擴(kuò)展層編碼數(shù)據(jù)進(jìn)行解碼，并將得到的擴(kuò)展層解碼信號(hào)輸出到解碼信號(hào)加法單元106。另外，在由擴(kuò)展層丟失檢測(cè)單元104通知擴(kuò)展層丟失信息(幀差錯(cuò))的情況下，也就是在擴(kuò)展層的數(shù)據(jù) 丟失時(shí)，擴(kuò)展層解碼單元105對(duì)解碼所需的參數(shù)進(jìn)行插值，利用插值后的參數(shù)合成插值解碼信號(hào)，并將其作為擴(kuò)展層解碼信號(hào)輸出到解碼信號(hào)加法單元106。這里，插值數(shù)據(jù)的增益基于窄帶譜斜率計(jì)算單元103的計(jì)算結(jié)果被控制。
解碼信號(hào)加法單元106將從上采樣/相位調(diào)整單元102輸出的核心層解碼信號(hào)和從擴(kuò)展層解碼單元105輸出的擴(kuò)展層解碼信號(hào)相加，并將得到的解碼信號(hào)輸出。圖2和圖3是用于說明在窄帶譜斜率計(jì)算單元103進(jìn)行的窄帶譜的斜率的計(jì)算處理的圖。窄帶譜斜率計(jì)算單元103使用線性預(yù)測(cè)系數(shù)之一的 LSP(Line Spectrum Pair)系數(shù)，如下所示，近似性地計(jì)算窄帶譜的衰減直線的斜率。圖2和圖3的上部的頻i普表示窄帶譜和寬帶譜的例子。在這些圖中，以橫軸表示頻率，縱軸表示功率，而且作為核心層處理4kHz以下的窄帶信號(hào)，作為擴(kuò)展層處理8kHz以下的寬帶信號(hào)的情況為例。在這些圖中，以虛線表示的曲線Sl和S4為寬帶信號(hào)的頻率包絡(luò)，而以實(shí)線表示的曲線S2和S5為窄帶信號(hào)的頻率包絡(luò)。一般而言，奈奎斯特頻率(Nyquistfrequency)附近的窄帶信號(hào)會(huì)與寬帶信號(hào)乖離，但是奈奎斯特頻率以下的頻帶的頻率功率分布會(huì)近似。另外，以實(shí)線表示的直線S3和S6為窄帶譜在頻域的衰減直線。該衰減直線為表示了窄帶譜的衰減程度的特性曲線，例如通過求各個(gè)采樣點(diǎn)的回歸線而能夠得到。圖2的上部的頻譜表示窄帶譜的衰減直線的斜率(以下簡(jiǎn)稱為"窄帶譜的斜率")較緩的情況的例子，而圖3的上部的頻譜表示窄帶譜的斜率較陡的情況的例子。另外，圖2和圖3的下部的信號(hào)表示在圖2和圖3的上部所示的窄帶譜的LSP系數(shù)(將分析次數(shù)M設(shè)為10次的情況)。一般而言，LSP系數(shù)的各個(gè)次數(shù)成分，在像共振峰(formant)那樣頻語功率集中的地方，有相鄰的次數(shù)成分相互接近地被配置(LSP系數(shù)的各個(gè)次數(shù)成分密集)的趨向，而在能量不集中的共振峰之間的谷的部分，有相鄰的次數(shù)成分互相分開地被配置的傾向。這里，LSP系數(shù)的相鄰的次數(shù)意味著例如對(duì)次數(shù)i的次數(shù)i+l那樣互相連續(xù)的次數(shù)。而且，實(shí)際上，在圖2和圖3的例子中，也呈現(xiàn)在頻率fD、 fl、 f2、 G、 f4和f5的附近LSP系數(shù)的各個(gè)次數(shù)成分密集，尤其在功率最集中的第一共振峰附近，LSP系數(shù)的各個(gè)次數(shù)成分之間的距離最小的趨向。而且，在圖2的例子中，寬帶信號(hào)直到高頻帶都存在，在中頻帶也呈現(xiàn)共振峰。在這樣的情況下，fl和f2附近的LSP系數(shù)的各個(gè)次數(shù)成分之間的距離也相近。另一方面，在圖3的例子中，不但在寬帶信號(hào)中高頻帶信號(hào)的強(qiáng)度較弱，也在中頻帶未呈現(xiàn)明顯的共振峰。在這樣的情況下，與fl和f2相比，f4和f5附近的LSP 系數(shù)的各個(gè)次數(shù)成分之間的距離大。因此，反過來說，在LSP系數(shù)的各個(gè)次數(shù)成分之間的距離較小時(shí)，在該地方存在更高的能量的可能性較高。于是，窄帶譜斜率計(jì)算單元103基于LSP系數(shù)的上述特征，將LSP系數(shù) 的相鄰的次數(shù)成分之間的距離的平方的倒數(shù)之和作為判斷功率的大小時(shí)的指標(biāo)。然后，求整個(gè)窄帶(窄帶LSP系數(shù)的所有次數(shù)成分)的虛擬功率(dummy power)和窄帶的高頻帶部分(以后稱為"中頻帶，，)的虛擬功率，并將中頻帶的虛擬功率與整個(gè)窄帶的虛擬功率的比視為表示窄帶譜的衰減程度的參數(shù)。具體而言，可以認(rèn)為計(jì)算出的比相當(dāng)于窄帶譜的斜率，在該斜率較大時(shí)，可以說窄帶譜在急劇地衰減。圖4是表示實(shí)現(xiàn)上述處理的窄帶譜斜率計(jì)算單元103內(nèi)部的主要結(jié)構(gòu)的方框圖。窄帶語斜率計(jì)算單元103包括全窄帶功率計(jì)算單元121、中頻帶功率計(jì) 算單元122以及除法單元123，而且被輸入表示核心層譜包絡(luò)信息的M次的 LSP系數(shù)，使用該LSP系數(shù)計(jì)算窄帶譜的斜率并將其輸出。全窄帶功率計(jì)算單元121基于以下的式(l),從所輸入的窄帶LSP系數(shù) Nlsp[t]計(jì)算全窄帶的虛擬功率NLSPpowALL[t]，并輸出到除法單元123。3(腳["l]-腳[i])2 ... ( 1 )其中，t表示幀號(hào)，M表示窄帶LSP系數(shù)的分析次數(shù)，i表示LSP系數(shù)的次數(shù)(l^i^M)。中頻帶功率計(jì)算單元122將窄帶LSP系數(shù)作為輸入，計(jì)算中頻帶的虛擬功率，并輸出到除法單元123。這里，為了計(jì)算中頻帶的虛擬功率，只使用窄帶LSP系數(shù)的高頻帶部分的系數(shù)而計(jì)算虛擬功率?；谝韵碌氖?2)計(jì)算中頻帶功率NLSPpowMID[t]。(腳[/ + 1]_愚柳2( 2 )除法單元123基于以下的式(3)將中頻帶功率除以全窄帶功率，從而計(jì)算窄帶譜的斜率Ntilt[t]。
層=腳戸M卿]
計(jì)算出的窄帶譜的斜率被輸出到后述的擴(kuò)展層增益解碼單元112。如上所述，通過使用窄帶LSP系數(shù)的特征，能夠計(jì)算窄帶譜的斜率。另外，由于LSP系數(shù)的位置會(huì)根據(jù)窄帶譜的分布而發(fā)生變化，而且中頻帶的頻帶也隨此發(fā)生變化，所以有時(shí)窄帶譜的斜率的精確度會(huì)降低。但是，該精確度的降低幾乎不影響擴(kuò)展層的插值增益的衰減速度的聽覺上的質(zhì)量。
圖5是表示擴(kuò)展層解碼單元105內(nèi)部的主要結(jié)構(gòu)的方框圖。編碼數(shù)據(jù)分離單元111將從編碼器(未圖示)發(fā)送的擴(kuò)展層編碼數(shù)據(jù)作為輸入，并按各個(gè)碼本分離編碼數(shù)據(jù)。分離后的編碼數(shù)據(jù)被輸出到擴(kuò)展層增益解碼單元112、擴(kuò) 展層自適應(yīng)碼本解碼單元113、擴(kuò)展層噪聲碼本解碼單元114以及擴(kuò)展層LPC 解碼單元115。
擴(kuò)展層增益解碼單元112解碼出提供給音調(diào)增益放大單元116和代碼增益放大單元117的增益量(gainamount)。具體而言，擴(kuò)展層增益解碼單元112 基于擴(kuò)展層丟失信息和窄帶譜斜率信息，控制通過對(duì)編碼數(shù)據(jù)進(jìn)行解碼而得到的增益。得到的增益量被分別輸出到音調(diào)增益放大單元116和代碼增益放大單元117。另外，在未能接收編碼數(shù)據(jù)的情況下，使用過去的解碼信息和核心層解碼信號(hào)分析信息而進(jìn)行丟失數(shù)據(jù)的插值。
在擴(kuò)展層自適應(yīng)碼本解碼單元113,在擴(kuò)展層自適應(yīng)碼本中存儲(chǔ)著過去的擴(kuò)展層音源信號(hào)，基于從編碼器發(fā)送的編碼數(shù)據(jù)確定延遲(lag),并且截取相當(dāng)于該延遲的音調(diào)周期分量的信號(hào)。輸出信號(hào)被輸出到音調(diào)增益放大單元 116。另外，在未能接收編碼數(shù)據(jù)的情況下，使用過去的延遲和核心層的信息而進(jìn)行丟失數(shù)據(jù)的插值。
擴(kuò)展層噪聲碼本解碼單元114生成用于表現(xiàn)通過上述的擴(kuò)展層自適應(yīng)碼本不能完全表現(xiàn)的、即不屬于周期分量的噪聲性的信號(hào)分量的信號(hào)。在近年的編解碼器中，以代數(shù)方式表現(xiàn)該信號(hào)的情況較多。輸出信號(hào)一皮輸出到代碼增益放大單元117。另外，在未能接收編碼數(shù)據(jù)的情況下，使用擴(kuò)展層的過去的解碼信息、核心層的解碼信息、或者隨機(jī)數(shù)的值等而進(jìn)行丟失數(shù)據(jù)的插值。
擴(kuò)展層LPC解碼單元115對(duì)從編碼器發(fā)送的編碼數(shù)據(jù)進(jìn)行解碼，并將得到的線性預(yù)測(cè)系數(shù)輸出到擴(kuò)展層合成濾波器119，作為用于合成濾波器的濾
波系數(shù)。另外，在未能接收編碼數(shù)據(jù)的情況下，使用過去接收的編碼數(shù)據(jù)進(jìn) 行丟失數(shù)據(jù)的插值，或者進(jìn)一步使用核心層的LPC信息而進(jìn)行丟失數(shù)據(jù)的解碼。此時(shí)，在核心層和擴(kuò)展層的線性預(yù)測(cè)的分析次數(shù)不同的情況下，先對(duì)核
心層的LPC進(jìn)行次數(shù)擴(kuò)張之后再用于插值。
音調(diào)增益放大單元116將擴(kuò)展層自適應(yīng)碼本解碼單元113的輸出信號(hào)，乘以從擴(kuò)展層增益解碼單元112輸出的音調(diào)增益而進(jìn)行放大，并輸出到音源加法單元118。
代碼增益放大單元117將擴(kuò)展層噪聲碼本解碼單元114的輸出信號(hào)，乘以從擴(kuò)展層增益解碼單元112輸出的代碼增益而進(jìn)行放大，并輸出到音源加法單元118。
音源加法單元118通過將從音調(diào)增益》t大單元116和代碼增益放大單元 117輸出的信號(hào)相加而生成擴(kuò)展層音源信號(hào)，并將其輸出到擴(kuò)展層合成濾波器119。
擴(kuò)展層合成濾波器119由從擴(kuò)展層LPC解碼單元115輸出的LPC系數(shù) 形成合成濾波器，并將從音源加法單元118輸出的擴(kuò)展層音源信號(hào)作為輸入而驅(qū)動(dòng)，從而得到擴(kuò)展層解碼信號(hào)。該擴(kuò)展層解碼信號(hào)被輸出到解碼信號(hào)加法單元106。另外，也可以對(duì)該擴(kuò)展層解碼信號(hào)進(jìn)一步進(jìn)行后置濾波 (post-filtering)處理。
圖6是表示擴(kuò)展層增益解碼單元112內(nèi)部的主要結(jié)構(gòu)的方框圖。擴(kuò)展層增益解碼單元112包括擴(kuò)展層增益碼本解碼單元131、增益選擇單元132、增益衰減單元134、過去增益存儲(chǔ)單元135以及增益衰減率計(jì)算單元133,而且在擴(kuò)展層的數(shù)據(jù)丟失時(shí)，基于過去的擴(kuò)展層的增益值和窄帶譜的斜率的信息，對(duì)擴(kuò)展層的插值增益進(jìn)行控制。具體而言，它被輸入編碼數(shù)據(jù)、擴(kuò)展層丟失信息以及窄帶譜的斜率，而且輸出音調(diào)增益Gep[t]和代碼增益Gec[t]的兩種增益。
擴(kuò)展層增益碼本解碼單元131接收編碼數(shù)據(jù)之后將其解碼，并將得到的解碼增益DGep[t]和DGec[t]輸出到增益選擇單元132。
增益選擇單元132被輸入擴(kuò)展層丟失信息、解碼增益(DGep[t]和DGec[t]) 以及從過去增益存儲(chǔ)單元135輸出的過去增益。增益選擇單元132基于擴(kuò)展層丟失信息選擇是使用解碼增益還是使用過去增益，并將所選擇的增益輸出到增益衰減單元134。具體而言，在接收到編碼數(shù)據(jù)時(shí)輸出解碼增益，而在
數(shù)據(jù)丟失時(shí)輸出過去增益。
增益衰減率計(jì)算單元133基于擴(kuò)展層丟失信息和窄帶譜的斜率信息計(jì)算
增益衰減率，并輸出到增益衰減單元134。
增益衰減單元134通過將來自增益選擇單元132的輸出乘以在增益衰減率計(jì)算單元133計(jì)算的增益衰減率而求衰減后的增益，并將其輸出。
過去增益存儲(chǔ)單元135存儲(chǔ)由增益衰減單元134衰減后的增益作為過去增益。所存儲(chǔ)的過去增益被輸出到增益選擇單元132。
接著，使用算式具體說明本實(shí)施方式的增益控制方法。
在窄帶譜的斜率較緩時(shí)，增益衰減率計(jì)算單元133將增益衰減率設(shè)定為較弱，以使增益緩慢地衰減。而且，在窄帶譜的斜率較大時(shí)，增益衰減率計(jì) 算單元133將增益衰減率設(shè)定為較強(qiáng)，以使增益大幅衰減。增益衰減率可基于以下的式(4)計(jì)算。
<formula>formula see original document page 11</formula> ( 4 )
這里，Gatt[t]是增益衰減率，卩是用于校正斜率的系數(shù)，而且是大于O.O 的正數(shù)，a是用于控制衰減率的幅度的系數(shù)，而且取O.(KoKl.O的值。也可以變更音調(diào)增益和代碼增益的各個(gè)系數(shù)。
增益衰減單元134根據(jù)以下的式(5)和(6)，使音調(diào)增益Gep[t]和代碼增益 Gec[t]衰減。
<formula>formula see original document page 11</formula> —(5 )
<formula>formula see original document page 11</formula> ( g )
接著，對(duì)由本實(shí)施方式的可擴(kuò)展解碼裝置解碼后的擴(kuò)展層的音源信號(hào)，使用具體例子進(jìn)行說明。
圖7是表示語音信號(hào)的頻譜功率的偏差的一例的圖。橫軸表示時(shí)間，而縱軸表示頻率。該圖中表示功率集中在以斜線表示的頻帶。
首先，在語音的開始部分，子音分量的大部分分布在約4kHz以上的高頻帶。然后，大約在T1之后母音分量將持續(xù)，而且該母音分量在高頻帶還帶有高諧波分量，直到T3附近為止存在高諧波。另一方面，在從T3到T4之
間，在大約為4kHz以下的低頻帶中，基本頻率附近的約2kHz以下的高諧波分量衰減程度較小，而中頻帶(3kHz附近)以上的高諧波急劇地衰減，從而不存在高諧波。在該圖中所示的狀況下，擴(kuò)展層音源功率也急劇地減少。
圖8和圖9是表示對(duì)呈現(xiàn)圖7的頻譜功率分布的語音信號(hào)進(jìn)行音源插值處理時(shí)的、解碼出的擴(kuò)展層的音源信號(hào)的功率的變化的圖。橫軸表示時(shí)間，縱軸表示功率，而且在表示擴(kuò)展層的音源信號(hào)的功率S12的同時(shí)表示核心層解碼信號(hào)的功率Sll。另外，S12和Sll表示正常接收時(shí)的功率。
而且，在這些圖中，同時(shí)表示擴(kuò)展層丟失信息(接收/非接收信息)。在圖8的例子中，到時(shí)刻Tl為止為正常接收狀態(tài)，從T1到T2為因數(shù)據(jù)丟失而引起的不可接收狀態(tài)(非接收狀態(tài))，T2以后為正常接收狀態(tài)。另外，在圖 9的例子中，到T3為止為正常接收狀態(tài)，從T3到T4為非接收狀態(tài)，T4以后為正常接收狀態(tài)。
在圖8的例子中，表示增益的衰減速度通過本實(shí)施方式的可擴(kuò)展解碼裝置而被減緩的情況(L2相當(dāng)于該情況)。在該例子中，在T1丟失擴(kuò)展層，在擴(kuò) 展層開始音源的插值。例如，在以規(guī)定的比率降低增益的方法中設(shè)定一個(gè)值 (Ll相當(dāng)于該值)，所示值能夠?qū)νㄟ^較弱的衰減而維持頻帶感(band quality) 以及通過較強(qiáng)的衰減而避免發(fā)生異音的兩個(gè)相反的要求保持均衡。
另一方面，在圖8的例子中，由于高諧波直到高頻帶都存在，而且在核心層的中頻帶也存在高諧波，所以存在共振峰的可能性非常高。在這樣的情況下，由于窄帶譜的斜率較緩，所以本實(shí)施方式的可擴(kuò)展解碼裝置將擴(kuò)展層增益的衰減系數(shù)設(shè)定得較低(L2)。由此，高頻帶的音源與過去和窄帶信號(hào)之間具有較強(qiáng)的相關(guān)性而容易進(jìn)行外插，從而能夠進(jìn)行自然的插值。
在圖9的例子中，表示增益的衰減速度通過本實(shí)施方式的可擴(kuò)展解碼裝置而被加快的情況(L4相當(dāng)于該情況)。在該例子中，在T3丟失擴(kuò)展層，在擴(kuò) 展層開始音源的插值。例如，在以定率降低增益的方法中，由于與圖8的例子同樣地只能衰減到高于原來的擴(kuò)展層的音源功率電平(S14)的增益(L3),所以即使對(duì)原來沒有信號(hào)的頻帶的信號(hào)也進(jìn)行過度強(qiáng)調(diào)而成為發(fā)生異音的原因。另一方面，本實(shí)施方式的可擴(kuò)展解碼裝置將擴(kuò)展層增益的衰減系數(shù)設(shè)定得較高(L4)。由此能夠衰減到低于原來的擴(kuò)展層的音源功率電平(S14)的增益，從而能夠進(jìn)行更自然的插值。
在圖9的例子(T4附近)中，在中頻帶以上的高頻帶端不存在高諧波，信
號(hào)功率偏重于低頻帶。在這樣的情況下，根據(jù)本實(shí)施方式的可擴(kuò)展解碼裝置，由于窄帶譜的斜率較陡，所以將擴(kuò)展層插值增益的衰減速度設(shè)定得較高。由此，能夠避免對(duì)原來不存在信號(hào)的高頻帶進(jìn)行過度強(qiáng)調(diào)，從而能夠避免發(fā)生異音。如上所述，根據(jù)本實(shí)施方式，在擴(kuò)展層的編碼數(shù)據(jù)丟失時(shí)，通過使用窄帶語音譜的斜率而適當(dāng)?shù)毓烙?jì)擴(kuò)展層的插值數(shù)據(jù)的增益，從而生成自然的插值語音。也就是說，在擴(kuò)展層丟失時(shí)，基于由窄帶i普斜率計(jì)算單元103得到的窄帶譜斜率的結(jié)果，根據(jù)該斜率對(duì)擴(kuò)展層的插值增益的衰減速度進(jìn)行控制。具體而言，在窄帶譜往高頻帶端的方向緩慢地減少的情況下，通過減弱擴(kuò)展層插值增益的衰減而維持頻帶感。另一方面，在窄帶譜往高頻帶端的方向急劇地減少的情況下，通過加強(qiáng)擴(kuò)展層插值增益的衰減而防止增益的過大估計(jì)，從而防止異音的發(fā)生。更詳細(xì)地，基于低層的窄帶語音的頻率信息(包絡(luò)信息)計(jì)算窄帶信號(hào)的頻譜的斜率，在該斜率較大時(shí)，即在接近高頻帶端的方向上功率減少較大時(shí)，抑制擴(kuò)展層的插值增益，而在上述的斜率較小時(shí)，使擴(kuò)展層的插值增益的衰減緩慢。由于一般基于窄帶的信號(hào)難以正確地估計(jì)更高頻帶的信號(hào)，所以隨著擴(kuò) 展層的丟失的延長(zhǎng)，被插值的寬帶信號(hào)變得不正確而會(huì)成為音質(zhì)惡化的原因。因此，可以認(rèn)為隨著擴(kuò)展層丟失期間的延長(zhǎng)衰減擴(kuò)展層插值信號(hào)并切換到窄帶信號(hào)較為理想，上述窄帶信號(hào)為雖然沒有頻帶感但是(由于正常接收)正確的解碼信號(hào)。于是，在本實(shí)施方式中，在實(shí)現(xiàn)上述操作的擴(kuò)展層的增益估計(jì)中使用以下所示的語音，尤其是母音等的有聲音的頻率特征。也就是說，作為第一特征，在核心層的頻帶(窄帶)的譜分布(具體而言為斜率)和包括直到擴(kuò)展層的頻帶(寬帶)的譜分布之間存在相關(guān)性。換而言之，在斜率往高頻帶的方向緩慢地減少的情況下，有在高頻帶也繼續(xù)存在基本頻率的高諧波的可能性，因此可以認(rèn)為高頻帶端的信號(hào)也有功率。另一方面，在斜率往高頻帶的方向急劇地減少的情況下，在高頻帶存在高諧波的可能性較低，因此可以認(rèn)為高頻帶端的信號(hào)的功率較小。作為第二特征，核心層頻帶的斜率較緩的信號(hào)與過去的信號(hào)之間具有相關(guān)性。在為母音等的有聲音的情況下，由于高諧波直到高頻帶都存在，所以斜率較緩。由于高諧波容易基于窄帶的信號(hào)進(jìn)行估計(jì)，而且被認(rèn)為與低頻帶
端的信號(hào)同樣緩慢地變化，所以與過去的信號(hào)之間的相關(guān)性也較高。另一方面，在核心層頻帶的斜率急劇減少的情況下，可以認(rèn)為在高頻帶端存在高諧波的可能性較低而在高頻帶端幾乎沒有信號(hào)，或者存在與過去的信號(hào)的相關(guān) 性較低的信號(hào)。根據(jù)以上的語音的特征，在核心層頻帶的斜率較緩時(shí)，由于高頻帶端的信號(hào)的功率變動(dòng)也緩慢而且與過去的信號(hào)之間的相關(guān)性也較高，所以通過將擴(kuò)展層增益的衰減設(shè)定得較弱，能夠得到自然的補(bǔ)償語音。另一方面，在核心層頻帶的斜率較陡時(shí)，可以認(rèn)為在高頻帶端本來不存在功率或者存在與過去的相關(guān)性較低的信號(hào)，通過將擴(kuò)展層增益的衰減設(shè)定得較強(qiáng)，能夠防止異音的發(fā)生。也就是說，通過由本實(shí)施方式的可擴(kuò)展解碼裝置適當(dāng)?shù)毓烙?jì)擴(kuò)展層增益，能夠維持?jǐn)U展層解碼信號(hào)的頻帶感，同時(shí)能夠抑制異音的發(fā)生。因此，能夠抑制擴(kuò)展層丟失所帶來的異音感，而且能夠維持頻帶感。另外，雖然在本實(shí)施方式中，以在幀丟失時(shí)基于窄帶譜的斜率對(duì)擴(kuò)展層增益的衰減速度進(jìn)行控制的情況為例進(jìn)行了說明，但是也可以通過核心層解碼信號(hào)的功率或?qū)诵膶拥脑鲆娴南鄬?duì)值來表示擴(kuò)展層增益，并基于窄帶譜斜率對(duì)該相對(duì)值進(jìn)行控制。另外，雖然在本實(shí)施方式中，以插值的處理單位為語音編碼的處理單位 (幀)的情況，也就是對(duì)每個(gè)幀進(jìn)行插值的情況為例進(jìn)行了說明，但是也可以將例如子幀等短于幀的一定時(shí)間作為插值的處理單位。再者，雖然在本實(shí)施方式中，以在計(jì)算窄帶譜的斜率時(shí)使用通過對(duì)窄帶信號(hào)的編碼數(shù)據(jù)進(jìn)行解碼而得到的頻譜信息的情況為例進(jìn)行了說明，但是也可以使用在核心層得到的解碼信號(hào)來代替窄帶信號(hào)的頻譜信息。也就是說，可以對(duì)該核心層解碼信號(hào)通過FFT(快速傅利葉變換)而進(jìn)行變頻，并基于其頻率分布計(jì)算窄帶譜的斜率，而且，在傳輸線性預(yù)測(cè)系數(shù)或等效的頻率包絡(luò)信息的情況下，也可以基于這些參數(shù)得到頻率包絡(luò)信息，并使用該信息計(jì)算窄帶譜的斜率。以上說明了本發(fā)明的實(shí)施方式。本發(fā)明的可擴(kuò)展解碼裝置和丟失數(shù)據(jù)插值方法并不限于上述實(shí)施方式，可以施加各種各樣的變更而實(shí)施。本發(fā)明的可擴(kuò)展解碼裝置可以安裝在移動(dòng)通信系統(tǒng)中的通信終端裝置以
及基站裝置，由此能夠提供具有與以上說明同樣的作用效果的通信終端裝置、基站裝置以及移動(dòng)通信系統(tǒng)。另外，雖然這里以由硬件構(gòu)成本發(fā)明的情況為例進(jìn)行了說明，但本發(fā)明也可以由軟件實(shí)現(xiàn)。例如，將本發(fā)明所涉及的丟失數(shù)據(jù)插值方法的算法使用編程語言記述，將該程序存儲(chǔ)于存儲(chǔ)器并由信息處理單元實(shí)行，由此能夠?qū)?現(xiàn)與本發(fā)明所涉及的可擴(kuò)展解碼裝置同樣的功能。另外，在上述各實(shí)施方式的說明中所使用的各功能塊典型地通過集成電路的LSI來實(shí)現(xiàn)。這些既可以單獨(dú)地實(shí)行單芯片化，也可以包含其中一部分或者是全部而實(shí)行單芯片化。另外，每個(gè)功能塊在此雖然稱作LSI,但是根據(jù)集成度的不同，有時(shí)也稱為IC、系統(tǒng)LSI、超級(jí)LSI(SuperLSI)、或超大LSI(Ultra LSI)等。另外，集成電路化的方法不只限于LSI,也可以使用專用電路或通用處理器來實(shí)現(xiàn)。也可以利用能夠在LSI制造后編程的FPGA( Field Programmable Gate Array),或可以利用可對(duì)LSI內(nèi)部的電路單元的連接或設(shè)定進(jìn)行重新配置的可重配置處理器(Reconfigurable Processor )。再者，如果由半導(dǎo)體技術(shù)的進(jìn)步或者派生的其他技術(shù)，出現(xiàn)取代LSI的集成電^各化的技術(shù)，當(dāng)然也可以利用該技術(shù)來實(shí)現(xiàn)功能塊的集成化。也有適用生物技術(shù)等的可能性。本說明書基于2005年6月29日提交的日本專利申請(qǐng)?zhí)卦?005-189532 號(hào)。其內(nèi)容全部包含于此。工業(yè)實(shí)用性本發(fā)明的可擴(kuò)展解碼裝置和丟失數(shù)據(jù)插值方法能夠適用于移動(dòng)通信系統(tǒng) 中的通信終端裝置和基站裝置等的用途。
權(quán)利要求
1、一種可擴(kuò)展解碼裝置，包括窄帶解碼單元，對(duì)窄帶信號(hào)的編碼數(shù)據(jù)進(jìn)行解碼；寬帶解碼單元，對(duì)寬帶信號(hào)的編碼數(shù)據(jù)進(jìn)行解碼，并且在該編碼數(shù)據(jù)不存在時(shí)，生成代替的插值數(shù)據(jù)；計(jì)算單元，基于所述窄帶信號(hào)的編碼數(shù)據(jù)，計(jì)算所述窄帶信號(hào)的頻譜在頻域的衰減程度；以及控制單元，基于所述衰減程度對(duì)所述插值數(shù)據(jù)的增益進(jìn)行控制。
2、如權(quán)利要求1所述的可擴(kuò)展解碼裝置，其中，所迷控制單元基于所述衰減程度對(duì)所述增益的衰減速度進(jìn)行控制。
3、如權(quán)利要求1所述的可擴(kuò)展解碼裝置，其中，所迷衰減程度為所述窄帶信號(hào)的頻譜的衰減直線的斜率。
4、如權(quán)利要求3所述的可擴(kuò)展解碼裝置，其中，所述斜率越陡，所述控制單元就越加快所述增益的衰減速度。
5、如權(quán)利要求l所述的可擴(kuò)展解碼裝置，其中，所述窄帶信號(hào)的編碼數(shù)據(jù)包括所述窄帶信號(hào)的頻譜信息的編碼數(shù)據(jù)。
6、如權(quán)利要求1所述的可擴(kuò)展解碼裝置，其中，所述計(jì)算單元對(duì)所述窄帶信號(hào)的編碼數(shù)據(jù)進(jìn)行解碼而得到所述窄帶信號(hào) 的頻譜，并基于該頻譜計(jì)算所述衰減程度。
7、一種通信終端裝置，具有權(quán)利要求1所述的可擴(kuò)展解碼裝置。
8、一種基站裝置，具有權(quán)利要求1所述的可擴(kuò)展解碼裝置。
9、一種丟失數(shù)據(jù)插值方法，包括以下步驟對(duì)窄帶信號(hào)的編碼數(shù)據(jù)進(jìn)行解碼；對(duì)寬帶信號(hào)的編碼數(shù)據(jù)進(jìn)行解碼；在所述寬帶信號(hào)的編碼數(shù)據(jù)不存在時(shí)，生成代替的插值數(shù)據(jù)；基于所述窄帶信號(hào)的編碼數(shù)據(jù)，計(jì)算所述窄帶信號(hào)的頻譜在頻域的衰減程度；以及基于所述衰減程度對(duì)所述插值數(shù)據(jù)的增益進(jìn)行控制。
全文摘要
公開了在頻帶可擴(kuò)展編碼的丟失數(shù)據(jù)插值處理中，能夠防止解碼信號(hào)的質(zhì)量惡化的可擴(kuò)展解碼裝置。在該裝置中，核心層解碼單元(101)通過解碼得到核心層解碼信號(hào)和窄帶頻譜信息。窄帶譜斜率計(jì)算單元(103)基于窄帶頻譜信息，計(jì)算窄帶譜的衰減直線的斜率。擴(kuò)展層丟失檢測(cè)單元(104)檢測(cè)擴(kuò)展層編碼數(shù)據(jù)是否丟失。擴(kuò)展層解碼單元(105)一般對(duì)擴(kuò)展層編碼數(shù)據(jù)進(jìn)行解碼，而且，在擴(kuò)展層丟失時(shí)，對(duì)解碼所需的參數(shù)進(jìn)行插值，以插值后的參數(shù)合成插值解碼信號(hào)。這里，插值數(shù)據(jù)的增益基于窄帶譜斜率計(jì)算單元(103)的計(jì)算結(jié)果被控制。
文檔編號(hào)G10L19/005GK101213590SQ20068002358
公開日2008年7月2日申請(qǐng)日期2006年6月27日優(yōu)先權(quán)日2005年6月29日
發(fā)明者江原宏幸, 河嶋拓也申請(qǐng)人:松下電器產(chǎn)業(yè)株式會(huì)社

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：河嶋拓也;江原宏幸
技術(shù)所有人：松下電器產(chǎn)業(yè)株式會(huì)社
我是此專利的發(fā)明人

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

對(duì)稱裝置解碼器相關(guān)技術(shù)

機(jī)戰(zhàn)擴(kuò)展裝置相關(guān)技術(shù)

完美解碼擴(kuò)展屏使用相關(guān)技術(shù)

完美解碼擴(kuò)展模式設(shè)置相關(guān)技術(shù)

mediacoder擴(kuò)展解碼器相關(guān)技術(shù)

藍(lán)牙丟失裝置國(guó)內(nèi)現(xiàn)狀相關(guān)技術(shù)

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

可擴(kuò)展解碼裝置及丟失數(shù)據(jù)插值方法