專利名稱:可擴(kuò)展解碼裝置及丟失數(shù)據(jù)插值方法
技術(shù)領(lǐng)域:
本發(fā)明涉及可擴(kuò)展解碼裝置及丟失數(shù)據(jù)插值方法。
技術(shù)背景可擴(kuò)展語音編碼具有如下特征由于分層地對(duì)語音信號(hào)進(jìn)行編碼,所以 即使丟失了某些分層(層layer)的編碼數(shù)據(jù)(編碼信息),也能夠基于其它的分 層的編碼數(shù)據(jù)解碼出語音信號(hào)。在可擴(kuò)展語音編碼中,將分層地對(duì)窄帶語音信號(hào)和寬帶語音信號(hào)進(jìn)行編碼的技術(shù)稱為"頻帶可擴(kuò)展語音編碼"。一般而言,在頻帶可擴(kuò)展語音編碼中,在最基本的分層對(duì)窄帶信號(hào)進(jìn)行 處理,而且隨著分層的增加,將下位分層的信號(hào)以上的寬帶信號(hào)作為對(duì)象。 因此,在本說明書中,將最基本(核心)的編碼/解碼處理層稱為"核心層(core layer)",而將進(jìn)行比核心層更高質(zhì)量化和寬帶化的編碼/解碼處理層稱為"擴(kuò) 展層(enhancement layer)"。另外,因?yàn)榫哂屑词箒G失了一部分的層的編碼數(shù)據(jù)也能夠進(jìn)行解碼的特 征,在可擴(kuò)展編碼中使用的語音編解碼器(codec)適合于使用像IP網(wǎng)那樣的分 組通信^各徑,作為數(shù)據(jù)交換語音信號(hào)的VoIP(Voice over IP)用的編碼。但是,在盡力(besteffort)型的分組通信中,傳輸頻帶一般不被保證,有 因一部分的分組丟失或延遲等的原因而欠缺一部分的編碼數(shù)據(jù)的可能性。例 如,如果通信路徑的業(yè)務(wù)量緣于擁塞等飽和,編碼數(shù)據(jù)因分組的丟棄而在傳 輸路徑的中途失去。由于這樣的編碼數(shù)據(jù)的欠缺,在解碼裝置中發(fā)生各種各 樣的狀況,諸如,完全不能進(jìn)行解碼、只接收核心層的編碼信息、以及接收 直到擴(kuò)展層的所有信息。而且,由于這樣的狀況隨時(shí)間的經(jīng)過而連續(xù)不斷地 發(fā)生,所以例如也會(huì)發(fā)生需要對(duì)只接收核心層的編碼信息的幀和接收包括直 到擴(kuò)展層的編碼信息的幀,在時(shí)間上切換且交替地進(jìn)行解碼的狀況。在這樣 的情況下,層的切換的發(fā)生會(huì)使聲音大小和頻帶擴(kuò)展感(bandspread)變得不連 續(xù),從而導(dǎo)致解碼信號(hào)的音質(zhì)惡化。例如,在非專利文獻(xiàn)1中公開了在使用單層的CELP(Code Excited Linear Prediction)的語音編解碼器中的幀丟失補(bǔ)償處理中,在幀丟失時(shí),基于過去的 信息對(duì)信號(hào)的合成所需的各個(gè)參數(shù)進(jìn)行插值的技術(shù)。在該丟失數(shù)據(jù)插值技術(shù) 中,尤其對(duì)于增益,以基于過去的被正常接收的幀的增益為基礎(chǔ),通過對(duì)該 增益使用單調(diào)減少的函數(shù)來表示對(duì)插值數(shù)據(jù)使用的增益。另外,對(duì)于從幀丟 失時(shí)到編碼數(shù)據(jù)接收時(shí)為止的增益控制,作為音調(diào)增益使用解碼后的音調(diào)增 益,而且關(guān)于代碼增益,對(duì)在丟失期間中的插值后的插值代碼增益和解碼后 的當(dāng)前的代碼增益進(jìn)行比較,使用更小的值的代碼增益。非專利文獻(xiàn)1: "AMR Speech Codec; Error Concealment of lost frames" T S 2 6 . 0 9 1發(fā)明內(nèi)容發(fā)明要解決的問題在非專利文獻(xiàn)1中所公開的技術(shù)為關(guān)于在一般的CELP中的丟失數(shù)據(jù)的 插值的技術(shù),其在數(shù)據(jù)丟失期間,基本上僅基于過去的信息而減少插值增益。 隨著插值期間的延長(zhǎng),解碼插值語音與原來的解碼語音相差越多,所以這是 為了防止異音(noise)的發(fā)生所需的動(dòng)作。但是,如果研究非專利文獻(xiàn)l的技術(shù)對(duì)可擴(kuò)展語音編解碼器的擴(kuò)展層的 丟失數(shù)據(jù)插值處理的適用,則在擴(kuò)展層的數(shù)據(jù)丟失的期間中,根據(jù)核心層的 解碼語音功率變動(dòng)和擴(kuò)展層的增益衰減量的狀況,插值數(shù)據(jù)有可能對(duì)正常解 碼的核心層的解碼語音的質(zhì)量造成壞影響,而且給收聽者帶來異音感和變動(dòng) 感。也就是說,在擴(kuò)展層丟失時(shí)核心層的解碼語音功率急劇減少,而且擴(kuò)展 層的插值增益的衰減緩慢的情況下,有時(shí)通過進(jìn)行插值反而導(dǎo)致擴(kuò)展層的解 碼信號(hào)的質(zhì)量的惡化。此時(shí),如果惡化了的擴(kuò)展層的解碼語音明顯,其結(jié)果 是給收聽者帶來異音感。另外,如果在核心層的解碼語音功率的變動(dòng)不大的 情況下增大擴(kuò)展層的插值增益的衰減量,則擴(kuò)展層的解碼語音會(huì)急劇地衰減,其結(jié)果是給收聽者帶來變動(dòng)感。因此,本發(fā)明的目的為提供可擴(kuò)展解碼裝置和丟失數(shù)據(jù)插值方法,在頻 帶可擴(kuò)展編碼的丟失數(shù)據(jù)插值處理中,防止解碼信號(hào)的質(zhì)量惡化,而且不會(huì) 給收聽者帶來異音感和變動(dòng)感。解決問題的方案本發(fā)明的可擴(kuò)展解碼裝置釆用的結(jié)構(gòu)包括窄帶解碼單元,對(duì)窄帶信號(hào)
的編碼數(shù)據(jù)進(jìn)行解碼;寬帶解碼單元,對(duì)寬帶信號(hào)的編碼數(shù)據(jù)進(jìn)行解碼,并且在該編碼數(shù)據(jù)不存在時(shí),生成代替的插值數(shù)據(jù);計(jì)算單元,基于所述窄帶 信號(hào)的編碼數(shù)據(jù),計(jì)算所述窄帶信號(hào)的頻譜在頻域的衰減程度;以及控制單 元,基于所述衰減程度對(duì)所述插值數(shù)據(jù)的增益進(jìn)行控制。 發(fā)明效果根據(jù)本發(fā)明,在頻帶可擴(kuò)展編碼的丟失數(shù)據(jù)插值處理中,能夠防止解碼 信號(hào)的質(zhì)量惡化,并能夠防止給收聽者帶來異音感和變動(dòng)感。
圖1是表示實(shí)施方式1的可擴(kuò)展解碼裝置的主要結(jié)構(gòu)的方框圖; 圖2是用于說明窄帶譜的斜率的計(jì)算處理的圖; 圖3是用于說明窄帶譜的斜率的計(jì)算處理的圖;圖4是表示實(shí)施方式1的窄帶譜斜率計(jì)算單元內(nèi)部的主要結(jié)構(gòu)的方框圖; 圖5是表示實(shí)施方式1的擴(kuò)展層解碼單元內(nèi)部的主要結(jié)構(gòu)的方框圖; 圖6是表示實(shí)施方式1的擴(kuò)展層增益解碼單元內(nèi)部的主要結(jié)構(gòu)的方框圖; 圖7是用于說明頻譜功率的偏差的示意圖;圖8是表示解碼出的擴(kuò)展層的音源信號(hào)的功率的變化(transition)的圖;以及圖9是表示解碼出的擴(kuò)展層的音源信號(hào)的功率的變化的圖。
具體實(shí)施方式
以下,參照附圖詳細(xì)說明本發(fā)明的實(shí)施方式。另外,雖然在本說明書中 以由兩個(gè)層構(gòu)成的分層結(jié)構(gòu)為例進(jìn)行說明,但是本發(fā)明并不限于兩個(gè)層。 (實(shí)施方式1)圖1是表示本發(fā)明的實(shí)施方式1的可擴(kuò)展解碼裝置的主要結(jié)構(gòu)的方框圖。 這里,以在擴(kuò)展層對(duì)比核心層更寬的頻帶的信號(hào)進(jìn)行基于CELP(CodeExcited Linear Prediction)方式的語音編碼的情況為例進(jìn)行說明。本實(shí)施方式的可擴(kuò)展解碼裝置包括核心層解碼單元101、上采樣/相位 調(diào)整單元102、窄帶譜斜率計(jì)算單元103、擴(kuò)展層丟失檢測(cè)單元104、擴(kuò)展層 解碼單元105以及解碼信號(hào)加法單元106,而且對(duì)從編碼器(未圖示)發(fā)送的核 心層編碼數(shù)據(jù)和擴(kuò)展層編碼數(shù)據(jù)進(jìn)行解碼。 本實(shí)施方式的可擴(kuò)展解碼裝置的各個(gè)部分進(jìn)行以下的動(dòng)作。核心層解碼單元101對(duì)接收到的核心層編碼數(shù)據(jù)進(jìn)行解碼,并將得到的窄帶信號(hào)即核心層解碼信號(hào)輸出到核心層解碼信號(hào)分析單元(未圖示)和上采樣/相位調(diào)整單元102。另外,核心層解碼單元101將在上述核心層編碼數(shù) 據(jù)中包含的窄帶頻譜信息(關(guān)于窄帶譜的包絡(luò)和能源分布等的信息)輸出到窄 帶譜斜率計(jì)算單元103。上采樣/相位調(diào)整單元102進(jìn)行調(diào)整(校正)核心層解碼信號(hào)和擴(kuò)展層解 碼信號(hào)之間的采樣速率、延遲和相位的偏離的處理。這里,使核心層解碼信 號(hào)與擴(kuò)展層解碼信號(hào)匹配而進(jìn)行變換。但是,如果核心層解碼信號(hào)和擴(kuò)展層 解碼信號(hào)之間的采樣速率和相位等相同的話,則不需要校正偏離,根據(jù)必要使核心層解碼信號(hào)成常數(shù)倍并將其輸出。輸出信號(hào)被輸出到解碼信號(hào)加法單 元106。窄帶譜斜率計(jì)算單元103基于從核心層解碼單元101輸出的窄帶頻語信 息,計(jì)算窄帶譜在頻域的衰減直線的斜率,并將該計(jì)算結(jié)果輸出到擴(kuò)展層解 碼單元105。計(jì)算出的窄帶語的衰減直線的斜率,在對(duì)擴(kuò)展層的丟失數(shù)據(jù)的 插值數(shù)據(jù)的增益(擴(kuò)展層插值增益)進(jìn)行控制時(shí)使用。測(cè)擴(kuò)展層編碼數(shù)據(jù)是否丟失,即是否能夠?qū)U(kuò)展層編碼數(shù)據(jù)進(jìn)行解碼。所得 到的擴(kuò)展層的幀差錯(cuò)檢測(cè)結(jié)果(擴(kuò)展層丟失信息)被輸出到擴(kuò)展層解碼單元105。 另外,作為數(shù)據(jù)丟失的檢測(cè)方法,也可以對(duì)附加到編碼數(shù)據(jù)的CRC等 的檢錯(cuò)碼進(jìn)行檢查,對(duì)到開始解碼的時(shí)間為止編碼數(shù)據(jù)是否未到達(dá)進(jìn)行判斷, 或者^r測(cè)分組丟失和分組未到達(dá)。另外,在擴(kuò)展層解碼單元105所接收的編 碼數(shù)據(jù)的解碼過程中,在基于包含在擴(kuò)展層編碼數(shù)據(jù)內(nèi)的檢錯(cuò)碼等檢測(cè)出重 大的差錯(cuò)的情況下,也可以由擴(kuò)展層解碼單元105將該差錯(cuò)信息輸入到擴(kuò)展 層丟失檢測(cè)單元104。擴(kuò)展層解碼單元105 —般對(duì)接收到的擴(kuò)展層編碼數(shù)據(jù)進(jìn)行解碼,并將得 到的擴(kuò)展層解碼信號(hào)輸出到解碼信號(hào)加法單元106。另外,在由擴(kuò)展層丟失 檢測(cè)單元104通知擴(kuò)展層丟失信息(幀差錯(cuò))的情況下,也就是在擴(kuò)展層的數(shù)據(jù) 丟失時(shí),擴(kuò)展層解碼單元105對(duì)解碼所需的參數(shù)進(jìn)行插值,利用插值后的參 數(shù)合成插值解碼信號(hào),并將其作為擴(kuò)展層解碼信號(hào)輸出到解碼信號(hào)加法單元106。 這里,插值數(shù)據(jù)的增益基于窄帶譜斜率計(jì)算單元103的計(jì)算結(jié)果被控制。
解碼信號(hào)加法單元106將從上采樣/相位調(diào)整單元102輸出的核心層解 碼信號(hào)和從擴(kuò)展層解碼單元105輸出的擴(kuò)展層解碼信號(hào)相加,并將得到的解 碼信號(hào)輸出。圖2和圖3是用于說明在窄帶譜斜率計(jì)算單元103進(jìn)行的窄帶譜的斜率 的計(jì)算處理的圖。窄帶譜斜率計(jì)算單元103使用線性預(yù)測(cè)系數(shù)之一的 LSP(Line Spectrum Pair)系數(shù),如下所示,近似性地計(jì)算窄帶譜的衰減直線的 斜率。圖2和圖3的上部的頻i普表示窄帶譜和寬帶譜的例子。在這些圖中,以 橫軸表示頻率,縱軸表示功率,而且作為核心層處理4kHz以下的窄帶信號(hào), 作為擴(kuò)展層處理8kHz以下的寬帶信號(hào)的情況為例。在這些圖中,以虛線表示 的曲線Sl和S4為寬帶信號(hào)的頻率包絡(luò),而以實(shí)線表示的曲線S2和S5為窄 帶信號(hào)的頻率包絡(luò)。 一般而言,奈奎斯特頻率(Nyquistfrequency)附近的窄帶 信號(hào)會(huì)與寬帶信號(hào)乖離,但是奈奎斯特頻率以下的頻帶的頻率功率分布會(huì)近 似。另外,以實(shí)線表示的直線S3和S6為窄帶譜在頻域的衰減直線。該衰減 直線為表示了窄帶譜的衰減程度的特性曲線,例如通過求各個(gè)采樣點(diǎn)的回歸 線而能夠得到。圖2的上部的頻譜表示窄帶譜的衰減直線的斜率(以下簡(jiǎn)稱為"窄帶譜的 斜率")較緩的情況的例子,而圖3的上部的頻譜表示窄帶譜的斜率較陡的情況的例子。另外,圖2和圖3的下部的信號(hào)表示在圖2和圖3的上部所示的 窄帶譜的LSP系數(shù)(將分析次數(shù)M設(shè)為10次的情況)。一般而言,LSP系數(shù)的各個(gè)次數(shù)成分,在像共振峰(formant)那樣頻語功 率集中的地方,有相鄰的次數(shù)成分相互接近地被配置(LSP系數(shù)的各個(gè)次數(shù)成 分密集)的趨向,而在能量不集中的共振峰之間的谷的部分,有相鄰的次數(shù)成 分互相分開地被配置的傾向。這里,LSP系數(shù)的相鄰的次數(shù)意味著例如對(duì)次 數(shù)i的次數(shù)i+l那樣互相連續(xù)的次數(shù)。而且,實(shí)際上,在圖2和圖3的例子中,也呈現(xiàn)在頻率fD、 fl、 f2、 G、 f4和f5的附近LSP系數(shù)的各個(gè)次數(shù)成分密集,尤其在功率最集中的第一共振 峰附近,LSP系數(shù)的各個(gè)次數(shù)成分之間的距離最小的趨向。而且,在圖2的 例子中,寬帶信號(hào)直到高頻帶都存在,在中頻帶也呈現(xiàn)共振峰。在這樣的情 況下,fl和f2附近的LSP系數(shù)的各個(gè)次數(shù)成分之間的距離也相近。另一方面, 在圖3的例子中,不但在寬帶信號(hào)中高頻帶信號(hào)的強(qiáng)度較弱,也在中頻帶未 呈現(xiàn)明顯的共振峰。在這樣的情況下,與fl和f2相比,f4和f5附近的LSP 系數(shù)的各個(gè)次數(shù)成分之間的距離大。因此,反過來說,在LSP系數(shù)的各個(gè)次 數(shù)成分之間的距離較小時(shí),在該地方存在更高的能量的可能性較高。于是,窄帶譜斜率計(jì)算單元103基于LSP系數(shù)的上述特征,將LSP系數(shù) 的相鄰的次數(shù)成分之間的距離的平方的倒數(shù)之和作為判斷功率的大小時(shí)的指 標(biāo)。然后,求整個(gè)窄帶(窄帶LSP系數(shù)的所有次數(shù)成分)的虛擬功率(dummy power)和窄帶的高頻帶部分(以后稱為"中頻帶,,)的虛擬功率,并將中頻帶的虛 擬功率與整個(gè)窄帶的虛擬功率的比視為表示窄帶譜的衰減程度的參數(shù)。具體 而言,可以認(rèn)為計(jì)算出的比相當(dāng)于窄帶譜的斜率,在該斜率較大時(shí),可以說 窄帶譜在急劇地衰減。圖4是表示實(shí)現(xiàn)上述處理的窄帶譜斜率計(jì)算單元103內(nèi)部的主要結(jié)構(gòu)的 方框圖。窄帶語斜率計(jì)算單元103包括全窄帶功率計(jì)算單元121、中頻帶功率計(jì) 算單元122以及除法單元123,而且被輸入表示核心層譜包絡(luò)信息的M次的 LSP系數(shù),使用該LSP系數(shù)計(jì)算窄帶譜的斜率并將其輸出。全窄帶功率計(jì)算單元121基于以下的式(l),從所輸入的窄帶LSP系數(shù) Nlsp[t]計(jì)算全窄帶的虛擬功率NLSPpowALL[t],并輸出到除法單元123。3(腳["l]-腳[i])2 ... ( 1 )其中,t表示幀號(hào),M表示窄帶LSP系數(shù)的分析次數(shù),i表示LSP系數(shù)的 次數(shù)(l^i^M)。中頻帶功率計(jì)算單元122將窄帶LSP系數(shù)作為輸入,計(jì)算中頻帶的虛擬 功率,并輸出到除法單元123。這里,為了計(jì)算中頻帶的虛擬功率,只使用 窄帶LSP系數(shù)的高頻帶部分的系數(shù)而計(jì)算虛擬功率?;谝韵碌氖?2)計(jì)算中 頻帶功率NLSPpowMID[t]。(腳[/ + 1]_愚柳2( 2 )除法單元123基于以下的式(3)將中頻帶功率除以全窄帶功率,從而計(jì)算 窄帶譜的斜率Ntilt[t]。
層=腳戸M卿]
計(jì)算出的窄帶譜的斜率被輸出到后述的擴(kuò)展層增益解碼單元112。 如上所述,通過使用窄帶LSP系數(shù)的特征,能夠計(jì)算窄帶譜的斜率。 另外,由于LSP系數(shù)的位置會(huì)根據(jù)窄帶譜的分布而發(fā)生變化,而且中頻 帶的頻帶也隨此發(fā)生變化,所以有時(shí)窄帶譜的斜率的精確度會(huì)降低。但是, 該精確度的降低幾乎不影響擴(kuò)展層的插值增益的衰減速度的聽覺上的質(zhì)量。
圖5是表示擴(kuò)展層解碼單元105內(nèi)部的主要結(jié)構(gòu)的方框圖。編碼數(shù)據(jù)分 離單元111將從編碼器(未圖示)發(fā)送的擴(kuò)展層編碼數(shù)據(jù)作為輸入,并按各個(gè)碼 本分離編碼數(shù)據(jù)。分離后的編碼數(shù)據(jù)被輸出到擴(kuò)展層增益解碼單元112、擴(kuò) 展層自適應(yīng)碼本解碼單元113、擴(kuò)展層噪聲碼本解碼單元114以及擴(kuò)展層LPC 解碼單元115。
擴(kuò)展層增益解碼單元112解碼出提供給音調(diào)增益放大單元116和代碼增 益放大單元117的增益量(gainamount)。具體而言,擴(kuò)展層增益解碼單元112 基于擴(kuò)展層丟失信息和窄帶譜斜率信息,控制通過對(duì)編碼數(shù)據(jù)進(jìn)行解碼而得 到的增益。得到的增益量被分別輸出到音調(diào)增益放大單元116和代碼增益放 大單元117。另外,在未能接收編碼數(shù)據(jù)的情況下,使用過去的解碼信息和 核心層解碼信號(hào)分析信息而進(jìn)行丟失數(shù)據(jù)的插值。
在擴(kuò)展層自適應(yīng)碼本解碼單元113,在擴(kuò)展層自適應(yīng)碼本中存儲(chǔ)著過去 的擴(kuò)展層音源信號(hào),基于從編碼器發(fā)送的編碼數(shù)據(jù)確定延遲(lag),并且截取 相當(dāng)于該延遲的音調(diào)周期分量的信號(hào)。輸出信號(hào)被輸出到音調(diào)增益放大單元 116。另外,在未能接收編碼數(shù)據(jù)的情況下,使用過去的延遲和核心層的信息 而進(jìn)行丟失數(shù)據(jù)的插值。
擴(kuò)展層噪聲碼本解碼單元114生成用于表現(xiàn)通過上述的擴(kuò)展層自適應(yīng)碼 本不能完全表現(xiàn)的、即不屬于周期分量的噪聲性的信號(hào)分量的信號(hào)。在近年 的編解碼器中,以代數(shù)方式表現(xiàn)該信號(hào)的情況較多。輸出信號(hào)一皮輸出到代碼 增益放大單元117。另外,在未能接收編碼數(shù)據(jù)的情況下,使用擴(kuò)展層的過 去的解碼信息、核心層的解碼信息、或者隨機(jī)數(shù)的值等而進(jìn)行丟失數(shù)據(jù)的插 值。
擴(kuò)展層LPC解碼單元115對(duì)從編碼器發(fā)送的編碼數(shù)據(jù)進(jìn)行解碼,并將得 到的線性預(yù)測(cè)系數(shù)輸出到擴(kuò)展層合成濾波器119,作為用于合成濾波器的濾
波系數(shù)。另外,在未能接收編碼數(shù)據(jù)的情況下,使用過去接收的編碼數(shù)據(jù)進(jìn) 行丟失數(shù)據(jù)的插值,或者進(jìn)一步使用核心層的LPC信息而進(jìn)行丟失數(shù)據(jù)的解 碼。此時(shí),在核心層和擴(kuò)展層的線性預(yù)測(cè)的分析次數(shù)不同的情況下,先對(duì)核
心層的LPC進(jìn)行次數(shù)擴(kuò)張之后再用于插值。
音調(diào)增益放大單元116將擴(kuò)展層自適應(yīng)碼本解碼單元113的輸出信號(hào), 乘以從擴(kuò)展層增益解碼單元112輸出的音調(diào)增益而進(jìn)行放大,并輸出到音源 加法單元118。
代碼增益放大單元117將擴(kuò)展層噪聲碼本解碼單元114的輸出信號(hào),乘 以從擴(kuò)展層增益解碼單元112輸出的代碼增益而進(jìn)行放大,并輸出到音源加 法單元118。
音源加法單元118通過將從音調(diào)增益》t大單元116和代碼增益放大單元 117輸出的信號(hào)相加而生成擴(kuò)展層音源信號(hào),并將其輸出到擴(kuò)展層合成濾波 器119。
擴(kuò)展層合成濾波器119由從擴(kuò)展層LPC解碼單元115輸出的LPC系數(shù) 形成合成濾波器,并將從音源加法單元118輸出的擴(kuò)展層音源信號(hào)作為輸入 而驅(qū)動(dòng),從而得到擴(kuò)展層解碼信號(hào)。該擴(kuò)展層解碼信號(hào)被輸出到解碼信號(hào)加 法單元106。另外,也可以對(duì)該擴(kuò)展層解碼信號(hào)進(jìn)一步進(jìn)行后置濾波 (post-filtering)處理。
圖6是表示擴(kuò)展層增益解碼單元112內(nèi)部的主要結(jié)構(gòu)的方框圖。擴(kuò)展層 增益解碼單元112包括擴(kuò)展層增益碼本解碼單元131、增益選擇單元132、增 益衰減單元134、過去增益存儲(chǔ)單元135以及增益衰減率計(jì)算單元133,而且 在擴(kuò)展層的數(shù)據(jù)丟失時(shí),基于過去的擴(kuò)展層的增益值和窄帶譜的斜率的信息, 對(duì)擴(kuò)展層的插值增益進(jìn)行控制。具體而言,它被輸入編碼數(shù)據(jù)、擴(kuò)展層丟失 信息以及窄帶譜的斜率,而且輸出音調(diào)增益Gep[t]和代碼增益Gec[t]的兩種增 益。
擴(kuò)展層增益碼本解碼單元131接收編碼數(shù)據(jù)之后將其解碼,并將得到的 解碼增益DGep[t]和DGec[t]輸出到增益選擇單元132。
增益選擇單元132被輸入擴(kuò)展層丟失信息、解碼增益(DGep[t]和DGec[t]) 以及從過去增益存儲(chǔ)單元135輸出的過去增益。增益選擇單元132基于擴(kuò)展 層丟失信息選擇是使用解碼增益還是使用過去增益,并將所選擇的增益輸出 到增益衰減單元134。具體而言,在接收到編碼數(shù)據(jù)時(shí)輸出解碼增益,而在
數(shù)據(jù)丟失時(shí)輸出過去增益。
增益衰減率計(jì)算單元133基于擴(kuò)展層丟失信息和窄帶譜的斜率信息計(jì)算
增益衰減率,并輸出到增益衰減單元134。
增益衰減單元134通過將來自增益選擇單元132的輸出乘以在增益衰減 率計(jì)算單元133計(jì)算的增益衰減率而求衰減后的增益,并將其輸出。
過去增益存儲(chǔ)單元135存儲(chǔ)由增益衰減單元134衰減后的增益作為過去 增益。所存儲(chǔ)的過去增益被輸出到增益選擇單元132。
接著,使用算式具體說明本實(shí)施方式的增益控制方法。
在窄帶譜的斜率較緩時(shí),增益衰減率計(jì)算單元133將增益衰減率設(shè)定為 較弱,以使增益緩慢地衰減。而且,在窄帶譜的斜率較大時(shí),增益衰減率計(jì) 算單元133將增益衰減率設(shè)定為較強(qiáng),以使增益大幅衰減。增益衰減率可基 于以下的式(4)計(jì)算。
<formula>formula see original document page 11</formula> ( 4 )
這里,Gatt[t]是增益衰減率,卩是用于校正斜率的系數(shù),而且是大于O.O 的正數(shù),a是用于控制衰減率的幅度的系數(shù),而且取O.(KoKl.O的值。也可以 變更音調(diào)增益和代碼增益的各個(gè)系數(shù)。
增益衰減單元134根據(jù)以下的式(5)和(6),使音調(diào)增益Gep[t]和代碼增益 Gec[t]衰減。
<formula>formula see original document page 11</formula> —(5 )
<formula>formula see original document page 11</formula> ( g )
接著,對(duì)由本實(shí)施方式的可擴(kuò)展解碼裝置解碼后的擴(kuò)展層的音源信號(hào), 使用具體例子進(jìn)行說明。
圖7是表示語音信號(hào)的頻譜功率的偏差的一例的圖。橫軸表示時(shí)間,而 縱軸表示頻率。該圖中表示功率集中在以斜線表示的頻帶。
首先,在語音的開始部分,子音分量的大部分分布在約4kHz以上的高 頻帶。然后,大約在T1之后母音分量將持續(xù),而且該母音分量在高頻帶還帶 有高諧波分量,直到T3附近為止存在高諧波。另一方面,在從T3到T4之
間,在大約為4kHz以下的低頻帶中,基本頻率附近的約2kHz以下的高諧波 分量衰減程度較小,而中頻帶(3kHz附近)以上的高諧波急劇地衰減,從而不 存在高諧波。在該圖中所示的狀況下,擴(kuò)展層音源功率也急劇地減少。
圖8和圖9是表示對(duì)呈現(xiàn)圖7的頻譜功率分布的語音信號(hào)進(jìn)行音源插值 處理時(shí)的、解碼出的擴(kuò)展層的音源信號(hào)的功率的變化的圖。橫軸表示時(shí)間, 縱軸表示功率,而且在表示擴(kuò)展層的音源信號(hào)的功率S12的同時(shí)表示核心層 解碼信號(hào)的功率Sll。另外,S12和Sll表示正常接收時(shí)的功率。
而且,在這些圖中,同時(shí)表示擴(kuò)展層丟失信息(接收/非接收信息)。在 圖8的例子中,到時(shí)刻Tl為止為正常接收狀態(tài),從T1到T2為因數(shù)據(jù)丟失 而引起的不可接收狀態(tài)(非接收狀態(tài)),T2以后為正常接收狀態(tài)。另外,在圖 9的例子中,到T3為止為正常接收狀態(tài),從T3到T4為非接收狀態(tài),T4以 后為正常接收狀態(tài)。
在圖8的例子中,表示增益的衰減速度通過本實(shí)施方式的可擴(kuò)展解碼裝 置而被減緩的情況(L2相當(dāng)于該情況)。在該例子中,在T1丟失擴(kuò)展層,在擴(kuò) 展層開始音源的插值。例如,在以規(guī)定的比率降低增益的方法中設(shè)定一個(gè)值 (Ll相當(dāng)于該值),所示值能夠?qū)νㄟ^較弱的衰減而維持頻帶感(band quality) 以及通過較強(qiáng)的衰減而避免發(fā)生異音的兩個(gè)相反的要求保持均衡。
另一方面,在圖8的例子中,由于高諧波直到高頻帶都存在,而且在核 心層的中頻帶也存在高諧波,所以存在共振峰的可能性非常高。在這樣的情 況下,由于窄帶譜的斜率較緩,所以本實(shí)施方式的可擴(kuò)展解碼裝置將擴(kuò)展層 增益的衰減系數(shù)設(shè)定得較低(L2)。由此,高頻帶的音源與過去和窄帶信號(hào)之 間具有較強(qiáng)的相關(guān)性而容易進(jìn)行外插,從而能夠進(jìn)行自然的插值。
在圖9的例子中,表示增益的衰減速度通過本實(shí)施方式的可擴(kuò)展解碼裝 置而被加快的情況(L4相當(dāng)于該情況)。在該例子中,在T3丟失擴(kuò)展層,在擴(kuò) 展層開始音源的插值。例如,在以定率降低增益的方法中,由于與圖8的例 子同樣地只能衰減到高于原來的擴(kuò)展層的音源功率電平(S14)的增益(L3),所 以即使對(duì)原來沒有信號(hào)的頻帶的信號(hào)也進(jìn)行過度強(qiáng)調(diào)而成為發(fā)生異音的原 因。另一方面,本實(shí)施方式的可擴(kuò)展解碼裝置將擴(kuò)展層增益的衰減系數(shù)設(shè)定 得較高(L4)。由此能夠衰減到低于原來的擴(kuò)展層的音源功率電平(S14)的增益, 從而能夠進(jìn)行更自然的插值。
在圖9的例子(T4附近)中,在中頻帶以上的高頻帶端不存在高諧波,信
號(hào)功率偏重于低頻帶。在這樣的情況下,根據(jù)本實(shí)施方式的可擴(kuò)展解碼裝置, 由于窄帶譜的斜率較陡,所以將擴(kuò)展層插值增益的衰減速度設(shè)定得較高。由 此,能夠避免對(duì)原來不存在信號(hào)的高頻帶進(jìn)行過度強(qiáng)調(diào),從而能夠避免發(fā)生 異音。如上所述,根據(jù)本實(shí)施方式,在擴(kuò)展層的編碼數(shù)據(jù)丟失時(shí),通過使用窄 帶語音譜的斜率而適當(dāng)?shù)毓烙?jì)擴(kuò)展層的插值數(shù)據(jù)的增益,從而生成自然的插值語音。也就是說,在擴(kuò)展層丟失時(shí),基于由窄帶i普斜率計(jì)算單元103得到 的窄帶譜斜率的結(jié)果,根據(jù)該斜率對(duì)擴(kuò)展層的插值增益的衰減速度進(jìn)行控制。具體而言,在窄帶譜往高頻帶端的方向緩慢地減少的情況下,通過減弱擴(kuò)展 層插值增益的衰減而維持頻帶感。另一方面,在窄帶譜往高頻帶端的方向急 劇地減少的情況下,通過加強(qiáng)擴(kuò)展層插值增益的衰減而防止增益的過大估計(jì), 從而防止異音的發(fā)生。更詳細(xì)地,基于低層的窄帶語音的頻率信息(包絡(luò)信息)計(jì)算窄帶信號(hào)的 頻譜的斜率,在該斜率較大時(shí),即在接近高頻帶端的方向上功率減少較大時(shí), 抑制擴(kuò)展層的插值增益,而在上述的斜率較小時(shí),使擴(kuò)展層的插值增益的衰 減緩慢。由于一般基于窄帶的信號(hào)難以正確地估計(jì)更高頻帶的信號(hào),所以隨著擴(kuò) 展層的丟失的延長(zhǎng),被插值的寬帶信號(hào)變得不正確而會(huì)成為音質(zhì)惡化的原因。 因此,可以認(rèn)為隨著擴(kuò)展層丟失期間的延長(zhǎng)衰減擴(kuò)展層插值信號(hào)并切換到窄 帶信號(hào)較為理想,上述窄帶信號(hào)為雖然沒有頻帶感但是(由于正常接收)正確的 解碼信號(hào)。于是,在本實(shí)施方式中,在實(shí)現(xiàn)上述操作的擴(kuò)展層的增益估計(jì)中 使用以下所示的語音,尤其是母音等的有聲音的頻率特征。也就是說,作為第一特征,在核心層的頻帶(窄帶)的譜分布(具體而言為 斜率)和包括直到擴(kuò)展層的頻帶(寬帶)的譜分布之間存在相關(guān)性。換而言之, 在斜率往高頻帶的方向緩慢地減少的情況下,有在高頻帶也繼續(xù)存在基本頻 率的高諧波的可能性,因此可以認(rèn)為高頻帶端的信號(hào)也有功率。另一方面, 在斜率往高頻帶的方向急劇地減少的情況下,在高頻帶存在高諧波的可能性 較低,因此可以認(rèn)為高頻帶端的信號(hào)的功率較小。作為第二特征,核心層頻帶的斜率較緩的信號(hào)與過去的信號(hào)之間具有相關(guān)性。在為母音等的有聲音的情況下,由于高諧波直到高頻帶都存在,所以 斜率較緩。由于高諧波容易基于窄帶的信號(hào)進(jìn)行估計(jì),而且被認(rèn)為與低頻帶
端的信號(hào)同樣緩慢地變化,所以與過去的信號(hào)之間的相關(guān)性也較高。另一方 面,在核心層頻帶的斜率急劇減少的情況下,可以認(rèn)為在高頻帶端存在高諧 波的可能性較低而在高頻帶端幾乎沒有信號(hào),或者存在與過去的信號(hào)的相關(guān) 性較低的信號(hào)。根據(jù)以上的語音的特征,在核心層頻帶的斜率較緩時(shí),由于高頻帶端的 信號(hào)的功率變動(dòng)也緩慢而且與過去的信號(hào)之間的相關(guān)性也較高,所以通過將 擴(kuò)展層增益的衰減設(shè)定得較弱,能夠得到自然的補(bǔ)償語音。另一方面,在核 心層頻帶的斜率較陡時(shí),可以認(rèn)為在高頻帶端本來不存在功率或者存在與過 去的相關(guān)性較低的信號(hào),通過將擴(kuò)展層增益的衰減設(shè)定得較強(qiáng),能夠防止異 音的發(fā)生。也就是說,通過由本實(shí)施方式的可擴(kuò)展解碼裝置適當(dāng)?shù)毓烙?jì)擴(kuò)展層增益, 能夠維持?jǐn)U展層解碼信號(hào)的頻帶感,同時(shí)能夠抑制異音的發(fā)生。因此,能夠 抑制擴(kuò)展層丟失所帶來的異音感,而且能夠維持頻帶感。另外,雖然在本實(shí)施方式中,以在幀丟失時(shí)基于窄帶譜的斜率對(duì)擴(kuò)展層 增益的衰減速度進(jìn)行控制的情況為例進(jìn)行了說明,但是也可以通過核心層解 碼信號(hào)的功率或?qū)诵膶拥脑鲆娴南鄬?duì)值來表示擴(kuò)展層增益,并基于窄帶譜 斜率對(duì)該相對(duì)值進(jìn)行控制。另外,雖然在本實(shí)施方式中,以插值的處理單位為語音編碼的處理單位 (幀)的情況,也就是對(duì)每個(gè)幀進(jìn)行插值的情況為例進(jìn)行了說明,但是也可以將 例如子幀等短于幀的 一定時(shí)間作為插值的處理單位。再者,雖然在本實(shí)施方式中,以在計(jì)算窄帶譜的斜率時(shí)使用通過對(duì)窄帶 信號(hào)的編碼數(shù)據(jù)進(jìn)行解碼而得到的頻譜信息的情況為例進(jìn)行了說明,但是也 可以使用在核心層得到的解碼信號(hào)來代替窄帶信號(hào)的頻譜信息。也就是說,可以對(duì)該核心層解碼信號(hào)通過FFT(快速傅利葉變換)而進(jìn)行變頻,并基于其頻 率分布計(jì)算窄帶譜的斜率,而且,在傳輸線性預(yù)測(cè)系數(shù)或等效的頻率包絡(luò)信 息的情況下,也可以基于這些參數(shù)得到頻率包絡(luò)信息,并使用該信息計(jì)算窄 帶譜的斜率。以上說明了本發(fā)明的實(shí)施方式。本發(fā)明的可擴(kuò)展解碼裝置和丟失數(shù)據(jù)插值方法并不限于上述實(shí)施方式, 可以施加各種各樣的變更而實(shí)施。本發(fā)明的可擴(kuò)展解碼裝置可以安裝在移動(dòng)通信系統(tǒng)中的通信終端裝置以
及基站裝置,由此能夠提供具有與以上說明同樣的作用效果的通信終端裝置、 基站裝置以及移動(dòng)通信系統(tǒng)。另外,雖然這里以由硬件構(gòu)成本發(fā)明的情況為例進(jìn)行了說明,但本發(fā)明 也可以由軟件實(shí)現(xiàn)。例如,將本發(fā)明所涉及的丟失數(shù)據(jù)插值方法的算法使用 編程語言記述,將該程序存儲(chǔ)于存儲(chǔ)器并由信息處理單元實(shí)行,由此能夠?qū)?現(xiàn)與本發(fā)明所涉及的可擴(kuò)展解碼裝置同樣的功能。另外,在上述各實(shí)施方式的說明中所使用的各功能塊典型地通過集成電 路的LSI來實(shí)現(xiàn)。這些既可以單獨(dú)地實(shí)行單芯片化,也可以包含其中一部分 或者是全部而實(shí)行單芯片化。另外,每個(gè)功能塊在此雖然稱作LSI,但是根據(jù)集成度的不同,有時(shí)也 稱為IC、系統(tǒng)LSI、超級(jí)LSI(SuperLSI)、或超大LSI(Ultra LSI)等。另外,集成電路化的方法不只限于LSI,也可以使用專用電路或通用處 理器來實(shí)現(xiàn)。也可以利用能夠在LSI制造后編程的FPGA( Field Programmable Gate Array),或可以利用可對(duì)LSI內(nèi)部的電路單元的連接或設(shè)定進(jìn)行重新配 置的可重配置處理器(Reconfigurable Processor )。再者,如果由半導(dǎo)體技術(shù)的進(jìn)步或者派生的其他技術(shù),出現(xiàn)取代LSI的 集成電^各化的技術(shù),當(dāng)然也可以利用該技術(shù)來實(shí)現(xiàn)功能塊的集成化。也有適 用生物技術(shù)等的可能性。本說明書基于2005年6月29日提交的日本專利申請(qǐng)?zhí)卦?005-189532 號(hào)。其內(nèi)容全部包含于此。工業(yè)實(shí)用性本發(fā)明的可擴(kuò)展解碼裝置和丟失數(shù)據(jù)插值方法能夠適用于移動(dòng)通信系統(tǒng) 中的通信終端裝置和基站裝置等的用途。
權(quán)利要求
1、一種可擴(kuò)展解碼裝置,包括窄帶解碼單元,對(duì)窄帶信號(hào)的編碼數(shù)據(jù)進(jìn)行解碼;寬帶解碼單元,對(duì)寬帶信號(hào)的編碼數(shù)據(jù)進(jìn)行解碼,并且在該編碼數(shù)據(jù)不存在時(shí),生成代替的插值數(shù)據(jù);計(jì)算單元,基于所述窄帶信號(hào)的編碼數(shù)據(jù),計(jì)算所述窄帶信號(hào)的頻譜在頻域的衰減程度;以及控制單元,基于所述衰減程度對(duì)所述插值數(shù)據(jù)的增益進(jìn)行控制。
2、 如權(quán)利要求1所述的可擴(kuò)展解碼裝置,其中, 所迷控制單元基于所述衰減程度對(duì)所述增益的衰減速度進(jìn)行控制。
3、 如權(quán)利要求1所述的可擴(kuò)展解碼裝置,其中, 所迷衰減程度為所述窄帶信號(hào)的頻譜的衰減直線的斜率。
4、 如權(quán)利要求3所述的可擴(kuò)展解碼裝置,其中, 所述斜率越陡,所述控制單元就越加快所述增益的衰減速度。
5、 如權(quán)利要求l所述的可擴(kuò)展解碼裝置,其中,所述窄帶信號(hào)的編碼數(shù)據(jù)包括所述窄帶信號(hào)的頻譜信息的編碼數(shù)據(jù)。
6、 如權(quán)利要求1所述的可擴(kuò)展解碼裝置,其中,所述計(jì)算單元對(duì)所述窄帶信號(hào)的編碼數(shù)據(jù)進(jìn)行解碼而得到所述窄帶信號(hào) 的頻譜,并基于該頻譜計(jì)算所述衰減程度。
7、 一種通信終端裝置,具有權(quán)利要求1所述的可擴(kuò)展解碼裝置。
8、 一種基站裝置,具有權(quán)利要求1所述的可擴(kuò)展解碼裝置。
9、 一種丟失數(shù)據(jù)插值方法,包括以下步驟 對(duì)窄帶信號(hào)的編碼數(shù)據(jù)進(jìn)行解碼;對(duì)寬帶信號(hào)的編碼數(shù)據(jù)進(jìn)行解碼;在所述寬帶信號(hào)的編碼數(shù)據(jù)不存在時(shí),生成代替的插值數(shù)據(jù); 基于所述窄帶信號(hào)的編碼數(shù)據(jù),計(jì)算所述窄帶信號(hào)的頻譜在頻域的衰減 程度;以及基于所述衰減程度對(duì)所述插值數(shù)據(jù)的增益進(jìn)行控制。
全文摘要
公開了在頻帶可擴(kuò)展編碼的丟失數(shù)據(jù)插值處理中,能夠防止解碼信號(hào)的質(zhì)量惡化的可擴(kuò)展解碼裝置。在該裝置中,核心層解碼單元(101)通過解碼得到核心層解碼信號(hào)和窄帶頻譜信息。窄帶譜斜率計(jì)算單元(103)基于窄帶頻譜信息,計(jì)算窄帶譜的衰減直線的斜率。擴(kuò)展層丟失檢測(cè)單元(104)檢測(cè)擴(kuò)展層編碼數(shù)據(jù)是否丟失。擴(kuò)展層解碼單元(105)一般對(duì)擴(kuò)展層編碼數(shù)據(jù)進(jìn)行解碼,而且,在擴(kuò)展層丟失時(shí),對(duì)解碼所需的參數(shù)進(jìn)行插值,以插值后的參數(shù)合成插值解碼信號(hào)。這里,插值數(shù)據(jù)的增益基于窄帶譜斜率計(jì)算單元(103)的計(jì)算結(jié)果被控制。
文檔編號(hào)G10L19/005GK101213590SQ20068002358
公開日2008年7月2日 申請(qǐng)日期2006年6月27日 優(yōu)先權(quán)日2005年6月29日
發(fā)明者江原宏幸, 河嶋拓也 申請(qǐng)人:松下電器產(chǎn)業(yè)株式會(huì)社