用于產(chǎn)生帶寬擴(kuò)展輸出數(shù)據(jù)的裝置和方法

文檔序號：2823193閱讀：234來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專利名稱：用于產(chǎn)生帶寬擴(kuò)展輸出數(shù)據(jù)的裝置和方法
技術(shù)領(lǐng)域：
本發(fā)明涉及一種用于產(chǎn)生帶寬擴(kuò)展(BWE)輸出數(shù)據(jù)的裝置和方法、一種音頻編碼器和音頻解碼器。
背景技術(shù)：
自然音頻編碼和語音編碼是針對音頻信號的兩種主要類別的編碼解碼器。自然音頻編碼通常用于中間比特率下的音樂或任意信號，且一般提供寬音頻帶寬。語音編碼器基本上受限于語音再現(xiàn)且可在非常低的比特率下使用。寬帶語音較窄帶語音提供重要的主觀質(zhì)量改善。此外，由于多媒體領(lǐng)域的巨大發(fā)展，音樂及其它非語音信號的傳輸以及儲存，以及例如針對通過電話系統(tǒng)的無線電/電視(TV)高質(zhì)量傳輸是所期望的特征。為了極大地減小比特率，信號源編碼可使用分離頻帶感知音頻編碼解碼器來執(zhí) 行。這些自然音頻編碼解碼器利用信號中的感知無關(guān)及統(tǒng)計(jì)冗余。如果只利用上述對于所給定的比特率限制而言是不充分的，則采樣速率被減小。減小組成等級的數(shù)目也是常見的，允許偶爾可聽量化失真，并且允許通過兩個(gè)或多個(gè)聲道的聯(lián)合立體聲編碼或參數(shù)編碼來使用立體聲場的劣化。這些方法的過度使用導(dǎo)致惱人的感知劣化。為了提高編碼性能，使用諸如頻譜帶復(fù)制(SBR)的帶寬擴(kuò)展方法作為一種用于在基于HFR(高頻重構(gòu))的編碼解碼器中產(chǎn)生高頻信號的有效方法。在記錄和傳送聲響信號的過程中，諸如背景噪聲之類的噪聲本底(noise floor) 始終存在。為了在解碼器側(cè)上產(chǎn)生可信的聲響信號，應(yīng)當(dāng)傳輸或產(chǎn)生噪聲本底。在后一種情況下，應(yīng)當(dāng)確定原始音頻信號中的噪聲本底。在頻譜帶復(fù)制中，這通過SBR工具或SBR相關(guān)模塊來執(zhí)行，這種工具或模塊產(chǎn)生表征噪聲本底的特征(其它除外)并且被傳輸?shù)浇獯a 器以重構(gòu)該噪聲本底的參數(shù)。在WO 00/45379中，描述了一種自適應(yīng)噪聲本底工具，這在所合成的高頻帶頻率分量中提供充足的噪聲內(nèi)容。然而，若在基帶中，短時(shí)能量波動或所謂的瞬變發(fā)生，則產(chǎn)生高頻帶頻率分量中的擾動偽像。這些偽像是感知不可接受的，且現(xiàn)有技術(shù)不提供可接受的解決方案(特別是在帶寬有限的情況下)。

發(fā)明內(nèi)容
因此，本發(fā)明的目的是提供一種裝置，該裝置允許有效編碼而沒有可感知偽像，特別是對于語音信號而言。該目的通過以下來實(shí)現(xiàn)根據(jù)權(quán)利要求1所述的用于產(chǎn)生SBR輸出數(shù)據(jù)的裝置、根據(jù)權(quán)利要求7所述的編碼器、根據(jù)權(quán)利要求10所述的用于產(chǎn)生SBR輸出數(shù)據(jù)的方法、根據(jù) 權(quán)利要求13所述的解碼器、根據(jù)權(quán)利要求14所述的用于解碼的方法、或根據(jù)權(quán)利要求16 所述的已編碼音頻信號。本發(fā)明基于以下發(fā)現(xiàn)依據(jù)音頻信號在一時(shí)間部分中的能量分布改變所測量的噪聲本底可以在解碼器測提高所合成音頻信號的感知質(zhì)量。盡管從理論觀點(diǎn)，不需要所測量的噪聲本底的改變或處理，但是產(chǎn)生噪聲本底的傳統(tǒng)技術(shù)顯示多個(gè)缺點(diǎn)。一方面，基于音調(diào) 測量的噪聲本底的估計(jì)通過傳統(tǒng)方法來執(zhí)行是困難的且不總是精確的。另一方面，噪聲本底的目的是在解碼器測上再現(xiàn)正確的音調(diào)印象。即使原始音頻信號與已解碼信號的主觀音調(diào)印象是相同的，但是仍然存在產(chǎn)生偽像的可能性；例如對于語音信號而言。主觀測試顯示不同類型的語音信號應(yīng)以不同方式來處理。在濁音語音信號中，計(jì) 算的噪聲本底的降低在與原始計(jì)算的噪聲本底相比較時(shí)，噪聲本底產(chǎn)生感知上較高的質(zhì) 量。結(jié)果在這種情況下語音發(fā)出較少的回響。在音頻信號包含齒音的情況下，噪聲本底中的偽像增加可以掩蓋與齒音有關(guān)的修補(bǔ)方法中的缺點(diǎn)。例如，短時(shí)能量波動(瞬變)在被移動或變換到較高頻帶時(shí)，產(chǎn)生擾動偽像，且噪聲本底的增加也可掩蓋這些能量波動。瞬時(shí)瞬變可以定義為傳統(tǒng)信號中的部分，其中能量的強(qiáng)烈增加出現(xiàn)在短時(shí)間段中，這在特定頻率區(qū)域上可以是受限的或不受限的。瞬變的示例是對響板及打擊樂器的擊打，以及人類聲音中的特定聲音，例如字母Ρ、τ、κ、...。到目前為止，這類瞬變的檢測通常以相同的方式或相同的算法(使用瞬變閾值)來實(shí)現(xiàn)，這獨(dú)立于信號，不管該信號被分類為語音還是被分類為音樂。此外，濁音和清音語音之間的可能區(qū)別不影響傳統(tǒng)或經(jīng)典的瞬變檢測機(jī)制。因此，實(shí)施例提供了針對諸如濁音語音之類的信號的噪聲本底的減小，噪聲本底以及針對包含例如齒音的信號的噪聲本底的增加。為了區(qū)分不同的信號，實(shí)施例使用能量分布數(shù)據(jù)(例如齒音參數(shù))，該能量分布數(shù) 據(jù)測量能量主要位于較高頻率還是較低頻率，或者換句話說，音頻信號的頻譜表示朝較高頻率的方向顯示增加還是減小傾斜。其他實(shí)施例也使用第一 LPC系數(shù)(LPC=線性預(yù)測編碼)，以產(chǎn)生齒音參數(shù)。存在兩種用于改變噪聲本底的可能性。第一可能性是傳輸所述齒音參數(shù)，使得解碼器可以使用該齒音參數(shù)，以便調(diào)整噪聲本底(例如除了計(jì)算的噪聲本底以外，增加還是減小噪聲本底)。除了計(jì)算的噪聲本底參數(shù)的外，該齒音參數(shù)可通過傳統(tǒng)方法來傳輸或在解碼器側(cè)上計(jì)算。第二可能性是通過使用齒音參數(shù)(或能量分布數(shù)據(jù))改變該所傳輸?shù)脑肼?本底，使得編碼器將修改的噪聲本底數(shù)據(jù)傳輸?shù)浇獯a器，且在解碼器側(cè)不需要修改-可以使用相同的解碼器。因此，噪聲本底的處理原則上可在編碼器側(cè)上以及在解碼器側(cè)上進(jìn)行。頻譜帶復(fù)制作為用于帶寬擴(kuò)展的示例依賴定義一時(shí)間部分的SBR幀，在該時(shí)間部分中音頻信號被分成第一頻帶及第二頻帶中的分量。對于整個(gè)SBR幀而言，可以測量及/或改變噪聲本底。備選地，SBR幀被分成噪聲包絡(luò)也是可能的，使得對于噪聲包絡(luò)中的每一噪聲包絡(luò)而言，可以執(zhí)行針對噪聲本底的調(diào)整。換言之，噪聲本底工具的時(shí)間分辨率通過SBR 幀中的所謂的噪聲包絡(luò)來確定。根據(jù)標(biāo)準(zhǔn)(IS0/IEC14496-3)，每一 SBR幀最多包含兩個(gè)噪聲包絡(luò)，使得噪聲本底的調(diào)整可在基本部分SBR幀上進(jìn)行。對于一些應(yīng)用而言，這可能是足夠的。然而，增加噪聲包絡(luò)的數(shù)目以改善用于時(shí)變音調(diào)的模型也是可能的。因此，實(shí)施例包含一種用于針對音頻信號產(chǎn)生BWE輸出數(shù)據(jù)的裝置，其中，該音頻信號包含第一頻帶及第二頻帶中的分量，且該BffE輸出數(shù)據(jù)適于控制第二頻帶中分量的合成。該裝置包含用于在該音頻信號的一時(shí)間部分內(nèi)測量該第二頻帶中的噪聲本底數(shù)據(jù)的一噪聲本底測量器。因?yàn)樗鶞y量的噪聲本底影響音頻信號的音調(diào)，所以噪聲本底測量器可以包含音調(diào)測量器。備選地，可以實(shí)現(xiàn)該噪聲本底測量器，以測量信號中的噪音量，以獲得噪聲本底。該裝置還包含用于得出能量分布數(shù)據(jù)的信號-能量表征器，其中該能量分布數(shù)據(jù) 表征在該音頻信號的該時(shí)間部分的頻譜中的能量分布的特征，最后，該裝置包含用于組合噪聲本底數(shù)據(jù)與能量分布數(shù)據(jù)以獲得BWE輸出數(shù)據(jù)的處理器。在其他實(shí)施例中，信號能量表征器適于將齒音參數(shù)用作能量分布數(shù)據(jù)，且該齒音參數(shù)例如可以是第一 LPC系數(shù)。在其他實(shí)施例中，處理器適于將能量分布數(shù)據(jù)添加至已編碼音頻數(shù)據(jù)的比特流中，或者備選地，該處理器適于調(diào)整噪聲本底參數(shù)，使得噪聲本底根據(jù) 能量分布數(shù)據(jù)而增加或被減小(信號相關(guān))。在這個(gè)實(shí)施例中，噪聲本底測量器將首先測量噪聲本底，以產(chǎn)生噪聲本底數(shù)據(jù)，該噪聲本底數(shù)據(jù)稍后將由該處理器來調(diào)整或改變。在其他實(shí)施例中，時(shí)間部分是SBR幀，且信號能量表征器適于每一 SBR幀產(chǎn)生多個(gè) 噪聲本底包絡(luò)。因此，噪聲本底測量器以及信號能量表征器可以適于針對每一噪聲本底包絡(luò)測量噪聲本底數(shù)據(jù)以及所得出的能量分布數(shù)據(jù)。噪聲本底包絡(luò)的數(shù)目可以是例如1、2、 4、...每 SBR 幀。其他實(shí)施例也包含在解碼器中用于產(chǎn)生音頻信號的第二頻帶中的分量的頻譜帶復(fù)制工具。在該產(chǎn)生中，使用針對第二頻帶中的分量的頻譜帶復(fù)制輸出數(shù)據(jù)和未處理信號頻譜表示。頻譜帶復(fù)制工具包含噪聲本底計(jì)算單元和組合器，噪聲本底計(jì)算單元被配置為根據(jù)能量分布數(shù)據(jù)計(jì)算噪聲本底，組合器用于組合該未處理信號頻譜表示與該計(jì)算的噪聲本底，以產(chǎn)生具有該計(jì)算的噪聲本底的第二頻帶中的分量。實(shí)施例的一個(gè)優(yōu)點(diǎn)是組合外部判定(語音/音頻)與內(nèi)部濁音語音檢測器或內(nèi)部齒音檢測器(信號能量表征器)，其中該內(nèi)部齒音檢測器控制被信號通知給解碼器的附加噪聲的事件，或者調(diào)整計(jì)算的噪聲本底。對于清音信號而言，執(zhí)行通常的噪聲本底計(jì)算獲。對于語音信號(從外部切換判定得出)而言，執(zhí)行附加語音分析，以確定實(shí)際信號的發(fā)聲。要添加到解碼器或編碼器的噪聲量根據(jù)信號的齒音程度(與發(fā)聲相反)來縮放。齒音的程度例如可以通過測量短信號部分的頻譜傾斜來確定。

現(xiàn)在通過所示示例描述本發(fā)明。參考附圖，通過以下詳細(xì)描述將更容易認(rèn)識且更好地理解本發(fā)明的特征，在附圖中圖1示出了根據(jù)本發(fā)明實(shí)施例的用于產(chǎn)生BffE輸出數(shù)據(jù)的裝置的框圖；圖加示出了非齒音信號的負(fù)頻譜傾斜；圖2b示出了類似齒音信號的正頻譜傾斜；圖2c示出了基于低階LPC參數(shù)的頻譜傾斜m的計(jì)算；圖3示出了編碼器的框圖；圖4示出了用于處理已編碼音頻串以在解碼器側(cè)上輸出PCM采樣的框圖；圖5a』b示出了傳統(tǒng)噪聲本底計(jì)算工具與根據(jù)實(shí)施例的修改的噪聲本底計(jì)算工具的比較；以及圖6示出了在預(yù)定數(shù)目的時(shí)間部分中的SBR幀的劃分。
具體實(shí)施例方式圖1示出了用于針對音頻信號105產(chǎn)生帶寬擴(kuò)展(BWE)輸出數(shù)據(jù)102的裝置100。
7該音頻信號105包含第一頻帶10 中的分量和第二頻帶10 中的分量。BffE輸出數(shù)據(jù)102 適于控制第二頻帶10 中的分量的合成。裝置100包含噪聲本底測量器110、信號能量表征器120以及處理器130。噪聲本底測量器110適于在音頻信號105的時(shí)間部分內(nèi)測量或確定第二頻帶10 的噪聲本底數(shù)據(jù)115。詳細(xì)地，噪聲本底可以通過比較基帶的所測量噪聲與較高頻帶的所測量噪聲來確定，使得可以確定在修補(bǔ)后用以再現(xiàn)自然音調(diào)印象所需噪聲量。信號能量表征器120得出能量分布數(shù)據(jù)125，能量分布數(shù)據(jù)125表征音頻信號105 的時(shí)間部分的頻譜中的能量分布。因此噪聲本底測量器110接收例如第一和/或第二頻帶 IO^u 105b，且信號能量表征器120接收例如第一和/或第二頻帶IO^u 105b。處理器130 接收噪聲本底數(shù)據(jù)115和能量分布數(shù)據(jù)125，且將噪聲本底數(shù)據(jù)115和能量分布數(shù)據(jù)125組合以獲得BffE輸出數(shù)據(jù)102。頻譜帶復(fù)制包含用于帶寬擴(kuò)展的一個(gè)示例，其中BffE輸出數(shù)據(jù) 102變成SBR輸出數(shù)據(jù)。接下來的實(shí)施例將主要描述SBR的示例，但是本發(fā)明的裝置/方法不限于這個(gè)示例。能量分布數(shù)據(jù)125指示第二頻帶中所包含的能量與第一頻帶中所包含的能量之間相比較的關(guān)系。在最簡單的情況下，能量分布數(shù)據(jù)由比特給出，該比特指示與SBR頻帶 (較高頻帶)相比較，是否有較多的能量儲存在基帶中，或者反之亦然。SBR頻帶(較高頻帶)例如可以被定義為大于例如由4kHz給出的一閾值的頻率分量，且基帶(較低頻帶)可以是小于該閾值頻率(例如小于4kHz或另一頻率)的信號分量。這些閾值頻率的示例大概是^Hz或6kHz。圖加和圖2b示出了音頻信號105的時(shí)間部分內(nèi)頻譜中的兩個(gè)能量分布。由能級 P所顯示的能量分布作為頻率F(模擬信號)的函數(shù)，其也可能是由多個(gè)采樣或線(變換到頻域)所給出的信號的包絡(luò)。該所示曲線圖也較簡單，以使頻譜傾斜概念可視化。較低及較高頻帶可被定義為小于或大于臨界頻率Ftl的頻率(橫跨例如500Hz、IkHz或2kHz的頻率)。圖加示出了下降頻譜傾斜的能量分布(隨著頻率增大而減小)。換言的，在這種情況下，與高頻率分量相比較，有較多的能量儲存在低頻率分量中。因此，對于較高頻率而言，能級P減小，暗示負(fù)頻譜傾斜(遞減函數(shù))。因此，如果信號能級P指示在較高頻帶(F >F0)較較低頻帶(FCFtl)中有較少的能量，則能級P包含負(fù)頻譜傾斜。例如針對包含少量齒音或不包含齒音的音頻信號而言，發(fā)生這種類型的信號。圖2b示出了這種情況，其中能級P隨著頻率F增加，這暗示正頻譜傾斜(根據(jù)頻率的能級P的遞增函數(shù))。因此，如果信號能級P指示在較高頻帶(F > F0)較較低頻帶(F < F0)有較多的能量，則能級P包含正頻譜傾斜。如果音頻信號105包含例如所示齒音，則產(chǎn)生這樣的能量分布。圖加示出了具有負(fù)頻譜傾斜的信號的功率譜。負(fù)頻譜傾斜表示頻譜的下降斜率。與的相反，圖2b示出了具有正頻譜傾斜的信號的功率譜。換言之，該頻譜傾斜具有上升斜率。當(dāng)然，諸如在圖加中所示的頻譜或在圖2b中所示的頻譜中的每一頻譜在具有不同于頻譜傾斜的斜率的局部范圍內(nèi)將具有變化。例如，當(dāng)諸如通過使直線與實(shí)際頻譜之間的平方差最小化來講該直線擬合到該功率譜時(shí)，可以獲得頻譜傾斜。將直線擬合到頻譜可以是用于計(jì)算短時(shí)頻譜的頻譜傾斜的方式之一。然而，優(yōu)選地，使用LPC系數(shù)來計(jì)算頻譜傾斜。
V. Goncharoff, E. Von Colln 和 R. Morris 的出版物"Efficientcalculation of spectral tilt from various LPC parameters", NavalCommand> Control and Ocean Surveillance Center (NCCOSC)、RDT和EDivision、San Diego.CA 92152-52001 的(于 1996 年5月23日出版)公開了計(jì)算頻譜傾斜的若干方法。在一個(gè)實(shí)現(xiàn)方式中，頻譜傾斜被定義為針對對數(shù)功率譜的最小二乘線性擬合的斜率。然而，也可以應(yīng)用針對非對數(shù)功率譜或振幅譜或任何其它類型頻譜的線性擬合。這一點(diǎn)在本發(fā)明的上下文中特別正確，其中在優(yōu)選實(shí)施例中，主要對頻譜傾斜的符號，即線性擬合結(jié)果的斜率是正還是負(fù)感興趣。然而，頻譜傾斜的實(shí)際值在本發(fā)明的高效實(shí)施例中不太重要，但是該實(shí)際值在較詳細(xì)實(shí)施例中可能是重要的。當(dāng)語音的線性預(yù)測編碼(LPC)用來對其短時(shí)頻譜進(jìn)行建模時(shí)，直接根據(jù)LPC模型參數(shù)而非對數(shù)功率譜計(jì)算頻譜傾斜在計(jì)算上較有效。圖2c示出了與第η階全極對數(shù)功率譜相對應(yīng)的倒頻譜系數(shù)ck的方程式。在這一方程式中，k是整數(shù)索引，Ρη是LPC濾波器的ζ 域傳遞函數(shù)H(Z)的全極表示中的第η極。圖2c中的下一個(gè)方程式是根據(jù)倒頻譜系數(shù)的頻譜傾斜。特別地，m是頻譜傾斜，k及η是整數(shù)，N是H(Z)的全極模型的最高階極點(diǎn)。圖2c 中的下一個(gè)方程式定義第N階LPC濾波器的對數(shù)功率譜S(co)。G是增益常數(shù)，且Cik是線性預(yù)測器系數(shù)，且ω等于2X π Xf，其中f是頻率。圖2c中的最下面的方程式直接產(chǎn)生倒頻譜系數(shù)作為LPC系數(shù)Cik的函數(shù)。然后倒頻譜系數(shù)Ck用來計(jì)算頻譜傾斜。一般而言，這種方法較分解LPC多項(xiàng)式以獲得極值及使用極方程式求解頻譜傾斜將在計(jì)算上將更有效。因此，在計(jì)算LPC系數(shù)α k后，可以使用在圖2c中的底部的方程式來計(jì)算倒頻譜系數(shù)ck，然后可以使用圖2c中的第一個(gè)方程式根據(jù)倒頻譜系數(shù)計(jì)算極點(diǎn)pn。然后基于該極點(diǎn)，可以計(jì) 算在圖2c中的第二個(gè)方程式中所定義的頻譜傾斜m。已發(fā)現(xiàn)的是，第一階LPC系數(shù)α i對于頻譜傾斜的符號的良好估計(jì)而言是充分的。因此，CI1是。的良好估計(jì)。因此，C1是P1的良好估計(jì)。當(dāng)P1被插入到針對頻譜傾斜m的方程式時(shí)，變得清楚的是，由于圖2c中的第二個(gè)方程式中的負(fù)符號，頻譜傾斜m的符號與在圖2c中的LPC系數(shù)定義中的第一 LPC系數(shù)α工的符號相反。優(yōu)選地，信號能量表征器120被配置為，產(chǎn)生與在音頻信號的當(dāng)前時(shí)間部分中的音頻信號的頻譜傾斜的符號有關(guān)的指示作為能量分布數(shù)據(jù)。優(yōu)選地，信號能量表征器120被配置為產(chǎn)生從用于估計(jì)一個(gè)或多個(gè)低階LPC系數(shù) 的音頻信號的時(shí)間部分的LPC分析得出的數(shù)據(jù)作為能量分布數(shù)據(jù)，以及從該等一個(gè)或多個(gè) 低階LPC系數(shù)得出能量分布數(shù)據(jù)。優(yōu)選地，信號能量表征器120被配置為只計(jì)算第一 LPC系數(shù)而不計(jì)算額外的LPC 系數(shù)，且從該第一 LPC系數(shù)的符號得出能量分布數(shù)據(jù)。優(yōu)選地，信號能量表征器120被配置為確定頻譜傾斜為負(fù)頻譜傾斜，其中當(dāng)?shù)谝?LPC系數(shù)具有正符號時(shí)，頻譜能量從較低頻率到較高頻率減小，以及檢測頻譜傾斜為正頻譜傾斜，其中當(dāng)該第一 LPC系數(shù)具有負(fù)符號時(shí)，頻譜能量從較低頻率到較高頻率增加。在其它實(shí)施例中，頻譜傾斜檢測器或信號能量表征器120被配置為不僅計(jì)算第一階LPC系數(shù)，而且計(jì)算若干低階LPC系數(shù)，諸如直到3階或4階或甚至更高階的LPC系數(shù)。在這樣一個(gè)實(shí)施例中，頻譜傾斜按如此高的精確度計(jì)算，以至于我們不能只指示符號作為齒音參數(shù)，而且作為依賴于傾斜的值，如在該符號實(shí)施例中其具有兩個(gè)以上的值。
如上所述，在較高頻率區(qū)域中齒音包含大量能量，而對于不具有或只具有很少齒音(例如元音)的部分，能量大部分分布在基帶(低頻帶)中。這一觀察可被使用，以確定語音信號部分是否包含齒音或所包含的程度。因此，噪聲本底測量器110 (檢測器)可使用頻譜傾斜，以判定齒音的量，或給出信號中的齒音程度。頻譜傾斜基本上可從能量分布的簡單LPC分析獲得。其可能例如足以計(jì) 算第一 LPC系數(shù)，以確定頻譜傾斜參數(shù)(齒音參數(shù))，因?yàn)轭l譜的行為(是遞增還是遞減函數(shù))可以從第一 LPC系數(shù)推斷。該分析可以在信號能量表征器120內(nèi)執(zhí)行。如果音頻編碼器使用LPC用以解碼音頻信號，則不需要傳送齒音參數(shù)，因?yàn)榈谝?LPC系數(shù)可以在解碼器端被用作能量分布數(shù)據(jù)。在實(shí)施例中，處理器130可以被配置為根據(jù)能量分布數(shù)據(jù)125 (頻譜傾斜)改變噪聲本底數(shù)據(jù)115，以獲得經(jīng)修改的噪聲本底數(shù)據(jù)，且處理器130可以被配置為將該經(jīng)修改的噪聲本底數(shù)據(jù)加入到包含BffE輸出數(shù)據(jù)102的比特流中。噪聲本底數(shù)據(jù)115的改變可以是，使得與包含較少齒音(圖加)的音頻信號105相比較，對于包含較多齒音(圖2b)的音頻信號105，經(jīng)修改噪聲本底被增加。用于產(chǎn)生帶寬擴(kuò)展(BWE)輸出數(shù)據(jù)102的裝置100可以是編碼器300的一部分。圖3示出了編碼器300的實(shí)施例，該編碼器300包含BTO相關(guān)模塊310 (其可以包含例如SBR 相關(guān)模塊)、分析QMF組320、低通濾波器(LP濾波器)330、AAC核心編碼器；340以及比特流有效載荷格式化器350。此外，編碼器300包含包絡(luò)數(shù)據(jù)計(jì)算器210。編碼器300包含PCM 樣本(音頻信號105 ；PCM =脈碼調(diào)制)的輸入端，該輸入端連接到分析QMF組320及BWE 相關(guān)模塊310及LP濾波器330。分析QMF組320可以包含用以分離第二頻帶10 的高通濾波器，且連接到包絡(luò)數(shù)據(jù)計(jì)算器210，該包絡(luò)數(shù)據(jù)計(jì)算器210連接到比特流有效載荷格式化器350。LP濾波器330可以包含用以分離第一頻帶10 的低通濾波器，且連接到AAC核心編碼器;340，該AAC核心編碼器340連接到比特流有效載荷格式化器350。最后，BffE相關(guān)模塊310連接到包絡(luò)數(shù)據(jù)計(jì)算器210及AAC核心編碼器340。因此，編碼器300對音頻信號105進(jìn)行下采樣，以產(chǎn)生核心頻帶10 中的分量(在 LP濾波器330中)，將該分量輸入到AAC核心編碼器；340中，該AAC核心編碼器340編碼核心頻帶中的音頻信號，以及將已編碼信號355轉(zhuǎn)發(fā)到比特流有效載荷格式器350，其中，將核心頻帶的已編碼音頻信號355加入到已編碼音頻串流345(比特流)中。另一方面，音頻信號105由分析QMF組320來分析，且該分析QMF組的高通濾波器提取高頻帶10 中的頻率分量，且將該信號輸入到包絡(luò)數(shù)據(jù)計(jì)算器210中，以產(chǎn)生BWE數(shù)據(jù)375。例如，64子頻帶 QMF組320執(zhí)行輸入信號的子頻帶濾波。來自濾波器組的輸出(即子頻帶樣本)是復(fù)數(shù)值，從而與規(guī)則QMF組相比，被兩倍過采樣。BffE相關(guān)模塊310例如可以包含用于產(chǎn)生BWE輸出數(shù)據(jù)102的裝置100，且通過例如將BffE輸出數(shù)據(jù)102(齒音參數(shù))提供到包絡(luò)數(shù)據(jù)計(jì)算器210來控制該包絡(luò)數(shù)據(jù)計(jì)算器 210。使用由分析QMF組320產(chǎn)生的音頻分量10 ，包絡(luò)數(shù)據(jù)計(jì)算器210計(jì)算BWE數(shù)據(jù)375 且將該BWE數(shù)據(jù)375轉(zhuǎn)發(fā)給比特流有效載荷格式化器350，該比特流有效載荷格式器350將 BffE數(shù)據(jù)375與通過核心編碼器340編碼的分量355組合在已編碼音頻流345中。此外，包絡(luò)數(shù)據(jù)計(jì)算器210例如可以使用齒音參數(shù)125，以調(diào)整噪聲包絡(luò)中的噪聲本底。備選地，用于產(chǎn)生BffE輸出數(shù)據(jù)102的裝置100也可以是包絡(luò)數(shù)據(jù)計(jì)算器210的
10一部分，且處理器也可以是比特流有效載荷格式化器350的一部分。因此，裝置100中的不同組件可以是圖3中的不同編碼器組件的一部分。圖4示出了解碼器400的實(shí)施例，其中將已編碼音頻流345輸入到比特流有效載荷解格式化器357中，比特流有效載荷解格式化器357使已編碼音頻信號355與BWE數(shù)據(jù) 375分離。將已編碼音頻信號355輸入到例如AAC核心解碼器360中，該AAC核心解碼器 360產(chǎn)生第一頻帶中的已解碼音頻信號10fe。將音頻信號105a (第一頻帶中的分量)輸入到分析32頻帶QMF組370中，該分析32頻帶QMF組370從第一頻帶中的音頻信號10 產(chǎn) 生例如32頻率子頻帶10532。將該頻率子頻帶音頻信號10532輸入到補(bǔ)丁發(fā)生器410中，以產(chǎn)生未處理的信號頻譜表示425 (補(bǔ)丁)，將其輸入到BWE工具430a中。該BWE工具430a 例如可以包含用以產(chǎn)生噪聲本底的噪聲本底計(jì)算單元。此外，該BWE工具430a可以重構(gòu)丟失的諧波或執(zhí)行逆濾波步驟。BffE工具430a可實(shí)施要用在補(bǔ)丁發(fā)生器410的QMF頻譜數(shù)據(jù) 輸出端的已知頻譜帶復(fù)制方法，用在頻域中的修補(bǔ)算法例如以采用頻域中的頻譜數(shù)據(jù)的簡單鏡像或復(fù)制。另一方面，將BWfE數(shù)據(jù)375(例如包含BWE輸出數(shù)據(jù)10 輸入到比特流剖析器380 中，該比特流剖析器380分析BWE數(shù)據(jù)375，以獲得不同的子信息385，且將這些子信息輸入到例如提取控制信息412及頻譜帶復(fù)制參數(shù)102的霍夫曼(Huffman)解碼與解量化單元 390中。該控制信息412控制補(bǔ)丁發(fā)生器410 (例如以使用特定修補(bǔ)算法)，且BWE參數(shù)102 也包含例如能量分布數(shù)據(jù)125 (例如齒音參數(shù))。將控制信息412輸入到BWE工具430a中，且將頻譜帶復(fù)制參數(shù)102輸入到BWE工具430a以及包絡(luò)調(diào)整器430b中。該包絡(luò)調(diào)整器 430b可操作以調(diào)整所產(chǎn)生補(bǔ)丁的包絡(luò)。因此，包絡(luò)調(diào)整器430b產(chǎn)生第二頻帶的經(jīng)調(diào)整未處理信號105b，且將其輸入到一合成QMF組440中，該合成QMF組440組合第二頻帶10 中的分量與頻域10532中的音頻信號。合成QMF組440例如可以包含64個(gè)頻帶，并且通過組合兩個(gè)信號(第二頻帶10 中的分量與頻域音頻信號10532)產(chǎn)生合成音頻信號105(例如 PCM樣本輸出，PCM =脈碼調(diào)制)。合成QMF組440可包含組合器，該組合器在將第二頻帶10 轉(zhuǎn)換到時(shí)域之前且在其將作為音頻信號105被輸出之前，組合頻域信號105%與該第二頻帶10恥?？蛇x地，組合器可輸出頻域中的音頻信號105。BffE工具430a可以包含傳統(tǒng)噪聲本底工具，該噪聲本底工具將額外的噪聲加入到經(jīng)修補(bǔ)頻譜(未處理信號頻譜表示42 ，使得頻譜分量10 顯示出原始信號的第二頻帶 105b的音調(diào)，其中該頻譜分量10 由核心編碼器340傳送且將用來合成第二頻帶10 的分量。然而，特別是在濁音語音路徑中，由傳統(tǒng)噪聲本底工具所加入的額外噪聲可能損害所再現(xiàn)信號的感知質(zhì)量。根據(jù)實(shí)施例，可以修改噪聲本底工具，使得噪聲本底工具考慮能量分布數(shù)據(jù) 125 (BffE數(shù)據(jù)102的一部分)，以根據(jù)所檢測到的齒音程度改變噪聲本底(參考圖幻。備選地，如上所述，可以不修改解碼器，而相反編碼器可根據(jù)所檢測到的齒音程度來改變噪聲本底數(shù)據(jù)。圖5示出了傳統(tǒng)噪聲本底計(jì)算工具與根據(jù)本發(fā)明實(shí)施例的經(jīng)修改的噪聲本底計(jì) 算工具的比較。該經(jīng)修改的噪聲本底計(jì)算工具可以是BWE工具430的一部分。圖fe示出了包含計(jì)算器433的傳統(tǒng)噪聲本底計(jì)算工具，其使用頻譜帶復(fù)制參數(shù)102和未處理信號頻譜表示425，以計(jì)算未處理頻譜線和噪聲頻譜線。BWE數(shù)據(jù)102可以包含包絡(luò)數(shù)據(jù)與和噪聲本底數(shù)據(jù)，從編碼器傳送該數(shù)據(jù)作為已編碼音頻流345的一部分。未處理信號頻譜表示425例如從補(bǔ)丁發(fā)生器獲得，該補(bǔ)丁發(fā)生器產(chǎn)生較高頻帶中的音頻信號分量(第二頻帶10 中的合成分量)。未處理頻譜線和噪聲頻譜線將進(jìn)一步被處理，這可能涉及逆濾波、包絡(luò)調(diào)整、加入丟失諧波等等。最后，組合器434將未處理頻譜線與計(jì)算的噪聲頻譜線組合到第二頻帶10 中的分量。圖恥示出了根據(jù)本發(fā)明的實(shí)施例的噪聲本底計(jì)算工具。除在圖fe中所示的傳統(tǒng) 噪聲本底計(jì)算工具以外，實(shí)施例包含噪聲本底修改單元431，該噪聲本底修改單元431被配置為例如在噪聲本底計(jì)算工具433中對傳送的噪聲本底數(shù)據(jù)進(jìn)行處理之前，基于能量分布數(shù)據(jù)125修改傳送的噪聲本底數(shù)據(jù)。也可以從編碼器傳送能量分布數(shù)據(jù)125作為BWE數(shù)據(jù) 102的一部分，或除BffE數(shù)據(jù)102之外，從編碼器傳送能量分布數(shù)據(jù)125。所傳送噪聲本底數(shù)據(jù)的修改包含，例如噪聲本底的級別的正頻譜傾斜的增加(參考圖2a)或噪聲本底的級別的負(fù)頻譜傾斜的減小(參考圖2b)，例如增加3dB或減小3dB或任何其它離散值(例如 +/-IdB或+/-2dB)。該離散值可以是整數(shù)dB值或非整數(shù)dB值。在減小/增加與頻譜傾斜之間也可能存在函數(shù)依賴(例如線性相關(guān))。基于這經(jīng)修改噪聲本底數(shù)據(jù)，噪聲本底計(jì)算工具433基于可以再次從補(bǔ)丁產(chǎn)生器中獲得的未處理信號頻譜表示425，再次計(jì)算未處理頻譜線和經(jīng)修改的噪聲頻譜線。圖恥中的頻譜帶復(fù)制工具430也包含組合器434，該組合器434用于組合未處理頻譜線與計(jì)算的噪聲本底(包括來自修改單元431的修改)，以產(chǎn)生第二頻帶10 中的分量。能量分布數(shù)據(jù)125可以指示最簡單情況下的對傳送的噪聲本底數(shù)據(jù)級別的修改。如上所述，第一 LPC系數(shù)同樣可用作能量分布數(shù)據(jù)125。因此，如果音頻信號105使用LPC 來編碼，則其他實(shí)施例使用第一 LPC系數(shù)，該第一 LPC系數(shù)是通過已編碼音頻流345來傳送作為能量分布數(shù)據(jù)125。在這種情況下，不需要另外傳送除能量分布數(shù)據(jù)125。備選地，噪聲本底的修改也可在計(jì)算器433中的計(jì)算的后執(zhí)行，使得噪聲本底修改單元431可以布置在處理器433之后。在其他實(shí)施例中，能量分布數(shù)據(jù)125可直接輸入到計(jì)算器433中，該計(jì)算器433直接修改噪聲本底的計(jì)算作為計(jì)算參數(shù)。因此，噪聲本底修改單元431和計(jì)算器/處理器433可已組合成噪聲本底修改器(modifier)工具433、431。在另一實(shí)施例中，包含噪聲本底計(jì)算工具的BWE工具430包含開關(guān)，其中該開關(guān)被配置為在噪聲本底的高級別(正頻譜傾斜)與噪聲本底的低級別(負(fù)頻譜傾斜)之間切換。該高級別例如可以與其中所傳送的噪聲級別被加倍(或與一個(gè)因子相乘)的情況相對應(yīng)，而低級別與其中所傳送級別被減倍的情況相對應(yīng)。開關(guān)可以受已編碼音頻信號345的比特流中的比特控制，該位指示音頻信號的正或負(fù)頻譜傾斜。備選地，該開關(guān)也可通過分析已解碼音頻信號105a (第一頻帶中的分量)或頻率子頻帶音頻信號105%來激活，例如相對于頻率傾斜(頻率傾斜是正還是負(fù))。備選地，開關(guān)也可由第一 LPC系數(shù)來控制，因?yàn)檫@系數(shù)指示頻率傾斜(參考上文)。盡管示意了圖1、圖3至圖5中的一些作為裝置的框圖，但是這些圖同時(shí)是方法的示意，其中方框的功能與方法步驟相對應(yīng)。如上所述，可以將SBR時(shí)間單元(SBR巾貞)或時(shí)間部分劃分成各種數(shù)據(jù)塊、所謂的包絡(luò)。這種劃分在SBR幀上是均勻的，且允許靈活調(diào)整SBR幀中的音頻信號的合成。
圖6示出了在η個(gè)包絡(luò)中針對SBR幀的這種劃分。SBR幀覆蓋開始時(shí)間、與結(jié)束時(shí)間tn之間的時(shí)間段或時(shí)間部分T。該時(shí)間部分T例如被劃分成八個(gè)時(shí)間部分第一時(shí)間
部分Tl、第二時(shí)間部分T2.....第八時(shí)間部分T8。在這個(gè)示例中，包絡(luò)的最大數(shù)目與時(shí)間
部分的數(shù)目相符，且η = 8。這8個(gè)時(shí)間部分Tl.....Τ8由7個(gè)邊界分開，這意味著邊界1
分開第一與第二時(shí)間部分Τ1、Τ2，邊界2位于第二部分Τ2與第三部分Τ3之間等等，直到邊界7分開第七部分Τ7與第八部分Τ8。在其他實(shí)施例中，SBR幀被分成四個(gè)噪聲包絡(luò)(n = 4)或者被分成兩個(gè)噪聲包絡(luò) (n = 2)。在第6圖中所示的實(shí)施例中，所有包絡(luò)包含相同的時(shí)間長度，在其它實(shí)施例中該時(shí)間長度可能是不同的，使得噪聲包絡(luò)覆蓋不同的時(shí)間長度。詳細(xì)地，具有兩個(gè)噪聲包絡(luò)(η =2)的情況包含在前四個(gè)時(shí)間部分(Τ1、Τ2、Τ3及Τ4)上從時(shí)間、延伸的第一包絡(luò)及覆蓋第五到第八時(shí)間部分(Τ5、Τ6、Τ7及Τ8)的第二噪聲包絡(luò)。由于標(biāo)準(zhǔn)IS0/IEC 14496-3，包絡(luò) 的最大數(shù)目限制為2。但是實(shí)施例可使用任何數(shù)目的包絡(luò)(例如兩個(gè)、四個(gè)或八個(gè)包絡(luò))。在其他實(shí)施例中，包絡(luò)數(shù)據(jù)計(jì)算器210被配置為依據(jù)所測量的噪聲本底數(shù)據(jù)115 的改變來改變包絡(luò)的數(shù)目。例如，如果所測量的噪聲本底數(shù)據(jù)115指示變化噪聲級別(例如大于一閾值)，則包絡(luò)的數(shù)目可以增加，而在噪聲本底數(shù)據(jù)115指示恒定噪聲本底的情況下，包絡(luò)的數(shù)目可以減少。在其它實(shí)施例中，信號能量表征器120可以基于語言信息，以檢測語音中的齒音。當(dāng)例如語音信號具有關(guān)聯(lián)元信息(諸如國際語音拼字)時(shí)，則該元信息的分析也將提供語音部分的齒音檢測。在該上下文中，對音頻信號的元數(shù)據(jù)部分進(jìn)行分析。盡管在裝置的上下文中描述了一些方面，但是清楚的是，這些方面也代表對應(yīng)方法的描述，其中模塊或設(shè)備與方法步驟或方法步驟的特征相對應(yīng)。類似地，在方法步驟的上下文中所描述的方面也代表對應(yīng)模塊或項(xiàng)目或?qū)?yīng)裝置的特征的描述。本發(fā)明的已編碼音頻信號可以儲存在數(shù)字儲存介質(zhì)上或可在諸如無線傳輸介質(zhì) 的傳輸介質(zhì)或諸如因特網(wǎng)的有線傳輸介質(zhì)上傳送。依據(jù)特定實(shí)施要求，本發(fā)明的實(shí)施例可在硬件或軟件中來實(shí)施。實(shí)施可以使用其上儲存有電可讀控制信號的數(shù)字儲存介質(zhì)來執(zhí)行，例如軟盤、DVD、CD、ROM、PROM、EPROM、 EEPROM或閃存，該電可讀控制信號可以與可編程計(jì)算機(jī)系統(tǒng)協(xié)作(或能夠協(xié)作)，使得執(zhí)行相應(yīng)方法。根據(jù)本發(fā)明的一些實(shí)施例包含具有電可讀控制信號的數(shù)據(jù)載體，該電可讀控制信號可以與可編程計(jì)算機(jī)系統(tǒng)協(xié)作，使得執(zhí)行這里所述的方法之一。一般地，本發(fā)明的實(shí)施例可實(shí)施為具有程序代碼的計(jì)算機(jī)程序產(chǎn)品，當(dāng)該計(jì)算機(jī) 程序產(chǎn)品在計(jì)算機(jī)上執(zhí)行時(shí)，該程序代碼可操作用于執(zhí)行方法之一。該程序代碼例如可以儲存在機(jī)器可讀載體上。其它實(shí)施例包含計(jì)算機(jī)程序，該計(jì)算機(jī)程序用于執(zhí)行這里所述的方法之一、儲存在機(jī)器可讀載體上。換言的，本發(fā)明方法的實(shí)施例因此是具有程序代碼的計(jì)算機(jī)程序，當(dāng)該計(jì)算機(jī)程序在計(jì)算機(jī)上執(zhí)行時(shí)，該程序代碼用于執(zhí)行這里所述的方法之一。因此，本發(fā)明方法的另一實(shí)施例是一種數(shù)據(jù)載體(或數(shù)字儲存介質(zhì)、或計(jì)算機(jī)可讀介質(zhì))，該數(shù)據(jù)載體包含、其上記錄有計(jì)算機(jī)程序，該計(jì)算機(jī)程序用以執(zhí)行這里所述的方法之一。因此，本發(fā)明方法的另一實(shí)施例是代表計(jì)算機(jī)程序的數(shù)據(jù)流或信號序列，該計(jì)算機(jī)程序用于執(zhí)行這里所述的方法之一。該數(shù)據(jù)流或信號序列例如可以被配置為經(jīng)由數(shù)據(jù)通信連接(例如經(jīng)由因特網(wǎng))來傳送。另一施例包含被配置為或適于執(zhí)行這里所述的方法之一的處理裝置，例如計(jì)算機(jī) 或可編程邏輯器件。另一實(shí)施例包含其上安裝用于執(zhí)行這里所述的方法之一的計(jì)算機(jī)程序的計(jì)算機(jī)。在一些實(shí)施例中，可編程邏輯器件(例如現(xiàn)場可編程門陣列)可以用來執(zhí)行這里所述方法的功能中的一些或全部。在一些實(shí)施例中，現(xiàn)場可編程門陣列可以與微處理器協(xié) 作，以執(zhí)行這里所述的方法之一。一般地，該等方法優(yōu)選地通過任何硬件裝置來執(zhí)行。就本發(fā)明的原理而言，上述實(shí)施例只是說明性的。需理解的是，這里所述配置及細(xì) 節(jié)的修改與變化對于本領(lǐng)域中的其它技術(shù)人員而言將是顯而易見的。因此，僅限于未決專利權(quán)利要求的范圍，而不限于這里實(shí)施例的描述與解釋所提出的特定細(xì)節(jié)。
權(quán)利要求
1.一種用于為音頻信號(10 產(chǎn)生帶寬擴(kuò)展輸出數(shù)據(jù)(10 的裝置(100)，所述音頻信號(10 包括第一頻帶(105a)中的分量和第二頻帶(105b)中的分量，所述帶寬擴(kuò)展輸出數(shù)據(jù)(10 適于控制第二頻帶(105b)中分量的合成，所述裝置包括噪聲本底測量器(110)，用于在音頻信號(105)的時(shí)間部分(T)內(nèi)測量第二頻帶 (105b)的噪聲本底數(shù)據(jù)(115)；信號能量表征器(120)，用于得到能量分布數(shù)據(jù)(125)，能量分布數(shù)據(jù)(12 表征音頻信號(105)的時(shí)間部分⑴的頻譜中的能量分布；以及處理器(130)，用于組合噪聲本底數(shù)據(jù)(1巧)與能量分布數(shù)據(jù)(125)，以獲得帶寬擴(kuò)展輸出數(shù)據(jù)(102)。
2.如權(quán)利要求1所述的裝置(100)，其中，信號能量表征器(120)被配置為使用齒音參數(shù)或頻譜傾斜參數(shù)作為能量分布數(shù)據(jù)(125)，所述齒音參數(shù)或頻譜傾斜參數(shù)標(biāo)識音頻信號 (105)隨頻率(F)的增大或減小級別。
3.如權(quán)利要求2所述的裝置(100)，其中，信號能量表征器(120)被配置為使用第一線性預(yù)測編碼系數(shù)作為所述齒音參數(shù)。
4.如前述權(quán)利要求中任一項(xiàng)所述的裝置(100)，其中，處理器(130)被配置為將該噪聲本底數(shù)據(jù)(115)和頻譜能量分布數(shù)據(jù)(125)加到比特流中，作為OTE輸出數(shù)據(jù)(102)。
5.如權(quán)利要求1至3中任一項(xiàng)所述的裝置(100)，其中，處理器(130)被配置為根據(jù) 能量分布數(shù)據(jù)(12 改變噪聲本底數(shù)據(jù)(115)，以獲得修改的噪聲本底數(shù)據(jù)，并且，處理器 (130)被配置為將修改的噪聲本底數(shù)據(jù)加到比特流中，作為BffE輸出數(shù)據(jù)(102)。
6.如權(quán)利要求5所述的裝置(100)，其中，噪聲本底數(shù)據(jù)(115)的改變是，使得與包括較少齒音的音頻信號(105)相比較，修改的噪聲本底針對包括較多齒音的音頻信號(105) 而增加。
7.一種用于編碼音頻信號(10 的編碼器(300)，音頻信號(105)包括第一頻帶 (105a)中的分量和第二頻帶(105b)中的分量，所述編碼器(300)包括核心編碼器(340)，用于編碼第一頻帶(105a)中的分量；如權(quán)利要求1至6中任一項(xiàng)所述的用于產(chǎn)生OTE輸出數(shù)據(jù)(102)的裝置(100)；以及包絡(luò)數(shù)據(jù)計(jì)算器010)，用于基于第二頻帶(105b)中的分量，來計(jì)算BffE數(shù)據(jù)(375)，其中，所計(jì)算的BffE數(shù)據(jù)(37 包括BffE輸出數(shù)據(jù)(102)。
8.如權(quán)利要求7所述的編碼器(300)，其中，時(shí)間部分(T)覆蓋SBR幀，所述SBR幀包括多個(gè)噪聲包絡(luò)，且所述包絡(luò)數(shù)據(jù)計(jì)算器(210)被配置為，為多個(gè)噪聲包絡(luò)中的不同噪聲包絡(luò)計(jì)算不同的BffE數(shù)據(jù)(375)。
9.如權(quán)利要求7或8所述的編碼器(300)，其中，包絡(luò)數(shù)據(jù)計(jì)算器(210)被配置為根據(jù) 測量的噪聲本底數(shù)據(jù)(11 的改變，來改變包絡(luò)的數(shù)目。
10.一種用于為音頻信號(105)產(chǎn)生帶寬擴(kuò)展輸出數(shù)據(jù)(102)的方法，音頻信號(105) 包括第一頻帶(105a)中的分量和第二頻帶(105b)中的分量，帶寬擴(kuò)展輸出數(shù)據(jù)(102)適于控制第二頻帶(105b)中的分量的合成，所述方法包括以下步驟在音頻信號(105)的時(shí)間部分(T)內(nèi)測量第二頻帶(105b)中的噪聲本底數(shù)據(jù)(115)；得到能量分布數(shù)據(jù)(125)，能量分布數(shù)據(jù)(12 表征音頻信號(10 的時(shí)間部分(T)的頻譜中的能量分布；以及組合噪聲本底數(shù)據(jù)(11 與能量分布數(shù)據(jù)(125)，以獲得帶寬擴(kuò)展輸出數(shù)據(jù)(102)。
11.一種帶寬擴(kuò)展工具G30)，用于針對第二頻帶(105b)中的分量，基于帶寬擴(kuò)展輸出數(shù)據(jù)(10 且基于未處理信號頻譜表示025)，產(chǎn)生音頻信號(10 的第二頻帶(105b)中的分量，其中，帶寬擴(kuò)展輸出數(shù)據(jù)(10 包括能量分布數(shù)據(jù)(125)，能量分布數(shù)據(jù)(12 表征音頻信號(10 的時(shí)間部分(T)的頻譜中的能量分布，所述帶寬擴(kuò)展工具(430)包括噪聲本底修改器工具033，431)，被配置為根據(jù)能量分布數(shù)據(jù)(12 來修改所傳送的噪聲本底；以及組合器034)，用于組合未處理信號頻譜表示(42 與修改的噪聲本底，以產(chǎn)生第二頻帶(105b)中具有修改的噪聲本底的分量。
12.如權(quán)利要求11所述的帶寬擴(kuò)展工具G30)，其中，音頻信號(10 包括第一頻帶 (105a)中的分量，并且?guī)挃U(kuò)展參數(shù)(102)包括對噪聲本底的噪聲級別加以指示的所傳送的噪聲本底數(shù)據(jù)，以及其中，噪聲本底修改器工具(433、431)適于在能量分布數(shù)據(jù)(12 指示音頻信號(10 在第二頻帶(105b)的分量中比在第一頻帶(105a)的分量中包括更多能量的情況下，增加噪聲級別，或者在能量分布數(shù)據(jù)(12 指示音頻信號(10 在第一頻帶(105a)的分量中比在第二頻帶(105b)的分量中包括更多能量的情況下，減小噪聲級別。
13.一種用于對已編碼音頻流(345)進(jìn)行解碼以獲得音頻信號(105)的解碼器，包括比特流解格式化器(375)，分離已編碼信號(355)與BffE輸出數(shù)據(jù)(102)；如權(quán)利要求11或權(quán)利要求12所述的帶寬擴(kuò)展工具G30)；核心解碼器(360)，用于從已編碼音頻信號(355)中解碼第一頻帶(105a)中的分量；以及合成單元G40)，用于通過組合第一頻帶(105a)與第二頻帶(105b)中的分量，來合成音頻信號(105)。
14.一種用于對已編碼音頻流(34 進(jìn)行解碼以獲得音頻信號(10 的方法，該音頻信號(10 包括第一頻帶(105a)中的分量和帶寬擴(kuò)展輸出數(shù)據(jù)(102)，其中，帶寬擴(kuò)展輸出數(shù)據(jù)(10 包括能量分布數(shù)據(jù)(12 和噪聲本底數(shù)據(jù)，能量分布數(shù)據(jù)(12 表征音頻信號 (105)的時(shí)間部分(T)的頻譜中的能量分布，所述方法包括從已編碼音頻流(345)中分離出已編碼音頻信號(355)和BffE輸出數(shù)據(jù)(102)；從已編碼音頻信號(355)中解碼出第一頻帶(105a)中的分量；從第一頻帶(105a)中的分量中產(chǎn)生針對第二頻帶(105b)中的分量的未處理信號頻譜表示(425)；根據(jù)能量分布數(shù)據(jù)(12 且根據(jù)所傳送的噪聲本底數(shù)據(jù)，來修改噪聲本底；組合未處理信號頻譜表示(42 與修改的噪聲本底，以產(chǎn)生第二頻帶(105b)中的具有計(jì)算的噪聲本底的分量；以及通過組合第一頻帶(105a)與第二頻帶(105b)中的分量，來合成音頻信號(105)。
15.一種計(jì)算機(jī)程序，當(dāng)在計(jì)算機(jī)上執(zhí)行時(shí)用于執(zhí)行如權(quán)利要求10或權(quán)利要求14所述的方法。
16.一種已編碼音頻流(345)，包括已編碼音頻信號(355)，針對音頻信號(10 的第一頻帶(105a)中的分量；噪聲本底數(shù)據(jù)，適于控制針對音頻信號(105)的第二頻帶(105b)中的分量的噪聲本底的合成；以及能量分布數(shù)據(jù)(125)，適于控制噪聲本底的修改。
全文摘要
一種用于為音頻信號產(chǎn)生帶寬擴(kuò)展輸出數(shù)據(jù)的裝置(100)，包含噪聲本底測量器(110)、信號能量表征器(120)和處理器(130)。該音頻信號(105)包含第一頻帶(105a)中的分量和第二頻帶(105b)中的分量，該帶寬擴(kuò)展輸出數(shù)據(jù)(102)適于控制該第二頻帶中的分量的合成。該噪聲本底測量器(110)在音頻信號(105)的時(shí)間部分(T)內(nèi)測量該第二頻帶(105b)中的噪聲本底數(shù)據(jù)。信號能量表征器(120)得到能量分布數(shù)據(jù)，該能量分布數(shù)據(jù)(125)表征音頻信號(105)的時(shí)間部分(T)的頻譜中的能量分布。處理器(130)組合噪聲本底數(shù)據(jù)(115)與能量分布數(shù)據(jù)(125)，以獲得帶寬擴(kuò)展輸出數(shù)據(jù)(102)。
文檔編號G10L21/02GK102144259SQ200980134905
公開日2011年8月3日申請日期2009年6月23日優(yōu)先權(quán)日2008年7月11日
發(fā)明者烏爾里赫·克里默, 伯恩哈德·格里爾, 哈拉爾德·波普, 尼古拉斯·雷特爾巴, 弗雷德里克·內(nèi)格爾, 曼努埃爾·揚(yáng)德爾, 維爾吉利奧·巴奇加盧波, 馬克思·諾伊恩多夫, 馬庫斯·洛瓦索, 馬庫斯·穆爾特魯斯, 馬雷·蓋爾申請人:弗勞恩霍夫應(yīng)用研究促進(jìn)協(xié)會

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：馬克思·諾伊恩多夫
技術(shù)所有人：弗勞恩霍夫應(yīng)用研究促進(jìn)協(xié)會
我是此專利的發(fā)明人

上一篇：編碼方案確定的方法和設(shè)備的制作方法
上一篇：用于產(chǎn)生爆炸的設(shè)備和方法

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點(diǎn)贊！

精彩留言，會給你點(diǎn)贊！

機(jī)戰(zhàn)擴(kuò)展裝置相關(guān)技術(shù)

漏電保護(hù)裝置主要用于相關(guān)技術(shù)

漏電保護(hù)裝置用于相關(guān)技術(shù)

用于室內(nèi)高壓配電裝置相關(guān)技術(shù)

圖1所示裝置可用于相關(guān)技術(shù)

用于室外配電裝置相關(guān)技術(shù)

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

用于產(chǎn)生帶寬擴(kuò)展輸出數(shù)據(jù)的裝置和方法