噪聲填充與帶寬擴展之間的自適應(yīng)過渡頻率的制作方法

文檔序號：2831816閱讀：246來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專利名稱：噪聲填充與帶寬擴展之間的自適應(yīng)過渡頻率的制作方法
技術(shù)領(lǐng)域：
本發(fā)明主要涉及用于對音頻信號編碼和解碼的方法和設(shè)備，并且具體來說涉及用于頻譜填充的方法和設(shè)備。
背景技術(shù)：
當要存儲和/或傳送音頻信號時，目前的標準方法是根據(jù)不同的方案將音頻信號編碼成數(shù)字表示。為了節(jié)省存儲和/或傳送容量，一般期望減小允許以足夠的質(zhì)量來重構(gòu) 音頻信號所需的數(shù)字表示的大小。編碼的信號的大小與信號質(zhì)量之間的平衡取決于實際應(yīng) 用?；谧儞Q的音頻編碼器通過將變換系數(shù)量化來壓縮音頻信號。為了實現(xiàn)低比特率，量化器可能將可用的比特集中于最有能量且感知相關(guān)的系數(shù)上，并且僅傳送那些系數(shù)，從而在頻譜中留下未量化的系數(shù)的“頻譜空洞”。所謂的SBR (頻帶復(fù)制)技術(shù)(參見例如 3GPP TS 26. 404V6. 0. 0 (2004-09)， "Enhanced aacPlus general audio codec-encoder SBR part (Release 6)，，, 2004 [1])閉合常規(guī)感知編碼器的帶限信號與約15kHz的可聽帶寬之間的間隙。SBR后的一般原理是以感知上精確的方式重新創(chuàng)建已解碼信號的丟失的高頻內(nèi)容。從心理聲學(xué)的角度來說，15kHz 以上的頻率是不那么重要的，但是也可以被重構(gòu)。但是，SBR無法用作獨立的編解碼器。它總是結(jié)合常規(guī)波形編解碼器(所謂的核心編解碼器)來操作。核心編解碼器負責傳送原始頻譜的較低部分，而SBR解碼器(其主要是對常規(guī)波形解碼器的后處理)重構(gòu)非傳送的頻率范圍。與常規(guī)編解碼器中一樣，不直接傳送高頻帶的頻譜值。該組合的系統(tǒng)提供優(yōu)于單獨的核心編解碼器的增益的編碼增益。SBR方法依賴于低頻帶、編碼的感知相關(guān)的低頻率、以及高頻帶、未編碼的不那么相關(guān)的高頻率之間固定的過渡頻率的定義。但是，在實踐中，此過渡頻率依賴于原始信號的音頻內(nèi)容。換言之，從一個信號到另一個信號，適合的過渡頻率可能變化得很大。例如，在將清晰的話音與全頻帶的音樂信號比較時，情況是如此。解碼的頻譜的“頻譜空洞”可以分成兩種類型。第一種是較低頻率處的小空洞，其是由于瞬時屏蔽(instantaneous masking)的效應(yīng)所致，參見例如J. D. Johnston 的“Estimation of Perceptual Entropy UsingNoise Masking Criteria " (Proc. ICASSP，2524-2527頁，1988年五月[2]).第二種是高頻率處的較大的空洞，是由于屏蔽的添加和聽覺的絕對閾值導(dǎo)致的飽和所引起的[2]。SBR主要涉及第二種。而且，基于這種方法的典型音頻編解碼器(其目的在于為高頻率填充“頻譜空洞”，即未編碼的系數(shù)，即第二種類型的“頻譜空洞”)優(yōu)選地應(yīng)該能夠填充整個頻譜上的頻譜空洞。實際上，即使SBR編解碼器能夠輸送全帶寬音頻信號，重構(gòu)的高頻率仍不會屏蔽編碼(即低頻帶的量化，該低頻帶即是感知相關(guān)的低頻率)引入的惱人的偽跡(artefact)。

發(fā)明內(nèi)容
本發(fā)明的主要目的在于提供用于實現(xiàn)有效抑制全頻帶音頻信號上頻譜空洞引起的感知偽跡的方法和設(shè)備。上面的目的通過如所附專利權(quán)利要求所述的方法和設(shè)備來實現(xiàn)?？偟膩碚f，根據(jù) 第一方面，一種用于音頻信號的頻譜解碼中的頻譜恢復(fù)的方法，包括獲取表示音頻信號的頻譜系數(shù)的初始集合，并確定過渡頻率。過渡頻率適應(yīng)于音頻信號的頻譜內(nèi)容。對頻譜系數(shù)的初始集合中過渡頻率以下的頻譜空洞進行噪聲填充，在過渡頻率以上對頻譜系數(shù)的初始集合進行帶寬擴展。根據(jù)第二方面，一種用于在音頻信號的頻譜編碼中使用的方法，包括確定用于表示音頻信號的頻譜系數(shù)的初始集合的過渡頻率。過渡頻率適應(yīng)于音頻信號的頻譜內(nèi)容。過渡頻率定義打算作為用于頻譜空洞的噪聲填充的對象的頻率范圍與打算作為用于帶寬擴展的對象的頻率范圍之間的邊界。根據(jù)第三方面，一種用于音頻信號的頻譜解碼的解碼器，包括用于獲取表示音頻信號的頻譜系數(shù)的初始集合的輸入和布置用于確定過渡頻率的過渡確定電路。過渡頻率適應(yīng)于音頻信號的頻譜內(nèi)容。該解碼器包括用于噪聲填充頻譜系數(shù)的初始集合中過渡頻率以下的頻譜空洞的噪聲填充器，和布置用于在過渡頻率以上帶寬擴展頻譜系數(shù)的初始集合的帶寬擴展器。根據(jù)第四方面，一種用于音頻信號的頻譜編碼的編碼器，包括布置用于確定用于表示音頻信號的頻譜系數(shù)的初始集合的過渡頻率的過渡確定電路。過渡頻率適應(yīng)于音頻信號的頻譜內(nèi)容。過渡頻率定義打算作為用于頻譜空洞的噪聲填充的對象的頻率范圍與打算作為用于帶寬擴展的對象的頻率范圍之間的邊界。本發(fā)明具有多個優(yōu)點。一個優(yōu)點是過渡頻率的使用允許使用噪聲填充和帶寬擴展的組合頻譜填充的使用。而且，過渡頻率是以自適應(yīng)的方式定義的，即根據(jù)所使用的編碼方案來定義的，這使得頻譜填充取決于例如頻率分辨率。使用此方法的任何話音和/或音頻編解碼器能夠輸送高質(zhì)量(即減少了惱人的偽跡)且全帶寬的音頻信號。在該方法可以與任何類型的頻率表示(DCT、MDCT等)或濾波器組組合、即與任何編解碼器(感知的、參數(shù)的等)組合的意義上而言，該方法是靈活的。

通過參考下文結(jié)合附圖的描述，將更好地理解本發(fā)明及其進一步的目的和優(yōu)點，其中圖1是編解碼器系統(tǒng)的示意框圖；圖2是根據(jù)本發(fā)明的音頻信號編碼器的一個實施例的示意框圖；圖3是頻譜系數(shù)、其組和頻帶的示意圖示；圖4是根據(jù)本發(fā)明的音頻信號解碼器的一個實施例的示意框圖；圖5A-C是用于查找過渡頻率的原理的實施例的圖示；圖6是根據(jù)本發(fā)明的方法的一個實施例的步驟的流程圖；圖7是根據(jù)本發(fā)明的信號處理方法的一個實施例的步驟的流程圖。
具體實施例方式在所有附圖中，相同的引用數(shù)字用于相似或?qū)?yīng)的單元。圖1中示意地示出用于音頻信號的普通編解碼器系統(tǒng)的一個實施例。音頻源10 產(chǎn)生音頻信號15。在編碼器20中處理音頻信號15，編碼器20產(chǎn)生包含表示音頻信號15 的數(shù)據(jù)的二進制流(binary flux) 25。二進制流25例如在多媒體通信的情況中可通過傳送和/或存儲裝置30來傳送?？蛇x地，傳送和/或存儲裝置30還可以包括某些存儲容量。二進制流25還可以僅存儲在傳送和/或存儲裝置30中，這僅僅在二進制流的利用中引入時間延遲。因此，傳送和/或存儲裝置30是引入二進制流25的空間重定位或時間延遲中至少一項的裝置。當使用時，在解碼器40中處理二進制流25，解碼器40從二進制流中包含的數(shù)據(jù)產(chǎn)生音頻輸出35。通常，音頻輸出35應(yīng)該在某些約束下盡可能完好地類似于原始音頻信號15。在許多實時應(yīng)用中，原始音頻信號15的產(chǎn)生與產(chǎn)生的音頻輸出35之間的時間延遲通常不允許超過某個時間。如果傳送資源在同時是受限制的，則可用的比特率也通常低。為了以最佳可能的方式利用可用的比特率，開發(fā)了感知音頻編碼。因此，感知音頻編碼已經(jīng) 成為目前許多多媒體服務(wù)的重要部分。其基本原理是，將音頻信號轉(zhuǎn)換成頻域中的頻譜系數(shù)，并使用感知模型來確定這些頻譜系數(shù)的頻率和時間相關(guān)的屏蔽。圖2示出根據(jù)本發(fā)明的音頻編碼器20的一個實施例。在此特定實施例中，感知音頻編碼器20是基于感知變換器或感知濾波器組的頻譜編碼器。接收音頻源15，包括音頻信號χ [η]的幀。在典型的頻譜編碼器中，轉(zhuǎn)換器21布置用于將時域音頻信號15轉(zhuǎn)換成頻域的頻譜系數(shù)Xb[n]的集合24。在典型的變換編碼器中，該轉(zhuǎn)換可以例如由離散傅立葉變換 (DFT)、離散余弦變換(DCT)或修改的離散余弦變換(MDCT)來執(zhí)行。因此，轉(zhuǎn)換器21通常可以由頻譜變換器來構(gòu)建。實際變換的細節(jié)對于本發(fā)明的基本原理并非特別重要，因此不進一步論述。將頻譜系數(shù)的集合24，即輸入的音頻信號的頻率表示，提供到量化和編碼部分 28，其中將頻譜系數(shù)量化并編碼。通常，量化為將可用比特集中在最有能量且感知相關(guān)的系數(shù)上而操作。這可以使用例如不同類型的屏蔽閾值或帶寬縮減來執(zhí)行。其結(jié)果通常將是頻譜中未量化的系數(shù)的“頻譜空洞”。換言之，故意將一些系數(shù)保留在外(因為它們在感知上不那么重要)，以便不占用其他目的更需要的傳送資源。然后可以在解碼器一側(cè)通過不同的重構(gòu)策略來校正或重構(gòu)此類頻譜空洞。通常，呈現(xiàn)兩種類型的頻譜空洞。第一種類型包括這樣的頻譜空洞，主要在低頻率區(qū)域中占據(jù)在不同位置的單獨的頻譜空洞或幾個相鄰的頻譜空洞。第二種類型是在頻譜的高頻端處或多或少的連續(xù)的頻譜空洞組。根據(jù)本發(fā)明，有利的是以不同的方式來處理這兩種不同類型的頻譜空洞，以便實現(xiàn)盡可能有效率的頻譜填充。要確定的一個參數(shù)因此是過渡頻率，在此頻率處不同的填充方法會合，所以稱為過渡頻率。因為頻譜空洞的分布在不同類型的音頻信號之間有所不同，所以過渡頻率的最佳選擇也有所不同。根據(jù)本發(fā)明，該過渡頻率適應(yīng)于音頻信號的頻譜內(nèi) 容。通常，過渡頻率適應(yīng)于音頻信號的當前幀的頻譜內(nèi)容，但是，過渡頻率還可以取決于音頻信號的先前幀的頻譜內(nèi)容，并且如果沒有嚴格的延遲要求，則過渡頻率還可以取決于音頻信號的將來幀的頻譜內(nèi)容。此適應(yīng)可以在編碼器一側(cè)由過渡確定電路60來執(zhí)行，過渡確定電路60通常與量化和編碼部分28集成在一起。但是，在備選實施例中，過渡確定電路60 可以作為單獨操作的部分來提供，從而僅將表示過渡頻率的參數(shù)提供到編碼器20的不同功能性?？梢栽诰幋a器一側(cè)將該過渡頻率用于例如在過渡頻率不同側(cè)提供用于頻率間隔的適合的包絡(luò)編碼。量化和編碼部分28還布置用于根據(jù)將要使用的傳送或存儲標準，將編碼的頻譜系數(shù)與附加的邊信息(side information)封裝成比特流。從而從量化和編碼部分28輸出具有表示頻譜系數(shù)的集合的數(shù)據(jù)的二進制流25。因為過渡頻率可直接從音頻信號的頻譜內(nèi) 容推導(dǎo)出，所以相同的推導(dǎo)可以在傳送接口的兩側(cè)執(zhí)行，即在編碼器和解碼器來執(zhí)行。這意味著過渡頻率自身的值不一定必須在附加的邊信息中傳送。但是，如果有可用的比特率容量，則那樣做當然是可能的。在特定實施例中，使用MDCT變換。在由心理聲學(xué)模型執(zhí)行的加權(quán)后，MDCT系數(shù)使用矢量量化來量化。在矢量量化VQ中，將頻譜系數(shù)劃分到小組中。每組系數(shù)可以視為單個矢量，并且每個矢量單獨地來量化。例如，因為比特率上的高限制，量化器可將可用的比特集中于最有能量且感知相關(guān)的組上，從而導(dǎo)致一些組被設(shè)置為零。這些組形成量化的頻譜中的頻譜空洞。圖3中示出此情況。在本實施例中，組70包括相同數(shù)量的頻譜系數(shù)71，在本例中是4個。但是，在備選實施例中，具有不同數(shù)量的頻譜系數(shù)的組也可以是可能的。在一個特定實施例中，所有組每個僅包括一個頻譜系數(shù)，即組與頻譜系數(shù)本身是相同的。附圖中以未填充的矩形來示出量化的組72，而將設(shè)置為零的組73示出為黑色矩形。傳送到任何最終用戶的通常僅是量化的組72。系數(shù)的組70又劃分到不同的頻帶74中。該劃分優(yōu)選地根據(jù)某種心理聲學(xué)準則來執(zhí)行。由此可以共同地對待具有基本相似的心理聲學(xué)屬性的組。因此每個頻帶74的成員的數(shù)量、即與頻帶74關(guān)聯(lián)的組70的數(shù)量可以有所不同。如果大頻率部分具有相似的屬性，則覆蓋這些頻率的頻帶可能具有大的頻率范圍。如果心理聲學(xué)屬性在頻率上快速變化，則這反而要求小頻率范圍的頻帶。用于頻譜填充的例程可以優(yōu)選地取決于要填充的頻帶，正如下文進一步詳細論述的。在解碼階段，基本實施反向操作。圖4中示出根據(jù)本發(fā)明的音頻解碼器40的一個實施例。接收到二進制流25，其具有上文描述的編碼器導(dǎo)致的屬性。在頻譜系數(shù)解碼器41 中執(zhí)行對接收的二進制流25(例如比特流)的去量化和解碼。頻譜系數(shù)解碼器41布置用于將從二進制流恢復(fù)的頻譜系數(shù)解碼成頻譜系數(shù)的初始集合42的解碼的頻譜系數(shù)XQ[n]，它們可能被分組在頻率組XbQ[n]中?？赡茉诤筇幚?例如屏蔽閾值或帶寬縮減)之后，頻譜系數(shù)的初始集合42優(yōu)選地類似于由編碼器一側(cè)的轉(zhuǎn)換器提供的頻譜系數(shù)的集合。正如上文進一步論述的，在編碼器應(yīng)用屏蔽閾值或帶寬縮減通常導(dǎo)致頻譜系數(shù)的集合42在它通常包括所謂的“頻譜空洞”的意義上來說是不完整的?！邦l譜空洞”對應(yīng)于不在二進制流中接收的頻譜系數(shù)。換言之，頻譜空洞是未定義或非編碼的頻譜系數(shù)XQ[n]或由頻譜系數(shù)解碼器41自動設(shè)置成預(yù)定值(通常為零)的頻譜系數(shù)。為了避免可聽偽跡，這些系數(shù)必須在解碼器由估計來替代(填充)。頻譜空洞常常以兩種類型出現(xiàn)。小頻譜空洞通常在低頻率處，以及一個或幾個大頻譜空洞通常出現(xiàn)在高頻率處。
為了將解碼的音頻信號中的偽跡減到最少，解碼器通過以系數(shù)的估計替代頻譜中的頻譜空洞來“填充”頻譜。這些估計可以基于解碼器傳送的邊信息和/或可以取決于信號本身。此類有用的邊信息示例可以是頻譜的功率包絡(luò)和音調(diào)，即，丟失的系數(shù)的頻譜平滑度測量?？梢允褂脙煞N不同方法來填充不同類型的頻譜空洞?！霸肼曁畛洹睂τ谳^低頻率中的頻譜空洞表現(xiàn)很好，而“帶寬擴展”在高頻率更適合。本發(fā)明描述決定應(yīng)該分別在哪里使用噪聲填充和帶寬擴展的方法。本發(fā)明依賴于頻譜的低相關(guān)部分和高相關(guān)部分之間的過渡頻率的定義?；诖?信息，依賴于高質(zhì)量“噪聲填充”過程的典型編碼算法將能夠減少對于低速率出現(xiàn)的編碼偽跡，并且還能夠基于“帶寬擴展”甚至以低速率并利用低復(fù)雜度方案來重新生成全帶寬音頻信號。這在下文將更詳細地進一步論述。來自頻譜系數(shù)解碼器41的頻譜系數(shù)的初始集合42通常包括提供到過渡確定電路 60的某個數(shù)量的頻譜空洞。過渡確定電路60布置用于確定過渡頻率ft。還將來自頻譜系數(shù)解碼器41的頻譜系數(shù)的初始集合42提供到頻譜填充器43。頻譜填充器43布置用于對頻譜系數(shù)的初始集合42進行頻譜填充，從而得到重構(gòu)的頻譜系數(shù) X' b[n]的完整集合44。重構(gòu)的頻譜系數(shù)的集合44通常具有定義的某個頻率范圍內(nèi)的所有頻譜系數(shù)。頻譜填充器43又包括噪聲填充器50。噪聲填充器50布置用于優(yōu)選地在低頻率區(qū) 域中(即過渡頻率ft以下)提供用于頻譜空洞的噪聲填充的過程。因此，對頻譜系數(shù)的初始集合中在過渡頻率以下由于未包含在接收的編碼的比特流中而“丟失”的頻譜系數(shù)賦值。為此，將來自過渡確定電路60的輸出65連接到噪聲填充器50，從而提供與過渡頻率ft關(guān) 聯(lián)的信息。頻譜填充器43還包括帶寬擴展器55，帶寬擴展器55布置用于在過渡頻率以上對頻譜系數(shù)的初始集合進行帶寬擴展以便產(chǎn)生重構(gòu)的頻譜系數(shù)的集合44。因此，也將來自過渡確定電路60的輸出65連接到帶寬擴展器55。如上所述，來自頻譜填充器43的結(jié)果是重構(gòu)的頻譜系數(shù)X' b[n]的完整集合44，具有定義的某個頻率范圍內(nèi)的所有頻譜系數(shù)。將重構(gòu)的頻譜系數(shù)的集合44提供到連接到頻譜填充器43的轉(zhuǎn)換器45。轉(zhuǎn)換器 45布置用于將頻域的頻譜系數(shù)的集合44轉(zhuǎn)換成時域的音頻信號46。在本實施例中，轉(zhuǎn)換器45基于感知變換器，對應(yīng)于編碼器20中使用的變換技術(shù)(圖2)。在特定實施例中，利用反向變換(例如反向MDCT-IMDCT或反向DFT-IDFT等)將信號提供回時域。在其他實施例中，可以利用反向濾波器組。與在編碼器一側(cè)一樣，轉(zhuǎn)換器45的技術(shù)同樣是本領(lǐng)域中公知的，并且不會進一步論述?？赡芾眠M一步的處理步驟，在用于音頻信號的輸出35提供最終的感知重構(gòu)的音頻信號34χ' [η]。編解碼器必須判定在什么頻帶中要使用噪聲填充以及在什么頻帶中要使用帶寬擴展。當量化要填充的頻帶的大多數(shù)組，并且該頻帶中只有少數(shù)頻譜空洞時，噪聲填充給出最佳結(jié)果。當高頻率中大部分信號保留不量化時，帶寬擴展是優(yōu)選的。—個基本方法將是在噪聲填充與帶寬擴展之間設(shè)置固定的過渡頻率。通過噪聲填充來填充頻帶或組中該頻率以下的頻譜空洞，通過帶寬擴展來填充組或頻帶中該頻率以上
8的頻譜空洞。
但是，此方法的問題在于，最佳過渡頻率并非對于所有音頻信號都是相同的。一些信號具有集中在低頻率中的大多數(shù)能量，并且信號的大部分能經(jīng)受帶寬擴展。其他信號具有更平均地散布在頻譜上的其能量，并且這些信號可受益于僅使用噪聲填充。
根據(jù)按照本發(fā)明的方法的一個實施例，過渡頻率自適應(yīng)地取決于頻譜系數(shù)的所述初始集合中的頻譜空洞的分布。用于查找適合的過渡頻率的例程可以是遍歷所有頻帶，從最高(BN)開始向下到l。如果當前頻帶中沒有量化的系數(shù)，則將通過帶寬擴展來填充它。如果帶寬中有量化的系數(shù)，則使用噪聲填充來填充此頻帶以及跟隨的頻帶的空洞。因此，將過渡頻率設(shè)置在從高頻率一側(cè)看的其中具有量化的系數(shù)的第一頻帶的上限。這在圖5A中示出。頻帶N中的頻譜空洞77(即過渡頻率f+以上)因此利用帶寬擴展方法來填充。反過來過渡頻率f+以下的頻譜空洞76通過噪聲填充來填充。
圖5B中示出一個備選實施例。此處過渡頻率的定義直接基于組70，而忽略頻帶劃分。此處，對從最高頻率向下到緊接第一量化組78以上的組的所有組使用帶寬擴展。反過來過渡頻率f+以下的頻譜空洞76通過噪聲填充來填充。[ooso] 這些方法對于音頻信號和量化器(即編碼方案)更具自適應(yīng)性，但是當信號例如根據(jù)圖5C來量化時它可能遇到小問題。此處，將信號的高頻率的大部分設(shè)置為零，并且從頻帶B9到B12優(yōu)選地應(yīng)該使用帶寬擴展。但是，因為頻帶B11中有單個編碼的量化組79，所以帶寬擴展將完全地在此量化組79以下被禁用，并且在直到此組79的所有頻帶使用噪聲填充。
也是為了避免此問題，還提出另一個實施例，其中根據(jù)頻帶中的頻譜空洞的比例來選擇過渡頻率f+。與先前實施例中一樣，編解碼器遍歷頻帶，從最高開始向下到l。對于每個頻帶，對編碼的頻譜系數(shù)或組的數(shù)量計數(shù)。如果量化的系數(shù)或組的數(shù)量除以頻譜系數(shù)或組的總數(shù)(即頻帶的編碼的頻譜系數(shù)的比例)超過某個閡值，則利用噪聲填充來填充該頻帶和跟隨的頻帶的頻譜空洞。否則，使用帶寬擴展。類似地，可以監(jiān)視頻帶中的頻譜空洞的比例。換言之，要找出過渡頻帶，它是其中頻譜空洞的比例低于第一閡值的最高頻帶。
選擇過渡頻帶還有備選準則。一種可能性是使閡值本身取決于頻率。以此方式，在高頻率部分中可以接受頻譜空洞的某個比例以用于仍使用帶寬擴展技術(shù)，而在低頻率部分中不可接受。本領(lǐng)域技術(shù)人員認識到，可以通過多種方式來更改選擇適合準則的細節(jié)，例如根據(jù)其他信號相關(guān)屬性或其他邊信息。
在一個實施例中，過渡頻率根據(jù)過渡頻帶的頻率上限來設(shè)置，并且優(yōu)選地等于過渡頻帶的頻率上限。但是，還有多種備選方案。一種備選方案是搜索最高頻率編碼的頻譜系數(shù)或組并將過渡頻率設(shè)在該組的高頻率一側(cè)。
上面描述的實施例的算法還能以如下偽代碼來描述
F。r CurrentBand—N t。
l
rati。一numC。dedC。eff工nBand(CurrentBand)／
numC。eff工nBand(CurrentBand)
工f rati。>閡值
過渡位于CurrentBand與CurrentBand+l之間
Re turn
End ifNext過渡位于頻帶1的開始處如果過渡頻率在連續(xù)幀之間沒有太大變化，則這是優(yōu)選的。太大變化可能被感知為干擾。因此，在一個示范實施例中，過渡頻率進一步取決于先前使用的過渡頻率。例如，兩個連續(xù)幀之間禁止過渡頻率改變大于預(yù)定的絕對或相對量將是可能的。備選的是，可以將臨時過渡頻率作為值與先前的過渡頻率一起輸入到濾波器中，從而給出具有更受抑制的變化行為的修改的過渡頻率。這樣，過渡頻率將取決于多于一個先前的過渡頻率。這些例程通常在過渡確定電路中(即優(yōu)選地分別在解碼器中和編碼器的量化和編碼部分中)執(zhí)行。圖6是示出根據(jù)本發(fā)明的方法的一個實施例的步驟的流程圖。一種用于音頻信號的頻譜解碼中的頻譜恢復(fù)的方法開始于步驟200。在步驟210中，獲取表示該音頻信號的頻譜系數(shù)的初始集合。在步驟212中，確定過渡頻率。過渡頻率適應(yīng)于音頻信號的頻譜內(nèi) 容。在步驟214中執(zhí)行頻譜系數(shù)的初始集合中過渡頻率以下的頻譜空洞的噪聲填充，以及在步驟216中在過渡頻率以上執(zhí)行對頻譜系數(shù)的初始集合的帶寬擴展。該過程結(jié)束于步驟 249。類似地，圖7是示出根據(jù)本發(fā)明的另一個方法的一個實施例的步驟的流程圖。一種用于在音頻信號的頻譜編碼中使用的方法開始于步驟200。在步驟212中，確定過渡頻率。用于表示音頻信號的頻譜系數(shù)的初始集合的過渡頻率適應(yīng)于音頻信號的頻譜內(nèi)容。過渡頻率定義打算作為用于頻譜空洞的噪聲填充的對象的頻率范圍和打算作為用于帶寬擴展的對象的頻率范圍之間的邊界。本發(fā)明通過根據(jù)所使用的編碼方案來自適應(yīng)地定義過渡頻率而獲得多個優(yōu)點。該適應(yīng)的過渡頻率允許使用噪聲填充和帶寬擴展來有效率地使用組合的頻譜填充。使用此方法的任何話音和/或音頻編解碼器能夠輸送高質(zhì)量且全帶寬的音頻信號同時減少惱人的偽跡。在該方法可以與任何類型的頻率表示(DCT、MDCT等)或濾波器組組合、即與任何編解碼器(感知的、參數(shù)的等)組合的意義上而言，該方法是靈活的。上文描述的實施例應(yīng)理解為本發(fā)明的幾個說明性示例。本領(lǐng)域技術(shù)人員將理解在不背離本發(fā)明范圍的前提下可以對這些實施例進行多種修改、組合和更改。具體來說，在技術(shù)上可能之處，可以將不同實施例中的不同部分解決方案組合在其他配置中。但是，本發(fā)明的范圍由所附權(quán)利要求來限定。參考文獻[1]3GPP TS 26.404V6. 0. 0 (2004—09)， “ Enhanced aacPlus generalaudio codec-encoder SBR part(Release 6)“ , 2004[2]J. D. Johnston," Estimation of Perceptual Entropy Using NoiseMasking Criteria"，Proc. ICASSP, 2524-2527 頁，1988 年 5 月。
權(quán)利要求
一種用于音頻信號的頻譜解碼中的頻譜恢復(fù)的方法，包括以下步驟獲取(210)表示所述音頻信號的頻譜系數(shù)的初始集合(42)；確定(212)過渡頻率(ft)；噪聲填充(214)頻譜系數(shù)的所述初始集合(42)中所述過渡頻率(ft)以下的頻譜空洞；以及在所述過渡頻率(ft)以上帶寬擴展(216)頻譜系數(shù)的所述初始集合(42)；所述過渡頻率(ft)適應(yīng)于所述音頻信號的頻譜內(nèi)容。
2.如權(quán)利要求1所述的方法，其中所述過渡頻率(ft)自適應(yīng)地取決于頻譜系數(shù)的所述初始集合(42)中頻譜空洞的分布。
3.如權(quán)利要求2所述的方法，其中確定所述過渡頻率(ft)的所述步驟又包括以下步驟將頻譜系數(shù)的所述初始集合(42)的所述頻譜系數(shù)劃分到多個頻帶(74)中；以及根據(jù)所述頻帶(74)中頻譜空洞的比例來選擇所述過渡頻率(ft)。
4.如權(quán)利要求3所述的方法，其中所述頻帶(74)具有恒定的頻率寬度。
5.如權(quán)利要求3所述的方法，其中所述頻帶(74)的至少兩個具有不同的頻率寬度。
6.如權(quán)利要求3至5中任一項所述的方法，其中選擇所述過渡頻率(ft)的所述步驟包括查找過渡頻帶，所述過渡頻帶是其中所述比例低于第一閾值的最高頻帶。
7.如權(quán)利要求6所述的方法，其中選擇所述過渡頻率(ft)的所述步驟還包括根據(jù)所述過渡頻帶的頻率上限來設(shè)置所述過渡頻率(ft)。
8.如權(quán)利要求6或7所述的方法，其中設(shè)置所述過渡頻率(ft)的所述步驟還取決于先前使用的過渡頻率。
9.如權(quán)利要求8所述的方法，其中設(shè)置所述過渡頻率(ft)的所述步驟還取決于多于一個先前使用的過渡頻率。
10.如權(quán)利要求8或9所述的方法，其中在兩個連續(xù)幀之間禁止所述過渡頻率(ft)變化大于預(yù)定的絕對或相對量。
11.一種用于在音頻信號的頻譜編碼中使用的方法，包括確定(212)用于表示所述音頻信號的頻譜系數(shù)的初始集合(24 ；42)的過渡頻率(ft)；所述過渡頻率(ft)定義打算作為用于頻譜空洞的噪聲填充的對象的頻率范圍與打算作為用于帶寬擴展的對象的頻率范圍之間的邊界；所述過渡頻率(ft)適應(yīng)于所述音頻信號的頻譜內(nèi)容。
12.一種用于音頻信號的頻譜解碼的解碼器(40)，包括輸入，用于獲取表示所述音頻信號的頻譜系數(shù)的初始集合(42)；過渡確定電路(60)，布置用于確定過渡頻率(ft)；噪聲填充器(50)，用于噪聲填充頻譜系數(shù)的所述初始集合(42)中所述過渡頻率(ft) 以下的頻譜空洞；以及帶寬擴展器(55)，布置用于在所述過渡頻率(ft)以上帶寬擴展頻譜系數(shù)的所述初始集合(42)；所述過渡頻率(ft)適應(yīng)于所述音頻信號的頻譜內(nèi)容。
13.如權(quán)利要求12所述的解碼器，其中所述過渡確定電路(60)布置用于根據(jù)頻譜系數(shù) 的所述初始集合(42)中頻譜空洞的分布來自適應(yīng)地確定所述過渡頻率(ft)。
14.如權(quán)利要求13所述的解碼器，其中所述過渡確定電路(60)還布置用于將頻譜系數(shù) 的所述初始集合的所述頻譜系數(shù)劃分到多個頻帶(74)中，以及用于根據(jù)所述頻帶(74)中頻譜空洞的比例來選擇所述過渡頻率(ft)。
15.如權(quán)利要求14所述的解碼器，其中所述頻帶(74)具有恒定的頻率寬度。
16.如權(quán)利要求14所述的解碼器，其中所述頻帶(74)的至少兩個具有不同的頻率寬度。
17.如權(quán)利要求14至16中任一項所述的解碼器，其中所述過渡確定電路(60)還布置用于查找過渡頻帶，所述過渡頻帶是其中所述比例低于第一閾值的最高頻帶。
18.如權(quán)利要求17所述的解碼器，其中所述過渡確定電路(60)還布置用于根據(jù)所述過渡頻帶的頻率上限來設(shè)置所述過渡頻率(ft)。
19.一種用于音頻信號的頻譜編碼的編碼器(20)，包括過渡確定電路(60)，布置用于確定用于表示所述音頻信號的頻譜系數(shù)的初始集合 (24)的過渡頻率(ft)；所述過渡頻率(ft)定義打算作為用于頻譜空洞的噪聲填充的對象的頻率范圍與打算作為用于帶寬擴展的對象的頻率范圍之間的邊界；所述過渡頻率(ft)適應(yīng)于所述音頻信號的頻譜內(nèi)容。
全文摘要
一種用于音頻信號的頻譜解碼中的頻譜恢復(fù)的方法，包括獲取(210)表示音頻信號的頻譜系數(shù)的初始集合，并確定(212)過渡頻率。過渡頻率適應(yīng)于音頻信號的頻譜內(nèi)容。對頻譜系數(shù)的初始集合中低于過渡頻率的頻譜空洞進行噪聲填充(214)，以及在過渡頻率以上對頻譜系數(shù)的初始集合進行帶寬擴展(216)。還圖示布置用于執(zhí)行部分或完整方法的解碼器和編碼器。
文檔編號G10L21/02GK101939782SQ200880105330
公開日2011年1月5日申請日期2008年8月26日優(yōu)先權(quán)日2007年8月27日
發(fā)明者A·塔萊布, G·尤爾伯格, M·布賴恩德申請人:愛立信電話股份有限公司

完整全部詳細技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：Ｇ.尤爾伯格;Ｍ.布賴恩德;Ａ.塔萊布
技術(shù)所有人：愛立信電話股份有限公司
我是此專利的發(fā)明人

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

帶寬自適應(yīng)相關(guān)技術(shù)

自適應(yīng)噪聲抵消相關(guān)技術(shù)

自適應(yīng)噪聲對消相關(guān)技術(shù)

自適應(yīng)噪聲抵消器相關(guān)技術(shù)

自適應(yīng)噪聲對消論文相關(guān)技術(shù)

自適應(yīng)噪聲消除相關(guān)技術(shù)

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

噪聲填充與帶寬擴展之間的自適應(yīng)過渡頻率的制作方法