用于多通道音頻的平滑配置切換的制作方法
【專利摘要】解碼系統(tǒng)(100)基于輸入信號(A)重構(gòu)n通道音頻信號,所述輸入信號通過參數(shù)譯碼表示音頻信號或者將音頻信號表示為n個離散譯碼通道。參數(shù)解碼基于控制空間合成級(150)的混合參數(shù)(a)以及核心信號進(jìn)行,所述空間合成級被從下混級(140)供給下混信號。選擇器(170)在穩(wěn)態(tài)的參數(shù)解碼模式和離散解碼模式下控制解碼系統(tǒng)的組件,并且在這些模式之間進(jìn)行轉(zhuǎn)變。下混級基于n通道信號實現(xiàn)下混信號上的投影,所述n通道信號是n通道輸入信號或者填充有中性值的核心信號。下混級在其中輸入信號通過參數(shù)譯碼表示音頻信號的每個時間幀中以及至少在每段參數(shù)譯碼時間幀中的最后一個時間幀之后的第一個時間幀中工作。
【專利說明】用于多通道音頻的平滑配置切換
【技術(shù)領(lǐng)域】
[0001] 本文中所公開的本發(fā)明總地涉及視聽媒體發(fā)布。具體地講,本發(fā)明涉及一種使得 能夠在解碼期間實現(xiàn)高比特率模式和低比特率模式兩者以及無縫模式轉(zhuǎn)變的自適應(yīng)發(fā)布 格式。本發(fā)明還涉及用于根據(jù)發(fā)布格式對信號進(jìn)行編碼和解碼的方法和裝置。
【背景技術(shù)】
[0002] 就收聽質(zhì)量而言,參數(shù)立體聲和多通道譯碼方法已知是可伸縮的并且有效率的, 這使得它們在低比特率應(yīng)用中特別有吸引力。然而,在比特率限制是瞬變的性質(zhì)(例如,網(wǎng) 絡(luò)抖動、載荷變化)的情況下,可以通過使用自適應(yīng)發(fā)布格式來獲得可供使用的網(wǎng)絡(luò)資源 的充分益處,其中,在正常狀況下使用相對高的比特率,當(dāng)網(wǎng)絡(luò)運行不良時,使用較低的比 特率。現(xiàn)有的自適應(yīng)發(fā)布格式和相關(guān)聯(lián)的譯碼(coding/碼化)(解碼)技術(shù)可以從它們的 帶寬效率、計算效率、差錯恢復(fù)、算法延遲的角度來進(jìn)行改進(jìn),并且進(jìn)一步,在視聽媒體發(fā)布 中就比特率切換事件對于享用解碼的媒體的人的明顯程度來進(jìn)行改進(jìn)。
【專利附圖】
【附圖說明】
[0003] 現(xiàn)在將參照附圖來描述本發(fā)明的實施例,其中:
[0004] 圖1是根據(jù)本發(fā)明的示例實施例的解碼系統(tǒng)的總體框圖;
[0005] 圖2類似于圖1,示出根據(jù)本發(fā)明的示例實施例的編碼系統(tǒng);
[0006] 圖3例示位于編碼器和解碼器側(cè)的下混級的機能;
[0007] 圖4示出用于部署在解碼系統(tǒng)中的根據(jù)示例實施例的上混級的細(xì)節(jié);
[0008] 圖5示出用于部署在解碼系統(tǒng)中的根據(jù)示例實施例的空間合成級的細(xì)節(jié);
[0009] 圖6例示在配備有圖5的空間合成級的示例解碼系統(tǒng)中出現(xiàn)的數(shù)據(jù)信號和控制信 號;
[0010] 圖7示出用于部署在解碼系統(tǒng)中的根據(jù)示例實施例的空間合成級的細(xì)節(jié);
[0011] 圖8例示在配備有圖7的空間合成級的示例解碼系統(tǒng)中出現(xiàn)的數(shù)據(jù)信號和控制信 號;
[0012] 圖9示出根據(jù)本發(fā)明的示例實施例的將信息發(fā)送到解碼器裝置的編碼系統(tǒng);
[0013] 圖10例示在配備有圖5的空間合成級的示例解碼系統(tǒng)中出現(xiàn)的數(shù)據(jù)信號和控制 信號;
[0014] 圖11是根據(jù)本發(fā)明的示例實施例的解碼系統(tǒng)的總體框圖;和
[0015] 圖12示出用于部署在解碼系統(tǒng)中的根據(jù)示例實施例的音頻解碼器的細(xì)節(jié)。
[0016] 所有的附圖都是示意性的,并且僅從大體上示出了為了闡明本發(fā)明而必需的部 分,而其他部分則可以被略去或者僅僅被建議。除非另有指示,否則相似的標(biāo)號在不同圖中 指示相似的部分。
【具體實施方式】
[0017] I.概沭
[0018] 如本文中所使用的,音頻信號可以是純音頻信號、視聽信號或多媒體信號的音頻 部分、或者與元數(shù)據(jù)組合的這些信號中的任何一個。
[0019] 在本發(fā)明的第一方面內(nèi),示例性實施例提出了使得能夠以改進(jìn)的比特率選擇能力 和/或減小的延遲來自適應(yīng)地發(fā)布媒體內(nèi)容(諸如音頻或視頻內(nèi)容)的方法和裝置。示例 實施例還提供了適合于這樣的自適應(yīng)媒體發(fā)布的譯碼格式,所述譯碼格式有助于比特率之 間的無縫轉(zhuǎn)變。
[0020] 本發(fā)明的示例實施例提供具有獨立權(quán)利要求中所闡述的特征的編碼方法、編碼系 統(tǒng)、解碼方法、解碼系統(tǒng)、音頻發(fā)布系統(tǒng)和計算機程序產(chǎn)品。
[0021] 解碼系統(tǒng)適于基于輸入信號重構(gòu)音頻信號,所述輸入信號可以直接提供給解碼系 統(tǒng),或者可替代地可以被用解碼系統(tǒng)所接收的比特流進(jìn)行編碼。輸入信號被分割為與音頻 信號的(重疊的或相連的)時間段相應(yīng)的時間巾貞。輸入信號的一個時間巾貞根據(jù)譯碼機制表 示音頻信號的時間段,所述譯碼機制選自包括參數(shù)譯碼和離散譯碼的一組譯碼機制。特別 地,如果編碼的音頻信號是η通道信號,則輸入信號在所接收的它被離散譯碼的幀中(至 少)包含相等數(shù)量的通道,即,在離散譯碼機制中,η個離散編碼的通道被用于表示音頻信 號。在參數(shù)譯碼的所接收的幀中,輸入信號包括比η個通道少的通道(但是它可以是η通 道格式,其中一些通道不被使用),但是可以另外包括元數(shù)據(jù),諸如在編碼處理期間例如通 過計算信號能量值或相關(guān)系數(shù)從音頻信號推導(dǎo)的至少一個混合參數(shù)。可替代地,所述至少 一個混合參數(shù)可以通過不同的通信路徑(例如,經(jīng)由與承載輸入信號的比特流分離的元數(shù) 據(jù)比特流)被供給解碼系統(tǒng)。如所指出的,輸入信號可以處于至少兩種不同的機制(即,參 數(shù)譯碼或離散譯碼),解碼系統(tǒng)通過轉(zhuǎn)變到--或者保持處于--參數(shù)模式或離散模式來 對這些機制做出反應(yīng)。系統(tǒng)的轉(zhuǎn)變可以具有有限的持續(xù)時間,使得解碼系統(tǒng)只有在一個或 多個時間幀過去之后才進(jìn)入輸入信號的當(dāng)前譯碼機制所引起的模式。因此,在操作中,解碼 系統(tǒng)的模式可能落后于輸入信號的機制與一個或多個時間幀相應(yīng)的時段。參數(shù)譯碼時間幀 集合(印isode)是指全都通過參數(shù)譯碼表示音頻信號的一個或多個連續(xù)時間幀的序列。類 似地,離散譯碼時間幀集合是具有η個離散譯碼通道的一個或多個連續(xù)時間幀的序列。如 本文中所使用的,解碼系統(tǒng)在如下這樣的那些時間幀中處于參數(shù)模式,在那些時間幀中,解 碼系統(tǒng)輸出對于幀持續(xù)時間的更大部分是通過空間合成而生成的(不管底層數(shù)據(jù)的來源 如何);離散模式是指在其中解碼系統(tǒng)不處于參數(shù)模式的任何時間幀。
[0022] 解碼系統(tǒng)包括下混級,所述下混級適于基于輸入信號輸出m通道下混信 號。優(yōu)選地,解碼系統(tǒng)接受控制下混操作的定量和/或定性方面的下混規(guī)范(downmix specification),例如,下混級所形成的將在任何線性組合中施加的增益。優(yōu)選地,下混規(guī)范 是可被從數(shù)據(jù)通信或存儲介質(zhì)提供給至少一個進(jìn)一步的下混級的數(shù)據(jù)結(jié)構(gòu),所述進(jìn)一步的 下混級例如是將輸入信號或者對輸入信號進(jìn)行編碼的比特流提供給解碼系統(tǒng)的編碼器中 的具有類似的或不同的結(jié)構(gòu)特性的下混級。這樣,可以確保這些下混級在功能上是等同的, 例如,它們響應(yīng)于相同的輸入信號提供相同的下混信號。下混規(guī)范的加載可以相當(dāng)于部署 之后下混級的重新配置,但是可替代地可以在其制造、初始編程、安裝、部署等期間執(zhí)行。下 混規(guī)范可以用輸入信號的特定形式或格式(包括一種格式中的通道的位置或編號)來表 達(dá)。可替代地,它可以從語義上來表達(dá)(包括通道的幾何意義,而不管其相對于格式的位置 如何)。優(yōu)選地,下混規(guī)范與輸入信號的當(dāng)前形式或格式和/或輸入信號的機制無關(guān)地制 定,從而下混操作可越過輸入信號格式改變繼續(xù)進(jìn)行,而不中斷。
[0023] 解碼系統(tǒng)還包括空間合成級,所述空間合成級適于接收下混信號,并且輸出音頻 信號的η通道表示??臻g合成級由于其算法延遲的原因與非零通過時間相關(guān)聯(lián);本發(fā)明的 基礎(chǔ)問題之一是盡管存在該延遲,但是仍然實現(xiàn)平滑切換。音頻信號的η通道表示可以作 為解碼系統(tǒng)輸出而輸出;可替代地,它經(jīng)受了以更忠實地和/或以更少的偽像和差錯重構(gòu) 音頻信號為總體目標(biāo)的附加的處理??臻g合成級接受控制空間合成操作的定量和/或定性 方面的至少一個混合參數(shù)。原則上,空間合成級至少在參數(shù)模式下(例如,當(dāng)下混信號可供 使用時)工作(active)。在離散模式下,解碼系統(tǒng)通過對η個離散編碼的通道中的每個進(jìn) 行解碼來從輸入信號推導(dǎo)輸出信號。
[0024] 根據(jù)這個示例實施例,下混級至少在每個離散譯碼時間幀集合中的第一時間幀中 (例如,在整個幀內(nèi))以及至少在每個離散譯碼時間幀集合之后的第一時間幀中(例如,在 整個幀內(nèi))工作。這意味著,輸入信號一從離散譯碼轉(zhuǎn)變?yōu)閰?shù)譯碼,m通道下混信號就可 以可供使用。因此,空間合成級可以在較短的時間內(nèi)啟動,即使它包括與固有的非零算法延 遲相關(guān)聯(lián)的處理(例如,時頻變換、實復(fù)轉(zhuǎn)換和/或混合分析濾波)仍如此。此外,音頻信 號的η通道表示在從參數(shù)模式到離散模式的整個轉(zhuǎn)變中可以保持可供使用,并且可以用于 使這樣的轉(zhuǎn)變更快速和/或更不明顯。
[0025] 如本文中所使用的,時間幀(或幀)是輸入信號的對于其譯碼機制可被控制的最 小單元。優(yōu)選地,輸入信號的非空通道通過加窗的變換而獲得。例如,如MDCT中那樣,每個 變換窗口可以與樣本相關(guān)聯(lián),并且連續(xù)變換窗口可以重疊。明確的是,如果連續(xù)窗口重疊 50%,則時間幀的長度不小于變換窗口的一半長度(例如,512樣本的變換窗口的一半長度 等于256個樣本),該長度于是等于變換步幅。因為可以使切換事件更少地被享用解碼的音 頻的人感知到,所以這個示例實施例不需要限制操作期間的切換事件的數(shù)量,而是可以專 心地對網(wǎng)絡(luò)狀況的變化做出響應(yīng)。這使得可供使用的網(wǎng)絡(luò)資源可以被更充分地利用。減小 的解碼系統(tǒng)延遲可以增強媒體的保真度,在實時媒體流傳輸中尤其如此。
[0026] 為了本公開的目的,下混級在時間幀中工作意味著下混級至少在該時間幀的子集 期間工作。下混級可以在整個幀內(nèi)/期間或者僅在時間幀的子集(諸如幀的起始部分)期 間工作。起始部分可以對應(yīng)于幀長度的1/2、1/3、1/4、1/6 ;起始部分可以對應(yīng)于變換步幅; 可替代地,起始部分可以對應(yīng)于Τ/ρ,其中,T是幀長度,ρ是在每個幀內(nèi)開始的變換窗口的 數(shù)量。輸入信號中的譯碼機制之間的轉(zhuǎn)變典型地涉及在時間幀開始時(例如,在時間幀的 前1/6期間或者在1536個時間米樣之中的256個時間米樣期間)、在前一時間巾貞的譯碼與 當(dāng)前時間幀的譯碼之間(例如,作為當(dāng)將輸入信號從頻域格式變換到時域時使用重疊變換 窗口的結(jié)果,在頻域格式中,輸入信號可以從比特流獲得)的交錯淡變。下混級優(yōu)選地可以 至少在緊接在輸入信號轉(zhuǎn)變?yōu)殡x散譯碼或者輸入信號從離散譯碼轉(zhuǎn)變之后的時間幀的起 始部分期間工作。這使得下混信號在輸入信號中的交錯淡變期間可供使用,由此空間合成 級可以對于與輸入信號中的交錯淡變相關(guān)聯(lián)的時間幀的部分輸出音頻信號的η通道表示。 關(guān)于輸入信號的當(dāng)前機制(例如,參數(shù)譯碼或離散譯碼)的信息可以與輸入信號一起(例 如,其中包含輸入信號的比特流中的某一位置處的比特)被接收。例如,在參數(shù)譯碼期間, 關(guān)于空間參數(shù)的信息可以在比特流的某些位置處被找到,而在離散譯碼期間,這些位置/ 比特不被使用。通過檢查這樣的比特在它們的預(yù)期位置的存在與否,解碼系統(tǒng)可以確定輸 入信號的當(dāng)前譯碼機制。
[0027] 在前面的示例實施例的進(jìn)一步發(fā)展中,輸入信號的時間段可以通過譯碼機制來表 示音頻信號的時間段,所述譯碼機制選自包括參數(shù)譯碼、離散譯碼和縮減(reduced)參數(shù) 譯碼的一組譯碼機制。因此,在進(jìn)一步的發(fā)展中,存在另外的被稱為縮減參數(shù)譯碼的譯碼機 制,在所述縮減參數(shù)譯碼中,輸入信號是m通道核心信號(可以伴隨有混合參數(shù)和其他元數(shù) 據(jù))。該核心信號可以通過根據(jù)下混規(guī)范進(jìn)行下混從表示相同的音頻信號(即,表示與第一 次提及的音頻信號相同的音頻信號)的假定離散η通道輸入信號獲得。相反,基于離散譯 碼時間幀中的輸入信號,下混規(guī)范使得能夠確定在縮減參數(shù)譯碼已經(jīng)用于在這些幀內(nèi)表示 相同的音頻信號的情況下核心信號將會是什么。
[0028] 在輸入信號通過縮減參數(shù)譯碼表示音頻信號的幀中,可能不需要執(zhí)行任何下混。 實際上,輸入信號是m通道核心信號,在它被發(fā)送到空間合成級之前,不需要進(jìn)行下混。因 此,空間合成級優(yōu)選地可以直接接收輸入信號,或者輸入信號可以在到達(dá)空間合成級之前 不受影響地通過下混級。在輸入信號通過縮減參數(shù)譯碼表示音頻信號的幀中,空間合成級 因此可以基于輸入信號和至少一個混合參數(shù)輸出音頻信號的η通道表示。當(dāng)接收到縮減參 數(shù)譯碼時間幀時停用下混級(或者使它置于空閑/被動/休息模式)可以節(jié)省能量,由此 例如便攜式裝置中的電池時間可以得以延長。
[0029] 在示例實施例中,下混級在其中輸入信號通過參數(shù)譯碼表示音頻信號的每個時間 幀中工作。在僅存在兩種譯碼機制(參數(shù)和離散)的例子中,這意味著,下混級至少在所有 的不被離散譯碼的幀中工作。在存在另外的可供使用的譯碼機制(諸如縮減參數(shù)譯碼)的 例子中,下混級在不被離散譯碼的時間幀中還可以不工作/被停用/空閑。這可以節(jié)省能 量和/或延長電池時間。
[0030] 在示例實施例中,解碼系統(tǒng)適于接收輸入信號,所述輸入信號在參數(shù)譯碼時間幀 期間還包括m通道核心信號(除了任何混合參數(shù)和其他元數(shù)據(jù)之外)。核心信號可以通過 根據(jù)下混規(guī)范進(jìn)行下混從表示相同的音頻信號(即,表示與第一次提及的音頻信號相同的 音頻信號)的假定離散η通道輸入信號獲得。相反,基于離散譯碼時間幀中的輸入信號,下 混規(guī)范使得能夠確定在參數(shù)譯碼已經(jīng)被用于在那些幀中表示相同的音頻信號的情況下核 心信號將會是什么。
[0031] 然而,因為下混級在輸入信號可能不包含核心信號的至少一些離散譯碼時間幀 (諸如,離散譯碼時間幀集合中的第一時間幀)中工作,所以解碼系統(tǒng)將能夠預(yù)測在這些離 散譯碼時間幀內(nèi)該核心信號將會是什么。因此,即使在原則上核心信號和離散譯碼通道可 能不能共存,輸入信號中的與(參數(shù)譯碼或縮減參數(shù)譯碼與離散譯碼之間的)機制改變相 關(guān)的任何間斷也可以一起被減輕或避免。
[0032] 在前面的示例實施例的進(jìn)一步發(fā)展中,下混級適于通過再現(xiàn)輸入信號中的核心信 號(如果該核心信號可供使用)來產(chǎn)生下混信號。換句話說,下混級適于尤其通過拷貝或 轉(zhuǎn)發(fā)核心信號來對參數(shù)譯碼時間幀的接收做出響應(yīng),以使得下混級將核心信號作為下混信 號輸出。換句話說,如果下混信號中的m通道被認(rèn)為是η通道輸入信號的空間的子空間,則 下混級是該子空間上的投影。特別地,存在輸入信號的如下m通道子集,下混級將所述m通 道子集相同地映射到下混信號中的各m個通道。這可以在下混規(guī)范中被規(guī)定。對于離散譯 碼時間幀,基于輸入信號并且根據(jù)下混規(guī)范來產(chǎn)生下混信號。如以上所討論的,下混規(guī)范定 義了輸入信號中的η個離散譯碼通道與核心信號之間的關(guān)系。這意味著,輸入信號中的機 制改變本身不能引起間斷;也就是說,如果音頻信號跨越模式改變是連續(xù)的,則下混級輸出 將保持為連續(xù)的,并且基本上不會中斷。
[0033] 在可以實現(xiàn)為以上所概述的示例實施例的替代方案或者這些示例實施例的進(jìn)一 步發(fā)展的示例實施例中,解碼系統(tǒng)適于接收如下比特流,所述比特流以在參數(shù)譯碼機制和 離散譯碼機制兩者中都可適用的格式對輸入信號進(jìn)行編碼。為了適應(yīng)η個離散譯碼通道, 所接收的比特流以包括η個通道或更多個通道的格式對輸入信號進(jìn)行編碼。因此,參數(shù)譯 碼機制中的時間幀可以包含例如n-m個未被使用的通道。為了保持參數(shù)譯碼機制中的格式 的均一 1丨生,未被使用的通道存在,但是被設(shè)為與無激勵相應(yīng)的中性值(neutral value),例 如,零序列。發(fā)明人認(rèn)識到,解碼器產(chǎn)品可包含其設(shè)計不意圖部署在其中格式改變可能頻繁 的自適應(yīng)媒體發(fā)布設(shè)備中的老式組件或通用組件(例如,硬件、算法、軟件庫)。這樣的組件 可以通過停用它們自己或者使它們自己部分?jǐn)嚯妬韺z測到變?yōu)榈捅忍芈矢袷阶龀鲰憫?yīng)。 當(dāng)這些組件回到正常操作時,這可能由于與格式改變相關(guān)的間斷而阻止比特率之間的平滑 轉(zhuǎn)變或者使得平滑轉(zhuǎn)變更難以實現(xiàn)。當(dāng)諸如與具有重疊窗口函數(shù)的變換有關(guān)地,來自不同 譯碼機制的幀的貢獻(xiàn)被累計時,也可能引起困難。在本示例實施例中,因為均一格式被用于 輸入格式,所以解碼系統(tǒng)中的具有這些特性的組件將典型地保持基本上不受從參數(shù)譯碼機 制到離散譯碼機制的轉(zhuǎn)變的影響,反之亦然。以上適用于所有的被離散譯碼或參數(shù)譯碼的 時間幀。在某些示例實施例中,輸入信號可以作為替代在兩個參數(shù)譯碼時間幀集合之間以m 通道格式(縮減參數(shù)譯碼機制)被提供,以便在沒有模式轉(zhuǎn)變即將發(fā)生或者正被執(zhí)行時不 需要下混??蛇x地,在所有的不被離散譯碼的幀中可以使用m通道格式(即,縮減參數(shù)譯碼 機制),并且解碼系統(tǒng)可選地可以適于至少在某些幀內(nèi)將所接收的m通道格式重新格式化 為η通道格式。例如,在緊接在離散譯碼時間幀前面或后面的縮減參數(shù)譯碼幀中,可以通過 將n-m個中性通道附加到m通道格式來重新格式化縮減參數(shù)譯碼,以便獲得上述在不同譯 碼機制之間的轉(zhuǎn)變期間具有相同數(shù)量的通道的優(yōu)點中的至少一些。優(yōu)選地,均一格式容納 混合參數(shù)和參數(shù)和/或離散模式中所使用的其他元數(shù)據(jù)。優(yōu)選地,通過熵編碼或類似的方 法來對輸入信號進(jìn)行編碼,以使得未被使用的通道僅將有限程度地增加所需的帶寬。
[0034] 在示例實施例中,解碼系統(tǒng)還包括第一延遲線和混合器。第一延遲線接收輸入信 號,并且可操作為輸出輸入信號的延遲版本??商娲?,第一延遲線可以可操作為延遲輸 入信號的經(jīng)處理的版本,例如,在已經(jīng)從輸入信號推導(dǎo)η個通道之后,或者在拆包之后。第 一延遲線不需要在參數(shù)模式下(即,在其中通過空間合成生成解碼系統(tǒng)輸出的那些時間幀 中)工作(可能除了解碼系統(tǒng)處于離散模式的時間幀序列中的起始時間幀之外),以便利于 模式轉(zhuǎn)變?;旌掀鬟B接到第一延遲線輸出和空間合成級輸出兩者,并且充當(dāng)這兩個源之間 的選擇器。在參數(shù)模式中,混合器輸出空間合成級輸出。在離散模式中,混合器輸出第一延 遲線輸出。當(dāng)在輸入信號中在離散譯碼機制與參數(shù)譯碼機制(或如上所述那樣,在解碼系 統(tǒng)適于將所接收的縮減參數(shù)譯碼時間幀重新格式化為η通道格式的情況下的縮減參數(shù)譯 碼機制)之間轉(zhuǎn)變時,混合器執(zhí)行這兩個輸出之間的混合轉(zhuǎn)變?;旌限D(zhuǎn)變可以包括交錯淡 變類型的操作或者已知不是顯然可感知到的其他混合轉(zhuǎn)變?;旌限D(zhuǎn)變可以占據(jù)從其發(fā)生模 式轉(zhuǎn)變的時間幀或者時間幀的一小部分。第一延遲線的存在使得通過空間合成級提供的音 頻信號的η通道表示可以保持與從輸入信號基于η個離散編碼通道推導(dǎo)的信號同步。這促 進(jìn)了模式轉(zhuǎn)變的平滑性。此外,因為不需要兩個信號之間的初步對齊,混合器將能夠以短的 等待時間在模式之間進(jìn)行轉(zhuǎn)變。特別地,第一延遲線可以被配置為使輸入信號延遲與下混 級和空間合成級的總通過時間相應(yīng)的時段??偼ㄟ^時間可以是各個通過時間的和。然而, 如果采取了延遲減小措施,則總通過時間可能小于該和。指出,下混級的通過時間可以是非 零數(shù)字或者零,在下混級在時域中進(jìn)行操作時尤其如此。
[0035] 在前面的實施例的進(jìn)一步發(fā)展中,解碼系統(tǒng)還包括在混合器下游的第二延遲線。 第二延遲線被配置為在參數(shù)模式和離散模式下類似地起作用(即,通過添加延遲,所述延 遲為時間幀持續(xù)時間與第一延遲線所引起的延遲之間的差值)。因此,解碼系統(tǒng)的總通過 時間正好為一個時間幀??商娲兀诙舆t線所引起的延遲被選擇為使得第一延遲線和 第二延遲線所引起的總延遲對應(yīng)于一個時間幀的長度的倍數(shù)。這兩種替代方案都簡化了切 換。特別地,這簡化了解碼系統(tǒng)與連接實體之間的和切換相關(guān)的協(xié)作。
[0036] 在示例實施例中,空間合成級適于應(yīng)用通過時間內(nèi)插而獲得的混合參數(shù)值。在參 數(shù)譯碼機制和縮減參數(shù)譯碼機制中,時間幀可以承載針對在給定時間幀中的參考點(或錨 點)被明確定義的一個混合參數(shù)(多個混合參數(shù)),所述參考點諸如為該時間幀的中間點 或終點(end)?;谒雒鞔_定義的值,空間合成級通過連續(xù)的(相連的)時間幀中的各 個參考點之間的內(nèi)插來推導(dǎo)用于中間時間點的中間混合參數(shù)值。換句話說,在兩個連續(xù)的 (相連的)時間幀中的每一個承載混合參數(shù)值的情況下,例如,在這兩個時間幀中的每一個 被參數(shù)譯碼或縮減參數(shù)譯碼的情況下,可以僅在這兩個時間幀之間執(zhí)行內(nèi)插。在該設(shè)置中, 特別是如果參考點不是起始點,則空間合成級適于通過下述方式響應(yīng)當(dāng)前時間幀是在其中 每個時間幀被參數(shù)譯碼或縮減參數(shù)譯碼的時間幀集合中的第一時間幀(即,當(dāng)前時間幀前 面的時間幀不承載混合參數(shù)值),即從當(dāng)前時間幀中的參考點向后對混合參數(shù)值進(jìn)行外插 直至當(dāng)前時間幀的開始。空間合成級可以被配置為用常數(shù)值對混合參數(shù)進(jìn)行外插。也就 是說,混合參數(shù)將被取為在幀開頭具有它們的參考點值,將不變地保持該值(作為中間值) 直到參考點為止,并且然后將朝著后一時間幀中的參考點發(fā)起內(nèi)插。優(yōu)選地,外插可以伴隨 有解碼系統(tǒng)中的到參數(shù)模式的轉(zhuǎn)變??臻g合成單元可以在當(dāng)前時間幀中被啟動。在當(dāng)前幀 和/或其后的幀期間,解碼系統(tǒng)可以轉(zhuǎn)變?yōu)槭褂脧目臻g合成單元輸出的音頻信號的η通道 表示重構(gòu)音頻信號。在當(dāng)前時間幀是離散譯碼時間幀集合中的第一時間幀時,空間合成級 可以適于從緊接在當(dāng)前時間幀前面的時間幀中的參考點開始執(zhí)行(混合參數(shù)值的)向前外 插??梢酝ㄟ^從最后一個參考點直到當(dāng)前時間幀的終點為止保持混合參數(shù)值不變來實現(xiàn)向 前外插。可替代地,對于在當(dāng)前時間幀之后的另一個時間幀,可以繼續(xù)進(jìn)行外插,以便適應(yīng) 到離散模式的模式轉(zhuǎn)變。因此,空間合成級可以將來自當(dāng)前時間幀(或后一時間幀)的核 心信號與從一個時間幀(緊接在當(dāng)前時間幀前面的時間幀)外插的混合參數(shù)值組合使用。 在當(dāng)前幀之后的幀和/或其后的時間幀期間,解碼系統(tǒng)優(yōu)選地可以轉(zhuǎn)變?yōu)榛谳斎胄盘栔?所包含的η個離散編碼通道推導(dǎo)音頻信號。
[0037] 在示例實施例中,空間合成級包括對下混信號的頻域表示進(jìn)行操作的混合矩陣。 混合矩陣可以可操作為執(zhí)行m到η上混。為此,空間合成級還包括在混合矩陣上游的時頻 變換級以及在混合矩陣下游的頻時變換級。附加地或者可替代地,混合矩陣被配置為通過 包括m個下混通道的線性組合來產(chǎn)生其η個輸出通道。線性組合優(yōu)選地可以包括下混通道 中的至少一些通道的去相關(guān)版本。混合矩陣接受混合參數(shù),并且通過根據(jù)混合參數(shù)的值調(diào) 整線性組合中的與下混通道中的至少一個相關(guān)的至少一個增益來做出反應(yīng)。所述至少一個 增益可以應(yīng)用于下混信號的m通道頻域表示中的通道中的一個或多個?;旌蠀?shù)值中的點 改變可以導(dǎo)致立即增益變化或漸變增益變化;例如,如以上所概述的,可以通過連續(xù)幀之間 的內(nèi)插來實現(xiàn)漸變變化。指出,不管是對下混信號的時域表示還是頻域表示執(zhí)行上混操作, 都可以實現(xiàn)增益的可控性。
[0038] 在示例實施例中,下混級適于對輸入信號的時域表示進(jìn)行操作。更確切地說,為了 生成m通道下混信號,下混級被供給核心信號的時域表示或者η個離散編碼信號。時域中 的下混是計算貧乏(computationally lean)的技術(shù),在典型使用情況下這意味著下混級的 操作將使解碼系統(tǒng)中的總計算載荷增加非常小的程度(與沒有下混級的解碼器相比)。如 已經(jīng)描述的,下混的定量特性可以由下混規(guī)范控制。特別地,下混規(guī)范可以包括將施加的增 Mo
[0039] 在示例實施例中,如果在解碼系統(tǒng)中提供空間合成級和混合器,則這樣的空間合 成級和混合器由可以實現(xiàn)為例如有限狀態(tài)機(FSM)的控制器控制。下混級可以獨立于所述 控制器進(jìn)行操作,或者當(dāng)不需要下混時,例如,當(dāng)輸入信號被縮減參數(shù)譯碼時或者當(dāng)輸入信 號在當(dāng)前時間幀和前一(或先前多個)時間幀中被離散譯碼時,下混級可以被所述控制器 停用。所述控制器(例如,有限狀態(tài)機)可以是處理器,其狀態(tài)由當(dāng)前時間幀和前一時間幀 的以及可能地在所述前一時間幀之前的時間幀的譯碼類型/機制(參數(shù)、離散,并且如果縮 減參數(shù)可供使用,縮減參數(shù))唯一地確定。如以下將看見的,所述控制器不需要包括堆棧、 隱式狀態(tài)變量、或者存儲除了出于能夠?qū)嵤┍景l(fā)明的目的的程序指令之外的任何內(nèi)容的內(nèi) 部存儲器。這給予了簡單性、透明性(例如,在驗證和測試中)和/或魯棒性。
[0040] 在示例實施例中,可以在每個時間幀中根據(jù)如下三種譯碼機制來表示音頻信號: 離散譯碼(D)、參數(shù)譯碼(P)和縮減參數(shù)譯碼(rP)。在目前的示例實施例(在該示例實施 例中,解碼系統(tǒng)不適于將縮減參數(shù)譯碼時間幀重新格式化為η通道格式,而如上所述,這在 其他示例實施例中是可以的)中,可以避免以下的連續(xù)(相連)時間幀序列:
[0041] rP D 或 D rP,
[0042] 即,縮減參數(shù)譯碼時間幀不(緊接)在離散譯碼時間幀的后面或前面。換句話說, 離散譯碼時間幀后面為離散譯碼時間幀或參數(shù)譯碼時間幀,離散譯碼時間幀前面為離散譯 碼時間幀或參數(shù)譯碼時間幀??商娲鼗蛘吡硗獾?,由于編碼效率,以下連續(xù)(相連)時間 幀序列:
[0043] P rP P 和 P rP...rP P
[0044] 分別優(yōu)于:
[0045] P P P 和 P P…P P
[0046] 換句話說,緊隨參數(shù)譯碼時間幀的每個時間幀優(yōu)選地可以被縮減參數(shù)譯碼或離散 譯碼。例外情況可以是非常短的集合被接受的實現(xiàn);在這樣的情況下,可能不總是存在足以 進(jìn)入縮減參數(shù)譯碼機制的時間,由此可能出現(xiàn)兩個連續(xù)的參數(shù)譯碼時間幀。
[0047] 在上述的與根據(jù)不同機制譯碼的時間幀的次序相關(guān)的規(guī)則全都應(yīng)用的示例實施 例中,輸入信號中的時間幀序列典型地看起來像:
[0048] DDPDDDDPrPrPrPrPrPPDDDPDPDDDPrPPDD,
[0049] 其中,縮減參數(shù)譯碼(rP)總是分離離散譯碼(D)和參數(shù)(P)編碼。要指出,如上 所述,上述示例實施例中的至少一些的編碼系統(tǒng)可以適于接收連續(xù)幀(的編碼機制)的其 他組合。
[0050] 在示例實施例中,在輸入信號在當(dāng)前時間幀中以及在緊接在當(dāng)前時間幀前面的先 前兩個時間幀中被離散譯碼的所有情況下,解碼通過從輸入信號推導(dǎo)η個離散編碼通道來 進(jìn)行。另外地,解碼通過下述方式進(jìn)行,即,在音頻信號在當(dāng)前時間幀內(nèi)被參數(shù)譯碼或者當(dāng) 前時間幀是離散譯碼時間幀集合中的第一時間幀的情況下,根據(jù)下混規(guī)范基于輸入信號產(chǎn) 生m通道下混信號;在音頻信號在當(dāng)前幀中以及在先前兩個幀中被參數(shù)譯碼的所有情況 下,基于下混信號產(chǎn)生音頻信號的η通道表不。輸入信號在當(dāng)前時間巾貞和僅前一時間巾貞中 被參數(shù)譯碼(或縮減參數(shù)譯碼)的時間幀中的行為在不同示例實施例中可不同??蛇x地, 當(dāng)音頻信號在(緊接)該前一時間幀前面的時間幀中被參數(shù)譯碼時,還產(chǎn)生m通道下混信 號。
[0051] 在這個示例實施例的進(jìn)一步發(fā)展中,接收輸入信號(例如,通過對比特流進(jìn)行解 碼)(所述輸入信號在給定時間幀中通過參數(shù)譯碼或縮減參數(shù)譯碼來表示音頻信號)的步 驟包括接收對于所述給定時間幀中的非起始點的至少一個混合參數(shù)的值。如果當(dāng)前時間幀 是時間巾貞集合(在該時間巾貞集合中,每個時間巾貞被參數(shù)譯碼或縮減參數(shù)譯碼)中的第一時 間幀,則對所接收的至少一個混合參數(shù)的值向后進(jìn)行外插,直到當(dāng)前時間幀的起點為止。另 外地,或者可替代地,參數(shù)譯碼時間幀之后的兩個連續(xù)的離散譯碼時間幀(當(dāng)前時間幀和 前一時間幀)的接收使解碼系統(tǒng)進(jìn)行參數(shù)解碼(即,基于下混信號產(chǎn)生音頻信號的η通道 表示),不過這是基于與在所述前一時間幀前面的時間幀相關(guān)聯(lián)的混合參數(shù)值的。因為不 存在可以形成向前內(nèi)插的基礎(chǔ)的緊接在后的時間幀,所以解碼系統(tǒng)在整個當(dāng)前幀內(nèi)對最后 的明確的混合參數(shù)值向前進(jìn)行外插。同時,例如,通過在幀的起始部分(例如,其持續(xù)時間 的1/3、1/4或1/6,其長度已經(jīng)在上面進(jìn)行了討論)執(zhí)行交叉混合,解碼系統(tǒng)轉(zhuǎn)變?yōu)殡x散解 碼/模式。所述方法還可以包括以下步驟:響應(yīng)于輸入信號在當(dāng)前時間幀和前一時間幀中 被參數(shù)譯碼并且在所述前一時間幀前面的時間幀中被離散譯碼,在當(dāng)前時間幀期間轉(zhuǎn)變?yōu)?基于下混信號和至少一個混合參數(shù)產(chǎn)生音頻信號的η通道表不。
[0052] 在本發(fā)明的示例實施例中,編碼系統(tǒng)適于對分割為時間幀的η通道音頻信號進(jìn)行 編碼。編碼系統(tǒng)適于輸出比特流(P),所述比特流在給定時間幀中根據(jù)譯碼機制表示音頻信 號,所述譯碼機制選自包含參數(shù)譯碼和使用η個離散編碼通道的離散譯碼的組。編碼系統(tǒng) 包括選擇器,所述選擇器適于對于給定時間幀選擇哪個編碼機制將用于表示音頻信號。編 碼系統(tǒng)還包括參數(shù)分析級,所述參數(shù)分析級可操作為基于音頻信號的η通道表示并且根據(jù) 下混規(guī)范來輸出在參數(shù)譯碼中將形成輸出比特流的一部分的核心信號和至少一個混合參 數(shù)。在本示例實施例的進(jìn)一步發(fā)展中,譯碼機制的組還包括縮減參數(shù)譯碼。在本實施例中, 參數(shù)譯碼使用具有η個信號通道的格式,離散譯碼也是如此。另一方面,縮減參數(shù)譯碼使用 具有m個信號通道的格式,其中,n>m> 1。
[0053] 在本發(fā)明的第二方面內(nèi),提供一種用于重構(gòu)η通道音頻信號的解碼系統(tǒng)。解碼系 統(tǒng)適于接收對輸入信號進(jìn)行編碼的比特流。輸入信號分割為時間幀,并且在給定時間幀中 根據(jù)譯碼機制表示音頻信號,所述譯碼機制選自包含以下譯碼機制的組:使用η個離散編 碼通道表示音頻信號的離散譯碼;以及使用m通道核心信號和至少一個混合參數(shù)表示音頻 信號的縮減參數(shù)譯碼,其中,n>m> 1。要指出,除了核心信號之外,縮減參數(shù)譯碼機制還可 以例如使用諸如至少一個混合參數(shù)的元數(shù)據(jù)來表示音頻信號。
[0054] 本示例實施例的解碼系統(tǒng)可操作為基于η個離散編碼通道或者通過空間合成來 推導(dǎo)音頻信號。解碼系統(tǒng)包括音頻解碼器,所述音頻解碼器適于將它從比特流提取的輸入 信號的頻域表示變換為輸入信號的時域表示。解碼系統(tǒng)還包括下混級和空間合成級,所述 下混級可操作為根據(jù)下混規(guī)范基于輸入信號的時域表示來輸出m通道下混信號,所述空間 合成級可操作為基于下混信號和至少一個混合參數(shù)(例如,在同一比特流中被接收并且被 音頻解碼器提取,或者例如在某些其他比特流中被分離地接收)來輸出音頻信號的η通道 表不。
[0055] 在本示例實施例的縮減參數(shù)譯碼時間幀中,與輸入信號的頻域表示是η通道信號 的離散譯碼時間幀不同,輸入信號的頻域表示是m通道信號(即,核心信號)。音頻解碼器 可以適于在將輸入信號的頻域表示變換到時域之前,在與離散譯碼時間幀相鄰的縮減參數(shù) 譯碼時間幀的至少部分中,對輸入信號的頻域表示進(jìn)行重新格式化(也就是說,修改其格 式),以便使這些部分中的輸入信號的頻域表示(從而,還使時域表示)具有數(shù)量與離散譯 碼時間幀中的通道數(shù)量相同的通道。在離散譯碼與縮減參數(shù)譯碼之間轉(zhuǎn)變期間具有恒定 (但是在各縮減參數(shù)譯碼時間幀集合期間不必是恒定的)數(shù)量的通道的輸入信號的時域表 示可有助于在這樣的轉(zhuǎn)變期間仍提供平滑的收聽體驗。這通過促使在解碼系統(tǒng)中的布置在 更下游的解碼/處理部分中進(jìn)行轉(zhuǎn)變來實現(xiàn)。例如,具有恒定數(shù)量的通道可以有助于提供 輸入信號的時域表示中的平滑轉(zhuǎn)變。
[0056] 為了這個目的,音頻解碼器可以適于至少在緊接在離散譯碼時間幀后面的各縮減 參數(shù)譯碼時間幀的起始部分期間,以及至少對于緊接在離散譯碼時間幀前面的各縮減參數(shù) 譯碼時間幀的最后部分,對輸入信號的頻域表示進(jìn)行重新格式化。音頻解碼器適于通過將 n-m個中性通道附加到m通道核心信號來將在這些部分的輸入信號的頻域表示(其用縮減 參數(shù)譯碼時間幀中的m通道核心信號表示)重新格式化為η通道格式。中性通道可以是包 含中性信號值(即,與無音頻內(nèi)容或無激勵相應(yīng)的值,諸如零)的通道。換句話說,中性值 可以被選擇為使得當(dāng)中性通道的內(nèi)容被添加到包含音頻信號的通道時,通過其生成音頻信 號的添加不受中性值的影響(中性值加上非中性貢獻(xiàn)等于非中性貢獻(xiàn)),但是仍然被明確 地定義為操作。以上述方式,(一些)縮減參數(shù)譯碼時間幀(的至少部分)中的音頻信號 的頻域表示的m通道核心信號可以被音頻解碼器重新格式化為與離散譯碼時間幀中的輸 入信號的格式同質(zhì)的格式,特別是包括相同數(shù)量的通道的格式。
[0057] 根據(jù)示例實施例,音頻解碼器可以適于使用重疊變換窗口來執(zhí)行頻時變換,其中, 每個時間幀等于變換窗口中的至少一個的一半長度(例如,具有與該一半長度相同的長 度)。換句話說,每個時間幀可以對應(yīng)于為等同于一個變換窗口的時間段的長度的至少一半 的時間段。當(dāng)變換窗口重疊時,在來自不同時間幀的變換窗口之間可能重疊,并且給定時間 幀中的輸入信號的時域表示的值因此可以基于來自除了給定時間幀之外的時間幀(例如, 至少緊接在所述給定時間幀前面或后面的時間幀)的貢獻(xiàn)。
[0058] 在示例實施例中,音頻解碼器可以適于在緊接在離散譯碼時間幀后面的各縮減參 數(shù)譯碼時間幀中通過下述方式來確定輸入信號的時域表示的至少一個通道,即,至少對來 自縮減參數(shù)譯碼時間幀的中性通道中的至少一個中性通道的第一貢獻(xiàn)和來自緊接在前的 離散譯碼時間幀的第二貢獻(xiàn)進(jìn)行求和。如關(guān)于前面的實施例所描述的,m通道核心信號在 縮減參數(shù)譯碼時間幀中表示輸入信號(在頻域中),并且音頻解碼器可以適于在緊接在離 散譯碼時間幀后面的縮減參數(shù)譯碼時間幀中(至少在這些縮減參數(shù)譯碼時間幀的起始部 分上)將m-n個中性通道附加到m通道核心信號。輸入信號的η通道時域表示可以在這樣 的縮減參數(shù)譯碼時間幀中通過下述方式獲得,即,對于η個通道中的每一個,對來自前一離 散譯碼時間幀和縮減參數(shù)譯碼時間幀的相應(yīng)通道的貢獻(xiàn)進(jìn)行求和。對于與m通道核心信號 相應(yīng)的m個通道中的每一個,這可以包括對來自核心信號的通道(來自縮減參數(shù)譯碼時間 幀)的第一貢獻(xiàn)和來自離散譯碼時間幀中的相應(yīng)通道的第二貢獻(xiàn)進(jìn)行求和。對于與n-m個 中性通道相應(yīng)的n-m個通道中的每一個,這可以對應(yīng)于對來自這些中性通道之一的第一貢 獻(xiàn)(即,諸如零的中性值)和來自前一離散譯碼時間幀中的相應(yīng)通道的第二貢獻(xiàn)進(jìn)行求和。 這樣,來自離散譯碼時間幀的所有η個通道的貢獻(xiàn)可當(dāng)在緊接在該離散譯碼時間幀后面的 縮減參數(shù)譯碼時間幀中形成輸入信號的時域表示時被使用。這可以使得在輸入信號的時域 表示中可以進(jìn)行更平滑的和/或較不明顯的轉(zhuǎn)變。例如,在縮減參數(shù)譯碼中,可以使得來自 離散譯碼時間幀的貢獻(xiàn)可以在與n-m個中性通道相應(yīng)的n-m個通道中淡出。這還可以有助 于解碼系統(tǒng)中的布置在更下游的級/單元中的輸入信號的處理/解碼,以便在輸入信號的 離散譯碼與縮減參數(shù)譯碼之間的轉(zhuǎn)變期間實現(xiàn)改進(jìn)的(或更平滑的)收聽體驗。
[0059] 在示例實施例中,音頻解碼器可以適于在緊接在參數(shù)譯碼時間幀后面的各離散譯 碼時間幀中通過下述方式來確定輸入信號的時域表示的至少一個通道,即,至少對來自離 散譯碼時間幀的第一貢獻(xiàn)和來自緊接在前的縮減參數(shù)譯碼時間幀的中性通道中的至少一 個的第二貢獻(xiàn)進(jìn)行求和。如關(guān)于前面的實施例所描述的,m通道核心信號在縮減參數(shù)譯碼時 間幀中表示輸入信號(在頻域中),并且音頻解碼器可以適于在緊接在離散譯碼時間幀前 面的縮減參數(shù)譯碼時間幀中(至少在這些縮減參數(shù)譯碼時間幀的最終部分上)將m-n個中 性通道附加到m通道核心信號。輸入信號的η通道時域表示可以在緊接在這樣的縮減參數(shù) 譯碼時間幀后面的離散譯碼時間幀中通過下述方式來獲得,即,對于所述η個通道中的每 一個,對來自離散譯碼時間幀和前一縮減參數(shù)譯碼時間幀的相應(yīng)通道的貢獻(xiàn)進(jìn)行求和。對 于與m通道核心信號相應(yīng)的m個通道中的每一個,這可以包括對來自離散譯碼時間幀中的 相應(yīng)通道的第一貢獻(xiàn)和來自核心信號的相應(yīng)通道(來自縮減參數(shù)譯碼時間幀)的第二貢獻(xiàn) 進(jìn)行求和。對于與n-m個中性通道相應(yīng)的n-m個通道中的每一個,這可以對應(yīng)于對來自離 散譯碼時間幀中的相應(yīng)通道的第一貢獻(xiàn)和來自前一縮減參數(shù)譯碼時間幀的相應(yīng)的中性通 道的第二貢獻(xiàn)(即,諸如零的中性值)進(jìn)行求和。這樣,來自縮減參數(shù)譯碼時間幀中的核心 信號的m個通道的貢獻(xiàn)可當(dāng)在緊接在后的離散譯碼時間幀中形成輸入信號的時域表示時 被使用,例如,以使離散譯碼時間幀的相應(yīng)通道的值在該離散譯碼時間幀的起始部分期間 淡入。而且,在其余的n-m個通道中,附加到m通道核心信號的通道中的中性值(例如,零) 可以用于使離散譯碼時間幀的相應(yīng)通道的值淡入。特別地,在音頻解碼器的緩沖器/存儲 器中剩余的來自早先的離散譯碼時間幀的以及與(典型的)在各縮減參數(shù)譯碼集合期間不 使用的n-m個通道相關(guān)的任何值可以被附加的中性通道的中性值取代,S卩,可能不被允許 影響在這個稍后的離散譯碼時間幀的編碼系統(tǒng)的音頻輸出。以上所提及的早先的離散譯碼 時間幀可潛在地安置為比當(dāng)前離散譯碼時間幀早許多個時間幀,即,它們可與當(dāng)前離散譯 碼時間幀相隔許多個縮減參數(shù)譯碼時間幀,并且可潛在地對應(yīng)于輸入信號所表示的音頻信 號中后退幾秒或者甚至幾分鐘的音頻內(nèi)容。因此,可能可取的是當(dāng)對當(dāng)前離散譯碼時間幀 進(jìn)行解碼時避免使用與這些早先的離散譯碼時間幀相關(guān)的數(shù)據(jù)和/或音頻內(nèi)容。
[0060] 本示例性實施例可以允許輸入信號的時域表示中的更平滑的和/或較不明顯的 轉(zhuǎn)變(由從縮減參數(shù)譯碼到離散譯碼的轉(zhuǎn)變引起)。它還可以有助于解碼系統(tǒng)中的更下游 的級/單元中的輸入信號的進(jìn)一步處理/解碼,以便在輸入信號的縮減參數(shù)譯碼與離散譯 碼之間的轉(zhuǎn)變期間實現(xiàn)改進(jìn)的(或更平滑的)收聽體驗。
[0061] 在示例實施例中,下混級可以適于在每一離散譯碼時間幀集合中的至少第一時間 幀中以及在每一離散譯碼時間幀集合之后的至少第一時間幀中工作。下混級優(yōu)選地可以在 這些時間幀的起始部分中(即,在輸入信號的時域表示中的到離散譯碼的變換以及從離散 譯碼的變換期間)工作。它然后可以在這些轉(zhuǎn)變期間提供下混信號,所述下混信號可以用 于在輸入信號中的到離散譯碼的變換以及從離散譯碼的變換期間使編碼系統(tǒng)的輸出具有 改進(jìn)的(或更平滑的)收聽體驗。
[0062] 在示例實施例中,譯碼機制的組還可以包括參數(shù)譯碼。解碼系統(tǒng)可以適于接收對 輸入信號進(jìn)行編碼的比特流,所述輸入信號在輸入信號通過參數(shù)譯碼表示音頻信號的每個 時間幀中包括m通道核心信號,所述m通道核心信號為使得在輸入信號將音頻信號表示為η 個離散編碼通道的每個時間幀中,可以使用下混規(guī)范從輸入信號獲得表示相同的音頻信號 的m通道核心信號。
[0063] 在本示例實施例中,可以使用如下三種譯碼機制中的任何一種來對經(jīng)由比特流接 收的輸入信號的時間幀進(jìn)行譯碼:離散譯碼、參數(shù)譯碼和縮減參數(shù)譯碼。特別地,用這些譯 碼機制中的任何一種譯碼的時間幀可以跟隨在用這些譯碼機制中的任何一種譯碼的時間 幀的后面。解碼系統(tǒng)可以適于處理使用這三種譯碼機制中的任何一種譯碼的時間幀之間的 任何轉(zhuǎn)變。
[0064] 在本發(fā)明的第二方面內(nèi),提供一種類似于前面的任一示例實施例中所描述的解碼 系統(tǒng)(所執(zhí)行的方法)那樣重構(gòu)η通道音頻信號的方法。所述方法可以包括:接收比特流; 從所述比特流提取輸入信號的頻域表示;并且響應(yīng)于輸入信號在當(dāng)前時間幀中被縮減參數(shù) 譯碼并且在緊接在前的時間幀中被離散譯碼,或者輸入信號在當(dāng)前時間幀中被縮減參數(shù)譯 碼并且在緊接在后的時間幀中被離散譯碼,將輸入信號的頻域表示的當(dāng)前時間幀的至少一 部分重新格式化為η通道格式;并且將輸入信號的頻域表示變換為輸入信號的時域表示。 所述方法還可以包括:響應(yīng)于輸入信號在當(dāng)前時間幀和(一個或)兩個緊接在前的時間幀 中被離散譯碼,基于η個離散編碼通道來推導(dǎo)音頻信號;并且響應(yīng)于輸入信號在當(dāng)前時間 幀和(一個或)兩個緊接在前的時間幀中被縮減參數(shù)譯碼,基于核心信號和至少一個混合 參數(shù)來產(chǎn)生音頻信號的η通道表示。
[0065] 在本發(fā)明的第二方面內(nèi),提供一種用于對分割為時間幀的η通道音頻信號進(jìn)行編 碼的編碼系統(tǒng),其中,編碼系統(tǒng)適于輸出比特流,所述比特流在給定時間幀中根據(jù)譯碼機制 表示音頻信號,所述譯碼機制選自包含以下譯碼機制的組:使用η個離散編碼通道的離散 譯碼;以及縮減參數(shù)譯碼。編碼系統(tǒng)包括:選擇器,其適于對于給定時間幀選擇哪個編碼機 制將用于表示音頻信號;以及參數(shù)分析級,其可操作為基于音頻信號的η通道表示并且根 據(jù)下混規(guī)范來輸出將由輸出比特流在縮減參數(shù)譯碼機制中編碼的m通道核心信號和至少 一個混合參數(shù)??蛇x地,編碼系統(tǒng)可以可操作為輸出如下比特流,所述比特流在給定時間幀 中也根據(jù)參數(shù)譯碼機制表示音頻信號,并且選擇器可以適于對于給定時間幀在離散譯碼、 參數(shù)譯碼和縮減參數(shù)譯碼之間進(jìn)行選擇。
[0066] 在本發(fā)明的第二方面內(nèi),提供一種將η通道音頻信號編碼為比特流的方法,所述 方法類似于前面的任一實施例的編碼系統(tǒng)(所執(zhí)行的方法)。所述方法可以包括:接收音 頻信號的η通道表示;選擇將用于在給定時間幀中表示音頻信號的譯碼機制;響應(yīng)于選擇 通過縮減參數(shù)譯碼對音頻信號進(jìn)行編碼,基于音頻信號的η通道表示并且根據(jù)下混規(guī)范來 形成對m通道核心信號和至少一個混合參數(shù)進(jìn)行編碼的比特流;并且響應(yīng)于選擇通過離散 譯碼對音頻信號進(jìn)行編碼,輸出通過η個離散編碼通道對音頻信號進(jìn)行編碼的比特流。
[0067] 在本發(fā)明的第二方面內(nèi),提供一種音頻傳輸系統(tǒng),所述音頻傳輸系統(tǒng)包括根據(jù)前 面的編碼系統(tǒng)和解碼系統(tǒng)的任一實施例的編碼系統(tǒng)和解碼系統(tǒng)。這些系統(tǒng)通信地連接,并 且編碼系統(tǒng)和解碼系統(tǒng)各自的下混規(guī)范是相同的。
[0068] 要指出,與本發(fā)明的第二方面的實施例相關(guān)地描述的譯碼機制(離散譯碼、參數(shù) 譯碼和縮減參數(shù)譯碼)是與關(guān)于本發(fā)明的第一方面描述的譯碼機制相同的譯碼機制,并 且本發(fā)明的第二方面的另外的實施例可以通過將已經(jīng)描述的本發(fā)明的第二方面的實施例 (或它們的組合)與來自關(guān)于本實施例的第一方面所描述的實施例的特征組合來獲得。在 這樣做時,要指出,對于來自根據(jù)本發(fā)明的第一方面的實施例的至少一些特征,參數(shù)譯碼時 間幀和縮減參數(shù)譯碼時間幀可以互換使用,即,可能不需要區(qū)分這兩種譯碼機制。
[0069] 在從屬權(quán)利要求中定義了本發(fā)明的兩個方面的進(jìn)一步的示例實施例。指出,本發(fā) 明涉及所有特征組合,即使特征被記載在互相不同的權(quán)利要求中仍如此。
[0070] II.示例實施例
[0071] 圖1以框圖形式例示了根據(jù)本發(fā)明的示例實施例的解碼系統(tǒng)100。音頻解碼器110 接收比特流Ρ,并且在一個或多個處理步驟中從該比特流產(chǎn)生由加圈的字母A所指示的輸 入信號,所述輸入信號表示η通道音頻信號。作為一個例子,可以將Dolby Digital Plus 格式(或Enhanced AC-3)與適于其的音頻解碼器110 -起使用。以下將更詳細(xì)地討論音 頻解碼器110的內(nèi)部工作。輸入信號A被分割為與音頻信號的時間段相應(yīng)的時間巾貞。優(yōu)選 地,連續(xù)時間幀是相連的,并且不重疊的。輸入信號A在給定時間幀內(nèi)(b)通過參數(shù)譯碼來 表示音頻信號或者(a)將音頻信號表示為η個離散編碼通道W。參數(shù)譯碼數(shù)據(jù)包括與可通 過對音頻信號進(jìn)行下混而獲得的下混信號X相應(yīng)的m通道核心信號。在輸入信號A中接收 的參數(shù)譯碼數(shù)據(jù)還可以包括與下混信號X相關(guān)聯(lián)的一個或多個混合參數(shù),這些混合參數(shù)共 同用α表示??商娲?,與下混信號X相關(guān)聯(lián)的至少一個混合參數(shù)α可以通過在同一比特 流P或不同比特流中與輸入信號分離的信號被接收。關(guān)于輸入信號的當(dāng)前譯碼機制(即, 參數(shù)譯碼或離散譯碼)的信息可以在比特流P中被接收或者作為單獨的信號被接收。在圖 1中所示的解碼系統(tǒng)中,音頻信號具有六個通道,核心信號具有兩個通道,即,m = 2,η = 6。 在本公開的一些段落中,為了明確地指示一些連接線適于發(fā)送多通道信號,為這些線提供 了與各自的通道數(shù)量相鄰的交叉線。在離散譯碼機制中,輸入信號A可以是音頻信號的作 為5. 1環(huán)繞聲的表示,具有通道L (左)、R(右)和C (中心)、Lfe (低頻效果)、Ls (左環(huán)繞 聲)、Rs (右環(huán)繞聲)。然而,在參數(shù)譯碼機制中,在2. 0立體聲中,L通道和R通道用于發(fā)送 核心信號通道LO (核心左)和RO (核心右)。
[0072] 解碼系統(tǒng)100可以在離散模式下進(jìn)行操作,在所述離散模式下,解碼系統(tǒng)100從η 個離散編碼通道W推導(dǎo)音頻信號。解碼系統(tǒng)100還可以在參數(shù)模式下進(jìn)行操作,在所述參 數(shù)模式下,解碼系統(tǒng)100通過執(zhí)行包括空間合成的上混操作來從核心信號重構(gòu)音頻信號。
[0073] 下混級140接收輸入信號,根據(jù)下混規(guī)范執(zhí)行輸入信號的下混,并且輸出m通道下 混信號X。在本實施例中,下混級140將輸入信號看作η通道信號,S卩,如果輸入信號僅包含 m通道核心信號,則輸入信號被認(rèn)為具有n-m個另外的通道,這些通道為空/零。在實踐中, 這可以變?yōu)橛弥行灾担ㄖT如零序列)填充未被占據(jù)的通道。下混級140形成η個輸入通道 的m通道線性組合,并且將這些作為下混信號X輸出。下混規(guī)范規(guī)定了該線性組合的增益, 并且與輸入信號的譯碼無關(guān),即,當(dāng)下混級140工作時,它與輸入信號的譯碼無關(guān)地進(jìn)行操 作。
[0074] 在本實施例中,當(dāng)音頻信號被參數(shù)譯碼時,下混級140接收具有n-m個空通道的m 通道核心信號。下混規(guī)范所規(guī)定的線性組合的增益被選擇為使得當(dāng)音頻信號被參數(shù)譯碼 時,下混信號X與核心信號相同,即,線性組合通過核心信號??梢匀缦碌貙ο禄旒夁M(jìn)行建 模:
【權(quán)利要求】
1. 一種用于重構(gòu)n通道音頻信號的解碼系統(tǒng)(100),其中,所述解碼系統(tǒng)適于接收比特 流(P),所述比特流(P)對輸入信號進(jìn)行編碼,所述輸入信號被分割為時間幀,并且在給定 時間幀中根據(jù)選自以下組的譯碼機制表示所述音頻信號,所述組包含: a) 使用至少一個混合參數(shù)(a)的參數(shù)譯碼;和 b) 使用n個離散編碼通道的離散譯碼, 所述解碼系統(tǒng)能夠操作為基于所述n個離散編碼通道或者通過空間合成來推導(dǎo)所述 音頻信號, 所述解碼系統(tǒng)包括: 下混級(140),能夠操作為根據(jù)下混規(guī)范基于所述輸入信號來輸出m通道下混信號 (X),其中,n>m彡1 ;和 空間合成級(150),能夠操作為基于所述下混信號和所述至少一個混合參數(shù)來輸出所 述音頻信號的n通道表示(Y), 其中,所述下混級適于在每一離散譯碼時間幀集合中的至少第一時間幀中以及在每一 離散譯碼時間幀集合之后的至少第一時間幀中工作。
2. 根據(jù)權(quán)利要求1所述的解碼系統(tǒng),還包括音頻解碼器(110),所述音頻解碼器適于基 于所述比特流輸出所述輸入信號,其中,所述音頻解碼器適于使用重疊變換窗口來執(zhí)行時 頻變換。
3. 根據(jù)權(quán)利要求2所述的解碼系統(tǒng),其中,所述時間幀中的每一個等于所述變換窗口 中的至少一個的一半長度。
4. 根據(jù)前述任一項權(quán)利要求所述的解碼系統(tǒng),其中,所述下混級適于在所述輸入信號 通過參數(shù)譯碼表示所述音頻信號的每個時間幀內(nèi)工作。
5. 根據(jù)前述任一項權(quán)利要求所述的解碼系統(tǒng),其中,所述解碼系統(tǒng)適于接收對輸入信 號進(jìn)行編碼的比特流,所述輸入信號在其中所述輸入信號通過參數(shù)譯碼表示音頻信號的每 個時間幀中包括m通道核心信號,所述m通道核心信號為使得在所述輸入信號將音頻信號 表示為n個離散編碼通道的每個時間幀中,能夠使用所述下混規(guī)范從所述輸入信號獲得表 示相同的音頻信號的m通道核心信號。
6. 根據(jù)權(quán)利要求5所述的解碼系統(tǒng),其中,所述下混級適于在所述輸入信號通過參數(shù) 譯碼表示音頻信號的每個時間幀中、通過將所述音頻信號的參數(shù)譯碼表示的核心信號再現(xiàn) 為下混信號來產(chǎn)生所述下混信號。
7. 根據(jù)前述任一項權(quán)利要求所述的解碼系統(tǒng),其中,所述解碼系統(tǒng)適于接收對輸入信 號進(jìn)行編碼的比特流,所述輸入信號在其中所述輸入信號通過參數(shù)譯碼表示音頻信號的每 個時間幀中是n通道信號,其中,n-m個通道不用于表示所述音頻信號。
8. 根據(jù)前述任一項權(quán)利要求所述的解碼系統(tǒng),還包括: 第一延遲線(120),適于接收所述輸入信號;和 混合器(130),通信地連接到所述空間合成級和所述第一延遲線,并且適于 -在所述系統(tǒng)的參數(shù)模式下,輸出空間合成級輸出或者從其推導(dǎo)的信號; -在所述系統(tǒng)的離散模式下,輸出第一延遲線輸出;和 -響應(yīng)于在所述輸入信號中發(fā)生的參數(shù)譯碼和離散譯碼之間的變化,輸出空間合成級 輸出與第一延遲線輸出之間的混合轉(zhuǎn)變。
9. 根據(jù)權(quán)利要求8所述的解碼系統(tǒng),其中,所述第一延遲線能夠操作為引起與總通過 時間相對應(yīng)的延遲,所述總通過時間是與所述下混級和所述空間合成級相關(guān)聯(lián)的。
10. 根據(jù)權(quán)利要求9所述的解碼系統(tǒng),還包括適于接收混合器輸出的第二延遲線 (160),其中,所述第一延遲線和第二延遲線所引起的總延遲對應(yīng)于一個時間幀的長度的倍 數(shù)。
11. 根據(jù)前述任一項權(quán)利要求所述的解碼系統(tǒng),其中,所述空間合成級適于應(yīng)用混合 參數(shù)值,所述混合參數(shù)值通過如下這樣的連續(xù)時間幀之間的內(nèi)插而獲得,在所述連續(xù)時間 幀中,在參數(shù)譯碼或者在適用的情況下的縮減參數(shù)譯碼中輸入信號定義用于時間幀中的非 起始點的明確的混合參數(shù)值。
12. 根據(jù)權(quán)利要求11所述的解碼系統(tǒng),其中,所述空間合成級適于響應(yīng)于當(dāng)前時間幀 是時間幀集合中的第一時間幀而發(fā)起離散到參數(shù)轉(zhuǎn)變,在所述集合中每個時間幀被參數(shù)譯 碼或者在適用的情況下被縮減參數(shù)譯碼,所述離散到參數(shù)轉(zhuǎn)變包括對最早的明確的混合參 數(shù)值進(jìn)行向后外插直到當(dāng)前時間幀的開始為止。
13. 根據(jù)權(quán)利要求11或12所述的解碼系統(tǒng),其中,所述空間合成級適于響應(yīng)于當(dāng)前時 間幀是離散譯碼時間幀集合中的第一時間幀而發(fā)起參數(shù)到離散轉(zhuǎn)變,所述參數(shù)到離散轉(zhuǎn)變 包括對最新的明確的混合參數(shù)值進(jìn)行向前外插,直到至少當(dāng)前時間幀的結(jié)束為止。
14. 根據(jù)前述任一項權(quán)利要求所述的解碼系統(tǒng),其中,所述空間合成級包括: 第一變換級(151),適于接收所述m通道下混信號的時域表示,并且基于其輸出所述下 混信號的頻域表示(Xf); 上混級(155),適于基于所述下混信號的頻域表示和所述至少一個混合參數(shù)來輸出所 述音頻信號的所述n通道表示的頻域表示(Yf);和 第二變換級(152),適于接收所述音頻信號的n通道表示的頻域表示,并且基于其輸出 所述音頻信號的n通道表示的時域表示作為所述空間合成級的輸出。
15. 根據(jù)權(quán)利要求14所述的解碼系統(tǒng),其中,所述上混級適于形成包括所述下混信號 的m通道頻域表示中的通道的線性組合;并且將其輸出作為所述音頻信號的n通道表示的 頻域表示,所述至少一個混合參數(shù)控制所述線性組合中的所述下混信號的m通道頻域表示 中的至少一個通道相關(guān)的至少一個增益。
16. 根據(jù)前述任一項權(quán)利要求所述的解碼系統(tǒng),其中,所述下混級適于形成所述輸入信 號的時域表示的通道的線性組合。
17. 根據(jù)前述任一項權(quán)利要求所述的解碼系統(tǒng),還包括控制器(170),所述控制器用于 基于當(dāng)前時間幀和前一時間幀的譯碼機制來控制所述空間合成級和任何混合器。
18. 根據(jù)權(quán)利要求17所述的解碼系統(tǒng),其中,所述控制器基于當(dāng)前時間幀和先前兩個 時間幀的譯碼機制來控制所述空間合成級和任何混合器。
19. 根據(jù)前述任一項權(quán)利要求所述的解碼系統(tǒng),其中,譯碼機制的組還包括: c)縮減參數(shù)譯碼, 所述解碼系統(tǒng)適于接收對輸入信號進(jìn)行編碼的比特流,所述輸入信號在其中輸入信號 通過縮減參數(shù)譯碼表示音頻信號的每個時間幀中具有m通道核心信號的形式,所述m通道 核心信號為使得在其中輸入信號將音頻信號表示為n個離散編碼通道的每個時間幀中,能 夠使用下混規(guī)范從所述輸入信號獲得表示相同的音頻信號的m通道核心信號。
20. 根據(jù)權(quán)利要求19所述的解碼系統(tǒng),其中,所述空間合成級(150)能夠操作為在其中 輸入信號通過縮減參數(shù)譯碼表示音頻信號的每個時間幀中基于所述輸入信號和所述至少 一個混合參數(shù)輸出所述音頻信號的n通道表示。
21. 根據(jù)權(quán)利要求19或20所述的解碼系統(tǒng),適于接收如下格式的比特流,在所述格式 中,所述輸入信號的緊接在所述輸入信號的參數(shù)譯碼時間幀后面的每個時間幀通過縮減參 數(shù)譯碼或離散譯碼被譯碼。
22. 根據(jù)前述任一項權(quán)利要求所述的解碼系統(tǒng),適于接收如下格式的比特流,在所述格 式中,所述輸入信號的緊接在所述輸入信號的離散譯碼時間幀前面的每個時間幀通過離散 譯碼或參數(shù)譯碼被譯碼,并且其中,所述輸入信號的緊接在所述輸入信號的離散譯碼時間 幀后面的每個時間幀通過離散譯碼或參數(shù)譯碼被譯碼。
23. -種重構(gòu)n通道音頻信號的方法,所述方法包括以下步驟: 接收比特流(P),所述比特流對輸入信號進(jìn)行編碼,所述輸入信號被分割為時間幀,并 且在給定時間幀中根據(jù)選自以下組的譯碼機制表示所述音頻信號,所述組包含: a) 使用至少一個混合參數(shù)(a )的參數(shù)譯碼;和 b) 使用n個離散編碼通道的離散譯碼, 響應(yīng)于當(dāng)前時間幀是離散譯碼時間幀集合中的第一時間幀,或者當(dāng)前時間幀是離散譯 碼時間幀集合之后的第一時間幀,根據(jù)下混規(guī)范基于所述輸入信號產(chǎn)生m通道下混信號, 其中,n>m > 1 ; 響應(yīng)于所述輸入信號在當(dāng)前時間幀和先前兩個時間幀中被離散譯碼,基于所述n個離 散編碼通道推導(dǎo)音頻信號;和 響應(yīng)于所述輸入信號在當(dāng)前時間幀和先前兩個時間幀中被參數(shù)譯碼,基于所述下混信 號和所述至少一個混合參數(shù)產(chǎn)生音頻信號的n通道表示。
24. 根據(jù)權(quán)利要求23所述的方法,包括以下步驟: 響應(yīng)于所述輸入信號在當(dāng)前時間巾貞和前一時間巾貞中被離散譯碼,基于所述n個離散編 碼通道推導(dǎo)音頻信號;以及 響應(yīng)于所述輸入信號在當(dāng)前時間幀和前一時間幀中被參數(shù)譯碼,基于所述下混信號和 所述至少一個混合參數(shù)產(chǎn)生音頻信號的n通道表示。
25. 根據(jù)權(quán)利要求23或24所述的方法,其中,所述輸入信號的其中所述輸入信號通過 參數(shù)譯碼表示音頻信號的每個時間巾貞包括對于給定時間巾貞中的非起始點的所述至少一個 混合參數(shù)的值,所述方法還包括以下步驟: 響應(yīng)于當(dāng)前時間幀是參數(shù)譯碼時間幀集合中的第一時間幀,對所接收的所述至少一個 混合參數(shù)的值進(jìn)行向后外插,直到當(dāng)前時間幀的開始為止。
26. 根據(jù)權(quán)利要求23至25中任一項所述的方法,還包括以下步驟: 響應(yīng)于所述輸入信號在當(dāng)前時間幀中被離散譯碼并且在前一時間幀中被參數(shù)譯碼,基 于所述下混信號并且基于所述至少一個混合參數(shù)的與前一時間幀相關(guān)聯(lián)的至少一個值來 產(chǎn)生音頻信號的n通道表示,并且在當(dāng)前時間幀期間轉(zhuǎn)變?yōu)榛谒鰊個離散編碼通道推 導(dǎo)音頻信號。
27. -種用于對分割為時間幀的n通道音頻信號進(jìn)行編碼的編碼系統(tǒng)(200),其中,所 述編碼系統(tǒng)適于輸出比特流(P),所述比特流在給定時間幀中根據(jù)選自以下組的譯碼機制 表示所述音頻信號,所述組包含: a) 參數(shù)譯碼;和 b) 使用n個離散編碼通道的離散譯碼, 所述編碼系統(tǒng)包括: 選擇器(230),適于對于給定時間幀選擇哪個編碼機制將用于表示音頻信號;和 參數(shù)分析級(240),能夠操作為基于音頻信號的n通道表示并且根據(jù)下混規(guī)范來輸 出將由輸出的比特流在參數(shù)譯碼機制中編碼的m通道核心信號(X)和至少一個混合參數(shù) (a ),其中,n>m 彡 1。
28. 根據(jù)權(quán)利要求27所述的編碼系統(tǒng),其中,該譯碼機制的組還包括: c) 縮減參數(shù)譯碼, 其中,在參數(shù)譯碼機制和離散譯碼機制中使用n通道信號格式,并且在縮減參數(shù)譯碼 機制中使用m通道信號格式。
29. 根據(jù)權(quán)利要求28所述的編碼系統(tǒng),其中,所述選擇器適于選擇在緊接在參數(shù)譯碼 時間幀后面的時間幀中通過縮減參數(shù)譯碼或離散譯碼表示音頻信號。
30. 根據(jù)權(quán)利要求27至29中的任一個所述的編碼系統(tǒng),其中,所述選擇器適于: 選擇在緊接在離散譯碼時間幀后面的時間幀中通過離散譯碼或參數(shù)譯碼表示音頻信 號;以及 選擇在緊接在離散譯碼時間幀后面的時間幀中通過離散譯碼或參數(shù)譯碼表示音頻信 號。
31. -種音頻發(fā)布系統(tǒng),所述音頻發(fā)布系統(tǒng)包括根據(jù)權(quán)利要求27至30中任一項所述的 編碼系統(tǒng)和根據(jù)權(quán)利要求1至22中任一項所述的解碼系統(tǒng),所述編碼系統(tǒng)和所述解碼系統(tǒng) 通信地連接,并且所述編碼系統(tǒng)和所述解碼系統(tǒng)各自的下混規(guī)范是相同的。
32. -種將n通道音頻信號編碼為比特流(P)的方法,所述方法包括以下步驟: 接收所述音頻信號的n通道表示; 從以下組選擇要使用哪個譯碼機制在給定時間幀中表示所述音頻信號,所述組包括: a) 參數(shù)譯碼;和 b) 使用n個離散編碼通道的離散譯碼; 響應(yīng)于通過參數(shù)譯碼對所述音頻信號進(jìn)行編碼的決定,基于所述音頻信號的n通道表 示并且根據(jù)下混規(guī)范來形成比特流,所述比特流對m通道核心信號(X)和至少一個混合參 數(shù)(〇)進(jìn)行編碼,其中,n>m彡1 ;和 響應(yīng)于通過離散譯碼對所述音頻信號進(jìn)行編碼的決定,輸出通過n個離散編碼通道對 所述音頻信號進(jìn)行編碼的比特流。
33. -種包括計算機可讀介質(zhì)的計算機程序產(chǎn)品,所述計算機可讀介質(zhì)具有用于執(zhí)行 根據(jù)權(quán)利要求23至26和32中任一項所述的方法的指令。
34. -種根據(jù)前述任一項權(quán)利要求所述的裝置或方法,其中,n = 6, m = 2。
【文檔編號】G10L19/18GK104364843SQ201380030996
【公開日】2015年2月18日 申請日期:2013年6月14日 優(yōu)先權(quán)日:2012年6月14日
【發(fā)明者】H·普恩哈根, L·塞勒斯特羅姆, K·J·羅德恩, K·克約爾林, L·維爾莫斯 申請人:杜比國際公司