專利名稱:使用頻譜分量耦合和頻譜分量再生的改進(jìn)音頻編碼系統(tǒng)和方法
技術(shù)領(lǐng)域:
本發(fā)明涉及用于傳輸、記錄和回放音頻信號的音頻編碼和解碼裝置和方法。更具體地,本發(fā)明涉及減少傳送或記錄給定音頻信號所需要的信息,同時(shí)在回放輸出信號中維持給定感覺質(zhì)量水平。
背景技術(shù):
許多通信系統(tǒng)面臨著信息傳輸和記錄容量的需求通常超過可用容量的問題。因此,其中在廣播和記錄領(lǐng)域中很受關(guān)注的是,降低傳送或記錄供人感知的音頻信號所需要的信息量而不降低它的感覺質(zhì)量。
用于降低信息容量要求的傳統(tǒng)方法涉及只傳送或記錄輸入信號中的選定部分。丟棄其余部分。稱為感知編碼的技術(shù)典型地轉(zhuǎn)換原始音頻信號為頻譜分量或者頻率子帶信號,以便冗余或者不相關(guān)的那些信號部分可以被更容易地識(shí)別和丟棄。一個(gè)信號部分如果可以從該信號的其他部分再生,那么它就被認(rèn)為是冗余的。如果一個(gè)信號部分感覺上無關(guān)緊要或者聽不見,那么它就被認(rèn)為是不相關(guān)的。感知解碼器可以從一個(gè)已編碼信號中再生丟失的冗余部分,但是它不能產(chǎn)生還不是冗余的任何丟失的不相關(guān)信息。然而,不相關(guān)信息的丟失是可接受的,因?yàn)樗娜鄙賹σ呀獯a信號沒有任何可察覺的影響。
如果信號編碼技術(shù)僅僅丟棄冗余或者感覺上不相關(guān)的那些信號部分,那么它在感覺上是透明的。如果感覺上透明的技術(shù)不能達(dá)到充分降低信息容量的要求,那么就需要感覺上不透明的技術(shù)來丟棄非冗余并且感覺上相關(guān)的附加信號部分。不可避免的結(jié)果就是,所傳送或記錄信號的感覺保真度就會(huì)降低。優(yōu)選地,感覺上不透明的技術(shù)只丟棄被認(rèn)為感覺上最不重要的那些信號部分。
一種稱為“耦合”的編碼技術(shù)可以用來降低信息容量要求,它通常被認(rèn)為是感覺上不透明的技術(shù)。根據(jù)該技術(shù),組合兩個(gè)或更多個(gè)輸入音頻信號中的頻譜分量以形成耦合聲道信號,該耦合聲道信號具有這些頻譜分量的復(fù)合表示。還產(chǎn)生補(bǔ)充信息,表示每一個(gè)輸入音頻信號中為了形成該復(fù)合表示所組合的頻譜分量的譜包絡(luò)。傳送或記錄包括耦合聲道信號和補(bǔ)充信息的已編碼信號,以供接收機(jī)隨后解碼。該接收機(jī)通過產(chǎn)生耦合聲道信號的副本并且使用補(bǔ)充信息對復(fù)制信號中的頻譜分量定標(biāo)使得原始輸入信號的譜包絡(luò)基本上被恢復(fù),來產(chǎn)生去耦信號,這些去耦信號是原始輸入信號的不精確復(fù)制。一種用于雙聲道立體聲系統(tǒng)的典型耦合技術(shù)組合左右聲道信號的高頻分量來形成一個(gè)單獨(dú)的復(fù)合高頻分量信號,并且產(chǎn)生表示原始左右聲道信號中的高頻分量的譜包絡(luò)的補(bǔ)充信息。在高級電視系統(tǒng)委員會(huì)(ATSC)標(biāo)準(zhǔn)文件A/52的“Digital Audio Compression(AC-3)”中描述了耦合技術(shù)的一個(gè)例子,通過引用其全部包含于此。
應(yīng)該選擇補(bǔ)充信息和耦合聲道信號的信息容量要求,以便優(yōu)化兩個(gè)競爭需要之間的折衷。如果用于補(bǔ)充信息的信息容量要求設(shè)置得太高,那么耦合聲道將被迫以低精確度傳送它的頻譜分量。耦合聲道頻譜分量中的較低精確度可能導(dǎo)致聽得見程度的編碼噪聲或量化噪聲被注入到去耦信號中。相反,如果耦合聲道信號的信息容量要求設(shè)置得太高,那么補(bǔ)充信息將被迫傳送具有低水平頻譜細(xì)節(jié)的譜包絡(luò)。譜包絡(luò)中的較低細(xì)節(jié)水平可能導(dǎo)致每個(gè)去耦信號的譜級(spectral level)和形狀的聽得到的差異。
通常,如果補(bǔ)充信息傳送頻率子帶的譜級,那么就可以得到良好的折衷,其中這些子帶具有與人聽覺系統(tǒng)的臨界頻帶相當(dāng)?shù)膸挕?yīng)該注意到,去耦信號可能能夠保持原始輸入信號的原始頻譜分量的譜級,但是他們通常不能保持原始頻譜分量的相位。如果耦合限于高頻頻譜分量,那么可能不會(huì)感覺到相位信息的丟失,因?yàn)槿说穆犛X系統(tǒng)對尤其是在高頻的相位變化相對不敏感。
通過傳統(tǒng)耦合技術(shù)產(chǎn)生的補(bǔ)充信息典型地是頻譜幅度的度量。因此,一個(gè)典型系統(tǒng)中的解碼器基于從頻譜幅度推導(dǎo)的能量度量來計(jì)算定標(biāo)因子。這些計(jì)算通常要求計(jì)算從補(bǔ)充信息得到的值的平方和的平方根,這需要相當(dāng)大的計(jì)算資源。
一種有時(shí)稱為“高頻再生”(HFR)的編碼技術(shù)是感覺上不透明的技術(shù),它可以用來降低信息容量要求。根據(jù)該技術(shù),傳送或存儲(chǔ)只包含輸入音頻信號的低頻分量的基帶信號。還提供表示原始高頻分量的頻譜包絡(luò)的補(bǔ)充信息。傳送或記錄一個(gè)包括該基帶信號和該補(bǔ)充信息的已編碼信號,供接收機(jī)隨后解碼。該接收機(jī)基于該補(bǔ)充信息再生具有譜級的所省略高頻分量并且組合該基帶信號和該再生高頻分量來產(chǎn)生輸出信號。在1979年4月的Proc.of the International Conf.onAcoust.,Speech and Signal Proc.中的Makhoul和Berouti的“High-Frequency Regeneration in Speech Coding Systems”,可以找到已知HFR方法的描述。在2002年3月28日提交的題目為“BroadbandFrequency Translation for High Frequency Regeneration”的美國專利申請第10/113,858號中公開了適于編碼高質(zhì)量音樂的改進(jìn)HFR技術(shù),通過參考其全部包含于此并且在下面稱為HFR申請。
應(yīng)該選擇補(bǔ)充信息和基帶信號的信息容量要求,以便優(yōu)化兩個(gè)競爭需要之間的折衷。如果用于補(bǔ)充信息的信息容量要求設(shè)置得太高,那么已編碼信號將被迫以低精確度傳送基帶信號中的頻譜分量?;鶐盘栴l譜分量中的較低精確度可能導(dǎo)致聽得見程度的編碼噪聲或量化噪聲被注入到基帶信號以及從它合成的其他信號中。相反,如果基帶信號的信息容量要求設(shè)置得太高,那么補(bǔ)充信息將被迫傳送具有低水平頻譜細(xì)節(jié)的譜包絡(luò)。譜包絡(luò)中的較低細(xì)節(jié)水平可能導(dǎo)致每個(gè)合成信號的譜級和形狀的聽得到的差異。
通常,如果補(bǔ)充信息傳送頻率子帶的譜級,那么就可以得到良好的折衷,其中這些子帶具有與人聽覺系統(tǒng)的臨界頻帶相當(dāng)?shù)膸挕?br>
正如對上面所討論的耦合技術(shù),通過傳統(tǒng)HFR技術(shù)產(chǎn)生的補(bǔ)充信息典型地是頻譜幅度的度量。因此,一個(gè)典型系統(tǒng)中的解碼器基于從頻譜幅度推導(dǎo)的能量度量來計(jì)算定標(biāo)因子。這些計(jì)算通常要求計(jì)算從補(bǔ)充信息得到的值的平方和的平方根,這需要相當(dāng)大的計(jì)算資源。
傳統(tǒng)的系統(tǒng)使用了耦合技術(shù)或者HFR技術(shù),但沒有同時(shí)使用兩者。在許多應(yīng)用中,耦合技術(shù)可能引起比HFR技術(shù)小的信號劣化,但是HFR技術(shù)可以實(shí)現(xiàn)信息容量要求的更大降低。可以在多聲道和單聲道應(yīng)用中有利地使用HFR技術(shù),但是,在單聲道應(yīng)用中耦合技術(shù)不能提供任何優(yōu)點(diǎn)。
發(fā)明內(nèi)容
本發(fā)明的目的是提供像在音頻編碼系統(tǒng)中實(shí)現(xiàn)耦合和HFR那樣的信號處理技術(shù)的改進(jìn)。
根據(jù)本發(fā)明的一個(gè)方面,一種用于編碼一個(gè)或多個(gè)輸入音頻信號的方法包括以下步驟從輸入音頻信號中得到一個(gè)或多個(gè)基帶信號以及一個(gè)或多個(gè)剩余信號,其中基帶信號的頻譜分量在第一組頻率子帶中,剩余信號的頻譜分量在基帶信號所不表示的第二組頻率子帶中;得到一個(gè)或多個(gè)合成信號的頻譜分量的能量度量,其中這些合成信號將在解碼期間在該第二組子帶內(nèi)產(chǎn)生;得到剩余信號的頻譜分量的能量度量;通過得到剩余信號和合成信號的頻譜分量的能量度量的平方根和比值來計(jì)算定標(biāo)因子;并且將表示定標(biāo)因子的定標(biāo)信息和表示基帶信號中的頻譜分量的信號信息匯編到已編碼信號中。
根據(jù)本發(fā)明的另一個(gè)方面,一種用于解碼表示一個(gè)或多個(gè)輸入音頻信號的已編碼信號的方法包括以下步驟從已編碼信號中得到定標(biāo)信息和信號信息,其中定標(biāo)信息表示通過得到頻譜分量的能量度量的平方根和比值所計(jì)算的定標(biāo)因子,信號信息表示一個(gè)或多個(gè)子帶信號的頻譜分量,并且其中基帶信號中的頻譜分量表示第一組頻率子帶中的輸入音頻信號的頻譜分量;為該基帶信號產(chǎn)生相關(guān)合成信號,這些合成信號具有基帶信號所不表示的第二組頻率子帶中的頻譜分量,其中根據(jù)一個(gè)或多個(gè)定標(biāo)因子通過乘法和除法對合成信號中的頻譜分量定標(biāo);并且產(chǎn)生一個(gè)或多個(gè)輸出音頻信號,這些信號表示輸入音頻信號并且是從基帶信號和相關(guān)合成信號中的頻譜分量中產(chǎn)生的。
根據(jù)本發(fā)明的又一個(gè)方面,一種用于編碼多個(gè)輸入音頻信號的方法包括以下步驟從輸入音頻信號中得到多個(gè)基帶信號、多個(gè)剩余信號和一個(gè)耦合聲道信號,其中基帶信號的頻譜分量表示在第一組頻率子帶中的輸入音頻信號頻譜分量而剩余信號的頻譜分量表示在基帶信號所不表示的第二組頻率子帶中的輸入音頻信號頻譜分量,并且其中耦合聲道信號的頻譜分量表示在第三組頻率子帶中的兩個(gè)或更多個(gè)輸入音頻信號的頻譜分量的復(fù)合;得到剩余信號和該耦合聲道信號所表示的兩個(gè)或更多個(gè)輸入音頻信號的頻譜分量的能量度量;并且將從能量度量中推導(dǎo)出來的定標(biāo)信息和表示基帶信號和耦合聲道信號中的頻譜分量的信號信息匯編到已編碼信號。
根據(jù)本發(fā)明的另一個(gè)方面,一種用于解碼表示多個(gè)輸入音頻信號的已編碼信號的方法包括以下步驟從已編碼信號中得到控制信息和信號信息,其中控制信息是從頻譜分量的能量度量中推導(dǎo)出來的并且信號信息表示多個(gè)基帶信號和一個(gè)耦合聲道信號的頻譜分量,基帶信號中的頻譜分量表示在第一組頻率子帶中的輸入音頻信號頻譜分量,耦合聲道信號的頻譜分量表示在兩個(gè)或更多個(gè)輸入音頻信號的第三組頻率子帶中的頻譜分量的復(fù)合;為基帶信號產(chǎn)生相關(guān)合成信號,這些相關(guān)合成信號具有基帶信號所不表示的第二組頻率子帶中的頻譜分量,其中根據(jù)該控制信息對相關(guān)合成信號中的頻譜分量定標(biāo);從耦合聲道信號中為耦合聲道信號所表示的兩個(gè)或更多個(gè)輸入音頻信號產(chǎn)生去耦信號,其中去耦信號具有根據(jù)控制信息所定標(biāo)的第三頻率子帶中的頻譜分量;并且從基帶信號和相關(guān)合成信號中的頻譜分量產(chǎn)生表示輸入音頻信號的多個(gè)輸出信頻信號,其中表示兩個(gè)或更多個(gè)音頻信號的輸出音頻信號也是從各個(gè)去耦信號中的頻譜分量中產(chǎn)生的。
本發(fā)明的其它方面包括具有執(zhí)行各種編碼和解碼方法的處理電路的裝置;攜帶裝置可執(zhí)行指令的程序的媒體,其中該程序會(huì)引起裝置執(zhí)行各種編碼和解碼方法;以及攜帶表示各種編碼方法所產(chǎn)生的輸入音頻信號的已編碼信息的媒體。
通過參考下面的討論和附圖,可以更好地理解本發(fā)明的各種特點(diǎn)及其優(yōu)選實(shí)施例,其中幾個(gè)圖中相同的參考編號指的是相同的元件。下面討論和附圖的內(nèi)容僅僅作為例子闡述,不應(yīng)該理解為表示對本發(fā)明范圍的限制。
圖1是對音頻信號編碼的裝置的示意框圖,其中該編碼信號用于隨后通過一個(gè)裝置使用高頻再生進(jìn)行解碼。
圖2是使用高頻再生解碼已編碼音頻信號的裝置的示意框圖。
圖3是將音頻信號分為頻率子帶信號的裝置的示意框圖,這些子帶信號具有響應(yīng)于該音頻信號的一個(gè)或多個(gè)特征所適配的范圍。
圖4是從具有所適配范圍的頻率子帶信號合成音頻信號的裝置的示意框圖。
圖5和6是使用耦合來編碼音頻信號的裝置的示意框圖,該編碼信號用于隨后通過一個(gè)裝置使用高頻再生和去耦合進(jìn)行解碼。
圖7是使用高頻再生和去耦合來解碼已編碼信號的裝置的示意框圖。
圖8是一個(gè)編碼音頻信號的裝置的示意框圖,該裝置使用第二分析濾波器組以便提供用于能量計(jì)算的附加頻譜分量。
圖9是可以實(shí)現(xiàn)本發(fā)明的各個(gè)方面的設(shè)備的示意框圖。
具體實(shí)施例方式
A.概述本發(fā)明涉及降低已編碼信號的信息容量要求的音頻編碼系統(tǒng)和方法,其通過丟棄原始輸入音頻信號的“剩余”部分并且只編碼原始輸入音頻信號的基帶部分、并且隨后通過產(chǎn)生合成信號代替丟失的剩余部分來解碼已編碼信號來實(shí)現(xiàn)。已編碼信號包括解碼處理用來控制信號合成的定標(biāo)信息,以便合成信號在某種程度上保持原始輸入音頻信號的剩余部分的譜級。
這種編碼技術(shù)在此稱為高頻再生(HFR),因?yàn)榭梢灶A(yù)料到,在許多實(shí)現(xiàn)中,剩余信號將包含較高頻率的頻譜分量。但是原則上,該技術(shù)并不限于只合成高頻頻譜分量?;鶐盘柨梢园ǜ哳l率頻譜分量的一些或全部,或者可以包括分散在整個(gè)輸入信號總帶寬的頻率子帶中的頻譜分量。
1.編碼器圖1示出接收輸入音頻信號并且產(chǎn)生表示該輸入音頻信號的已編碼信號的音頻編碼器。分析濾波器組10從路徑9接收該輸入音頻信號,并且作為響應(yīng),提供表示該音頻信號的頻譜分量的頻率子帶信息。沿著路徑12產(chǎn)生表示基帶信號的頻譜分量的信息并且沿著路徑11產(chǎn)生表示剩余信號的頻譜分量的信息。基帶信號的頻譜分量表示第一組頻率子帶中的一個(gè)或多個(gè)子帶中的輸入音頻信號的頻譜內(nèi)容,這些子帶由已編碼信號中傳送的信號信息來表示。在一種優(yōu)選實(shí)現(xiàn)中,第一組頻率子帶是較低頻子帶。剩余信號的頻譜分量表示在第二組頻率子帶中的一個(gè)或多個(gè)子帶中的輸入音頻信號的頻譜內(nèi)容,這些子帶沒有在基帶被表示并且沒有被已編碼信號傳送。在一種實(shí)現(xiàn)中,第一和第二組頻率子帶的聯(lián)合組成了輸入音頻信號的整個(gè)帶寬。
能量計(jì)算器31計(jì)算剩余信號的一個(gè)或多個(gè)子帶中頻譜能量的一個(gè)或多個(gè)度量。在一種優(yōu)選實(shí)現(xiàn)中,從路徑11接收的頻譜分量被安排在具有與人聽覺系統(tǒng)的臨界頻帶相當(dāng)?shù)膸挼念l率子帶中,并且能量計(jì)算器31提供這些頻率子帶中每一個(gè)的能量度量。
合成模型21表示信號合成處理,該處理將會(huì)在對沿著路徑51產(chǎn)生的已編碼信號進(jìn)行解碼的解碼處理中發(fā)生。合成模型21可以自己執(zhí)行合成處理或者它可以執(zhí)行某種其他處理,該其他處理可以估計(jì)合成信號的頻譜能量而不實(shí)際執(zhí)行合成處理。能量計(jì)算器32接收合成模型21的輸出并且計(jì)算要合成的信號中的頻譜能量的一個(gè)或多個(gè)度量。在一個(gè)優(yōu)選實(shí)現(xiàn)中,合成信號的頻譜分量被安排在具有與人聽覺系統(tǒng)的臨界頻帶相當(dāng)?shù)膸挼念l率子帶中,并且能量計(jì)算器32提供這些頻率子帶中每一個(gè)的能量度量。
在圖1中的描述和圖5、6和8中的描述表示了分析濾波器組和合成模型之間的連接,其建議合成模型至少部分地響應(yīng)于基帶信號;但是,這種連接是可選的。下面討論合成模型的一些實(shí)現(xiàn)。這些實(shí)現(xiàn)中的一些獨(dú)立于基帶信號而操作。
定標(biāo)因子計(jì)算器40從兩個(gè)能量計(jì)算器中的每一個(gè)接收一個(gè)或多個(gè)能量度量,并且計(jì)算定標(biāo)因子,這在下面更詳細(xì)地解釋。沿著路徑41傳遞表示所計(jì)算的定標(biāo)因子的定標(biāo)信息。
格式化器50從路徑41接收定標(biāo)信息并且從路徑12接收表示基帶信號的頻譜分量的信息。這些信息被匯編到已編碼信號中,后者沿著路徑51傳遞供傳輸或記錄用。已編碼信號可以通過基帶或包括超聲波到紫外頻率的整個(gè)頻譜上的調(diào)制通信路徑傳送,或者它可以使用基本上任何記錄技術(shù)記錄在媒體上,這些記錄技術(shù)包括磁帶、卡或盤、光卡或盤以及在像紙張這樣的媒體上的可檢測標(biāo)記。
在優(yōu)選實(shí)現(xiàn)中,使用可以通過丟棄冗余或不相關(guān)的部分降低信息容量要求的感知編碼處理來編碼基帶信號的頻譜分量。這些編碼處理對于本發(fā)明來說不是必要的。
2.解碼器圖2描述了接收表示音頻信號的已編碼信號并且產(chǎn)生該音頻信號的解碼表示的音頻解碼器。去格式化器60從路徑59接收已編碼信號并且從已編碼信號中得到定標(biāo)信息和信號信息。定標(biāo)信息表示定標(biāo)因子而信號信息表示基帶信號的頻譜分量,其中該基帶信號具有在第一組頻率子帶中的一個(gè)或多個(gè)子帶中的頻譜分量。信號合成部件23執(zhí)行合成處理以便產(chǎn)生具有在第二組頻率子帶中的一個(gè)或多個(gè)子帶中的頻譜分量的信號,這些頻率分量表示已編碼信號沒有傳送的剩余信號的頻譜分量。
圖2和7中的描述示出了去格式化器和信號合成部件23之間的連接,其建議信號合成至少部分地響應(yīng)于基帶信號;但是,該連接是可選的。下面討論信號合成的一些實(shí)現(xiàn)。這些實(shí)現(xiàn)中的一些獨(dú)立于基帶信號而操作。
信號定標(biāo)部件70從由路徑61接收的定標(biāo)信息中得到定標(biāo)因子。定標(biāo)因子用來對信號合成部件23產(chǎn)生的合成信號的頻譜分量定標(biāo)。合成濾波器組80從路徑71接收已定標(biāo)合成信號,從路徑62接收基帶信號的頻譜分量,并且作為響應(yīng)沿著路徑89產(chǎn)生輸出音頻信號,該輸出音頻信號是原始輸入音頻信號的解碼表示。盡管輸出信號與原始輸入音頻信號不同樣,但是可以預(yù)料到,該輸出信號與輸入音頻信號在感覺上不可區(qū)別,或者對于給定應(yīng)用至少是以在感覺上令人滿意并且可接受的方式可區(qū)別的。
在優(yōu)選實(shí)現(xiàn)中,信號信息表示編碼形式的基帶信號的頻譜分量,必須使用與編碼器中使用的編碼處理相反的解碼處理來解碼。如上所提到的,這些處理對于本發(fā)明來說不是必要的。
3.濾波器組分析和合成濾波器組可以以期望的基本上任何方式來實(shí)現(xiàn),包括數(shù)字濾波器技術(shù)、塊變換和小波變換的廣泛范圍。在一個(gè)具有如圖1和2中分別所示的解碼器和編碼器的音頻編碼系統(tǒng)中,分析濾波器組10通過改進(jìn)離散余弦變換(MDCT)來實(shí)現(xiàn),并且合成濾波器組80可以通過改進(jìn)離散余弦反變換來實(shí)現(xiàn),這些在1987年5月的Proc.ofthe International Conf.on Acoust.,Speech and Signal Proc.第2161-64頁P(yáng)rincen等人的“Subband/Transform Coding Using Filter BankDesigns Based on Time Domain Aliasing Cancellation”中描述了。原則上沒有特定的濾波器實(shí)現(xiàn)是很重要的。
通過塊變換實(shí)現(xiàn)的分析濾波器組將一塊或一個(gè)時(shí)段的輸入信號分為一組表示該時(shí)段的信號的頻譜內(nèi)容的變換系數(shù)。一個(gè)或多個(gè)相鄰變換系數(shù)的一個(gè)組表示一個(gè)特定頻率子帶中的頻譜內(nèi)容,該子帶具有與該組中的系數(shù)數(shù)量相當(dāng)?shù)膸挕?br>
通過某種數(shù)字濾波器例如多相濾波器而不是塊變換實(shí)現(xiàn)的分析濾波器組將輸入信號分為一組子帶信號。每個(gè)子帶信號是一個(gè)特定頻率子帶內(nèi)的輸入信號頻譜內(nèi)容的基于時(shí)間的表示。優(yōu)選地,子帶信號被抽取,以便每個(gè)子帶信號的帶寬與單位時(shí)段的子帶信號中的抽樣數(shù)量相當(dāng)。
下面的討論具體地參考使用類似于上面提到的時(shí)域混疊消除(TDAC)變換的塊變換的實(shí)現(xiàn)。在該討論中,術(shù)語“頻譜分量”指的是變換系數(shù)并且術(shù)語“頻率子帶”和“子帶信號”涉及一個(gè)或多個(gè)相鄰變換系數(shù)的組。但是,本發(fā)明的原理可以應(yīng)用于其它類型的實(shí)現(xiàn),因此術(shù)語“頻率子帶”和“子帶信號”還涉及表示一個(gè)信號的整個(gè)帶寬一部分的頻譜內(nèi)容的信號,并且術(shù)語“頻譜分量”通常理解為指的是子帶信號的抽樣或單元。
B.定標(biāo)因子在使用例如像TDAC變換這樣的變換的編碼系統(tǒng)中,變換系數(shù)X(k)表示原始輸入音頻信號x(t)的頻譜分量。變換系數(shù)分為不同組,表示基帶信號和剩余信號。在使用諸如下述方式之一的合成處理的解碼處理期間,產(chǎn)生合成信號的變換系數(shù)Y(k)。
1.計(jì)算在一個(gè)優(yōu)選實(shí)現(xiàn)中,編碼處理提供定標(biāo)信息,其傳送根據(jù)剩余信號的頻譜能量度量與合成信號的頻譜能量度量的比值的平方根而計(jì)算的定標(biāo)因子。對剩余信號和合成信號的頻譜能量的度量可以根據(jù)下式計(jì)算E(k)=X2(k) (1a)ES(k)=Y(jié)2(k) (1b)其中,X(k)=剩余信號中的變換系數(shù)k;E(k)=頻譜分量X(k)的能量度量;Y(k)=合成信號中的變換系數(shù)k;以及ES(k)=頻譜分量Y(k)的能量度量。
對于大多數(shù)應(yīng)用來說,用于補(bǔ)充信息的信息容量要求太高,其中補(bǔ)充信息基于對每個(gè)頻譜分量的能量度量;因此,根據(jù)下式由頻譜分量的組或頻率子帶的能量度量計(jì)算定標(biāo)因子E(m)=Σk=m1m2X2(k)---(2a)]]>ES(m)=Σk=m1m2Y2(k)---(2b)]]>
其中,E(m)=對剩余信號的頻率子帶m的能量度量;以及ES(m)=對合成信號的頻率子帶m的能量度量。求和界限m1和m2規(guī)定了在子帶m中的最低和最高頻譜分量。在優(yōu)選實(shí)現(xiàn)中,這些頻率子帶具有與人聽覺系統(tǒng)的臨界頻帶相當(dāng)?shù)膸挕?br>
求和界限還可以使用一個(gè)集合表示法來表示,例如k∈{M},其中{M}表示包含在能量計(jì)算中的所有頻譜分量的集合。基于下面解釋的原因,該表示法在說明書其余部分中使用。使用該表示法,公式2a和2b可以分別如公式2c和2d所示寫為E(m)=Σk∈{M}X2(k)---(2c)]]>ES(m)=Σk∈{M}Y2(k)---(2d)]]>其中,{M}=子帶m中的所有頻譜分量的集合。
根據(jù)下式之一可以計(jì)算用于子帶m的定標(biāo)因子SF(m)SF(m)=E(m)ES(m)---(3a)]]>SF(m)=E(m)ES(m)---(3b)]]>但是,基于第一公式的計(jì)算通常更有效。
2.定標(biāo)因子的表示優(yōu)選地,編碼處理在已編碼信號中提供定標(biāo)信息,其以需要比這些定標(biāo)因子本身低的信息容量的形式來傳送所計(jì)算的定標(biāo)因子??梢允褂酶鞣N方法來降低定標(biāo)信息的信息容量要求。
一種方法是將每個(gè)定標(biāo)因子本身表示為具有相關(guān)定標(biāo)值的定標(biāo)數(shù)。可實(shí)現(xiàn)該方法的一種方式是將每個(gè)定標(biāo)因子表示為一個(gè)浮點(diǎn)數(shù),其中尾數(shù)是定標(biāo)數(shù)并且相關(guān)指數(shù)表示定標(biāo)值??梢赃x擇尾數(shù)或定標(biāo)數(shù)的精確度,以便傳送具有足夠精確度的定標(biāo)因子??梢赃x擇指數(shù)或定標(biāo)值的允許范圍,以便為定標(biāo)因子提供足夠的動(dòng)態(tài)范圍。產(chǎn)生定標(biāo)信息的處理還可以允許兩個(gè)或更多浮點(diǎn)尾數(shù)或定標(biāo)數(shù)來共享一個(gè)共同指數(shù)或定標(biāo)值。
另一種方法通過相對于某個(gè)基值或歸一化值歸一化定標(biāo)因子來降低信息容量要求。可以在定標(biāo)信息的編碼和解碼處理之前規(guī)定該基值,或者可以自適應(yīng)地確定它。例如,可以相對于一個(gè)時(shí)段的音頻信號的最大定標(biāo)因子來歸一化用于音頻信號的所有頻率子帶的定標(biāo)因子,或者可以相對于從規(guī)定的一組值中選擇的一個(gè)值來對它們歸一化?;档哪撤N指示可以與定標(biāo)信息包含在一起,以便解碼處理可以撤銷歸一化的作用。
如果定標(biāo)因子可由在從零到一范圍內(nèi)的值來表示,在許多實(shí)現(xiàn)中可以便于編碼和解碼定標(biāo)信息所需的處理。如果相對于等于或大于所有可能定標(biāo)因子的某個(gè)基值來歸一化定標(biāo)因子,那么可以確保該范圍。作為替換,可以相對于比可合理預(yù)期的任何定標(biāo)因子大的某個(gè)基值來歸一化定標(biāo)因子,并且如果某個(gè)意外或罕見事件導(dǎo)致一個(gè)定標(biāo)因子超出該值就將其設(shè)置等于一。如果基值被限制為2的冪,那么歸一化這些定標(biāo)因子并且撤銷該歸一化的處理可以通過二進(jìn)制整數(shù)運(yùn)算函數(shù)或二進(jìn)制移位操作有效地實(shí)現(xiàn)。
這些方法中的多個(gè)可以一起使用。例如,定標(biāo)信息可以包括歸一化定標(biāo)因子的浮點(diǎn)表示。
C.信號合成合成信號可以以各種方式產(chǎn)生。
1.頻率變換一種技術(shù)通過線性地轉(zhuǎn)換一個(gè)基帶信號的頻譜分量X(k)來產(chǎn)生合成信號的頻譜分量Y(k)。該轉(zhuǎn)換可以表示為Y(j)=X(k) (4)這里,差值(j-k)是用于頻譜分量k的頻率變換的量。
當(dāng)子帶m中的頻譜分量被轉(zhuǎn)換為頻率子帶p時(shí),編碼處理可以根據(jù)下式由頻率子帶m中的頻譜分量的能量度量計(jì)算用于頻率子帶p的定標(biāo)因子SF(p)=E(p)ES(p)=Σj∈{p}X2(j)Σj∈{p}Y2(j)=Σj∈{p}X2(j)Σk∈{M}X2(k)---(5)]]>這里,{P}=頻率子帶p中的所有頻譜分量的集合;以及{M}=被轉(zhuǎn)換的頻率子帶m中的頻譜分量的集合。
集合{M}不需要包含頻率子帶m中的所有頻譜分量并且頻率子帶m中的一些頻譜分量可以在該集合中被多次表示。這是因?yàn)樵擃l率變換處理可能不轉(zhuǎn)換頻率子帶m中的一些頻譜分量并且可以多次轉(zhuǎn)換頻率子帶m中的其他頻譜分量,每次以不同的量轉(zhuǎn)換。當(dāng)頻率子帶p與頻率子帶m的頻譜分量的數(shù)量不相同時(shí),將出現(xiàn)這些情況之一或兩者。
下面的例子說明了子帶m中的一些頻譜分量被省略而其他分量被多次表示的情況。頻率子帶m的頻率范圍從200Hz到3.5kHz并且頻率子帶p的頻率范圍從10kHz到14kHz。通過將從500Hz到3.5kHz的頻譜分量轉(zhuǎn)換到從10kHz到13kHz的范圍,其中對每個(gè)頻譜分量的轉(zhuǎn)換量是9.5kHz,并且通過將從500Hz到1.5kHz的頻譜分量轉(zhuǎn)換到從13kHz到14kHz的范圍,其中對每個(gè)頻譜分量的轉(zhuǎn)換量是12.5kHz,在頻率子帶p中合成一個(gè)信號。在該例中集合{M}不包括從200Hz到500Hz的任何頻譜分量,但是包括從1.5kHz到3.5kHz的頻譜分量并且包括從500Hz到1.5kHz的每個(gè)頻譜分量兩次。
上面所提到的HFR申請描述了可以包含到編碼系統(tǒng)中以便改進(jìn)合成信號的感覺質(zhì)量的其他考慮。一個(gè)考慮是根據(jù)需要修改轉(zhuǎn)換的頻譜分量以便確保在已轉(zhuǎn)換信號中維持一致相位的特征。在本發(fā)明的優(yōu)選實(shí)現(xiàn)中,限制頻率變換的量,以便已轉(zhuǎn)換分量維持一致相位而不需任何進(jìn)一步的修改。例如對于使用TDAC變換的實(shí)現(xiàn),這可以通過確保轉(zhuǎn)換量是一個(gè)偶數(shù)來實(shí)現(xiàn)。
另一個(gè)考慮是音頻信號的類似噪聲或類似音調(diào)的特征。在許多情況下,音頻信號的高頻部分比低頻部分更像噪聲。如果低頻基帶信號更像音調(diào)并且高頻剩余信號更像噪聲,那么頻率變換將產(chǎn)生比原始剩余信號更像音調(diào)的高頻合成信號。信號高頻部分的特征的改變可能導(dǎo)致可聽得到的劣化,但是通過下面所述的合成技術(shù)可以降低或避免劣化的可聽度,這種合成技術(shù)使用頻率變換和噪聲產(chǎn)生來保持高頻部分的類似噪聲的特征。
在一個(gè)信號的低頻和高頻部分都類似音調(diào)的其他情況下,頻率變換仍然可能導(dǎo)致聽得出的劣化,因?yàn)樗D(zhuǎn)換的頻譜分量不保持原始剩余信號的諧波結(jié)構(gòu)。通過限制要通過頻率變換合成的剩余信號的最低頻率可以降低或避免這種聽得到的劣化影響。HFR申請建議用于轉(zhuǎn)換的最低頻率應(yīng)該不低于大約5kHz。
2.噪聲產(chǎn)生可以用來產(chǎn)生合成信號的第二種技術(shù)是例如通過產(chǎn)生一個(gè)偽隨機(jī)數(shù)序列以表示時(shí)域信號的抽樣來合成類似噪聲的信號。這種特定的技術(shù)有一個(gè)缺點(diǎn),就是必須使用分析濾波器組來得到所產(chǎn)生的信號的頻譜分量以用于隨后的信號合成。作為替換,可以通過使用偽隨機(jī)數(shù)產(chǎn)生器直接產(chǎn)生這些頻譜分量來產(chǎn)生類似噪聲的信號。任何一種方法都可以通過下式示意性地表示Y(j)=N(j)(6)這里,N(j)=類似噪聲的信號的頻譜分量j。
但是根據(jù)任何一種方法,編碼處理都可以合成該類似噪聲的信號。產(chǎn)生該信號所需要的附加計(jì)算資源增加了編碼處理的復(fù)雜性和實(shí)現(xiàn)成本。
3.轉(zhuǎn)換和噪聲用于信號合成的第三種方法是組合基帶信號的頻率變換和合成的類似噪聲信號的頻譜分量。在一個(gè)優(yōu)選實(shí)現(xiàn)中,根據(jù)在已編碼信號中傳送的噪聲混合控制信息,如在HFR申請中所描述的那樣適配所轉(zhuǎn)換信號和類似噪聲信號的相對部分。該方法可以表示為Y(j)=a·X(k)+b·N(j)(7)這里,a=用于所轉(zhuǎn)換頻譜分量的混合參數(shù);以及b=用于類似噪聲的頻譜分量的混合參數(shù)。
在一種實(shí)現(xiàn)中,通過取頻譜平坦度量(SFM)的平方根來計(jì)算混合參數(shù)b,頻譜平坦度量等于頻譜分量值的幾何平均與算術(shù)平均的比值的對數(shù),其被定標(biāo)并且限制在從零到一的范圍內(nèi)變化。對于這種特定實(shí)現(xiàn),b=1指示類似噪聲的信號。優(yōu)選地,混合參數(shù)a如下式所示從b推導(dǎo)出來
a=c-b2---(8)]]>這里,c是常數(shù)。
在一個(gè)優(yōu)選實(shí)現(xiàn)中,公式8中的常數(shù)c等于一并且產(chǎn)生類似噪聲的信號,以便它的頻譜分量N(j)具有均值零和統(tǒng)計(jì)上等效于與它們組合的轉(zhuǎn)換頻譜分量的能量度量的能量度量。如公式7所示,合成處理可以混合類似噪聲信號的頻譜分量和所轉(zhuǎn)換頻譜分量。在該合成信號中的頻率子帶p的能量可以根據(jù)下式計(jì)算ES(p)=Σj∈{P}Y2(j)=Σk∈{M},j∈{P}[a·X(k)+b·N(j)]2---(9)]]>在一個(gè)替換實(shí)現(xiàn)中,混合參數(shù)表示頻率的規(guī)定函數(shù)或者它們明確地傳送頻率的函數(shù)a(j)和b(j),該函數(shù)指示原始輸入音頻信號的類似噪聲特征如何隨頻率變化。在另一個(gè)替換中,為各個(gè)頻率子帶提供混合參數(shù),這基于可為每個(gè)子帶計(jì)算的噪聲度量。
通過編碼和解碼處理執(zhí)行對合成信號的能量度量的計(jì)算。包括類似噪聲的信號的頻譜分量的計(jì)算是不希望的,因?yàn)閮H僅為了執(zhí)行這些能量計(jì)算的目的,該編碼處理必須使用附加的計(jì)算資源來合成類似噪聲的信號。編碼處理為任何其他目的并不需要合成信號本身。
上面所述的優(yōu)選實(shí)現(xiàn)允許編碼處理得到公式7中所示的合成信號的頻譜分量的能量度量,而不需合成類似噪聲的信號,因?yàn)樗铣尚盘栔械念l譜分量的頻率子帶的能量在統(tǒng)計(jì)上獨(dú)立于類似噪聲的信號的頻譜能量。編碼處理可以僅僅基于所轉(zhuǎn)換的頻譜分量來計(jì)算能量度量。以這種方式計(jì)算的能量度量平均來說是實(shí)際能量的精確度量。因此,該編碼處理可以根據(jù)公式5僅僅從基帶信號的頻率子帶m的能量度量為頻率子帶p計(jì)算一個(gè)定標(biāo)因子。
在一個(gè)替換實(shí)現(xiàn)中,通過已編碼信號而不是定標(biāo)因子來傳送頻譜能量度量。在該替換實(shí)現(xiàn)中,產(chǎn)生類似噪聲的信號,以便它的頻譜分量具有等于零的均值以及等于一的方差,并且定標(biāo)所轉(zhuǎn)換頻譜分量,以便他們的方差為一。如公式7所示通過組合分量所得到的合成信號的頻譜能量平均來說等于常數(shù)c。解碼處理可以對該合成信號定標(biāo),以便具有與原始剩余信號相同的能量度量。如果常數(shù)c不等于一,那么定標(biāo)處理還應(yīng)該考慮該常數(shù)。
D.耦合通過在編碼系統(tǒng)中使用耦合,對于解碼信號中的給定感覺信號質(zhì)量水平,可以達(dá)到已編碼信號的信息要求的降低,其中該編碼系統(tǒng)產(chǎn)生表示兩個(gè)或更多個(gè)聲道的音頻信號的已編碼信號。
1.編碼器圖5和6描述了音頻編碼器,其從路徑9a和9b接收兩個(gè)聲道的輸入音頻信號,并且沿路徑51產(chǎn)生表示這兩個(gè)聲道的輸入音頻信號的一個(gè)已編碼信號。分析濾波器組10a和10b、能量計(jì)算器31a、32a、31b和32b、合成模型21a和21b、定標(biāo)因子計(jì)算器40a和40b以及格式化器50的細(xì)節(jié)和特點(diǎn)基本上與針對圖1中所示的單聲道編碼器的部件所描述的那些相同。
a)共同特點(diǎn)圖5和6中的編碼器類似。在討論不同點(diǎn)之前描述對這兩種實(shí)現(xiàn)來說共同的特點(diǎn)。
參照圖5和6,分析濾波器組10a和10b分別沿路徑13a和13b產(chǎn)生頻譜分量,他們表示在第三組頻率子帶中的一個(gè)或多個(gè)子帶中的各自輸入音頻信號的頻譜分量。在優(yōu)選實(shí)現(xiàn)中,第三組頻率子帶是一個(gè)或多個(gè)中間頻率子帶,在第一組頻率子帶中的低頻子帶之上并且在第二組頻率子帶中的高頻子帶之下。能量計(jì)算器35a和35b各計(jì)算在一個(gè)或多個(gè)頻率子帶中的頻譜能量的一個(gè)或多個(gè)度量。優(yōu)選地,這些頻率子帶具有與人聽覺系統(tǒng)的臨界頻帶相當(dāng)?shù)膸?,并且能量?jì)算器35a和35b為這些頻率子帶中每一個(gè)提供一個(gè)能量度量。
耦合器26沿著路徑27產(chǎn)生一個(gè)耦合聲道信號,該信號的頻譜分量表示從路徑13a和13b接收的頻譜分量的復(fù)合。該復(fù)合表示可以以各種方式形成。例如,可以根據(jù)從路徑13a和13b接收的相應(yīng)頻譜分量值的和或平均計(jì)算復(fù)合表示中的每個(gè)頻譜分量。能量計(jì)算器37計(jì)算在該耦合聲道信號的一個(gè)或多個(gè)頻率子帶中頻譜能量的一個(gè)或多個(gè)度量。在一個(gè)優(yōu)選實(shí)現(xiàn)中,這些頻率子帶具有與人聽覺系統(tǒng)的臨界頻帶相當(dāng)?shù)膸?,并且能量?jì)算器37為這些頻率子帶中每一個(gè)提供能量度量。
定標(biāo)因子計(jì)算器44從能量計(jì)算器35a、35b和37中每一個(gè)接收一個(gè)或多個(gè)能量度量并且如上所述計(jì)算定標(biāo)因子。沿路徑45a和45b分別傳遞表示用于耦合聲道信號中所表示的每個(gè)輸入音頻信號的定標(biāo)因子的定標(biāo)信息。可以如上所述編碼該定標(biāo)信息。在一個(gè)優(yōu)選實(shí)現(xiàn)中,如下式中任一個(gè)所表示的那樣,為每個(gè)頻率子帶中的每個(gè)輸入聲道信號計(jì)算一個(gè)定標(biāo)因子。
SFi(m)=Ei(m)EC(m)---(10a)]]>SFi(m)=Ei(m)EC(m)---(10b)]]>這里,SFi(m)=用于信號聲道i的頻率子帶m的定標(biāo)因子;Ei(m)=用于輸入信號聲道i的頻率子帶m的能量度量;以及EC(m)=用于耦合聲道的頻率子帶m的能量度量。
格式化器50從路徑41a、41b、45a和45b接收定標(biāo)信息,從路徑12a和12b接收表示基帶信號的頻譜分量的信息,以及從路徑27接收表示該耦合聲道信號的頻譜分量的信息。如上所述將這些信息匯編到一個(gè)用于傳輸或記錄的已編碼信號中。
圖5和6中所示的編碼器和圖7中所示的解碼器是雙聲道裝置;但是,本發(fā)明的各方面可以應(yīng)用到用于更多聲道的編碼系統(tǒng)。說明書和附圖提到雙聲道實(shí)現(xiàn)僅僅是為了解釋和圖示的方便。
b)不同特點(diǎn)可以將耦合聲道信號中的頻譜分量在解碼處理中用于HFR。在這種實(shí)現(xiàn)中,編碼器應(yīng)該為解碼處理在已編碼信號中提供控制信息,以便在從耦合聲道信號產(chǎn)生合成信號中使用。該控制信息可以以許多方式來產(chǎn)生。
在圖5中描述了一種方式。根據(jù)該實(shí)現(xiàn),合成模型21a響應(yīng)于從路徑12a接收的基帶頻譜分量,并且響應(yīng)于從路徑13a接收的頻譜分量,后者將通過耦合器26耦合。合成模式21a、相關(guān)的能量計(jì)算器31a和32a以及定標(biāo)因子計(jì)算器40a以類似于上面討論的計(jì)算的方式執(zhí)行計(jì)算。表示這些定標(biāo)因子的定標(biāo)信息沿路徑41a傳遞給格式化器50。該格式化器還從路徑41b接收定標(biāo)信息,該定標(biāo)信息表示以類似方式為來自路徑12b和13b的頻譜分量所計(jì)算的定標(biāo)因子。
在圖5所示編碼器的一個(gè)替換實(shí)現(xiàn)中,如上所討論的,合成模型21a獨(dú)立于來自路徑12a和13a中任一個(gè)或兩者的頻譜分量而操作,并且合成模型21b獨(dú)立于來自路徑12b和13b中任一個(gè)或兩者的頻譜分量而操作。
在另一個(gè)實(shí)現(xiàn)中,沒有為耦合聲道信號和/或基帶信號計(jì)算用于HFR的定標(biāo)因子。作為替代,頻譜能量度量的表示傳遞給格式化器50并且包含在已編碼信號中,而不是相應(yīng)的定標(biāo)因子的表示。這種實(shí)現(xiàn)增加了解碼處理的計(jì)算復(fù)雜性,因?yàn)榻獯a處理必須計(jì)算這些定標(biāo)因子中至少一些;但是,它降低了編碼處理的計(jì)算復(fù)雜性。
圖6中描述了另一種產(chǎn)生控制信息的方式。根據(jù)該實(shí)現(xiàn),定標(biāo)部件91a和91b從路徑27接收耦合聲道信號并從定標(biāo)因子計(jì)算器44接收定標(biāo)因子,并且執(zhí)行等效于在下面討論的解碼處理中執(zhí)行的處理的處理以從耦合聲道信號產(chǎn)生去耦信號。這些去耦信號傳遞給合成模型21a和21b,并且以類似于在上面結(jié)合圖5所討論的方式計(jì)算這些定標(biāo)因子。
在圖6所示編碼器的一個(gè)替換實(shí)現(xiàn)中,如果頻譜能量度量和定標(biāo)因子的計(jì)算不需要基帶信號和/或耦合聲道信號的頻譜分量的話,合成模型21a和21b可以獨(dú)立于基帶信號和/或耦合聲道信號的頻譜分量進(jìn)行操作。此外,如果HFR不使用耦合聲道信號中的頻譜分量,那么合成模型可以獨(dú)立于耦合聲道信號進(jìn)行操作。
2.解碼器圖7描述了一個(gè)音頻解碼器,其從路徑59接收表示兩個(gè)聲道的輸入音頻信號的一個(gè)已編碼信號并且沿路徑89a和89b產(chǎn)生這些信號的解碼表示。去格式化器60、信號合成部件23a和23b、信號定標(biāo)部件70a和70b以及合成濾波器組80a和80b的細(xì)節(jié)和特點(diǎn)基本上與上面對圖2中所示的單聲道解碼器的部件描述的那些是相同的。
去格式化器60從該已編碼信號得到一個(gè)耦合聲道信號和一組耦合定標(biāo)因子。該耦合聲道信號沿著路徑64傳遞,其頻譜分量表示在兩個(gè)輸入音頻信號中的頻譜分量的復(fù)合。用于這兩個(gè)輸入音頻信號中每一個(gè)的耦合定標(biāo)因子分別沿路徑63a和63b傳遞。
信號定標(biāo)部件92a沿路徑93a產(chǎn)生一個(gè)去耦信號的頻譜分量,這些頻譜分量近似于在原始輸入音頻信號之一中的相應(yīng)頻譜分量的頻譜能量水平。通過將該耦合聲道信號中的每個(gè)頻譜分量與一個(gè)合適的耦合定標(biāo)因子相乘,可以產(chǎn)生這些去耦頻譜分量。在將該耦合聲道信號的頻譜分量安排到頻譜子帶中并且為每個(gè)子帶提供一個(gè)定標(biāo)因子的實(shí)現(xiàn)中,可以根據(jù)下式產(chǎn)生一個(gè)去耦信號的頻譜分量。
XDi(k)=SFi(m)·XC(k) (11)這里,XC(k)=該耦合聲道信號的子帶m中的頻譜分量k;SFi(m)=用于信號聲道i的頻率子帶m的定標(biāo)因子;以及XDi(k)=用于信號聲道i的去耦頻譜分量k。
每個(gè)去耦信號都傳遞到一個(gè)相應(yīng)的合成濾波器組中。在上述的優(yōu)選實(shí)現(xiàn)中,每個(gè)去耦信號的頻譜分量都在第三組頻率子帶中的一個(gè)或多個(gè)頻率子帶中,該第三組頻率子帶在第一和第二組頻率子帶的頻率子帶的中間。
如果信號合成需要去耦頻譜分量的話,去耦頻譜分量還傳遞到一個(gè)相應(yīng)的信號合成部件23a或23b中。
E.自適應(yīng)帶化(banding)如上所討論的將頻譜分量安排到兩或三組頻率子帶中的編碼系統(tǒng)可以適配包含在每組中的子帶的頻率范圍。例如,有利的是,在具有被認(rèn)為是類似噪聲的高頻頻譜分量的輸入音頻信號各時(shí)段,降低用于剩余信號的第二組頻率子帶的頻率范圍的較低端。還可以適配頻率范圍,以便去除一組頻率子帶中的所有子帶。例如,可以通過從第二組頻率子帶中去除所有子帶,對幅度具有大的突然變化的輸入音頻信號禁止HFR處理。
圖3和4描述了一種方式,在該方式下為了任何原因,包括對輸入音頻信號的一個(gè)或多個(gè)特征的響應(yīng),都可以適配基帶、剩余和/或耦合聲道信號的頻率范圍。為了實(shí)現(xiàn)該特點(diǎn),圖1、5、6和8中所示的分析濾波器組中每一個(gè)都可以由圖3中所示的裝置代替,并且圖2和7中所示的分析濾波器組中每一個(gè)都可以由圖4中所示的裝置來代替。這些圖表示了頻率子帶如何適應(yīng)三組頻率子帶;但是,可以使用同樣的實(shí)現(xiàn)原理來適應(yīng)不同數(shù)量的頻率子帶組。
參照圖3,分析濾波器組14從路徑9接收一個(gè)輸入音頻信號并且作為響應(yīng)產(chǎn)生一組頻率子帶信號,傳遞給自適應(yīng)帶化部件15。信號分析部件17分析直接從輸入音頻信號推導(dǎo)出來的和/或從子帶信號推導(dǎo)出來的信息,并且響應(yīng)于該分析產(chǎn)生頻帶控制信息。該頻帶控制信息傳遞給自適應(yīng)帶化部件15,并且它沿路徑18將該頻帶控制信息傳遞給格式化器50。格式化器50將該頻帶控制信息的表示包括在已編碼信號中。
該自適應(yīng)帶化部件15通過將頻率子帶信號頻譜分量分配給各組頻率子帶來響應(yīng)該頻帶控制信息。沿路徑12傳遞分配給第一組子帶的頻譜分量。沿路徑11傳遞分配給第二組子帶的頻譜分量。沿路徑13傳遞分配給第三組子帶的頻譜分量。如果存在沒有包含在任何一組中的一個(gè)頻率范圍或間隔,那么通過不分配該范圍或間隔中的頻譜分量給任何一組,就可以達(dá)到此目的。
信號分析部件17還可以產(chǎn)生頻帶控制信息以響應(yīng)于與該輸入音頻信號無關(guān)的條件適配頻率范圍。例如,可響應(yīng)于表示信號質(zhì)量的期望水平或者傳送或記錄已編碼信號的可用容量的一個(gè)信號來適配這些范圍。
頻帶控制信息可以以許多形式產(chǎn)生。在一種實(shí)現(xiàn)中,頻帶控制信息規(guī)定了頻譜分量要被分配到的每個(gè)組的最低和/或最高頻率。在另一種實(shí)現(xiàn)中,頻帶控制信息規(guī)定了多個(gè)預(yù)定義頻率范圍安排之一。
參照圖4,自適應(yīng)帶化部件81從路徑71、93和62接收各組頻譜分量,并且它從路徑68接收頻帶控制信息。通過去格式化器60從已編碼信號得到頻帶控制信息。自適應(yīng)帶化部件81通過將接收到的各組頻譜分量中的頻譜分量分配到一組頻率子帶信號中來響應(yīng)頻帶控制信息,該組頻率子帶信號被傳遞給合成濾波器組82。合成濾波器組82響應(yīng)于頻率子帶信號沿路徑89產(chǎn)生一個(gè)輸出音頻信號。
F.第二分析濾波器組在用諸如上面提到的TDAC變換這樣的變換來實(shí)現(xiàn)分析濾波器組10的音頻編碼器中根據(jù)公式1a計(jì)算的頻譜能量度量往往低于輸入音頻信號的真實(shí)頻譜能量,因?yàn)榉治鰹V波器組僅僅提供了實(shí)數(shù)值變換系數(shù)。使用像離散傅立葉變換(DFT)這樣的變換的實(shí)現(xiàn)能夠提供更精確的能量計(jì)算,因?yàn)槊總€(gè)變換系數(shù)都由一個(gè)復(fù)數(shù)值表示,該復(fù)數(shù)值更精確地傳送每個(gè)頻譜分量的真實(shí)幅度。
通過使用第二分析濾波器組,可以克服基于從如TDAC變換這樣的變換得到的僅有實(shí)數(shù)值的變換系數(shù)的能量計(jì)算的固有不精確性,該第二分析濾波器組具有正交于分析濾波器組10的基底函數(shù)的基底函數(shù)。圖8示出了一個(gè)音頻編碼器,其類似于圖1中所示的編碼器,但是包括第二分析濾波器組19。如果該編碼器使用TDAC變換的MDCT來實(shí)現(xiàn)分析濾波器組10,那么可以使用一個(gè)相應(yīng)的改進(jìn)離散正弦變換(MDST)來實(shí)現(xiàn)第二分析濾波器組19。
能量計(jì)算器39根據(jù)下式計(jì)算頻譜能量的更精確度量E’(k)E′(k)=X12(k)+X22(k)---(12)]]>這里,X1(k)=來自第一分析濾波器組的變換系數(shù)k;以及X2(k)=來自第二分析濾波器組的變換系數(shù)k。
在為頻率子帶計(jì)算能量度量的實(shí)現(xiàn)中,能量計(jì)算器39根據(jù)下式為頻率子帶m計(jì)算度量E′(m)=Σk∈{M}X12(k)+X22(k)---(13)]]>定標(biāo)因子計(jì)算器49以類似于公式3a或3b的方式根據(jù)這些更精確能量度量計(jì)算定標(biāo)因子SF’(m)。在公式14中表示了類似于公式3a的計(jì)算
SF′(m)=E′(m)ES(m)=Σk∈{M}X12(k)+X22(k)Σk∈{M}Y2(k)---(14)]]>當(dāng)使用根據(jù)這些更精確的能量度量計(jì)算的定標(biāo)因子SF’(m)時(shí),應(yīng)該注意一些。根據(jù)更精確定標(biāo)因子SF’(m)定標(biāo)的合成信號頻譜分量幾乎肯定會(huì)畸變一個(gè)信號的基帶部分與再生的合成部分的相對頻譜平衡,因?yàn)楦_的能量度量總是大于或等于僅僅從實(shí)數(shù)值變換系數(shù)計(jì)算的能量度量??梢匝a(bǔ)償該差別的一種方式是將更精確的能量度量減半,因?yàn)槠骄鶃碚f更精確度量是較低精確度量的兩倍大。這種減小將在一個(gè)信號的基帶和合成部分中提供一個(gè)在統(tǒng)計(jì)上一致的能量水平,同時(shí)保持了更精確頻譜能量度量的好處。
可能有用的是指出即使可以從第二濾波器組19得到附加系數(shù),公式14中的比例的分母也應(yīng)該僅僅根據(jù)來自分析濾波器組10的實(shí)數(shù)值變換系數(shù)計(jì)算。定標(biāo)因子的計(jì)算應(yīng)該以這種方式來完成,因?yàn)樵诮獯a處理期間執(zhí)行的定標(biāo)將基于合成頻譜分量,這些合成頻譜分量僅類似于從分析濾波器組10得到的變換系數(shù)。解碼處理將不使用相應(yīng)于或可以從由第二分析濾波器組19得到的頻譜分量推導(dǎo)出來的任何系數(shù)。
G.實(shí)現(xiàn)本發(fā)明的各方面可以以多種方式實(shí)現(xiàn),包括在通用計(jì)算機(jī)系統(tǒng)中或者在某種其他設(shè)備中的軟件,該其它設(shè)備包括更多諸如數(shù)字信號處理器(DSP)電路這樣的專用部件,這些專用部件耦合到類似于在通用計(jì)算機(jī)系統(tǒng)中可以找到的那些部件的部件上。圖9是可以用來在音頻編碼器或音頻解碼器中實(shí)現(xiàn)本發(fā)明的各方面的裝置70的框圖。DSP72提供計(jì)算資源。RAM 73是用于信號處理的DSP 72所使用的系統(tǒng)隨機(jī)存取存儲(chǔ)器(RAM)。ROM 74表示某種形式的永久存儲(chǔ)器,例如只讀存儲(chǔ)器(ROM),用于存儲(chǔ)操作裝置70以及執(zhí)行本發(fā)明的各方面所需要的程序。I/O控制器75表示用來通過通信信道76、77接收和傳送信號的接口電路。模數(shù)轉(zhuǎn)換器和數(shù)模轉(zhuǎn)換器可以根據(jù)需要包括在I/O控制器75中,用來接收和/或傳送模擬音頻信號。在所示的實(shí)施例中,所有主要系統(tǒng)部件都連接到總線71上,該總線可以表示多于一個(gè)的物理總線;但是,實(shí)現(xiàn)本發(fā)明并不需要總線結(jié)構(gòu)。
在通用計(jì)算機(jī)系統(tǒng)中實(shí)現(xiàn)的實(shí)施例中,為了接口到諸如鍵盤或鼠標(biāo)和顯示器這樣的裝置上,以及為了控制具有存儲(chǔ)媒體的存儲(chǔ)器裝置,可以包括附加部件,其中存儲(chǔ)媒體例如是磁帶或盤、或光媒體。存儲(chǔ)媒體可用來記錄用于操作系統(tǒng)、實(shí)用和應(yīng)用的指令程序,并且可以包括實(shí)現(xiàn)本發(fā)明的各方面的程序的實(shí)施例。
實(shí)踐本發(fā)明的各方面所需要的功能可以通過以多種方式實(shí)現(xiàn)的部件來執(zhí)行,這些部件包括分立邏輯部件、集成電路、一個(gè)或多個(gè)ASIC和/或受程序控制的處理器。實(shí)現(xiàn)這些部件的方式對于本發(fā)明來說并不重要。
通過多種機(jī)器可讀媒體或者基本上使用任何記錄技術(shù)傳送信息的存儲(chǔ)媒體可以傳送本發(fā)明的軟件實(shí)現(xiàn),機(jī)器可讀媒體例如是基帶或包括從超聲波到紫外頻率的整個(gè)頻譜中的調(diào)制通信路徑,所述記錄技術(shù)包括磁帶、卡或盤、光卡或盤以及在像紙張這樣的媒體上的可檢測標(biāo)記。
權(quán)利要求
1.一種用于編碼一個(gè)或多個(gè)輸入音頻信號的方法,包括接收該一個(gè)或多個(gè)輸入音頻信號并且從中得到一個(gè)或多個(gè)基帶信號和一個(gè)或多個(gè)剩余信號,其中一個(gè)基帶信號的頻譜分量表示在第一組頻率子帶中的一個(gè)相應(yīng)輸入音頻信號的頻譜分量,并且在一個(gè)相關(guān)剩余信號中的頻譜分量表示在該基帶信號所沒有表示的第二組頻率子帶中的該相應(yīng)輸入音頻信號的頻譜分量;得到將在解碼期間產(chǎn)生的一個(gè)或多個(gè)合成信號的至少一些頻譜分量的能量度量,其中該一個(gè)或多個(gè)合成信號具有在該第二組頻率子帶內(nèi)的頻譜分量;得到每個(gè)剩余信號的至少一些頻譜分量的能量度量;通過得到在所述剩余信號中的頻譜分量的能量度量與在該一個(gè)或多個(gè)合成信號中的頻譜分量的能量度量的比值的平方根、在該一個(gè)或多個(gè)合成信號中的頻譜分量的能量度量與在所述剩余信號中的頻譜分量的能量度量的比值的平方根、在所述剩余信號中的頻譜分量的能量度量的平方根與在該一個(gè)或多個(gè)合成信號中的頻譜分量的能量度量的平方根的比值、或者在該一個(gè)或多個(gè)合成信號中的頻譜分量的能量度量的平方根與在所述剩余信號中的頻譜分量的能量度量的平方根的比值,計(jì)算定標(biāo)因子;以及將信號信息和定標(biāo)信息匯編到已編碼信號中,其中該信號信息表示在該一個(gè)或多個(gè)基帶信號中的頻譜分量并且該定標(biāo)信息表示定標(biāo)因子。
2.根據(jù)權(quán)利要求1的方法,其中該一個(gè)或多個(gè)合成信號將至少部分地通過該一個(gè)或多個(gè)基帶信號中的至少一些頻譜分量的頻率變換來產(chǎn)生。
3.根據(jù)權(quán)利要求2的方法,合成信號的頻譜分量將通過保持相位相關(guān)性的頻率變換來產(chǎn)生。
4.根據(jù)權(quán)利要求1的方法,其中,將至少部分地通過組合該一個(gè)或多個(gè)基帶信號中的至少一些頻譜分量的頻率變換和一個(gè)或多個(gè)類似噪聲的信號的產(chǎn)生來產(chǎn)生該一個(gè)或多個(gè)合成信號,所述類似噪聲的信號具有根據(jù)該一個(gè)或多個(gè)基帶信號中的譜級適配的譜級,并且其中,在不考慮所述類似噪聲的信號中的譜級的情況下得到在該一個(gè)或多個(gè)合成信號中的頻譜分量的能量度量。
5.根據(jù)權(quán)利要求1的方法,其中該一個(gè)或多個(gè)合成信號將至少部分地通過產(chǎn)生一個(gè)或多個(gè)類似噪聲的信號來產(chǎn)生。
6.根據(jù)權(quán)利要求1的方法,其中所述剩余信號的頻譜分量的能量度量從表示這些頻譜分量的幅度的值得到。
7.根據(jù)權(quán)利要求6的方法,還包括將第一分析濾波器組應(yīng)用于該一個(gè)或多個(gè)輸入音頻信號以得到該一個(gè)或多個(gè)基帶信號和該一個(gè)或多個(gè)剩余信號;以及將第二分析濾波器組應(yīng)用于該一個(gè)或多個(gè)輸入音頻信號以得到附加頻譜分量;其中,從所述剩余信號的頻譜分量和所述附加頻譜分量中的一個(gè)或多個(gè)計(jì)算所述剩余信號中的頻譜分量的能量度量。
8.根據(jù)權(quán)利要求1的方法,其中該定標(biāo)信息表示相對于一個(gè)或多個(gè)歸一化值被歸一化的定標(biāo)因子,并且其中該定標(biāo)信息包括該一個(gè)或多個(gè)歸一化值的表示。
9.根據(jù)權(quán)利要求8的方法,其中從一組值中選擇該一個(gè)或多個(gè)歸一化值。
10.根據(jù)權(quán)利要求8的方法,其中該一個(gè)或多個(gè)歸一化值包括定標(biāo)因子的最大容許值。
11.根據(jù)權(quán)利要求1的方法,為各個(gè)剩余信號的一個(gè)或多個(gè)頻率子帶計(jì)算一個(gè)定標(biāo)因子。
12.根據(jù)權(quán)利要求11的方法,其中適配所述各組頻率子帶中一組或多組的頻率范圍,并且其中該方法在該已編碼信號中匯編所適配頻率范圍的指示。
13.根據(jù)權(quán)利要求12的方法,其中通過從一組范圍中選擇來適配所述頻率范圍。
14.根據(jù)權(quán)利要求1的用于多個(gè)輸入音頻信號的方法,包括從該多個(gè)輸入音頻信號得到一個(gè)耦合聲道信號,該耦合聲道信號的頻譜分量表示第三組頻率子帶中的所述輸入音頻信號中兩個(gè)或更多個(gè)的頻譜分量的復(fù)合;得到該耦合聲道信號的至少一些頻譜分量的能量度量;得到在該第三組頻率子帶中的耦合聲道信號所表示的所述兩個(gè)或更多個(gè)輸入音頻信號的至少一些頻譜分量的能量度量;以及通過得到在該兩個(gè)或更多個(gè)輸入音頻信號中的頻譜分量的能量度量與在該耦合聲道信號中的頻譜能量的能量度量的比值的平方根、在該耦合聲道信號中的頻譜能量的能量度量與在該兩個(gè)或更多個(gè)輸入音頻信號中的頻譜分量的能量度量的比值的平方根、在該兩個(gè)或更多個(gè)輸入音頻信號中的頻譜分量的能量度量的平方根與在該耦合聲道信號中的頻譜能量的能量度量的平方根的比值、或者在該耦合聲道信號中的頻譜能量的能量度量的平方根與在該兩個(gè)或更多個(gè)輸入音頻信號中的頻譜分量的能量度量的平方根的比值,計(jì)算耦合定標(biāo)因子;其中該定標(biāo)信息還表示這些耦合定標(biāo)因子并且該信號信息還表示該耦合聲道信號中的頻譜分量。
15.根據(jù)權(quán)利要求14的方法,其中該一個(gè)或多個(gè)合成信號將至少部分地通過在該第三組頻率子帶中的輸入音頻信號的至少一些頻譜分量的頻率變換來產(chǎn)生。
16.根據(jù)權(quán)利要求14的方法,包括檢測該多個(gè)輸入音頻信號的一個(gè)或多個(gè)特性;響應(yīng)于所檢測的特性,適配該第一組頻率子帶、該第二組頻率子帶或該第三組頻率子帶的頻率范圍;以及在該已編碼信號中匯編所適配頻率范圍的指示。
17.根據(jù)權(quán)利要求1的方法,包括檢測該一個(gè)或多個(gè)輸入音頻信號的一個(gè)或多個(gè)特性;響應(yīng)于所檢測的特性,適配該第一組頻率子帶或該第二組頻率子帶的頻率范圍;以及在該已編碼信號中匯編所適配頻率范圍的指示。
18.一種用于解碼表示一個(gè)或多個(gè)輸入音頻信號的已編碼信號的方法,包括從該已編碼信號中得到定標(biāo)信息和信號信息,其中該定標(biāo)信息表示從頻譜分量的能量度量的比值的平方根或者頻譜分量的能量度量的平方根的比值所計(jì)算的定標(biāo)因子,并且該信號信息表示一個(gè)或多個(gè)基帶信號的頻譜分量,其中在每個(gè)基帶信號中的頻譜分量表示在第一組頻率子帶中的一個(gè)相應(yīng)輸入音頻信號的頻譜分量;為每個(gè)相應(yīng)的基帶信號產(chǎn)生一個(gè)相關(guān)的合成信號,該合成信號具有該相應(yīng)基帶信號所沒有表示的第二組頻率子帶中的頻譜分量,其中根據(jù)一個(gè)或多個(gè)所述定標(biāo)因子通過乘法或除法對該相關(guān)合成信號中的頻譜分量定標(biāo);以及產(chǎn)生一個(gè)或多個(gè)輸出音頻信號,其中每個(gè)輸出音頻信號表示一個(gè)相應(yīng)的輸入音頻信號并且從相應(yīng)基帶信號及其相關(guān)合成信號中的頻譜分量產(chǎn)生。
19.根據(jù)權(quán)利要求18的方法,其中該相關(guān)合成信號至少部分地通過在相應(yīng)基帶信號中的至少一些頻譜分量的頻率變換來產(chǎn)生。
20.根據(jù)權(quán)利要求19的方法,其中頻率變換保持相位相關(guān)性。
21.根據(jù)權(quán)利要求18的方法,其中該相關(guān)合成信號至少部分地通過產(chǎn)生一個(gè)類似噪聲的信號來產(chǎn)生,該類似噪聲的信號具有根據(jù)一個(gè)或多個(gè)所述定標(biāo)因子適配的譜級。
22.根據(jù)權(quán)利要求18的方法,從該已編碼信號中得到一個(gè)或多個(gè)歸一化值并且撤銷所述定標(biāo)因子相對于該一個(gè)或多個(gè)歸一化值的歸一化。
23.根據(jù)權(quán)利要求22的方法,其中通過定標(biāo)信息在該已編碼信號中傳送該一個(gè)或多個(gè)歸一化值,該定標(biāo)信息表示在一組值中的選定值。
24.根據(jù)權(quán)利要求22的方法,其中該一個(gè)或多個(gè)歸一化值包括定標(biāo)因子的最大容許值。
25.根據(jù)權(quán)利要求18的方法,其中該相關(guān)合成信號的頻率子帶與一個(gè)相應(yīng)的定標(biāo)因子相關(guān)。
26.根據(jù)權(quán)利要求25的方法,響應(yīng)于在該已編碼信號中傳送的子帶信息適配該相關(guān)合成信號的產(chǎn)生,其中該子帶信息規(guī)定所述頻率子帶的頻率范圍。
27.根據(jù)權(quán)利要求26的方法,其中該子帶信息表示在一組范圍中的選定頻率范圍。
28.根據(jù)權(quán)利要求18的用于解碼表示多個(gè)輸入音頻信號的信號的方法,包括從該已編碼信號得到一個(gè)耦合聲道信號,該耦合聲道信號的頻譜分量表示第三組頻率子帶中的該多個(gè)輸入音頻信號中兩個(gè)或更多個(gè)的復(fù)合,其中該定標(biāo)信息還表示耦合定標(biāo)因子,這些耦合定標(biāo)因子是從以下計(jì)算的在該第三組頻率子帶中的該兩個(gè)或更多個(gè)輸入音頻信號的頻譜分量的能量度量與在該耦合聲道信號中的頻譜能量的能量度量的比值的平方根、在該耦合聲道信號中的頻譜能量的能量度量與在該第三組頻率子帶中的該兩個(gè)或更多個(gè)輸入音頻信號的頻譜分量的能量度量的比值的平方根、在該第三組頻率子帶中的該兩個(gè)或更多個(gè)輸入音頻信號的頻譜分量的能量度量的平方根與在該耦合聲道信號中的頻譜能量的能量度量的平方根的比值、或者在該耦合聲道信號中的頻譜能量的能量度量的平方根與在該第三組頻率子帶中的該兩個(gè)或更多個(gè)輸入音頻信號的頻譜分量的能量度量的平方根的比值;以及從該耦合聲道信號為該耦合聲道信號所表示的該兩個(gè)或更多個(gè)輸入音頻信號中每一個(gè)產(chǎn)生一個(gè)相應(yīng)的去耦信號,其中這些去耦信號具有在該第三組頻率子帶中的頻譜分量,這些頻率分量根據(jù)一個(gè)或多個(gè)所述耦合定標(biāo)因子通過乘法或除法來定標(biāo);其中,還從各個(gè)去耦信號中的頻譜分量產(chǎn)生表示該兩個(gè)或更多個(gè)輸入音頻信號的輸出音頻信號。
29.根據(jù)權(quán)利要求28的方法,其中該相關(guān)合成信號至少部分地通過在該第三組頻率子帶中的至少一些頻譜分量的頻率變換來產(chǎn)生。
30.根據(jù)權(quán)利要求28的方法,包括從該已編碼信號中得到該第一、第二或第三組頻率子帶的頻率范圍的指示;以及響應(yīng)于該指示適配合成信號和去耦信號的產(chǎn)生。
31.根據(jù)權(quán)利要求18的方法,包括從該已編碼信號中得到該第一或第二組頻率子帶的頻率范圍的指示;以及響應(yīng)于該指示適配合成信號和去耦信號的產(chǎn)生。
32.一種用于編碼多個(gè)輸入音頻信號的方法,包括接收該多個(gè)輸入音頻信號并且從中得到多個(gè)基帶信號、多個(gè)剩余信號以及一個(gè)耦合聲道信號,其中一個(gè)基帶信號的頻譜分量表示在第一組頻率子帶中的一個(gè)相應(yīng)輸入音頻信號的頻譜分量并且一個(gè)相關(guān)剩余信號的頻譜分量表示在該基帶信號所沒有表示的第二組頻率子帶中的該相應(yīng)輸入音頻信號的頻譜分量,并且其中該耦合聲道信號的頻譜分量表示在第三組頻率子帶中的兩個(gè)或更多個(gè)所述輸入音頻信號的頻譜分量的復(fù)合;得到每個(gè)剩余信號和該耦合聲道信號所表示的該兩個(gè)或更多個(gè)輸入音頻信號的至少一些頻譜分量的能量度量;以及將控制信息和信號匯編到已編碼信號中,其中該控制信息從所述能量度量中推導(dǎo)出來并且其中該信號信息表示在該多個(gè)基帶信號和該耦合聲道信號中的頻譜分量。
33.根據(jù)權(quán)利要求32的方法,包括得到將在解碼期間產(chǎn)生的一個(gè)或多個(gè)合成信號的至少一些頻譜分量的能量度量,其中該一個(gè)或多個(gè)合成信號具有在該第二組頻率子帶內(nèi)的頻譜分量;以及通過計(jì)算這些能量度量的比值的平方根或這些能量度量的平方根的比值推導(dǎo)至少一些所述控制信息。
34.根據(jù)權(quán)利要求33的方法,其中該一個(gè)或多個(gè)合成信號的至少一些頻譜分量將從該第三組頻率子帶中的頻譜分量合成。
35.根據(jù)權(quán)利要求32的方法,其中適配所述各組頻率子帶的頻率范圍,并且其中該方法將所適配的頻率范圍的指示匯編到該已編碼信號中。
36.一種用于解碼表示多個(gè)輸入音頻信號的已編碼信號的方法,包括從該已編碼信號得到控制信息和信號信息,其中該控制信息是從頻譜分量的能量度量推導(dǎo)出來的并且該信號信息表示多個(gè)基帶信號和一個(gè)耦合聲道信號的頻譜分量,其中在每個(gè)基帶信號中的頻譜分量表示在第一組頻率子帶中的一個(gè)相應(yīng)輸入音頻信號的頻譜分量并且該耦合聲道信號的頻譜分量表示該多個(gè)輸入音頻信號中兩個(gè)或更多個(gè)的第三組頻率子帶中的頻譜分量的復(fù)合;為每個(gè)相應(yīng)的基帶信號產(chǎn)生一個(gè)相關(guān)合成信號,該合成信號具有該相應(yīng)基帶信號所沒有表示的第二組頻率子帶中的頻譜分量,其中根據(jù)該控制信息對該相關(guān)合成信號中的頻譜分量定標(biāo);從該耦合聲道信號為該耦合聲道信號所表示的所述兩個(gè)或更多個(gè)輸入音頻信號中每一個(gè)產(chǎn)生一個(gè)相應(yīng)去耦信號,其中去耦信號具有該第三組頻率子帶中的根據(jù)該控制信息所定標(biāo)的頻譜分量;以及產(chǎn)生多個(gè)輸出音頻信號,其中每個(gè)輸出音頻信號表示一個(gè)相應(yīng)的輸入音頻信號并且是從一個(gè)相應(yīng)基帶信號及其相關(guān)合成信號中的頻譜分量產(chǎn)生的,并且其中表示該兩個(gè)或更多個(gè)音頻信號的輸出音頻信號也是從相應(yīng)的去耦信號中的頻譜分量產(chǎn)生的。
37.根據(jù)權(quán)利要求36的方法,其中該控制信息傳送從能量度量的比值的平方根或者能量度量的平方根的比值所計(jì)算的定標(biāo)因子的表示,并且其中在這些比值中的一些能量度量表示所述合成信號的至少一些頻譜分量的能量。
38.根據(jù)權(quán)利要求37的方法,其中從該第三組頻率子帶中的頻譜分量合成該一個(gè)或多個(gè)合成信號的至少一些頻譜分量。
39.根據(jù)權(quán)利要求36的方法,其中響應(yīng)于該控制信息適配所述各組頻率子帶中的一組或多組的頻率范圍。
40.一種用于編碼一個(gè)或多個(gè)輸入音頻信號的編碼器,其中該編碼器具有執(zhí)行信號處理方法的處理電路,該信號處理方法包括接收該一個(gè)或多個(gè)輸入音頻信號并且從中得到一個(gè)或多個(gè)基帶信號和一個(gè)或多個(gè)剩余信號,其中一個(gè)基帶信號的頻譜分量表示在第一組頻率子帶中的一個(gè)相應(yīng)輸入音頻信號的頻譜分量,并且在一個(gè)相關(guān)剩余信號中的頻譜分量表示在該基帶信號所沒有表示的第二組頻率子帶中的該相應(yīng)輸入音頻信號的頻譜分量;得到將在解碼期間產(chǎn)生的一個(gè)或多個(gè)合成信號的至少一些頻譜分量的能量度量,其中該一個(gè)或多個(gè)合成信號具有在該第二組頻率子帶內(nèi)的頻譜分量;得到每個(gè)剩余信號的至少一些頻譜分量的能量度量;通過得到在所述剩余信號中的頻譜分量的能量度量與在該一個(gè)或多個(gè)合成信號中的頻譜分量的能量度量的比值的平方根、在該一個(gè)或多個(gè)合成信號中的頻譜分量的能量度量與在所述剩余信號中的頻譜分量的能量度量的比值的平方根、在所述剩余信號中的頻譜分量的能量度量的平方根與在該一個(gè)或多個(gè)合成信號中的頻譜分量的能量度量的平方根的比值、或者在該一個(gè)或多個(gè)合成信號中的頻譜分量的能量度量的平方根與在所述剩余信號中的頻譜分量的能量度量的平方根的比值,計(jì)算定標(biāo)因子;以及將信號信息和定標(biāo)信息匯編到已編碼信號中,其中該信號信息表示在該一個(gè)或多個(gè)基帶信號中的頻譜分量并且該定標(biāo)信息表示定標(biāo)因子。
41.一種用于解碼表示一個(gè)或多個(gè)輸入音頻信號的編碼信號的解碼器,其中該解碼器具有執(zhí)行信號處理方法的處理電路,該信號處理方法包括從該已編碼信號中得到定標(biāo)信息和信號信息,其中該定標(biāo)信息表示從頻譜分量的能量度量的比值的平方根或者頻譜分量的能量度量的平方根的比值所計(jì)算的定標(biāo)因子,并且該信號信息表示一個(gè)或多個(gè)基帶信號的頻譜分量,其中在每個(gè)基帶信號中的頻譜分量表示在第一組頻率子帶中的一個(gè)相應(yīng)輸入音頻信號的頻譜分量;為每個(gè)相應(yīng)的基帶信號產(chǎn)生一個(gè)相關(guān)的合成信號,該合成信號具有該相應(yīng)基帶信號所沒有表示的第二組頻率子帶中的頻譜分量,其中根據(jù)一個(gè)或多個(gè)所述定標(biāo)因子通過乘法或除法對該相關(guān)合成信號中的頻譜分量定標(biāo);以及產(chǎn)生一個(gè)或多個(gè)輸出音頻信號,其中每個(gè)輸出音頻信號表示一個(gè)相應(yīng)的輸入音頻信號并且從相應(yīng)基帶信號及其相關(guān)合成信號中的頻譜分量產(chǎn)生。
42.一種用于編碼多個(gè)輸入音頻信號的編碼器,其中該編碼器具有執(zhí)行信號處理方法的處理電路,該信號處理方法包括接收該多個(gè)輸入音頻信號并且從中得到多個(gè)基帶信號、多個(gè)剩余信號以及一個(gè)耦合聲道信號,其中一個(gè)基帶信號的頻譜分量表示在第一組頻率子帶中的一個(gè)相應(yīng)輸入音頻信號的頻譜分量并且一個(gè)相關(guān)剩余信號的頻譜分量表示在該基帶信號所沒有表示的第二組頻率子帶中的該相應(yīng)輸入音頻信號的頻譜分量,并且其中該耦合聲道信號的頻譜分量表示在第三組頻率子帶中的兩個(gè)或更多個(gè)所述輸入音頻信號的頻譜分量的復(fù)合;得到每個(gè)剩余信號和該耦合聲道信號所表示的該兩個(gè)或更多個(gè)輸入音頻信號的至少一些頻譜分量的能量度量;以及將控制信息和信號匯編到已編碼信號中,其中該控制信息從所述能量度量中推導(dǎo)出來并且其中該信號信息表示在該多個(gè)基帶信號和該耦合聲道信號中的頻譜分量。
43.一種用于解碼表示多個(gè)輸入音頻信號的已編碼信號的解碼器,其中該解碼器具有執(zhí)行信號處理方法的處理電路,該信號處理方法包括從該已編碼信號得到控制信息和信號信息,其中該控制信息是從頻譜分量的能量度量推導(dǎo)出來的并且該信號信息表示多個(gè)基帶信號和一個(gè)耦合聲道信號的頻譜分量,其中在每個(gè)基帶信號中的頻譜分量表示在第一組頻率子帶中的一個(gè)相應(yīng)輸入音頻信號的頻譜分量并且該耦合聲道信號的頻譜分量表示該多個(gè)輸入音頻信號中兩個(gè)或更多個(gè)的第三組頻率子帶中的頻譜分量的復(fù)合;為每個(gè)相應(yīng)的基帶信號產(chǎn)生一個(gè)相關(guān)合成信號,該合成信號具有該相應(yīng)基帶信號所沒有表示的第二組頻率子帶中的頻譜分量,其中根據(jù)該控制信息對該相關(guān)合成信號中的頻譜分量定標(biāo);從該耦合聲道信號為該耦合聲道信號所表示的所述兩個(gè)或更多個(gè)輸入音頻信號中每一個(gè)產(chǎn)生一個(gè)相應(yīng)去耦信號,其中去耦信號具有該第三組頻率子帶中的根據(jù)該控制信息所定標(biāo)的頻譜分量;以及產(chǎn)生多個(gè)輸出音頻信號,其中每個(gè)輸出音頻信號表示一個(gè)相應(yīng)的輸入音頻信號并且是從一個(gè)相應(yīng)基帶信號及其相關(guān)合成信號中的頻譜分量產(chǎn)生的,并且其中表示該兩個(gè)或更多個(gè)音頻信號的輸出音頻信號也是從相應(yīng)的去耦信號中的頻譜分量產(chǎn)生的。
44.一種傳送裝置可執(zhí)行的指令程序的媒體,其中該指令程序的執(zhí)行導(dǎo)致該裝置執(zhí)行權(quán)利要求1-39中任一個(gè)的方法。
全文摘要
一種音頻編碼器丟棄輸入信號的頻譜分量并且使用聲道耦合來降低已編碼信號的信息容量需求。聲道耦合以復(fù)合形式表示多個(gè)聲道信號的選定頻譜分量。音頻解碼器合成頻譜分量來代替丟棄的頻譜分量并且從耦合聲道信號中產(chǎn)生用于各個(gè)聲道信號的頻譜分量。該編碼器在已編碼信號中提供定標(biāo)因子,這些定標(biāo)因子可以提高解碼器產(chǎn)生輸出信號的效率,其中這些輸出信號基本上保持了原始輸入信號的頻譜能量。
文檔編號G10L19/02GK1781141SQ200480011250
公開日2006年5月31日 申請日期2004年4月30日 優(yōu)先權(quán)日2003年5月8日
發(fā)明者羅伯特·L.·安德森, 邁克爾·M.·杜魯門, 飛利浦·A.·威廉姆斯, 斯蒂芬·D.·弗農(nóng) 申請人:杜比實(shí)驗(yàn)室特許公司