欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

多信道音頻編碼的制作方法

文檔序號:7649131閱讀:113來源:國知局
專利名稱:多信道音頻編碼的制作方法
技術(shù)領(lǐng)域
本發(fā)明一般涉及音頻信號處理。本發(fā)明尤其適用于低比特率和甚低比特率音頻信號處理。具體地說,本發(fā)明的方面涉及編碼器(或編碼過程),解碼器(或解碼過程),和音頻信號的編碼/解碼系統(tǒng)(或編碼/解碼過程),其中多個(gè)音頻信道用復(fù)合單聲音頻信道和輔助(“側(cè)鏈”)信息來表示?;蛘撸鄠€(gè)音頻信道用多個(gè)音頻信道和側(cè)鏈信息來表示。 本發(fā)明的方面還涉及多信道-復(fù)合單聲信道下混合器(或下混合過程),單聲信道-多信道上混合器(或上混合過程),和單聲信道-多信道解相關(guān)器(或解相關(guān)過程)。本發(fā)明其他方面涉及多信道-多信道下混合器(或下混合過程),多信道-多信道上混合器(或上混合過程),和解相關(guān)器(或解相關(guān)過程)。
背景技術(shù)
在AC-3數(shù)字音頻編碼和解碼系統(tǒng)中,當(dāng)系統(tǒng)缺少比特時(shí),可以有選擇地在高頻對信道進(jìn)行合并或“耦合”。AC-3系統(tǒng)的細(xì)節(jié)在本技術(shù)領(lǐng)域是眾所周知的,例如參見ATSC Standard A52/A :Digital AudioCompression Stan dard(AC-3), Revision A, Advanced TelevisionSystems Committee, 20Aug. 2001。A/52A 文獻(xiàn)可以從萬維網(wǎng)上的 http://www. atsc. org/standards. html得到。A/52A文獻(xiàn)在此全部包含作為參考。AC-3系統(tǒng)根據(jù)需要以高于某一頻率對信道進(jìn)行合并,這一頻率被稱為“耦合”頻率。高于耦合頻率時(shí),所耦合的信道被合并成“耦合”或復(fù)合信道。編碼器為每一信道中高于耦合頻率的每一子帶產(chǎn)生“耦合坐標(biāo)”(振幅比例因子)。耦合坐標(biāo)表示每一耦合信道子帶的原始能量與復(fù)合信道中相應(yīng)子帶的能量的比率。低于耦合頻率時(shí),信道被分立地編碼。 為了減少異相信號分量抵消,耦合信道的子帶的相位極性在該信道與一個(gè)或多個(gè)其他耦合信道合并之前可以先被反向。復(fù)合信道與側(cè)鏈信息(按每一子帶含有耦合坐標(biāo)以及信道相位是否反向)一起被發(fā)送到解碼器。實(shí)際上,AC-3系統(tǒng)的商用實(shí)施方式中所用的耦合頻率的范圍是從約 IOkHz 到約 3500Hzο 美國專利 5,583,962,5, 633,981,5, 727,119,5, 909,664 和6,021,386包括一些教導(dǎo),涉及將多個(gè)音頻信道合并成復(fù)合信道以及輔助或側(cè)鏈信息, 和由此恢復(fù)出原始多個(gè)信道的近似。所述專利中的每一個(gè)在此全部包含作為參考。

發(fā)明內(nèi)容
本發(fā)明的方面可以被認(rèn)為是AC-3編碼和解碼系統(tǒng)的“耦合”技術(shù)的改進(jìn),同時(shí)也是如下其他技術(shù)的改進(jìn)將多個(gè)音頻信道合并成單聲復(fù)合信號,或合并成多個(gè)音頻信道連同相關(guān)輔助信息,以及重建多個(gè)音頻信道。本發(fā)明的方面還可以被認(rèn)為是這樣一些技術(shù)的改進(jìn)將多個(gè)音頻信道下混合到單聲音頻信號或下混合到多個(gè)音頻信道,和將從單聲音頻信道或從多個(gè)音頻信道得到的多個(gè)音頻信道解相關(guān)。
本發(fā)明的方面可以用于N: 1 :N的空間音頻編碼技術(shù)中(其中“N”是音頻信道數(shù)) 或M: 1 :N的空間音頻編碼技術(shù)中(其中“M”是編碼的音頻信道數(shù)而“N”是解碼的音頻信道數(shù)),這些技術(shù)尤其通過提供改進(jìn)的相位補(bǔ)償、解相關(guān)機(jī)制和與信號相關(guān)的可變時(shí)間常數(shù)來改進(jìn)信道耦合。本發(fā)明的方面還可以用于N:X:N和M:X:N的空間音頻編碼技術(shù)中(其中 “X”可以是1或大于1)。目的在于,在下混合之前通過調(diào)整信道間相對相位來減小編碼過程中的耦合抵消人為產(chǎn)物,和通過在解碼器中恢復(fù)相角和解相關(guān)度來改進(jìn)再現(xiàn)信號的空間維度。本發(fā)明的方面在實(shí)際實(shí)施方式中體現(xiàn)時(shí),應(yīng)當(dāng)考慮到連續(xù)不斷的而不是請求式的信道耦合以及比例如AC-3系統(tǒng)中更低的耦合頻率,從而降低所需的數(shù)據(jù)率。


圖1是示出體現(xiàn)本發(fā)明的方面的N: 1編碼配置的主要功能或設(shè)備的理想化框圖。圖2是示出體現(xiàn)本發(fā)明的方面的1:N解碼配置的主要功能或設(shè)備的理想化框圖。圖3示出了下述內(nèi)容的簡化的概念性結(jié)構(gòu)的一個(gè)例子沿(縱向)頻率軸的bin 和子帶,和沿(橫向)時(shí)間軸的塊和幀。該圖沒有按比例繪制。圖4具有混合流程圖和功能框圖的性質(zhì),示出了用于實(shí)現(xiàn)體現(xiàn)本發(fā)明的方面的編碼配置的功能的編碼步驟或設(shè)備。圖5具有混合流程圖和功能框圖的性質(zhì),示出了用于實(shí)現(xiàn)體現(xiàn)本發(fā)明的方面的解碼配置的功能的解碼步驟或設(shè)備。圖6是示出體現(xiàn)本發(fā)明的方面的第一種N:X編碼配置的主要功能或設(shè)備的理想化框圖。圖7是示出體現(xiàn)本發(fā)明的方面的x:M解碼配置的主要功能或設(shè)備的理想化框圖。圖8是示出體現(xiàn)本發(fā)明的方面的第一種可選X:M解碼配置的主要功能或設(shè)備的理想化框圖。圖9是示出體現(xiàn)本發(fā)明的方面的第二種可選x:M解碼配置的主要功能或設(shè)備的理想化框圖。
具體實(shí)施例方式基本N: 1編碼器參照圖1,示出了體現(xiàn)本發(fā)明的方面的N:1編碼器功能或設(shè)備。該圖是作為體現(xiàn)本發(fā)明的方面的基本編碼器所實(shí)現(xiàn)的功能或結(jié)構(gòu)的一個(gè)例子。實(shí)施本發(fā)明的方面的其他功能或結(jié)構(gòu)配置也可以使用,包括如下所述的可選和/或等價(jià)的功能或結(jié)構(gòu)配置。兩個(gè)或兩個(gè)以上音頻輸入信道輸入到編碼器。盡管原則上本發(fā)明的方面可以用模擬、數(shù)字或混合模擬/數(shù)字實(shí)施方式來實(shí)施,但本文所公開的例子是數(shù)字實(shí)施方式。因此, 輸入信號可以是已從模擬音頻信號中得到的時(shí)間樣值。時(shí)間樣值可以被編碼成線性脈碼調(diào)制(PCM)信號。每個(gè)線性PCM音頻輸入信道都由具有同相和正交輸出的濾波器組功能或設(shè)備進(jìn)行處理,比如通過512點(diǎn)開窗的正向離散傅里葉變換(DFT)(由快速傅里葉變換(FFT) 所實(shí)現(xiàn))進(jìn)行處理。濾波器組可以被認(rèn)為是一種時(shí)域-頻域變換。圖1示出了各自輸入到濾波器組功能或設(shè)備“濾波器組” 2的第一 PCM信道輸入 (信道“1”)和輸入到另一濾波器組功能或設(shè)備“濾波器組” 4的第二 PCM信道輸入(信道“η”)。可以有“η”個(gè)輸入信道,其中“η”是大于等于2的正整數(shù)。因此,相應(yīng)地有“η”個(gè)濾波器組,每個(gè)都接收“η”個(gè)輸入信道中的唯一一個(gè)信道。為了便于說明,圖1只示出了兩個(gè)輸入信道“1”和“η”。當(dāng)用FFT實(shí)現(xiàn)濾波器組時(shí),輸入時(shí)域信號被分割成連續(xù)的塊,然后通常以交疊的塊進(jìn)行處理。FFT的離散頻率輸出(變換系數(shù))稱之為bin,每個(gè)bin都有一個(gè)具有實(shí)部和虛部(分別相應(yīng)于同相和正交分量)的復(fù)值。鄰接的變換bin可以組合成接近于人耳聽覺臨界帶寬的子帶,并且由編碼器產(chǎn)生的大部分側(cè)鏈信息(如下所述)可以按每一子帶進(jìn)行計(jì)算和發(fā)送,以便最大限度地減少處理資源和降低比特率。多個(gè)連續(xù)的時(shí)域塊可以組合成幀,單個(gè)塊的值在每幀上進(jìn)行平均或反過來進(jìn)行合并或累積,以便最大限度地降低側(cè)鏈數(shù)據(jù)率。在本文所述的例子中,每一濾波器組都通過FFT實(shí)現(xiàn),鄰接的變換bin被組合成子帶, 塊被組合成幀,而側(cè)鏈數(shù)據(jù)每幀發(fā)送一次。或者,側(cè)鏈數(shù)據(jù)可以每幀發(fā)送一次以上(如每塊一次)。例如參見以下圖3及其描述。眾所周知,在發(fā)送側(cè)鏈信息的頻率與所需的比特率之間有一個(gè)折衷。當(dāng)使用48kHz采樣率時(shí),本發(fā)明的方面的一種適宜的實(shí)際實(shí)現(xiàn)方式可以使用約32 毫秒的固定長度幀,每一幀有6個(gè)相互間隔約為5. 3毫秒的塊(例如采用持續(xù)時(shí)間約為 10. 6毫秒有50%交疊的塊)。然而,假如這里所述的按每幀發(fā)送的信息以不低于約每隔40 毫秒的頻率發(fā)送,那么這種時(shí)序、固定長度幀的使用及其固定個(gè)數(shù)的塊的劃分對實(shí)施本發(fā)明的方面而言都不是關(guān)鍵所在。幀可以具有任意長度,而且其長度可以動(dòng)態(tài)變化。正如上述AC-3系統(tǒng)中那樣,可以使用可變塊長度。條件是在此要參照“幀”和“塊”。實(shí)際上,如果復(fù)合單聲或多信道信號或者復(fù)合單聲或多信道信號和離散低頻信道通過例如感覺編碼器來編碼(如下所述),那么可以方便地使用感覺編碼器中所用的相同的幀和塊結(jié)構(gòu)。此外,如果該編碼器使用可變塊長度使得可以隨時(shí)從一個(gè)塊長度切換到另一個(gè)塊長度,那么,當(dāng)這種塊切換發(fā)生時(shí),最好更新本文所述的一個(gè)或多個(gè)側(cè)鏈信息。為了使數(shù)據(jù)開銷增量最小,當(dāng)隨著這種切換的發(fā)生而更新側(cè)鏈信息時(shí),可以降低所更新側(cè)鏈信息的頻率分辨率。圖3示出了下述內(nèi)容的簡化的概念性結(jié)構(gòu)的一個(gè)例子沿(縱向)頻率軸的bin 和子帶,和沿(橫向)時(shí)間軸的塊和幀。當(dāng)一些bin被劃分為接近于臨界頻帶的子帶時(shí),最低頻率子帶具有最少的bin(比如1個(gè)),而每一子帶的bin個(gè)數(shù)隨頻率提高而增加?;氐綀D1,由每個(gè)信道的各自濾波器組(本例中的濾波器組2和4)所產(chǎn)生的η個(gè)時(shí)域輸入信道中的每一個(gè)的頻域形式通過加性合并功能或設(shè)備“加性合并器”6被一起合并 (“下混合”)為單聲復(fù)合音頻信號。下混合可以應(yīng)用于輸入音頻信號的整個(gè)頻率帶寬,或者它可以可選地限于給定 “耦合”頻率以上的頻率,因?yàn)橄禄旌线^程的人為產(chǎn)物在中頻到低頻可聽得更清楚。在這些情況下,在耦合頻率以下信道可以離散傳送。這種策略即使在處理人為產(chǎn)物不成問題時(shí)也能合乎要求,這是因?yàn)?,將變換bin組合成臨界頻帶類的子帶(寬度與頻率大致成比例)所構(gòu)成的中/低頻子帶使得在低頻時(shí)有較少的變換bin(在甚低頻只有一個(gè)bin),并可以直接用少數(shù)幾個(gè)比特或比發(fā)送具有側(cè)鏈信息的下混合單聲音頻信號所需更少的比特來編碼。低至4kHz、2300Hz、1000Hz甚至低至輸入到編碼器的音頻信號的頻帶的最低頻率的耦合或過渡頻率可適用于某些應(yīng)用,尤其適用于甚低比特率顯得重要的應(yīng)用。其他頻率可以在節(jié)省比特與聽眾接受之間提供有益的平衡。具體耦合頻率的選擇對本發(fā)明來說并不是關(guān)鍵。耦合頻率可以變化,而且如果變化,那么該頻率可以例如直接或間接地取決于輸入信號特性。本發(fā)明的一個(gè)方面在于,在下混合之前改進(jìn)信道彼此之間的相角對準(zhǔn),以便當(dāng)信道被合并時(shí)減少異相信號分量抵消并提供改進(jìn)的單聲復(fù)合信道。這可以通過隨時(shí)間可控地對這些信道中的一些信道上的某些或所有變換bin的“絕對角度”進(jìn)行偏移來實(shí)現(xiàn)。例如, 必要時(shí),在每一信道中或者當(dāng)以某個(gè)信道作參考時(shí)在除該參考信道外的所有信道中,隨時(shí)間可控地對表示高于耦合頻率的音頻(從而規(guī)定了所關(guān)心的頻帶)的所有變換bin進(jìn)行偏移。bin的“絕對角度”可以認(rèn)為是濾波器組所產(chǎn)生的每一復(fù)值變換bin的幅度-角度表達(dá)式中的角度。信道中的bin的絕對角度的可控偏移可以利用角度轉(zhuǎn)動(dòng)功能或設(shè)備(“轉(zhuǎn)動(dòng)角度”)來實(shí)現(xiàn)。濾波器組2的輸出在被應(yīng)用于加性合并器6所提供的下混合合并之前, 轉(zhuǎn)動(dòng)角度8先對其進(jìn)行處理,而濾波器組4的輸出在被應(yīng)用于加性合并器6之前,轉(zhuǎn)動(dòng)角度 10先對其進(jìn)行處理。應(yīng)當(dāng)理解,在某些信號條件下,特定的變換bin在某一時(shí)間段(在這里所述的例子中為一幀的時(shí)間段)上可以不需要角度轉(zhuǎn)動(dòng)。低于耦合頻率時(shí),信道信息可以離散編碼(圖1中未示出)。原則上,信道彼此之間的相角對準(zhǔn)的改善可以通過在所關(guān)心的整個(gè)頻帶上的每個(gè)塊中使每個(gè)變換bin或子帶偏移其絕對相角的負(fù)值來完成。盡管這樣基本上避免了異相信號分量抵消,然而,尤其當(dāng)孤立傾聽所得到的單聲復(fù)合信號時(shí),往往會(huì)造成可聽得見的人為產(chǎn)物。因此,最好采用“最少處理”原則根據(jù)需要只對信道中bin的絕對角度進(jìn)行偏移,以便最大限度地減少下混合過程中的異相抵消和最大限度地減少解碼器所重建的多信道信號的空間聲像崩潰。一些用于確定這種角度偏移的技術(shù)如下所述。這些技術(shù)包括時(shí)間和頻率平滑方法以及信號處理對發(fā)生瞬變作出響應(yīng)的方式。此外,如下所述,還可以在編碼器中按每一 bin進(jìn)行能量歸一化,以進(jìn)一步減少孤立bin的其余任意異相抵消。如下進(jìn)一步所述,還可以(在解碼器中)按每一子帶進(jìn)行能量歸一化,以確保單聲復(fù)合信號的能量等于起作用信道的能量總和。每一輸入信道都有一個(gè)與其相關(guān)的音頻分析器功能或設(shè)備(“音頻分析器”),用于產(chǎn)生該信道的側(cè)鏈信息,和用于在控制了應(yīng)用于信道的角度轉(zhuǎn)動(dòng)量或度數(shù)之后才將其輸入到下混合合并6。信道1和η的濾波器組輸出分別輸入到音頻分析器12和音頻分析器14。 音頻分析器12產(chǎn)生信道1的側(cè)鏈信息和信道1的相角轉(zhuǎn)動(dòng)量。音頻分析器14產(chǎn)生信道η 的側(cè)鏈信息和信道η的相角轉(zhuǎn)動(dòng)量。應(yīng)當(dāng)理解,本文中這些所謂“角度”指的是相角。每個(gè)信道的音頻分析器所產(chǎn)生的每個(gè)信道的側(cè)鏈信息可以包括振幅比例因子(“振幅SF” ),角度控制參數(shù),解相關(guān)比例因子(“解相關(guān)SF” ),瞬變標(biāo)志,和可選內(nèi)插標(biāo)志。這樣的側(cè)鏈信息可以表征為“空間參數(shù)”,表示信道的空間特性和/或表示可能與空間處理有關(guān)的信號特性(比如瞬變)。在每種情況下,側(cè)鏈信息都將應(yīng)用于單個(gè)子帶(除了瞬變標(biāo)志和內(nèi)插標(biāo)志之外,每一側(cè)鏈信息都將應(yīng)用于信道內(nèi)的所有子帶),并且可以每幀更新一次(如以下例子中所述)或者當(dāng)在相關(guān)編碼器中出現(xiàn)塊切換時(shí)進(jìn)行更新。各種空間參數(shù)的進(jìn)一步的細(xì)節(jié)如下所述。編碼器中的具體信道的角度轉(zhuǎn)動(dòng)可以被認(rèn)為是極性反向的角度控制參數(shù),它是側(cè)鏈信息的一部分。如果使用參考信道,那么該信道可以不需要音頻分析器,或者可以需要只產(chǎn)生振幅比例因子側(cè)鏈信息的音頻分析器。如果解碼器可以根據(jù)其他非參考信道的振幅比例因子推斷出具有足夠精度的振幅比例因子,那么未必發(fā)送該振幅比例因子。如下所述,如果編碼器中的能量歸一化確保任意子帶內(nèi)的所有信道上的比例因子實(shí)際平方和為1,那么在解碼器中可以推斷出參考信道的振幅比例因子的近似值。由于振幅比例因子的相對粗量化導(dǎo)致所再現(xiàn)的多信道音頻中的聲像移位,因此推斷出的近似參考信道振幅比例因子值可能有誤差。然而,在低數(shù)據(jù)率情況下,這種人為產(chǎn)物與使用比特來發(fā)送參考信道的振幅比例因子的情況相比更可接受。不過,在某些情況下,參考信道最好使用至少能產(chǎn)生振幅比例因子側(cè)鏈信息的音頻分析器。圖1用虛線來表示到每個(gè)音頻分析器的可選輸入(從PCM時(shí)域輸入到該信道中的音頻分析器)。音頻分析器利用這一輸入來檢測某一時(shí)間段(在這里所述的例子中為一個(gè)塊或幀的時(shí)間段)上的瞬變,并響應(yīng)這一瞬變產(chǎn)生瞬變指示符(例如1比特“瞬變標(biāo)志”)。 或者,如以下圖4的步驟408的解釋中所述,可以在頻域中檢測瞬變,這樣,音頻分析器不必接收時(shí)域輸入。單聲復(fù)合音頻信號和所有信道(或除參考信道外的所有信道)的側(cè)鏈信息可被存儲(chǔ)、傳送或者存儲(chǔ)和傳送到解碼過程或設(shè)備(“解碼器”)。在進(jìn)行存儲(chǔ)、傳送或者存儲(chǔ)和傳送之前,各種音頻信號和各種側(cè)鏈信息可以被復(fù)用和打包到一個(gè)或多個(gè)適用于存儲(chǔ)、傳送或者存儲(chǔ)和傳送媒介或媒體的比特流中。在進(jìn)行存儲(chǔ)、傳送或者存儲(chǔ)和傳送之前,單聲復(fù)合音頻可以輸入到數(shù)據(jù)率下降編碼過程或設(shè)備(比如感覺編碼器)或者輸入到感覺編碼器和熵編碼器(比如算術(shù)或霍夫曼編碼器)(有時(shí)也稱之為“無損”編碼器)。此外,如上所述, 只對于高于某一頻率(“耦合”頻率)的音頻,才可以從多個(gè)輸入信道中得到單聲復(fù)合音頻和相關(guān)側(cè)鏈信息。在這種情況下,多個(gè)輸入信道的每一個(gè)中的低于耦合頻率的音頻可以作為離散信道進(jìn)行存儲(chǔ)、傳送或者存儲(chǔ)和傳送,或者可以按與這里所述不同的某種方式進(jìn)行合并或處理。這些離散的或反過來合并的信道也可以輸入到數(shù)據(jù)下降編碼過程或設(shè)備(比如感覺編碼器,或者感覺編碼器和熵編碼器)。單聲復(fù)合音頻和離散多信道音頻都可以輸入到綜合感覺編碼或者感覺和熵編碼過程或設(shè)備。在編碼器比特流中載送側(cè)鏈信息的具體方式對本發(fā)明而言并不是關(guān)鍵。需要時(shí), 側(cè)鏈信息可以按比如比特流與老式解碼器兼容(即比特流是向后兼容的)的方式進(jìn)行載送。完成這項(xiàng)工作的許多合適技術(shù)是已知的。例如,許多編碼器產(chǎn)生了具有解碼器忽略的未用或無效比特的比特流。這種配置的一個(gè)例子如美國專利6,807,528B1中所述,該專利在此全部包含作為參考,它由iTruman等人于2004年10月19日申請,名稱為“Adding Data to a Compressed Data Frame”。這些比特可以用側(cè)鏈信息來代替。另一個(gè)例子是,側(cè)鏈信息可以在編碼器的比特流中進(jìn)行加密編碼。此外,還可利用允許這種側(cè)鏈信息和與老式解碼器兼容的單聲/立體聲比特流一同傳送或存儲(chǔ)的任意技術(shù),將側(cè)鏈信息與向后兼容的比特流分別存儲(chǔ)或傳送。基本1 N和1 M解碼器
參照圖2,示出了體現(xiàn)本發(fā)明的方面的1:N解碼器功能或設(shè)備(“解碼器”)。該圖是作為體現(xiàn)本發(fā)明的方面的基本解碼器所實(shí)現(xiàn)的功能或結(jié)構(gòu)的一個(gè)例子。實(shí)施本發(fā)明的方面的其他功能或結(jié)構(gòu)配置也可以使用,包括如下所述的可選和/或等價(jià)的功能或結(jié)構(gòu)配置。解碼器接收單聲復(fù)合音頻信號和所有信道(或除參考信道外的所有信道)的側(cè)鏈信息。必要時(shí),將復(fù)合音頻信號和相關(guān)側(cè)鏈信息去復(fù)用、拆分和/或解碼。解碼可以采用查尋表。目的是要從單聲復(fù)合音頻信道中得到與輸入到圖1的編碼器的音頻信道中的各個(gè)信道接近的多個(gè)單獨(dú)音頻信道,以遵照本文所述的本發(fā)明的比特率下降技術(shù)。當(dāng)然,可以選擇不恢復(fù)輸入到編碼器的所有信道或者只使用單聲復(fù)合信號。此外, 利用如下申請中所述發(fā)明的方面,還可以從根據(jù)本發(fā)明的方面的解碼器的輸出中得到除了這些輸入到編碼器的信道以外的信道于2002年2月7日申請并于2002年8月15日公布的指定美國的國際申請PCT/US02/03619,及其于2003年8月5日申請的相應(yīng)美國國家申請系列號10/467,213 ;和于2003年8月6日申請并于2001年3月4日公布為WO 2004/019656 的指定美國的國際申請PCT/US03/24570,及其于2005年1月27日申請的相應(yīng)美國國家申請系列號10/522,515。所述申請?jiān)诖巳堪鳛閰⒖?。?shí)施本發(fā)明的方面的解碼器所恢復(fù)的信道尤其可以與所述參考的申請中的信道相乘技術(shù)結(jié)合起來使用,這是因?yàn)?,所恢?fù)信道不僅具有有用的信道間振幅關(guān)系,而且還具有有用的信道間相位關(guān)系。信道相乘的另一種變通辦法是使用矩陣解碼器來得到附加信道。本發(fā)明的信道間振幅和相位保持的方面使得體現(xiàn)本發(fā)明的方面的解碼器的輸出信道尤其適用于對振幅和相位敏感的矩陣解碼器。 許多這樣的矩陣解碼器使用寬帶控制電路,這種控制電路嚴(yán)格地僅當(dāng)輸入給它的信號在整個(gè)信號帶寬上都是立體聲時(shí)才工作。因此,如果在N等于2的N: 1:N系統(tǒng)中體現(xiàn)本發(fā)明的方面,那么解碼器所恢復(fù)的兩個(gè)信道可以輸入到2:M的有源矩陣解碼器。如上所述,低于耦合頻率時(shí),這些信道可以是離散信道。許多合適的有源矩陣解碼器在技術(shù)上是眾所周知的,包括例如稱為“Pro Logic”和“Pro Logic II”解碼器的矩陣解碼器("Pro Logic”是Dolby Laboratories Licensing Corporation的商標(biāo))。Pro Logic角軍碼器的有關(guān)方面如美國專利4,799,260和4,941,177中所公開,這些專利中的每一個(gè)在此全部包含作為參考。Pro Logic II解碼器的有關(guān)方面如以下專利申請所公開=Fosgate于2000年3月22日申請并于2001年6月7日公布為WO 01/41504的未決美國專利申請系列號09/532,711,名稱為 "Method for Deriving at Least Three Audio Signalsfrom Two Input Audio Signals,,; 和Fosgate等人于2003年2月25日申請并于2004年7月1日公布為US 2004/0125960A1 的未決美國專利申請系列號10/362,786,名稱為“Method for Apparatus for Audio MatrixDecoding”。所述申請中的每一個(gè)在此全部包含作為參考。例如,在Roger Dressier 的論文"Dolby Surround Pro Logic Decoder Principlesof Operation”禾口 Jim Hilson 的論文"Mixing with Dolby Pro Logic IITechnology,,中,角軍釋了 Dolby Pro Logic 禾口 Pro Logic II解碼器的操作的某些方面,這些論文可以從Dolby Laboratories的網(wǎng)站(www. dolby.com)上得到。其他合適的有源矩陣解碼器可以包括下列美國專利和公開的國際申請(每個(gè)都指定美國)中的一個(gè)或多個(gè)中所述的有源矩陣解碼器,這些專利和申請中的每一個(gè)在此全部包含作為參考5, 046,098 ;5,274,740 ;5,400,433 ;5,625,696 ;5,644,640 ; 5,504,819 ;5,428,687 ;5,172,415 ;和 WO 02/19768。
再回到圖2,接收到的單聲復(fù)合音頻信道應(yīng)用于多個(gè)信號通道,從中得到所恢復(fù)的多個(gè)音頻信道中的各自一個(gè)信道。各信道得到通道包括(按任一次序)振幅調(diào)整功能或設(shè)備(“調(diào)整振幅”)和角度轉(zhuǎn)動(dòng)功能或設(shè)備(“轉(zhuǎn)動(dòng)角度”)。調(diào)整振幅是對單聲復(fù)合信號施加增益或衰減,這樣,在某些信號條件下,從復(fù)合信號中得到的輸出信道的相對輸出幅度(或能量)類似于編碼器輸入端的信道的幅度(或能量)。此外,如下所述,在強(qiáng)加“隨機(jī)”角度變動(dòng)時(shí)的某些信號條件下,還可以對所恢復(fù)信道的振幅強(qiáng)加一個(gè)可控的“隨機(jī)”振幅變動(dòng)量,從而改進(jìn)它相對于所恢復(fù)信道中的其他信道的解相關(guān)性。轉(zhuǎn)動(dòng)角度應(yīng)用了相位轉(zhuǎn)動(dòng),這樣,在某些信號條件下,從單聲復(fù)合信號中得到的輸出信道的相對相角類似于編碼器輸入端的信道的相角。最好,在某些信號條件下,還可以對所恢復(fù)信道的角度強(qiáng)加一個(gè)可控的“隨機(jī)”角度變動(dòng)量,從而改進(jìn)它相對于所恢復(fù)信道中的其他信道的解相關(guān)性。如以下進(jìn)一步所述,“隨機(jī)”角度振幅變動(dòng)不僅包括偽隨機(jī)和真隨機(jī)變動(dòng),而且包括確定性產(chǎn)生的變動(dòng)(具有減小信道之間的互相關(guān)的作用)。這還將在以下圖5A的步驟 505的解釋中作進(jìn)一步的討論。從概念上講,具體信道的調(diào)整振幅和轉(zhuǎn)動(dòng)角度是要確定單聲復(fù)合音頻DFT系數(shù), 以便得到信道的重建變換bin值。每個(gè)信道的調(diào)整振幅可以至少由具體信道的所恢復(fù)側(cè)鏈振幅比例因子進(jìn)行控制, 或者,在有參考信道的情況下,既根據(jù)參考信道的所恢復(fù)側(cè)鏈振幅比例因子又根據(jù)從其他非參考信道的所恢復(fù)側(cè)鏈振幅比例因子中推斷出的振幅比例因子進(jìn)行控制。可選地,為了增強(qiáng)所恢復(fù)信道的解相關(guān)性,調(diào)整振幅還可以由從具體信道的所恢復(fù)側(cè)鏈解相關(guān)比例因子以及具體信道的所恢復(fù)側(cè)鏈瞬變標(biāo)志中得出的隨機(jī)振幅比例因子參數(shù)進(jìn)行控制。每個(gè)信道的轉(zhuǎn)動(dòng)角度可以至少由所恢復(fù)的側(cè)鏈角度控制參數(shù)進(jìn)行控制(在這種情況下,解碼器中的轉(zhuǎn)動(dòng)角度基本上可以取消編碼器中的轉(zhuǎn)動(dòng)角度所提供的角度轉(zhuǎn)動(dòng))。為了增強(qiáng)所恢復(fù)信道的解相關(guān)性,轉(zhuǎn)動(dòng)角度還可以由從具體信道的所恢復(fù)側(cè)鏈解相關(guān)比例因子以及具體信道的所恢復(fù)側(cè)鏈瞬變標(biāo)志中得出的隨機(jī)角度控制參數(shù)進(jìn)行控制。信道的隨機(jī)角度控制參數(shù)以及信道的隨機(jī)振幅比例因子(如果使用該因子的話)可以由可控的解相關(guān)器功能或設(shè)備(“可控解相關(guān)器”)從信道的所恢復(fù)解相關(guān)比例因子和信道的所恢復(fù)瞬變標(biāo)志中得出ο參照圖2中的例子,所恢復(fù)的單聲復(fù)合音頻輸入到第一信道音頻恢復(fù)通道22,通道22得出信道1音頻;同時(shí)輸入到第二信道音頻恢復(fù)通道M,通道M得出信道η音頻。 音頻通道22包括調(diào)整振幅沈、轉(zhuǎn)動(dòng)角度觀和反向?yàn)V波器組功能或設(shè)備(“反向?yàn)V波器組”)30 (如果需要PCM輸出的話)。同樣,音頻通道M包括調(diào)整振幅32、轉(zhuǎn)動(dòng)角度34和反向?yàn)V波器組功能或設(shè)備(“反向?yàn)V波器組”)36(如果需要PCM輸出的話)。至于圖1中的情況,為了便于說明,只示出了兩個(gè)信道,應(yīng)當(dāng)理解可以有兩個(gè)以上的信道。第一信道(信道1)的所恢復(fù)側(cè)鏈信息可以包括振幅比例因子、角度控制參數(shù)、解相關(guān)比例因子、瞬變標(biāo)志和可選內(nèi)插標(biāo)志(如以上結(jié)合基本編碼器的描述中所述)。振幅比例因子輸入到調(diào)整振幅26。如果使用可選內(nèi)插標(biāo)志,那么可以使用可選頻率內(nèi)插器或內(nèi)插器功能(“內(nèi)插器”)27在整個(gè)頻率上(例如信道的每一子帶中的所有bin上)內(nèi)插角度控制參數(shù)。這種內(nèi)插可以是例如每個(gè)子帶中心點(diǎn)之間的bin角度的線性內(nèi)插。1比特內(nèi)插標(biāo)志的狀態(tài)可以選擇是否在頻率上進(jìn)行內(nèi)插,如以下進(jìn)一步所述。瞬變標(biāo)志和解相關(guān)比例因子輸入到可控解相關(guān)器38,該解相關(guān)器根據(jù)這一輸入產(chǎn)生一個(gè)隨機(jī)角度控制參數(shù)。1比特瞬變標(biāo)志的狀態(tài)可以選擇隨機(jī)角度解相關(guān)的兩種復(fù)方式之一,如以下進(jìn)一步所述。可在整個(gè)頻率上進(jìn)行內(nèi)插(如果使用內(nèi)插標(biāo)志和內(nèi)插器的話)的角度控制參數(shù)和隨機(jī)角度控制參數(shù)通過加性合并器或合并功能40相加在一起,以便提供用于轉(zhuǎn)動(dòng)角度觀的控制信號。可選地,可控解相關(guān)器38除了產(chǎn)生隨機(jī)角度控制參數(shù)之外,還可以根據(jù)瞬變標(biāo)志和解相關(guān)比例因子產(chǎn)生一個(gè)隨機(jī)振幅比例因子。振幅比例因子與這種隨機(jī)振幅比例因子通過加性合并器或合并功能(未示出)相加在一起,以便提供用于調(diào)整振幅26的控制信號。同樣,第二信道(信道η)的所恢復(fù)側(cè)鏈信息也可以包括振幅比例因子、角度控制參數(shù)、解相關(guān)比例因子、瞬變標(biāo)志和可選內(nèi)插標(biāo)志(如以上結(jié)合基本編碼器的描述中所述)。振幅比例因子輸入到調(diào)整振幅32??梢允褂妙l率內(nèi)插器或內(nèi)插器功能(“內(nèi)插器”)33 在整個(gè)頻率上內(nèi)插角度控制參數(shù)。與信道1的情況一樣,1比特內(nèi)插標(biāo)志的狀態(tài)可以選擇是否在整個(gè)頻率上進(jìn)行內(nèi)插。瞬變標(biāo)志和解相關(guān)比例因子輸入到可控解相關(guān)器42,該解相關(guān)器根據(jù)這一輸入產(chǎn)生一個(gè)隨機(jī)角度控制參數(shù)。與信道1的情況一樣,1比特瞬變標(biāo)志的狀態(tài)可以選擇隨機(jī)角度解相關(guān)的兩種復(fù)方式之一,如以下進(jìn)一步所述。角度控制參數(shù)和隨機(jī)角度控制參數(shù)通過加性合并器或合并功能44相加在一起,以便提供用于轉(zhuǎn)動(dòng)角度34的控制信號。可選地,如以上結(jié)合信道1所述,可控解相關(guān)器42除了產(chǎn)生隨機(jī)角度控制參數(shù)之外, 還可以根據(jù)瞬變標(biāo)志和解相關(guān)比例因子產(chǎn)生一個(gè)隨機(jī)振幅比例因子。振幅比例因子與隨機(jī)振幅比例因子通過加性合并器或合并功能(未示出)相加在一起,以便提供用于調(diào)整振幅 32的控制信號。盡管剛剛所述的過程或布局便于理解,然而,實(shí)際上利用能達(dá)到相同或類似結(jié)果的其他過程或布局也可以得到相同的結(jié)果。例如,調(diào)整振幅沈(32)和轉(zhuǎn)動(dòng)角度觀(34)的次序可以反過來,和/或可以有一個(gè)以上的轉(zhuǎn)動(dòng)角度(一個(gè)用于響應(yīng)角度控制參數(shù),而另一個(gè)用于響應(yīng)隨機(jī)角度控制參數(shù))。轉(zhuǎn)動(dòng)角度還可以被認(rèn)為是三個(gè)(而不是一個(gè)或兩個(gè))功能或設(shè)備,如以下圖5的例子中所述。如果使用隨機(jī)振幅比例因子,那么,可以有一個(gè)以上的調(diào)整振幅(一個(gè)用于響應(yīng)振幅比例因子,而另一個(gè)用于響應(yīng)隨機(jī)振幅比例因子)。由于人耳聽覺對振幅比對相位更敏感,因此,如果使用隨機(jī)振幅比例因子,那么,最好調(diào)整隨機(jī)振幅比例因子的影響相對于隨機(jī)角度控制參數(shù)的影響的比例,使得隨機(jī)振幅比例因子對振幅的影響小于隨機(jī)角度控制參數(shù)對相角的影響。作為另一種可選的過程或布局,解相關(guān)比例因子還可以用來控制隨機(jī)相角與基本相角的比例(而不是將表示隨機(jī)相角的參數(shù)與表示基本相角的參數(shù)相加),以及(如果使用的話)隨機(jī)振幅變動(dòng)與基本振幅變動(dòng)的比例(而不是將表示隨機(jī)振幅的比例因子與表示基本振幅的比例因子相加)(即每種情況下的可變疊化)。如果使用參考信道,那么,如以上結(jié)合基本編碼器所述,由于參考信道的側(cè)鏈信息可能只包括振幅比例因子(或者,如果該側(cè)鏈信息不含參考信道的振幅比例因子,那么,當(dāng)編碼器中的能量歸一化確保子帶內(nèi)的所有信道上的比例因子平方和為1時(shí),該振幅比例因子可以從其他信道的振幅比例因子中推斷出),因此可以省略該信道的可控解相關(guān)器和加性合并器。為參考信道提供振幅調(diào)整,并且可以由接收到的或所得出的參考信道的振幅比例因子來該控制振幅調(diào)整。無論參考信道的振幅比例因子是從該側(cè)鏈中得出還是在解碼器中推斷出,所恢復(fù)參考信道都是單聲復(fù)合信道的振幅定標(biāo)形式。因此它不需要角度轉(zhuǎn)動(dòng),這是因?yàn)樗瞧渌诺赖霓D(zhuǎn)動(dòng)的參考。盡管調(diào)整所恢復(fù)信道的相對振幅可以提供適度的解相關(guān),然而,如果使用單獨(dú)的振幅調(diào)整很可能導(dǎo)致許多信號條件下再現(xiàn)的聲場實(shí)際上缺乏空間化或映像(例如“崩潰” 的聲場)。振幅調(diào)整可能影響耳邊的耳間電平差,這只是耳朵所用的心理聲學(xué)定向提示之一。因此,根據(jù)本發(fā)明的方面,可以根據(jù)信號條件使用某些角度調(diào)整技術(shù),以提供附加的解相關(guān)。可以參照表1,表中給出了簡要解釋,這些解釋便于理解根據(jù)本發(fā)明的方面所采用的多種角度調(diào)整解相關(guān)技術(shù)或操作模式。除了表1中的技術(shù)之外,還可以采用其他解相關(guān)技術(shù)(如以下結(jié)合圖8和9的例子所述)。實(shí)際上,實(shí)施角度轉(zhuǎn)動(dòng)和幅度變更可能導(dǎo)致循環(huán)回旋(circularconvolution) (也稱為循環(huán)性或周期性回旋)。盡管通常要求避免循環(huán)回旋,然而,在編碼器和解碼器中通過互補(bǔ)角度偏移可以稍微減輕循環(huán)回旋所帶來的令人不快的聽得見的人為產(chǎn)物。此外, 在本發(fā)明的方面的低成本實(shí)現(xiàn)方式中,尤其是在只有部分音頻頻帶(比如1500Hz以上)下混合到單聲或多個(gè)信道的那些實(shí)現(xiàn)方式中(這種情況下聽得見的循環(huán)回旋的影響最小), 可以容忍這種循環(huán)回旋的影響??蛇x地,利用任意合適的技術(shù)(包括例如適當(dāng)使用“0”填充)可以避免或最大限度地減小循環(huán)回旋。使用“0”填充的一種方式是將所提出的頻域變動(dòng)(表示角度轉(zhuǎn)動(dòng)和振幅定標(biāo))變換到時(shí)域,對其開窗(利用任意窗口),為其填充一些 “0”,然后再變換回到頻域并乘以所要處理的音頻的頻域形式(該音頻不必被開窗)。表 1角度調(diào)整解相關(guān)技術(shù)
權(quán)利要求
1.一種用于對M個(gè)編碼音頻信道以及具有第一時(shí)間分辨率的一組一個(gè)或多個(gè)空間參數(shù)進(jìn)行解碼的方法,所述M個(gè)編碼音頻信道表示N個(gè)音頻信道,其中N大于等于2,所述方法包括以下步驟a)接收所述M個(gè)編碼音頻信道以及所述具有第一時(shí)間分辨率的該組一個(gè)或多個(gè)空間參數(shù),b)采用隨時(shí)間的內(nèi)插,以從所述具有第一時(shí)間分辨率的該組一個(gè)或多個(gè)空間參數(shù)產(chǎn)生具有第二時(shí)間分辨率的一組一個(gè)或多個(gè)空間參數(shù),c)從所述M個(gè)編碼音頻信道得出N個(gè)音頻信號,其中每個(gè)音頻信號被劃分成多個(gè)頻帶, 其中每個(gè)頻帶包括一個(gè)或多個(gè)頻譜分量,以及d)從所述N個(gè)音頻信號以及具有第二時(shí)間分辨率的該組一個(gè)或多個(gè)空間參數(shù)生成多信道輸出信號,其中,M大于等于2,所述N個(gè)音頻信號中的至少一個(gè)是從所述M個(gè)編碼音頻信道中的至少兩個(gè)的加權(quán)組合得出的相關(guān)信號,具有第二時(shí)間分辨率的該組一個(gè)或多個(gè)空間參數(shù)包括指示要與相關(guān)信號混合的不相關(guān)信號的量的第一參數(shù),以及步驟d)包括從所述至少一個(gè)相關(guān)信號得到至少一個(gè)不相關(guān)信號,并且響應(yīng)于所述具有第二時(shí)間分辨率的空間參數(shù)中的一個(gè)或多個(gè)控制在所述多信道輸出信號的至少一個(gè)信道中的所述至少一個(gè)相關(guān)信號與所述至少一個(gè)不相關(guān)信號的比例,其中所述控制至少部分地依照所述第一參數(shù)進(jìn)行。
2.根據(jù)權(quán)利要求1所述的方法,其中,步驟d)包括通過對于所述至少一個(gè)相關(guān)信號應(yīng)用人工混響濾波器得到所述至少一個(gè)不相關(guān)信號。
3.根據(jù)權(quán)利要求1所述的方法,其中,步驟d)包括通過對于多個(gè)相關(guān)信號應(yīng)用多個(gè)人工混響濾波器得到多個(gè)不相關(guān)信號。
4.根據(jù)權(quán)利要求3所述的方法,其中,所述多個(gè)人工混響濾波器中的每一個(gè)具有獨(dú)特的濾波器特性。
5.根據(jù)權(quán)利要求1所述的方法,其中,步驟d)中的所述控制包括至少部分地根據(jù)所述第一參數(shù),得到對于所述多個(gè)頻帶中的每一個(gè)的所述至少一個(gè)相關(guān)信號與所述至少一個(gè)不相關(guān)信號的單獨(dú)的比例。
6.根據(jù)權(quán)利要求1所述的方法,其中,通過包括對所述M個(gè)編碼音頻信道解矩陣化的處理,從所述M個(gè)編碼音頻信道得到所述N個(gè)音頻信號。
7.根據(jù)權(quán)利要求6所述的方法,其中,所述解矩陣化至少部分地響應(yīng)于所述具有第二時(shí)間分辨率的空間參數(shù)中的一個(gè)或多個(gè)進(jìn)行。
8.根據(jù)權(quán)利要求1-7中任一個(gè)所述的方法,所述方法進(jìn)一步包括響應(yīng)于所述具有第二時(shí)間分辨率的空間參數(shù)中的一個(gè)或多個(gè),變動(dòng)所述N個(gè)音頻信號中的至少一個(gè)中的頻譜分量的幅度。
9.根據(jù)權(quán)利要求1-8中任一個(gè)所述的方法,其中,所述多信道輸出信號是在時(shí)域中。
10.根據(jù)權(quán)利要求1-8中任一個(gè)所述的方法,其中,所述多信道輸出信號是在頻域中。
11.根據(jù)權(quán)利要求1-10中任一個(gè)所述的方法,其中,N為3或更大。
12.根據(jù)權(quán)利要求1-11中任一個(gè)所述的方法,其中,所述內(nèi)插為線性內(nèi)插。
13.包括用于執(zhí)行根據(jù)權(quán)利要求1-12中任一個(gè)所述方法的步驟中的每一個(gè)的部件的裝置。
14.一種介質(zhì),所述介質(zhì)承載指令程序,并且可由設(shè)備讀取以執(zhí)行所述指令程序以實(shí)行權(quán)利要求1-12中任一個(gè)所述的方法的所有步驟。
全文摘要
將多個(gè)音頻信道合并成單聲復(fù)合信號,或合并成多個(gè)音頻信道,連同用于重建多個(gè)音頻信道的相關(guān)輔助信息,包括改進(jìn)的下混合將多個(gè)音頻信道下混合到單聲音頻信號或下混合到多個(gè)音頻信道,和改進(jìn)的解相關(guān)將從單聲音頻信道或從多個(gè)音頻信道得到的多個(gè)音頻信道解相關(guān)。所公開的本發(fā)明的方面可用于音頻編碼器、解碼器、編碼/解碼系統(tǒng)、下混合器、上混合器和解相關(guān)器。
文檔編號H04S5/00GK102176311SQ20111010470
公開日2011年9月7日 申請日期2005年2月28日 優(yōu)先權(quán)日2004年3月1日
發(fā)明者馬克·F·戴維斯 申請人:杜比實(shí)驗(yàn)室特許公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會(huì)獲得點(diǎn)贊!
1
揭东县| 固阳县| 福贡县| 静乐县| 抚州市| 敦煌市| 大足县| 望谟县| 旺苍县| 长丰县| 灌南县| 沂南县| 双柏县| 宣恩县| 安远县| 赤水市| 宝坻区| 长沙县| 昌乐县| 浦北县| 密山市| 武穴市| 玉溪市| 浙江省| 永州市| 周宁县| 且末县| 沧州市| 卢龙县| 普格县| 偏关县| 安丘市| 巴南区| 宁化县| 宣武区| 济南市| 清涧县| 巫山县| 珲春市| 楚雄市| 和林格尔县|