專利名稱:對音頻動態(tài)特性處理有約束的分層控制路徑的制作方法
技術(shù)領域:
本發(fā)明涉及音頻信號處理器、音頻信號處理以及用于控制音頻信號處理器和音頻信號處理的軟件。根據(jù)本發(fā)明的多個方面,提供了一種用于動態(tài)特性處理的分層控制路徑,并且以分層方式強加對音頻信號動態(tài)特性處理的約束以提供改善的性能。
背景技術(shù):
音頻動態(tài)特性處理的目的是更改音頻信號的相對聲級或動態(tài)特性使之處于某些想要的界限內(nèi)。這一般是通過產(chǎn)生對音頻信號聲級的某種時變計量(例如均方根聲級或峰值聲級)、然后計算并施加作為聲級計量的函數(shù)的信號修正(例如增益改變)來實現(xiàn)的。在2006年5月4日公布為WO 2006/047600的Alan Jeffrey Seefeldt的國際專利申請PCT/US2005/038579中闡述了共享這樣的工作模式的動態(tài)特性處理器,這些動態(tài)特性處理器包括自動增益控制(AGC)、動態(tài)范圍控制(DRC)、擴展器、限制器、噪聲門等。Seefeldt的申請指定了美國及其它實體。通過引用將該申請整體合并于此。
圖1描繪了處理音頻信號(多通道音頻信號的單個通道或僅有一個通道的音頻信號)的一般性音頻動態(tài)特性處理器的高級框圖。可認為該處理器具有兩個路徑上“信號”路徑2和下“控制”路徑4。在下控制路徑上,音頻信號的聲級由計量裝置或過程(“聲級計量”)6計量,然后此測量結(jié)果(即,對信號聲級的計量)由動態(tài)特性控制裝置或過程(“動態(tài)特性控制”)8用來計算一個或多個信號修正參數(shù)。這樣的參數(shù)擔當信號修正控制信號并且被用來根據(jù)動態(tài)特性處理函數(shù)修正音頻信號,該函數(shù)可以是比如下文描述的圖3b中所示的想要的動態(tài)特性處理曲線。如圖所示,修正參數(shù)根據(jù)輸入音頻信號來導出??商孢x地,修正參數(shù)可根據(jù)經(jīng)處理的(輸出)音頻來導出或者根據(jù)輸入和輸出音頻信號的組合來導出。在音頻信號路徑2中,由動態(tài)特性控制8生成的修正參數(shù)被施加于音頻以控制對音頻的修正,從而生成經(jīng)處理的音頻。向音頻信號施加修正參數(shù)可以許多已知方式來實現(xiàn),并且由乘法器符號12一般性地示出。在音頻信號路徑2中,音頻可由延遲裝置或過程(“延遲”)10延遲以補償與聲級估計和動態(tài)特性控制過程關聯(lián)的任何延遲。
當處理復雜的多通道音頻資料時,在計算和施加信號修正時必須注意避免引入可感知的偽像(artifact)。接收多通道音頻信號輸入的基本動態(tài)特性處理器可計算表示組合后的所有通道總體的信號聲級,然后基于這樣的總體聲級計量向所有通道施加相同的修正。在以相同的方式修正所有通道時,這樣的方法具有維持所有通道之間的相對聲級、從而保護空間圖像(包括例如在通道之間被搖攝的虛擬圖像的位置以及感知的漫射)的優(yōu)點。這樣的方法在所施加的修正不太強的情況下可很好地工作。
然而,當想要的修正更強時可能出現(xiàn)問題??紤]被施加了具有很高壓縮比的動態(tài)范圍控制器的多通道音頻信號(例如5.1通道)。對于這樣的處理器,高于壓縮閾值的信號被顯著衰減以使信號聲級更接近閾值。假定音頻信號在所有通道中都包含相對恒定聲級的背景音樂,其中就該背景音樂而言在組合所有通道之后的總體聲級低于壓縮閾值。進一步假定簡短但響亮的一段對話被引入到中央通道中。由于該對話,組合后的所有通道的總體聲級現(xiàn)在超過壓縮閾值,因此整個信號被衰減。在對話結(jié)束后,信號聲級回落到壓縮閾值以下而無衰減被施加。結(jié)果,聽到來自左、右、左環(huán)繞和右環(huán)繞通道的背景音樂根據(jù)中央通道中的對話而聲級波動或上下來回“泵動(pump)”。該效應對于收聽者而言可能是很不自然的發(fā)聲和干擾。這種偽像作為一種交叉調(diào)制或互調(diào)制,在音頻動態(tài)特性處理領域中是眾所周知的,而一種典型的現(xiàn)有技術(shù)方案涉及到向每個通道獨立地施加動態(tài)范圍控制。雖然這樣的方案可糾正前述問題,但是它可能具有更改音頻的空間圖像的缺點。具體而言,在兩個通道之間被搖攝的虛擬源可能由于向兩個通道施加的不同衰減量而看來似乎在“游蕩”。因此,需要一種設法解決泵動和圖像不穩(wěn)定這兩個問題的方案。
當考慮單個音頻通道的譜時也存在類似問題??紤]包含中到高頻的持續(xù)弦音符的單個通道,其中就該弦音符而言信號聲級低于壓縮閾值?,F(xiàn)在考慮以低頻引入的很響亮的低音鼓擊打,其造成信號聲級頃刻增大到壓縮閾值以上。整個信號頃刻衰減,導致弦被感知為根據(jù)低音鼓而聲級不自然地上下泵動。這一問題的一種典型現(xiàn)有技術(shù)方案是將音頻信號分到多個頻帶中,然后向每個頻帶獨立地施加動態(tài)范圍控制。這減小了泵動問題,但是可能更改感知譜平衡或音色。因此,需要一種減小泵動同時減小感知譜平衡的變化的方案。
發(fā)明內(nèi)容
根據(jù)本發(fā)明的多個方面,根據(jù)在多個層級中的每個層級的一個或多個相應節(jié)點處工作的一個或多個裝置或過程來導出可用于修正音頻信號的動態(tài)特性的信息,每個層級具有一個或多個節(jié)點,其中在每個層級處工作的一個或多個裝置或過程進行對音頻信號的一個或多個特性的計量,以使得在每個依次更低層級處工作的一個或多個裝置或過程進行對音頻信號的逐漸更小細分的一個或多個特性的計量??捎糜谛拚纛l信號的動態(tài)特性的信息可以在與導出信息的裝置或過程關聯(lián)的裝置或過程中被施加于音頻信號,或者這樣的信息可作為例如元數(shù)據(jù)與音頻信號一起攜帶,以使得該信息可被施加于空間和/或時間上遠距離的音頻信號。音頻的逐漸更小細分可包括(1)通道細分和(2)頻帶細分二者之一或全部。如下文進一步說明的那樣,每個層級的每個節(jié)點處的所述一個或多個裝置或一個或多個過程在該節(jié)點的層級處進行對音頻的計量,并可根據(jù)對音頻信號的這樣的計量并且根據(jù)它可從另一層級處的一個或多個裝置或過程接收的信息來導出信息。
第一即最高層級可包括進行對音頻信號的總體的計量的根節(jié)點。在多通道音頻信號的情形下,至少一個更低層級可包括多個節(jié)點,每個節(jié)點進行對音頻信號的通道細分的計量,并且至少一個進一步更低層級可包括多個節(jié)點,每個節(jié)點進行對音頻信號的通道的頻率細分的計量。在單通道音頻信號的情形下,至少一個更低層級可包括多個節(jié)點,每個節(jié)點進行對音頻信號的頻率細分的計量。
根據(jù)本發(fā)明的另一些方面,根據(jù)在特定層級處對音頻信號的計量而導出的信息可以在該分層結(jié)構(gòu)中被下傳到一個或多個更低層級,以便影響在這樣的層級處工作的裝置或過程的工作。根據(jù)在特定層級處對音頻信息的計量而導出的信息可不僅包括可用于影響在一個或多個更低層級處工作的裝置和過程的工作的信息,而且包括可用于修正音頻信號的動態(tài)特性的信息。
根據(jù)本發(fā)明的又一些方面,根據(jù)在特定更低層級處對音頻信號的計量并且根據(jù)被傳到這樣的更低層級的信息而導出的信息可用來影響在這樣的更低層級處工作的裝置或過程的工作。這樣的影響可例如使得該更低層級生成對它本來將生成的信息的修正??商孢x地或附加地,根據(jù)在特定更低層級處對音頻信號的計量并且根據(jù)被傳到這樣的更低層級的信息而導出的信息可以在該分層結(jié)構(gòu)中被上傳到一個或多個更高層級,以便影響在這樣的更高層級處工作的裝置或過程的工作。這樣的影響可例如使得更高層級生成對它本來將傳到一個或多個更低層級的或者將被用于修正音頻信號的信息的修正。
圖2a描繪了根據(jù)本發(fā)明多個方面的分層控制路徑架構(gòu)的一個例子的示意性概觀,其中在從頂?shù)降椎目刂坡窂椒謱咏Y(jié)構(gòu)(“自頂向下”分層布置)中下傳信息。在自頂向下控制路徑分層結(jié)構(gòu)的此例子中,至動態(tài)特性處理器或過程的輸入信號是多頻帶音頻信號,且層級是(1)所有通道的所有頻帶(“總體”層級)、(2)多通道音頻信號內(nèi)的通道(“通道”層級)和(3)每個通道內(nèi)的頻帶(“頻帶”層級)。在該圖的右手側(cè)的頻帶層級處的相應動態(tài)特性控制裝置或過程的輸出可擔當信號修正控制信號,并且可被施加以便修正如下文描述的圖2b中所示那樣被處理的音頻信號的相應通道和頻帶中的音頻信號??商孢x地,這樣的控制信號可作為例如元數(shù)據(jù)與音頻信號一起攜帶,以使得該信息可例如以圖2b的方式在空間和/或時間上遠距離的地方被施加于音頻信號。如下文進一步說明的那樣,在該分層結(jié)構(gòu)中下傳的信息可不僅包括適用于對音頻信號的修正進行控制的修正參數(shù)(如果這些參數(shù)被施加于音頻信號)——在該分層結(jié)構(gòu)中下傳的信息可包括在動態(tài)特性控制裝置或過程內(nèi)可用于影響這樣的裝置或過程的工作的控制參數(shù)(這樣的控制參數(shù)可稱為“動態(tài)特性控制參數(shù)”,且這樣的參數(shù)可包括適用于直接或間接控制音頻信號的“修正參數(shù)”)。
向圖2a分層控制路徑施加的輸入信號可根據(jù)向圖2a控制路徑是其一部分的音頻動態(tài)特性處理器施加的音頻信號、或可替選地根據(jù)這樣的音頻動態(tài)特性處理器的經(jīng)處理的(輸出)音頻或根據(jù)這樣的輸入和輸出音頻信號的組合來導出。
在圖2a中,實線表示多通道音頻信號的音頻流向,該多通道音頻信號具有通道x1...xC,而每個通道具有一個或多個頻帶或“子頻帶”b1...bn。雖然在原理上可通過模擬、數(shù)字或混合模擬/數(shù)字實施例來實現(xiàn)本發(fā)明的多個方面,但是在實際實施例中可在數(shù)字域中進行音頻處理。每個動態(tài)特性控制裝置或過程的虛線輸出表示由相應動態(tài)特性控制裝置或過程生成的一個或多個動態(tài)特性控制參數(shù)。動態(tài)特性控制參數(shù)可耦合到控制路徑分層結(jié)構(gòu)的更低層級中的動態(tài)特性控制裝置或過程,以便強加約束。例如,如結(jié)合下述例子說明的那樣,長期信號聲級、長期增益和短期增益的值可從總體層級下傳到通道層級并且從通道層級下傳到頻帶層級以實施約束。在它們中,在這里所述例子中僅施加頻帶層級處的短期增益來控制音頻信號的動態(tài)特性(亦如一個所述例子中那樣,這樣的短期增益可被時間平滑)。
在原理上,在該分層結(jié)構(gòu)中下傳的信息可不施加于一個或多個層級。而且,在原理上,(除了來自頻帶層級的信息以外或代替來自頻帶層級的信息)可施加來自不同于頻帶層級的層級的信息來控制音頻信號的動態(tài)特性。這樣的信息可被時間平滑。
因此,在圖2a控制路徑例子中,具有通道x1...xC的多通道音頻信號被施加于第一分層控制路徑級即總體層級,其中裝置或過程(“總體聲級計量”)14針對組合后的所有音頻通道的總體計算平均信號聲級計量。總體聲級14的工作類似于圖1的聲級6的工作,不同之處在于總體聲級14對多通道音頻信號的所有通道而不是對多通道音頻信號或僅有一個通道的音頻信號進行工作。然后,由總體聲級14獲得的測量結(jié)果(即,對總體信號聲級的計量)可由動態(tài)特性控制裝置或過程(“動態(tài)特性控制”)16用來計算可包括一個或多個信號修正參數(shù)的一個或多個總體層級動態(tài)特性控制參數(shù)。由動態(tài)特性控制16計算出的動態(tài)特性控制參數(shù)中的一些或全部可被下傳到通道層級中的動態(tài)特性控制20以供這樣的動態(tài)特性控制在其工作中使用。由總體層級的動態(tài)特性控制16計算出的修正參數(shù)或其函數(shù)可被施加于音頻信號,但是在此例子中并非如此。
接著,在第二分層控制路徑級即通道層級(在此例子中為下一更低層級)中,每個通道x1至xc被分別施加于它自己的由聲級計量裝置或過程18-1至18-c和動態(tài)特性控制裝置或過程20-1至20-c構(gòu)成的對。每個聲級計量18-1至18-c可以與圖1的聲級計量6的方式相似的方式工作,以針對向它施加的特定音頻通道計算平均信號聲級計量。根據(jù)該聲級計量,聲級/動態(tài)特性控制對中的每個動態(tài)特性控制20-1至20-c計算可包括一個或多個信號修正參數(shù)的一個或多個動態(tài)特性控制參數(shù)。然而,圖2a布置中的動態(tài)特性控制20-1至20-c與圖1動態(tài)特性控制8的不同之處除了在于產(chǎn)生動態(tài)特性控制參數(shù)而不是修正參數(shù)以外,還在于接收由上一層級中的動態(tài)特性控制16計算出的一個或多個動態(tài)特性控制參數(shù)。這樣的更高層級動態(tài)特性控制參數(shù)可用來約束或影響相應動態(tài)特性控制20-1至20-c的工作。由動態(tài)特性控制20計算出的動態(tài)特性控制參數(shù)中的一些或全部可被下傳到頻帶層級中的動態(tài)特性控制26以供這樣的動態(tài)特性控制在其工作中使用。由一個或多個動態(tài)特性控制20計算出的修正參數(shù)或其函數(shù)可被施加于音頻信號,但是在此例子中并非如此。
接著,在第三分層控制路徑級即頻帶層級中,音頻信號的每個通道x1至xc被施加于將每個音頻通道分裂成多個頻帶b1至bn的頻帶分裂裝置或功能(“頻帶分裂”)22-1至22-c。用于將音頻信號分裂到多個頻帶中的許多裝置和過程在本領域中眾所周知(濾波器組、帶通濾波器、正交鏡濾波器、時間-頻率變換等)。使用任何具體的這樣的頻帶分裂器對于本發(fā)明而言并非關鍵。每個通道的每個頻帶被分別施加于它自己的由聲級計量裝置或過程24-1-1至24-c-n和動態(tài)特性控制裝置或過程26-1-1至26-c-n構(gòu)成的對。每個聲級計量24-1-1至24-c-n可以與圖1的聲級計量6的方式相似的方式工作,以針對向它施加的音頻通道的特定頻帶計算平均信號聲級計量——因此,它在頻帶層級而不是通道層級處工作。每個動態(tài)特性控制26-1-1至26-c-n根據(jù)由與之成對的聲級計量提供的信號聲級計量、以與圖1的動態(tài)特性控制8的方式相似的方式計算信號修正參數(shù)。然而,不同于圖1動態(tài)特性控制8,圖2a例子中的動態(tài)特性控制26-1-1至26-c-n亦可接收由與上一層級中同一通道關聯(lián)的動態(tài)特性控制20計算出的一個或多個動態(tài)特性控制參數(shù)。這樣的更高層級修正參數(shù)可用來約束或影響對一個通道內(nèi)多個頻帶進行工作的相應動態(tài)特性控制26-1-1至26-c-n的工作。由每個動態(tài)特性控制26-1-1至26-c-n計算出的一個或多個修正參數(shù)可如圖2b中所示那樣被施加于音頻的每個通道的多個頻帶。在頻帶層級處,由于它在此例子中為底層級,所以動態(tài)特性控制26無需提供動態(tài)特性控制參數(shù)輸出(一個都不需要)而代之以提供如圖2b中所示那樣可用來控制對音頻信號的修正的一個或多個修正參數(shù)的輸出。
參照圖2b,以與圖1的上信號路徑的方式相似的方式,每個音頻通道的特定頻帶(音頻通道1頻帶1至音頻通道c頻帶n)被施加于具有相應延遲10-1-1至10-c-n和相應乘法器12-1-1至12-c-n的相應信號路徑。如圖1中那樣,乘法器由乘法器符號一般性地示出以表明響應于一個或多個修正參數(shù)而修正音頻的任何適當方式。每個乘法器從對應的動態(tài)特性控制26-1-1至26-c-n接收一個或多個修正參數(shù)(即,通道1頻帶1音頻由來自用于通道1頻帶1的動態(tài)特性控制的修正參數(shù)來修正,等等)??商孢x地,由其它層級產(chǎn)生的修正參數(shù)或它們的函數(shù)可被施加于音頻信號、其通道中的一個或多個和/或一個或多個其通道的一個或多個頻帶。
雖然圖2a和2b的例子示出了總體層級、通道層級和頻帶層級這三級分層結(jié)構(gòu),但是本發(fā)明的多個方面不限于三級分層結(jié)構(gòu)并且該分層結(jié)構(gòu)可具有不同的順序。例如,可能不希望進行多頻帶修正,在該情形下僅有總體層級和通道層級的二級分層結(jié)構(gòu)可能是合適的。類似地,可能不想允許通道之間的任何獨立性,因此可利用僅有總體層級和頻帶層級的二級分層結(jié)構(gòu)。換言之,可能不想向不同的通道施加不同的修正參數(shù)——可不同地對待各頻帶,但是可以對所有通道相同的方式修正每個頻帶。如上所述,每個層級可包括一個或多個裝置或過程。可擴展圖2a和圖6的三層結(jié)構(gòu)例子以包括更多層級。例如,并非在一個級將信號分裂到多個頻帶中,可以在第一頻帶級處將信號分裂到兩個頻帶中。然后,可以在第二頻帶級處將這些頻帶中的每個頻帶進一步分裂成又兩個頻帶,等等。類似地,通道分裂可發(fā)生在一個以上的層級中。例如,在總體層級之后,可以在第一通道層級中將多個通道分裂成三組(1)左和右,(2)中央以及(3)左環(huán)繞和右環(huán)繞。然后,在下一通道層級處,左和右這一組可明確地分成左和右。類似地,左環(huán)繞和右環(huán)繞這一組可明確地分成左環(huán)繞和右環(huán)繞。
具有呈圖2a和2b例子的形式的約束及其變形的控制路徑分層結(jié)構(gòu)適用于許多種動態(tài)特性處理應用比如壓縮器、限制器、擴展器等。然而,為了便于說明,在其中音頻信號的原始動態(tài)范圍得以減小的動態(tài)范圍控制(DRC)的背景下描述本發(fā)明多個方面的例子。換言之,使音頻的響亮部分更柔和并且/或者使安靜部分更響亮。這樣的處理例如在希望以減小的平均音量在深夜收聽音頻選段時是有用的。
圖3a描繪了對于DRC而言的典型輸入/輸出曲線或傳遞函數(shù),其中水平軸是輸入信號聲級的對數(shù)表示,而豎直軸是想要的輸出信號聲級的對數(shù)表示。信號聲級一般性地表示多個可能計量中的任何計量;例如將在一個優(yōu)選實施例中描述的均方根聲級或心理聲學響度級。在該曲線或傳遞函數(shù)的“零頻帶”區(qū)中,曲線斜率為1,這表明未進行信號修正。在零頻帶以上和以下,斜率小于1,這表明施加了壓縮——在零頻帶以上音頻衰減而在零頻帶以下音頻增強。圖3b描繪了圖3a輸入/輸出曲線或傳遞函數(shù)的等效表示,其用當被施加于輸入信號聲級時產(chǎn)生想要的輸出信號聲級的增益的對數(shù)取代豎直軸上的輸出信號聲級。在此背景下,術(shù)語“增益”意圖一般性地表示對信號進行增強或衰減的修正。這樣的“增益”可以是與信號直接相乘的值,或者它可更加復雜,比如將在一個優(yōu)選實施例中描述的感知響度的縮放。由于約束被施加于這樣的增益,所以正是動態(tài)特性曲線或傳遞函數(shù)的此可替選表示(即,圖3b表示)被用于此例子的其余部分。
取平均約束 通常,音頻動態(tài)特性處理器中的輸入信號聲級L是使用相對短的時間常數(shù)對信號聲級的時變計量——例如幾毫秒持續(xù)時間內(nèi)積分得到的均方根信號聲級。出于強加約束的目的,亦可計算對應的長期或平均信號聲級L。L可以是與L相同的、但具有顯著更長的時間常數(shù)(例如1秒或多秒的量級)的基本計量(例如均方根、峰值等)。
雖然L和L的時間常數(shù)并非關鍵,但是應理解,L的時間常數(shù)長于L的時間常數(shù)。在動態(tài)范圍控制(DRC)的情形下,短期時間常數(shù)可與人類響度感知時間分辨率(人可感知響度變化所需的最短時間間隔)相當,而長期時間常數(shù)可與足以使人將“短期”響度整合為聲源響度的心理聲學印象的時間相當。
在三級控制路徑分層結(jié)構(gòu)比如圖2a的例子中,可針對組合后的所有音頻通道的總體、針對每個單獨通道以及針對每個通道中的多個頻帶中的每個頻帶在相應動態(tài)特性控制16、20和26中計算短期和平均(長期)信號聲級計量。這樣的信號聲級計量可分別稱為LT和LT、LC和LC以及LB和LB,并且可表示例如圖3a和3b中所示的對數(shù)值。
對于三層控制路徑布置比如圖2a的例子,可通過為總體層級指定想要的動態(tài)特性處理曲線比如圖3b中所示的動態(tài)特性處理曲線來開始施加約束。這樣的曲線可一般性地表示為總體層級處的使增益G與信號聲級L相關的函數(shù)FT{L}。因此 G=FT{L} (1a) 每個信號聲級計量L盡管是計量的(例如均方根、峰值等)但可視為與根據(jù)關聯(lián)的動態(tài)特性處理函數(shù)FT計算出的理論增益G相關聯(lián)。因此,可根據(jù)LT和LT依據(jù)下式計算增益GT和GT GT=FT{LT}(1b) GT=FT{LT}(1c) 接著,針對通道控制路徑層級處的每個通道,可根據(jù)被約束成使得GC=GT(其中GC和GC分別是與LC和LC關聯(lián)的理論增益)的FT來導出通道層級處的使增益G與信號聲級L相關的動態(tài)特性處理函數(shù)FC{L}。導出具有想要的約束的動態(tài)特性函數(shù)FC{L}可通過將FT的輸入自變量平移平均信號聲級LT與LC之間的差(如果取決于信號狀況而存在的話)來實現(xiàn)(見圖4b) FC{L}=FT{(LT-LC)+L} (2a) 取決于信號狀況,效果可以是函數(shù)FT在增益/聲級軸上的平移,這保護了想要的動態(tài)特性處理曲線的形狀但是將所有閾值水平移動了量LC-LT,以使得平均通道信號聲級LC和與通道函數(shù)FC關聯(lián)的各種閾值之間的關系與總體信號聲級LT和與總體函數(shù)FT關聯(lián)的閾值之間的關系相同。在下文進一步描述的圖4a-c中示出了這樣的平移。等式2a表明了限定FT和LT的信息從總體層級被傳到通道層級。
根據(jù)導出的通道動態(tài)特性處理函數(shù)FC,增益GC和GC可計算為 GC=FC{LC} (2b) GC=FC{LC} (2c) 根據(jù)前面的等式可知 GC=FC{LC}=FT{(LT-LC)+LC}=FT{LT}=GT(2d) 在根據(jù)總體動態(tài)特性函數(shù)FT來構(gòu)造通道動態(tài)特性函數(shù)FC以使得GC=GT時,GC的時間平均值等于GT的時間平均值。換言之,對通道的修正平均而言等于對信號總體的想要的修正。然而,以短期為衡量標準,LT和LC保持相對恒定,且GC充當通道信號聲級LC的函數(shù)以減小或防止交叉通道泵動。
作為一個例子,再次考慮在所有通道中都有音樂、然后在中央通道中引入一段簡短而響亮的對話的多通道音頻信號。在引入對話之前,平均總體信號聲級LT與短期總體信號聲級LT一起處于動態(tài)特性函數(shù)FT的零頻帶中。結(jié)果,該函數(shù)無需修正。這對于所有通道中的信號聲級LC和LC與FC之間的關系同樣成立。當引入對話時,中央通道中的短期信號聲級LC顯著增大到FC的壓縮閾值以上,導致衰減。然而,其余通道中的信號聲級的行為保持相同,而無衰減被施加。因此,以空間圖像被頃刻更改為代價減小或防止了交叉通道泵動。然而,如果該響亮的對話然后繼續(xù),則平均總體信號聲級LT緩慢地增大到壓縮閾值以上。這又導致由于用于構(gòu)造通道函數(shù)FC的約束而使所有通道被施加緩慢增大的衰減。這繼續(xù)下去,直到施加于所有通道的平均衰減達到施加于中央通道中的連續(xù)對話的平均衰減的衰減水平為止。因此,根據(jù)本發(fā)明多個方面的分層約束布置可提供減小或防止交叉通道泵動與保護空間圖像之間的平衡。
相同的原理適用于一個通道內(nèi)的各個頻帶。正如通道函數(shù)可根據(jù)總體函數(shù)來構(gòu)造那樣,特定頻帶的動態(tài)特性處理函數(shù)FB可根據(jù)該特定頻帶是其一部分的通道的函數(shù)來構(gòu)造??赏ㄟ^將FC的輸入自變量平移平均信號聲級LC與LB之間的差(如果取決于信號狀況而存在的話)來導出函數(shù)FB FB{L}=FC{(LC-LB)+L}(3a) 等式3a表明了限定FC和LC的信息從通道層級被傳到通道層級。
根據(jù)下式計算頻帶增益 GB=FB{LB} (3b) GB=FB{LB} (3c) 此構(gòu)造約束了GB=GC,其在下面示出 GB=FB{LB}=FC{(LC-LB)+LB}=FC{LC}=GC(3d) 由于GB=GC,所以頻帶增益GB的時間平均值約等于GC的時間平均值,但是,以短期為衡量標準,增益GB作為頻帶信號聲級LB的函數(shù)而變化以減小或防止交叉譜泵動。圖4a-c描繪了將FC構(gòu)造為FT的平移版本而將FB構(gòu)造為FC的平移版本以使得GB=GC=GB的上述過程。在圖4b中示出了總體層級到通道層級的平移。在圖4c中示出了通道層級到頻帶層級的平移。可將圖4a-c一起觀察以查看想要的動態(tài)特性處理曲線如何在該分層結(jié)構(gòu)中從總體級下傳到通道級再下傳到頻帶級。
范圍約束 理想地,用于根據(jù)FC構(gòu)造FB和根據(jù)FT構(gòu)造FC的約束確保了向通道中的每個頻帶施加的平均修正與針對整個通道的平均修正基本上相同,并且向每個通道施加的平均修正與針對組合后的所有通道的平均修正基本上相同。由于這樣的約束不對各修正圍繞其平均值的范圍施加限制,所以特定情形可能是有問題的。再次考慮在所有通道中都有音樂、然后在中央通道中引入一段簡短而響亮的對話的多通道音頻信號。當引入對話時,總體信號聲級LT增大到比平均總體信號聲級LT高某個量,而動態(tài)特性函數(shù)FT需要信號的整體衰減。在中央通道中,信號聲級LC也增大到平均信號聲級LC以上,但LC相對于LC的增大比LT相對于LT的增大大得多,因為LT具有來自包含音樂的所有其它通道的貢獻。結(jié)果,由FC計算出的衰減顯著大于由FT計算出的想要的整體衰減。為了減小這樣的問題,因此希望除了對修正的平均行為施加約束以外還對修正的范圍施加約束。
這樣的范圍約束可以多種方式來實施,但是一種簡單而有效的技術(shù)涉及到將通道增益GC約束為處在總體短期增益GT與總體平均增益GT之間,然后將頻帶增益GB進一步約束為處在通道短期增益GC與通道平均增益GC之間。因此,當亦采用范圍約束時,從總體層級傳到通道層級的信息不僅包括限定FT和LT的信息而且包括限定GT和GT的信息,且從通道層級傳到頻帶層級的信息不僅包括限定FC和LC的信息而且包括限定GC和GC的信息。令G′C和G′B表示這些范圍受約束的通道和頻帶增益,可根據(jù)以下邏輯在形式上寫出這些約束 I)總體到通道的約束 A)如果GT<=GT,則 i)如果GC<GT,則G′C=GT ii)否則如果G′C>GT,則G′C=GT iii)否則G′C=GC B)否則,如果GT>GT,則 i)如果GC>GT,則G′C=GT ii)否則如果GC<GT,則G′C=GT iii)否則G′C=GC II)通道到頻帶的約束 A)如果G′C<=GC,則 i)如果GB<G′C,則G′B=G′C ii)否則如果GB>GC,則G′B=GC iii)否則G′B=GB。
B)否則如果G′C>GC,則 i)如果GB>G′C,則G′B=G′C ii)否則如果GB<GC,則G′B=GC iii)否則G′B=GB 圖5a和5b描繪了從總體傳到通道再傳到頻帶的范圍約束的兩個例子。在每種情形下,來自當前層級的約束區(qū)被下傳到下一級。在最高一行中,注意到在通道層級處強加來自上述邏輯的約束I.A.i。然后,在頻帶層級處,強加約束II.A.ii。在最低一行中,在通道層級處強加約束I.A.iii,而在頻帶層級處強加約束II.A.i。
自底向上約束 在上述例子中,以從較高層級傳到較低層級(在圖2a和2b例子中為總體到通道再到頻帶)的“自頂向下”方式強加了約束。實施本發(fā)明的又一方面也可能是有益的,在該方面中,“自底向上”次約束與自頂向下主約束一起實施。
根據(jù)本發(fā)明的另一方面,圖6描繪了在圖2a的例子的背景下的、除了圖2a的自頂向下分層約束以外還有分層“自底向上”約束被施加的總體概觀。在施加圖2a例子中的自頂向下約束的過程中,每個動態(tài)特性控制產(chǎn)生由圖6中的單虛線表示的一個或多個受約束參數(shù)。
如對于圖2a例子那樣,向圖6分層控制路徑施加的輸入信號可根據(jù)向圖6控制路徑是其一部分的音頻動態(tài)特性處理器施加的音頻信號、或可替選地根據(jù)這樣的音頻動態(tài)特性處理器的經(jīng)處理的(輸出)音頻或根據(jù)這樣的輸入和輸出音頻信號的組合來導出。
為了開始施加自底向上約束這一過程,可首先遍及所有通道中的所有頻帶在分析裝置或過程(“分析”)27中分析自頂向下參數(shù),以生成可回傳到頻帶級處的所有動態(tài)特性控制并且任選地在該分層結(jié)構(gòu)中上傳到所有通道的一個或多個次頻帶分層約束。如下文進一步說明的那樣,分析27可例如計算它的所有輸入的平均值或最小值。在圖6中,將這樣的一個或多個次頻帶約束示出為來自頻帶層級處的分析27的雙虛線輸出。這樣的一個或多個次頻帶約束被施加于頻帶層級中的每個動態(tài)特性控制26’-1-1至26’-c-n并且由動態(tài)特性控制26’-1-1至26’-c-n用來進一步約束圖2a的自頂向下動態(tài)特性控制參數(shù)。這樣的受雙重約束(即,向下約束和向上約束)的一個或多個動態(tài)特性控制參數(shù)由每個頻帶動態(tài)特性控制26’-1-1至26’-c-n的輸出處的雙虛線表示。換言之,以雙虛線示出的由每個動態(tài)特性控制26’-1-1至26’-c-n產(chǎn)生的受雙重約束的動態(tài)特性控制參數(shù)是由圖2a的動態(tài)特性控制26-1-1至26產(chǎn)生的受自頂向下約束的修正參數(shù)(其由來自分析27的輸出的一個或多個自底向上次約束來進一步約束)的結(jié)果。
任選地,來自分析27的輸出的次約束亦在該分層結(jié)構(gòu)中上傳到通道層級。在該情形下,在通道層級處,由單虛線表示的所有通道的受自頂向下約束的動態(tài)特性控制參數(shù)與從分析27接收到的一個或多個次頻帶約束一起由分析器裝置或功能(“分析”)21分析以生成由通道層級處的分析21的雙虛線輸出表示的受雙重約束的修正參數(shù)。這樣的次通道層級約束由通道層級中的每個動態(tài)特性控制20-1至20-c用來產(chǎn)生由通道層級處的每個動態(tài)特性控制20’的輸出處的雙虛線表示的一個或多個受雙重約束的動態(tài)特性控制參數(shù)。
任選地,來自分析21的輸出的次約束亦在該分層結(jié)構(gòu)中上傳到總體層級。在該情形下,用于總體層級的受自頂向下約束的動態(tài)特性參數(shù)與次通道約束一起由分析裝置或過程(“分析”)17分析以生成次總體約束,該次總體約束又用來產(chǎn)生總體層級處的一個或多個受雙重約束的動態(tài)特性控制參數(shù)。
在施加這樣的自底向上的次約束之后,一些動態(tài)特性控制的輸出處的受雙重約束的修正參數(shù)可用來修正音頻。例如,頻帶層級處的動態(tài)特性控制26’-1-1至26”-c-n的輸出處的參數(shù)可用來修正音頻信號的每個通道內(nèi)的各個頻帶??商孢x地,通道層級處的參數(shù)可用來遍及各頻帶均勻地修正每個通道,總體層級處的參數(shù)可用來均勻地修正所有通道,或者各層級處的參數(shù)或其函數(shù)的某個組合可用來修正音頻信號。
這樣的自底向上的次約束在動態(tài)特性處理系統(tǒng)處于“釋放”模式下(這意味著短期總體信號聲級LT小于平均總體信號聲級LT)時特別有用。為了理解對這樣的約束的需要,再次考慮在所有通道中都有音樂并且在中央通道中有對話的多通道音頻信號。假定該響亮的對話已在中央通道中在相當長的時間段內(nèi)保持恒定。因此,自頂向下約束已收斂至穩(wěn)態(tài)行為,導致所有通道接收近似相同量的衰減。現(xiàn)在假定對話驟然停止,在所有通道中僅留下較低聲級的音樂信號。總體信號聲級LT立即下降到平均總體信號聲級LT以下,進入動態(tài)特性函數(shù)FT的零頻帶中,這意味著與先前的衰減相比,GT無需修正。這對于其中已存在對話的中央通道中的G′C同樣成立。然而,在其余通道中,LC相對于LC的行為維持如初,這意味著先前的衰減繼續(xù)。因此,現(xiàn)在,中央通道相對于其余通道被增強,從而使音樂的空間圖像失真。此失真繼續(xù),直到平均總體信號聲級LT減小到音樂的平均聲級從而處于零頻帶中為止,這時自頂向下約束不導致施加于其余通道的修正。因此,音樂的空間圖像隨著LT緩慢減小而在相當長的時間段內(nèi)失真。
為了設法解決這一問題,可以在LT<LT時施加自底向上的次約束。對于剛才描述的特定問題,可以分析所有通道的G′C值并將這些值與GT一起約束為全部等于所有通道的G′C值中的最小值。這防止了任一通道比任何其它通道增強更多。相同原理可向下擴展至頻帶。如果LT<LT,則所有頻帶和通道的G′B值可被約束為等于該組值中的最小值。然后,該最小值被回上傳到通道,在通道中,所有通道的G′C被設置為等于包括所有通道的G′C以及來自頻帶約束的最小值這二者的組中的最小值。最后,該通道最小值可被回上傳到總體,在總體中,GT被設置為等于GT和先前的通道最小值這二者中的最小值。
時間平滑 施加上述分層約束(自頂向下和自底向上這二者)可能在增益隨時間的軌跡中引入突然的不連續(xù)。這樣的不連續(xù)如果不修正則可能造成經(jīng)處理的音頻中的可感知的偽像。因此,在本發(fā)明的一個實際實施例中,希望在使用受約束的增益修正音頻之前隨時間平滑受約束的增益。這樣的平滑可以各種方式進行,下面在優(yōu)選實施例的描述中將討論一種這樣的方法。
圖1是對多通道音頻信號的單個通道或僅有一個通道的音頻信號進行處理的一般性現(xiàn)有技術(shù)音頻動態(tài)特性處理器的高級框圖。
圖2a是根據(jù)本發(fā)明多個方面的分層控制路徑架構(gòu)的一個例子的示意性概觀,其中在從頂?shù)降椎目刂坡窂椒謱咏Y(jié)構(gòu)(“自頂向下”分層布置)中下傳信息。
圖2b是音頻路徑的一個例子的示意性概觀,其中可根據(jù)在控制路徑(比如圖2a的控制路徑和/或圖2a和圖6的控制路徑)中導出的信息來修正音頻信號。
圖3a是對于動態(tài)范圍控制(DRC)而言的示范輸入/輸出曲線或傳遞函數(shù),其中水平軸是輸入信號聲級的對數(shù)表示,而豎直軸是想要的輸出信號聲級的對數(shù)表示。
圖3b是圖3a輸入/輸出曲線或傳遞函數(shù)的等效表示,其用當被施加于輸入信號聲級時產(chǎn)生想要的輸出信號聲級的增益的對數(shù)取代豎直軸上的輸出信號聲級。
圖4a-c是可用于理解本發(fā)明多個方面的、示出了呈圖3b的形式的輸入/輸出曲線或傳遞函數(shù)的例子,其中考慮到特定取平均約束而在較低層級處重新構(gòu)造初始曲線在初始較高層級處的版本。
圖5a和5b是可用于理解本發(fā)明多個方面的、示出了呈圖3b的形式的輸入/輸出曲線或傳遞函數(shù)的例子,其中考慮到特定范圍約束而在較低層級處重新構(gòu)造初始曲線在初始較高層級處的版本。
圖6是根據(jù)本發(fā)明多個方面的分層控制路徑架構(gòu)的一個例子的示意性概觀,其中除了圖2a例子的自頂向下分層信息以外還有信息在從底到頂?shù)目刂坡窂椒謱咏Y(jié)構(gòu)(“自底向上”分層布置)中上傳。
圖7描繪了一組適當?shù)呐R界頻帶濾波器響應,其中40個頻帶沿著如Moore和Glasberg所定義的等效矩形帶寬(ERB)標度均勻地間隔開。
圖8是一組等響度線。
具體實施例方式 被公布為WO 2006/047600的Alan Jeffrey Seefeldt的所述國際專利申請PCT/US 2005/038579尤其公開了通過使用響度感知的心理聲學模型來計量和修正音頻信號的感知響度和/或感知譜平衡的布置。該公開內(nèi)容討論了使用這樣的布置來進行音頻動態(tài)特性處理,其中引證了在感知響度域中執(zhí)行這種處理的若干優(yōu)點。然而,可通過本發(fā)明多個方面進一步改進Seefeldt布置。因此,下面在心理聲學響度模型的背景下描述本發(fā)明的一個優(yōu)選實施例。
作為第一步,通過以下步驟計算多通道數(shù)字音頻信號xc[n],c=1...C的特定響度,即,對隨頻率和時間分布的感知響度的計量。首先,計算用于每個通道的激勵信號Ec[b,t],其近似于在臨界頻帶b、在時間塊t內(nèi)沿著內(nèi)耳基膜的能量分布。此激勵可根據(jù)音頻信號的短時間離散傅立葉變換(STDFT)計算如下 其中Xc[k,t]表示xc[n]在時間塊t和元k處的STDFT。T[k]表示對音頻通過外耳和中耳的傳輸進行模擬的濾波器的頻率響應,而Cb[k]表示基膜在與臨界頻帶b對應的位置處的頻率響應。圖7描繪了一組適當?shù)呐R界頻帶濾波器響應,其中40個頻帶沿著如Moore和Glasberg所定義的等效矩形帶寬(ERB)標度均勻地間隔開(B.C.J.Moore、B.Glasberg、T.Baer的“Amodel for the Prediction of Thresholds,Loudness,and Partial Loudness”,Journal of the Audio Engineering Society,1997年4月第45卷第4號第224-240頁)。每個濾波器形狀由舍入(rounded)指數(shù)函數(shù)來描述,且各頻帶使用1ERB的間距來分布。等式4中的平滑時間常數(shù)λb可有利地選擇為與頻帶b內(nèi)人類響度感知的積分時間成比例。
除了每一通道激勵以外,還通過對各通道的通道激勵求和來計算表示總體音頻信號的激勵 接著,使用等響度線(比如圖8中所示的等響度線)將每個頻帶處的總體和通道激勵變換成將在1kHz處生成相同響度的激勵聲級。最后,通過壓縮式非線性、根據(jù)這些經(jīng)變換的激勵E′c[b,t]和E′T[b,t]來計算總體和通道特定響度譜。一般性地參考根據(jù)經(jīng)變換的激勵E將特定響度N計算為N=Φ{E}的函數(shù),一個這樣的適當函數(shù)由下式給出 其中TQ1kHz是1kHz處的靜音閾值,常數(shù)β和α被選擇為與公布的響度數(shù)據(jù)增長匹配。使用此函數(shù),根據(jù)下式來計算總體和通道特定響度譜 NT[b,t]=Ψ{E′T[b,t]} (7a) Nc[b,t]=Ψ{E′c[b,t]} (7b) 然后,通過對各頻帶b的總體和通道特定響度譜求和來計算總體響度和通道響度值 出于強加動態(tài)特性處理約束的目的,通過使用大的平滑時間常數(shù)λ平滑上述特定響度譜和響度值來計算平均特定響度譜和平均響度值 NT[t]=λNT[t-1]+(1-λ)NT[t] (9a) Nc[t]=λNc[t-1]+(1-λ)Nc[t] (9b) Nc[b,t]=λNc[b,t-1]+(1-λ)Nc[b,t](9c) 最后,根據(jù)響度值和特定響度譜將在本發(fā)明的概括描述中使用的通項LT,LT,LC,LC,LB,LB所對應的值計算為 LT→LT[t]=log(NT[t]) (10a) LT→LT[t]=log(NT[t]) (10b) LC→Lc[t]=log(Nc[t]) (10c) LC→Lc[t]=log(Nc[t]) (10d) LB→Lc[b,t]=log(Nc[b,t])(10e) LB→Lc[b,t]=log(Nc[b,t])(10f) 從想要的總體動態(tài)特性函數(shù)FT(其將對數(shù)感知響度作為其輸入并且輸出想要的感知響度縮放的對數(shù))開始,施加在本發(fā)明的概括描述中詳述的自頂向下和自底向上約束,以生成分別由G′T[t],G′c[t]和G′c[b,t]表示的受約束的總體、通道和頻帶對數(shù)響度縮放值。
受約束的頻帶對數(shù)響度縮放G′c[b,t]用來修正音頻信號。然而,這一量必須首先在時間上被平滑以去除通過施加約束引入的任何時間上的不連續(xù)。該平滑可有利地采用快和慢時間常數(shù),其中決定使用哪種時間常數(shù)是基于Lc[b,t]和G′c[b,t]的同時平滑的。如果Lc[b,t]相對于其平滑版本在增大而G′c[b,t]相對于其平滑版本在減小,則使用快時間常數(shù)。否則,使用慢時間常數(shù)。更具體而言,將Lc[b,t]和G′c[b,t]的時間平滑版本計算為 其中
作為經(jīng)修正信號的計算的下一步,通過將原始特定響度與經(jīng)平滑的頻帶縮放
相乘來計算每個通道中的想要的經(jīng)修正的特定響度譜 令函數(shù)Ψ{·}表示從激勵到特定響度的變換,針對每個通道計算頻帶變化的增益gc[b,m],使得 重新整理(13a),得到以下解 在被公布為WO 2006/047600的Alan Jeffrey Seefeldt的所述國際專利申請PCT/US 2005/038579中描述了用于計算(13b)中的反函數(shù)Ψ-1的若干技術(shù),包括閉式表達、查找表和迭代搜索。
最后,在每個臨界頻帶中將頻帶變化的增益gc[b,m]施加于原始STDFT的對應元以生成經(jīng)修正的STDFT 對經(jīng)修正的STDFT進行逆變換并重疊相加以產(chǎn)生最終的經(jīng)修正的多通道數(shù)字音頻信號
在通過引用整體合并于此的Fielder等人的美國專利5,899,969(“Frame-based audio with gain-control words”)中闡述了采用重疊樣本塊的數(shù)字音頻處理布置的更多細節(jié)。
雖然在這里將各種分層約束(例如GB=GC=GB)表達為等式,但是這樣的等式是理想化的例子。本發(fā)明構(gòu)想強加這樣的約束其趨向于使這樣的值與沒有這樣的約束強加時的情況相比更接近于相等。類似地,雖然動態(tài)特性處理曲線從一個層級到另一層級的傳遞被圖示(例如圖3b)為相同曲線形狀的傳遞,但是這樣的形狀相同性是理想化的例子。本發(fā)明構(gòu)想動態(tài)特性處理曲線從一個層級到另一層級的這樣的傳遞其中被傳遞的曲線是一個或多個更高級曲線的近似,接近程度是動態(tài)特性處理裝置或過程的創(chuàng)建者的實施選擇。
實現(xiàn) 本發(fā)明可用硬件或軟件或二者的組合(例如可程序邏輯陣列)來實現(xiàn)。除非另有規(guī)定,作為本發(fā)明的一部分被包括在內(nèi)的算法并非與任何具體計算機或其它裝置固有地相關。具體而言,各種通用機器可與根據(jù)此處教導編寫的程序一起使用,或者,構(gòu)造更專門的裝置(例如集成電路)來執(zhí)行所需的方法步驟可能是更方便的。因此,本發(fā)明可用在一個或多個可編程計算機系統(tǒng)上執(zhí)行的一個或多個計算機程序來實現(xiàn),其中每個可編程計算機系統(tǒng)包括至少一個處理器、至少一個數(shù)據(jù)存儲系統(tǒng)(包括易失性和非易失性存儲器和/或存儲單元)、至少一個輸入設備或端口以及至少一個輸出設備或端口。程序代碼被施加于輸入數(shù)據(jù)以執(zhí)行此處描述的功能并生成輸出信息。該輸出信息以已知的方式被施加于一個或多個輸出設備。
每個這樣的程序可用任何期望計算機語言(包括機器、匯編、或高級程序的、邏輯的或面向?qū)ο蟮木幊陶Z言)來實現(xiàn),以與計算機系統(tǒng)通信。在任何情形下,該語言可以是編譯或解釋語言。
每個這樣的計算機程序優(yōu)選地被存儲在或被下載到可由通用或?qū)S每删幊逃嬎銠C讀取的存儲介質(zhì)或設備(例如固態(tài)存儲器或介質(zhì)、或者磁或光介質(zhì)),用于當存儲介質(zhì)或設備被計算機系統(tǒng)讀取時配置和操作計算機以執(zhí)行此處描述的過程。本發(fā)明的系統(tǒng)亦可被看作實施為配置有計算機程序的計算機可讀取存儲介質(zhì),其中如此配置的存儲介質(zhì)使得計算機系統(tǒng)以特定且預定的方式工作以執(zhí)行此處描述的功能。
已描述了本發(fā)明的若干實施例。然而,應理解,可在不背離本發(fā)明的精神和范圍的情況下作出各種修改。例如,此處描述的步驟中的一些步驟可無順序之分,并因此可按不同于所述順序的順序來執(zhí)行。
權(quán)利要求
1.一種用于音頻動態(tài)特性處理的方法,包括
響應于根據(jù)在多個層級中的每個層級的節(jié)點處工作的一個或多個裝置或過程導出的信息而修正音頻信號的動態(tài)特性,每個層級具有一個或多個節(jié)點,其中在每個層級處工作的所述一個或多個裝置或過程進行對所述音頻信號的一個或多個特性的計量,以使得在每個依次更低層級處工作的所述一個或多個裝置或過程進行對所述音頻信號的逐漸更小細分的一個或多個特性的計量。
2.一種用于導出可用于修正音頻信號的動態(tài)特性的信息的方法,包括
根據(jù)在多個層級中的每個層級的節(jié)點處工作的一個或多個裝置或過程來導出所述信息,每個層級具有一個或多個節(jié)點,其中在每個層級處工作的所述一個或多個裝置或過程進行對所述音頻信號的一個或多個特性的計量,以使得在每個依次更低層級處工作的所述一個或多個裝置或過程進行對所述音頻信號的逐漸更小細分的一個或多個特性的計量。
3.根據(jù)權(quán)利要求1或2所述的方法,其中所述音頻的所述逐漸更小細分包括(1)通道細分和(2)頻帶細分二者之一或全部。
4.根據(jù)權(quán)利要求1-3中的任一權(quán)利要求所述的方法,其中每個層級的每個節(jié)點處的所述一個或多個裝置或一個或多個過程在該節(jié)點的層級處進行對所述音頻的計量,并根據(jù)對所述音頻信號的這樣的計量并且根據(jù)它從另一層級處的一個或多個裝置或過程接收的信息來導出信息。
5.根據(jù)權(quán)利要求1-4中的任一權(quán)利要求所述的方法,其中第一即最高層級包括進行對所述音頻信號的總體的計量的根節(jié)點。
6.根據(jù)權(quán)利要求1-5中的任一權(quán)利要求所述的方法,其中所述音頻信號是多通道音頻信號,并且至少一個更低層級包括多個節(jié)點,每個節(jié)點進行對所述音頻信號的通道細分的計量,并且至少一個進一步更低層級包括多個節(jié)點,每個節(jié)點進行對所述音頻信號的通道的頻率細分的計量。
7.根據(jù)權(quán)利要求1-5中的任一權(quán)利要求所述的方法,其中所述音頻信號是單通道音頻信號,并且至少一個更低層級包括多個節(jié)點,每個節(jié)點進行對所述音頻信號的頻率細分的計量。
8.根據(jù)權(quán)利要求1-7中的任一權(quán)利要求所述的方法,其中根據(jù)在特定層級處對所述音頻信號的計量而導出的信息在該分層結(jié)構(gòu)中被下傳到一個或多個更低層級,以便影響在這樣的層級處工作的所述裝置或過程的工作。
9.根據(jù)權(quán)利要求8所述的方法,其中根據(jù)在特定層級處對所述音頻信息的計量而導出的信息不僅包括可用于影響在一個或多個更低層級處工作的裝置和過程的工作的信息,而且包括可用于修正所述音頻信號的動態(tài)特性的信息。
10.根據(jù)權(quán)利要求8或9所述的方法,其中根據(jù)在特定更低層級處對所述音頻信號的計量并且根據(jù)被傳到這樣的更低層級的信息而導出的信息可用來影響在這樣的更低層級處工作的所述裝置或過程的工作。
11.根據(jù)權(quán)利要求10所述的方法,其中影響在這樣的更低層級處工作的所述裝置或過程的工作使得該更低層級生成對它本來將生成的信息的修正。
12.根據(jù)權(quán)利要求8或9所述的方法,其中根據(jù)在特定更低層級處對所述音頻信號的計量并且根據(jù)被傳到這樣的更低層級的信息而導出的信息在該分層結(jié)構(gòu)中被上傳到一個或多個更高層級,以便影響在這樣的更高層級處工作的所述裝置或過程的工作。
13.根據(jù)權(quán)利要求12所述的方法,其中影響在這樣的更高層級處工作的所述裝置或過程的工作使得更高層級生成對它本來將傳到一個或多個更低層級的或者將被用于修正所述音頻信號的信息的修正。
14.根據(jù)權(quán)利要求1和引用權(quán)利要求1的權(quán)利要求3-13中的任一權(quán)利要求所述的方法,其中用于修正音頻信號的動態(tài)特性的所述信息被時間平滑。
15.根據(jù)權(quán)利要求2和引用權(quán)利要求2的權(quán)利要求2-13中的任一權(quán)利要求所述的方法,其中用于修正音頻信號的動態(tài)特性的所述信息被時間平滑。
16.一種設備,適于執(zhí)行權(quán)利要求1至15中的任一權(quán)利要求的方法。
17.一種計算機程序,存儲在計算機可讀介質(zhì)上,用于使得計算機執(zhí)行權(quán)利要求1至15中的任一權(quán)利要求的方法。
全文摘要
根據(jù)在多個層級中的每個層級的一個或多個相應節(jié)點處工作的一個或多個裝置或過程來導出可用于修正音頻信號的動態(tài)特性的信息,每個層級具有一個或多個節(jié)點,其中在每個層級處工作的一個或多個裝置或過程進行對音頻信號的一個或多個特性的計量,以使得在每個依次更低層級處工作的一個或多個裝置或過程進行對音頻信號的逐漸更小細分的一個或多個特性的計量。
文檔編號H03G7/00GK101606316SQ200780040917
公開日2009年12月16日 申請日期2007年10月17日 優(yōu)先權(quán)日2006年11月1日
發(fā)明者阿蘭·杰弗里·西費爾特, 肯尼斯·詹姆斯·岡德里 申請人:杜比實驗室特許公司