專利名稱:音頻聲道空間轉(zhuǎn)換的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及音頻信號處理。更具體而言,本發(fā)明涉及將表示聲場的M個音頻輸入聲道轉(zhuǎn)換為表示同一聲場的N個音頻輸出聲道,其中每個聲道是表示由一個方向抵達(dá)的音頻的單獨(dú)音頻流,M和N為正整數(shù),并且M至少為2和N至少為3,以及N大于M。典型地,N大于M的空間轉(zhuǎn)換器通常被表征為“解碼器”。
背景技術(shù):
雖然人類只有兩只耳朵,但我們能聽出實(shí)際三維的聲音,這依賴于多個定位提示,諸如頭部相關(guān)的轉(zhuǎn)換函數(shù)(HRTF)和頭部運(yùn)動。所以完全逼真的聲音再現(xiàn)要求保留并再現(xiàn)全三維聲場,或者至少需要可感知的提示。不幸的是,聲音記錄技術(shù)不適應(yīng)于獲取三維聲場,也不適應(yīng)于獲取二維平面聲音,甚至不適應(yīng)于獲取一維直線聲音。當(dāng)前的聲音記錄技術(shù)只適合于獲取、保存和呈現(xiàn)零位的離散音頻聲道。
自從Edison發(fā)明聲音記錄以來關(guān)于改進(jìn)逼真度的努力大多集中于克服其原始的模擬紋道調(diào)制的圓柱體/圓盤媒體的缺陷。這些缺陷包括有限且不平坦的頻率響應(yīng)、噪音、失真、變音、聲音顫動、速度精度、磨損、污垢和復(fù)制損害。雖然已經(jīng)有一些對于局部改進(jìn)的離散努力,包括電子放大、磁帶記錄、減少噪音以及價格比某些汽車還高的放音機(jī),但是各聲道質(zhì)量的傳統(tǒng)問題在直到研發(fā)了一般的數(shù)字記錄,尤其是引入音頻光盤之前都存有爭論而沒有最終得到解決。自研發(fā)了數(shù)字記錄特別是音頻光盤以來,除了進(jìn)一步擴(kuò)展數(shù)字記錄的質(zhì)量到24比特/96千赫茲采樣的一些努力之外,在聲音再現(xiàn)研究方面的主要努力集中于降低為保持各聲道質(zhì)量所需的數(shù)據(jù)量-大都采用可感知的編碼器,以及提高空間逼真度。這后一個問題是本文的主題。
改進(jìn)空間逼真度的努力已沿著兩條路線進(jìn)行試圖傳送整個聲場的感知提示,以及試圖傳送實(shí)際的原始聲場的一個近似。采用前一處理的系統(tǒng)實(shí)例包括雙聲道記錄和基于兩個揚(yáng)聲器的虛擬環(huán)繞聲系統(tǒng)。這些系統(tǒng)存在多個不幸的缺陷,尤其是在可靠地定位某些方向上的聲音方面,以及在要求使用耳機(jī)或單獨(dú)的固定的收聽位置方面。
無論在一間居室還是諸如電影院這樣的商業(yè)場所中,為了再現(xiàn)立體聲給多位聽眾,唯一可行的替換處理是嘗試近似實(shí)際的原始聲場。如果給定聲音記錄的離散聲道特性,這是不會令人吃驚的目前大多數(shù)努力包括所謂保守地增加再現(xiàn)聲道的數(shù)量。代表性系統(tǒng)包括50年代早期的移動-單聲道三揚(yáng)聲器電影膠片音軌、傳統(tǒng)的立體聲、60年代的四聲道立體聲系統(tǒng)、70毫米電影膠片上的五聲道離散磁性音軌、70年代使用矩陣的杜比環(huán)繞聲、90年代的AC-35.1聲道環(huán)繞聲和近來的環(huán)繞-EX 6.1聲道環(huán)繞聲?!癉olby”(杜比)、“Pro Logic”和“Surround EX”(環(huán)繞-EX)是杜比實(shí)驗(yàn)室許可公司的商標(biāo)。在不同程度上,這些系統(tǒng)提供比單聲道再現(xiàn)所增強(qiáng)了的空間再現(xiàn)。然而,大量聲道的混音導(dǎo)致了更多時間和費(fèi)用負(fù)擔(dān)在內(nèi)容制作者身上,并且導(dǎo)致的感知典型是幾個分散的離散聲道中的一個,而不是一個連續(xù)的聲場。在美國專利4799260中描述了Dolby的Pro Logic解碼,該專利的全部內(nèi)容在此包含引作參考。AC-3的詳細(xì)內(nèi)容在先進(jìn)電視系統(tǒng)委員會(ATSC)1995年12月20日公布的文檔A/52“數(shù)字音頻壓縮標(biāo)準(zhǔn)(AC-3)”(也可以在因特網(wǎng)的萬維網(wǎng)地址www.atsc.org/standards/A52/a 52/doc得到)中描述。也可以參見1999年7月22日的勘誤表(可在因特網(wǎng)的萬維網(wǎng)地址www.dolby.com/tech/ATSC err.pdf得到)。
一旦聲場被表征,原理上有可能一個解碼器產(chǎn)生最佳信號饋給任一輸出揚(yáng)聲器。饋送到這樣一個解碼器的聲道在本文的不同地方被稱之為“基本”、“被傳送的”和“輸入”聲道,并且位置不對應(yīng)于輸入聲道中的一個聲道的位置的任何輸出信道將被稱之為“中間”聲道。一個輸出聲道也可以有一個與一個輸入聲道相一致的位置。
發(fā)明內(nèi)容
根據(jù)本發(fā)明的第一方面,一種用于將M個音頻輸入信號轉(zhuǎn)換為N個音頻輸出信號的處理,每個輸入信號與一個方向相關(guān)聯(lián),每個輸出信號與一個方向相關(guān)聯(lián),其中N大于M,M至少是2以及N為至少是3的正整數(shù),該處理包括提供M:N可變矩陣,應(yīng)用M個音頻輸入信號給該可變矩陣,從可變矩陣中推導(dǎo)出N個音頻輸出信號,并響應(yīng)于輸入信號控制該可變矩陣,以便當(dāng)輸入信號高度相關(guān)時,輸出信號所產(chǎn)生的聲場在輸入信號的指定前進(jìn)基本方向中具有緊湊的聲像,隨著相關(guān)度的減少該聲像從緊湊到寬進(jìn)行擴(kuò)展,并逐步分離成多個緊湊聲像,每個聲像在與輸入信號相關(guān)聯(lián)的方向中隨相關(guān)度繼續(xù)減少到高度不相關(guān)。
根據(jù)本發(fā)明的第一方面,可以響應(yīng)于以下度量而控制可變矩陣(1)輸入信號的相對電平,和(2)輸入信號的互相關(guān)。在這種情況下,為了度量具有第一范圍內(nèi)值的輸入信號的互相關(guān),該范圍由最大值和參考值來作為界限,當(dāng)互相關(guān)的度量是最大值時,聲場可以具有緊湊的聲像,當(dāng)互相關(guān)的度量是參考值時,聲場則可以具有寬的擴(kuò)展聲像,以及為了度量具有第二范圍內(nèi)值的輸入信號的互相關(guān),該范圍由參考值和最小值來作為界限,當(dāng)互相關(guān)的度量是參考值時,聲場可以具有寬的擴(kuò)展聲像,當(dāng)互相關(guān)的度量是最小值時,它可以具有多個緊湊的聲場,每個聲場位于與輸入信號相關(guān)聯(lián)的方向中。
根據(jù)本發(fā)明的又一個方面,一種用于將M個音頻輸入信號轉(zhuǎn)換為N個音頻輸出信號的處理,每個輸入信號與一個方向相關(guān)聯(lián),每個輸出信號與一個方向相關(guān)聯(lián),其中N大于M,M至少是3,該處理包括提供多個m:n可變矩陣,這里m是M的子集以及n是N的子集,從每一個可變矩陣中推導(dǎo)出N個音頻輸出信號的各子集,響應(yīng)于應(yīng)用于矩陣的輸入信號的子集以控制每個可變矩陣,以便當(dāng)這些輸入信號高度相關(guān)時,從矩陣所推導(dǎo)的輸出信號的各子集產(chǎn)生的聲場,在應(yīng)用于矩陣的輸入信號子集的指定前進(jìn)基本方向中具有緊湊的聲像,隨著相關(guān)度的減少該聲像從緊湊到寬進(jìn)行擴(kuò)展,并逐步分離成多個緊湊聲像,每個聲像在與應(yīng)用于該矩陣的輸入信號相關(guān)聯(lián)的方向中,隨相關(guān)度繼續(xù)減少到高度不相關(guān),并從N個音頻輸出聲道的子集中推導(dǎo)出N個音頻輸出信號。
根據(jù)本發(fā)明的再一個方面,還可以響應(yīng)于補(bǔ)償接收同一輸入信號的一個或多個其他可變矩陣的影響的信息來控制可變矩陣。而且,從N個音頻輸出聲道的子集中推導(dǎo)出N個音頻輸出信號還可以包括補(bǔ)充產(chǎn)生同一輸出信號的多個可變矩陣。根據(jù)本發(fā)明這一方面,可以響應(yīng)于以下度量來控制每個可變矩陣(a)應(yīng)用于該矩陣的輸入信號的相對電平,和(b)輸入信號的互相關(guān)。
根據(jù)本發(fā)明的又一個方面,一種用于將M個音頻輸入信號轉(zhuǎn)換為N個音頻輸出信號的處理,每個輸入信號與一個方向相關(guān)聯(lián),每個輸出信號與一個方向相關(guān)聯(lián),其中N大于M,M至少是3,該處理包括響應(yīng)于控制矩陣系數(shù)或控制矩陣輸出的定標(biāo)因子提供一M:N可變矩陣,應(yīng)用M個音頻輸入信號給該可變矩陣,提供多個的m:n可變矩陣定標(biāo)因子發(fā)生器,這里m是M的子集以及n是N的子集,并應(yīng)用M個音頻輸入信號的各子集給每個可變矩陣定標(biāo)因子發(fā)生器,為N個音頻輸出信號的各子集從每個可變矩陣定標(biāo)因子發(fā)生器中推導(dǎo)出一組可變矩陣定標(biāo)因子,響應(yīng)于應(yīng)用到矩陣的輸入信號的子集來控制每個可變矩陣定標(biāo)因子發(fā)生器,以便當(dāng)它所產(chǎn)生的定標(biāo)因子被應(yīng)用到M:N可變矩陣時,所產(chǎn)生的輸出信號的各子集產(chǎn)生的聲場當(dāng)這些輸入信號高度相關(guān)時,在產(chǎn)生和應(yīng)用定標(biāo)因子的輸入信號子集的指定前進(jìn)基本方向中具有緊湊的聲場,隨著相關(guān)度的減少該聲像從緊湊到寬進(jìn)行擴(kuò)展,并逐步分離成多個緊湊聲像,每個聲像在與產(chǎn)生該應(yīng)用定標(biāo)因子的輸入信號相關(guān)聯(lián)的方向中,隨相關(guān)度繼續(xù)減少到非常不相關(guān),并可變矩陣中推導(dǎo)出N個音頻輸出信號。
根據(jù)本發(fā)明的再一個方面,還可以響應(yīng)于補(bǔ)償接收同一輸入信號的一個或多個其他可變矩陣定標(biāo)因子發(fā)生器的影響的信息來控制可變矩陣定標(biāo)因子發(fā)生器。而且,從可變矩陣中推導(dǎo)出N個音頻輸出信號可包括補(bǔ)償為同一輸出信號產(chǎn)生定標(biāo)因子的多個可變矩陣定標(biāo)因子發(fā)生器。根據(jù)本發(fā)明的該方面可響應(yīng)于以下度量控制可變矩陣定標(biāo)因子發(fā)生器(a)應(yīng)用給該發(fā)生器的輸入信號的相對電平,和(b)輸入信號的互相關(guān)。
根據(jù)本發(fā)明,將表示聲場的M個音頻輸入聲道轉(zhuǎn)換為表示同一聲場的N個音頻輸出聲道,其中每個聲道是表示從一個方向抵達(dá)的音頻的單獨(dú)音頻流,M和N是正整數(shù),以及M至少是2和N至少是3,且N大于M。每個輸入和輸出聲道具有一個相關(guān)聯(lián)的方向(例如,方位、高度和可選的為距離,以考慮到較近或更遠(yuǎn)的虛擬或映像聲道)。產(chǎn)生一組或多組輸出聲道,每組聲道有一個或多個輸出聲道。每組聲道通常與兩個或更多個空間上相鄰的輸入聲道相關(guān)聯(lián),以及一組內(nèi)的每個輸出聲道是通過確定兩個或更多個輸入聲道的互相關(guān)度量或兩個或更多個輸入聲道的電平相互間關(guān)系的度量而產(chǎn)生的?;ハ嚓P(guān)的度量優(yōu)選是零時間偏移互相關(guān)的度量,該度量是公共能量電平與輸入信號能量電平幾何平均之比。公共能量電平優(yōu)選是平滑或平均的公共能量電平以及輸入信號能量電平是平滑或平均的輸入信號能量電平。
在本發(fā)明的一個方面,多組輸出聲道可以與多于兩個的輸入聲道相關(guān)聯(lián),以及一種處理可以根據(jù)分級次序確定與每組輸出聲道相關(guān)聯(lián)的那些輸入聲道的相關(guān)性,以便根據(jù)與輸出聲道相關(guān)聯(lián)的輸入聲道數(shù)量排序每組或各組,數(shù)目最大的輸入聲道具有最高的階,并以按照它們的分級次序來依序處理各組。此外根據(jù)本發(fā)明的一個方面,處理過程考慮到對較高階的組處理的結(jié)果。
本發(fā)明的放音或解碼方面假設(shè)表示從一個方向抵達(dá)音頻的M個音頻輸入聲道的每一個通過每個源方向的一個無源矩陣的最近-相鄰的幅度-跟隨編碼而產(chǎn)生(即假設(shè)一個源方向被主要映射到最近的輸入聲道),而不需要附加側(cè)鏈信息(側(cè)鏈或輔助信息的使用是可選的),從而它與現(xiàn)有混音技術(shù)、控制臺和格式相兼容。雖然這些源信號可以通過直接使用一個無源編碼矩陣產(chǎn)生,大多數(shù)傳統(tǒng)的記錄技術(shù)固有產(chǎn)生這些源信號(所以,構(gòu)成一個“有效編碼矩陣”)。本發(fā)明的放音或解碼方面也與自然記錄的源信號大都兼容,諸如用5個實(shí)際的定向話筒記錄的信號,因?yàn)樵试S某些可能的延遲,從中間方向抵達(dá)的聲音傾向于主要映射到最鄰近的話筒(在一個水平陣列中,特別是映射到最鄰近的一對話筒中)。
根據(jù)本發(fā)明諸方面的解碼器或解碼處理可以被實(shí)現(xiàn)為耦合的處理模塊或模塊功能(下稱為“模塊”或“解碼模塊”)的網(wǎng)格,每一個解碼模塊用于典型地從與該解碼模塊相關(guān)聯(lián)的兩個或更多的空間上最鄰近的相鄰輸入聲道產(chǎn)生一個或多個輸出聲道(或者可替換地,可用于產(chǎn)生一個或多個輸出聲道的控制信號)。輸出聲道典型表示與特定解碼模塊相關(guān)聯(lián)的空間上最鄰近的相鄰輸入聲道中音頻信號的相對比例。正如以下所詳細(xì)解釋的那樣,在模塊共享輸入和存在解碼模塊分級的意義上解碼模塊互相松散耦合。模塊被按照與其相關(guān)聯(lián)的輸入聲道的數(shù)目分級排序(具有最多數(shù)目相關(guān)輸入聲道的一個模塊或多個模塊有最高階)。一個監(jiān)控器功能如此管理這些模塊,以便在這些模塊之間公平地共享公共輸入信號,并且較高階的解碼器模塊可以影響較低階模塊的輸出。
每個解碼器模塊可以有效地包括一個矩陣,使得它直接產(chǎn)生輸出信號,或者每個解碼器模塊可以產(chǎn)生控制信號,這些控制信號與其他解碼模塊產(chǎn)生的控制信號一起用于改變一個可變矩陣的系數(shù)或改變輸入到一個固定矩陣的或從一個固定矩陣輸出的定標(biāo)因子,以便產(chǎn)生所有的輸出信號。
解碼器模塊模仿人耳的工作,以試圖提供可感知的透明再現(xiàn)。根據(jù)其中解碼器模塊和模塊功能是一個方面的本發(fā)明的信號轉(zhuǎn)換可應(yīng)用于寬帶信號或者多頻帶處理器的每一個頻帶,這取決于實(shí)現(xiàn),并且可以在每個采樣執(zhí)行一次或者每個采樣方塊執(zhí)行一次。一個多頻帶實(shí)施例可以應(yīng)用濾波器組,諸如離散的臨界頻帶濾波器組或其頻帶結(jié)構(gòu)與相關(guān)解碼器兼容的濾波器組,或一種變換結(jié)構(gòu),諸如FFT(快速傅里葉變換)或MDCT(修正的離散余弦變換)線性濾波器組。
本發(fā)明的另一方面在于能夠通過適宜依賴于虛擬映像,以減少接收N個輸出聲道的揚(yáng)聲器質(zhì)量到實(shí)際數(shù)值,即在除了放置揚(yáng)聲器以外的空間位置上形成的感知聲像。雖然虛擬映像最通普遍的應(yīng)用是通過在聲道之間移動一個單聲道信號立體再現(xiàn)兩個揚(yáng)聲器之間的一個映像的軌跡,正如本發(fā)明一個方面所預(yù)期的,虛擬映像可以包括再現(xiàn)幻影映射聲像,該聲像提供了超越居室的墻之外或居室墻之內(nèi)的聽覺印象。虛擬映像對于數(shù)目稀少聲道的群再現(xiàn)來說不被認(rèn)為是一種可行的技術(shù),因?yàn)樗笫章犝吲c兩個揚(yáng)聲器等距離或近似等距。例如,在電影院中左前方和右前方的揚(yáng)聲器對于大多數(shù)聽眾獲得一個中央聲像的有用的幻象而言相距太遠(yuǎn)了,因此就許多對話源的中央聲道的重要性而言,代替使用一個物理的中央揚(yáng)聲器。
隨著揚(yáng)聲器密度的增加,對于大多數(shù)聽眾來說,至少對于平滑移動的范圍,可在任何一對揚(yáng)聲器之間出現(xiàn)虛擬映像的位置將可達(dá)到;揚(yáng)聲器足夠大時,揚(yáng)聲器之間的間隙不再被感知。
信號分布如上所述,互相關(guān)的一個度量確定模塊中優(yōu)勢(公共信號分量)和非優(yōu)勢(非公共信號分量)能量之比以及在模塊的輸出聲道之間非優(yōu)勢信號分量的擴(kuò)展程度。通過在用于兩個輸入模塊的不同信號條件下考慮模塊的輸出聲道的信號分布,可以更好的理解上述方面。除非另外注意,所闡述的原理可直接擴(kuò)展用到更高階的模塊。
信號分布的問題是通常對于恢復(fù)原始信號振幅分布的信息太少,信號本身則更少??捎玫幕拘畔⑹敲恳荒K輸入處的信號電平和輸入信號的平均向量積、公共能量電平。零時間偏移互相關(guān)是公共能量電平相對于輸入信號能量電平的幾何平均的比率。
互相關(guān)的有效性在于它功能上作為對于所有輸入公共的信號分量凈振幅的度量。如果存在在模塊輸入之間任何地方移動的單獨(dú)信號(“內(nèi)部”或“中間”信號),所有的輸入將具有相同的波形,但是可能具有不同的振幅,在這些條件下,相關(guān)度將是1.0。在另一個極端,如果所有輸入信號是獨(dú)立的,意思是說不存在公共信號分量,那么相關(guān)度將是0。位于0和1.0之間的相關(guān)值能夠被認(rèn)為是對應(yīng)于輸出端的某些單獨(dú)、公共信號分量和獨(dú)立信號分量的中間平衡電平。因此,可以將任何輸入信號條件劃分為公共信號、“優(yōu)勢”信號,以及在減去公共信號組成所剩下的輸入信號分量包括“全部剩余的”信號分量(“非優(yōu)勢”或剩余信號能量)。如上所述,公共或“優(yōu)勢”信號振幅不必高于剩余的或非優(yōu)勢的信號電平。
例如,考慮映射到單獨(dú)Lt/Rt(左全和右全)對的五個聲道(L(左)、MidL(中左)、C(中間)、MidL(中右)、R(右))的圓弧的情況,希望恢復(fù)原始的五個聲道。如果所有五個聲道具有相等振幅的獨(dú)立信號,那么Lt和Rt將會振幅相等,并具有對應(yīng)于位于零和1之間互相關(guān)值的公共能量的中間值(由于Lt和Rt不是獨(dú)立的信號)。利用適當(dāng)選擇的L、C和R的電平,而不利用來自MidL和MidR的信號能夠獲得相同的電平。因此,兩輸入、五輸出模塊可能在從Lt和Rt輸入移除C能量之后,只饋送對應(yīng)于主方向(在本例中為C)的輸出聲道和對應(yīng)于輸入信號剩余(L、R)的輸出聲道,以不給MidL和MidR輸出聲道任何信號。這樣的一種結(jié)果不是期望的-不必要地關(guān)掉聲道幾乎總是一種壞的選擇,因?yàn)樾盘枟l件中的小干擾將引起“關(guān)斷”聲道到開啟和關(guān)斷之間的觸發(fā)器,并引起令人討厭的振動聲音(“振動”是一種快速開啟和關(guān)斷的聲道),特別是當(dāng)聽到“關(guān)斷”聲道處于隔離時。
因此,當(dāng)存在用于給定組模塊輸入信號值的多個可能的輸出信號分布時,從各聲道質(zhì)量的觀點(diǎn)出發(fā),該保守的解決方法是盡可能均勻地在模塊的輸出聲道之間擴(kuò)展非優(yōu)勢信號分量,以與信號條件相一致。本發(fā)明的一個方面是在信號條件下根據(jù)三方式分離而不是“優(yōu)勢”比“所有剩余”的兩方式分離來均勻地擴(kuò)展可用的信號能量。優(yōu)選地,三方式分離包括優(yōu)勢(公共)信號分量、填充(均勻擴(kuò)展)信號分量和輸入信號分量剩余。不幸的是,只有足夠信息來進(jìn)行兩方式分離(優(yōu)勢信號分量和所有其他的信號分量)。這里描述了一種適當(dāng)?shù)膶?shí)現(xiàn)三方式分離的解決方法,在該方法中對于超過特定值的相關(guān)值,兩方式分離應(yīng)用優(yōu)勢和擴(kuò)展的非優(yōu)勢信號分量;對于低于該值的相關(guān)值來說,兩方式分離應(yīng)用擴(kuò)展的非優(yōu)勢信號分量和剩余的分量。公共信號能量被在“優(yōu)勢”和“均勻擴(kuò)展”之間分離?!熬鶆驍U(kuò)展”分量包括“公共”和“剩余”的信號分量。所以,“擴(kuò)展”包括混合公共(相關(guān)的)和剩余的(不相關(guān)的)信號分量。
在處理之前,對于給定模塊的給定輸入/輸出聲道結(jié)構(gòu)來說,對應(yīng)于所有接收相同信號幅度的輸出聲道來計算相關(guān)值。該相關(guān)值可以被稱之為“隨機(jī)_xcor”值。對于單獨(dú)的、中央導(dǎo)出中間輸出聲道和兩個輸入聲道,隨機(jī)_xcor的值可以計算為0.333。對于三個相等的擴(kuò)展中間聲道和兩個輸入聲道,隨機(jī)_xcor的值可以計算為0.483。雖然已經(jīng)發(fā)現(xiàn)這些時間值提供了令人滿意的結(jié)果,但是它們?nèi)圆皇菦Q定性的。例如,可使用分別大約是0.3和0.5的值。換言之,對于具有M個輸入和N個輸出的模塊來說,存在M個輸入的特定相關(guān)度,并認(rèn)為它能夠表示所有N個輸出中的相等能量。這能夠通過考慮M個輸入是否已經(jīng)使用接收相等能量的N個獨(dú)立信號的無源N到M矩陣推導(dǎo)出它們而達(dá)到,盡管當(dāng)然實(shí)際的輸入可以通過其他方式推導(dǎo)出。該門限相關(guān)值是“隨機(jī)_xcor”,它可以表示兩個工作狀態(tài)之間的界限。
然后,在處理過程中,如果模塊的互相關(guān)值大于或等于隨機(jī)_xcor值,則將它定標(biāo)在1.0到0的范圍。
定標(biāo)_xcor=(相關(guān)-隨機(jī)_xcor)/(1-隨機(jī)_xcor)“定標(biāo)_xocr”值表示高于均勻擴(kuò)展電平的優(yōu)勢信號的量。不論所剩的是什么都可以相等地分布到模塊的其他輸出聲道中。
但是,存在應(yīng)該考慮到的其他因子,即由于輸入信號的指定的前進(jìn)基本方向變得更加明顯偏離中央,因此如果保持對于所有輸出聲道的相等分布,則應(yīng)該顯著減少擴(kuò)展能量的數(shù)量,或者可替換地,如果應(yīng)該保持?jǐn)U展能量的數(shù)量,但是相對于優(yōu)勢能量的“偏離中央”則應(yīng)該減少輸出信道所分布的能量-換言之,沿輸出聲道的能量逐漸減少。在后者的情況下,可能需要其他處理復(fù)雜度以保持輸出能量等于輸入能量。
另一方面,如果當(dāng)前相關(guān)值小于隨機(jī)_xcor值,則認(rèn)為優(yōu)勢能量應(yīng)是零,顯著地減少均勻擴(kuò)展能量,以及允許所剩余的剩余信號在輸入端累積。在相關(guān)=零時,不存在內(nèi)部信號,而只有直接映射到輸出聲道的獨(dú)立的輸入信號。
本發(fā)明這方面的操作可以進(jìn)一步如下所解釋的a)當(dāng)實(shí)際相關(guān)值大于隨機(jī)_xcor時,存在足夠的公共能量被考慮作為兩個相鄰輸出之間引入(移動)的優(yōu)勢信號(或者,當(dāng)然如果它的方向碰巧與一個輸出的方向相一致的話,可將其饋送到一個輸出);從輸入中減去分配給該信號的能量以給出在所有輸出之間(優(yōu)選均勻)分布的剩余能量。
b)當(dāng)實(shí)際相關(guān)值精確為隨機(jī)_xcor時,輸入能量(可能被認(rèn)為是所有剩余能量)均勻地分布在所有輸出之間(這就是隨機(jī)_xcor的定義)。
c)當(dāng)實(shí)際相關(guān)值小于隨機(jī)_xcor時,不存在用于優(yōu)勢信號的足夠的公共能量,因此輸入的能量根據(jù)多少的比例而分布在輸出之間。如果一種經(jīng)處理的相關(guān)部分作為剩余能量,輸入能量則將均勻地分布在所有輸出之間,并且不相關(guān)部分更像要發(fā)送到對應(yīng)于輸入方向的輸出的大量優(yōu)勢信號。在相關(guān)是零的極端情況下,每個輸入只被饋送給一個輸出位置(通常是各輸出中的一個輸出,但是它能夠作為兩個輸出之間的移動位置)。
因此,在完全相關(guān)之間存在連續(xù),并具有根據(jù)輸入的相對能量的兩個輸出之間移動的單獨(dú)信號,并通過具有在所有輸出中均勻分布的輸入的隨機(jī)_xcor,到具有M個獨(dú)立饋送到M個輸出位置的輸入的零相關(guān)。
交互作用補(bǔ)償如上所述,可以認(rèn)為是根據(jù)本發(fā)明一個方面的聲道轉(zhuǎn)換包含“模塊”的網(wǎng)格。因此多個模塊可以共享一個給定的輸入聲道,在模塊之間也有可能交互作用,并且可能惡化性能除非應(yīng)用某種補(bǔ)償。盡管通常不可能在輸入聲道根據(jù)信號所“跟隨”的模塊來分離各信號,但是估計每個連接模塊所使用的輸入信號的數(shù)目能夠提高所產(chǎn)生的相關(guān)和方向性估計,以導(dǎo)致提高整體的性能。
如上所述,存在兩種類型的模塊交互作用包括在公共或較低分級等級的模塊(即,具有相似數(shù)量輸入或較少輸入的模塊),稱之為“鄰居”,以及比給定模塊較高分級等級的模塊(具有更多輸入),但是共享一個或多個公共輸入,稱之為“更高階鄰居”。
考慮在公共分級等級上的第一相鄰補(bǔ)償。為了理解相鄰交互作用所帶來的問題,考慮一個獨(dú)立的兩輸入模塊,它具有相同的L/R(左和右)輸入信號A。這對應(yīng)于輸入中間的單獨(dú)的優(yōu)勢(公共)信號。公共能量是A2以及相關(guān)值是1.0。假設(shè)第二兩輸入模塊,它在其L/R輸入具有公共信號,B,公共能量是B2,而且相關(guān)值也是1.0。如果兩個模塊都連接于公共輸入,則該公共輸入的信號將是A+B。假設(shè)信號A和B是獨(dú)立的,那么AB的平均乘積將是零,因此第一模塊的公共能量將是A(A+B)=A2+AB=A2以及第二模塊的公共能量將是B(A+B)=B2+AB=B2。因此,只要相鄰模塊處理獨(dú)立的信號,那么公共能量就不受相鄰模塊的影響。這通常是一個正確的假設(shè)。如果各信號不是獨(dú)立的,而是相同的或者至少基本上共享公共信號分量,那么系統(tǒng)將以一種與人耳響應(yīng)相一致的方式進(jìn)行反應(yīng)-即,公共輸入將會較大,以引起所產(chǎn)生的聲像拉向公共輸入。在這種情況下,偏移每個模塊的L/R輸入幅度比,因?yàn)楣草斎氲男盘柗?A+B)高于外部輸入的信號幅度,這將導(dǎo)致方向性估計偏向公共輸入。在這種情況下,諸模塊的相關(guān)值現(xiàn)在有些小于1.0,因?yàn)樵趦蓚€輸入對的波形不同。由于相關(guān)值確定了擴(kuò)展非公共信號分量的程度和優(yōu)勢(公共信號分量)與非優(yōu)勢能量(非公共信號分量)之比,未經(jīng)補(bǔ)償?shù)墓草斎胄盘枌?dǎo)致了擴(kuò)展每個模塊的非公共信號分布。
為了補(bǔ)償,估計屬于每個模塊的每個輸入的“公共輸入電平”的度量,然后通知每個模塊有關(guān)位于每個模塊輸入的同一分級等級的所有相鄰電平的這種公共輸入電平能量的總量。這里描述了兩種計算屬于一個模塊的每個輸入的公共輸入電平度量的方法其中一種方法是根據(jù)模塊輸入的公共能量(通常在下一段中描述),另一種方法是更為精確但是要求更多的計算資源,該方法基于模塊內(nèi)部輸出的全部能量(下文結(jié)合圖6A的結(jié)構(gòu)描述)。
根據(jù)計算屬于一個模塊的每個輸入的公共輸入電平度量的第一種方法,模塊輸入信號的分析不直接允許解決在每個輸入的公共輸入電平,只有全部公共能量的一部分,該部分是公共輸入能量電平的幾何平均。由于在每個輸入的公共輸入能量電平不能夠超過所度量和已知的在該輸入的總能量電平,因此全部公共能量被定標(biāo)為經(jīng)過以下所限定的、與所觀察的輸入電平成比例的已估計的公共輸入電平。一旦為網(wǎng)格中的所有模塊計算了公共輸入電平的總體(不論公共輸入電平的度量是基于第一種計算方式還是第二種計算方式),則通知每個模塊有關(guān)在每個輸入的所有相鄰模塊的全部公共輸入電平,被稱之為位于其每一個輸入處模塊的“相鄰電平”的量。然后模塊從位于它每個輸入的輸入電平種減去相鄰電平以導(dǎo)出補(bǔ)償?shù)妮斎腚娖?,該補(bǔ)償?shù)妮斎腚娖接糜谟嬎阆嚓P(guān)值和方向(輸入信號的指定前進(jìn)基本方向)。
對于以上所述的例子,相鄰電平初始是零,這是因?yàn)楣草斎氡榷它c(diǎn)輸入具有更多的信號,第一模塊要求在該輸入的公共輸入能量電平超過A2,第一模塊要求在同一輸入的公共輸入電平超過B2。由于全部要求超過了在該輸入可用的能量電平,該要求則被分別限制到大約A2和B2。由于沒有其他模塊連接到該公共輸入,因此每個公共輸入電平對應(yīng)于其他模塊的相鄰電平。因此,第一模塊所看到的補(bǔ)償輸入能量電平是(A2+B2)-B2=A2以及第二模塊所看到的補(bǔ)償輸入能量電平是(A2+B2)-A2=B2。
但是,這些僅僅是已經(jīng)利用這些模塊獨(dú)立觀測到的電平。因此,產(chǎn)生的相關(guān)值將是1.0,并且正如所希望的,優(yōu)勢方向?qū)⒓性谶m當(dāng)?shù)姆?。但是,恢?fù)的信號本身將不會是完全獨(dú)立的-第一模塊的輸出將具有一些B信號分量,反之亦然,但這是矩陣系統(tǒng)的一種限制,并且如果在多頻帶的基礎(chǔ)上執(zhí)行該處理,混合的信號分量將位于相似的頻率處,以反映這些信號分量之間某種懸而未決的不同。在更為復(fù)雜的情況下,補(bǔ)償通常將不會精確,但是通過該系統(tǒng)的經(jīng)驗(yàn)表明實(shí)際當(dāng)中的補(bǔ)償可減輕相鄰模塊交互作用的絕大部分的影響。
已經(jīng)建立了在相鄰電平補(bǔ)償中使用的原理和信號,到更高階的相鄰電平補(bǔ)償?shù)臄U(kuò)展相當(dāng)?shù)刂苯?。這應(yīng)用于位于不同分級等級兩個或更多模塊共享不止一個公共輸入聲道的情形。例如,可能存在與兩輸入模塊共享兩個輸入的三輸入模塊。所有三個輸入的公共信號分量還將是兩個輸入模塊輸入的公共信號分量,而無需補(bǔ)償,以及將通過每個模塊在不同的位置處反映出。更一般而言,可能存在所有三個輸入的一個公共信號分量以及只有兩輸入模塊輸入的公共的第二分量,并為了正確反映輸出聲場盡可能地分離它們的影響。因此,正如嵌入到上述公共輸入電平中的三輸入公共信號影響應(yīng)該在能夠正確執(zhí)行兩輸入計算之前從輸入中被減去。實(shí)際上,在處理較低等級的計算時,不僅應(yīng)該從較低等級的模塊輸入電平中,而且還應(yīng)該從它對公共能量電平的觀測度量中減去更高階的公共信號單元。這不同于位于相同分級等級的模塊的公共輸入電平的影響,模塊的公共輸入電平不會影響相鄰模塊的公共能量電平的度量。因此,應(yīng)該考慮并應(yīng)用與同一階相鄰電平獨(dú)立的更高階的相鄰電平。同時將更高階相鄰電平向下傳遞到較低分級的模塊,剩余的較低等級模塊的公共電平還應(yīng)該被向上傳遞到如上所述的分級中,因?yàn)檩^低等級模塊的動作類似于較高等級模塊的普通鄰居。一些量是相互獨(dú)立的并且難以同時解決。為了避免執(zhí)行復(fù)雜的同時解決資源集中計算,可將前一計算的值傳遞給相關(guān)的模塊。位于不同分級等級的模塊公共輸入電平的潛在相互獨(dú)立性能夠通過使用如上的前一值,或者是通過在從最高分級等級到最低等級的各個順序中(即,一個環(huán))執(zhí)行計算而解決??商鎿Q地,同時方程解決也是有可能的,盡管它可能包含非平常的計算開銷。
盡管所描述的交互作用補(bǔ)償技術(shù)僅僅傳送用于復(fù)雜信號分布的近似正確的值,但是人們相信它們可以提供對不能考慮模塊交互作用的網(wǎng)格結(jié)構(gòu)的改進(jìn)。
圖1是一個頂視圖,它示意性示出了一種測試安排方式中的理想化的解碼結(jié)構(gòu),該測試安排應(yīng)用在房間墻壁周圍的十六聲道水平陣列、布置在水平陣列之上的圓環(huán)中的六聲道陣列和單個頂置聲道。
圖2是一個功能方框圖,它提供了多個模塊的多頻帶變換實(shí)施例的總視圖,這些模塊利用實(shí)現(xiàn)圖1實(shí)例的中央監(jiān)控器工作。
圖3是對理解監(jiān)控器諸如圖2的監(jiān)控器201確定端點(diǎn)定標(biāo)因子的方式有用的功能方框圖。
圖4A-4C示出了根據(jù)本發(fā)明一個方面的一模塊的功能方框圖。
圖5是一個示意圖,它示出了輸入聲道的三角形所饋送的三輸入模塊的理想結(jié)構(gòu)、三內(nèi)部輸出聲道和優(yōu)勢方向。該視圖對理解優(yōu)勢信號分量的分布有用。
圖6A和6B是分別示出了一種適當(dāng)結(jié)構(gòu)的功能方框圖,該結(jié)構(gòu)用于(1)響應(yīng)于每個輸入的總能量而產(chǎn)生用于模塊每個輸入的總的估計能量,和(2)響應(yīng)于對輸入信號的互相關(guān)度量,產(chǎn)生用于模塊每個端點(diǎn)的過量端點(diǎn)能量定標(biāo)因子分量。
圖7示出了圖4C中“求和和/或其中較大者”方塊367的優(yōu)選功能的一個功能方框圖。
圖8是本發(fā)明的一個方面響應(yīng)于互相關(guān)的度量而產(chǎn)生定標(biāo)因子分量的方式的理想化表示。
圖9A和9B到圖16A和16B是一系列理想化表示,它們示例了由輸入信號條件的各實(shí)例所產(chǎn)生的模塊的輸出定標(biāo)因子。
具體實(shí)施例方式
為了測試本發(fā)明的各個方面,開發(fā)了一種水平陣列的結(jié)構(gòu),在房間的每堵墻上有5個揚(yáng)聲器(在每個角落有一個揚(yáng)聲器,在每個角落之間有3個均勻間隔的揚(yáng)聲器),考慮到公共的角落揚(yáng)聲器,總共16個揚(yáng)聲器,加上以大約45度的垂直角置于中央定位的聽眾之上的一圈6個揚(yáng)聲器,再加上直接位于聽眾上方的單個揚(yáng)聲器,總共23個揚(yáng)聲器,加上一個超重低音揚(yáng)聲器/LFE(低頻效應(yīng))聲道,總共24個揚(yáng)聲器,所有的揚(yáng)聲器都由設(shè)置用于24聲道放音的一臺個人計算機(jī)饋給。盡管按照現(xiàn)在的說法,這個系統(tǒng)可以被稱之為23.1聲道系統(tǒng),但是為了簡單起見,這里將它稱之為24聲道系統(tǒng)。
圖1是一個頂視圖,它示意性示出了如上所述測試安排方式中的一個理想化的解碼結(jié)構(gòu)。5個水平廣范圍的輸入聲道被示為外圓上的方塊1’、3’、5’、9’和13’。一個垂直聲道被示為中心處的虛線方塊23’,該聲道可能由5個廣范圍的輸入聲道通過相關(guān)或所產(chǎn)生的混響而導(dǎo)出,或者單獨(dú)提供(如圖2所示)。23個廣范圍輸出聲道由相應(yīng)數(shù)字1-23標(biāo)出的實(shí)心圓示出。外圓上16個輸出聲道在一個水平面上,內(nèi)圓上6個輸出聲道在水平面上方45度。輸出聲道23直接在一個或多個聽眾上方。5個兩輸入解碼模塊由外圓上箭頭24-28示出,它們連接在每一對水平輸入聲道之間。5個附加兩輸入垂直解碼模塊由箭頭29-33示出,連接垂直聲道到每個水平聲道。被升高的中央靠后的聲道即輸出聲道21由一個三輸入解碼模塊34導(dǎo)出,它由輸出聲道21和輸入聲道9、13和23之間的箭頭示出。因此,三輸入模塊34比它的兩輸入較低分級的相鄰模塊27、32和33具有較高的分級等級。在該實(shí)例中,每個模塊與相應(yīng)的一對或三個空間最鄰近的輸入聲道相關(guān)聯(lián)。本例中的每個模塊至少具有三個同一等級的鄰居。例如,模塊25、28和29是模塊24的鄰居。
盡管圖1的安排應(yīng)用了五個模塊(24-28)(每個模塊具有兩個輸入)以及五個輸入(1’、3’、5’、9’和13’)以導(dǎo)出十六個表示房間四堵墻周圍位置的水平輸出(1-16),但是利用最小數(shù)目的三個輸入和三個模塊(每個具有兩個輸入,每個模塊與另一個模塊共享一個輸入)也能夠獲得相似的結(jié)果。
通過應(yīng)用多個模塊,其中每個模塊在圓弧或直線上具有諸輸出聲道(諸如圖1和2的實(shí)例),解碼現(xiàn)有技術(shù)解碼器中遇到的不定性,其中解碼小于零的相關(guān)值以指示可以避免后面的方向。
盡管可通過它們的物理位置或至少它們的方向來表征輸入和輸出聲道,但是可以有利地利用一個矩陣來表征,因?yàn)樵摼仃囂峁┝肆己枚x的信號關(guān)系。每個矩陣單元(行i,列j)是一個有關(guān)輸入聲道i到輸出聲道j的轉(zhuǎn)換函數(shù)。各矩陣單元通常是帶符號的乘法系數(shù),但是也可以包括相位或延遲項目(原理上,任何濾波器),并且可以作為頻率的函數(shù)(離散頻率、一個不同的矩陣位于一個頻率)。在給固定矩陣的輸出應(yīng)用動態(tài)定標(biāo)因子的情況下這是簡單的,但是它還可以通過讓每個矩陣單元具有一個獨(dú)立的定標(biāo)因子,或者對于諸矩陣單元來說具有比簡單的標(biāo)量定標(biāo)因子更詳細(xì)描述的定標(biāo)因子,導(dǎo)致它本身是可變矩陣,其中諸矩陣本身是可變的,例如是一個可變的延遲。
在映射物理位置到矩陣單元中存在一定的靈活性;原理上說,本發(fā)明各方面的實(shí)施例可處理映射一個輸入聲道到任何數(shù)量的輸出聲道,反之亦然,但是最為普遍的情形是假設(shè)經(jīng)由簡單的定標(biāo)因子僅僅映射到最近輸出聲道的保存能量的信號的平方和是1.0。這種映射通常借助正弦/余弦移動函數(shù)來實(shí)現(xiàn)。
例如,在一條直線上的兩個輸入聲道和三個內(nèi)部輸出聲道再加上兩個與輸入位置相一致的端點(diǎn)輸出聲道(即,M:N模塊,這里M是2以及N是5),有人可能假設(shè)間隔表示90度的弧度(正弦或余弦從0變?yōu)?的范圍,或者反之亦然),從而每個聲道是90度/4個間隔=每一部分是22.5度,以下給出了(余弦(角度),正弦(角度))的聲道矩陣系數(shù)Lout coeffs=cos(0),sin(0)=(1,0)MidLout coeffs=cos(22.5),sin(22.5)=(.92,.38)Cout coeffs=cos(45),sin(45)=(.71,.71)MidRout coeffs=cos(67.5,sin(67.5)=(.38,.92)Rout coeffs=cos(90),sin(90)=(0,1)因此,對于一個矩陣具有固定系數(shù)和在每個矩陣輸出端受定標(biāo)因子所控制的可變增益的情況,在五個輸出聲道的其中每一個輸出聲道的信號輸出是(這里“SF”是下標(biāo)所標(biāo)識的特定輸出的定標(biāo)因子)
Lout=Lt(SFL)MidLout=((.92)Lt+(.38)Rt))(SFMidL)Cout=((.45)Lt+(.45)Rt))(SFc)MidRout=((.38)Lt+(.92)Lt))(SFMidR)Rout=Rt(SFR)一般而言,給定輸入聲道的一個陣列,概念上可能加入具有直線的最近的輸入,該陣列表示潛在的解碼器模塊。(它們之所以是“潛在”的,是因?yàn)槿绻淮嬖谛枰獜囊粋€模塊推導(dǎo)出的任何輸出聲道,則不需要該模塊)。對于典型的安排來說,可以從一個兩輸入模塊推導(dǎo)出位于兩個輸入聲道之間一條線上的任何輸出聲道(如果源和發(fā)送聲道共面,那么任何一個源將出現(xiàn)在最多兩個輸入聲道中,在這種情況下,在應(yīng)用多于兩個輸入聲道時將會不利)。和一個輸入聲道位置相同的一個輸出聲道是一個端點(diǎn)聲道,也許是不止一個模塊的輸出聲道。和輸入聲道不在一條線上或位置相同的一個輸出聲道(例如,位于三個輸入聲道所形成的三角形的內(nèi)部或外部)需要一個具有多于兩個輸入的模塊。
當(dāng)公共信號占用多于兩個輸入聲道時,具有多于兩個輸入的解碼模塊將是有用的。例如,當(dāng)源聲道和輸入聲道不在一個面上源聲道可能映射到多于兩個的輸入聲道上時,這種情況可能會發(fā)生。當(dāng)映射24聲道(16個水平的圓環(huán)聲道,6個升高的圓環(huán)聲道,1個垂直聲道,加上LEF)到6.1聲道(包括一個復(fù)合的垂直聲道),這種情況可能在圖1的實(shí)例中發(fā)生。在上述情況下,升高的圓環(huán)中的中間后聲道并不在兩個源聲道之間的直線上,它在Ls(13)、Rs(9)和top(23)聲道所形成的三角形中間,因此需要一個三輸入模塊來提取該聲道。一種映射升高的聲道到水平陣列的方法是映射每一個升高的聲道到多于兩個的輸入聲道上。這允許將圖1所例舉的24個聲道映射到傳統(tǒng)的5.1聲道陣列。在可替換的情況下,多個個三輸入模塊可以提取各個升高的聲道,并且剩余的信號分量可以由兩輸入模塊進(jìn)行處理以提取聲道的主水平圓環(huán)。
一般而言,沒有必要檢驗(yàn)輸入聲道之間信號通用性的所有可能的組合。利用水平的聲道陣列(例如,表示水平陣列方向的聲道),通常足以成對地執(zhí)行空間相鄰聲道的相似性比較。對于在蓋或球表面安排的聲道來說,信號通用性可擴(kuò)展到三個或更多的聲道。使用和檢測信號通用性還可以被用于傳遞附加的信號信息。例如,可以通過將垂直信號分量映射到一個水平的五聲道陣列的所有五個滿標(biāo)度聲道來表示該信號分量。
為通用性判定有關(guān)哪一個輸入聲道組合用于分析,以及判定默認(rèn)的輸入/輸出映射矩陣,每個輸入/輸出聲道轉(zhuǎn)換器或轉(zhuǎn)換器函數(shù)結(jié)構(gòu)每次需要完成的是配置轉(zhuǎn)換器或轉(zhuǎn)換器函數(shù)?!俺跏加成洹?處理之前)推導(dǎo)出一個無源“主”矩陣,該矩陣將輸入/輸出聲道配置與聲道的空間方位進(jìn)行相關(guān)。作為一種替換,本發(fā)明的處理器或處理部件可以生成隨時間變化的定標(biāo)因子,每個輸出聲道一個定標(biāo)因子,該定標(biāo)因子修改否則將成為簡單的、無源矩陣的輸出信號電平或其自身的矩陣系數(shù)。定標(biāo)因子依次從如下所述的(a)優(yōu)勢、(b)均勻擴(kuò)展(填充),和(c)剩余(端點(diǎn))信號分量的組合中推導(dǎo)。
一個主矩陣有利于配置諸如在圖1的實(shí)例中所示出的模塊結(jié)構(gòu)并結(jié)合圖2在下文進(jìn)一步予以描述。通過檢查主矩陣,例如可能推論出,需要多少個解碼器模塊,如何連接這些解碼器模塊,每個解碼器模塊具有多少個輸入和輸出聲道,以及與每個模塊的輸入和輸出有關(guān)的矩陣系數(shù)。這些系數(shù)可以從主矩陣中獲得;只需要非零值,除非一個輸入聲道同時還是一個輸入聲道(即,端點(diǎn)聲道)。
每個模塊優(yōu)選具有一個“本地”矩陣,該矩陣是可應(yīng)用于特定模塊的主矩陣的一部分。在多模塊結(jié)構(gòu)的情況下,諸如圖1和2的實(shí)例,該模塊可使用本地矩陣來產(chǎn)生用于控制主矩陣的定標(biāo)因子(或矩陣系數(shù)),正如在結(jié)合圖2和圖4A-4C在下文中所描述的,或者使用本地矩陣來產(chǎn)生輸出信號的一個子集,輸出信號通過中央處理諸如結(jié)合圖2所描述的監(jiān)控器來匯編。在后一種情況下,這種監(jiān)控器以一種類似于圖2的監(jiān)控器201的方式補(bǔ)償同一輸出信號的多個版本,該信號由具有公共輸出信號的各模塊產(chǎn)生,而圖2的監(jiān)控器確定一個最終的定標(biāo)因子以代替各模塊所產(chǎn)生的初步定標(biāo)因子,這些模塊為相同的輸出聲道產(chǎn)生初步定標(biāo)因子。
在產(chǎn)生定標(biāo)因子而不是輸出信號的多個模塊的情況下,這些模塊可以經(jīng)由監(jiān)控器從主矩陣連續(xù)地獲得有關(guān)它自身的矩陣信息,而不是具有一個本地矩陣。但是,如果模塊具有它自己的本地矩陣,那么只需要較少的計算開銷。在單個、獨(dú)立模塊的情況下,該模塊具有一個本地矩陣,它是唯一需要的矩陣(從作用上講,該本地矩陣就是一個主矩陣),以及該本地矩陣被用來產(chǎn)生輸出信號。
除非指明,否則將參考模塊產(chǎn)生定標(biāo)因子的替換方式對具有多個模塊的本發(fā)明實(shí)施例進(jìn)行描述。
任何只具有模塊本地矩陣中一個非零系數(shù)(該系數(shù)是1.0,因?yàn)橄禂?shù)平方和將會是1.0)的解碼模塊輸出聲道是一個端點(diǎn)聲道。具有多于一個非零系數(shù)的輸出聲道是內(nèi)部輸出聲道??紤]一種簡單的例子。如果輸出聲道O1和O2都是從輸入聲道I1和I2推導(dǎo)出來的(但是它們具有不同的系數(shù)值),那么將需要連接在I1和I2之間產(chǎn)生輸出O1和O2的2-輸入模塊,也可能連接在其他模塊之間。在一更為復(fù)雜的例子中,如果存在5個輸入和16個輸出,其中的一個解碼器模塊將具有輸入I1和I2,并饋給輸出O1和O2,以便O1=AI1+BI2+0I3+0I4+0I5(注意沒有來自輸入聲道I3、I4或I5的貢獻(xiàn)),以及O2=CI1+DI2+0I3+0I4+0I5(注意沒有來自輸入聲道I3、I4或I5的貢獻(xiàn)),那么,解碼器可能具有兩個輸入(I1和I2)、兩個輸出,以及與它們有關(guān)的定標(biāo)因子如下O1=AI1+BI2,以及O2=CI1+DI2不論是主矩陣還是本地矩陣,在單個、獨(dú)立模塊的情況下,可能具有用于提供除了乘法以外的矩陣單元。例如,如上所述,矩陣單元可能包括一個濾波函數(shù),諸如相位或延遲項,和/或一個為頻率函數(shù)的濾波器。可能被應(yīng)用的濾波的一個實(shí)例是一個純延遲的矩陣,該矩陣可以再現(xiàn)幻象投影聲像。實(shí)際上,可能將這種主矩陣或是本地矩陣分割為兩個函數(shù),其中一個應(yīng)用系數(shù)來推導(dǎo)輸出聲道,另一個則應(yīng)用一個濾波函數(shù)。
圖2一個功能方框圖,它提供了實(shí)現(xiàn)圖1中實(shí)例的多頻帶變換實(shí)施例的總視圖。例如,PCM音頻輸入具有多個交織的音頻信號聲道,它被應(yīng)用于一個包括有去交織器的監(jiān)控器或管理函數(shù)201(下稱為“監(jiān)控器201”),該去交織器恢復(fù)交織的輸入所攜帶的六個音頻信號聲道(1’、3’、5’、9’、13’、和23’)中每一個聲道的單獨(dú)流,并應(yīng)用每個單獨(dú)流給時域到頻域變換或變換函數(shù)(下稱為“前向變換”)。可替換地,可以在單獨(dú)的流中接收音頻聲道,在這種情況下,不需要去交織器。
如上所述,根據(jù)本發(fā)明的信號轉(zhuǎn)換可應(yīng)用于寬帶信號或多頻帶處理器的每個頻帶,該處理器可應(yīng)用一個濾波器組,諸如離散關(guān)鍵頻帶濾波器組或具有與相關(guān)聯(lián)解碼器兼容的頻帶結(jié)構(gòu)的濾波器組,或者應(yīng)用變換結(jié)構(gòu),諸如FFT(快速傅里葉變換)或MDCT(修改的離散余弦變換)線性濾波器組。圖2、4A-4C和其他的圖都以多頻帶變換結(jié)構(gòu)為背景被描述。
為了簡單起見,在圖1、2和其他圖中未示出的是,可選的LFE輸入聲道(圖1和2中潛在的第七輸入聲道)和輸出聲道(圖1和2中潛在的第24輸出聲道)。通??梢砸耘c其他輸入和輸出聲道相同的方式處理LFE聲道,但是該聲道具有它自己的定標(biāo)因子,并固定為“1”,以及還具有它自己的矩陣系數(shù),也固定為“1”。在源聲道不具有LFE但是輸出聲道具有的情況下(例如,25.1上混音),可以通過使用一個應(yīng)用于聲道求和、或避免聲道相加消除的低通濾波器(例如,第五階Butterworth濾波器,它具有120Hz轉(zhuǎn)角頻率)而得到一個LFE聲道,以及可以應(yīng)用聲道的補(bǔ)償相位和。在輸入具有一個LFE聲道,而輸出不具有該聲道的情況下,可以將LFE聲道添加到一個或更多的輸出聲道。
繼續(xù)描述圖2,模塊24-34以圖1所示的方式接收六個輸入1’、3’、5’、9’、13’和23’中適當(dāng)?shù)囊恍┹斎搿U鐖D1所示,每個模塊為與其相關(guān)聯(lián)的每一個音頻輸出聲道產(chǎn)生一個初步定標(biāo)因子(“PSF”)輸出。因此,例如,模塊24接收輸入1’和3’并產(chǎn)生初步定標(biāo)因子輸出PSF1、PSF2和PSF3??商鎿Q地,如上所述,每個模塊可以為與其相關(guān)聯(lián)的每一個音頻輸出聲道產(chǎn)生一組初步音頻輸出。每個模塊還可以與監(jiān)控器201通信,如以下進(jìn)一步說明的。監(jiān)控器201發(fā)送到各個模塊的信息可以包括相鄰電平信息和更高階相鄰電平信息,如果有的話。從每個模塊發(fā)送到監(jiān)控器的信息可以包括內(nèi)部的總共估計能量。可以考慮將諸模塊作為圖2整個系統(tǒng)的控制信號發(fā)生部件的一部分。
一個監(jiān)控器,諸如圖2的監(jiān)控器201,可以執(zhí)行大量的不同功能。監(jiān)控器例如可以確定是否正在使用多于一個的模塊,如果沒有使用,監(jiān)控器則不需要執(zhí)行任何與相鄰電平有關(guān)的功能。在初始化過程中,監(jiān)控器可以通知該模塊或每個模塊它所擁有的輸入和輸出的數(shù)量,與它們相關(guān)的矩陣系數(shù),和信號的采樣速率。正如以上已經(jīng)所述的,監(jiān)控器可以讀取交織的PCM采樣的各個塊,并去交織這些塊為單獨(dú)的聲道。它還可以例如響應(yīng)于指示源信號幅度受限以及限制程度的附加信息,在時域中應(yīng)用不受限制的動作。如果系統(tǒng)以多頻帶模式工作,則監(jiān)控器可以應(yīng)用加窗和濾波器組(例如,F(xiàn)FT、MDCT等)給每個聲道(以便多個模塊不執(zhí)行冗余變換,該變換實(shí)質(zhì)上增加了處理開銷)并傳送變換值的流給每個模塊用于處理。每個模塊給監(jiān)控器傳送回一個二維陣列的定標(biāo)因子用于每個輸出聲道的每個子帶中的全部變換接收器的一個定標(biāo)因子(當(dāng)在多頻帶變換結(jié)構(gòu)中時,否則一個輸出聲道一個定標(biāo)因子),或,替換地,一個二維陣列的輸出信號用于每個輸出聲道的每個子帶的復(fù)合變換接收器的總體(當(dāng)在多頻帶變換結(jié)構(gòu)中時,否則每個輸出聲道一個輸出信號)。監(jiān)控器可以平滑定標(biāo)因子并將它們應(yīng)用到信號路徑矩陣(矩陣203,如下所述)以產(chǎn)生(在多頻帶變換結(jié)構(gòu)中)輸出聲道復(fù)合頻譜??商鎿Q地,當(dāng)模塊產(chǎn)生輸出信號時,監(jiān)控器可以推導(dǎo)出輸出聲道(輸出聲道復(fù)合頻譜,在一個多頻帶變換結(jié)構(gòu)中),以補(bǔ)償產(chǎn)生相同輸出信號的本地矩陣。然后,監(jiān)控器可以為每個輸出聲道在MDCT的情況下執(zhí)行逆變換再加上加窗和重疊添加,交織輸出采樣以形成一個復(fù)合的多聲道輸出流(或者,可選地,可以省略交織,以便提供多個輸出流),并發(fā)送該輸出流到一個輸出文件、聲音卡或其他的最終目的地。
盡管通過一個監(jiān)控器或多個監(jiān)控器可以執(zhí)行各種功能,如這里所述,但是本領(lǐng)域的普通技術(shù)人員將會理解,可以在模塊本身內(nèi)執(zhí)行各種功能或全部的這些功能,而不是通過全部或部分模塊所公共的監(jiān)控器來執(zhí)行。例如,如果只有一個單獨(dú)的模塊,則在模塊功能和監(jiān)控器功能之間不存在任何區(qū)別。盡管在多模塊的情況下,一個公共監(jiān)控器可以通過消除或減少冗余的處理任務(wù)而減少所需的全部處理能量,消除公共監(jiān)控器或簡化該監(jiān)控器可以允許各模塊被容易地相互添加,例如,以升級到更多的輸出聲道。
回到圖2的描述,還可以將六個輸入1’、3’、5’、9’、13’和23’應(yīng)用于一個可變矩陣或可變矩陣函數(shù)203(下稱為“矩陣203”)。可以考慮將矩陣203作為圖2系統(tǒng)的信號路徑的一部分。矩陣203還從監(jiān)控器201接收一組最終的定標(biāo)因子SF1到SF23作為輸入,這些定標(biāo)因子用于圖1實(shí)例的23個輸出聲道中的每一個聲道??梢钥紤]將最終的定標(biāo)因子作為圖2系統(tǒng)的控制信號部件的輸出。如以下進(jìn)一步說明的,監(jiān)控器201優(yōu)選將用于每個“內(nèi)部”輸出聲道的初步定標(biāo)因子,作為最終的定標(biāo)因子傳送給矩陣,但是該監(jiān)控器響應(yīng)于它從諸模塊所接收的信息,為每個端點(diǎn)輸出聲道確定最終的定標(biāo)因子。一個“內(nèi)部”輸出聲道是每個模塊的兩個或更多“端點(diǎn)”輸出聲道的中間。可替換地,如果諸模塊產(chǎn)生輸出信號而不是定標(biāo)因子,則不需要矩陣203;監(jiān)控器本身產(chǎn)生該輸出信號。
在圖1的實(shí)例中,假設(shè)端點(diǎn)輸出聲道與輸入聲道位置相一致,盡管它們相一致不是必須的,如其他地方進(jìn)一步描述的。因此,輸出聲道2、4、6-8、10-12、14-16、17、18、19、20、21和22都是內(nèi)部輸出聲道。內(nèi)部輸出聲道21位于中間或者由三個輸入聲道(輸入聲道9’、13’和23’)框入,而其他內(nèi)部聲道每個在兩個輸入聲道中間(之間或框入)。由于對于在模塊之間或中間共享的這些端點(diǎn)輸出聲道(即,輸出聲道1、3、5、9、13、和23)存在多個初步定標(biāo)因子,因此監(jiān)控器201確定定標(biāo)因子SF1到SF23中最終的端點(diǎn)定標(biāo)因子(SF1、SF3等等)。最終的內(nèi)部輸出定標(biāo)因子(SF2、SF4、SF6等等)和初步定標(biāo)因子相同。
圖3是一個功能方框圖,它有利于理解監(jiān)控器,諸如圖2的監(jiān)控器201可以確定一個端點(diǎn)定標(biāo)因子的方式。該監(jiān)控器不對共享一個輸入的諸模塊的全部輸出求和以得到一個端點(diǎn)定標(biāo)因子。相反,它另外諸如在一個組合器301中組合用于來自共享該輸入諸如輸入9’的每個模塊的一個輸入的總體估計的內(nèi)部能量,其中該輸入9’由圖2的模塊26和27所共享。該和表示了在全部連接模塊的內(nèi)部輸出所聲明的輸入的總能量電平。然后,諸如在組合器303中,從共享輸入的任何一個模塊(在本例中,為模塊26或模塊27)的該輸入的平滑輸入能量電平中減去該和(例如,如下所述的圖4B的平滑器325或327的輸出)。盡管從模塊到模塊的電平可能稍微不同,這是因?yàn)槊總€模塊都彼此獨(dú)立地調(diào)整其時間常量,但是足以在公共輸入選擇任何一個模塊的平滑輸入。在組合器303輸出端,該差別就是在該輸入想要的輸出信號能量電平,其中不允許能量電平低于零。諸如在分割器305中,通過在該輸入的平滑輸入電平來分割該想要的輸出信號電平,并如在方塊307中執(zhí)行平方根運(yùn)算,以獲得用于該輸出的最終的定標(biāo)因子(在本例中為SF9)。應(yīng)該注意到監(jiān)控器為每個這種共享的輸入推導(dǎo)出了單個的最終定標(biāo)因子,而不管多少模塊共享該輸入。一種確定屬于每個模塊輸入的內(nèi)部輸出的總估計能量的安排在以下結(jié)合圖6A被描述。
由于這些電平是能量電平(第二階數(shù)量),正如與幅度(第一階數(shù)量)相對,在分割操作之后,應(yīng)用平方根運(yùn)算以便獲得最終的定標(biāo)因子(將定標(biāo)因子與第一階數(shù)量相關(guān)聯(lián))。內(nèi)部電平的相加從總的輸入電平中減去都全部以純粹能量的含義執(zhí)行,這是因?yàn)榧僭O(shè)不同模塊內(nèi)部的內(nèi)部輸出是獨(dú)立的(不相關(guān)的)。如果該假設(shè)在某種特殊情況下不正確,那么計算可以在輸入產(chǎn)生比應(yīng)該產(chǎn)生信號而更多的剩余信號,這可能會在再現(xiàn)的聲場中導(dǎo)致稍微的空間失真(例如,稍微將其他相鄰內(nèi)部聲像推向該輸入),但是在相同情況之下,人耳很可能進(jìn)行相似地反應(yīng)。通過監(jiān)控器傳送內(nèi)部輸出聲道定標(biāo)因子,諸如模塊26的PSF6到PSF8,以作為最終的定標(biāo)因子(它們都未經(jīng)修改)。為了簡單起見,圖3僅僅示出了產(chǎn)生一個端點(diǎn)最終定標(biāo)因子。其他端點(diǎn)最終定標(biāo)因子可以相似的方式予以推導(dǎo)。
回到圖2的描述,如上所述,在可變矩陣203中,可變性可以復(fù)雜(全部系數(shù)可變)或是簡單(系數(shù)以組而變化,諸如將它們應(yīng)用于固定矩陣的輸入或輸出)。盡管可以應(yīng)用任何一種方法來產(chǎn)生基本上相同的結(jié)果,但其中一種較為簡單的方法是,已經(jīng)發(fā)現(xiàn)每個輸出的可變增益所跟隨的一個固定矩陣(每個輸出的增益受定標(biāo)因子控制)產(chǎn)生令人滿意的結(jié)果,并在這里描述的實(shí)施例中應(yīng)用該固定矩陣。盡管可使用一個可變矩陣,在該矩陣中每個矩陣系數(shù)是可變的,但是其中不利的是變量太多并需要更多的處理能量。
監(jiān)控器201還在將它們應(yīng)用到可變矩陣203之前執(zhí)行可選的最終定標(biāo)因子的時域平滑。在可變矩陣系統(tǒng)中,輸出聲道從不“關(guān)掉”,并安排各系數(shù)以增強(qiáng)某些信號和消除其他的信號。但是,正如本發(fā)明的所述實(shí)施例中的固定矩陣、可變增益系統(tǒng),相反卻開啟和關(guān)掉聲道,同時對于不想要的“振動”假象更為敏感。盡管有以下所述的兩級平滑(例如,平滑器319/325,等等),但是這種現(xiàn)象仍有可能會發(fā)生。例如,當(dāng)定標(biāo)因子接近于零時,由于只需要小的變化從‘小’到‘無’然后從‘無’到‘小’,因此轉(zhuǎn)換到零和從零轉(zhuǎn)換可以引起可聽的振動。
監(jiān)控器201所執(zhí)行的可選平滑優(yōu)選地利用可變時間常量來平滑輸出定標(biāo)因子,該常量取決于最新推導(dǎo)的瞬時定標(biāo)因子值和平滑的定標(biāo)因子的連續(xù)值之間絕對差的大小(“abs-dif’)。例如,如果abs-dif大于0.4(當(dāng)然,小于等于1.0),則幾乎不應(yīng)用和沒有任何平滑操作;應(yīng)用小附加量的平滑給位于0.2和0.4之間的abs-diff值;低于0.2的值,時間常量是一個連續(xù)的abs-diff的逆函數(shù)。盡管這些值不是關(guān)鍵,但是發(fā)現(xiàn)它們減少了可聽的振動假象??蛇x地,在一個模塊的多頻帶版本中,定標(biāo)因子平滑器時間常量還可以利用頻率和時間一樣,以以下所述圖4A的頻率平滑器413、415和417的方式來定標(biāo)。
如上所述,可變矩陣203優(yōu)選為一個固定的解碼矩陣,該矩陣在矩陣輸出具有可變的定標(biāo)因子(增益)。每個矩陣輸出聲道可能具有(固定的)矩陣系數(shù),如果已存在具有不同輸入的一個編碼器(代替混音源聲道直接到下混音的陣列,這避免了需要不同的編碼器),則該系數(shù)可能已經(jīng)是用于該聲道編碼下混音系數(shù)。對于每個輸出聲道來說,該系數(shù)優(yōu)選平方和是1.0。一旦已知了輸出聲道在哪里(如上述討論的有關(guān)“主”矩陣),矩陣系數(shù)就是固定的;而控制每個聲道輸出增益的定標(biāo)因子則是動態(tài)的。
以接收器電平計算初始數(shù)量的能量和公共能量之后,對此將如下進(jìn)一步說明,包括應(yīng)用到圖2模塊24-34的頻域變換接收器的輸入可由每個模塊分組為頻率子帶。因此,對于每個頻率子帶,都存在一個初步定標(biāo)因子(圖2中的PSF)和一個最終的定標(biāo)因子(圖2中的SF)。矩陣203所產(chǎn)生的頻域輸出聲道1-23每個都包括一組變換接收器(變換接收器的分成子帶大小的組由同一定標(biāo)因子處理)。該組頻域變換接收器被通過頻域到時域變換或變換函數(shù)205(下稱為“逆變換”)分別轉(zhuǎn)換為一組PCM輸出聲道1-23,該函數(shù)可能是監(jiān)控器201的函數(shù),但是為了簡明起見未單獨(dú)示出。監(jiān)控器201可以交織產(chǎn)生的PCM聲道1-23以提供單個交織的PCM輸出流或讓PCM輸出聲道作為單獨(dú)的流。
圖4A-4C示出了根據(jù)本發(fā)明一個方面的一個模塊的功能方框圖。該模塊從一個監(jiān)控器,諸如圖2的監(jiān)控器201接收兩個或更多的輸入信號流。每個輸入包括復(fù)數(shù)值的頻域變換接收器(bin)的總體。每個輸入,從1到m,都被應(yīng)用于計算每個接收器能量的一個函數(shù)或設(shè)備(諸如用于輸入1的函數(shù)或設(shè)備401,和用于輸入m的函數(shù)或設(shè)備403),該能量為每個變換接收器的實(shí)部和虛部值的平方和(為了簡化附圖只示出了用于兩個輸入的路徑,1和m)。還將每個輸入應(yīng)用于一個計算模塊輸入聲道上的每個接收器的公共能量的函數(shù)或設(shè)備405。在FFT實(shí)施例的情況下,可以通過取輸入采樣的交叉乘積來計算該公共能量(在兩個輸入的情況下,L和R,例如為,復(fù)數(shù)L接收器值的復(fù)數(shù)乘積的實(shí)部以及復(fù)數(shù)R接收器值的復(fù)數(shù)共軛)。使用實(shí)數(shù)值的實(shí)施例只需要交叉乘以每個輸入的實(shí)數(shù)值。對于多于兩個輸入的情況,可以應(yīng)用以下描述的特定的交叉乘法技術(shù),即,如果全部符號相同,則給乘積一個正號,否則給它一個負(fù)號,并通過可能的正結(jié)果的數(shù)量與可能的負(fù)結(jié)果的數(shù)量之比來定標(biāo)(總是存在兩種情況結(jié)果或者全部為正,或者全部為負(fù))。
公共能量的成對計算例如,假設(shè)輸入聲道對A/B包含了一個公共信號X以及各個、不相關(guān)的信號Y和ZA=0.707X+YB=0.707X+Z這里,定標(biāo)因子0.707=0.5]]>提供了映射到最近輸入聲道的保留能量。
RMSEnergy(A)=∫A2∂t=A2‾=(.707X+Y)2‾=(0.5X2+0.707XY+Y2)‾]]>=0.5X2‾+0.707XY‾+Y2‾]]>由于X和Y不相關(guān),XY=0所以A2‾=0.5X2‾+Y2‾]]>即,由于X和Y不相關(guān),輸入聲道A的總能量是信號X和Y的能量之和。
同理B2‾=0.5X2‾+Z2‾]]>由于X、Y和Z不相關(guān),A和B的平均交叉乘積是AB‾=0.5X2‾]]>因此,在輸出信號由兩個相鄰輸入聲道平等共享的情況下,該聲道還可以包含獨(dú)立的、不相關(guān)信號,這些信號的平均交叉乘積等于在每個聲道中公共信號分量的能量。如果公共信號不被平等地共享的話,即它偏向一個輸入,那么平均交叉乘積將會是A和B中公共分量能量之間的幾何平均,由此,通過聲道幅度比的平方根進(jìn)行歸一化,能夠推導(dǎo)出各個聲道公共能量估計。如下所述,在平滑級之后計算實(shí)際的時間平均值。
更高階公共能量計算為了推導(dǎo)帶有三個或更多輸入的解碼模塊的公共能量,有必要通知所有輸入信號的平均交叉乘積。簡單地執(zhí)行成對處理輸入不能區(qū)別每對輸入與全部輸入的公共信號之間的各個輸出信號。
例如,考慮三個輸入聲道,即A、B和C,這些聲道由不相關(guān)的信號W、Y、Z和公共信號X構(gòu)成A=X+WB=X+YC=X+Z如果計算平均交叉乘積,包含W、Y和Z組合的所有項都被消去,如在第二階計算中一樣,剩下X3的平均ABC‾=X3‾]]>不幸的是,如果X是零平均值的時間信號,正如所期望的,那么它立方的平均值也將是零。不像平均X2,它對于任何非零的X值都是正值,但X3與X符號相同,因此正和負(fù)的貢獻(xiàn)將趨于抵消。顯然,這對于X的任何奇數(shù)冪也同理,X的奇數(shù)冪對應(yīng)于奇數(shù)個的模塊輸入,但是大于2的偶指數(shù)也能夠?qū)е洛e誤的結(jié)果;例如,四個分量的輸入(X、X、-X、-X)將和(X、X、X、X)一樣具有相同的乘積/平均值。
通過應(yīng)用平均乘積技術(shù)的一種變型可以解決該問題。在平均之前,通過取該乘積的絕對值而去除每個乘積的符號。檢查乘積的每一項的符號。如果它們符號相同,則將乘積的絕對值應(yīng)用到平均器。如果符號中的任何一個與其他的符號不同的話,則平均該乘積的絕對值的負(fù)值。由于可能的同符號組合的數(shù)量可以不同于可能的不同符號組合的數(shù)量,因此將由相同符號組合和不同符號組合的數(shù)量之比構(gòu)成的加權(quán)因子應(yīng)用到求反絕對值乘積以進(jìn)行補(bǔ)償。例如,三輸入模塊有兩種方式用于相同的符號,這兩種方式來自于八種可能性,并留下六種可能的方式用于不同的符號,從而產(chǎn)生的定標(biāo)因子是2/6=1/3。如果且僅僅當(dāng)一個解碼模塊的全部輸入存在公共的信號分量時,這種補(bǔ)償才導(dǎo)致積分的或相加的乘積以正方向增長。
但是,為了不同階模塊的平均可以比較,它們?nèi)w必須具有相同的量。一個傳統(tǒng)的第二階相關(guān)包括平均量輸入乘法,因此,平均具有能量維數(shù)或冪的數(shù)量。因此,還必須修改在更高階相關(guān)中要平均的項以具有該冪的維數(shù)。對于第k階相關(guān)來說,因此在對其進(jìn)行平均之前,必須增加各個乘積絕對值到冪2/k。
當(dāng)然,不論階如何,如果需要的話,能夠計算一個模塊的各個輸入能量,把它作為相應(yīng)輸入信號的平方的平均值,不需要首先將它增加到k次冪然后減少到第二階數(shù)量。
回到圖4A的描述,可以通過各自的函數(shù)或設(shè)備407、409和411將每個方塊的變換接收器輸出分組為子帶。各子帶例如可近似于人耳的關(guān)鍵頻帶。圖4A-4C的實(shí)施例剩余的模塊在每個子帶上單獨(dú)并獨(dú)立地操作。為了簡化附圖,僅示出了在一個子帶上的操作。
來自方塊407、409和411的每個子帶被分別地應(yīng)用于頻率平滑器或頻率平滑函數(shù)413、415和417(下稱為“頻率平滑器”)。以下將說明頻率平滑器的作用。分別應(yīng)用來自頻率平滑器的每個頻率平滑的子帶到可選的提供時域平滑的“快速”平滑器或平滑函數(shù)419、421和423(下稱為“快速平滑器”)。盡管為優(yōu)選,但是當(dāng)快速平滑器的時間常量接近于產(chǎn)生輸入接收器的前向變換(例如,圖1監(jiān)控器201中的前向變換)的方塊長度時間時,可以省略快速平滑器。這些快速平滑器之所以快,是相對于“慢速”可變時間常量平滑器或平滑器函數(shù)425、427和429(下稱為“慢速平滑器”)而言的,這些慢速平滑器接收該快速平滑器的各個輸出。以下給出了快速和慢速平滑器時間常量值的一些實(shí)例。
因此,不論是通過前向變換的固有操作還是通過一個快速平滑器來提供快速平滑,都優(yōu)選兩級平滑動作,其中第二、較慢一級是可變的。但是,平滑的單獨(dú)一級可提供令人可以接受的結(jié)果。
慢速平滑器的時間常量優(yōu)選在一個模塊內(nèi)相互同步。這可能例如通過應(yīng)用相同的控制信息給每個慢速平滑器以及配置每個慢速平滑器以相同方式應(yīng)答所應(yīng)用的控制信息而予以實(shí)現(xiàn)。以下將描述對控制慢速平滑器的信息的推導(dǎo)。
優(yōu)選地,每對平滑器都以與圖4A和圖4B所示的對419/425、421/427和423/429所相同的方式串聯(lián),其中一個快速平滑器饋給一個慢速平滑器。串聯(lián)結(jié)構(gòu)的優(yōu)點(diǎn)在于,第二級可抵抗在對輸入處的短的快速信號峰值。但是,通過并行地配置這些平滑器對也可以獲得相似的結(jié)果。例如,在并行結(jié)構(gòu)中,可以在時間常量控制器的邏輯中處理串聯(lián)結(jié)構(gòu)中第二級對短的快速信號峰值的抵抗。
通過單極低通濾波器(“泄漏積分器”)諸如RC低通濾波器(在模擬的實(shí)施例中)或等同地,一個第一階低通濾波器(在數(shù)字的實(shí)施例中)可以實(shí)現(xiàn)兩級平滑器的每一級。例如,在一個數(shù)字的實(shí)施例中,每一個第一階濾波器都可以被實(shí)現(xiàn)為“雙四邊形”濾波器,通常的第二階IIR濾波器,其中將某些系數(shù)設(shè)置為零,以便該濾波器用作一個第一階濾波器??商鎿Q地,兩個平滑器可以組合為一個單獨(dú)的第二階雙四邊形級,盡管如果它與第一(固定)級獨(dú)立,計算第二(可變)級的系數(shù)值則較為簡單。
應(yīng)該注意到在圖4A、4B和4C的實(shí)施例中,所有信號電平都被表示為能量(平方的)電平,除非由于取平方根而需要幅度。應(yīng)用平滑到所應(yīng)用信號的能量電平,以代替平均檢測而進(jìn)行平滑器RMS檢測(平均檢測平滑器由線性幅度饋給)。由于應(yīng)用到這些平滑器的信號是平方的電平,因此這些平滑器可以比平均平滑器更為快速地響應(yīng)信號電平的突然增加,這是由于平方函數(shù)放大了電平的增加。
因此,兩級平滑器為每個輸入聲道能量的每個子帶提供了時間平均值(慢速平滑器425提供了第一聲道的平均值以及慢速平滑器427提供了第m聲道的平均)并為輸入聲道公共能量的每個子帶提供了平均值(由慢速平滑器429提供)。
慢速平滑器(425、427、429)的平均能量輸出分別地應(yīng)用到組合器431、433和435,其中(1)從每個輸入聲道的平滑能量電平中減去相鄰能量電平(如果有的話)(例如,來自圖2的監(jiān)控器201),以及(2)從每個慢速平滑器的平均能量輸出中減去更高階相鄰能量電平(如果有的話)(例如,來自圖2的監(jiān)控器201)。例如,接收輸入3’(圖1和2)的每個模塊擁有兩個相鄰模塊并接收補(bǔ)償這兩個相鄰模塊影響的相鄰能量電平信息。但是,這些模塊中沒有一個模塊是一個“更高階”的模塊(即,共享輸入聲道3’的全部模塊是兩-輸入模塊)。相反,模塊28(圖1和2)是一個擁有共享它其中一個輸入的更高階模塊的模塊的實(shí)例。因此,例如在模塊28中,來自輸入13’的慢速平滑器的平均能量輸出接收更高階的相鄰電平補(bǔ)償。
產(chǎn)生的用于每個模塊輸入的每個子帶的“相鄰補(bǔ)償”能量電平被應(yīng)用到一個函數(shù)或設(shè)備437,該函數(shù)或設(shè)備計算這些能量電平的指定前進(jìn)的基本方向。可以計算方向性指示以作為加權(quán)能量輸入的向量和。對于一個兩輸入模塊,這簡化成為平滑的輸入信號能量電平和相鄰補(bǔ)償?shù)妮斎胄盘柲芰侩娖降腖/R比率。
例如,假設(shè)一個平面的環(huán)繞陣列,在該陣列中給出了聲道的位置,如2-ples表示用于兩個輸入情況下的x、y坐標(biāo)。假設(shè)中央的聽眾位于(0,0)。在歸一化空間坐標(biāo)中,左前聲道位于(1,1)。右前聲道位于(-1,1)。如果左輸入幅度(Lt)是4以及右輸入幅度(Rt)是3,那么使用這些幅度作為加權(quán)因子,指定的前進(jìn)基本方向是(4*(1,1)+3*(-1,1))/(4+3)=(0.143,1)或者稍微偏向連接左和右的水平線上的中央的左邊。
可替換地,一旦定義了一個主矩陣,那么就可以以矩陣坐標(biāo)而不是以物理坐標(biāo)來表示空間方向。在這種情況下,歸一化平方和為1的輸入幅度是該方向的有效矩陣坐標(biāo)。在上述實(shí)例中,“方向”是(0.8,0.6)。換句話說,指定的前進(jìn)基本方向是歸一化平方和為1版本的相鄰補(bǔ)償平滑輸入能量電平的平方根。方塊337產(chǎn)生相同數(shù)量的輸出,這些輸出指示一個空間方向,正如存在該模塊的輸入(在本實(shí)例中為2)。
應(yīng)用到方向確定函數(shù)或設(shè)備337的用于每個模塊輸入的每個子帶的相鄰補(bǔ)償平滑能量電平,還可以被應(yīng)用到計算相鄰補(bǔ)償互相關(guān)(“相鄰補(bǔ)償_xcor”)的函數(shù)或設(shè)備339。方塊330還從慢速可變平滑器329接收用于每個子帶的模塊輸入的平均公共能量作為一個輸入,如果有的話,通過更高階相鄰能量電平在組合器335中已經(jīng)補(bǔ)償過了慢速平滑器的輸出。在方塊339中計算相鄰補(bǔ)償互相關(guān)以作為被用于每個模塊輸入聲道的相鄰補(bǔ)償平滑能量電平的乘積的第M個根相除的更高階補(bǔ)償?shù)钠交材芰?,這里M是輸入的數(shù)量,以便推導(dǎo)出一個范圍從1.0到-1.0的真實(shí)的數(shù)學(xué)相關(guān)值。優(yōu)選地,從0到-1.0的值被取為0。相鄰補(bǔ)償_xcor提供了存在于其他未出現(xiàn)模塊中的互相關(guān)的一個估計。
然后,將來自方塊339的相鄰補(bǔ)償_xcor應(yīng)用到一個加權(quán)設(shè)備或函數(shù)341,該設(shè)備利用相鄰補(bǔ)償方向信息加權(quán)相鄰補(bǔ)償_xcor以產(chǎn)生一個方向加權(quán)相鄰補(bǔ)償互相關(guān)(“方向加權(quán)_xcor”)。加權(quán)隨著指定前進(jìn)的基本方向從一個中央狀態(tài)離開而增加。換句話說,不相等的輸入幅度(以及因此能量也不相等)導(dǎo)致了方向加權(quán)_xcor成比例的增加。方向加權(quán)_xcor提供了聲像壓縮的一個估計。因此,在例如擁有左L和右R輸入的兩輸入模塊的情況下,加權(quán)隨著該方向離開中央偏向左或者是右而增加(即,加權(quán)對于偏離中央的相同程度而言在任何方向都相同)。例如,在一個兩輸入模塊的情況下,相鄰補(bǔ)償_xcor值由一個L/R或R/L比率來加權(quán),以便非均勻信號分布促進(jìn)方向加權(quán)_xcor趨向1.0。對于這樣的一個兩輸入模塊,當(dāng)R大于等于L時,方向加權(quán)_xcor=(1-((1-相鄰補(bǔ)償_xcor)*(L/R))以及當(dāng)R小于L時,
方向加權(quán)_xcor=(1-((1-相鄰補(bǔ)償_xcor)*(R/L))對于具有多于兩個輸入的模塊來說,根據(jù)相鄰加權(quán)的_xcor計算方向加權(quán)_xcor例如需要,首先通過在1.0和0之間變化的“平均”度量代替比率L/R或R/L。例如,為了計算任何數(shù)量輸入的平均度量,通過總的輸入功率來歸一化輸入信號電平,并產(chǎn)生了歸一化的輸入電平,該電平能量(平方)和檢測為1.0。每個歸一化的輸入電平被位于陣列中央的信號的類似歸一化的輸入電平相除。最小比值成將成為平均度量。所以,例如,對于三輸入模塊來說,其中一個輸入的電平是零,因此平均度量是零,并且方向加權(quán)_xcor等于1。(在這種情況下,信號位于三輸入模塊的邊界,在它兩個輸入中間的一條線上,并且一個兩輸入模塊(分級較低的)判定指定前進(jìn)的基本方向位于該條線上哪個位置,以及沿著這條線應(yīng)該將輸出信號擴(kuò)展多寬。)回到圖4B的描述,進(jìn)一步通過到函數(shù)或設(shè)備443的應(yīng)用來加權(quán)方向加權(quán)_xcor以產(chǎn)生一個“有效的_xcor”,該設(shè)備應(yīng)用一個“隨機(jī)_xcor”加權(quán)。有效的_xcor提供了輸入信號分布形狀的一個估計。
隨機(jī)_xcor是被平均輸入能量的平方根相除的輸入幅度的平均交叉乘積。通過假設(shè)輸出聲道為原始的模塊輸入聲道,可以計算隨機(jī)_xcor的值,以及計算由所有這些聲道產(chǎn)生的xcor值,這些聲道具有獨(dú)立的、但電平相等的信號,并且被被動地下混音。根據(jù)這種解決途徑,對于帶有兩個輸入的三輸出模塊的例子,隨機(jī)_xcor計算為0.333,對于帶有兩個輸入的五輸出模塊(三個內(nèi)部輸出)來說,隨機(jī)_xcor計算為0.483。對于每個模塊,只需要計算隨機(jī)_xcor值一次。盡管已經(jīng)發(fā)現(xiàn)這些隨機(jī)_xcor值提供了令人滿意的結(jié)果,但是這些值并不是關(guān)鍵的,以及從系統(tǒng)設(shè)計者的判斷來看還可以應(yīng)用其他的值。隨機(jī)_xcor值中的變化影響了信號分布系統(tǒng)操作的兩種狀態(tài)之間的分界線,如下所述。該分界線的精確位置并不關(guān)鍵。
可以考慮將函數(shù)或設(shè)備343所執(zhí)行的隨機(jī)_xcor加權(quán)作為一種重新歸一化方向加權(quán)_xcor值,以便獲得一個有效的_xcor有效_xcor=(方向加權(quán)_xcor-隨機(jī)_xcor)/(1-隨機(jī)_xcor),如果方向加權(quán)_xcor大于等于隨機(jī)_xcor;否則,有效_xcor=0隨著方向加權(quán)_xcor減少到低于1.0,隨機(jī)_xcor加權(quán)加速了方向加權(quán)_xcor的減少,以便當(dāng)方向加權(quán)_xcor等于隨機(jī)_xcor時,有效_xcor的值等于0。由于一個模塊的各輸出表示沿一個圓弧或一條線的方向,小于零的有效_xcor值被認(rèn)為是等于零。
從非相鄰補(bǔ)償?shù)穆俸涂焖倨交斎肼暤赖哪芰恳约奥俸涂焖倨交斎肼暤赖墓材芰縼硗茖?dǎo)用于控制慢速平滑器325、327和329的信息。特別是,函數(shù)或設(shè)備345響應(yīng)于快速平滑輸入聲道的能量和快速平滑輸入聲道的公共能量,以計算一個快速非相鄰補(bǔ)償?shù)幕ハ嚓P(guān)。函數(shù)或設(shè)備347響應(yīng)于快速平滑輸入聲道能量來計算一個快速非相鄰補(bǔ)償方向(比率或向量,如上述結(jié)合方塊337描述內(nèi)容所討論的)。函數(shù)或設(shè)備349響應(yīng)于該慢速平滑輸入聲道的能量和慢速平滑輸入聲道的公共能量,以計算一個慢速非相鄰補(bǔ)償互相關(guān)。函數(shù)或設(shè)備351響應(yīng)于慢速平滑輸入聲道的能量計算一個慢速非相鄰補(bǔ)償方向(比率或向量,如上討論)。該快速非相鄰補(bǔ)償互相關(guān)、快速非相鄰補(bǔ)償方向、慢速非相鄰補(bǔ)償互相關(guān)以及慢速非相鄰補(bǔ)償方向以及來自方塊341的方向加權(quán)_xcor,都被應(yīng)用于一個設(shè)備或函數(shù)353,該設(shè)備或函數(shù)353提供用于控制可變慢速平滑器325、327和329以調(diào)整其時間常量(下稱為“調(diào)整時間常量”)的信息。優(yōu)選地,應(yīng)用相同的控制信息給每個可變慢速平滑器。不象饋給時間常量選擇方框的其他數(shù)量,這些數(shù)量比較快速和慢速度量,優(yōu)選地使用方向加權(quán)_xcor而不參考任何的快速值,以便如果方向加權(quán)_xcor的絕對值大于一個門限,那么它可能會導(dǎo)致調(diào)整時間常量353以選擇一個更為快速的時間常量。以下將闡述“調(diào)制時間常量”353操作的原則。
一般在一個動態(tài)音頻系統(tǒng)中,都期望盡可能地使用位于一個靜態(tài)值的慢速時間常量以最小化再現(xiàn)聲場的可聽中斷,除非音頻信號中發(fā)生了“新事件”,在這種情況下,期望控制信號來迅速地改變到一個新的靜態(tài)值,然后保持在該值直到另一個“新事件”發(fā)生。典型地,音頻處理系統(tǒng)已經(jīng)利用一個“新事件”使得幅度變化相等。但是,當(dāng)處理交叉乘積或互相關(guān)時,新事件和幅度并不總是相等新事件可能引起互相關(guān)的減少。通過檢測與模塊操作有關(guān)的參數(shù)中的變化,即度量互相關(guān)和方向,模塊的時間常量可以加速并根據(jù)需要快速地假設(shè)一種新的控制狀態(tài)。
不正確的動態(tài)行為的后果包括漂移、振動(聲道快速地開啟和關(guān)掉)、脈動(電平的不自然變化),以及在多頻帶實(shí)施例中,還包括有鳴叫(在一個個頻帶的基礎(chǔ)上振動和脈動)。這些影響中的一些對于隔離聲道的質(zhì)量尤為關(guān)鍵。
諸如圖1和2的一個實(shí)施例應(yīng)用解碼模塊的網(wǎng)格。這樣的一種結(jié)構(gòu)產(chǎn)生了兩類的動態(tài)問題模塊中間和模塊內(nèi)部動態(tài)。另外,多個實(shí)現(xiàn)音頻處理的方法(例如,寬帶、使用FFT或MDCT線性濾波器組的多頻帶,或不同的濾波器組,關(guān)鍵頻帶或其他)每個都需要它自己的動態(tài)行為優(yōu)化。
每個模塊內(nèi)基本的解碼處理取決于輸入信號能量比率的度量和輸入信號互相關(guān)的度量,(具體來說,方向加權(quán)相關(guān)(方向加權(quán)_xcor),如上所述;圖4B中方塊341的輸出),這些度量一起來控制模塊輸出中的信號分布。推導(dǎo)這種基本量需要平滑,該平滑在時域中需要計算這些量瞬時值的時間加權(quán)平均值。所需時間常量的范圍相當(dāng)?shù)拇髮τ谛盘枲顟B(tài)中的快速瞬變變化,該時間常量非常短(例如,1毫秒),到對于相關(guān)的較小值來說,時間常量又非常長(例如,150毫秒),這里瞬時變化有可能顯著大于真實(shí)的平均值。
實(shí)現(xiàn)可變時間常量行為的一種普遍的方法是,在模擬中使用一個“加速”二極管。當(dāng)瞬時電平超出平均電平一個門限量時,二極管產(chǎn)生了較短的有效時間常量。這種技術(shù)的一個缺點(diǎn)是在其他的穩(wěn)定狀態(tài)輸入中的瞬間峰值可能導(dǎo)致平滑電平中的巨大變化,然后,該峰值將非常緩慢地衰變,以提供獨(dú)立峰值的不自然加重,該峰值將會具有很少的可聽結(jié)果。
結(jié)合圖4A-4C的實(shí)施例描述的相關(guān)計算使得加速二極管(或等同使用DSP)的使用出現(xiàn)問題。例如,特定模塊內(nèi)的所有平滑器優(yōu)選地?fù)碛型綍r間常量,以便它們的平滑電平是可比的。所以,優(yōu)選一種全局(群)時間常量開關(guān)機(jī)制。另外,信號狀態(tài)的快速變化并不必須與公共能量電平的增加相關(guān)聯(lián)。為該電平使用一個加速二極管有可能產(chǎn)生偏置的、不精確的相關(guān)估計。因此,本發(fā)明各方面的實(shí)施例優(yōu)選地使用兩級平滑而不需要一個等同二極管的加速。相關(guān)和方向的估計可以至少根據(jù)這些平滑器的第一和第二級來推導(dǎo)以設(shè)置第二級的時間常量。
對于每一對平滑器(例如,319/325),第一級、固定的最后一級、時間常量可以被設(shè)置為一個固定值,諸如1毫秒。第二級、可變慢速級、時間常量可以例如在10毫秒(快速)、30毫秒(中間值)以及150毫秒(慢速)之間進(jìn)行選擇。盡管已經(jīng)發(fā)現(xiàn)這些時間常量提供了令人滿意的結(jié)果,但是它們的值并不是關(guān)鍵的,從系統(tǒng)設(shè)計者看來,還可以應(yīng)用其他的值。另外,第二級時間常量值可以連續(xù)變化而不是離散的。選擇時間常量可以不僅基于上述的信號狀態(tài),而且還可以基于一種使用“快速標(biāo)記”的滯后機(jī)制,該機(jī)制用于保證一旦遇到了真正的快速轉(zhuǎn)換,系統(tǒng)將保持在快速模式,以避免使用中間的時間常量,一直到信號狀態(tài)重新啟動慢速時間常量為止。這可能會有助于保證快速適應(yīng)于新的信號狀態(tài)。
選擇使用三種可能的第二級時間常量中的哪一種可以根據(jù)以下用于兩個輸入情形的原則通過“調(diào)整時間常量”353來實(shí)現(xiàn)如果方向加權(quán)_xcor的絕對值小于第一參考值(例如,0.5)和快速非相鄰補(bǔ)償_xcor和慢速非相鄰補(bǔ)償_xcor之間的絕對差小于同一第一參考值,以及快速和慢速方向比率(每個比率的范圍是+1到-1)之間的絕對差小于同一第一參考值,則使用慢速第二級時間常量,并將快速標(biāo)記設(shè)定為真,以啟動接下來的中間時間常量的選擇。
否則,如果快速標(biāo)記為真,快速和慢速非相鄰補(bǔ)償_xcor之間的絕對差大于同一第一參考值并小于第二參考值(例如,0.75),快速和慢速瞬時L/R比之間的絕對差大于第一參考值并小于第二參考值,以及方向加權(quán)_xcor的絕對值大于第一參考值并小于第二參考值,則選擇中間的第二級時間常量。
否則,使用快速第二級時間常量,并設(shè)置快速標(biāo)記為假,禁止接下來的中間時間常量的使用,直到再次選擇了慢速時間常量。
換句話說,當(dāng)所有三個條件都是小于第一參考值時,就選擇慢速時間常量,當(dāng)所有的條件位于第一參考值和第二參考值之間以及在先條件是慢速時間常量時,就選擇中間的時間常量,當(dāng)任何一個條件都大于第二參考值時,選擇快速時間常量。
盡管已經(jīng)發(fā)現(xiàn)了上述原則和參考值產(chǎn)生了令人滿意的結(jié)果,但是這些并不是關(guān)鍵的,在系統(tǒng)設(shè)計者看來,還可以應(yīng)用這些原則的變型或其他的原則,其中上述原則考慮到了快速和慢速互相關(guān)和快速和慢速方向。另外,可以進(jìn)行其他的改變。例如,它可以簡化,但是對于使用二極管加速類型的處理來說是同等有效的,但是具有群操作,以便如果模塊中的任何一個平滑器處于快速模式,所有其他的平滑器也切換到快速模式。還可能期望對于時間常量確定和信號分布而言擁有單獨(dú)的平滑器,用于時間常量確定的平滑器保持有固定的時間常量,而只有信號分布時間常量變化。
由于即使在快速模式中,平滑的信號電平也需要多個毫秒來匹配,時間延遲可以被內(nèi)置于系統(tǒng)中以在應(yīng)用控制信號到信號路徑之前允許控制信號進(jìn)行匹配。在一個寬帶實(shí)施例中,可以將該延遲實(shí)現(xiàn)為信號路徑中離散的延遲(例如,5毫秒)。在多頻帶(變換)版本中,該延遲是方塊處理的自然結(jié)果,如果在該方塊的信號路徑矩陣變換之前對方塊進(jìn)行分析,可能不需要明確的延遲。
本發(fā)明各方面的多頻帶實(shí)施例可以和寬帶版本一樣使用相同的時間常量和原則,除非可以將平滑器的采樣速率設(shè)置為被方塊大小相除的信號采樣速率(例如,方塊速率),以便適當(dāng)?shù)卣{(diào)整在這些平滑器中所使用的系數(shù)。
在多頻帶實(shí)施例中,對于低于400Hz的頻率,優(yōu)選地將時間常量與頻率相反地定標(biāo)。在寬帶版本中,在不同頻率處不存在單獨(dú)的平滑器是不可能的,因此,正如部分補(bǔ)償,可應(yīng)用一個緩和帶通/預(yù)加重濾波器給輸入信號到控制路徑,以加重中間和上中間頻率。該濾波器例如可以具有兩極高通特性,其轉(zhuǎn)角頻率為200Hz,加上2極低通特性,其轉(zhuǎn)角頻率為8000Hz,加上一個預(yù)加重網(wǎng)絡(luò),該網(wǎng)絡(luò)應(yīng)用從400Hz提升到800Hz的6dB,以及從1600Hz提升到3200Hz的另一6dB。盡管已經(jīng)發(fā)現(xiàn)這種濾波器是合適的,但是濾波器特性并不是關(guān)鍵的,就系統(tǒng)設(shè)計者看來還可以應(yīng)用其他的參數(shù)。
除了時域平滑以外,本發(fā)明各方面的多頻帶版本優(yōu)選地還應(yīng)用頻域平滑,如上結(jié)合圖4A所述(頻率平滑器413、415和417)。對于每個方塊,可以利用滑動頻率窗來平均化非相鄰補(bǔ)償能量電平,以便在把能量電平應(yīng)用到接下來的如上所述的時域處理之前,將其調(diào)整到接近1/3-倍頻程(關(guān)鍵頻帶)帶寬。由于基于變換的濾波器組固有地具有線性頻率分辨率,該窗的寬度(變換系數(shù)的大小)隨著增加頻率而增加,并且通常在低頻率(低于大約400Hz)處該寬度只有一個變換系數(shù)寬。所以,應(yīng)用到多頻帶處理的總平滑更加依賴于低頻率處的時域平滑,以及在較高頻率處的頻域平滑,這里有時快速時間響應(yīng)有可能更有必要。
回到圖4C的描述,可以通過分別計算“優(yōu)勢”定標(biāo)因子分量、“填充”定標(biāo)因子分量和“過量端點(diǎn)能量”定標(biāo)因子分量的設(shè)備或函數(shù)455、457和459,以及各個歸一化器或歸一化器函數(shù)361、363和365,和取優(yōu)勢和填充定標(biāo)因子分量和/或填充和過量端點(diǎn)能量定標(biāo)因子分量的相加組合中最大值的設(shè)備或函數(shù)367的組合來產(chǎn)生初步定標(biāo)因子(在圖2中,示為“PSF”),這些初步定標(biāo)因子最終影響了優(yōu)勢/填充/端點(diǎn)信號分布。如果該模塊是多個模塊的其中之一,可發(fā)送該初步定標(biāo)因子給監(jiān)控器,諸如圖2的監(jiān)控器201。每一個初步定標(biāo)因子都可以具有從0到1的范圍。
優(yōu)勢定標(biāo)因子分量除了有效_xcor以外,設(shè)備或函數(shù)355(“計算優(yōu)勢定標(biāo)因子分量”)從方塊337接收相鄰補(bǔ)償方向信息并從本地矩陣369接收有關(guān)本地矩陣系數(shù)的信息,以便它可以確定N個最近輸出聲道(這里N=輸入數(shù)量),這些輸出聲道能夠被應(yīng)用到加權(quán)求和以產(chǎn)生指定的前進(jìn)基本方向坐標(biāo),并且該設(shè)備可以應(yīng)用“優(yōu)勢”定標(biāo)因子分量給輸出聲道以產(chǎn)生優(yōu)勢坐標(biāo)。如果指定的前進(jìn)基本方向碰巧與輸出方向相一致,那么方塊355的輸出為一個定標(biāo)因子分量,否則,該輸出是給指定前進(jìn)基本方向加括號的多個定標(biāo)因子分量(每個子帶的每個輸入數(shù)量擁有一個定標(biāo)因子分量)并且以適當(dāng)?shù)谋壤粦?yīng)用,以便就節(jié)約功率的意義來說搖攝或映射優(yōu)勢信號到正確的虛位置(即,對于N=2,兩個指定的優(yōu)勢聲道定標(biāo)因子分量應(yīng)該平方和為有效_xcor)。
對于一個兩輸入模塊,所有的輸出聲道都在一條線或圓弧上,因此,存在一種自然的排序(從“左”到“右”),相當(dāng)顯而易見的是,聲道都彼此相鄰。對于上述的假設(shè)情況,正如所示的,模塊具有帶有正弦/余弦系數(shù)的兩個輸入聲道和五個輸出聲道,可以假設(shè)指定的前進(jìn)基本方向是(0.8,0.6),該方向位于中間左ML聲道(.92,.38)以及中央C聲道(.71,.71)之間。以上可以通過找到兩個連續(xù)的聲道而實(shí)現(xiàn),這里L(fēng)系數(shù)大于指定的前進(jìn)基本方向L的坐標(biāo),以及它右邊的聲道具有一個小于優(yōu)勢L坐標(biāo)的L系數(shù)。
就恒定功率的意義來說,給兩個最近的聲道分配該優(yōu)勢定標(biāo)因子分量。為了完成分配,解答兩個方程和兩個未知的一個系統(tǒng),這些未知是優(yōu)勢方向(SFL)左邊的聲道的優(yōu)勢分量定標(biāo)因子分量,和指定前進(jìn)基本方向(SFR)的相應(yīng)的定標(biāo)因子分量(為SFL和SFR解答這些方程)。
第一優(yōu)勢坐標(biāo)=SFL*左聲道矩陣值1+SFR*右聲道矩陣值1第二優(yōu)勢坐標(biāo)=SFL*左聲道矩陣值2+SFR*右聲道矩陣值2注意到左和右聲道指的是給指定的前進(jìn)基本方向加括號的聲道,而不是模塊的L和R輸入聲道。
解答是每個聲道的倒數(shù)優(yōu)勢電平計算,并被歸一化平方和為1.0,以及用作優(yōu)勢分布定標(biāo)因子分量(SFL、SFR),每個分量用于其他聲道。換句話說,對于坐標(biāo)為C、D的信號來說,一個系數(shù)為A、B的輸出聲道的倒數(shù)優(yōu)勢值是AD-BC的絕對值。對于根據(jù)以下考慮的數(shù)字實(shí)例Antidom(ML聲道)=abs(.92*.6-.38*.8)=.248Antidom(C聲道)=abs(.71*.6-.71*.8)=.142(這里“abs”表示取絕對值)歸一化后者的兩個數(shù)字到平方和為1.0分別產(chǎn)生了值.8678和.4969。因此,切換這些值到相對的聲道,優(yōu)勢定標(biāo)因子分量是(注意到在方向加權(quán)之前,優(yōu)勢定標(biāo)因子的值是有效_xcor的平方根)ML dom sf=.4969*sqrt(有效_xcor)C dom sf=.8678*sqrt(有效_xcor)(優(yōu)勢信號比MidLout更接近于Cout)。
如果指定的前進(jìn)基本方向碰巧精確地指向兩個所選聲道的其中一個,那么正如其他聲道的優(yōu)勢定標(biāo)因子分量一樣,通過考慮所發(fā)生的可以更好地理解使用一個聲道被歸一化的antidom分量。假設(shè)一個聲道的系數(shù)是[A、B]和其他聲道的系數(shù)是[C、D],以及指定的前進(jìn)基本方向坐標(biāo)是[A、B](指向第一聲道),那么Antidom(第一聲道)=abs(AB-BA)Antidom(第二聲道)=abs(CB-DA)注意到第一antidom值是零。當(dāng)兩個antidom信號被歸一化成平方和是1.0時,第二antidom值也是1.0。當(dāng)切換時,正如所期望的,第一聲道接收一個1.0的優(yōu)勢定標(biāo)因子分量(有效_xcor的次平方根)以及第二聲道接收0.0。
當(dāng)這種解決方法被擴(kuò)展到具有多于兩個輸入的模塊時,不再存在一種自然排序,這種排序當(dāng)這些聲道位于一條線或圓弧上時而發(fā)生。例如,圖4B的方塊337通過利用輸入幅度在相鄰補(bǔ)償之后再次計算指定的前進(jìn)基本方向坐標(biāo),并歸一化坐標(biāo)成平方和為1。然后,例如圖4B的方塊455識別N個最近的聲道(這里N=輸入數(shù)量),這些聲道能夠被應(yīng)用于一個加權(quán)和以產(chǎn)生優(yōu)勢的坐標(biāo)。(注意到如果這些坐標(biāo)是(x、y、z)空間坐標(biāo),那么能夠計算距離或接近程度以作為坐標(biāo)差平方的和。)因此,由于必須加權(quán)求和這些聲道以產(chǎn)生該指定的前進(jìn)基本方向,因此不能總是拾取N個最近的聲道。
例如,假設(shè)聲道的一個三角形如圖5中的Ls、Rs和Top饋給一個三輸入模塊。假設(shè)存在一起接近該三角形底部的三個內(nèi)部輸出聲道,這些聲道的模塊本地矩陣系數(shù)分別是[.71、.69、.01]、[.70、.70、.01]和[.69、.71、.01]。假設(shè)指定的前進(jìn)基本方向稍微低于三角形的中央,其坐標(biāo)為[.6、.6、.53]。(注意三角形中間的坐標(biāo)是[.5、.5、.707]。)到指定前進(jìn)基本方向的這三個最近的聲道是位于三角形底板的那三個內(nèi)部聲道,但是它們不求和到使用0和1之間定標(biāo)因子的優(yōu)勢坐標(biāo),因此從底部和頂部端點(diǎn)聲道選擇兩個以分布該優(yōu)勢信號,并解決了三個加權(quán)因子的三個方程,以便完成該優(yōu)勢計算和進(jìn)行到填充和端點(diǎn)計算。
在圖1和2的實(shí)例中,只存在一個三輸入模塊,并且使用該模塊來推導(dǎo)唯一的一個內(nèi)部聲道,這簡化了計算。
填充定標(biāo)因子分量除了有效_xcor以外,設(shè)備或函數(shù)357(“計算填充定標(biāo)因子分量”)還從方塊341接收隨機(jī)_xcor、方向加權(quán)_xcor,“EQUIAMPL”(“EQUIAMPL”在以下定義和說明),并從本地矩陣接收有關(guān)本地矩陣系數(shù)的信息(在相同填充定標(biāo)因子分量不應(yīng)用于所有輸出的情況下,如以下結(jié)合圖14B所說明的)。方塊457的輸出是用于每個模塊輸出(每個子帶)的定標(biāo)因子分量。
如上所述,當(dāng)方向加權(quán)_xcor小于或等于隨機(jī)_xcor時,有效_xcor是零。當(dāng)方向加權(quán)_xcor大于等于隨機(jī)_xcor時,用于全部輸出聲道的填充定標(biāo)因子分量是填充定標(biāo)因子分量=sqrt(1-有效_xcor)*EQUIAMPL因此,當(dāng)方向加權(quán)_xcor=隨機(jī)_xcor時,有效_xcor是0,因此(1-有效_xcor)是1.0,從而填充幅度定標(biāo)因子分量等于EQUIAMPL(保證了在該條件下輸出功率=輸入功率)。該點(diǎn)就是填充定標(biāo)因子分量所達(dá)到的最大值。
當(dāng)加權(quán)_xcor小于隨機(jī)xcor時,一個或多個優(yōu)勢定標(biāo)因子分量是0,以及當(dāng)方向加權(quán)_xcor接近零時,填充定標(biāo)因子分量也被減少到零填充定標(biāo)因子分量=sqrt(方向加權(quán)_xcor/隨機(jī)_xcor)*EQUIAMPL因此,在邊界處,當(dāng)方向加權(quán)_xcor=隨機(jī)_xcor時,填充的初步定標(biāo)因子分量再次等于EQUIAMPL,以對于方向加權(quán)_xcor大于隨機(jī)_xcor的情況來說,保證了與上述方程結(jié)果的連續(xù)性。
與每個解碼器模塊相關(guān)聯(lián)的不僅是隨機(jī)_xcor的一個值,而且是“EQUIAMPL”的一個值,如果這些信號被等同地分布,以便保留該功率時,該值是所有定標(biāo)因子應(yīng)該具有的一個定標(biāo)因子值,即EQUIAMPL=平方根(解碼器模塊輸入聲道的數(shù)量/解碼器模塊輸出聲道的數(shù)量)例如,對于一個具有三個輸出的兩輸入模塊EQUIAMPL=sqrt(2/3)=.8165這里“sqrt()”指“()的平方根”對于一個具有4個輸出的兩輸入模塊EQUIAMPL=sqrt(2/4)=.7071對于一個具有5個輸出的兩輸入模塊EQUIAMPL=sqrt(2/5)=.6325盡管已經(jīng)發(fā)現(xiàn)這些EQUIAMPL值提供令人滿意的結(jié)果,但是這些值并不是關(guān)鍵的,就系統(tǒng)設(shè)計者看來還可以應(yīng)用其他的值。相對于用于“優(yōu)勢”狀態(tài)(輸入信號的最大相關(guān))和“所有端點(diǎn)”狀態(tài)(輸入信號的最小相關(guān))的輸出聲道的電平,對于“填充”狀態(tài)(輸入信號的中間相關(guān))來說,EQUIAMPL值中的變化影響了輸出聲道的電平。
端點(diǎn)定標(biāo)因子分量除了相鄰補(bǔ)償_xcor(來自圖4B的方塊439)之外,設(shè)備或函數(shù)359(“計算過量端點(diǎn)能量定標(biāo)因子分量”)接收各個第一到第m輸入的平滑非相鄰補(bǔ)償能量(來自方塊325和327),可選地,還從本地矩陣接收有關(guān)本地矩陣系數(shù)的信息(在模塊的端點(diǎn)輸出之一或兩個都與一個輸入不一致的情況下,該模塊應(yīng)用過量端點(diǎn)能量給兩個輸出,這兩個輸出的方向最接近于輸入的方向,如以下所討論的)。如果這些方向與輸入方向相一致,那么方塊359的輸出是一個用于每個端點(diǎn)輸出的定標(biāo)因子分量,否則兩個定標(biāo)因子分量,其中用于每個輸出的一個分量最接近于該端點(diǎn),正如以下說明的。
但是,方塊359所產(chǎn)生的過量端點(diǎn)能量定標(biāo)因子分量不是唯一的“端點(diǎn)”定標(biāo)因子分量。存在三個其他來源的端點(diǎn)定標(biāo)因子分量(在單個、獨(dú)立模塊的情況下為兩個定標(biāo)因子分量)首先,在一個特定的模塊的初步定標(biāo)因子計算中,這些端點(diǎn)對于方塊335(和歸一化器361)的優(yōu)勢信號定標(biāo)因子分量是可能的候選。
其次,在圖4C的方塊357(和歸一化器363)的“填充”計算中,將這些端點(diǎn)作為可能的填充候選與所有的內(nèi)部聲道一起來處理??蓱?yīng)用任何非零填充定標(biāo)因子分量給所有的輸出,甚至應(yīng)用于端點(diǎn)和所選的優(yōu)勢輸出。
最后,如果存在多個模塊的一個網(wǎng)格,監(jiān)控器(諸如圖3實(shí)例中的監(jiān)控器201)執(zhí)行最終、第四、“端點(diǎn)”聲道的分配,如以上結(jié)合圖2和3所述。
為了方塊459根據(jù)相鄰補(bǔ)償_xcor計算“過量端點(diǎn)能量”定標(biāo)因子分量,所有內(nèi)部輸出的總能量被反射回到模塊的輸入,以估計每個輸入貢獻(xiàn)了多少內(nèi)部輸出的能量(在輸入“n”的內(nèi)部能量),以及使用該能量來計算在與一個輸入相一致的每個模塊輸出處(即,端點(diǎn))的過量端點(diǎn)能量定標(biāo)因子分量。
還需要反射內(nèi)部能量回到輸入,以便提供監(jiān)控器,諸如圖2的監(jiān)控器201所需要的信息,以計算相鄰電平和更高階的相鄰電平。在圖6A和6B中示出了一種計算在每個模塊輸入處內(nèi)部能量的貢獻(xiàn)以及為每個端點(diǎn)輸出確定過量端點(diǎn)定標(biāo)因子分量的方法。
圖6A和6B是功能方框圖,其分別示出了在諸如圖2模塊24-34中的任何一個模塊中,一種適當(dāng)?shù)陌才庞糜?1)響應(yīng)于每個輸入即從1到m的總能量,為模塊的每個輸入即從1到m,產(chǎn)生總的估計內(nèi)部能量,以及(2)響應(yīng)于相鄰補(bǔ)償_xcor(參見圖4B,方塊439的輸出),為每個模塊端點(diǎn)產(chǎn)生一個過量端點(diǎn)能量定標(biāo)因子分量。監(jiān)控器需要用于一個模塊的每個輸入的總的估計內(nèi)部能量,(圖6A),在一個多模塊的結(jié)構(gòu)中,以及在任何情況下,由模塊本身來產(chǎn)生過量端點(diǎn)能量定標(biāo)因子分量。
使用在圖4C的方塊455和457中推導(dǎo)的定標(biāo)因子分量以及其他信息,圖6A的結(jié)構(gòu)計算每個內(nèi)部輸出(而不是它的端點(diǎn)輸出)處總的估計能量。使用計算的內(nèi)部輸出能量電平,它將每個輸出電平乘以與到每個輸入的輸出有關(guān)的矩陣系數(shù)[“m”個輸入,“m”個乘法器],以提供到該輸出的該輸入的能量分布。對于每個輸入,它對所有內(nèi)部輸出聲道的全部能量貢獻(xiàn)求和以獲得該輸入的總內(nèi)部能量貢獻(xiàn)。將每個輸入的該總的內(nèi)部能量貢獻(xiàn)報告給監(jiān)控器,并由模塊使用它來為每個端點(diǎn)輸出計算過量端點(diǎn)能量定標(biāo)因子分量。
詳細(xì)地參考圖6A,用于每個模塊輸入的平滑的總能量電平(優(yōu)選為,非相鄰補(bǔ)償)被應(yīng)用于一組乘法器,一個乘法器用于模塊的每一內(nèi)部輸入。為了簡化表示,圖6A示出了兩個輸入,即“1”和“m”以及兩個內(nèi)部輸出“X”和“Z”。用于每個模塊輸入的平滑的總能量電平被乘以一個(模塊的本地矩陣的)矩陣系數(shù),該系數(shù)與其中的一個模塊內(nèi)部輸出的特定輸入有關(guān)(注意矩陣系數(shù)是其自己的倒數(shù),因?yàn)榫仃囅禂?shù)平方和是1)。對于輸入和內(nèi)部輸出的每一組合都進(jìn)行以上乘法運(yùn)算。因此,如圖6A所示,可將在輸入1的平滑的總能量電平(例如,可以在圖4B的慢速平滑器425的輸出而獲得)應(yīng)用到一個乘法器601,該乘法器將該能量電平乘以一個與輸入1的內(nèi)部輸出X有關(guān)的矩陣系數(shù),以在輸出X提供一個定標(biāo)的輸出能量電平分量X1。同理,乘法器603、605和607提供了定標(biāo)的能量電平分量Xm、Z1和Zm。
根據(jù)相鄰補(bǔ)償_xcor以幅度/功率的方式,在組合器611和613中對用于每個內(nèi)部輸出的能量電平分量(X1和Xm;Z1和Zm)進(jìn)行求和。如果到一個組合器的各輸入同相,這通過值為1.0的相鄰加權(quán)互相關(guān)予以指示,那么這些輸入的線性幅度相加。如果各輸入不相關(guān),這通過值為零的相鄰加權(quán)互相關(guān)予以指示,那么這些輸入的能量電平相加。如果互相關(guān)位于1和0之間,那么求和就是部分為幅度求和并且部分為功率求和。為了正確地對每個組合器的輸入進(jìn)行求和,同時計算幅度求和以及功率求和,并分別通過相鄰補(bǔ)償_xcor和(1-相鄰加權(quán)_xcor)對它們加權(quán)。為了獲得加權(quán)求和,取功率求和的平方根以獲得一個等同的幅度,或者平方該線性幅度求和以在平方該加權(quán)求和之前而獲得它的功率電平。例如,采用后者方法(功率的加權(quán)求和),如果幅度電平是3和4,相鄰加權(quán)_xcor是,幅度求和則為3+4=7,或者功率電平是49以及功率能量求和是9+16=25。因此加權(quán)求和是0.7*49+(1-0.7)*25=41.8(功率能量電平),或者取平方根,即6.47。
在乘法器613和615中,將求和產(chǎn)物(X1+Xm;Z1+Zm)乘以用于每個輸出X和Z的定標(biāo)因子分量,以在每個內(nèi)部輸出產(chǎn)生總的能量電平,并可以將能量電平標(biāo)識為X’和Z’。從方塊467(圖4C)獲得用于每個內(nèi)部輸出的定標(biāo)因子分量。注意到來自方塊459(圖4C)的“過量端點(diǎn)能量定標(biāo)因子分量”不會影響內(nèi)部輸出,并且也不包含在圖6A結(jié)構(gòu)所執(zhí)行的計算中。
通過將每個能量電平乘以一個(模塊本地矩陣的)矩陣系數(shù),可以將在每個內(nèi)部輸出的總的能量電平,X’和Z’,反射回到模塊的各個輸入,該系數(shù)與每個模塊輸入的特定輸出有關(guān)。對于內(nèi)部輸出和輸入的每個組合都執(zhí)行上述乘法。因此,如圖6A所示,應(yīng)用在內(nèi)部輸出X的總的能量電平X’給一個乘法器617,該乘法器將能量電平乘以一個以輸入1的內(nèi)部輸出X有關(guān)的矩陣系數(shù)(該系數(shù)與其倒數(shù)相同,如上所述),以在輸入1提供一個定標(biāo)的能量電平分量X1’。
應(yīng)該注意到當(dāng)?shù)诙A值,諸如總的能量電平X’,通過一個第一階值,諸如一個矩陣系數(shù)加權(quán)時,則需要一個第二階加權(quán)。這等同于利用能量的平方根來獲得一個幅度,將該幅度乘以該矩陣系數(shù)并平方相乘的結(jié)果以得到一個能量值。
同理,乘法器619、621和623提供定標(biāo)的能量電平Xm’、Z1’和Zm’。與每個輸出有關(guān)的能量分量被以幅度/功率的方式根據(jù)相鄰補(bǔ)償_xcor在組合器625和627中進(jìn)行求和,如上結(jié)合組合器611和613所述。組合器625和627的輸出分別表示用于輸入1和m的總的估計內(nèi)部能量。在一個多模塊網(wǎng)格的情況下,發(fā)送該信息給監(jiān)控器,諸如圖2的監(jiān)控器201,以便該監(jiān)控器可以計算相鄰電平。監(jiān)控器從與該輸入連接的全部模塊請求每個輸入的全部的總的內(nèi)部能量貢獻(xiàn),然后它通知每個模塊,對于它的每個輸入,有哪些全部的其他總計內(nèi)部能量貢獻(xiàn)之和是來自與該輸入連接的全部其他模塊。結(jié)果是用于該模塊輸入的相鄰電平。以下將進(jìn)一步描述產(chǎn)生相鄰電平信息。
該模塊還需要每個輸入1和m所貢獻(xiàn)的總的估計內(nèi)部能量,以計算用于每個端點(diǎn)輸出的過量端點(diǎn)能量定標(biāo)因子分量。圖6B示出了可以計算多少定標(biāo)因子分量信息。為了簡化表示,僅僅示出了計算用于一個端點(diǎn)的定標(biāo)因子分量信息,應(yīng)該理解對于每個端點(diǎn)輸出都可以執(zhí)行類似的計算。在組合器或組合函數(shù)629中,從用于同一輸入即在本實(shí)例中為輸入1的平滑的總輸入能量中減去一個輸入,諸如輸入1所貢獻(xiàn)的總的估計內(nèi)部能量(例如在圖4B的慢速平滑器425的輸出,獲得輸入1的相同的平滑的總能量電平,并將它應(yīng)用到一個乘法器601)。在除法器或除法功能631中通過同一輸入1的平滑的總能量電平除以減法的結(jié)果。在平方根計算器或平方根函數(shù)633中取相除結(jié)果的平方根。應(yīng)該注意到,除法器或除法函數(shù)631(以及這里所述的其他除法器)的運(yùn)算應(yīng)該包括零分母的一個測試。在這種情況下,可以將商設(shè)置為零。
如果只有一個單個的、單獨(dú)模塊,因此,通過依靠已經(jīng)確定優(yōu)勢、填充和過量端點(diǎn)能量定標(biāo)因子來確定端點(diǎn)初步定標(biāo)因子分量。
所以,包括端點(diǎn)的全部輸出聲道已經(jīng)分配了諸定標(biāo)因子,并且其中一個聲道可以繼續(xù)使用它們來執(zhí)行信號路徑矩陣化。但是,如果存在一個多模塊的網(wǎng)格,每個模塊已經(jīng)分配了一個端點(diǎn)定標(biāo)因子給饋給模塊的每個輸入,因此具有與該輸入相連接的多于一個的模塊的每個輸入擁有多個定標(biāo)因子分配,其中一個定標(biāo)因子來自每個相連接的模塊。在這種情況下,監(jiān)控器(諸如圖2實(shí)例的監(jiān)控器201)執(zhí)行最終的、第四、“端點(diǎn)”聲道的分配,如以上結(jié)合圖2和3所述。該監(jiān)控器確定最終的端點(diǎn)定標(biāo)因子,該最終的定標(biāo)因子覆蓋了各個模塊所分配的作為端點(diǎn)定標(biāo)因子的所有定標(biāo)因子。
在實(shí)際的安排中,不確定即實(shí)際上存在一種對應(yīng)于端點(diǎn)位置的輸出聲道方向,盡管這種情況經(jīng)常發(fā)生。如果不存在任何物理端點(diǎn)聲道的話,但是存在超越該端點(diǎn)的至少一個物理聲道,那么該端點(diǎn)能量將被移動到最接近端點(diǎn)的物理聲道,就好像它是一個優(yōu)勢信號分量。在水平陣列中,這是兩個最接近端點(diǎn)位置的聲道,它們優(yōu)選使用一個恒定能量分布(兩個定標(biāo)因子平方和是1.0)。換句話說,當(dāng)聲音方向不對應(yīng)于實(shí)際聲道的位置時,即使該方向是一個端點(diǎn)信號,那么它將優(yōu)選被移動到最近可用的一對實(shí)際聲道,因?yàn)槿绻曇艟徛苿?,那么該端點(diǎn)信號將突然從一個輸出聲道跳到另一個輸出聲道。因此,當(dāng)不存在任何物理的端點(diǎn)聲道時,將一個端點(diǎn)信號移動到一個最接近端點(diǎn)位置的聲道是不適當(dāng)?shù)?,除非不存在任何超越該端點(diǎn)的物理聲道,在這種情況下,沒有其他選擇除了移動到最接近端點(diǎn)位置的一個聲道。
實(shí)現(xiàn)這種移動的另一種方法是對于監(jiān)控器,諸如圖2的監(jiān)控器201根據(jù)一種假設(shè)即每個輸入還具有一個相應(yīng)的輸出聲道以產(chǎn)生“最終的”定標(biāo)因子(即,每個相應(yīng)的輸入和輸出都是相一致的,它們表示相同的位置)。然后,如果不存在實(shí)際的直接對應(yīng)于一個輸入聲道的輸出聲道,那么一個輸出矩陣,諸如圖2的可變矩陣203,可以將一個輸出聲道映射到一個或更多適當(dāng)?shù)妮敵雎暤馈?br>
如上所述,應(yīng)用每個“計算定標(biāo)因子分量”設(shè)備或函數(shù)455、457和459的輸出給各個歸一化設(shè)備或函數(shù)461、463和465。只所以想要這些歸一化器是因?yàn)?,方塊455、457和459所計算的定標(biāo)因子分量都是基于相鄰補(bǔ)償電平,而最終的信號路徑矩陣化(在主矩陣中,在多個模塊的情況下,或在本地矩陣中,在單獨(dú)模塊的情況下)包括非相鄰補(bǔ)償電平(應(yīng)用到矩陣的輸入信號未經(jīng)相鄰補(bǔ)償)。典型地,通過歸一化器減少了定標(biāo)因子分量的值。
一種實(shí)現(xiàn)歸一化器的合適方法如下所述。每個歸一化器(如從組合器331和333)接收用于每個模塊輸入的相鄰補(bǔ)償?shù)钠交斎肽芰浚?如從方塊325和327)接收用于每個模塊輸入的非相鄰補(bǔ)償?shù)钠交斎肽芰?,從本地矩陣接收本地矩陣系?shù)信息,以及方塊355、357和359的各個輸出。每個歸一化器為每個輸出聲道計算一個想要的輸出,并為每個輸出聲道計算一個實(shí)際的輸出電平,這里假設(shè)定標(biāo)因子是1。然后,通過為每個輸出聲道所計算的實(shí)際輸出電平除以用于每個輸出聲道的計算的想要輸出,并取商的平方根以提供一個潛在的初步定標(biāo)因子,以將它應(yīng)用到“求和和/或其中較大者”367??紤]以下的實(shí)例。
假設(shè)兩輸入模塊的平滑的非相鄰補(bǔ)償輸入能量電平是6和8,以及相應(yīng)的相鄰補(bǔ)償能量電平是3和4。還假設(shè)中央內(nèi)部輸出聲道的矩陣系數(shù)=(.71,.71),或其平方(0.5,0.5)。如果模塊為該聲道(基于相鄰補(bǔ)償電平)選擇一個初始的定標(biāo)因子0.5,或其平方=0.25,那么該聲道的想要的輸出電平是(為了簡單起見,假設(shè)純能量求和并使用相鄰補(bǔ)償電平).25*(3*.5+4*.5)=0875。
由于實(shí)際的輸入電平是6和8,如果上述值0.25的定標(biāo)因子(它的平方)被用于最終的信號路徑矩陣化,那么輸出電平將是.25*(6*.5+8*.5)=1.75代替想要的輸出電平0.875。當(dāng)使用非相鄰補(bǔ)償電平時,歸一化器調(diào)整該定標(biāo)因子以得到想要的輸出電平。
實(shí)際輸出,假設(shè)SF=1,=(6*.5+8*.5)=7.
(想要的輸出電平)/(實(shí)際的輸出假設(shè)SF=1)=0.875/7.0=0.125=平方的最終定標(biāo)因子用于該輸出聲道的最終定標(biāo)因子=sqrt(0.125)=0.354,代替了初始計算值0.5。
“求和和/或其中最大者”367優(yōu)選地對用于每個子帶的每個輸出聲道的相應(yīng)填充定標(biāo)因子分量和端點(diǎn)定標(biāo)因子分量求和,并選擇用于每個子帶的每個輸出聲道的優(yōu)勢和填充定標(biāo)因子分量中較大的一個。函數(shù)“求和和/或其中較大者”367的優(yōu)選形式可以如圖7所示來表征。即,應(yīng)用優(yōu)勢定標(biāo)因子分量和填充定標(biāo)因子分量給一個設(shè)備或函數(shù)701,該設(shè)備或函數(shù)選擇用于每個輸出的定標(biāo)因子分量中較大的一個(“其中較大者”701)并應(yīng)用它們給相加組合器或組合函數(shù)703,該組合器對來自其中較大者701的定標(biāo)因子分量與用于每個輸出的過量端點(diǎn)能量定標(biāo)因子求和??商鎿Q地,當(dāng)“求和和/或其中最大者”467為(1)在區(qū)域1和區(qū)域2中求和,(2)取區(qū)域1和非1區(qū)域2中較大的一個,或(3)選擇區(qū)域1中最大的一個并在區(qū)域2中求和,從而可以獲得可接受的結(jié)果。
圖8是本發(fā)明的一個方面響應(yīng)于互相關(guān)的度量而產(chǎn)生定標(biāo)因子分量的理想化表示方式。該圖特別有利于參考圖9A和9B到圖16A和16B的實(shí)例。如上所述,可以將定標(biāo)因子分量的產(chǎn)生考慮為具有兩個區(qū)域或操作區(qū)域第一區(qū)域,區(qū)域1,該區(qū)域的邊界是“全部優(yōu)勢”和“均勻填充”,其中可用的定標(biāo)因子分量是優(yōu)勢和填充定標(biāo)因子分量的一個組合,還有第二區(qū)域,區(qū)域2,其邊界是“均勻填充”和“全部端點(diǎn)”,其中可用的定標(biāo)因子分量是填充和過量端點(diǎn)能量定標(biāo)因子分量的一個組合。該“全部優(yōu)勢”邊界狀態(tài)發(fā)生在當(dāng)方向加權(quán)_xcor是1時。區(qū)域1(優(yōu)勢加填充)從該邊界延伸至方向加權(quán)_xcor等于隨機(jī)_xcor的該點(diǎn),即“均勻填充”狀態(tài)。“全部端點(diǎn)”邊界狀態(tài)發(fā)生在當(dāng)方向加權(quán)_xcor是零時。區(qū)域2(填充加端點(diǎn))從“均勻填充”邊界狀態(tài)延伸到“全部端點(diǎn)”邊界狀態(tài)??梢钥紤]“均勻填充”邊界點(diǎn)位于區(qū)域1或區(qū)域2中。如以下所述,精確的邊界點(diǎn)不是關(guān)鍵。
如圖8中所示例,隨著優(yōu)勢定標(biāo)因子分量值的減少,填充定標(biāo)因子分量的值在增加,以隨著優(yōu)勢定標(biāo)因子分量到達(dá)一個零值而到達(dá)最大值,在該點(diǎn)上,隨著填充定標(biāo)因子分量的值減少,過量端點(diǎn)能量定標(biāo)因子分量的值在增加。當(dāng)該結(jié)果應(yīng)用給接收模塊輸入信號的適當(dāng)矩陣時,它時一個輸出信號分布,當(dāng)輸入信號高度相關(guān)時,該信號分布提供了緊湊的聲像,并隨相關(guān)度的減少而從緊湊到寬擴(kuò)展(加寬),并隨著相關(guān)繼續(xù)減少到高度不相關(guān),而逐漸地從寬分離或向外彎曲成多個聲像,每個聲像位于一個端點(diǎn)上。
盡管期望對于完全相關(guān)的情況來說存在單個空間緊湊的聲像(在輸入信號的指定前進(jìn)基本方向),并且對于全部不相關(guān)的情況來說,存在多個個空間緊湊的聲像(每個聲像位于一個端點(diǎn)上),可以以除了圖8示例中所示以外的方式實(shí)現(xiàn)這些極端之間的空間擴(kuò)展聲像。例如,對于隨機(jī)_xcor=方向加權(quán)_xcor的情況來說,填充定標(biāo)因子分量值達(dá)到一個最大值并不關(guān)鍵,或者三個定標(biāo)因子分量的值如圖所示那樣線性變化也并不關(guān)鍵。對圖8的關(guān)系(以及這里表達(dá)的成為圖基礎(chǔ)的方程)和互相關(guān)適當(dāng)度量和定標(biāo)因子值之間的其他關(guān)系的修改還是本發(fā)明所期望的,其中這些值能夠?yàn)榛ハ嚓P(guān)度量產(chǎn)生緊湊優(yōu)勢以寬擴(kuò)展到緊湊端點(diǎn)信號分布,以從高度相關(guān)到高度不相關(guān)。例如,通過應(yīng)用諸如如上所述的雙區(qū)域方法來代替獲得一種緊湊優(yōu)勢以寬擴(kuò)展到緊湊端點(diǎn)信號分布,可以通過數(shù)學(xué)方法而獲得這些結(jié)果,諸如一種應(yīng)用基于偽逆的方程解決方法。
輸出定標(biāo)因子實(shí)例一系列理想化表示,如圖9A和9B到圖16A和16B,示例了用于輸入信號狀態(tài)的各實(shí)例的一個模塊的輸出定標(biāo)因子。為了簡化起見,假設(shè)單個、單獨(dú)的模塊,以便它為可變矩陣產(chǎn)生的諸定標(biāo)因子是最終的定標(biāo)因子。該模塊和相關(guān)聯(lián)的可變矩陣具有兩個輸入聲道(諸如左L和右R聲道),這兩個輸入聲道與兩個端點(diǎn)輸出聲道相一致(還可以是指定的L和R)。在該系列的實(shí)例中,存在三個內(nèi)部輸出聲道(諸如左中Lm,中間C,和右中Rm)。
“全部優(yōu)勢”、“組合優(yōu)勢和填充”、“均勻填充”、“混合填充和端點(diǎn)”以及“全部端點(diǎn)”的意義將進(jìn)一步結(jié)合圖9A和9B到圖16A和16B的實(shí)例予以示例。在每對圖(例如,圖9A和9B)中,“A”圖所示為兩個輸入左L和右R的能量電平,以及“B”圖所示為用于五個輸出,即左L、左中LM、中間C、右中RM和右R的定標(biāo)因子分量。這些圖未按比率繪制。
在圖9A中,輸入能量電平是相等的,如兩個垂直箭頭所示。另外,方向加權(quán)_xcor(和有效_xcor)是1.0(完全相關(guān))。在本實(shí)例中,只存在一個非零的定標(biāo)因子,如圖9B所示為位于C的單個垂直箭頭,并將該定標(biāo)因子應(yīng)用給中間內(nèi)部聲道C輸出,以產(chǎn)生空間上緊湊的優(yōu)勢信號。在該實(shí)例中,輸出位于中間(L/R=1),因此,碰巧與中間的內(nèi)部輸出聲道C相一致。如果不存在相一致的輸出聲道,則以適當(dāng)?shù)谋壤龖?yīng)用該優(yōu)勢信號給最近的輸出聲道,以便移動該優(yōu)勢信號到它們之間正確的虛位置。例如,如果不存在中間輸出聲道C,左中LM和右中RM輸出聲道將具有非零定標(biāo)因子,以使得該優(yōu)勢信號等同應(yīng)用于LM和RM輸出。在完全相關(guān)的情況下(全部優(yōu)勢信號),不存在填充和端點(diǎn)信號分量。因此,方塊467(圖4C)所產(chǎn)生的初步定標(biāo)因子與方塊361所產(chǎn)生的歸一化優(yōu)勢定標(biāo)因子分量相同。
在圖10A中,輸入能量電平是相等的,但方向加權(quán)_xcor小于1.0并且大于隨機(jī)_xcor。因此,定標(biāo)因子分量是區(qū)域1中的分量-組合的優(yōu)勢和填充定標(biāo)因子分量。歸一化優(yōu)勢定標(biāo)因子分量(來自方塊361)和歸一化填充定標(biāo)因子分量(來自方塊363)中較大者(通過367方塊)被應(yīng)用于每個輸出聲道,以便優(yōu)勢定標(biāo)因子位于和圖10B中相同的中央輸出聲道C處,但較小一些,并且填充定標(biāo)因子出現(xiàn)在每個其他的輸出聲道,即L、LM、RM和R(包括端點(diǎn)L和R)。
在圖11A中,輸入能量電平保持相等,但方向加權(quán)_xcor=隨機(jī)_xcor。因此,圖11的定標(biāo)因子是區(qū)域1和2之間邊界狀態(tài)的定標(biāo)因子-均勻填充狀態(tài),其中不存在優(yōu)勢或端點(diǎn)定標(biāo)因子,僅僅填充定標(biāo)因子在每個輸出具有相同的值(因此,被“均勻填充”),如在每個輸出的同一箭頭所指示的。在本例中填充定標(biāo)因子電平達(dá)到它們的最大值。如以下所討論的,可以諸如以漸縮的方式不均勻地應(yīng)用該填充定標(biāo)因子,這種方式取決于輸入信號狀態(tài)。
在圖12A中,輸入能量電平保持相等,但方向加權(quán)_xcor小于隨機(jī)_xcor且大于零(區(qū)域2)。因此,如圖12B所示,存在填充和端點(diǎn)定標(biāo)因子,但沒有優(yōu)勢定標(biāo)因子。
在圖13A中,輸入能量電平保持相等,但方向加權(quán)_xcor是零。因此,如圖13B中所示的定標(biāo)因子是全部端點(diǎn)邊界狀態(tài)的定標(biāo)因子。不存在內(nèi)部輸出定標(biāo)因子,而只有端點(diǎn)定標(biāo)因子。
在圖9A/9B到圖13A/13B的實(shí)例中,由于兩個輸入的能量電平相等,因此方向加權(quán)_xcor(諸如由圖4B的方塊441產(chǎn)生的)和相鄰補(bǔ)償_xcor(諸如由圖4B的方塊439產(chǎn)生的)相同。但是,在圖14A中,輸入能量電平卻不相等(L小于R)。盡管在本例中相鄰加權(quán)_xcor等于隨機(jī)_xcor,但是如圖14B所示產(chǎn)生的定標(biāo)因子并不是均勻應(yīng)用到如在圖11A和11B實(shí)例中所示的全部聲道的填充定標(biāo)因子。相反,不相等的輸入能量電平引起了方向加權(quán)_xcor中成比例的增加(與指定前進(jìn)基本方向離開它中央位置的程度成比例),以便該方向加權(quán)變得大于相鄰補(bǔ)償_xcor,籍此引起了定標(biāo)因子更加偏向全部優(yōu)勢而被加權(quán)(如圖8中所示例的)。這是一種期望的結(jié)果,因?yàn)轱@著L或R加權(quán)的信號不應(yīng)該具有寬的帶寬;它們應(yīng)該具有接近L或R聲道端點(diǎn)的緊湊帶寬。如圖14B所示,所產(chǎn)生的輸出是一個位于與R輸出相比更接近于L輸出的非零優(yōu)勢定標(biāo)因子(相鄰補(bǔ)償方向信息,在這種情況下,碰巧精確地定位優(yōu)勢分量在左中LM位置),減少了填充定標(biāo)因子幅度,并且不需要端點(diǎn)定標(biāo)因子(方向加權(quán)推送該操作到圖8的區(qū)域1(優(yōu)勢和填充組合))。
對于對應(yīng)于圖14B的定標(biāo)因子的五個輸出,輸出可以如下表示為Lout=Lt(SFL)MidLout=((.92)Lt+(.38)Rt))(SFMidL)Cout=((.45)Lt+(.45)Rt))(SFC)MidRout=((.38)Lt+(.92)Lt))(SFMidR)Rout=Rt(SFR)因此,在圖14B的實(shí)例中,即使用于四個輸出中除了MidLout以外每一個的定標(biāo)因子(SF)都相等(填充),那么相應(yīng)的信號輸出也不相等,這是因?yàn)長t大于Rt(導(dǎo)致了向左的更多信號輸出)和在中左的優(yōu)勢輸出大于定標(biāo)因子指示。由于指定的前進(jìn)基本方向與中左輸出聲道相一致,因此Lr和Rt之比和用于中左輸出聲道的矩陣系數(shù)相同,即0.92到0.38。假設(shè)上述系數(shù)值是用于Lt和Rt的實(shí)際幅度。為了這些輸出電平,將這些電平乘以相應(yīng)的矩陣系數(shù),相加,并通過各個定標(biāo)因子對其定標(biāo)輸出幅度(輸出聲道_sub_i)=sf(i)*(Lt_系數(shù)(i)*Lt+Rt_系數(shù)(i)*Rt)盡管優(yōu)選地考慮幅度和能量相加之間的組合(如在與圖6A有關(guān)的計算中),但是在本例中,互相關(guān)值相當(dāng)高(大的優(yōu)勢定標(biāo)因子),可以執(zhí)行通常的相加Lout=0.1*(1*0.92+0*0.38)=0.092MidLout=0.9*(0.92*0.92+0.38*0.38)=0.900Cout=0.1*(0.71*0.92+0.71*0.38)=0.092MidRout=0.1*(0.38*0.92+0.92*0.38)=0.070Rout=0.1*(0*0.92+1*0.38)=0.038因此,該實(shí)例表明在Lout、Cout、MidRout和Rout的信號輸出不相等,因?yàn)長t大于Rt,即使用于這些輸出的定標(biāo)因子相同。
填充定標(biāo)因子可以相等地分布給輸出聲道,如在圖10B、11B、12B和14B的實(shí)例中所示。可替換地,填充定標(biāo)因子分量而不是一樣的,可以通過某種方式隨著位置而發(fā)生變化,即作為優(yōu)勢(相關(guān))和/或端點(diǎn)(不相關(guān))輸入信號分量(或等同地,作為方向加權(quán)_xcor值的函數(shù))的函數(shù)。例如,對于方向加權(quán)_xcor的中等高的值,填充定標(biāo)因子分量幅度可以中凸地彎曲,以便接近指定前進(jìn)基本方向的輸出聲道可以比遠(yuǎn)離的聲道接收更多的信號電平。對于方向加權(quán)_xcor=隨機(jī)_xcor來說,填充定標(biāo)因子分量幅度可以變平為一種均勻分布,對于方向加權(quán)_xcor小于隨機(jī)_xcor,該幅度可能凹度地彎曲,以有利于接近端點(diǎn)方向的聲道。
在圖15B和圖16B中闡述這些彎曲的填充定標(biāo)因子幅度的各實(shí)例。圖15B來自一個輸入(圖15A)的輸出結(jié)果與上述圖10A中的相同。圖16B來自一個輸入(圖16A)的輸出結(jié)果與上述圖12B中的相同。
模塊和監(jiān)控器之間的通信關(guān)于相鄰電平和更高階的相鄰電平一個多模塊結(jié)構(gòu)中的每個模塊,諸如圖1和2的實(shí)例,需要兩種機(jī)制以便支持它和一個監(jiān)控器之間的通信,諸如圖2的監(jiān)控器201(a)一種機(jī)制是挑選和報告監(jiān)控器所需的信息以計算相鄰電平和更高階相鄰電平(若有的話)。監(jiān)控器所需的信息是例如由圖6A的結(jié)構(gòu)所產(chǎn)生的,屬于每個模塊輸入的總的估計內(nèi)部能量。
(b)另一種機(jī)制是從監(jiān)控器接收和應(yīng)用相鄰電平(若有的話)和更高階相鄰電平(若有的話)。在圖4B的實(shí)例中,在各個組合器431和433中從每個輸入的平滑能量電平中減去該相鄰電平,在各個組合器431、433和435中從每個輸入的平滑能量電平和整個聲道上的公共能量中減去更高階相鄰電平(若有的話)。
一旦監(jiān)控器知道了每個模塊的每個輸入的全部的總估計的內(nèi)部能量貢獻(xiàn)(1)監(jiān)控器確定是否每個輸入的總估計內(nèi)部能量貢獻(xiàn)(根據(jù)與該輸入相連接的全部模塊進(jìn)行求和)超過了該輸入的總的可用信號電平。如果該和超過了總共可用的信號電平,那么監(jiān)控器定標(biāo)回與該輸入相連接的每個模塊所報告的每個報告的內(nèi)部能量,以便它們求和到總的輸入電平。
(2)監(jiān)控器通知在每個輸入的其他內(nèi)部能量貢獻(xiàn)以作為該輸入的所有其他內(nèi)部能量貢獻(xiàn)的和(若有的話)。
更高階(HO)相鄰電平是一個或更多更高階模塊的相鄰電平,這些模塊共享較低等級模塊的輸入。對相鄰電平的上述計算僅僅與在特定輸入的模塊有關(guān),這些模塊具有相同的分級所有的三輸入模塊(若有的話),然后是所有的兩輸入模塊,等等。一個模塊的HO相鄰電平是在該輸入的所有更高階模塊的全部相鄰電平之和(即,在一個兩輸入模塊輸入的HO相鄰電平是全部第三、第四和更高階模塊的和,若有的話,這些模塊共享兩輸入模塊的節(jié)點(diǎn))。一旦一個模塊知道了它的HO-相鄰電平位于它輸入的一個特定輸入,它將從該輸入的總輸入能量電平中減去該電平,以及相同分級等級相鄰電平,以獲得在該輸入節(jié)點(diǎn)的相鄰補(bǔ)償電平。這在圖4B中示出,其中分別在組合器431和433中從可變慢速平滑器425和427的輸出中減去用于輸入1和輸入m的相鄰電平,分別在組合器431、433和435中從可變慢速平滑器425、427和429的輸出中減去用于輸入1、輸入m的更高階相鄰電平和公共能量。
使用用于補(bǔ)償?shù)南噜忞娖胶虷O相鄰電平之間的一個區(qū)別在于,HO相鄰電平還用于補(bǔ)償整個輸入聲道上的公共能量(例如,通過在組合器435中減去HO相鄰電平而實(shí)現(xiàn))。這種區(qū)別的基本原理是模塊的公共電平不受同一分級的相鄰模塊的影響,但是它卻能夠受到共享模塊的所有輸入的更高階模塊的影響。
例如,假設(shè)輸入聲道Ls(左環(huán)繞)和Rs(右環(huán)繞)以及Top,在它們之間三角形的中間具有內(nèi)部輸出聲道(升高的圓環(huán)后),加上Ls和Rs之間一條線上的一個內(nèi)部輸出聲道(主水平圓環(huán)后),前者的輸出聲道需要一個三輸入模塊來恢復(fù)對于全部三個輸入所公共的信號。然后,后者位于兩個輸入(Ls和Rs)之間一條線上的輸出聲道需要一個兩輸入聲道。但是,兩輸入模塊所觀測到的總的公共信號電平包括三輸入模塊的公共單元,這些公共單元不屬于后者的輸出聲道,因此,從兩輸入模塊的公共能量中減去HO相鄰電平的成對乘積的平方根,以確定多少公共能量是應(yīng)該單獨(dú)歸于它的內(nèi)部聲道(所述的后者)。因此,在圖4B中,平滑的公共能量電平(來自方塊429)已經(jīng)從其中減去推導(dǎo)出的HO公共電平以產(chǎn)生一個相鄰補(bǔ)償公共能量電平(來自組合器435),模塊使用該電平來計算(在方塊439)相鄰補(bǔ)償_xcor。
可以在模擬電路中實(shí)現(xiàn)本發(fā)明及其各個方面,或者更有可能將其實(shí)施為在數(shù)字信號處理器、編程的通用數(shù)字計算機(jī)、和/或?qū)S脭?shù)字計算機(jī)中所執(zhí)行的軟件功能。模擬和數(shù)字信號流之間的接口可以以適當(dāng)?shù)挠布?或作為軟件和/或固件中的功能來實(shí)現(xiàn)。盡管本發(fā)明及其各個方面可以包括模擬或數(shù)字信號,但在實(shí)際的應(yīng)用中,絕大多數(shù)或全部的處理功能都有可能在數(shù)字信號流上的數(shù)字域中被執(zhí)行,其中通過采樣來表示音頻信號。
應(yīng)該明白,對于本領(lǐng)域的普通技術(shù)人員而言將會顯而易見的是,可以實(shí)現(xiàn)對本發(fā)明及其各方面的其他變型和修改,本發(fā)明并不局限于這里描述的這些具體實(shí)施例。因此,本發(fā)明意圖覆蓋任何和全部的修改、變型或等同物,這些都落入了這里所公開和要求保護(hù)的基本原理的精神和范圍內(nèi)。
權(quán)利要求
1.一種用于將M個音頻輸入信號轉(zhuǎn)換為N個音頻輸出信號的處理,每個輸入信號與一個方向相關(guān)聯(lián),以及每個輸出信號與一個方向相關(guān)聯(lián),其中N大于M,M至少是2而N為至少是3的正整數(shù),該處理包括提供一個M:N可變矩陣,應(yīng)用所述M個音頻輸入信號給所述可變矩陣,從所述可變矩陣推導(dǎo)出所述N個音頻輸出信號,以及響應(yīng)于所述輸入信號控制所述可變矩陣,使得當(dāng)輸入信號高度相關(guān)時,所述輸出信號所產(chǎn)生的聲場在輸入信號的標(biāo)稱前進(jìn)基本方向中具有緊湊的聲像,隨著相關(guān)度的減少該聲像從緊湊到寬進(jìn)行擴(kuò)展,并隨相關(guān)度繼續(xù)減少到高度不相關(guān),逐步分離成多個緊湊聲像,每個在與一個輸入信號相關(guān)聯(lián)的方向中。
2.根據(jù)權(quán)利要求1所述的處理,其中所述M:N可變矩陣是一個具有可變系數(shù)的可變矩陣,或者是一個具有固定系數(shù)和可變輸出的可變矩陣,其中通過改變可變系數(shù)或改變可變輸出來控制所述可變矩陣。
3.根據(jù)權(quán)利要求1所述的處理,其中響應(yīng)于以下度量來控制所述可變矩陣(1)輸入信號的相對電平,和(2)輸入信號的互相關(guān)。
4.根據(jù)權(quán)利要求3所述的處理,其中為了度量具有第一范圍內(nèi)值的輸入信號的互相關(guān),該范圍的界限是一個最大值和一個參考值,該聲場當(dāng)互相關(guān)度量是所述最大值時具有緊湊的聲像,當(dāng)互相關(guān)的度量是所述參考值時它具有寬擴(kuò)展聲像,以及為了度量具有第二范圍內(nèi)值的輸入信號的互相關(guān),該范圍的界限是所述參考值和最小值,該聲場當(dāng)互相關(guān)度量是所述參考值時具有所述寬擴(kuò)展聲像,當(dāng)互相關(guān)的度量是所述最小值時,具有多個緊湊聲像,每個位于與一個輸入信號相關(guān)聯(lián)的方向中。
5.根據(jù)權(quán)利要求4所述的處理,其中對于在每個輸出中能量相同的情況,所述參考值大約是輸入信號的互相關(guān)的一個度量值。
6.根據(jù)權(quán)利要求3所述的處理,其中輸入信號的相對電平的度量響應(yīng)于每個輸入信號的平滑能量電平。
7.根據(jù)權(quán)利要求3或權(quán)利要求6所述的處理,其中輸入信號的相對電平的度量是輸入信號的標(biāo)稱前進(jìn)基本方向。
8.根據(jù)權(quán)利要求3所述的處理,其中輸入信號互相關(guān)的度量響應(yīng)于輸入信號的平滑公共能量除以每個輸入信號的平滑能量電平的乘積的M次根,這里M是輸入個數(shù)。
9.根據(jù)權(quán)利要求6、7或8中任何一項所述的處理,其中通過可變時間常量時域平滑以獲得每個輸入信號的平滑能量電平。
10.根據(jù)權(quán)利要求6、7或8中任何一項所述的處理,其中通過頻域平滑和可變時間常量時域平滑以獲得每個輸入信號的平滑能量電平。
11.根據(jù)權(quán)利要求8所述的處理,其中通過交叉相乘輸入幅度電平以獲得輸入信號的公共能量。
12.根據(jù)權(quán)利要求11所述的處理,其中通過可變時間常量時域平滑輸入信號的公共能量以獲得輸入信號的平滑公共能量。
13.根據(jù)權(quán)利要求12所述的處理,其中通過可變時間常量時域平滑以獲得每個輸入信號的平滑能量電平。
14.根據(jù)權(quán)利要求11所述的處理,其中通過頻域平滑和可變時間常量時域平滑輸入信號的公共能量以獲得輸入信號的平滑公共能量。
15.根據(jù)權(quán)利要求14所述的處理,其中通過頻域平滑和可變時間常量時域平滑以獲得每個輸入信號的平滑能量電平。
16.根據(jù)權(quán)利要求9、10、12、13、14和15中任何一項所述的處理,其中所述可變時間常量時域平滑通過具有固定時間常量和可變時間常量的平滑而執(zhí)行。
17.根據(jù)權(quán)利要求9、10、12、13、14和15中任何一項所述的處理,其中所述可變時間常量時域平滑通過只具有可變時間常量的平滑而執(zhí)行。
18.根據(jù)權(quán)利要求16或權(quán)利要求17所述的處理,其中所述可變時間常量是以步長變化的。
19.根據(jù)權(quán)利要求16或權(quán)利要求17所述的處理,其中所述可變時間常量是連續(xù)可變的。
20.根據(jù)權(quán)利要求16或權(quán)利要求17所述的處理,其中響應(yīng)于輸入信號的相對電平和它們的互相關(guān)的度量,以控制所述可變時間常量。
21.根據(jù)權(quán)利要求6所述的處理,其中通過用基本上相同的時間常量來可變時間常量時域平滑每個輸入信號的能量電平來獲得每個輸入信號的平滑能量電平。
22.根據(jù)權(quán)利要求3所述的處理,其中通過可變時間常量時域平滑獲得輸入信號的相對電平的度量和它們互相關(guān)的度量,其中給每個平滑應(yīng)用同一時間常量。
23.根據(jù)權(quán)利要求8所述的處理,其中所述互相關(guān)的度量是輸入信號互相關(guān)的第一度量,以及通過應(yīng)用輸入信號相對電平的度量給互相關(guān)的所述第一度量產(chǎn)生互相關(guān)的一個方向加權(quán)的度量,以獲得互相關(guān)的附加度量。
24.根據(jù)權(quán)利要求23所述的處理,其中對于在每個輸出中能量相同的情況,通過應(yīng)用一個大約等于輸入信號的互相關(guān)度量值的定標(biāo)因子,可以獲得輸入信號的互相關(guān)的另一個度量。
25.一種用于將M個音頻輸入信號轉(zhuǎn)換為N個音頻輸出信號的處理,每個輸入信號與一個方向相關(guān)聯(lián),以及每個輸出信號與一個方向相關(guān)聯(lián),其中N大于M,M至少是3,該處理包括提供多個m:n可變矩陣,這里m是M的子集以及n是N的子集,應(yīng)用所述M個音頻輸入信號的各個子集給每一個所述可變矩陣,從每一個所述可變矩陣推導(dǎo)出所述N個音頻輸出信號的各子集,響應(yīng)于應(yīng)用于每個可變矩陣的輸入信號的子集以控制每個所述可變矩陣,使得當(dāng)這些輸入信號高度相關(guān)時,從所述矩陣推導(dǎo)的輸出信號的各子集產(chǎn)生的聲場在應(yīng)用于該矩陣的輸入信號子集的指定前進(jìn)基本方向中具有緊湊的聲像,隨著相關(guān)度的減少該聲像從緊湊到寬進(jìn)行擴(kuò)展,并隨相關(guān)度繼續(xù)減少到高度不相關(guān),逐步分離成多個緊湊聲像,每個在與應(yīng)用于矩陣的一個輸入信號相關(guān)聯(lián)的方向中,以及從N個音頻輸出聲道的子集中推導(dǎo)出所述N個音頻輸出信號。
26.根據(jù)權(quán)利要求25所述的處理,其中還響應(yīng)于補(bǔ)償接收同一輸入信號的一個或更多其他的可變矩陣的影響的信息來控制所述可變矩陣。
27.根據(jù)權(quán)利要求25或權(quán)利要求26所述的處理,其中從N個音頻輸出聲道推導(dǎo)所述N個音頻輸出信號包括補(bǔ)償產(chǎn)生同一輸出信號的多個可變矩陣。
28.根據(jù)權(quán)利要求25-27中任何一項所述的處理,其中響應(yīng)于以下度量控制每個所述可變矩陣(a)應(yīng)用給它的輸入信號的相對電平,和(b)輸入信號的互相關(guān)。
29.一種用于將M個音頻輸入信號轉(zhuǎn)換為N個音頻輸出信號的處理,每個輸入信號與一個方向相關(guān)聯(lián),以及每個輸出信號與一個方向相關(guān)聯(lián),其中N大于M,M至少是3,該處理包括響應(yīng)于控制矩陣系數(shù)或控制矩陣輸出的定標(biāo)因子提供一個M:N可變矩陣,應(yīng)用所述M個音頻輸入信號給所述可變矩陣,提供多個m:n可變矩陣定標(biāo)因子發(fā)生器,這里m是M的子集以及n是N的子集,應(yīng)用所述M個音頻輸入信號的各個子集給所述每個可變矩陣定標(biāo)因子發(fā)生器,為所述N個音頻輸出信號的各子集從所述每個可變矩陣定標(biāo)因子發(fā)生器推導(dǎo)出一組可變矩陣定標(biāo)因子,響應(yīng)于應(yīng)用到每個可變矩陣定標(biāo)因子發(fā)生器的輸入信號的子集來控制所述每個可變矩陣定標(biāo)因子發(fā)生器,使得當(dāng)它所產(chǎn)生的定標(biāo)因子被應(yīng)用到所述M:N可變矩陣時,產(chǎn)生的輸出信號的各子集所產(chǎn)生的聲場當(dāng)這些輸入信號高度相關(guān)時,在產(chǎn)生所應(yīng)用定標(biāo)因子的輸入信號子集的標(biāo)稱前進(jìn)基本方向中具有緊湊的聲像,隨著相關(guān)度的減少,該聲像從緊湊到寬進(jìn)行擴(kuò)展,并隨相關(guān)度繼續(xù)減少到高度不相關(guān),逐步分離成多個緊湊聲像,每個在與產(chǎn)生所應(yīng)用的定標(biāo)因子的一個輸入信號相關(guān)聯(lián)的方向中,以及從所述可變矩陣中推導(dǎo)出所述N個音頻輸出信號。
30.根據(jù)權(quán)利要求29所述的處理,其中還響應(yīng)于補(bǔ)償接收同一輸入信號的一個或更多其他可變矩陣定標(biāo)因子發(fā)生器的影響的信息,來控制所述可變矩陣定標(biāo)因子發(fā)生器。
31.根據(jù)權(quán)利要求29或權(quán)利要求30所述的處理,其中從所述可變矩陣推導(dǎo)所述N個音頻輸出信號包括補(bǔ)償多個為同一輸出信號產(chǎn)生定標(biāo)因子的可變矩陣定標(biāo)因子發(fā)生器。
32.根據(jù)權(quán)利要求29-31中任何一項所述的處理,其中響應(yīng)于以下度量來控制每個所述可變矩陣定標(biāo)因子發(fā)生器(a)應(yīng)用給它的各輸入信號的相對電平,以及(b)各輸入信號的互相關(guān)。
全文摘要
使用一個M∶N可變矩陣,將M個音頻輸入信號轉(zhuǎn)換為N個音頻輸出信號,每個輸入信號與一個方向相關(guān)聯(lián),以及每個輸出信號與一個方向相關(guān)聯(lián),其中N大于M,M至少是2以及N為至少是3的正整數(shù)。響應(yīng)于以下度量來控制可變矩陣(1)輸入信號的相對電平,和(2)輸入信號的互相關(guān),以便當(dāng)輸入信號高度相關(guān)時,所述輸出信號所產(chǎn)生的聲場在輸入信號的標(biāo)稱前進(jìn)基本方向的方向中具有緊湊的聲像,隨著相關(guān)度的減少該聲像從緊湊到寬進(jìn)行擴(kuò)展,并隨相關(guān)度繼續(xù)減少到高度不相關(guān),逐步分離成多個緊湊聲像,每個在與輸入信號相關(guān)聯(lián)的方向中。
文檔編號H04S5/02GK1672464SQ03817877
公開日2005年9月21日 申請日期2003年8月6日 優(yōu)先權(quán)日2002年8月7日
發(fā)明者馬克·富蘭克林·戴維斯 申請人:杜比實(shí)驗(yàn)室特許公司