專(zhuān)利名稱(chēng):音頻信號(hào)響度級(jí)的自動(dòng)校正的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及對(duì)包含至少兩個(gè)不同音軌的音頻輸出信號(hào)的增益進(jìn)行調(diào)整的方法和系統(tǒng),這至少兩個(gè)不同音軌具有不同信號(hào)水平范圍。
背景技術(shù):
在本領(lǐng)域中,已知有許多不同的包含音樂(lè)和/或語(yǔ)音的音頻信號(hào)源。音樂(lè)信號(hào)可被存儲(chǔ)在CD、DVD或任意其它的存儲(chǔ)介質(zhì)中。尤其是隨著例如MPEG的新壓縮方案的發(fā)展, 具有不同的風(fēng)格和表演者的音頻信號(hào)被保存在存儲(chǔ)介質(zhì)上,并可被組合成要播放給用戶(hù)的播放列表。尤其是在車(chē)輛環(huán)境中,乘客感受到的音頻信號(hào)包括音頻信號(hào)本身和道路輪胎噪聲、空氣動(dòng)力噪聲和發(fā)動(dòng)機(jī)噪聲。不同音頻源的不同音頻信號(hào)通常具有不同的信號(hào)和動(dòng)態(tài)壓縮水平。經(jīng)常地,音頻輸出信號(hào)的不同音軌具有不同信號(hào)水平范圍,被用戶(hù)感知到時(shí)具有不同的響度級(jí)。尤其是在車(chē)輛環(huán)境中,所接收的音頻信號(hào)對(duì)于用戶(hù)應(yīng)該是能感知到的,這意味著所接收的音頻信號(hào)必須超過(guò)車(chē)輛中存在的噪聲。同時(shí)總音頻信號(hào)水平不應(yīng)超過(guò)一定的水平,如果超過(guò)該水平則會(huì)對(duì)用戶(hù)產(chǎn)生聽(tīng)覺(jué)損害或使用戶(hù)感覺(jué)疼痛。而且,在車(chē)輛環(huán)境中,環(huán)境噪聲很大程度上取決于車(chē)輛的速度。
發(fā)明內(nèi)容
因此,存在允許在不同駕駛條件下對(duì)車(chē)輛中音頻信號(hào)的響度水平進(jìn)行動(dòng)態(tài)自動(dòng)校正的需求。這種需要可由獨(dú)立權(quán)利要求的特征滿(mǎn)足。在從屬權(quán)利要求中,描述了本發(fā)明的實(shí)施例的優(yōu)選實(shí)施例。依據(jù)本發(fā)明的第一方面,提供了用于對(duì)包含至少兩個(gè)不同音軌的音頻輸出信號(hào)的增益進(jìn)行調(diào)整方法,這至少兩個(gè)不同音軌具有不同信號(hào)水平范圍。該方法包括基于人類(lèi)聽(tīng)覺(jué)的心理聲學(xué)模型動(dòng)態(tài)地確定音頻輸入信號(hào)的感知響度。額外地,動(dòng)態(tài)地確定增益確定單元輸出的音頻輸出信號(hào)的增益,該增益確定單元接收所確定的響度并輸出音頻輸出信號(hào), 其中增益被確定成使得音頻輸出信號(hào)的所述至少兩個(gè)音軌被輸出時(shí)在預(yù)定的信號(hào)水平范圍內(nèi)。而且,音頻輸出信號(hào)被輸出到一個(gè)空間中,該空間中的環(huán)境噪聲被估算,并且確定由增益確定單元確定的增益影響音頻輸出信號(hào)的程度。然后基于估算的環(huán)境噪聲確定增益確定單元影響音頻輸出信號(hào)的程度。如果環(huán)境噪聲非常低,例如,當(dāng)車(chē)輛靜止或以非常低的速度行駛時(shí),并不絕對(duì)地需要由增益確定單元進(jìn)行的增益調(diào)整。但是,在較高的車(chē)輛速度下, 動(dòng)態(tài)確定的增益調(diào)整將更為有用,因?yàn)樾盘?hào)水平應(yīng)該足夠高,以便能被用戶(hù)感知到,但是不能太高。通過(guò)自動(dòng)地調(diào)整輸出信號(hào)水平,使得不同音軌在輸出時(shí)在預(yù)定范圍內(nèi),對(duì)于不同音軌可獲得一個(gè)相等的響度。而且,用戶(hù)不再需要對(duì)音量進(jìn)行調(diào)節(jié)。尤其避免了對(duì)具有高信號(hào)聲壓級(jí)SPL的音軌或音頻信號(hào)的音量的減弱,還避免了在具有相當(dāng)?shù)偷男盘?hào)聲壓級(jí)的音頻信號(hào)的情況下對(duì)音量的增加。因此,所有不同的音頻信號(hào)源可能具有相等的響度,同時(shí)還能保留該音頻信號(hào)的動(dòng)態(tài)結(jié)構(gòu)。
可通過(guò)單獨(dú)使用所述心理聲學(xué)模型或者結(jié)合使用所述心理聲學(xué)模型與音頻輸入信號(hào)的信號(hào)統(tǒng)計(jì)來(lái)確定響度。估算環(huán)境噪聲的一種可能方法是確定在其中輸出音頻信號(hào)的車(chē)輛的車(chē)輛速度,并由確定的車(chē)輛速度推導(dǎo)出環(huán)境噪聲。在該實(shí)施例中,不需要經(jīng)由麥克風(fēng)來(lái)精確測(cè)量環(huán)境噪聲,環(huán)境噪聲可從車(chē)輛速度中推導(dǎo)出。但是,應(yīng)該理解的是作為備選的,麥克風(fēng)也可被用于估算環(huán)境噪聲。麥克風(fēng)信號(hào)于是可被單獨(dú)使用或與車(chē)輛速度相結(jié)合以估算環(huán)境噪聲。在一個(gè)實(shí)施例中,如果估算的環(huán)境噪聲比預(yù)定閾值低,則音頻輸出信號(hào)有可能根本沒(méi)有受到增益確定單元影響。當(dāng)例如由車(chē)輛速度確定的環(huán)境噪聲為低時(shí),則可不需要由增益確定單元來(lái)調(diào)整增益,并且可使用如音頻源提供的信號(hào)水平范圍輸出音頻輸出信號(hào)。 而且,隨著環(huán)境噪聲的增加,即隨著車(chē)輛速度的增加,增大動(dòng)態(tài)確定的增益影響音頻輸出信號(hào)的程度是可能的。這意味著車(chē)輛速度越高,增益確定單元對(duì)輸出信號(hào)的信號(hào)水平或響度范圍的影響越大。依據(jù)優(yōu)選的實(shí)施例,本方法包括確定所述至少兩個(gè)不同音軌之間的暫?;蛞粋€(gè)音軌內(nèi)的暫停的步驟,在該暫停中噪聲是占主導(dǎo)的音頻輸入信號(hào)。當(dāng)檢測(cè)出這樣的具有噪聲的暫停時(shí),減少在確定的暫停中的增益,以便避免噪聲的放大。在本發(fā)明的一個(gè)實(shí)施例中, 通過(guò)使用對(duì)如正在收聽(tīng)音頻輸入信號(hào)的收聽(tīng)者所感知的音頻輸入信號(hào)的空間感知的模擬來(lái)基于雙耳定位模型確定所述輸入信號(hào)是否能夠被定位,以在音頻輸入信號(hào)中檢測(cè)出噪聲。如果能夠使用所述人類(lèi)聽(tīng)覺(jué)的心理聲學(xué)模型定位音頻輸入信號(hào),則該音頻輸入信號(hào)不能被當(dāng)作噪聲。但是,如果音頻輸入信號(hào)不能被定位,則該音頻輸入信號(hào)被當(dāng)作是主要包含噪聲。結(jié)果,可避免增加僅包含噪聲的音頻信號(hào)的響度。優(yōu)選地,如果檢測(cè)到超過(guò)預(yù)定時(shí)間段(例如IO-IOOms之間,優(yōu)選地在50ms左右)內(nèi)的暫停,為該暫停減少增益。因此,只有在長(zhǎng)于例如50ms的時(shí)間內(nèi)檢測(cè)到暫停,增益才被降低,以便避免在非常短的不包含音樂(lè)信號(hào)時(shí)期的音軌中降低增益。但是如果音頻輸入信號(hào)包含更多的信息并且該輸入信號(hào)水平很低,則因此應(yīng)該通過(guò)以使得音頻輸出信號(hào)覆蓋預(yù)定的信號(hào)水平范圍的方式增加增益,來(lái)調(diào)整該增益。因此,通過(guò)對(duì)增益進(jìn)行控制來(lái)降低具有太高的音頻輸入水平的音頻輸入信號(hào),使得預(yù)定的信號(hào)水平范圍被覆蓋,并且如果輸入音頻水平太低,則該增益被提高,以便覆蓋相同的信號(hào)水平范圍。對(duì)于基于輸入信號(hào)的定位能力的暫停檢測(cè)可使用定位模型。該定位模型可額外地被用于估計(jì)響度。正常地,以多個(gè)塊的方式處理音頻信號(hào),與對(duì)每個(gè)采樣進(jìn)行處理相比節(jié)省了處理時(shí)間。依據(jù)本發(fā)明的一個(gè)實(shí)施例,每個(gè)塊的增益通過(guò)使用時(shí)間常數(shù)來(lái)確定,該時(shí)間常數(shù)描述了從一個(gè)信號(hào)塊到下一個(gè)塊的響度改變。在該實(shí)施例中,提升時(shí)間常數(shù)被用于描述在兩個(gè)連續(xù)的塊之間的上升的信號(hào)響度,而下降時(shí)間常數(shù)被用于描述在兩個(gè)連續(xù)的塊之間的下降的響度。一個(gè)塊包含一個(gè)或若干個(gè)數(shù)字音頻輸入信號(hào)的信號(hào)采樣。優(yōu)選地,時(shí)間常數(shù)被配置成,使得與下降時(shí)間常數(shù)允許響度下降相比,提升時(shí)間常數(shù)允許更快的響度增加。信號(hào)暫停之后的新音軌開(kāi)始處需要快速的響度增加,此處需要從一個(gè)塊到另一個(gè)塊突然地增加響度。兩個(gè)塊之間響度下降的較低的可能性允許保持在該音頻信號(hào)中最初包含的增加的響度的動(dòng)態(tài)。優(yōu)選地,時(shí)間常數(shù)是自適應(yīng)時(shí)間常數(shù),其中該自適應(yīng)時(shí)間常數(shù)被調(diào)整成,使得允許時(shí)間常數(shù)在音軌開(kāi)始處,比稍后的音軌期間改變得更快。這使得在音軌開(kāi)始處響度能夠被快速調(diào)整,并仍然有助于保持例如在音樂(lè)的音軌中的音頻信號(hào)中包含的動(dòng)態(tài)。尤其地,在包含古典音樂(lè)的音樂(lè)音軌中,應(yīng)該保持和信號(hào)中最初包含的一樣的信號(hào)水平的動(dòng)態(tài)。優(yōu)選地,當(dāng)兩個(gè)音軌之間檢測(cè)到暫停時(shí),重置自適應(yīng)時(shí)間常數(shù)。音頻信號(hào)源的一些用戶(hù)可能喜歡保持原始音頻信號(hào)的動(dòng)態(tài)范圍而不對(duì)增益進(jìn)行調(diào)整以達(dá)到適合的響度。此外,音頻輸入信號(hào)在被輸出之前可被延遲,該延遲與對(duì)調(diào)整增益進(jìn)行確定所需的時(shí)間相對(duì)應(yīng)。這種延遲可以是恒定的,或可以隨調(diào)整增益的計(jì)算而改變。本發(fā)明還涉及如上描述的那樣調(diào)整增益的系統(tǒng),該系統(tǒng)包括響度確定單元,該響度確定單元基于人類(lèi)聽(tīng)覺(jué)的心理聲學(xué)雙耳模型,并最終基于音樂(lè)輸入信號(hào)的信號(hào)統(tǒng)計(jì),或者基于兩者的結(jié)合,動(dòng)態(tài)地確定音頻輸入信號(hào)的響度。在接收所確定的響度的系統(tǒng)中提供了增益確定單元,該增益確定單元輸出具有調(diào)整增益的音樂(lè)輸出信號(hào),其中該增益確定單元?jiǎng)討B(tài)地確定音樂(lè)輸出信號(hào)的增益,使得音頻輸出信號(hào)的至少兩個(gè)音軌以覆蓋預(yù)定的信號(hào)水平范圍的方式被輸出。本系統(tǒng)此外還包括環(huán)境噪聲估算單元,該環(huán)境噪聲估算單元被配置成對(duì)音頻輸出信號(hào)被輸出到的空間中的環(huán)境噪聲進(jìn)行估算。而且,提供了增益控制單元,該增益控制單元被配置成確定由增益確定單元確定的增益影響音頻輸出信號(hào)的程度,其中該增益控制單元確定音頻輸出信號(hào)被增益確定單元基于估算出的環(huán)境噪聲所影響的程度。正如在聯(lián)系以上本發(fā)明的方法描述的那樣,環(huán)境噪聲估算器可使用車(chē)輛速度來(lái)估算環(huán)境噪聲。如果環(huán)境噪聲低于預(yù)定閾值,則增益控制單元可禁止增益確定單元的影響。音頻分析單元,如以上提及的那樣,通過(guò)分析對(duì)輸入信號(hào)進(jìn)行定位的可能性,或通過(guò)使用信號(hào)統(tǒng)計(jì)確定暫停。該音樂(lè)分析單元試圖使用輸入信號(hào)空間調(diào)整的模擬來(lái)定位音頻輸入信號(hào)。在EP 1 522 868 Al中描述了如何使用如收聽(tīng)者感知的那樣的音樂(lè)輸入信號(hào)空間感知進(jìn)行定位的一個(gè)實(shí)施例。定位的進(jìn)一步的細(xì)節(jié)可參考此文檔。進(jìn)一步的細(xì)節(jié)也可以在Wolfgang Hess等人于2003年 10月,在Audio Engineering Society Convention Paper 5864,115thConvention 中發(fā)表的 “Acoustical Evaluation of Virtual Rooms by Means of Binaural Activity Patterns”中找到。對(duì)于信號(hào)源的定位可參考由W. Lindemann在 Journal of Acoustic Society of America,1986 年 12 月,p. 1608-1622,Vol. 80 (6)的 "Extension of a Binaural Cross-Correlation Model by Contralateral Inhibition. I. Simulation of Lateralization for Stationary Signals”。音頻分析單元如上所述那樣確定自適應(yīng)時(shí)間常數(shù),并在檢測(cè)到暫停時(shí)對(duì)這些自適應(yīng)時(shí)間常數(shù)進(jìn)行重置??赏ㄟ^(guò)使用上面提到的暫停檢測(cè)來(lái)識(shí)別不同音軌的內(nèi)容,來(lái)將音頻信號(hào)的不同音軌分隔開(kāi)。而且,可能存在延遲單元,在音頻輸入信號(hào)伴隨著被控制的增益被輸出之前,將延遲時(shí)間引入音頻輸入信號(hào)。該延遲元件引入了與確定調(diào)整增益所需的延遲時(shí)間相對(duì)應(yīng)的延遲。
將參考附圖更詳細(xì)地描述本發(fā)明,其中圖1示意性地示出了車(chē)輛內(nèi)的聲音分量,包含噪音和音頻分量;圖2示出了音頻輸入信號(hào)與無(wú)增益調(diào)整的估計(jì)響度的示例,包括不同的時(shí)間常量以平滑響度,即,對(duì)增加響度的快速反應(yīng)和在減少響度級(jí)處的延遲反應(yīng);圖3示出了音頻輸入信號(hào)的動(dòng)態(tài)水平調(diào)節(jié),如應(yīng)該為自動(dòng)響度調(diào)節(jié)進(jìn)行調(diào)節(jié)一樣,當(dāng)已知整個(gè)信號(hào)內(nèi)容時(shí)進(jìn)行理想地校正,12個(gè)平均響度線被示出;圖4示意性地示出了用于調(diào)整音頻輸出信號(hào)增益的系統(tǒng);圖5示出了被用于確定音頻輸入信號(hào)響度的音頻分析單元的更詳細(xì)的視圖;圖6示意性地示出了向音頻信號(hào)引入時(shí)間常數(shù),表現(xiàn)為從一個(gè)塊到另一個(gè)塊的增益改變;圖7示出了不具有以及具有自動(dòng)響度調(diào)整的音頻輸入信號(hào)水平;圖8示出了在自動(dòng)響度調(diào)整之前和之后,音頻輸入信號(hào)的另一個(gè)示例。
具體實(shí)施例方式從圖1可以看出,取決于使用的車(chē)輛,乘車(chē)者感知到不同的環(huán)境噪聲。車(chē)輛聲音信號(hào)包括噪聲分量10和音頻信號(hào)分量20。噪聲信號(hào)分量10可歸因于道路輪胎噪聲、空氣動(dòng)力噪聲或發(fā)動(dòng)機(jī)噪聲。在圖1的右側(cè)部分中,指示了不同車(chē)輛的噪聲,該噪聲取決于車(chē)輛速度。曲線11描述了在跑車(chē)或運(yùn)動(dòng)型車(chē)中產(chǎn)生的噪聲,而曲線12示出了 SUV的與速度相關(guān)的噪聲。正如所看到的,噪聲可具有在60到85dB SPL(信號(hào)聲壓級(jí))之間的值。由于聽(tīng)力痛苦閾值在120dB SPL周?chē)?,音頻信號(hào)分量的范圍在20-40dB SPL之間。在圖2的上圖部分中,以滿(mǎn)刻度示出了音頻輸入信號(hào)的信號(hào)水平,表示OdB滿(mǎn)刻度(OdBre)被分配到數(shù)字域最大可能的信號(hào)水平,dB滿(mǎn)刻度表示相對(duì)于滿(mǎn)刻度的分貝。正如從圖2的上圖部分可以看出的,信號(hào)水平變化地相當(dāng)大,并因此使得被使用者感知的對(duì)應(yīng)于該信號(hào)的響度級(jí)也變化地相當(dāng)大。在圖2的下圖部分,相應(yīng)的響度被從信號(hào)輸入水平中 古i十出,$ ITU—R BS. 1770-1 ( "Algorithms to Measure Audio Program Loudness and to a Peak Audio Level")的建議中描述了一種響度估計(jì)的可能方法。在本申請(qǐng)中,響度可通過(guò)雙耳定位模型(binaural localization model)估計(jì)。如果如圖2示出的聲音信號(hào)在車(chē)輛中向使用者播放,該音頻信號(hào)的一些部分可能會(huì)被感知到具有令人不快的響度,而音頻信號(hào)的其它部分可能被認(rèn)為太低而不能被使用者正確地感知。在圖3中示出了圖2中的信號(hào)被理想地調(diào)節(jié)后的水平。作為示例,為了讓使用者良好地感知到,在范圍21中的信號(hào)采樣應(yīng)被調(diào)整成較低的信號(hào)水平,而在范圍22中的信號(hào)應(yīng)被調(diào)整成較高的信號(hào)水平。相似地,范圍23中的信號(hào)將以強(qiáng)烈減弱的信號(hào)水平被輸出。在圖3的下圖部分中,示出了上圖部分的對(duì)應(yīng)的經(jīng)理想調(diào)節(jié)的水平的估計(jì)響度。 當(dāng)比較圖2的下圖部分與圖3的下圖部分時(shí),可推導(dǎo)出圖3示出的響度估計(jì)值優(yōu)于圖2中示出的響度估計(jì)值。圖3的響度估計(jì)值可比圖2的響度估計(jì)值感知的感覺(jué)更好。在此得到了并形像化了平滑的、相對(duì)恒定的響度。圖4中示出了一種系統(tǒng),使用該系統(tǒng)可如同圖3的實(shí)施例中示意性示出的那樣對(duì)響度進(jìn)行調(diào)整。所示的系統(tǒng)包括音頻信號(hào)分析單元30,其中使用人類(lèi)聽(tīng)力的心理聲學(xué)定位模型并使用信號(hào)統(tǒng)計(jì)確定音頻輸入信號(hào),例如娛樂(lè)音頻信號(hào)的響度。該音頻輸入信號(hào)19被輸入到包括增益控制單元41和延遲元件42的信號(hào)控制器40。通過(guò)使用用戶(hù)界面50控制由增益控制確定的增益,在用戶(hù)界面50能夠確定在被經(jīng)由揚(yáng)聲器60輸出或被饋給后處理級(jí)之前,由增益確定單元確定的增益是否被用于音頻輸出信號(hào)19,或以哪種程度被用于音
7頻輸出信號(hào)19。娛樂(lè)或音頻輸入信號(hào)可以是2. 0、1. 5或7. 1倍的作為音頻信號(hào)18輸入音頻信號(hào)分析單元和信號(hào)控制器40中的音頻信號(hào)或另一種格式。在信號(hào)分析單元30中,象征性地示出響度是基于人類(lèi)聽(tīng)覺(jué)心理聲學(xué)模型并基于信號(hào)的統(tǒng)計(jì)確定的。心理聲學(xué)模型被用于估計(jì)響度、聲音定位,并被用于確定噪音是否在音頻輸入信號(hào)中作為主導(dǎo)因素存在,例如暫停期間或兩個(gè)音軌之間。信號(hào)統(tǒng)計(jì)是確定或估計(jì)響度以及確定在該音頻信號(hào)中是否存在具有噪聲的暫停的第二基礎(chǔ)。作為示例,可確定該娛樂(lè)音頻信號(hào)的信號(hào)強(qiáng)度。單獨(dú)地基于心理聲學(xué)模型或基于心理聲學(xué)模型與統(tǒng)計(jì)信號(hào)模型的結(jié)合,響度的適配通過(guò)將在下面詳細(xì)描述的動(dòng)態(tài)確定自適應(yīng)時(shí)間常量來(lái)確定。在圖5中,示出了音頻信號(hào)分析單元30的更詳細(xì)的視圖。該音頻信號(hào)分析單元包括對(duì)接收音頻輸入信號(hào)的響度進(jìn)行估計(jì)的響度確定單元31。該響度確定單元31可使用本領(lǐng)域公知的方法和如在ITU-R BS 1770-1中描述的其他方法來(lái)確定響度。該響度確定單元可進(jìn)一步使用人類(lèi)聽(tīng)力的雙耳模型,該人類(lèi)聽(tīng)力的雙耳模型用于在聽(tīng)到音頻輸入信號(hào)18 時(shí)確定響度并用于確定該音頻輸入信號(hào)18是否可被用戶(hù)定位以及被定位在何處。該雙耳模型模擬音頻輸入信號(hào)的空間感知,并允許確定該音頻輸入信號(hào)是否主要包含噪聲或例如音樂(lè)或語(yǔ)音的任何其它輸入信號(hào)。在本申請(qǐng)前面提到的文件中,主要在EP 1 522 868 Al, W. Lindemann 的文件中或在上面提到的 Audio Engineering Society Convention Paper 5864中,更詳細(xì)地描述了對(duì)音頻輸入信號(hào)的定位。這種定位技術(shù)允許區(qū)分噪音和其它聲音信號(hào),并有助于在音頻輸入信號(hào)中僅檢測(cè)出噪聲時(shí)避免該噪聲經(jīng)過(guò)增加的增益被輸出。還允許在檢測(cè)出暫停時(shí)重置自適應(yīng)時(shí)間常數(shù)。該響度確定單元使用人類(lèi)聽(tīng)覺(jué)的心理聲學(xué)模型對(duì)音頻輸入信號(hào)的響度進(jìn)行估計(jì)。而且,響度確定單元31可額外地使用統(tǒng)計(jì)信號(hào)處理,以便估計(jì)該音頻輸入信號(hào)的響度或檢測(cè)信號(hào)的暫停。在音頻輸入信號(hào)統(tǒng)計(jì)分析中,確定了音頻輸入信號(hào)的不同采樣的實(shí)際信號(hào)水平。作為示例,如果該輸入信號(hào)的若干連續(xù)采樣的信號(hào)水平符合高斯分布,可推論出所處理的采樣只包含噪聲而不含其它音頻信號(hào)。然后音頻信號(hào)分析單元使用響度估計(jì)的結(jié)果,以便計(jì)算被引入到音頻輸入信號(hào)中的時(shí)間常數(shù)。在圖5中,時(shí)間常數(shù)的計(jì)算由時(shí)間常數(shù)生成器32代表。音頻信號(hào)分析單元30進(jìn)一步包括調(diào)整該音頻輸出信號(hào)17的增益的增益確定單元 35。響度確定單元31通過(guò)發(fā)出dB響度等值(dBLEQ)提供了一定部分的音樂(lè)輸入信號(hào),例如包含若干采樣的塊的響度。該增益確定單元具有預(yù)定的信號(hào)水平或任意其它信號(hào)水平閾值,該預(yù)定的信號(hào)水平為當(dāng)輸出例如圖7和圖8的下圖部分示出的_12dB的音頻信號(hào)時(shí)應(yīng)該滿(mǎn)足的信號(hào)水平。在增益確定單元中,從要獲得的平均信號(hào)水平中減去確定出的響度,以便計(jì)算增益。作為示例,如果確定出的響度對(duì)應(yīng)于_5dB,并且如果目標(biāo)為-12dB滿(mǎn)刻度,則必須據(jù)此通過(guò)降低增益來(lái)調(diào)整增益,以便具有約-12dB的平均信號(hào)水平。在圖6中示出了由時(shí)間常數(shù)沈分隔開(kāi)的音頻輸入信號(hào)的不同的采樣25。該時(shí)間常數(shù)26說(shuō)明了從一個(gè)采樣到下一個(gè)采樣應(yīng)該如何調(diào)整響度。該時(shí)間常數(shù)可以是提升時(shí)間常數(shù)或下降時(shí)間常數(shù)。提升時(shí)間常數(shù)說(shuō)明從一個(gè)采樣到下一個(gè)采樣信號(hào)增益如何被增加, 反之下降時(shí)間常數(shù)說(shuō)明從一個(gè)采樣到下一個(gè)采樣增益減少。時(shí)間常數(shù)26是以使得提升時(shí)間常數(shù)可比下降時(shí)間常數(shù)更迅速地被調(diào)整的方式確定的。作為示例,如果在兩個(gè)音軌之間或在一個(gè)音軌內(nèi)確定出信號(hào)暫停,則不應(yīng)增加音頻信號(hào)水平以便避免噪聲的放大。當(dāng)新的音軌開(kāi)始時(shí),在非常低的信號(hào)水平之后可能立即出現(xiàn)高信號(hào)水平。因此必須對(duì)響度估計(jì)的提升時(shí)間常數(shù)進(jìn)行調(diào)整,以便避免新音軌開(kāi)始處的信號(hào)水平被大大增加。在音頻信號(hào)水平減少情況下的下降時(shí)間常數(shù)只允許與信號(hào)水平的增加相比信號(hào)水平較慢地減少。而且,時(shí)間常數(shù)為自適應(yīng)時(shí)間常數(shù),表示音軌越長(zhǎng),時(shí)間常數(shù)反應(yīng)越慢。對(duì)于提升和下降時(shí)間常數(shù), 這可能是有效的。經(jīng)平滑的響度估計(jì)還保證了和人類(lèi)感知響度的方式一樣的響度估計(jì)。尖峰和凹谷(dips)被人類(lèi)聽(tīng)覺(jué)系統(tǒng)平滑掉。時(shí)間常數(shù)隨著音頻音軌的時(shí)間增加而更慢地變化,有助于保持該音頻信號(hào)的動(dòng)態(tài)。但是,也在到達(dá)音樂(lè)信號(hào)的長(zhǎng)運(yùn)行時(shí)間時(shí),對(duì)增加的響度的較短的反應(yīng)時(shí)間保證了對(duì)較快信號(hào)增長(zhǎng)的適當(dāng)反應(yīng)。在圖6的下圖部分中,示出對(duì)于音樂(lè)信號(hào)隨時(shí)間過(guò)去的增益增長(zhǎng)和增益下降。對(duì)于音樂(lè)采樣的第一塊61,第一增益被確定為所示出的那樣。對(duì)于隨后的信號(hào)塊62,確定其具有增加的增益,隨后的信號(hào)塊63具有輕微下降的增益。基于使用時(shí)間常數(shù)的響度調(diào)整, 確定了每個(gè)塊的增益,即每個(gè)塊的目標(biāo)增益。于是塊η的目標(biāo)增益實(shí)現(xiàn)為從前一個(gè)塊n-1 的目標(biāo)增益開(kāi)始的線性斜坡。如果確定了在一個(gè)音軌中或兩個(gè)音軌之間有暫停,可重置時(shí)間常數(shù)。在信號(hào)分析單元30中執(zhí)行的暫停檢測(cè)或音軌檢測(cè)由暫停檢測(cè)單元33和音軌檢測(cè)單元34代表。在圖5 的實(shí)施例中,響度確定單元31、時(shí)間常數(shù)生成器32、暫停和音軌檢測(cè)單元33和34以及增益確定單元35被示為分開(kāi)的單元。但是,對(duì)于本領(lǐng)域技術(shù)人員來(lái)說(shuō)應(yīng)該清楚的是,不同的單元可被合并為更少的單元,并且這些單元可被組合成若干個(gè)單元或甚至成為一個(gè)單元。而且,信號(hào)分析單元可通過(guò)硬件元件或軟件或硬件和軟件的組合來(lái)設(shè)計(jì)。參考圖4,信號(hào)分析單元的信號(hào)輸出17被輸入到增益控制單元41,增益控制單元 41如下面將進(jìn)一步解釋的那樣控制音頻輸入信號(hào)的增益。信號(hào)分析單元的信號(hào)輸出17被輸入到增益控制單元41中,該增益控制單元41正如將在下面進(jìn)一步描述的那樣對(duì)音頻輸入信號(hào)的增益進(jìn)行控制。此外,信號(hào)控制單元40包括延遲元件,該延遲元件將在信號(hào)分析單元中確定增益所需要的延遲引入音頻輸入信號(hào)18。延遲元件有助于確保由信號(hào)分析單元 30處理的信號(hào)實(shí)際被對(duì)應(yīng)于音頻信號(hào)的正確的時(shí)間常數(shù)控制,正確的時(shí)間常數(shù)對(duì)于該音頻信號(hào)被確定。增益控制單元41有助于確定由增益確定單元35確定的增益的多少數(shù)量實(shí)際影響信號(hào)輸出水平。為實(shí)現(xiàn)這種結(jié)果,提供了對(duì)車(chē)廂內(nèi)的環(huán)境噪聲進(jìn)行估算的噪聲估算器50。正如由圖1可以看出的,車(chē)輛速度很強(qiáng)地影響了車(chē)廂內(nèi)的噪聲。如果車(chē)輛以非常低的速度行駛或處于靜止?fàn)顟B(tài),則可考慮不需要由增益確定單元確定的增益調(diào)整。如果音樂(lè)輸出信號(hào)根本不應(yīng)該受到增益確定單元的影響,意味著單元60中確定的校正沒(méi)有被用于輸出,則增益控制單元可將因子設(shè)置為0%,通過(guò)該因子,輸出信號(hào)受到在單元30中執(zhí)行的計(jì)算的影響。噪聲估算器50可接收車(chē)輛速度并可訪問(wèn)表格51,在該表格中提供了車(chē)輛速度和噪聲之間的關(guān)系。該表格可以是由車(chē)輛制造商設(shè)定的預(yù)定義表格。一般,駕駛員應(yīng)該不能更改在表格51中給定的值。但是,在該表格中給定的值可以例如通過(guò)軟件工具來(lái)修改,利用該軟件工具可調(diào)節(jié)聲音的設(shè)置。當(dāng)車(chē)輛速度較高時(shí),環(huán)境噪聲也可能如圖1所示那樣在SOdB(A)。 在該示例中,如果不應(yīng)超過(guò)105dB (A)的閾值,則只有25dB (A)保留下來(lái)。由于環(huán)境噪聲為 SOdB(A),音頻輸出信號(hào)的響度可被增益確定單元如上所述那樣動(dòng)態(tài)地確定。增益確定單元可基于環(huán)境噪聲確定在0%和100%之間的因子,該百分比描述了應(yīng)該如上面描述那樣調(diào)整響度的多少量。在所示的實(shí)施例中,車(chē)輛速度是確定環(huán)境噪聲的唯一變量。但是,其它因素(比如由麥克風(fēng)(未示出)確定的環(huán)境噪聲)可被單獨(dú)使用或與車(chē)輛速度相結(jié)合使用。圖7中示出了自動(dòng)響度調(diào)整的第一個(gè)示例。在圖7的上圖部分中,示出了響度估計(jì)之前的音頻輸出信號(hào)18。正如可由該音頻輸入信號(hào)的兩個(gè)聲道看出的,該輸入信號(hào)覆蓋了不同的輸入水平范圍。最大輸入水平可為OdB滿(mǎn)刻度。在圖7的下圖部分中,示出了在響度估計(jì)和增益調(diào)整后的音頻輸出信號(hào)19。正如可從圖7的下圖部分看出的,平均信號(hào)水平被設(shè)定為_(kāi)12dB滿(mǎn)刻度。同時(shí)保留了該音頻信號(hào)的動(dòng)態(tài)結(jié)構(gòu)。圖8中示出了另一個(gè)示例,其中輸入水平具有_20dB滿(mǎn)刻度的最大輸入水平。在圖8的下圖部分,示出了在響度估計(jì)和增益估計(jì)之后的音頻輸出信號(hào)19。再次保留了動(dòng)態(tài)結(jié)構(gòu),并且平均信號(hào)水平再次為_(kāi)12dB滿(mǎn)刻度。如果圖7和圖8的上圖部分中示出的輸入信號(hào)被輸出給使用者,該使用者必須頻繁地調(diào)節(jié)音量,以便避免信號(hào)水平太高而令人不快, 并對(duì)收聽(tīng)的信號(hào)水平太低的音頻信號(hào)部分的信號(hào)進(jìn)行增加。通過(guò)本申請(qǐng)的使用,由于系統(tǒng)對(duì)響度進(jìn)行了估計(jì),并且在輸出之前自動(dòng)地且動(dòng)態(tài)地調(diào)整了增益,用戶(hù)將不再需要這種頻繁的音量調(diào)節(jié)。
權(quán)利要求
1.一種方法,用于對(duì)包含至少兩個(gè)不同音軌的音頻輸出信號(hào)的增益進(jìn)行調(diào)整,該至少兩個(gè)不同音軌具有不同信號(hào)水平范圍,該方法的步驟包括-基于人類(lèi)聽(tīng)覺(jué)的心理聲學(xué)模型,動(dòng)態(tài)地確定音頻輸入信號(hào)的感知響度,-動(dòng)態(tài)地確定由增益確定單元(35)輸出的音頻輸出信號(hào)的增益,該增益確定單元(35) 接收感知響度并輸出具有確定的增益的音頻輸出信號(hào),其中,以使得所述音頻輸出信號(hào)的至少兩個(gè)音軌是覆蓋預(yù)定的信號(hào)水平范圍或響度范圍的輸出的方式確定增益,-估算所述音頻輸出信號(hào)被輸出的空間中的環(huán)境噪聲;以及_確定由所述增益確定單元確定的增益影響所述音頻輸出信號(hào)的程度,其中基于估算出的環(huán)境噪聲確定音頻輸出被所述增益確定單元影響的程度。
2.如權(quán)利要求1所述的方法,其中,如果估算出的環(huán)境噪聲低于預(yù)定閾值,則所述音頻輸出信號(hào)不受所述增益確定單元確定的增益的影響。
3.如權(quán)利要求1或2所述的方法,其中通過(guò)確定車(chē)輛速度來(lái)估算所述環(huán)境噪聲,從該車(chē)輛速度中推導(dǎo)出所述環(huán)境噪聲。
4.如前述權(quán)利要求中的任一項(xiàng)所述的方法,其中所述動(dòng)態(tài)確定的增益影響所述音頻輸出信號(hào)的程度隨著估算出的環(huán)境噪聲的增大而增大。
5.如前述權(quán)利要求中的任一項(xiàng)所述的方法,其中音頻輸入和輸出信號(hào)的每個(gè)音軌包括連續(xù)的音樂(lè)信號(hào)塊,其中每個(gè)塊的響度通過(guò)使用時(shí)間常數(shù)來(lái)確定,該時(shí)間常數(shù)描述了從一個(gè)塊到下一個(gè)塊的響度改變。
6.如權(quán)利要求5所述的方法,其中提升時(shí)間常數(shù)被用于描述在兩個(gè)連續(xù)塊之間升高的響度,而下降時(shí)間常數(shù)用于描述在兩個(gè)連續(xù)塊之間下降的響度,其中所述時(shí)間常數(shù)被配置成使得,與下降時(shí)間常數(shù)允許的響度下降相比,提升時(shí)間常數(shù)允許更快的響度增加。
7.如權(quán)利要求5或6所述的方法,其中所述時(shí)間常數(shù)為自適應(yīng)時(shí)間常數(shù),其中該自適應(yīng)時(shí)間常數(shù)被調(diào)整成,使得在音軌開(kāi)始處,所述時(shí)間常數(shù)被允許比稍后音軌期間變化得更快。
8.如權(quán)利要求7所述的方法,其中當(dāng)檢測(cè)出兩個(gè)音軌之間的暫停時(shí),所述自適應(yīng)時(shí)間常數(shù)被重置,通過(guò)確定是否能夠通過(guò)單獨(dú)使用雙耳定位模型或通過(guò)結(jié)合使用雙耳定位模型與信號(hào)統(tǒng)計(jì)模型定位所述音頻輸入信號(hào),來(lái)檢測(cè)所述暫停。
9.如前述權(quán)利要求中的任一項(xiàng)所述的方法,進(jìn)一步包括在所述音頻輸入信號(hào)被輸出之前,將延遲時(shí)間包括在所述音頻輸入信號(hào)中的步驟,其中所述延遲時(shí)間對(duì)應(yīng)于對(duì)所述音頻輸出信號(hào)的增益進(jìn)行確定所需的時(shí)間。
10.一種對(duì)包含至少兩個(gè)不同音軌的音頻輸出信號(hào)的增益進(jìn)行調(diào)整的系統(tǒng),其中該至少兩個(gè)不同音軌具有不同信號(hào)水平范圍,該系統(tǒng)接收音頻輸入信號(hào)并輸出具有調(diào)整的增益的音頻輸出信號(hào),該系統(tǒng)包括-響度確定單元(31),其基于人類(lèi)聽(tīng)覺(jué)的心理聲學(xué)模型,動(dòng)態(tài)地確定所述音頻輸入信號(hào)的響度,以及_增益確定單元(35),其接收所確定的響度并輸出具有調(diào)整增益的音頻輸出信號(hào),其中所述增益確定單元(35)動(dòng)態(tài)地確定所述音頻輸出信號(hào)的增益,使得所述音頻輸出信號(hào)的至少兩個(gè)音軌是覆蓋預(yù)定的信號(hào)水平范圍的輸出,-環(huán)境噪聲估算單元(50),其被配置成對(duì)所述音頻輸出信號(hào)被輸出到的空間中的環(huán)境噪聲進(jìn)行估算,_增益控制單元(41),其被配置成確定由所述增益確定單元確定的增益影響所述音頻輸出信號(hào)的程度,其中所述增益控制單元基于估算出的環(huán)境噪聲確定所述音頻輸出信號(hào)受所述增益確定單元影響的程度。
11.如權(quán)利要求10所述的系統(tǒng),進(jìn)一步包括暫停檢測(cè)單元(33),該暫停檢測(cè)單元(33) 通過(guò)使用對(duì)如正在收聽(tīng)所述音頻輸入信號(hào)的收聽(tīng)者所感知的音頻輸入信號(hào)的空間感知的模擬來(lái)確定是否能夠定位所述音頻輸入信號(hào),以確定所述至少兩個(gè)不同音軌之間或一個(gè)音軌以?xún)?nèi)的暫停,在該暫停中噪聲是音頻輸入信號(hào)的主導(dǎo)部分,其中,所述增益確定單元(35) 在被確定的暫停中減少增益。
12.如權(quán)利要求10或11所述的系統(tǒng),其中所述音頻輸入和輸出信號(hào)的每個(gè)音軌包括音頻信號(hào)的連續(xù)的塊(25),其中時(shí)間常數(shù)生成單元(32)確定所述音頻輸入信號(hào)的所述連續(xù)的塊的時(shí)間常數(shù)(26),該時(shí)間常數(shù)(26)描述了從一個(gè)塊到下一個(gè)塊的響度的改變,其中所述增益確定單元(35)基于所述時(shí)間常數(shù)確定所述音頻輸出信號(hào)的增益。
13.如權(quán)利要求12所述的系統(tǒng),其中所述時(shí)間常數(shù)生成單元(32)使用提升時(shí)間常數(shù)來(lái)描述兩個(gè)連續(xù)塊之間的升高響度,并使用下降時(shí)間常數(shù)描述兩個(gè)連續(xù)塊之間的下降響度, 其中所述時(shí)間常數(shù)生成單元將所述時(shí)間常數(shù)確定成,使得與下降時(shí)間常數(shù)允許的增益減少相比,提升時(shí)間常數(shù)允許增益增加得更快。
14.如權(quán)利要求12或13所述的系統(tǒng),其中所述時(shí)間常數(shù)生成單元(32)將所述時(shí)間常數(shù)確定成,使得所述時(shí)間常數(shù)為自適應(yīng)時(shí)間常數(shù),在音軌開(kāi)始處,該自適應(yīng)時(shí)間常數(shù)在塊與塊之間能夠變化得比在稍后的音軌期間變化得更快。
15.如前述權(quán)利要求12至14中的任一項(xiàng)所述的系統(tǒng),其中當(dāng)在兩個(gè)音軌之間檢測(cè)出暫停時(shí),所述時(shí)間常數(shù)生成單元(32)重置所述時(shí)間常數(shù)。
16.如權(quán)利要求11至15中的任一項(xiàng)所述的系統(tǒng),進(jìn)一步包括延遲元件(42),所述延遲元件(42)在所述音頻輸入信號(hào)被作為輸出信號(hào)輸出之前將延遲時(shí)間引入所述音頻輸入信號(hào),其中所述延遲元件引入與對(duì)所述音頻輸出信號(hào)的增益進(jìn)行確定所需的時(shí)間對(duì)應(yīng)的延遲時(shí)間。
17.如權(quán)利要求10至16中的任一項(xiàng)所述的系統(tǒng),其中所述增益控制單元被配置成,當(dāng)估算出的噪聲低于預(yù)定閾值時(shí),消除所述增益確定單元(35)對(duì)所述音頻輸出信號(hào)的影響。
全文摘要
本發(fā)明音頻信號(hào)響度級(jí)的自動(dòng)校正涉及一種用于對(duì)包含至少兩個(gè)不同音軌的音頻輸出信號(hào)的增益進(jìn)行調(diào)整的方法,該至少兩個(gè)不同音軌具有不同信號(hào)水平范圍,該方法的步驟包括-基于人類(lèi)的心理聲學(xué)模型,動(dòng)態(tài)地確定音頻輸入信號(hào)的感知響度,-動(dòng)態(tài)地確定增益確定單元(35)輸出的音頻輸出信號(hào)的增益,該增益確定單元(35)接收感知響度并輸出具有確定增益的音頻輸出信號(hào),其中確定該增益,使得音頻輸出信號(hào)的所述至少兩個(gè)音軌是覆蓋預(yù)定的信號(hào)水平范圍或響度范圍的輸出,-對(duì)音頻輸出信號(hào)被輸出的空間的環(huán)境噪聲進(jìn)行估算,以及,-確定由增益確定單元確定的增益影響音頻輸出信號(hào)的程度,其中基于估算出的環(huán)境噪聲確定音頻輸出受到增益確定單元影響的程度。
文檔編號(hào)H03G3/32GK102195584SQ20111005992
公開(kāi)日2011年9月21日 申請(qǐng)日期2011年3月14日 優(yōu)先權(quán)日2010年3月12日
發(fā)明者弗蘭克.貝倫, 沃爾夫?qū)?赫斯 申請(qǐng)人:哈曼貝克自動(dòng)系統(tǒng)股份有限公司