欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

用于壓縮數(shù)字電視的音頻處理的制作方法

文檔序號(hào):7939444閱讀:155來源:國知局
專利名稱:用于壓縮數(shù)字電視的音頻處理的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及廣播信號(hào)的音量控制。
背景技術(shù)
音量控制仍然是廣播界的一個(gè)實(shí)際問題。如果觀眾感到足夠煩擾,他們確實(shí)就會(huì) “改變頻道”?!艾F(xiàn)代的”高動(dòng)態(tài)范圍內(nèi)容與(較低動(dòng)態(tài)范圍的)傳統(tǒng)內(nèi)容和喧鬧刺耳(高密 度)的商業(yè)廣告的集成實(shí)際上是“被觀眾排斥的”。已有考慮到這個(gè)問題的可行的元數(shù)據(jù)技術(shù),然而,存在內(nèi)容與使用者之間的元數(shù) 據(jù)集成的挑戰(zhàn)、以及傳統(tǒng)內(nèi)容問題(先前存在的沒有相關(guān)元數(shù)據(jù)的內(nèi)容)。SMPTE曾經(jīng)將_20dBFS作為用于數(shù)字音頻系統(tǒng)的“工作電平”,并且將VU 0 設(shè)為-20dBFS以便對(duì)于VU峰值0產(chǎn)生約-lOdBFS的典型PPM峰值。由于似乎難以 將其保持為一致意見,所以在從-31dBFS至-ldBFS的可變范圍內(nèi)進(jìn)行對(duì)白歸一化 (dialognormalization)。盡管對(duì)白歸一表(dialnorm meter)已經(jīng)可以買到,但是正確的 對(duì)白歸一(dialnorm)測量需要在節(jié)目中挑選適當(dāng)?shù)膶?duì)白部分,并且依賴于操作者在高度 受控環(huán)境中進(jìn)行監(jiān)聽時(shí)的判斷力。這些測量需要熟練的操作者花時(shí)間對(duì)每個(gè)節(jié)目進(jìn)行完全 的電平評(píng)估,這在廣播環(huán)境中是不可能的。只有在全部運(yùn)行良好和滿足所有這些條件之后, 然后對(duì)白歸一必須原樣傳送到所有目的地解碼器。

發(fā)明內(nèi)容
根據(jù)本發(fā)明,提供用于控制廣播信號(hào)的音量的系統(tǒng)和方法。提供一種用于控制音量的系統(tǒng)。該系統(tǒng)包括感知響度估計(jì)單元,其用于例如通過 利用人類聽覺機(jī)制的心理聲學(xué)模型處理信號(hào),來確定信號(hào)的多個(gè)頻帶中每一個(gè)頻帶的感知 響度。增益控制單元接收信號(hào)的頻帶之一的感知響度,并且根據(jù)該頻帶的感知響度來調(diào)節(jié) 該信號(hào)的該頻帶的增益。本領(lǐng)域的技術(shù)人員在閱讀了下面結(jié)合附圖的詳細(xì)描述后,將進(jìn)一步認(rèn)識(shí)到本發(fā)明 的優(yōu)點(diǎn)和優(yōu)越特征以及它的其它重要方面。


圖1是根據(jù)本發(fā)明一個(gè)示例性實(shí)施例的壓縮曲線的圖;圖2是根據(jù)本發(fā)明一個(gè)示例性實(shí)施例的等響曲線的圖;圖3是根據(jù)本發(fā)明一個(gè)示例性實(shí)施例的等響濾波器的圖;圖4A-4C是根據(jù)本發(fā)明一個(gè)示例性實(shí)施例的在3個(gè)音軌中RMS能量值的直方圖;圖5是根據(jù)本發(fā)明一個(gè)示例性實(shí)施例的中間(interim)處理器的圖;圖6是根據(jù)本發(fā)明一個(gè)示例性實(shí)施例的動(dòng)態(tài)范圍輪廓線(dynamic range contours, DRC)的圖;圖7是根據(jù)本發(fā)明一個(gè)示例性實(shí)施例的由日期和時(shí)間(15分鐘軍用時(shí)間(military time)間隔)表示的日程安排時(shí)間表(day-partingschedule);圖8是根據(jù)本發(fā)明一個(gè)示例性實(shí)施例的使用者“音量鎖定”功能的圖;圖9是根據(jù)本發(fā)明一個(gè)示例性實(shí)施例的用于響度控制的系統(tǒng)的圖;圖10是根據(jù)本發(fā)明一個(gè)示例性實(shí)施例的用于感知響度估計(jì)的系統(tǒng)的圖;圖11是根據(jù)本發(fā)明一個(gè)示例性實(shí)施例的用于感知平坦度縮放(scaling)的系統(tǒng) 的圖;及圖12是根據(jù)本發(fā)明一個(gè)示例性實(shí)施例的用于執(zhí)行響度調(diào)整(leveling)的系統(tǒng)的 圖。
具體實(shí)施例方式在隨后的描述中,相同部件在整個(gè)說明書和附圖中分別用相同的附圖標(biāo)記標(biāo)注。 附圖可能不按比例,并且為了清楚和簡明起見,某些元件可能以一般化的或示意性的形式 示出并由商業(yè)名稱來標(biāo)識(shí)。通常,響度控制傳遞函數(shù)的整體形狀是可能產(chǎn)生問題的地方。在沒有元數(shù)據(jù)時(shí),可 定義并保持節(jié)目動(dòng)態(tài)的缺省“目標(biāo)圖”。當(dāng)存在有效元數(shù)據(jù)時(shí),目標(biāo)圖可轉(zhuǎn)換成由元數(shù)據(jù)描 述的壓縮曲線。如果元數(shù)據(jù)消失或變壞,則壓縮曲線被轉(zhuǎn)換回缺省目標(biāo)圖。圖1是根據(jù)本發(fā)明一個(gè)示例性實(shí)施例的壓縮曲線的圖。在所有條件下都維持整個(gè) 節(jié)目的長期感知響度(壓縮曲線中“空帶(null band)”的中心)是所希望的特征。盡管瞬 時(shí)校正是不可能的,但是如果根據(jù)心理聲學(xué)原理來對(duì)恢復(fù)/減小發(fā)射特性(ballistics)進(jìn) 行整形,則令人滿意的(本地)空帶增益歸一化是可實(shí)現(xiàn)的。廣播工程師在存在有效元數(shù)據(jù)時(shí)則可以選擇超馳(override)本地歸一。這種特 征允許廣播臺(tái)在元數(shù)據(jù)變得較好理解和較可靠時(shí),退出本地歸一和缺省的目標(biāo)圖特征。如 果全部進(jìn)行良好,則除了設(shè)置了特定于廣播臺(tái)的動(dòng)態(tài)優(yōu)選項(xiàng)的廣播臺(tái)之外,維持本地壓縮 曲線目標(biāo)圖和空帶增益歸一化將成為不必要的。音量歸一化處理音頻內(nèi)容的頭端采集(head end ingest)。在該階段,利用具有統(tǒng) 計(jì)處理的心理聲學(xué)模型對(duì)內(nèi)容歸一化,以保證長期感知響度是一致的。這里所描述的是可 用于完成自動(dòng)歸一化的示例性元件。圖2是根據(jù)本發(fā)明一個(gè)示例性實(shí)施例的等響曲線圖。等響曲線是基于由Fletcher 和Munson在1933年進(jìn)行的原始測量、由Robinson和Dadson在1956年測量的,曲線上往 往帶有他們的姓名。這些線條表示,對(duì)于任何頻率的測試音調(diào),使其聽起來與1kHz的測試音調(diào)一樣響 所需要的聲壓。以標(biāo)記為“60”的線條為例,在lkHz(x軸上為“1”)時(shí),該標(biāo)記為“60”的 線條在60dB(y軸上)。隨著該“60”線條向下到達(dá)0.5kHz (500Hz),y軸值大約為55dB。因 而,對(duì)于人類聽眾,在55dB SPL處的500Hz音調(diào)跟在60dB SPL處的1kHz音調(diào)聽起來一樣
響。該原理被用來控制音量級(jí)。圖3是根據(jù)本發(fā)明一個(gè)示例性實(shí)施例的等響濾波器的圖。在線條向上彎曲處,對(duì) 該處頻率的聲音較不敏感。從而,濾波器衰減該頻率的聲音。理想的濾波器是等響濾波器 的逆濾波器。由于重放電平是未知的,并且不希望對(duì)不同響度的聲音采用不同的濾波器,所 以曲線的代表性平均可被選作目標(biāo)濾波器。
雖然能夠計(jì)算出在整個(gè)音頻文件上的RMS能量,但這個(gè)值不會(huì)給出對(duì)信號(hào)的感知 響度的良好指示,盡管它比由峰值振幅給出的值更加接近。通過逐時(shí)刻地計(jì)算RMS能量,可 以利用以下過程來實(shí)現(xiàn)較好的解決方案 信號(hào)以50ms長度的塊被采樣。 每個(gè)樣本被平方。 取平均值。 計(jì)算該平均值的平方根。利用這四個(gè)步驟,每個(gè)50ms塊的RMS值可用于進(jìn)一步處理。在研究了 25ms與1秒之間的值的效果之后,挑選了 50ms的塊長度。觀測表明, 25ms太短以致于不能準(zhǔn)確地反映某些聲音的感知響度。超過50ms,則觀測到在統(tǒng)計(jì)處理之 后沒有什么變化。為此,挑選50ms。對(duì)于如何處理立體聲文件具有困難。在計(jì)算RMS能量之前,它們可被總計(jì)到單聲 道,但這樣的話,任何異相分量(在每個(gè)聲道上具有相反信號(hào))會(huì)抵消到零(即,靜音)。由 于這不是它們被感知的那樣,所以該過程不是良好的解決方案。一種替換方式是計(jì)算兩個(gè)RMS值,每個(gè)聲道一個(gè),并且然后將它們相加。不幸地 是,線性相加仍然不會(huì)給出聽眾聽到的相同效果。為了說明這個(gè),考慮單(單聲道)音軌。 當(dāng)它在一個(gè)揚(yáng)聲器上重放并與在兩個(gè)揚(yáng)聲器上重放的聲音相比較時(shí),線性相加將表明它會(huì) 是一半響,而觀測到的音量是0. 75倍響。感知上,如果在計(jì)算平方根之前將聲道信號(hào)的平均值相加,則獲得更接近的表示。 按照聲像移動(dòng)器(pan-pot)術(shù)語,這意味著使用“等功率”而不是“等電壓”。如果也假定任 何單(單聲道)信號(hào)將在兩個(gè)揚(yáng)聲器上重放,則該單信號(hào)可被視為一對(duì)相同的立體聲信號(hào)。 這樣,單信號(hào)給出(a+a)/2(即a),而立體聲信號(hào)給出(a+b)/2,其中a和b是每個(gè)聲道的均 方值。在這之后,進(jìn)行平方根,并且轉(zhuǎn)化為dB。圖4A-4C是根據(jù)本發(fā)明一個(gè)示例性實(shí)施例的在3個(gè)音軌中的RMS能量值的直方 圖。圖4A表示話音(speech),圖4B表示流行音樂,而圖4C表示古典音樂。在計(jì)算出文件 從頭至尾每50ms的RMS信號(hào)電平后,可確定單個(gè)偏移值來代表整個(gè)文件的感知響度。示例 性直方圖表示出,在每個(gè)文件中每個(gè)RMS值出現(xiàn)多少次。在話音音軌中最普遍的RMS值是45dB (背景噪聲),所以該最普遍的RMS值明顯不 是好的感知響度指示符。類似地,平均RMS值對(duì)于話音樣本是易于誤導(dǎo)的,對(duì)于古典音樂也 是如此。作為代替,確定整體感知響度的一種好的方法是將RMS能量值排列成數(shù)值順序, 然后對(duì)靠近列表頂部的值進(jìn)行平均。為了確定代表值沿該排序列表向下有多遠(yuǎn),對(duì)于圖4B的高度壓縮流行音樂,選擇 幾乎不會(huì)造成差別。而對(duì)于話音和古典音樂,選擇會(huì)造成巨大差別??砂聪率接?jì)算與感知 響度的人類感知最準(zhǔn)確匹配的值
排序1 +排序2 +排序3_正常電平 3在計(jì)算出內(nèi)容的“正常電平(normal level) ”后,增大或減小長期音量以滿足所
6選擇的-21dBFS的歸一化電平(normalizationlevel)。使用這種方法,話音片段會(huì)被帶高 5. 7dB,流行音樂片段降低6dB,而古典音樂片段降低7dB。歸一化內(nèi)容然后被存儲(chǔ)到服務(wù)器、位于頭端的播出(playout)或任何其它海量存 儲(chǔ)器,或者在許多情況下被存儲(chǔ)到分臺(tái)(affiliate)。圖5是根據(jù)本發(fā)明一個(gè)示例性實(shí)施例的中間處理器的圖。假定內(nèi)容在頭端和本地 分臺(tái)都已經(jīng)被歸一化,中間處理器不再負(fù)責(zé)長期音量控制。就是說,現(xiàn)在依靠中間處理器 (IP)來控制音頻內(nèi)容的使人驚嚇的增加和使人困惑的降低。為了實(shí)現(xiàn)這個(gè),可使用對(duì)內(nèi)容 的上邊界和下邊界的控制,其中所述上下邊界跟蹤內(nèi)容的預(yù)歸一化電平。IP可連續(xù)地跟蹤 內(nèi)容的長期電平,以及調(diào)節(jié)邊界并使其保持“不擋道(outof the way)”,以維持完全的透明 性。完成這個(gè)任務(wù)的一個(gè)示例性途徑是使上界限和下界限隨內(nèi)容包絡(luò)一起“浮動(dòng)”。只要短 期動(dòng)態(tài)特性停留在長期包絡(luò)的一階導(dǎo)數(shù)內(nèi),就不采取行動(dòng)。圖6是根據(jù)本發(fā)明一個(gè)示例性實(shí)施例的動(dòng)態(tài)范圍輪廓線(DRC)的圖。DRC定義內(nèi) 容的動(dòng)態(tài)“特性”。輪廓線允許分臺(tái)具有調(diào)節(jié)內(nèi)容的動(dòng)態(tài)特性的能力,以在給定時(shí)隙中更好 地匹配觀眾人口統(tǒng)計(jì)數(shù)據(jù)。即使當(dāng)基于元數(shù)據(jù)的系統(tǒng)正確時(shí),在跨過幾個(gè)時(shí)區(qū)時(shí),單一大小 也不會(huì)全部適合。該條件可通過對(duì)DRC進(jìn)行日程安排和將控制給予分臺(tái)而減輕。通過這種 方式,考慮到寬動(dòng)態(tài)范圍大片電影不會(huì)在凌晨或深夜欣賞,而談話或“審判(judge) ”節(jié)目要 被精密地調(diào)節(jié)以不失去任何對(duì)白,可以按切合實(shí)際并可預(yù)知的方式來控制已提前知道的編 排。通過提供對(duì)內(nèi)容上下邊界的可調(diào)節(jié)控制來實(shí)現(xiàn)這個(gè)過程。注意,提升和降低輪廓線在_21dBFS附近聚集。這個(gè)電平被確定成對(duì)于傳統(tǒng)的和 適當(dāng)采集的內(nèi)容具有最佳益處。依據(jù)選擇的動(dòng)態(tài)范圍輪廓線,“死區(qū)(deadband)”——即 傳遞函數(shù)中完全透明的部分——被調(diào)節(jié)大小以得出對(duì)內(nèi)容的剛好恰當(dāng)?shù)目刂屏?。如在圖6 中看到的那樣,增益提升曲線可以由普通AGC處理,而增益降低曲線可通過壓縮和限制來 執(zhí)行。黃色輪廓線對(duì)應(yīng)于壓縮,綠色輪廓線對(duì)應(yīng)于AGC功能,而紅色輪廓線是限制的結(jié) 果。容易看到,可以怎樣使組合成適當(dāng)?shù)腄RC十分簡單。DRC “A”表示嚴(yán)格受控輪廓線,其表明在47dB范圍上的4dB動(dòng)態(tài)范圍。這種DRC 是極端狀態(tài),但可能在“關(guān)鍵任務(wù)(mission critical)”對(duì)白的播送中具有應(yīng)用。DRC “B” 表明較少的控制;在40dB范圍上的20dB。該輪廓線將代表中等范圍電影。每當(dāng)內(nèi)容漂移到輪廓線的紅色或綠色部分中時(shí),中間處理器的“警報(bào)”特征就會(huì)啟 動(dòng)。在該過程期間,長期增益被調(diào)節(jié),直到內(nèi)容電平位于黃色區(qū)“中心”。這時(shí),警報(bào)功能停 止,直到探測到再次從低失真黃色區(qū)偏離。在使用AGC期間,警報(bào)被啟動(dòng)以便將偏離通知操 作者,并且記錄警報(bào)的時(shí)間。基于音頻相關(guān)元數(shù)據(jù)的系統(tǒng)難以預(yù)測在內(nèi)容旅程(journey)另一端處使用者的 時(shí)區(qū)。鑒于這個(gè)事實(shí),IP由本地日程安排或時(shí)間安排系統(tǒng)來驅(qū)動(dòng),該系統(tǒng)允許分臺(tái)控制音 量邊界,作為一天中時(shí)間的函數(shù)。由于本地內(nèi)容的類型和時(shí)間安排被高度控制,所以分臺(tái)容 易對(duì)處理進(jìn)行日程安排,以匹配內(nèi)容的類型(談話、動(dòng)作片、卡通、肥皂劇)和一天中的時(shí)間 (在凌晨和深夜控制得更多)這兩者。圖7是根據(jù)本發(fā)明一個(gè)示例性實(shí)施例的由日期和時(shí)間(15分鐘軍用時(shí)間間隔)表 示的日程安排時(shí)間表。日期可拷貝到其它日期,以節(jié)省編輯時(shí)間。對(duì)于特殊事件或日程的突然改變,能夠遠(yuǎn)程編輯該日程安排時(shí)間表(諸如通過互聯(lián)網(wǎng)協(xié)議)。每個(gè)日期/時(shí)間代表 一個(gè)預(yù)置。每個(gè)預(yù)置代表一個(gè)可編排的特定動(dòng)態(tài)范圍輪廓線。日程安排時(shí)間表一旦寫好, 就只需要一年改變或更新少數(shù)幾次。IP還可以采用附加的處理以增強(qiáng)內(nèi)容的聆聽享受,即使內(nèi)容有缺陷。去嗡嗡聲和 去噪聲對(duì)于較老的內(nèi)容是有用的工具,而時(shí)間和強(qiáng)度歸一化對(duì)于仍在將基于左-右的內(nèi)容 與立體聲內(nèi)容混合廣播的分臺(tái)是有幫助的。在使用者端,可提供最終感知音量控制或鎖定。這種音量鎖定的主要目的是給予 使用者對(duì)動(dòng)態(tài)范圍輪廓線和內(nèi)容電平的最終控制。使用者的條件是不可能預(yù)知的,因?yàn)槭?用者可能擁有最佳的家庭影院或僅僅擁有小的單聲道電視。使用者可能生活在非常嘈雜的 環(huán)境中或者可能有聽力障礙。使用者可能有正在睡覺的幼兒,或者有既有聽力障礙又容易 受驚嚇的老年親屬。音量鎖定向使用者提供簡單的解決方案,在該方案中,對(duì)音量和三個(gè)動(dòng) 態(tài)范圍(寬、平均及窄)之一進(jìn)行簡單的選擇。圖8是根據(jù)本發(fā)明一個(gè)示例性實(shí)施例的使用者“音量鎖定”功能的圖。AGC目標(biāo)和 壓縮器和限制器功能被“成套組合(ganged)”,以使得能夠容易地設(shè)置所希望的音量級(jí)。三 個(gè)本地預(yù)置允許使用者選擇窄、中等或?qū)拕?dòng)態(tài)范圍輪廓線。在“寬”模式中,使用者選擇成 按原樣信任廣播。在“中等”模式中,使用者可以在寬松控制下欣賞各種節(jié)目。“窄”模式對(duì) 于不時(shí)被吵鬧的商業(yè)廣告打斷的訪談節(jié)目或肥皂劇是有用的。收集的信息針對(duì)一個(gè)三部分系統(tǒng)采集、具有日程安排的中間處理、及使用者控 制。這三個(gè)過程的任一個(gè)應(yīng)當(dāng)基于其本身的優(yōu)點(diǎn)而有益于使用者的體驗(yàn)。當(dāng)組合時(shí),它們 為內(nèi)容的音頻部分提供安全防故障的環(huán)境,沒有驚人的電平突升或降低。該系統(tǒng)與任意傳 統(tǒng)的基礎(chǔ)設(shè)施一起工作,并且不依賴元數(shù)據(jù)來控制歸一化電平或動(dòng)態(tài)范圍輪廓線。它為喧 鬧的商業(yè)廣告或者頭端或分臺(tái)錯(cuò)誤提供改進(jìn)的性能。如果遵循采集和中間處理協(xié)議,則除 非為了方便,否則不需要使用者處理。一旦采集了內(nèi)容并編排了中間過程每日時(shí)段分割,系 統(tǒng)就是自動(dòng)的,無需人為干預(yù)。在缺乏適當(dāng)采集的內(nèi)容時(shí),中間處理智能地控制電平,僅具 有很小的、非常短期的跟蹤誤差。圖9是根據(jù)本發(fā)明一個(gè)示例性實(shí)施例的用于響度控制的系統(tǒng)900的圖。系統(tǒng)900 包括感知響度估計(jì)902、增益控制904、壓縮器906及最終限制器908,其每一個(gè)可以以硬 件、軟件或硬件和軟件的適當(dāng)組合來實(shí)施,并且可以是在通用處理平臺(tái)上運(yùn)行的一個(gè)或多 個(gè)軟件系統(tǒng)。如這里所使用的,“硬件”可包括分立元件的組合、集成電路、專用集成電路、 現(xiàn)場可編程門陣列、或其它適當(dāng)硬件。如這里所使用的,“軟件”可包括一個(gè)或多個(gè)對(duì)象、代 理、線程、代碼行、子例行程序、單獨(dú)的軟件應(yīng)用、在兩個(gè)或更多個(gè)軟件應(yīng)用中或者在兩個(gè)或 更多個(gè)處理器上運(yùn)行的兩個(gè)或更多個(gè)代碼行或其它適當(dāng)?shù)能浖Y(jié)構(gòu)、或其它適當(dāng)?shù)能浖Y(jié) 構(gòu)。在一個(gè)示例性實(shí)施例中,軟件可包括在諸如操作系統(tǒng)之類的通用軟件應(yīng)用中運(yùn)行的一 個(gè)或多個(gè)代碼行或其它適當(dāng)軟件結(jié)構(gòu)、在專用軟件應(yīng)用中運(yùn)行的一個(gè)或多個(gè)代碼行或其它 適當(dāng)軟件結(jié)構(gòu)。感知響度估計(jì)系統(tǒng)902利用心理聲學(xué)和信號(hào)處理技術(shù)來準(zhǔn)確地探測和調(diào)節(jié)適當(dāng) 的源的感知響度,適當(dāng)?shù)脑粗T如圖9中所示的示例性5. 1源。同樣,可處理諸如單聲道信號(hào)、 立體聲信號(hào)、7. 1信號(hào)、或其它適當(dāng)信號(hào)之類的聲源。增益控制系統(tǒng)904用于基于來自感知響度估計(jì)系統(tǒng)902的輸出、預(yù)定的響度約束或其它適當(dāng)因素,來增大或減小信號(hào)的增益以修改響度。壓縮器906可用于控制未被感知響度估計(jì)系統(tǒng)902和增益控制系統(tǒng)904適當(dāng)處理 的短期響度變化。在一個(gè)示例性實(shí)施例中,壓縮器906可被設(shè)置成允許預(yù)定的容許短期峰 值高于預(yù)定的目標(biāo)電平,諸如2dB至8dB。壓縮器906可在用戶選擇的范圍上應(yīng)用諸如0. 40 至0. 80的壓縮比。最終限制器908可用于控制絕對(duì)波形峰值電平。在一個(gè)示例性實(shí)施例中,最終限 制器908在諸如-10dB滿刻度(FS)至OdBFS之類的預(yù)定范圍上可以是用戶可選擇的。在操作時(shí),諸如通過利用心理聲學(xué)和信號(hào)處理技術(shù)來準(zhǔn)確地探測和調(diào)節(jié)聲源的感 知響度、并與諸如壓縮器和限制器之類的其它適當(dāng)響度控制相結(jié)合,系統(tǒng)900使得響度能 夠在廣播系統(tǒng)處或其它適當(dāng)位置處被控制。通過將心理聲學(xué)和信號(hào)處理技術(shù)與其它適當(dāng)?shù)?響度控制相結(jié)合,系統(tǒng)900避免響度的過補(bǔ)償,諸如在用輕柔的對(duì)白來抵消間歇性的喧鬧 噪聲——如槍擊、碰撞、爆炸、或其它所希望的內(nèi)容——的情況中。圖10是根據(jù)本發(fā)明一個(gè)示例性實(shí)施例的用于感知響度估計(jì)的系統(tǒng)1000的圖。源 音頻信號(hào)的音頻通道(t)至xN(t)(其中N是表示源音頻數(shù)據(jù)的通道數(shù)目的適當(dāng)整數(shù)) 通過復(fù)時(shí)頻濾波器組1002a至1002n而被處理,其中濾波器組1002a至1002n將時(shí)域信號(hào) Xl(t) MxN(t)轉(zhuǎn)換成相應(yīng)的頻域信號(hào)\( 至%江)。每個(gè)子帶的幅度IXjf) |至|XN(f) 然后被輸入到相應(yīng)的感知平坦度縮放1004a至1004n,其產(chǎn)生應(yīng)用于每個(gè)相應(yīng)子帶的幅度 的縮放值至aN。在每個(gè)通道的音頻頻譜已經(jīng)與感知平坦度成比例地縮放之后,所有通道 | \ (f) 至徹⑴⑴|由恒功率求和1006諸如根據(jù)以下等式來求和 恒功率求和是從恒功率平移定律(constant power panning law)導(dǎo)出的,并且可 用來為當(dāng)音頻信號(hào)要在揚(yáng)聲器上重放時(shí)存在于聆聽“最佳位置(sweet-spot) ”處的每個(gè)子 帶的聲功率級(jí)建模。使用恒功率求和來為聲功率級(jí)建模,提供了一種在感知上適當(dāng)?shù)摹⒂糜?對(duì)各通道求和以及在多個(gè)輸入通道中提供可縮放性的方法。恒功率求和1006輸出組合的 音頻頻譜Y(f)。等響整形1008使用等響曲線來處理組合的音頻頻譜Y(f),所述等響曲線諸如 Fletcher-Munson曲線或其它適當(dāng)?shù)牡软懬€,其針對(duì)對(duì)于典型人類聽眾,不同頻率在不同 響度級(jí)處被感知這一現(xiàn)象建模。例如,對(duì)于給定聲壓級(jí)(SPL),一般的聽眾將感知到,l-4kHz 左右的中頻將比低頻或高頻更響。等響整形1008產(chǎn)生等響整形頻譜YEJf)。等響整形頻譜Ya(f)的每個(gè)子帶被四次乘方,并且然后由感知頻帶分組1010分組 成感知頻帶。將頻譜YEJf)四次乘方以補(bǔ)償將帶狀(banded)頻譜YEJbark)0. 25次乘方這 一后續(xù)處理。所有壓縮感知頻帶(bark)°_25然后由求和1012求和并且轉(zhuǎn)換成dB,得到針 對(duì)給定音頻段的感知響度估計(jì)PLE。圖11是根據(jù)本發(fā)明一個(gè)示例性實(shí)施例的用于感知平坦度縮放的系統(tǒng)1100的圖。 感知頻帶分組1102將頻譜IXjf) |分組成感知頻帶,并且產(chǎn)生輸出(barks) |。頻譜平坦 度測量1104計(jì)算感知頻帶(barks) |上的頻譜平坦度,得到感知平坦度PFM。高的感知 平坦度表明,信號(hào)在所有感知頻帶中具有幾乎相等的能量值,可能聽起來類似于粉紅噪聲(pink noise)。低的感知平坦度表明,信號(hào)能量集中在少數(shù)感知頻帶中,可能聽起來類似于
音調(diào)混合。感知平坦度PFM然后由反相器(inverter) 1106轉(zhuǎn)換成縮放值 ,該縮放值 用于 通過乘法器1108來縮放|Xi(f)|的整個(gè)頻譜。當(dāng)PFM高時(shí),縮放因子 應(yīng)當(dāng)?shù)?,而?dāng)PFM 低時(shí),縮放因子ai應(yīng)當(dāng)高,這基于如下的經(jīng)驗(yàn)觀測結(jié)果寬帶和感知平坦的信號(hào)的能量水平 相對(duì)于它們的感知響度通常太高。在一個(gè)示例性實(shí)施例中,縮放值^的范圍可從針對(duì)感知 平坦材料的_6dB到針對(duì)感知音調(diào)材料的OdB。圖12是根據(jù)本發(fā)明一個(gè)示例性實(shí)施例的用于進(jìn)行響度調(diào)整的系統(tǒng)1200的圖。系 統(tǒng)1200通過簡單的一階低通濾波器來平滑從感知響度估計(jì)系統(tǒng)902接收到的短期感知響 度估計(jì)(PLE)。輸入到減法器1208的目標(biāo)感知響度級(jí)可預(yù)先確定、由用戶設(shè)置、或者以別的方式 確定。因?yàn)榻K端用戶重放音量級(jí)是未知的,所以目標(biāo)響度級(jí)可按dBFS而不是按SPL設(shè)置。 例如,如果用戶將目標(biāo)響度級(jí)選擇為-20dBFS,則校正后的音頻信號(hào)將具有-20dBFS的長期 平均電平,同時(shí)維持相等的感知響度。系統(tǒng)1200包括濾波器LP 1 1202和LP 2 1204,這兩個(gè)濾波器可以是一階無限沖 激響應(yīng)低通濾波器或其它適當(dāng)?shù)臑V波器。濾波器LP 11202基于響度校正信號(hào)的上升時(shí)間 來控制,而濾波器LP 2 1204基于響度校正信號(hào)的下降時(shí)間來控制。PLE值通過兩個(gè)濾波器 LP 1 1202和濾波器LP 2 1204被發(fā)送,并且由max 1026挑選最大輸出作為平滑后的PLE 值。在實(shí)際中,使用比下降時(shí)間值要快的上升時(shí)間值。這個(gè)過程使得上升時(shí)間濾波器LP 1 1202控制開始(onset)事件,而下降時(shí)間濾波器LP 2 1204控制衰減(decay)事件。存在反饋環(huán)路以便向響度校正提供可變速度處理。計(jì)算DELTA值,其為當(dāng)前的平 滑后PLE值與前一個(gè)平滑后PLE值之間的差。當(dāng)DELTA值超過預(yù)定的或用戶定義的閾值 時(shí),用于濾波器LP 1 1202和濾波器LP 2 1204的截止頻率分別被設(shè)置為預(yù)定或用戶定義 值Fast^和FastFT。當(dāng)DELTA值的值下降到低于閾值時(shí),截止頻率被設(shè)置為預(yù)定或用戶定 義值S10Wm和SlowFT。加入這個(gè)簡單反饋環(huán)路和可變速度平滑有助于在出現(xiàn)突然的響度開 始時(shí)將其捕獲。由減法器1208計(jì)算最終校正值,其為目標(biāo)值與平滑后的PLE值之間的差。然后由 加法器1210a至1210n將該校正值應(yīng)用于源信號(hào)的所有通道Xl (f)至xN(f),并且分別由頻 時(shí)變換1212a至1212n產(chǎn)生響度校正后的輸出信號(hào)yi (t)至71<(0。盡管這里已經(jīng)詳細(xì)描述了本發(fā)明的系統(tǒng)和方法的示例性實(shí)施例,但本領(lǐng)域技術(shù)人 員也將認(rèn)識(shí)到,可以對(duì)所述系統(tǒng)和方法可進(jìn)行各種替代和修改,而不脫離所附權(quán)利要求的 范圍和精神。
權(quán)利要求
一種用于控制音量的系統(tǒng),包括感知響度估計(jì)單元,用于確定信號(hào)的多個(gè)頻帶中的每一個(gè)頻帶的感知響度;和增益控制單元,用于接收所述信號(hào)的所述多個(gè)頻帶之一的感知響度,并且用于根據(jù)該頻帶的感知響度來調(diào)節(jié)所述信號(hào)的該頻帶的增益。
2.根據(jù)權(quán)利要求1所述的系統(tǒng),其中所述感知響度估計(jì)單元還包括多個(gè)感知平坦度縮 放單元,每一個(gè)感知平坦度縮放單元用于接收所述信號(hào)的一個(gè)子帶的幅度數(shù)據(jù)、產(chǎn)生對(duì)應(yīng) 的縮放值、以及將所述幅度數(shù)據(jù)乘以所述對(duì)應(yīng)的縮放值以產(chǎn)生縮放后的子帶幅度。
3.根據(jù)權(quán)利要求2所述的系統(tǒng),其中所述感知響度估計(jì)單元還包括恒功率求和單元, 用于接收多個(gè)縮放后的子帶幅度,并且產(chǎn)生組合的音頻頻譜。
4.根據(jù)權(quán)利要求3所述的系統(tǒng),其中所述組合的音頻頻譜根據(jù)以下等式確定
5.根據(jù)權(quán)利要求3所述的系統(tǒng),還包括等響整形系統(tǒng),用于接收所述組合的音頻頻譜, 并通過根據(jù)等響曲線縮放所述組合的音頻頻譜來產(chǎn)生等響整形頻譜。
6.根據(jù)權(quán)利要求5所述的系統(tǒng),還包括感知響度估計(jì)系統(tǒng),所述感知響度估計(jì)系統(tǒng)接 收所述等響整形頻譜,并產(chǎn)生感知響度估計(jì)。
7.根據(jù)權(quán)利要求1所述的系統(tǒng),其中所述增益控制單元還包括 上升時(shí)間濾波器,用于接收感知響度估計(jì)和控制開始事件;和 下降時(shí)間濾波器,用于接收所述感知響度估計(jì)和控制衰減事件。
8.根據(jù)權(quán)利要求1所述的系統(tǒng),其中所述增益控制單元還包括感知響度估計(jì)平滑系 統(tǒng),所述感知響度估計(jì)平滑系統(tǒng)接收一系列感知響度估計(jì)值,并且產(chǎn)生平滑后的感知響度 估計(jì)值。
9.根據(jù)權(quán)利要求1所述的系統(tǒng),其中所述增益控制單元還包括反饋環(huán)路,所述反饋環(huán) 路用于從當(dāng)前的平滑后感知響度估計(jì)值和前一個(gè)平滑后感知響度估計(jì)值產(chǎn)生差值,并且如 果該差值超過預(yù)定閾值,則修改用于一個(gè)或多個(gè)濾波器的截止頻率。
10.一種用于控制音量的方法,包括確定信號(hào)的多個(gè)頻帶中的每一個(gè)頻帶的感知響度;在增益控制單元處接收所述信號(hào)的所述多個(gè)頻帶之一的感知響度;和根據(jù)該頻帶的感知響度來調(diào)節(jié)所述信號(hào)的該頻帶的增益。
11.根據(jù)權(quán)利要求10所述的方法,還包括 接收所述信號(hào)的多個(gè)子帶的幅度數(shù)據(jù);為所述信號(hào)的多個(gè)子帶中的每一個(gè)子帶產(chǎn)生對(duì)應(yīng)的縮放值;和 將所述幅度數(shù)據(jù)乘以所述對(duì)應(yīng)的縮放值以產(chǎn)生縮放后的子帶幅度。
12.根據(jù)權(quán)利要求11所述的方法,還包括接收多個(gè)縮放后的子帶幅度,和產(chǎn)生組合的 音頻頻譜。
13.根據(jù)權(quán)利要求12所述的方法,其中所述組合的音頻頻譜根據(jù)以下等式確定
14.根據(jù)權(quán)利要求12所述的方法,還包括通過根據(jù)等響曲線縮放所述組合的音頻頻譜 來產(chǎn)生等響整形頻譜。
15.根據(jù)權(quán)利要求14所述的方法,還包括產(chǎn)生感知響度估計(jì)。
16.根據(jù)權(quán)利要求10所述的方法,還包括 基于感知響度估計(jì),控制開始事件;和 基于所述感知響度估計(jì),控制衰減事件。
17.根據(jù)權(quán)利要求10所述的方法,還包括接收一系列感知響度估計(jì)值,和產(chǎn)生平滑后 的感知響度估計(jì)值。
18.根據(jù)權(quán)利要求10所述的方法,還包括從當(dāng)前的平滑后感知響度估計(jì)值和前一個(gè)平滑后感知響度估計(jì)值產(chǎn)生差值;和 如果該差值超過預(yù)定閾值,則修改用于一個(gè)或多個(gè)濾波器的截止頻率。
19.一種用于控制音量的系統(tǒng),包括用于確定信號(hào)的多個(gè)頻帶中的每一個(gè)頻帶的感知響度的裝置;和 用于接收所述信號(hào)的所述多個(gè)頻帶之一的感知響度并根據(jù)該頻帶的感知響度來調(diào)節(jié) 所述信號(hào)的該頻帶的增益的裝置。
20.根據(jù)權(quán)利要求19所述的系統(tǒng),還包括多個(gè)感知平坦度縮放單元,每一個(gè)感知平坦 度縮放單元用于接收所述信號(hào)的一個(gè)子帶的幅度數(shù)據(jù),產(chǎn)生對(duì)應(yīng)的縮放值,以及將所述幅 度數(shù)據(jù)乘以所述對(duì)應(yīng)的縮放值以產(chǎn)生縮放后的子帶幅度。
全文摘要
一種用于控制音量的系統(tǒng),包括感知響度估計(jì)單元,該感知響度估計(jì)單元用于確定信號(hào)的多個(gè)頻帶中的每一個(gè)頻帶的感知響度。增益控制單元用于接收所述信號(hào)的所述多個(gè)頻帶之一的感知響度,并且用于根據(jù)該頻帶的感知響度來調(diào)節(jié)所述信號(hào)的該頻帶的增益。
文檔編號(hào)H04N5/60GK101855901SQ200880102054
公開日2010年10月6日 申請(qǐng)日期2008年8月15日 優(yōu)先權(quán)日2007年8月16日
發(fā)明者J·湯普森, R·里姆斯 申請(qǐng)人:Dts(英屬維爾京群島)有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
汉沽区| 五原县| 遂宁市| 泰宁县| 内丘县| 收藏| 读书| 铁岭市| 抚顺市| 婺源县| 三门县| 和静县| 深圳市| 嘉善县| 隆昌县| 九寨沟县| 石楼县| 枣阳市| 清远市| 荔浦县| 通化县| 贞丰县| 平阳县| 临海市| 定西市| 天门市| 夏邑县| 彩票| 建瓯市| 武功县| 方正县| 定襄县| 浏阳市| 金阳县| 乌兰浩特市| 余干县| 岚皋县| 微山县| 曲水县| 文成县| 五河县|