專利名稱:解碼音頻信號的方法和裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及用于對音頻信號進行處理的裝置及方法。盡管本發(fā)明適用于廣泛的應用,但其尤其適用于對經(jīng)由數(shù)字介質(zhì)、廣播信號等接收的音頻信號進行處理。
背景技術(shù):
通常,在用于將包括多個對象的音頻信號下混合為單聲道或立體聲信號的處理中,從該對象中提取參數(shù)。在對下混合信號進行解碼中使用這些參數(shù)。并且,用戶做出的選擇以及該參數(shù)可以控制每個對象的定位(panning)和增益。
發(fā)明內(nèi)容
技術(shù)問題首先,用戶所做的選擇可以控制在下混合信號中包括的對象的定位和增益。然而, 在對象的定位和增益,具體而言對象的增益受到用戶控制的情況中,由于沒有用于增益控制的準則或者未對增益控制做出限制,因此聲音質(zhì)量可能根據(jù)增益控制而失真。其次,在用戶調(diào)整對象的定位和增益的情況中,必須在用戶接口上檢查用于定位和增益控制的準則或者對于定位和增益控制所做的限制。技術(shù)方案因此,本發(fā)明涉及一種用于處理音頻信號的裝置及其方法,其基本避免了由于相關(guān)技術(shù)的限制和缺點所帶來的一個或多個問題。本發(fā)明的一個目的是提供一種用于處理音頻信號的裝置及其方法,通過該裝置和方法,可以基于用戶所做的選擇來控制對象的定位和增益。本發(fā)明的另一目的是提供一種對音頻信號進行處理的裝置及其方法,通過該裝置和方法,可以在預定限制范圍內(nèi)基于用戶所做的選擇,控制對象的定位和增益。本發(fā)明的進一步目的是提供一種用于處理音頻信號的裝置及其方法,通過該裝置和方法,如果可以基于用戶所做的選擇來控制對象的定位和增益,則可以在用戶界面上檢查用于定位和增益控制的準則和/或?qū)τ诙ㄎ缓驮鲆婵刂扑龅南拗啤S幸嫘Ч鄳?,本發(fā)明提供以下效果和/或優(yōu)點。首先,本發(fā)明可以基于用戶所做的選擇來控制對象的增益和定位。其次,在對象的增益和定位受控的情況下,本發(fā)明可以用對定位和/或增益調(diào)整提供限制范圍的方式,防止根據(jù)定位和/或增益調(diào)整的聲音質(zhì)量的失真。第三,在對象的增益和定位受控的情況下,本發(fā)明可以用在用戶界面上顯示可以檢查用于定位和增益控制的準則和/或?qū)Χㄎ缓驮鲆婵刂扑龅南拗频姆绞剑乐垢鶕?jù)定位和/或增益調(diào)整的聲音質(zhì)量的失真。第四,在對象的增益和定位受控的情況下,本發(fā)明用在用戶界面上顯示調(diào)整結(jié)果的方式,使得用戶可以檢查是否實際執(zhí)行了用戶特定對象(user-specific object)的定位和增益調(diào)整。
附圖被包括進來以提供對本發(fā)明的進一步理解,并且附圖被并入和組成本說明書的一部分,附示說明了本發(fā)明的實施例,并與描述一起解釋本發(fā)明的原理。在附圖中圖1是根據(jù)本發(fā)明一個實施例的音頻信號處理裝置的示圖;圖2是根據(jù)本發(fā)明實施例的音頻信號處理裝置的框圖;圖3是根據(jù)本發(fā)明實施例,包括在音頻信號處理裝置中的提取單元的配置的詳細框圖;圖4是根據(jù)本發(fā)明一個實施例,包括圖形用戶界面的音頻信號處理裝置的配置的框圖;圖5是根據(jù)本發(fā)明一個實施例,使用圖形用戶界面來顯示電平指導信息(level guide information)的方法的示圖;圖6是根據(jù)本發(fā)明另一實施例,使用圖形用戶界面來顯示電平指導信息的方法的示圖;圖7是指示電平指導信息是否存在于比特流中以及指示電平指導信息在比特流中的位置的示圖;圖8是根據(jù)本發(fā)明一個實施例的音頻信號處理方法的流程圖;圖9是根據(jù)本發(fā)明一個實施例,包括圖形用戶界面的音頻信號處理裝置的配置的框圖,該圖形用戶界面被配置為顯示對應于電平指導信息的表示(!^presentation);圖10是根據(jù)本發(fā)明又一實施例,包括圖形用戶界面的音頻信號處理裝置的配置的框圖;圖11示出根據(jù)本發(fā)明一個實施例,顯示與修改后的混合信息相對應的表示的方法;圖12是根據(jù)本發(fā)明另一實施例,顯示與修改后的混合信息相對應的表示的方法的示圖;圖13是根據(jù)本發(fā)明再一實施例,包括圖形用戶界面的音頻信號處理裝置的配置的框圖;圖14是根據(jù)本發(fā)明又一實施例,包括圖形用戶界面的音頻信號處理裝置的配置的框圖;圖15是產(chǎn)品的示意框圖,其中實現(xiàn)了根據(jù)本發(fā)明一個實施例的音頻信號處理裝置;以及圖16A和圖16B是根據(jù)本發(fā)明一個實施例,與音頻信號處理裝置一起提供的產(chǎn)品的關(guān)系的示圖。
具體實施例方式本發(fā)明的其他特征和優(yōu)點將在以下說明中闡述,并且部分地將因該說明而變得明顯,或可通過本發(fā)明的實踐而知悉。通過在所撰寫的說明書及其權(quán)利要求以及附圖中具體指出的結(jié)構(gòu),將實現(xiàn)并獲得本發(fā)明的目的和其它優(yōu)點。為了實現(xiàn)這些和其他益處并根據(jù)本發(fā)明的目的,如所體現(xiàn)的和寬泛描述的,一種用于處理音頻信號的方法,包括以下步驟接收包括多個對象的下混合信號以及包括對象信息和下混合增益信息的比特流;獲取用于指示在比特流中是否存在電平指導信息的用于所有幀的電平指導標記信息;基于電平指導標記信息,從比特流獲取電平指導信息,電平指導信息表示應用于多個對象中至少一個對象的對象電平的限制;接收混合信息;基于電平指導信息和下混合增益信息,通過修改混合信息來產(chǎn)生修改后的混合信息;并且基于修改后的混合信息和對象信息,產(chǎn)生下混合處理信息和多聲道信息中的至少一個,其中使用用于多個對象中至少一個對象的對象電平,估計混合信息,并且當產(chǎn)生下混合信號時,確定對象信息和下混合增益信息。優(yōu)選地,從比特流的頭部獲取用于所有幀的電平指導標記信息。優(yōu)選地,該方法進一步包括獲取用于指示在比特流的幀數(shù)據(jù)中是否存在電平指導信息的用于每個幀的電平指導標記信息,其中電平指導信息被從比特流的幀數(shù)據(jù)中獲取,并且被應用于與幀數(shù)據(jù)相對應的當前幀。優(yōu)選地,電平指導信息對應于固定比特長度,并且該方法進一步包括使用量化表,將用于所有幀的電平指導信息去量化(de-quantize)為電平指導參數(shù),基于電平指導參數(shù)和下混合增益信息,通過修改混合信息來產(chǎn)生修改后的混合信息。優(yōu)選地,該對象信息包括對象電平信息和對象相關(guān)性信息中的至少一個,在不改變聲道數(shù)量的情況下,下混合處理信息將處理下混合信號,多聲道信息包括聲道電平差異、 聲道間相關(guān)性和聲道預測系數(shù)中的至少一個,使用用于至少一個對象的全部或一部分的進一步對象定位,來估計混合信息,并且當產(chǎn)生下混合信號時,下混合增益信息是應用于至少一個對象的增益值。優(yōu)選地,該方法進一步包括使用下混合信號和下混合處理信息,產(chǎn)生處理后的下混合信號,并且基于處理后的下混合信號和多聲道信息,產(chǎn)生多聲道信號。優(yōu)選地,電平指導信息包括應用于多個對象的全部的公共限制。優(yōu)選地,電平指導信息包括應用于多個對象中的每一個的個別限制。為了進一步實現(xiàn)這些和其他益處并根據(jù)本發(fā)明的目的,一種用于處理音頻信號的裝置,包括接收單元,接收包括多個對象的下混合信號以及包括對象信息和下混合增益信息的比特流;提取單元,獲取用于指示在比特流中是否存在電平指導信息的用于所有幀的電平指導標記信息,并且基于電平指導標記信息,從比特流獲取電平指導信息,該電平指導信息表示應用于多個對象中至少一個對象的對象電平的限制;呈現(xiàn)控制單元,接收混合信息,并且基于電平指導信息和下混合增益信息,通過修改混合信息來產(chǎn)生修改后的混合信息;以及信息產(chǎn)生單元,基于修改后的混合信息和對象信息,產(chǎn)生下混合處理信息和多聲道信息中的至少一個,其中使用用于多個對象中至少一個對象的對象電平,來估計混合信息, 并且當產(chǎn)生下混合信號時,確定對象信息和下混合增益信息。優(yōu)選地,從比特流的頭部獲取用于所有幀的電平指導標記信息。優(yōu)選地,提取單元進一步包括獲取用于指示在比特流的幀數(shù)據(jù)中是否存在電平指導信息的用于每個幀的電平指導標記信息;其中電平指導信息被從比特流的幀數(shù)據(jù)中獲取,并且被應用于與幀數(shù)據(jù)相對應的當前幀。
優(yōu)選地,電平指導信息對應于固定比特長度,并且其中提取單元通過使用量化表, 將用于所有幀的電平指導信息去量化為電平指導參數(shù),其中基于電平指導參數(shù)和下混合增益信息,通過修改混合信息來產(chǎn)生修改后的混合信息。優(yōu)選地,該對象信息包括對象電平信息和對象相關(guān)性信息中的至少一個,在不改變聲道數(shù)量的情況下,下混合處理信息將處理下混合信號,多聲道信息包括聲道電平差異、 聲道間相關(guān)性和聲道預測系數(shù)中的至少一個,使用用于至少一個對象的全部或一部分的進一步對象定位,來估計混合信息,并且當產(chǎn)生下混合信號時,下混合增益信息是應用于至少一個對象的增益值。優(yōu)選地,該裝置進一步包括下混合處理單元,通過使用下混合信號和下混合處理信息,產(chǎn)生處理后的下混合信號;以及多聲道解碼器,基于處理后的下混合信號和多聲道信息,產(chǎn)生多聲道信號。優(yōu)選地,電平指導信息包括應用于多個對象的全部的公共限制。優(yōu)選地,電平指導信息包括應用于多個對象中的每一個的個別限制。
具體實施例方式現(xiàn)在將具體參考本發(fā)明的優(yōu)選實施例,本發(fā)明的示例在附圖中予以說明。首先,在本說明和權(quán)利要求中使用的術(shù)語和詞語不被解釋為受限于一般的意義或者字典的意義,而是應當基于發(fā)明人能夠適當定義術(shù)語的概念以便用最佳方式描述發(fā)明人的發(fā)明的原理,而被解釋為匹配于本發(fā)明的技術(shù)思想的意義和概念。在本公開中公開的實施例和在附圖中示出的配置僅是優(yōu)選實施例,并不代表本發(fā)明的所有技術(shù)思想。因此,應當理解,本發(fā)明涵蓋本發(fā)明的修改和變化,只要在提交本申請的時間點,這些修改和變化處于所附權(quán)利要求以及其等效內(nèi)容的范圍之內(nèi)??梢曰谝韵聵藴式忉屧诒景l(fā)明中的以下術(shù)語,并且可以根據(jù)以下目的來解釋未被解釋的其他術(shù)語。具體而言,在本公開中,本公開中的信息是一般包括值、參數(shù)、系數(shù)、元素等的術(shù)語,并且有時可以對其意義做不同的解釋,本發(fā)明并不受限于此。圖1是根據(jù)本發(fā)明一個實施例的音頻信號處理裝置的示圖。參照圖1,根據(jù)本發(fā)明一個實施例的音頻信號處理裝置100主要包括下混合單元 110和對象編碼器120。將多個對象輸入到下混合單元110來產(chǎn)生單聲道或立體聲下混合信號。另外,將多個對象輸入對象編碼器120,以產(chǎn)生指示對象的屬性的對象信息。對象信息包括指示對象的電平的對象電平信息和指示對象間相關(guān)性的對象相關(guān)性信息。在下混合信號是立體聲信號的情況下,對象信息包括指示增益間的差異的對象增益比率,該增益中的每一個指示在下混合信號的相應聲道(channel)(例如,左聲道、右聲道等)中對象被包括的程度。而且,在產(chǎn)生下混合信號的情況下,對象編碼器120可以附加地產(chǎn)生對象增益信息DMG,該對象增益信息DMG指示施加到對象的增益。另外,對象編碼器120可以進一步產(chǎn)生電平指導信息,以下具體參照圖2進行解釋。另外,對象編碼器120可以通過將對象信息、下混合增益信息、電平指導信息等復用在一起,產(chǎn)生比特流。同時,復用器(在附圖中未示出)可以通過將下混合單元110產(chǎn)生的下混合信號以及對象編碼器120產(chǎn)生的參數(shù)(例如,對象信息等)復用在一起,產(chǎn)生一個比特流。
圖2是根據(jù)本發(fā)明一個實施例的音頻信號處理裝置的框圖。參照圖2,根據(jù)本發(fā)明的音頻處理裝置200包括接收單元210、提取單元220、呈現(xiàn)(rendering)控制單元230和對象解碼器M0,還可以進一步包括多聲道解碼器270。對象解碼器240可以包括下混合處理器單元250和信息產(chǎn)生單元沈0。接收單元210從音頻信號處理裝置100接收包括至少一個對象的下混合信號DMX, 還接收包括對象信息的比特流。在這種情況下,比特流可以進一步包括下混合增益信息和電平指導信息。在附圖中,示出的是分開地接收下混合信號和比特流。這樣是為了有助于理解本發(fā)明。如在以上描述中提及的,可以通過將下混合信號包括在與其復用在一起的一個比特流中來發(fā)送下混合信號。提取單元220從接收單元210所發(fā)送的比特流中提取下混合信息和電平指導信息。以下參照圖4描述提取單元220的詳情。呈現(xiàn)控制單元230從用戶接口(附圖中未示出)接收混合信息MXI,還接收提取單元220所提取的下混合增益信息和電平指導信息。以下參照圖4描述呈現(xiàn)控制單元230的詳情?;旌闲畔⑹腔趯ο笪恢眯畔ⅰο笤鲆嫘畔ⅰ⒅胤排渲眯畔⒌榷a(chǎn)生的信息。具體而言,對象位置信息是用戶輸入的信息,用來控制每個對象的位置或定位。并且,對象增益信息是用戶輸入的信息,用來控制每個對象的增益。并且,重放配置信息是包括揚聲器數(shù)量、揚聲器位置、環(huán)境信息(揚聲器的虛擬位置)等的信息。重放配置信息由用戶輸入、被提前存儲、或者可以被從其他設備接收。在產(chǎn)生下混合信號的情況中,下混合增益信息指示施加到對象的增益。并且,電平指導信息是指示用于至少一個對象的再現(xiàn)電平的限制或?qū)ο箅娖降南拗频男畔?。在這種情況下,在對象電平被過度地增大或抑制的情況中,需要對象電平的限制以防止聲音質(zhì)量失真。對象電平的限制可以包括用于避免增大超過特定值的增大限制值,以及用于避免抑制超過特定值的抑制限制值。電平指導信息由音頻信號處理裝置200自身產(chǎn)生,或者可以由用戶提前定義。而本發(fā)明意圖描述由編碼器產(chǎn)生電平指導信息的情況?;陔娖街笇畔⒑拖禄旌显鲆嫘畔ⅲ尸F(xiàn)控制單元230通過修改混合信息來產(chǎn)生修改后的混合信息。以下將參照圖11解釋這個過程的詳情。將修改后的混合信息輸入到信息產(chǎn)生單元260。同時,參考圖2,例如由用戶輸入混合信息,本發(fā)明并不受限于此。替代性地,混合信息包括通過被包括在比特流中而被輸入給接收單元210的信息,或者可以包括從外部或單獨地輸入的信息。同時,信息產(chǎn)生單元260可以基于修改后的混合信息,產(chǎn)生下混合處理信息和多聲道信息中的至少一個。具體而言,在解碼模式中(例如,輸出模式是單聲道、立體聲或 3D (雙耳)輸出),信息產(chǎn)生單元260產(chǎn)生下混合處理信息。在轉(zhuǎn)碼模式的情況中(例如, 輸出模式是多聲道模式),信息產(chǎn)生單元260可以進一步產(chǎn)生多聲道信息。在這種情況下,下混合處理信息(DPI)是用于處理下混合的信息。在解碼模式的情況中,下混合處理信息(DPI)是用于通過調(diào)整對象的電平和/或定位,來產(chǎn)生最終輸出 (例如,時域中的PCM信號)的信息。在轉(zhuǎn)碼模式的情況中,下混合處理信息(DPI)可以是用于在不改變聲道數(shù)量的情況下,對立體聲下混合信號調(diào)整對象定位的信息。在轉(zhuǎn)碼模式和單聲道下混合信號的情況中,不產(chǎn)生下混合處理信息(DPI),并且下混合信號DMX可以繞過下混合處理單元250。同時,多聲道信息是用于對下混合信號或者處理后的下混合信號進行上混合的信息。而且,多聲道信息可以包括聲道電平信息、聲道相關(guān)性信息和聲道預測系數(shù)。在由信息產(chǎn)生單元260產(chǎn)生下混合處理信息(DPI)的情況中,下混合處理單元250 可以使用下混合信號和下混合處理信息(DPI)來產(chǎn)生處理后的下混合信號。在前述解碼模式的情況中,處理后的下混合信號可以包括時域的PCM信號。在這種情況下,將處理后的下混合信號作為最終輸出信號傳送給諸如揚聲器的輸出設備,而不是傳送給多聲道解碼器 270。將多聲道信息輸出到多聲道解碼器270。隨后,通過使用處理后的下混合信號(在轉(zhuǎn)碼模式和立體聲下混合的情況中)或者下混合信號DMX(在轉(zhuǎn)碼模式和單聲道下混合的情況中)以及多聲道信息(MI)來執(zhí)行上混合,多聲道解碼器270可以最終產(chǎn)生多聲道信號。圖3是根據(jù)本發(fā)明一個實施例,包括在音頻信號處理裝置中的提取單元的配置的詳細框圖。參照圖3,根據(jù)本發(fā)明實施例包括在音頻信號處理裝置中的提取單元200表示參照圖2描述的提取單元220的具體配置。而且,提取單元200包括下混合增益信息提取單元222、對象信息提取單元224、電平指導標記獲取單元226、電平指導信息獲取單元2 和呈現(xiàn)控制單元230。下混合增益信息提取單元222提取從參照圖2描述的接收單元210接收到的比特流中所包括的下混合增益信息。在這種情況下,如在以上描述中提及的,下混合增益信息是用于指示施加到包括在下混合信號中的每個對象的增益的信息。對象信息提取單元2M從接收到的比特流中提取對象信息。在這種情況下,如在以上描述中提及的,對象信息可以包括對象電平信息、對象相關(guān)性信息等。電平指導標記獲取單元2 從接收到的比特流中獲取電平指導標記。具體而言, 電平指導標記可以包括用于全部幀的電平指導標記和用于每個幀的電平指導標記。用于全部幀的電平指導標記指示在比特流中是否包括電平指導信息??梢栽诒忍亓鞯念^部中包括該標記。同時,用于每個幀的電平指導標記信息指示在比特流的幀數(shù)據(jù)中是否存在電平指導信息。而且,也可以在比特流的頭部中包括該標記。根據(jù)電平指導標記獲取單元2 所獲取的標記,將比特流引入到電平指導信息獲取單元228。如果標記指示在接收到的比特流中包括電平指導信息(例如,如果標記的值被設置為1),則將比特流引入到電平指導信息獲取單元228。相反,如果標記指示在接收到的比特流中不包括電平指導信息(例如,如果標記的值被設置為0),則接收到的比特流繞過電平指導信息獲取單元228。在電平指導標記指示在比特流中包括電平指導信息的情況中,電平指導信息獲取單元2 從比特流中獲取電平指導信息。在這種情況下,電平指導信息可以對應于全部幀或僅對應于特定幀,以下將參照圖7對其詳情進行解釋。呈現(xiàn)控制單元230從下混合增益信息獲取單元220獲取下混合增益信息,從用戶接口(附圖中未示出)獲取混合信息,并且從電平指導信息獲取單元2 獲取電平指導信息?;陔娖街笇畔ⅲ尸F(xiàn)控制單元230通過修改混合信息來產(chǎn)生修改后的混合信息。然后將修改后的混合信息傳送給參照圖2描述的信息產(chǎn)生單元沈0。電平指導信息是指示用于至少一個對象的再現(xiàn)電平的限制的信息,并且可以例如包括用于對象的增益調(diào)整的范圍。在這種情況下,可以將該范圍設置為限制值,諸如上限、 下限等,本發(fā)明并不受限于此。限制值可以對應于用于特定對象的絕對增益值。例如,在包括2個對象(對象A、 對象B)的對象信號中,將對象A(例如,語音對象)的增益調(diào)整范圍設置在6dB內(nèi),并且可以將對象B(例如,吉他對象)的增益調(diào)整值設置在12dB內(nèi)。以下將參照圖8來對此做進一步的詳細解釋。圖4是根據(jù)本發(fā)明一個實施例,包括圖形用戶界面的音頻信號處理裝置的配置的框圖。參考圖4,除了先前參照圖2描述的音頻信號處理裝置200以外,根據(jù)本發(fā)明一個實施例的音頻信號處理裝置400可以進一步包括圖形用戶界面480。圖4中的接收單元410、提取單元420、呈現(xiàn)控制單元430、對象解碼器440、下混合處理單元450、信息產(chǎn)生單元460和多聲道解碼器470分別與圖2所示的相同名稱組件的配置與功能相同,為了清楚起見,在以下描述中省略其詳情。圖形用戶界面480接收用于對至少一個對象的電平進行調(diào)整的用戶輸入。然后將根據(jù)用戶輸入而估計的混合信息輸入到呈現(xiàn)控制單元430。如前所述,呈現(xiàn)控制單元430可以用基于電平指導信息來修改混合信息的方式, 產(chǎn)生修改后的混合信息。而且,圖形用戶界面480可以顯示對應于修改后的混合信息的表
7J\ ο以下將參照圖11具體描述經(jīng)由圖形用戶界面480的用戶輸入和修改后的混合信息顯示方法。圖5是根據(jù)本發(fā)明一個實施例,使用圖形用戶界面來顯示電平指導信息的方法的示圖。參照圖5,圖形用戶界面顯示對應于電平指導信息的表示,電平指導信息指示用于包括在下混合信號中的多個對象中的至少一個對象的呈現(xiàn)限制(rendering limitation)。 在這種情況下,該表示可以包括表示呈現(xiàn)限制的非推薦呈現(xiàn)區(qū)域和表示除呈現(xiàn)限制以外的呈現(xiàn)范圍的推薦呈現(xiàn)區(qū)域。另外,圖形用戶界面另外地顯示了用于接收用戶輸入的電平調(diào)節(jié)器(level fader),該用戶輸入用于控制多個對象中的至少一個的電平。在這種情況下,對應于電平指導信息的表示可以與電平調(diào)節(jié)器相關(guān)聯(lián)地顯示。電平調(diào)節(jié)器沿著直線或曲線操作??梢栽谥本€或曲線上顯示非推薦呈現(xiàn)區(qū)域和推薦呈現(xiàn)區(qū)域中的每一個。而且,電平調(diào)節(jié)器可在推薦呈現(xiàn)區(qū)域內(nèi)操作。圖5示出電平調(diào)節(jié)器沿著直線操作,本發(fā)明不受限于此。推薦呈現(xiàn)區(qū)域的形狀(或形式)不同于非推薦呈現(xiàn)區(qū)域的形狀(或形式)。也就是說,形狀可以例如包括顏色、亮度、 紋理和圖案中的至少一種。參照圖5,例如如果描述了低音對象,則推薦呈現(xiàn)區(qū)域510被表示為綠線,而非推薦呈現(xiàn)區(qū)域520可以被表示為紅線。本發(fā)明參照顏色區(qū)分了推薦呈現(xiàn)區(qū)域和非推薦呈現(xiàn)區(qū)域的形狀,本發(fā)明并不受限 于此。如前所述,本發(fā)明可以包括參照亮度、紋理、圖案等來實現(xiàn)視覺區(qū)分的所有情況。在調(diào)整對象的増益和定位,尤其是對象的増益的情況中,用戶可以基于對應于電 平指導信息的表示,來查看用于增益調(diào)整的限制范圍。因此,可以防止聲音質(zhì)量根據(jù)定位調(diào) 整和/或増益調(diào)整而失真。圖6是根據(jù)本發(fā)明另一個實施例,使用圖形用戶界面來顯示電平指導信息的方法 的示圖。圖5所示的顯示方法僅提供了用于增益調(diào)整的限制范圍,但是沒有對未偏離范圍 的增益調(diào)整做出限制。因此,聲音質(zhì)量可能根據(jù)用戶做出的増益調(diào)整而失真。參照圖6,為了防止以上問題,顯示了電平調(diào)節(jié)器的上限和下限。并且,基于電平指 導信息,使得用戶不偏離用于增益調(diào)整的限制范圍。因此,可以防止聲音質(zhì)量根據(jù)用戶做出 的増益調(diào)整而失真??梢詫⒂脩糨斎胨烙嫷纳鲜龌旌闲畔⒆鳛楣?所示的呈現(xiàn)矩陣而輸入。在公 式1所示的呈現(xiàn)矩陣中,每行指示輸入信號的每個聲道,每列指示在輸入信號中包括的每 個對象。因此,可以根據(jù)該矩陣確定從每個聲道輸出的每個對象的大小。具體而言,可以通過公式2估計在呈現(xiàn)矩陣中的N個對象中的第i個對象的輸出。數(shù)學式權(quán)利要求
1.一種用于處理音頻信號的方法,包括接收包括多個對象的下混合信號以及包括對象信息和下混合增益信息的比特流; 獲取用于指示在所述比特流中是否存在電平指導信息的用于所有幀的電平指導標記 fn息;基于所述電平指導標記信息,從所述比特流獲取所述電平指導信息,所述電平指導信息表示應用于所述多個對象中至少一個對象的對象電平的限制; 接收混合信息;基于所述電平指導信息和所述下混合增益信息,通過修改所述混合信息來產(chǎn)生修改后的混合信息;以及基于修改后的混合信息和所述對象信息,產(chǎn)生下混合處理信息和多聲道信息中的至少一個,其中使用用于所述多個對象中至少一個對象的對象電平估計所述混合信息, 并且其中當產(chǎn)生所述下混合信號時,確定所述對象信息和所述下混合增益信息。
2.如權(quán)利要求1所述的方法,其中從所述比特流的頭部獲取用于所有幀的電平指導標記信息ο
3.如權(quán)利要求1所述的方法,進一步包括獲取用于指示在所述比特流的幀數(shù)據(jù)中是否存在電平指導信息的用于每個幀的電平指導標記信息;其中從所述比特流的幀數(shù)據(jù)獲取所述電平指導信息,并且將所述電平指導信息應用于與所述幀數(shù)據(jù)相對應的當前幀。
4.如權(quán)利要求1所述的方法,其中所述電平指導信息對應于固定比特長度,并且所述方法進一步包括使用量化表,將用于所有幀的電平指導信息去量化為電平指導參數(shù), 基于所述電平指導參數(shù)和所述下混合增益信息,通過修改所述混合信息來產(chǎn)生修改后的混合信息。
5.如權(quán)利要求1所述的方法,其中所述對象信息包括對象電平信息和對象相關(guān)性信息中的至少一個, 在不改變聲道數(shù)量的情況下,所述下混合處理信息將處理所述下混合信號, 所述多聲道信息包括聲道電平差異、聲道間相關(guān)性和聲道預測系數(shù)中的至少一個, 使用用于所述至少一個對象的全部或一部分的進一步對象定位,估計所述混合信息,以及當產(chǎn)生所述下混合信號時,所述下混合增益信息是應用于至少一個對象的增益值。
6.如權(quán)利要求1所述的方法,進一步包括使用所述下混合信號和所述下混合處理信息產(chǎn)生處理后的下混合信號;以及, 基于所述處理后的下混合信號和所述多聲道信息產(chǎn)生多聲道信號。
7.如權(quán)利要求1所述的方法,其中所述電平指導信息包括應用于所述多個對象的全部的公共限制。
8.如權(quán)利要求1所述的方法,其中所述電平指導信息包括應用于所述多個對象中的每一個的個別限制。
9.一種用于處理音頻信號的裝置,包括接收單元,接收包括多個對象的下混合信號以及包括對象信息和下混合增益信息的比特流;提取單元,獲取用于指示在所述比特流中是否存在電平指導信息的用于所有幀的電平指導標記信息,并且基于所述電平指導標記信息,從所述比特流獲取電平指導信息,所述電平指導信息表示應用于所述多個對象中至少一個對象的對象電平的限制;呈現(xiàn)控制單元,接收混合信息,并且基于所述電平指導信息和所述下混合增益信息,通過修改所述混合信息來產(chǎn)生修改后的混合信息;以及信息產(chǎn)生單元,基于所述修改后的混合信息和所述對象信息產(chǎn)生下混合處理信息和多聲道信息中的至少一個,其中使用用于所述多個對象中至少一個對象的對象電平估計所述混合信息, 并且其中當產(chǎn)生所述下混合信號時,確定所述對象信息和所述下混合增益信息。
10.如權(quán)利要求9所述的裝置,其中從所述比特流的頭部獲取用于所有幀的電平指導標記信息。
11.如權(quán)利要求9所述的裝置,其中所述提取單元進一步獲取用于指示在所述比特流的幀數(shù)據(jù)中是否存在電平指導信息的用于每個幀的電平指導標記信息,其中從所述比特流的幀數(shù)據(jù)獲取所述電平指導信息,并且將所述電平指導信息應用于與所述幀數(shù)據(jù)相對應的當前幀。
12.如權(quán)利要求9所述的裝置,其中所述電平指導信息對應于固定比特長度,并且其中所述提取單元使用量化表將用于所有幀的電平指導信息去量化為電平指導參數(shù), 其中基于所述電平指導參數(shù)和所述下混合增益信息通過修改所述混合信息來產(chǎn)生修改后的混合信息。
13.如權(quán)利要求9所述的裝置,其中所述對象信息包括對象電平信息和對象相關(guān)性信息中的至少一個, 在不改變聲道數(shù)量的情況下,所述下混合處理信息將處理所述下混合信號, 所述多聲道信息包括聲道電平差異、聲道間相關(guān)性和聲道預測系數(shù)中的至少一個, 使用用于所述至少一個對象的全部或一部分的進一步對象定位估計所述混合信息,以及當產(chǎn)生所述下混合信號時,所述下混合增益信息是應用于至少一個對象的增益值。
14.如權(quán)利要求9所述的裝置,進一步包括下混合處理單元,通過使用所述下混合信號和所述下混合處理信息產(chǎn)生處理后的下混合信號;以及,多聲道解碼器,基于所述處理后的下混合信號和所述多聲道信息產(chǎn)生多聲道信號。
15.如權(quán)利要求9所述的裝置,其中所述電平指導信息包括應用于所述多個對象的全部的公共限制。
16.如權(quán)利要求9所述的裝置,其中所述電平指導信息包括應用于所述多個對象中的每一個的個別限制。
全文摘要
本發(fā)明涉及用于處理音頻信號的裝置及方法。本發(fā)明包括接收包括多個對象的下混合信號以及包括對象信息和下混合增益信息的比特流;獲取用于指示在比特流中是否存在電平指導信息的用于所有幀的電平指導標記信息;基于電平指導標記信息,從比特流獲取電平指導信息,電平指導信息表示應用于多個對象中至少一個對象的對象電平的限制;接收混合信息;基于電平指導信息和下混合增益信息,通過修改混合信息來產(chǎn)生修改后的混合信息;并且基于修改后的混合信息和所述對象信息,產(chǎn)生下混合處理信息和多聲道信息中的至少一個,其中使用用于多個對象中至少一個對象的對象電平,估計混合信息,并且當產(chǎn)生下混合信號時,確定對象信息和下混合增益信息。因此,本發(fā)明可以用對定位和/或增益調(diào)整提供限制范圍的方式,防止根據(jù)定位和/或增益調(diào)整的聲音質(zhì)量的失真。
文檔編號G11B20/10GK102349108SQ201080011640
公開日2012年2月8日 申請日期2010年1月28日 優(yōu)先權(quán)日2009年1月28日
發(fā)明者吳賢午, 鄭亮源 申請人:Lg電子株式會社