專利名稱:處理音頻信號(hào)的方法和裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及音頻信號(hào)處理,并且更具體地,涉及用于處理音頻信號(hào)的裝置及其方 法。盡管本發(fā)明適用于大范圍的應(yīng)用,但是它特別適合于處理經(jīng)由數(shù)字介質(zhì)、廣播信號(hào)等接 收的音頻信號(hào)。
背景技術(shù):
通常,在用于通過將包括多個(gè)對(duì)象的音頻信號(hào)下混合成單聲道或立體聲信號(hào)來(lái)生 成下混合信號(hào)的過程中,從該對(duì)象中提取參數(shù)(或信息)。這些參數(shù)(或信息)在對(duì)下混合 信號(hào)解碼中進(jìn)行使用。而且,對(duì)象的位置和增益可以通過由用戶進(jìn)行的選擇以及參數(shù)來(lái)控 制。
發(fā)明內(nèi)容
技術(shù)問題然而,包括在下混合信號(hào)中的對(duì)象應(yīng)當(dāng)通過用戶的選擇來(lái)控制。在用戶控制對(duì)象 的情況下,用戶不便于直接控制所有對(duì)象信號(hào)。而且,重現(xiàn)包括多個(gè)對(duì)象的音頻信號(hào)的最佳 狀態(tài)可能比專家控制對(duì)象的情況更加困難。技術(shù)方案因此,本發(fā)明針對(duì)一種用于處理音頻信號(hào)的裝置及其方法,該裝置和方法基本上 消除了由于現(xiàn)有技術(shù)的限制和缺點(diǎn)而引起的一個(gè)或多個(gè)問題。本發(fā)明的目的在于提供一種用于處理音頻信號(hào)的裝置及其方法,通過該裝置和方 法可以使用包括預(yù)設(shè)渲染參數(shù)和預(yù)設(shè)元數(shù)據(jù)的預(yù)設(shè)信息來(lái)控制對(duì)象的電平和位置。本發(fā)明的另一目的在于提供一種用于處理音頻信號(hào)的裝置及其方法,通過該裝置 和方法可以使用包括在獨(dú)立于下混合信號(hào)輸入的比特流中的外部預(yù)設(shè)信息來(lái)控制對(duì)象的 電平和位置。本發(fā)明的另一目的在于提供一種用于處理音頻信號(hào)的裝置及其方法,通過該裝置 和方法可以通過根據(jù)音頻源的特性,使用指示與下混合信號(hào)一起輸入的預(yù)設(shè)信息的屬性的 預(yù)設(shè)屬性信息,將在獨(dú)立于下混合信號(hào)輸入的比特流上承載的外部預(yù)設(shè)信息應(yīng)用于整個(gè)下 混合或者下混合信號(hào)的數(shù)據(jù)區(qū)域,來(lái)控制包括在下混合信號(hào)中的對(duì)象。本發(fā)明的另一目的在于提供一種用于處理音頻信號(hào)的裝置及其方法,通過該裝置 和方法可以基于用戶進(jìn)行的選擇,使用與從在屏幕上顯示的多個(gè)外部預(yù)設(shè)元數(shù)據(jù)中選擇的 一個(gè)相對(duì)應(yīng)外部預(yù)設(shè)渲染參數(shù)來(lái)控制對(duì)象的電平和位置。本發(fā)明的又一目的在于提供一種用于處理音頻信號(hào)的裝置及其方法,通過該裝置 和方法可以以在屏幕上顯示對(duì)象的方式來(lái)從用戶接收反饋信息,該對(duì)象通過使外部預(yù)設(shè)渲 染參數(shù)應(yīng)用于該對(duì)象以及選擇的外部預(yù)設(shè)元數(shù)據(jù)來(lái)控制。有益效果因此,本發(fā)明提供了如下效果或優(yōu)點(diǎn)。
首先,本發(fā)明單獨(dú)地選擇通過數(shù)據(jù)區(qū)域(或幀單元)應(yīng)用預(yù)設(shè)信息,或者選擇將同 一預(yù)設(shè)信息應(yīng)用于整個(gè)下混合信號(hào),由此高效地重建音頻信號(hào)。第二,本發(fā)明在沒有每個(gè)對(duì)象的用戶設(shè)定的情況下,使用外部預(yù)設(shè)元數(shù)據(jù)以及預(yù) 先設(shè)定的預(yù)設(shè)信息來(lái)選擇多個(gè)外部預(yù)設(shè)渲染參數(shù)中的一個(gè),由此便于調(diào)整對(duì)象的輸出聲道 的電平。第三,本發(fā)明通過檢查對(duì)象來(lái)選擇更適當(dāng)?shù)耐獠款A(yù)設(shè)信息,由此調(diào)整對(duì)象的輸出 聲道的電平或位置,該對(duì)象通過使外部預(yù)設(shè)信息應(yīng)用于該對(duì)象以及選擇的預(yù)設(shè)元數(shù)據(jù)來(lái)控 制。
附圖被包括進(jìn)來(lái)以提供本發(fā)明的進(jìn)一步的理解并且被并入本說明書且構(gòu)成本說 明書的一部分,附示了本發(fā)明的實(shí)施例并且連同描述一起用于解釋本發(fā)明的原理。在附圖中圖IA和圖IB是根據(jù)本發(fā)明的一個(gè)實(shí)施例的根據(jù)預(yù)設(shè)屬性信息通過應(yīng)用預(yù)設(shè)信息 來(lái)調(diào)整包括在下混合信號(hào)中的對(duì)象的概念的示圖;圖2是根據(jù)本發(fā)明的一個(gè)實(shí)施例的根據(jù)預(yù)設(shè)屬性信息使用外部預(yù)設(shè)信息來(lái)調(diào)整 包括在下混合信號(hào)中的對(duì)象的概念的示圖;圖3是應(yīng)用于包括在下混合信號(hào)中的對(duì)象的外部預(yù)設(shè)信息的概念的示圖;圖4是根據(jù)本發(fā)明的一個(gè)實(shí)施例的音頻信號(hào)處理裝置的框圖;圖5A和圖5B是根據(jù)本發(fā)明的一個(gè)實(shí)施例的靜態(tài)預(yù)設(shè)信息接收單元、動(dòng)態(tài)預(yù)設(shè)信 息接收單元和渲染單元的示意性配置的框圖;圖6是根據(jù)本發(fā)明的一個(gè)實(shí)施例的外部預(yù)設(shè)信息接收單元和渲染單元的示意性 配置的框圖;圖7是圖5A至圖6的一個(gè)中示出的預(yù)設(shè)渲染參數(shù)接收單元的示意性配置的框圖;圖8是根據(jù)本發(fā)明的一個(gè)實(shí)施例的音頻信號(hào)處理裝置的框圖;圖9是外部預(yù)設(shè)信息的比特流結(jié)構(gòu)的示圖;圖10至圖12是根據(jù)本發(fā)明的另一實(shí)施例的與本發(fā)明相關(guān)的語(yǔ)法的各種示圖;圖13是根據(jù)本發(fā)明的另一實(shí)施例的音頻信號(hào)處理裝置的框圖;圖14是根據(jù)本發(fā)明的另一實(shí)施例的音頻信號(hào)處理裝置的顯示單元的示圖;圖15是根據(jù)本發(fā)明的另一實(shí)施例的顯示對(duì)其應(yīng)用外部預(yù)設(shè)信息的對(duì)象的至少一 個(gè)圖示對(duì)象的示圖;圖16是根據(jù)本發(fā)明的另一實(shí)施例的包括外部預(yù)設(shè)信息接收單元、外部預(yù)設(shè)信息 應(yīng)用確定單元、靜態(tài)預(yù)設(shè)信息接收單元、動(dòng)態(tài)預(yù)設(shè)信息接收單元和渲染單元的產(chǎn)品的示意 圖;圖17A和圖17B是根據(jù)本發(fā)明的另一實(shí)施例的產(chǎn)品的關(guān)系的示意圖,這些產(chǎn)品中 的每一個(gè)包括外部預(yù)設(shè)信息接收單元、外部預(yù)設(shè)信息應(yīng)用確定單元、靜態(tài)預(yù)設(shè)信息接收單 元、動(dòng)態(tài)預(yù)設(shè)信息接收單元和渲染單元;以及圖18是根據(jù)本發(fā)明的又一實(shí)施例的包括外部預(yù)設(shè)信息接收單元、外部預(yù)設(shè)信息 應(yīng)用確定單元、靜態(tài)預(yù)設(shè)信息接收單元、動(dòng)態(tài)預(yù)設(shè)信息接收單元和渲染單元的廣播信號(hào)解碼裝置的示意性框圖。最佳模式本發(fā)明的另外的特征和優(yōu)點(diǎn)將在下面的描述中進(jìn)行闡述,并且部分地從描述中而 明顯,或者可以通過實(shí)踐本發(fā)明來(lái)習(xí)得。本發(fā)明的目的和其他優(yōu)點(diǎn)將通過所撰寫的說明書 及其權(quán)利要求以及附圖中具體指出的結(jié)構(gòu)來(lái)實(shí)現(xiàn)和獲得。為了實(shí)現(xiàn)這些和其他優(yōu)點(diǎn)并且根據(jù)本發(fā)明的目的,如所實(shí)施和廣泛描述的,根據(jù) 本發(fā)明的一種處理音頻信號(hào)的方法包括用于處理音頻信號(hào)的裝置,包括信息接收單元, 該信息接收單元接收包括至少一個(gè)對(duì)象的下混合信號(hào)以及用于渲染包括在下混合信號(hào)中 的至少一個(gè)對(duì)象的多個(gè)預(yù)設(shè)信息;外部預(yù)設(shè)信息接收單元,該外部預(yù)設(shè)信息接收單元接收 從外部輸入的多個(gè)外部預(yù)設(shè)信息以及指示應(yīng)用了外部預(yù)設(shè)信息的對(duì)象數(shù)目的應(yīng)用的對(duì)象 數(shù)目信息;外部預(yù)設(shè)應(yīng)用確定單元,該外部預(yù)設(shè)應(yīng)用確定單元基于應(yīng)用的對(duì)象數(shù)目信息來(lái) 確定是否將多個(gè)外部預(yù)設(shè)信息應(yīng)用于下混合信號(hào);外部預(yù)設(shè)信息選擇單元,如果選擇了多 個(gè)外部預(yù)設(shè)信息,則該外部預(yù)設(shè)信息選擇單元在多個(gè)外部預(yù)設(shè)信息中選擇一個(gè)外部預(yù)設(shè)信 息;以及渲染單元,該渲染單元通過將外部預(yù)設(shè)信息應(yīng)用于所有數(shù)據(jù)區(qū)域來(lái)控制對(duì)象,其 中,外部預(yù)設(shè)信息包括用于渲染下混合信號(hào)的外部預(yù)設(shè)渲染參數(shù)和指示外部預(yù)設(shè)渲染參數(shù) 的屬性的外部預(yù)設(shè)元數(shù)據(jù)。優(yōu)選地,外部預(yù)設(shè)應(yīng)用確定單元進(jìn)一步使用指示是否將外部預(yù)設(shè)信息應(yīng)用于下混 合信號(hào)的外部元數(shù)據(jù)信息。優(yōu)選地,外部預(yù)設(shè)信息接收單元包括外部預(yù)設(shè)渲染參數(shù)接收單元,該外部預(yù)設(shè)渲 染參數(shù)接收單元接收作為從外部輸入的渲染數(shù)據(jù)的外部預(yù)設(shè)渲染參數(shù);以及外部預(yù)設(shè)元數(shù) 據(jù)接收單元,該外部預(yù)設(shè)元數(shù)據(jù)接收單元接收指示外部預(yù)設(shè)渲染參數(shù)的屬性的外部預(yù)設(shè)元 數(shù)據(jù)。優(yōu)選地,該裝置進(jìn)一步包括顯示單元,該顯示單元顯示多個(gè)外部預(yù)設(shè)元數(shù)據(jù),以在 多個(gè)外部預(yù)設(shè)信息中選擇一個(gè)外部預(yù)設(shè)信息;以及預(yù)設(shè)信息輸入單元,該預(yù)設(shè)信息輸入單 元被輸入在多個(gè)外部預(yù)設(shè)元數(shù)據(jù)中選擇一個(gè)外部預(yù)設(shè)元數(shù)據(jù)的選擇信號(hào),其中,預(yù)設(shè)信息 選擇單元基于選擇信號(hào)來(lái)選擇一個(gè)外部預(yù)設(shè)信息。更優(yōu)選地,顯示單元進(jìn)一步顯示基于選擇信號(hào)進(jìn)行選擇的選擇的外部預(yù)設(shè)元數(shù) 據(jù)。更優(yōu)選地,顯示單元包括指示對(duì)象的電平或位置的一個(gè)或多個(gè)圖形元素。在該情況下,對(duì)圖形元素進(jìn)行修改以指示對(duì)象的電平或位置以及激活。更優(yōu)選地,當(dāng)顯示單元操作地耦合到外部預(yù)設(shè)信息選擇單元時(shí),顯示單元一次顯 示多個(gè)外部預(yù)設(shè)元數(shù)據(jù)。優(yōu)選地,該裝置進(jìn)一步包括輸出單元,該輸出單元輸出修改的對(duì)象;以及存儲(chǔ)單 元,該存儲(chǔ)單元存儲(chǔ)選擇的外部預(yù)設(shè)信息。為了進(jìn)一步實(shí)現(xiàn)這些和其他優(yōu)點(diǎn)并且根據(jù)本發(fā)明的目的,一種處理音頻信號(hào)的方 法包括接收包括至少一個(gè)對(duì)象的下混合信號(hào)、用于渲染包括了下混合信號(hào)的至少一個(gè)對(duì) 象的多個(gè)預(yù)設(shè)信息、從外部輸入的多個(gè)外部預(yù)設(shè)信息以及指示應(yīng)用了外部預(yù)設(shè)信息的對(duì)象 數(shù)目的應(yīng)用的對(duì)象數(shù)目信息;基于應(yīng)用的對(duì)象數(shù)目信息來(lái)確定是否將多個(gè)外部預(yù)設(shè)信息應(yīng) 用于下混合信號(hào);如果選擇了多個(gè)外部預(yù)設(shè)信息,則在多個(gè)外部預(yù)設(shè)信息中選擇一個(gè)外部預(yù)設(shè)信息;以及通過將外部預(yù)設(shè)信息應(yīng)用于所有數(shù)據(jù)區(qū)域來(lái)控制對(duì)象,其中,外部預(yù)設(shè)信息 包括用于渲染下混合信號(hào)的外部預(yù)設(shè)渲染參數(shù)和指示外部預(yù)設(shè)渲染參數(shù)的屬性的外部預(yù) 設(shè)元數(shù)據(jù)。優(yōu)選地,該確定進(jìn)一步使用指示是否將外部預(yù)設(shè)信息應(yīng)用于下混合信號(hào)的外部元 數(shù)據(jù)信息。優(yōu)選地,在渲染之后,該方法進(jìn)一步包括顯示對(duì)象的受控電平和選擇的外部預(yù)設(shè) 元數(shù)據(jù)。優(yōu)選地,在渲染之后,該方法進(jìn)一步包括存儲(chǔ)選擇的外部預(yù)設(shè)信息。應(yīng)當(dāng)理解,前面的一般描述和后面的詳細(xì)描述是示例性的和解釋性的,并且旨在 提供要求保護(hù)的本發(fā)明的進(jìn)一步的解釋。
具體實(shí)施例方式現(xiàn)將詳細(xì)參考本發(fā)明的優(yōu)選實(shí)施例,在附圖中圖示了本發(fā)明的示例。首先,本發(fā)明 中的術(shù)語(yǔ)可以被解釋為如下引用。而且,本說明書中沒有公開的術(shù)語(yǔ)可以被解釋為匹配本 發(fā)明的技術(shù)思想的如下意義和概念。因此,本公開的實(shí)施例和附圖中實(shí)現(xiàn)的配置僅是本發(fā) 明的一個(gè)最優(yōu)選的實(shí)施例,并且無(wú)法表示本發(fā)明的所有技術(shù)思想。因此,應(yīng)當(dāng)理解,在提交 本申請(qǐng)時(shí),可能存在替代它們的各種修改/變化和等同物。在本公開中,‘信息’是通常包括值、參數(shù)、系數(shù)、元素等的術(shù)語(yǔ),并且可以偶爾不同 地解釋其意義,本發(fā)明不限于此。圖IA和圖IB是根據(jù)本發(fā)明的一個(gè)實(shí)施例的通過根據(jù)預(yù)設(shè)屬性信息應(yīng)用預(yù)設(shè)信息 來(lái)調(diào)整包括在下混合信號(hào)中的對(duì)象的概念的示圖。本發(fā)明的音頻信號(hào)由編碼器編碼成下混 合信號(hào)和對(duì)象信息。下混合信號(hào)或?qū)ο笮畔⑼ㄟ^被承載在單個(gè)比特流或者獨(dú)立比特流上來(lái) 被傳輸?shù)浇獯a器。預(yù)設(shè)信息被包括在對(duì)象信息中,并且指示預(yù)先設(shè)定為調(diào)整包括在下混合 信號(hào)中的對(duì)象的電平、平移等的信息。預(yù)設(shè)信息可以包括各種模式,并且能夠包括用于實(shí)際 調(diào)整對(duì)象的渲染參數(shù)和指示相應(yīng)模式的特性的元數(shù)據(jù)。這將在稍后參考圖2和圖3來(lái)詳細(xì) 解釋。參考圖IA和圖1B,包括在比特流中的對(duì)象信息具體地包括配置信息區(qū)域和多個(gè) 數(shù)據(jù)區(qū)域(數(shù)據(jù)區(qū)域1、數(shù)據(jù)區(qū)域2、…數(shù)據(jù)區(qū)域η)。配置信息區(qū)域是位于對(duì)象信息的比特 流的前面部分的區(qū)域,并且包含共同應(yīng)用于對(duì)象信息的所有數(shù)據(jù)區(qū)域的信息。例如,配置區(qū) 域信息可以包含包括樹結(jié)構(gòu)等的配置信息、數(shù)據(jù)區(qū)域長(zhǎng)度信息、對(duì)象數(shù)目信息等。相反,數(shù)據(jù)區(qū)域是通過基于包含在配置信息區(qū)域中的數(shù)據(jù)區(qū)域長(zhǎng)度信息對(duì)整個(gè)音 頻信號(hào)的時(shí)域進(jìn)行劃分而生成的單位,并且能夠包括幀。對(duì)象信息的數(shù)據(jù)區(qū)域與下混合信 號(hào)的數(shù)據(jù)區(qū)域相對(duì)應(yīng),并且包含諸如基于相應(yīng)的數(shù)據(jù)區(qū)域的對(duì)象的屬性的對(duì)象電平信息、 對(duì)象增益信息等的對(duì)象數(shù)據(jù)信息。在根據(jù)本發(fā)明的一個(gè)實(shí)施例的音頻信號(hào)處理方法中,從比特流的對(duì)象信息中讀取 預(yù)設(shè)屬性信息(presetjttributejnformation)。預(yù)設(shè)屬性信息指示預(yù)設(shè)信息被包括在比 特流的哪個(gè)區(qū)域中。具體地,預(yù)設(shè)屬性信息指示預(yù)設(shè)信息被包括在對(duì)象信息的配置信息區(qū) 域還是對(duì)象信息的數(shù)據(jù)區(qū)域中,并且在表1中示出了其詳細(xì)意義。[表 1]
預(yù)設(shè)屬性信息 (preset—attribute—information )冠、^Cr0預(yù)設(shè)信息被包括在配置信息區(qū)域 中。1預(yù)設(shè)信息被包括在數(shù)據(jù)區(qū)域中。參考圖1A,如果預(yù)設(shè)屬性信息被設(shè)定為0以指示預(yù)設(shè)信息被包括在配置信息區(qū)域 中,則以如下方式執(zhí)行渲染從配置信息區(qū)域中提取的預(yù)設(shè)信息被等同地應(yīng)用于下混合信 號(hào)的所有數(shù)據(jù)區(qū)域。相反,參考圖1B,如果預(yù)設(shè)屬性信息被設(shè)定為1以指示預(yù)設(shè)信息被包括在數(shù)據(jù)區(qū) 域中,則以如下方式執(zhí)行渲染從數(shù)據(jù)區(qū)域中提取的預(yù)設(shè)信息被等同地應(yīng)用于下混合信號(hào) 的相應(yīng)的數(shù)據(jù)區(qū)域。例如,將從數(shù)據(jù)區(qū)域1中提取的預(yù)設(shè)信息應(yīng)用于數(shù)據(jù)區(qū)域1的下混合 信號(hào)。而且,從數(shù)據(jù)區(qū)域η中提取的預(yù)設(shè)信息被應(yīng)用于數(shù)據(jù)區(qū)域η的下混合信號(hào)。而且,預(yù)設(shè)屬性信息能夠指示預(yù)設(shè)信息是靜態(tài)的還是動(dòng)態(tài)的。當(dāng)預(yù)設(shè)屬性信息被 設(shè)定為0時(shí),如果預(yù)設(shè)信息被包括在配置信息區(qū)域中,則能夠稱為預(yù)設(shè)信息是靜態(tài)的。在該 情況下,預(yù)設(shè)信息被靜態(tài)地和等同地應(yīng)用于所有數(shù)據(jù)區(qū)域。相反,當(dāng)預(yù)設(shè)屬性信息被設(shè)定為1時(shí),如果預(yù)設(shè)信息被包括在數(shù)據(jù)區(qū)域中,則能夠 稱預(yù)設(shè)信息是動(dòng)態(tài)的。在該情況下,由于預(yù)設(shè)信息僅被應(yīng)用于相應(yīng)的數(shù)據(jù)區(qū)域以渲染該相 應(yīng)的數(shù)據(jù)區(qū)域的下混合信號(hào),因此預(yù)設(shè)信息對(duì)于每個(gè)數(shù)據(jù)區(qū)域是動(dòng)態(tài)應(yīng)用的。在該情況下, 如果預(yù)設(shè)信息是動(dòng)態(tài)的,則優(yōu)選的是,預(yù)設(shè)信息存在于數(shù)據(jù)區(qū)域的擴(kuò)展區(qū)域中。如果預(yù)設(shè)信 息是靜態(tài)的,則優(yōu)選的是,預(yù)設(shè)信息存在于配置信息區(qū)域的擴(kuò)展區(qū)域中。因此,根據(jù)本發(fā)明的一個(gè)實(shí)施例的音頻信號(hào)處理方法能夠以如下方式渲染下混合 信號(hào)通過預(yù)設(shè)屬性信息根據(jù)音頻源的特性來(lái)使用適用于每個(gè)數(shù)據(jù)區(qū)域的預(yù)設(shè)信息,或者 將同一預(yù)設(shè)信息應(yīng)用于所有數(shù)據(jù)區(qū)域。圖2是根據(jù)本發(fā)明的一個(gè)實(shí)施例的根據(jù)預(yù)設(shè)屬性信息使用外部預(yù)設(shè)信息來(lái)調(diào)整 包括在下混合信號(hào)中的對(duì)象的概念的示圖。首先,本發(fā)明的音頻信號(hào)被編碼為下混合信號(hào)和對(duì)象信息。如前面參考圖IA和圖 IB的描述中提到的,下混合信號(hào)和對(duì)象信息作為一個(gè)比特流或獨(dú)立比特流被傳輸?shù)浇獯a 器。在該情況下,傳輸比特流的對(duì)象信息可以進(jìn)一步包括指示包括在下混合信號(hào)中的對(duì)象 數(shù)目的對(duì)象數(shù)目信息以及預(yù)設(shè)屬性信息和預(yù)設(shè)信息。同時(shí),外部預(yù)設(shè)信息作為外部比特流(并非從編碼器)被外部地輸入到解碼器,并 且包括在從編碼器傳輸?shù)膶?duì)象信息中的預(yù)設(shè)信息也被輸入到解碼器,以渲染下混合信號(hào)。 作為預(yù)先設(shè)定為調(diào)整對(duì)象的信息集合,不是從編碼器而是從外部環(huán)境輸入的預(yù)設(shè)信息在本 公開中被稱為外部預(yù)設(shè)信息。包括在外部比特流中的外部預(yù)設(shè)信息可以包括用于調(diào)整對(duì)象 的增益和/或平移的外部預(yù)設(shè)渲染參數(shù)以及指示外部預(yù)設(shè)渲染參數(shù)的屬性的外部預(yù)設(shè)參 數(shù)。而且,外部比特流可以進(jìn)一步包括指示將對(duì)其應(yīng)用外部預(yù)設(shè)信息的包括在下混合信號(hào) 中的對(duì)象的數(shù)目的應(yīng)用的對(duì)象數(shù)目信息以及指示是否使用外部預(yù)設(shè)信息的外部元數(shù)據(jù)信 肩、ο
能夠使用對(duì)象數(shù)目信息和應(yīng)用的對(duì)象數(shù)目信息來(lái)確定將使用外部預(yù)設(shè)信息還是 預(yù)設(shè)信息。這將在后面參考圖4來(lái)詳細(xì)解釋。如果確定使用外部預(yù)設(shè)信息,則可以以如下 方式調(diào)整對(duì)象外部預(yù)設(shè)信息被等同地和靜態(tài)地應(yīng)用于下混合信號(hào)的所有數(shù)據(jù)區(qū)域。圖3是應(yīng)用于包括在下混合信號(hào)中的對(duì)象的外部預(yù)設(shè)信息的概念的示圖。首先,可以以各種模式來(lái)表示外部預(yù)設(shè)信息,可以根據(jù)音頻信號(hào)的特性或者收聽 環(huán)境來(lái)選擇的各種模式。而且,可能存在至少一個(gè)外部預(yù)設(shè)信息。而且,外部預(yù)設(shè)信息可以 包括適用于調(diào)整對(duì)象的外部預(yù)設(shè)渲染參數(shù)和用于表示外部預(yù)設(shè)渲染參數(shù)的屬性的外部預(yù) 設(shè)元數(shù)據(jù)等。能夠以文本形式表示外部預(yù)設(shè)元數(shù)據(jù)。外部預(yù)設(shè)元數(shù)據(jù)可以指示外部預(yù)設(shè)信 息的屬性以及外部預(yù)設(shè)渲染參數(shù)的屬性(例如,音樂廳模式、卡拉OK模式、新聞模式等)。外部預(yù)設(shè)元數(shù)據(jù)可以包括用于表示外部預(yù)設(shè)渲染參數(shù)的相關(guān)信息(諸如外部預(yù) 設(shè)渲染參數(shù)的作者、外部預(yù)設(shè)渲染參數(shù)的編寫日期、對(duì)其應(yīng)用外部預(yù)設(shè)渲染參數(shù)的對(duì)象的 名稱等)、指示預(yù)設(shè)信息的文件格式的文件擴(kuò)展信息等。同時(shí),外部預(yù)設(shè)渲染參數(shù)是基本上 適用于對(duì)象的數(shù)據(jù),并且可以以各種形式(例如,矩陣)來(lái)表示以與外部預(yù)設(shè)元數(shù)據(jù)相對(duì) 應(yīng)。參考圖3,外部預(yù)設(shè)信息1可以與用于提供聲音舞臺(tái)效果的音樂廳模式相對(duì)應(yīng),其 使得收聽者能夠收聽音樂信號(hào),如同收聽者位于音樂廳中。外部預(yù)設(shè)信息2可以是用于減 少音頻信號(hào)中的聲樂對(duì)象的電平的卡拉OK模式。而且,外部預(yù)設(shè)信息η可以是用于提高話 音對(duì)象的電平的新聞模式。而且,外部預(yù)設(shè)信息包括外部預(yù)設(shè)元數(shù)據(jù)和外部預(yù)設(shè)渲染參數(shù)。 如果用戶選擇外部預(yù)設(shè)信息2,則與外部預(yù)設(shè)元數(shù)據(jù)2相對(duì)應(yīng)的卡拉OK模式將被顯示在顯 示單元上。而且,能夠通過將與外部預(yù)設(shè)元數(shù)據(jù)2相關(guān)的外部預(yù)設(shè)信息2應(yīng)用于對(duì)象來(lái)調(diào) 整電平。在該情況下,外部預(yù)設(shè)渲染參數(shù)可以包括單聲道外部預(yù)設(shè)渲染參數(shù)、立體聲外部 預(yù)設(shè)渲染參數(shù)和多聲道外部預(yù)設(shè)渲染參數(shù)。外部預(yù)設(shè)渲染參數(shù)根據(jù)對(duì)象的最終輸出聲道 (或者,包括對(duì)象的下混合信號(hào)的最終輸出聲道)來(lái)確定。單聲道外部預(yù)設(shè)渲染參數(shù)是在對(duì) 象的輸出聲道是單聲道的情況下應(yīng)用的外部預(yù)設(shè)渲染參數(shù)。立體聲外部預(yù)設(shè)渲染參數(shù)是在 對(duì)象的輸出聲道是立體聲的情況下應(yīng)用的外部預(yù)設(shè)渲染參數(shù)。而且,多聲道外部預(yù)設(shè)渲染 參數(shù)是在對(duì)象的輸出聲道是多聲道的情況下應(yīng)用的外部預(yù)設(shè)渲染參數(shù)。一旦根據(jù)配置信息 確定了對(duì)象的輸出聲道,就使用確定的輸出聲道來(lái)確定外部預(yù)設(shè)渲染參數(shù)的類型。然后,能 夠通過將外部預(yù)設(shè)渲染參數(shù)應(yīng)用于所有數(shù)據(jù)區(qū)域來(lái)調(diào)整包括在下混合信號(hào)中的對(duì)象。圖4是根據(jù)本發(fā)明的一個(gè)實(shí)施例的音頻信號(hào)處理裝置400的框圖。參考圖4,音頻信號(hào)處理裝置400可以包括下混合單元410、預(yù)設(shè)信息生成單元 420、外部預(yù)設(shè)信息接收單元430、外部預(yù)設(shè)信息應(yīng)用確定單元440、靜態(tài)預(yù)設(shè)信息接收單元 450、動(dòng)態(tài)預(yù)設(shè)信息接收單元460和渲染單元470。下混合單元410接收至少一個(gè)或多個(gè)對(duì)象,對(duì)象1、對(duì)象2、對(duì)象3、…、對(duì)象η,并 且然后通過下混合接收到的至少一個(gè)或多個(gè)對(duì)象來(lái)生成下混合信號(hào)。在該情況下,對(duì)象指 源,并且可以包括聲樂、吉他、鋼琴等。下混合信號(hào)的聲道數(shù)目小于輸入信號(hào)的聲道數(shù)目。而 且,下混合信號(hào)可以包括所有對(duì)象。預(yù)設(shè)信息生成單元420生成用于在渲染情況下調(diào)整包括在音頻信號(hào)中的對(duì)象的 預(yù)設(shè)信息,并且能夠生成預(yù)設(shè)渲染參數(shù)、預(yù)設(shè)信息和指示預(yù)設(shè)信息的屬性的預(yù)設(shè)屬性信息。預(yù)設(shè)信息生成單元420可以包括預(yù)設(shè)屬性確定單元、預(yù)設(shè)渲染參數(shù)生成單元和預(yù)設(shè)元數(shù)據(jù) 生成單元。這將在后面參考圖13來(lái)解釋。根據(jù)本發(fā)明的一個(gè)實(shí)施例,外部預(yù)設(shè)信息接收單元430接收從音頻信號(hào)處理裝置 400的外部環(huán)境輸入的外部預(yù)設(shè)信息。外部預(yù)設(shè)信息包括多個(gè)外部預(yù)設(shè)渲染參數(shù)和與該外 部預(yù)設(shè)渲染參數(shù)相對(duì)應(yīng)的多個(gè)外部預(yù)設(shè)元數(shù)據(jù),并且還能夠包括指示對(duì)其應(yīng)用外部預(yù)設(shè)渲 染參數(shù)的對(duì)象的數(shù)目的應(yīng)用對(duì)象數(shù)目信息。根據(jù)本發(fā)明的一個(gè)實(shí)施例的外部預(yù)設(shè)信息的比 特流結(jié)構(gòu)將在后面參考圖9來(lái)解釋。外部預(yù)設(shè)信息應(yīng)用確定單元440接收從預(yù)設(shè)信息生成單元420輸入的預(yù)設(shè)信息 和從外部預(yù)設(shè)信息接收單元430輸入的外部預(yù)設(shè)信息,并且然后確定是否應(yīng)用外部預(yù)設(shè)信 息。首先,外部預(yù)設(shè)信息應(yīng)用確定單元440從包括在外部預(yù)設(shè)信息接收單元430中的應(yīng)用 對(duì)象數(shù)目信息接收單元431接收指示將對(duì)其應(yīng)用外部預(yù)設(shè)信息的對(duì)象的數(shù)目的應(yīng)用對(duì)象 數(shù)目信息。如果通過比較,應(yīng)用對(duì)象數(shù)目信息等同于包括在預(yù)設(shè)信息中的對(duì)象數(shù)目信息,則 能夠確定優(yōu)選地使用外部預(yù)設(shè)信息。如果應(yīng)用對(duì)象數(shù)目信息不同于對(duì)象數(shù)目信息,則通過提取指示從預(yù)設(shè)信息生成單 元420輸入的預(yù)設(shè)信息的屬性的預(yù)設(shè)屬性信息來(lái)確定預(yù)設(shè)信息被包括在比特流的配置信 息區(qū)域還是其數(shù)據(jù)區(qū)域中。優(yōu)選地,預(yù)設(shè)屬性信息用于確定預(yù)設(shè)信息被包括在比特流的配 置信息的擴(kuò)展區(qū)域中還是數(shù)據(jù)區(qū)域的擴(kuò)展區(qū)域[附圖中未示出]中。在該情況下,如果確 定了預(yù)設(shè)信息被包括在比特流的配置信息區(qū)域中,則激活靜態(tài)預(yù)設(shè)信息接收單元450。如果 確定預(yù)設(shè)信息被包括在比特流的數(shù)據(jù)區(qū)域中,則激活動(dòng)態(tài)預(yù)設(shè)信息接收單元460?;陬A(yù)設(shè)屬性信息,如果靜態(tài)預(yù)設(shè)信息接收單元450被激活(表1中的preSet_ attribute_information = 0的情況),則預(yù)設(shè)信息被輸入到激活的靜態(tài)預(yù)設(shè)信息接收單元 450以進(jìn)行操作。靜態(tài)預(yù)設(shè)信息接收單元450可以包括接收與所有數(shù)據(jù)區(qū)域相對(duì)應(yīng)的預(yù)設(shè) 元數(shù)據(jù)的靜態(tài)預(yù)設(shè)元數(shù)據(jù)接收單元以及接收預(yù)設(shè)信息的靜態(tài)預(yù)設(shè)信息接收單元。這將在后 面參考圖13詳細(xì)解釋。如果預(yù)設(shè)屬性信息指示預(yù)設(shè)信息被包括在數(shù)據(jù)區(qū)域中(表1中的preSet_ attribute_flag = 1的情況),則動(dòng)態(tài)預(yù)設(shè)信息接收單元460被激活。動(dòng)態(tài)預(yù)設(shè)信息接收 單元460能夠包括接收與相應(yīng)的數(shù)據(jù)區(qū)域相對(duì)應(yīng)的預(yù)設(shè)元數(shù)據(jù)的動(dòng)態(tài)預(yù)設(shè)元數(shù)據(jù)接收單 元以及接收每個(gè)數(shù)據(jù)區(qū)域的預(yù)設(shè)信息的動(dòng)態(tài)預(yù)設(shè)信息接收單元。動(dòng)態(tài)預(yù)設(shè)元數(shù)據(jù)接收單元 接收并且輸出選擇的預(yù)設(shè)元數(shù)據(jù),并且動(dòng)態(tài)預(yù)設(shè)信息接收單元接收預(yù)設(shè)信息。這將在后面 參考圖11來(lái)詳細(xì)解釋。渲染單元470接收從下混合包括多個(gè)對(duì)象的音頻信號(hào)而生成的下混合信號(hào)以及 從靜態(tài)預(yù)設(shè)信息接收單元450或動(dòng)態(tài)預(yù)設(shè)信息接收單元460輸出的預(yù)設(shè)渲染參數(shù)。同時(shí), 如果外部預(yù)設(shè)信息應(yīng)用確定單元440確定應(yīng)用外部預(yù)設(shè)信息,則渲染單元470從外部預(yù)設(shè) 渲染參數(shù)接收單元432接收外部預(yù)設(shè)渲染參數(shù)的輸入。預(yù)設(shè)信息或外部預(yù)設(shè)渲染參數(shù)適用 于包括在下混合信號(hào)中的對(duì)象,由此可以調(diào)整對(duì)象的電平或位置。如果音頻信號(hào)處理裝置400包括顯示單元[附圖中未示出],則從動(dòng)態(tài)預(yù)設(shè)元數(shù)據(jù) 接收單元輸出的選擇的預(yù)設(shè)元數(shù)據(jù)、從靜態(tài)預(yù)設(shè)元數(shù)據(jù)接收單元輸出的選擇的預(yù)設(shè)元數(shù)據(jù) 或者從外部預(yù)設(shè)元數(shù)據(jù)接收單元433輸出的選擇的外部預(yù)設(shè)元數(shù)據(jù)可以被顯示在顯示單 元的屏幕上。
圖5A和圖5B是根據(jù)本發(fā)明的實(shí)施例的將預(yù)設(shè)信息應(yīng)用于渲染單元的方法的框 圖。首先,圖5A示出了將從靜態(tài)預(yù)設(shè)信息接收單元450輸出的預(yù)設(shè)信息應(yīng)用于渲染單元 570的方法。在該情況下,靜態(tài)預(yù)設(shè)信息接收單元450與前面的圖4中示出的靜態(tài)預(yù)設(shè)信息 接收單元450相同,并且包括靜態(tài)預(yù)設(shè)元數(shù)據(jù)接收單元451和靜態(tài)預(yù)設(shè)渲染參數(shù)接收單元 452。靜態(tài)預(yù)設(shè)渲染參數(shù)接收單元452接收用于通過應(yīng)用于下混合信號(hào)的所有數(shù)據(jù)區(qū) 域來(lái)調(diào)整對(duì)象的預(yù)設(shè)渲染參數(shù)。在該情況下,預(yù)設(shè)渲染參數(shù)可以包括從多個(gè)預(yù)設(shè)信息中選 擇的一個(gè)預(yù)設(shè)信息中包括的渲染參數(shù)。相反,靜態(tài)預(yù)設(shè)元數(shù)據(jù)接收單元451接收通過與一 個(gè)預(yù)設(shè)渲染參數(shù)相對(duì)應(yīng)而指示預(yù)設(shè)渲染參數(shù)的屬性的預(yù)設(shè)元數(shù)據(jù)。靜態(tài)預(yù)設(shè)信息接收單元450接收并且輸出預(yù)設(shè)元數(shù)據(jù)和與所有數(shù)據(jù)區(qū)域相對(duì)應(yīng) 的預(yù)設(shè)渲染參數(shù)。而且,渲染單元570接收預(yù)設(shè)渲染參數(shù)。渲染單元570通過接收下混合信號(hào)以及預(yù)設(shè)渲染參數(shù)來(lái)執(zhí)行每個(gè)數(shù)據(jù)區(qū)域的渲 染。渲染單元570包括數(shù)據(jù)區(qū)域1渲染單元571、數(shù)據(jù)區(qū)域2渲染單元572、…和數(shù)據(jù)區(qū)域 η渲染單元57η。在該情況下,以渲染單元570的所有數(shù)據(jù)區(qū)域渲染單元54Χ將接收到的預(yù) 設(shè)渲染參數(shù)等同地應(yīng)用于下混合信號(hào)的方式來(lái)執(zhí)行渲染。例如,如果從靜態(tài)預(yù)設(shè)渲染參數(shù) 接收單元452輸出的預(yù)設(shè)渲染參數(shù)是指示卡拉OK模式的外部重置渲染參數(shù)2,則能夠?qū)⒖?拉OK模式應(yīng)用于范圍從第一數(shù)據(jù)區(qū)域到第η數(shù)據(jù)區(qū)域的所有數(shù)據(jù)區(qū)域。圖5Β示出了將從動(dòng)態(tài)預(yù)設(shè)信息接收單元460輸出的預(yù)設(shè)信息應(yīng)用于渲染單元570 的方法。動(dòng)態(tài)預(yù)設(shè)信息接收單元460與前面的圖4中示出的動(dòng)態(tài)預(yù)設(shè)信息接收單元460相 同,并且包括動(dòng)態(tài)預(yù)設(shè)元數(shù)據(jù)接收單元461和動(dòng)態(tài)預(yù)設(shè)渲染參數(shù)接收單元462。動(dòng)態(tài)預(yù)設(shè)信息接收單元460從每個(gè)數(shù)據(jù)區(qū)域的動(dòng)態(tài)預(yù)設(shè)渲染參數(shù)接收預(yù)設(shè)渲染 參數(shù)。動(dòng)態(tài)預(yù)設(shè)信息接收單元460接收并且輸出來(lái)自動(dòng)態(tài)預(yù)設(shè)元數(shù)據(jù)接收單元461的預(yù)設(shè) 元數(shù)據(jù)。然后,預(yù)設(shè)渲染參數(shù)被輸入到渲染單元570。渲染單元570通過接收下混合信號(hào)和預(yù)設(shè)渲染參數(shù)來(lái)執(zhí)行每個(gè)數(shù)據(jù)區(qū)域的渲染。 渲染單元570包括數(shù)據(jù)區(qū)域1渲染單元571、數(shù)據(jù)區(qū)域2渲染單元572、…和數(shù)據(jù)區(qū)域η渲 染單元57η。在該情況下,渲染單元570的每個(gè)數(shù)據(jù)區(qū)域渲染單元MX通過接收與每個(gè)數(shù)據(jù) 區(qū)域相對(duì)應(yīng)的預(yù)設(shè)渲染參數(shù)并且將其應(yīng)用到下混合信號(hào)來(lái)執(zhí)行渲染。例如,音樂廳模式的預(yù)設(shè)信息1被應(yīng)用于第一數(shù)據(jù)區(qū)域。經(jīng)典模式的預(yù)設(shè)信息3 適用于第二數(shù)據(jù)區(qū)域??ɡ璒K模式的預(yù)設(shè)信息2可以適用于第六數(shù)據(jù)區(qū)域。在該情況下, 預(yù)設(shè)信息η中的‘η’指示外部預(yù)設(shè)模式的索引。而且,應(yīng)當(dāng)理解,每個(gè)數(shù)據(jù)區(qū)域地輸出與每 個(gè)預(yù)設(shè)渲染參數(shù)相對(duì)應(yīng)的預(yù)設(shè)元數(shù)據(jù)。圖6是根據(jù)本發(fā)明的實(shí)施例的將外部預(yù)設(shè)信息應(yīng)用于渲染單元的方法的框圖。首 先,外部預(yù)設(shè)信息接收單元430與前面的圖3中的外部預(yù)設(shè)信息接收單元430相同,并且包 括外部預(yù)設(shè)元數(shù)據(jù)接收單元433和外部預(yù)設(shè)渲染參數(shù)接收單元432。外部預(yù)設(shè)渲染參數(shù)接收單元432接收用于通過應(yīng)用于下混合信號(hào)的所有數(shù)據(jù)區(qū) 域來(lái)調(diào)整對(duì)象的預(yù)設(shè)渲染參數(shù)。在該情況下,外部預(yù)設(shè)渲染參數(shù)可以包括從多個(gè)外部預(yù)設(shè) 信息中選擇的一個(gè)外部預(yù)設(shè)信息中包括的渲染參數(shù)。相反,外部預(yù)設(shè)元數(shù)據(jù)接收單元433 接收通過與一個(gè)外部預(yù)設(shè)渲染參數(shù)相對(duì)應(yīng)而指示外部預(yù)設(shè)渲染參數(shù)的屬性的外部預(yù)設(shè)元 數(shù)據(jù)。
外部預(yù)設(shè)信息接收單元430接收并且輸出外部預(yù)設(shè)元數(shù)據(jù)和與所有數(shù)據(jù)區(qū)域相 對(duì)應(yīng)的外部預(yù)設(shè)渲染參數(shù)。而且,渲染單元670接收外部預(yù)設(shè)渲染參數(shù)。渲染單元670通過接收下混合信號(hào)以及外部預(yù)設(shè)渲染參數(shù)來(lái)執(zhí)行每個(gè)數(shù)據(jù)區(qū)域 的渲染。渲染單元670包括數(shù)據(jù)區(qū)域1渲染單元671、數(shù)據(jù)區(qū)域2渲染單元672、…和數(shù)據(jù) 區(qū)域η渲染單元67η。在該情況下,以渲染單元670的所有數(shù)據(jù)區(qū)域渲染單元64Χ將接收到 的外部預(yù)設(shè)渲染參數(shù)等同地應(yīng)用于下混合信號(hào)的方式來(lái)執(zhí)行渲染。例如,如果從外部預(yù)設(shè) 渲染參數(shù)接收單元432輸出的外部預(yù)設(shè)渲染參數(shù)是指示經(jīng)典模式的外部重置渲染參數(shù)3, 則能夠?qū)⒖ɡ璒K模式應(yīng)用于范圍從第一數(shù)據(jù)區(qū)域到第η數(shù)據(jù)區(qū)域的所有數(shù)據(jù)區(qū)域。圖7是包括在音頻信號(hào)處理裝置400的靜態(tài)預(yù)設(shè)信息接收單元450中的靜態(tài)預(yù)設(shè) 渲染參數(shù)接收單元452、包括在動(dòng)態(tài)預(yù)設(shè)信息接收單元460中的動(dòng)態(tài)預(yù)設(shè)渲染參數(shù)接收單 元462、或者包括在外部預(yù)設(shè)信息接收單元430中的外部預(yù)設(shè)渲染參數(shù)接收單元432的示意 性配置的框圖。動(dòng)態(tài)/靜態(tài)/外部預(yù)設(shè)渲染參數(shù)接收單元452/462/432包括輸出聲道信息接收 單元45h/462a/43h和預(yù)設(shè)渲染參數(shù)確定單元452b/462b/432b。輸出聲道信息接收單元 45h/462a/43h接收并且輸出指示將從其輸出下混合信號(hào)中包括的對(duì)象的輸出聲道的數(shù) 目的輸出聲道數(shù)目信息。在該情況下,輸出聲道數(shù)目信息可以指示單聲道、立體聲聲道或者 多聲道(5.1聲道),本發(fā)明不限于此。預(yù)設(shè)渲染參數(shù)確定單元452b/462b/432b基于從輸出聲道信息接收單元 45h/462a/43h輸入的輸出聲道數(shù)目信息來(lái)接收并且輸出相應(yīng)的預(yù)設(shè)渲染參數(shù)或者相應(yīng) 的外部預(yù)設(shè)渲染參數(shù)。在該情況下,外部預(yù)設(shè)渲染參數(shù)可以包括單聲道外部預(yù)設(shè)渲染參數(shù)、 立體聲外部預(yù)設(shè)渲染參數(shù)和多聲道外部預(yù)設(shè)渲染參數(shù)中的一個(gè)。而且,預(yù)設(shè)渲染參數(shù)可以 包括單聲道預(yù)設(shè)渲染參數(shù)、立體聲預(yù)設(shè)渲染參數(shù)和多聲道預(yù)設(shè)渲染參數(shù)中的一個(gè)。在預(yù)設(shè) 渲染參數(shù)或者外部預(yù)設(shè)渲染參數(shù)是矩陣類型的情況下,其尺寸可以基于對(duì)象的數(shù)目和輸出 聲道的數(shù)目來(lái)確定。而且,預(yù)設(shè)矩陣或者外部預(yù)設(shè)矩陣可以具有(對(duì)象的數(shù)目)X (輸出聲 道的數(shù)目)的形式。例如,當(dāng)下混合信號(hào)中包括η個(gè)對(duì)象時(shí),如果來(lái)自輸出聲道信息接收單 元45^/4623/43 的輸出聲道與5. 1聲道(即,6個(gè)聲道)相對(duì)應(yīng),則預(yù)設(shè)渲染參數(shù)確定單 元452b/462b/432b可以輸出以nX6的形式實(shí)現(xiàn)的多聲道預(yù)設(shè)渲染參數(shù)或者多聲道外部預(yù) 設(shè)渲染參數(shù)。在該情況下,矩陣的元素是指示包括在第i個(gè)聲道中的第a個(gè)對(duì)象的程度的 增益值。圖8是根據(jù)本發(fā)明的另一實(shí)施例的音頻信號(hào)處理裝置800的框圖。參考圖8,音 頻信號(hào)處理裝置800主要包括下混合單元810,對(duì)象信息生成單元820、預(yù)設(shè)信息生成單元 830、下混合信號(hào)處理單元840、信息處理單元850和多聲道解碼單元860。將多個(gè)對(duì)象(對(duì)象1、對(duì)象2、…對(duì)象η)輸入到下混合單元810以生成單聲道或 立體聲下混合信號(hào)。而且,多個(gè)對(duì)象被輸入到對(duì)象信息生成單元820以生成包括在下混合 信號(hào)中的指示對(duì)象電平的對(duì)象電平信息和對(duì)象的增益值。在立體聲下混合信號(hào)的情況下, 對(duì)象信息生成單元820生成指示包括在下混合聲道中的對(duì)象的程度的對(duì)象增益信息、指示 是否存在對(duì)象之間的相關(guān)的對(duì)象相關(guān)信息等。隨后,下混合信號(hào)和對(duì)象信息被輸入到預(yù)設(shè) 信息生成單元830。然后,預(yù)設(shè)信息生成單元830生成指示預(yù)設(shè)信息被包括在比特流的數(shù)據(jù) 區(qū)域還是比特流的配置信息區(qū)域中的預(yù)設(shè)屬性信息以及包括預(yù)先設(shè)定為執(zhí)行渲染以調(diào)整對(duì)象的電平或位置的預(yù)設(shè)渲染參數(shù)和用于表示預(yù)設(shè)渲染參數(shù)的預(yù)設(shè)元數(shù)據(jù)的預(yù)設(shè)信息。如 前面圖1至4中示出的音頻信號(hào)處理裝置和方法的描述中提到的,用于生成預(yù)設(shè)屬性信息、 預(yù)設(shè)渲染參數(shù)和預(yù)設(shè)元數(shù)據(jù)的過程遵循其相同的描述。而且,預(yù)設(shè)信息生成單元830能夠進(jìn)一步生成指示比特流中是否存在預(yù)設(shè)信息的 預(yù)設(shè)存在信息、指示預(yù)設(shè)信息的數(shù)目的預(yù)設(shè)數(shù)目信息和指示預(yù)設(shè)元數(shù)據(jù)的長(zhǎng)度的預(yù)設(shè)元數(shù) 據(jù)長(zhǎng)度信息。對(duì)象信息生成單元820生成的對(duì)象信息和預(yù)設(shè)信息生成單元830生成的預(yù)設(shè) 屬性信息、預(yù)設(shè)信息、預(yù)設(shè)元數(shù)據(jù)、預(yù)設(shè)存在信息、預(yù)設(shè)數(shù)目信息和預(yù)設(shè)元數(shù)據(jù)長(zhǎng)度信息可 以通過被包括在SAOC比特流中來(lái)被傳輸,或者可以以其中還包括下混合信號(hào)的一個(gè)比特 流的形式來(lái)被傳輸。在該情況下,包括下混合信號(hào)和預(yù)設(shè)相關(guān)信息的比特流可以被輸入到 解碼裝置的信號(hào)接收單元(圖中未示出)。信息處理單元850包括對(duì)象信息處理單元851、外部預(yù)設(shè)信息接收單元852、外部 預(yù)設(shè)信息應(yīng)用確定單元853、靜態(tài)預(yù)設(shè)信息接收單元852和動(dòng)態(tài)預(yù)設(shè)信息接收單元853,并 且接收SAOC比特流。如前面參考圖1至圖7的描述中提到的,基于包括在SAOC比特流中 的預(yù)設(shè)屬性信息來(lái)確定激活靜態(tài)預(yù)設(shè)信息接收單元852還是動(dòng)態(tài)預(yù)設(shè)信息接收單元853。根據(jù)本發(fā)明的一個(gè)實(shí)施例,外部預(yù)設(shè)信息接收單元852接收從音頻信號(hào)處理裝置 800的外部環(huán)境輸入的外部預(yù)設(shè)信息。將接收到的外部預(yù)設(shè)信息輸入到外部預(yù)設(shè)信息應(yīng)用 確定單元853,以確定外部預(yù)設(shè)信息是否將用于調(diào)整對(duì)象。在使用外部預(yù)設(shè)信息的情況下,外部預(yù)設(shè)信息接收單元852接收到的外部預(yù)設(shè)信 息被直接輸入到對(duì)象信息處理單元851。相反,在使用包括在SAOC比特流中的預(yù)設(shè)信息的 情況下,基于包括在SAOC比特流中的預(yù)設(shè)屬性信息,將預(yù)設(shè)信息輸入到靜態(tài)預(yù)設(shè)信息接收 單元邪4或者動(dòng)態(tài)預(yù)設(shè)信息接收單元855。靜態(tài)預(yù)設(shè)信息接收單元邪4或者動(dòng)態(tài)預(yù)設(shè)信息接收單元855經(jīng)由SAOC比特流接 收上述預(yù)設(shè)屬性信息。而且,外部預(yù)設(shè)信息接收單元852接收外部預(yù)設(shè)存在信息、外部預(yù)設(shè) 數(shù)目信息、外部預(yù)設(shè)元數(shù)據(jù)、輸出聲道信息和外部預(yù)設(shè)渲染參數(shù)(例如,外部預(yù)設(shè)矩陣)。而 且,使用根據(jù)圖1至圖7中示出的音頻信號(hào)處理方法和裝置中描述的各種實(shí)施例的方法。靜態(tài)預(yù)設(shè)信息接收單元854、動(dòng)態(tài)預(yù)設(shè)信息接收單元855或者外部預(yù)設(shè)信息接收 單元852輸出經(jīng)由SAOC比特流接收到的預(yù)設(shè)元數(shù)據(jù)和預(yù)設(shè)渲染數(shù)據(jù),或者經(jīng)由外部比特流 接收到的外部預(yù)設(shè)元數(shù)據(jù)和外部預(yù)設(shè)信息。然后,對(duì)象信息處理單元851接收輸出的數(shù)據(jù) 和信息,以生成用于預(yù)處理下混合信號(hào)的下混合處理信息和用于使用下混合處理單元上混 合經(jīng)預(yù)處理的下混合信號(hào)的多聲道信息(以連同包括在SAOC比特流中的對(duì)象信息一起使 用輸出的數(shù)據(jù)和信息的方式)。通過這樣操作,從靜態(tài)預(yù)設(shè)信息接收單元邪4輸出的預(yù)設(shè)渲染數(shù)據(jù)和預(yù)設(shè)元數(shù)據(jù) 以及從外部預(yù)設(shè)信息接收單元852輸出的外部預(yù)設(shè)渲染數(shù)據(jù)和外部預(yù)設(shè)元數(shù)據(jù)與所有數(shù) 據(jù)區(qū)域相對(duì)應(yīng)。而且,從動(dòng)態(tài)預(yù)設(shè)信息接收單元855輸出的預(yù)設(shè)信息和預(yù)設(shè)元數(shù)據(jù)與數(shù)據(jù) 區(qū)域中的一個(gè)相對(duì)應(yīng)。隨后,下混合處理信息被輸入到下混合信號(hào)處理單元840以變化其中包括下混合 信號(hào)中包含的對(duì)象的聲道。因此,能夠執(zhí)行平移。因此,預(yù)處理的下混合信號(hào)與從信息處理 單元850輸出的多聲道信息一起被輸入到多聲道解碼單元860。然后,能夠通過一起上混合 輸入的預(yù)處理的下混合信號(hào)和多聲道信息來(lái)生成多聲道音頻信號(hào)。
在使用多聲道信息將包括多個(gè)對(duì)象的下混合信號(hào)解碼為多聲道信號(hào)時(shí),根據(jù)本發(fā) 明的另一實(shí)施例的音頻信號(hào)處理裝置便于使用從外部環(huán)境作為比特流獨(dú)立輸入的外部預(yù) 設(shè)渲染參數(shù)和外部預(yù)設(shè)元數(shù)據(jù)來(lái)調(diào)整對(duì)象的電平。圖9是根據(jù)本發(fā)明的一個(gè)實(shí)施例的外部預(yù)設(shè)信息的比特流結(jié)構(gòu)的示圖。參考圖9,為了與SAOC比特流兼容,外部預(yù)設(shè)信息包括文件ID910、外部預(yù)設(shè)渲染 參數(shù)920和外部預(yù)設(shè)元數(shù)據(jù)930。為了確定外部預(yù)設(shè)信息是否可以被應(yīng)用于下混合信號(hào),S卩,與SAOC比特流的同步 是否可能,文件ID 910可以包括指示對(duì)其應(yīng)用外部預(yù)設(shè)信息的對(duì)象的數(shù)目的對(duì)象數(shù)目信 息。而且,文件ID 910可以包括針對(duì)同步單獨(dú)定義的同步字,可以進(jìn)一步包括指示外部預(yù) 設(shè)信息的數(shù)目的外部預(yù)設(shè)數(shù)目信息,并且可以包括被設(shè)定為使外部預(yù)設(shè)信息能夠優(yōu)選地與 應(yīng)用的對(duì)象數(shù)目無(wú)關(guān)地使用的標(biāo)識(shí)符。外部預(yù)設(shè)渲染參數(shù)920可以包含諸如包括在SAOC比特流中的預(yù)設(shè)渲染參數(shù)的內(nèi) 容,并且能夠包括參考圖3描述的各種外部預(yù)設(shè)渲染參數(shù)。外部預(yù)設(shè)渲染參數(shù)920可以包 括用戶設(shè)定類型的渲染數(shù)據(jù)以及矩陣類型渲染參數(shù)。而且,外部預(yù)設(shè)渲染參數(shù)920可以進(jìn) 一步包括指示外部預(yù)設(shè)信息的數(shù)目和輸出聲道的數(shù)目的輸出聲道信息。同時(shí),外部預(yù)設(shè)元數(shù)據(jù)930包括與外部預(yù)設(shè)渲染參數(shù)920相對(duì)應(yīng)的元數(shù)據(jù)。圖10至圖12是根據(jù)本發(fā)明的另一實(shí)施例的與本發(fā)明相關(guān)的語(yǔ)法的各種示圖。參考圖10,能夠配置要包括在配置信息的擴(kuò)展區(qū)域中的預(yù)設(shè)信息。比特流的配置信息區(qū)域SAOCSpecificConfigO具有擴(kuò)展區(qū)域 SAOCExtensionConfigO。如果接收到預(yù)設(shè)信息,則它可以由SAOCExtensionConfig (9)的 容器類型來(lái)指示,并且其意義在表2中公開。在圖10中,SAOCExtensionConfigO)的擴(kuò)展 區(qū)域包括預(yù)設(shè)信息I^resetConfigO。[表2]
權(quán)利要求
1.一種處理音頻信號(hào)的方法,包括接收包括至少一個(gè)對(duì)象的下混合信號(hào)、指示所述對(duì)象的屬性并且包括對(duì)象數(shù)目信息的 對(duì)象信息、用于渲染所述下混合信號(hào)的預(yù)設(shè)信息、從外部輸入的并且包括外部預(yù)設(shè)渲染參 數(shù)和外部預(yù)設(shè)元數(shù)據(jù)的外部預(yù)設(shè)信息、以及指示應(yīng)用了所述外部預(yù)設(shè)信息的對(duì)象的數(shù)目的 應(yīng)用的對(duì)象數(shù)目信息;確定所述應(yīng)用的對(duì)象數(shù)目信息是否與所述對(duì)象數(shù)目信息相同;以及 如果所述應(yīng)用的對(duì)象數(shù)目信息與所述對(duì)象數(shù)目信息相同,則通過使用所述外部預(yù)設(shè)信 息來(lái)渲染所述下混合信號(hào),其中,所述外部預(yù)設(shè)渲染參數(shù)渲染包括在所述下混合信號(hào)中的所述對(duì)象,并且所述外 部預(yù)設(shè)元數(shù)據(jù)指示所述外部預(yù)設(shè)渲染參數(shù)的屬性。
2.根據(jù)權(quán)利要求1所述的方法,其中,所述確定進(jìn)一步使用指示所述外部預(yù)設(shè)信息是 否應(yīng)用于所述下混合信號(hào)的外部元數(shù)據(jù)信息。
3.根據(jù)權(quán)利要求1所述的方法,其中,所述外部預(yù)設(shè)渲染參數(shù)包括外部預(yù)設(shè)矩陣,所述 外部預(yù)設(shè)矩陣基于指示所述下混合信號(hào)的輸出聲道的數(shù)目的輸出聲道信息和所述應(yīng)用的 對(duì)象數(shù)目信息。
4.根據(jù)權(quán)利要求3所述的方法,其中,所述渲染進(jìn)一步包括通過使用所述外部預(yù)設(shè)矩 陣來(lái)修改所述對(duì)象的輸出電平。
5.根據(jù)權(quán)利要求1所述的方法,其中,根據(jù)所述下混合信號(hào)的所述輸出聲道的數(shù)目,所 述外部預(yù)設(shè)渲染參數(shù)包括外部單聲道預(yù)設(shè)渲染參數(shù)、外部立體聲預(yù)設(shè)渲染參數(shù)和外部多聲 道預(yù)設(shè)渲染參數(shù)。
6.根據(jù)權(quán)利要求1所述的方法,進(jìn)一步包括通過使用所述對(duì)象信息和所述外部預(yù)設(shè)信息來(lái)生成控制所述下混合信號(hào)的平移或增 益的下混合處理信息以及用于上混合所述下混合信號(hào)的多聲道信息;以及 通過使用所述下混合處理信息來(lái)修改所述下混合信號(hào)。
7.一種用于處理音頻信號(hào)的裝置。包括信號(hào)接收單元,所述信號(hào)接收單元接收包括至少一個(gè)對(duì)象的下混合信號(hào)、指示所述對(duì) 象的屬性并且包括對(duì)象數(shù)目信息的對(duì)象信息以及渲染所述下混合信號(hào)的預(yù)設(shè)信息;外部預(yù)設(shè)信息接收單元,所述外部預(yù)設(shè)信息接收單元接收從外部輸入的外部預(yù)設(shè)信息 以及指示應(yīng)用了所述外部預(yù)設(shè)信息的對(duì)象的數(shù)目的應(yīng)用的對(duì)象數(shù)目信息;外部預(yù)設(shè)應(yīng)用確定單元,所述外部預(yù)設(shè)應(yīng)用確定單元確定所述應(yīng)用的對(duì)象數(shù)目信息是 否與所述對(duì)象數(shù)目信息相同;以及渲染單元,如果所述應(yīng)用的對(duì)象數(shù)目信息與所述對(duì)象數(shù)目信息相同,則所述渲染單元 通過使用所述外部預(yù)設(shè)信息來(lái)渲染所述下混合信號(hào),其中,所述外部預(yù)設(shè)信息包括渲染包括在所述下混合信號(hào)中的所述對(duì)象的外部預(yù)設(shè)渲 染參數(shù)以及指示所述外部預(yù)設(shè)渲染參數(shù)的屬性的外部預(yù)設(shè)元數(shù)據(jù)。
8.根據(jù)權(quán)利要求7所述的裝置,其中,所述外部預(yù)設(shè)應(yīng)用確定單元進(jìn)一步使用指示所 述外部預(yù)設(shè)信息是否應(yīng)用于所述下混合信號(hào)的外部元數(shù)據(jù)信息。
9.根據(jù)權(quán)利要求7所述的裝置,其中,所述外部預(yù)設(shè)渲染參數(shù)包括基于輸出聲道信息 和所述應(yīng)用的對(duì)象數(shù)目信息的外部預(yù)設(shè)矩陣,所述輸出聲道信息指示所述下混合信號(hào)的輸出聲道的數(shù)目。
10.根據(jù)權(quán)利要求7所述的裝置,其中,所述外部預(yù)設(shè)信息接收單元包括接收外部預(yù)設(shè) 渲染參數(shù)的外部預(yù)設(shè)渲染參數(shù)接收單元,以及接收外部預(yù)設(shè)元數(shù)據(jù)的外部預(yù)設(shè)元數(shù)據(jù)接收 單元。
11.根據(jù)權(quán)利要求7所述的裝置,其中,所述渲染單元包括渲染所述下混合信號(hào)的數(shù)據(jù) 區(qū)域的數(shù)據(jù)區(qū)域的多個(gè)渲染單元。
12.根據(jù)權(quán)利要求11所述的裝置,如果從所述外部預(yù)設(shè)信息接收單元接收所述外部預(yù) 設(shè)渲染參數(shù),其中,所述外部預(yù)設(shè)渲染參數(shù)應(yīng)用于所述數(shù)據(jù)區(qū)域的多個(gè)渲染單元。
13.—種處理音頻信號(hào)的方法,包括 生成下混合至少一個(gè)對(duì)象的下混合信號(hào);生成應(yīng)用于所述下混合信號(hào)以控制所述對(duì)象的預(yù)設(shè)信息,所述預(yù)設(shè)信息包括渲染所述 對(duì)象的預(yù)設(shè)渲染參數(shù);生成與所述預(yù)設(shè)渲染參數(shù)相對(duì)應(yīng)的預(yù)設(shè)元數(shù)據(jù);以及 確定指示所述預(yù)設(shè)信息的屬性的預(yù)設(shè)屬性信息。
14.一種處理音頻信號(hào)的裝置,包括下混合信號(hào)生成單元,所述下混合信號(hào)生成單元生成下混合至少一個(gè)對(duì)象的下混合信號(hào);對(duì)象信息生成單元,所述對(duì)象信息生成單元生成指示所述對(duì)象的屬性的對(duì)象信息; 預(yù)設(shè)信息生成單元,所述預(yù)設(shè)信息生成單元生成應(yīng)用于所述下混合信號(hào)以控制所述對(duì) 象的預(yù)設(shè)信息,所述預(yù)設(shè)信息包括渲染所述對(duì)象的預(yù)設(shè)渲染參數(shù);預(yù)設(shè)元數(shù)據(jù)生成單元,所述預(yù)設(shè)元數(shù)據(jù)生成單元生成與所述預(yù)設(shè)渲染參數(shù)相對(duì)應(yīng)的預(yù) 設(shè)元數(shù)據(jù);以及預(yù)設(shè)屬性確定單元,所述預(yù)設(shè)屬性確定單元確定指示所述預(yù)設(shè)信息的屬性的預(yù)設(shè)屬性 fn息ο
全文摘要
公開了一種用于處理音頻信號(hào)的裝置及其方法。該方法包括接收下混合信號(hào)、指示對(duì)象的屬性并且包括對(duì)象數(shù)目信息的對(duì)象信息、用于渲染下混合信號(hào)的預(yù)設(shè)信息、從外部輸入的外部預(yù)設(shè)信息、以及指示應(yīng)用了外部預(yù)設(shè)信息的對(duì)象的數(shù)目的應(yīng)用的對(duì)象數(shù)目信息;確定應(yīng)用的對(duì)象數(shù)目信息是否與對(duì)象數(shù)目信息相同;以及如果應(yīng)用的對(duì)象數(shù)目信息與對(duì)象數(shù)目信息相同,則通過使用外部預(yù)設(shè)信息來(lái)渲染下混合信號(hào),其中,外部預(yù)設(shè)渲染參數(shù)渲染包括在下混合信號(hào)中的對(duì)象,并且外部預(yù)設(shè)元數(shù)據(jù)指示外部預(yù)設(shè)渲染參數(shù)的屬性。因此,音頻信號(hào)可以通過以數(shù)據(jù)區(qū)域?yàn)閱挝华?dú)立地選擇和應(yīng)用外部預(yù)設(shè)信息,或者通過選擇相同的外部預(yù)設(shè)信息并且將相同的外部預(yù)設(shè)信息應(yīng)用于整個(gè)下混合信號(hào),來(lái)高效地重建音頻信號(hào)。
文檔編號(hào)G10L19/00GK102099854SQ200980127922
公開日2011年6月15日 申請(qǐng)日期2009年7月15日 優(yōu)先權(quán)日2008年7月15日
發(fā)明者吳賢午, 鄭亮源 申請(qǐng)人:Lg電子株式會(huì)社