專利名稱:用于控制音頻信號的渲染的方法
技術(shù)領(lǐng)域:
本發(fā)明涉及控制多目標(biāo)或多聲道音頻信號的渲染(rendering);并更具體地涉及ー種當(dāng)解碼多目標(biāo)或多聲道音頻信號時基于空間線索(spatial cue)控制多目標(biāo)或多聲道音頻信號的渲染的方法和裝置。
背景技術(shù):
圖I圖解說明了用于編碼多目標(biāo)或多聲道音頻信號的傳統(tǒng)編碼器的示例。參考該附圖,空間音頻編碼(Spatial Audio Coding, SAC)編碼器101被展示為傳統(tǒng)的多目標(biāo)或多聲道音頻信號編碼器的示例,并且它從輸入信號(即多目標(biāo)或多聲道音頻信號)中提取空間線索(將在后面描述),并且傳送該空間線索,同時對該音頻信號進(jìn)行縮混(down-mixing),并且以單聲道(mono)信號或者立體聲(stereo)信號的形式來傳送該音頻信號。SAC技術(shù)涉及一種將多目標(biāo)或多聲道音頻信號表不為縮混的單聲道或立體聲信號和空間線索信息、并且傳送和恢復(fù)它們的方法。SAC技術(shù)甚至能夠以低位速率傳送高質(zhì)量多聲道信號。SAC技術(shù)集中于根據(jù)每個子帶分析多目標(biāo)或多聲道音頻信號,并且根據(jù)每個子帶的空間線索信息從縮混的信號中恢復(fù)原始信號。因此,空間線索信息包括用于在解碼處理中恢復(fù)原始信號所需的重要信息,并且該信息變成確定在SAC解碼設(shè)備中恢復(fù)的音頻信號的聲音質(zhì)量的主要因素?;赟AC技術(shù)的運動圖像專家組(MPEG)正在經(jīng)受MPEG環(huán)繞名義的標(biāo)準(zhǔn)化,并且聲道電平差(Channel Level Difference, CLD)被用作空間線索。本發(fā)明致力于ー種用于在多目標(biāo)或多聲道音頻信號被縮混并且從編碼器傳送并被解碼的同時、基于從編碼器傳送的空間線索來控制多目標(biāo)或多聲道音頻信號的渲染的裝置和方法。按照慣例,配備有頻率分析器的圖形均衡器通常被用來恢復(fù)單聲道或立體聲音頻信號。多目標(biāo)或多聲道音頻信號可以在空間內(nèi)不同地定位。然而,從多目標(biāo)或多聲道音頻信號生成的音頻信號的位置對當(dāng)前技術(shù)中的解碼設(shè)備來說被唯一地識別和恢復(fù)。
發(fā)明內(nèi)容
技術(shù)問題本發(fā)明的一個實施例致カ于提供一種當(dāng)解碼多目標(biāo)或多聲道音頻信號時基于空間線索控制多目標(biāo)或多聲道音頻信號的渲染的裝置和方法。
本發(fā)明的其他方面和優(yōu)點可以通過下列描述來理解,并且參考本發(fā)明的實施例而變得明顯。而且,對于本發(fā)明領(lǐng)域的相關(guān)技術(shù)人員來說明顯的是,本發(fā)明的方面和優(yōu)點可以通過要求保護(hù)的部件及其組合來實現(xiàn)。技術(shù)方案根據(jù)本發(fā)明的一方面,提供了ー種用于控制音頻信號的渲染的裝置,包括解碼器,用于使用空間音頻編碼(SAC)解碼方法來解碼輸入音頻信號,所述輸入音頻信號是按照SAC方法編碼的縮混信號;和空間線索渲染器,用于接收空間線索信息和有關(guān)該輸入音頻信號的渲染的控制信息,并且基于該控制信息來控制空間線索域中的空間線索信息。這里,該解碼器基于由空間線索渲染器控制的受控空間線索信息對輸入音頻信號進(jìn)行渲染。根據(jù)本發(fā)明的另一方面,提供了ー 種用于控制音頻信號的渲染的裝置,包括解碼器,用于使用SAC方法來解碼輸入音頻信號,所述輸入音頻信號是按照SAC方法編碼的縮混信號;和空間線索渲染器,用于接收空間線索信息和有關(guān)該輸入音頻信號的渲染的控制信息,并且基于該控制信息來控制空間線索域中的空間線索信息。這里,該解碼器基于由空間線索渲染器控制的空間線索信息進(jìn)行輸入音頻信號的渲染,和所述空間線索信息是表示輸
入音頻信號之間的電平差并表達(dá)為仏/,m)的聲道電平差(CLD)值。該空間線索渲染
器包括CLD分析単元,用于從編碼部件傳送的CLD中提取CLD參數(shù);增益因子轉(zhuǎn)換單元,用于從自CLD分析単元中提取的CLD參數(shù)中提取每個音頻信號的功率増益;和増益因子控制単元,用于通過基于有關(guān)輸入音頻信號的渲染的控制信息控制在増益因子轉(zhuǎn)換單元中提取
的每個音頻信號的功率増益,來計算受控功率増益,m表示子帶的索引,I表示
中的參數(shù)組的索引。根據(jù)本發(fā)明的另一方面,提供了ー種用于控制音頻信號的渲染的裝置,包括解碼器,用于使用空間音頻編碼(SAC)方法來解碼輸入音頻信號,所述輸入音頻信號是按照SAC方法編碼的縮混信號;和空間線索渲染器,用于接收空間線索信息和有關(guān)該輸入音頻信號的渲染的控制信息,并且基于該控制信息來控制空間線索域中的空間線索信息。這里,該解碼器基于由空間線索渲染器控制的空間線索信息來進(jìn)行輸入音頻信號的渲染,和從縮混的信號LO和RO中提取中央信號(C)、左半平面信號(Lf+Ls)和右半平面信號(Rf+Rs),和所述空間線索信息是表示輸入音頻信號之間的電平差并表達(dá)為CU\K/afe,CLDl/e, CLDc/lfe, CLDLf/Ls和CLDKf/Ks的CLD值。該空間線索渲染器包括CLD分析単元,用于從編碼器傳送的CLD中提取CLD參數(shù);增益因子轉(zhuǎn)換單元,用于從自CLD分析単元中提取的CLD參數(shù)中提取每個音頻信號的功率増益;和増益因子控制單元,用于通過基于有關(guān)輸入音頻信號的渲染的控制信息控制在増益因子轉(zhuǎn)換單元中提取的每個音頻信號的功率増益,來計算受控功率増益。根據(jù)本發(fā)明的另一方面,提供了ー種用于控制音頻信號的渲染的裝置,包括解碼器,用于使用SAC方法來解碼輸入音頻信號,所述輸入音頻信號是按照SAC方法編碼的縮混信號;和空間線索渲染器,用于接收空間線索信息和有關(guān)該輸入音頻信號的渲染的控制信息,并且基于該控制信息來控制空間線索域中的空間線索信息。這里,該解碼器基于由空間線索渲染器控制的空間線索信息進(jìn)行輸入音頻信號的渲染,和所述空間線索信息是表示輸入音頻信號的縮混率的聲道預(yù)測系數(shù)(CPC)和表示輸入音頻信號之間的電平差的聲道電平差(CLD)值。該空間線索渲染器包括CPC/CLD分析単元,用于從編碼器傳送的CPC和CLD中提取CPC參數(shù)和CLD參數(shù);增益因子轉(zhuǎn)換單元,用于通過從在CPC/CLD分析單元中提取的CPC參數(shù)中提取中央信號、左半平面信號和右半平面信號并且從CLD參數(shù)中提取左信號分量和右信號分量的功率増益,而提取每個信號的功率増益;和増益因子控制單元,用于通過基于有關(guān)輸入音頻信號的渲染的控制信息控制在増益因子轉(zhuǎn)換單元中提取的每個音頻信號的功率増益,而計算受控功率増益。根據(jù)本發(fā)明的另一方面,提供了ー種用于控制音頻信號的渲染的裝置,包括解碼器,用于使用SAC方法來解碼輸入音頻信號,所述輸入音頻信號是按照SAC方法編碼的縮混信號;和空間線索渲染器,用于接收空間線索信息和有關(guān)該輸入音頻信號的渲染的控制信息,并且基于該控制信息來控制空間線索域中的空間線索信息。這里,該解碼器基于由空間線索渲染器控制的空間線索信息進(jìn)行輸入音頻信號的渲染,和該空間線索信息是表示輸入音頻信號之間的相關(guān)性的聲道間相關(guān)性(ICC)值,和該空間線索渲染器通過線性內(nèi)插處理來控制ICC參數(shù)。根據(jù)本發(fā)明的另一方面,提供了ー種用于控制音頻信號的渲染的方法,包括步驟a)使用SAC解碼方法來解碼輸入音頻信號,所述輸入音頻信號是按照SAC方法編碼的縮混信號;和b)接收空間線索信息和有關(guān)該輸入音頻信號的渲染的控制信息,并且基于該控制 信息來控制空間線索域中的空間線索信息。這里,基于在空間線索渲染步驟b)中控制的受控空間線索信息,在解碼步驟a)中對輸入音頻信號進(jìn)行渲染。根據(jù)本發(fā)明的另一方面,提供了ー種用于控制音頻信號的渲染的方法,包括步驟
a)使用SAC方法來解碼輸入音頻信號,所述輸入音頻信號是按照SAC方法編碼的縮混信號;和b)接收空間線索信息和有關(guān)該輸入音頻信號的渲染的控制信息,并且基于該控制信息來控制空間線索域中的空間線索信息。這里,在解碼步驟a)中,基于在空間線索渲染步驟
b)中控制的空間線索信息進(jìn)行輸入音頻信號的渲染,和所述空間線索信息是表示輸入音頻
信號之間的電平差并表達(dá)為的CLD值。這里,該空間線索渲染步驟b)包括步
驟bl)從編碼器傳送的CLD中提取CLD參數(shù);b2)從自CLD分析步驟bl)中提取的CLD參數(shù)中提取每個音頻信號的功率増益;和b3)通過基于有關(guān)輸入音頻信號的渲染的控制信息控制在増益因子轉(zhuǎn)換步驟b2)中提取的每個音頻信號的功率増益,來計算受控功率増益,m
表示子帶的索引,而I表示も(紙しη)中的參數(shù)組的索引。根據(jù)本發(fā)明的另一方面,提供了ー種用于控制音頻信號的渲染的方法,包括步驟a)使用SAC方法來解碼輸入音頻信號,所述輸入音頻信號是按照SAC方法編碼的縮混信號;和b)接收空間線索信息和有關(guān)該輸入音頻信號的渲染的控制信息,并且基于該控制信息來控制空間線索域中的空間線索信息。這里,在解碼步驟a)中,基于在空間線索渲染步驟b)中控制的空間線索信息進(jìn)行輸入音頻信號的渲染,和從縮混的信號LO和RO中提取中央イ目號(C)、左半平面/[目號(Lf+Ls)和右半平面/[目號(Rf+Rs),和所述空間線索/[目息是表不輸入音頻信號之間的電平差并表達(dá)為CU\K/afe,CLDl/e, CLDc7lfe, CLDLf/Ls和CLDKf/Ks的CLD值。該空間線索渲染步驟b)包括步驟bl)從編碼器傳送的CLD中提取CLD參數(shù);b2)從在CLD分析步驟bl)中提取的CLD參數(shù)中提取每個音頻信號的功率増益;和b3)通過基于有關(guān)輸入音頻信號的渲染的控制信息控制在増益因子轉(zhuǎn)換步驟b2)中提取的每個音頻信號的功率増益,來計算受控功率増益,根據(jù)本發(fā)明的另一方面,提供了ー種用于控制音頻信號的渲染的方法,包括步驟
a)使用SAC方法來解碼輸入音頻信號,所述輸入音頻信號是按照SAC方法編碼的縮混信號;和b)接收空間線索信息和有關(guān)該輸入音頻信號的渲染的控制信息,并且基于該控制信息來控制空間線索域中的空間線索信息。這里,在解碼步驟a)中,基于在空間線索渲染步驟b)中控制的空間線索信息,進(jìn)行輸入音頻信號的渲染,和所述空間線索信息是表示輸入音頻信號的縮混率的CPC和表示輸入音頻信號之間的電平差的CLD。這里,該空間線索渲染步驟b)包括bl)從編碼器傳送的CPC和CLD中提取CPC參數(shù)和CLD參數(shù);b2)通過從在CPC/CLD分析步驟bl)中提取的CPC參數(shù)中提取中央信號、左半平面信號和右半平面信號并且從CLD參數(shù)中提取左信號分量和右信號分量的功率増益,而提取每個信號的功率增益;和b3)通過基于有關(guān)輸入音頻信號的渲染的控制信息控制在増益因子轉(zhuǎn)換步驟b2)中提取的每個音頻信號的功率増益,來計算受控功率増益。根據(jù)本發(fā)明的另一方面,提供了ー種用于控制音頻信號的渲染的方法,包括步驟
a)使用SAC方法來解碼輸入音頻信號,所述輸入音頻信號是按照SAC方法編碼的縮混信號;和b)接收空間線索信息和有關(guān)該輸入音頻信號的渲染的控制信息,并且基于該控制信息來控制空間線索域中的空間線索信息。這里,在解碼步驟a)中,基于在空間線索渲染步驟
b)中控制的空間線索信息,進(jìn)行輸入音頻信號的渲染,并且該空間線索信息是表示輸入音頻信號之間的相關(guān)性的聲道間相關(guān)性(ICC)值,和在空間線索渲染步驟b)中,通過線性內(nèi)插處理來控制ICC參數(shù)。根據(jù)本發(fā)明的另一方面,提供了ー種用于控制音頻信號的渲染的方法,包括以下步驟a)使用空間音頻編碼(SAC)解碼方法來解碼輸入音頻信號,所述輸入音頻信號是以SAC方法編碼的縮混信號;和b)接收空間線索信息和有關(guān)該輸入音頻信號的渲染的控制信息,并且基于該控制信息來控制空間線索域中的空間線索信息,其中基于在該空間線索渲染步驟b)中控制的受控空間線索信息,在該解碼步驟a)中對輸入音頻信號執(zhí)行渲染。根據(jù)本發(fā)明,一旦接收到來自用戶或者通信的外部系統(tǒng)的請求,通過直接控制空間線索,可能靈活地控制多目標(biāo)或多聲道音頻信號的位置。有利效果本發(fā)明提供了一種當(dāng)解碼多目標(biāo)或多聲道音頻信號時、基于空間線索控制多目標(biāo)或多聲道音頻信號的渲染的裝置和方法。
圖I是示出傳統(tǒng)的多目標(biāo)或多聲道音頻信號編碼器的示例圖。圖2示出了根據(jù)本發(fā)明實施例的音頻信號渲染控制器。圖3是圖解說明恢復(fù)的平移(panning)多聲道信號的示例圖。圖4是描繪根據(jù)本發(fā)明實施例的當(dāng)聲道電平差(CLD)被用作空間線索時圖2中示出的空間線索渲染器的方框圖。圖5圖解說明了利用恒定功率平移(Constant Power Panning, CPP)將音頻信號映射到期望位置的方法。圖6示意性示出了包括信號之間的角度關(guān)系的布局。圖7是描繪當(dāng)SAC解碼器處于MPEG環(huán)繞立體聲模式時根據(jù)本發(fā)明實施例的空間線索渲染器的詳細(xì)方框圖。圖8圖解說明了用于解碼多目標(biāo)或多聲道音頻信號的空間解碼器。
圖9圖解說明了作為空間解碼器的三維(3D)立體聲音頻信號解碼器。圖10是示出應(yīng)用到圖8和圖9的空間線索渲染器的實施例的視圖。圖11是圖解說明采用雙聲道(binaural)立體聲解碼的運動圖像專家組(MPEG)環(huán)繞解碼器的視圖。圖12是描繪根據(jù)本發(fā)明另ー個實施例的音頻信號渲染控制器的視圖。圖13是圖解說明圖12的聲場定位器(spatializer)的詳細(xì)方框圖。圖14是描繪本發(fā)明實施例所應(yīng)用到的多聲道音頻解碼器的視圖。
具體實施例方式下面的描述僅例示了本發(fā)明的原理。即使它們在本說明書中未被清楚地描述或者圖解說明,本領(lǐng)域的普通技術(shù)人員也可以在本發(fā)明的概念和范疇之內(nèi)實施本發(fā)明的原理并且發(fā)明各種裝置。本說明書中展示的條件性術(shù)語和實施例的使用僅g在使得本發(fā)明的概念容易理解,并且它們不限于說明書中提到的實施例和條件。另外,有關(guān)本發(fā)明的原理、觀點和實施例以及特定實施例的所有詳細(xì)描述應(yīng)當(dāng)被理解為包括結(jié)構(gòu)性和功能性的等效物。所述等效物不僅包括當(dāng)前已知的等效物,還包括將來要研發(fā)的那些等效物,即,被發(fā)明來執(zhí)行相同功能的所有設(shè)備,而不管它們的結(jié)構(gòu)如何。例如,本發(fā)明的方框圖應(yīng)當(dāng)被理解為示出了體現(xiàn)本發(fā)明的原理的示例性電路的概念性觀點。類似地,所有流程圖、狀態(tài)轉(zhuǎn)換圖、偽代碼等能夠基本上在計算機(jī)可讀介質(zhì)中表達(dá),并且無論是否區(qū)別地描述了計算機(jī)或處理器,它們都應(yīng)當(dāng)被理解為表達(dá)由計算機(jī)或者處理器操作的各種處理。附圖中圖示的包括表達(dá)為處理器或者類似概念的功能塊的各種設(shè)備的功能不僅可以使用專用于所述功能的硬件來提供,還可以使用能夠運行所述功能的合適軟件的硬件來提供。當(dāng)通過處理器提供功能時,所述功能可以通過單個專用處理器、單個共享處理器、或者多個獨立處理器來提供,它們中的一部分可被共享。術(shù)語“處理器”、“控制”或者類似概念的明顯的使用不應(yīng)當(dāng)被理解為排他地表示能夠運行軟件的ー塊硬件,而是應(yīng)當(dāng)被理解為含蓄地包括數(shù)字信號處理器(DSP)、硬件以及用于存儲軟件的ROM、RAM和非易失性存儲器。這里也可以包括其他已知和公用的硬件。類似地,可以僅在概念上展示附圖中描述的切換。所述切換的功能應(yīng)當(dāng)被理解為 手動執(zhí)行,或者通過控制程序邏輯或者專用邏輯來執(zhí)行,或者通過專用邏輯的交互作用來執(zhí)行。設(shè)計者可以選擇特定技術(shù),用以更深入地理解本說明書。在本說明書的權(quán)利要求中,被表達(dá)為用于執(zhí)行在詳細(xì)描述中所描述的功能的部件的元件意欲包括用于執(zhí)行包括所有格式的軟件的功能的所有方法,例如,用于執(zhí)行預(yù)期功能的電路、固件/微碼等的組合。為了執(zhí)行預(yù)期功能,所述元件與用于執(zhí)行軟件的合適電路協(xié)作。由權(quán)利要求限定的本發(fā)明包括用于執(zhí)行特定功能的不同的部件,并且所述部件以權(quán)利要求中請求的方法相互連接。因此,能夠提供所述功能的任何部件應(yīng)當(dāng)被理解為等效于從本說明書中概括的部件。參考附圖,從下文所闡述的實施例的下列描述中,本發(fā)明的優(yōu)點、特征和方面將變得明顯。如果對相關(guān)現(xiàn)有技術(shù)的進(jìn)一步詳細(xì)描述被確定為模糊了本發(fā)明的發(fā)明點,則省略所述描述。下文中,將參考附圖來詳細(xì)描述本發(fā)明的優(yōu)選實施例。圖2示出了根據(jù)本發(fā)明的實施例的音頻信號渲染控制器。參考該附圖,音頻信號渲染控制器采用空間音頻編碼(SAC)解碼器203,該SAC解碼器203是對應(yīng)于圖I的SAC編碼器101的組成元件,并且音頻信號渲染控制器另外包括空間線索渲染器201。輸入到SAC解碼器203的信號是從編碼器(例如,圖I的SAC編碼器)傳送的縮混的單聲道或立體聲信號。輸入到空間線索渲染器201的信號是從編碼器(例如,圖I的SAC編碼器)傳送的空間線索。空間線索渲染器201控制空間線索域中的渲染。具體地,空間線索渲染器201不通過直接控制SAC解碼器203的輸出信號來進(jìn)行渲染,而是通過從空間線索中提取音頻信號信息來進(jìn)行渲染。這里,空間線索域是其中從編碼器傳送的空間線索作為參數(shù)被識別并且被控制的參數(shù)域。渲染是一種通過確定輸入音頻信號的位置和電平而生成輸出音頻信號的處理。SAC解碼器203可以采用諸如MPEG環(huán)繞、雙聲道線索編碼(BCC)和聲源位置線索編碼(Sound Source Location Cue Coding, SSLCC)之類的方法,但是本發(fā)明不限于此。根據(jù)本發(fā)明的實施例,可應(yīng)用的空間線索被定義為
聲道電平差(CLD):輸入音頻信號之間的電平差聲道間相關(guān)性(ICC):輸入音頻信號之間的相關(guān)性聲道預(yù)測系數(shù)(CPC):輸入音頻信號的縮混率換句話說,CDC是音頻信號的功率増益信息,而ICC是音頻信號之間的相關(guān)性信息。CTD是首頻/[目號之間的時間差/[目息,而CPC是首頻/[目號的縮混增益/[目息??臻g線索的主要作用是維持空間圖像(即聲音場景(scene))。根據(jù)本發(fā)明,聲音場景可以通過控制空間線索參數(shù)而不是直接操縱音頻輸出信號來控制。當(dāng)考慮音頻信號的再現(xiàn)環(huán)境時,最常使用的空間線索是CLD,該CLD単獨一個就可以生成基本輸出信號。下文中,將基于CLD來描述用于控制空間線索域中的信號的技術(shù)作為本發(fā)明的實施例。然而,本發(fā)明不限于該CLD,并且這對于本發(fā)明所屬領(lǐng)域的普通技術(shù)人員是顯而易見的。因此,應(yīng)當(dāng)理解,本發(fā)明不限于CLD的使用。根據(jù)使用CLD的實施例,可以通過將聲音平移定律直接應(yīng)用于功率増益系數(shù),來平移多目標(biāo)和多聲道音頻信號。根據(jù)該實施例,通過控制空間線索,基于整個波段中的平移位置,可以恢復(fù)多目標(biāo)和多聲道音頻信號。CLD被操縱來估計對應(yīng)于期望平移位置的每個音頻信號的功率増益。該平移位置可以通過從外部輸入的交互作用控制信號自由地輸入。圖3是圖解說明所恢復(fù)的平移多聲道信號的示意圖。每個信號以給定角度Qpan旋轉(zhuǎn)。然后,用戶可以識別旋轉(zhuǎn)的聲音場景。在附圖3中,Lf表示左前聲道信號;Ls表示左后聲道信號;Rf表示右前聲道信號;Rs表不右后聲道信號;C表不中央聲道信號。因此[Lf+Ls]表不左半平面信號,以及[Rf+Rs]表不右半平面信號。盡管圖3中未不出,但是Lfe表不低音揚聲器(woofer)信號。圖4是描繪根據(jù)本發(fā)明實施例的當(dāng)CLD被用作空間線索時圖2中示出的空間線索渲染器的方框圖。參考該附圖,使用CLD作為空間線索的空間線索渲染器201包括CLD分析單元401、增益因子轉(zhuǎn)換單元403、增益因子控制單元405、和CLD轉(zhuǎn)換單元407。
CLD分析單元401從接收到的空間線索(即CLD)中提取CLD參數(shù)。CLD包括音頻信號的電平差信息,并且它被表達(dá)為C LDm = IOlog10 -J-公式 I
m其中Pk表示第m子帶中的第k輸入音頻信號的子帶功率。增益因子轉(zhuǎn)換單元403從在CLD分析單元401中獲得的CLD參數(shù)中提取每個音頻信號的功率増益。參考公式1,當(dāng)在第m子帶中輸入M個音頻時,第m子帶中可提取的CLD的數(shù)目是 M-Kl彡i彡M-1)。因此,基于如下表達(dá)的公式2,從CLD中獲取每個音頻信號的功率增益
IΓPigm=gm'10= 1..........7............................7公式 2
お+巧因此,從第m子帶中的M-ICLD中可以獲取M輸入音頻信號的功率増益。同吋,由于基于輸入音頻信號的子帶而提取空間線索,因此也基于子帶來提取功率増益。當(dāng)提取第m子帶中的所有輸入音頻信號的功率增益時,它們可被表達(dá)為如公式3中所示的矢量矩陣
Sm
IGn =公式 3
Sn,_其中m表示子帶索引;‘表示第m子帶中第k輸入音頻信號(I彡k彡M)的子帶功率増益;和Gffl表示指明第m子帶中所有輸入音頻信號的功率増益的矢量。在増益因子轉(zhuǎn)換單元中提取的每個音頻信號的功率増益(Gm)被輸入到増益因子控制單元405并且被調(diào)節(jié)。所述調(diào)節(jié)控制輸入音頻信號的渲染,并且最終形成期望的音頻場景。輸入到増益因子控制單元405的渲染信息包括輸入音頻信號的數(shù)目(N)、包括突發(fā)(burst)和抑制(suppression)的姆個輸入音頻信號的虛擬位置和電平、輸出音頻信號的數(shù)目(M)、以及虛擬位置信息。増益因子控制單元405接收有關(guān)輸入音頻信號的渲染的控制信息,該控制信息是包括輸入音頻信號的輸出位置和輸出電平的音頻場景信息。該音頻場景信息是由外面的用戶輸入的交互作用控制信號。然后,増益因子控制單元405調(diào)節(jié)從増益因子轉(zhuǎn)換單元403輸出的每個輸入音頻信號的功率増益(Gm),并且獲取如公式4所示的受控功率增益^utGm)。
權(quán)利要求
1.ー種用于控制音頻信號的渲染的方法,包括以下步驟 a)使用空間音頻編碼(SAC)解碼方法來解碼輸入音頻信號,所述輸入音頻信號是以SAC方法編碼的縮混信號;和 b)接收空間線索信息和有關(guān)該輸入音頻信號的渲染的控制信息,并且基于該控制信息來控制空間線索域中的空間線索信息, 其中基于在該空間線索渲染步驟b)中控制的受控空間線索信息,在該解碼步驟a)中對輸入音頻信號執(zhí)行渲染。
2.如權(quán)利要求I所述的方法,其中所述空間線索信息是指明輸入音頻信號之間的電平差的ィ目息,和 該空間線索渲染步驟b)通過基于指明輸入音頻信號之間的電平差的信息和有關(guān)輸入音頻信號的渲染的控制信息,控制每個音頻信號的功率増益,來計算受控功率増益。
全文摘要
本研究涉及一種用于控制音頻信號的渲染的方法。所述方法包括以下步驟a)使用空間音頻編碼(SAC)解碼方法來解碼輸入音頻信號,所述輸入音頻信號是以SAC方法編碼的縮混信號;和b)接收空間線索信息和有關(guān)該輸入音頻信號的渲染的控制信息,并且基于該控制信息來控制空間線索域中的空間線索信息,其中基于在該空間線索渲染步驟b)中控制的受控空間線索信息,在該解碼步驟a)中對輸入音頻信號執(zhí)行渲染。
文檔編號G10L19/00GK102693727SQ201210139738
公開日2012年9月26日 申請日期2007年2月5日 優(yōu)先權(quán)日2006年2月3日
發(fā)明者張大永, 徐廷一, 李泰辰, 李用主, 洪鎮(zhèn)佑, 白承權(quán), 金鎮(zhèn)雄 申請人:韓國電子通信研究院