本申請(qǐng)是申請(qǐng)?zhí)枮?01380037816.5、申請(qǐng)日為2013年7月16日、發(fā)明名稱為“用于渲染音頻聲場(chǎng)表示以供音頻回放的方法和設(shè)備”的發(fā)明專利申請(qǐng)的分案申請(qǐng)。
本發(fā)明涉及一種用于渲染(render)音頻聲場(chǎng)表示(具體地,涉及高保真度立體聲響復(fù)制格式的音頻表示)以供音頻回放的方法和設(shè)備。
背景技術(shù):
精確定位是任何空間音頻再現(xiàn)系統(tǒng)的關(guān)鍵目標(biāo)。這種再現(xiàn)系統(tǒng)高度可應(yīng)用于會(huì)議系統(tǒng)、游戲或受益于3d聲音的其他虛擬環(huán)境。3d中的聲音場(chǎng)景可被合成或捕獲為自然聲場(chǎng)。聲場(chǎng)信號(hào)(例如,高保真度立體聲響復(fù)制(ambisonics))攜帶期望聲場(chǎng)的表示。高保真度立體聲響復(fù)制格式基于聲場(chǎng)的球面諧波分解。雖然基本高保真度立體聲響復(fù)制格式或b格式使用階數(shù)0和1的球面諧波,所謂的高階高保真度立體聲響復(fù)制(hoa)還使用至少2階的其他球面諧波。需要解碼或渲染過(guò)程來(lái)從這種高保真度立體聲響復(fù)制格式的信號(hào)中獲得單獨(dú)的擴(kuò)音器信號(hào)。在本文中將擴(kuò)音器的空間布置稱為擴(kuò)音器設(shè)置。然而,雖然已知的渲染方案僅適于常規(guī)的擴(kuò)音器設(shè)置,任意的擴(kuò)音器設(shè)置更加普遍。如果將這種渲染方案應(yīng)用于任何擴(kuò)音器設(shè)置,聲音方向性受到損傷。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明描述了一種用于渲染/解碼針對(duì)于常規(guī)和非常規(guī)空間擴(kuò)音器分布的音頻聲場(chǎng)表示的方法,其中,該渲染/解碼提供了高度改進(jìn)的定位特性并節(jié)省了能量。具體地,本發(fā)明提供了用于獲得(例如hoa格式的)聲場(chǎng)數(shù)據(jù)的解碼矩陣的新方式。因?yàn)閔oa格式描述了不直接涉及擴(kuò)音器位置的聲場(chǎng),且因?yàn)橐@得的擴(kuò)音器信號(hào)必然處于基于通道的音頻格式,hoa信號(hào)的解碼與音頻信號(hào)的渲染始終緊密相關(guān)。因此,本發(fā)明涉及解碼和渲染聲場(chǎng)相關(guān)的音頻格式。
本發(fā)明的一個(gè)優(yōu)點(diǎn)是實(shí)現(xiàn)節(jié)能解碼以及非常好的定向特性。術(shù)語(yǔ)“節(jié)能”指的是在解碼之后保留hoa定向信號(hào)中的能量,使得例如將以恒定的響度感知恒定幅度定向空間掃描。術(shù)語(yǔ)“好的定向特性”指的是通過(guò)定向的主波瓣和較小的副波瓣來(lái)表征的揚(yáng)聲器方向性,其中,與常規(guī)的渲染/解碼相比,提高了方向性。
本發(fā)明公開(kāi)了針對(duì)任意的擴(kuò)音器設(shè)置渲染聲場(chǎng)信號(hào)(例如,高階高保真度立體聲響復(fù)制(hoa)),其中,該渲染導(dǎo)致高度改進(jìn)的定位特性,且是節(jié)能的。這是通過(guò)用于聲場(chǎng)數(shù)據(jù)的新類(lèi)型的解碼矩陣以及用于獲得解碼矩陣的新方式來(lái)獲得的。在針對(duì)任意的空間擴(kuò)音器設(shè)置渲染音頻聲場(chǎng)表示的方法中,通過(guò)以下步驟獲得針對(duì)目標(biāo)擴(kuò)音器的給定布置進(jìn)行渲染的解碼矩陣:獲得目標(biāo)揚(yáng)聲器的數(shù)目及它們的位置、球面建模網(wǎng)格的位置以及hoa階數(shù),根據(jù)建模網(wǎng)格的位置和揚(yáng)聲器的位置來(lái)生成混合矩陣,根據(jù)球面建模網(wǎng)格的位置和hoa階數(shù)來(lái)生成模式矩陣,根據(jù)混合矩陣和模式矩陣計(jì)算第一解碼矩陣,以及使用平滑和縮放系數(shù)來(lái)平滑和縮放第一解碼矩陣,以獲得節(jié)能的解碼矩陣。
在一個(gè)實(shí)施例中,如權(quán)利要求1中所述,本發(fā)明涉及一種用于解碼和/或渲染音頻聲場(chǎng)表示以供音頻回放的方法。在另一實(shí)施例中,如權(quán)利要求9中所述,本發(fā)明涉及一種用于解碼和/或渲染音頻聲場(chǎng)表示以供音頻回放的設(shè)備。在又一實(shí)施例中,如權(quán)利要求15中所述,本發(fā)明涉及其上存儲(chǔ)可執(zhí)行指令的計(jì)算機(jī)可讀介質(zhì),所述可執(zhí)行指令使計(jì)算機(jī)執(zhí)行一種用于解碼和/或渲染音頻聲場(chǎng)表示以供音頻回放的方法。
一般而言,本發(fā)明使用以下方案。首先,導(dǎo)出取決于用于回放的擴(kuò)音器設(shè)置的平移(panning)函數(shù)。其次,針對(duì)擴(kuò)音器設(shè)置中的所有擴(kuò)音器,根據(jù)這些平移函數(shù)(或由平移函數(shù)所獲得的混合矩陣)計(jì)算解碼矩陣(例如,高保真度立體聲響復(fù)制解碼矩陣)。在第三步驟中,生成解碼矩陣并將其處理為是節(jié)能的。最后,對(duì)解碼矩陣濾波,以平滑擴(kuò)音器平移主波瓣并抑制副波瓣。針對(duì)給定的擴(kuò)音器設(shè)置,使用已濾波的解碼矩陣來(lái)渲染音頻信號(hào)。副波瓣是渲染的副作用,并在不想要的方向上提供音頻信號(hào)。因?yàn)獒槍?duì)給定的擴(kuò)音器設(shè)置來(lái)優(yōu)化渲染,副波瓣是令人煩惱的。本發(fā)明的優(yōu)點(diǎn)之一是最小化副波瓣,使得擴(kuò)音器信號(hào)的方向性得到改進(jìn)。
根據(jù)本發(fā)明一個(gè)實(shí)施例,一種用于解碼和/或渲染音頻聲場(chǎng)表示以供音頻回放的方法包括以下步驟:緩沖接收到的hoa時(shí)間采樣b(t),其中,形成m個(gè)采樣的塊以及時(shí)間索引μ,對(duì)系數(shù)b(μ)進(jìn)行濾波以獲得已頻率濾波的系數(shù)
用于渲染步驟(即,用來(lái)針對(duì)目標(biāo)揚(yáng)聲器的給定布置進(jìn)行渲染)的解碼矩陣d是通過(guò)以下步驟獲得的:獲得目標(biāo)揚(yáng)聲器的數(shù)目和揚(yáng)聲器的位置,確定球面建模網(wǎng)格的位置和hoa階數(shù),根據(jù)球面建模網(wǎng)格的位置和揚(yáng)聲器的位置生成混合矩陣,根據(jù)球面建模網(wǎng)格的位置和hoa階數(shù)生成模式矩陣,根據(jù)混合矩陣g和模式矩陣
根據(jù)另一方面,一種用于解碼和/或渲染音頻聲場(chǎng)表示以供音頻回放的設(shè)備包括具有用于獲得解碼矩陣d的解碼矩陣計(jì)算單元的渲染處理單元,解碼矩陣計(jì)算單元包括:用于獲得目標(biāo)揚(yáng)聲器的數(shù)目l的裝置和用于獲得揚(yáng)聲器的位置
根據(jù)又一方面,一種計(jì)算機(jī)可讀介質(zhì)在其上存儲(chǔ)有可執(zhí)行指令,當(dāng)在計(jì)算機(jī)上執(zhí)行該可執(zhí)行指令時(shí),該可執(zhí)行指令使計(jì)算機(jī)執(zhí)行上述用于解碼音頻聲場(chǎng)表示以供音頻回放的方法。
當(dāng)與附圖結(jié)合時(shí),根據(jù)對(duì)以下描述和所附權(quán)利要求的考慮,本發(fā)明的其他目標(biāo)、特征和優(yōu)點(diǎn)將變得顯而易見(jiàn)。
附圖說(shuō)明
參考附圖對(duì)本發(fā)明的示例性實(shí)施方式進(jìn)行描述,在附圖中:
圖1是根據(jù)本發(fā)明的一個(gè)實(shí)施例的方法的流程圖;
圖2是用于構(gòu)建混合矩陣g的方法的流程圖;
圖3是渲染器的框圖;
圖4是解碼矩陣生成過(guò)程的示意性步驟的流程圖;
圖5是解碼矩陣生成單元的框圖;
圖6是示例性的16個(gè)揚(yáng)聲器的設(shè)置,其中,揚(yáng)聲器被示出為連接的節(jié)點(diǎn);
圖7是自然視角下的示例性的16個(gè)揚(yáng)聲器的設(shè)置,其中,節(jié)點(diǎn)被示出為揚(yáng)聲器;
圖8是示出
圖9是針對(duì)根據(jù)現(xiàn)有技術(shù)[14](n=3)設(shè)計(jì)的解碼矩陣的聲壓圖,其中,中心揚(yáng)聲器的平移(panning)波束具有強(qiáng)的副波瓣;
圖10是示出
圖11是針對(duì)根據(jù)現(xiàn)有技術(shù)[2](n=3)設(shè)計(jì)的解碼矩陣的聲壓圖,其中,中心揚(yáng)聲器的平移波束具有較小的副波瓣;
圖12是示出
圖13是針對(duì)利用根據(jù)本發(fā)明的方法設(shè)計(jì)的解碼矩陣的聲壓圖,其中,中心揚(yáng)聲器具有帶有較小副波瓣的平移波束。
具體實(shí)施方式
大體上,本發(fā)明涉及向擴(kuò)音器渲染(即,解碼)聲場(chǎng)格式的音頻信號(hào)(例如,高階高保真度立體聲響復(fù)制(hoa)音頻信號(hào)),其中,擴(kuò)音器位于對(duì)稱或不對(duì)稱、常規(guī)或非常規(guī)位置。音頻信號(hào)可適于饋送比可用擴(kuò)音器更多的擴(kuò)音器,例如,hoa系數(shù)的數(shù)目可以大于擴(kuò)音器的數(shù)目。本發(fā)明以非常好的定向特性為解碼器提供了節(jié)能解碼矩陣,即,與利用常規(guī)解碼矩陣所獲得的揚(yáng)聲器方向性波瓣相比,揚(yáng)聲器方向性波瓣大體上包括更強(qiáng)的定向主波瓣和較小的副波瓣。節(jié)能指的是在解碼之后保留hoa方向性信號(hào)中的能量,使得例如以恒定的響度感知恒定幅度定向空間掃描。
圖1輸出了根據(jù)本發(fā)明的一個(gè)實(shí)施例的方法的流程圖。在該實(shí)施例中,用于渲染(即,解碼)hoa音頻聲場(chǎng)表示以供音頻回放的方法使用如下生成的解碼矩陣:首先,確定11目標(biāo)擴(kuò)音器的數(shù)目l、擴(kuò)音器的位置
在一個(gè)實(shí)施例中,通過(guò)兩種不同方法中的一種來(lái)獲得平滑系數(shù)
在一個(gè)實(shí)施例中,生成對(duì)應(yīng)于多個(gè)不同擴(kuò)音器布置的多個(gè)解碼矩陣,并將其存儲(chǔ)以供后續(xù)使用。不同的擴(kuò)音器布置可以在以下至少一方面不同:擴(kuò)音器的數(shù)目、一個(gè)或多個(gè)擴(kuò)音器的位置、以及輸入音頻信號(hào)的階數(shù)n。因此,在初始化渲染系統(tǒng)時(shí),確定匹配解碼矩陣,根據(jù)當(dāng)前需要從存儲(chǔ)器獲取該匹配解碼矩陣,并將其用于解碼。
在一個(gè)實(shí)施例中,通過(guò)根據(jù)
在備選實(shí)施例中,通過(guò)根據(jù)
在一個(gè)實(shí)施例中,根據(jù)
在一個(gè)實(shí)施例中,根據(jù)
在一個(gè)實(shí)施例中,根據(jù)hoa階數(shù)n和目標(biāo)揚(yáng)聲器的數(shù)目l,使用兩種不同的方法來(lái)計(jì)算平滑系數(shù):如果存在比hoa通道少的目標(biāo)揚(yáng)聲器,即,如果o3d=(n2+1)>l,則平滑和縮放系數(shù)
在一個(gè)實(shí)施例中,根據(jù)已平滑的解碼矩陣來(lái)獲得縮放因子。具體地,在一個(gè)實(shí)施例中,根據(jù)以下等式獲得縮放因子
下面描述完整的渲染系統(tǒng)。本發(fā)明的主要關(guān)注點(diǎn)是渲染器的初始化階段,在該階段如上所述地生成解碼矩陣d。在此,主要的關(guān)注點(diǎn)是用于導(dǎo)出一個(gè)或多個(gè)解碼矩陣(例如,用于碼本)的技術(shù)。為了生成解碼矩陣,有多少目標(biāo)擴(kuò)音器可用以及它們位于何處(即,它們的位置)是已知的。
圖2示出了根據(jù)本發(fā)明的一個(gè)實(shí)施例的用于構(gòu)建混合矩陣g的方法的流程圖。在該實(shí)施例中,創(chuàng)建21僅具有零的初始混合矩陣,以及針對(duì)每個(gè)具有角方向ωs=[θs,φs]t和半徑rs的虛擬源,執(zhí)行下面的步驟。首先,確定22環(huán)繞位置
下面一節(jié)給出對(duì)高階高保真度立體聲響復(fù)制(hoa)的簡(jiǎn)要介紹,并定義要處理(即,針對(duì)擴(kuò)音器渲染)的信號(hào)。
高階高保真度立體聲響復(fù)制(hoa)基于對(duì)感興趣的緊致區(qū)域內(nèi)的聲場(chǎng)的描述,該感興趣的緊致區(qū)域被假定為與聲源無(wú)關(guān)。在該情況下,在感興趣的區(qū)域內(nèi),在時(shí)間t以及位置x=[r,θ,φ]t(球面坐標(biāo):半徑r,傾角θ,方位角φ)處的聲壓p(t,x)的時(shí)空行為在物理上完全通過(guò)均勻波(homogeneouswave)等式來(lái)決定。可以示出,可根據(jù)[13]將聲壓相對(duì)于時(shí)間的傅里葉變換(即,
在等式(2)中,cs表示聲音的速度,以及
應(yīng)該注意到,sh一般是復(fù)數(shù)取值的函數(shù)。然而,通過(guò)它們的適當(dāng)線性組合,可以獲得取實(shí)數(shù)值的函數(shù),并關(guān)于這些函數(shù)執(zhí)行擴(kuò)展。
關(guān)于等式(2)中的壓力聲場(chǎng),可以將源場(chǎng)定義為:
其中,源場(chǎng)或幅度密度[12]d(kcs,ω)取決于角波數(shù)和角度方向ω=[θ,φ]t。源場(chǎng)可以由遠(yuǎn)場(chǎng)/近場(chǎng)的離散/連續(xù)源組成[1]。通過(guò)以下等式,源場(chǎng)系數(shù)
其中,
可以在頻域或時(shí)域中將hoa域中的信號(hào)表示為源場(chǎng)或聲場(chǎng)系數(shù)的傅里葉逆變換。下面的描述將假設(shè)使用有限數(shù)目的源場(chǎng)系數(shù)的時(shí)域表示:
:在n=n處截?cái)嗟仁?3)中的無(wú)限序列。截?cái)鄬?duì)應(yīng)于空間帶寬限制。
系數(shù)(或hoa通道)的數(shù)目被給出為:
o3d=(n+1)2對(duì)于3d(6)
或?qū)τ趦H2d的描述,給出為o2d=2n+1。系數(shù)
以及通過(guò)矩陣
b:=[b(tstart+1),b(tstart+2),..,b(tstart+m)](8)
可通過(guò)利用環(huán)形諧波(circularharmonic)的擴(kuò)展來(lái)導(dǎo)出聲場(chǎng)的二維表示。這是上述的一般性描述的特殊情況,該特殊情況使用固定傾角
在一個(gè)實(shí)施例中,將元數(shù)據(jù)與系數(shù)數(shù)據(jù)一起發(fā)送,允許明確地識(shí)別系數(shù)數(shù)據(jù)。通過(guò)所發(fā)送的元數(shù)據(jù)或因?yàn)榻o定的上下文,給出用于導(dǎo)出時(shí)間采樣系數(shù)矢量b(t)的所有必要信息。此外,要注意到的是,hoa階數(shù)n或o3d中的至少一個(gè),且在一個(gè)實(shí)施例中還包括特殊標(biāo)記以及用于指示近場(chǎng)記錄的rs,在解碼器處是已知的。接下來(lái)描述向擴(kuò)音器渲染hoa信號(hào)。該節(jié)示出了解碼以及某些數(shù)學(xué)特性的基本原理。
基本解碼假設(shè):第一,平面波擴(kuò)音器信號(hào),以及第二,可以忽略從揚(yáng)聲器到原點(diǎn)的距離。可以將針對(duì)位于球面方向
w=db(9)
其中,
d=ψ+(10)
其中,ψ+是模式矩陣ψ的偽取逆。模式矩陣ψ被定義為
ψ=[y1,…yl](11)
其中,
接下來(lái),描述由奇異值分解(svd)進(jìn)行的矩陣的偽取逆。導(dǎo)出偽取逆的一種通用方式是首先計(jì)算緊致svd:
ψ=usvh(12)
其中,
通過(guò)以下等式確定偽取逆:
其中,
下面描述節(jié)能特性。通過(guò)以下等式給出hoa域中的信號(hào)能量:
e=bhb(14)
以及通過(guò)以下等式給出空間域中的對(duì)應(yīng)能量:
節(jié)能解碼器矩陣的比率
一般而言,節(jié)能渲染器設(shè)計(jì)是本領(lǐng)域已知的。在[14]中通過(guò)以下等式提出了針對(duì)l≥o3d的節(jié)能解碼器矩陣設(shè)計(jì):
d=vuh(16)
其中,將來(lái)自等式(13)的
針對(duì)非常規(guī)位置的揚(yáng)聲器的渲染器設(shè)計(jì)也是本領(lǐng)域已知的。在[2]中描述了針對(duì)l≥o3d和l<o(jì)3d的解碼器設(shè)計(jì)方法,該解碼器設(shè)計(jì)方法允許在再現(xiàn)方向性上以較高精確度進(jìn)行渲染。該設(shè)計(jì)方法的缺陷是所導(dǎo)出的渲染器不節(jié)能(參見(jiàn)圖10-11)。
可以將球面卷積用于空間平滑。這是空間濾波過(guò)程,或是系數(shù)域中的窗口化(windowing)(卷積)。其目的是最小化副波瓣,稱為平移波瓣。通過(guò)原始hoa系數(shù)
這等效于在空間域?qū)2的左卷積[5]。在[5]中,將這方便地用于在通過(guò)對(duì)hoa系數(shù)b加權(quán)來(lái)進(jìn)行渲染/解碼之前對(duì)擴(kuò)音器信號(hào)的定向特性進(jìn)行平滑,該加權(quán)通過(guò)以下等式進(jìn)行:
其中,矢量
下面描述所公開(kāi)解決方案的其他細(xì)節(jié)和實(shí)施例。首先,在初始化、啟動(dòng)行為和處理方面對(duì)渲染器架構(gòu)進(jìn)行描述。
每次擴(kuò)音器設(shè)置(即,擴(kuò)音器的數(shù)目以及任何擴(kuò)音器相對(duì)于收聽(tīng)位置的位置發(fā)生改變),渲染器需要執(zhí)行初始化過(guò)程,以確定針對(duì)所支持hoa輸入信號(hào)具有的任何hoa階數(shù)的解碼矩陣組。同樣地,根據(jù)揚(yáng)聲器與收聽(tīng)位置之間的距離來(lái)確定延遲線的單獨(dú)揚(yáng)聲器延遲dl和揚(yáng)聲器增益
參考圖3解釋用于渲染的數(shù)據(jù)處理的示意性步驟,圖3示出了渲染器的處理框的框圖。它們是第一緩沖器31、頻域?yàn)V波單元32、渲染處理單元33、第二緩沖器34、用于l個(gè)通道的延遲單元35、以及數(shù)模變換器及放大器36。
首先在第一緩沖器31中存儲(chǔ)具有時(shí)間索引t和o3dhoa系數(shù)通道的hoa時(shí)間采樣b(t),以形成塊索引為μ的m個(gè)采樣的塊。在頻域?yàn)V波單元32中對(duì)的系數(shù)b(μ)進(jìn)行頻率濾波,以獲得已頻率濾波的塊
其中,
渲染器初始化如下進(jìn)行。
首先,需要知道揚(yáng)聲器的數(shù)目和位置。初始化的第一步驟是使新的揚(yáng)聲器數(shù)目l及相關(guān)位置
將l個(gè)距離rl和rmax輸入到延遲線和增益補(bǔ)償35。通過(guò)以下等式來(lái)確定針對(duì)每個(gè)揚(yáng)聲器通道dl的延遲采樣的數(shù)目:
其中,采樣速率為fs,聲音速度為c(溫度為20攝氏度時(shí),
如下進(jìn)行(例如,針對(duì)于碼本的)解碼矩陣的計(jì)算。圖4示出了在一個(gè)實(shí)施例中用于生成解碼矩陣的方法的示意性步驟。圖5示出了在一個(gè)實(shí)施例中用于生成解碼矩陣的對(duì)應(yīng)設(shè)備的處理框。輸入是揚(yáng)聲器方向
可以將揚(yáng)聲器方向
將揚(yáng)聲器方向
在構(gòu)建混合矩陣框41中,利用
1利用0值來(lái)創(chuàng)建g(即,初始化g)
2針對(duì)每個(gè)s=1...s
3{
4找到圍繞位置
5在笛卡爾坐標(biāo)中計(jì)算lt=spherical_to_cartesian(r)。
6構(gòu)建虛擬源位置s=(sinθscosφs,sinθssinφs,cosθs)t。
7計(jì)算g=lt-1s,其中
8歸一化增益:g=g/||g||2
9利用g的元素來(lái)填充g的相關(guān)元素gl,s:
10}
在構(gòu)建解碼矩陣框43中,計(jì)算對(duì)模式矩陣與轉(zhuǎn)置混合矩陣的矩陣乘積的緊致奇異值分解。這是本發(fā)明的一個(gè)重要方面,可通過(guò)各種方式來(lái)執(zhí)行。在一個(gè)實(shí)施例中,根據(jù)以下等式來(lái)計(jì)算模式矩陣
在備選實(shí)施例中,根據(jù)以下等式來(lái)計(jì)算模式矩陣
其中,g+是混合矩陣g的偽取逆。
在一個(gè)實(shí)施例中,創(chuàng)建對(duì)角矩陣,在該對(duì)角矩陣中,
發(fā)現(xiàn)適合的閾值大約是0.06。在例如±0.01的范圍內(nèi)或在±10%的范圍內(nèi)的較小偏差是可接受的。然后,如下計(jì)算解碼矩陣:
在平滑解碼矩陣框44中,平滑解碼矩陣。替代現(xiàn)有技術(shù)中已知的在解碼之前向hoa系數(shù)應(yīng)用平滑系數(shù),可以將其與解碼矩陣相組合。這節(jié)省了一個(gè)處理步驟或相應(yīng)節(jié)省了處理框。
為了針對(duì)用于hoa內(nèi)容比擴(kuò)音器具有更多系數(shù)(即,o3d>l)的解碼器也獲得良好的節(jié)能特性,根據(jù)hoa階數(shù)n(o3d=(n+1)2)來(lái)選擇所應(yīng)用的平滑系數(shù)
與在[4]中一樣,針對(duì)l≥o3d,
針對(duì)l<o(jì)3d,根據(jù)凱撒窗構(gòu)建的
其中,len=2n+1,width=2n,其中,
其中,io()表示第一類(lèi)的零階修正貝塞爾函數(shù)。矢量
其中,針對(duì)hoa階數(shù)索引n=o..n,每個(gè)元素
在一個(gè)實(shí)施例中,對(duì)已平滑的解碼矩陣進(jìn)行縮放。在一個(gè)實(shí)施例中,在圖4a)中示出的平滑解碼矩陣框44中執(zhí)行縮放。在不同的實(shí)施例中,在圖4b)中示出的縮放矩陣框45中將縮放作為單獨(dú)步驟執(zhí)行。
在一個(gè)實(shí)施例中,根據(jù)解碼矩陣來(lái)獲得恒定縮放因子。具體地,其可根據(jù)解碼矩陣的所謂弗羅比舍范數(shù)來(lái)獲得:
其中,
圖5示出了根據(jù)本發(fā)明的一方面的一種用于解碼音頻聲場(chǎng)表示以供音頻回放的設(shè)備。該設(shè)備包括具有用于獲得解碼矩陣d的解碼矩陣計(jì)算單元140的渲染處理單元33,解碼矩陣計(jì)算單元140包括用于獲得目標(biāo)揚(yáng)聲器的數(shù)目l的裝置1x和用于獲得揚(yáng)聲器的位置
圖6示出了節(jié)點(diǎn)示意圖中的示例性的16個(gè)揚(yáng)聲器的設(shè)置中的揚(yáng)聲器位置,其中,將揚(yáng)聲器示出為已連接節(jié)點(diǎn)。前臺(tái)連接示出為實(shí)線,后臺(tái)連接示出為虛線。圖7通過(guò)用透視法縮小繪制的視圖的形式示出了具有16個(gè)揚(yáng)聲器的相同設(shè)置。
下面描述利用圖5和圖6中的揚(yáng)聲器設(shè)置獲得的示例結(jié)果。在2個(gè)球面(所有的測(cè)試方向)上以db示出聲音信號(hào)的能量分布,以及具體地,比率
另一方面,在[2]中設(shè)計(jì)的解碼器矩陣(n=3)產(chǎn)生圖9中示出的比率
圖12示出了利用根據(jù)本發(fā)明的解碼器矩陣獲得的聲音信號(hào)的能量分布,為了易于比較,示例性地針對(duì)于n=3。(在圖12的右側(cè)示出的)比率
要注意到的是,在本文中只要提及揚(yáng)聲器,表示的是聲音發(fā)射設(shè)備,例如擴(kuò)音器。
附圖中的流程圖和/或框圖示出了根據(jù)本發(fā)明的各種實(shí)施例的系統(tǒng)、方法和計(jì)算機(jī)程序產(chǎn)品的可能實(shí)現(xiàn)的配置、操作和功能。在這一點(diǎn)上,流程圖或框圖中的每個(gè)框可以表示代碼的模塊、片段或部分,該代碼包括用于實(shí)現(xiàn)所指定的邏輯功能的一個(gè)或多個(gè)可執(zhí)行指令。
還應(yīng)該注意到,在一些備選實(shí)現(xiàn)中,框中提到的功能可以通過(guò)附圖中所提到的順序之外的順序來(lái)發(fā)生。例如,取決于所涉及的功能,連續(xù)示出的兩個(gè)框事實(shí)上可以實(shí)質(zhì)上同時(shí)執(zhí)行,或有時(shí)以相反的順序來(lái)執(zhí)行該框,或者可以通過(guò)備選順序執(zhí)行該框。還要注意到的是,框圖和/或流程圖示意圖的每個(gè)框,以及框圖和/或流程圖示意圖中的框組合可通過(guò)基于專用硬件的系統(tǒng)或者專用硬件和計(jì)算機(jī)指令的組合來(lái)實(shí)現(xiàn),該基于專用硬件的系統(tǒng)執(zhí)行特定功能或動(dòng)作。雖然沒(méi)有明確描述,可以在任何組合或子組合中使用當(dāng)前實(shí)施例。
此外,本領(lǐng)域技術(shù)人員應(yīng)該意識(shí)到的是,本原理的各方面可以體現(xiàn)為系統(tǒng)、方法或計(jì)算機(jī)可讀介質(zhì)。因此,本原理的各方面可以采用以下形式:完全硬件實(shí)施例、完全軟件實(shí)施例(包括固件、駐機(jī)軟件、微代碼等)、或組合了軟件和硬件方面(在本文中可全部統(tǒng)稱為“電路”、“模塊”或“系統(tǒng)”)的實(shí)施例。此外,本原理的各方面可以采用計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)的形式??梢岳靡粋€(gè)或多個(gè)計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)的任何組合。本文中使用的計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)被認(rèn)為是非暫時(shí)存儲(chǔ)介質(zhì),該非暫時(shí)存儲(chǔ)介質(zhì)被給定了在其中存儲(chǔ)信息的固有能力以及從其提供對(duì)信息的獲取的固有能力。
此外,本領(lǐng)域技術(shù)人員應(yīng)該意識(shí)到,這里所呈現(xiàn)的框圖表示了體現(xiàn)本發(fā)明原理的示意性系統(tǒng)組件和/或電路的概念視圖。類(lèi)似地,應(yīng)該意識(shí)到,任何流程圖、流程圖表、狀態(tài)轉(zhuǎn)移圖、偽代碼等表示各種過(guò)程,其中可以在計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中表示這些過(guò)程并且由計(jì)算機(jī)或處理器執(zhí)行這些過(guò)程,不管是否明確示出了這樣的計(jì)算機(jī)或處理器。
所引用的參考文獻(xiàn)
[1]t.d.abhayapala.generalizedframeworkforsphericalmicrophonearrays:spatialandfrequencydecomposition.inproc.ieeeinternationalconferenceonacoustics,speech,andsignalprocessing(icassp),(accepted)vol.x,pp.,april2008,lasvegas,usa.
[2]johann-markusbatke,floriankeiler,andjohannesboehm.methodanddevicefordecodinganaudiosoundfieldrepresentationforaudioplayback.internationalpatentapplicationwo20111117399(pd100011).
[3]
[4]
[5]jamesr.driscollanddennism.healyjr.computingfouriertransformsandconvolutionsonthe2-sphere.advancesinappliedmathematics,15:202-250,1994.
[6]
http://www.personal.soton.ac.uk/jf1w07/nodes/nodes.html,online,accessed2012-06-01.
[7]
[8]r.h.hardinandn.j.a.sloane.webpage:sphericaldesigns,sphericalt-designs.http://www2.research.att.com/~njas/sphdesigns/.
[9]r.h.hardinandn.j.a.sloane.mclaren′simprovedsnubcubeandothernewsphericaldesignsinthreedimensions.discreteandcomputationalgeometry,15:429-441,1996.
[10]m.a.poletfi.three-dimensionalsurroundsoundsystemsbasedonsphericalharmonics.j.audioeng.soc.,53(11):1004-1025,november2005.
[11]villepulkki.spatialsoundgenerationandperceptionbyamplitudepanningtechniques.phdthesis,helsinkiuniversityoftechnology,2001.
[12]boazrafaely.plane-wavedecompositionofthesoundfieldonaspherebysphericalconvolution.j.acoust.soc.am.,4(116):2149-2157,october2004.
[13]earlg.williams.fourieracoustics,volume93ofappliedmathematicalsciences.academicpress,1999.
[14]f.zotter.h.pomberger,andm.noisternig.energy-preservingambisonicdecoding.actaacusticaunitedwithacustica,98(1):37-47.january/february2012.