本技術(shù)涉及用于頻帶中的聲場相關(guān)參數(shù)估計(jì)、但不排他地用于音頻編碼器和解碼器的時頻域聲場相關(guān)參數(shù)估計(jì)的裝置和方法。
背景技術(shù):
1、參數(shù)化的空間音頻處理是音頻信號處理的領(lǐng)域,其中使用參數(shù)集描述聲音的空間方面。例如,在從麥克風(fēng)陣列進(jìn)行參數(shù)化空間音頻捕獲中,從麥克風(fēng)陣列信號中估計(jì)參數(shù)集(例如頻帶中聲音的方向以及頻帶中捕獲的聲音的定向和非定向部分之間的比率)是一種典型且有效的選擇。眾所周知,這些參數(shù)很好地描述了麥克風(fēng)陣列位置處捕獲的聲音的感知空間特性。這些參數(shù)可以相應(yīng)地用于空間聲音的合成、用于雙耳式耳機(jī)、用于揚(yáng)聲器或其他格式,例如立體聲混響(ambisonics)。
2、因此,頻帶中的方向和直接總體能量比(direct-to-total?energy?ratio)是對空間音頻捕獲特別有效的參數(shù)化(parameterization)。
技術(shù)實(shí)現(xiàn)思路
1、根據(jù)第一方面,提供一種裝置,包括用于以下操作的模塊:定義與輸入多聲道音頻信號相關(guān)聯(lián)的至少一個參數(shù)字段,該至少一個參數(shù)字段被配置為描述該多聲道音頻信號的至少一個特性;確定與該多聲道音頻信號相關(guān)聯(lián)的至少一個空間音頻參數(shù);以及通過至少使用該多聲道音頻信號的該至少一個特性和該至少一個空間音頻參數(shù)處理該輸入多聲道音頻信號,來控制該多聲道音頻信號的渲染。
2、該用于定義與該多聲道音頻信號相關(guān)聯(lián)的至少一個參數(shù)字段的模塊,被配置為描述該多聲道音頻信號的特性的該至少一個參數(shù)字段可以包括被配置為將該多聲道音頻信號標(biāo)識為特定類型的音頻信號的至少一個第一字段。
3、該特定類型的音頻信號可以包括以下至少之一:麥克風(fēng)捕獲的多聲道音頻信號;雙耳音頻信號;信號處理的音頻信號;增強(qiáng)信號處理的音頻信號;噪聲抑制的信號處理的音頻信號;源分離的信號處理的音頻信號;跟蹤源信號處理的音頻信號;空間處理的音頻信號;高級信號處理的音頻信號;以及全景聲音頻信號。
4、該用于定義與該多聲道音頻信號相關(guān)聯(lián)的至少一個參數(shù)字段的模塊,被配置為描述該多聲道音頻信號的特性的該至少一個參數(shù)字段可以包括被配置為標(biāo)識與該特定類型的音頻信號相關(guān)聯(lián)的特性的至少一個第二字段。
5、當(dāng)該特定類型的音頻信號是麥克風(fēng)捕獲的多聲道音頻信號時,與該特定類型的音頻信號相關(guān)聯(lián)的該特性可以包括以下之一:標(biāo)識被致使捕獲該麥克風(fēng)捕獲的多聲道音頻信號的麥克風(fēng)陣列中的至少一個麥克風(fēng)的麥克風(fēng)簡檔(profile);標(biāo)識被致使捕獲該麥克風(fēng)捕獲的多聲道音頻信號的該麥克風(fēng)陣列的配置;以及標(biāo)識被致使捕獲該麥克風(fēng)捕獲的多聲道音頻信號的該麥克風(fēng)陣列內(nèi)的至少兩個麥克風(fēng)的位置和/或布置。
6、被致使為捕獲該麥克風(fēng)捕獲的多聲道音頻信號的至少一個麥克風(fēng)的麥克風(fēng)簡檔可以包括以下至少之一:全向麥克風(fēng)簡檔;子心形(subcardoid)定向麥克風(fēng)簡檔;心形定向麥克風(fēng)簡檔;高心形(hypercardoid)定向麥克風(fēng)簡檔;超心形(supercardoid)定向麥克風(fēng)配置文件;短槍式(shotgun)定向麥克風(fēng)配置文件;8字型/中側(cè)(midside)定向麥克風(fēng)簡檔;以及邊界式定向麥克風(fēng)簡檔。
7、該用于定義與該多聲道音頻信號相關(guān)聯(lián)的至少一個參數(shù)字段的模塊,被配置為描述該多聲道音頻信號的特性的該至少一個參數(shù)字段可以包括被配置為標(biāo)識與該特定麥克風(fēng)簡檔相關(guān)聯(lián)的特性的至少一個第三字段。
8、與該特定麥克風(fēng)簡檔相關(guān)聯(lián)的該特性可以包括以下至少之一:該麥克風(fēng)陣列的至少兩個麥克風(fēng)之間的距離;以及該麥克風(fēng)陣列中的該至少一個麥克風(fēng)的方向。
9、當(dāng)該特定類型的音頻信號是雙耳音頻信號時,與該特定類型的音頻信號相關(guān)聯(lián)的該特性可以包括標(biāo)識頭部相關(guān)傳遞函數(shù)。
10、該用于定義與該多聲道音頻信號相關(guān)聯(lián)的至少一個參數(shù)字段的模塊,被配置為描述該多聲道音頻信號的特性的該至少一個參數(shù)字段可以包括被配置為標(biāo)識與該頭部相關(guān)傳遞函數(shù)相關(guān)聯(lián)的方向的至少一個第三字段。
11、當(dāng)該特定類型的音頻信號是空間處理的音頻信號時,與該特定類型的音頻信號相關(guān)聯(lián)的該特性可以包括標(biāo)識用于標(biāo)識處理變量以協(xié)助該渲染的參數(shù)。
12、標(biāo)識處理變量以協(xié)助該渲染的該參數(shù)可以包括以下至少之一:應(yīng)用于至少兩個捕獲的音頻信號以形成該多聲道音頻信號的波束成形;應(yīng)用于至少兩個捕獲的音頻信號以形成該多聲道音頻信號的處理變量;標(biāo)識可用于由該解碼器從中選擇的可能的音頻渲染信號處理變量的指示符;左-右側(cè)聚焦;前-后聚焦;噪聲抑制-殘留噪聲信號;目標(biāo)跟蹤-剩余(remainder)信號;主-殘留信號;源1-源2信號;以及波束1-波束2信號。
13、該用于定義與該多聲道音頻信號相關(guān)聯(lián)的至少一個參數(shù)字段的模塊,被配置為描述該多聲道音頻信號的特性的該至少一個參數(shù)字段可以包括被配置為標(biāo)識與該處理變量相關(guān)聯(lián)的聚焦量的至少一個第三字段。
14、當(dāng)該特定類型的音頻信號是全景聲音頻信號時,與該特定類型的音頻信號相關(guān)聯(lián)的該特性可以包括標(biāo)識該全景聲音頻信號的格式。
15、標(biāo)識該全景聲音頻信號的格式的該參數(shù)可以包括以下至少之一:a-格式標(biāo)識符;b-格式標(biāo)識符;四象限標(biāo)識符;以及頭部傳遞函數(shù)標(biāo)識符。
16、該用于定義與該多聲道音頻信號相關(guān)聯(lián)的至少一個參數(shù)字段的模塊,被配置為描述該多聲道音頻信號的特性的該至少一個參數(shù)字段可以包括被配置為標(biāo)識與該全景聲音頻信號相關(guān)聯(lián)的歸一化(normalisation)的至少一個第三字段,其中該歸一化包括以下至少之一:b-格式歸一化;sn3d歸一化;sn2d歸一化;maxn歸一化;n3d歸一化;以及n2d/sn2d歸一化。
17、該模塊可以進(jìn)一步用于將與輸入多聲道音頻信號相關(guān)聯(lián)的該至少一個參數(shù)字段發(fā)送給渲染器,以渲染該多聲道音頻信號。
18、該模塊可以進(jìn)一步用于接收用戶輸入,其中該用于定義與輸入多聲道音頻信號相關(guān)聯(lián)的至少一個參數(shù)字段的模塊可以基于該用戶輸入。
19、該用于定義與輸入多聲道音頻信號相關(guān)聯(lián)的至少一個參數(shù)字段的模塊可以基于該用戶輸入,進(jìn)一步用于在沒有用戶輸入的情況下將該至少一個參數(shù)字段定義為確定的默認(rèn)值。
20、該至少一個空間音頻參數(shù)可以包括該多聲道音頻信號的至少兩個頻帶的方向和能量比。
21、根據(jù)第二方面,提供了一種裝置,包括用于以下操作的模塊:接收與多聲道音頻信號相關(guān)聯(lián)的至少一個參數(shù)字段,該至少一個參數(shù)字段被配置為描述該多聲道音頻信號的特性;接收至少一個空間音頻參數(shù);確定該多聲道音頻信號;以及基于該至少一個空間音頻參數(shù)和與該多聲道音頻信號相關(guān)聯(lián)的至少一個參數(shù)字段,處理該多聲道音頻信號,以協(xié)助渲染該多聲道音頻信號。
22、與該多聲道音頻信號相關(guān)聯(lián)的該至少一個參數(shù)字段可以包括被配置為將該多聲道音頻信號標(biāo)識為特定類型的音頻信號的至少一個第一字段。
23、該特定類型的音頻信號可以包括以下至少之一:麥克風(fēng)捕獲的多聲道音頻信號;雙耳音頻信號;信號處理的音頻信號;增強(qiáng)信號處理的音頻信號;噪聲抑制的信號處理的音頻信號;源分離的信號處理的音頻信號;跟蹤源信號處理的音頻信號;高級信號處理的音頻信號;空間處理的音頻信號;以及全景聲音頻信號。
24、與該多聲道音頻信號相關(guān)聯(lián)的至少一個參數(shù)字段可以包括被配置為標(biāo)識與該特定類型的音頻信號相關(guān)聯(lián)的特性的至少一個第二字段。
25、當(dāng)該特定類型的音頻信號是麥克風(fēng)捕獲的多聲道音頻信號時,與該特定類型的音頻信號相關(guān)聯(lián)的該特性可以包括以下之一:
26、標(biāo)識被致使捕獲該麥克風(fēng)捕獲的多聲道音頻信號的麥克風(fēng)陣列中的至少一個麥克風(fēng)的麥克風(fēng)簡檔;
27、標(biāo)識被致使捕獲該麥克風(fēng)捕獲的多聲道音頻信號的該麥克風(fēng)陣列的配置;以及
28、標(biāo)識被致使捕獲該麥克風(fēng)捕獲的多聲道音頻信號的該麥克風(fēng)陣列內(nèi)的至少兩個麥克風(fēng)的位置和/或布置。
29、被致使捕獲該麥克風(fēng)捕獲的多聲道音頻信號的至少一個麥克風(fēng)的麥克風(fēng)簡檔可以包括以下至少之一:全向麥克風(fēng)簡檔;亞心形定向麥克風(fēng)簡檔;心形定向麥克風(fēng)簡檔;高心形定向麥克風(fēng)簡檔;超心形定向麥克風(fēng)簡檔;短槍式定向麥克風(fēng)簡檔;8字型/中側(cè)定向麥克風(fēng)簡檔;以及邊界式定向麥克風(fēng)簡檔。
30、與該多聲道音頻信號相關(guān)聯(lián)的至少一個參數(shù)字段可以包括被配置為標(biāo)識與該特定麥克風(fēng)簡檔相關(guān)聯(lián)的特性的至少一個第三字段。
31、與該特定麥克風(fēng)簡檔相關(guān)聯(lián)的該特性可以包括以下至少之一:該麥克風(fēng)陣列的至少兩個麥克風(fēng)之間的距離;以及該麥克風(fēng)陣列中的該至少一個麥克風(fēng)的方向。
32、當(dāng)該特定類型的音頻信號是雙耳音頻信號時,與該特定類型的音頻信號相關(guān)聯(lián)的該特性可以包括標(biāo)識頭部相關(guān)傳遞函數(shù)。
33、與該多聲道音頻信號相關(guān)聯(lián)的至少一個參數(shù)字段可以包括被配置為標(biāo)識與該頭部相關(guān)傳遞函數(shù)相關(guān)聯(lián)的方向的至少一個第三字段。
34、當(dāng)該特定類型的音頻信號是空間處理的音頻信號時,與該特定類型的音頻信號相關(guān)聯(lián)的該特性可以包括標(biāo)識處理變量以協(xié)助該渲染的參數(shù)。
35、標(biāo)識處理變量以協(xié)助該渲染的該參數(shù)可以包括以下至少之一:應(yīng)用于至少兩個捕獲的音頻信號以形成該多聲道音頻信號的波束成形;應(yīng)用于至少兩個捕獲的音頻信號以形成該多聲道音頻信號的處理變量;標(biāo)識可用于由該解碼器從中選擇的可能的音頻渲染信號處理變量的指示符;左-右側(cè)聚焦;前-后聚焦;噪聲抑制-殘留噪聲信號;目標(biāo)跟蹤-剩余信號;主-殘留信號;源1-源2信號;以及波束1-波束2信號。
36、與該多聲道音頻信號相關(guān)聯(lián)的至少一個參數(shù)字段可以包括被配置為標(biāo)識與該處理變量相關(guān)聯(lián)的聚焦量的至少一個第三字段。
37、當(dāng)該特定類型的音頻信號是全景聲音頻信號時,與該特定類型的音頻信號相關(guān)聯(lián)的該特性可以包括標(biāo)識該全景聲音頻信號的格式。
38、標(biāo)識該全景聲音頻信號的格式的該參數(shù)可以包括以下至少之一:a-格式標(biāo)識符;b-格式標(biāo)識符;四象限標(biāo)識符;以及頭部傳遞函數(shù)標(biāo)識符。
39、該至少一個參數(shù)字段可以包括被配置為標(biāo)識與該立體聲混響音頻信號相關(guān)聯(lián)的歸一化的至少一個第三字段,其中該歸一化包括以下至少之一:b-格式歸一化;sn3d歸一化;sn2d歸一化;maxn歸一化;n3d歸一化;以及n2d/sn2d歸一化。
40、該模塊可以進(jìn)一步用于接收用戶輸入,其中用于基于該至少一個空間音頻參數(shù)和與該多聲道音頻信號相關(guān)聯(lián)的至少一個參數(shù)字段來處理該多聲道音頻信號以協(xié)助渲染該多聲道音頻信號的該模塊可以進(jìn)一步基于該用戶輸入。
41、用于基于該至少一個空間音頻參數(shù)和與該多聲道音頻信號相關(guān)聯(lián)的至少一個參數(shù)字段來處理該多聲道音頻信號以協(xié)助渲染該多聲道音頻信號的該模塊還可以用于在沒有用戶輸入的情況下將該至少一個參數(shù)字段定義為確定的默認(rèn)值。
42、根據(jù)第三方面,提供了一種裝置,該裝置包括至少一個處理器和至少一個包括計(jì)算機(jī)程序代碼的存儲器,該至少一個存儲器和該計(jì)算機(jī)程序代碼被配置為與該至少一個處理器一起使該裝置至少:定義與輸入多聲道音頻信號相關(guān)聯(lián)的至少一個參數(shù)字段,該至少一個參數(shù)字段被配置為描述該多聲道音頻信號的至少一個特性;確定與該多聲道音頻信號相關(guān)聯(lián)的至少一個空間音頻參數(shù);以及通過至少使用該多聲道音頻信號的該至少一個特性和該至少一個空間音頻參數(shù)處理該輸入多聲道音頻信號,來控制該多聲道音頻信號的渲染。
43、該被致使定義與該多聲道音頻信號相關(guān)聯(lián)的至少一個參數(shù)字段的裝置,被配置為描述該多聲道音頻信號的特性的該至少一個參數(shù)字段可以包括被配置為將該多聲道音頻信號標(biāo)識為特定類型的音頻信號的至少一個第一字段。
44、該特定類型的音頻信號可以包括以下至少之一:麥克風(fēng)捕獲的多聲道音頻信號;雙耳音頻信號;信號處理的音頻信號;增強(qiáng)信號處理的音頻信號;噪聲抑制的信號處理的音頻信號;源分離的信號處理的音頻信號;跟蹤源信號處理的音頻信號;空間處理的音頻信號;高級信號處理的音頻信號;以及全景聲音頻信號。
45、該被致使定義與該多聲道音頻信號相關(guān)聯(lián)的至少一個參數(shù)字段的裝置,被配置為描述該多聲道音頻信號的特性的該至少一個參數(shù)字段可以包括被配置為標(biāo)識與該特定類型的音頻信號相關(guān)聯(lián)的特性的至少一個第二字段。
46、當(dāng)該特定類型的音頻信號是麥克風(fēng)捕獲的多聲道音頻信號時,與該特定類型的音頻信號相關(guān)聯(lián)的該特性可以包括以下之一:標(biāo)識被致使捕獲該麥克風(fēng)捕獲的多聲道音頻信號的麥克風(fēng)陣列中的至少一個麥克風(fēng)的麥克風(fēng)簡檔;標(biāo)識被致使捕獲該麥克風(fēng)捕獲的多聲道音頻信號的該麥克風(fēng)陣列的配置;以及標(biāo)識被致使捕獲該麥克風(fēng)捕獲的多聲道音頻信號的該麥克風(fēng)陣列內(nèi)的至少兩個麥克風(fēng)的位置和/或布置。
47、被致使捕獲該麥克風(fēng)捕獲的多聲道音頻信號的至少一個麥克風(fēng)的麥克風(fēng)簡檔可以包括以下至少之一:全向麥克風(fēng)簡檔;亞心形定向麥克風(fēng)簡檔;心形定向麥克風(fēng)簡檔;高心形定向麥克風(fēng)簡檔;超心形定向麥克風(fēng)簡檔;短槍式定向麥克風(fēng)簡檔;8字型/中側(cè)定向麥克風(fēng)簡檔;以及邊界式定向麥克風(fēng)簡檔。
48、該被致使定義與該多聲道音頻信號相關(guān)聯(lián)的至少一個參數(shù)字段的裝置,被配置為描述該多聲道音頻信號的特性的該至少一個參數(shù)字段可以包括被配置為標(biāo)識與該特定麥克風(fēng)簡檔相關(guān)聯(lián)的特性的至少一個第三字段。
49、與該特定麥克風(fēng)簡檔相關(guān)聯(lián)的該特性可以包括以下至少之一:該麥克風(fēng)陣列的至少兩個麥克風(fēng)之間的距離;以及該麥克風(fēng)陣列中的該至少一個麥克風(fēng)的方向。
50、當(dāng)該特定類型的音頻信號是雙耳音頻信號時,與該特定類型的音頻信號相關(guān)聯(lián)的該特性可以包括標(biāo)識頭部相關(guān)傳遞函數(shù)。
51、該被致使定義與該多聲道音頻信號相關(guān)聯(lián)的至少一個參數(shù)字段的裝置,被配置為描述該多聲道音頻信號的特性的該至少一個參數(shù)字段可以包括被配置為標(biāo)識與該頭部相關(guān)傳遞函數(shù)相關(guān)聯(lián)的方向的至少一個第三字段。
52、當(dāng)該特定類型的音頻信號是空間處理的音頻信號時,與該特定類型的音頻信號相關(guān)聯(lián)的該特性可以包括標(biāo)識用于標(biāo)識處理變量以協(xié)助該渲染的參數(shù)。
53、用于標(biāo)識處理變量以協(xié)助該渲染的該參數(shù)可以包括以下至少之一:應(yīng)用于至少兩個捕獲的音頻信號以形成該多聲道音頻信號的波束成形;應(yīng)用于至少兩個捕獲的音頻信號以形成該多聲道音頻信號的處理變量;標(biāo)識可用于由該解碼器從中選擇的可能的音頻渲染信號處理變量的指示符;左-右側(cè)聚焦;前-后聚焦;噪聲抑制-殘留噪聲信號;目標(biāo)跟蹤-剩余信號;主-殘留信號;源1-源2信號;以及波束1-波束2信號。
54、該被致使定義與該多聲道音頻信號相關(guān)聯(lián)的至少一個參數(shù)字段的裝置,被配置為描述該多聲道音頻信號的特性的該至少一個參數(shù)字段可以包括被配置為標(biāo)識與該處理變量相關(guān)聯(lián)的聚焦量的至少一個第三字段。
55、當(dāng)該特定類型的音頻信號是全景聲音頻信號時,與該特定類型的音頻信號相關(guān)聯(lián)的該特性可以包括標(biāo)識該全景聲音頻信號的格式。
56、標(biāo)識該全景聲音頻信號的格式的該參數(shù)可以包括以下至少之一:a-格式標(biāo)識符;b-格式標(biāo)識符;四象限標(biāo)識符;以及頭部傳遞函數(shù)標(biāo)識符。
57、該被致使定義與該多聲道音頻信號相關(guān)聯(lián)的至少一個參數(shù)字段的裝置,被配置為描述該多聲道音頻信號的特性的該至少一個參數(shù)字段可以包括被配置為標(biāo)識與該全景聲音頻信號相關(guān)聯(lián)的歸一化的至少一個第三字段,其中該歸一化包括以下至少之一:b-格式歸一化;sn3d歸一化;sn2d歸一化;maxn歸一化;n3d歸一化;以及n2d/sn2d歸一化。
58、該裝置可以進(jìn)一步被致使為將與輸入多聲道音頻信號相關(guān)聯(lián)的該至少一個參數(shù)字段發(fā)送給渲染器以渲染該多聲道音頻信號。
59、該裝置可以進(jìn)一步被致使為接收用戶輸入,其中該用于定義與輸入多聲道音頻信號相關(guān)聯(lián)的至少一個參數(shù)字段的裝置可以基于該用戶輸入。
60、該被致使為定義與該多聲道音頻信號相關(guān)聯(lián)的至少一個參數(shù)字段的裝置可以基于該用戶輸入,進(jìn)一步用于在沒有用戶輸入的情況下將該至少一個參數(shù)字段定義為確定的默認(rèn)值。
61、該至少一個空間音頻參數(shù)可以包括該多聲道音頻信號的至少兩個頻帶的方向和能量比。
62、根據(jù)第四方面,提供了一種裝置,該裝置包括至少一個處理器和至少一個包括計(jì)算機(jī)程序代碼的存儲器,該至少一個存儲器和該計(jì)算機(jī)程序代碼被配置為與該至少一個處理器一起使該裝置至少:接收與多聲道音頻信號相關(guān)聯(lián)的至少一個參數(shù)字段,該至少一個參數(shù)字段被配置為描述該多聲道音頻信號的特性;接收至少一個空間音頻參數(shù);確定該多聲道音頻信號;以及基于該至少一個空間音頻參數(shù)和與該多聲道音頻信號相關(guān)聯(lián)的至少一個參數(shù)字段,處理該多聲道音頻信號,以協(xié)助渲染該多聲道音頻信號。
63、與該多聲道音頻信號相關(guān)聯(lián)的該至少一個參數(shù)字段可以包括被配置為將該多聲道音頻信號標(biāo)識為特定類型的音頻信號的至少一個第一字段。
64、該特定類型的音頻信號可以包括以下至少之一:麥克風(fēng)捕獲的多聲道音頻信號;雙耳音頻信號;信號處理的音頻信號;增強(qiáng)信號處理的音頻信號;噪聲抑制的信號處理的音頻信號;源分離的信號處理的音頻信號;跟蹤源信號處理的音頻信號;高級信號處理的音頻信號;空間處理的音頻信號;以及全景聲音頻信號。
65、與該多聲道音頻信號相關(guān)聯(lián)的至少一個參數(shù)字段可以包括被配置為標(biāo)識與該特定類型的音頻信號相關(guān)聯(lián)的特性的至少一個第二字段。
66、當(dāng)該特定類型的音頻信號是麥克風(fēng)捕獲的多聲道音頻信號時,與該特定類型的音頻信號相關(guān)聯(lián)的該特性可以包括以下之一:標(biāo)識被致使捕獲該麥克風(fēng)捕獲的多聲道音頻信號的麥克風(fēng)陣列中的至少一個麥克風(fēng)的麥克風(fēng)簡檔;標(biāo)識被致使捕獲該麥克風(fēng)捕獲的多聲道音頻信號的該麥克風(fēng)陣列的配置;以及標(biāo)識被致使捕獲該麥克風(fēng)捕獲的多聲道音頻信號的該麥克風(fēng)陣列內(nèi)的至少兩個麥克風(fēng)的位置和/或布置。
67、被致使捕獲該麥克風(fēng)捕獲的多聲道音頻信號的至少一個麥克風(fēng)的麥克風(fēng)簡檔可以包括以下至少之一:全向麥克風(fēng)簡檔;亞心形定向麥克風(fēng)簡檔;心形定向麥克風(fēng)簡檔;高心形定向麥克風(fēng)簡檔;超心形定向麥克風(fēng)簡檔;短槍式定向麥克風(fēng)簡檔;8字型/中側(cè)定向麥克風(fēng)簡檔;以及邊界式定向麥克風(fēng)簡檔。
68、與該多聲道音頻信號相關(guān)聯(lián)的至少一個參數(shù)字段可以包括被配置為標(biāo)識與該特定麥克風(fēng)簡檔相關(guān)聯(lián)的特性的至少一個第三字段。
69、與該特定麥克風(fēng)簡檔相關(guān)聯(lián)的該特性可以包括以下至少之一:該麥克風(fēng)陣列的至少兩個麥克風(fēng)之間的距離;以及該麥克風(fēng)陣列中的該至少一個麥克風(fēng)的方向。
70、當(dāng)該特定類型的音頻信號是雙耳音頻信號時,與該特定類型的音頻信號相關(guān)聯(lián)的該特性可以包括標(biāo)識頭部相關(guān)傳遞函數(shù)。
71、與該多聲道音頻信號相關(guān)聯(lián)的至少一個參數(shù)字段可以包括被配置為標(biāo)識與該頭部相關(guān)傳遞函數(shù)相關(guān)聯(lián)的方向的至少一個第三字段。
72、當(dāng)該特定類型的音頻信號是空間處理的音頻信號時,與該特定類型的音頻信號相關(guān)聯(lián)的該特性可以包括標(biāo)識處理變量以協(xié)助該渲染的參數(shù)。
73、標(biāo)識處理變量以協(xié)助該渲染的該參數(shù)可以包括以下至少之一:應(yīng)用于至少兩個捕獲的音頻信號以形成該多聲道音頻信號的波束成形;應(yīng)用于至少兩個捕獲的音頻信號以形成該多聲道音頻信號的處理變量;標(biāo)識可用于由該解碼器從中選擇的可能的音頻渲染信號處理變量的指示符;左-右側(cè)聚焦;前-后聚焦;噪聲抑制-殘留噪聲信號;目標(biāo)跟蹤-剩余信號;主-殘留信號;源1-源2信號;以及波束1-波束2信號。
74、與該多聲道音頻信號相關(guān)聯(lián)的至少一個參數(shù)字段可以包括被配置為標(biāo)識與該處理變量相關(guān)聯(lián)的聚焦量的至少一個第三字段。
75、當(dāng)該特定類型的音頻信號是全景聲音頻信號時,與該特定類型的音頻信號相關(guān)聯(lián)的該特性可以包括標(biāo)識該全景聲音頻信號的格式。
76、標(biāo)識該全景聲音頻信號的格式的該參數(shù)可以包括以下至少之一:a-格式標(biāo)識符;b-格式標(biāo)識符;四象限標(biāo)識符;以及頭部傳遞函數(shù)標(biāo)識符。
77、該至少一個參數(shù)字段可以包括被配置為標(biāo)識與該全景聲音頻信號相關(guān)聯(lián)的歸一化的至少一個第三字段,其中該歸一化包括以下至少之一:b-格式歸一化;sn3d歸一化;sn2d歸一化;maxn歸一化;n3d歸一化;以及n2d/sn2d歸一化。
78、該裝置可以進(jìn)一步被致使接收用戶輸入,其中被致使基于該至少一個空間音頻參數(shù)和與該多聲道音頻信號相關(guān)聯(lián)的至少一個參數(shù)字段來處理該多聲道音頻信號以協(xié)助渲染該多聲道音頻信號的該裝置可以進(jìn)一步基于該用戶輸入。
79、被致使基于該至少一個空間音頻參數(shù)和與該多聲道音頻信號相關(guān)聯(lián)的至少一個參數(shù)字段來處理該多聲道音頻信號以協(xié)助渲染該多聲道音頻信號的該裝置可以進(jìn)一步被致使在沒有用戶輸入的情況下將該至少一個參數(shù)字段定義為確定的默認(rèn)值。
80、根據(jù)第五方面,提供了一種方法,該方法包括:定義與輸入多聲道音頻信號相關(guān)聯(lián)的至少一個參數(shù)字段,該至少一個參數(shù)字段被配置為描述該多聲道音頻信號的至少一個特性;確定與該多聲道音頻信號相關(guān)聯(lián)的至少一個空間音頻參數(shù);以及通過至少使用該多聲道音頻信號的該至少一個特性和該至少一個空間音頻參數(shù)處理該輸入多聲道音頻信號,來控制該多聲道音頻信號的渲染。
81、定義與該多聲道音頻信號相關(guān)聯(lián)的至少一個參數(shù)字段,被配置為描述該多聲道音頻信號的特性的該至少一個參數(shù)字段可以包括被配置為將該多聲道音頻信號標(biāo)識為特定類型的音頻信號的至少一個第一字段。
82、該特定類型的音頻信號可以包括以下至少之一:麥克風(fēng)捕獲的多聲道音頻信號;雙耳音頻信號;信號處理的音頻信號;增強(qiáng)信號處理的音頻信號;噪聲抑制的信號處理的音頻信號;源分離的信號處理的音頻信號;跟蹤源信號處理的音頻信號;空間處理的音頻信號;高級信號處理的音頻信號;以及全景聲音頻信號。
83、定義與該多聲道音頻信號相關(guān)聯(lián)的至少一個參數(shù)字段,被配置為描述該多聲道音頻信號的特性的該至少一個參數(shù)字段可以包括被配置為標(biāo)識與該特定類型的音頻信號相關(guān)聯(lián)的特性的至少一個第二字段。
84、當(dāng)該特定類型的音頻信號是麥克風(fēng)捕獲的多聲道音頻信號時,與該特定類型的音頻信號相關(guān)聯(lián)的該特性可以包括以下之一:標(biāo)識被致使捕獲該麥克風(fēng)捕獲的多聲道音頻信號的麥克風(fēng)陣列中的至少一個麥克風(fēng)的麥克風(fēng)簡檔;標(biāo)識被致使捕獲該麥克風(fēng)捕獲的多聲道音頻信號的該麥克風(fēng)陣列的配置;以及標(biāo)識被致使捕獲該麥克風(fēng)捕獲的多聲道音頻信號的該麥克風(fēng)陣列內(nèi)的至少兩個麥克風(fēng)的位置和/或布置。
85、被致使捕獲該麥克風(fēng)捕獲的多聲道音頻信號的至少一個麥克風(fēng)的麥克風(fēng)簡檔可以包括以下至少之一:全向麥克風(fēng)簡檔;亞心形定向麥克風(fēng)簡檔;心形定向麥克風(fēng)簡檔;高心形定向麥克風(fēng)簡檔;超心形定向麥克風(fēng)簡檔;短槍式定向麥克風(fēng)簡檔;8字型/中側(cè)定向麥克風(fēng)簡檔;以及邊界式定向麥克風(fēng)簡檔。
86、定義與該多聲道音頻信號相關(guān)聯(lián)的至少一個參數(shù)字段,被配置為描述該多聲道音頻信號的特性的該至少一個參數(shù)字段可以包括被配置為標(biāo)識與該特定麥克風(fēng)簡檔相關(guān)聯(lián)的特性的至少一個第三字段。
87、與該特定麥克風(fēng)簡檔相關(guān)聯(lián)的該特性可以包括以下至少之一:該麥克風(fēng)陣列的至少兩個麥克風(fēng)之間的距離;以及該麥克風(fēng)陣列中的該至少一個麥克風(fēng)的方向。
88、當(dāng)該特定類型的音頻信號是雙耳音頻信號時,與該特定類型的音頻信號相關(guān)聯(lián)的該特性可以包括標(biāo)識頭部相關(guān)傳遞函數(shù)。
89、定義與該多聲道音頻信號相關(guān)聯(lián)的至少一個參數(shù)字段,被配置為描述該多聲道音頻信號的特性的該至少一個參數(shù)字段可以包括被配置為標(biāo)識與該頭部相關(guān)傳遞函數(shù)相關(guān)聯(lián)的方向的至少一個第三字段。
90、當(dāng)該特定類型的音頻信號是空間處理的音頻信號時,與該特定類型的音頻信號相關(guān)聯(lián)的該特性可以包括標(biāo)識用于標(biāo)識處理變量以協(xié)助該渲染的參數(shù)。
91、標(biāo)識處理變量以協(xié)助該渲染的該參數(shù)可以包括以下至少之一:應(yīng)用于至少兩個捕獲的音頻信號以形成該多聲道音頻信號的波束成形;應(yīng)用于至少兩個捕獲的音頻信號以形成該多聲道音頻信號的處理變量;標(biāo)識可用于由該解碼器從中選擇的可能的音頻渲染信號處理變量的指示符;左-右側(cè)聚焦;前-后聚焦;噪聲抑制-殘留噪聲信號;目標(biāo)跟蹤-剩余信號;主-殘留信號;源1-源2信號;以及波束1-波束2信號。
92、定義與該多聲道音頻信號相關(guān)聯(lián)的至少一個參數(shù)字段,被配置為描述該多聲道音頻信號的特性的該至少一個參數(shù)字段可以包括被配置為標(biāo)識與該處理變量相關(guān)聯(lián)的聚焦量的至少一個第三字段。
93、當(dāng)該特定類型的音頻信號是全景聲音頻信號時,與該特定類型的音頻信號相關(guān)聯(lián)的該特性可以包括標(biāo)識該全景聲音頻信號的格式。
94、標(biāo)識該全景聲音頻信號的格式的該參數(shù)可以包括以下至少之一:a-格式標(biāo)識符;b-格式標(biāo)識符;四象限標(biāo)識符;以及頭部傳遞函數(shù)標(biāo)識符。
95、定義與該多聲道音頻信號相關(guān)聯(lián)的至少一個參數(shù)字段,被配置為描述該多聲道音頻信號的特性的該至少一個參數(shù)字段可以包括被配置為標(biāo)識與該全景聲音頻信號相關(guān)聯(lián)的歸一化的至少一個第三字段,其中該歸一化包括以下至少之一:b-格式歸一化;sn3d歸一化;sn2d歸一化;maxn歸一化;n3d歸一化;以及n2d/sn2d歸一化。
96、該方法可以進(jìn)一步包括:將與輸入多聲道音頻信號相關(guān)聯(lián)的該至少一個參數(shù)字段發(fā)送給渲染器以渲染該多聲道音頻信號。
97、該方法可以進(jìn)一步包括接收用戶輸入,其中定義與輸入多聲道音頻信號相關(guān)聯(lián)的至少一個參數(shù)字段可以基于該用戶輸入。
98、定義與輸入多聲道音頻信號相關(guān)聯(lián)的至少一個參數(shù)字段可以基于該用戶輸入,進(jìn)一步用于在沒有用戶輸入的情況下將該至少一個參數(shù)字段定義為確定的默認(rèn)值。
99、該至少一個空間音頻參數(shù)可以包括該多聲道音頻信號的至少兩個頻帶的方向和能量比。
100、根據(jù)第六方面,提供了一種方法,包括:接收與多聲道音頻信號相關(guān)聯(lián)的至少一個參數(shù)字段,該至少一個參數(shù)字段被配置為描述該多聲道音頻信號的特性;接收至少一個空間音頻參數(shù);確定該多聲道音頻信號;以及基于該至少一個空間音頻參數(shù)和與該多聲道音頻信號相關(guān)聯(lián)的至少一個參數(shù)字段,處理該多聲道音頻信號,以協(xié)助渲染該多聲道音頻信號。
101、與該多聲道音頻信號相關(guān)聯(lián)的該至少一個參數(shù)字段可以包括被配置為將該多聲道音頻信號標(biāo)識為特定類型的音頻信號的至少一個第一字段。
102、該特定類型的音頻信號可以包括以下至少之一:麥克風(fēng)捕獲的多聲道音頻信號;雙耳音頻信號;信號處理的音頻信號;增強(qiáng)信號處理的音頻信號;噪聲抑制的信號處理的音頻信號;源分離的信號處理的音頻信號;跟蹤源信號處理的音頻信號;高級信號處理的音頻信號;空間處理的音頻信號;以及全景聲音頻信號。
103、與該多聲道音頻信號相關(guān)聯(lián)的至少一個參數(shù)字段可以包括被配置為標(biāo)識與該特定類型的音頻信號相關(guān)聯(lián)的特性的至少一個第二字段。
104、當(dāng)該特定類型的音頻信號是麥克風(fēng)捕獲的多聲道音頻信號時,與該特定類型的音頻信號相關(guān)聯(lián)的該特性可以包括以下之一:標(biāo)識被致使捕獲該麥克風(fēng)捕獲的多聲道音頻信號的麥克風(fēng)陣列中的至少一個麥克風(fēng)的麥克風(fēng)簡檔;標(biāo)識被致使捕獲該麥克風(fēng)捕獲的多聲道音頻信號的該麥克風(fēng)陣列的配置;以及標(biāo)識被致使捕獲該麥克風(fēng)捕獲的多聲道音頻信號的該麥克風(fēng)陣列內(nèi)的至少兩個麥克風(fēng)的位置和/或布置。
105、被致使捕獲該麥克風(fēng)捕獲的多聲道音頻信號的至少一個麥克風(fēng)的麥克風(fēng)簡檔可以包括以下至少之一:全向麥克風(fēng)簡檔;亞心形定向麥克風(fēng)簡檔;心形定向麥克風(fēng)簡檔;高心形定向麥克風(fēng)簡檔;超心形定向麥克風(fēng)簡檔;彈槍定向麥克風(fēng)簡檔;8字型/中側(cè)定向麥克風(fēng)簡檔;以及邊界式定向麥克風(fēng)簡檔。
106、與該多聲道音頻信號相關(guān)聯(lián)的至少一個參數(shù)字段可以包括被配置為標(biāo)識與該特定麥克風(fēng)簡檔相關(guān)聯(lián)的特性的至少一個第三字段。
107、與該特定麥克風(fēng)簡檔相關(guān)聯(lián)的該特性可以包括以下至少之一:該麥克風(fēng)陣列的至少兩個麥克風(fēng)之間的距離;以及該麥克風(fēng)陣列中的該至少一個麥克風(fēng)的方向。
108、當(dāng)該特定類型的音頻信號是雙耳音頻信號時,與該特定類型的音頻信號相關(guān)聯(lián)的該特性可以包括標(biāo)識頭部相關(guān)傳遞函數(shù)。
109、與該多聲道音頻信號相關(guān)聯(lián)的至少一個參數(shù)字段可以包括被配置為標(biāo)識與該頭部相關(guān)傳遞函數(shù)相關(guān)聯(lián)的方向的至少一個第三字段。
110、當(dāng)該特定類型的音頻信號是空間處理的音頻信號時,與該特定類型的音頻信號相關(guān)聯(lián)的該特性可以包括標(biāo)識處理變量以協(xié)助該渲染的參數(shù)。
111、標(biāo)識處理變量以協(xié)助該渲染的該參數(shù)可以包括以下至少之一:應(yīng)用于至少兩個捕獲的音頻信號以形成該多聲道音頻信號的波束成形;應(yīng)用于至少兩個捕獲的音頻信號以形成該多聲道音頻信號的處理變量;標(biāo)識可用于由該解碼器從中選擇的可能的音頻渲染信號處理變量的指示符;左-右側(cè)聚焦;前-后聚焦;噪聲抑制-殘留噪聲信號;目標(biāo)跟蹤-剩余信號;主-殘留信號;源1-源2信號;以及波束1-波束2信號。
112、與該多聲道音頻信號相關(guān)聯(lián)的至少一個參數(shù)字段可以包括被配置為標(biāo)識與該處理變量相關(guān)聯(lián)的聚焦量的至少一個第三字段。
113、當(dāng)該特定類型的音頻信號是全景聲音頻信號時,與該特定類型的音頻信號相關(guān)聯(lián)的該特性可以包括該全景聲音頻信號的格式。
114、標(biāo)識該全景聲音頻信號的格式的該參數(shù)可以包括以下至少之一:a-格式標(biāo)識符;b-格式標(biāo)識符;四象限標(biāo)識符;以及頭部傳遞函數(shù)標(biāo)識符。
115、該至少一個參數(shù)字段可以包括被配置為標(biāo)識與該全景聲音頻信號相關(guān)聯(lián)的歸一化的至少一個第三字段,其中該歸一化包括以下至少之一:b-格式歸一化;sn3d歸一化;sn2d歸一化;maxn歸一化;n3d歸一化;以及n2d/sn2d歸一化。
116、該方法可以進(jìn)一步包括:接收用戶輸入,其中基于該至少一個空間音頻參數(shù)和與該多聲道音頻信號相關(guān)聯(lián)的至少一個參數(shù)字段來處理該多聲道音頻信號以協(xié)助渲染該多聲道音頻信號可以進(jìn)一步基于該用戶輸入。
117、基于該至少一個空間音頻參數(shù)和與該多聲道音頻信號相關(guān)聯(lián)的至少一個參數(shù)字段來處理該多聲道音頻信號以協(xié)助渲染該多聲道音頻信號還可以用于在沒有用戶輸入的情況下將該至少一個參數(shù)字段定義為確定的默認(rèn)值。
118、根據(jù)第七方面,提供了一種包括指令的計(jì)算機(jī)程序[或包括程序指令的計(jì)算機(jī)可讀介質(zhì)],該指令用于使裝置至少執(zhí)行以下操作:定義與輸入多聲道音頻信號相關(guān)聯(lián)的至少一個參數(shù)字段,該至少一個參數(shù)字段被配置為描述該多聲道音頻信號的至少一個特性;確定與該多聲道音頻信號相關(guān)聯(lián)的至少一個空間音頻參數(shù);以及通過至少使用該多聲道音頻信號的該至少一個特性和該至少一個空間音頻參數(shù)處理該輸入多聲道音頻信號,來控制該多聲道音頻信號的渲染。
119、根據(jù)第八方面,提供了一種包括的指令計(jì)算機(jī)程序[或包括程序指令的計(jì)算機(jī)可讀介質(zhì)],該指令用于使裝置至少執(zhí)行以下操作:接收與多聲道音頻信號相關(guān)聯(lián)的至少一個參數(shù)字段,該至少一個參數(shù)字段被配置為描述該多聲道音頻信號的特性;接收至少一個空間音頻參數(shù);確定該多聲道音頻信號;以及基于該至少一個空間音頻參數(shù)和與該多聲道音頻信號相關(guān)聯(lián)的至少一個參數(shù)字段,處理該多聲道音頻信號,以協(xié)助渲染該多聲道音頻信號。
120、根據(jù)第九方面,提供了一種非暫時性計(jì)算機(jī)可讀介質(zhì),包括用于使裝置執(zhí)行至少以下操作的程序指令:定義與輸入多聲道音頻信號相關(guān)聯(lián)的至少一個參數(shù)字段,該至少一個參數(shù)字段被配置為描述該多聲道音頻信號的至少一個特性;確定與該多聲道音頻信號相關(guān)聯(lián)的至少一個空間音頻參數(shù);以及通過至少使用該多聲道音頻信號的該至少一個特性和該至少一個空間音頻參數(shù)處理該輸入多聲道音頻信號,來控制該多聲道音頻信號的渲染。
121、根據(jù)第十方面,提供了一種非暫時性計(jì)算機(jī)可讀介質(zhì),包括用于使裝置執(zhí)行至少以下操作的程序指令:接收與多聲道音頻信號相關(guān)聯(lián)的至少一個參數(shù)字段,該至少一個參數(shù)字段被配置為描述該多聲道音頻信號的特性;接收至少一個空間音頻參數(shù);確定該多聲道音頻信號;以及基于該至少一個空間音頻參數(shù)和與該多聲道音頻信號相關(guān)聯(lián)的至少一個參數(shù)字段,處理該多聲道音頻信號,以協(xié)助渲染該多聲道音頻信號。
122、根據(jù)第十一方面,提供了一種裝置,包括:定義電路,其被配置為定義與輸入多聲道音頻信號相關(guān)聯(lián)的至少一個參數(shù)字段,該至少一個參數(shù)字段被配置為描述該多聲道音頻信號的至少一個特性;確定電路,其被配置為確定與該多聲道音頻信號相關(guān)聯(lián)的至少一個空間音頻參數(shù);以及控制電路,其被配置為通過至少使用該多聲道音頻信號的該至少一個特性和該至少一個空間音頻參數(shù)處理該輸入多聲道音頻信號,來控制該多聲道音頻信號的渲染。
123、根據(jù)第十二方面,提供了一種裝置,包括:接收電路,其被配置為接收與多聲道音頻信號相關(guān)聯(lián)的至少一個參數(shù)字段,該至少一個參數(shù)字段被配置為描述該多聲道音頻信號的特性;接收電路,其被配置為接收至少一個空間音頻參數(shù);確定電路,其被配置為確定該多聲道音頻信號;以及處理電路,其被配置為基于該至少一個空間音頻參數(shù)和與該多聲道音頻信號相關(guān)聯(lián)的至少一個參數(shù)字段,處理該多聲道音頻信號,以協(xié)助渲染該多聲道音頻信號。
124、根據(jù)第十三方面,提供了一種計(jì)算機(jī)可讀介質(zhì),其包括用于使裝置執(zhí)行至少以下操作的程序指令:定義與輸入多聲道音頻信號相關(guān)聯(lián)的至少一個參數(shù)字段,該至少一個參數(shù)字段被配置為描述該多聲道音頻信號的至少一個特性;確定與該多聲道音頻信號相關(guān)聯(lián)的至少一個空間音頻參數(shù);以及通過至少使用該多聲道音頻信號的該至少一個特性和該至少一個空間音頻參數(shù)處理該輸入多聲道音頻信號,來控制該多聲道音頻信號的渲染。
125、根據(jù)第十四方面,提供了一種計(jì)算機(jī)可讀介質(zhì),其包括用于使裝置執(zhí)行至少以下操作的程序指令:接收與多聲道音頻信號相關(guān)聯(lián)的至少一個參數(shù)字段,該至少一個參數(shù)字段被配置為描述該多聲道音頻信號的特性;接收至少一個空間音頻參數(shù);確定該多聲道音頻信號;以及基于該至少一個空間音頻參數(shù)和與該多聲道音頻信號相關(guān)聯(lián)的至少一個參數(shù)字段,處理該多聲道音頻信號,以協(xié)助渲染該多聲道音頻信號。
126、一種裝置,包括用于執(zhí)行如上所述的方法的動作的模塊。
127、一種被配置為執(zhí)行如上所述的方法的動作的裝置。
128、一種計(jì)算機(jī)程序,包括用于使計(jì)算機(jī)執(zhí)行如上所述的方法的程序指令。
129、一種存儲在介質(zhì)上的計(jì)算機(jī)程序產(chǎn)品可以使裝置執(zhí)行本文所述的方法。
130、一種電子設(shè)備可以包括如本文所述的裝置。
131、一種芯片組可以包括如本文所述的裝置。
132、本技術(shù)的實(shí)施例旨在解決與現(xiàn)有技術(shù)相關(guān)的問題。