本發(fā)明涉及一種用于對(duì)聲場(chǎng)的高階高保真立體聲hoa信號(hào)表示進(jìn)行低位速率壓縮的方法和裝置,其中,hoa信號(hào)表示由于該低位速率而是空間稀疏的。
背景技術(shù):
除了像波場(chǎng)合成(wfs)的其他技術(shù)或者像22.2的基于聲道的方法之外,高階高保真立體聲(hoa)提供表示三維聲音的一種可能性。但是,與基于聲道的方法相反,hoa表示提供獨(dú)立于特定擴(kuò)音器設(shè)置的優(yōu)點(diǎn)。但是該靈活性是以在特定擴(kuò)音器設(shè)置上回放hoa表示所需的解碼過(guò)程為代價(jià)的。與所需擴(kuò)音器數(shù)量通常非常大的wfs方法相比,hoa還可以被渲染到僅包括幾個(gè)擴(kuò)音器的設(shè)置。hoa的另外的優(yōu)點(diǎn)是相同的表示還可以在不做任何修改的情況下被用于對(duì)耳機(jī)的雙耳渲染。
hoa是基于復(fù)諧平面波幅度的空間密度的通過(guò)截?cái)嗲蛑C函數(shù)(sh)展開(kāi)的表示的。每個(gè)展開(kāi)系數(shù)是角頻率的函數(shù),其可以用時(shí)域函數(shù)等同地表示。因此,不失一般性地,整個(gè)hoa聲場(chǎng)表示實(shí)際上可以被假定為包括o個(gè)時(shí)域函數(shù),其中,o表示展開(kāi)系數(shù)的數(shù)量。在下面,這些時(shí)域函數(shù)將被等同地稱為hoa系數(shù)序列或hoa聲道。
hoa表示的空間分辨率隨著展開(kāi)的最大階次n增長(zhǎng)而改進(jìn)。不幸的是,展開(kāi)系數(shù)數(shù)量o隨著階次n二次方地增長(zhǎng),具體地說(shuō),o=(n+1)2。例如,使用階次n=4的典型的hoa表示需要o=25個(gè)hoa(展開(kāi))系數(shù)。根據(jù)前面的考慮,給定期望的單聲道采樣速率fs和每采樣的位數(shù)nb,用于發(fā)送hoa表示的總位速率由o·fs·nb確定。結(jié)果,通過(guò)采用每采樣nb=16位、以fs=48khz的采樣速率發(fā)送階次n=4的hoa表示,得到19.2mbits/s的位速率,該位速率對(duì)于許多實(shí)際應(yīng)用(例如流傳輸)是非常高的。因而,hoa表示的壓縮是非常期望的。
hoa聲場(chǎng)表示的壓縮在ep2665208a1、ep2743922a1和國(guó)際申請(qǐng)pct/ep2013/059363(參看2014年7月的iso/iecdis23008-3,mpeg-h3daudio)中被提出。這些方法的共同之處在于,它們進(jìn)行聲場(chǎng)分析,并且將給定的hoa表示分解為定向分量和殘余環(huán)境分量。最終的壓縮表示一方面被假定為包括若干個(gè)量化信號(hào),這些量化信號(hào)是從定向信號(hào)和基于矢量的信號(hào)以及環(huán)境hoa分量的相關(guān)系數(shù)序列的感知編碼得出的。另一方面,最終的壓縮表示被假定為包括與量化信號(hào)相關(guān)的附加輔助信息,該輔助信息對(duì)于從hoa表示的壓縮版本重構(gòu)hoa表示是必需的。對(duì)于ep2665208a1、ep2743922a1和國(guó)際申請(qǐng)pct/ep2013/059363中的方法,量化信號(hào)的合理的最少數(shù)量為“8”個(gè)。因此,假定對(duì)于每個(gè)單獨(dú)的感知編碼器,數(shù)據(jù)速率為32kbit/s,則這些方法中的一個(gè)的數(shù)據(jù)速率通常不低于256kbit/s。對(duì)于某些應(yīng)用,例如對(duì)于移動(dòng)裝置的音頻流傳輸,該總數(shù)據(jù)速率可能太高,這使得期望以明顯降低的數(shù)據(jù)速率(例如,128kbit/s)的hoa壓縮方法。
在歐洲專利申請(qǐng)ep14306077.0中,描述了一種用于對(duì)聲場(chǎng)的hoa表示進(jìn)行低位速率壓縮的方法,該方法使用較少數(shù)量的量化信號(hào),這些量化信號(hào)基本上是原始hoa表示的小子集。為了復(fù)制丟失的hoa系數(shù),獲得用于不同頻帶的預(yù)測(cè)參數(shù)以便從量化信號(hào)預(yù)測(cè)附加的定向hoa分量。
技術(shù)實(shí)現(xiàn)要素:
在ep14306077.0處理中,重構(gòu)的hoa表示由高度相關(guān)的分量組成,因?yàn)樗械膆oa分量都是僅從少量量化信號(hào)重構(gòu)的。由于這樣的少量量化信號(hào),其定向hoa分量的預(yù)測(cè)可能并不令人滿意,并且可以導(dǎo)致重構(gòu)hoa表示在空間上稀疏的效果。這可以使聲音干(dry)并且比原始hoa表示中的聲音更安靜。如果量化信號(hào)的數(shù)量非常少,例如,“1”個(gè)或“2”個(gè),則通常由空間上不相關(guān)的信號(hào)分量組成的環(huán)境聲場(chǎng)不能被適當(dāng)?shù)刂貥?gòu)。
本發(fā)明要解決的問(wèn)題是改進(jìn)聲場(chǎng)的hoa表示的低位速率壓縮。該問(wèn)題通過(guò)權(quán)利要求1和8中所公開(kāi)的方法來(lái)解決。利用這些方法的裝置在權(quán)利要求2和9中公開(kāi)。
本發(fā)明的有利的另外的實(shí)施例在相應(yīng)的從屬權(quán)利要求中公開(kāi)。
下面描述的處理對(duì)高階高保真立體聲表示的低位速率壓縮進(jìn)行處理,并且重新創(chuàng)建環(huán)境聲場(chǎng)分量,并且在量化信號(hào)的數(shù)量非常少的情況下,它改進(jìn)了上述ep14306077.0處理。
所描述的處理被稱為參數(shù)化環(huán)境復(fù)制(par),并且它用可能丟失的環(huán)境分量來(lái)補(bǔ)充重構(gòu)的空間稀疏的hoa表示,所述可能丟失的環(huán)境分量是從其本身參數(shù)化復(fù)制的。復(fù)制是通過(guò)以下操作來(lái)進(jìn)行的:首先從稀疏hoa表示(其可以包括定向信號(hào)和環(huán)境分量)的信號(hào)創(chuàng)建具有修改的相位譜、因而與先前的信號(hào)不相關(guān)的若干個(gè)新信號(hào)。第二,將新創(chuàng)建的信號(hào)彼此混合,以便提供復(fù)制的環(huán)境hoa分量。通過(guò)疊加原始稀疏hoa表示和復(fù)制的環(huán)境hoa分量來(lái)計(jì)算最終的增強(qiáng)的hoa表示。執(zhí)行混合以便使最終的增強(qiáng)的hoa表示的空間聲學(xué)性質(zhì)與原始hoa表示的空間聲學(xué)性質(zhì)匹配。優(yōu)選地,在頻域中進(jìn)行混合,從而提供在不同頻帶之間變化的可能性。假設(shè)從稀疏hoa表示創(chuàng)建不相關(guān)的信號(hào)的過(guò)程被確定性地指定,將被包括到壓縮hoa表示中的用于par的輔助信息僅由混合參數(shù)組成,該混合參數(shù)本質(zhì)上是復(fù)值的混合矩陣。
用于以減少用于par的輔助信息的量為目標(biāo)從稀疏hoa表示創(chuàng)建不相關(guān)的信號(hào)的一種特定方法是首先用來(lái)自在單位球體上應(yīng)盡可能均勻地分布的一些預(yù)測(cè)方向的虛擬擴(kuò)音器信號(hào)(或等同地用一般的平面波函數(shù))來(lái)表示稀疏hoa表示。在下面,用于從hoa表示創(chuàng)建虛擬擴(kuò)音器信號(hào)的渲染被稱為空間變換。第二,對(duì)于這些方向中的每個(gè),通過(guò)使用去相關(guān)濾波器對(duì)稀疏hoa表示的對(duì)應(yīng)的虛擬擴(kuò)音器信號(hào)的相位譜進(jìn)行修改來(lái)創(chuàng)建一個(gè)不相關(guān)的信號(hào)。第三,還用用于相同方向的虛擬擴(kuò)音器信號(hào)來(lái)表示復(fù)制的環(huán)境hoa表示,其中,用于某個(gè)方向的每個(gè)虛擬擴(kuò)音器信號(hào)僅由為該特定方向的鄰域的預(yù)定義方向創(chuàng)建的不相關(guān)的信號(hào)被混合得到。僅由少量不相關(guān)的信號(hào)混合得到提供創(chuàng)建一個(gè)不相關(guān)的信號(hào)的混合系數(shù)的數(shù)量可以保持很少、用于par的輔助信息的量也可以保持很少的優(yōu)點(diǎn)。另一個(gè)優(yōu)點(diǎn)是,對(duì)于復(fù)制的環(huán)境hoa分量的單個(gè)的虛擬擴(kuò)音器信號(hào)的混合,只有來(lái)自空間鄰域的、因此具有類似的幅度譜的信號(hào)被考慮。該操作防止了稀疏hoa表示的定向分量不期望地在所有方向上空間分布。對(duì)于該方法,假定去相關(guān)濾波器是成對(duì)地不同的,并且它們的數(shù)量等于虛擬擴(kuò)音器方向的數(shù)量。許多這樣的去相關(guān)濾波器的實(shí)際構(gòu)造通常使每個(gè)單獨(dú)的濾波器僅具有有限的去相關(guān)效果。對(duì)于虛擬方向(或等同地空間位置)的去相關(guān)濾波器分配應(yīng)合理地選擇,以便最小化將被混合以用于創(chuàng)建復(fù)制的環(huán)境hoa分量的單個(gè)虛擬擴(kuò)音器信號(hào)的信號(hào)之間的互相關(guān)性。
允許虛擬擴(kuò)音器方向的數(shù)量對(duì)于各個(gè)頻帶改變,并且可以用于指定復(fù)制的環(huán)境hoa分量的頻率相關(guān)階次。
從稀疏hoa表示創(chuàng)建不相關(guān)的信號(hào)的方法的進(jìn)一步擴(kuò)展是,考慮將具有隨時(shí)間變化的數(shù)量的不相關(guān)的信號(hào)用于復(fù)制的環(huán)境hoa分量的虛擬擴(kuò)音器信號(hào)的混合。要被混合的不相關(guān)的信號(hào)的數(shù)量依賴于稀疏hoa表示中的丟失環(huán)境的量。該變化通常將導(dǎo)致對(duì)于虛擬擴(kuò)音器位置的去相關(guān)濾波器分配變化。為了避免由于時(shí)間分配改變而導(dǎo)致去相關(guān)信號(hào)不連續(xù),可以通過(guò)將稀疏hoa表示的虛擬擴(kuò)音器信號(hào)等同地分配給去相關(guān)濾波器來(lái)交換去相關(guān)濾波器對(duì)于虛擬擴(kuò)音器信號(hào)的分配。該分配可以用簡(jiǎn)單的置換矩陣表達(dá)。在分配改變的情況下,可以通過(guò)由兩個(gè)不同的分配引起的信號(hào)之間的重疊相加(overlap-add)來(lái)計(jì)算每個(gè)去相關(guān)濾波器的輸入。因此,每個(gè)去相關(guān)濾波器的輸入和輸出是連續(xù)的。隨后,必須使分配倒轉(zhuǎn)以便將每個(gè)去相關(guān)濾波器的輸出重新分配給每個(gè)虛擬擴(kuò)音器方向。
在多聲道音頻的上下文下,創(chuàng)建環(huán)境聲音分量的問(wèn)題在以下文獻(xiàn)中被解決:2006年6月
但是,本申請(qǐng)描述了用于在hoa表示的上下文下創(chuàng)建環(huán)境的處理。
原理上,本發(fā)明的壓縮改進(jìn)方法適于改進(jìn)聲場(chǎng)的低位速率壓縮和解壓縮的高階高保真立體聲hoa信號(hào)表示,以便提供參數(shù)化環(huán)境復(fù)制參數(shù)集,其中,所述解壓縮提供空間稀疏的解碼的hoa表示和該表示的系數(shù)序列的索引集,所述方法包括:
-將所述空間稀疏的解碼的hoa表示變換為若干個(gè)復(fù)值的頻域子帶表示,并且使用分析濾波器組將所述hoa信號(hào)表示的對(duì)應(yīng)延遲版本變換為對(duì)應(yīng)數(shù)量的復(fù)值的頻域子帶表示;
-將所述子帶分組為若干個(gè)子帶組,并且在這些子帶組中的每個(gè)子帶組內(nèi):
-對(duì)于來(lái)自所述復(fù)值的頻域子帶表示的子帶組中的每個(gè)子帶,使用去相關(guān)濾波器創(chuàng)建與所述復(fù)值的頻域子帶表示不相關(guān)的若干個(gè)經(jīng)修改的相位譜信號(hào);
-對(duì)于來(lái)自所述經(jīng)修改的相位譜信號(hào)的子帶組中的每個(gè)子帶,計(jì)算去相關(guān)協(xié)方差矩陣;
-對(duì)于子帶組中的每個(gè)子帶,將所述復(fù)值的頻域子帶表示變換為它的空域表示,并且從該空域表示計(jì)算對(duì)應(yīng)的協(xié)方差矩陣;
-對(duì)于子帶組中的每個(gè)子帶,將用于所述hoa信號(hào)表示的復(fù)值的頻域子帶表示變換為它的空域表示,并且從該空域表示計(jì)算對(duì)應(yīng)的協(xié)方差矩陣,
對(duì)于每個(gè)子帶組:
-對(duì)于子帶組的所有子帶,組合所述去相關(guān)協(xié)方差矩陣以便提供子帶組去相關(guān)協(xié)方差矩陣
-對(duì)于子帶組的所有子帶,組合用于所述復(fù)值的頻域子帶表示的所述空域表示的協(xié)方差矩陣以便提供子帶組協(xié)方差矩陣
-對(duì)于子帶組的所有子帶,組合用于所述hoa信號(hào)表示的所述復(fù)值的頻域子帶表示的所述空域表示的協(xié)方差矩陣以便提供子帶組協(xié)方差矩陣
-形成組合協(xié)方差矩陣
-使用矩陣
-對(duì)所述混合矩陣進(jìn)行編碼以便提供用于子帶組的參數(shù)集;
-對(duì)用于所述子帶組的所述參數(shù)集以及編碼的子帶配置數(shù)據(jù)和參數(shù)化環(huán)境復(fù)制編碼參數(shù)進(jìn)行復(fù)用以便提供參數(shù)化環(huán)境復(fù)制參數(shù)集。
原理上,本發(fā)明的壓縮改進(jìn)裝置適于改進(jìn)聲場(chǎng)的低位速率壓縮和解壓縮的高階高保真立體聲hoa信號(hào)表示,以便提供參數(shù)化環(huán)境復(fù)制參數(shù)集,其中,所述解壓縮提供空間稀疏的解碼的hoa表示和該表示的系數(shù)序列的索引集,所述裝置包括適于執(zhí)行以下操作的部件:
-將所述空間稀疏的解碼的hoa表示變換為若干個(gè)復(fù)值的頻域子帶表示,并且使用分析濾波器組將所述hoa信號(hào)表示的對(duì)應(yīng)延遲版本變換為對(duì)應(yīng)數(shù)量的復(fù)值的頻域子帶表示;
-將所述子帶分組為若干個(gè)子帶組,并且在這些子帶組中的每個(gè)子帶組內(nèi):
-對(duì)于來(lái)自所述復(fù)值的頻域子帶表示的子帶組中的每個(gè)子帶,使用去相關(guān)濾波器創(chuàng)建與所述復(fù)值的頻域子帶表示不相關(guān)的若干個(gè)經(jīng)修改的相位譜信號(hào);
-對(duì)于來(lái)自所述經(jīng)修改的相位譜信號(hào)的子帶組中的每個(gè)子帶,計(jì)算去相關(guān)協(xié)方差矩陣;
-對(duì)于子帶組中的每個(gè)子帶,將所述復(fù)值的頻域子帶表示變換為它的空域表示,并且從該空域表示計(jì)算對(duì)應(yīng)的協(xié)方差矩陣;
-對(duì)于子帶組中的每個(gè)子帶,將用于所述hoa信號(hào)表示的復(fù)值的頻域子帶表示變換為它的空域表示,并且從該空域表示計(jì)算對(duì)應(yīng)的協(xié)方差矩陣,
對(duì)于每個(gè)子帶組:
-對(duì)于子帶組的所有子帶,組合所述去相關(guān)協(xié)方差矩陣以便提供子帶組去相關(guān)協(xié)方差矩陣
-對(duì)于子帶組的所有子帶,組合用于所述復(fù)值的頻域子帶表示的所述空域表示的協(xié)方差矩陣以便提供子帶組協(xié)方差矩陣
-對(duì)于子帶組的所有子帶,組合用于所述hoa信號(hào)表示的所述復(fù)值的頻域子帶表示的所述空域表示的協(xié)方差矩陣以便提供子帶組協(xié)方差矩陣
-形成組合的協(xié)方差矩陣
-使用矩陣
-對(duì)所述混合矩陣進(jìn)行編碼以便提供用于子帶組的參數(shù)集;
-對(duì)用于所述子帶組的所述參數(shù)集以及編碼的子帶配置數(shù)據(jù)和參數(shù)化環(huán)境復(fù)制編碼參數(shù)進(jìn)行復(fù)用以便提供參數(shù)化環(huán)境復(fù)制參數(shù)集。
原理上,本發(fā)明的解壓縮改進(jìn)方法適于改進(jìn)空間稀疏的解碼的hoa表示,對(duì)于該表示,該表示的系數(shù)序列的索引集是通過(guò)使用根據(jù)以上壓縮改進(jìn)方法生成的參數(shù)化環(huán)境復(fù)制參數(shù)集進(jìn)行解碼而提供的,所述方法包括:
-從所述空間稀疏的解碼的hoa表示、系數(shù)序列的所述索引集以及所述參數(shù)化環(huán)境復(fù)制參數(shù)集重構(gòu)改進(jìn)的hoa表示,所述重構(gòu)包括:
-從所述參數(shù)化環(huán)境復(fù)制參數(shù)集確定子帶配置;
-將所述空間稀疏的解碼的hoa表示轉(zhuǎn)換為若干個(gè)頻帶hoa表示;
-根據(jù)所述子帶配置,將對(duì)應(yīng)組的頻帶hoa表示與相關(guān)參數(shù)一起分派給創(chuàng)建復(fù)制的環(huán)境hoa表示的去相關(guān)系數(shù)序列的、對(duì)應(yīng)數(shù)量的參數(shù)化環(huán)境復(fù)制子帶解碼器步驟或級(jí);
-將所述復(fù)制的環(huán)境hoa表示的所述系數(shù)序列變換為復(fù)制的時(shí)域hoa表示;
-用所述復(fù)制的時(shí)域hoa表示增強(qiáng)所述空間稀疏的解碼的hoa表示,以便提供增強(qiáng)的解壓縮的hoa表示。
原理上,本發(fā)明的解壓縮改進(jìn)裝置適于改進(jìn)空間稀疏的解碼的hoa表示,對(duì)于該表示,該表示的系數(shù)序列的索引集是通過(guò)使用根據(jù)以上壓縮改進(jìn)方法生成的參數(shù)化環(huán)境復(fù)制參數(shù)集進(jìn)行解碼而提供的,所述裝置包括適于執(zhí)行以下操作的部件:
-從所述空間稀疏的解碼的hoa表示、系數(shù)序列的所述索引集以及所述參數(shù)化環(huán)境復(fù)制參數(shù)集重構(gòu)改進(jìn)的hoa表示,其中,該重構(gòu)包括:
-從所述參數(shù)化環(huán)境復(fù)制參數(shù)集確定子帶配置;
-將所述空間稀疏的解碼的hoa表示轉(zhuǎn)換為若干個(gè)頻帶hoa表示;
-根據(jù)所述子帶配置,將對(duì)應(yīng)組的頻帶hoa表示與相關(guān)參數(shù)一起分派給創(chuàng)建復(fù)制的環(huán)境hoa表示的去相關(guān)系數(shù)序列的、對(duì)應(yīng)數(shù)量的參數(shù)化環(huán)境復(fù)制子帶解碼器步驟或級(jí);
-將所述復(fù)制的環(huán)境hoa表示的所述系數(shù)序列變換為復(fù)制的時(shí)域hoa表示;
-用所述復(fù)制的時(shí)域hoa表示增強(qiáng)所述空間稀疏的解碼的hoa表示,以便提供增強(qiáng)的解壓縮的hoa表示。
附圖說(shuō)明
參考附圖來(lái)描述本發(fā)明的示例性實(shí)施例,附圖示出:
圖1示出包括par編碼器的hoa數(shù)據(jù)編碼器;
圖2更詳細(xì)地示出par編碼器,其中,k′=k-khoa;
圖3示出par子帶編碼器;
圖4示出包括par解碼器的hoa數(shù)據(jù)解壓縮器;
圖5更詳細(xì)地示出par解碼器;
圖6示出par子帶解碼器;
圖7示出球坐標(biāo)系。
具體實(shí)施方式
即使未被明確描述,也可以按任何組合或子組合采用以下實(shí)施例。
hoa編碼器
參數(shù)化環(huán)境復(fù)制(par)處理被用作擴(kuò)展基本的hoa壓縮的附加編碼工具,像圖1所示那樣,在圖1中,采取了對(duì)具有幀索引k的幀的、基于幀的處理。hoa編碼器步驟或級(jí)11將hoa表示c(k)分解為傳輸信號(hào)矩陣z(k-khoa)和hoa輔助信息集γhoa(k-khoa),像ep2665208a1、ep2743922a1、國(guó)際申請(qǐng)pct/ep2013/059363和歐洲專利申請(qǐng)ep14306077.0中所描述的那樣。用于幀索引k的hoa表示矩陣c(k)由o個(gè)行組成,其中,每行保存對(duì)應(yīng)的hoa系數(shù)的l個(gè)時(shí)域采樣,并且它還被饋送到幀延遲步驟或級(jí)14。矩陣z(k-khoa)的行保存c(k)已經(jīng)被包括在其中的傳輸信號(hào)的l個(gè)時(shí)域采樣。在感知音頻編碼器步驟或級(jí)15中將來(lái)自z(k-khoa)的時(shí)域信號(hào)感知編碼為傳輸信號(hào)參數(shù)集γtrans(k-khoa-kenc),該參數(shù)集被饋送到復(fù)用器和幀同步步驟或級(jí)16。在hoa解碼器步驟或級(jí)12中從γhoa(k-khoa)和z(k-khoa)恢復(fù)稀疏的hoa表示的o×l矩陣d(k-khoa),hoa解碼器步驟或級(jí)12還提供活動(dòng)環(huán)境系數(shù)集
術(shù)語(yǔ)‘稀疏的’或‘空間稀疏的hoa表示’意指,在該表示中,原始聲場(chǎng)的空間不相關(guān)的信號(hào)分量丟失。具體地說(shuō),術(shù)語(yǔ)‘稀疏的’可以、但不必意指相應(yīng)hoa表示的大多數(shù)系數(shù)序列為零。例如,僅用兩個(gè)平面波編碼/表示的聲場(chǎng)意指是空間稀疏的。但是,通常,相應(yīng)hoa系數(shù)序列中沒(méi)有一個(gè)將為零。
稀疏的hoa表示d(k-khoa)與延遲補(bǔ)償?shù)膆oa表示c(k-khoa)、活動(dòng)環(huán)境系數(shù)集
復(fù)用器和幀同步步驟/級(jí)16使參數(shù)集γhoa(k-khoa)、γpar(k-khoa-1)和γtrans(k-khoa-kenc)的幀延遲同步,并且將它們組合為編碼的hoa幀γ(k-kmax)。
hoa編碼器延遲由khoa定義,其中,假定hoa解碼器不引入任何附加延遲。相同的定義適用于感知編碼器延遲kenc。par處理還添加一個(gè)幀的延遲,以使總延遲為kmax=max{khoa+kenc,khoa+1}。
par編碼器
par處理的基本特征是,從稀疏hoa表示d(k′)創(chuàng)建去相關(guān)信號(hào),并且獲得頻域中的混合矩陣,該混合矩陣將這些去相關(guān)信號(hào)組合為增強(qiáng)稀疏的且高度相關(guān)的hoa表示的、復(fù)制的環(huán)境hoa表示,以便匹配原始hoa表示c(k′)的空間性質(zhì)。在該上下文下,去相關(guān)意指子帶信號(hào)的相位在不改變它的幅值的情況下被修改。因此,圖2所示的par編碼器考慮到par編碼參數(shù)opar、nsig(k′)、vcomplex和
par處理是在頻域中進(jìn)行的。par分析濾波器組將輸入hoa表示變換為它的復(fù)值的頻域表示,其中,假定時(shí)域采樣的數(shù)量等于頻域采樣的數(shù)量。例如,具有nfb個(gè)子帶的正交鏡像濾波器組(qmf)可以用作濾波器組。第一濾波器組24將o×l矩陣c(k′)變換為nfb個(gè)頻域
在還接收f(shuō)、opar、nsig(k′)和vcomplex的步驟或級(jí)25中,將這些子帶分組為nsb個(gè)子帶組。對(duì)應(yīng)數(shù)量的par子帶編碼器步驟或級(jí)26和27對(duì)每個(gè)子帶組g=1...nsb的信號(hào)單獨(dú)地進(jìn)行編碼。
par子帶配置由以下矩陣定義:
其中,第一列和第二列保存對(duì)應(yīng)的子帶組g的第一子帶索引和最后子帶索引的索引j。在步驟或級(jí)21中通過(guò)歐洲專利申請(qǐng)ep14306347.7中所描述的方法將子帶配置編碼為參數(shù)集γsubband。因?yàn)樗鼘?duì)于每個(gè)幀索引k是固定的,所以它僅需被發(fā)送到解碼器一次以用于初始化。
步驟/級(jí)25中的子帶分組根據(jù)給定的子帶配置將輸入信號(hào)和參數(shù)引導(dǎo)到每個(gè)par子帶編碼器步驟/級(jí)26、27,使得子帶組g的每個(gè)par子帶編碼器得到
參數(shù)opar,g指示par編碼器對(duì)其計(jì)算參數(shù)的hoa階次。該階次等于或小于hoa表示c(k′)的hoa階次n。它用于降低用于發(fā)送編碼的par參數(shù)
保存用于所有子帶組的hoa階次。
用于創(chuàng)建復(fù)制的環(huán)境hoa表示的一個(gè)空域信號(hào)的去相關(guān)信號(hào)的數(shù)量由以下矢量定義:
其中,0≤nsig,g(k′)≤(opar,g+1)2且
去相關(guān)信號(hào)的混合是通過(guò)矩陣乘法進(jìn)行的,其中,編碼矩陣包括在par參數(shù)集
包括指示混合矩陣的元素是實(shí)值非負(fù)數(shù)、還是復(fù)值數(shù)的布爾變量,其中,可以定義對(duì)于vcomplex,g=1,復(fù)值元素矩陣被用在子帶組g中。由于傳輸信號(hào)z(k)的壓縮,解碼的傳輸信號(hào)的相位信息可能由于參數(shù)化編碼工具而在解碼器端丟失(例如在應(yīng)用譜帶復(fù)制方法的情況下)。在這種情況下,par處理可以僅復(fù)制丟失的環(huán)境分量的空間功率分布,這意味著par混合矩陣的相位信息是過(guò)時(shí)的。
此外,參數(shù)
最后,在復(fù)用器和幀同步步驟或級(jí)22中,將編碼的par參數(shù)集
par子帶編碼器
圖3中更詳細(xì)地示出了par子帶編碼器步驟/級(jí)26和27。對(duì)于par子帶g的每個(gè)子帶jg=fg,1,...,fg,2,在步驟或級(jí)311、312、313中通過(guò)下面在章節(jié)空間變換中描述的空間變換將矩陣
以及
其中,ah表示矩陣a的厄密(hermitian)轉(zhuǎn)置。前一幀的矩陣被包括在內(nèi),以便獲得協(xié)方差矩陣,這些協(xié)方差矩陣對(duì)于當(dāng)前幀和前一幀是有效的,使得在par解碼器處能夠在兩個(gè)相鄰幀的矩陣之間交叉漸變。
步驟或級(jí)331和332中去相關(guān)信號(hào)的創(chuàng)建將來(lái)自
為了在步驟或級(jí)341和342中獲得對(duì)應(yīng)的空域信號(hào)的協(xié)方差矩陣,必須用矩陣
為了計(jì)算
假定每個(gè)子帶的hoa表示是彼此獨(dú)立的,使得子帶組的協(xié)方差矩陣可以通過(guò)它的子帶的協(xié)方差矩陣的和來(lái)計(jì)算。從而,par子帶編碼器計(jì)算在組合器步驟或級(jí)352中計(jì)算以下協(xié)方差矩陣:
在組合器步驟或級(jí)354中計(jì)算以下協(xié)方差矩陣:
并且在組合器步驟或級(jí)351中計(jì)算以下協(xié)方差矩陣:
從去相關(guān)信號(hào)
以及矩陣
最后,在步驟或級(jí)37中,如章節(jié)混合矩陣的編碼中所描述的,對(duì)混合矩陣mg(k′-1)進(jìn)行量化并且編碼為參數(shù)集
空間變換
在空間變換中,通過(guò)對(duì)給定hoa階次opar,g使用章節(jié)實(shí)值球諧函數(shù)的定義中的球諧變換將輸入hoa表示c變換為其空域表示w。因?yàn)閔oa階次opar,g通常小于輸入hoa階次n,所以必須在球諧變換可以被應(yīng)用之前移除c中具有比qpar,g=(opar,g+1)2高的索引的行。
去相關(guān)信號(hào)的創(chuàng)建
去相關(guān)信號(hào)的創(chuàng)建包括以下處理步驟:
·從稀疏hoa表示
·對(duì)于hoa階次opar,g根據(jù)章節(jié)空間變換來(lái)進(jìn)行選定系數(shù)序列的空間變換;
·通過(guò)針對(duì)用于環(huán)境復(fù)制的若干個(gè)信號(hào)nsig,g(k′)和hoa階次opar,g選擇的置換矩陣
·使用在最佳地保持子帶信號(hào)的幅值的同時(shí)修改子帶信號(hào)的相位的單獨(dú)處理對(duì)置換的信號(hào)進(jìn)行去相關(guān)。
在下面,給出這些處理步驟的詳細(xì)描述。
去相關(guān)器通過(guò)用
在計(jì)算混合矩陣nsig,g(k′)的每行期間,從
然后通過(guò)以下方程進(jìn)行實(shí)際的置換,即,
其中,diag(f)形成來(lái)自f的元素的對(duì)角矩陣。用于不同置換矩陣之間的切換的漸增矢量和漸減矢量由以下方程定義:
其元素從以下方程獲得:
從一個(gè)置換矩陣到另一個(gè)置換矩陣的漸變防止去相關(guān)器的輸入信號(hào)不連續(xù)。隨后,對(duì)應(yīng)的去相關(guān)器對(duì)
基本上,每個(gè)去相關(guān)器使每個(gè)頻帶信號(hào)延遲獨(dú)立數(shù)量的采樣,其中,對(duì)于所有的qpar,g個(gè)去相關(guān)器,延遲是相等的。另外,每個(gè)去相關(guān)器將單獨(dú)的全通濾波器應(yīng)用于它的輸入信號(hào)。去相關(guān)器的不同配置使空域信號(hào)
混合矩陣的計(jì)算
可以對(duì)用vcomplex,g變量標(biāo)示(signalled)的實(shí)值非負(fù)或復(fù)值矩陣元素計(jì)算混合矩陣mg(k′-1)。對(duì)于等于一的vcomplex,g,根據(jù)章節(jié)復(fù)值混合矩陣來(lái)計(jì)算復(fù)值混合矩陣,由此該計(jì)算只有在傳輸信道的感知編碼不破壞子帶組g中的采樣的相位信息時(shí)才可適用。
否則,實(shí)值非負(fù)元素的混合矩陣對(duì)于提取復(fù)制的環(huán)境hoa表示是足夠的。章節(jié)實(shí)值非負(fù)混合矩陣中給出了用于計(jì)算實(shí)值非負(fù)混合矩陣的示例處理。
復(fù)值混合矩陣
混合矩陣的計(jì)算是基于以上提及的vilkamo/baeckstroem/kuntz文章中所描述的方法。通過(guò)y=mx計(jì)算用于將多聲道信號(hào)x上混為具有更高數(shù)量的聲道的信號(hào)y的混合矩陣m。滿足
的、其中
的、混合矩陣m的解由
給出,其中
其中,||·||fro表示矩陣的frobenius范數(shù),信號(hào)矢量x、和y的協(xié)方差矩陣∑y是已知的。原型混合矩陣q滿足
給出,并且
其中,符號(hào){k′,k′-1}用于表達(dá)混合矩陣mg(k′-1)對(duì)于當(dāng)前幀和前一幀是有效的。
因?yàn)榧俣沼蛐盘?hào)
為了使增強(qiáng)的稀疏的hoa表示從心理聲學(xué)的角度來(lái)講聽(tīng)起來(lái)像原始hoa表示
該要求導(dǎo)致混合矩陣的以下約束:
其中,δ∑g(k′-1)在方程(12)中定義。
方程(18)和(27)的比較導(dǎo)致以下賦值:
∑y:=δ∑g(k′-1)(28)
其中,ky和kx可以從δ∑g(k′-1)和
最后,必須對(duì)所提出的方法定義矩陣q。因?yàn)榫仃?imgfile="bda00012654595900001715.gif"wi="36"he="63"img-content="drawing"img-format="gif"orientation="portrait"inline="no"/>應(yīng)是y的良好近似,所以q必須對(duì)以下方程進(jìn)行求解:
該問(wèn)題的眾所周知的解決方法是通過(guò)使用moore-penrose偽逆解來(lái)最小化如下定義的近似誤差的euclidean范數(shù),即,
為了降低用于發(fā)送混合矩陣的數(shù)據(jù)速率,可以選擇來(lái)自
其中,元素so,n表示用于創(chuàng)建復(fù)制的環(huán)境hoa表示的第o空域信號(hào)的來(lái)自
其中,p=vuh。定義
并且ta是t的a=1...qpar,g個(gè)列矢量中的一個(gè)。為了計(jì)算mg(k′-1)的o=1...qpar,g個(gè)行中的每行,構(gòu)建子矩陣
并且通過(guò)以下方程確定矢量mrow,o:
其中,ky,o是來(lái)自ky的第o行矢量,
至少,混合矩陣mg(k′-1)的元素mo,i被賦值為:
其中,mrow,o,a是矢量mrow,o的元素并且o=1...qpar,g。
實(shí)值非負(fù)混合矩陣
但是,對(duì)于可能受感知編碼的譜帶寬復(fù)制影響的高頻子帶組g,在章節(jié)復(fù)值混合矩陣中所描述的方法是不合理的,因?yàn)橄∈璧膆oa表示的重構(gòu)的子帶信號(hào)的相位不能假定為甚至基本上類似于原始子帶信號(hào)的相位。
對(duì)于這樣的情況,可以忽視相位。相反,僅集中于用于計(jì)算混合矩陣mg(k′-1).的信號(hào)功率。用于確定預(yù)測(cè)系數(shù)的合理標(biāo)準(zhǔn)是最小化以下誤差:
其中,運(yùn)算|·|2假定被逐個(gè)元素地應(yīng)用于矩陣。換言之,混合矩陣被選為使得去相關(guān)hoa表示的所有加權(quán)的空間子帶信號(hào)的功率的和最佳地近似原始hoa表示和稀疏hoa表示的空域子帶信號(hào)的殘差的功率。在這種情況下,非負(fù)矩陣因式分解(nmf)技術(shù)可以用于對(duì)該優(yōu)化問(wèn)題進(jìn)行求解。關(guān)于對(duì)nmf的介紹,參見(jiàn)例如1999年nature第401卷第788-791頁(yè)的d.d.lee、h.s.seung的"learningthepartsofobjectsbynonnegativematrixfactorization"。
混合矩陣的編碼
每個(gè)子帶組g=1,...,nsb的混合矩陣mg(k′-1)將被量化和編碼為參數(shù)集
如果假定幅值位于區(qū)間[0,mmax]內(nèi),則幅值差位于區(qū)間[-mmax,mmax]內(nèi)。假定角度差位于區(qū)間[-π,π]內(nèi)。為了對(duì)這些差進(jìn)行量化,對(duì)應(yīng)地對(duì)幅值差和角度差使用預(yù)定義位數(shù)。在使用具有實(shí)值非負(fù)元素的混合矩陣的情況下,只有幅值差被編碼,因?yàn)橄辔徊羁偸菫榱恪?/p>
發(fā)明人已經(jīng)通過(guò)實(shí)驗(yàn)發(fā)現(xiàn),各個(gè)差的出現(xiàn)概率是以高度不均勻的方式分布的。具體地說(shuō),小的幅值差和角度差的出現(xiàn)頻率顯著高于大的幅值差和角度差。因此,可以利用基于將被編碼的各個(gè)值的先驗(yàn)概率的編碼方法(例如哈夫曼編碼),以便顯著地減少每個(gè)混合矩陣元素的平均位數(shù)。
另外,對(duì)于每個(gè)幀必須發(fā)送nsig,g(k′-1)的值。為了這個(gè)目的,可以用信號(hào)發(fā)送預(yù)定義表的索引,該索引是針對(duì)每個(gè)有效parhoa階次定義的。
置換矩陣和選擇矩陣的計(jì)算
為了降低用于發(fā)送混合矩陣的數(shù)據(jù)速率,可以減少每行的活動(dòng)(即,非零)元素的數(shù)量?;顒?dòng)行元素對(duì)應(yīng)于空域中的qpar個(gè)去相關(guān)信號(hào)中的用于混合復(fù)制的環(huán)境hoa表示的一個(gè)空域信號(hào)(現(xiàn)在稱為目標(biāo)信號(hào))的nsig個(gè)去相關(guān)信號(hào)。將被混合的去相關(guān)空域信號(hào)的復(fù)值子帶信號(hào)理想地應(yīng)具有目標(biāo)信號(hào)的縮放幅值譜,但是具有不同的相位譜。這可以通過(guò)從目標(biāo)信號(hào)的空間附近選擇要被混合的信號(hào)來(lái)實(shí)現(xiàn)。
因而,在第一步中,對(duì)于每個(gè)第o目標(biāo)信號(hào)位置,o=1,...,qpar,必須針對(duì)每個(gè)hoa階次opar和每個(gè)數(shù)量的活動(dòng)行nsig找到多組的nsig個(gè)空間相鄰位置。在第二步中,獲得qpar個(gè)輸入信號(hào)對(duì)于qpar個(gè)去相關(guān)器的分配,以便最小化每組中的nsig個(gè)信號(hào)之間的互相關(guān)性。
對(duì)給定hoa階次opar找到一組的nsig個(gè)信號(hào)的一種方式是,計(jì)算所有空域位置和第o目標(biāo)信號(hào)的位置之間的角度距離,并且將屬于nsig個(gè)最小距離的信號(hào)索引選入第o組中。因而,來(lái)自方程(34)的矩陣
現(xiàn)在,必須找到對(duì)于去相關(guān)器的空域信號(hào)分配并且將該分配存儲(chǔ)在用于opar和nsig的每個(gè)預(yù)定義組合的置換矩陣
·對(duì)于每組通過(guò)從矩陣∑僅選擇分配給該組的信號(hào)的元素來(lái)構(gòu)建協(xié)方差子矩陣;
·對(duì)每個(gè)協(xié)方差子矩陣的最大和最小奇異值的商進(jìn)行求和。
從具有最低懲罰的分配,獲得置換矩陣
hoa解碼器框架
圖4中描繪了包括par解碼器的hoa解碼器/hoa解壓縮器的框架。在解復(fù)用器步驟或級(jí)41中將位流參數(shù)集γ(k)解復(fù)用為輔助信息參數(shù)集γhoa(k)和γpar(k)以及信號(hào)參數(shù)集γtrans(k)。因?yàn)檩o助信息和信號(hào)參數(shù)之間的延遲已經(jīng)在hoa編碼器中被對(duì)齊,所以解碼器端接收它的已經(jīng)同步的數(shù)據(jù)。
信號(hào)參數(shù)集γtrans(k)被饋送到感知音頻解碼器步驟或級(jí)42,感知音頻解碼器步驟或級(jí)42從信號(hào)參數(shù)集γtrans(k)解碼稀疏的hoa表示
par解碼器框架
圖5所示的par解碼器框架用解碼的復(fù)制的環(huán)境hoa表示cpar(k)增強(qiáng)解碼的稀疏的hoa表示
在解復(fù)用器步驟或級(jí)51中將par輔助信息參數(shù)集γpar(k)解復(fù)用為子帶配置集γsubband、par參數(shù)opar、nsig(k)、vcomplex以及用于各個(gè)子帶組g=1,...,nsb的編碼的混合矩陣
并行地,在分析濾波器組步驟或級(jí)52中將解碼的稀疏的hoa表示
從子帶配置集γsubband,在步驟或級(jí)53中解碼如方程(1)中定義的子帶組數(shù)量nsb和子帶配置矩陣f,并且將它們饋送到組分派步驟或級(jí)54。根據(jù)這些參數(shù),組分派步驟或級(jí)54對(duì)于子帶1...nsb將來(lái)自步驟/級(jí)51和53的參數(shù)以及來(lái)自步驟/級(jí)52的頻帶hoa表示
nsb個(gè)par子帶解碼器55、56對(duì)于對(duì)應(yīng)頻帶jg=fg,1,...,fg,2從解碼的稀疏的hoa表示矩陣
在合成濾波器組步驟或級(jí)58中將每個(gè)頻帶的所得的復(fù)制的環(huán)境hoa表示矩陣
par子帶解碼器
圖6中所描繪的par子帶解碼器為子帶組g的頻帶jg=fg,1,...,fg,1創(chuàng)建頻域復(fù)制的環(huán)境hoa表示矩陣
并行地,在步驟或級(jí)611、612中,使用參數(shù)
此外,在混合矩陣解碼步驟或級(jí)63中,使用參數(shù)opar,g、nsig,g(k)和vcomplex,g從編碼的混合矩陣
隨后,在環(huán)境復(fù)制步驟或級(jí)621、622中,通過(guò)章節(jié)環(huán)境復(fù)制中描述的環(huán)境復(fù)制處理對(duì)于子帶組g的每個(gè)頻帶jg,使用opar,g、nsig,g(k)和
最后,在步驟或級(jí)641、642中使用opar,g和逆空間變換將復(fù)制的環(huán)境hoa表示
混合矩陣的解碼
編碼的混合矩陣的元素的索引由當(dāng)前的選擇矩陣
因此,在第一步中,根據(jù)par編碼器中應(yīng)用的對(duì)應(yīng)熵編碼對(duì)每個(gè)矩陣元素的角度差和幅值差進(jìn)行解碼。然后,將解碼的角度差和幅值差加到前一幀的重構(gòu)的qpar,g×qpar,g角度和幅值混合矩陣,其中,只有當(dāng)前選擇矩陣
其中,ma,b是
環(huán)境復(fù)制
環(huán)境復(fù)制進(jìn)行由用于參數(shù)opar,g和nsig,g(k)的置換矩陣定義的去相關(guān)空域信號(hào)的逆置換,接著再乘以混合矩陣
其中,使用來(lái)自方程(14)和(15)的交叉漸變函數(shù)。
高階高保真立體聲的基礎(chǔ)
高階高保真立體聲(hoa)基于感興趣的緊湊區(qū)域內(nèi)的聲場(chǎng)的描述,所述感興趣的緊湊區(qū)域假定是沒(méi)有聲源的。在這種情況下,在時(shí)刻t時(shí)感興趣區(qū)域內(nèi)的位置x處的聲壓p(t,x)的空間時(shí)間行為在物理上完全由齊次波動(dòng)方程(homogeneouswaveequation)確定。在下面,采取如圖7所示的球坐標(biāo)系。在所用的坐標(biāo)系中,x軸指向前面的位置,y軸指向左,z軸指向頂部??臻gx=(r,θ,φ)t中的位置用半徑r>0(即,到坐標(biāo)原點(diǎn)的距離)、從極坐標(biāo)z測(cè)量的傾角θ∈[0,π]以及在x-y平面中從x軸逆時(shí)針測(cè)量的方位角φ∈[0,2π[表示。此外,(·)t表示轉(zhuǎn)置。
然后,從“傅里葉聲學(xué)”課本可以示出,
其中,ω表示角頻率,i指示虛數(shù)單位,該式可以根據(jù)以下方程被展開(kāi)為球諧級(jí)數(shù)(seriesofsphericalharmonics):
其中,cs表示聲音的速度,k表示按照
如果聲場(chǎng)用從由角度元組(θ,φ)指定的所有可能的方向到達(dá)的無(wú)限數(shù)量的不同角頻率ω的諧平面波的疊加表示,則可以表明(參見(jiàn)2004年10月j.acoust.soc.am.第4(116)卷第2149–2157頁(yè)的b.rafaely的"plane-wavedecompositionofthesoundfieldonaspherebysphericalconvolution"),相應(yīng)的平面波復(fù)幅度函數(shù)c(ω,θ,φ)可以用以下球諧展開(kāi)表達(dá):
其中,展開(kāi)系數(shù)
與展開(kāi)系數(shù)
假定各個(gè)系數(shù)
這些時(shí)域函數(shù)在這里被稱為連續(xù)時(shí)間hoa系數(shù)序列,這些連續(xù)時(shí)間hoa系數(shù)序列可以通過(guò)以下方程收集在單個(gè)矢量c(t)中:
矢量c(t)內(nèi)的hoa系數(shù)序列
最終的高保真立體聲格式如下使用采樣頻率fs來(lái)提供c(t)的采樣版本:
{c(lts)}l∈n={c(ts),c(2ts),c(3ts),c(4ts),...}(49)
其中,ts=1/fs表示采樣周期。c(lts)的元素被稱為離散時(shí)間hoa系數(shù)序列,這些離散時(shí)間hoa系數(shù)序列可以被示出為總是實(shí)值的。該性質(zhì)也適用于連續(xù)時(shí)間版本
實(shí)值球諧函數(shù)的定義
實(shí)值球諧函數(shù)
其中,
相關(guān)聯(lián)的legendre函數(shù)pn,m(x)被定義為:
該函數(shù)具有l(wèi)egendre多項(xiàng)式pn(x),并且不同于1999年appliedmathematicalsciences,academicpress第93卷中e.g.williams的"fourieracoustics"中那樣,沒(méi)有condon-shortley相位項(xiàng)(-1)m。
球諧變換
如果hoa序列的空間表示在幾乎均勻分布在單位球體上的數(shù)量o個(gè)空間方向ωo,1≤o≤o上被離散化,則獲得o個(gè)定向信號(hào)c(t,ωo)。如下將這些信號(hào)收集到矢量中:
cspat(t):=[c(t,ω1)...c(t,ωo)]t(53)
可以通過(guò)如下的簡(jiǎn)單矩陣乘法從方程(48)中定義的連續(xù)高保真立體聲表示c(t)計(jì)算該矢量:
cspat(t)=ψhc(t)(54)
其中,(·)h指示聯(lián)合轉(zhuǎn)置和共軛,ψ表示由以下方程定義的模式矩陣:
ψ:=[s1...so](55)
其中,
因?yàn)榉较颚豲幾乎均勻地分布在單位球體上,所以模式矩陣一般是可逆的。因此,可以通過(guò)以下方程從定向信號(hào)c(t,ωo)計(jì)算連續(xù)高保真立體聲表示:
c(t)=ψ-hcspat(t)(57)
這兩個(gè)方程構(gòu)成高保真立體聲表示和空域之間的變換和逆變換。這些變換被稱為球諧變換和逆球諧變換。
因?yàn)榉较颚豲幾乎均勻地分布在單位球體上,所以近似
ψh≈ψ-1(58)
是可用的,其證明使用ψ-1、而不是方程(54)中的ψh是合理的。有利地,所提及的所有關(guān)系對(duì)于離散時(shí)域也是有效的。
所描述的處理可以由單個(gè)處理器或電子電路執(zhí)行,或者由并行操作和/或在整個(gè)處理的不同部分上操作的幾個(gè)處理或電子電路執(zhí)行。
用于根據(jù)所描述的處理操作所述一個(gè)處理器或多個(gè)處理器的指令可以被存儲(chǔ)在一個(gè)或多個(gè)存儲(chǔ)器中。所述至少一個(gè)處理器被配置為執(zhí)行這些指令。