用于對(duì)聲場(chǎng)的高階高保真立體聲HOA信號(hào)表示進(jìn)行低位速率壓縮的方法和裝置與流程

文檔序號(hào)：11531126閱讀：721來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>樂(lè)器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

用于對(duì)聲場(chǎng)的高階高保真立體聲HOA信號(hào)表示進(jìn)行低位速率壓縮的方法和裝置與流程

本發(fā)明涉及一種用于對(duì)聲場(chǎng)的高階高保真立體聲hoa信號(hào)表示進(jìn)行低位速率壓縮的方法和裝置，其中，hoa信號(hào)表示由于該低位速率而是空間稀疏的。

背景技術(shù)：

除了像波場(chǎng)合成(wfs)的其他技術(shù)或者像22.2的基于聲道的方法之外，高階高保真立體聲(hoa)提供表示三維聲音的一種可能性。但是，與基于聲道的方法相反，hoa表示提供獨(dú)立于特定擴(kuò)音器設(shè)置的優(yōu)點(diǎn)。但是該靈活性是以在特定擴(kuò)音器設(shè)置上回放hoa表示所需的解碼過(guò)程為代價(jià)的。與所需擴(kuò)音器數(shù)量通常非常大的wfs方法相比，hoa還可以被渲染到僅包括幾個(gè)擴(kuò)音器的設(shè)置。hoa的另外的優(yōu)點(diǎn)是相同的表示還可以在不做任何修改的情況下被用于對(duì)耳機(jī)的雙耳渲染。

hoa是基于復(fù)諧平面波幅度的空間密度的通過(guò)截?cái)嗲蛑C函數(shù)(sh)展開(kāi)的表示的。每個(gè)展開(kāi)系數(shù)是角頻率的函數(shù)，其可以用時(shí)域函數(shù)等同地表示。因此，不失一般性地，整個(gè)hoa聲場(chǎng)表示實(shí)際上可以被假定為包括o個(gè)時(shí)域函數(shù)，其中，o表示展開(kāi)系數(shù)的數(shù)量。在下面，這些時(shí)域函數(shù)將被等同地稱為hoa系數(shù)序列或hoa聲道。

hoa表示的空間分辨率隨著展開(kāi)的最大階次n增長(zhǎng)而改進(jìn)。不幸的是，展開(kāi)系數(shù)數(shù)量o隨著階次n二次方地增長(zhǎng)，具體地說(shuō)，o＝(n+1)²。例如，使用階次n＝4的典型的hoa表示需要o＝25個(gè)hoa(展開(kāi))系數(shù)。根據(jù)前面的考慮，給定期望的單聲道采樣速率fs和每采樣的位數(shù)nb，用于發(fā)送hoa表示的總位速率由o·fs·nb確定。結(jié)果，通過(guò)采用每采樣nb＝16位、以fs＝48khz的采樣速率發(fā)送階次n＝4的hoa表示，得到19.2mbits/s的位速率，該位速率對(duì)于許多實(shí)際應(yīng)用(例如流傳輸)是非常高的。因而，hoa表示的壓縮是非常期望的。

hoa聲場(chǎng)表示的壓縮在ep2665208a1、ep2743922a1和國(guó)際申請(qǐng)pct/ep2013/059363(參看2014年7月的iso/iecdis23008-3，mpeg-h3daudio)中被提出。這些方法的共同之處在于，它們進(jìn)行聲場(chǎng)分析，并且將給定的hoa表示分解為定向分量和殘余環(huán)境分量。最終的壓縮表示一方面被假定為包括若干個(gè)量化信號(hào)，這些量化信號(hào)是從定向信號(hào)和基于矢量的信號(hào)以及環(huán)境hoa分量的相關(guān)系數(shù)序列的感知編碼得出的。另一方面，最終的壓縮表示被假定為包括與量化信號(hào)相關(guān)的附加輔助信息，該輔助信息對(duì)于從hoa表示的壓縮版本重構(gòu)hoa表示是必需的。對(duì)于ep2665208a1、ep2743922a1和國(guó)際申請(qǐng)pct/ep2013/059363中的方法，量化信號(hào)的合理的最少數(shù)量為“8”個(gè)。因此，假定對(duì)于每個(gè)單獨(dú)的感知編碼器，數(shù)據(jù)速率為32kbit/s，則這些方法中的一個(gè)的數(shù)據(jù)速率通常不低于256kbit/s。對(duì)于某些應(yīng)用，例如對(duì)于移動(dòng)裝置的音頻流傳輸，該總數(shù)據(jù)速率可能太高，這使得期望以明顯降低的數(shù)據(jù)速率(例如，128kbit/s)的hoa壓縮方法。

在歐洲專利申請(qǐng)ep14306077.0中，描述了一種用于對(duì)聲場(chǎng)的hoa表示進(jìn)行低位速率壓縮的方法，該方法使用較少數(shù)量的量化信號(hào)，這些量化信號(hào)基本上是原始hoa表示的小子集。為了復(fù)制丟失的hoa系數(shù)，獲得用于不同頻帶的預(yù)測(cè)參數(shù)以便從量化信號(hào)預(yù)測(cè)附加的定向hoa分量。

技術(shù)實(shí)現(xiàn)要素：

在ep14306077.0處理中，重構(gòu)的hoa表示由高度相關(guān)的分量組成，因?yàn)樗械膆oa分量都是僅從少量量化信號(hào)重構(gòu)的。由于這樣的少量量化信號(hào)，其定向hoa分量的預(yù)測(cè)可能并不令人滿意，并且可以導(dǎo)致重構(gòu)hoa表示在空間上稀疏的效果。這可以使聲音干(dry)并且比原始hoa表示中的聲音更安靜。如果量化信號(hào)的數(shù)量非常少，例如，“1”個(gè)或“2”個(gè)，則通常由空間上不相關(guān)的信號(hào)分量組成的環(huán)境聲場(chǎng)不能被適當(dāng)?shù)刂貥?gòu)。

本發(fā)明要解決的問(wèn)題是改進(jìn)聲場(chǎng)的hoa表示的低位速率壓縮。該問(wèn)題通過(guò)權(quán)利要求1和8中所公開(kāi)的方法來(lái)解決。利用這些方法的裝置在權(quán)利要求2和9中公開(kāi)。

本發(fā)明的有利的另外的實(shí)施例在相應(yīng)的從屬權(quán)利要求中公開(kāi)。

下面描述的處理對(duì)高階高保真立體聲表示的低位速率壓縮進(jìn)行處理，并且重新創(chuàng)建環(huán)境聲場(chǎng)分量，并且在量化信號(hào)的數(shù)量非常少的情況下，它改進(jìn)了上述ep14306077.0處理。

所描述的處理被稱為參數(shù)化環(huán)境復(fù)制(par)，并且它用可能丟失的環(huán)境分量來(lái)補(bǔ)充重構(gòu)的空間稀疏的hoa表示，所述可能丟失的環(huán)境分量是從其本身參數(shù)化復(fù)制的。復(fù)制是通過(guò)以下操作來(lái)進(jìn)行的：首先從稀疏hoa表示(其可以包括定向信號(hào)和環(huán)境分量)的信號(hào)創(chuàng)建具有修改的相位譜、因而與先前的信號(hào)不相關(guān)的若干個(gè)新信號(hào)。第二，將新創(chuàng)建的信號(hào)彼此混合，以便提供復(fù)制的環(huán)境hoa分量。通過(guò)疊加原始稀疏hoa表示和復(fù)制的環(huán)境hoa分量來(lái)計(jì)算最終的增強(qiáng)的hoa表示。執(zhí)行混合以便使最終的增強(qiáng)的hoa表示的空間聲學(xué)性質(zhì)與原始hoa表示的空間聲學(xué)性質(zhì)匹配。優(yōu)選地，在頻域中進(jìn)行混合，從而提供在不同頻帶之間變化的可能性。假設(shè)從稀疏hoa表示創(chuàng)建不相關(guān)的信號(hào)的過(guò)程被確定性地指定，將被包括到壓縮hoa表示中的用于par的輔助信息僅由混合參數(shù)組成，該混合參數(shù)本質(zhì)上是復(fù)值的混合矩陣。

用于以減少用于par的輔助信息的量為目標(biāo)從稀疏hoa表示創(chuàng)建不相關(guān)的信號(hào)的一種特定方法是首先用來(lái)自在單位球體上應(yīng)盡可能均勻地分布的一些預(yù)測(cè)方向的虛擬擴(kuò)音器信號(hào)(或等同地用一般的平面波函數(shù))來(lái)表示稀疏hoa表示。在下面，用于從hoa表示創(chuàng)建虛擬擴(kuò)音器信號(hào)的渲染被稱為空間變換。第二，對(duì)于這些方向中的每個(gè)，通過(guò)使用去相關(guān)濾波器對(duì)稀疏hoa表示的對(duì)應(yīng)的虛擬擴(kuò)音器信號(hào)的相位譜進(jìn)行修改來(lái)創(chuàng)建一個(gè)不相關(guān)的信號(hào)。第三，還用用于相同方向的虛擬擴(kuò)音器信號(hào)來(lái)表示復(fù)制的環(huán)境hoa表示，其中，用于某個(gè)方向的每個(gè)虛擬擴(kuò)音器信號(hào)僅由為該特定方向的鄰域的預(yù)定義方向創(chuàng)建的不相關(guān)的信號(hào)被混合得到。僅由少量不相關(guān)的信號(hào)混合得到提供創(chuàng)建一個(gè)不相關(guān)的信號(hào)的混合系數(shù)的數(shù)量可以保持很少、用于par的輔助信息的量也可以保持很少的優(yōu)點(diǎn)。另一個(gè)優(yōu)點(diǎn)是，對(duì)于復(fù)制的環(huán)境hoa分量的單個(gè)的虛擬擴(kuò)音器信號(hào)的混合，只有來(lái)自空間鄰域的、因此具有類似的幅度譜的信號(hào)被考慮。該操作防止了稀疏hoa表示的定向分量不期望地在所有方向上空間分布。對(duì)于該方法，假定去相關(guān)濾波器是成對(duì)地不同的，并且它們的數(shù)量等于虛擬擴(kuò)音器方向的數(shù)量。許多這樣的去相關(guān)濾波器的實(shí)際構(gòu)造通常使每個(gè)單獨(dú)的濾波器僅具有有限的去相關(guān)效果。對(duì)于虛擬方向(或等同地空間位置)的去相關(guān)濾波器分配應(yīng)合理地選擇，以便最小化將被混合以用于創(chuàng)建復(fù)制的環(huán)境hoa分量的單個(gè)虛擬擴(kuò)音器信號(hào)的信號(hào)之間的互相關(guān)性。

允許虛擬擴(kuò)音器方向的數(shù)量對(duì)于各個(gè)頻帶改變，并且可以用于指定復(fù)制的環(huán)境hoa分量的頻率相關(guān)階次。

從稀疏hoa表示創(chuàng)建不相關(guān)的信號(hào)的方法的進(jìn)一步擴(kuò)展是，考慮將具有隨時(shí)間變化的數(shù)量的不相關(guān)的信號(hào)用于復(fù)制的環(huán)境hoa分量的虛擬擴(kuò)音器信號(hào)的混合。要被混合的不相關(guān)的信號(hào)的數(shù)量依賴于稀疏hoa表示中的丟失環(huán)境的量。該變化通常將導(dǎo)致對(duì)于虛擬擴(kuò)音器位置的去相關(guān)濾波器分配變化。為了避免由于時(shí)間分配改變而導(dǎo)致去相關(guān)信號(hào)不連續(xù)，可以通過(guò)將稀疏hoa表示的虛擬擴(kuò)音器信號(hào)等同地分配給去相關(guān)濾波器來(lái)交換去相關(guān)濾波器對(duì)于虛擬擴(kuò)音器信號(hào)的分配。該分配可以用簡(jiǎn)單的置換矩陣表達(dá)。在分配改變的情況下，可以通過(guò)由兩個(gè)不同的分配引起的信號(hào)之間的重疊相加(overlap-add)來(lái)計(jì)算每個(gè)去相關(guān)濾波器的輸入。因此，每個(gè)去相關(guān)濾波器的輸入和輸出是連續(xù)的。隨后，必須使分配倒轉(zhuǎn)以便將每個(gè)去相關(guān)濾波器的輸出重新分配給每個(gè)虛擬擴(kuò)音器方向。

在多聲道音頻的上下文下，創(chuàng)建環(huán)境聲音分量的問(wèn)題在以下文獻(xiàn)中被解決：2006年6月sweden的aes28thinternationalconference中的v.pulkki的"directionalaudiocodinginspatialsoundreproductionandstereoupmixing"；iso/iec23003-1mpegsurround以及iso/iec23003-2spatialaudioobjectcoding中的2013年的j.audioeng.soc第61(6)卷第403-411頁(yè)的j.vilkamo、t.baeckstroem、a.kuntz的"optimizedcovariancedomainframeworkfortime-frequencyprocessingofspatialaudio"。

但是，本申請(qǐng)描述了用于在hoa表示的上下文下創(chuàng)建環(huán)境的處理。

原理上，本發(fā)明的壓縮改進(jìn)方法適于改進(jìn)聲場(chǎng)的低位速率壓縮和解壓縮的高階高保真立體聲hoa信號(hào)表示，以便提供參數(shù)化環(huán)境復(fù)制參數(shù)集，其中，所述解壓縮提供空間稀疏的解碼的hoa表示和該表示的系數(shù)序列的索引集，所述方法包括：

-將所述空間稀疏的解碼的hoa表示變換為若干個(gè)復(fù)值的頻域子帶表示，并且使用分析濾波器組將所述hoa信號(hào)表示的對(duì)應(yīng)延遲版本變換為對(duì)應(yīng)數(shù)量的復(fù)值的頻域子帶表示；

-將所述子帶分組為若干個(gè)子帶組，并且在這些子帶組中的每個(gè)子帶組內(nèi)：

-對(duì)于來(lái)自所述復(fù)值的頻域子帶表示的子帶組中的每個(gè)子帶，使用去相關(guān)濾波器創(chuàng)建與所述復(fù)值的頻域子帶表示不相關(guān)的若干個(gè)經(jīng)修改的相位譜信號(hào)；

-對(duì)于來(lái)自所述經(jīng)修改的相位譜信號(hào)的子帶組中的每個(gè)子帶，計(jì)算去相關(guān)協(xié)方差矩陣；

-對(duì)于子帶組中的每個(gè)子帶，將所述復(fù)值的頻域子帶表示變換為它的空域表示，并且從該空域表示計(jì)算對(duì)應(yīng)的協(xié)方差矩陣；

-對(duì)于子帶組中的每個(gè)子帶，將用于所述hoa信號(hào)表示的復(fù)值的頻域子帶表示變換為它的空域表示，并且從該空域表示計(jì)算對(duì)應(yīng)的協(xié)方差矩陣，

對(duì)于每個(gè)子帶組：

-對(duì)于子帶組的所有子帶，組合所述去相關(guān)協(xié)方差矩陣以便提供子帶組去相關(guān)協(xié)方差矩陣

-對(duì)于子帶組的所有子帶，組合用于所述復(fù)值的頻域子帶表示的所述空域表示的協(xié)方差矩陣以便提供子帶組協(xié)方差矩陣

-對(duì)于子帶組的所有子帶，組合用于所述hoa信號(hào)表示的所述復(fù)值的頻域子帶表示的所述空域表示的協(xié)方差矩陣以便提供子帶組協(xié)方差矩陣

-形成組合協(xié)方差矩陣和之間的殘差，以便提供矩陣δ∑g(k′-1)；

-使用矩陣和矩陣δ∑g(k′-1)計(jì)算對(duì)應(yīng)的混合矩陣；

-對(duì)所述混合矩陣進(jìn)行編碼以便提供用于子帶組的參數(shù)集；

-對(duì)用于所述子帶組的所述參數(shù)集以及編碼的子帶配置數(shù)據(jù)和參數(shù)化環(huán)境復(fù)制編碼參數(shù)進(jìn)行復(fù)用以便提供參數(shù)化環(huán)境復(fù)制參數(shù)集。

原理上，本發(fā)明的壓縮改進(jìn)裝置適于改進(jìn)聲場(chǎng)的低位速率壓縮和解壓縮的高階高保真立體聲hoa信號(hào)表示，以便提供參數(shù)化環(huán)境復(fù)制參數(shù)集，其中，所述解壓縮提供空間稀疏的解碼的hoa表示和該表示的系數(shù)序列的索引集，所述裝置包括適于執(zhí)行以下操作的部件：

-將所述子帶分組為若干個(gè)子帶組，并且在這些子帶組中的每個(gè)子帶組內(nèi)：

-對(duì)于來(lái)自所述經(jīng)修改的相位譜信號(hào)的子帶組中的每個(gè)子帶，計(jì)算去相關(guān)協(xié)方差矩陣；

對(duì)于每個(gè)子帶組：

-對(duì)于子帶組的所有子帶，組合所述去相關(guān)協(xié)方差矩陣以便提供子帶組去相關(guān)協(xié)方差矩陣

-對(duì)于子帶組的所有子帶，組合用于所述復(fù)值的頻域子帶表示的所述空域表示的協(xié)方差矩陣以便提供子帶組協(xié)方差矩陣

-形成組合的協(xié)方差矩陣和之間的殘差，以便提供矩陣δ∑g(k′-1)；

-使用矩陣和矩陣δ∑g(k′-1)計(jì)算對(duì)應(yīng)的混合矩陣；

-對(duì)所述混合矩陣進(jìn)行編碼以便提供用于子帶組的參數(shù)集；

原理上，本發(fā)明的解壓縮改進(jìn)方法適于改進(jìn)空間稀疏的解碼的hoa表示，對(duì)于該表示，該表示的系數(shù)序列的索引集是通過(guò)使用根據(jù)以上壓縮改進(jìn)方法生成的參數(shù)化環(huán)境復(fù)制參數(shù)集進(jìn)行解碼而提供的，所述方法包括：

-從所述空間稀疏的解碼的hoa表示、系數(shù)序列的所述索引集以及所述參數(shù)化環(huán)境復(fù)制參數(shù)集重構(gòu)改進(jìn)的hoa表示，所述重構(gòu)包括：

-從所述參數(shù)化環(huán)境復(fù)制參數(shù)集確定子帶配置；

-將所述空間稀疏的解碼的hoa表示轉(zhuǎn)換為若干個(gè)頻帶hoa表示；

-根據(jù)所述子帶配置，將對(duì)應(yīng)組的頻帶hoa表示與相關(guān)參數(shù)一起分派給創(chuàng)建復(fù)制的環(huán)境hoa表示的去相關(guān)系數(shù)序列的、對(duì)應(yīng)數(shù)量的參數(shù)化環(huán)境復(fù)制子帶解碼器步驟或級(jí)；

-將所述復(fù)制的環(huán)境hoa表示的所述系數(shù)序列變換為復(fù)制的時(shí)域hoa表示；

-用所述復(fù)制的時(shí)域hoa表示增強(qiáng)所述空間稀疏的解碼的hoa表示，以便提供增強(qiáng)的解壓縮的hoa表示。

原理上，本發(fā)明的解壓縮改進(jìn)裝置適于改進(jìn)空間稀疏的解碼的hoa表示，對(duì)于該表示，該表示的系數(shù)序列的索引集是通過(guò)使用根據(jù)以上壓縮改進(jìn)方法生成的參數(shù)化環(huán)境復(fù)制參數(shù)集進(jìn)行解碼而提供的，所述裝置包括適于執(zhí)行以下操作的部件：

-從所述空間稀疏的解碼的hoa表示、系數(shù)序列的所述索引集以及所述參數(shù)化環(huán)境復(fù)制參數(shù)集重構(gòu)改進(jìn)的hoa表示，其中，該重構(gòu)包括：

-從所述參數(shù)化環(huán)境復(fù)制參數(shù)集確定子帶配置；

-將所述空間稀疏的解碼的hoa表示轉(zhuǎn)換為若干個(gè)頻帶hoa表示；

-將所述復(fù)制的環(huán)境hoa表示的所述系數(shù)序列變換為復(fù)制的時(shí)域hoa表示；

-用所述復(fù)制的時(shí)域hoa表示增強(qiáng)所述空間稀疏的解碼的hoa表示，以便提供增強(qiáng)的解壓縮的hoa表示。

附圖說(shuō)明

參考附圖來(lái)描述本發(fā)明的示例性實(shí)施例，附圖示出：

圖1示出包括par編碼器的hoa數(shù)據(jù)編碼器；

圖2更詳細(xì)地示出par編碼器，其中，k′＝k-khoa；

圖3示出par子帶編碼器；

圖4示出包括par解碼器的hoa數(shù)據(jù)解壓縮器；

圖5更詳細(xì)地示出par解碼器；

圖6示出par子帶解碼器；

圖7示出球坐標(biāo)系。

具體實(shí)施方式

即使未被明確描述，也可以按任何組合或子組合采用以下實(shí)施例。

hoa編碼器

參數(shù)化環(huán)境復(fù)制(par)處理被用作擴(kuò)展基本的hoa壓縮的附加編碼工具，像圖1所示那樣，在圖1中，采取了對(duì)具有幀索引k的幀的、基于幀的處理。hoa編碼器步驟或級(jí)11將hoa表示c(k)分解為傳輸信號(hào)矩陣z(k-khoa)和hoa輔助信息集γhoa(k-khoa)，像ep2665208a1、ep2743922a1、國(guó)際申請(qǐng)pct/ep2013/059363和歐洲專利申請(qǐng)ep14306077.0中所描述的那樣。用于幀索引k的hoa表示矩陣c(k)由o個(gè)行組成，其中，每行保存對(duì)應(yīng)的hoa系數(shù)的l個(gè)時(shí)域采樣，并且它還被饋送到幀延遲步驟或級(jí)14。矩陣z(k-khoa)的行保存c(k)已經(jīng)被包括在其中的傳輸信號(hào)的l個(gè)時(shí)域采樣。在感知音頻編碼器步驟或級(jí)15中將來(lái)自z(k-khoa)的時(shí)域信號(hào)感知編碼為傳輸信號(hào)參數(shù)集γtrans(k-khoa-kenc)，該參數(shù)集被饋送到復(fù)用器和幀同步步驟或級(jí)16。在hoa解碼器步驟或級(jí)12中從γhoa(k-khoa)和z(k-khoa)恢復(fù)稀疏的hoa表示的o×l矩陣d(k-khoa)，hoa解碼器步驟或級(jí)12還提供活動(dòng)環(huán)境系數(shù)集該hoa解碼器步驟/級(jí)12與圖4所示的hoa數(shù)據(jù)解壓縮器中使用的hoa解碼器步驟或級(jí)43是相同的。

術(shù)語(yǔ)‘稀疏的’或‘空間稀疏的hoa表示’意指，在該表示中，原始聲場(chǎng)的空間不相關(guān)的信號(hào)分量丟失。具體地說(shuō)，術(shù)語(yǔ)‘稀疏的’可以、但不必意指相應(yīng)hoa表示的大多數(shù)系數(shù)序列為零。例如，僅用兩個(gè)平面波編碼/表示的聲場(chǎng)意指是空間稀疏的。但是，通常，相應(yīng)hoa系數(shù)序列中沒(méi)有一個(gè)將為零。

稀疏的hoa表示d(k-khoa)與延遲補(bǔ)償?shù)膆oa表示c(k-khoa)、活動(dòng)環(huán)境系數(shù)集以及在步驟/級(jí)14中經(jīng)過(guò)延遲補(bǔ)償?shù)膒ar編碼器參數(shù)f、opar、nsig(k-khoa)和vcomplex一起被饋送到par編碼器步驟或級(jí)13。par處理是按nsb個(gè)子帶組進(jìn)行的，其中，矩陣f的行保存用于每個(gè)對(duì)應(yīng)子帶組的par濾波器組的第一子帶索引和最后子帶索引。對(duì)于所有par子帶組，矢量opar包含用于處理的hoa階次。索引集保存用于par處理的、來(lái)自d(k-khoa)的行的索引。用于計(jì)算復(fù)制的環(huán)境hoa表示的一個(gè)空域信號(hào)的每個(gè)子帶組的空域信號(hào)的數(shù)量由用于幀k的矢量nsig(k)定義。矢量vcomplex對(duì)于每個(gè)子帶組指示par混合矩陣的元素是復(fù)值數(shù)、還是實(shí)值非負(fù)數(shù)。根據(jù)這些輸入信號(hào)和參數(shù)，par編碼器計(jì)算編碼的par參數(shù)集γpar(k-khoa-1)，該參數(shù)集也被饋送到步驟/級(jí)16。

復(fù)用器和幀同步步驟/級(jí)16使參數(shù)集γhoa(k-khoa)、γpar(k-khoa-1)和γtrans(k-khoa-kenc)的幀延遲同步，并且將它們組合為編碼的hoa幀γ(k-kmax)。

hoa編碼器延遲由khoa定義，其中，假定hoa解碼器不引入任何附加延遲。相同的定義適用于感知編碼器延遲kenc。par處理還添加一個(gè)幀的延遲，以使總延遲為kmax＝max{khoa+kenc，khoa+1}。

par編碼器

par處理的基本特征是，從稀疏hoa表示d(k′)創(chuàng)建去相關(guān)信號(hào)，并且獲得頻域中的混合矩陣，該混合矩陣將這些去相關(guān)信號(hào)組合為增強(qiáng)稀疏的且高度相關(guān)的hoa表示的、復(fù)制的環(huán)境hoa表示，以便匹配原始hoa表示c(k′)的空間性質(zhì)。在該上下文下，去相關(guān)意指子帶信號(hào)的相位在不改變它的幅值的情況下被修改。因此，圖2所示的par編碼器考慮到par編碼參數(shù)opar、nsig(k′)、vcomplex和而從輸入hoa表示c(k′)和d(k′)計(jì)算編碼的par參數(shù)集γpar(k′-1)，其中，為簡(jiǎn)單起見(jiàn)，引入了索引k′＝k-khoa。

par處理是在頻域中進(jìn)行的。par分析濾波器組將輸入hoa表示變換為它的復(fù)值的頻域表示，其中，假定時(shí)域采樣的數(shù)量等于頻域采樣的數(shù)量。例如，具有nfb個(gè)子帶的正交鏡像濾波器組(qmf)可以用作濾波器組。第一濾波器組24將o×l矩陣c(k′)變換為nfb個(gè)頻域矩陣其中，j＝1，...，nfb且并且第二濾波器組23將o×l矩陣d(k′)變換為nfb個(gè)頻域矩陣其中，j＝1，...，nfb且

在還接收f(shuō)、opar、nsig(k′)和vcomplex的步驟或級(jí)25中，將這些子帶分組為nsb個(gè)子帶組。對(duì)應(yīng)數(shù)量的par子帶編碼器步驟或級(jí)26和27對(duì)每個(gè)子帶組g＝1...nsb的信號(hào)單獨(dú)地進(jìn)行編碼。

par子帶配置由以下矩陣定義：

其中，第一列和第二列保存對(duì)應(yīng)的子帶組g的第一子帶索引和最后子帶索引的索引j。在步驟或級(jí)21中通過(guò)歐洲專利申請(qǐng)ep14306347.7中所描述的方法將子帶配置編碼為參數(shù)集γsubband。因?yàn)樗鼘?duì)于每個(gè)幀索引k是固定的，所以它僅需被發(fā)送到解碼器一次以用于初始化。

步驟/級(jí)25中的子帶分組根據(jù)給定的子帶配置將輸入信號(hào)和參數(shù)引導(dǎo)到每個(gè)par子帶編碼器步驟/級(jí)26、27，使得子帶組g的每個(gè)par子帶編碼器得到opar，g、nsig，g(k′)和vcomplex，g作為對(duì)于所有jg＝fg，1，...，fg，2的輸入。

參數(shù)opar，g指示par編碼器對(duì)其計(jì)算參數(shù)的hoa階次。該階次等于或小于hoa表示c(k′)的hoa階次n。它用于降低用于發(fā)送編碼的par參數(shù)的數(shù)據(jù)速率。矢量

保存用于所有子帶組的hoa階次。

用于創(chuàng)建復(fù)制的環(huán)境hoa表示的一個(gè)空域信號(hào)的去相關(guān)信號(hào)的數(shù)量由以下矢量定義：

其中，0≤nsig，g(k′)≤(opar，g+1)²且它對(duì)于每一個(gè)幀被更新，因?yàn)樗栊盘?hào)的數(shù)量依賴于hoa表示。對(duì)于包括高度空間分散的場(chǎng)景的hoa表示，所需的去相關(guān)信號(hào)多于空間分散度較小的hoa表示所需的去相關(guān)信號(hào)。因?yàn)橛糜诰幋a的par參數(shù)的數(shù)據(jù)速率隨著去相關(guān)信號(hào)的所用數(shù)量而增大，所以該參數(shù)也可以用于降低數(shù)據(jù)速率。

去相關(guān)信號(hào)的混合是通過(guò)矩陣乘法進(jìn)行的，其中，編碼矩陣包括在par參數(shù)集中。矢量

包括指示混合矩陣的元素是實(shí)值非負(fù)數(shù)、還是復(fù)值數(shù)的布爾變量，其中，可以定義對(duì)于vcomplex，g＝1，復(fù)值元素矩陣被用在子帶組g中。由于傳輸信號(hào)z(k)的壓縮，解碼的傳輸信號(hào)的相位信息可能由于參數(shù)化編碼工具而在解碼器端丟失(例如在應(yīng)用譜帶復(fù)制方法的情況下)。在這種情況下，par處理可以僅復(fù)制丟失的環(huán)境分量的空間功率分布，這意味著par混合矩陣的相位信息是過(guò)時(shí)的。

此外，參數(shù)被輸入到每個(gè)par子帶編碼器步驟/級(jí)26、27。該集合保存用于創(chuàng)建去相關(guān)信號(hào)的來(lái)自d(k′)的稀疏hoa系數(shù)序列的索引。這些索引應(yīng)對(duì)hoa階次opar，g內(nèi)的系數(shù)序列進(jìn)行尋址，這些系數(shù)序列不應(yīng)顯著不同于原始hoa表示c(k′)的序列。在最佳情況下，序列在par編碼器處是相同的，使得在解碼器端，選定的序列的不同之處僅在于通過(guò)感知譯碼添加的畸變(distortion)。

最后，在復(fù)用器和幀同步步驟或級(jí)22中，將編碼的par參數(shù)集編碼的子帶配置集γsubband以及par編碼參數(shù)opar、nsig(k′)和vcomplex按它們的幀索引同步，并且將它們復(fù)用到par位流參數(shù)集γpar(k′-1)中。

par子帶編碼器

圖3中更詳細(xì)地示出了par子帶編碼器步驟/級(jí)26和27。對(duì)于par子帶g的每個(gè)子帶jg＝fg，1，...，fg，2，在步驟或級(jí)311、312、313中通過(guò)下面在章節(jié)空間變換中描述的空間變換將矩陣和變換為它們的空域表示和在步驟或級(jí)321、322、323和324中，從這些空域表示計(jì)算以下協(xié)方差矩陣：

以及

其中，a^h表示矩陣a的厄密(hermitian)轉(zhuǎn)置。前一幀的矩陣被包括在內(nèi)，以便獲得協(xié)方差矩陣，這些協(xié)方差矩陣對(duì)于當(dāng)前幀和前一幀是有效的，使得在par解碼器處能夠在兩個(gè)相鄰幀的矩陣之間交叉漸變。

步驟或級(jí)331和332中去相關(guān)信號(hào)的創(chuàng)建將來(lái)自的系數(shù)序列的根據(jù)所用系數(shù)的索引集選擇的子集變換到空域，并且用置換矩陣對(duì)這些空域信號(hào)進(jìn)行置換，以便將信號(hào)分配給創(chuàng)建矩陣的對(duì)應(yīng)的去相關(guān)器。下面在章節(jié)去相關(guān)信號(hào)的創(chuàng)建中給出這些處理步驟的詳細(xì)描述。

為了在步驟或級(jí)341和342中獲得對(duì)應(yīng)的空域信號(hào)的協(xié)方差矩陣，必須用矩陣翻轉(zhuǎn)中所包括的置換。因此，從以下方程獲得去相關(guān)信號(hào)的協(xié)方差矩陣：

為了計(jì)算將逆置換矩陣應(yīng)用于當(dāng)前幀和前一幀以用于獲得對(duì)于兩個(gè)幀都有效的協(xié)方差矩陣。這對(duì)于兩個(gè)相鄰幀的混合矩陣之間的有效交叉漸變以及兩個(gè)相鄰幀的置換是需要的。

假定每個(gè)子帶的hoa表示是彼此獨(dú)立的，使得子帶組的協(xié)方差矩陣可以通過(guò)它的子帶的協(xié)方差矩陣的和來(lái)計(jì)算。從而，par子帶編碼器計(jì)算在組合器步驟或級(jí)352中計(jì)算以下協(xié)方差矩陣：

在組合器步驟或級(jí)354中計(jì)算以下協(xié)方差矩陣：

并且在組合器步驟或級(jí)351中計(jì)算以下協(xié)方差矩陣：

從去相關(guān)信號(hào)的協(xié)方差矩陣、在組合器步驟或級(jí)353中生成的矩陣

以及矩陣和通過(guò)混合矩陣計(jì)算步驟或級(jí)36獲得混合矩陣mg(k′-1)，其處理在章節(jié)混合矩陣的計(jì)算中描述。

最后，在步驟或級(jí)37中，如章節(jié)混合矩陣的編碼中所描述的，對(duì)混合矩陣mg(k′-1)進(jìn)行量化并且編碼為參數(shù)集

空間變換

在空間變換中，通過(guò)對(duì)給定hoa階次opar，g使用章節(jié)實(shí)值球諧函數(shù)的定義中的球諧變換將輸入hoa表示c變換為其空域表示w。因?yàn)閔oa階次opar，g通常小于輸入hoa階次n，所以必須在球諧變換可以被應(yīng)用之前移除c中具有比qpar，g＝(opar，g+1)²高的索引的行。

去相關(guān)信號(hào)的創(chuàng)建

去相關(guān)信號(hào)的創(chuàng)建包括以下處理步驟：

·從稀疏hoa表示選擇由所用系數(shù)的索引集定義的系數(shù)序列的子集；

·對(duì)于hoa階次opar，g根據(jù)章節(jié)空間變換來(lái)進(jìn)行選定系數(shù)序列的空間變換；

·通過(guò)針對(duì)用于環(huán)境復(fù)制的若干個(gè)信號(hào)nsig，g(k′)和hoa階次opar，g選擇的置換矩陣對(duì)用于分配給去相關(guān)器的空域信號(hào)進(jìn)行置換；

·使用在最佳地保持子帶信號(hào)的幅值的同時(shí)修改子帶信號(hào)的相位的單獨(dú)處理對(duì)置換的信號(hào)進(jìn)行去相關(guān)。

在下面，給出這些處理步驟的詳細(xì)描述。

去相關(guān)器通過(guò)用的零矢量取代具有不是索引集的元素的索引的行來(lái)從輸入矩陣移除所有的不活動(dòng)hoa系數(shù)序列。然后使用章節(jié)空間變換中的空間變換來(lái)將所得的矩陣變換為它的空域表示矩陣

在計(jì)算混合矩陣nsig，g(k′)的每行期間，從選擇空間相鄰的信號(hào)。因此，對(duì)矩陣進(jìn)行置換以用于將來(lái)自的信號(hào)引導(dǎo)到去相關(guān)器，使得nsig，g(k′)個(gè)選定信號(hào)之間的去相關(guān)性保證為最佳。必須對(duì)nsig，g(k′)和opar，g的每個(gè)預(yù)定義組合定義固定的qpar，g×qpar，g置換矩陣在章節(jié)置換矩陣和選擇矩陣的計(jì)算中給出了這些置換矩陣的計(jì)算以及對(duì)應(yīng)的信號(hào)選擇表。

然后通過(guò)以下方程進(jìn)行實(shí)際的置換，即，

其中，diag(f)形成來(lái)自f的元素的對(duì)角矩陣。用于不同置換矩陣之間的切換的漸增矢量和漸減矢量由以下方程定義：

其元素從以下方程獲得：

從一個(gè)置換矩陣到另一個(gè)置換矩陣的漸變防止去相關(guān)器的輸入信號(hào)不連續(xù)。隨后，對(duì)應(yīng)的去相關(guān)器對(duì)的每行中的qpar，g個(gè)信號(hào)進(jìn)行去相關(guān)以便形成矩陣mpegsurround標(biāo)準(zhǔn)iso/iecfdis23003-1,mpegsurround第6.6章中定義了所用的去相關(guān)方法。

基本上，每個(gè)去相關(guān)器使每個(gè)頻帶信號(hào)延遲獨(dú)立數(shù)量的采樣，其中，對(duì)于所有的qpar，g個(gè)去相關(guān)器，延遲是相等的。另外，每個(gè)去相關(guān)器將單獨(dú)的全通濾波器應(yīng)用于它的輸入信號(hào)。去相關(guān)器的不同配置使空域信號(hào)的相位信息不同地畸變，這導(dǎo)致空域信號(hào)去相關(guān)。

混合矩陣的計(jì)算

可以對(duì)用vcomplex，g變量標(biāo)示(signalled)的實(shí)值非負(fù)或復(fù)值矩陣元素計(jì)算混合矩陣mg(k′-1)。對(duì)于等于一的vcomplex，g，根據(jù)章節(jié)復(fù)值混合矩陣來(lái)計(jì)算復(fù)值混合矩陣，由此該計(jì)算只有在傳輸信道的感知編碼不破壞子帶組g中的采樣的相位信息時(shí)才可適用。

否則，實(shí)值非負(fù)元素的混合矩陣對(duì)于提取復(fù)制的環(huán)境hoa表示是足夠的。章節(jié)實(shí)值非負(fù)混合矩陣中給出了用于計(jì)算實(shí)值非負(fù)混合矩陣的示例處理。

復(fù)值混合矩陣

混合矩陣的計(jì)算是基于以上提及的vilkamo/baeckstroem/kuntz文章中所描述的方法。通過(guò)y＝mx計(jì)算用于將多聲道信號(hào)x上混為具有更高數(shù)量的聲道的信號(hào)y的混合矩陣m。滿足

的、其中

的、混合矩陣m的解由

給出，其中

其中，||·||fro表示矩陣的frobenius范數(shù)，信號(hào)矢量x、和y的協(xié)方差矩陣∑y是已知的。原型混合矩陣q滿足使得是y的良好近似。因?yàn)閬?lái)自和y的信號(hào)的能量可能不同，所以對(duì)角矩陣g使的能量歸一化為y的能量，其中，g的對(duì)角元素由

給出，并且和是∑y和的對(duì)角元素。第g子帶組的每個(gè)子帶jg＝fg，1，...，fg，2，增強(qiáng)的空域信號(hào)的矩陣cout({k′，k′-1}，jg)假定是通過(guò)以下方程從稀疏hoa表示的空域信號(hào)和混合的空域去相關(guān)信號(hào)的和計(jì)算的：

其中，符號(hào){k′，k′-1}用于表達(dá)混合矩陣mg(k′-1)對(duì)于當(dāng)前幀和前一幀是有效的。

因?yàn)榧俣沼蛐盘?hào)和對(duì)于每個(gè)定義是不相關(guān)的，所以增強(qiáng)的空域信號(hào)cout({k′，k′-1},jg)的相關(guān)矩陣∑out(k′-1)可以通過(guò)以下方程被寫為這兩個(gè)分量的相關(guān)矩陣的和：

為了使增強(qiáng)的稀疏的hoa表示從心理聲學(xué)的角度來(lái)講聽(tīng)起來(lái)像原始hoa表示可以匹配它們的相關(guān)矩陣，即，

該要求導(dǎo)致混合矩陣的以下約束：

其中，δ∑g(k′-1)在方程(12)中定義。

方程(18)和(27)的比較導(dǎo)致以下賦值：

∑y：＝δ∑g(k′-1)(28)

其中，ky和kx可以從δ∑g(k′-1)和的奇異值分解來(lái)計(jì)算。

最后，必須對(duì)所提出的方法定義矩陣q。因?yàn)榫仃?imgfile="bda00012654595900001715.gif"wi="36"he="63"img-content="drawing"img-format="gif"orientation="portrait"inline="no"/>應(yīng)是y的良好近似，所以q必須對(duì)以下方程進(jìn)行求解：

該問(wèn)題的眾所周知的解決方法是通過(guò)使用moore-penrose偽逆解來(lái)最小化如下定義的近似誤差的euclidean范數(shù)，即，

為了降低用于發(fā)送混合矩陣的數(shù)據(jù)速率，可以選擇來(lái)自的nsig，g(k′-1)個(gè)空間相鄰的信號(hào)用于計(jì)算復(fù)制的環(huán)境hoa表示的每個(gè)空域信號(hào)。因此，必須根據(jù)以下選擇矩陣來(lái)單獨(dú)地計(jì)算混合矩陣mg(k′-1)的每行：

其中，元素so，n表示用于創(chuàng)建復(fù)制的環(huán)境hoa表示的第o空域信號(hào)的來(lái)自的行矢量的索引，其中，n＝1...nsig，g(k′-1)。為了對(duì)混合矩陣的每行單獨(dú)地求解方程(19)，必須將方程(19)變換為

其中，p＝vu^h。定義

并且ta是t的a＝1...qpar，g個(gè)列矢量中的一個(gè)。為了計(jì)算mg(k′-1)的o＝1...qpar，g個(gè)行中的每行，構(gòu)建子矩陣

并且通過(guò)以下方程確定矢量mrow，o：

其中，ky，o是來(lái)自ky的第o行矢量，表示moore-penrose偽逆解。在一些情況下，to可以是病態(tài)的，其在偽逆解的計(jì)算中可能需要規(guī)范。

至少，混合矩陣mg(k′-1)的元素mo，i被賦值為：

其中，mrow，o，a是矢量mrow，o的元素并且o＝1...qpar，g。

實(shí)值非負(fù)混合矩陣

但是，對(duì)于可能受感知編碼的譜帶寬復(fù)制影響的高頻子帶組g，在章節(jié)復(fù)值混合矩陣中所描述的方法是不合理的，因?yàn)橄∈璧膆oa表示的重構(gòu)的子帶信號(hào)的相位不能假定為甚至基本上類似于原始子帶信號(hào)的相位。

對(duì)于這樣的情況，可以忽視相位。相反，僅集中于用于計(jì)算混合矩陣mg(k′-1).的信號(hào)功率。用于確定預(yù)測(cè)系數(shù)的合理標(biāo)準(zhǔn)是最小化以下誤差：

其中，運(yùn)算|·|²假定被逐個(gè)元素地應(yīng)用于矩陣。換言之，混合矩陣被選為使得去相關(guān)hoa表示的所有加權(quán)的空間子帶信號(hào)的功率的和最佳地近似原始hoa表示和稀疏hoa表示的空域子帶信號(hào)的殘差的功率。在這種情況下，非負(fù)矩陣因式分解(nmf)技術(shù)可以用于對(duì)該優(yōu)化問(wèn)題進(jìn)行求解。關(guān)于對(duì)nmf的介紹，參見(jiàn)例如1999年nature第401卷第788-791頁(yè)的d.d.lee、h.s.seung的"learningthepartsofobjectsbynonnegativematrixfactorization"。

混合矩陣的編碼

每個(gè)子帶組g＝1，...，nsb的混合矩陣mg(k′-1)將被量化和編碼為參數(shù)集其中，只有由選擇矩陣定義的qpar，g×nsig，g(k′-1)子矩陣被編碼。矩陣元素的量化必須降低數(shù)據(jù)速率，而不降低復(fù)制的環(huán)境hoa表示的感知音頻質(zhì)量。因此，可以利用由于關(guān)于重疊幀計(jì)算協(xié)方差矩陣、在連續(xù)幀的混合矩陣之間存在高相關(guān)性的事實(shí)。具體地說(shuō)，每個(gè)子矩陣元素可以用它的幅值和它的角度表示，然后對(duì)連續(xù)幀之間的角度差和幅值差進(jìn)行編碼。

如果假定幅值位于區(qū)間[0，mmax]內(nèi)，則幅值差位于區(qū)間[-mmax，mmax]內(nèi)。假定角度差位于區(qū)間[-π，π]內(nèi)。為了對(duì)這些差進(jìn)行量化，對(duì)應(yīng)地對(duì)幅值差和角度差使用預(yù)定義位數(shù)。在使用具有實(shí)值非負(fù)元素的混合矩陣的情況下，只有幅值差被編碼，因?yàn)橄辔徊羁偸菫榱恪?/p>

發(fā)明人已經(jīng)通過(guò)實(shí)驗(yàn)發(fā)現(xiàn)，各個(gè)差的出現(xiàn)概率是以高度不均勻的方式分布的。具體地說(shuō)，小的幅值差和角度差的出現(xiàn)頻率顯著高于大的幅值差和角度差。因此，可以利用基于將被編碼的各個(gè)值的先驗(yàn)概率的編碼方法(例如哈夫曼編碼)，以便顯著地減少每個(gè)混合矩陣元素的平均位數(shù)。

另外，對(duì)于每個(gè)幀必須發(fā)送nsig，g(k′-1)的值。為了這個(gè)目的，可以用信號(hào)發(fā)送預(yù)定義表的索引，該索引是針對(duì)每個(gè)有效parhoa階次定義的。

置換矩陣和選擇矩陣的計(jì)算

為了降低用于發(fā)送混合矩陣的數(shù)據(jù)速率，可以減少每行的活動(dòng)(即，非零)元素的數(shù)量?；顒?dòng)行元素對(duì)應(yīng)于空域中的qpar個(gè)去相關(guān)信號(hào)中的用于混合復(fù)制的環(huán)境hoa表示的一個(gè)空域信號(hào)(現(xiàn)在稱為目標(biāo)信號(hào))的nsig個(gè)去相關(guān)信號(hào)。將被混合的去相關(guān)空域信號(hào)的復(fù)值子帶信號(hào)理想地應(yīng)具有目標(biāo)信號(hào)的縮放幅值譜，但是具有不同的相位譜。這可以通過(guò)從目標(biāo)信號(hào)的空間附近選擇要被混合的信號(hào)來(lái)實(shí)現(xiàn)。

因而，在第一步中，對(duì)于每個(gè)第o目標(biāo)信號(hào)位置，o＝1，...，qpar，必須針對(duì)每個(gè)hoa階次opar和每個(gè)數(shù)量的活動(dòng)行nsig找到多組的nsig個(gè)空間相鄰位置。在第二步中，獲得qpar個(gè)輸入信號(hào)對(duì)于qpar個(gè)去相關(guān)器的分配，以便最小化每組中的nsig個(gè)信號(hào)之間的互相關(guān)性。

對(duì)給定hoa階次opar找到一組的nsig個(gè)信號(hào)的一種方式是，計(jì)算所有空域位置和第o目標(biāo)信號(hào)的位置之間的角度距離，并且將屬于nsig個(gè)最小距離的信號(hào)索引選入第o組中。因而，來(lái)自方程(34)的矩陣的第o行矢量包括第o組的遞增排序的索引。假定用于opar和nsig的每個(gè)預(yù)定義組合的矩陣在par編碼器和解碼器中是已知的。

現(xiàn)在，必須找到對(duì)于去相關(guān)器的空域信號(hào)分配并且將該分配存儲(chǔ)在用于opar和nsig的每個(gè)預(yù)定義組合的置換矩陣中。因此，應(yīng)用遍歷所有可能的分配的搜索，以便找到根據(jù)某個(gè)標(biāo)準(zhǔn)的最佳分配。一個(gè)可能的標(biāo)準(zhǔn)是構(gòu)建所有去相關(guān)器的全通脈沖響應(yīng)的協(xié)方差矩陣∑。通過(guò)以下步驟計(jì)算分配的懲罰(penalty)：

·對(duì)于每組通過(guò)從矩陣∑僅選擇分配給該組的信號(hào)的元素來(lái)構(gòu)建協(xié)方差子矩陣；

·對(duì)每個(gè)協(xié)方差子矩陣的最大和最小奇異值的商進(jìn)行求和。

從具有最低懲罰的分配，獲得置換矩陣使得章節(jié)去相關(guān)信號(hào)的創(chuàng)建中的矩陣的每行被置換為分配的去相關(guān)器的對(duì)應(yīng)索引。

hoa解碼器框架

圖4中描繪了包括par解碼器的hoa解碼器/hoa解壓縮器的框架。在解復(fù)用器步驟或級(jí)41中將位流參數(shù)集γ(k)解復(fù)用為輔助信息參數(shù)集γhoa(k)和γpar(k)以及信號(hào)參數(shù)集γtrans(k)。因?yàn)檩o助信息和信號(hào)參數(shù)之間的延遲已經(jīng)在hoa編碼器中被對(duì)齊，所以解碼器端接收它的已經(jīng)同步的數(shù)據(jù)。

信號(hào)參數(shù)集γtrans(k)被饋送到感知音頻解碼器步驟或級(jí)42，感知音頻解碼器步驟或級(jí)42從信號(hào)參數(shù)集γtrans(k)解碼稀疏的hoa表示后面的hoa解碼器步驟或級(jí)43從解碼的傳輸信號(hào)和輔助信息參數(shù)集γhoa(k)組成解碼的稀疏的hoa表示索引集也由hoa解碼器步驟/級(jí)43重構(gòu)。解碼的稀疏的hoa表示索引集以及par輔助信息參數(shù)集γpar(k)被饋送到par解碼器步驟或級(jí)44，par解碼器步驟或級(jí)44從解碼的稀疏hoa表示索引集以及par輔助信息參數(shù)集γpar(k)重構(gòu)復(fù)制的環(huán)境hoa表示，并且將解碼的稀疏的hoa表示增強(qiáng)為解碼的hoa表示

par解碼器框架

圖5所示的par解碼器框架用解碼的復(fù)制的環(huán)境hoa表示cpar(k)增強(qiáng)解碼的稀疏的hoa表示以便重構(gòu)解碼的hoa表示根據(jù)所應(yīng)用的濾波器組的分析和合成延遲來(lái)使解碼的hoa表示的采樣延遲。

在解復(fù)用器步驟或級(jí)51中將par輔助信息參數(shù)集γpar(k)解復(fù)用為子帶配置集γsubband、par參數(shù)opar、nsig(k)、vcomplex以及用于各個(gè)子帶組g＝1，...，nsb的編碼的混合矩陣的數(shù)據(jù)集。

并行地，在分析濾波器組步驟或級(jí)52中將解碼的稀疏的hoa表示轉(zhuǎn)換為第j＝1，...，nfb頻帶hoa表示矩陣所應(yīng)用的濾波器組必須與在編碼器端的par編碼器中已經(jīng)使用的濾波器組是相同的。

從子帶配置集γsubband，在步驟或級(jí)53中解碼如方程(1)中定義的子帶組數(shù)量nsb和子帶配置矩陣f，并且將它們饋送到組分派步驟或級(jí)54。根據(jù)這些參數(shù)，組分派步驟或級(jí)54對(duì)于子帶1...nsb將來(lái)自步驟/級(jí)51和53的參數(shù)以及來(lái)自步驟/級(jí)52的頻帶hoa表示引導(dǎo)到對(duì)應(yīng)的par子帶解碼器步驟或級(jí)55、56。

nsb個(gè)par子帶解碼器55、56對(duì)于對(duì)應(yīng)頻帶jg＝fg，1，...，fg，2從解碼的稀疏的hoa表示矩陣以及par子帶參數(shù)opar、vcomplex、nsig(k)、和創(chuàng)建復(fù)制的環(huán)境hoa表示的系數(shù)序列。

在合成濾波器組步驟或級(jí)58中將每個(gè)頻帶的所得的復(fù)制的環(huán)境hoa表示矩陣變換為時(shí)域hoa表示cpar(k)。最后，在組合步驟或級(jí)59中逐個(gè)采樣地將cpar(k)加到(在濾波器組延遲補(bǔ)償57中)經(jīng)過(guò)延遲補(bǔ)償?shù)南∈璧膆oa表示以便創(chuàng)建解碼的hoa表示

par子帶解碼器

圖6中所描繪的par子帶解碼器為子帶組g的頻帶jg＝fg，1，...，fg，1創(chuàng)建頻域復(fù)制的環(huán)境hoa表示矩陣

并行地，在步驟或級(jí)611、612中，使用參數(shù)opar，g和nsig，g(k)從稀疏的hoa表示矩陣的系數(shù)序列生成置換的且去相關(guān)的空域信號(hào)矩陣其中，該處理與章節(jié)去相關(guān)信號(hào)的創(chuàng)建中的用在par子帶編碼器中的處理是相同的。

此外，在混合矩陣解碼步驟或級(jí)63中，使用參數(shù)opar，g、nsig，g(k)和vcomplex，g從編碼的混合矩陣的數(shù)據(jù)集獲得混合矩陣章節(jié)混合矩陣的解碼中描述了混合矩陣元素的實(shí)際解碼。

隨后，在環(huán)境復(fù)制步驟或級(jí)621、622中，通過(guò)章節(jié)環(huán)境復(fù)制中描述的環(huán)境復(fù)制處理對(duì)于子帶組g的每個(gè)頻帶jg，使用opar，g、nsig，g(k)和從對(duì)應(yīng)的去相關(guān)空域信號(hào)生成復(fù)制的環(huán)境hoa表示的空域信號(hào)

最后，在步驟或級(jí)641、642中使用opar，g和逆空間變換將復(fù)制的環(huán)境hoa表示的空域信號(hào)變換回它們的hoa表示，其中，章節(jié)球諧變換中的逆球諧變換被應(yīng)用。創(chuàng)建的復(fù)制的環(huán)境hoa表示矩陣必須具有尺寸其中，只有對(duì)應(yīng)parhoa階次opar，g的前qpar，g個(gè)行具有非零元素。

混合矩陣的解碼

編碼的混合矩陣的元素的索引由當(dāng)前的選擇矩陣定義，使得每個(gè)混合矩陣的qpar，g乘以nsig，g(k)個(gè)元素必須被解碼。

因此，在第一步中，根據(jù)par編碼器中應(yīng)用的對(duì)應(yīng)熵編碼對(duì)每個(gè)矩陣元素的角度差和幅值差進(jìn)行解碼。然后，將解碼的角度差和幅值差加到前一幀的重構(gòu)的qpar，g×qpar，g角度和幅值混合矩陣，其中，只有當(dāng)前選擇矩陣中的元素被使用，并且所有的其他元素都必須被設(shè)置為零。從更新的重構(gòu)的角度和幅值混合矩陣，通過(guò)以下方程恢復(fù)解碼的混合矩陣的復(fù)值：

其中，ma，b是的第a行第b列中的元素，mangle，a，b和mabs，a，b是更新的重構(gòu)的角度和幅值混合矩陣的對(duì)應(yīng)元素。

環(huán)境復(fù)制

環(huán)境復(fù)制進(jìn)行由用于參數(shù)opar，g和nsig，g(k)的置換矩陣定義的去相關(guān)空域信號(hào)的逆置換，接著再乘以混合矩陣為了平緩地轉(zhuǎn)變相鄰幀的參數(shù)，使用當(dāng)前幀和前一幀的參數(shù)來(lái)對(duì)來(lái)自當(dāng)前幀的去相關(guān)信號(hào)進(jìn)行處理和交叉漸變。環(huán)境復(fù)制的處理因此由以下方程定義，即，

其中，使用來(lái)自方程(14)和(15)的交叉漸變函數(shù)。

高階高保真立體聲的基礎(chǔ)

高階高保真立體聲(hoa)基于感興趣的緊湊區(qū)域內(nèi)的聲場(chǎng)的描述，所述感興趣的緊湊區(qū)域假定是沒(méi)有聲源的。在這種情況下，在時(shí)刻t時(shí)感興趣區(qū)域內(nèi)的位置x處的聲壓p(t，x)的空間時(shí)間行為在物理上完全由齊次波動(dòng)方程(homogeneouswaveequation)確定。在下面，采取如圖7所示的球坐標(biāo)系。在所用的坐標(biāo)系中，x軸指向前面的位置，y軸指向左，z軸指向頂部?？臻gx＝(r，θ，φ)^t中的位置用半徑r＞0(即，到坐標(biāo)原點(diǎn)的距離)、從極坐標(biāo)z測(cè)量的傾角θ∈[0，π]以及在x-y平面中從x軸逆時(shí)針測(cè)量的方位角φ∈[0，2π[表示。此外，(·)^t表示轉(zhuǎn)置。

然后，從“傅里葉聲學(xué)”課本可以示出，所表示的聲壓相對(duì)于時(shí)間的傅里葉變換，即，

其中，ω表示角頻率，i指示虛數(shù)單位，該式可以根據(jù)以下方程被展開(kāi)為球諧級(jí)數(shù)(seriesofsphericalharmonics)：

其中，cs表示聲音的速度，k表示按照與角頻率ω相關(guān)的角波數(shù)。此外，jn(·)表示第一種球貝塞爾函數(shù)，表示階次n、度數(shù)m的實(shí)值球諧函數(shù)，這在章節(jié)實(shí)值球諧函數(shù)的定義中定義。展開(kāi)系數(shù)僅依賴于角波數(shù)k。注意，已經(jīng)隱含地假定聲壓在空間上是帶受限的。因而，該級(jí)數(shù)相對(duì)于上限n處的階次索引n(其被稱為hoa表示的階次)被截?cái)唷?/p>

如果聲場(chǎng)用從由角度元組(θ，φ)指定的所有可能的方向到達(dá)的無(wú)限數(shù)量的不同角頻率ω的諧平面波的疊加表示，則可以表明(參見(jiàn)2004年10月j.acoust.soc.am.第4(116)卷第2149–2157頁(yè)的b.rafaely的"plane-wavedecompositionofthesoundfieldonaspherebysphericalconvolution")，相應(yīng)的平面波復(fù)幅度函數(shù)c(ω，θ，φ)可以用以下球諧展開(kāi)表達(dá)：

其中，展開(kāi)系數(shù)按照

與展開(kāi)系數(shù)相關(guān)。

假定各個(gè)系數(shù)是角頻率ω的函數(shù)，逆傅里葉變換(用表示)的應(yīng)用對(duì)于每個(gè)階次n和度數(shù)m提供以下時(shí)域函數(shù)：

這些時(shí)域函數(shù)在這里被稱為連續(xù)時(shí)間hoa系數(shù)序列，這些連續(xù)時(shí)間hoa系數(shù)序列可以通過(guò)以下方程收集在單個(gè)矢量c(t)中：

矢量c(t)內(nèi)的hoa系數(shù)序列的位置索引由n(n+1)+1+m給出。矢量c(t)中的元素的總數(shù)由o＝(n+1)²給出。

最終的高保真立體聲格式如下使用采樣頻率fs來(lái)提供c(t)的采樣版本：

{c(lts)}l∈n＝{c(ts)，c(2ts)，c(3ts)，c(4ts)，...}(49)

其中，ts＝1/fs表示采樣周期。c(lts)的元素被稱為離散時(shí)間hoa系數(shù)序列，這些離散時(shí)間hoa系數(shù)序列可以被示出為總是實(shí)值的。該性質(zhì)也適用于連續(xù)時(shí)間版本

實(shí)值球諧函數(shù)的定義

實(shí)值球諧函數(shù)(其采取根據(jù)universitéparis的j.daniel的2001年6月的博士論文"représentationdechampsacoustiques,applicationàlatransmissionetàlareproductiondescènessonorescomplexesdansuncontextemultimédia"第3.1章的sn3d歸一化)由以下方程給出：

其中，

相關(guān)聯(lián)的legendre函數(shù)pn，m(x)被定義為：

該函數(shù)具有l(wèi)egendre多項(xiàng)式pn(x)，并且不同于1999年appliedmathematicalsciences,academicpress第93卷中e.g.williams的"fourieracoustics"中那樣，沒(méi)有condon-shortley相位項(xiàng)(-1)^m。

球諧變換

如果hoa序列的空間表示在幾乎均勻分布在單位球體上的數(shù)量o個(gè)空間方向ωo,1≤o≤o上被離散化，則獲得o個(gè)定向信號(hào)c(t，ωo)。如下將這些信號(hào)收集到矢量中：

cspat(t)：＝[c(t，ω1)...c(t，ωo)]^t(53)

可以通過(guò)如下的簡(jiǎn)單矩陣乘法從方程(48)中定義的連續(xù)高保真立體聲表示c(t)計(jì)算該矢量：

cspat(t)＝ψ^hc(t)(54)

其中，(·)^h指示聯(lián)合轉(zhuǎn)置和共軛，ψ表示由以下方程定義的模式矩陣：

ψ：＝[s1...so](55)

其中，

因?yàn)榉较颚豲幾乎均勻地分布在單位球體上，所以模式矩陣一般是可逆的。因此，可以通過(guò)以下方程從定向信號(hào)c(t，ωo)計(jì)算連續(xù)高保真立體聲表示：

c(t)＝ψ^-hcspat(t)(57)

這兩個(gè)方程構(gòu)成高保真立體聲表示和空域之間的變換和逆變換。這些變換被稱為球諧變換和逆球諧變換。

因?yàn)榉较颚豲幾乎均勻地分布在單位球體上，所以近似