用于編碼和解碼基于對(duì)象的音頻信號(hào)的方法和裝置的制作方法

文檔序號(hào)：2830498閱讀：203來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專(zhuān)利>樂(lè)器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專(zhuān)利名稱：用于編碼和解碼基于對(duì)象的音頻信號(hào)的方法和裝置的制作方法
技術(shù)領(lǐng)域：
本發(fā)明涉及一種音頻編碼方法和裝置，以及一種音頻解碼方法和裝置，其中每一個(gè)對(duì)象音頻信號(hào)的聲像可被定位于任何希望的位置。
背景技術(shù)：
一般來(lái)說(shuō)，在多聲道音頻編碼和解碼技術(shù)中，多聲道信號(hào)的多個(gè) 聲道信號(hào)被縮減混音進(jìn)少數(shù)聲道信號(hào)中，傳輸關(guān)于原始聲道信號(hào)的邊信息并且恢復(fù)具有和原始多聲道信號(hào)一樣多的聲道的多聲道信號(hào)。
基于對(duì)象的音頻編碼和解碼技術(shù)與多聲道音頻編碼和解碼技術(shù)在將多個(gè)聲音源縮減混音進(jìn)少數(shù)聲音源信號(hào)中，并傳輸關(guān)于原始聲音源的邊信息方面是基本上相似的。然而，在基于對(duì)象的音頻編碼和解碼技術(shù)中，對(duì)象信號(hào)，其為聲道信號(hào)的基本元素(例如樂(lè)器的聲音或人的語(yǔ)音)，被視為與多聲道音頻編碼和解碼技術(shù)中的聲道信號(hào)相同，并且也可被編/解碼。
換句話說(shuō)，在基于對(duì)象的音頻編碼和解碼技術(shù)中，每個(gè)對(duì)象信號(hào)
將被視為編/解碼的主體(entities)。在這點(diǎn)上，基于對(duì)象的音頻編碼和解碼技術(shù)與多聲道音頻編碼和解碼技術(shù)是有區(qū)別的，該區(qū)別在于多聲道音頻編/解碼是簡(jiǎn)單的根據(jù)聲道間信息而被編/解碼的，而與要被編 /解碼的聲道信號(hào)中的元素?cái)?shù)量無(wú)關(guān)。

發(fā)明內(nèi)容
技術(shù)問(wèn)題
本發(fā)明提供了一種音頻編碼方法和裝置，以及一種音頻解碼方法和裝置，其中可對(duì)音頻信號(hào)進(jìn)行編碼或解碼以使每一個(gè)對(duì)象音頻信號(hào)的聲像可被定位于任何希望的位置。技術(shù)方案
根據(jù)本發(fā)明的一個(gè)方面，其提供了一種音頻解碼方法，包括從輸入音頻信號(hào)中提取縮減混音信號(hào)和基于對(duì)象的邊信息；基于輸入控制信息生成渲染信息；以及基于該渲染信息和該基于對(duì)象的邊信息，生成基于聲道的邊信息。
根據(jù)本發(fā)明的另一個(gè)方面，其提供了一種音頻解碼裝置，包括解復(fù)用器，用于從輸入音頻信號(hào)中提取縮減混音信號(hào)和基于對(duì)象的邊信息；渲染器，用于基于輸入控制信息生成渲染信息；以及代碼轉(zhuǎn)換
器，用于基于該渲染信息和該基于對(duì)象的邊信息生成基于聲道的邊信息。
根據(jù)本發(fā)明的另一個(gè)方面，其提供了一種計(jì)算機(jī)可讀記錄介質(zhì)，其上記錄了用于執(zhí)行音頻解碼方法的計(jì)算機(jī)程序，該音頻解碼方法包
括從輸入音頻信號(hào)中提取縮減混音信號(hào)和基于對(duì)象的邊信息；基于輸入控制信息生成渲染信息；以及基于該渲染信息和該基于對(duì)象的邊信息，生成基于聲道的邊信息。
有益效果
提供了一種音頻編碼方法和裝置，以及一種音頻解碼方法和裝置，其中可對(duì)音頻信號(hào)進(jìn)行編碼或解碼以使每一個(gè)對(duì)象音頻信號(hào)的聲像可被定位于任何希望的位置。

通過(guò)以下的詳細(xì)描述和附圖，本發(fā)明將變得更加易于理解，附圖只是示例性的，其并不構(gòu)成對(duì)本發(fā)明的限制，其中
圖1是典型的基于對(duì)象的音頻編碼/解碼系統(tǒng)的方框圖；圖2是根據(jù)本發(fā)明第一實(shí)施例的音頻解碼裝置的方框圖；圖3是根據(jù)本發(fā)明第二實(shí)施例的音頻解碼裝置的方框圖4用于解釋幅度差和時(shí)間差對(duì)于聲像定位的影響，其是相互獨(dú)
立的；
圖5是關(guān)于幅度差和時(shí)間差之間的對(duì)應(yīng)關(guān)系的函數(shù)圖，其中該幅
度差和時(shí)間差是將聲像定位于預(yù)定位置所需要的；圖6表示包括諧波信息的控制數(shù)據(jù)的格式；圖7是根據(jù)本發(fā)明第三實(shí)施例的音頻解碼裝置的方框圖；圖8是可被應(yīng)用于如圖7所示的音頻解碼裝置中的藝術(shù)縮減混音
增益(ADG)模塊的方框圖9是根據(jù)本發(fā)明第四實(shí)施例的音頻解碼裝置的方框圖；圖IO是根據(jù)本發(fā)明第五實(shí)施例的音頻解碼裝置的方框圖11是根據(jù)本發(fā)明第六實(shí)施例的音頻解碼裝置的方框圖12是根據(jù)本發(fā)明第七實(shí)施例的音頻解碼裝置的方框圖；圖13是根據(jù)本發(fā)明第八實(shí)施例的音頻解碼裝置的方框圖；圖14是用于解釋由圖13所示的音頻解碼裝置使用于幀的三維
(3D)信息的應(yīng)用的框圖15是根據(jù)本發(fā)明第九實(shí)施例的音頻解碼裝置的方框圖；圖16是根據(jù)本發(fā)明第十實(shí)施例的音頻解碼裝置的方框圖17-19是用于解釋根據(jù)本發(fā)明一個(gè)實(shí)施例的音頻解碼方法的框
圖20是根據(jù)本發(fā)明一個(gè)實(shí)施例的音頻編碼裝置的方框圖。
實(shí)施本發(fā)明的最佳模式
現(xiàn)在將參考附圖來(lái)詳細(xì)說(shuō)明本發(fā)明，在附圖中已表示了本發(fā)明的示例性實(shí)施例。
根據(jù)本發(fā)明的一種音頻編碼方法和裝置以及一種音頻解碼方法和裝置可被應(yīng)用于基于對(duì)象的音頻處理操作，但是本發(fā)明并不限于此。換句話說(shuō)，該音頻編碼方法和裝置以及音頻解碼方法和裝置還可被應(yīng) 用于基于對(duì)象的音頻處理操作之外的各種信號(hào)處理操作。
7圖1是典型的基于對(duì)象的音頻編碼/解碼系統(tǒng)的方框圖。通常來(lái)說(shuō)，輸入給基于對(duì)象的音頻編碼裝置的音頻信號(hào)與多聲道信號(hào)的聲道是不對(duì)應(yīng)的，這些音頻信號(hào)是獨(dú)立的對(duì)象信號(hào)。在這點(diǎn)上，基于對(duì)象的音頻編碼裝置與多聲道音頻編碼裝置是不同的，其區(qū)別在于多聲道音頻編碼裝置輸入多聲道信號(hào)的聲道信號(hào)。
舉例來(lái)說(shuō)，諸如5.1聲道信號(hào)的左前聲道信號(hào)和右前聲道信號(hào)之類(lèi)的聲道信號(hào)被輸入到多聲道音頻編碼裝置中，然而諸如人語(yǔ)音或樂(lè) 器聲音(例如小提琴或鋼琴的聲音)之類(lèi)的比聲道信號(hào)小的主體的對(duì) 象音頻信號(hào)可被輸入到基于對(duì)象的音頻編碼裝置中。
參見(jiàn)圖1，該基于對(duì)象的音頻編碼/解碼系統(tǒng)包括基于對(duì)象的音頻編碼裝置和基于對(duì)象的音頻解碼裝置?；趯?duì)象的音頻編碼裝置包
括對(duì)象編碼器100，基于對(duì)象的音頻解碼裝置包括對(duì)象解碼器111和渲染器113。
對(duì)象編碼器100接收N個(gè)對(duì)象音頻信號(hào)，并且生成帶有一個(gè)或多個(gè)聲道的基于對(duì)象的縮減混音信號(hào)和邊信息，上述邊信息包括從N個(gè) 對(duì)象音頻信號(hào)中提取的多條信息片，例如能量差，相位差和相關(guān)性值。邊信息和基于對(duì)象的縮減混音信號(hào)被合并入一個(gè)單一比特流中，并且該比特流被傳輸給基于對(duì)象的解碼裝置。
邊信息可包括指示是否執(zhí)行基于聲道的音頻編/解碼或基于對(duì)象的音頻編/解碼的標(biāo)志，貝ij，可以根據(jù)邊信息的標(biāo)志來(lái)確定是執(zhí)行基于聲道的音頻編/解碼還是執(zhí)行基于對(duì)象的音頻編/解碼。邊信息還可包括關(guān)于對(duì)象信號(hào)的包絡(luò)信息、分組信息、靜止期信息和延遲信息。邊信息還可包括對(duì)象電平差信息、對(duì)象間互相關(guān)信息、縮減混音增益信息、縮減混音聲道電平差信息和絕對(duì)對(duì)象能量信息。對(duì)象解碼器111接收來(lái)自基于對(duì)象音頻編碼裝置的基于對(duì)象的縮減混音信號(hào)和邊信息，并且根據(jù)基于對(duì)象的縮減混音信號(hào)和邊信息來(lái)
恢復(fù)具有與N個(gè)對(duì)象音頻信號(hào)相似屬性的對(duì)象信號(hào)。由對(duì)象解碼器111
生成的對(duì)象信號(hào)并沒(méi)有被分配給多聲道空間中的任何位置。因此渲染
器113將由對(duì)象解碼器111生成的對(duì)象信號(hào)的每一個(gè)分配給多聲道空間中的預(yù)定位置，并且渲染器113確定對(duì)象信號(hào)的電平，這樣可通過(guò) 由渲染器113指定的各個(gè)相應(yīng)位置和由渲染器113確定的各個(gè)相應(yīng)電平來(lái)再現(xiàn)對(duì)象信號(hào)。與由對(duì)象解碼器111生成的每個(gè)對(duì)象信號(hào)相關(guān)的控制信息可隨時(shí)間而改變，貝IJ，由對(duì)象解碼器111生成的對(duì)象信號(hào)的電平和空間位置可根據(jù)控制信號(hào)而改變。
圖2是根據(jù)本發(fā)明第一實(shí)施例的音頻解碼裝置120的方框圖。參見(jiàn)圖2，該音頻解碼裝置120包括對(duì)象解碼器121，渲染器123，和參數(shù)變換器125。該音頻解碼裝置120還包括解復(fù)用器(未示出)，用于從輸入的比特流中提取縮減混音信號(hào)和邊信息，并且該解復(fù)用器將應(yīng)用于根據(jù)本發(fā)明的其它實(shí)施例的所有音頻解碼裝置中。
對(duì)象解碼器121根據(jù)縮減混音信號(hào)和由參數(shù)變換器125提供的修改后的邊信息來(lái)生成多個(gè)對(duì)象信號(hào)。渲染器123將由對(duì)象解碼器121 生成的對(duì)象信號(hào)的每一個(gè)分配到多聲道空間中的預(yù)定位置，并且根據(jù) 控制信息來(lái)確定由對(duì)象解碼器121生成的對(duì)象信號(hào)的電平。參數(shù)變換器125通過(guò)組合邊信息和控制信息來(lái)生成修改后的邊信息。接著，參數(shù)變換器125將修改后的邊信息傳輸給對(duì)象解碼器121。
對(duì)象解碼器121可通過(guò)分析修改后的邊信息中的控制信息來(lái)執(zhí)行自適應(yīng)解碼。
舉例來(lái)說(shuō)，如果控制信息指示第一對(duì)象信號(hào)和第二對(duì)象信號(hào)被分配給多聲道空間中的相同的位置，并且具有相同的電平，則典型的音頻解碼裝置可分別解碼第一和第二對(duì)象信號(hào)，接著通過(guò)混音/渲染操作來(lái)將它們安排到多聲道空間中。
在另一方面，音頻解碼裝置120的對(duì)象解碼器121從修改后的邊信息中的控制信息中得知第一和第二對(duì)象信號(hào)被分配到多聲道空間中的相同位置，并且具有相同電平，如同第一和第二對(duì)象信號(hào)是一個(gè)單獨(dú)的聲音源。從而，對(duì)象解碼器121將第一和第二對(duì)象信號(hào)看成一個(gè) 單獨(dú)的聲音源而解碼第一和第二對(duì)象信號(hào)，而不將它們分開(kāi)解碼。這樣的話，解碼的復(fù)雜度降低了。另外，因?yàn)樾枰幚淼穆曇粼吹臄?shù)量減少了，混音/渲染的復(fù)雜度也降低了。
音頻解碼裝置120可被有效的使用于當(dāng)對(duì)象信號(hào)的數(shù)量大于輸出聲道的數(shù)量這種情況，因?yàn)槎鄠€(gè)對(duì)象信號(hào)很有可能被分配到相同的空間位置。
可選的是，音頻解碼裝置120可被使用于當(dāng)?shù)谝粚?duì)象信號(hào)和第二對(duì)象信號(hào)被分配到多聲道空間中的相同位置，但具有不同電平這種情況。這種情況下，音頻解碼裝置120將第一和第二對(duì)象信號(hào)視為一體來(lái)解碼第一和第二對(duì)象信號(hào)，而不分別解碼第一和第二對(duì)象信號(hào)，并
且將解碼后的第一和第二對(duì)象信號(hào)傳輸給渲染器123。更具體來(lái)說(shuō)，對(duì) 象解碼器121從修改后的邊信息中的控制信息得到關(guān)于第一和第二對(duì) 象信號(hào)的電平之間的差的信息，并根據(jù)獲得的信息來(lái)解碼第一和第二對(duì)象信號(hào)。這樣的話，即使第一和第二對(duì)象信號(hào)具有不同電平，也可將第一和第二對(duì)象信號(hào)當(dāng)成單一聲音源來(lái)進(jìn)行解碼。
同樣可選的是，對(duì)象解碼器121可根據(jù)控制信息來(lái)調(diào)整由對(duì)象解碼器121生成的對(duì)象信號(hào)的電平。接著，對(duì)象解碼器121可解碼調(diào)整過(guò)電平的對(duì)象信號(hào)。從而，渲染器123不需要調(diào)整由對(duì)象解碼器121 提供的解碼后的對(duì)象信號(hào)，而只要簡(jiǎn)單的將由對(duì)象解碼器121提供的解碼后的對(duì)象信號(hào)安排到多聲道空間中。簡(jiǎn)而言之，因?yàn)閷?duì)象解碼器 121根據(jù)控制信息調(diào)整了由對(duì)象解碼器121生成的對(duì)象信號(hào)的電平，渲染器123可容易的將由對(duì)象解碼器121生成的對(duì)象信號(hào)安排到多聲道空間中，而不需要額外的調(diào)整由對(duì)象解碼器121生成的對(duì)象信號(hào)的電平。因此，可以減少混音/渲染的復(fù)雜度。
根據(jù)圖2的實(shí)施例，音頻解碼裝置120的對(duì)象解碼器可通過(guò)對(duì)控制信息的分析來(lái)自適應(yīng)的執(zhí)行解碼操作，從而減少解碼的復(fù)雜度和混音/渲染的復(fù)雜度?？墒褂糜梢纛l解碼裝置120執(zhí)行的上述方法的組合。
圖3是根據(jù)本發(fā)明第二實(shí)施例的音頻解碼裝置130的方框圖。參見(jiàn)圖3，音頻解碼裝置130包括對(duì)象解碼器131和渲染器133。該音頻解碼裝置130的特征在于其不僅提供邊信息給對(duì)象解碼器131，還提供給渲染器133。
即使在存在相應(yīng)于靜止期的對(duì)象信號(hào)時(shí)，音頻解碼裝置130也可有效的執(zhí)行解碼操作。舉例來(lái)說(shuō)，第二至第四對(duì)象信號(hào)可能相應(yīng)于樂(lè) 器演奏的音樂(lè)演奏期，而第一對(duì)象信號(hào)可能相應(yīng)于伴奏演奏的靜止期。
在這種情況下，指示多個(gè)對(duì)象信號(hào)中的哪一個(gè)對(duì)應(yīng)于靜止期的信息可被包括在邊信息中，并且該邊信息可被提供給渲染器133和對(duì)象解碼器131。
對(duì)象解碼器131可通過(guò)不對(duì)相應(yīng)于靜止期的對(duì)象信號(hào)進(jìn)行解碼來(lái) 最小化解碼復(fù)雜度。對(duì)象解碼器131將一個(gè)對(duì)象信號(hào)設(shè)置為相應(yīng)于0 值，并且將該對(duì)象信號(hào)的電平傳輸給渲染器133。一般來(lái)說(shuō)，具有0值的對(duì)象信號(hào)被視為與具有非0值的對(duì)象信號(hào)相同，并且一起進(jìn)入混音/ 渲染操作。
在另一方面，音頻解碼裝置130傳輸包括指示多個(gè)對(duì)象物體相應(yīng) 于靜止期的信息的邊信息給渲染器133，接著阻止相應(yīng)于靜止期的對(duì)象信號(hào)進(jìn)入由渲染器133執(zhí)行的混音/渲染操作。因此，音頻解碼裝置130 可阻止混音/渲染的復(fù)雜度的不必要增加。
11渲染器133可使用包括在控制信息中的混音參數(shù)信息來(lái)定義立體聲場(chǎng)景中的每個(gè)對(duì)象信號(hào)的聲像。混音參數(shù)信息可僅包括幅度信息或包括幅度信息和時(shí)間信息。混音參數(shù)信息不僅影響立體聲聲像的定位，還影響用戶對(duì)于空間聲音質(zhì)量的心理聲學(xué)的感覺(jué)。
舉例來(lái)說(shuō)，通過(guò)比較分別通過(guò)使用時(shí)間淘選方法和幅度淘選方法
生成的，及使用2聲道立體聲揚(yáng)聲器在相同位置再現(xiàn)的兩個(gè)聲像，可
以得知幅度淘選方法可實(shí)現(xiàn)聲像的精確定位，而時(shí)間淘選方法可以提
供有空間深厚感的自然聲音。貝U，如果渲染器133僅使用幅度淘選方法來(lái)在多聲道空間中安排對(duì)象信號(hào)，渲染器133可以精確的定位每個(gè) 聲像，但是不能提供使用時(shí)間淘選方法時(shí)的聲音的深厚感。根據(jù)聲源的類(lèi)型，用戶有時(shí)會(huì)偏好聲音的精確定位而不是聲音的深厚感，反之亦然。
圖4(a)和4(b)解釋在使用2聲道立體聲揚(yáng)聲器來(lái)再現(xiàn)信號(hào)時(shí)強(qiáng)度差(幅度差)和時(shí)間差對(duì)于聲像定位的影響。參見(jiàn)圖4(a)和4(b)，根據(jù) 互相獨(dú)立的幅度差和時(shí)間差，來(lái)將一個(gè)聲像定位到預(yù)定角度。例如，可以使用大約8dB的幅度差，或與8dB的幅度差相等的大約0.5ms的時(shí)間差來(lái)將聲像定位在角度20。因此，即使僅提供了幅度差作為混音參數(shù)信息，也能夠通過(guò)將幅度差轉(zhuǎn)換為時(shí)間差來(lái)獲得具有不同屬性的多種聲音，其中時(shí)間差在聲像定位期間等同于幅度差。
圖5表示關(guān)于將聲像定位于角度10、 20和30所需要的幅度差和時(shí)間差之間對(duì)應(yīng)關(guān)系的函數(shù)。圖5中所示的函數(shù)可根據(jù)圖4(a)和4(b) 獲得。參見(jiàn)圖5，多種幅度差-時(shí)間差的比較可被提供來(lái)將聲像定位于預(yù)定位置。例如，假設(shè)8dB的幅度差被提供為混音參數(shù)信息來(lái)將聲像定位在角度20。根據(jù)圖5所示的函數(shù)，還可使用3dB的幅度差和0.3ms 的時(shí)間差的組合來(lái)將聲像定位在角度20。在這種情況下，不僅提供幅度差信息還提供時(shí)間差信息作為混音參數(shù)信息，從而增強(qiáng)了空間感。因此，為了在混音/渲染操作期間生成具有用戶期望的屬性的聲
音，混音參數(shù)信息可被適當(dāng)?shù)霓D(zhuǎn)換，使得能夠執(zhí)行適合于用戶的幅度
淘選和時(shí)間淘選中的任何一個(gè)。也就是說(shuō)，如果混音參數(shù)信息僅包括
幅度差信息，但用戶期望具有空間深厚感的聲音，該幅度差信息可參
考心理聲學(xué)數(shù)據(jù)而被轉(zhuǎn)換為等同于幅度差信息的時(shí)間差信息。可選的
是，如果用戶同時(shí)期望空間深厚感的聲音和聲像的精確定位，幅度差
信息可被轉(zhuǎn)換為幅度差信息和等同于原始幅度信息的時(shí)間差信息的組合。
可選的是，如果混音參數(shù)信息僅包括時(shí)間差信息，但用戶期望聲像的精確定位，該時(shí)間差信息可被轉(zhuǎn)換為等同于時(shí)間差信息的幅度差信息，或可被轉(zhuǎn)換為幅度差信息和時(shí)間差信息的組合，該組合可通過(guò) 增強(qiáng)聲像的精確定位和空間感來(lái)滿足用戶的偏好。
仍然可選的是，如果混音參數(shù)信息包括幅度差信息和時(shí)間差信息，并且用戶選擇聲像的精確定位，幅度差信息和時(shí)間差信息的組合可被轉(zhuǎn)換為等同于原始幅度差信息和時(shí)間差信息的組合的幅度差信息。在另一方面，如果混音參數(shù)信息包括幅度差信息和時(shí)間差信息，并且用戶期望空間感的增強(qiáng)，幅度差信息和時(shí)間差信息的組合可被轉(zhuǎn)換為等同于幅度差信息和原始時(shí)間差信息組合的時(shí)間差信息。
參見(jiàn)圖6，控制信息可包括關(guān)于一個(gè)或多個(gè)對(duì)象信號(hào)的混音/渲染信息和諧波信息。諧波信息可包括關(guān)于一個(gè)或多個(gè)對(duì)象信號(hào)的基音信息，基頻信息和主頻帶信息中的至少一個(gè)，以及每個(gè)對(duì)象信號(hào)的每個(gè) 子帶的頻譜和能量的說(shuō)明。
因?yàn)橐宰訋閱挝粓?zhí)行操作的渲染器的清晰度的不足，諧波信息可被使用于在渲染操作期間處理對(duì)象信號(hào)。如果該諧波信息包括關(guān)于一個(gè)或多個(gè)對(duì)象信號(hào)的基音信息，可通過(guò)使用梳狀濾波器或逆梳狀濾波器來(lái)削弱或增強(qiáng)預(yù)定頻域來(lái)調(diào)整每個(gè) 對(duì)象信號(hào)的增益。舉例來(lái)說(shuō)，如果多個(gè)對(duì)象信號(hào)中的一個(gè)是嗓音信號(hào)，
這些對(duì)象信號(hào)可通過(guò)僅削弱嗓音信號(hào)而被用于卡拉OK。可選的是，如
果諧波信息包括關(guān)于一個(gè)或多個(gè)對(duì)象信號(hào)的主頻域信息，則可執(zhí)行削弱或增強(qiáng)主頻域的處理。仍然可選的是，如果諧波信息包括關(guān)于一個(gè) 或多個(gè)對(duì)象信號(hào)的頻譜信息，可通過(guò)執(zhí)行不被任何子帶邊界限制的削弱或增強(qiáng)來(lái)控制每個(gè)對(duì)象信號(hào)的增益。
圖7是根據(jù)本發(fā)明另一個(gè)實(shí)施例的音頻解碼裝置140的方框圖。參見(jiàn)圖7，音頻解碼裝置140使用多聲道解碼器141來(lái)代替對(duì)象解碼器和渲染器，并且在對(duì)象信號(hào)被適當(dāng)?shù)陌才旁诙嗦暤揽臻g中后解碼多個(gè) 對(duì)象信號(hào)。
具體來(lái)說(shuō)，音頻解碼裝置140包括多聲道解碼器141和參數(shù)變換器145。多聲道解碼器141生成多聲道信號(hào)，這些多聲道信號(hào)的對(duì)象信號(hào)根據(jù)縮減混音信號(hào)和空間參數(shù)信息被安排到多聲道空間中，該空間參數(shù)信息是由參數(shù)變換器145提供的基于聲道的邊信息。參數(shù)變換器 145分析由音頻編碼裝置(未示出)傳輸來(lái)的邊信息和控制信息，并且根據(jù)分析的結(jié)果生成空間參數(shù)信息。更具體的，參數(shù)變換器145通過(guò) 邊信息和控制信息來(lái)生成空間參數(shù)信息，該控制信息包括回放設(shè)置信息和混音信息。也就是說(shuō)，對(duì)應(yīng)于一至二(OTT)盒或二至三(TTT)盒，參數(shù)變換器145把邊信息和控制信息的組合變換為空間數(shù)據(jù)。
音頻解碼裝置140可執(zhí)行多聲道解碼操作，其中基于對(duì)象的解碼操作和混音/渲染操作被合并，并且可以跳過(guò)對(duì)每個(gè)對(duì)象信號(hào)的解碼。因此，可以降低解碼和/或混音/渲染的復(fù)雜度。
舉例來(lái)說(shuō)，當(dāng)使用5.1聲道揚(yáng)聲器再現(xiàn)系統(tǒng)來(lái)再現(xiàn)10個(gè)對(duì)象信號(hào) 和根據(jù)這10個(gè)對(duì)象信號(hào)而獲得的多聲道信號(hào)時(shí)，典型的基于對(duì)象的音頻解碼裝置根據(jù)縮減混音信號(hào)和邊信息來(lái)生成分別對(duì)應(yīng)于這io個(gè)對(duì)象信號(hào)的解碼后的信號(hào)，并且通過(guò)將這IO個(gè)對(duì)象信號(hào)適當(dāng)?shù)陌才诺蕉嗦?br> 道空間中來(lái)生成5.1聲道信號(hào)，則這些對(duì)象信號(hào)變得適于5.1聲道揚(yáng)聲器環(huán)境。然而，在5.1聲道信號(hào)生成期間，生成10個(gè)對(duì)象信號(hào)的效率是很低的，并且這個(gè)問(wèn)題在對(duì)象信號(hào)的數(shù)量和要生成的多聲道信號(hào)的聲道數(shù)量之間的差增加時(shí)變得更加嚴(yán)重。
在另一方面，根據(jù)圖7所示的實(shí)施例，音頻解碼裝置140根據(jù)邊信息和控制信息來(lái)生成適于5.1聲道信號(hào)的空間參數(shù)信息，并且將空間參數(shù)信息和縮減混音信號(hào)提供給多聲道解碼器M1。接著，多聲道解碼器141根據(jù)空間參數(shù)信息和縮減混音信號(hào)生成5.1聲道信號(hào)。換句話說(shuō)，當(dāng)要輸出的聲道數(shù)量是5.1聲道時(shí)，音頻解碼裝置140根據(jù)縮減混音信號(hào)可容易的生成5.1聲道信號(hào)，而不需要生成10個(gè)對(duì)象信號(hào)，則該音頻解碼裝置相對(duì)于通常的音頻解碼裝置在復(fù)雜度方面更有效率。
當(dāng)通過(guò)分析由音頻編碼裝置傳輸來(lái)的邊信息和控制信息來(lái)計(jì)算對(duì) 應(yīng)于每個(gè)OTT盒和TTT盒的空間參數(shù)信息所需的計(jì)算量小于在每個(gè)對(duì) 象信號(hào)解碼之后執(zhí)行混音/渲染操作所需的計(jì)算量時(shí)，該音頻解碼裝置
140更為有效。
通過(guò)分析邊信息和控制信息來(lái)把用于生成空間參數(shù)信息的模塊加入到典型的多聲道音頻解碼裝置，可獲得該音頻解碼裝置140，并且可維持與典型的多聲道音頻解碼裝置的兼容性。同樣的，音頻解碼裝置 140可通過(guò)使用典型的多聲道解碼裝置的現(xiàn)有的工具來(lái)提高聲音質(zhì)量，諸如包絡(luò)整形器，子帶時(shí)域處理(STP)工具和去相關(guān)器。通過(guò)上述內(nèi) 容，可以推斷出典型的多聲道音頻解碼方法的所有優(yōu)點(diǎn)都可被輕松的應(yīng)用于基于對(duì)象的音頻解碼方法。
由參數(shù)變換器145傳輸給多聲道解碼器141的空間參數(shù)信息可被壓縮以適于傳輸?？蛇x的是，空間參數(shù)信息可具有與由典型的多聲道編碼裝置所傳輸?shù)臄?shù)據(jù)一樣的格式。也就是說(shuō)，空間參數(shù)信息可進(jìn)入霍夫曼解碼操作或?qū)ьl解碼操作，并且可作為未壓縮的空間線索數(shù)據(jù)
(space cue data)傳輸給每個(gè)模塊。前一種適于通過(guò)遙控來(lái)傳輸空間參
數(shù)信息給多聲道音頻解碼裝置，后一種也很方便，因?yàn)椴恍枰嗦暤?音頻解碼裝置把壓縮的空間線索數(shù)據(jù)轉(zhuǎn)換到更容易在解碼操作中使用
的未壓縮的空間線索數(shù)據(jù)。
根據(jù)邊信息和控制信息的分析的空間參數(shù)信息的配置可能導(dǎo)致縮減混音信號(hào)和空間參數(shù)信息之間的延遲。為了避免這一點(diǎn)，可提供一個(gè)額外的緩沖器用于縮減混音信號(hào)或用于空間參數(shù)信息，這樣縮減混音信號(hào)和空間參數(shù)信息可彼此同步。然而這些方法是不方便的，因?yàn)?需要提供額外的緩沖器?？蛇x的是，邊信息可于縮減混音信號(hào)之前被傳輸，其已經(jīng)考慮了可能發(fā)生的縮減混音信號(hào)和空間參數(shù)信息之間的延遲。在這種情況下，通過(guò)組合邊信息和控制信息而得到的空間參數(shù) 信息不需要再被調(diào)整而可被容易的使用。
如果縮減混音信號(hào)的多個(gè)對(duì)象信號(hào)具有不同電平，能直接補(bǔ)償縮減混音信號(hào)的藝術(shù)縮減混音增益(ADG)模塊可以確定對(duì)象信號(hào)的相關(guān)電平，并且可使用諸如聲道電平差信息，聲道間相關(guān)性(ICC)信息和聲道預(yù)測(cè)系數(shù)(CPC)信息之類(lèi)的空間線索數(shù)據(jù)來(lái)將每個(gè)對(duì)象信號(hào)分配到多聲道空間中的預(yù)定位置。
舉例來(lái)說(shuō)，如果控制信息指示一個(gè)預(yù)定對(duì)象信號(hào)將被分配到多聲道空間中的預(yù)定位置，并且該對(duì)象信號(hào)的電平高于其它對(duì)象信號(hào)，典型的多聲道解碼器可計(jì)算縮減混音信號(hào)的聲道能量之間的差，并且根據(jù)計(jì)算的結(jié)果將縮減混音信號(hào)劃分為若干輸出聲道。然而，典型的多聲道解碼器不能增加或減小縮減混音信號(hào)中聲音的音量。換句話說(shuō)，典型的多聲道解碼器簡(jiǎn)單的將縮減混音信號(hào)分配給若干輸出聲道，并且不增加或減小縮減混音信號(hào)中聲音的音量。
16根據(jù)控制信息將由對(duì)象編碼器生成的多個(gè)對(duì)象信號(hào)的每一個(gè)分配到多聲道空間中的預(yù)定位置也是相對(duì)很簡(jiǎn)單的。然而，增加或減小預(yù) 定對(duì)象信號(hào)的增幅則需要特殊的技術(shù)。換句話說(shuō)，如果使用由對(duì)象編碼器生成的縮減混音信號(hào)，減小縮減混音信號(hào)的每個(gè)對(duì)象信號(hào)的幅度是困難的。
因此，根據(jù)本發(fā)明一個(gè)實(shí)施例，可使用如圖8中所示的ADG模塊 147根據(jù)控制信息來(lái)改變對(duì)象信號(hào)的相關(guān)幅度。更具體的說(shuō)，可以通過(guò) 使用ADG模塊147來(lái)增加或減小由對(duì)象編碼器所傳輸?shù)目s減混音信號(hào) 的多個(gè)對(duì)象信號(hào)的任何一個(gè)的幅度。由ADG模塊147執(zhí)行補(bǔ)償所獲得的縮減混音信號(hào)可被進(jìn)行多聲道解碼。
如果使用ADG模塊147來(lái)適當(dāng)?shù)恼{(diào)整縮減混音信號(hào)的對(duì)象信號(hào)的相對(duì)幅度，則可以使用典型的多聲道解碼器來(lái)執(zhí)行對(duì)象解碼。如果由對(duì)象編碼器生成的縮減混音信號(hào)是單聲道或立體聲信號(hào)或具有三個(gè)或更多聲道的多聲道信號(hào)，該縮減混音信號(hào)可被ADG模塊147處理。如果由對(duì)象編碼器生成的縮減混音信號(hào)具有兩個(gè)或更多聲道，并且需要由ADG模塊147來(lái)調(diào)整的預(yù)定對(duì)象信號(hào)僅存在于縮減混音信號(hào)中的一個(gè)聲道中，則ADG模塊147可僅被應(yīng)用于包括該預(yù)定對(duì)象信號(hào)的聲道，而不是應(yīng)用于縮減混音信號(hào)的所有聲道。由ADG模塊147通過(guò)上述方法處理后的縮減混音信號(hào)可很容易的使用典型的多聲道解碼器來(lái)處理，而不需要修改多聲道解碼器的結(jié)構(gòu)。
即使當(dāng)最終輸出的信號(hào)不是可被多聲道揚(yáng)聲器再現(xiàn)的多聲道信號(hào)，而是雙耳信號(hào)，可以使用ADG模塊147去調(diào)整最終輸出信號(hào)的對(duì) 象信號(hào)的相關(guān)幅度。
作為使用ADG模塊147的替代，在多個(gè)對(duì)象信號(hào)的生成期間，控制信息中可包括指定將要應(yīng)用于每個(gè)對(duì)象信號(hào)的增益值的增益信息。為此，可能要修改典型的多聲道解碼器的結(jié)構(gòu)。即使需要修改現(xiàn)有多
17聲道解碼器的結(jié)構(gòu)，在解碼操作期間，通過(guò)將增益值應(yīng)用于每個(gè)對(duì)象
信號(hào)，而不需要計(jì)算ADG和補(bǔ)償每個(gè)對(duì)象信號(hào)，該方法在降低解碼復(fù)雜度方面還是很方便的。
圖9是根據(jù)本發(fā)明第四實(shí)施例的音頻解碼裝置150的方框圖。參見(jiàn)圖9，音頻解碼裝置150的特征在于生成雙耳信號(hào)。
具體來(lái)說(shuō)，音頻解碼裝置150包括多聲道雙耳解碼器151，第一參數(shù)變換器157和第二參數(shù)變換器159。
第二參數(shù)變換器159分析由音頻編碼裝置提供的邊信息和控制信息，并且根據(jù)分析結(jié)果來(lái)配置空間參數(shù)信息。第一參數(shù)變換器157通過(guò)增加三維(3D)信息，例如頭相關(guān)傳輸函數(shù)(HRTF)參數(shù)給空間參數(shù)信息，來(lái)配置可被多聲道雙耳解碼器151使用的雙耳參數(shù)信息。多聲道雙耳解碼器151通過(guò)應(yīng)用虛擬3D參數(shù)信息給縮減混音信號(hào)來(lái)生成虛擬三維(3D)信號(hào)。
第一參數(shù)變換器157和第二參數(shù)變換器159可被一個(gè)單獨(dú)的模塊所取代，即參數(shù)變換模塊155，其接收邊信息、控制信息和HRTF參數(shù)，并且根據(jù)邊信息、控制信息和HRTF參數(shù)來(lái)配置雙耳參數(shù)信息。
通常來(lái)說(shuō)，為了使用頭戴式耳機(jī)生成用于包括IO個(gè)對(duì)象信號(hào)的縮減混音信號(hào)的再現(xiàn)的雙耳信號(hào)，對(duì)象信號(hào)必須根據(jù)縮減混音信號(hào)和邊信息來(lái)分別生成對(duì)應(yīng)于IO個(gè)對(duì)象信號(hào)的IO個(gè)解碼后的信號(hào)。其后，渲染器參考控制信號(hào)將IO個(gè)對(duì)象信號(hào)的每一個(gè)分配到多聲道空間中的預(yù)定位置以適于5聲道揚(yáng)聲器環(huán)境。其后，渲染器生成可使用5聲道揚(yáng)聲器再現(xiàn)的5聲道信號(hào)。其后，渲染器將HRTF參數(shù)應(yīng)用到5聲道信號(hào)中，從而生成2聲道信號(hào)。簡(jiǎn)而言之，上述通常的音頻解碼方法包括再現(xiàn)10個(gè)對(duì)象信號(hào)，將這10個(gè)對(duì)象信號(hào)轉(zhuǎn)換為5聲道信號(hào)，并且根據(jù)5聲道信號(hào)生成2聲道信號(hào)，可見(jiàn)其效率是很低的。在另一方面，音頻解碼裝置150可根據(jù)對(duì)象音頻信號(hào)而容易的生成可使用頭戴式耳機(jī)再現(xiàn)的雙耳信號(hào)。另外，音頻解碼裝置150通過(guò) 對(duì)邊信息和控制信息的分析來(lái)配置空間參數(shù)信息，并且使用典型的多聲道雙耳解碼器來(lái)生成雙耳信號(hào)。然而，即便在其裝配有一體化參數(shù) 變換器時(shí)，音頻解碼裝置150仍然可以使用典型的多聲道雙耳解碼器，該參數(shù)變換器接收邊信息、控制信息和HRTF參數(shù)，并且根據(jù)邊信息、制信息和HRTF參數(shù)來(lái)配置雙耳參數(shù)信息。
圖10是根據(jù)本發(fā)明第五實(shí)施例的音頻解碼裝置160的方框圖。參見(jiàn)圖10，音頻解碼裝置160包括縮減混音處理器161，多聲道解碼器 163，和參數(shù)變換器165。縮減混音處理器161和參數(shù)變換器163可被單一模塊167替代。
參數(shù)變換器165生成可被多聲道解碼器163使用的空間參數(shù)信息，和被縮減混音處理器161使用的參數(shù)信息?？s減混音處理器161執(zhí)行對(duì)縮減混音信號(hào)的預(yù)處理操作，并且傳輸預(yù)處理操作結(jié)果的縮減混音信號(hào)給多聲道解碼器163。多聲道解碼器163對(duì)由縮減混音處理器161 傳輸來(lái)的縮減混音信號(hào)執(zhí)行解碼操作，從而輸出立體聲信號(hào)、雙耳立體聲信號(hào)或多聲道信號(hào)?？s減混音處理器161所執(zhí)行的預(yù)處理操作的例子包括通過(guò)濾波在時(shí)域或頻域中修改或變換縮減混音信號(hào)。
如果輸入到音頻解碼裝置160中的縮減混音信號(hào)是立體聲信號(hào)的話，在該縮減混音信號(hào)被輸入多聲道解碼器163前，該縮減混音信號(hào) 可被用于由縮減混音處理器161執(zhí)行的縮減混音處理，因?yàn)槎嗦暤澜?碼器163不能將縮減混音信號(hào)的分量映射到對(duì)應(yīng)的左聲道和右聲道，其中左聲道是多聲道的一個(gè)，而右聲道是多聲道的另一個(gè)。因此，為了能將分類(lèi)到左聲道的對(duì)象信號(hào)轉(zhuǎn)移到右聲道的方向上，輸入給音頻解碼裝置160的縮減混音信號(hào)可被進(jìn)行縮減混音處理器預(yù)處理，預(yù)處理后的縮減混音信號(hào)可被輸入給多聲道解碼器163?？筛鶕?jù)從邊信息和從控制信息處獲得的預(yù)處理信息來(lái)執(zhí)行立體聲縮減混音信號(hào)的預(yù)處理。
圖11是根據(jù)本發(fā)明第六實(shí)施例的音頻解碼裝置170的方框圖。參見(jiàn)圖11，音頻解碼裝置170包括多聲道解碼器171，聲道處理器173 和參數(shù)變換器175。
參數(shù)變換器175生成可被多聲道解碼器171使用的空間參數(shù)信息，和可被聲道處理器173使用的參數(shù)信息。聲道處理器173執(zhí)行對(duì)由多聲道解碼器171輸出的信號(hào)的后處理。多聲道解碼器171所輸出的信號(hào)的例子包括立體聲信號(hào)，雙耳立體聲信號(hào)和多聲道信號(hào)。
聲道處理器173所執(zhí)行的后處理操作的例子包括修改或變換輸出信號(hào)的每個(gè)聲道或所有聲道。舉例來(lái)說(shuō)，如果邊信息包括關(guān)于預(yù)定對(duì)象信號(hào)的基本頻率信息，聲道處理器173可參考該基本頻率信息從預(yù)定對(duì)象信號(hào)中去除諧波分量。多聲道音頻解碼方法對(duì)于卡拉OK系統(tǒng) 來(lái)說(shuō)可能不夠高效。然而，如果關(guān)于嗓音對(duì)象的基本頻率信息被包括在邊信息中，且嗓音對(duì)象信號(hào)的諧波分量在后處理期間已被去除，通過(guò)使用圖11的實(shí)施例可實(shí)現(xiàn)高性能的卡拉OK系統(tǒng)。圖11的實(shí)施例也可應(yīng)用于除嗓音對(duì)象信號(hào)之外的對(duì)象信號(hào)。舉例來(lái)說(shuō)，可使用圖ll的實(shí)施例來(lái)去除預(yù)定樂(lè)器的聲音。同樣，可以使用圖11的實(shí)施例來(lái)使用關(guān)于對(duì)象信號(hào)的基本頻率信息來(lái)放大預(yù)定的諧波分量。
聲道處理器173可對(duì)縮減混音信號(hào)執(zhí)行額外的效果處理?？蛇x的是，聲道處理器173可把由額外的效果處理而獲得的信號(hào)加入到多聲道解碼器171輸出的信號(hào)。聲道處理器173可在任何需要的時(shí)候改變對(duì)象的頻譜或修改縮減混音信號(hào)。如果直接執(zhí)行效果處理操作(諸如對(duì)縮減混音信號(hào)的混響)并把效果處理操作所獲得的信號(hào)傳輸給多聲道解碼器171不是很適當(dāng)?shù)脑挘暤捞幚砥?73可把經(jīng)效果處理操作多聲道解碼器171的輸出，以代替對(duì)縮減混音信
號(hào)執(zhí)行效果處理。
音頻解碼裝置170可被設(shè)計(jì)為不僅包括聲道處理器173,還包括縮減混音處理器。在這種情況下，縮減混音處理器可被安排在多聲道解碼器171之前，并且聲道處理器173可被安排在多聲道解碼器171 之后。
圖12是根據(jù)本發(fā)明第七實(shí)施例的音頻解碼裝置210的方框圖。參見(jiàn)圖12，音頻解碼裝置210使用多聲道解碼器213來(lái)代替對(duì)象解碼器。
具體而言，音頻解碼裝置210包括多聲道解碼器213，代碼轉(zhuǎn)換器215，渲染器217和3D信息數(shù)據(jù)庫(kù)219。
渲染器217根據(jù)包括在控制信息中的對(duì)應(yīng)于索引數(shù)據(jù)的3D信息來(lái) 確定多個(gè)對(duì)象信號(hào)的3D位置。代碼轉(zhuǎn)換器215通過(guò)綜合關(guān)于多個(gè)對(duì)象音頻信號(hào)的位置信息來(lái)生成基于聲道的邊信息，其中渲染器217將3D 信息應(yīng)用到了這些對(duì)象音頻信號(hào)中。多聲道解碼器213通過(guò)將基于聲道的邊信息應(yīng)用到縮減混音信號(hào)來(lái)輸出3D信號(hào)。
頭相關(guān)傳輸函數(shù)(HRTF)可作為一種3D信息被使用。HRTF是一種傳輸函數(shù)，其描述了在任意位置的聲源和耳朵之間的聲波的傳輸，并且返回一個(gè)根據(jù)聲源的位置和高度而改變的值。如果使用HRTF來(lái) 濾波不帶方向性的信號(hào)，該信號(hào)可被聽(tīng)成是從某個(gè)方向再現(xiàn)的。
當(dāng)接收到輸入比特流時(shí)，音頻解碼裝置210使用解復(fù)用器(未示出)來(lái)從輸入比特流中提取基于對(duì)象的縮減混音信號(hào)和基于對(duì)象的參數(shù)信息。接著，渲染器217從控制信息中提取用于確定多個(gè)對(duì)象音頻信號(hào)位置的索引數(shù)據(jù)，并且從3D信息數(shù)據(jù)庫(kù)219中抽出(withdraw) 與所提取的索引數(shù)據(jù)相對(duì)應(yīng)的3D信息。具體來(lái)說(shuō)，被音頻解碼裝置210所使用的包括在控制信息中的混音參數(shù)信息不僅可以包括電平信息，還可以包括搜索3D信息所必須的索引數(shù)據(jù)?；煲魠?shù)信息還可包括關(guān)于聲道間時(shí)間差的時(shí)間信息，位置信息和一個(gè)或多個(gè)通過(guò)適當(dāng)組合電平信息和時(shí)間信息所獲得的參數(shù)。
可根據(jù)缺省的混音參數(shù)信息來(lái)初始確定對(duì)象音頻信號(hào)的位置，并且隨后通過(guò)應(yīng)用相應(yīng)于用戶所期望的位置的3D信息給對(duì)象音頻信號(hào) 來(lái)改變位置?？蛇x的是，如果用戶希望只將3D效果應(yīng)用到一些對(duì)象音頻信號(hào)，關(guān)于其它用戶不希望應(yīng)用3D效果的對(duì)象音頻信號(hào)的電平信息和時(shí)間信息可被使用為混音參數(shù)信息。
代碼轉(zhuǎn)換器215通過(guò)綜合由音頻編碼裝置所傳輸?shù)年P(guān)于N對(duì)象信號(hào)的基于對(duì)象的參數(shù)信息和多個(gè)對(duì)象信號(hào)的位置信息來(lái)生成關(guān)于M聲道的基于聲道的邊信息，渲染器217將諸如HRTF的3D信息應(yīng)用到了上述對(duì)象信號(hào)的位置信息中。
多聲道解碼器213根據(jù)縮減混音信號(hào)和由代碼轉(zhuǎn)換器215所提供的基于聲道的邊信息來(lái)生成音頻信號(hào)，并且通過(guò)使用包括在基于聲道的邊信息中的3D信息來(lái)執(zhí)行3D渲染操作而生成3D多聲道信號(hào)。
圖13是根據(jù)本發(fā)明第八實(shí)施例的音頻解碼裝置220的方框圖。參見(jiàn)圖13，音頻解碼裝置220不同于圖12所示的音頻解碼裝置210，其區(qū)別在于代碼轉(zhuǎn)換器225分離地傳輸基于聲道的邊信息和3D信息給多聲道解碼器223。換句話說(shuō)，音頻解碼裝置220的代碼轉(zhuǎn)換器225從關(guān) 于N個(gè)對(duì)象信號(hào)的基于對(duì)象的參數(shù)信息中獲得關(guān)于M個(gè)聲道的基于聲道的邊信息，并且傳輸基于聲道的邊信息和應(yīng)用于N個(gè)對(duì)象信號(hào)的每個(gè)的3D信息給多聲道解碼器223，然而音頻解碼裝置210的代碼轉(zhuǎn)換器215傳輸包括3D信息的基于聲道的邊信息給多聲道解碼器213。參見(jiàn)圖14，基于聲道的邊信息和3D信息可包括多個(gè)幀索引。因此，多聲道解碼器223可參考每個(gè)基于聲道的邊信息和3D信息的幀索引來(lái)同步基于聲道的邊信息和3D信息，并且可以應(yīng)用3D信息給對(duì)應(yīng) 于該3D信息的比特流的幀。例如，具有索引2的3D信息可被應(yīng)用到具有索引2的幀2的開(kāi)始。
因?yàn)榛诼暤赖倪呅畔⒑?D信息都包括幀索引，即使3D信息隨著時(shí)間而更新，也可以有效地確定3D信息要被應(yīng)用到的基于聲道的邊信息的臨時(shí)位置。換句話說(shuō)，代碼轉(zhuǎn)換器225包括3D信息和基于聲道的邊信息中的多個(gè)幀索引，因此多聲道解碼器223可容易地同步基于聲道的邊信息和3D信息。
縮減混音處理器231，代碼轉(zhuǎn)換器235，渲染器237和3D信息數(shù) 據(jù)庫(kù)可由一個(gè)單獨(dú)的模塊239替代。
圖15是根據(jù)本發(fā)明第九實(shí)施例的音頻解碼裝置230的方框圖。參見(jiàn)圖15，音頻解碼裝置230不同于圖13所示的音頻解碼裝置220，其區(qū)別在于音頻解碼裝置230進(jìn)一步包括縮減混音處理器231。
具體來(lái)說(shuō)，音頻解碼裝置230包括代碼轉(zhuǎn)換器235,渲染器237， 3D信息數(shù)據(jù)庫(kù)238，多聲道解碼器233和縮減混音處理器231。代碼轉(zhuǎn)換器235，渲染器237， 3D信息數(shù)據(jù)庫(kù)238和多聲道解碼器233與圖13所示的對(duì)應(yīng)部分分別相同?？s減混音處理器231對(duì)立體聲縮減混音信號(hào)執(zhí)行預(yù)處理操作以調(diào)整位置。3D信息數(shù)據(jù)庫(kù)238可與渲染器237 合并。還可以提供用于應(yīng)用預(yù)定效果給縮減混音信號(hào)的模塊給音頻解碼裝置230。
圖16表示根據(jù)本發(fā)明第十實(shí)施例的音頻解碼裝置240的方框圖。參見(jiàn)圖16，音頻解碼裝置240不同于圖15所示的音頻解碼裝置230，
23其區(qū)別在于音頻解碼裝置240包括多點(diǎn)控制單元組合器241。
也就是說(shuō)，音頻解碼裝置240與音頻解碼裝置230 —樣，包括縮減混音處理器243，多聲道解碼器244，代碼轉(zhuǎn)換器245，渲染器247 和3D信息數(shù)據(jù)庫(kù)249。多點(diǎn)控制單元組合器241組合由基于對(duì)象的編碼所獲得的多個(gè)比特流，從而獲得單一的比特流。舉例來(lái)說(shuō)，當(dāng)輸入用于第一音頻信號(hào)的第一比特流和用于第二音頻信號(hào)的第二比特流時(shí)，多點(diǎn)控制單元組合器241從第一比特流中提取第一縮減混音信號(hào)，從第二比特流中提取第二縮減混音信號(hào)，并且通過(guò)組合第一和第二縮減混音信號(hào)來(lái)生成第三縮減混音信號(hào)。此外，多點(diǎn)控制單元組合器241 從第一比特流中提取第一基于對(duì)象的邊信息，從第二比特流中提取第二基于對(duì)象的邊信息，并且通過(guò)組合第一基于對(duì)象的邊信息和第二基于對(duì)象的邊信息來(lái)生成第三基于對(duì)象的邊信息。其后，多點(diǎn)控制單元組合器241通過(guò)組合第三縮減混音信號(hào)和第三基于對(duì)象的邊信息來(lái)生成比特流，并且輸出所生成的比特流。
因此，根據(jù)本發(fā)明第十實(shí)施例，相比較于編碼或解碼每個(gè)對(duì)象信號(hào)的情況，即使是由兩個(gè)或多個(gè)通信方傳輸?shù)男盘?hào)，其也可以有效地被處理。
多點(diǎn)控制單元組合器241為了能夠?qū)⒍鄠€(gè)從多個(gè)比特流中分別提取出來(lái)的，并且與不同壓縮編解碼相對(duì)應(yīng)的縮減混音信號(hào)合并到一個(gè) 單獨(dú)的縮減混音信號(hào)中，這些縮減混音信號(hào)需要根據(jù)縮減混音信號(hào)的壓縮編解碼類(lèi)型被轉(zhuǎn)換為脈沖編碼調(diào)制(PCM)信號(hào)或預(yù)定頻域中的信號(hào)，PCM信號(hào)或通過(guò)轉(zhuǎn)換所獲得的信號(hào)可能需要組合在一起，通過(guò) 組合所獲得的信號(hào)需要使用預(yù)定壓縮編解碼來(lái)轉(zhuǎn)換。在這種情況下，根據(jù)縮減混音信號(hào)是否被并入PCM信號(hào)或預(yù)定頻域中的信號(hào)，可能會(huì) 發(fā)生延遲。然而，該延遲可能無(wú)法被解碼器正確地估計(jì)。因此，該延遲可能需要被包括在比特流中并與比特流一起被傳輸。該延遲指示在 PCM信號(hào)中的延遲釆樣的數(shù)量或在預(yù)定頻域中的延遲采樣的數(shù)量。與在典型的多聲道編/解碼操作期間(例如5.1聲道或7.1聲道編/ 解碼操作)通常處理的輸入信號(hào)的數(shù)量相比，在基于對(duì)象的音頻編/解碼操作期間需要處理的輸入信號(hào)的數(shù)量有時(shí)會(huì)相當(dāng)大。因此，基于對(duì) 象的音頻編/解碼方法比典型的基于聲道的音頻編/解碼需要更高的比特率。然而，因?yàn)榛趯?duì)象的音頻編/解碼方法包括對(duì)比聲道信號(hào)更小的對(duì)象信號(hào)的處理，其可使用基于對(duì)象的音頻編/解碼方法來(lái)生成動(dòng)態(tài) 的輸出信號(hào)。
下面將參見(jiàn)附圖17-20來(lái)詳細(xì)解釋根據(jù)本發(fā)明一個(gè)實(shí)施例的音頻編碼方法。
在基于對(duì)象的音頻編碼方法中，對(duì)象信號(hào)可被定義為表示單獨(dú)的聲音，諸如人類(lèi)的語(yǔ)音或樂(lè)器的聲音。可選的是，具有相同特征的聲音，諸如有弦樂(lè)器的聲音(例如小提琴，中提琴和大提琴)，屬于相同頻帶的聲音，或根據(jù)聲源的方向和角度被分類(lèi)到相同類(lèi)別的聲音可被組合在一起，并且由相同的對(duì)象信號(hào)來(lái)定義。仍然可選的是，可使用上述方法的組合來(lái)定義對(duì)象信號(hào)。
多個(gè)對(duì)象信號(hào)可作為縮減混音信號(hào)和邊信息而被傳輸。在將要被傳輸?shù)男畔⒌膭?chuàng)建期間，對(duì)縮減混音信號(hào)或縮減混音信號(hào)的多個(gè)對(duì)象信號(hào)的每一個(gè)的能量或功率被進(jìn)行初始計(jì)算以用于檢測(cè)縮減混音信號(hào) 的包絡(luò)。計(jì)算的結(jié)果可被用于傳輸對(duì)象信號(hào)或縮減混音信號(hào)或計(jì)算對(duì) 象信號(hào)的電平比率。
線性預(yù)測(cè)編碼(LPC)算法可被用于更低比特率。具體來(lái)說(shuō)，通過(guò)信號(hào)分析來(lái)生成表示信號(hào)的包絡(luò)的多個(gè)LPC系數(shù)，并且這些LPC系數(shù)將被傳輸以代替?zhèn)鬏旉P(guān)于信號(hào)的包絡(luò)信息。該方法在比特率方面是高效的。然而LPC參數(shù)很可能與信號(hào)的實(shí)際包絡(luò)有差異，該方法需要額外的處理，諸如錯(cuò)誤校正。簡(jiǎn)而言之，涉及傳輸信號(hào)的包絡(luò)信息的方法可保證聲音的高質(zhì)量，但這導(dǎo)致了需要傳輸?shù)男畔⒘康脑黾?。?另一方面，涉及使用LPC系數(shù)的方法可減少需要傳輸?shù)男畔⒘?，但?需要額外的處理，諸如錯(cuò)誤校正，這將導(dǎo)致聲音質(zhì)量的降低。
根據(jù)本發(fā)明的一個(gè)實(shí)施例，可以使用這些方法的組合。換句話說(shuō), 可以用信號(hào)的能量或功率或索引值或?qū)?yīng)于信號(hào)的能量或功率的另一
個(gè)值，如LPC系數(shù)來(lái)表示信號(hào)的包絡(luò)。
關(guān)于信號(hào)的包絡(luò)信息能以時(shí)間段或頻率段為單位來(lái)獲得。具體來(lái) 說(shuō)，參見(jiàn)圖17，關(guān)于信號(hào)的包絡(luò)信息以幀為單元來(lái)獲得?？蛇x的是，如果信號(hào)是由使用諸如正交鏡像濾波器(QMF)組的濾波器組的頻帶結(jié)構(gòu)所表示的，關(guān)于信號(hào)的包絡(luò)信息能以頻率子帶，頻率子帶的組，或頻率子帶分隔的組為單位來(lái)獲得，頻率子帶分隔是比頻率子帶更小
塊的實(shí)體。仍然可選的是，基于幀的方法，基于頻率子帶的方法，和基于頻率子帶分隔的方法的組合的使用也在本發(fā)明的保護(hù)范圍之內(nèi)。
仍然可選的是，假設(shè)信號(hào)的低頻分量具有比信號(hào)的高頻分量更多的信息，關(guān)于信號(hào)的低頻分量的包絡(luò)信息本身可被傳輸，然而，關(guān)于信號(hào)的高頻分量的包絡(luò)信息可由LPC系數(shù)或其它值來(lái)表示，并且傳輸 LPC系數(shù)或其它值以代替關(guān)于信號(hào)的高頻分量的包絡(luò)信息。但是，信號(hào)的低頻分量不一定就比信號(hào)的高頻分量有更多的信息。因此需要根據(jù)實(shí)際情況靈活運(yùn)用上述方法。
根據(jù)本發(fā)明一個(gè)實(shí)施例，對(duì)應(yīng)于信號(hào)的一部分(以下稱為主要部分)的包絡(luò)信息或索引數(shù)據(jù)將被傳輸，該信號(hào)的一部分是在時(shí)間/頻率軸上表現(xiàn)為主要部分?？蛇x的是，表示信號(hào)的主要部分的能量和功率的值(例如LPC系數(shù))可被傳輸，并且不傳輸對(duì)應(yīng)于信號(hào)的非主要部分的這些值。仍然可選的是，可傳輸相應(yīng)于信號(hào)的主要部分的包絡(luò)信息或索引數(shù)據(jù)，而也可傳輸表示信號(hào)的非主要部分的能量或功率的值。仍然可選的是，僅傳輸關(guān)于信號(hào)的主要部分的信息，這樣可根據(jù)關(guān)于
26信號(hào)的主要部分的信息來(lái)估計(jì)信號(hào)的非主要部分。仍然可選的是，可以使用上述方法的組合。
舉例來(lái)說(shuō)，參見(jiàn)圖18，如果信號(hào)被劃分為主要時(shí)期和非主要時(shí)期，關(guān)于信號(hào)的信息可使用標(biāo)記為(a)-(d)的四種不同的方法來(lái)傳輸。
為了傳輸縮減混音信號(hào)和邊信息的組合的多個(gè)對(duì)象信號(hào)，作為解碼操作的一部分，縮減混音信號(hào)需要被劃分為多個(gè)元素，例如，考慮了對(duì)象信號(hào)的電平的比率。為了保證縮減混音信號(hào)的元素之間的獨(dú)立性，需要額外的執(zhí)行去相關(guān)操作。
作為基于對(duì)象的編解碼方法中的編解碼單元的對(duì)象信號(hào)比作為多聲道編解碼方法中的編解碼單元的聲道信號(hào)具有更多獨(dú)立性。換句話說(shuō)，聲道信號(hào)包括多個(gè)對(duì)象信號(hào)，所以需要被去相關(guān)。在另一個(gè)方面，對(duì)象信號(hào)之間是獨(dú)立的，所以可使用對(duì)象信號(hào)的特征而容易的執(zhí)行聲道分離而不需要去相關(guān)操作。
具體來(lái)說(shuō)，參見(jiàn)圖19，對(duì)象信號(hào)A， B和C輪流作為頻率軸上的主要對(duì)象。在這種情況下，不需要根據(jù)對(duì)象信號(hào)A， B和C的電平比率而將縮減混音信號(hào)劃分為多個(gè)信號(hào)，也不需要執(zhí)行去相關(guān)。作為代替，關(guān)于對(duì)象信號(hào)A， B和C的主要時(shí)期的信息將被傳輸，或?qū)⒃鲆?值應(yīng)用到每個(gè)對(duì)象信號(hào)A， B和C的每個(gè)頻率分量上，從而跳過(guò)去相關(guān)。因此，其可以減少計(jì)算量，并且可以減少去相關(guān)所必需的邊信息所需要比特率。
簡(jiǎn)而言之，為了跳過(guò)去相關(guān)，關(guān)于包括每個(gè)對(duì)象信號(hào)的頻域的信息可作為邊信息被傳輸，該去相關(guān)被執(zhí)行以保證由根據(jù)縮減混音信號(hào) 的對(duì)象信號(hào)率的比率來(lái)劃分縮減混音信號(hào)所獲得的多個(gè)信號(hào)之間的獨(dú) 立性?？蛇x的是，可以應(yīng)用不同增益值給主要時(shí)期和非主要時(shí)期，主要時(shí)期中每個(gè)對(duì)象信號(hào)都表現(xiàn)為主要，非主要時(shí)期中每個(gè)對(duì)象信號(hào)都表現(xiàn)為不太主要，因此關(guān)于主要時(shí)期的信息可被主要提供為邊信息。仍然可選的是，關(guān)于主要時(shí)期的信息可作為邊信息被傳輸，并且不傳輸沒(méi)有關(guān)于非主要時(shí)期的信息。仍然可選的是，作為去相關(guān)方法的替代的上述方法的組合可被使用。
作為去相關(guān)方法的替代的上述方法可被應(yīng)用到所有信號(hào)對(duì)象，或僅被應(yīng)用到某些具有明顯可識(shí)別的主要周期的對(duì)象信號(hào)。同樣的，作為去相關(guān)方法的替代的上述方法可以幀為單位被應(yīng)用。
以下將詳細(xì)描述使用殘差信號(hào)的對(duì)象音頻信號(hào)的編碼。
一般來(lái)說(shuō)，在基于對(duì)象的音頻編/解碼方法中，多個(gè)對(duì)象信號(hào)被編碼，并且編碼結(jié)果作為縮減混音信號(hào)和邊信息的組合被傳輸。接著，通過(guò)解碼根據(jù)邊信息從縮減混音信號(hào)中恢復(fù)多個(gè)對(duì)象信號(hào)，并且恢復(fù) 后的對(duì)象信號(hào)被適當(dāng)?shù)幕煲?，例如，在用戶的?qǐng)求中根據(jù)控制信息生成最終聲道信號(hào)?；趯?duì)象的音頻編/解碼方法一般致力于根據(jù)控制信號(hào)在混音器的幫助下自由的改變輸出聲道信號(hào)。然而，基于對(duì)象的音頻編/解碼方法還可被用于生成按照預(yù)定義方式的聲道輸出而不管控制
"f曰息。
為此，邊信息不僅包括從縮減混音信號(hào)中獲得多個(gè)對(duì)象信號(hào)所必須的信息，還包括生成聲道信號(hào)所必須的混音參數(shù)信息。則，不需要混音器的幫助就可以生成最終聲道輸出信號(hào)。在這種情況下，可使用這種殘差編/解碼算法來(lái)提高聲音質(zhì)量。
典型的殘差編/解碼方法包括編/解碼信號(hào)和對(duì)編/解碼后的信號(hào)和原始信號(hào)之間的錯(cuò)誤進(jìn)行編/解碼，也就是殘差信號(hào)。在解碼操作期間，編碼后的信號(hào)被解碼，同時(shí)補(bǔ)償編碼后的信號(hào)和原始信號(hào)之間的錯(cuò)誤，從而恢復(fù)與原始信號(hào)盡可能相同的信號(hào)。因?yàn)榻獯a后的信號(hào)和原始信號(hào)之間的錯(cuò)誤通常來(lái)說(shuō)是微不足道的，其可以減少執(zhí)行殘差編/解碼所必需的額外信息的量。
如果解碼器的最終聲道輸出被確定了，不僅要提供用于生成最終
聲道信號(hào)所必需的混音參數(shù)信息，還要提供殘差編碼信息以作為邊信息。在這種情況下，其可以提高聲音質(zhì)量。
圖20是根據(jù)本發(fā)明一個(gè)實(shí)施例的音頻編碼裝置310的方框圖。參照?qǐng)D20，音頻編碼裝置310的特征在于其使用了殘差信號(hào)。
具體來(lái)說(shuō)，音頻編碼裝置310包括編碼器311，解碼器313，第一混音器315，第二混音器319，加法器317和比特流生成器321。
第一混音器315執(zhí)行對(duì)于原始信號(hào)的混音操作，第二混音器319 執(zhí)行對(duì)通過(guò)對(duì)原始信號(hào)執(zhí)行編碼操作和解碼操作所得到的信號(hào)的混音操作。加法器317計(jì)算第一混音器315輸出的信號(hào)和第二混音器319 輸出的信號(hào)之間的殘差信號(hào)。比特流生成器321將殘差信號(hào)加入到邊信息中，并且傳輸加入后的結(jié)果。這樣的話，其可以提高聲音質(zhì)量。
殘差信號(hào)的計(jì)算可被應(yīng)用于信號(hào)的所有部分，或僅應(yīng)用于信號(hào)的低頻部分?？蛇x的是，殘差信號(hào)的計(jì)算可被可變的僅應(yīng)用于包括基于幀到幀的主要信號(hào)的頻域中。仍然可選的是，可使用上述方法的組合。
因?yàn)榘埐钚盘?hào)信息的邊信息的量比不包括殘差信號(hào)信息的邊信息的量要大，殘差信號(hào)的計(jì)算可僅被應(yīng)用于信號(hào)的那些直接影響聲音質(zhì)量的部分，從而防止比特率過(guò)多的增長(zhǎng)。本發(fā)明可使用記錄在計(jì) 算機(jī)可讀介質(zhì)上的計(jì)算機(jī)可讀代碼來(lái)實(shí)現(xiàn)。該計(jì)算機(jī)可讀記錄介質(zhì)可以是任何類(lèi)型的記錄裝置，在其中數(shù)據(jù)以計(jì)算機(jī)可讀的方式被存儲(chǔ)。計(jì)算機(jī)可讀記錄介質(zhì)的例子包括ROM, RAM， CD-ROM，磁盤(pán)，軟盤(pán)，光學(xué)數(shù)據(jù)存儲(chǔ)器和載波(例如通過(guò)因特網(wǎng)的數(shù)據(jù)傳輸)。計(jì)算機(jī)可讀記錄介質(zhì)可通過(guò)連接到網(wǎng)絡(luò)上的多個(gè)計(jì)算機(jī)系統(tǒng)而被分配，所以計(jì)算
29機(jī)可讀代碼被寫(xiě)入其中，并且以非集中方式被執(zhí)行。普通的本領(lǐng)域技術(shù)人員可容易的構(gòu)造出用于實(shí)現(xiàn)本發(fā)明的功能性程序、代碼和代碼段。
工業(yè)實(shí)用性
如上所述，根據(jù)本發(fā)明，通過(guò)受益于基于對(duì)象的音頻編碼和解碼
方法的優(yōu)點(diǎn)，每個(gè)對(duì)象音頻信號(hào)的聲像可被定位。貝u，其可以通過(guò)對(duì) 象音頻信號(hào)的再現(xiàn)來(lái)提供更真實(shí)的聲音。此外，本發(fā)明可被應(yīng)用于交互式游戲，并且可以提供更真實(shí)的虛擬實(shí)體經(jīng)歷給用戶。
盡管本發(fā)明已參照其優(yōu)選實(shí)施例進(jìn)行了描述及說(shuō)明，很明顯本領(lǐng) 域的技術(shù)人員可做出多種形式上和細(xì)節(jié)上的改變，而不脫離由以下權(quán) 利要求所定義的本發(fā)明的精神或范疇。
30
權(quán)利要求
1. 一種音頻解碼方法，其包括從輸入音頻信號(hào)中提取縮減混音信號(hào)和基于對(duì)象的邊信息；基于輸入控制信息生成渲染信息；以及基于所述渲染信息和所述基于對(duì)象的邊信息，生成基于聲道的邊信息。
2. 根據(jù)權(quán)利要求l所述的音頻解碼方法，其進(jìn)一步包括基于所述縮減混音信號(hào)和所述基于聲道的邊信息生成多聲道音頻信號(hào)。
3. 根據(jù)權(quán)利要求l所述的音頻解碼方法，其中，所述控制信息包括用于處理預(yù)定對(duì)象信號(hào)的三維(3D)信息、混音信息和諧波信息中的至少一個(gè)。
4. 根據(jù)權(quán)利要求l所述的音頻解碼方法，其中，生成所述渲染信息包括把包含在所述混音信息中的時(shí)間信息轉(zhuǎn)換成等效的幅度信息以響應(yīng)用戶命令。
5. 根據(jù)權(quán)利要求3所述的音頻解碼方法，其中，生成所述渲染信息進(jìn)一步包括把包含在所述混音信息中的幅度信息轉(zhuǎn)換成等效的時(shí) 間信息以響應(yīng)用戶命令。
6. 根據(jù)權(quán)利要求3所述的音頻解碼方法，其中，所述諧波信息包括所述預(yù)定對(duì)象信號(hào)的基音信息、基頻信息和主頻信息中的至少一個(gè)。
7. 根據(jù)權(quán)利要求6所述的音頻解碼方法，其進(jìn)一步包括基于所述諧波信息調(diào)整所述預(yù)定對(duì)象信號(hào)的增益。
8. 根據(jù)權(quán)利要求6所述的音頻解碼方法，其進(jìn)一步包括基于所述諧波信息補(bǔ)償預(yù)定頻帶中的對(duì)象信號(hào)。
9. 根據(jù)權(quán)利要求1所述的音頻解碼方法，其進(jìn)一步包括補(bǔ)償所述空間信息和所述縮減混音信號(hào)之間的延遲。
10. —種音頻解碼裝置，其包括解復(fù)用器，用于從輸入音頻信號(hào)中提取縮減混音信號(hào)和基于對(duì)象的邊信息；渲染器，用于基于輸入控制信息生成渲染信息；以及代碼轉(zhuǎn)換器，用于基于所述渲染信息和所述基于對(duì)象的邊信息生成基于聲道的邊信息。
11. 根據(jù)權(quán)利要求IO所述的音頻解碼裝置，進(jìn)一步包括多聲道解碼器，用于基于所述縮減混音信號(hào)和所述基于聲道的邊信息生成多聲道音頻信號(hào)。
12. 根據(jù)權(quán)利要求IO所述的音頻解碼裝置，其中，所述控制信息包括用于處理預(yù)定對(duì)象信號(hào)的三維(3D)信息、混音信息和諧波信息中的至少一個(gè)。
13. 根據(jù)權(quán)利要求12所述的音頻解碼裝置，其中，在生成所述渲染信息時(shí)，所述渲染器把包含在所述混音信息中的時(shí)間信息轉(zhuǎn)換成等效的幅度信息以響應(yīng)用戶命令。
14. 根據(jù)權(quán)利要求12所述的音頻解碼裝置，其中，在生成所述渲染信息時(shí)，所述渲染器把包含在所述混音信息中的幅度信息轉(zhuǎn)換成等效的時(shí)間信息以響應(yīng)用戶命令。
15. 根據(jù)權(quán)利要求12所述的音頻解碼裝置，其中，所述諧波信息包括所述預(yù)定對(duì)象信號(hào)的基音信息、基頻信息和主頻信息中的至少一個(gè)。
16. 根據(jù)權(quán)利要求15所述的音頻解碼裝置，其中，所述渲染器基于所述諧波信息調(diào)整所述預(yù)定對(duì)象信號(hào)的增益。
17. 根據(jù)權(quán)利要求15所述的音頻解碼裝置，其中，所述渲染器基于所述諧波信息補(bǔ)償預(yù)定頻帶中的對(duì)象信號(hào)。
18. 根據(jù)權(quán)利要求IO所述的音頻解碼裝置，進(jìn)一步包括緩沖器，其補(bǔ)償所述空間信息和所述縮減混音信號(hào)之間的延遲。
19. 一種計(jì)算機(jī)可讀記錄介質(zhì)，其上記錄了用于執(zhí)行音頻解碼方法的計(jì)算機(jī)程序，所述音頻解碼方法包括從輸入音頻信號(hào)中提取縮減混音信號(hào)和基于對(duì)象的邊信息；基于輸入控制信息生成渲染信息；以及基于所述渲染信息和所述基于對(duì)象的邊信息，生成基于聲道的邊信息。
20. 根據(jù)權(quán)利要求19所述的計(jì)算機(jī)可讀記錄介質(zhì)，其中，所述音頻解碼方法進(jìn)一步包括基于所述縮減混音信號(hào)和所述基于聲道的邊信息生成多聲道音頻信號(hào)。
全文摘要
提供了一種音頻編碼方法和裝置以及一種音頻解碼方法和裝置，其中音頻信號(hào)可以被編碼或解碼使得對(duì)于每一個(gè)對(duì)象音頻信號(hào)聲像可以被定位于期望的位置。該音頻解碼方法包括從輸入音頻信號(hào)中提取縮減混音信號(hào)和基于對(duì)象的邊信息；基于輸入控制信息生成渲染信息；以及基于該渲染信息和該基于對(duì)象的邊信息，生成空間信息。
文檔編號(hào)G10L19/00GK101484935SQ200780024120
公開(kāi)日2009年7月15日申請(qǐng)日期2007年10月1日優(yōu)先權(quán)日2006年9月29日
發(fā)明者尹圣龍, 房熙錫, 李顯國(guó), 林宰顯, 金東秀申請(qǐng)人:Lg電子株式會(huì)社

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專(zhuān)利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：房熙錫;金東秀;李顯國(guó);林宰顯;尹圣龍
技術(shù)所有人：LG電子株式會(huì)社
我是此專(zhuān)利的發(fā)明人

上一篇：用于編碼和解碼基于對(duì)象的音頻信號(hào)的方法和裝置的制作方法
上一篇：聲音幀長(zhǎng)度適配的制作方法

相關(guān)技術(shù)

網(wǎng)友詢問(wèn)留言已有0條留言

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

音頻編解碼相關(guān)技術(shù)

音頻編解碼芯片相關(guān)技術(shù)

silk音頻編解碼協(xié)議相關(guān)技術(shù)

音頻編解碼技術(shù)相關(guān)技術(shù)

音頻編解碼算法相關(guān)技術(shù)

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

用于編碼和解碼基于對(duì)象的音頻信號(hào)的方法和裝置的制作方法