專(zhuān)利名稱:用于編碼和解碼基于對(duì)象的音頻信號(hào)的方法和裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種音頻編碼方法和裝置,以及一種音頻解碼方法和 裝置,其中每一個(gè)對(duì)象音頻信號(hào)的聲像可被定位于任何希望的位置。
背景技術(shù):
一般來(lái)說(shuō),在多聲道音頻編碼和解碼技術(shù)中,多聲道信號(hào)的多個(gè) 聲道信號(hào)被縮減混音進(jìn)少數(shù)聲道信號(hào)中,傳輸關(guān)于原始聲道信號(hào)的邊 信息并且恢復(fù)具有和原始多聲道信號(hào)一樣多的聲道的多聲道信號(hào)。
基于對(duì)象的音頻編碼和解碼技術(shù)與多聲道音頻編碼和解碼技術(shù)在 將多個(gè)聲音源縮減混音進(jìn)少數(shù)聲音源信號(hào)中,并傳輸關(guān)于原始聲音源 的邊信息方面是基本上相似的。然而,在基于對(duì)象的音頻編碼和解碼 技術(shù)中,對(duì)象信號(hào),其為聲道信號(hào)的基本元素(例如樂(lè)器的聲音或人 的語(yǔ)音),被視為與多聲道音頻編碼和解碼技術(shù)中的聲道信號(hào)相同, 并且也可被編/解碼。
換句話說(shuō),在基于對(duì)象的音頻編碼和解碼技術(shù)中,每個(gè)對(duì)象信號(hào)
將被視為編/解碼的主體(entities)。在這點(diǎn)上,基于對(duì)象的音頻編碼 和解碼技術(shù)與多聲道音頻編碼和解碼技術(shù)是有區(qū)別的,該區(qū)別在于多 聲道音頻編/解碼是簡(jiǎn)單的根據(jù)聲道間信息而被編/解碼的,而與要被編 /解碼的聲道信號(hào)中的元素?cái)?shù)量無(wú)關(guān)。
發(fā)明內(nèi)容
技術(shù)問(wèn)題
本發(fā)明提供了一種音頻編碼方法和裝置,以及一種音頻解碼方法 和裝置,其中可對(duì)音頻信號(hào)進(jìn)行編碼或解碼以使每一個(gè)對(duì)象音頻信號(hào)的聲像可被定位于任何希望的位置。 技術(shù)方案
根據(jù)本發(fā)明的一個(gè)方面,其提供了一種音頻解碼方法,包括從 輸入音頻信號(hào)中提取縮減混音信號(hào)和基于對(duì)象的邊信息;基于輸入控 制信息生成渲染信息;以及基于該渲染信息和該基于對(duì)象的邊信息, 生成基于聲道的邊信息。
根據(jù)本發(fā)明的另一個(gè)方面,其提供了一種音頻解碼裝置,包括 解復(fù)用器,用于從輸入音頻信號(hào)中提取縮減混音信號(hào)和基于對(duì)象的邊 信息;渲染器,用于基于輸入控制信息生成渲染信息;以及代碼轉(zhuǎn)換
器,用于基于該渲染信息和該基于對(duì)象的邊信息生成基于聲道的邊信 息。
根據(jù)本發(fā)明的另一個(gè)方面,其提供了一種計(jì)算機(jī)可讀記錄介質(zhì), 其上記錄了用于執(zhí)行音頻解碼方法的計(jì)算機(jī)程序,該音頻解碼方法包
括從輸入音頻信號(hào)中提取縮減混音信號(hào)和基于對(duì)象的邊信息;基于 輸入控制信息生成渲染信息;以及基于該渲染信息和該基于對(duì)象的邊 信息,生成基于聲道的邊信息。
有益效果
提供了一種音頻編碼方法和裝置,以及一種音頻解碼方法和裝置, 其中可對(duì)音頻信號(hào)進(jìn)行編碼或解碼以使每一個(gè)對(duì)象音頻信號(hào)的聲像可 被定位于任何希望的位置。
通過(guò)以下的詳細(xì)描述和附圖,本發(fā)明將變得更加易于理解,附圖 只是示例性的,其并不構(gòu)成對(duì)本發(fā)明的限制,其中
圖1是典型的基于對(duì)象的音頻編碼/解碼系統(tǒng)的方框圖; 圖2是根據(jù)本發(fā)明第一實(shí)施例的音頻解碼裝置的方框圖;圖3是根據(jù)本發(fā)明第二實(shí)施例的音頻解碼裝置的方框圖4用于解釋幅度差和時(shí)間差對(duì)于聲像定位的影響,其是相互獨(dú)
立的;
圖5是關(guān)于幅度差和時(shí)間差之間的對(duì)應(yīng)關(guān)系的函數(shù)圖,其中該幅
度差和時(shí)間差是將聲像定位于預(yù)定位置所需要的; 圖6表示包括諧波信息的控制數(shù)據(jù)的格式; 圖7是根據(jù)本發(fā)明第三實(shí)施例的音頻解碼裝置的方框圖; 圖8是可被應(yīng)用于如圖7所示的音頻解碼裝置中的藝術(shù)縮減混音
增益(ADG)模塊的方框圖9是根據(jù)本發(fā)明第四實(shí)施例的音頻解碼裝置的方框圖; 圖IO是根據(jù)本發(fā)明第五實(shí)施例的音頻解碼裝置的方框圖11是根據(jù)本發(fā)明第六實(shí)施例的音頻解碼裝置的方框圖12是根據(jù)本發(fā)明第七實(shí)施例的音頻解碼裝置的方框圖; 圖13是根據(jù)本發(fā)明第八實(shí)施例的音頻解碼裝置的方框圖; 圖14是用于解釋由圖13所示的音頻解碼裝置使用于幀的三維
(3D)信息的應(yīng)用的框圖15是根據(jù)本發(fā)明第九實(shí)施例的音頻解碼裝置的方框圖; 圖16是根據(jù)本發(fā)明第十實(shí)施例的音頻解碼裝置的方框圖17-19是用于解釋根據(jù)本發(fā)明一個(gè)實(shí)施例的音頻解碼方法的框
圖20是根據(jù)本發(fā)明一個(gè)實(shí)施例的音頻編碼裝置的方框圖。
實(shí)施本發(fā)明的最佳模式
現(xiàn)在將參考附圖來(lái)詳細(xì)說(shuō)明本發(fā)明,在附圖中已表示了本發(fā)明的 示例性實(shí)施例。
根據(jù)本發(fā)明的一種音頻編碼方法和裝置以及一種音頻解碼方法和 裝置可被應(yīng)用于基于對(duì)象的音頻處理操作,但是本發(fā)明并不限于此。 換句話說(shuō),該音頻編碼方法和裝置以及音頻解碼方法和裝置還可被應(yīng) 用于基于對(duì)象的音頻處理操作之外的各種信號(hào)處理操作。
7圖1是典型的基于對(duì)象的音頻編碼/解碼系統(tǒng)的方框圖。通常來(lái)說(shuō), 輸入給基于對(duì)象的音頻編碼裝置的音頻信號(hào)與多聲道信號(hào)的聲道是不 對(duì)應(yīng)的,這些音頻信號(hào)是獨(dú)立的對(duì)象信號(hào)。在這點(diǎn)上,基于對(duì)象的音 頻編碼裝置與多聲道音頻編碼裝置是不同的,其區(qū)別在于多聲道音頻 編碼裝置輸入多聲道信號(hào)的聲道信號(hào)。
舉例來(lái)說(shuō),諸如5.1聲道信號(hào)的左前聲道信號(hào)和右前聲道信號(hào)之 類(lèi)的聲道信號(hào)被輸入到多聲道音頻編碼裝置中,然而諸如人語(yǔ)音或樂(lè) 器聲音(例如小提琴或鋼琴的聲音)之類(lèi)的比聲道信號(hào)小的主體的對(duì) 象音頻信號(hào)可被輸入到基于對(duì)象的音頻編碼裝置中。
參見(jiàn)圖1,該基于對(duì)象的音頻編碼/解碼系統(tǒng)包括基于對(duì)象的音 頻編碼裝置和基于對(duì)象的音頻解碼裝置?;趯?duì)象的音頻編碼裝置包
括對(duì)象編碼器100,基于對(duì)象的音頻解碼裝置包括對(duì)象解碼器111和渲 染器113。
對(duì)象編碼器100接收N個(gè)對(duì)象音頻信號(hào),并且生成帶有一個(gè)或多 個(gè)聲道的基于對(duì)象的縮減混音信號(hào)和邊信息,上述邊信息包括從N個(gè) 對(duì)象音頻信號(hào)中提取的多條信息片,例如能量差,相位差和相關(guān)性值。 邊信息和基于對(duì)象的縮減混音信號(hào)被合并入一個(gè)單一比特流中,并且 該比特流被傳輸給基于對(duì)象的解碼裝置。
邊信息可包括指示是否執(zhí)行基于聲道的音頻編/解碼或基于對(duì)象 的音頻編/解碼的標(biāo)志,貝ij,可以根據(jù)邊信息的標(biāo)志來(lái)確定是執(zhí)行基于 聲道的音頻編/解碼還是執(zhí)行基于對(duì)象的音頻編/解碼。邊信息還可包括 關(guān)于對(duì)象信號(hào)的包絡(luò)信息、分組信息、靜止期信息和延遲信息。邊信 息還可包括對(duì)象電平差信息、對(duì)象間互相關(guān)信息、縮減混音增益信息、 縮減混音聲道電平差信息和絕對(duì)對(duì)象能量信息。對(duì)象解碼器111接收來(lái)自基于對(duì)象音頻編碼裝置的基于對(duì)象的縮 減混音信號(hào)和邊信息,并且根據(jù)基于對(duì)象的縮減混音信號(hào)和邊信息來(lái)
恢復(fù)具有與N個(gè)對(duì)象音頻信號(hào)相似屬性的對(duì)象信號(hào)。由對(duì)象解碼器111
生成的對(duì)象信號(hào)并沒(méi)有被分配給多聲道空間中的任何位置。因此渲染
器113將由對(duì)象解碼器111生成的對(duì)象信號(hào)的每一個(gè)分配給多聲道空 間中的預(yù)定位置,并且渲染器113確定對(duì)象信號(hào)的電平,這樣可通過(guò) 由渲染器113指定的各個(gè)相應(yīng)位置和由渲染器113確定的各個(gè)相應(yīng)電 平來(lái)再現(xiàn)對(duì)象信號(hào)。與由對(duì)象解碼器111生成的每個(gè)對(duì)象信號(hào)相關(guān)的 控制信息可隨時(shí)間而改變,貝IJ,由對(duì)象解碼器111生成的對(duì)象信號(hào)的 電平和空間位置可根據(jù)控制信號(hào)而改變。
圖2是根據(jù)本發(fā)明第一實(shí)施例的音頻解碼裝置120的方框圖。參 見(jiàn)圖2,該音頻解碼裝置120包括對(duì)象解碼器121,渲染器123,和 參數(shù)變換器125。該音頻解碼裝置120還包括解復(fù)用器(未示出),用 于從輸入的比特流中提取縮減混音信號(hào)和邊信息,并且該解復(fù)用器將 應(yīng)用于根據(jù)本發(fā)明的其它實(shí)施例的所有音頻解碼裝置中。
對(duì)象解碼器121根據(jù)縮減混音信號(hào)和由參數(shù)變換器125提供的修 改后的邊信息來(lái)生成多個(gè)對(duì)象信號(hào)。渲染器123將由對(duì)象解碼器121 生成的對(duì)象信號(hào)的每一個(gè)分配到多聲道空間中的預(yù)定位置,并且根據(jù) 控制信息來(lái)確定由對(duì)象解碼器121生成的對(duì)象信號(hào)的電平。參數(shù)變換 器125通過(guò)組合邊信息和控制信息來(lái)生成修改后的邊信息。接著,參 數(shù)變換器125將修改后的邊信息傳輸給對(duì)象解碼器121。
對(duì)象解碼器121可通過(guò)分析修改后的邊信息中的控制信息來(lái)執(zhí)行 自適應(yīng)解碼。
舉例來(lái)說(shuō),如果控制信息指示第一對(duì)象信號(hào)和第二對(duì)象信號(hào)被分 配給多聲道空間中的相同的位置,并且具有相同的電平,則典型的音 頻解碼裝置可分別解碼第一和第二對(duì)象信號(hào),接著通過(guò)混音/渲染操作來(lái)將它們安排到多聲道空間中。
在另一方面,音頻解碼裝置120的對(duì)象解碼器121從修改后的邊 信息中的控制信息中得知第一和第二對(duì)象信號(hào)被分配到多聲道空間中 的相同位置,并且具有相同電平,如同第一和第二對(duì)象信號(hào)是一個(gè)單 獨(dú)的聲音源。從而,對(duì)象解碼器121將第一和第二對(duì)象信號(hào)看成一個(gè) 單獨(dú)的聲音源而解碼第一和第二對(duì)象信號(hào),而不將它們分開(kāi)解碼。這 樣的話,解碼的復(fù)雜度降低了。另外,因?yàn)樾枰幚淼穆曇粼吹臄?shù)量 減少了,混音/渲染的復(fù)雜度也降低了。
音頻解碼裝置120可被有效的使用于當(dāng)對(duì)象信號(hào)的數(shù)量大于輸出 聲道的數(shù)量這種情況,因?yàn)槎鄠€(gè)對(duì)象信號(hào)很有可能被分配到相同的空 間位置。
可選的是,音頻解碼裝置120可被使用于當(dāng)?shù)谝粚?duì)象信號(hào)和第二 對(duì)象信號(hào)被分配到多聲道空間中的相同位置,但具有不同電平這種情 況。這種情況下,音頻解碼裝置120將第一和第二對(duì)象信號(hào)視為一體 來(lái)解碼第一和第二對(duì)象信號(hào),而不分別解碼第一和第二對(duì)象信號(hào),并
且將解碼后的第一和第二對(duì)象信號(hào)傳輸給渲染器123。更具體來(lái)說(shuō),對(duì) 象解碼器121從修改后的邊信息中的控制信息得到關(guān)于第一和第二對(duì) 象信號(hào)的電平之間的差的信息,并根據(jù)獲得的信息來(lái)解碼第一和第二 對(duì)象信號(hào)。這樣的話,即使第一和第二對(duì)象信號(hào)具有不同電平,也可 將第一和第二對(duì)象信號(hào)當(dāng)成單一聲音源來(lái)進(jìn)行解碼。
同樣可選的是,對(duì)象解碼器121可根據(jù)控制信息來(lái)調(diào)整由對(duì)象解 碼器121生成的對(duì)象信號(hào)的電平。接著,對(duì)象解碼器121可解碼調(diào)整 過(guò)電平的對(duì)象信號(hào)。從而,渲染器123不需要調(diào)整由對(duì)象解碼器121 提供的解碼后的對(duì)象信號(hào),而只要簡(jiǎn)單的將由對(duì)象解碼器121提供的 解碼后的對(duì)象信號(hào)安排到多聲道空間中。簡(jiǎn)而言之,因?yàn)閷?duì)象解碼器 121根據(jù)控制信息調(diào)整了由對(duì)象解碼器121生成的對(duì)象信號(hào)的電平,渲染器123可容易的將由對(duì)象解碼器121生成的對(duì)象信號(hào)安排到多聲道 空間中,而不需要額外的調(diào)整由對(duì)象解碼器121生成的對(duì)象信號(hào)的電 平。因此,可以減少混音/渲染的復(fù)雜度。
根據(jù)圖2的實(shí)施例,音頻解碼裝置120的對(duì)象解碼器可通過(guò)對(duì)控 制信息的分析來(lái)自適應(yīng)的執(zhí)行解碼操作,從而減少解碼的復(fù)雜度和混 音/渲染的復(fù)雜度??墒褂糜梢纛l解碼裝置120執(zhí)行的上述方法的組合。
圖3是根據(jù)本發(fā)明第二實(shí)施例的音頻解碼裝置130的方框圖。參 見(jiàn)圖3,音頻解碼裝置130包括對(duì)象解碼器131和渲染器133。該音頻 解碼裝置130的特征在于其不僅提供邊信息給對(duì)象解碼器131,還提 供給渲染器133。
即使在存在相應(yīng)于靜止期的對(duì)象信號(hào)時(shí),音頻解碼裝置130也可 有效的執(zhí)行解碼操作。舉例來(lái)說(shuō),第二至第四對(duì)象信號(hào)可能相應(yīng)于樂(lè) 器演奏的音樂(lè)演奏期,而第一對(duì)象信號(hào)可能相應(yīng)于伴奏演奏的靜止期。
在這種情況下,指示多個(gè)對(duì)象信號(hào)中的哪一個(gè)對(duì)應(yīng)于靜止期的信息可 被包括在邊信息中,并且該邊信息可被提供給渲染器133和對(duì)象解碼 器131。
對(duì)象解碼器131可通過(guò)不對(duì)相應(yīng)于靜止期的對(duì)象信號(hào)進(jìn)行解碼來(lái) 最小化解碼復(fù)雜度。對(duì)象解碼器131將一個(gè)對(duì)象信號(hào)設(shè)置為相應(yīng)于0 值,并且將該對(duì)象信號(hào)的電平傳輸給渲染器133。 一般來(lái)說(shuō),具有0值 的對(duì)象信號(hào)被視為與具有非0值的對(duì)象信號(hào)相同,并且一起進(jìn)入混音/ 渲染操作。
在另一方面,音頻解碼裝置130傳輸包括指示多個(gè)對(duì)象物體相應(yīng) 于靜止期的信息的邊信息給渲染器133,接著阻止相應(yīng)于靜止期的對(duì)象 信號(hào)進(jìn)入由渲染器133執(zhí)行的混音/渲染操作。因此,音頻解碼裝置130 可阻止混音/渲染的復(fù)雜度的不必要增加。
11渲染器133可使用包括在控制信息中的混音參數(shù)信息來(lái)定義立體 聲場(chǎng)景中的每個(gè)對(duì)象信號(hào)的聲像。混音參數(shù)信息可僅包括幅度信息或 包括幅度信息和時(shí)間信息。混音參數(shù)信息不僅影響立體聲聲像的定位, 還影響用戶對(duì)于空間聲音質(zhì)量的心理聲學(xué)的感覺(jué)。
舉例來(lái)說(shuō),通過(guò)比較分別通過(guò)使用時(shí)間淘選方法和幅度淘選方法
生成的,及使用2聲道立體聲揚(yáng)聲器在相同位置再現(xiàn)的兩個(gè)聲像,可
以得知幅度淘選方法可實(shí)現(xiàn)聲像的精確定位,而時(shí)間淘選方法可以提
供有空間深厚感的自然聲音。貝U,如果渲染器133僅使用幅度淘選方 法來(lái)在多聲道空間中安排對(duì)象信號(hào),渲染器133可以精確的定位每個(gè) 聲像,但是不能提供使用時(shí)間淘選方法時(shí)的聲音的深厚感。根據(jù)聲源 的類(lèi)型,用戶有時(shí)會(huì)偏好聲音的精確定位而不是聲音的深厚感,反之 亦然。
圖4(a)和4(b)解釋在使用2聲道立體聲揚(yáng)聲器來(lái)再現(xiàn)信號(hào)時(shí)強(qiáng)度 差(幅度差)和時(shí)間差對(duì)于聲像定位的影響。參見(jiàn)圖4(a)和4(b),根據(jù) 互相獨(dú)立的幅度差和時(shí)間差,來(lái)將一個(gè)聲像定位到預(yù)定角度。例如, 可以使用大約8dB的幅度差,或與8dB的幅度差相等的大約0.5ms的 時(shí)間差來(lái)將聲像定位在角度20。因此,即使僅提供了幅度差作為混音 參數(shù)信息,也能夠通過(guò)將幅度差轉(zhuǎn)換為時(shí)間差來(lái)獲得具有不同屬性的 多種聲音,其中時(shí)間差在聲像定位期間等同于幅度差。
圖5表示關(guān)于將聲像定位于角度10、 20和30所需要的幅度差和 時(shí)間差之間對(duì)應(yīng)關(guān)系的函數(shù)。圖5中所示的函數(shù)可根據(jù)圖4(a)和4(b) 獲得。參見(jiàn)圖5,多種幅度差-時(shí)間差的比較可被提供來(lái)將聲像定位于 預(yù)定位置。例如,假設(shè)8dB的幅度差被提供為混音參數(shù)信息來(lái)將聲像 定位在角度20。根據(jù)圖5所示的函數(shù),還可使用3dB的幅度差和0.3ms 的時(shí)間差的組合來(lái)將聲像定位在角度20。在這種情況下,不僅提供幅 度差信息還提供時(shí)間差信息作為混音參數(shù)信息,從而增強(qiáng)了空間感。因此,為了在混音/渲染操作期間生成具有用戶期望的屬性的聲
音,混音參數(shù)信息可被適當(dāng)?shù)霓D(zhuǎn)換,使得能夠執(zhí)行適合于用戶的幅度
淘選和時(shí)間淘選中的任何一個(gè)。也就是說(shuō),如果混音參數(shù)信息僅包括
幅度差信息,但用戶期望具有空間深厚感的聲音,該幅度差信息可參
考心理聲學(xué)數(shù)據(jù)而被轉(zhuǎn)換為等同于幅度差信息的時(shí)間差信息。可選的
是,如果用戶同時(shí)期望空間深厚感的聲音和聲像的精確定位,幅度差
信息可被轉(zhuǎn)換為幅度差信息和等同于原始幅度信息的時(shí)間差信息的組 合。
可選的是,如果混音參數(shù)信息僅包括時(shí)間差信息,但用戶期望聲 像的精確定位,該時(shí)間差信息可被轉(zhuǎn)換為等同于時(shí)間差信息的幅度差 信息,或可被轉(zhuǎn)換為幅度差信息和時(shí)間差信息的組合,該組合可通過(guò) 增強(qiáng)聲像的精確定位和空間感來(lái)滿足用戶的偏好。
仍然可選的是,如果混音參數(shù)信息包括幅度差信息和時(shí)間差信息, 并且用戶選擇聲像的精確定位,幅度差信息和時(shí)間差信息的組合可被 轉(zhuǎn)換為等同于原始幅度差信息和時(shí)間差信息的組合的幅度差信息。在 另一方面,如果混音參數(shù)信息包括幅度差信息和時(shí)間差信息,并且用 戶期望空間感的增強(qiáng),幅度差信息和時(shí)間差信息的組合可被轉(zhuǎn)換為等 同于幅度差信息和原始時(shí)間差信息組合的時(shí)間差信息。
參見(jiàn)圖6,控制信息可包括關(guān)于一個(gè)或多個(gè)對(duì)象信號(hào)的混音/渲染 信息和諧波信息。諧波信息可包括關(guān)于一個(gè)或多個(gè)對(duì)象信號(hào)的基音信 息,基頻信息和主頻帶信息中的至少一個(gè),以及每個(gè)對(duì)象信號(hào)的每個(gè) 子帶的頻譜和能量的說(shuō)明。
因?yàn)橐宰訋閱挝粓?zhí)行操作的渲染器的清晰度的不足,諧波信息 可被使用于在渲染操作期間處理對(duì)象信號(hào)。如果該諧波信息包括關(guān)于一個(gè)或多個(gè)對(duì)象信號(hào)的基音信息,可通 過(guò)使用梳狀濾波器或逆梳狀濾波器來(lái)削弱或增強(qiáng)預(yù)定頻域來(lái)調(diào)整每個(gè) 對(duì)象信號(hào)的增益。舉例來(lái)說(shuō),如果多個(gè)對(duì)象信號(hào)中的一個(gè)是嗓音信號(hào),
這些對(duì)象信號(hào)可通過(guò)僅削弱嗓音信號(hào)而被用于卡拉OK。可選的是,如
果諧波信息包括關(guān)于一個(gè)或多個(gè)對(duì)象信號(hào)的主頻域信息,則可執(zhí)行削 弱或增強(qiáng)主頻域的處理。仍然可選的是,如果諧波信息包括關(guān)于一個(gè) 或多個(gè)對(duì)象信號(hào)的頻譜信息,可通過(guò)執(zhí)行不被任何子帶邊界限制的削 弱或增強(qiáng)來(lái)控制每個(gè)對(duì)象信號(hào)的增益。
圖7是根據(jù)本發(fā)明另一個(gè)實(shí)施例的音頻解碼裝置140的方框圖。 參見(jiàn)圖7,音頻解碼裝置140使用多聲道解碼器141來(lái)代替對(duì)象解碼器 和渲染器,并且在對(duì)象信號(hào)被適當(dāng)?shù)陌才旁诙嗦暤揽臻g中后解碼多個(gè) 對(duì)象信號(hào)。
具體來(lái)說(shuō),音頻解碼裝置140包括多聲道解碼器141和參數(shù)變換 器145。多聲道解碼器141生成多聲道信號(hào),這些多聲道信號(hào)的對(duì)象信 號(hào)根據(jù)縮減混音信號(hào)和空間參數(shù)信息被安排到多聲道空間中,該空間 參數(shù)信息是由參數(shù)變換器145提供的基于聲道的邊信息。參數(shù)變換器 145分析由音頻編碼裝置(未示出)傳輸來(lái)的邊信息和控制信息,并且 根據(jù)分析的結(jié)果生成空間參數(shù)信息。更具體的,參數(shù)變換器145通過(guò) 邊信息和控制信息來(lái)生成空間參數(shù)信息,該控制信息包括回放設(shè)置信 息和混音信息。也就是說(shuō),對(duì)應(yīng)于一至二(OTT)盒或二至三(TTT)盒, 參數(shù)變換器145把邊信息和控制信息的組合變換為空間數(shù)據(jù)。
音頻解碼裝置140可執(zhí)行多聲道解碼操作,其中基于對(duì)象的解碼 操作和混音/渲染操作被合并,并且可以跳過(guò)對(duì)每個(gè)對(duì)象信號(hào)的解碼。 因此,可以降低解碼和/或混音/渲染的復(fù)雜度。
舉例來(lái)說(shuō),當(dāng)使用5.1聲道揚(yáng)聲器再現(xiàn)系統(tǒng)來(lái)再現(xiàn)10個(gè)對(duì)象信號(hào) 和根據(jù)這10個(gè)對(duì)象信號(hào)而獲得的多聲道信號(hào)時(shí),典型的基于對(duì)象的音頻解碼裝置根據(jù)縮減混音信號(hào)和邊信息來(lái)生成分別對(duì)應(yīng)于這io個(gè)對(duì)象 信號(hào)的解碼后的信號(hào),并且通過(guò)將這IO個(gè)對(duì)象信號(hào)適當(dāng)?shù)陌才诺蕉嗦?br>
道空間中來(lái)生成5.1聲道信號(hào),則這些對(duì)象信號(hào)變得適于5.1聲道揚(yáng)聲 器環(huán)境。然而,在5.1聲道信號(hào)生成期間,生成10個(gè)對(duì)象信號(hào)的效率 是很低的,并且這個(gè)問(wèn)題在對(duì)象信號(hào)的數(shù)量和要生成的多聲道信號(hào)的 聲道數(shù)量之間的差增加時(shí)變得更加嚴(yán)重。
在另一方面,根據(jù)圖7所示的實(shí)施例,音頻解碼裝置140根據(jù)邊 信息和控制信息來(lái)生成適于5.1聲道信號(hào)的空間參數(shù)信息,并且將空間 參數(shù)信息和縮減混音信號(hào)提供給多聲道解碼器M1。接著,多聲道解碼 器141根據(jù)空間參數(shù)信息和縮減混音信號(hào)生成5.1聲道信號(hào)。換句話說(shuō), 當(dāng)要輸出的聲道數(shù)量是5.1聲道時(shí),音頻解碼裝置140根據(jù)縮減混音信 號(hào)可容易的生成5.1聲道信號(hào),而不需要生成10個(gè)對(duì)象信號(hào),則該音 頻解碼裝置相對(duì)于通常的音頻解碼裝置在復(fù)雜度方面更有效率。
當(dāng)通過(guò)分析由音頻編碼裝置傳輸來(lái)的邊信息和控制信息來(lái)計(jì)算對(duì) 應(yīng)于每個(gè)OTT盒和TTT盒的空間參數(shù)信息所需的計(jì)算量小于在每個(gè)對(duì) 象信號(hào)解碼之后執(zhí)行混音/渲染操作所需的計(jì)算量時(shí),該音頻解碼裝置
140更為有效。
通過(guò)分析邊信息和控制信息來(lái)把用于生成空間參數(shù)信息的模塊加 入到典型的多聲道音頻解碼裝置,可獲得該音頻解碼裝置140,并且可 維持與典型的多聲道音頻解碼裝置的兼容性。同樣的,音頻解碼裝置 140可通過(guò)使用典型的多聲道解碼裝置的現(xiàn)有的工具來(lái)提高聲音質(zhì)量, 諸如包絡(luò)整形器,子帶時(shí)域處理(STP)工具和去相關(guān)器。通過(guò)上述內(nèi) 容,可以推斷出典型的多聲道音頻解碼方法的所有優(yōu)點(diǎn)都可被輕松的 應(yīng)用于基于對(duì)象的音頻解碼方法。
由參數(shù)變換器145傳輸給多聲道解碼器141的空間參數(shù)信息可被 壓縮以適于傳輸??蛇x的是,空間參數(shù)信息可具有與由典型的多聲道編碼裝置所傳輸?shù)臄?shù)據(jù)一樣的格式。也就是說(shuō),空間參數(shù)信息可進(jìn)入 霍夫曼解碼操作或?qū)ьl解碼操作,并且可作為未壓縮的空間線索數(shù)據(jù)
(space cue data)傳輸給每個(gè)模塊。前一種適于通過(guò)遙控來(lái)傳輸空間參
數(shù)信息給多聲道音頻解碼裝置,后一種也很方便,因?yàn)椴恍枰嗦暤?音頻解碼裝置把壓縮的空間線索數(shù)據(jù)轉(zhuǎn)換到更容易在解碼操作中使用
的未壓縮的空間線索數(shù)據(jù)。
根據(jù)邊信息和控制信息的分析的空間參數(shù)信息的配置可能導(dǎo)致縮 減混音信號(hào)和空間參數(shù)信息之間的延遲。為了避免這一點(diǎn),可提供一 個(gè)額外的緩沖器用于縮減混音信號(hào)或用于空間參數(shù)信息,這樣縮減混 音信號(hào)和空間參數(shù)信息可彼此同步。然而這些方法是不方便的,因?yàn)?需要提供額外的緩沖器??蛇x的是,邊信息可于縮減混音信號(hào)之前被 傳輸,其已經(jīng)考慮了可能發(fā)生的縮減混音信號(hào)和空間參數(shù)信息之間的 延遲。在這種情況下,通過(guò)組合邊信息和控制信息而得到的空間參數(shù) 信息不需要再被調(diào)整而可被容易的使用。
如果縮減混音信號(hào)的多個(gè)對(duì)象信號(hào)具有不同電平,能直接補(bǔ)償縮 減混音信號(hào)的藝術(shù)縮減混音增益(ADG)模塊可以確定對(duì)象信號(hào)的相 關(guān)電平,并且可使用諸如聲道電平差信息,聲道間相關(guān)性(ICC)信息 和聲道預(yù)測(cè)系數(shù)(CPC)信息之類(lèi)的空間線索數(shù)據(jù)來(lái)將每個(gè)對(duì)象信號(hào)分 配到多聲道空間中的預(yù)定位置。
舉例來(lái)說(shuō),如果控制信息指示一個(gè)預(yù)定對(duì)象信號(hào)將被分配到多聲 道空間中的預(yù)定位置,并且該對(duì)象信號(hào)的電平高于其它對(duì)象信號(hào),典 型的多聲道解碼器可計(jì)算縮減混音信號(hào)的聲道能量之間的差,并且根 據(jù)計(jì)算的結(jié)果將縮減混音信號(hào)劃分為若干輸出聲道。然而,典型的多 聲道解碼器不能增加或減小縮減混音信號(hào)中聲音的音量。換句話說(shuō), 典型的多聲道解碼器簡(jiǎn)單的將縮減混音信號(hào)分配給若干輸出聲道,并 且不增加或減小縮減混音信號(hào)中聲音的音量。
16根據(jù)控制信息將由對(duì)象編碼器生成的多個(gè)對(duì)象信號(hào)的每一個(gè)分配 到多聲道空間中的預(yù)定位置也是相對(duì)很簡(jiǎn)單的。然而,增加或減小預(yù) 定對(duì)象信號(hào)的增幅則需要特殊的技術(shù)。換句話說(shuō),如果使用由對(duì)象編 碼器生成的縮減混音信號(hào),減小縮減混音信號(hào)的每個(gè)對(duì)象信號(hào)的幅度 是困難的。
因此,根據(jù)本發(fā)明一個(gè)實(shí)施例,可使用如圖8中所示的ADG模塊 147根據(jù)控制信息來(lái)改變對(duì)象信號(hào)的相關(guān)幅度。更具體的說(shuō),可以通過(guò) 使用ADG模塊147來(lái)增加或減小由對(duì)象編碼器所傳輸?shù)目s減混音信號(hào) 的多個(gè)對(duì)象信號(hào)的任何一個(gè)的幅度。由ADG模塊147執(zhí)行補(bǔ)償所獲得 的縮減混音信號(hào)可被進(jìn)行多聲道解碼。
如果使用ADG模塊147來(lái)適當(dāng)?shù)恼{(diào)整縮減混音信號(hào)的對(duì)象信號(hào)的 相對(duì)幅度,則可以使用典型的多聲道解碼器來(lái)執(zhí)行對(duì)象解碼。如果由 對(duì)象編碼器生成的縮減混音信號(hào)是單聲道或立體聲信號(hào)或具有三個(gè)或 更多聲道的多聲道信號(hào),該縮減混音信號(hào)可被ADG模塊147處理。如 果由對(duì)象編碼器生成的縮減混音信號(hào)具有兩個(gè)或更多聲道,并且需要 由ADG模塊147來(lái)調(diào)整的預(yù)定對(duì)象信號(hào)僅存在于縮減混音信號(hào)中的一 個(gè)聲道中,則ADG模塊147可僅被應(yīng)用于包括該預(yù)定對(duì)象信號(hào)的聲道, 而不是應(yīng)用于縮減混音信號(hào)的所有聲道。由ADG模塊147通過(guò)上述方 法處理后的縮減混音信號(hào)可很容易的使用典型的多聲道解碼器來(lái)處 理,而不需要修改多聲道解碼器的結(jié)構(gòu)。
即使當(dāng)最終輸出的信號(hào)不是可被多聲道揚(yáng)聲器再現(xiàn)的多聲道信 號(hào),而是雙耳信號(hào),可以使用ADG模塊147去調(diào)整最終輸出信號(hào)的對(duì) 象信號(hào)的相關(guān)幅度。
作為使用ADG模塊147的替代,在多個(gè)對(duì)象信號(hào)的生成期間,控 制信息中可包括指定將要應(yīng)用于每個(gè)對(duì)象信號(hào)的增益值的增益信息。 為此,可能要修改典型的多聲道解碼器的結(jié)構(gòu)。即使需要修改現(xiàn)有多
17聲道解碼器的結(jié)構(gòu),在解碼操作期間,通過(guò)將增益值應(yīng)用于每個(gè)對(duì)象
信號(hào),而不需要計(jì)算ADG和補(bǔ)償每個(gè)對(duì)象信號(hào),該方法在降低解碼復(fù)雜度方面還是很方便的。
圖9是根據(jù)本發(fā)明第四實(shí)施例的音頻解碼裝置150的方框圖。參見(jiàn)圖9,音頻解碼裝置150的特征在于生成雙耳信號(hào)。
具體來(lái)說(shuō),音頻解碼裝置150包括多聲道雙耳解碼器151,第一參數(shù)變換器157和第二參數(shù)變換器159。
第二參數(shù)變換器159分析由音頻編碼裝置提供的邊信息和控制信息,并且根據(jù)分析結(jié)果來(lái)配置空間參數(shù)信息。第一參數(shù)變換器157通過(guò)增加三維(3D)信息,例如頭相關(guān)傳輸函數(shù)(HRTF)參數(shù)給空間參數(shù)信息,來(lái)配置可被多聲道雙耳解碼器151使用的雙耳參數(shù)信息。多聲道雙耳解碼器151通過(guò)應(yīng)用虛擬3D參數(shù)信息給縮減混音信號(hào)來(lái)生成虛擬三維(3D)信號(hào)。
第一參數(shù)變換器157和第二參數(shù)變換器159可被一個(gè)單獨(dú)的模塊所取代,即參數(shù)變換模塊155,其接收邊信息、控制信息和HRTF參數(shù),并且根據(jù)邊信息、控制信息和HRTF參數(shù)來(lái)配置雙耳參數(shù)信息。
通常來(lái)說(shuō),為了使用頭戴式耳機(jī)生成用于包括IO個(gè)對(duì)象信號(hào)的縮減混音信號(hào)的再現(xiàn)的雙耳信號(hào),對(duì)象信號(hào)必須根據(jù)縮減混音信號(hào)和邊信息來(lái)分別生成對(duì)應(yīng)于IO個(gè)對(duì)象信號(hào)的IO個(gè)解碼后的信號(hào)。其后,渲染器參考控制信號(hào)將IO個(gè)對(duì)象信號(hào)的每一個(gè)分配到多聲道空間中的預(yù)定位置以適于5聲道揚(yáng)聲器環(huán)境。其后,渲染器生成可使用5聲道揚(yáng)聲器再現(xiàn)的5聲道信號(hào)。其后,渲染器將HRTF參數(shù)應(yīng)用到5聲道信號(hào)中,從而生成2聲道信號(hào)。簡(jiǎn)而言之,上述通常的音頻解碼方法包括再現(xiàn)10個(gè)對(duì)象信號(hào),將這10個(gè)對(duì)象信號(hào)轉(zhuǎn)換為5聲道信號(hào),并且根據(jù)5聲道信號(hào)生成2聲道信號(hào),可見(jiàn)其效率是很低的。在另一方面,音頻解碼裝置150可根據(jù)對(duì)象音頻信號(hào)而容易的生 成可使用頭戴式耳機(jī)再現(xiàn)的雙耳信號(hào)。另外,音頻解碼裝置150通過(guò) 對(duì)邊信息和控制信息的分析來(lái)配置空間參數(shù)信息,并且使用典型的多 聲道雙耳解碼器來(lái)生成雙耳信號(hào)。然而,即便在其裝配有一體化參數(shù) 變換器時(shí),音頻解碼裝置150仍然可以使用典型的多聲道雙耳解碼器, 該參數(shù)變換器接收邊信息、控制信息和HRTF參數(shù),并且根據(jù)邊信息、 制信息和HRTF參數(shù)來(lái)配置雙耳參數(shù)信息。
圖10是根據(jù)本發(fā)明第五實(shí)施例的音頻解碼裝置160的方框圖。參 見(jiàn)圖10,音頻解碼裝置160包括縮減混音處理器161,多聲道解碼器 163,和參數(shù)變換器165。縮減混音處理器161和參數(shù)變換器163可被 單一模塊167替代。
參數(shù)變換器165生成可被多聲道解碼器163使用的空間參數(shù)信息, 和被縮減混音處理器161使用的參數(shù)信息??s減混音處理器161執(zhí)行 對(duì)縮減混音信號(hào)的預(yù)處理操作,并且傳輸預(yù)處理操作結(jié)果的縮減混音 信號(hào)給多聲道解碼器163。多聲道解碼器163對(duì)由縮減混音處理器161 傳輸來(lái)的縮減混音信號(hào)執(zhí)行解碼操作,從而輸出立體聲信號(hào)、雙耳立 體聲信號(hào)或多聲道信號(hào)??s減混音處理器161所執(zhí)行的預(yù)處理操作的 例子包括通過(guò)濾波在時(shí)域或頻域中修改或變換縮減混音信號(hào)。
如果輸入到音頻解碼裝置160中的縮減混音信號(hào)是立體聲信號(hào)的 話,在該縮減混音信號(hào)被輸入多聲道解碼器163前,該縮減混音信號(hào) 可被用于由縮減混音處理器161執(zhí)行的縮減混音處理,因?yàn)槎嗦暤澜?碼器163不能將縮減混音信號(hào)的分量映射到對(duì)應(yīng)的左聲道和右聲道, 其中左聲道是多聲道的一個(gè),而右聲道是多聲道的另一個(gè)。因此,為 了能將分類(lèi)到左聲道的對(duì)象信號(hào)轉(zhuǎn)移到右聲道的方向上,輸入給音頻 解碼裝置160的縮減混音信號(hào)可被進(jìn)行縮減混音處理器預(yù)處理,預(yù)處 理后的縮減混音信號(hào)可被輸入給多聲道解碼器163??筛鶕?jù)從邊信息和從控制信息處獲得的預(yù)處理信息來(lái)執(zhí)行立體聲 縮減混音信號(hào)的預(yù)處理。
圖11是根據(jù)本發(fā)明第六實(shí)施例的音頻解碼裝置170的方框圖。參 見(jiàn)圖11,音頻解碼裝置170包括多聲道解碼器171,聲道處理器173 和參數(shù)變換器175。
參數(shù)變換器175生成可被多聲道解碼器171使用的空間參數(shù)信息, 和可被聲道處理器173使用的參數(shù)信息。聲道處理器173執(zhí)行對(duì)由多 聲道解碼器171輸出的信號(hào)的后處理。多聲道解碼器171所輸出的信 號(hào)的例子包括立體聲信號(hào),雙耳立體聲信號(hào)和多聲道信號(hào)。
聲道處理器173所執(zhí)行的后處理操作的例子包括修改或變換輸 出信號(hào)的每個(gè)聲道或所有聲道。舉例來(lái)說(shuō),如果邊信息包括關(guān)于預(yù)定 對(duì)象信號(hào)的基本頻率信息,聲道處理器173可參考該基本頻率信息從 預(yù)定對(duì)象信號(hào)中去除諧波分量。多聲道音頻解碼方法對(duì)于卡拉OK系統(tǒng) 來(lái)說(shuō)可能不夠高效。然而,如果關(guān)于嗓音對(duì)象的基本頻率信息被包括 在邊信息中,且嗓音對(duì)象信號(hào)的諧波分量在后處理期間已被去除,通 過(guò)使用圖11的實(shí)施例可實(shí)現(xiàn)高性能的卡拉OK系統(tǒng)。圖11的實(shí)施例也 可應(yīng)用于除嗓音對(duì)象信號(hào)之外的對(duì)象信號(hào)。舉例來(lái)說(shuō),可使用圖ll的 實(shí)施例來(lái)去除預(yù)定樂(lè)器的聲音。同樣,可以使用圖11的實(shí)施例來(lái)使用 關(guān)于對(duì)象信號(hào)的基本頻率信息來(lái)放大預(yù)定的諧波分量。
聲道處理器173可對(duì)縮減混音信號(hào)執(zhí)行額外的效果處理??蛇x的 是,聲道處理器173可把由額外的效果處理而獲得的信號(hào)加入到多聲 道解碼器171輸出的信號(hào)。聲道 處理器173可在任何需要的時(shí)候改變 對(duì)象的頻譜或修改縮減混音信號(hào)。如果直接執(zhí)行效果處理操作(諸如 對(duì)縮減混音信號(hào)的混響)并把效果處理操作所獲得的信號(hào)傳輸給多聲 道解碼器171不是很適當(dāng)?shù)脑挘暤捞幚砥?73可把經(jīng)效果處理操作多聲道解碼器171的輸出,以代替對(duì)縮減混音信
號(hào)執(zhí)行效果處理。
音頻解碼裝置170可被設(shè)計(jì)為不僅包括聲道處理器173,還包括 縮減混音處理器。在這種情況下,縮減混音處理器可被安排在多聲道 解碼器171之前,并且聲道處理器173可被安排在多聲道解碼器171 之后。
圖12是根據(jù)本發(fā)明第七實(shí)施例的音頻解碼裝置210的方框圖。參 見(jiàn)圖12,音頻解碼裝置210使用多聲道解碼器213來(lái)代替對(duì)象解碼器。
具體而言,音頻解碼裝置210包括多聲道解碼器213,代碼轉(zhuǎn)換 器215,渲染器217和3D信息數(shù)據(jù)庫(kù)219。
渲染器217根據(jù)包括在控制信息中的對(duì)應(yīng)于索引數(shù)據(jù)的3D信息來(lái) 確定多個(gè)對(duì)象信號(hào)的3D位置。代碼轉(zhuǎn)換器215通過(guò)綜合關(guān)于多個(gè)對(duì)象 音頻信號(hào)的位置信息來(lái)生成基于聲道的邊信息,其中渲染器217將3D 信息應(yīng)用到了這些對(duì)象音頻信號(hào)中。多聲道解碼器213通過(guò)將基于聲 道的邊信息應(yīng)用到縮減混音信號(hào)來(lái)輸出3D信號(hào)。
頭相關(guān)傳輸函數(shù)(HRTF)可作為一種3D信息被使用。HRTF是 一種傳輸函數(shù),其描述了在任意位置的聲源和耳朵之間的聲波的傳輸, 并且返回一個(gè)根據(jù)聲源的位置和高度而改變的值。如果使用HRTF來(lái) 濾波不帶方向性的信號(hào),該信號(hào)可被聽(tīng)成是從某個(gè)方向再現(xiàn)的。
當(dāng)接收到輸入比特流時(shí),音頻解碼裝置210使用解復(fù)用器(未示 出)來(lái)從輸入比特流中提取基于對(duì)象的縮減混音信號(hào)和基于對(duì)象的參 數(shù)信息。接著,渲染器217從控制信息中提取用于確定多個(gè)對(duì)象音頻 信號(hào)位置的索引數(shù)據(jù),并且從3D信息數(shù)據(jù)庫(kù)219中抽出(withdraw) 與所提取的索引數(shù)據(jù)相對(duì)應(yīng)的3D信息。具體來(lái)說(shuō),被音頻解碼裝置210所使用的包括在控制信息中的混 音參數(shù)信息不僅可以包括電平信息,還可以包括搜索3D信息所必須的 索引數(shù)據(jù)?;煲魠?shù)信息還可包括關(guān)于聲道間時(shí)間差的時(shí)間信息,位 置信息和一個(gè)或多個(gè)通過(guò)適當(dāng)組合電平信息和時(shí)間信息所獲得的參 數(shù)。
可根據(jù)缺省的混音參數(shù)信息來(lái)初始確定對(duì)象音頻信號(hào)的位置,并 且隨后通過(guò)應(yīng)用相應(yīng)于用戶所期望的位置的3D信息給對(duì)象音頻信號(hào) 來(lái)改變位置??蛇x的是,如果用戶希望只將3D效果應(yīng)用到一些對(duì)象音 頻信號(hào),關(guān)于其它用戶不希望應(yīng)用3D效果的對(duì)象音頻信號(hào)的電平信息 和時(shí)間信息可被使用為混音參數(shù)信息。
代碼轉(zhuǎn)換器215通過(guò)綜合由音頻編碼裝置所傳輸?shù)年P(guān)于N對(duì)象信 號(hào)的基于對(duì)象的參數(shù)信息和多個(gè)對(duì)象信號(hào)的位置信息來(lái)生成關(guān)于M聲 道的基于聲道的邊信息,渲染器217將諸如HRTF的3D信息應(yīng)用到了 上述對(duì)象信號(hào)的位置信息中。
多聲道解碼器213根據(jù)縮減混音信號(hào)和由代碼轉(zhuǎn)換器215所提供 的基于聲道的邊信息來(lái)生成音頻信號(hào),并且通過(guò)使用包括在基于聲道 的邊信息中的3D信息來(lái)執(zhí)行3D渲染操作而生成3D多聲道信號(hào)。
圖13是根據(jù)本發(fā)明第八實(shí)施例的音頻解碼裝置220的方框圖。參 見(jiàn)圖13,音頻解碼裝置220不同于圖12所示的音頻解碼裝置210,其 區(qū)別在于代碼轉(zhuǎn)換器225分離地傳輸基于聲道的邊信息和3D信息給多 聲道解碼器223。換句話說(shuō),音頻解碼裝置220的代碼轉(zhuǎn)換器225從關(guān) 于N個(gè)對(duì)象信號(hào)的基于對(duì)象的參數(shù)信息中獲得關(guān)于M個(gè)聲道的基于聲 道的邊信息,并且傳輸基于聲道的邊信息和應(yīng)用于N個(gè)對(duì)象信號(hào)的每 個(gè)的3D信息給多聲道解碼器223,然而音頻解碼裝置210的代碼轉(zhuǎn)換 器215傳輸包括3D信息的基于聲道的邊信息給多聲道解碼器213。參見(jiàn)圖14,基于聲道的邊信息和3D信息可包括多個(gè)幀索引。因 此,多聲道解碼器223可參考每個(gè)基于聲道的邊信息和3D信息的幀索 引來(lái)同步基于聲道的邊信息和3D信息,并且可以應(yīng)用3D信息給對(duì)應(yīng) 于該3D信息的比特流的幀。例如,具有索引2的3D信息可被應(yīng)用到 具有索引2的幀2的開(kāi)始。
因?yàn)榛诼暤赖倪呅畔⒑?D信息都包括幀索引,即使3D信息隨 著時(shí)間而更新,也可以有效地確定3D信息要被應(yīng)用到的基于聲道的邊 信息的臨時(shí)位置。換句話說(shuō),代碼轉(zhuǎn)換器225包括3D信息和基于聲道 的邊信息中的多個(gè)幀索引,因此多聲道解碼器223可容易地同步基于 聲道的邊信息和3D信息。
縮減混音處理器231,代碼轉(zhuǎn)換器235,渲染器237和3D信息數(shù) 據(jù)庫(kù)可由一個(gè)單獨(dú)的模塊239替代。
圖15是根據(jù)本發(fā)明第九實(shí)施例的音頻解碼裝置230的方框圖。參 見(jiàn)圖15,音頻解碼裝置230不同于圖13所示的音頻解碼裝置220,其 區(qū)別在于音頻解碼裝置230進(jìn)一步包括縮減混音處理器231。
具體來(lái)說(shuō),音頻解碼裝置230包括代碼轉(zhuǎn)換器235,渲染器237, 3D信息數(shù)據(jù)庫(kù)238,多聲道解碼器233和縮減混音處理器231。代碼 轉(zhuǎn)換器235,渲染器237, 3D信息數(shù)據(jù)庫(kù)238和多聲道解碼器233與 圖13所示的對(duì)應(yīng)部分分別相同??s減混音處理器231對(duì)立體聲縮減混 音信號(hào)執(zhí)行預(yù)處理操作以調(diào)整位置。3D信息數(shù)據(jù)庫(kù)238可與渲染器237 合并。還可以提供用于應(yīng)用預(yù)定效果給縮減混音信號(hào)的模塊給音頻解 碼裝置230。
圖16表示根據(jù)本發(fā)明第十實(shí)施例的音頻解碼裝置240的方框圖。 參見(jiàn)圖16,音頻解碼裝置240不同于圖15所示的音頻解碼裝置230,
23其區(qū)別在于音頻解碼裝置240包括多點(diǎn)控制單元組合器241。
也就是說(shuō),音頻解碼裝置240與音頻解碼裝置230 —樣,包括縮 減混音處理器243,多聲道解碼器244,代碼轉(zhuǎn)換器245,渲染器247 和3D信息數(shù)據(jù)庫(kù)249。多點(diǎn)控制單元組合器241組合由基于對(duì)象的編 碼所獲得的多個(gè)比特流,從而獲得單一的比特流。舉例來(lái)說(shuō),當(dāng)輸入 用于第一音頻信號(hào)的第一比特流和用于第二音頻信號(hào)的第二比特流 時(shí),多點(diǎn)控制單元組合器241從第一比特流中提取第一縮減混音信號(hào), 從第二比特流中提取第二縮減混音信號(hào),并且通過(guò)組合第一和第二縮 減混音信號(hào)來(lái)生成第三縮減混音信號(hào)。此外,多點(diǎn)控制單元組合器241 從第一比特流中提取第一基于對(duì)象的邊信息,從第二比特流中提取第 二基于對(duì)象的邊信息,并且通過(guò)組合第一基于對(duì)象的邊信息和第二基 于對(duì)象的邊信息來(lái)生成第三基于對(duì)象的邊信息。其后,多點(diǎn)控制單元 組合器241通過(guò)組合第三縮減混音信號(hào)和第三基于對(duì)象的邊信息來(lái)生 成比特流,并且輸出所生成的比特流。
因此,根據(jù)本發(fā)明第十實(shí)施例,相比較于編碼或解碼每個(gè)對(duì)象信 號(hào)的情況,即使是由兩個(gè)或多個(gè)通信方傳輸?shù)男盘?hào),其也可以有效地 被處理。
多點(diǎn)控制單元組合器241為了能夠?qū)⒍鄠€(gè)從多個(gè)比特流中分別提 取出來(lái)的,并且與不同壓縮編解碼相對(duì)應(yīng)的縮減混音信號(hào)合并到一個(gè) 單獨(dú)的縮減混音信號(hào)中,這些縮減混音信號(hào)需要根據(jù)縮減混音信號(hào)的 壓縮編解碼類(lèi)型被轉(zhuǎn)換為脈沖編碼調(diào)制(PCM)信號(hào)或預(yù)定頻域中的 信號(hào),PCM信號(hào)或通過(guò)轉(zhuǎn)換所獲得的信號(hào)可能需要組合在一起,通過(guò) 組合所獲得的信號(hào)需要使用預(yù)定壓縮編解碼來(lái)轉(zhuǎn)換。在這種情況下, 根據(jù)縮減混音信號(hào)是否被并入PCM信號(hào)或預(yù)定頻域中的信號(hào),可能會(huì) 發(fā)生延遲。然而,該延遲可能無(wú)法被解碼器正確地估計(jì)。因此,該延 遲可能需要被包括在比特流中并與比特流一起被傳輸。該延遲指示在 PCM信號(hào)中的延遲釆樣的數(shù)量或在預(yù)定頻域中的延遲采樣的數(shù)量。與在典型的多聲道編/解碼操作期間(例如5.1聲道或7.1聲道編/ 解碼操作)通常處理的輸入信號(hào)的數(shù)量相比,在基于對(duì)象的音頻編/解 碼操作期間需要處理的輸入信號(hào)的數(shù)量有時(shí)會(huì)相當(dāng)大。因此,基于對(duì) 象的音頻編/解碼方法比典型的基于聲道的音頻編/解碼需要更高的比 特率。然而,因?yàn)榛趯?duì)象的音頻編/解碼方法包括對(duì)比聲道信號(hào)更小 的對(duì)象信號(hào)的處理,其可使用基于對(duì)象的音頻編/解碼方法來(lái)生成動(dòng)態(tài) 的輸出信號(hào)。
下面將參見(jiàn)附圖17-20來(lái)詳細(xì)解釋根據(jù)本發(fā)明一個(gè)實(shí)施例的音頻 編碼方法。
在基于對(duì)象的音頻編碼方法中,對(duì)象信號(hào)可被定義為表示單獨(dú)的 聲音,諸如人類(lèi)的語(yǔ)音或樂(lè)器的聲音。可選的是,具有相同特征的聲 音,諸如有弦樂(lè)器的聲音(例如小提琴,中提琴和大提琴),屬于相 同頻帶的聲音,或根據(jù)聲源的方向和角度被分類(lèi)到相同類(lèi)別的聲音可 被組合在一起,并且由相同的對(duì)象信號(hào)來(lái)定義。仍然可選的是,可使 用上述方法的組合來(lái)定義對(duì)象信號(hào)。
多個(gè)對(duì)象信號(hào)可作為縮減混音信號(hào)和邊信息而被傳輸。在將要被 傳輸?shù)男畔⒌膭?chuàng)建期間,對(duì)縮減混音信號(hào)或縮減混音信號(hào)的多個(gè)對(duì)象 信號(hào)的每一個(gè)的能量或功率被進(jìn)行初始計(jì)算以用于檢測(cè)縮減混音信號(hào) 的包絡(luò)。計(jì)算的結(jié)果可被用于傳輸對(duì)象信號(hào)或縮減混音信號(hào)或計(jì)算對(duì) 象信號(hào)的電平比率。
線性預(yù)測(cè)編碼(LPC)算法可被用于更低比特率。具體來(lái)說(shuō),通 過(guò)信號(hào)分析來(lái)生成表示信號(hào)的包絡(luò)的多個(gè)LPC系數(shù),并且這些LPC系 數(shù)將被傳輸以代替?zhèn)鬏旉P(guān)于信號(hào)的包絡(luò)信息。該方法在比特率方面是 高效的。然而LPC參數(shù)很可能與信號(hào)的實(shí)際包絡(luò)有差異,該方法需要 額外的處理,諸如錯(cuò)誤校正。簡(jiǎn)而言之,涉及傳輸信號(hào)的包絡(luò)信息的方法可保證聲音的高質(zhì)量,但這導(dǎo)致了需要傳輸?shù)男畔⒘康脑黾?。?另一方面,涉及使用LPC系數(shù)的方法可減少需要傳輸?shù)男畔⒘?,但?需要額外的處理,諸如錯(cuò)誤校正,這將導(dǎo)致聲音質(zhì)量的降低。
根據(jù)本發(fā)明的一個(gè)實(shí)施例,可以使用這些方法的組合。換句話說(shuō), 可以用信號(hào)的能量或功率或索引值或?qū)?yīng)于信號(hào)的能量或功率的另一
個(gè)值,如LPC系數(shù)來(lái)表示信號(hào)的包絡(luò)。
關(guān)于信號(hào)的包絡(luò)信息能以時(shí)間段或頻率段為單位來(lái)獲得。具體來(lái) 說(shuō),參見(jiàn)圖17,關(guān)于信號(hào)的包絡(luò)信息以幀為單元來(lái)獲得??蛇x的是, 如果信號(hào)是由使用諸如正交鏡像濾波器(QMF)組的濾波器組的頻帶 結(jié)構(gòu)所表示的,關(guān)于信號(hào)的包絡(luò)信息能以頻率子帶,頻率子帶的組, 或頻率子帶分隔的組為單位來(lái)獲得,頻率子帶分隔是比頻率子帶更小
塊的實(shí)體。仍然可選的是,基于幀的方法,基于頻率子帶的方法,和 基于頻率子帶分隔的方法的組合的使用也在本發(fā)明的保護(hù)范圍之內(nèi)。
仍然可選的是,假設(shè)信號(hào)的低頻分量具有比信號(hào)的高頻分量更多 的信息,關(guān)于信號(hào)的低頻分量的包絡(luò)信息本身可被傳輸,然而,關(guān)于 信號(hào)的高頻分量的包絡(luò)信息可由LPC系數(shù)或其它值來(lái)表示,并且傳輸 LPC系數(shù)或其它值以代替關(guān)于信號(hào)的高頻分量的包絡(luò)信息。但是,信 號(hào)的低頻分量不一定就比信號(hào)的高頻分量有更多的信息。因此需要根 據(jù)實(shí)際情況靈活運(yùn)用上述方法。
根據(jù)本發(fā)明一個(gè)實(shí)施例,對(duì)應(yīng)于信號(hào)的一部分(以下稱為主要部 分)的包絡(luò)信息或索引數(shù)據(jù)將被傳輸,該信號(hào)的一部分是在時(shí)間/頻率 軸上表現(xiàn)為主要部分??蛇x的是,表示信號(hào)的主要部分的能量和功率 的值(例如LPC系數(shù))可被傳輸,并且不傳輸對(duì)應(yīng)于信號(hào)的非主要部 分的這些值。仍然可選的是,可傳輸相應(yīng)于信號(hào)的主要部分的包絡(luò)信 息或索引數(shù)據(jù),而也可傳輸表示信號(hào)的非主要部分的能量或功率的值。 仍然可選的是,僅傳輸關(guān)于信號(hào)的主要部分的信息,這樣可根據(jù)關(guān)于
26信號(hào)的主要部分的信息來(lái)估計(jì)信號(hào)的非主要部分。仍然可選的是,可 以使用上述方法的組合。
舉例來(lái)說(shuō),參見(jiàn)圖18,如果信號(hào)被劃分為主要時(shí)期和非主要時(shí)期, 關(guān)于信號(hào)的信息可使用標(biāo)記為(a)-(d)的四種不同的方法來(lái)傳輸。
為了傳輸縮減混音信號(hào)和邊信息的組合的多個(gè)對(duì)象信號(hào),作為解 碼操作的一部分,縮減混音信號(hào)需要被劃分為多個(gè)元素,例如,考慮 了對(duì)象信號(hào)的電平的比率。為了保證縮減混音信號(hào)的元素之間的獨(dú)立 性,需要額外的執(zhí)行去相關(guān)操作。
作為基于對(duì)象的編解碼方法中的編解碼單元的對(duì)象信號(hào)比作為多 聲道編解碼方法中的編解碼單元的聲道信號(hào)具有更多獨(dú)立性。換句話 說(shuō),聲道信號(hào)包括多個(gè)對(duì)象信號(hào),所以需要被去相關(guān)。在另一個(gè)方面, 對(duì)象信號(hào)之間是獨(dú)立的,所以可使用對(duì)象信號(hào)的特征而容易的執(zhí)行聲 道分離而不需要去相關(guān)操作。
具體來(lái)說(shuō),參見(jiàn)圖19,對(duì)象信號(hào)A, B和C輪流作為頻率軸上的 主要對(duì)象。在這種情況下,不需要根據(jù)對(duì)象信號(hào)A, B和C的電平比 率而將縮減混音信號(hào)劃分為多個(gè)信號(hào),也不需要執(zhí)行去相關(guān)。作為代 替,關(guān)于對(duì)象信號(hào)A, B和C的主要時(shí)期的信息將被傳輸,或?qū)⒃鲆?值應(yīng)用到每個(gè)對(duì)象信號(hào)A, B和C的每個(gè)頻率分量上,從而跳過(guò)去相 關(guān)。因此,其可以減少計(jì)算量,并且可以減少去相關(guān)所必需的邊信息 所需要比特率。
簡(jiǎn)而言之,為了跳過(guò)去相關(guān),關(guān)于包括每個(gè)對(duì)象信號(hào)的頻域的信 息可作為邊信息被傳輸,該去相關(guān)被執(zhí)行以保證由根據(jù)縮減混音信號(hào) 的對(duì)象信號(hào)率的比率來(lái)劃分縮減混音信號(hào)所獲得的多個(gè)信號(hào)之間的獨(dú) 立性??蛇x的是,可以應(yīng)用不同增益值給主要時(shí)期和非主要時(shí)期,主 要時(shí)期中每個(gè)對(duì)象信號(hào)都表現(xiàn)為主要,非主要時(shí)期中每個(gè)對(duì)象信號(hào)都表現(xiàn)為不太主要,因此關(guān)于主要時(shí)期的信息可被主要提供為邊信息。 仍然可選的是,關(guān)于主要時(shí)期的信息可作為邊信息被傳輸,并且不傳 輸沒(méi)有關(guān)于非主要時(shí)期的信息。仍然可選的是,作為去相關(guān)方法的替 代的上述方法的組合可被使用。
作為去相關(guān)方法的替代的上述方法可被應(yīng)用到所有信號(hào)對(duì)象,或 僅被應(yīng)用到某些具有明顯可識(shí)別的主要周期的對(duì)象信號(hào)。同樣的,作 為去相關(guān)方法的替代的上述方法可以幀為單位被應(yīng)用。
以下將詳細(xì)描述使用殘差信號(hào)的對(duì)象音頻信號(hào)的編碼。
一般來(lái)說(shuō),在基于對(duì)象的音頻編/解碼方法中,多個(gè)對(duì)象信號(hào)被編 碼,并且編碼結(jié)果作為縮減混音信號(hào)和邊信息的組合被傳輸。接著, 通過(guò)解碼根據(jù)邊信息從縮減混音信號(hào)中恢復(fù)多個(gè)對(duì)象信號(hào),并且恢復(fù) 后的對(duì)象信號(hào)被適當(dāng)?shù)幕煲?,例如,在用戶的?qǐng)求中根據(jù)控制信息生 成最終聲道信號(hào)?;趯?duì)象的音頻編/解碼方法一般致力于根據(jù)控制信 號(hào)在混音器的幫助下自由的改變輸出聲道信號(hào)。然而,基于對(duì)象的音 頻編/解碼方法還可被用于生成按照預(yù)定義方式的聲道輸出而不管控制
"f曰息。
為此,邊信息不僅包括從縮減混音信號(hào)中獲得多個(gè)對(duì)象信號(hào)所必 須的信息,還包括生成聲道信號(hào)所必須的混音參數(shù)信息。則,不需要 混音器的幫助就可以生成最終聲道輸出信號(hào)。在這種情況下,可使用 這種殘差編/解碼算法來(lái)提高聲音質(zhì)量。
典型的殘差編/解碼方法包括編/解碼信號(hào)和對(duì)編/解碼后的信號(hào)和 原始信號(hào)之間的錯(cuò)誤進(jìn)行編/解碼,也就是殘差信號(hào)。在解碼操作期間, 編碼后的信號(hào)被解碼,同時(shí)補(bǔ)償編碼后的信號(hào)和原始信號(hào)之間的錯(cuò)誤, 從而恢復(fù)與原始信號(hào)盡可能相同的信號(hào)。因?yàn)榻獯a后的信號(hào)和原始信 號(hào)之間的錯(cuò)誤通常來(lái)說(shuō)是微不足道的,其可以減少執(zhí)行殘差編/解碼所必需的額外信息的量。
如果解碼器的最終聲道輸出被確定了,不僅要提供用于生成最終
聲道信號(hào)所必需的混音參數(shù)信息,還要提供殘差編碼信息以作為邊信 息。在這種情況下,其可以提高聲音質(zhì)量。
圖20是根據(jù)本發(fā)明一個(gè)實(shí)施例的音頻編碼裝置310的方框圖。參 照?qǐng)D20,音頻編碼裝置310的特征在于其使用了殘差信號(hào)。
具體來(lái)說(shuō),音頻編碼裝置310包括編碼器311,解碼器313,第一 混音器315,第二混音器319,加法器317和比特流生成器321。
第一混音器315執(zhí)行對(duì)于原始信號(hào)的混音操作,第二混音器319 執(zhí)行對(duì)通過(guò)對(duì)原始信號(hào)執(zhí)行編碼操作和解碼操作所得到的信號(hào)的混音 操作。加法器317計(jì)算第一混音器315輸出的信號(hào)和第二混音器319 輸出的信號(hào)之間的殘差信號(hào)。比特流生成器321將殘差信號(hào)加入到邊 信息中,并且傳輸加入后的結(jié)果。這樣的話,其可以提高聲音質(zhì)量。
殘差信號(hào)的計(jì)算可被應(yīng)用于信號(hào)的所有部分,或僅應(yīng)用于信號(hào)的 低頻部分??蛇x的是,殘差信號(hào)的計(jì)算可被可變的僅應(yīng)用于包括基于 幀到幀的主要信號(hào)的頻域中。仍然可選的是,可使用上述方法的組合。
因?yàn)榘埐钚盘?hào)信息的邊信息的量比不包括殘差信號(hào)信息的邊 信息的量要大,殘差信號(hào)的計(jì)算可僅被應(yīng)用于信號(hào)的那些直接影響聲 音質(zhì)量的部分,從而防止比特率過(guò)多的增長(zhǎng)。本發(fā)明可使用記錄在計(jì) 算機(jī)可讀介質(zhì)上的計(jì)算機(jī)可讀代碼來(lái)實(shí)現(xiàn)。該計(jì)算機(jī)可讀記錄介質(zhì)可 以是任何類(lèi)型的記錄裝置,在其中數(shù)據(jù)以計(jì)算機(jī)可讀的方式被存儲(chǔ)。 計(jì)算機(jī)可讀記錄介質(zhì)的例子包括ROM, RAM, CD-ROM,磁盤(pán),軟盤(pán), 光學(xué)數(shù)據(jù)存儲(chǔ)器和載波(例如通過(guò)因特網(wǎng)的數(shù)據(jù)傳輸)。計(jì)算機(jī)可讀 記錄介質(zhì)可通過(guò)連接到網(wǎng)絡(luò)上的多個(gè)計(jì)算機(jī)系統(tǒng)而被分配,所以計(jì)算
29機(jī)可讀代碼被寫(xiě)入其中,并且以非集中方式被執(zhí)行。普通的本領(lǐng)域技 術(shù)人員可容易的構(gòu)造出用于實(shí)現(xiàn)本發(fā)明的功能性程序、代碼和代碼段。
工業(yè)實(shí)用性
如上所述,根據(jù)本發(fā)明,通過(guò)受益于基于對(duì)象的音頻編碼和解碼
方法的優(yōu)點(diǎn),每個(gè)對(duì)象音頻信號(hào)的聲像可被定位。貝u,其可以通過(guò)對(duì) 象音頻信號(hào)的再現(xiàn)來(lái)提供更真實(shí)的聲音。此外,本發(fā)明可被應(yīng)用于交 互式游戲,并且可以提供更真實(shí)的虛擬實(shí)體經(jīng)歷給用戶。
盡管本發(fā)明已參照其優(yōu)選實(shí)施例進(jìn)行了描述及說(shuō)明,很明顯本領(lǐng) 域的技術(shù)人員可做出多種形式上和細(xì)節(jié)上的改變,而不脫離由以下權(quán) 利要求所定義的本發(fā)明的精神或范疇。
30
權(quán)利要求
1. 一種音頻解碼方法,其包括從輸入音頻信號(hào)中提取縮減混音信號(hào)和基于對(duì)象的邊信息;基于輸入控制信息生成渲染信息;以及基于所述渲染信息和所述基于對(duì)象的邊信息,生成基于聲道的邊信息。
2. 根據(jù)權(quán)利要求l所述的音頻解碼方法,其進(jìn)一步包括基于所 述縮減混音信號(hào)和所述基于聲道的邊信息生成多聲道音頻信號(hào)。
3. 根據(jù)權(quán)利要求l所述的音頻解碼方法,其中,所述控制信息包括用于處理預(yù)定對(duì)象信號(hào)的三維(3D)信息、混音信息和諧波信息中 的至少一個(gè)。
4. 根據(jù)權(quán)利要求l所述的音頻解碼方法,其中,生成所述渲染信息包括把包含在所述混音信息中的時(shí)間信息轉(zhuǎn)換成等效的幅度信息 以響應(yīng)用戶命令。
5. 根據(jù)權(quán)利要求3所述的音頻解碼方法,其中,生成所述渲染信息進(jìn)一步包括把包含在所述混音信息中的幅度信息轉(zhuǎn)換成等效的時(shí) 間信息以響應(yīng)用戶命令。
6. 根據(jù)權(quán)利要求3所述的音頻解碼方法,其中,所述諧波信息包括所述預(yù)定對(duì)象信號(hào)的基音信息、基頻信息和主頻信息中的至少一個(gè)。
7. 根據(jù)權(quán)利要求6所述的音頻解碼方法,其進(jìn)一步包括基于所述諧波信息調(diào)整所述預(yù)定對(duì)象信號(hào)的增益。
8. 根據(jù)權(quán)利要求6所述的音頻解碼方法,其進(jìn)一步包括基于所述諧波信息補(bǔ)償預(yù)定頻帶中的對(duì)象信號(hào)。
9. 根據(jù)權(quán)利要求1所述的音頻解碼方法,其進(jìn)一步包括補(bǔ)償所 述空間信息和所述縮減混音信號(hào)之間的延遲。
10. —種音頻解碼裝置,其包括解復(fù)用器,用于從輸入音頻信號(hào)中提取縮減混音信號(hào)和基于對(duì)象 的邊信息;渲染器,用于基于輸入控制信息生成渲染信息;以及 代碼轉(zhuǎn)換器,用于基于所述渲染信息和所述基于對(duì)象的邊信息生 成基于聲道的邊信息。
11. 根據(jù)權(quán)利要求IO所述的音頻解碼裝置,進(jìn)一步包括多聲道解 碼器,用于基于所述縮減混音信號(hào)和所述基于聲道的邊信息生成多聲 道音頻信號(hào)。
12. 根據(jù)權(quán)利要求IO所述的音頻解碼裝置,其中,所述控制信息 包括用于處理預(yù)定對(duì)象信號(hào)的三維(3D)信息、混音信息和諧波信息 中的至少一個(gè)。
13. 根據(jù)權(quán)利要求12所述的音頻解碼裝置,其中,在生成所述渲 染信息時(shí),所述渲染器把包含在所述混音信息中的時(shí)間信息轉(zhuǎn)換成等 效的幅度信息以響應(yīng)用戶命令。
14. 根據(jù)權(quán)利要求12所述的音頻解碼裝置,其中,在生成所述渲 染信息時(shí),所述渲染器把包含在所述混音信息中的幅度信息轉(zhuǎn)換成等 效的時(shí)間信息以響應(yīng)用戶命令。
15. 根據(jù)權(quán)利要求12所述的音頻解碼裝置,其中,所述諧波信息 包括所述預(yù)定對(duì)象信號(hào)的基音信息、基頻信息和主頻信息中的至少一個(gè)。
16. 根據(jù)權(quán)利要求15所述的音頻解碼裝置,其中,所述渲染器基于所述諧波信息調(diào)整所述預(yù)定對(duì)象信號(hào)的增益。
17. 根據(jù)權(quán)利要求15所述的音頻解碼裝置,其中,所述渲染器基于所述諧波信息補(bǔ)償預(yù)定頻帶中的對(duì)象信號(hào)。
18. 根據(jù)權(quán)利要求IO所述的音頻解碼裝置,進(jìn)一步包括緩沖器,其補(bǔ)償所述空間信息和所述縮減混音信號(hào)之間的延遲。
19. 一種計(jì)算機(jī)可讀記錄介質(zhì),其上記錄了用于執(zhí)行音頻解碼方法的計(jì)算機(jī)程序,所述音頻解碼方法包括從輸入音頻信號(hào)中提取縮減混音信號(hào)和基于對(duì)象的邊信息;基于輸入控制信息生成渲染信息;以及基于所述渲染信息和所述基于對(duì)象的邊信息,生成基于聲道的邊信息。
20. 根據(jù)權(quán)利要求19所述的計(jì)算機(jī)可讀記錄介質(zhì),其中,所述音頻解碼方法進(jìn)一步包括基于所述縮減混音信號(hào)和所述基于聲道的邊信息生成多聲道音頻信號(hào)。
全文摘要
提供了一種音頻編碼方法和裝置以及一種音頻解碼方法和裝置,其中音頻信號(hào)可以被編碼或解碼使得對(duì)于每一個(gè)對(duì)象音頻信號(hào)聲像可以被定位于期望的位置。該音頻解碼方法包括從輸入音頻信號(hào)中提取縮減混音信號(hào)和基于對(duì)象的邊信息;基于輸入控制信息生成渲染信息;以及基于該渲染信息和該基于對(duì)象的邊信息,生成空間信息。
文檔編號(hào)G10L19/00GK101484935SQ200780024120
公開(kāi)日2009年7月15日 申請(qǐng)日期2007年10月1日 優(yōu)先權(quán)日2006年9月29日
發(fā)明者尹圣龍, 房熙錫, 李顯國(guó), 林宰顯, 金東秀 申請(qǐng)人:Lg電子株式會(huì)社