專(zhuān)利名稱(chēng):基于avs有損音頻的無(wú)損編解碼擴(kuò)展方法
技術(shù)領(lǐng)域:
本發(fā)明涉及音頻編解碼技術(shù),尤其涉及基于AV S有損音頻的無(wú)損編解碼擴(kuò)展方法。
背景技術(shù):
中國(guó)數(shù)字音視頻標(biāo)準(zhǔn)已經(jīng)在各個(gè)領(lǐng)域內(nèi)逐步展開(kāi)應(yīng)用,其中AVS標(biāo)準(zhǔn)的第三部分音頻標(biāo)準(zhǔn)也在一些領(lǐng)域被采用,例如,中國(guó)自主的CBHD標(biāo)準(zhǔn)指定采用AVS音頻為其音頻格式之一。但現(xiàn)有的AVS音頻為了實(shí)現(xiàn)更高的壓縮效果,采用感知編碼技術(shù),屬于有損音頻編解碼。在獲得較高壓縮效果的同時(shí),將犧牲一定的音頻質(zhì)量。近年來(lái),隨著信息技術(shù)的發(fā)展及用戶(hù)對(duì)高質(zhì)量音頻的需求,對(duì)無(wú)損音頻的需求越來(lái)越強(qiáng)烈。因此在AVS原有損標(biāo)準(zhǔn)的基礎(chǔ)上,擴(kuò)展對(duì)無(wú)損音頻的支持,并且還能實(shí)現(xiàn)對(duì)原有損音頻的后向兼容的應(yīng)用需求將越來(lái)越多。
發(fā)明內(nèi)容
針對(duì)此類(lèi)需求,本發(fā)明的重點(diǎn)在于提出一種保證向AVS音頻標(biāo)準(zhǔn)后向兼容的基于 AVS有損音頻的無(wú)損編解碼擴(kuò)展方法方法,并且基于此方法提出實(shí)現(xiàn)AVS音頻無(wú)損擴(kuò)展技術(shù)的兩種技術(shù)方案,基于本發(fā)明提供的技術(shù)方案可以在實(shí)現(xiàn)后向兼容AVS音頻標(biāo)準(zhǔn)的同時(shí)獲得優(yōu)化的壓縮效果和系統(tǒng)復(fù)雜度。有鑒于此,本發(fā)明的主要目的是基于AVS音頻標(biāo)準(zhǔn),提出擴(kuò)展無(wú)損音頻的技術(shù)方案,提供一種靈活簡(jiǎn)便的擴(kuò)展方法,可以在現(xiàn)有AVS有損技術(shù)基礎(chǔ)上擴(kuò)展無(wú)損音頻的支持,最終實(shí)現(xiàn)一套兼容AVS音頻標(biāo)準(zhǔn)的完整的無(wú)損音頻編解碼系統(tǒng)。并且利用本發(fā)明同樣可以將多種成熟的無(wú)損編解碼方案在AVS有損技術(shù)基礎(chǔ)上進(jìn)行擴(kuò)展。具體地,本發(fā)明可以采用如下技術(shù)方案。一種基于AVS有損音頻的無(wú)損編碼擴(kuò)展方法,該方法基于AVS音頻標(biāo)準(zhǔn)進(jìn)行分析, 對(duì)AVS音頻標(biāo)準(zhǔn)中的保留字進(jìn)行重定義,擴(kuò)展無(wú)損功能選項(xiàng),并且通過(guò)復(fù)用AVS音頻有損數(shù)據(jù)區(qū)域之后的填充區(qū)域,將無(wú)損音頻數(shù)據(jù)存放于填充區(qū)域來(lái)實(shí)現(xiàn)有損無(wú)損信號(hào)的并存。優(yōu)選地,該方法實(shí)現(xiàn)一種獨(dú)立的無(wú)損音頻編碼,有損編碼與無(wú)損編碼獨(dú)立,兩部分音頻成分共存在編碼的碼流中,通過(guò)標(biāo)志位來(lái)標(biāo)識(shí)編碼數(shù)據(jù)類(lèi)型。優(yōu)選地,該方法利用殘差編碼實(shí)現(xiàn)無(wú)損編碼擴(kuò)展,將原始音頻數(shù)據(jù)與通過(guò)有損編碼之后再解碼出來(lái)的有損解碼數(shù)據(jù)相減以獲取殘差信號(hào),對(duì)殘差信號(hào)進(jìn)行熵編碼,然后在編碼數(shù)據(jù)中保存壓縮的殘差信號(hào)。優(yōu)選地,所述方法組合了有損編碼方法、獨(dú)立的無(wú)損編碼方法和殘差編碼方法;有損編碼與獨(dú)立的無(wú)損編碼獨(dú)立,兩部分音頻成分共存在編碼的碼流中,通過(guò)標(biāo)志位來(lái)標(biāo)識(shí)編碼數(shù)據(jù)類(lèi)型;在殘差編碼時(shí),將原始音頻數(shù)據(jù)與通過(guò)有損編碼之后再解碼出來(lái)的有損解碼數(shù)據(jù)相減以獲取殘差信號(hào),對(duì)殘差信號(hào)進(jìn)行熵編碼,然后在編碼數(shù)據(jù)中保存壓縮的殘差信號(hào)。
優(yōu)選地,首先對(duì)輸入音頻進(jìn)行分幀處理;接著,進(jìn)行聲道間去相關(guān);然后,如果經(jīng)聲道間去相關(guān)后某個(gè)通道一幀的所有樣本均為固定值,則進(jìn)行游程編碼,最后輸出編碼后的比特流;否則,則先進(jìn)行線性預(yù)測(cè),然后進(jìn)行Golomb-Rice編碼,最后輸出編碼后的比特流。優(yōu)選地,在AVS音頻的RAW格式中,幀結(jié)構(gòu)包括聲道數(shù)、FS索引和幀數(shù)據(jù),其中的幀數(shù)據(jù)包括有損數(shù)據(jù)、無(wú)損數(shù)據(jù)和填充比特,該無(wú)損數(shù)位于現(xiàn)有AVS標(biāo)準(zhǔn)的填充比特內(nèi)。優(yōu)選地,AVS音頻存儲(chǔ)和/或傳輸格式中的Coding_profile字段包括表示純有損編碼框架的標(biāo)識(shí)、表示純無(wú)損編碼框架的標(biāo)識(shí)和表示有損、無(wú)損并存編碼框架的標(biāo)識(shí)。優(yōu)選地,對(duì)聲道間去相關(guān)后的每個(gè)通道的樣本獨(dú)立進(jìn)行線性預(yù)測(cè),生成樣本殘差。一種基于AVS有損音頻的無(wú)損解碼擴(kuò)展方法,其特征在于,該方法用于對(duì)權(quán)利要求1至8中任一項(xiàng)所述的方法編碼的音頻數(shù)據(jù)進(jìn)行解碼,其中,通過(guò)標(biāo)志位來(lái)標(biāo)識(shí)編碼數(shù)據(jù)類(lèi)型;和/或在解碼時(shí),對(duì)有損信號(hào)和殘差信號(hào)進(jìn)行組裝,以恢復(fù)出壓縮前的原始信號(hào)。一種基于AVS有損音頻的無(wú)損編解碼擴(kuò)展方法,該方法基于AVS音頻標(biāo)準(zhǔn)進(jìn)行分析,對(duì)AVS音頻標(biāo)準(zhǔn)中的保留字進(jìn)行重定義,擴(kuò)展無(wú)損功能選項(xiàng),并且通過(guò)復(fù)用AVS音頻有損數(shù)據(jù)區(qū)域之后的填充區(qū)域,將無(wú)損音頻數(shù)據(jù)存放于填充區(qū)域來(lái)實(shí)現(xiàn)有損無(wú)損信號(hào)的并存;在解碼時(shí),通過(guò)碼流拆分器對(duì)輸入的編碼碼流進(jìn)行識(shí)別、拆分,然后由有損解碼器或無(wú)損解碼器進(jìn)行相應(yīng)的有損或無(wú)損解碼。
圖1是根據(jù)本發(fā)明的一個(gè)方案的獨(dú)立編碼框架的示意圖。圖2是根據(jù)本發(fā)明的另一方案的殘差編碼框架的示意圖。圖3是根據(jù)本發(fā)明的還一方案的組合編碼框架的示意圖。圖4是根據(jù)本發(fā)明的一個(gè)方案的獨(dú)立方案解碼框架的示意圖。圖5是根據(jù)本發(fā)明的另一方案的殘差方案解碼框架的示意圖。圖6是根據(jù)本發(fā)明的還一方案的組合方案解碼框架的示意圖。圖7示出本發(fā)明的編碼方法概要的框圖。圖8示出本發(fā)明的解碼方法概要的框圖。 圖9是2. 1聲道去相關(guān)的示意圖。
圖10是3. 1聲道去相關(guān)的示意圖。 圖11是5. 1聲道去相關(guān)的示意圖。 圖12是7. 1聲道去相關(guān)的示意圖。 圖13是采樣率Fs <= 48kHz下的音頻樣本分區(qū)示意圖。 圖14是采樣率Fs > 48kHz下的音頻樣本分區(qū)示意圖。 圖15是Golomb-Rice碼字結(jié)構(gòu)示意圖。 圖16是修改前AVS音頻RAW格式下的幀格式示意圖。 圖17是修改后AVS音頻RAW格式下的幀格式示意圖。 圖18是修改前AVS音頻存儲(chǔ)格式下的幀格式示意圖。 圖19是修改后AVS音頻存儲(chǔ)格式下的幀格式示意圖。圖20是修改前AVS音頻傳輸格式下的幀格式示意圖。 圖21是修改后AVS音頻傳輸格式下的幀格式示意圖。
具體實(shí)施例方式下面結(jié)合附圖,對(duì)本發(fā)明的具體實(shí)施方式
作進(jìn)一步的詳細(xì)說(shuō)明。對(duì)于所屬技術(shù)領(lǐng)域的技術(shù)人員而言,從對(duì)本發(fā)明的詳細(xì)說(shuō)明中,本發(fā)明的上述和其他目的、特征和優(yōu)點(diǎn)將顯而易見(jiàn)。一、概沭本發(fā)明由以下部分構(gòu)成1)AVS音頻后向兼容無(wú)損擴(kuò)展基于AVS音頻標(biāo)準(zhǔn)進(jìn)行分析,針對(duì)已經(jīng)固定的碼流結(jié)構(gòu)的編解碼器語(yǔ)法,本發(fā)明的基于AVS有損音頻的無(wú)損編解碼擴(kuò)展方法充分利用AVS音頻標(biāo)準(zhǔn)中的保留字,對(duì)其中保留字進(jìn)行重定義,擴(kuò)展無(wú)損功能選項(xiàng),并且通過(guò)復(fù)用AVS音頻有損數(shù)據(jù)區(qū)域之后的填充區(qū)域,將無(wú)損音頻數(shù)據(jù)存放于填充區(qū)域來(lái)實(shí)現(xiàn)有損無(wú)損信號(hào)的并存。后向兼容上的關(guān)鍵技術(shù)點(diǎn)(1)對(duì)AVS有損音頻技術(shù)標(biāo)準(zhǔn)中的保留字部分進(jìn)行擴(kuò)展定義,例如 CodingProfile中擴(kuò)展有損無(wú)損并存模式,純無(wú)損模式;根據(jù)需要對(duì)于殘差無(wú)損擴(kuò)展或獨(dú)立無(wú)損擴(kuò)展仍可以追加編碼模式定義。(2)針對(duì)AVS有損音頻技術(shù)標(biāo)準(zhǔn)中定義的Raw格式,AASF格式,AATF格式,經(jīng)過(guò)擴(kuò)展后的無(wú)損數(shù)據(jù)與有損數(shù)據(jù)并存于相同碼流或文件中。(3)為了保證附加在有損填充區(qū)域的無(wú)損數(shù)據(jù)能夠在解碼時(shí)被正確識(shí)別,在基于獨(dú)立無(wú)損擴(kuò)展方法中,無(wú)損數(shù)據(jù)區(qū)以同步字(SyncWord)和無(wú)損附加信息起始,利用同步字實(shí)現(xiàn)對(duì)無(wú)損數(shù)據(jù)的定位或隨機(jī)訪問(wèn)功能;在基于殘差無(wú)損擴(kuò)展方法中,可以復(fù)用有損同步字結(jié)合無(wú)損數(shù)據(jù)區(qū)長(zhǎng)度的辦法來(lái)定位無(wú)損數(shù)據(jù),或使用與獨(dú)立擴(kuò)展方法相同的處理,在無(wú)損數(shù)據(jù)區(qū)以同步字(SyncWord)和無(wú)損附加信息起始,這樣便于殘差無(wú)損擴(kuò)展方法進(jìn)行數(shù)據(jù)定位和隨機(jī)訪問(wèn)。(4)無(wú)損數(shù)據(jù)幀長(zhǎng)度,為了保證與有損部分兼容,本方法指定無(wú)損部分?jǐn)?shù)據(jù)幀長(zhǎng)度與有損部分?jǐn)?shù)據(jù)幀一樣,一幀原始樣本數(shù)大小為IOM個(gè)。(5)利用本方法,可以將包括本發(fā)明給出的獨(dú)立無(wú)損編碼方案在內(nèi)的符合如上碼流布置的無(wú)損編解碼器內(nèi)嵌到AVS有損編解碼器中來(lái)執(zhí)行基于AVS音頻技術(shù)對(duì)其他無(wú)損技術(shù)的支持。例如將流行的開(kāi)源FLAC無(wú)損編解碼器擴(kuò)展到AVS編解碼器中。2) AVS音頻后向兼容的無(wú)損音頻編解碼方案通過(guò)對(duì)AVS-P3音頻標(biāo)準(zhǔn)的分析,基于有損音頻壓縮原理,在原有有損編碼方案基礎(chǔ)上擴(kuò)展無(wú)損音頻支持有兩種方法,下面,給出本發(fā)明實(shí)現(xiàn)AVS音頻無(wú)損擴(kuò)展的兩種框架。上兩種方法可以根據(jù)需要自由選擇或組合使用,以便實(shí)現(xiàn)最佳的壓縮效率和適應(yīng)靈活的使用需求。方案一方案一是實(shí)現(xiàn)一種獨(dú)立的無(wú)損音頻編碼器,有損編解碼與無(wú)損編解碼獨(dú)立,兩部分音頻成分可以共存在編碼的碼流中,通過(guò)標(biāo)志位來(lái)標(biāo)識(shí)編碼數(shù)據(jù)類(lèi)型;在解碼時(shí)根據(jù)碼流中編碼數(shù)據(jù)的類(lèi)型來(lái)選擇使用有損解碼還是無(wú)損解碼。方案二方案二是利用對(duì)殘差編碼實(shí)現(xiàn)無(wú)損編碼擴(kuò)展,即將原始音頻數(shù)據(jù)與通過(guò)有損編碼之后再解碼出來(lái)的有損數(shù)據(jù)相減以獲取殘差信號(hào),對(duì)殘差信號(hào)進(jìn)行熵編碼,然后在編碼數(shù)據(jù)中保存壓縮的殘差信號(hào),當(dāng)解碼時(shí),對(duì)有損信號(hào)和殘差信號(hào)進(jìn)行組裝,以便恢復(fù)出壓縮前的原始信號(hào)。二、帥■細(xì)爾Φ裕員偷混☆■馬船·馬輕1.獨(dú)立編碼框架圖1是根據(jù)本發(fā)明的一個(gè)方案的獨(dú)立編碼框架的示意圖。下面參照?qǐng)D1說(shuō)明根據(jù)本發(fā)明的一個(gè)方案的獨(dú)立編碼框架的結(jié)構(gòu)和獨(dú)立編碼方法。參照?qǐng)D1,輸入的原始音頻101首先流入模式選擇器102,該模式選擇器102用于選擇有損編碼和/或無(wú)損編碼。也就是,兩個(gè)開(kāi)關(guān)Sl和S2可以是一個(gè)打開(kāi)一個(gè)閉合,從而最終生成有損編碼碼流或者無(wú)損編碼碼流;或者,兩個(gè)開(kāi)關(guān)Sl和S2也可以是同時(shí)閉合,以同時(shí)生成有損編碼和無(wú)損編碼,有損編碼和無(wú)損編碼共存于編碼碼流111中。其中,通過(guò)標(biāo)志位來(lái)標(biāo)識(shí)編碼數(shù)據(jù)類(lèi)型。當(dāng)選擇有損編碼模式時(shí),開(kāi)關(guān)Sl閉合而開(kāi)關(guān)S2打開(kāi),原始音頻101經(jīng)由閉合的開(kāi)關(guān)Sl流入AVS有損編碼器104。AVS有損編碼器104對(duì)原始音頻進(jìn)行有損編碼,從而生成有損編碼數(shù)據(jù)106。生成的有損編碼數(shù)據(jù)106流入碼流合成器110,然后碼流合成器110 對(duì)有損編碼數(shù)據(jù)106進(jìn)行合成而生成(有損)編碼碼流111。當(dāng)選擇無(wú)損編碼模式時(shí),開(kāi)關(guān)S2閉合而開(kāi)關(guān)Sl打開(kāi),原始音頻101經(jīng)由閉合的開(kāi)關(guān)S2首先流入緩沖區(qū)105。原始音頻101在緩沖區(qū)105中緩沖一定量,經(jīng)緩沖的原始音頻數(shù)據(jù)流入AVS無(wú)損編碼器107。AVS無(wú)損編碼器107對(duì)原始音頻進(jìn)行無(wú)損編碼,從而生成無(wú)損編碼數(shù)據(jù)109。生成的無(wú)損編碼數(shù)據(jù)109流入碼流合成器110,然后碼流合成器110對(duì)無(wú)損編碼數(shù)據(jù)109進(jìn)行合成而生成(無(wú)損)編碼碼流111。當(dāng)然,還可以選擇有損編碼和無(wú)損編碼共存的編碼模式,此時(shí)開(kāi)關(guān)Sl和開(kāi)關(guān)S2同時(shí)閉合。有損編碼數(shù)據(jù)106和無(wú)損編碼數(shù)據(jù)109都流入碼流合成器110,在碼流合成器110 中,通過(guò)標(biāo)志位來(lái)標(biāo)識(shí)編碼數(shù)據(jù)類(lèi)型(有損編碼或無(wú)損編碼),從而生成有損編碼和無(wú)損編碼共存的編碼碼流111。這樣,在解碼時(shí),既可以進(jìn)行無(wú)損解碼,以提供高品質(zhì)的音頻,也可以進(jìn)行有損解碼,從而實(shí)現(xiàn)對(duì)AVS有損音頻編解碼的后向兼容。2.殘差編碼框架圖2是根據(jù)本發(fā)明的另一方案的殘差編碼框架的示意圖。下面參照?qǐng)D2說(shuō)明根據(jù)本發(fā)明的另一方案的殘差編碼框架的結(jié)構(gòu)和殘差編碼方法。參照?qǐng)D2,輸入的原始音頻201首先經(jīng)過(guò)兩個(gè)開(kāi)關(guān)Sl和S2,經(jīng)由該兩個(gè)開(kāi)關(guān)可以決定進(jìn)行的是有損編碼還是有損編碼及殘差編碼(無(wú)損編碼)。當(dāng)選擇有損編碼模式時(shí),開(kāi)關(guān)Sl閉合而開(kāi)關(guān)S2打開(kāi)(后述的開(kāi)關(guān)S3也打開(kāi)), 原始音頻201經(jīng)由閉合的開(kāi)關(guān)Sl流入AVS有損編碼器204。AVS有損編碼器204對(duì)原始音頻進(jìn)行有損編碼,從而生成有損編碼數(shù)據(jù)206。生成的有損編碼數(shù)據(jù)206流入碼流合成器 210,然后碼流合成器210對(duì)有損編碼數(shù)據(jù)206進(jìn)行合成而生成(有損)編碼碼流211。當(dāng)選擇殘差編碼(無(wú)損編碼)模式時(shí),開(kāi)關(guān)Sl和開(kāi)關(guān)S2都閉合(后述的開(kāi)關(guān)S3也閉合)。一方面,原始音頻201經(jīng)由閉合的開(kāi)關(guān)Sl流入AVS有損編碼器204。AVS有損編碼器204對(duì)原始音頻進(jìn)行有損編碼,從而生成有損編碼數(shù)據(jù)206。生成的有損編碼數(shù)據(jù)206 流入碼流合成器210,然后碼流合成器210對(duì)有損編碼數(shù)據(jù)206進(jìn)行合成而生成(有損)編碼碼流211。同時(shí),經(jīng)有損編碼的有損編碼數(shù)據(jù)206還經(jīng)由閉合的開(kāi)關(guān)S3流入AVS有損定點(diǎn)解碼器203。AVS有損定點(diǎn)解碼器203對(duì)有損編碼數(shù)據(jù)206進(jìn)行解碼,解碼出有損音頻數(shù)據(jù)。另一方面,原始音頻201還經(jīng)由閉合的開(kāi)關(guān)S2首先流入緩沖區(qū)205。原始音頻201 在緩沖區(qū)205中緩沖一定量,經(jīng)緩沖的原始音頻數(shù)據(jù)與AVS有損定點(diǎn)解碼器203解碼出的相對(duì)應(yīng)的有損音頻數(shù)據(jù)相減,從而得到殘差音頻數(shù)據(jù)。得到的殘差音頻數(shù)據(jù)流入AVS無(wú)損編碼器207。AVS無(wú)損編碼器207對(duì)殘差音頻數(shù)據(jù)進(jìn)行無(wú)損編碼,生成的無(wú)損編碼數(shù)據(jù)流入碼流合成器210,然后碼流合成器210對(duì)無(wú)損編碼數(shù)據(jù)進(jìn)行合成而生成(無(wú)損)編碼碼流 211。在這種情況下,編碼碼流211中同時(shí)存在有損編碼數(shù)據(jù)和殘差編碼數(shù)據(jù)。3.組合編碼框架圖3是根據(jù)本發(fā)明的還一方案的組合編碼框架的示意圖。參照?qǐng)D3可見(jiàn),其中組合了有損編碼、獨(dú)立的無(wú)損編碼和殘差編碼。參照?qǐng)D3,原始音頻301可以流經(jīng)模式選擇器302、開(kāi)關(guān)S1、AVS有損編碼器304(生成有損編碼數(shù)據(jù)306)、碼流合成器310,而生成(有損)編碼碼流311。另外,原始音頻301還可以流經(jīng)模式選擇器302、開(kāi)關(guān)S2、無(wú)損編碼器307 (生成無(wú)損編碼數(shù)據(jù)309)、碼流合成器310,而生成(無(wú)損)編碼碼流311。另外,在對(duì)原始音頻301進(jìn)行有損編碼的同時(shí),還可以生成殘差編碼數(shù)據(jù)。具體地,有損編碼數(shù)據(jù)306經(jīng)由開(kāi)關(guān)S3流入AVS有損定點(diǎn)解碼器303,AVS有損定點(diǎn)解碼器 303對(duì)有損編碼數(shù)據(jù)306進(jìn)行解碼,原始音頻數(shù)據(jù)與解碼出的有損編碼數(shù)據(jù)相減,從而得到殘差音頻數(shù)據(jù),由無(wú)損編碼器307對(duì)殘差音頻數(shù)據(jù)進(jìn)行無(wú)損編碼,從而生成無(wú)損編碼數(shù)據(jù) 309。其中,無(wú)損編碼器307包括獨(dú)立無(wú)損預(yù)處理模塊307A和無(wú)損編碼核心模塊307B 兩個(gè)模塊。當(dāng)進(jìn)行獨(dú)立的無(wú)損編碼時(shí),原始音頻301首先經(jīng)獨(dú)立無(wú)損預(yù)處理模塊307A預(yù)處理,然后由無(wú)損編碼核心模塊307B進(jìn)行無(wú)損編碼。當(dāng)進(jìn)行殘差編碼時(shí),由無(wú)損編碼核心模塊307B對(duì)殘差音頻數(shù)據(jù)進(jìn)行殘差編碼。三、解碼器框架圖4是根據(jù)本發(fā)明的一個(gè)方案的獨(dú)立方案解碼框架的示意圖。圖5是根據(jù)本發(fā)明的另一方案的殘差方案解碼框架的示意圖。圖6是根據(jù)本發(fā)明的還一方案的組合方案解碼框架的示意圖。由于解碼是編碼的逆過(guò)程,在上面詳細(xì)描述本發(fā)明的編碼方案的情況下,本領(lǐng)域的技術(shù)人員當(dāng)可以參照?qǐng)D4至圖6而明了本發(fā)明的解碼方案,故下面僅作簡(jiǎn)單描述。圖4所示的獨(dú)立方案解碼框架對(duì)應(yīng)于有損數(shù)據(jù)和無(wú)損數(shù)據(jù)獨(dú)立存在的編碼方案。其中,有損解碼的碼流如下編碼碼流401 —碼流拆分器402 —有損編碼數(shù)據(jù)404 — AVS有損解碼器406 —有損解碼數(shù)據(jù)408 —輸出控制器409 —解碼數(shù)據(jù)輸出410。無(wú)損解碼的碼流如下編碼碼流401 —碼流拆分器402 —無(wú)損編碼數(shù)據(jù)403 —無(wú)損解碼器405 —無(wú)損解碼數(shù)據(jù)407 —輸出控制器409 —解碼數(shù)據(jù)輸出410。也就是,由碼流拆分器402識(shí)別編碼碼流401的碼流為有損編碼、無(wú)損編碼、以及有損編碼和無(wú)損編碼共存。在有損編碼和無(wú)損編碼共存的情況下,碼流拆分器402對(duì)有損編碼和無(wú)損編碼進(jìn)行拆分,從而進(jìn)行相應(yīng)的有損或無(wú)損解碼。圖5所示的殘差方案解碼框架對(duì)應(yīng)于有損數(shù)據(jù)和殘差數(shù)據(jù)的無(wú)損編碼方案。其中,有損解碼的碼流如下編碼碼流501 —碼流拆分器502 —有損編碼數(shù)據(jù)504 — AVS有損解碼器506 —有損解碼數(shù)據(jù)508 —輸出控制器509 —解碼數(shù)據(jù)輸出510。其與圖4中的有損解碼碼流基本相同。下面對(duì)殘差解碼的碼流說(shuō)明如下。在編碼碼流501中同時(shí)存在有損編碼數(shù)據(jù)和無(wú)損(殘差)編碼數(shù)據(jù)503的情況下, 碼流拆分器502對(duì)有損編碼數(shù)據(jù)和無(wú)損編碼數(shù)據(jù)進(jìn)行拆分。有損編碼數(shù)據(jù)504流入AVS 有損定點(diǎn)解碼器513進(jìn)行解碼,解碼出有損解碼數(shù)據(jù);同時(shí),由無(wú)損解碼器505對(duì)無(wú)損編碼數(shù)據(jù)503進(jìn)行解碼,解碼出無(wú)損解碼數(shù)據(jù)。然后對(duì)解碼出的有損編碼數(shù)據(jù)和無(wú)損編碼數(shù)據(jù)進(jìn)行殘差(相加),而得到完整的無(wú)損解碼數(shù)據(jù)507。圖6是根據(jù)本發(fā)明的還一方案的組合方案解碼框架的示意圖。其中,有損解碼的碼流如下編碼碼流601 —碼流拆分器602 —有損編碼數(shù)據(jù)604 — AV S有損解碼器606 — 有損解碼數(shù)據(jù)608 —輸出控制器609 —解碼數(shù)據(jù)輸出610。獨(dú)立的無(wú)損解碼的碼流如下編碼碼流601 —碼流拆分器602 —無(wú)損編碼數(shù)據(jù)603 —無(wú)損解碼器605 —無(wú)損解碼數(shù)據(jù)607B —輸出控制器609 —解碼數(shù)據(jù)輸出610。也就是,由碼流拆分器602識(shí)別編碼碼流601的碼流為有損編碼、獨(dú)立的無(wú)損編碼、有損編碼和獨(dú)立的無(wú)損編碼共存、還是有損編碼與殘差無(wú)損編碼共存。在有損編碼和獨(dú)立的無(wú)損編碼共存的情況下,碼流拆分器402對(duì)有損編碼和無(wú)損編碼進(jìn)行拆分,從而進(jìn)行相應(yīng)的有損或無(wú)損解碼。有損編碼與殘差無(wú)損編碼共存的情況下,進(jìn)行殘差解碼,下面對(duì)殘差解碼的碼流說(shuō)明如下。在編碼碼流601中同時(shí)存在有損編碼數(shù)據(jù)604和無(wú)損(殘差)編碼數(shù)據(jù)603的情況下,碼流拆分器602對(duì)有損編碼數(shù)據(jù)和無(wú)損編碼數(shù)據(jù)進(jìn)行拆分。有損編碼數(shù)據(jù)604流入 AVS有損定點(diǎn)解碼器613進(jìn)行解碼,解碼出有損解碼數(shù)據(jù);同時(shí),由無(wú)損解碼器605對(duì)無(wú)損編碼數(shù)據(jù)603進(jìn)行解碼,解碼出無(wú)損(殘差)解碼數(shù)據(jù)。然后對(duì)解碼出的有損編碼數(shù)據(jù)和無(wú)損編碼數(shù)據(jù)進(jìn)行殘差(相加),而得到完整的無(wú)損解碼數(shù)據(jù)607A。四、無(wú)損音頻編碼方案本方案利用音頻信號(hào)的特性,通過(guò)聲道間去相關(guān)和線性預(yù)測(cè)等手段消除聲道間及聲道內(nèi)信號(hào)的相關(guān)性,并對(duì)得到的殘差信號(hào)進(jìn)行Golomb-Rice編碼,最終達(dá)到對(duì)音頻信號(hào)進(jìn)行壓縮的目的。實(shí)驗(yàn)結(jié)果表明該方案對(duì)音頻信號(hào)進(jìn)行無(wú)損壓縮是非常有效的。另外,本方案支持多聲道0聲道以上)音頻無(wú)損壓縮,并且為保持后向兼容,解碼端可以選擇只解碼多聲道中的左右聲道的編碼數(shù)據(jù)。圖7示出本發(fā)明的編碼方法概要的框圖。圖8示出本發(fā)明的解碼方法概要的框圖。參照?qǐng)D7,對(duì)本發(fā)明的編碼方法可以簡(jiǎn)述如下。首先對(duì)音頻X(Ii)進(jìn)行分幀處理,接著,進(jìn)行聲道間去相關(guān)。然后,如果經(jīng)聲道間去相關(guān)后某個(gè)通道一幀的所有樣本均為一固定值,則進(jìn)行游程編碼,最后輸出編碼后的比特流(bit stream);否則,則先進(jìn)行線性預(yù)測(cè),然后進(jìn)行Golomb-Rice編碼,最后輸出編碼后的比特流。參照?qǐng)D8,對(duì)本發(fā)明的解碼方法簡(jiǎn)述如下。首先,解壓輸入的編碼比特流的幀頭,然后,判定是存在固定值標(biāo)記(Const flag)。如果判定結(jié)果為是,則進(jìn)行游程解碼,然后進(jìn)行聲道間去相關(guān)的反轉(zhuǎn),即恢復(fù)聲道間的相關(guān),最后輸出得到的比特流;如果判定結(jié)果為否, 則進(jìn)行Golomb-Rice解碼,然后進(jìn)行線性預(yù)測(cè)的反轉(zhuǎn),然后進(jìn)行聲道間去相關(guān)的反轉(zhuǎn),即恢復(fù)聲道間的相關(guān),最后輸出得到的比特流。注意,因?yàn)榻獯a過(guò)程為編碼過(guò)程的逆過(guò)稱(chēng),下面將詳細(xì)說(shuō)明本發(fā)明的編碼方案,而省略對(duì)解碼方案的具體說(shuō)明。編碼方案詳述下面將參照?qǐng)D3對(duì)本發(fā)明的編碼方法進(jìn)行詳細(xì)說(shuō)明。分巾貞AVS P3現(xiàn)有的有損音頻編碼方案中,每幀包含IOM個(gè)音頻樣本。為保持后向兼容,無(wú)損音頻編碼擴(kuò)展的幀長(zhǎng)度與有損部分保持一致,即每幀包含IOM個(gè)音頻樣本。聲道|、司去才百關(guān)(Inter channel decorrelation)1.對(duì)單聲道(Mono)輸入,不做聲道間去相關(guān)2.對(duì)立體聲(Stereo)輸入,聲道間去相關(guān)方法如下Mid = (L+R)/2Side = (L-R)即把左右聲道輸入轉(zhuǎn)換為Mid和Side通道并傳送至下一級(jí)編碼單元,然后對(duì)Mid 和Side通道進(jìn)行獨(dú)立編碼。圖5示意性地示出了該立體聲輸入時(shí)的聲道間去相關(guān)的方法。3.對(duì)多聲道(Multi channel)輸入,聲道間去相關(guān)方法如下■如果L和R聲道同時(shí)存在,則L和R聲道轉(zhuǎn)換為Mid和Side通道。■如果L,R和C聲道同時(shí)存在,則L,R和C聲道轉(zhuǎn)換為Mid,Side和⑶if通道。其中=CDif= C-Mid■如果Ls和Rs同時(shí)存在,則Ls和Rs聲道轉(zhuǎn)換為SMid和SSide通道。其中SMid= (Ls+Rs)/2SSide = Ls-Rs■如果Lb和Rb同時(shí)存在,則Lb和Rb聲道轉(zhuǎn)換為BMid和BSide通道。其中BMid= (Lb+Rb)/2
BSide = Lb-Rb■如果LFE聲道存在,LFE聲道不做任何處理■如果C聲道存在并且L和R聲道不存在,C聲道不做任何處理。幾種典型聲道模式的聲道間去相關(guān)示意圖如圖9 12所示。
4.針對(duì)具體的某一幀樣本,通過(guò)決策機(jī)制來(lái)決定是否對(duì)相應(yīng)的聲道對(duì)做聲道間去相關(guān)。線件預(yù)測(cè)(LPC)對(duì)聲道間去相關(guān)后的每個(gè)通道的樣本獨(dú)立進(jìn)行LPC,生成樣本殘差。本編碼方案中采用三類(lèi)線性預(yù)測(cè)方法,分別如下1.固定系數(shù)線性預(yù)測(cè)(Fixed LPC)本方案采用1-6階固定系數(shù)線性預(yù)測(cè),預(yù)測(cè)公式如下表所示。表 權(quán)利要求
1.一種基于AVS有損音頻的無(wú)損編碼擴(kuò)展方法,該方法基于AVS音頻標(biāo)準(zhǔn)進(jìn)行分析,對(duì) AVS音頻標(biāo)準(zhǔn)中的保留字進(jìn)行重定義,擴(kuò)展無(wú)損功能選項(xiàng),并且通過(guò)復(fù)用AVS音頻有損數(shù)據(jù)區(qū)域之后的填充區(qū)域,將無(wú)損音頻數(shù)據(jù)存放于填充區(qū)域來(lái)實(shí)現(xiàn)有損無(wú)損信號(hào)的并存。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,該方法實(shí)現(xiàn)一種獨(dú)立的無(wú)損音頻編碼,有損編碼與無(wú)損編碼獨(dú)立,兩部分音頻成分共存在編碼的碼流中,通過(guò)標(biāo)志位來(lái)標(biāo)識(shí)編碼數(shù)據(jù)類(lèi)型。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,該方法利用殘差編碼實(shí)現(xiàn)無(wú)損編碼擴(kuò)展,將原始音頻數(shù)據(jù)與通過(guò)有損編碼之后再解碼出來(lái)的有損解碼數(shù)據(jù)相減以獲取殘差信號(hào),對(duì)殘差信號(hào)進(jìn)行熵編碼,然后在編碼數(shù)據(jù)中保存壓縮的殘差信號(hào)。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法組合了有損編碼方法、獨(dú)立的無(wú)損編碼方法和殘差編碼方法;有損編碼與獨(dú)立的無(wú)損編碼獨(dú)立,兩部分音頻成分共存在編碼的碼流中,通過(guò)標(biāo)志位來(lái)標(biāo)識(shí)編碼數(shù)據(jù)類(lèi)型;在殘差編碼時(shí),將原始音頻數(shù)據(jù)與通過(guò)有損編碼之后再解碼出來(lái)的有損解碼數(shù)據(jù)相減以獲取殘差信號(hào),對(duì)殘差信號(hào)進(jìn)行熵編碼,然后在編碼數(shù)據(jù)中保存壓縮的殘差信號(hào)。
5.根據(jù)權(quán)利要求1至4中任一項(xiàng)所述的方法,其特征在于,首先對(duì)輸入音頻進(jìn)行分幀處理;接著,進(jìn)行聲道間去相關(guān);然后,如果經(jīng)聲道間去相關(guān)后某個(gè)通道一幀的所有樣本均為固定值,則進(jìn)行游程編碼, 最后輸出編碼后的比特流;否則,則先進(jìn)行線性預(yù)測(cè),然后進(jìn)行Golomb-Rice編碼,最后輸出編碼后的比特流。
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,在AVS音頻的RAW格式中,幀結(jié)構(gòu)包括聲道數(shù)、FS索引和幀數(shù)據(jù),其中的幀數(shù)據(jù)包括有損數(shù)據(jù)、無(wú)損數(shù)據(jù)和填充比特,該無(wú)損數(shù)位于現(xiàn)有AVS標(biāo)準(zhǔn)的填充比特內(nèi)。
7.根據(jù)權(quán)利要求5所述的方法,其特征在于,AVS音頻存儲(chǔ)和/或傳輸格式中的Coding_profile字段包括表示純有損編碼框架的標(biāo)識(shí)、表示純無(wú)損編碼框架的標(biāo)識(shí)和表示有損、無(wú)損并存編碼框架的標(biāo)識(shí)。
8.根據(jù)權(quán)利要求5所述的方法,其特征在于,對(duì)聲道間去相關(guān)后的每個(gè)通道的樣本獨(dú)立進(jìn)行線性預(yù)測(cè),生成樣本殘差。
9.一種基于AVS有損音頻的無(wú)損解碼擴(kuò)展方法,其特征在于,該方法用于對(duì)權(quán)利要求1 至8中任一項(xiàng)所述的方法編碼的音頻數(shù)據(jù)進(jìn)行解碼,其中,通過(guò)標(biāo)志位來(lái)標(biāo)識(shí)編碼數(shù)據(jù)類(lèi)型;和/或在解碼時(shí),對(duì)有損信號(hào)和殘差信號(hào)進(jìn)行組裝,以恢復(fù)出壓縮前的原始信號(hào)。
10.一種基于AVS有損音頻的無(wú)損編解碼擴(kuò)展方法,該方法基于AVS音頻標(biāo)準(zhǔn)進(jìn)行分析, 對(duì)AVS音頻標(biāo)準(zhǔn)中的保留字進(jìn)行重定義,擴(kuò)展無(wú)損功能選項(xiàng),并且通過(guò)復(fù)用AVS音頻有損數(shù)據(jù)區(qū)域之后的填充區(qū)域,將無(wú)損音頻數(shù)據(jù)存放于填充區(qū)域來(lái)實(shí)現(xiàn)有損無(wú)損信號(hào)的并存;在解碼時(shí),通過(guò)碼流拆分器對(duì)輸入的編碼碼流進(jìn)行識(shí)別、拆分,然后由有損解碼器或無(wú)損解碼器進(jìn)行相應(yīng)的有損或無(wú)損解碼。
全文摘要
本發(fā)明涉及基于AVS有損音頻的無(wú)損編解碼擴(kuò)展方法。一種基于AVS有損音頻的無(wú)損編碼擴(kuò)展方法,該方法基于AVS音頻標(biāo)準(zhǔn)進(jìn)行分析,對(duì)AVS音頻標(biāo)準(zhǔn)中的保留字進(jìn)行重定義,擴(kuò)展無(wú)損功能選項(xiàng),并且通過(guò)復(fù)用AVS音頻有損數(shù)據(jù)區(qū)域之后的填充區(qū)域,將無(wú)損音頻數(shù)據(jù)存放于填充區(qū)域來(lái)實(shí)現(xiàn)有損無(wú)損信號(hào)的并存。因該方法改進(jìn)技術(shù)具有簡(jiǎn)單,高效的特點(diǎn),很容易被應(yīng)用到數(shù)字音頻領(lǐng)域,提供無(wú)損音頻解碼方案。
文檔編號(hào)G10L19/04GK102262881SQ201010189598
公開(kāi)日2011年11月30日 申請(qǐng)日期2010年5月24日 優(yōu)先權(quán)日2010年5月24日
發(fā)明者劉任化, 楊新輝 申請(qǐng)人:中科開(kāi)元信息技術(shù)(北京)有限公司