專利名稱:一種音頻編碼方法和音頻編碼器的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及音頻編解碼技術(shù)領(lǐng)域,具體涉及一種音頻編碼方法和音頻編碼器。
背景技術(shù):
在音頻編碼技術(shù)中,有失真的音頻編碼技術(shù)通??梢垣@得更高的壓縮比,但是為 了得到很好的音頻質(zhì)量,需要控制音頻編碼技術(shù)中編碼失真的程度。心理聲學(xué)模型是一種 普遍用于控制編碼失真程度的數(shù)學(xué)模型。心理聲學(xué)模型是人們?cè)谘芯咳祟惵犛X系統(tǒng)基礎(chǔ)上 抽象出來(lái)的反映人類聽覺感知特性的數(shù)學(xué)模型,它反映了人類聽覺系統(tǒng)對(duì)音頻及噪聲的感 知和掩蔽能力。在音頻編碼技術(shù)中具體利用到的心理聲學(xué)模型中的參數(shù)通常為掩蔽門限, 該參數(shù)是編碼器接收到信號(hào)在頻域上每個(gè)頻率處受到其它所有頻率分量掩蔽的值的和,該 參數(shù)在頻域上是條曲線。處于該曲線下方的頻率分量不能被人耳感覺到,則該頻率分量可 以用零比特編碼;另一方面,選擇量化階時(shí)若能保證量化噪聲低于掩蔽曲線,也不被人耳察 覺,所以掩蔽門限越大的頻率分量量化階可以越大。因此用掩蔽閾值作為量化編碼的依據(jù), 就能夠保證壓縮后的聲音質(zhì)量。所以,借助心理聲學(xué)模型,在對(duì)音頻信號(hào)進(jìn)行編碼中,可以 有效地去除包含在原始音頻中與人類聽覺不相關(guān)的信號(hào)成分,從而可以在獲取高壓縮比的 同時(shí)保證音頻信號(hào)的質(zhì)量。 參見圖1所示,為心理聲學(xué)模型在音頻編碼技術(shù)中的應(yīng)用。其中,該音頻編碼技術(shù) 為感知音頻編碼技術(shù)。如圖la所示,在音頻編碼器中,輸入音頻信號(hào)一部分進(jìn)入時(shí)頻分析 模塊,在該模塊中編碼器對(duì)音頻信號(hào)進(jìn)行變換處理得到音頻的頻域參數(shù);輸入音頻信號(hào)還 有一部分進(jìn)入心理聲學(xué)模型,在該模塊中編碼器對(duì)輸入信號(hào)做處理得到掩蔽門限,將掩蔽 門限輸入給比特分配模塊,編碼器的比特分配模塊根據(jù)掩蔽門限獲取對(duì)感知編碼的比特分 配信息;量化和編碼模塊根據(jù)獲取的比特分配信息,對(duì)從時(shí)頻分析模塊輸出的頻域參數(shù)進(jìn) 行量化和壓縮編碼;合路模塊將來(lái)自量化與編碼模塊的編碼信息和來(lái)自比特分配模塊的、 作為邊信息進(jìn)行傳輸?shù)谋忍胤峙湫畔⑦M(jìn)行合路處理,形成編碼比特流輸出。
在音頻解碼器中,參見圖lb,分路模塊對(duì)接收到的編碼比特流實(shí)施分路處理,分別 得到編碼信息和比特分配邊信息;解碼與反量化模塊根據(jù)得到編碼信息和比特分配邊信息 進(jìn)行解碼并進(jìn)行反量化處理,從而得到重構(gòu)的頻域參數(shù);最后時(shí)頻合成模塊將重構(gòu)頻域參 數(shù)進(jìn)行反變換處理,得到重構(gòu)的音頻時(shí)域信號(hào)輸出。 在現(xiàn)有技術(shù)中編碼器根據(jù)獲取的掩蔽門限進(jìn)行對(duì)語(yǔ)音信號(hào)的編碼的過(guò)程中,為獲 取掩蔽門限而建立的心理聲學(xué)模型,需要進(jìn)行非常復(fù)雜的計(jì)算,且不易實(shí)現(xiàn),對(duì)硬件設(shè)備要 求高,消耗功率大。
發(fā)明內(nèi)容
本發(fā)明實(shí)施例提供一種音頻編碼方法及相應(yīng)裝置,本發(fā)明實(shí)施例提供的技術(shù)方案 能夠減少建立心理聲學(xué)模型的復(fù)雜度,但是可以到達(dá)與現(xiàn)有技術(shù)相似的技術(shù)效果,即準(zhǔn)確 度相似。
5
本發(fā)明實(shí)施例提供了一種音頻編碼方法,該方法包括 接收時(shí)域音頻信號(hào); 對(duì)所述音頻信號(hào)進(jìn)行采樣; 對(duì)采樣后的音頻信號(hào)進(jìn)行線性預(yù)測(cè); 根據(jù)所述線性預(yù)測(cè)的結(jié)果,獲取線性預(yù)測(cè)濾波器的幅頻響應(yīng)曲線;
對(duì)采樣后的音頻信號(hào)進(jìn)行巻曲線性預(yù)測(cè); 根據(jù)所述巻曲線性預(yù)測(cè)的結(jié)果,獲取巻曲線性預(yù)測(cè)濾波器的幅頻響應(yīng)曲線;
根據(jù)所述線性預(yù)測(cè)濾波器的幅頻響應(yīng)曲線和所述巻曲線性預(yù)測(cè)濾波器的幅頻響 應(yīng)曲線,獲取局部掩蔽曲線; 根據(jù)所述獲取的局部掩蔽曲線和絕對(duì)掩蔽曲線的特性,獲取全局掩蔽曲線;
根據(jù)所述獲取的全局掩蔽曲線和臨界頻帶的信息,獲取全局掩蔽門限;
根據(jù)所述獲取的全局掩蔽門限,對(duì)所述音頻信號(hào)進(jìn)行編碼。
本發(fā)明實(shí)施例還提供了一種音頻編碼器,包括
接收單元,用于接收時(shí)域音頻信號(hào);
采樣單元,用于對(duì)所述音頻信號(hào)進(jìn)行采樣; 線性預(yù)測(cè)LP單元,用于對(duì)采樣后的音頻信號(hào)進(jìn)行線性預(yù)測(cè)LP ; 獲取LP濾波器幅頻響應(yīng)單元,用于根據(jù)所述線性預(yù)測(cè)的結(jié)果,獲取線性預(yù)測(cè)LP濾
波器的幅頻響應(yīng)曲線Cw(f); 巻曲線性預(yù)測(cè)WLP單元,用于對(duì)采樣后的音頻信號(hào)進(jìn)行巻曲線性預(yù)測(cè)WLP ;
獲取WLP濾波器幅頻響應(yīng)單元,用于根據(jù)所述巻曲線性預(yù)測(cè)的結(jié)果,獲取WLP濾波 器的幅頻響應(yīng)曲線Cip(f); 獲取局部掩蔽曲線單元,用于根據(jù)所述LP濾波器的幅頻響應(yīng)曲線Cw(f)和所述 WLP濾波器的幅頻響應(yīng)曲線Cip(f),獲取局部掩蔽曲線Cp(f) 獲取全局掩蔽曲線單元,用于根據(jù)所述獲取的局部掩蔽曲線和絕對(duì)掩蔽曲線的特 性,獲取全局掩蔽曲線Cg(f); 獲取掩蔽門限單元,用于根據(jù)所述獲取的全局掩蔽曲線Cg(f)和預(yù)置的臨界頻帶 的信息,獲取全局掩蔽門限; 音頻編碼單元,用于根據(jù)獲取掩蔽門限對(duì)所述接收到的音頻信號(hào)進(jìn)行編碼。
本發(fā)明實(shí)施例還提供了一種音頻水印嵌入裝置,其特征在于,包括
接收單元,用于接收時(shí)域音頻信號(hào);
采樣單元,用于對(duì)所述音頻信號(hào)進(jìn)行采樣; 線性預(yù)測(cè)LP單元,用于對(duì)采樣后的音頻信號(hào)進(jìn)行線性預(yù)測(cè)LP ; 獲取LP濾波器幅頻響應(yīng)單元,用于根據(jù)所述線性預(yù)測(cè)的結(jié)果,獲取線性預(yù)測(cè)LP濾
波器的幅頻響應(yīng)曲線Cw(f); 巻曲線性預(yù)測(cè)WLP單元,用于對(duì)采樣后的音頻信號(hào)進(jìn)行巻曲線性預(yù)測(cè)WLP ;
獲取WLP濾波器幅頻響應(yīng)單元,用于根據(jù)所述巻曲線性預(yù)測(cè)的結(jié)果,獲取WLP濾波
器的幅頻響應(yīng)曲線Cip(f); 獲取局部掩蔽曲線單元,用于根據(jù)所述LP濾波器的幅頻響應(yīng)曲線Cw(f)和所述 WLP濾波器的幅頻響應(yīng)曲線ip(f),獲取局部掩蔽曲線Cp(f)
獲取全局掩蔽曲線單元,用于根據(jù)所述獲取的局部掩蔽曲線和絕對(duì)掩蔽曲線的特 性,獲取全局掩蔽曲線Cg(f); 獲取掩蔽門限單元,用于根據(jù)所述獲取的全局掩蔽曲線Cg(f)和預(yù)置的臨界頻帶 的信息,獲取全局掩蔽門限; 水印嵌入單元,用于根據(jù)所述獲取的全局掩蔽門限,將水印編碼嵌入到輸入音頻 信號(hào)中。 本發(fā)明實(shí)施例利用線性預(yù)測(cè)LP和巻曲線性預(yù)測(cè)WLP的頻率分辨特性非常接近人
類聽覺特性中的臨界頻帶和掩蔽特性的特點(diǎn),建立的心理聲學(xué)模型,獲取掩蔽門限,根據(jù)獲
取的掩蔽門限進(jìn)行音頻編碼的方法,降低了建立心理聲學(xué)模型的復(fù)雜度,易于實(shí)現(xiàn),降低了 心理聲學(xué)模型在硬件實(shí)現(xiàn)的成本,降低了硬件的功率消耗。
圖la是現(xiàn)有技術(shù)中音頻編碼器的組成示意簡(jiǎn)圖; 圖lb是現(xiàn)有技術(shù)中音頻解碼器的組成示意簡(jiǎn)圖; 圖2是本發(fā)明實(shí)施例一提供的一種建立心理聲學(xué)模型的方法流程示意簡(jiǎn)圖; 圖3是本發(fā)明實(shí)施例一中巻曲線性預(yù)測(cè)中獲取相關(guān)函數(shù)的運(yùn)算示意簡(jiǎn)圖; 圖4a是輸入編碼器的音頻信號(hào)幅頻響應(yīng)圖; 圖4b是濾波器幅頻響應(yīng)曲線(f) 、WLP濾波器幅頻響應(yīng)曲線(f)和音頻信號(hào) 的功率譜密度示意圖; 圖5是局部掩蔽曲線與絕對(duì)掩蔽曲線圖; 圖6a是絕對(duì)掩蔽門限在對(duì)數(shù)域的軌跡圖; 圖6b是絕對(duì)掩蔽門限在線性域的軌跡圖; 圖7是全局掩蔽曲線圖; 圖8a是折線型全局掩蔽門限示意圖; 圖8b是階梯型全局掩蔽門限示意圖; 圖9是本發(fā)明實(shí)施例二提供的一種音頻編碼方法流程示意簡(jiǎn)圖; 圖10是本發(fā)明實(shí)施例三提供的一種音頻編碼器的邏輯組成示意圖。
具體實(shí)施例方式
本發(fā)明實(shí)施例提供一種音頻編碼方法,本發(fā)明實(shí)施例還提供相應(yīng)的音頻編碼器。
以下分別進(jìn)行詳細(xì)說(shuō)明。 實(shí)施例一 本實(shí)施例提供了一種音頻編碼方法,該方法是利用巻曲線性預(yù)測(cè)(WLP, Warped Linear Prediction)和傳統(tǒng)線性預(yù)測(cè)(LP, Linear Prediction)分析的頻率分辨率特性非 常接近人類聽覺特性中的臨界頻帶和掩蔽特性的特性,最終獲取掩蔽門限。參見圖2所示, 該方法包括 步驟1 :編碼器接收時(shí)域音頻信號(hào); 編碼器接收到的時(shí)域音頻信號(hào)可以是語(yǔ)音信號(hào)、音頻信號(hào)或者各種人耳可以聽到 的各種聲音信號(hào)的混合信息,該音頻信號(hào)的頻帶寬度通常為人耳可以聽到頻率范圍(即0Hz到24000Hz)。編碼器接收到的音頻信號(hào)通常是幀的格式, 一幀的長(zhǎng)度一般為5毫秒到 30毫秒之間。
步驟2 :編碼器對(duì)接收到的音頻信號(hào)進(jìn)行采樣,得到采樣后的音頻信號(hào)X(n);
在本實(shí)施例中,步驟2中編碼器通常對(duì)接收到的時(shí)域音頻信號(hào)采用的采樣頻率包 括48kHz、44. 1kHz、32kHz、 16kHz或8kHz中任一項(xiàng)。
步驟3 :編碼器對(duì)采樣后的音頻信號(hào)進(jìn)行線性預(yù)測(cè)LP ; 其中,步驟3中編碼器對(duì)音頻信號(hào)的進(jìn)行線性預(yù)測(cè)的結(jié)果是獲取到了較佳線性濾 波器系數(shù)。需要理解的是,線性預(yù)測(cè)LP利用過(guò)去若干個(gè)采樣信號(hào)來(lái)預(yù)測(cè)當(dāng)前采樣信號(hào),即 通常是利用當(dāng)前時(shí)刻之前的N個(gè)采樣信號(hào)的線性組合來(lái)估計(jì)輸入的時(shí)域音頻信號(hào)x(n) , n =1,2,...,L,其中,L為幀的長(zhǎng)度。用公式表示如下 = Z c^x(w - A:) (1)。 其中,ak, k= 1,2, ..., N為L(zhǎng)P濾波器系數(shù),N為線性預(yù)測(cè)階數(shù)。在ak,k二l, 2, . . . , N為已知的情況下,LP濾波器的系統(tǒng)函數(shù)則為可知,如下公式所示 = E "J—* ] Z(z) (2)。 因此,濾波器系數(shù)ak是實(shí)現(xiàn)LP濾波器組的關(guān)鍵。在步驟3中獲取較佳線性濾波 器系數(shù)的具體操作包括 步驟A1 :獲取輸入信號(hào)x(n)的自相關(guān)函數(shù)r(l), 步驟A2 :根據(jù)原始信號(hào)采樣后的音頻信號(hào)x (n)與線性預(yù)測(cè)濾波器預(yù)測(cè)結(jié)果到")之 間的差值(即預(yù)測(cè)誤差e)最小的原則,獲取LP的正則方程; 其中,步驟Al用公式表示為L(zhǎng)P濾波器系數(shù)ak的最優(yōu)取值為
一w
e二五[lx(") —S^x("-"卩]最小,即只需對(duì)于k = 1,2,... ,N,使3e/^ =o由此,可以
yfc=1 & 。
獲得LP濾波器的正則方程,表達(dá)式如下
TVr(/)=-J>^(/-" (3)。 步驟A3 :根據(jù)步驟Al中獲取的自相關(guān)函數(shù)r (1),利用萊文森_杜比 LevinsonDurbin算法求解公式(3),獲取LP濾波器系數(shù)ak,該LP濾波器系數(shù)ak為較佳LP 濾波器系數(shù)。 步驟4 :編碼器根據(jù)線性預(yù)測(cè)的結(jié)果,獲取LP濾波器的幅頻響應(yīng)曲線Cw(f);
其中,步驟3中編碼器根據(jù)獲取的采樣后的音頻信號(hào)進(jìn)行線性預(yù)測(cè)的結(jié)果,獲取 幅頻響應(yīng)曲線Cw(f)具體可以是結(jié)論性公式 、 ' ,f 4 (4)°
1-》J 其中,Gw是輸入信號(hào)的能量。將獲取的A—、z)用曲線表示,即為幅頻響應(yīng)曲線 CIP(f)。
8
步驟5 :編碼器對(duì)步驟2中得到采樣后音頻信號(hào)進(jìn)行巻曲線性預(yù)測(cè)WLP ; 其中,需要理解的是,巻曲線性預(yù)測(cè)WLP是根據(jù)線性預(yù)測(cè)LP的原理,而總結(jié)出的一
種更接近與人耳聽覺特性的預(yù)測(cè)方法。編碼器根據(jù)步驟2中獲取的音頻信號(hào)樣點(diǎn)進(jìn)行巻曲
線性預(yù)測(cè)的結(jié)果是獲取到較佳的濾波器系數(shù)。 其中,采用巻曲線性預(yù)測(cè)WLP是利用當(dāng)前時(shí)刻之前的N個(gè)采樣信號(hào)的線性組合來(lái) 估計(jì)輸入的時(shí)域音頻信號(hào)x(n) , n = 1,2, . . . , L,采用公式表示如下f (z) = [t ]X(z) ( 5 )。
/fc=l 其中,D(z)為全通濾波器的系統(tǒng)函數(shù),D(z)相當(dāng)于WLP濾波器中的延遲模塊,該模 塊與LP中的延遲模塊有相似的作用。WLP中使用到的全通濾波器具有幅度響應(yīng)為常數(shù),相 位響應(yīng)決定頻域的映射情況的特性,其幅頻響應(yīng)的數(shù)據(jù)表達(dá)式如下
a , ,+ ,義sin(w) w = w+2 arctan(- ) (6)
1 —義cos(w) 其中,為了保證WLP濾波器對(duì)頻率的映射情況盡可能的接近人類的聽覺特性,參 數(shù)A需要滿足一定的條件,該條件可以具體參考以下公式 ........"2
示如下
A -1.0674(二 arctan(0.06583, ))1 /2 — 0.1916
: (7 )。
其中,fs是輸入信號(hào)的采樣頻率。
由以上對(duì)全通濾波器的說(shuō)明,可以獲取該全通濾波器的系統(tǒng)函數(shù)D(z),用公式表
其脈沖響應(yīng)函數(shù)的表達(dá)式如下
… f —義, "=0-
一)4d-");r',其它. (9)° 其中,A是濾波器參數(shù)。還需要說(shuō)明的是該系統(tǒng)函數(shù)D(z)可以是根據(jù)以上說(shuō)明 預(yù)置在該編碼器中,當(dāng)編碼器在進(jìn)行線性預(yù)測(cè)時(shí)可以由D (z)來(lái)獲取更佳的WLP濾波器系數(shù)
ak2° 由以上對(duì)D(z)和WLP濾波器的中實(shí)際輸入和預(yù)測(cè)輸出之間的關(guān)系(如公式(5)),
該WLP濾波器的K階全通濾波器的輸出在時(shí)域上的表達(dá)式如下 dk[x(n)]三h(n)*h(n)*. *h(n)*x(n) (10)。 其中,h(n)為D(z)的脈沖響應(yīng),"*"表示巻積運(yùn)算,dk[x(n)]即為k階全通濾波
器的輸出。 因此,步驟5中對(duì)采樣后音頻信號(hào)進(jìn)行巻曲線性預(yù)測(cè)WLP具體操作包括
步驟B1 :獲取WLP濾波器的各階輸出與輸入信號(hào)之間的相關(guān)函數(shù)r(k), k = 0, 1, . . . , N-l, N與K都是WLP濾波器的階數(shù),通常WLP濾波器的階數(shù)是10。
其中,步驟B1中巻曲線性預(yù)測(cè)中相關(guān)函數(shù)可以使用圖3所示的自相關(guān)網(wǎng)絡(luò)結(jié)構(gòu)得
9到。其中,x(n)表示輸入音頻信號(hào),D(z)是一階全通濾波器;輸入音頻信號(hào)x(n)通過(guò)級(jí)聯(lián) 的一階全通濾波器D(z)的處理,分別得到各級(jí)聯(lián)全通濾波器的輸出信號(hào)dk[x(n)], k = 0, 1, ...N-l。然后,通過(guò)乘加和運(yùn)算來(lái)計(jì)算輸入音頻信號(hào)x(n)與各級(jí)聯(lián)階全通濾波器D(z) 的輸出信號(hào)dk[X(n)] , k = 0, 1, . . . N-l的相關(guān)函數(shù),即獲取r (k) , k = 0, 1, . . . , N_l。
步驟B2 :與步驟Al相似,根據(jù)原始信號(hào)采樣后的音頻信號(hào)x(n)與線性濾波器預(yù) 測(cè)結(jié)果^0)之間的差值(即預(yù)測(cè)誤差e)最小的原則,獲取WLP正則方程;
其中,步驟Al用公式說(shuō)明為根據(jù)WLP的預(yù)測(cè)誤差均方值最小的原則,即
<formula>formula see original document page 10</formula>
如下
其中,為了使6為最小,則可知&/3、=()因此,可以獲取WLP正則方程,其表達(dá)式
五
<formula>formula see original document page 10</formula> 步驟B3 :根據(jù)步驟B1中獲取相關(guān)函數(shù)r(k)和步驟B2中獲取的正則方程,利用 Levinson Durbin算法求解正則方程,獲取WLP濾波器系數(shù)ak2。 步驟6 :編碼器根據(jù)對(duì)采用后的音頻信號(hào)進(jìn)行巻曲線性預(yù)測(cè)WLP,獲取WLP濾波器
的幅頻響應(yīng)曲線Cip(f); 其中,步驟6中編碼器根據(jù)對(duì)采樣后的音頻信號(hào)進(jìn)行線性預(yù)測(cè),獲取幅頻響應(yīng)曲 線CM(f)具體可以是根據(jù)現(xiàn)有技術(shù)中已經(jīng)發(fā)現(xiàn)的結(jié)論性公式
<formula>formula see original document page 10</formula> 其中,ak2是WLP濾波器的系數(shù),D (z)是一階全通濾波器的傳輸函數(shù),GM為輸入信 號(hào)的能量。圖4b給出了 一個(gè)WLP濾波器的幅頻響應(yīng)曲線(f)的實(shí)例。
以上步驟3至步驟6分別為采用線性預(yù)測(cè)和巻曲線性預(yù)測(cè)的操作方法,通過(guò)以上 的預(yù)測(cè),可以分別獲取幅頻響應(yīng)曲線C"f)和幅頻響應(yīng)曲線Cip(f)。參見圖4所示,其中, 圖4a顯示是一幀采樣速率為48kHz,長(zhǎng)度為512個(gè)點(diǎn)的音頻信號(hào);圖4b顯示了圖4a所示 的音頻信號(hào)對(duì)應(yīng)的LP濾波器幅頻響應(yīng)曲線Cw(f) 、WLP濾波器幅頻響應(yīng)曲線C^p(f)和音頻 信號(hào)的功率譜密度。由圖可以看出,采用線性預(yù)測(cè)獲取的濾波器具有較好的高頻特性,采用 巻曲線性預(yù)測(cè)WLP獲取的濾波器具有較好的低頻特性。 步驟7 :根據(jù)步驟4中獲取的LP濾波器的幅頻響應(yīng)曲線Cw(f)和WLP濾波器幅頻
響應(yīng)曲線Cip(f),獲取局部掩蔽曲線; 其中,步驟7中根據(jù)獲取(f)和CM (f),獲取局部掩蔽曲線的具體方法可以是根 據(jù)如下公式Cp(f) = CLP, (f)+CWLP, (f) = CLP(f)KLP(f, Cqb)+CWLP(f)KWLP(f, Cqb)+BXLP(Cqb) (dB) [o川](14)
其中,Cp(f)為局部掩蔽曲線,Kw(f, Cqb)和K亂p(f, Cqb)分別為Cw(f)和C亂p(f)的 頻率補(bǔ)償函數(shù)。其中,控制信息C,b是可選的,與音頻編碼質(zhì)量設(shè)定值或編碼速率設(shè)定值相 關(guān),所以K"f, cqb)、KWU)(f, Cqb)也與設(shè)定音質(zhì)或編碼速率要求相關(guān),但Kw(f, C,b)、K^p(f, Cqb)有所不同;Kw(f,C,b)主要用于加強(qiáng)Cw(f)的低頻特性、Kip(f,C,b)主要用于加強(qiáng)Cip(f) 的高頻特性,在實(shí)際應(yīng)用中可以由經(jīng)驗(yàn)值得到。B,(Cqb)為相對(duì)偏差系數(shù),它的主要目的是 用來(lái)按照音頻編碼質(zhì)量設(shè)定值或編碼速率設(shè)定值整體調(diào)整局部掩蔽曲線的幅度;比如音頻 編碼質(zhì)量設(shè)定值或編碼速率設(shè)定較高時(shí),B^(C,b)可以降低局部掩蔽曲線幅度,而當(dāng)音頻編 碼質(zhì)量設(shè)定值或編碼速率設(shè)定較低時(shí),B,(Cqb)可以提高局部掩蔽曲線幅度。Kw(f, Cqb)、 KwLP(f,Cqb)和B,(C,b)可以在實(shí)際應(yīng)用中由經(jīng)驗(yàn)值得到。圖5給出了局部掩蔽曲線的示意 圖,圖中KLP(f, Cqb) = KWLP(f, Cqb) = 0. 5, BXLP(Cqb) = 0. 0。即取CLP(f)和C野(f)在每個(gè)頻 率上的平均值作為局部掩蔽曲線。 通過(guò)以上對(duì)步驟7的說(shuō)明,可以看出獲取局部掩蔽曲線的具體方法可以是先對(duì) 獲取的LP濾波器的幅頻響應(yīng)曲線Cw(f)和WLP濾波器幅頻響應(yīng)曲線CWU)(f)分別進(jìn)行頻率 補(bǔ)償,即分別獲取Cw(f)K"f, Cqb)和Cip(f)IWp(f, Cqb);根據(jù)頻率補(bǔ)償?shù)慕Y(jié)果和預(yù)置的信 息,獲取局部掩蔽曲線。其中,預(yù)置的信息可以是按照音頻編碼質(zhì)量設(shè)定值或編碼速率設(shè)定 值整體調(diào)整局部掩蔽曲線的幅度的信息,如相對(duì)偏差系數(shù)B^(C,b)。 步驟8 :根據(jù)步驟7中獲取局部掩蔽曲線和預(yù)置的絕對(duì)掩蔽曲線的特性,獲取全局 掩蔽曲線Cg(f); 其中,絕對(duì)掩蔽門限(Absolute Threshold)表示在無(wú)噪聲環(huán)境下單音信號(hào)能被人 耳感知所需要的能量,通常用聲壓級(jí)dB表示。絕對(duì)掩蔽門限也與頻率相關(guān),它的幅值可以 由如下表達(dá)式近似得到7^(/) = 3.64(//1000"8-6.5,6(//誦—33)2 +1(T3C/71000)4(必)(15) 其中,Uf)是絕對(duì)掩蔽門限,它是頻率的函數(shù),參見圖6a所示絕對(duì)掩蔽門限在對(duì) 數(shù)域的軌跡;參見圖6b所示,為絕對(duì)掩蔽門限在線性域的軌跡。兩種軌跡雖然表示形式不 同,但實(shí)質(zhì)是相同的。 由以上的說(shuō)明可以理解,如果音頻信號(hào)的能量低于局部掩蔽曲線和絕對(duì)掩蔽曲線 任一項(xiàng),則該音頻信號(hào)則不被人耳察覺,因此,全局掩蔽曲線是在每個(gè)頻率上的局部掩蔽曲 線和絕對(duì)掩蔽曲線中最大值連成的曲線。用公式表達(dá)如下
Cg (f) = max {Cp (f) , Y (Cqb) TAT (f)} (dB) (20) 其中,1.0<= Y(Cqb) <= O.O為絕對(duì)掩蔽門限匹配系數(shù),它是與反映音質(zhì)或編
碼速率要求的控制信息C,b相關(guān)的。用于局部掩蔽曲線Cp(f)同絕對(duì)掩蔽門限TM(f)的聲
壓級(jí)的匹配處理。其中,C,b在本發(fā)明實(shí)施例中一直是可選的預(yù)置在編碼器中參數(shù)。如果不
用C,b則Y (Cqb)取值為1。圖7所示對(duì)應(yīng)的全局掩蔽曲線Cg(f)。同時(shí)參考圖5所示的局
部掩蔽曲線和絕對(duì)掩蔽門限,從而更容易理解圖7中顯示的全局掩蔽曲線Cg(f)。 步驟9 :根據(jù)步驟8中獲取的全局掩蔽曲線和預(yù)置的臨界頻帶的信息,獲取全局掩
蔽門限。 其中,需要說(shuō)明的是臨界頻帶(Critical Band)反映的是人耳的另一種聽覺特性,
即頻率分析能力。人耳對(duì)頻率的分析能力可以用一系列高度重疊的帶通濾波器表征,帶通
濾波器的幅頻響應(yīng)是非對(duì)稱和非線性的,其頻帶寬度是隨著頻率的提高而增加,正對(duì)同一
11臨界頻帶內(nèi)的不同頻率,人耳有幾乎相同的感知特性。臨界頻帶就是用一個(gè)頻率函數(shù)定量 描述聽覺帶通濾波器的特性。在巴克Bark域內(nèi),一個(gè)臨界頻帶的頻帶寬度通常為一個(gè)巴克 Bark,以下表達(dá)式可以將臨界頻帶由線性頻域到Bark域的轉(zhuǎn)換 = 13 arctan(0.00076/) + 3.5 arctan
7500
(21) 通過(guò)以下表達(dá)式可以獲得臨界頻帶的頻帶寬度的近似值
BWc(f) = 25+75[l+l. 4(f/1000)2] 0 69 (Hz) (22) 還需要說(shuō)明的是人耳的臨界頻帶可以是通過(guò)實(shí)驗(yàn)或者其它已有的經(jīng)驗(yàn)獲得的,預(yù) 置在編碼器中的。 在步驟9中根據(jù)獲取的全局掩蔽曲線和預(yù)置的臨界頻帶的信息,獲取全局掩蔽 門限的具體執(zhí)行方法可以是獲取每個(gè)Bark內(nèi)臨界頻帶端點(diǎn)和頻帶中點(diǎn)在全局掩蔽曲線 Cg(f)的幅度取值,將所述獲取的所有幅度取值按照頻率順序用直線連接起來(lái)形成的全局 掩蔽門限T口(f)。參見圖8a所示,該全局掩蔽門限T^(f)是折線的形式,可以將該全局掩 蔽門限TpsY(f)稱為折線型全局掩蔽門限。 在步驟9中根據(jù)獲取的全局掩蔽曲線和預(yù)置的臨界頻帶的信息,獲取全局掩蔽門 限的具體執(zhí)行方法也可以是通過(guò)在每個(gè)Bark上臨界頻帶內(nèi)獲取全局掩蔽曲線Cg(f)的最 小值,每個(gè)臨界頻帶內(nèi)的幅度取值是該頻帶內(nèi)全局掩蔽曲線Cg(f)中的最小值,得到的幅頻 響應(yīng)為全局掩蔽門限Uf)。參見圖8b所示,該全局掩蔽門限T^(f)在圖中是階梯型。該 全局掩蔽門限T^(f)可以成為階梯型全局掩蔽門限T^(f)。由于人耳對(duì)語(yǔ)音或音頻信號(hào) 在低頻的辨別能力好于在高頻的辨別能力,因此,從圖上可以看出,在低頻處臨界頻帶寬度 較窄,在高頻出臨界頻帶寬度較寬。事實(shí)上,折線型全局掩蔽門限也有此特點(diǎn)。
還需要理解的是,步驟9中根據(jù)獲取的全局掩蔽曲線和預(yù)置的臨界頻帶的信息, 獲取全局掩蔽門限的具體執(zhí)行方法不止局限于以上描述的兩種,以上兩種方法是比較簡(jiǎn)單 的近似獲取全局掩蔽門限TPSY(f),當(dāng)然還可以在每個(gè)臨界頻帶上選取多個(gè)頻點(diǎn),來(lái)獲取全 局掩蔽門限TPSY(f)。 以上步驟1至步驟9的說(shuō)明實(shí)現(xiàn)了一種建立心理聲學(xué)模型的方法,編碼器可以獲 取到全局掩蔽門限作為量化的依據(jù)。該方法根據(jù)線性預(yù)測(cè)LP和巻曲線性預(yù)測(cè)WLP的頻率 分辨特性非常接近人類聽覺特性中的臨界頻帶和掩蔽特性的特點(diǎn),對(duì)接收到的采樣音頻信 號(hào)分別進(jìn)行線性預(yù)測(cè)LP和巻曲線性預(yù)測(cè)WLP,獲取LP濾波器的幅頻響應(yīng)和WLP濾波器的幅 頻響應(yīng),根據(jù)獲取的LP濾波器的幅頻響應(yīng)和WLP濾波器的幅頻響應(yīng),獲取到局部掩蔽曲線; 根據(jù)獲取的局部掩蔽曲線、預(yù)置的絕對(duì)掩蔽門限和臨界頻帶帶寬,獲取全局掩蔽門限。
步驟10 :根據(jù)獲取的全局掩蔽門限,對(duì)音頻信號(hào)進(jìn)行編碼。 本實(shí)施例提供的利用線性預(yù)測(cè)LP和巻曲線性預(yù)測(cè)WLP的頻率分辨特性非常接近 人類聽覺特性中的臨界頻帶和掩蔽特性的特點(diǎn),建立心理聲學(xué)模型的方法,獲取全局掩蔽 門限,根據(jù)獲取的全局掩蔽門限對(duì)音頻信號(hào)進(jìn)行編碼,降低了建立心理聲學(xué)模型的復(fù)雜度, 易于實(shí)現(xiàn),降低了心理聲學(xué)模型在硬件實(shí)現(xiàn)的成本,降低了硬件的功率消耗。
實(shí)施例二 本發(fā)明實(shí)施例提供了一種音頻編碼方法,參見圖9所示,且參考圖1所示的音頻編
12碼器。該音頻編碼方法中獲取心理聲學(xué)模型全局掩蔽門限的方法,是利用了實(shí)施例一中提 供的一種建立心理聲學(xué)模型的方法。本發(fā)明實(shí)施例提供了一種音頻編碼方法包括
步驟H1 :編碼器接收時(shí)域音頻信號(hào); 其中,編碼器接收的時(shí)域音頻信號(hào)是與實(shí)施例一中的步驟1中執(zhí)行的同一個(gè)步 驟。 步驟H2 :編碼器根據(jù)接收到的時(shí)域音頻信號(hào),建立心理聲學(xué)模型,獲取全局掩蔽 門限; 其中,步驟H3的具有執(zhí)行方法可以參考實(shí)施例一中的說(shuō)明。 步驟H3 :編碼器根據(jù)步驟2中獲取的全局掩蔽門限,對(duì)接收到的時(shí)域音頻信號(hào)進(jìn) 行編碼。 其中,需要理解的該實(shí)施例中提供的一種音頻編碼方法,該音頻編碼方法,利用線 性預(yù)測(cè)LP和巻曲線性預(yù)測(cè)WLP的頻率分辨特性非常接近人類聽覺特性中的臨界頻帶和掩 蔽特性的特點(diǎn),建立的心理聲學(xué)模型,降低了建立心理聲學(xué)模型的復(fù)雜度,易于實(shí)現(xiàn),降低 了心理聲學(xué)模型在硬件實(shí)現(xiàn)的成本,降低了硬件的功率消耗。 因此,實(shí)施例一中建立心理聲學(xué)模型的方法可以應(yīng)用在不同環(huán)境,以上實(shí)施例二 是其中一種應(yīng)用環(huán)境,即應(yīng)用在音頻編碼中。該心理聲學(xué)模型還可以應(yīng)用在音頻水印系統(tǒng) 中,即一種音頻水印嵌入方法中利用到實(shí)施例一提供的建立心理聲學(xué)模型。采用實(shí)施例一 提供的建立心理聲學(xué)模型方法的音頻水印系統(tǒng),也具有降低建立心理聲學(xué)模型的復(fù)雜度, 易于實(shí)現(xiàn),降低了心理聲學(xué)模型在硬件實(shí)現(xiàn)的成本,降低了硬件的功率消耗的特點(diǎn)。
實(shí)施例三 本實(shí)施例提供了一種音頻編碼器,參見圖IO所示,包括接收單元10、采樣單元 20、線性預(yù)測(cè)LP單元30、獲取LP濾波器幅頻響應(yīng)單元40、巻曲線性預(yù)測(cè)WLP單元50、獲取 WLP濾波器幅頻響應(yīng)單元60、獲取局部掩蔽曲線單元70,獲取全局掩蔽曲線單元80、獲取掩 蔽門限單元90和音頻編碼單元100。 其中,接收單元10接收時(shí)域音頻信號(hào),該接收到的時(shí)域音頻信號(hào)可以是語(yǔ)音信 號(hào)、音頻信號(hào)或者各種人耳可以聽到的各種聲音信號(hào)的混合信息,該音頻信號(hào)的頻帶寬度 通常為人耳可以聽到頻率范圍(即OHz到24000Hz),音頻信號(hào)通常是幀的格式, 一幀的長(zhǎng)度 一般為5毫秒到30毫秒之間。 采用單元20對(duì)接收到的音頻信號(hào)進(jìn)行采用,采用的頻率可以是48kHz、44. lkHz、 32kHz、 16kHz、8kHz等其中任一一種。線性預(yù)測(cè)LP單元30對(duì)獲取的采樣語(yǔ)音信號(hào)進(jìn)行線性 預(yù)測(cè)LP,也可以說(shuō)是根據(jù)獲取的采用語(yǔ)音信號(hào)獲取LP濾波器的系數(shù)。 其中。LP單元30還可以具體包括第一獲取自相關(guān)函數(shù)單元301、第一獲取正則 方程單元302和第一獲取線性預(yù)測(cè)濾波器系數(shù)單元303。其中第一獲取自相關(guān)函數(shù)單元 301,用于獲取采樣后的音頻信號(hào)的自相關(guān)函數(shù);第一獲取正則方程單元302根據(jù)原始信號(hào) 采樣后的音頻信號(hào)與線性濾波器預(yù)測(cè)結(jié)果之間的差值最小的原則,獲取LP的正則方程;第 一獲取LP濾波器系統(tǒng)單元303根據(jù)第一獲取自相關(guān)函數(shù)單元301中獲取的自相關(guān)函數(shù),利 用Levinson Durbin算法求解正則方程,獲取LP濾波器系數(shù)。 第一獲取LP幅頻響應(yīng)單元40根 LP單元30中獲取LP濾波器系數(shù),獲取LP濾 波器的幅頻響應(yīng)曲線;其中,獲取LP幅頻響應(yīng)單元40中獲取LP濾波器的幅頻響應(yīng)曲線是根據(jù)結(jié)論性公式(4)得到的。 巻曲線性預(yù)測(cè)WLP單元50對(duì)獲取的采樣后的語(yǔ)音信號(hào)進(jìn)行巻曲線性預(yù)測(cè)WLP,也 可以說(shuō)是根據(jù)獲取的采用語(yǔ)音信號(hào)獲取WLP濾波器的系數(shù)。 其中,巻曲線性預(yù)測(cè)WLP單元50與LP單元30相似,還可以具體包括第二獲取自 相關(guān)函數(shù)單元501、第二獲取正則方程單元502和第二獲取巻曲線性預(yù)測(cè)濾波器系數(shù)單元 503。其中第二獲取自相關(guān)函數(shù)單元501,用于獲取采用音頻信號(hào)的自相關(guān)函數(shù);第二獲取 正則方程單元502根據(jù)原始信號(hào)采樣后的音頻信號(hào)與巻曲線性濾波器預(yù)測(cè)結(jié)果之間的差 值最小的原則,獲取WLP正則方程;第二獲取WLP濾波器系統(tǒng)單元503根據(jù)第二獲取自相關(guān) 函數(shù)單元501中獲取的自相關(guān)函數(shù),利用Levinson Durbin算法求解正則方程,獲取WLP濾 波器系數(shù)。 獲取WLP濾波器幅頻響應(yīng)單元60根據(jù)WLP單元50中獲取WLP濾波器系數(shù),獲取 WLP濾波器的幅頻響應(yīng)曲線;其中,獲取WLP幅頻響應(yīng)單元60中獲取WLP濾波器的幅頻響 應(yīng)曲線是根據(jù)結(jié)論性公式(13)得到的。 獲取局部掩蔽曲線單元70根據(jù)獲取LP濾波器幅頻響應(yīng)單元40中獲取的LP濾波 器的幅頻響應(yīng)曲線,和獲取WLP濾波器幅頻響應(yīng)單元60中獲取的WLP濾波器的幅頻響應(yīng)曲 線,獲取局部掩蔽曲線。該獲取局部掩蔽曲線單元70具體可以包括頻率補(bǔ)償單元701和 計(jì)算局部掩蔽曲線單元702。 其中,頻率補(bǔ)償單元701用于根據(jù)預(yù)置的控制信息加強(qiáng)LP濾波器的幅頻響應(yīng)曲線 Cw(f)的低頻特性、和加強(qiáng)WLP濾波器的幅頻響應(yīng)Cip(f)的高頻特性;計(jì)算局部掩蔽曲線 單元702根據(jù)頻率補(bǔ)償單元701中獲取的頻率補(bǔ)償后的幅頻特性和預(yù)置的相對(duì)偏差系數(shù), 獲取局部掩蔽曲線,可以參考公式(14)。 獲取全局掩蔽曲線單元80根據(jù)獲取局部掩蔽曲線單元70中獲取的局部掩蔽曲線 和預(yù)置的絕對(duì)掩蔽曲線,獲取全局掩蔽曲線,具體可以參考公式(20)。 獲取掩蔽門限單元90根據(jù)獲取的全局掩蔽曲線和預(yù)置的臨界頻帶的信息,獲取 全局掩蔽門限。 音頻編碼單元IOO,該音頻編碼單元用于根據(jù)獲取掩蔽門限對(duì)接收到的信號(hào)進(jìn)行 編碼。 本發(fā)明實(shí)施例提供的一種音頻編碼器中的接收單元10、采樣單元20、線性預(yù)測(cè)LP 單元30、獲取LP濾波器幅頻響應(yīng)單元40、巻曲線性預(yù)測(cè)WLP單元50、獲取WLP濾波器幅頻 響應(yīng)單元60、獲取局部掩蔽曲線單元70,獲取全局掩蔽曲線單元80和獲取掩蔽門限單元90 共同來(lái)實(shí)現(xiàn)獲取全局掩蔽門限,可以包含在一種音頻水印嵌入裝置中。該水印嵌入裝置還 包括水印嵌入單元。 其中,該水印嵌入單元根據(jù)獲取的全局掩蔽門限,將水印編碼嵌入到輸入音頻信 號(hào)中。 通過(guò)以上的對(duì)本實(shí)施例提供的一種音頻編碼器的說(shuō)明,該音頻編碼器利用線性預(yù) 測(cè)LP和巻曲線性預(yù)測(cè)WLP的頻率分辨特性非常接近人類聽覺特性中的臨界頻帶和掩蔽特 性的特點(diǎn),建立心理聲學(xué)模型,降低了建立心理聲學(xué)模型的復(fù)雜度,易于實(shí)現(xiàn),降低了心理 聲學(xué)模型在硬件實(shí)現(xiàn)的成本,降低了硬件的功率消耗。 本領(lǐng)域普通技術(shù)人員可以理解上述實(shí)施例的各種方法中的全部或部分步驟是可以通過(guò)程序來(lái)指令相關(guān)的硬件來(lái)完成,該程序可以存儲(chǔ)于一計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中,存儲(chǔ) 介質(zhì)可以包括R0M、RAM、磁盤或光盤等。 以上對(duì)本發(fā)明實(shí)施例所提供的一種音頻編碼方法以及相應(yīng)裝置進(jìn)行了詳細(xì)介紹, 本文中應(yīng)用了具體個(gè)例對(duì)本發(fā)明的原理及實(shí)施方式進(jìn)行了闡述,以上實(shí)施例的說(shuō)明只是用 于幫助理解本發(fā)明的方法及其核心思想;同時(shí),對(duì)于本領(lǐng)域的一般技術(shù)人員,依據(jù)本發(fā)明的 思想,在具體實(shí)施方式
及應(yīng)用范圍上均會(huì)有改變之處,綜上所述,本說(shuō)明書內(nèi)容不應(yīng)理解為 對(duì)本發(fā)明的限制。
權(quán)利要求
一種音頻編碼方法,其特征在于,包括接收時(shí)域音頻信號(hào);對(duì)所述音頻信號(hào)進(jìn)行采樣;對(duì)采樣后的音頻信號(hào)進(jìn)行線性預(yù)測(cè);根據(jù)所述線性預(yù)測(cè)的結(jié)果,獲取線性預(yù)測(cè)濾波器的幅頻響應(yīng)曲線;對(duì)采樣后的音頻信號(hào)進(jìn)行卷曲線性預(yù)測(cè);根據(jù)所述卷曲線性預(yù)測(cè)的結(jié)果,獲取卷曲線性預(yù)測(cè)濾波器的幅頻響應(yīng)曲線;根據(jù)所述線性預(yù)測(cè)濾波器的幅頻響應(yīng)曲線和所述卷曲線性預(yù)測(cè)濾波器的幅頻響應(yīng)曲線,獲取局部掩蔽曲線;根據(jù)所述獲取的局部掩蔽曲線和絕對(duì)掩蔽曲線的特性,獲取全局掩蔽曲線;根據(jù)所述獲取的全局掩蔽曲線和臨界頻帶的信息,獲取全局掩蔽門限;根據(jù)所述獲取的全局掩蔽門限,對(duì)所述音頻信號(hào)進(jìn)行編碼。
2. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述對(duì)采樣后的音頻信號(hào)進(jìn)行線性預(yù)測(cè) LP,具體包括獲取所述采樣后的音頻信號(hào)的自相關(guān)函數(shù);根據(jù)原始信號(hào)采樣后的音頻信號(hào)與線性預(yù)測(cè)LP濾波器預(yù)測(cè)結(jié)果之間差值的取值,獲 取線性預(yù)測(cè)LP正則方程;求解所述LP正則方程,所述LP正則方程的解為所述濾波器系數(shù)。
3. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述對(duì)采樣后的音頻信號(hào)進(jìn)行巻曲線性 預(yù)測(cè)WLP,具體包括獲取所述采樣后的音頻信號(hào)的自相關(guān)函數(shù);根據(jù)原始信號(hào)采樣后的音頻信號(hào)與WLP濾波器預(yù)測(cè)結(jié)果之間差值的取值,獲取WLP正 則方程;求解所述WLP正則方程,所述WLP正則方程的解為所述WLP濾波器系數(shù)。
4. 根據(jù)權(quán)利要求3所述的方法,其特征在于,所述獲取所述采樣后的音頻信號(hào)的自相 關(guān)函數(shù),具體包括所述采樣后的音頻信號(hào)通過(guò)預(yù)置的級(jí)聯(lián)的一階全通濾波器,獲取到各級(jí)聯(lián)全通濾波器 的輸出信號(hào)dk[x(n)],k二O,l,...N-l ;根據(jù)所述采樣后的音頻信號(hào)與各級(jí)聯(lián)階全通濾波器的輸出信號(hào)dk[X(n)], k = 0, l,...N-l獲取相關(guān)函數(shù)。
5. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述LP濾波器的幅頻響應(yīng)曲線 (f)和所述WLP濾波器的幅頻響應(yīng)曲線CM (f),獲取局部掩蔽曲線Cp (f),具體包括根據(jù)預(yù)置的控制信息,分別對(duì)所述獲取的LP濾波器的幅頻響應(yīng)曲線和所述巻曲線性 預(yù)測(cè)濾波器的幅頻響應(yīng)曲線進(jìn)行頻率補(bǔ)償;根據(jù)所述頻率補(bǔ)償后的結(jié)果和預(yù)置的控制信息,獲取局部掩蔽曲線。
6. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述LP濾波器的幅頻響應(yīng)曲線 和所述巻曲線性預(yù)測(cè)濾波器的幅頻響應(yīng)曲線,獲取局部掩蔽曲線,具體包括將所述LP濾波器的幅頻響應(yīng)曲線和所述WLP濾波器的幅頻響應(yīng)曲線C^p(f)在相同頻 率上的幅度求平均值,獲取的所述平均值的曲線為局部掩蔽曲線Cp(f)。
7. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)獲取的局部掩蔽曲線和絕對(duì)掩 蔽曲線的特性,獲取全局掩蔽曲線,具體包括獲取局部掩蔽曲線與絕對(duì)掩蔽曲線在相同頻率上幅度最大的值,所述最大值在頻率上 形成的曲線即為全局掩蔽曲線Cg(f)。
8. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)獲取的局部掩蔽曲線和絕對(duì)掩 蔽曲線的特性,獲取全局掩蔽曲線Cg (f),具體包括根據(jù)預(yù)置的絕對(duì)掩蔽門限匹配系數(shù)、局部掩蔽曲線和絕對(duì)掩蔽曲線的特性,獲取全局 掩蔽曲線Cg(f)。
9. 根據(jù)權(quán)利要求1至8任一項(xiàng)所述的方法,其特征在于,所述根據(jù)獲取的全局掩蔽曲線Cg(f)和預(yù)置的臨界頻帶的信息,獲取全局掩蔽門限,具體包括獲得臨界頻帶端點(diǎn)和頻帶中點(diǎn)在全局掩蔽曲線Cg(f)上的幅度取值,將所述獲取的幅 度取值按照頻率順序用直線連接形成的全局掩蔽門限曲線。
10. 根據(jù)權(quán)利要求1至8任一項(xiàng)所述的方法,其特征在于,所述根據(jù)獲取的全局掩蔽曲線Cg(f)和預(yù)置的臨界頻帶的信息,獲取全局掩蔽門限,具體包括從臨界頻帶內(nèi)獲取全局掩蔽曲線Cg(f)上幅度的最小值,以每個(gè)Bark上臨界頻帶內(nèi)全 局掩蔽曲線Cg(f)上幅度的最小值作為全局掩蔽門限。
11. 一種音頻編碼器,其特征在于,包括 接收單元,用于接收時(shí)域音頻信號(hào); 采樣單元,用于對(duì)所述音頻信號(hào)進(jìn)行采樣;線性預(yù)測(cè)LP單元,用于對(duì)采樣后的音頻信號(hào)進(jìn)行線性預(yù)測(cè)LP ;獲取LP濾波器幅頻響應(yīng)單元,用于根據(jù)所述線性預(yù)測(cè)的結(jié)果,獲取線性預(yù)測(cè)LP濾波器的幅頻響應(yīng)曲線Cw(f);巻曲線性預(yù)測(cè)WLP單元,用于對(duì)采樣后的音頻信號(hào)進(jìn)行巻曲線性預(yù)測(cè)WLP ;獲取WLP濾波器幅頻響應(yīng)單元,用于根據(jù)所述巻曲線性預(yù)測(cè)的結(jié)果,獲取WLP濾波器的 幅頻響應(yīng)曲線Cip(f);獲取局部掩蔽曲線單元,用于根據(jù)所述LP濾波器的幅頻響應(yīng)曲線Cw(f)和所述WLP濾 波器的幅頻響應(yīng)曲線CWU)(f),獲取局部掩蔽曲線Cp(f)獲取全局掩蔽曲線單元,用于根據(jù)所述獲取的局部掩蔽曲線和絕對(duì)掩蔽曲線的特性, 獲取全局掩蔽曲線Cg(f);獲取掩蔽門限單元,用于根據(jù)所述獲取的全局掩蔽曲線Cg(f)和預(yù)置的臨界頻帶的信 息,獲取全局掩蔽門限;音頻編碼單元,用于根據(jù)獲取掩蔽門限對(duì)所述接收到的音頻信號(hào)進(jìn)行編碼。
12. 根據(jù)權(quán)利要求11所述的音頻編碼器,其特征在于,所述線性預(yù)測(cè)LP單元具體包括第一獲取自相關(guān)函數(shù)單元,用于獲取所述采樣后的音頻信號(hào)的自相關(guān)函數(shù); 第一獲取正則方程單元,用于根據(jù)原始信號(hào)采樣后的音頻信號(hào)與線性預(yù)測(cè)LP濾波器預(yù)測(cè)結(jié)果之間的差值的取值,獲取線性預(yù)測(cè)LP正則方程;第一獲取線性預(yù)測(cè)濾波器系數(shù)單元,用于根據(jù)所述自相關(guān)函數(shù),求解所述LP正則方程,所述LP正則方程的解為所述LP濾波器系數(shù)。
13. 根據(jù)權(quán)利要求11所述的音頻編碼器,其特征在于,所述巻曲線性預(yù)測(cè)WLP單元具體 包括第二獲取自相關(guān)函數(shù)單元,用于獲取所述采樣后的音頻信號(hào)的自相關(guān)函數(shù); 第二獲取正則方程單元,用于根據(jù)原始信號(hào)采樣后的音頻信號(hào)與WLP濾波器預(yù)測(cè)結(jié)果之間的差值的取值,獲取WLP正則方程;第二獲取線性預(yù)測(cè)濾波器系數(shù)單元,用于根據(jù)所述自相關(guān)函數(shù),求解所述WLP正則方程,所述WLP正則方程的解為所述WLP濾波器系數(shù)。
14. 根據(jù)權(quán)利要求11所述的音頻編碼器,其特征在于,所述獲取局部掩蔽曲線單元具 體包括頻率補(bǔ)償單,用于根據(jù)預(yù)置的控制信息,分別對(duì)所述獲取的LP濾波器的幅頻響應(yīng)曲線C"f)和所述WLP濾波器的幅頻響應(yīng)曲線Cip(f)進(jìn)行頻率補(bǔ)償;計(jì)算局部掩蔽曲線單元,用于根據(jù)所述頻率補(bǔ)償后的結(jié)果和預(yù)置的控制信息,獲取局 部掩蔽曲線Cp(f)。
15. —種音頻水印嵌入裝置,其特征在于,包括接收單元,用于接收時(shí)域音頻信號(hào);采樣單元,用于對(duì)所述音頻信號(hào)進(jìn)行采樣;線性預(yù)測(cè)LP單元,用于對(duì)采樣后的音頻信號(hào)進(jìn)行線性預(yù)測(cè)LP ;獲取LP濾波器幅頻響應(yīng)單元,用于根據(jù)所述線性預(yù)測(cè)的結(jié)果,獲取線性預(yù)測(cè)LP濾波器的幅頻響應(yīng)曲線Cw(f);巻曲線性預(yù)測(cè)WLP單元,用于對(duì)采樣后的音頻信號(hào)進(jìn)行巻曲線性預(yù)測(cè)WLP ;獲取WLP濾波器幅頻響應(yīng)單元,用于根據(jù)所述巻曲線性預(yù)測(cè)的結(jié)果,獲取WLP濾波器的 幅頻響應(yīng)曲線Cip(f);獲取局部掩蔽曲線單元,用于根據(jù)所述LP濾波器的幅頻響應(yīng)曲線Cw(f)和所述WLP濾 波器的幅頻響應(yīng)曲線CWU)(f),獲取局部掩蔽曲線Cp(f)獲取全局掩蔽曲線單元,用于根據(jù)所述獲取的局部掩蔽曲線和絕對(duì)掩蔽曲線的特性, 獲取全局掩蔽曲線Cg(f);獲取掩蔽門限單元,用于根據(jù)所述獲取的全局掩蔽曲線Cg(f)和預(yù)置的臨界頻帶的信 息,獲取全局掩蔽門限;水印嵌入單元,用于根據(jù)所述獲取的全局掩蔽門限,將水印編碼嵌入到輸入音頻信號(hào)中。
全文摘要
本發(fā)明公開了一種音頻編碼方法和音頻編碼器方法。本發(fā)明實(shí)施例還提供相應(yīng)的音頻編碼器。本發(fā)明技術(shù)方案由于利用線性預(yù)測(cè)LP和卷曲線性預(yù)測(cè)WLP的頻率分辨特性非常接近人類聽覺特性中的臨界頻帶和掩蔽特性的特點(diǎn),建立心理聲學(xué)模型,獲取到掩蔽門限,根據(jù)獲取的掩蔽門限對(duì)音頻信號(hào)進(jìn)行編碼,降低了建立心理聲學(xué)模型的復(fù)雜度,易于實(shí)現(xiàn),降低了心理聲學(xué)模型在硬件實(shí)現(xiàn)的成本,降低了硬件的功率消耗。
文檔編號(hào)G10L19/14GK101740033SQ200810181909
公開日2010年6月16日 申請(qǐng)日期2008年11月24日 優(yōu)先權(quán)日2008年11月24日
發(fā)明者宋少鵬, 李倩, 柳巍, 許麗凈, 馬鴻飛 申請(qǐng)人:華為技術(shù)有限公司;西安電子科技大學(xué)