欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

音頻編碼方法和設(shè)備、音頻解碼方法和設(shè)備與流程

文檔序號:12475986閱讀:195來源:國知局
音頻編碼方法和設(shè)備、音頻解碼方法和設(shè)備與流程

技術(shù)領(lǐng)域
與示例性實施例一致的設(shè)備和方法涉及音頻編碼/解碼,更具體地講,涉及一種能夠在不增加復(fù)雜度和恢復(fù)的聲音質(zhì)量的惡化的情況下,通過減少在有限比特范圍內(nèi)對音頻頻譜的包絡(luò)信息進行編碼所需的比特的數(shù)量來增加對實際頻譜分量進行編碼所需的比特的數(shù)量的音頻編碼方法和設(shè)備、音頻解碼方法和設(shè)備、記錄介質(zhì)和采用該音頻編碼方法和設(shè)備、音頻解碼方法和設(shè)備的多媒體裝置。
背景技術(shù)
:當(dāng)對音頻信號進行編碼時,除實際頻譜分量以外的附加信息(諸如,包絡(luò))可包括在比特流中。在這種情況下,通過在使損失最小化的同時減少分配用于附加信息的編碼的比特的數(shù)量,分配用于實際頻譜分量的編碼的比特的數(shù)量可被增加。也就是說,當(dāng)對音頻信號進行編碼或解碼時,需要通過以特別低的比特率有效地使用有限數(shù)量的比特來構(gòu)建在相應(yīng)比特范圍內(nèi)具有最優(yōu)聲音質(zhì)量的音頻信號。技術(shù)實現(xiàn)要素:技術(shù)問題一個或更多個示例性實施例的多個方面提供一種音頻編碼方法和設(shè)備、音頻解碼方法和設(shè)備、記錄介質(zhì)和采用其的多媒體裝置,其中,所述音頻編碼方法和設(shè)備能夠在不增加復(fù)雜度和恢復(fù)的聲音質(zhì)量的惡化的情況下,在將對音頻頻譜的包絡(luò)信息進行編碼所需的比特的數(shù)量減少到有限的比特范圍內(nèi)的同時,增加對實際頻譜分量進行編碼所需的比特的數(shù)量。解決方案根據(jù)一個或更多個示例性實施例的一方面,提供一種音頻編碼方法,包括:針對音頻頻譜基于預(yù)定的子頻帶獲取包絡(luò);基于預(yù)定的子頻帶對包絡(luò)進行量化;獲得相鄰子頻帶的量化的包絡(luò)之間的差值并通過將先前子頻帶的差值用作上下文來對當(dāng)前子頻帶的差值進行無損編碼。根據(jù)一個或更多個示例性實施例的一方面,提供一種音頻編碼設(shè)備,包括:包絡(luò)獲取單元,用于針對音頻頻譜基于預(yù)定的子頻帶獲取包絡(luò);包絡(luò)量化器,用于基于預(yù)定的子頻帶對包絡(luò)進行量化;包絡(luò)編碼器,用于獲得相鄰子頻帶的量化的包絡(luò)之間的差值,并通過將先前子頻帶的差值用作上下文來對當(dāng)前子頻帶的差值進行無損編碼;頻譜編碼器,用于對音頻頻譜進行量化和無損編碼。根據(jù)一個或更多個示例性實施例的一方面,提供一種音頻解碼方法,包括:從比特流獲得相鄰子頻帶的量化的包絡(luò)之間的差值,并通過將先前子頻帶的差值用作上下文來對當(dāng)前子頻帶的差值進行無損解碼;通過從作為無損解碼的結(jié)果而被重構(gòu)的當(dāng)前子頻帶的差值獲得基于子頻帶的量化的包絡(luò)來執(zhí)行反量化。根據(jù)一個或更多個示例性實施例的一方面,提供一種音頻解碼設(shè)備,包括:包絡(luò)解碼器,用于從比特流獲得相鄰子頻帶的量化的包絡(luò)之間的差值,并通過將先前子頻帶的差值用作上下文來對當(dāng)前子頻帶的差值進行無損解碼;包絡(luò)反量化器,用于通過從作為無損解碼的結(jié)果而被重構(gòu)的當(dāng)前子頻帶的差值獲得基于子頻帶的量化的包絡(luò)來執(zhí)行反量化;頻譜解碼器,用于對包括在比特流中的頻譜分量進行無損解碼和反量化。根據(jù)一個或更多個示例性實施例的一方面,提供一種包括編碼模塊的多媒體裝置,其中,編碼模塊用于針對音頻頻譜基于預(yù)定的子頻帶獲取包絡(luò),基于預(yù)定的子頻帶對包絡(luò)進行量化,獲得相鄰子頻帶的量化的包絡(luò)之間的差值并通過將先前子頻帶的差值用作上下文來對當(dāng)前子頻帶的差值進行無損編碼。多媒體裝置還可包括解碼模塊,其中,解碼模塊用于從比特流獲得相鄰子頻帶的量化的包絡(luò)之間的差值,并通過將先前子頻帶的差值用作上下文來對當(dāng)前子頻帶的差值進行無損解碼,通過從作為無損解碼的結(jié)果而被重構(gòu)的當(dāng)前子頻帶的差值獲得基于子頻帶的量化的包絡(luò)來執(zhí)行反量化。效果可在不增加復(fù)雜度和恢復(fù)的聲音質(zhì)量的惡化的情況下,通過減少在有限的比特范圍內(nèi)對音頻頻譜的包絡(luò)信息進行編碼所需的比特的數(shù)量,來增加對實際頻譜分量進行編碼所需的比特的數(shù)量。附圖說明通過下面結(jié)合附圖的示例性實施例的描述,這些和其他方面將變得清楚和更容易理解,其中:圖1是根據(jù)示例性實施例的數(shù)字信號處理設(shè)備的框圖;圖2是根據(jù)另一示例性實施例的數(shù)字信號處理設(shè)備的框圖;圖3A和圖3B分別示出在量化分辨率是0.5且量化步長是3.01時的相互比較的非優(yōu)化的對數(shù)尺度和優(yōu)化的對數(shù)尺度;圖4A和圖4B分別示出在量化分辨率是1且量化步長是6.02時的相互比較的非優(yōu)化的對數(shù)尺度和優(yōu)化的對數(shù)尺度;圖5A和圖5B是分別示出相互比較的非優(yōu)化的對數(shù)尺度的量化結(jié)果和優(yōu)化的對數(shù)尺度的量化結(jié)果的曲線圖;圖6是示出在先前子頻帶的量化差(delta)值被用作上下文時選擇的三個組的概率分布的曲線圖;圖7是示出根據(jù)示例性實施例的圖1的數(shù)字信號處理設(shè)備的包絡(luò)編碼器中的基于上下文的編碼處理的流程圖;圖8是示出根據(jù)示例性實施例的圖2的數(shù)字信號處理設(shè)備的包絡(luò)解碼器中的基于上下文的解碼處理的流程圖;圖9是根據(jù)示例性實施例的包括編碼模塊的多媒體裝置的框圖;圖10是根據(jù)示例性實施例的包括解碼模塊的多媒體裝置的框圖;圖11是根據(jù)示例性實施例的包括編碼模塊和解碼模塊的多媒體裝置的框圖。具體實施方式示例性實施例可允許各種改變或修改以及形式上的各種改變,特定實施例將被示出在附圖中并在說明書中被詳細(xì)描述。然而,應(yīng)理解特定實施例不將本發(fā)明構(gòu)思限制為特定公開形式而是包括本發(fā)明構(gòu)思的精神和技術(shù)范圍內(nèi)的所有修改的、等同的或替代的實施例。在以下描述中,由于公知的功能或構(gòu)造將在不必要的細(xì)節(jié)上使本發(fā)明構(gòu)思不清楚,因此不被詳細(xì)描述。盡管諸如“第一”和“第二”的術(shù)語可用于描述各種元件,但所述元件可不被所述術(shù)語限制。所述術(shù)語可用于將特定元件與另一元件分開。在本申請中使用的術(shù)語僅用于描述特定實施例,而不具有任何限制本發(fā)明構(gòu)思的意圖。盡管在考慮在本發(fā)明構(gòu)思中的功能的同時將當(dāng)前盡可能廣泛使用的通用術(shù)語選作在本發(fā)明構(gòu)思中使用的術(shù)語,但它們可根據(jù)本領(lǐng)域的普通技術(shù)人員的意圖、先前使用或新技術(shù)的出現(xiàn)改變。另外,在特定情況下,可使用由申請人有意地選擇的術(shù)語,在這種情況下,將在本發(fā)明構(gòu)思的相應(yīng)描述中公開這些術(shù)語的意義。因此,在本發(fā)明構(gòu)思中使用的術(shù)語不應(yīng)僅由術(shù)語的名稱而應(yīng)由術(shù)語的含義和整個本發(fā)明構(gòu)思中的內(nèi)容來定義。除非在上下文中單數(shù)的表達與復(fù)數(shù)的表達明顯彼此不同,否則單數(shù)的表達包括復(fù)數(shù)的表達。在本申請中,應(yīng)理解諸如“包括”和“具有”的術(shù)語用于指示實施的特征、數(shù)字、步驟、操作、元件、部件或它們的組合的存在,而不是預(yù)先排除一個或更多個其他特征、數(shù)字、步驟、操作、元件、部件或它們的組合的存在或添加的可能性。在下文中,將參照示出本發(fā)明構(gòu)思的示例性實施例的附圖來更全面地描述本發(fā)明構(gòu)思。附圖中的相同的標(biāo)號表示相同的元件,因此將省略它們的重復(fù)的描述。當(dāng)諸如“…中的至少一個”的表述在一列元件之后時,其修飾整列元件而不修飾列出的單個元件。圖1是根據(jù)示例性實施例的數(shù)字信號處理設(shè)備100的框圖。圖1中示出的數(shù)字信號處理設(shè)備100可包括變換器110、包絡(luò)獲取單元120、包絡(luò)量化器130、包絡(luò)編碼器140、頻譜歸一化器150和頻譜編碼器160。數(shù)字信號處理設(shè)備100的組件可被集成到至少一個模塊中,并可由至少一個處理器實現(xiàn)。這里,數(shù)字信號可指示媒體信號,諸如,視頻、圖像、音頻或語音、或指示通過對音頻和語音進行合成來獲得的信號的聲音,但在下文中,為便于描述,數(shù)字信號通常指示音頻信號。參照圖1,變換器110可通過將音頻信號從時域變換到頻域來產(chǎn)生音頻頻譜??赏ㄟ^使用諸如改進的離散余弦變換(MDCT)的各種公知方法來執(zhí)行時域到頻域的變換。例如,用于時域的音頻信號的MDCT可使用等式1來執(zhí)行。在等式1中,N表示包括在單個幀中的采樣的數(shù)量(即,幀大小),hj表示應(yīng)用的窗口,sj表示時域的音頻信號,xi表示MDCT系數(shù)??蛇x擇地,可使用正弦窗口(例如,hj=sin[π(j+1/2)/2N])替代等式1的余弦窗口。由變換器110獲得的音頻頻譜的變換系數(shù)(例如,MDCT系數(shù)xi)被提供給包絡(luò)獲取單元120。包絡(luò)獲取單元120可從自變換器110提供的變換系數(shù)基于預(yù)定的子頻帶獲取包絡(luò)值。子頻帶是對音頻頻譜的采樣進行分組的單位,并可通過反映臨界頻帶具有均勻或不均勻的長度。當(dāng)子頻帶具有不均勻的長度時,子頻帶可被設(shè)置為使得針對一幀包括在每個子頻帶中的從開始采樣到最后采樣的采樣的數(shù)量漸漸增加。另外,當(dāng)支持多比特率時,可進行設(shè)置使得包括在不同比特率的相應(yīng)子頻帶的每個子頻帶中的采樣的數(shù)量相同??深A(yù)先確定包括在一個幀中的子頻帶的數(shù)量或包括在每個子頻帶中的采樣數(shù)量。包絡(luò)值可指示包括在每個子頻帶中的變換系數(shù)的平均幅度、平均能量、功率或范數(shù)(norm)值。每個子頻帶的包絡(luò)值可使用等式2來計算,但不限于此。在等式2中,w表示包括在子頻帶中的變換系數(shù)的數(shù)量(即,子頻帶大小),xi表示變換系數(shù),n表示子頻帶的包絡(luò)值。包絡(luò)量化器130可以以優(yōu)化的對數(shù)尺度對每個子頻帶的包絡(luò)值n進行量化。由包絡(luò)量化器獲得的每個子頻帶的包絡(luò)值n的量化索引nq可使用例如等式3來獲得。在等式3中,b表示取整系數(shù),在優(yōu)化之前的其初始值是r/2。另外,c表示對數(shù)尺度的底數(shù),r表示量化分辨率。根據(jù)實施例,包絡(luò)量化器130可可變地改變與每個量化索引相應(yīng)的量化區(qū)域的左邊界和右邊界,從而與每個量化索引相應(yīng)的量化區(qū)域中的總量化誤差被最小化。為此,取整系數(shù)b可被調(diào)整,使得在量化索引與和每個量化索引相應(yīng)的量化區(qū)域的左邊界和右邊界之間獲得的左量化誤差和右量化誤差彼此相同。以下,描述包絡(luò)量化器130的詳細(xì)操作??赏ㄟ^等式4執(zhí)行每個子頻帶的包絡(luò)值n的量化索引nq的反量化。在等式4中,表示每個子頻帶的反量化的包絡(luò)值,r表示量化分辨率,c表示對數(shù)尺度的底數(shù)。由包絡(luò)量化器130獲得的每個子頻帶的包絡(luò)值n的量化索引nq可被提供給包絡(luò)編碼器140,每個子頻帶的反量化的包絡(luò)值可被提供到頻譜歸一化器150。盡管未示出,但基于子頻帶獲得的包絡(luò)值可用于對歸一化的頻譜(即,歸一化的系數(shù))進行編碼所需的比特分配。在這種情況下,基于子頻帶量化和無損編碼的包絡(luò)值可包括在比特流中,并被提供給解碼設(shè)備。與使用基于子頻帶獲得的包絡(luò)值的比特分配關(guān)聯(lián)地,可應(yīng)用反量化的包絡(luò)值以在編碼設(shè)備和相應(yīng)的解碼設(shè)備中使用相同的處理。例如,當(dāng)包絡(luò)值是范數(shù)值時,可使用基于子頻帶的范數(shù)值計算掩蔽(masking)閾值,并可使用掩蔽閾值預(yù)測感知上所需的比特數(shù)量。也就是說,掩蔽閾值是與恰可察覺失真(JND)相應(yīng)的值,當(dāng)量化噪聲小于掩蔽閾值時,感知噪聲可能不被感測到。因此,可使用掩蔽閾值計算感測不到感知噪聲所需的比特的最小數(shù)量。例如,可使用范數(shù)值相對于基于子頻帶的掩蔽閾值的比例來計算信號掩蔽比(SMR),可使用對于SMR的6.025dB≒1比特的關(guān)系預(yù)測滿足掩蔽閾值的比特數(shù)量。盡管預(yù)測的比特數(shù)量是感測不到感知噪聲的所需的比特的最小數(shù)量,但在壓縮方面不需要使用多于預(yù)測的比特數(shù)量的比特,所以預(yù)測的比特的數(shù)量可被認(rèn)為是基于子頻帶允許的最大數(shù)量的比特(在下文中,被稱為可允許的比特數(shù)量)??梢砸孕?shù)點單位表示每個子頻帶的可允許的比特數(shù)量,但不限于此。另外,可使用以小數(shù)點為單位的范數(shù)值來執(zhí)行基于子頻帶的比特分配,但不限于此。從具有較大范數(shù)值的子頻帶順序地分配比特,可調(diào)整分配的比特,從而通過基于每個子頻帶的感知上的重要性對每個子頻帶的范數(shù)值進行加權(quán)來將更多的比特分配到感知上更重要的子頻帶??赏ㄟ^例如在ITU-TG.719中定義的心理聲學(xué)加權(quán)(psycho-acousticweighting)來確定感知上的重要性。包絡(luò)編碼器140可獲得用于從包絡(luò)量化器130提供的每個子頻帶的包絡(luò)值n的量化索引nq的量化差值,可基于用于量化差值的上下文執(zhí)行無損編碼,可將無損編碼結(jié)果包括在比特流中,并可發(fā)送和存儲比特流。先前子頻帶的量化差值可用作上下文。以下描述包絡(luò)編碼器140的詳細(xì)操作。頻譜歸一化器150通過使用每個子頻帶的反量化包絡(luò)值將變換系數(shù)歸一化為從而使頻譜平均能量為1。頻譜編碼器160可執(zhí)行歸一化的變化系數(shù)的量化和無損編碼,可將量化和無損編碼結(jié)果包括在比特流中,并可發(fā)送和存儲比特流。這里,頻譜編碼器160可通過使用根據(jù)基于子頻帶的包絡(luò)值最終確定的可允許的比特數(shù)量,來執(zhí)行歸一化的變換系數(shù)的量化和無損編碼。歸一化的變換系數(shù)的無損編碼可使用例如階乘脈沖編碼(FPC)。FPC是通過使用單位幅度脈沖來有效地對信息信號進行編碼的方法。根據(jù)FPC,可使用四個分量(即,非零脈沖位置的數(shù)量、非零脈沖的位置、非零脈沖的幅度和非零脈沖的符號)來表示信息內(nèi)容。詳細(xì)地,F(xiàn)PC可基于均方誤差(MSE)范數(shù)確定的最優(yōu)解,其中,在MSE中在滿足(m表示單位幅度脈沖的總數(shù)量)的同時使子頻帶的原始矢量y和FPC矢量之間的差最小??赏ㄟ^使用如等式5中的拉格朗日函數(shù)找到條件極值來獲得最優(yōu)解。在等式5中,L表示拉格朗日函數(shù),m表示子頻帶中的單位幅度脈沖的總數(shù)量,λ表示作為拉格朗日乘子(即,優(yōu)化系數(shù))的用于尋找給定函數(shù)的最小值的控制參數(shù),yi表示歸一化的變換系數(shù),表示在位置i處所需的脈沖的最優(yōu)數(shù)量。當(dāng)無損編碼使用FPC被執(zhí)行時,基于子頻帶獲得的總集的可被包括在比特流中并被發(fā)送。另外,還可將最優(yōu)乘子包括在比特流中并進行發(fā)送,其中,最優(yōu)乘子用于使每個子頻帶中的量化誤差最小化并執(zhí)行平均能量的對齊(alignment)??赏ㄟ^等式6獲得最優(yōu)乘子。在等式6中,D表示量化誤差,G表示最優(yōu)乘子。圖2是根據(jù)示例性實施例的數(shù)字信號解碼設(shè)備200的框圖。圖2中示出的數(shù)字信號解碼設(shè)備可包括包絡(luò)解碼器210、包絡(luò)反量化器220、頻譜解碼器230、頻譜反歸一化器240和反變換器250。數(shù)字信號解碼設(shè)備200的組件可集成到至少一個模塊中并由至少一個處理器實現(xiàn)。這里,數(shù)字信號可指示媒體信號,諸如,視頻、圖像、音頻或語音、或指示通過對音頻和語音進行合成而獲得的信號的聲音,但在下文中,數(shù)字信號通常指示音頻信號以與圖1的編碼設(shè)備相應(yīng)。參照圖2,包絡(luò)解碼器210可經(jīng)由通信信道或網(wǎng)絡(luò)接收比特流,對包括在比特流中的每個子頻帶的量化差值進行無損解碼,并重構(gòu)每個子頻帶的包絡(luò)值的量化索引nq。包絡(luò)反量化器220可通過對每個子頻帶的包絡(luò)值的量化索引nq進行反量化來獲得反量化的包絡(luò)值頻譜解碼器230可通過對接收的比特流進行無損解碼和反量化來重構(gòu)歸一化的變換系數(shù)。例如,當(dāng)編碼設(shè)備已使用FPC時,包絡(luò)反量化器可對關(guān)于每個子頻帶的總集的進行無損解碼和反量化??砂凑盏仁?使用最優(yōu)乘子G來執(zhí)行每個子頻帶的平均能量對齊。如同在圖1的頻譜編碼器160中,頻譜解碼器230可通過使用基于根據(jù)子頻帶的包絡(luò)值最終確定的可允許的比特數(shù)量來執(zhí)行無損解碼和反量化。頻譜反歸一化器240可通過使用從包絡(luò)反量化器220提供的反量化的包絡(luò)值,對從包絡(luò)解碼器210提供的歸一化的變換系數(shù)進行反量化。例如,當(dāng)編碼設(shè)備已使用FPC時,按照使用反量化的包絡(luò)值將執(zhí)行了能量對齊的反歸一化。通過執(zhí)行反歸一化,重構(gòu)每個子頻帶的原始頻譜平均能量。反變換器250通過對從頻譜反歸一化器240提供的變換系數(shù)進行反變換來重構(gòu)時域的音頻信號。例如,可通過使用與等式1相應(yīng)的等式8來對頻譜分量進行反變換來獲得時域的音頻信號sj。在下文中,將更詳細(xì)地描述圖1的包絡(luò)量化器130的操作。當(dāng)包絡(luò)量化器130以底數(shù)為c的對數(shù)尺度對每個子頻帶的包絡(luò)值進行量化時,與量化索引相應(yīng)的量化區(qū)域的邊界Bi可由表示,近似點(即,量化索引)Ai可由表示,量化分辨率r可由r=Si-Si-1表示,量化步長可由20lgAi-20lgAi-1=20rlgc表示??赏ㄟ^等式3獲得每個子頻帶的包絡(luò)值n的量化索引nq。在非優(yōu)化的線性尺度的情況下,與量化索引nq相應(yīng)的量化區(qū)域的左邊界和右邊界從近似點遠(yuǎn)離不同的距離。由于該差異,如圖3A和圖4A所示,用于量化的信噪比(SNR)測量(即,量化誤差)從近似點對于左邊界和右邊界具有不同的值。圖3A示出非優(yōu)化的對數(shù)尺度(底數(shù)為2)的量化,其中,量化分辨率為0.5和量化步長為3.01。如圖3A所示,量化區(qū)域中的在左邊界處和右邊界處距離近似點的量化誤差SNRL和SNRR分別是14.46dB和15.96dB。圖4A示出非優(yōu)化的對數(shù)尺度的量化(底數(shù)是2),其中,量化分辨率是1并且量化步長是6.02dB。如圖4A所示,在量化區(qū)域中在左邊界處和右邊界處距離近似點的量化誤差SNRL和SNRR分別是7.65dB和10.66dB。根據(jù)實施例,通過可變地改變與量化索引相應(yīng)的量化區(qū)域的邊界,與每個量化索引相應(yīng)的量化區(qū)域中的總量化誤差可被最小化。當(dāng)在量化區(qū)域中的左邊界處和右邊界處獲得的距離近似點的量化誤差相同時,量化區(qū)域中的總量化誤差可被最小化??赏ㄟ^可變地改變?nèi)≌禂?shù)b來獲得量化區(qū)域的邊界位移??赏ㄟ^等式9來表示在與量化索引i相應(yīng)的量化區(qū)域中的左邊界處和右邊界處獲得的距離近似點的量化誤差SNRL和SNRR。在等式9中,c表示對數(shù)尺度的底數(shù),Si表示與量化索引i相應(yīng)的量化區(qū)域中的邊界的指數(shù)。可使用由等式10定義的參數(shù)bL和bR來表示與量化索引相應(yīng)的量化區(qū)域中的左邊界和右邊界的指數(shù)位移。bL=Si-(Si+Si-1)/2bR=(Si+Si+1)/2-Si(10)在等式10中,Si表示與量化索引i相應(yīng)的量化區(qū)域中的邊界處的指數(shù),bL和bR表示量化區(qū)域中的左邊界和右邊界距離近似點的指數(shù)位移。量化區(qū)域中的左邊界處和右邊界處的距離近似點的指數(shù)位移之和與量化分辨率相同,因此,可通過等式11來表示。bL+bR=r(11)基于量化的一般特性,取整系數(shù)與和量化索引相應(yīng)的量化區(qū)域中的左邊界處的距離近似點的指數(shù)位移相同。因此,等式9可由等式12表示。通過使在與量化索引相應(yīng)的量化區(qū)域中的左邊界處和右邊界處的距離近似點的量化誤差SNRL和SNRR相同,參數(shù)bL可通過等式13來確定。因此,可通過等式14表示取整系數(shù)bL。bL=1-logc(1+c-r)(14)圖3B示出優(yōu)化的對數(shù)尺度(底數(shù)為2)的量化,其中,量化分辨率為0.5并且量化步長為3.01。如圖3B所示,量化區(qū)域中的左邊界處和右邊界處的距離近似點的量化誤差SNRL和SNRR兩者都是15.31dB。圖4B示出優(yōu)化的對數(shù)尺度(底數(shù)為2)的量化,其中,量化分辨率為1并且量化步長為6.02。如圖4B所示,量化區(qū)域中的左邊界處和右邊界處的距離近似點的量化誤差SNRL和SNRR兩者都是9.54dB。取整系數(shù)b=bL確定從與量化索引i相應(yīng)的量化區(qū)域中的左邊界和右邊界中的每個到近似點的指數(shù)距離。因此,可通過等式15執(zhí)行根據(jù)實施例的量化。在圖5A和圖5B中示出通過以底數(shù)為2的對數(shù)尺度執(zhí)行量化而獲得的測試結(jié)果。根據(jù)信息論,比特率失真函數(shù)H(D)可用作參考,其中,通過所述參考可比較和分析各種量化方法。量化索引集合的熵可看作比特率并具有維數(shù)b/s,dB尺度的SNR可看作失真測量。圖5A是在正態(tài)分布下執(zhí)行的量化的比較曲線圖。在圖5A中,實線指示非優(yōu)化的對數(shù)尺度的量化的比特率失真函數(shù),點劃線指示優(yōu)化的對數(shù)尺度的量化的比特率失真函數(shù)。圖5B是在均勻分布下執(zhí)行的量化的比較曲線圖。在圖5B中,實線指示非優(yōu)化的對數(shù)尺度的量化的比特率失真函數(shù),點劃線指示優(yōu)化的對數(shù)尺度的量化的比特率失真函數(shù)。根據(jù)相應(yīng)的分布規(guī)律、零期望值和單個方差使用隨機數(shù)量的傳感器產(chǎn)生正態(tài)分布和均勻分布的采樣??舍槍Ω鞣N量化分辨率計算比特率失真函數(shù)H(D)。如圖5A和圖5B所示,點劃線位于實線下面,這表示優(yōu)化的對數(shù)尺度的量化的性能優(yōu)于非優(yōu)化的對數(shù)尺度的量化的性能。也就是說,根據(jù)優(yōu)化的對數(shù)尺度的量化,可以以相同的比特率使用較少的量化誤差執(zhí)行量化,或以相同的比特率按照相同的量化誤差,使用較少的比特執(zhí)行量化。表1和表2中示出測試結(jié)果,其中,表1示出非優(yōu)化的對數(shù)尺度的量化,表2示出優(yōu)化的對數(shù)尺度的量化。表1表2根據(jù)表1和表2,在量化分辨率0.5特性值SNR提高0.1dB,在量化分辨率1.0特性值SNR提高0.45dB,在量化分辨率2.0特性值SNR提高1.5dB。由于根據(jù)實施例的量化方法僅更新基于取整系數(shù)的量化索引的搜索表,因此復(fù)雜度不增加?,F(xiàn)將更詳細(xì)地描述圖1的包絡(luò)解碼器140的操作。使用差值編碼(deltacoding)執(zhí)行包絡(luò)值的基于上下文的編碼。可通過等式16表示當(dāng)前子頻帶和先前子頻帶的包絡(luò)值之間的量化差值。d(i)=nq(i+1)-nq(i)(16)在等式16中,d(i)表示子頻帶(i+1)的量化差值,nq(i)表示子頻帶(i)的包絡(luò)值的量化索引,nq(i+1)表示子頻帶(i+1)的包絡(luò)值的量化索引。每個子頻帶的量化差值d(i)限制在[-15,16]的范圍內(nèi),如下所述,首先調(diào)整負(fù)量化差值,隨后調(diào)整正量化差值。首先,通過使用等式16以從高頻子頻帶到低頻子頻帶的順序獲得量化差值d(i)。在這種情況下,如果d(i)<-15,則通過nq(i)=nq(i+1)+15(i=42,…,0)來執(zhí)行調(diào)整。接下來,通過使用等式16以從低頻子頻帶到高頻子頻帶的順序獲得量化差值d(i)。在這種情況下,如果d(i)>16,則通過d(i)=16,nq(i+1)=nq(i)+16(i=0,…,42)來執(zhí)行調(diào)整。最后,通過將偏移15添加到所有獲得的量化差值d(i)來產(chǎn)生范圍為[0,31]的量化差值。根據(jù)等式16,當(dāng)N個子頻帶存在于單個幀中時,獲得nq(0),d(0),d(1),d(2),...,d(N-2)。使用上下文模型對當(dāng)前子頻帶的量化差值進行編碼,根據(jù)實施例,可將先前子頻帶的量化差值用作上下文。由于第一子頻帶的nq(0)存在于[0,31]的范圍內(nèi),因此可通過使用5比特按照其原樣對量化差值nq(0)進行無損編碼。當(dāng)?shù)谝蛔宇l帶的nq(0)用作d(0)的上下文時,通過使用預(yù)定參考值從nq(0)獲得的值可被使用。也就是說,當(dāng)d(i)的霍夫曼編碼被執(zhí)行時,d(i-1)可用作上下文,當(dāng)d(0)的霍夫曼編碼被執(zhí)行時,通過從nq(0)減去預(yù)定參考值而獲得的值可用作上下文。預(yù)定參考值可以是例如通過仿真或?qū)嶒烆A(yù)先設(shè)置為最優(yōu)值的預(yù)定常數(shù)值。參考值可被包括在比特流中并被發(fā)送,或在編碼設(shè)備或解碼設(shè)備中預(yù)先被提供。根據(jù)實施例,包絡(luò)編碼器140可將用作上下文的先前子頻帶的量化差值的范圍劃分為多個組,并基于針對所述多個組預(yù)定義的霍夫曼表對當(dāng)前子頻帶的量化差值執(zhí)行霍夫曼編碼??衫缤ㄟ^使用大數(shù)據(jù)庫的訓(xùn)練處理產(chǎn)生霍夫曼表。也就是說,基于預(yù)定范數(shù)收集數(shù)據(jù),并基于收集的數(shù)據(jù)產(chǎn)生霍夫曼表。根據(jù)實施例,在先前子頻帶的量化差值的范圍內(nèi)收集當(dāng)前子頻帶的量化差值的頻率的數(shù)據(jù),并且可針對所述多個組產(chǎn)生霍夫曼表??墒褂卯?dāng)前子頻帶的量化差值的概率分布的分析結(jié)果選擇各種分布模型,并因此可執(zhí)行對具有類似分布模型的量化級別的分組,其中,通過將先前子頻帶的量化差值用作上下文來獲得所述分析結(jié)果。在表3中示出三個組的參數(shù)。表3圖6中示出了三個組的概率分布。組#1的概率分布于組#3的概率分布類似,它們基于x軸基本被反轉(zhuǎn)(reverse)(或翻轉(zhuǎn)(flip))。這表示在沒有任何編碼效率的損失的情況下,相同的概率模型可用于兩個組#1和#3。也就是說,兩個組#1和#3可使用相同的霍夫曼表。因此,可使用關(guān)于組#2的第一霍夫曼表和由組#1和#3共享的第二霍夫曼表。在這種情況下,組#1中的代碼的索引可相對于組#3相反地表示。也就是說,當(dāng)由于作為上下文的先前子頻帶的量化差值而將當(dāng)前子頻帶的量化差值d(i)的霍夫曼表確定為組#1時,可通過對編碼端的處理的反向處理來將當(dāng)前子頻帶的量化差值d(i)改變?yōu)閐’(i)=A-d(i),從而通過參考關(guān)于組#3的霍夫曼表來執(zhí)行霍夫曼解碼。在解碼端,通過參考關(guān)于組#3的霍夫曼表來執(zhí)行霍夫曼解碼,并且通過d(i)=A-d’(i)的轉(zhuǎn)換處理來從d’(i)提取最終值d(i)。這里,值A(chǔ)可被設(shè)置為使得組#1和#3的概率分布彼此對稱??深A(yù)先將值A(chǔ)設(shè)置為最優(yōu)值而不是在編碼和解碼處理中提取??蛇x擇地,可使用關(guān)于組#1的霍夫曼表而不是關(guān)于組#3的霍夫曼表,并可改變組#3中的量化差值。根據(jù)實施例,當(dāng)d(i)具有范圍在[0,31]中的值時,值A(chǔ)可以是31。圖7是示出根據(jù)示例性實施例的圖1的數(shù)字信號處理設(shè)備100的包絡(luò)編碼器140中的基于上下文的霍夫曼編碼處理的流程圖。在圖7中,使用根據(jù)三個組中的量化差值的概率分布確定的兩個霍夫曼表。另外,當(dāng)對當(dāng)前子頻帶的量化差值d(i)執(zhí)行霍夫曼編碼時,先前子頻帶的量化差值d(i-1)用作上下文,例如,使用關(guān)于組#2的第一霍夫曼表和關(guān)于組#3的第二霍夫曼表。參照圖7,在操作710,確定先前子頻帶的量化差值d(i-1)是否屬于組#2。如果在操作710確定先前子頻帶的量化差值d(i-1)屬于組#2,則在操作720,從第一霍夫曼表選擇當(dāng)前子頻帶的量化差值d(i)的代碼。如果在操作710另外確定先前子頻帶的量化差值d(i-1)不屬于組#2,則在操作730,確定先前子頻帶的量化差值d(i-1)是否屬于組#1。如果在操作730確定先前子頻帶的量化差值d(i-1)不屬于組#1,即,如果先前子頻帶的量化差值d(i-1)屬于組#3,則在操作740,從第二霍夫曼表選擇當(dāng)前子頻帶的量化差值d(i)的代碼。如果在操作730另外地確定先前子頻帶的量化差值d(i-1)屬于組#1,則在操作750,對當(dāng)前子頻帶的量化差值d(i)進行反轉(zhuǎn)并且從第二霍夫曼表選擇當(dāng)前子頻帶的反轉(zhuǎn)的量化差值d’(i)的代碼。在操作760,使用在操作720、740或750選擇的代碼執(zhí)行當(dāng)前子頻帶的量化差值d(i)的霍夫曼編碼。圖8是示出根據(jù)示例性實施例的圖2的數(shù)字信號解碼設(shè)備200的包絡(luò)解碼器210中的基于上下文的霍夫曼解碼處理的流程圖。如在圖7中,在圖8中,使用根據(jù)在三個組中的量化差值的概率分布確定的兩個霍夫曼表。另外,當(dāng)對當(dāng)前子頻帶的量化差值d(i)執(zhí)行霍夫曼編碼時,先前子頻帶的量化差值d(i-1)用作上下文,例如,使用關(guān)于組#2的第一霍夫曼表和關(guān)于組#3的第二霍夫曼表。參照圖8,在操作810,確定先前子頻帶的量化差值d(i-1)是否屬于組#2。如果在操作810確定先前子頻帶的量化差值d(i-1)屬于組#2,則在操作820,從第一霍夫曼表選擇當(dāng)前子頻帶的量化差值d(i)的代碼。如果在操作810另外地確定先前子頻帶的量化差值d(i-1)不屬于組#2,則在操作830,確定先前子頻帶的量化差值d(i-1)是否屬于組#1。如果在操作830確定先前子頻帶的量化差值d(i-1)不屬于組#1,即,如果先前子頻帶的量化差值d(i-1)屬于組#3,則在操作840,從第二霍夫曼表選擇當(dāng)前子頻帶的量化差值d(i)的代碼。如果在操作830另外地確定先前子頻帶的量化差值d(i-1)屬于組#1,則在操作850,對當(dāng)前子頻帶的量化差值d(i)進行反轉(zhuǎn),并且從第二霍夫曼表選擇當(dāng)前子頻帶的反轉(zhuǎn)的量化差值d’(i)的代碼。在操作860,使用在操作820、840或850選擇的代碼執(zhí)行當(dāng)前子頻帶的量化差值d(i)的霍夫曼解碼。在表4中示出了按照幀的比特代價差分析。如在表4中所示,根據(jù)圖7的實施例的編碼效率較原始霍夫曼編碼算法平均增加9%。表4算法比特率,kbps增益,%霍夫曼編碼6.25-上下文+霍夫曼編碼5.79圖9是根據(jù)示例性實施例的包括編碼模塊930的多媒體裝置900的框圖。圖9的多媒體裝置900可包括通信單元910和編碼模塊930。另外,根據(jù)被獲得作為編碼結(jié)果的音頻比特流的用途,圖9的多媒體裝置900還可包括存儲單元950以存儲音頻比特流。另外,圖9的多媒體裝置900還可包括麥克風(fēng)970。也就是說,存儲單元950和麥克風(fēng)970是可選的。圖9的多媒體裝置900還可包括解碼模塊(未示出),例如,用于執(zhí)行一般解碼功能的解碼模塊或根據(jù)示例性實施例的解碼模塊。編碼模塊930可與包括在多媒體裝置900中的其他組件(未示出)集成并由至少一個處理器實現(xiàn)。參照圖9,通信單元910可接收從外部提供的音頻信號和編碼的比特流中的至少一個,或可發(fā)送作為編碼模塊930的編碼的結(jié)果而獲得的重構(gòu)的音頻信號和音頻比特流的中的至少一個。通信單元910被配置為通過如下的無線網(wǎng)絡(luò)將數(shù)據(jù)發(fā)送到外部多媒體裝置并從外部多媒體裝置接收數(shù)據(jù):諸如,無線互聯(lián)網(wǎng)、無線內(nèi)聯(lián)網(wǎng)、無線電話網(wǎng)、無線局域網(wǎng)(LAN)、Wi-Fi、Wi-Fi直連(WFD)、第三代(3G)、第四代(4G)、藍牙、紅外數(shù)據(jù)協(xié)會(IrDA)、射頻識別(RFID)、超寬帶(UWB)、Zigbee或近場通信(NFC)或有線網(wǎng)絡(luò)(諸如,有線電話網(wǎng)絡(luò)或有線互聯(lián)網(wǎng))。根據(jù)實施例,編碼模塊930可通過以下操作來產(chǎn)生比特流:將通過通信單元910或麥克風(fēng)970提供的時域的音頻信號變換到頻譜的音頻頻譜,基于關(guān)于音頻頻譜的預(yù)定的子頻帶獲取包絡(luò),基于預(yù)定的子頻帶對包絡(luò)進行量化,獲得相鄰的子頻帶的量化的包絡(luò)之間的差,并通過將先前子頻帶的差值用作上下文來對當(dāng)前子頻帶的差值進行無損編碼。根據(jù)另一實施例,當(dāng)包絡(luò)被量化時,編碼模塊930可對與預(yù)定的量化索引相應(yīng)的量化區(qū)域的邊界進行調(diào)整,使得量化區(qū)域中的總量化誤差被最小化并可使用通過調(diào)整更新的量化表來執(zhí)行量化。存儲單元950可存儲由編碼模塊930產(chǎn)生的編碼的比特流。另外,存儲單元950可存儲操作多媒體裝置900所需的各種程序。麥克風(fēng)970可將來自用戶或外部的音頻信號提供給編碼模塊930。圖10是根據(jù)示例性實施例的包括解碼模塊1030的多媒體裝置1000的框圖。圖10的多媒體裝置1000可包括通信模塊1010和解碼模塊1030。另外,根據(jù)作為解碼結(jié)果而獲得的重構(gòu)的音頻信號的用途,圖10的多媒體裝置1000還可包括存儲單元1050以存儲重構(gòu)的音頻信號。另外,圖10的多媒體裝置1000還可包括揚聲器1070。也就是說,存儲單元1050和揚聲器1070是可選的。圖10的多媒體裝置1000還可包括編碼模塊(未示出),例如,用于執(zhí)行一般編碼功能的編碼模塊或根據(jù)示例性實施例的編碼模塊。解碼模塊1030可與包括在多媒體裝置1000中的其他組件(未示出)集成并由至少一個處理來實現(xiàn)。參照圖10,通信單元1010可接收從外部提供的音頻信號和編碼的比特流中的至少一個,或可發(fā)送作為解碼模塊1030的解碼的結(jié)果而獲得的重構(gòu)的音頻信號以及作為編碼的結(jié)果而獲得的音頻比特流中的至少一個。通信單元1010可被實現(xiàn)為基本與圖9的通信單元910相同。根據(jù)實施例,解碼模塊1030可通過以下操作執(zhí)行反量化:接收通過通信單元1010提供的比特流,通過將先前子頻帶的差值用作上下文來對當(dāng)前子頻帶的差值進行無損解碼,從作為無損解碼的結(jié)果而重構(gòu)的當(dāng)前子頻帶的差值基于子頻帶獲得量化的包絡(luò)。存儲單元1050可存儲由解碼模塊1030產(chǎn)生的重構(gòu)的音頻信號。另外,存儲單元1050可存儲操作多媒體裝置1000所需的各種程序。揚聲器1070可將由解碼模塊1030產(chǎn)生的重構(gòu)的音頻信號輸出到外部。圖11是根據(jù)示例性實施例的包括編碼模塊1120和解碼模塊1130的多媒體裝置1100的框圖。圖11的多媒體裝置1100可包括通信單元1110、編碼模塊1120和解碼模塊1130。另外,根據(jù)作為編碼結(jié)果而獲得的音頻比特流或作為解碼結(jié)果而獲得的重構(gòu)的音頻信號的用途,圖11的多媒體裝置1100還可包括存儲單元1140,用于存儲音頻比特流或重構(gòu)音頻信號。另外,圖11的多媒體裝置1110還可包括麥克風(fēng)1150或揚聲器1160。編碼模塊1120和解碼模塊1130可與包括在多媒體裝置110中的其他組件(未示出)集成,并由至少一個處理器來實現(xiàn)。由于圖11的多媒體裝置1100中的組件與圖9的多媒體裝置900中的組件或圖10的多媒體裝置1000中的組件相同,因此省略其詳細(xì)描述。圖9、圖10或圖11的多媒體裝置900、1000或1100可包括:包括電話或移動電話的僅語音通信的終端、包括TV或MP3播放器的僅廣播或音樂的裝置或僅語音通信終端和僅廣播或音樂的裝置的混合型終端裝置,但不限于此。另外,圖9、圖10或圖11的多媒體裝置900、1000或1100可用作客戶機、服務(wù)器或布置在客戶機或服務(wù)器之間的變換器。例如,如果多媒體裝置900、1000或1100是移動電話,則盡管未示出,但移動電話還可包括諸如鍵區(qū)的用戶輸入單元、用戶界面或用于顯示由移動電話處理的信息的顯示單元和用于控制移動電話的一般功能的處理器。另外,移動電話還可包括具有圖像拾取功能的相機單元和用于執(zhí)行移動電話所需的功能的至少一個組件。作為另一示例,如果多媒體裝置900、1000或1100是TV,則盡管未示出,但TV還可包括諸如鍵區(qū)的用戶輸入單元、用于顯示接收的廣播信息的顯示單元和用于控制TV的一般功能的處理器。另外,TV還可包括用于執(zhí)行TV所需的功能的至少一個組件。根據(jù)示例性實施例的方法可被編寫為計算機可執(zhí)行程序,并可被實現(xiàn)在通用數(shù)字計算機中,其中,通用數(shù)字計算機通過使用非暫時性計算機可讀記錄介質(zhì)執(zhí)行程序。另外,可在實施例中使用的數(shù)據(jù)結(jié)構(gòu)、程序指令或數(shù)據(jù)文件可以以各種方式記錄在計算機可讀記錄介質(zhì)中。非暫時性計算機可讀記錄介質(zhì)是可存儲隨后可由計算機系統(tǒng)讀取的數(shù)據(jù)的任何數(shù)據(jù)存儲裝置。非暫時性計算機可讀記錄介質(zhì)的示例包括:磁存儲介質(zhì)(諸如,硬盤、軟盤和磁帶)、光學(xué)記錄介質(zhì)(諸如,CD-ROM、DVD)、磁光介質(zhì)(諸如,光盤)和專門被配置為存儲和執(zhí)行程序指令的硬件裝置(諸如,ROM、RAM和閃存)。另外,非暫時性計算機可讀記錄介質(zhì)可以是用于傳輸指定程序指令、數(shù)據(jù)結(jié)構(gòu)等的信號的傳輸介質(zhì)。程序指令的示例可不僅包括由編譯器創(chuàng)建的機器語言代碼,還包括由計算機使用解釋器等可執(zhí)行的高級語言代碼。雖然以上已具體地示出和描述了示例性實施例,但本領(lǐng)域的普通技術(shù)人員將理解,在不脫離由權(quán)利要求限定的本發(fā)明構(gòu)思的精神和范圍的情況下,可在形式和細(xì)節(jié)上進行各種改變。示例性實施例應(yīng)被理解為描述性意義,而不是限制的目的。因此,本發(fā)明構(gòu)思的范圍不由示例性實施例的詳細(xì)描述而由權(quán)利要求限定,在范圍內(nèi)的所有不同將被解釋為包括在本發(fā)明構(gòu)思中。當(dāng)前第1頁1 2 3 
當(dāng)前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
鱼台县| 上林县| 内乡县| 连南| 五莲县| 张家港市| 日照市| 潮安县| 密山市| 土默特右旗| 大理市| 鄂托克前旗| 朝阳区| 库车县| 田林县| 方城县| 淮北市| 乌兰浩特市| 丰台区| 栖霞市| 新龙县| 翁牛特旗| 宁武县| 安阳市| 平乐县| 湄潭县| 岫岩| 司法| 府谷县| 洞口县| 启东市| 浦东新区| 修水县| 准格尔旗| 阳山县| 喜德县| 浦江县| 闽清县| 五大连池市| 偃师市| 淳安县|