基于時域混疊消除的無線音頻壓縮、解壓縮方法及其設(shè)備的制作方法

文檔序號：2825966閱讀：449來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

基于時域混疊消除的無線音頻壓縮、解壓縮方法及其設(shè)備的制作方法
【專利摘要】基于時域混疊消除的無線音頻壓縮、解壓縮方法，包括：音頻壓縮和音頻解壓，前者包括對輸入的音頻PCM數(shù)據(jù)加窗濾波、MDCT變換、量化因子計算、聲學(xué)掩蔽曲線計算、比特分配、量化計算、生成比特流；后者包括解析碼流、解析量化因子、升學(xué)掩蔽曲線計算、比特分配、反量化、IMDCT、凱塞窗濾波、時域混疊。還包括執(zhí)行上述方法的音頻編碼器和音頻解碼器。
【專利說明】基于時域混疊消除的無線音頻壓縮、解壓縮方法及其設(shè)備
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種面向無線應(yīng)用的音頻壓縮、解壓縮方法及相應(yīng)的音頻編碼器和解碼器。
【背景技術(shù)】
[0002]基于嵌入式技術(shù)的無線數(shù)字音頻系統(tǒng)有效地將嵌入式技術(shù)、音頻編解碼技術(shù)、無線傳輸技術(shù)結(jié)合在一起，和基于PC的數(shù)字音頻系統(tǒng)相比，基于嵌入式技術(shù)的無線數(shù)字音頻設(shè)備具有體積小，攜帯方便，功能專業(yè)化高，成本較低，穩(wěn)定性高，實時性好等特點。雖然無線音頻傳輸與有線音頻傳輸相比，具有使用靈活方便的特點，但是會受到帶寬、延遲和功耗等方面的限制。而目前藍牙SBC無線音頻系統(tǒng)的成本相對較高，且音質(zhì)較低。因此，針對無線傳輸設(shè)計ー款在低碼率、低延遲和低計算復(fù)雜度的情況下實現(xiàn)較高音質(zhì)的音頻編解碼算并將之應(yīng)用在基于嵌入式技術(shù)的無線音頻系統(tǒng)中是十分有意義的。
[0003]目前公知的高音質(zhì)音頻編碼器按照編碼方式可以分為兩類。第一類是有損音頻編碼器，該類型編碼器通過分析音頻數(shù)據(jù)頻域上的相關(guān)性對音頻數(shù)據(jù)進行壓縮，第二類是無損音頻編碼器，該類型編碼器通過分析音頻數(shù)據(jù)時域上的相關(guān)性對音頻數(shù)據(jù)進行壓縮。
[0004]第一類編碼器采用變換域結(jié)合心理聲學(xué)模型的壓縮方法或者時域預(yù)測結(jié)合自適應(yīng)量化器的壓縮方法對音頻數(shù)據(jù)進行壓縮，變換域方法是將時域信號轉(zhuǎn)換成頻域，而后通過心理聲學(xué)模型分析該音頻信號的頻域分量特性，最終通過量化器控制各頻域分量的量化精度。由于有心理聲學(xué)模型的分析，變換域方法可以在保證人耳主觀感受的情況下最大限度地壓縮音頻數(shù)據(jù)流，所以變換域方法的特點就是高延遲、高復(fù)雜度、高音質(zhì)和低碼流。主流的變換域方法有，余弦調(diào)制濾波器組實現(xiàn)的子帶編碼，如MP1、MP2和MP3 ;改進型離散余弦變換(MDCT)實現(xiàn)的時域混疊消除編碼(TDAC)，如dolby AC3，而AAC用的則是上述兩種變換域方法的結(jié)合。時域預(yù)測方法是通過消除音頻信號的時域相關(guān)性來進行壓縮，通過計算音頻數(shù)據(jù)和預(yù)測值的差值，并設(shè)定自適應(yīng)量化器的量化級、更新下一數(shù)據(jù)的預(yù)測值。并傳輸當前數(shù)據(jù)和預(yù)測值的差值。由于采用殘差的傳輸方式和自適應(yīng)的量化器，時域預(yù)測方法在保證一定壓縮比的情況下很難將提高主觀音質(zhì)水平，所以時域預(yù)測方法的特點是低延遲、低運算量、低音質(zhì)和中等的壓縮比。常見的時域預(yù)測方法有ADPCM等。
[0005]第二類編碼器采用時域預(yù)測結(jié)合熵編碼的方法對音頻數(shù)據(jù)進行壓縮，主要特點是高延遲、無損音質(zhì)、低運算量和低壓縮比。無損編碼通過時域測試等方式分析時域信號的相關(guān)性和數(shù)據(jù)的冗余性，通過熵編碼來壓縮時域數(shù)據(jù)的冗余。這種方式最大的特點就是音頻數(shù)據(jù)的無損壓縮，能完美的重現(xiàn)壓縮前的音頻數(shù)據(jù)，但是由于時域數(shù)據(jù)的冗余度分析需要大段時域數(shù)據(jù)且冗余度會根據(jù)數(shù)據(jù)的變化而改變，因而無損壓縮方法的幀長較長，且壓縮后的數(shù)據(jù)量會隨音頻數(shù)據(jù)的變化而變化。常見的無損壓縮方法有WAVPACK、FLAC等。
[0006]由于基于無線音頻傳輸?shù)囊纛l碼流需要的高音質(zhì)、低延遲、高壓縮比且碼流在可控的情況下是固定的，所以純軟件運算的第一類編碼器中的變換域編碼因為其高延遲和高運算量無法達到無線傳輸?shù)囊?，而時域預(yù)測編碼又因其壓縮比和低音質(zhì)而同樣無法滿足要求。無損算法雖然音質(zhì)堪稱完美，但因其低壓縮比和碼流不定限制了其在無線音頻方面的應(yīng)用。本發(fā)明在軟硬件結(jié)合運行的情況下，改進和實現(xiàn)了第一類編碼器，使之適合無線音頻應(yīng)用的需求。

【發(fā)明內(nèi)容】

[0007]為了克服已有音頻傳輸技術(shù)的無法同時有效滿足無線音頻傳輸?shù)母咭糍|(zhì)、低延遲、高壓縮比且碼流不可控的不足，本發(fā)明提供一種適應(yīng)無線音頻應(yīng)用的無線音頻壓縮、解壓縮方法及相應(yīng)的音頻編碼器音頻解碼器，可在保證音頻數(shù)據(jù)高音質(zhì)的情況下實現(xiàn)了高壓縮比、低延遲和中等的運算復(fù)雜度。
[0008]本發(fā)明解決其技術(shù)問題所采用的技術(shù)方案是:
[0009]1.基于時域混疊消除的無線音頻壓縮、解壓縮方法，包括以下步驟:
[0010]步驟1、無線音頻壓縮，具體包括:
[0011]1.1通過Kaiser窗濾波器對輸入的音頻PCM數(shù)據(jù)加窗；
[0012]1.2將獲得的經(jīng)過加窗濾波的音頻數(shù)據(jù)進行離散余弦變換，獲得變換頻域信號；
[0013]1.3計算變換后頻域信號的能量強度，獲得各量化比特數(shù)，通過歸類分析，將量化比特數(shù)寫入碼流；
[0014]1.4根據(jù)量化比特數(shù)計算頻域信號頻譜能量表(PSD)，根據(jù)能量表和基于心理聲學(xué)的頻域能量掩蔽閾值將頻域信號分為頻譜能量帶，計算得出各頻域信號的比特分配數(shù)；
[0015]1.5根據(jù)頻域信號的量化比特數(shù)和比特分配數(shù)，采用自適應(yīng)的量化仲裁算法選擇不同的量化器對頻域信號進行量化；
[0016]步驟2.無線音頻解壓縮,具體包括:
[0017]2.1從輸入的編碼后碼流中尋找同步字，而后解析出聲道數(shù)據(jù)和碼率參數(shù)；
[0018]2.2從碼流中解析量化因子。
[0019]2.3根據(jù)量化因子和碼率信息，計算心理聲學(xué)掩蔽曲線，根據(jù)曲線計算數(shù)據(jù)傳輸比特位；
[0020]2.4從碼流中解析出量化后數(shù)據(jù)，然后根據(jù)量化因子和比特分配數(shù)計算MDCT系數(shù)；
[0021]2.5對MDCT系數(shù)進行頂DCT運算，將MDCT系數(shù)轉(zhuǎn)換成時域音頻數(shù)據(jù)，基于頂DCT的運算特性，采用硬件音頻加速単元AUAC作為其實現(xiàn)平臺；
[0022]2.6對時域音頻數(shù)據(jù)加凱塞窗，并與前ー幀PCM數(shù)據(jù)做時域混疊處理，計算得出最終的PCM音頻數(shù)據(jù)；
[0023]2.7根據(jù)聲道數(shù)的配置，將PCM音頻數(shù)據(jù)轉(zhuǎn)換成PCM碼流。
[0024]進ー步，步驟1.2中采用硬件音頻加速模塊(AUAC)實現(xiàn)離散余弦變換(MDCT)，根據(jù)AUAC功能特性，將MDCT劃分為3個功能模塊:余弦加窗濾波模塊(用AUAC的MAC模塊實現(xiàn))，256點快速傅里葉變換模塊(用AUAC的FFT模塊實現(xiàn))和正弦窗濾波模塊(用AUAC的MAC模塊實現(xiàn))。
[0025]步驟1.3所述歸類分析方法是根據(jù)輸入的頻域信號的能量強度將量化因子分為D15、D25和D45等3類，分別以不同的方式寫入壓縮比特流。其中D15類每個量化因子單獨使用7比特進行傳輸比特；D25類的每2個量化因子共用ー個7比特作為傳輸比特；D45類的量化因子每4個量化因子共用ー個7比特作傳輸比持。
[0026]用于前述無線音頻壓縮、解壓縮方法的設(shè)備，包括音頻編碼器和音頻解碼器，其特征在于:
[0027]所述音頻編碼器包括:凱塞窗加窗濾波単元，用于對輸入的音頻數(shù)據(jù)加凱塞窗濾波；離散余弦變換單元，對凱塞窗加窗濾波單元的結(jié)果進行MDCT濾波，并將結(jié)果輸出給量化因子計算單元，該單元運算由AUAC實現(xiàn)，通過對AUAC編程，實現(xiàn)MDCT的硬件運算，將時域音頻數(shù)據(jù)轉(zhuǎn)換為頻域MDCT系數(shù)，MDCT濾波單元為128點MDCT變換，為時域到頻域的無損變換；量化因子計算單元，讀取MDCT濾波單元輸出的MDCT系數(shù)，并計算MDCT系數(shù)的能量強度，將能量強度歸類為3類量化因子，控制聲學(xué)掩蔽計算單元的計算和量化器組的計算，并寫入壓縮碼流；心理聲學(xué)掩蔽曲線計算単元，讀取頻域能量分析単元的結(jié)果，實時計算聲學(xué)掩蔽曲線，將掩蔽結(jié)果用于比特分配；比特分配単元，根據(jù)心理聲學(xué)単元的結(jié)果修改掩蔽閾值表，修改聲壓曲線，將MDCT系數(shù)劃分為N個頻帶分塊，并對個頻帶分塊計算其比特分配數(shù)，并將結(jié)果用于量化器単元；量化器組單元，根據(jù)頻域能量分析單元輸出的比特量化因子和比特分配單元輸出的比特分配數(shù)數(shù)對MDCT濾波單元的輸出的MDCT系數(shù)進行分組量化，得到量化后的數(shù)據(jù)；碼流生成単元，用于將幀頭，量化因子計算單元輸出的量化因子和量化器組輸出的量化后后頻帶數(shù)據(jù)打包生成碼流；
[0028]以及與所述的音頻編碼器配套的音頻解碼器，所述音頻解碼器包括:碼流解析單元，用于讀取同步字判斷幀頭，分析幀長，分析碼流邊信息；量化因子解析単元，在碼流解析単元解析完幀頭等頭信息之后，從碼流中解析量化因子，用于比特分配和反量化；聲學(xué)掩蔽曲線計算単元，根據(jù)量化因子単元計算的量化因子實時計算聲學(xué)掩蔽曲線，將掩蔽結(jié)果用于比特分配；比特分配単元，利用聲學(xué)掩蔽曲線計算単元的輸出和量化因子計算比特分配數(shù)據(jù)；反量化器組單元，用于根據(jù)量化因子計算單元輸出量化因子、比特分配単元計算的比特分配數(shù)和量化因子輸出的量化后數(shù)據(jù)進行反量化運算，計算IMDCT系數(shù)；反離散余弦變換單元，將反量化単元得到的頂DCT系數(shù)用于MDCT計算，將MDCT系數(shù)轉(zhuǎn)換為時域數(shù)據(jù)；凱塞窗濾波器，對頂DCT單元計算出的時域數(shù)據(jù)進行凱塞窗濾波，生成時域音頻數(shù)據(jù)；PCM生成単元，用于根據(jù)單/雙聲道的不同將PCM數(shù)據(jù)按要求排列成PCM流。
[0029]本發(fā)明利用時域混疊消除思想，提供一種無線音頻壓縮方法。該方法首先采用凱塞窗加窗濾波器，對輸入時域數(shù)據(jù)濾波以消除邊際效應(yīng)；采用離散余弦變器(MDCT)，將時域音頻數(shù)據(jù)轉(zhuǎn)換為頻域數(shù)據(jù)(MDCT系數(shù));通過基于心理聲學(xué)掩蔽曲線實時輸入頻域信號的音頻掩蔽曲線，根據(jù)掩蔽曲線分析MDCT系數(shù)頻域掩蔽特性并為其分配傳輸比特，采用分組的量化器對不同掩蔽特性的MDCT系數(shù)使用不同的量化器進行量化。另外，該方法采用軟硬件并行思想實現(xiàn)音頻壓縮算法:采用硬件平臺中的硬件音頻加速器(AUAC)計算核心運算轉(zhuǎn)換部分(加窗濾波、MDCT轉(zhuǎn)換)，通過CPU與AUAC的協(xié)同操作，運用流水線實現(xiàn)音頻壓縮算法的并行運行，提高音頻編解碼速度，節(jié)省硬件資源。本發(fā)明同時提供與所述無線音頻壓縮方法相應(yīng)的無線音頻解壓縮方法。
[0030]本發(fā)明還提供利用所述無線音頻壓縮方法和無線音頻解壓縮方法實現(xiàn)的音頻編碼器和解碼器。音頻編碼器包括:可配置的去邊際效應(yīng)凱塞窗濾波；離散余弦變換器通過離散余弦變換，將經(jīng)凱塞窗濾波的時域采樣轉(zhuǎn)換為頻域信號(MDCT系數(shù))；硬件音頻加速器(AUAC)利用可編程硬件加速功能加速濾波和余弦變換器；量化因子分析器計算子MDCT系數(shù)的頻域能量值，計算量化因子，用于比特分配；基于心理聲學(xué)掩蔽曲線的自適應(yīng)比特分配器，根據(jù)MDCT數(shù)據(jù)實時計算聲學(xué)掩蔽曲線，根據(jù)掩蔽曲線對MDCT系數(shù)分配比持；自適應(yīng)量化器組按比特分配數(shù)對MDCT系數(shù)分塊采用不同的量化器對音頻數(shù)據(jù)進行量化，得到壓縮后的數(shù)據(jù)。
[0031]音頻解碼器包括:碼流解析器解析碼流中通用部分，如采樣率，聲道模式和碼率信息；量化因子解析器讀取碼流中量化因子部分，解析量化因子；比特分配器根據(jù)量化因子和比特池計算比特分配數(shù)；頻域數(shù)據(jù)解析器解析碼流中壓縮后頻域數(shù)據(jù)；反量化器根據(jù)解析的頻域數(shù)據(jù)、量化因子和比特分配數(shù)計算子頻帶數(shù)據(jù)；反相濾波器對子頻帶數(shù)據(jù)反相濾波，得到還原的PCM數(shù)據(jù)；PCM生成器，將還原的PCM碼流根據(jù)需求排列格式輸出。
[0032]如上所述，本發(fā)明算法中核心運算部分時頻轉(zhuǎn)換過程由硬件平臺中的可編程硬件音頻加速器(AUAC)負責運算，實現(xiàn)和算法其他部分的并行執(zhí)行，充分利用硬件的性能優(yōu)勢，提高算法的執(zhí)行速度。AUAC作為專門針對音頻音效算法所設(shè)計的音頻加速模塊，根據(jù)音頻算法的特點提供5種運算模塊:
[0033]DADD模塊:矢量加法/減法運算，可以一次運算2個矢量的對應(yīng)元素的和值/差值。
[0034]2) MUL模塊:矢量乘法，可以一次運算2個矢量對應(yīng)元素的乘積。
[0035]3)ACC模塊:標量累加，可以一次運算ー個矢量本身元素的累加值。
[0036]4)MAC模塊:乘累加，可以一次運算2個矢量對應(yīng)元素的N次乘累加的結(jié)果。
[0037]5)FFT模塊:快速傅里葉變換/反變換，可以一次運算N點的快速傅里葉變換。
[0038]用戶可以根據(jù)算法的需要和以上5種運算模式構(gòu)建運算模型，配置AUAC，實現(xiàn)算法的運行。
[0039]本發(fā)明的有益效果主要表現(xiàn)在:128?512點可調(diào)配的MDCT變換精細的分析了頻域信號特性，心理聲學(xué)掩蔽曲線的實時計算根據(jù)人耳特性分析對頻域信號進行壓縮，達到無損的音質(zhì)效果，提高了壓縮率；采用音頻加速模塊實現(xiàn)軟硬件結(jié)壓縮，使用流水線結(jié)果實現(xiàn)編解碼算法的并行運行，減小了運算量。
【專利附圖】

【附圖說明】
[0040]圖1是本發(fā)明音頻壓縮器的結(jié)構(gòu)圖。
[0041]圖2是本發(fā)明音頻壓縮方法的流程圖。
[0042]圖3是本發(fā)明音頻解壓縮器的結(jié)構(gòu)圖。
[0043]圖4是本發(fā)明音頻解壓縮方法的流程圖。
[0044]圖5是本發(fā)明音頻壓縮/解壓系統(tǒng)的凱塞窗頻響圖。
[0045]圖6是本發(fā)明音頻加速模塊AUAC設(shè)計使用原理圖。
[0046]圖7是本發(fā)明利用AUAC并行執(zhí)行壓縮算法的示意圖。
[0047]圖8是本發(fā)明壓縮/解壓算法對Ikhz正弦波重構(gòu)效果圖。
【具體實施方式】
[0048]下面結(jié)合附圖對本發(fā)明作進ー步描述，參照附圖:
[0049]本發(fā)明解決其技術(shù)問題所采用的技術(shù)方案是:[0050]1.基于時域混疊消除的無線音頻壓縮、解壓縮方法，包括以下步驟:
[0051]步驟1、無線音頻壓縮，具體包括:
[0052]1.1通過Kaiser窗濾波器對輸入的音頻PCM數(shù)據(jù)加窗；
[0053]1.2將獲得的經(jīng)過加窗濾波的音頻數(shù)據(jù)進行離散余弦變換，獲得變換頻域信號；
[0054]1.3計算變換后頻域信號的能量強度，獲得各量化比特數(shù)，通過歸類分析，將量化比特數(shù)寫入碼流；
[0055]1.4根據(jù)量化比特數(shù)計算頻域信號頻譜能量表(PSD)，根據(jù)能量表和基于心理聲學(xué)的頻域能量掩蔽閾值將頻域信號分為頻譜能量帶，計算得出各頻域信號的比特分配數(shù)；
[0056]1.5根據(jù)頻域信號的量化比特數(shù)和比特分配數(shù)，采用自適應(yīng)的量化仲裁算法選擇不同的量化器對頻域信號進行量化；
[0057]步驟2.無線音頻解壓縮，具體包括:
[0058]2.1從輸入的編碼后碼流中尋找同步字，而后解析出聲道數(shù)據(jù)和碼率參數(shù)；
[0059]2.2從碼流中解析量化因子。
[0060]2.3根據(jù)量化因子和碼率信息，計算心理聲學(xué)掩蔽曲線，根據(jù)曲線計算數(shù)據(jù)傳輸比特位；
[0061]2.4從碼流中解析出量化后數(shù)據(jù)，然后根據(jù)量化因子和比特分配數(shù)計算MDCT系數(shù)；
[0062]2.5對MDCT系數(shù)進行頂DCT運算，將MDCT系數(shù)轉(zhuǎn)換成時域音頻數(shù)據(jù)，基于頂DCT的運算特性，采用硬件音頻加速単元AUAC作為其實現(xiàn)平臺；
[0063]2.6對時域音頻數(shù)據(jù)加凱塞窗，并與前ー幀PCM數(shù)據(jù)做時域混疊處理，計算得出最終的PCM音頻數(shù)據(jù)；
[0064]2.7根據(jù)聲道數(shù)的配置，將PCM音頻數(shù)據(jù)轉(zhuǎn)換成PCM碼流。
[0065]進ー步，步驟1.2中采用硬件音頻加速模塊(AUAC)實現(xiàn)離散余弦變換(MDCT)，根據(jù)AUAC功能特性，將MDCT劃分為3個功能模塊:余弦加窗濾波模塊(用AUAC的MAC模塊實現(xiàn))，256點快速傅里葉變換模塊(用AUAC的FFT模塊實現(xiàn))和正弦窗濾波模塊(用AUAC的MAC模塊實現(xiàn))。
[0066]步驟1.3所述歸類分析方法是根據(jù)輸入的頻域信號的能量強度將量化因子分為D15、D25和D45等3類，分別以不同的方式寫入壓縮比特流。其中D15類每個量化因子單獨使用7比特進行傳輸比特；D25類的每2個量化因子共用ー個7比特作為傳輸比特；D45類的量化因子每4個量化因子共用ー個7比特作傳輸比持。
[0067]用于前述無線音頻壓縮、解壓縮方法的設(shè)備，包括音頻編碼器和音頻解碼器，其特征在于:
[0068]所述音頻編碼器包括:凱塞窗加窗濾波単元，用于對輸入的音頻數(shù)據(jù)加凱塞窗濾波；離散余弦變換單元，對凱塞窗加窗濾波單元的結(jié)果進行MDCT濾波，并將結(jié)果輸出給量化因子計算單元，該單元運算由AUAC實現(xiàn)，通過對AUAC編程，實現(xiàn)MDCT的硬件運算，將時域音頻數(shù)據(jù)轉(zhuǎn)換為頻域MDCT系數(shù)，MDCT濾波單元為128點MDCT變換，為時域到頻域的無損變換；量化因子計算單元，讀取MDCT濾波單元輸出的MDCT系數(shù)，并計算MDCT系數(shù)的能量強度，將能量強度歸類為3類量化因子，控制聲學(xué)掩蔽計算單元的計算和量化器組的計算，并寫入壓縮碼流；心理聲學(xué)掩蔽曲線計算単元，讀取頻域能量分析単元的結(jié)果，實時計算聲學(xué)掩蔽曲線，將掩蔽結(jié)果用于比特分配；比特分配単元，根據(jù)心理聲學(xué)単元的結(jié)果修改掩蔽閾值表，修改聲壓曲線，將MDCT系數(shù)劃分為N個頻帶分塊，并對個頻帶分塊計算其比特分配數(shù)，并將結(jié)果用于量化器単元；量化器組單元，根據(jù)頻域能量分析單元輸出的比特量化因子和比特分配單元輸出的比特分配數(shù)數(shù)對MDCT濾波單元的輸出的MDCT系數(shù)進行分組量化，得到量化后的數(shù)據(jù)；碼流生成単元，用于將幀頭，量化因子計算單元輸出的量化因子和量化器組輸出的量化后后頻帶數(shù)據(jù)打包生成碼流；
[0069]以及與所述的音頻編碼器配套的音頻解碼器，所述音頻解碼器包括:碼流解析單元，用于讀取同步字判斷幀頭，分析幀長，分析碼流邊信息；量化因子解析単元，在碼流解析単元解析完幀頭等頭信息之后，從碼流中解析量化因子，用于比特分配和反量化；聲學(xué)掩蔽曲線計算単元，根據(jù)量化因子単元計算的量化因子實時計算聲學(xué)掩蔽曲線，將掩蔽結(jié)果用于比特分配；比特分配単元，利用聲學(xué)掩蔽曲線計算単元的輸出和量化因子計算比特分配數(shù)據(jù)；反量化器組單元，用于根據(jù)量化因子計算單元輸出量化因子、比特分配単元計算的比特分配數(shù)和量化因子輸出的量化后數(shù)據(jù)進行反量化運算，計算IMDCT系數(shù)；反離散余弦變換單元，將反量化単元得到的頂DCT系數(shù)用于MDCT計算，將MDCT系數(shù)轉(zhuǎn)換為時域數(shù)據(jù)；凱塞窗濾波器，對頂DCT單元計算出的時域數(shù)據(jù)進行凱塞窗濾波，生成時域音頻數(shù)據(jù)；PCM生成単元，用于根據(jù)單/雙聲道的不同將PCM數(shù)據(jù)按要求排列成PCM流。
[0070]本發(fā)明利用時域混疊消除思想，提供一種無線音頻壓縮方法。該方法首先采用凱塞窗加窗濾波器，對輸入時域數(shù)據(jù)濾波以消除邊際效應(yīng)；采用離散余弦變器(MDCT)，將時域音頻數(shù)據(jù)轉(zhuǎn)換為頻域數(shù)據(jù)(MDCT系數(shù));通過基于心理聲學(xué)掩蔽曲線實時輸入頻域信號的音頻掩蔽曲線，根據(jù)掩蔽曲線分析MDCT系數(shù)頻域掩蔽特性并為其分配傳輸比特，采用分組的量化器對不同掩蔽特性的MDCT系數(shù)使用不同的量化器進行量化。另外，該方法采用軟硬件并行思想實現(xiàn)音頻壓縮算法:采用硬件平臺中的硬件音頻加速器(AUAC)計算核心運算轉(zhuǎn)換部分(加窗濾波、MDCT轉(zhuǎn)換)，通過CPU與AUAC的協(xié)同操作，運用流水線實現(xiàn)音頻壓縮算法的并行運行，提高音頻編解碼速度，節(jié)省硬件資源。本發(fā)明同時提供與所述無線音頻壓縮方法相應(yīng)的無線音頻解壓縮方法。
[0071]本發(fā)明還提供利用所述無線音頻壓縮方法和無線音頻解壓縮方法實現(xiàn)的音頻編碼器和解碼器。音頻編碼器包括:可配置的去邊際效應(yīng)凱塞窗濾波；離散余弦變換器通過離散余弦變換，將經(jīng)凱塞窗濾波的時域采樣轉(zhuǎn)換為頻域信號(MDCT系數(shù))；硬件音頻加速器(AUAC)利用可編程硬件加速功能加速濾波和余弦變換器；量化因子分析器計算子MDCT系數(shù)的頻域能量值，計算量化因子，用于比特分配；基于心理聲學(xué)掩蔽曲線的自適應(yīng)比特分配器，根據(jù)MDCT數(shù)據(jù)實時計算聲學(xué)掩蔽曲線，根據(jù)掩蔽曲線對MDCT系數(shù)分配比特；自適應(yīng)量化器組按比特分配數(shù)對MDCT系數(shù)分塊采用不同的量化器對音頻數(shù)據(jù)進行量化，得到壓縮后的數(shù)據(jù)。
[0072]音頻解碼器包括:碼流解析器解析碼流中通用部分，如采樣率，聲道模式和碼率信息；量化因子解析器讀取碼流中量化因子部分，解析量化因子；比特分配器根據(jù)量化因子和比特池計算比特分配數(shù)；頻域數(shù)據(jù)解析器解析碼流中壓縮后頻域數(shù)據(jù)；反量化器根據(jù)解析的頻域數(shù)據(jù)、量化因子和比特分配數(shù)計算子頻帶數(shù)據(jù)；反相濾波器對子頻帶數(shù)據(jù)反相濾波，得到還原的PCM數(shù)據(jù)；PCM生成器，將還原的PCM碼流根據(jù)需求排列格式輸出。
[0073]如上所述，本發(fā)明算法中核心運算部分時頻轉(zhuǎn)換過程由硬件平臺中的可編程硬件音頻加速器(AUAC)負責運算，實現(xiàn)和算法其他部分的并行執(zhí)行，充分利用硬件的性能優(yōu)勢，提高算法的執(zhí)行速度。AUAC作為專門針對音頻音效算法所設(shè)計的音頻加速模塊，根據(jù)音頻算法的特點提供5種運算模塊:
[0074]6) ADD模塊:矢量加法/減法運算，可以一次運算2個矢量的對應(yīng)元素的和值/差值。
[0075]7) MUL模塊:矢量乘法，可以一次運算2個矢量對應(yīng)元素的乘積。
[0076]8)ACC模塊:標量累加，可以一次運算ー個矢量本身元素的累加值。
[0077]9)MAC模塊:乘累加，可以一次運算2個矢量對應(yīng)元素的N次乘累加的結(jié)果。
[0078]10)FFT模塊:快速傅里葉變換/反變換，可以一次運算N點的快速傅里葉變換。
[0079]用戶可以根據(jù)算法的需要和以上5種運算模式構(gòu)建運算模型，配置AUAC，實現(xiàn)算法的運行。
[0080]參照圖1，圖1所示是根據(jù)本發(fā)明的一種音頻編碼器的結(jié)構(gòu)圖，包括:凱塞窗濾波器110，離散余弦變換器120，量化因子計算器130，掩蔽曲線計算器140，比特分配器150，量化器組160，碼流產(chǎn)生単元170。
[0081]首先本發(fā)明使用的時域混疊消除算法體系需要輸入的音頻數(shù)據(jù)經(jīng)過邊界收斂的窗函數(shù)濾波器，之后經(jīng)過加窗的音頻數(shù)據(jù)進行離散余弦變換(MDCT)得到頻域的MDCT系數(shù)，可配置的MDCT可以實現(xiàn)64點到512點的MDCT變換，分別針對不同的音質(zhì)，延遲和功耗要求，一般情況下使用的256點的MDCT，既能達到精準的頻域譜線分割，提高音質(zhì)，又能實現(xiàn)低延遲，低功耗。
[0082]量化因子計算器，根據(jù)MDCT系數(shù)分析頻域信號能量，計算各頻線MDCT系數(shù)對應(yīng)的量化因子，并根據(jù)信號能量的大小將量化因子分為3類，分別寫入碼流。
[0083]聲學(xué)掩蔽曲線計算器根據(jù)MDCT系數(shù)頻域信號能量計算對應(yīng)聲學(xué)掩蔽曲線，重新計算各頻線之間信號掩蔽關(guān)系。
[0084]比特分配器根據(jù)頻線的信號掩蔽關(guān)系和碼率參數(shù)對各頻線的MDCT系數(shù)重新分配比特數(shù)。
[0085]量化器組根據(jù)比特分配數(shù)和MDCT系數(shù)頻域信號能量，將MDCT系數(shù)分成4組，分別選擇不同的量化器對MDCT系數(shù)進行量化。
[0086]碼流產(chǎn)生單元將含有解碼關(guān)鍵參數(shù)的比特率、聲道數(shù)等信息會同量化因子碼流和量化后數(shù)據(jù)碼流整合為壓縮后碼流。
[0087]圖2所示是根據(jù)本發(fā)明的壓縮方法的流程圖，
[0088]首先，在步驟210讀入PCM碼流。
[0089]接著，在步驟220采用凱塞窗濾波器對PCM碼流加窗濾波。
[0090]接著，在步驟230采用離散余弦變換(MDCT)對加窗的PCM數(shù)據(jù)進行離散余弦變換，得到頻域的MDCT系數(shù)。
[0091]根據(jù)本發(fā)明的軟硬件并行執(zhí)行思想，步驟210、220和230由硬件音頻加速模塊(AUAC)實現(xiàn)(實現(xiàn)方式見圖6、圖7)。
[0092]接著，在步驟240，分析MDCT系數(shù)計算頻域信號能量，計算量化因子并將量化因子分塊寫入碼流。
[0093]接著，在步驟250，根據(jù)MDCT系數(shù)的頻域信號能量計算聲學(xué)掩蔽曲線，獲得MDCT系數(shù)的頻域掩蔽關(guān)系。
[0094]在步驟260中，根據(jù)MDCT系數(shù)的頻域能量和頻域掩蔽關(guān)系，計算MDCT系數(shù)的比特分配數(shù)。
[0095]在步驟270中，根據(jù)MDCT系數(shù)的頻域能量和比特分配數(shù)，選擇不同的量化器對MDCT系數(shù)進行量化。
[0096]在步驟280中，將碼流同步字、聲道信息、碼率信息、量化因子比特流和量化數(shù)據(jù)比特率整合為壓縮后的TDAC碼流。
[0097]圖3所示為根據(jù)本發(fā)明實現(xiàn)的解碼器的結(jié)構(gòu)圖，包括:碼流解析器310，量化因子解析器320，聲學(xué)掩蔽曲線計算器330，比特分配器340，反量化器組350，反離散余弦濾波器(IMDCT ) 360，凱塞窗濾波器370，PCM時域混疊器380。
[0098]碼流解析器的功能是解析壓縮后的TDAC碼流，獲得聲道信息和碼率信息等解碼相關(guān)信息。
[0099]量化因子解析器的功能是從碼流解析量化因子信息。
[0100]聲學(xué)掩蔽曲線計算器的功能是根據(jù)計算聲學(xué)掩蔽曲線，分析MDCT系數(shù)頻線間的聲學(xué)掩蔽關(guān)系。
[0101]比特分配器的功能是根據(jù)MDCT的量化字和頻線間聲學(xué)掩蔽關(guān)系計算各頻線的比特分配數(shù)。
[0102]反量化器組的功能是對MDCT系數(shù)壓縮后的碼流進行反量化。
[0103]反離散余弦變換的功能是對MDCT系數(shù)進行MDCT，得到時域PCM數(shù)據(jù)。
[0104]凱塞窗濾波器的功能是給頂DCT變換的到的時域PCM數(shù)據(jù)進行加窗濾波得到音頻PCM數(shù)據(jù)。
[0105]時域混疊器的功能是對當前幀音頻PCM數(shù)據(jù)與前一幀音頻PCM數(shù)據(jù)進行時域混疊，消除因MDCT變換所帯來的頻譜擴散效應(yīng)，獲取最終的PCM音頻數(shù)據(jù)。
[0106]圖4所示是根據(jù)本發(fā)明實現(xiàn)的解壓算法的流程圖，
[0107]首先，在步驟410解析碼流器解析輸入的壓縮碼流，解析出聲道信息、碼率信息。
[0108]接著，在步驟420，從碼流中解析出量化因子。
[0109]接著，在步驟430，根據(jù)量化因子分析MDCT系數(shù)頻域能量，計算心理聲學(xué)掩蔽曲線，獲得MDCT系數(shù)的頻域掩蔽關(guān)系。
[0110]接著，在步驟440，根據(jù)MDCT系數(shù)的量化因子和頻域掩蔽關(guān)系計算MDCT系數(shù)的比特分配數(shù)。
[0111]接著，在步驟450，根據(jù)量化因子和比特分配數(shù)，采用不同的反量化器對壓縮后的MDCT系數(shù)碼流進行反量化，得到MDCT系數(shù)。
[0112]接著，在步驟460，對MDCT系數(shù)進行反離散余弦變換(MDCT)，得到時域PCM數(shù)據(jù)。
[0113]接著，在步驟470和480，對MDCT得到的PCM數(shù)據(jù)進行加窗濾波和時域混疊，得到恢復(fù)后的時域音頻數(shù)據(jù)。
[0114]圖5所示的是凱塞窗的頻響圖,顯示其對邊界收斂的頻響響應(yīng)。
[0115]圖6所示的是本發(fā)明的硬件音頻加速器(AUAC)加速算法的設(shè)計流程:
[0116]首先，在步驟610中將算法中核心計算部分獨立出來，并抽象成獨立的數(shù)學(xué)模型。
[0117]接著，在步驟620中將根據(jù)數(shù)學(xué)模型根據(jù)AUAC的預(yù)算模式進行歸類和修改，使之符合AUAC內(nèi)置運算模式的要求，并根據(jù)該改進模型配置AUAC寄存器。
[0118]接著，在步驟630中，AUAC根據(jù)配置調(diào)用內(nèi)部運算功能模塊進行運算，實現(xiàn)模型算法的功能。
[0119]圖7所示的是本發(fā)明中采用的軟硬件結(jié)合的編程方結(jié)構(gòu)，710為AUAC硬件處理模塊，720為CPU軟件處理模塊，2個模塊能夠同時進行操作，實現(xiàn)軟硬件并行操作，大大提高了算法的執(zhí)行效率。
[0120]圖8所示是本發(fā)明的壓縮/解壓算法重構(gòu)的Ikhz正弦波(820)和原始的Ikhz正弦波(810)的比較，可以看到，經(jīng)過本算法重構(gòu)的Ikhz正弦波，信噪比僅比原始正弦波低4個db，可以達到無損的聽覺效果。
【權(quán)利要求】
1.基于時域混疊消除的無線音頻壓縮、解壓縮方法，包括以下步驟: 步驟1、無線音頻壓縮，具體包括: 1.1通過Kaiser窗濾波器對輸入的音頻PCM數(shù)據(jù)加窗； 1.2將獲得的經(jīng)過加窗濾波的音頻數(shù)據(jù)進行離散余弦變換，獲得變換頻域信號； 1.3計算變換后頻域信號的能量強度，獲得各量化比特數(shù)，通過歸類分析，將量化比特數(shù)寫入碼流； 1.4根據(jù)量化比特數(shù)計算頻域信號頻譜能量表(PSD)，根據(jù)能量表和基于心理聲學(xué)的頻域能量掩蔽閾值將頻域信號分為頻譜能量帶，計算得出各頻域信號的比特分配數(shù)； 1.5根據(jù)頻域信號的量化比特數(shù)和比特分配數(shù)，采用自適應(yīng)的量化仲裁算法選擇不同的量化器對頻域信號進行量化；步驟2.無線音頻解壓縮，具體包括: 2.1從輸入的編碼后碼流中尋找同步字，而后解析出聲道數(shù)據(jù)和碼率參數(shù)； 2.2從碼流中解析量化因子。 2.3根據(jù)量化因子和碼率信息，計算心理聲學(xué)掩蔽曲線，根據(jù)曲線計算數(shù)據(jù)傳輸比特位； 2.4從碼流中解析出量化后數(shù)據(jù)，然后根據(jù)量化因子和比特分配數(shù)計算MDCT系數(shù)； 2.5對MDCT系數(shù)進行MDCT運算，將MDCT系數(shù)轉(zhuǎn)換成時域音頻數(shù)據(jù)，基于MDCT的運算特性，采用硬件音頻加速単元AUAC作為其實現(xiàn)平臺； 2.6對時域音頻數(shù)據(jù)加凱塞窗，并與前ー幀PCM數(shù)據(jù)做時域混疊處理，計算得出最終的PCM音頻數(shù)據(jù)； 2.7根據(jù)聲道數(shù)的配置，將PCM音頻數(shù)據(jù)轉(zhuǎn)換成PCM碼流。
2.如權(quán)利要求1所述的基于時域混疊消除的無線音頻壓縮、解壓縮方法，其特征在于:步驟1.2中采用硬件音頻加速模塊(AUAC)實現(xiàn)離散余弦變換(MDCT)，根據(jù)AUAC功能特性，將MDCT劃分為3個功能模塊:余弦加窗濾波模塊(用AUAC的MAC模塊實現(xiàn))，256點快速傅里葉變換模塊(用AUAC的FFT模塊實現(xiàn))和正弦窗濾波模塊(用AUAC的MAC模塊實現(xiàn))；步驟1.3所述歸類分析方法是根據(jù)輸入的頻域信號的能量強度將量化因子分為D15、D25和D45等3類，分別以不同的方式寫入壓縮比特流。其中D15類每個量化因子単獨使用7比特進行傳輸比特；D25類的每2個量化因子共用ー個7比特作為傳輸比特；D45類的量化因子每4個量化因子共用ー個7比特作傳輸比持。
3.用于權(quán)利要求1所述的無線音頻壓縮、解壓縮方法的設(shè)備，包括音頻編碼器和音頻解碼器，其特征在于: 所述音頻編碼器包括:凱塞窗加窗濾波単元，用于對輸入的音頻數(shù)據(jù)加凱塞窗濾波；離散余弦變換單元，對凱塞窗加窗濾波單元的結(jié)果進行MDCT濾波，并將結(jié)果輸出給量化因子計算單元，該單元運算由AUAC實現(xiàn)，通過對AUAC編程，實現(xiàn)MDCT的硬件運算，將時域音頻數(shù)據(jù)轉(zhuǎn)換為頻域MDCT系數(shù)，MDCT濾波單元為128點MDCT變換，為時域到頻域的無損變換；量化因子計算單元，讀取MDCT濾波單元輸出的MDCT系數(shù)，并計算MDCT系數(shù)的能量強度，將能量強度歸類為3類量化因子，控制聲學(xué)掩蔽計算單元的計算和量化器組的計算，并寫入壓縮碼流；心理聲學(xué)掩蔽曲線計算単元，讀取頻域能量分析単元的結(jié)果，實時計算聲學(xué)掩蔽曲線，將掩蔽結(jié)果用于比特分配；比特分配単元，根據(jù)心理聲學(xué)単元的結(jié)果修改掩蔽閾值表，修改聲壓曲線，將MDCT系數(shù)劃分為N個頻帶分塊，并對個頻帶分塊計算其比特分配數(shù)，并將結(jié)果用于量化器単元；量化器組單元，根據(jù)頻域能量分析單元輸出的比特量化因子和比特分配單元輸出的比特分配數(shù)數(shù)對MDCT濾波單元的輸出的MDCT系數(shù)進行分組量化，得到量化后的數(shù)據(jù)；碼流生成単元，用于將幀頭，量化因子計算單元輸出的量化因子和量化器組輸出的量化后后頻帶數(shù)據(jù)打包生成碼流；以及與所述的音頻編碼器配套的音頻解碼器，所述音頻解碼器包括:碼流解析単元，用于讀取同步字判斷幀頭，分析幀長，分析碼流邊信息；量化因子解析単元，在碼流解析単元解析完幀頭等頭信息之后，從碼流中解析量化因子，用于比特分配和反量化；聲學(xué)掩蔽曲線計算單元，根據(jù)量化因子単元計算的量化因子實時計算聲學(xué)掩蔽曲線，將掩蔽結(jié)果用于比特分配；比特分配単元，利用聲學(xué)掩蔽曲線計算単元的輸出和量化因子計算比特分配數(shù)據(jù)；反量化器組單元，用于根據(jù)量化因子計算單元輸出量化因子、比特分配単元計算的比特分配數(shù)和量化因子輸出的量化后數(shù)據(jù)進行反量化運算，計算IMDCT系數(shù)；反離散余弦變換單元，將反量化単元得到的頂DCT系數(shù)用于MDCT計算，將MDCT系數(shù)轉(zhuǎn)換為時域數(shù)據(jù)；凱塞窗濾波器，對頂DCT單元計算出的時域數(shù)據(jù)進行凱塞窗濾波，生成時域音頻數(shù)據(jù)；PCM生成単元，用于根據(jù)單/雙聲道的不同將P`CM數(shù)據(jù)按要求排列成PCM流。
【文檔編號】G10L19/002GK103489450SQ201310117937
【公開日】2014年1月1日申請日期:2013年4月7日優(yōu)先權(quán)日:2013年4月7日
【發(fā)明者】楊洋, 姚嘉, 任金平, 高永澤申請人:杭州微納科技有限公司

完整全部詳細技術(shù)資料下載