欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

對(duì)音頻信號(hào)進(jìn)行編碼的方法和設(shè)備的制作方法

文檔序號(hào):7538746閱讀:263來源:國知局
專利名稱:對(duì)音頻信號(hào)進(jìn)行編碼的方法和設(shè)備的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及對(duì)音頻信號(hào)進(jìn)行編碼的方法和設(shè)備。尤其是,本發(fā)明涉及一種方法和設(shè)備,用于對(duì)音頻信號(hào)進(jìn)行編碼以提高活動(dòng)圖像專家組4高級(jí)音頻編碼(MPEG-4 AAC)方案的處理效率。
背景技術(shù)
在能提供多媒體服務(wù)(諸如,數(shù)字音頻廣播(DAB)服務(wù)、互聯(lián)網(wǎng)電話服務(wù)或音頻點(diǎn)播(AOD)服務(wù))的系統(tǒng)中,活動(dòng)圖像專家組(MPEG)音頻標(biāo)準(zhǔn)在音頻信號(hào)的存儲(chǔ)和傳輸中起到了重要的作用?;贛PEG音頻標(biāo)準(zhǔn)的MPEG音頻編碼算法被用于對(duì)音頻信號(hào)進(jìn)行壓縮而不損失主觀聲音質(zhì)量,以此減少音頻信號(hào)存儲(chǔ)和傳輸中所需的信道容量。
在多種MPEG音頻編碼算法中,MPEG-4 AAC(活動(dòng)圖像專家組4高級(jí)音頻編碼)方案是最新的一種系統(tǒng)化的編碼方案,支持最高壓縮比和最佳聲音質(zhì)量。依照該MPEG方案,音頻壓縮技術(shù)已經(jīng)有了高速的發(fā)展。
使用人類的聽覺特性來有效去除噪聲的心理聲學(xué)理論對(duì)音頻壓縮技術(shù)的高速發(fā)展做出了巨大貢獻(xiàn)。在音頻編碼處理中,根據(jù)復(fù)雜心理聲學(xué)理論處理來計(jì)算每個(gè)頻率的最大可允許噪聲量。
圖1是示出對(duì)音頻信號(hào)進(jìn)行編碼的常規(guī)音頻編碼設(shè)備的框圖。尤其是,圖1示出了ISO/IEC 14496-3(表示與MPEG-4 AAC相關(guān)聯(lián)的標(biāo)準(zhǔn)技術(shù))中推薦的設(shè)備。如圖1所示,常規(guī)音頻編碼設(shè)備包括改良型離散余弦變換(MDCT)塊10、快速傅立葉變換(FFT)塊20、心理聲學(xué)模型塊30、編碼效率增強(qiáng)塊40、量化和比特分配塊50、以及哈夫曼(Huffman)編碼塊60。
MDCT塊10接收時(shí)域信號(hào)并在編碼過程中將所接收的信號(hào)轉(zhuǎn)換為頻域信號(hào)。FFT塊20接收音頻信號(hào),在所接收的音頻信號(hào)上執(zhí)行FFT處理,并輸出轉(zhuǎn)換系數(shù)。編碼效率增強(qiáng)塊40使用多種方法(諸如,臨時(shí)噪聲修正(TNS)、聯(lián)合立體聲、用于增強(qiáng)周期性信號(hào)壓縮性能的長(zhǎng)時(shí)間預(yù)測(cè)(LTP),以及用于增強(qiáng)噪聲分量壓縮效率的感知噪聲抑制(PNS))增強(qiáng)與信號(hào)特性相關(guān)聯(lián)的編碼(即,壓縮)的效率。值得注意的是包含在編碼效率增強(qiáng)塊40中的上述組件已經(jīng)在MPEG-4 AAC標(biāo)準(zhǔn)中定義了。
心理聲學(xué)模型塊30分析音頻信號(hào)的感知特性并確定所分析的音頻信號(hào)的每個(gè)頻率的最大可允許量化噪聲量。心理聲學(xué)模型塊30使用從FFT塊20接收到的系數(shù)。
量化和比特分配塊50在所接收的信號(hào)上執(zhí)行量化和比特分配。量化處理考慮到編碼效率增強(qiáng)塊40的輸出信號(hào)的相關(guān)SNR(信號(hào)-噪聲比)和心理聲學(xué)模型塊30的輸出值,最小化人類可感知到的噪聲量。此外,最優(yōu)化了比特分配,這樣依照最優(yōu)化比特分配,編碼效率增強(qiáng)塊40的輸出信號(hào)的相關(guān)SNR要小于心理聲學(xué)模型塊30輸出值的最大可允許量化噪聲量。值得注意的是包含在上述量化和比特分配塊50中的組成分量已經(jīng)在MPEG-4 AAC標(biāo)準(zhǔn)中定義了。
本領(lǐng)域熟練技術(shù)人員眾所周知的是,哈夫曼編碼塊60允許上述量化和比特分配塊50的輸出信號(hào)的無損編碼。同時(shí),心理聲學(xué)模型塊30分析轉(zhuǎn)換為頻域信號(hào)的音頻信號(hào)的感知特性,這樣就需要一種將輸入音頻信號(hào)轉(zhuǎn)換為頻域信號(hào)的特殊處理。
特別地,當(dāng)前MPEG推薦已經(jīng)定義了在心理聲學(xué)模型中使用的必須的額外FFT。如圖1所示,常規(guī)音頻編碼設(shè)備包括FFT塊20。
然而,在圖1所示的常規(guī)設(shè)備中的各個(gè)塊中所執(zhí)行的計(jì)算量中,特別是在根據(jù)MPEG-4 AAC算法在每個(gè)塊所執(zhí)行的計(jì)算量中,心理聲學(xué)模型處理返回了大約所有計(jì)算的一半。尤其是,心理聲學(xué)模型處理的FFT需要很多的計(jì)算。
如果使用了低速處理器,就無法實(shí)時(shí)驅(qū)動(dòng)常規(guī)方法所需的MPEG-4 AAC算法。另一方面,如果使用具有高級(jí)計(jì)算性能的高性能處理器,就可實(shí)時(shí)驅(qū)動(dòng)MPEG-4 AAC。然而,高性能處理器在電源消耗方面是有缺點(diǎn)的。
因此,需要一種改進(jìn)的方法,能夠減少驅(qū)動(dòng)MPEG-4 AAC算法的計(jì)算量。本發(fā)明解決了這些和其它需要。

發(fā)明內(nèi)容
在下文描述中將給出本發(fā)明的特點(diǎn)和優(yōu)點(diǎn),部分可從說明中顯而易見,或可通過對(duì)本發(fā)明的實(shí)踐而理解。將通過書面描述和權(quán)利要求書以及附圖中所特別指出的結(jié)構(gòu)來實(shí)現(xiàn)并獲得本發(fā)明的目的和其它優(yōu)點(diǎn)。
本發(fā)明針對(duì)一種音頻編碼方法和設(shè)備,在實(shí)質(zhì)上消除了由于相關(guān)技術(shù)的限制和缺點(diǎn)而產(chǎn)生的一個(gè)或多個(gè)問題。本發(fā)明的一個(gè)目的是提供一種音頻編碼方法和設(shè)備,用于減少音頻編碼算法中的計(jì)算量以增強(qiáng)音頻編碼處理的效率。本發(fā)明的另一個(gè)目的是提供一種音頻編碼方法和設(shè)備,用于減少對(duì)音頻信號(hào)進(jìn)行編碼的MPEG-4 AAC算法中心理聲學(xué)模型處理所需的計(jì)算量。
在本發(fā)明的一個(gè)方面中,提供了一種音頻編碼設(shè)備。該設(shè)備包括能夠?qū)r(shí)域音頻信號(hào)轉(zhuǎn)換為頻域音頻信號(hào)的改良型離散余弦變換(MDCT)塊、能夠使用從MDCT塊接收到的轉(zhuǎn)換結(jié)果確定每個(gè)頻率的最大可允許量化噪聲量的心理聲學(xué)模型塊。
可以理解的是該設(shè)備進(jìn)一步包括能夠在時(shí)域音頻信號(hào)上執(zhí)行MDST處理的改良型離散正弦變換(MDST)塊。還可以理解的是該設(shè)備進(jìn)一步包括能夠?qū)DCT塊的變換結(jié)果和MDST塊的變換結(jié)果的組合移動(dòng)預(yù)定值的移動(dòng)塊。
可以理解的是該設(shè)備進(jìn)一步包括能夠在移動(dòng)塊的輸出結(jié)果上執(zhí)行初步FIR濾波并向心理聲學(xué)模型塊提供FIR濾波結(jié)果的有限脈沖相應(yīng)(FIR)濾波器。還可以理解的是FIR濾波器還能夠獲取對(duì)應(yīng)于與音頻信號(hào)相關(guān)聯(lián)的快速傅立葉變換(FFT)結(jié)果的第一系數(shù)和第二系數(shù)的濾波結(jié)果。
可以理解的是FFT結(jié)果可由MDCT塊的轉(zhuǎn)換結(jié)果和MDST塊的轉(zhuǎn)換結(jié)果形成的第一等式所表示FFT{x(n)}=[(Xc(k)-jXs(k))·exp(j2πNn0k)]*FFT{exp(j2πNk0n)}]]>其中,符號(hào)*表示使用FIR濾波器所生成的初步FIR濾波計(jì)算的圓周卷積,x(n)表示輸入音頻信號(hào)、FFT{x(n)}表示輸入音頻信號(hào)的FFT結(jié)果、Xc(k)表示MDCT塊的轉(zhuǎn)換結(jié)果、Xs(k)表示MDST塊的轉(zhuǎn)換結(jié)果、n0和k0表示MDCT塊中使用的常數(shù)、n表示輸入音頻信號(hào)的采樣索引、N表示轉(zhuǎn)換窗口的窗口長(zhǎng)度、exp(j2πNn0k)]]>表示移動(dòng)塊的移動(dòng)結(jié)果。
可以理解的是該設(shè)備中,該FIR濾波器的輸出結(jié)果表示為第二等式Σj=01ait[k-i],]]>且等于初步FIR濾波結(jié)果,其中a0表示FFT{exp(j2πNk0n)}]]>的第一系數(shù)值、a1表示FFT{exp(j2πNk0n)}]]>的第二系數(shù)值、t(k)表示為t(k)=[(Xc(k)-jXs(k))·exp(j2πNn0k)].]]>可以理解的是該設(shè)備中,第一等式表示當(dāng)FFT窗口與MDCT窗口不同時(shí)使用漢納(Hann)窗口的FFT結(jié)果。還可以理解的是該設(shè)備中,表示FFT結(jié)果并應(yīng)用漢納窗口的第一等式可改變?yōu)槿缦滤镜牡谌仁紽FT{x(n)hH(n)}=]]>FFT{x(n)hs(n)·hH(n)hs(n)}=[(Xc(k)-jXs(k))·exp(j2πNn0k)]*FFT{exp(j2πNn0k)hH(n)hs(n)}]]>這樣第三等式對(duì)應(yīng)用到FFT和MDCT塊的不同窗口做出了補(bǔ)償。
在本發(fā)明的另一個(gè)方面,提供了一種音頻編碼方法。該方法包括使用改良型離散余弦變換(MDCT)將輸入時(shí)域音頻信號(hào)轉(zhuǎn)換為頻域音頻信號(hào)、使用改良型離散正弦變換(MDST)轉(zhuǎn)換輸入時(shí)域音頻信號(hào),以及通過將MDCT和MDST的轉(zhuǎn)換結(jié)果應(yīng)用到心理聲學(xué)模型來確定每個(gè)頻率的最大可允許量化噪聲量。
可以理解的是該方法還包括將MDCT的變換結(jié)果和MDST的變換結(jié)果的組合移動(dòng)預(yù)定值,并在移動(dòng)結(jié)果上執(zhí)行有限脈沖相應(yīng)(FIR)濾波。還可以理解的是該方法還包括根據(jù)濾波結(jié)果確定最大可允許量化噪聲量。
可以理解的是該方法還包括執(zhí)行初步FIR濾波。還可以理解的是濾波結(jié)果對(duì)應(yīng)于與輸入音頻信號(hào)相關(guān)聯(lián)的快速傅立葉變換(FFT)結(jié)果的第一系數(shù)和第二系數(shù)。
可以理解的是FFT結(jié)果可由MDCT的轉(zhuǎn)換結(jié)果和MDST的轉(zhuǎn)換結(jié)果形成的第一等式所表示
FFT{x(n)}=[(Xc(k)-jXs(k))·exp(j2πNn0k)]*FFT{exp(j2πNk0n)}]]>其中,符號(hào)*表示使用初步FIR濾波計(jì)算的圓周卷積,x(n)表示輸入音頻信號(hào)、FFT{x(n)}表示輸入音頻信號(hào)的FFT結(jié)果、Xc(k)表示MDCT的轉(zhuǎn)換結(jié)果、Xs(k)表示MDST的轉(zhuǎn)換結(jié)果、n0和k0表示MDCT中使用的常數(shù)、n表示輸入音頻信號(hào)的采樣索引、N表示轉(zhuǎn)換窗口的窗口長(zhǎng)度、exp(j2πNn0k)]]>表示移動(dòng)結(jié)果。
可以理解的是FIR濾波器的輸出結(jié)果表示為第二等式Σi=01ait[k-i],]]>且等于初步FIR濾波結(jié)果,其中a0表示FFT{exp(j2πNk0n)}]]>的第一系數(shù)值、a1表示FFT{exp(j2πNk0n)}]]>的第二系數(shù)值、t(k)表示為t(k)=[(Xc(k)-jXs(k))·exp(j2πNn0k)].]]>可以理解的是第一等式表示當(dāng)FFT窗口與MDCT窗口不同時(shí)使用漢納(Hann)窗口的FFT結(jié)果。
可以理解的是表示FFT結(jié)果并應(yīng)用漢納窗口的第一等式可改變?yōu)槿缦滤镜牡谌仁紽FT{x(n)hH(n)}=]]>FFT{x(n)hs(n)·hH(n)hs(n)}=[(Xc(k)-jXs(k))·exp(j2πNn0k)]*FFT{exp(j2πNn0k)hH(n)hs(n)}]]>這樣第三等式對(duì)應(yīng)用到FFT和MDCT塊的不同窗口做出了補(bǔ)償。
本發(fā)明的其它特點(diǎn)和優(yōu)點(diǎn)將在下文中給出,并且部分可從描述中顯而易見,或可通過對(duì)本發(fā)明的實(shí)踐而理解??梢岳斫獾氖潜景l(fā)明的上述一般描述和下述詳細(xì)描述是示例性和說明性的,旨在提供對(duì)根據(jù)所要求保護(hù)的本發(fā)明的進(jìn)一步解釋。對(duì)本領(lǐng)域熟練技術(shù)人員而言,參考附圖從實(shí)施例的下述詳細(xì)描述中可以很容易地理解這些和其它實(shí)施例,本發(fā)明不限于任何所揭示的特定實(shí)施例。


包括在此以提供對(duì)本發(fā)明進(jìn)一步理解并結(jié)合作為本說明書一部分的附圖示出了本發(fā)明的實(shí)施例,并與描述一起解釋了本發(fā)明的原理。根據(jù)一個(gè)或多個(gè)實(shí)施例,在不同附圖中由相同標(biāo)號(hào)所表示的本發(fā)明的特征、元素以及方面表示相同的、等價(jià)的、或類似的特征、元素和方面。
包括在此以提供對(duì)本發(fā)明進(jìn)一步理解并結(jié)合作為本申請(qǐng)一部分的附圖示出了本發(fā)明的多個(gè)實(shí)施例,并與描述一起解釋了本發(fā)明的原理。
圖1是示出常規(guī)音頻編碼設(shè)備的框圖。
圖2是示出根據(jù)本發(fā)明的一則實(shí)施例的音頻編碼設(shè)備的框圖。
圖3是示出根據(jù)本發(fā)明的一則實(shí)施例的能夠?qū)σ纛l信號(hào)進(jìn)行編碼的心理聲學(xué)模型處理的流程圖。
具體實(shí)施例方式
現(xiàn)在將詳細(xì)參考本發(fā)明較佳實(shí)施例,其示例已在附圖中示出。只要在可能的情況下,將在所有附圖中使用相同的標(biāo)號(hào)表示相同或相近的部分。
將參考附圖描述根據(jù)本發(fā)明的一種用于對(duì)音頻信號(hào)進(jìn)行編碼的方法和設(shè)備。本發(fā)明旨在減少用于執(zhí)行MPEG-4 AAC算法的心理聲學(xué)模型處理的FFT處理所需的計(jì)算量。
圖2是示出根據(jù)本發(fā)明的一則實(shí)施例的音頻編碼設(shè)備的框圖。如圖2所示,根據(jù)本發(fā)明的音頻編碼設(shè)備包括MDCT塊110、改良型離散正弦變換(MDST)塊125、有限脈沖相應(yīng)(FIR)濾波器127、心理聲學(xué)模型塊130、編碼效率增強(qiáng)塊140、量化和比特分配塊150以及哈夫曼編碼塊160。
MDCT塊110接收到時(shí)域音頻信號(hào)并將所接收的音頻信號(hào)轉(zhuǎn)換為頻域信號(hào)以執(zhí)行編碼處理。MDST塊125在所接收的時(shí)域音頻信號(hào)上執(zhí)行MDST。FIR濾波器127執(zhí)行初步FIR濾波并將FIR濾波結(jié)果發(fā)送給心理聲學(xué)模型塊130。心理聲學(xué)模型塊130分析音頻信號(hào)的感知特性并確定所分析的音頻信號(hào)的每個(gè)頻率的最大可允許量化噪聲量。心理聲學(xué)模型塊130使用MDCT塊110的轉(zhuǎn)換結(jié)果、MDST塊125的轉(zhuǎn)換結(jié)果以及FIR濾波器127的濾波結(jié)果。
心理聲學(xué)模型塊130必須使用由FFT結(jié)果所獲得的系數(shù)。這樣,如果FIR濾波器127在MDCT塊110的轉(zhuǎn)換結(jié)果和MDST塊125的轉(zhuǎn)換結(jié)果的組合上執(zhí)行初步FIR濾波,并且初步FIR濾波結(jié)果對(duì)應(yīng)于與所接收的音頻信號(hào)相關(guān)聯(lián)的FFT結(jié)果,編碼性能并不受初步FIR濾波結(jié)果的影響。等式1示出了該轉(zhuǎn)換結(jié)果。
(等式1)FFT{x(n)}=[(Xc(k)-jXs(k))·exp(j2πNn0k)]*FFT{exp(j2πNk0n)}]]>參考等式1,x(n)表示輸入音頻信號(hào)、FFT{x(n)}表示輸入音頻信號(hào)的FFT結(jié)果、Xc(k)表示MDCT塊110的轉(zhuǎn)換結(jié)果、Xs(k)表示MDST塊125的轉(zhuǎn)換結(jié)果、n0和k0表示MDCT塊中使用的常數(shù)。此外,符號(hào)(*)表示圓周卷積,字符(n)表示輸入音頻信號(hào)的采樣索引、字符(K)表示頻率索引、字符(N)表示轉(zhuǎn)換窗口的窗口長(zhǎng)度、exp(j2πNn0k)]]>表示n0移動(dòng)結(jié)果。
音頻編碼設(shè)備還包括移動(dòng)塊(未圖示),用于將MDCT塊110和MDST塊125的轉(zhuǎn)換結(jié)果的組合移動(dòng)預(yù)定值。移動(dòng)塊執(zhí)行n0移動(dòng)。
FIR濾波器127在移動(dòng)塊的輸出信號(hào)上執(zhí)行初步FIR濾波并將FIR濾波結(jié)果發(fā)送到心理聲學(xué)模型塊130。MDST塊125和FIR濾波器127獲得上述FFT結(jié)果。
如等式1所示,計(jì)算了輸入音頻信號(hào)的MDCT結(jié)果和MDST結(jié)果的組合并獲得了所計(jì)算的組合結(jié)果的圓周卷積。然而,因?yàn)閳A周卷積極大地影響了計(jì)算的量,本發(fā)明使用FIR濾波器127生成的初步FIR濾波來執(zhí)行近似處理以減少圓周卷積計(jì)算的量。換句話說,由FIR濾波器127生成的初步FIR濾波執(zhí)行了多個(gè)圓周卷積計(jì)算的近似計(jì)算。
同時(shí),應(yīng)用到輸入音頻信號(hào)的用于FFT的窗口是不同于應(yīng)用到輸入音頻信號(hào)用于MDCT的窗口。考慮到應(yīng)用到FFT和MDCT的不同窗口,等式1轉(zhuǎn)變?yōu)榈仁?。等式2是通過在等式1上應(yīng)用漢納窗口而獲得的,并對(duì)應(yīng)用到單個(gè)輸入音頻信號(hào)的FFT和MDCT的不同窗口做出了補(bǔ)償。
(等式2)FFT{x(n)hH(n)}=]]>FFT{x(n)hs(n)·hH(n)hs(n)}=[(Xc(k)-jXs(k))·exp(j2πNn0k)]*FFT{exp(j2πNn0k)hH(n)hs(n)}]]>在等式2中,hs(n)表示使用在MDCT的正弦窗口,hH(n)表示主要用于心理聲學(xué)模型輸入處理的漢納窗口。如圖2所示,初步FIR濾波必須執(zhí)行近似計(jì)算以減少圓周卷積計(jì)算的量。
在圖2中所示的圓周卷積的右側(cè)項(xiàng)含有與頻率索引(k)相關(guān)的常數(shù)值(s),這樣常數(shù)值就實(shí)現(xiàn)為表格的形式。FIR濾波結(jié)果(輸出信號(hào)或者是FIR濾波器12的初步FIR濾波結(jié)果)可由等式3所表示(等式3)Σi=01ait[k-i]]]>在等式3中,t(k)表示為t(k)=[(Xc(k)-jXs(k))·exp(j2πNn0k)],]]>a0表示FFT{exp(j2πNk0n)}]]>的第一系數(shù)值、a1表示FFT{exp(j2πNk0n)}]]>的第二系數(shù)值、。
編碼效率增強(qiáng)塊140由多個(gè)在MPEG-4 AAC標(biāo)準(zhǔn)中所定義的組件組成,并根據(jù)信號(hào)特征增強(qiáng)了編碼(即,壓縮)效率。編碼效率增強(qiáng)塊140中的組件為TNS(臨時(shí)噪聲修正)組件、聯(lián)合立體聲組件、LTP(長(zhǎng)時(shí)間預(yù)測(cè))組件以及PNS(感知噪聲抑制)。
定義在MPEG-4 AAC標(biāo)準(zhǔn)中的量化和比特分配塊150在所接收的信號(hào)上執(zhí)行量化和比特分配。量化處理考慮到編碼效率增強(qiáng)塊140的輸出信號(hào)的相關(guān)SNR(信號(hào)-噪聲比)和心理聲學(xué)模型塊130的輸出值,最小化人類可感知到的噪聲量。此外,最優(yōu)化了比特分配,這樣依照最優(yōu)化比特分配,編碼效率增強(qiáng)塊40的輸出信號(hào)的相關(guān)SNR要小于心理聲學(xué)模型塊30輸出值的最大可允許量化噪聲量。
哈夫曼編碼塊160允許上述量化和比特分配塊50的輸出信號(hào)的無損編碼。
圖3是示出根據(jù)本發(fā)明的能夠?qū)σ纛l信號(hào)進(jìn)行編碼的心理聲學(xué)模型處理的流程圖。如圖3所示,在步驟S10中在音頻編碼設(shè)備中接收到的時(shí)域音頻信號(hào)等于2048個(gè)采樣。
在步驟S11中,通過MDST塊125將音頻信號(hào)轉(zhuǎn)換為另一個(gè)信號(hào)。MDCT塊127將輸入音頻信號(hào)轉(zhuǎn)換為頻域音頻信號(hào),并將轉(zhuǎn)換結(jié)果與MDST轉(zhuǎn)換結(jié)果相組合,這樣獲得了組合結(jié)果Xc(k)-jXs(k)。
組合結(jié)果Xc(k)-jXs(k)接著被乘以等式1所示的特定值exp(j2πNn0k).]]>換句換說,在步驟S12,將兩個(gè)轉(zhuǎn)換結(jié)果的組合移動(dòng)預(yù)定值n0,并將頻譜在時(shí)間軸上移動(dòng)相等于n0移動(dòng)的預(yù)定值。
在步驟S13中,在n0移動(dòng)結(jié)果上執(zhí)行初步FIR濾波。當(dāng)輸入音頻信號(hào)近似于FFT結(jié)果時(shí)獲得FIR濾波結(jié)果。
本發(fā)明不將FFT結(jié)果計(jì)算的多個(gè)系數(shù)應(yīng)用在心理聲學(xué)模型上,而是僅僅使用FFT結(jié)果的第一和第二系數(shù)。換句話說,初步FIR濾波結(jié)果等于FFT近似值。在步驟S14中,心理聲學(xué)模型塊130使用FFT近似值。
同時(shí),本發(fā)明執(zhí)行上述近似計(jì)算以替換FFT結(jié)果,因此導(dǎo)致想不到的誤差的發(fā)生。然而,誤差并不會(huì)極大影響到音頻編碼處理。
計(jì)算與N個(gè)采樣相關(guān)的高速M(fèi)DST需要實(shí)數(shù)乘法預(yù)定數(shù)量N*(log2N+1)/4和預(yù)定數(shù)量N*(log2N-1)/4。n0移動(dòng)處理所需的乘法數(shù)量是3N/2,n0移動(dòng)處理所需的加法數(shù)量是3N/2。FIR濾波處理所需的乘法數(shù)量是3N,F(xiàn)IR濾波處理所需的加法數(shù)量是7N/2。
因此,用于心理聲學(xué)模型的乘法/加法計(jì)算的總數(shù)量表示為N*log2N+19N/2。普通FFT所需的計(jì)算量表示為4N*(log2N-1)+8。
因此,假設(shè)FFT處理與包括2048個(gè)采樣的輸入音頻信號(hào)相關(guān)聯(lián),根據(jù)本發(fā)明的FIR濾波所需的計(jì)算量占用FFT處理所需計(jì)算量的大約51%,因此本發(fā)明可以較大地減少用于音頻編碼處理的計(jì)算總量。
本領(lǐng)域熟練技術(shù)人員容易理解的是可對(duì)本發(fā)明進(jìn)行各種修改和變化而不脫離本發(fā)明的精神或范圍。因此,本發(fā)明旨在覆蓋屬于附加權(quán)利要求和它們的等價(jià)物的范圍中的本發(fā)明的修改和變化。
因?yàn)楸景l(fā)明可被實(shí)現(xiàn)為各種形式而不脫離本發(fā)明的精神或必要特征,可以理解的是除非有特別說明,上述實(shí)施例不受任何上述描述的細(xì)節(jié)所限制,而是可被廣泛構(gòu)建為附加權(quán)利要求中定義的精神和范圍中,并且附加權(quán)利要求旨在包含處于權(quán)利要求公認(rèn)范圍,或是這些公認(rèn)范圍的等價(jià)物中的所有改動(dòng)和修改。
上述實(shí)施例和優(yōu)點(diǎn)僅僅是示例性的,并且不能構(gòu)成對(duì)本發(fā)明的限制。本教導(dǎo)可容易地應(yīng)用在其它類型的設(shè)備上。本發(fā)明的描述旨在是描述性的,并且不限制權(quán)利要求的范圍。本領(lǐng)域熟練技術(shù)人員可以知曉許多的改動(dòng)、修改和變化。在權(quán)利要求中,裝置加功能的語句旨在覆蓋在此所述的執(zhí)行所述功能的結(jié)構(gòu),并且不僅僅是結(jié)構(gòu)性等價(jià)物,也是等價(jià)的結(jié)構(gòu)。
權(quán)利要求
1.一種音頻編碼設(shè)備,包括改良型離散余弦變換(MDCT)塊,適用于將時(shí)域音頻信號(hào)轉(zhuǎn)換為頻域音頻信號(hào);以及心理聲學(xué)模型塊,適用于使用從所述MDCT塊接收到的轉(zhuǎn)換結(jié)果確定每個(gè)頻率的最大可允許量化噪聲量。
2.如權(quán)利要求1所述的設(shè)備,其特征在于,還包括改良型離散正弦變換(MDST)塊,適用于在所述時(shí)域音頻信號(hào)上執(zhí)行MDST處理。
3.如權(quán)利要求2所述的設(shè)備,其特征在于,還包括移動(dòng)塊,適用于將所述MDCT塊的變換結(jié)果和所述MDST塊的變換結(jié)果的組合移動(dòng)預(yù)定值。
4.如權(quán)利要求3所述的設(shè)備,其特征在于,還包括有限脈沖相應(yīng)(FIR)濾波器,適用于在所述移動(dòng)塊的輸出結(jié)果上執(zhí)行初步FIR濾波并向所述心理聲學(xué)模型塊提供FIR濾波結(jié)果。
5.如權(quán)利要求4所述的設(shè)備,其特征在于,所述FIR濾波器還適用于獲取對(duì)應(yīng)于與所述音頻信號(hào)相關(guān)聯(lián)的快速傅立葉變換(FFT)結(jié)果的第一系數(shù)和第二系數(shù)的濾波結(jié)果。
6.如權(quán)利要求5所述的設(shè)備,其特征在于,所述FFT結(jié)果可由所述MDCT塊的轉(zhuǎn)換結(jié)果和所述MDST塊的轉(zhuǎn)換結(jié)果形成的第一等式FFT{x(n)}=[(Xc(k)-jXs(k))·exp(j2πNn0k)]*FFT{exp(j2πNk0n)}]]>所表示,其中,符號(hào)*表示使用所述FIR濾波器所生成的初步FIR濾波計(jì)算的圓周卷積,x(n)表示輸入音頻信號(hào)、FFT{x(n)}表示所述輸入音頻信號(hào)的FFT結(jié)果、Xc(k)表示所述MDCT塊的轉(zhuǎn)換結(jié)果、Xs(k)表示所述MDST塊的轉(zhuǎn)換結(jié)果、n0和k0表示所述MDCT塊中使用的常數(shù)、n表示所述輸入音頻信號(hào)的采樣索引、N表示轉(zhuǎn)換窗口的窗口長(zhǎng)度、 表示所述移動(dòng)塊的移動(dòng)結(jié)果。
7.如權(quán)利要求6所述的設(shè)備,其特征在于,所述FIR濾波器的輸出結(jié)果表示為第二等式 且等于所述初步FIR濾波結(jié)果,其中a0表示 的第一系數(shù)值、a1表示 的第二系數(shù)值、t(k)表示為t(k)=[(Xc(k)-jXs(k))·exp(j2πNn0k)].]]>
8.如權(quán)利要求6所述的設(shè)備,其特征在于,所述第一等式表示當(dāng)所述FFT的窗口與所述MDCT的窗口不同時(shí)使用漢納窗口的FFT結(jié)果。
9.如權(quán)利要求6所述的設(shè)備,其特征在于,表示所述FFT結(jié)果并應(yīng)用漢納窗口的所述第一等式可改變?yōu)槿缦滤龅牡谌仁紽FT{x(n)hH(n)}=]]>FFT{x(n)hs(n)·hH(n)hs(n)}=[(Xc(k)-jXs(k))·exp(j2πNn0k)]*FFT{exp(j2πNn0k)hH(n)hs(n)}]]>這樣所述第三等式對(duì)應(yīng)用到所述FFT和所述MDCT塊的不同窗口做出了補(bǔ)償。
10.一種音頻編碼方法。包括使用改良型離散余弦變換(MDCT)將輸入時(shí)域音頻信號(hào)轉(zhuǎn)換為頻域音頻信號(hào);使用改良型離散正弦變換(MDST)轉(zhuǎn)換所述輸入時(shí)域音頻信號(hào);以及通過將所述MDCT和所述MDST的轉(zhuǎn)換結(jié)果應(yīng)用到心理聲學(xué)模型來確定每個(gè)頻率的最大可允許量化噪聲量。
11.如權(quán)利要求10所述的方法,其特征在于,所述方法還包括將所述MDCT的變換結(jié)果和所述MDST的變換結(jié)果的組合移動(dòng)預(yù)定值;并且在所述移動(dòng)結(jié)果上執(zhí)行有限脈沖相應(yīng)(FIR)濾波。
12.如權(quán)利要求11所述的方法,其特征在于還包括根據(jù)所述濾波結(jié)果確定最大可允許量化噪聲量。
13.如權(quán)利要求11所述的方法,其特征在于,還包括執(zhí)行初步FIR濾波。
14.如權(quán)利要求11所述的方法,其特征在于,所述濾波結(jié)果對(duì)應(yīng)于與所述輸入音頻信號(hào)相關(guān)聯(lián)的快速傅立葉變換(FFT)結(jié)果的第一系數(shù)和第二系數(shù)。
15.如權(quán)利要求14所述的方法,其特征在于,所述FFT結(jié)果可由所述MDCT的轉(zhuǎn)換結(jié)果和所述MDST的轉(zhuǎn)換結(jié)果形成的第一等式FFT{x(n)}=[(Xc(k)-jXs(k))·exp(j2πNn0k)]*FFT{exp(j2πNk0n)}]]>所表示,其中,符號(hào)*表示使用初步FIR濾波計(jì)算的圓周卷積,x(n)表示輸入音頻信號(hào)、FFT{x(n)}表示所述輸入音頻信號(hào)的FFT結(jié)果、Xc(k)表示所述MDCT的轉(zhuǎn)換結(jié)果、Xs(k)表示所述MDST的轉(zhuǎn)換結(jié)果、n0和k0表示所述MDCT中使用的常數(shù)、n表示所述輸入音頻信號(hào)的采樣索引、N表示轉(zhuǎn)換窗口的窗口長(zhǎng)度、 表示所述移動(dòng)結(jié)果。
16.如權(quán)利要求15所示的方法,其特征在于,所述FIR濾波器的輸出結(jié)果表示為第二等式 且等于所述初步FIR濾波結(jié)果,其中a0表示 的第一系數(shù)值、a1表示 的第二系數(shù)值、t(k)表示為t(k)=[(Xc(k)-jXs(k))·exp(j2πNn0k)].]]>
17.如權(quán)利要求15所示的方法,其特征在于,所述第一等式表示當(dāng)所述FFT的窗口與所述MDCT的窗口不同時(shí)使用漢納(Hann)窗口的FFT結(jié)果。
18.如權(quán)利要求15所示的方法,其特征在于,表示FFT結(jié)果并應(yīng)用漢納窗口的所述第一等式可改變?yōu)槿缦滤龅牡谌仁紽FT{x(n)hH(n)}=]]>FFT{x(n)hs(n)·hH(n)hs(n)}=[(Xc(k)-jXs(k))·exp(j2πNn0k)]*FFT{exp(j2πNn0k)hH(n)hs(n)}]]>這樣所述第三等式對(duì)應(yīng)用到所述FFT和所述MDCT塊的不同窗口做出了補(bǔ)償。
全文摘要
揭示了一種音頻編碼方法和設(shè)備,能夠增強(qiáng)MPEG-4AAC(移動(dòng)圖像專家組-4高級(jí)音頻編碼)處理的效率。該音頻編碼方法和設(shè)備減少了音頻編碼算法的計(jì)算量以增強(qiáng)音頻編碼處理的效率。尤其是,該音頻編碼方法和設(shè)備減少了對(duì)音頻信號(hào)進(jìn)行編碼的MPEG-4AAC算法中心理聲學(xué)模型處理所需的計(jì)算量。
文檔編號(hào)H03M7/40GK1841938SQ200610073708
公開日2006年10月4日 申請(qǐng)日期2006年3月31日 優(yōu)先權(quán)日2005年3月31日
發(fā)明者康泰益, 崔珍奎, 李瑾燮, 樸榮喆, 尹大熙 申請(qǐng)人:Lg電子株式會(huì)社
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
长子县| 北票市| 龙陵县| 抚松县| 兰考县| 洛扎县| 获嘉县| 婺源县| 孙吴县| 桂东县| 陵川县| 北京市| 麦盖提县| 开平市| 布拖县| 新宁县| 化州市| 芮城县| 房产| 永川市| 资阳市| 青州市| 佛坪县| 曲阳县| 胶州市| 永川市| 临城县| 明溪县| 德江县| 陈巴尔虎旗| 昌邑市| 根河市| 宜黄县| 大足县| 济宁市| 武陟县| 新丰县| 萨嘎县| 偏关县| 汉沽区| 昌乐县|