專利名稱:用于轉(zhuǎn)換為變換表示或?qū)ψ儞Q表示進(jìn)行反轉(zhuǎn)換的設(shè)備和方法
技術(shù)領(lǐng)域:
本發(fā)明涉及用于具有音頻和/或圖像信息的離散值的壓縮算法,尤其涉及變換算法,該變換算法特別用于基于變換的編碼器中,基于變換表示不對(duì)原始音頻和/或圖像信號(hào)進(jìn)行量化/編碼,而是包括在量化/編碼之前變換到譜范圍中。
背景技術(shù):
現(xiàn)代音頻編碼方法,如MPEG Layer3(MP3)或MPEG AAC使用變換,如所謂的改進(jìn)離散余弦變換(MDCT),以獲得音頻信號(hào)的按組(block-wise)頻率表示。通常,這樣的音頻編碼器接收時(shí)間離散音頻采樣流。音頻采樣流被加窗以獲得例如1024或2048個(gè)加窗的音頻采樣的加窗塊。為了加窗,使用不同窗函數(shù),如正弦窗,等等。
然后,加窗的時(shí)間離散音頻采樣經(jīng)濾波器組轉(zhuǎn)換為譜表示。原則上,可使用傅立葉變換,或?yàn)榱颂厥庠?,使用傅立葉變換的變型,如FFT或,如上面解釋的MDCT。然后,如果需要,可進(jìn)一步處理濾波器組輸出端上的音頻譜值。在上面提到的音頻編碼器中,隨后進(jìn)行音頻譜值的量化,其中通常這樣選擇量化級(jí),使得由量化引入的量化噪聲低于心理聲學(xué)掩蔽閾值(psycho-acoustic masking threshold),即被“掩蔽掉(masked away)”。量化是一種有損耗的編碼。為了獲得進(jìn)一步的數(shù)據(jù)量減少,量化的譜值然后被熵編碼(entropyencoded),例如經(jīng)Huffman編碼。通過添加邊信息(side information),如標(biāo)度因子等等,位流多路復(fù)用器從熵編碼的量化譜值形成可被存儲(chǔ)或傳輸?shù)奈涣鳌?br>
在音頻解碼器中,位流經(jīng)位流分解器分成編碼的量化譜值和邊信息。熵編碼的量化譜值首先被熵解碼,以獲得量化的譜值。量化譜值然后被反量化以獲得解碼的譜值,解碼的譜值具有量化噪聲,該量化噪聲低于心理聲學(xué)掩蔽閾值,因此是聽不到的。這些譜值然后經(jīng)綜合濾波器組轉(zhuǎn)換為時(shí)域表示(time representation)以獲得時(shí)間離散的解碼音頻采樣。在綜合濾波器組中必須使用與上面的變換算法逆反的變換算法。此外,在頻域到時(shí)域的反變換之后必須取消加窗。
為了獲得好的頻率選擇性,現(xiàn)代音頻編碼器通常使用塊交疊(block overlapping)。一個(gè)這樣的例子示于圖12a中。首先,例如,2048個(gè)時(shí)間離散的音頻采樣被接收并經(jīng)裝置402被加窗。表示裝置402的窗具有2N個(gè)采樣的窗長(zhǎng)度,并在輸出側(cè)提供2N個(gè)加窗采樣的塊。為了實(shí)現(xiàn)窗重疊,通過裝置404形成第二2N個(gè)采樣的塊,裝置404在圖12a中僅為了清晰的原因而與裝置402分開表示。然而,饋入裝置404中的2048個(gè)采樣不是與第一窗直接相鄰的時(shí)間離散的音頻采樣,而是包括被裝置402加窗的采樣的后半部分,并且僅僅另外包括1024個(gè)“新的”采樣。重疊通過圖12a中的裝置406被象征性地圖解說明,它實(shí)現(xiàn)了50%的重疊度。由裝置402輸出的2N個(gè)加窗的采樣和由裝置404輸出的2N個(gè)加窗的采樣然后分別通過裝置408和410都執(zhí)行MDCT算法。按照公知的MDCT算法,裝置408提供第一窗的N個(gè)譜值,而裝置410也提供N個(gè)譜值,但是是第二窗的N個(gè)譜值,其中在第一窗和第二窗之間存在50%的重疊。
如圖12b所示,在解碼器中,第一窗的N個(gè)譜值被提供給裝置412,該裝置412執(zhí)行反向的改進(jìn)離散余弦變換。這同樣適用于第二窗的N個(gè)譜值。這些譜值被提供給也執(zhí)行反向的改進(jìn)離散余弦變換的裝置414。裝置412和裝置414每個(gè)都分別提供第一窗的2N個(gè)采樣和第二窗的2N個(gè)采樣。
在圖12b中被標(biāo)示為TDAC(TDAC=時(shí)域混迭消除)的裝置416中考慮了這兩個(gè)窗交疊的事實(shí)。特別地,第一窗后半部分的采樣y1,即索引為N+k的采樣,和第二窗前半部分的采樣y2,即索引為k的采樣加和,使得在輸出側(cè),即在解碼器,生成N個(gè)解碼的時(shí)間采樣。
應(yīng)該指出,通過裝置416的函數(shù),該函數(shù)也稱為加函數(shù),在圖12a中示意示出的編碼器中執(zhí)行的加窗被自動(dòng)考慮,使得在圖12b中所示的解碼器中不必須執(zhí)行明確的“反加窗”。
如果由裝置402或404執(zhí)行的窗函數(shù)被稱為w(k),其中索引k表示時(shí)間索引,則必須滿足以下條件,即窗加權(quán)w(k)的平方與窗加權(quán)w(N+k)的平方相加等于1,其中k從0到N-1。如果使用其窗加權(quán)遵從正弦函數(shù)的前半波的正弦窗,則該條件總是滿足的,因?yàn)閷?duì)于每個(gè)角,正弦的平方和余弦的平方相加等于值1。
圖12a中描述的帶有隨后MDCT函數(shù)的加窗方法不足之處在于,通過乘以時(shí)間離散的采樣值而實(shí)現(xiàn)加窗,在考慮正弦窗時(shí),時(shí)間離散的采樣值具有浮點(diǎn)數(shù),因?yàn)槌?0度角之外,0到180度之間的角的正弦不產(chǎn)生整數(shù)。即使整數(shù)的時(shí)間離散的采樣被加窗,在加窗之后也產(chǎn)生浮點(diǎn)數(shù)。
因此,即使不使用心理聲學(xué)編碼器,這意味著當(dāng)要獲得無損編碼時(shí),需要在裝置408和410的輸出端進(jìn)行量化,以便能夠執(zhí)行合理的可管理的熵編碼。
一般地,當(dāng)前公知的用于無損音頻和/或視頻編碼的整數(shù)變換是通過將其中所使用的變換分離成Givens旋轉(zhuǎn),并通過對(duì)每個(gè)Givens旋轉(zhuǎn)應(yīng)用提升方案(lifting scheme)而獲得的。因此,在每一步中都引入舍入誤差。對(duì)于Givens旋轉(zhuǎn)的隨后階段,舍入誤差保持累加。尤其對(duì)于無損音頻解碼,得到的近似誤差變得難以解決,特別是當(dāng)使用長(zhǎng)的變換時(shí),長(zhǎng)變換提供例如1024個(gè)譜值,例如在公知的具有交疊和加和的MDCT的情形(MDCT=改進(jìn)的離散余弦變換)。特別在更高頻率范圍內(nèi),其中音頻信號(hào)通常具有非常低的能量,近似誤差可能快速地變得大于實(shí)際信號(hào),使得該方法對(duì)于無損編碼,特別是對(duì)于由此可達(dá)到的編碼效率是有問題的。
對(duì)于音頻編碼,生成整數(shù)輸出值的整數(shù)變換,即變換算法,特別基于公知的不考慮恒定成分(constant component)的DCT-IV,而用于圖像應(yīng)用的整數(shù)變換是基于DCT-II的,DCT-II特別包含用于恒定成分的條件。這樣的整數(shù)變換在下列文章中描述,例如2001年5月的Proc.ICASSP’01第1181-1184頁中Y.Zeng,G.Bi和Z.Lin的“Integer sinusoidal transforms based on lifting factorization”、Proc.ICASSP 1998年第三卷第1769-1772頁中K.Komatsu和K.Sezaki的“Reversible Discrete Cosine Transform”,IEEE Trans.SignalProcessing,Signal Processing第49卷的2314-2324頁中P.Hao和Q.Shi的“Matrix factorizations for reversible integer mapping”、和J.Wang,J.Sun和S.Yu在2003年4月香港的ICASSP’03的“1-d and2-d transforms from integers to integers”。
如上面解釋的那樣,這里描述的整數(shù)變換是基于將變換分離成Givens旋轉(zhuǎn),并基于將公知的提升方案應(yīng)用至Givens旋轉(zhuǎn),這涉及累積舍入誤差的問題。這特別是由于在一個(gè)變換內(nèi),即每個(gè)提升步驟之后,必須執(zhí)行幾次取整,使得特別是在相應(yīng)地涉及許多提升步驟的、長(zhǎng)的變換中,必須特別經(jīng)常地執(zhí)行取整。如已經(jīng)解釋的那樣,這導(dǎo)致累積的誤差,并特別導(dǎo)致相對(duì)復(fù)雜的處理,因?yàn)樵诿總€(gè)提升步驟之后執(zhí)行取整,以執(zhí)行下一個(gè)提升步驟。
發(fā)明內(nèi)容
本發(fā)明的目的是提供更有效和精確的設(shè)計(jì),用于將離散值轉(zhuǎn)換為變換的表示,并用于該變換的表示的相應(yīng)反變換。
本發(fā)明的這個(gè)目的是通過按照權(quán)利要求1的轉(zhuǎn)換設(shè)備,按照權(quán)利要求17的轉(zhuǎn)換方法,按照權(quán)利要求19的反轉(zhuǎn)換設(shè)備,按照權(quán)利要求21的反轉(zhuǎn)換方法或按照權(quán)利要求24的計(jì)算機(jī)程序?qū)崿F(xiàn)的。
本發(fā)明進(jìn)一步的目的是提供正向變換設(shè)備和反向變換設(shè)備,其分別包括用于轉(zhuǎn)換的發(fā)明構(gòu)思和用于反轉(zhuǎn)換的發(fā)明構(gòu)思。
該目的是通過按照權(quán)利要求16的正向變換設(shè)備,按照權(quán)利要求18的正向變換方法,按照權(quán)利要求22的反向變換設(shè)備或按照權(quán)利要求23的反向變換方法或按照權(quán)利要求24的計(jì)算機(jī)程序?qū)崿F(xiàn)的。
本發(fā)明基于這樣的認(rèn)識(shí),即通過將一維提升方案擴(kuò)展至多維提升方案以及通過至少兩個(gè)這種提升步驟的級(jí)聯(lián)執(zhí)行,一方面降低輸入誤差,另一方面,提高計(jì)算效率。因此,按照本發(fā)明,需要至少兩塊包括音頻和/或圖像信息的值,對(duì)這些至少兩個(gè)塊中的每個(gè)塊進(jìn)行任意變換算法。按照本發(fā)明,僅在執(zhí)行完整的變換算法之后執(zhí)行取整。這意味著,僅例如第一變換的輸出結(jié)果值,如譜值,和第二變換的輸出結(jié)果值被取整。因此,不需要在變換內(nèi)取整。因此,任意存在的、特別是任何已經(jīng)測(cè)試的變換規(guī)則,例如現(xiàn)有的并可自由利用的程序代碼形式的變換規(guī)則,可用作第一變換規(guī)則和第二變換規(guī)則,而不必如現(xiàn)有技術(shù)中的那樣,通過干涉實(shí)際變換而將變換本身分成各個(gè)旋轉(zhuǎn)。
按照本發(fā)明,通過將第二塊與第一塊的變換表示相加,第二塊被用作第一塊的變換表示的載波。進(jìn)一步,按照本發(fā)明,通過從第一塊中減去第二塊的變換的表示,第一塊被用作第二塊的變換表示的載波,其中第二塊的變換的表示已經(jīng)包含第一塊的譜值。
因?yàn)?,按照本發(fā)明,僅在第一和第二變換之后執(zhí)行取整,且因?yàn)槿≌捣謩e被加性和減性地疊加在相應(yīng)的載波值上,所以在逆轉(zhuǎn)換中可以沒有數(shù)據(jù)損失地實(shí)現(xiàn)取消在轉(zhuǎn)換中執(zhí)行的步驟,使得實(shí)現(xiàn)整數(shù)變換算法,該整數(shù)變換算法一方面可以計(jì)算有效的方式執(zhí)行,并且另一方面不產(chǎn)生舍入誤差的累積。這是由于這樣的事實(shí),即僅在完整的第一或第二變換之后執(zhí)行取整,這一方面消除了舍入誤差的累積,另一方面,與將變換本身分成旋轉(zhuǎn)的情形相比顯著減少了取整步驟的數(shù)量,在將變換本身分成旋轉(zhuǎn)的情形中,在實(shí)際變換算法中,在每次提升步驟之后執(zhí)行取整。
本發(fā)明的一個(gè)優(yōu)點(diǎn)是可以進(jìn)一步使用任何傳統(tǒng)的非整數(shù)變換規(guī)則,因?yàn)閮H在變換之后必須執(zhí)行取整。
進(jìn)一步,本發(fā)明是有利的,因?yàn)榭墒褂每焖偎惴?,其消耗O不根據(jù)N2增加,而僅根據(jù)NlogN增加。這對(duì)于音頻信號(hào)特別重要,因?yàn)橹礜,即變換長(zhǎng)度,在音頻信號(hào)中相對(duì)較大,并且在上述公知音頻壓縮方法中約為1024個(gè)值。
在本發(fā)明優(yōu)選實(shí)施例中,其中使用已知的浮點(diǎn)MDCT變換的整數(shù)版本,公知的、對(duì)于第一和第二變換包括相同變換矩陣作為變換規(guī)則的DCT-IC變換是變換規(guī)則。進(jìn)一步,為了獲得對(duì)應(yīng)于帶有交疊和相加的MDCT的完全整數(shù)變換,優(yōu)選地將通常的MDCT的加窗與時(shí)域混迭消除功能性(TDAC功能性)結(jié)合,并通過Givens旋轉(zhuǎn)表達(dá)它,Givens旋轉(zhuǎn)又可以通過提升方案整數(shù)地計(jì)算,以實(shí)現(xiàn)MDCT的完全整數(shù)版本。
被提供給根據(jù)本發(fā)明的轉(zhuǎn)換設(shè)備的兩塊離散值對(duì)應(yīng)于時(shí)間離散音頻采樣或離散圖像采樣或在現(xiàn)代視頻壓縮算法預(yù)測(cè)后圖像殘余值的交疊加窗塊的Givens旋轉(zhuǎn)值,其中在音頻數(shù)據(jù)的情形中,DCT-IV算法優(yōu)選作為變換算法。在解碼器一側(cè),DCT-IV算法又優(yōu)選作為頻率時(shí)間變換設(shè)備,在DCT-IV算法后跟隨有旋轉(zhuǎn)級(jí),該旋轉(zhuǎn)級(jí)執(zhí)行逆提升方案以無損耗地再現(xiàn)在編碼器側(cè)引入的N個(gè)取整,即在時(shí)間頻率變換中引入的取整。
以下將參考
本發(fā)明的優(yōu)選實(shí)施例,附圖分別示出圖1是根據(jù)本發(fā)明的用于轉(zhuǎn)換的設(shè)備的方框圖;圖2是根據(jù)本發(fā)明的用于逆轉(zhuǎn)換的設(shè)備的方框圖;圖3是按照本發(fā)明優(yōu)選實(shí)施例的轉(zhuǎn)換設(shè)備的方框圖;圖4是按照本發(fā)明優(yōu)選實(shí)施例的逆轉(zhuǎn)換設(shè)備;圖5是值的兩個(gè)相繼塊的變換的表示,其可應(yīng)用于本發(fā)明;圖6是具有正向變換矩陣的多維提升步驟的詳細(xì)表示;圖7是具有反向變換矩陣的多維逆提升步驟的詳細(xì)表示;圖8是本發(fā)明的表示,用于將長(zhǎng)度為N的DCT-IV分成兩個(gè)N/2長(zhǎng)度的DCT-IV;圖9是優(yōu)選裝置的方框圖,用于處理時(shí)間離散的音頻采樣以獲得整數(shù)值,通過該整數(shù)值可確定整數(shù)譜值;圖10是將MDCT和逆MDCT分為Givens旋轉(zhuǎn)和兩個(gè)DCT-IV操作的示意表示;
圖11是用于示出將具有50%交疊的MDCT分成旋轉(zhuǎn)和DCT-IV操作的表示;圖12a是帶有MDCT和50%交疊的公知編碼器的示意方框圖;和圖12b是用于解碼圖10a所生成的值的公知解碼器的方框圖。
具體實(shí)施例方式
圖1示出了根據(jù)本發(fā)明的、用于將離散值轉(zhuǎn)換為具有整數(shù)值的變換表示的設(shè)備。離散值經(jīng)第一輸出端100a和第二輸入端100b饋送到根據(jù)本發(fā)明的設(shè)備。第一塊離散值經(jīng)輸入端100a饋入,而第二塊離散值經(jīng)輸入端100b饋入。離散值分別表示音頻數(shù)據(jù)或圖像數(shù)據(jù)和視頻數(shù)據(jù)。如下面將解釋的那樣,第一塊離散值和第二塊離散值實(shí)際可包括兩塊時(shí)間上連續(xù)的音頻采樣。第一和第二塊離散值也可分別包括兩個(gè)在預(yù)測(cè)后由離散值表示的圖像和殘余值,或在差分編碼(differenceencoding)中的差值,等等??蛇x地,這兩塊離散值可已經(jīng)被預(yù)處理,如在MDCT的整數(shù)實(shí)現(xiàn)中,其中已經(jīng)由Givens旋轉(zhuǎn)從實(shí)際加窗的采樣中生成第一塊和第二塊離散值。因此,可通過任何處理,如旋轉(zhuǎn),置換,正/負(fù)蝶形(butteflies),縮放等等,從原始音頻數(shù)據(jù)或圖像數(shù)據(jù)中獲得第一和第二塊離散值。而且,第一和第二塊離散值分別包含音頻信息和圖像信息,雖然它們不直接是音頻采樣或離散圖像值。
第一塊離散值經(jīng)輸入端100a被饋入到裝置102,以通過使用第一變換規(guī)則處理第一塊離散值,以在裝置102a的輸出端獲得第一塊變換的值,如圖1所示。該第一塊變換的值通常不是整數(shù),而是包括浮點(diǎn)值,如同它們通常通過任何變換規(guī)則,如傅立葉變換、拉普拉斯變換、FFT,DCT,DST,MDCT,MDST或諸如具有任意基函數(shù)(basefunctions)的小波變換的任何其他變換,所獲得的那樣。第一塊變換值被饋送到裝置104,以對(duì)第一塊變換值取整,從而在輸出側(cè)獲得第一塊取整的變換值。形成用于取整的裝置104以執(zhí)行任何取整功能,如通過舍棄的取整或根據(jù)浮點(diǎn)值執(zhí)行的向上取整或向下取整。
因此,由裝置104執(zhí)行的取整規(guī)則負(fù)責(zé)第一塊取整的變換值又僅具有整數(shù)值,其精度由裝置104所使用的取整規(guī)則決定。第一塊取整的變換值被提供給用于求和的裝置106,而第二塊離散值被提供給第二輸入端100b,以獲得第二塊加和的值。如果考慮音頻信號(hào)例子,可以看到,通過裝置106將來自第一塊取整變換值的譜值被添加到來自第二塊離散值的時(shí)間值上。如果第二塊的離散值例如作為電壓值出現(xiàn),那么建議第一塊取整的變換值也是作為電壓幅值,即單位為V的值,出現(xiàn)。在這種情況下,在求和中沒有單位問題。然而,本領(lǐng)域技術(shù)人員可以理解,用第一塊取整的變換值或用第二塊離散值可以進(jìn)行任何單位標(biāo)準(zhǔn)化,因?yàn)榈谝粔K取整的變換值和第二塊離散值都是例如沒有單位的。
第二塊加和值被提供至裝置108,以利用第二變換規(guī)則處理第二塊加和值,從而獲得第二塊變換值。如果裝置102中所利用的變換規(guī)則是例如時(shí)間頻率變換規(guī)則,那么塊108中所利用的第二變換規(guī)則是例如頻率時(shí)間變換規(guī)則。這些關(guān)系也可以逆轉(zhuǎn),使得第一和第二塊離散值是例如譜值,從而通過用于在變換規(guī)則下處理的裝置102獲得時(shí)間值,而又通過用于經(jīng)由反變換規(guī)則處理的裝置,即裝置108,獲得譜值。因此,第一和第二變換規(guī)則可以是正向變換規(guī)則或反向變換規(guī)則,其中反變換規(guī)則分別是反向變換規(guī)則和正向變換規(guī)則。
第二塊變換值被饋送到用于取整的裝置110,如圖1所示,以獲得第二塊取整的變換值,該取整的變換值然后被饋送到用于減法的裝置112,以從經(jīng)第一輸入端108a饋入的第一塊離散值中減去第二塊取整的變換值,以獲得一塊變換表示的整數(shù)輸出值,其可以在輸出端114輸出。通過使用任意第三變換規(guī)則處理該塊變換表示的整數(shù)輸出值,且通過隨后對(duì)該塊變換輸出值取整以獲得一塊取整的變換輸出值,并通過隨后對(duì)該塊取整的變換輸出值和第二塊加和值求和,可獲得另一塊變換表示的整數(shù)輸出值,其中該任意第三變換規(guī)則也已經(jīng)應(yīng)用在裝置102中或與其不同,該另一塊整數(shù)輸出值通過那塊位于輸出端114的整數(shù)輸出值提供第一和第二塊離散值的完整變換表示。
但是,即使沒有最后三個(gè)處理、取整和求和步驟,其中該塊變換表示整數(shù)輸出值被施加到輸出端114,可獲得整個(gè)變換表示的一部分,也就是例如前半部分,其當(dāng)受到逆處理時(shí)使得能夠重新計(jì)算第一塊離散值和第二塊離散值。
這里,應(yīng)該指出,根據(jù)變換規(guī)則,第一、第二,以及必要時(shí)還有第三變換規(guī)則可以是相同的。例如,在DCT-IV中的情形。如果FFT用作第一變換規(guī)則,則與FFT不同的IFFT可用作第二(逆)變換規(guī)則。
出于計(jì)算的原因,優(yōu)選地提供矩陣形式的變換規(guī)則,于是當(dāng)?shù)谝粔K的離散值數(shù)量等于第二塊的離散值數(shù)量時(shí),如果第一塊的離散值數(shù)量和第二塊的離散值數(shù)量都等于N,則該矩陣是N×N的方陣。
在本發(fā)明的一個(gè)優(yōu)選實(shí)施例中,構(gòu)造用于取整的裝置104和110,以根據(jù)取整函數(shù)進(jìn)行取整,該取整函數(shù)提供取整的結(jié)果,其精度小于執(zhí)行圖1所示功能的計(jì)算機(jī)固有的機(jī)器精度。按照取整函數(shù),應(yīng)該指出,取整函數(shù)在一個(gè)優(yōu)選實(shí)施例中僅將非整數(shù)數(shù)字映射到相鄰的較高或較小整數(shù),如數(shù)字17.7映射到數(shù)字10或數(shù)字20,只要取整函數(shù)降低要取整的數(shù)字的精度。在上面的例子中,未取整的數(shù)字是小數(shù)點(diǎn)后有一個(gè)數(shù)位的數(shù)字,而取整的數(shù)字是小數(shù)點(diǎn)后沒有數(shù)位的數(shù)字。
雖然在圖1中將用于利用第一變換規(guī)則進(jìn)行處理的裝置102和用于利用第二變換規(guī)則進(jìn)行處理的裝置108示為分開的裝置,但是應(yīng)該指出,在具體實(shí)施中,可以僅有一個(gè)變換功能單元,其由特定序列控制來控制,首先變換第一塊離散值,然后在算法的相應(yīng)時(shí)刻反變換第二塊加和值。于是,第一和第二變換規(guī)則是相同的。這同樣地適用于用于取整的裝置104、110。它們也不必被提供為分開的裝置,而是可以由取整功能單元執(zhí)行,其由序列控制根據(jù)算法的要求控制,首先取整第一塊變換值,然后取整第二塊變換值。
在本發(fā)明的一個(gè)優(yōu)選實(shí)施例中,第一塊離散值和第二塊離散值是整數(shù)加窗采樣,如它們是在圖9中塊28的輸出端獲得的,圖9將在下面討論。于是,通過圖1中所示的整數(shù)算法實(shí)現(xiàn)圖9的塊14中的整數(shù)DCT,使得例如對(duì)于圖9所涉及的音頻信號(hào),變換表示代表圖9中所示裝置的輸出端30上的整數(shù)譜值。
以下,將借助于圖2說明對(duì)應(yīng)于圖1的用于反變換的裝置,其中除了圖1的塊112的輸出端上的那塊整數(shù)輸出值之外,還使用圖1的裝置106的輸出端上的第二塊加和值。參考將在下面更詳細(xì)地討論的圖4,這對(duì)應(yīng)于僅存在塊150和130而沒有變換塊124的情形。
圖2示出了根據(jù)本發(fā)明的、用于對(duì)變換表示的一塊整數(shù)輸出值,如在圖1的輸出端114上所獲得的那塊整數(shù)輸出值,以及第二塊加和值進(jìn)行逆轉(zhuǎn)換的設(shè)備。第二塊加和值被饋送到圖2中所示的逆轉(zhuǎn)換設(shè)備的輸入端120。變換表示的該塊輸出值被饋送到逆轉(zhuǎn)換設(shè)備的另一個(gè)輸入端122。
如果編碼中最后使用的變換規(guī)則是第二變換規(guī)則,則第二塊加和值被饋送到裝置130,該裝置130用于通過使用第二變換規(guī)則處理該塊。在輸出側(cè),裝置130提供第一塊變換值,其被提供給用于取整的裝置132,裝置132又在輸出側(cè)生成第一塊取整的變換值。然后由裝置134從變換表示的輸出值塊減去第一塊取整的變換值,以便在圖2的設(shè)備的第一輸出端149上獲得第一塊離散值。
該第一塊離散值被提供給裝置150,裝置150用于通過使用第一變換規(guī)則處理該塊以在裝置150的輸出端獲得第二塊變換值。該第二塊變換的減去值又在裝置152中取整,以獲得第二塊取整的變換值。然后從在輸出側(cè)上提供的、已經(jīng)通過輸入端120輸入的第二塊加和值中減去該第二塊取整的變換值,以在輸出側(cè)的輸出端136上獲得第二塊離散值。
對(duì)于第一、第二、和第三變換規(guī)則的關(guān)系以及對(duì)于通過公共功能單元和相應(yīng)的序列控制/臨時(shí)存儲(chǔ)器具體實(shí)現(xiàn)圖2中各個(gè)功能塊,參考圖1說明。
下面,參考圖3討論圖1中一般示出的、用于轉(zhuǎn)換到變換表示的設(shè)備的優(yōu)選實(shí)施例。和圖1相比,圖1中的實(shí)施例包括進(jìn)一步的變換/取整,以便從第二塊加和值中生成另一塊整數(shù)輸出值。
第一輸入端100a包括N條輸入線x0,...,xN-1,用于輸入第一塊離散值的N個(gè)值。第二輸入端100b也包括N條線,用于輸入第二塊離散值的N個(gè)值xN,...,x2N-1。圖1的裝置102在圖3中示為DCT-IV變換器。構(gòu)造DCT變換器102以由N個(gè)輸入值生成N個(gè)輸出值,每個(gè)輸出值然后將由裝置104通過由“[·]”指示的取整規(guī)范而取整,如圖3所示。這樣表示用于求和的裝置106,使得進(jìn)行數(shù)值方式的累加。這意味著,裝置102的索引為0的輸出值與第二塊離散值的索引為N的第一值加和。因此,一般地,第一塊取整的變換值的序數(shù)為i的值在取整裝置104的輸出端分別與第二塊輸出值的序數(shù)為N+i的離散值加和,其中i是從0到N-1的循環(huán)變量。
用于通過使用第二變換規(guī)則進(jìn)行處理的裝置108也被表示為DCT-IV變換器。在圖3所示的優(yōu)選實(shí)施例中,還構(gòu)造用于減法的裝置112,以執(zhí)行數(shù)值方式的減法,即,取整器110的輸出值,即第二塊取整的變換值的值,被分別從第一塊離散值中減去。在圖3所示的實(shí)施例中,優(yōu)選地執(zhí)行相應(yīng)的減法,即將第二塊的序數(shù)為N+i的值從第一塊的序數(shù)為i的值中減去,其中i也是從0到N-1??蛇x地,可執(zhí)行其他加和/減法,例如將一塊中序數(shù)為N-1的值從另一塊中序數(shù)為N-1的值中減去,只要這相應(yīng)地在逆轉(zhuǎn)換中被考慮。
在輸出側(cè),用于減法的裝置112已經(jīng)提供變換表示的一塊整數(shù)輸出值,即變換表示的整數(shù)輸出值y0到y(tǒng)N-1。如果可選地希望獲得變換表示的其余整數(shù)輸出值,即另一塊yN到y(tǒng)2N-1,則由正向變換器140通過使用第三變換規(guī)則對(duì)變換表示的位于輸出端114的那塊整數(shù)輸出值進(jìn)行變換,其中正向變換器140的輸出值也被取整,如取整裝置142所示,以執(zhí)行這些值與第二塊加和值在加法器106的輸出端上的加和,如圖3中附圖標(biāo)記144所示。加法器144的輸出值表示變換表示的另一塊的整數(shù)輸出值146,其由yN到y(tǒng)2N-1表示。
下面,將參考圖4說明根據(jù)本發(fā)明的、用于對(duì)根據(jù)優(yōu)選實(shí)施例的變換表示進(jìn)行逆轉(zhuǎn)換的設(shè)備。應(yīng)該指出,圖3中設(shè)備所執(zhí)行的操作可由圖4所示設(shè)備以無損方式反向處理。除了用于根據(jù)在圖2所示實(shí)施例中被饋入輸入端120的另一塊變換的輸出值生成第二塊加和值的附加變換/取整級(jí)以外,圖4對(duì)應(yīng)于圖2。應(yīng)該指出,加法功能分別被加法功能逆反。進(jìn)一步地,應(yīng)該指出,也可以向加法器/減法器對(duì)(圖3的144和圖4的128)提供符號(hào)相反的輸入量,使得當(dāng)一組輸入量與所示情形相比具有相反的符號(hào)時(shí),加法器144實(shí)際執(zhí)行減法操作,只要這一點(diǎn)在然后實(shí)際執(zhí)行加法操作的相應(yīng)部件(圖4中的128)中被考慮。
又構(gòu)造圖4中所示的減法器128、加法器134和另一減法器154,以執(zhí)行單個(gè)數(shù)值方式的加法/減法,其中還使用與已經(jīng)參考圖3所表示的序數(shù)相同的序數(shù)處理。如果在圖3中使用與圖示不同的序數(shù)用法,這將在圖4中相應(yīng)地考慮。
由x0到xN-1表示的第一塊離散值136已經(jīng)出現(xiàn)在減法器134的輸出端。為了還獲得余下的反變換表示,第一塊離散值被提供給以第一變換規(guī)則操作的變換器150,其輸出側(cè)的值被取整器152取整,并從減法器128的輸出端的第二塊減去值中減去,以最終獲得第二塊離散值156,它們由xN,...,x2N-1指示。
下面,參考圖5-8,討論如圖1-4所示的用于根據(jù)本發(fā)明的設(shè)備的數(shù)學(xué)背景。通過根據(jù)本發(fā)明的、分別用于轉(zhuǎn)換和用于逆轉(zhuǎn)換的設(shè)備,提供了用于無損音頻編碼的整數(shù)變換方法,其中減小了近似誤差。此外,還考慮了計(jì)算消耗,即不再使用公知的將提升方案應(yīng)用到每個(gè)Givens旋轉(zhuǎn)的方法,其中總是出現(xiàn)微小的(trivial)和差蝶形(sum-difference butterfly)。與要復(fù)制的變換的原始非整數(shù)版本相比,它們顯著增加了計(jì)算消耗。
通常地,使用提升方案,以獲得Givens旋轉(zhuǎn)的可逆整數(shù)近似。
cosα-sinsinαcosα≅1cosα-1sinα0110sinα11cosα-1sinα01]]>通過在每次加法之后,即在每個(gè)提升步驟之后,使用取整函數(shù)而獲得該整數(shù)近似。
提升方案也可用于某些縮放操作的可逆整數(shù)近似。在專業(yè)出版物R.Geiger和G.Schuller,“Integer low delay and MDCT filter banks”Proc.of the Asilomar Conf.on Signals,Systems and Computers,2002中,示出并說明了下面的行列式等于1的2×2縮放矩陣的提升分離d00d-1=-10d-111-d01011d-1]]>根據(jù)本發(fā)明,該一維,即僅涉及2×2縮放矩陣的提升分離被擴(kuò)展到多維情形。單獨(dú)地,前面等式的所有值由n×n矩陣取代,其中n,即一塊的離散值數(shù)量,大于或等于2。因此,對(duì)于每個(gè)任意n×n矩陣T,該矩陣T優(yōu)選是可逆的,可能如下那樣分成2n×2n塊矩陣,其中En表示n×n單位矩陣T00T-1=-En0T-1EnEn-T0En0EnEnT-1]]>除了采樣操作,諸如置換或乘以-1,之外,這個(gè)分離的所有三個(gè)塊都具有下面的一般結(jié)構(gòu)En0AEn]]>對(duì)于這個(gè)2n×2n塊矩陣,可使用根據(jù)本發(fā)明的一般提升方案,該方案隨后也稱為多維提升。
對(duì)于值矢量x=(x0,...,x2n-1),該塊矩陣的應(yīng)用提供了下面的等式En0AEn(x0,...,x2n-1)=((x0,...,xn-1),(xn,...,x2n-1)+A·(x0,...,xn-1))]]>應(yīng)該理解,在前一等式的右側(cè)存在矢量,其維數(shù),即行數(shù),等于2n。前n個(gè)分量,即從0到n-1的分量,對(duì)應(yīng)于x0到xn-1。后n個(gè)分量,即在前一等式右側(cè)得到的矢量的后半部分,等于第二塊離散值,即xn,...,x2n-1,現(xiàn)在與對(duì)應(yīng)于圖1-4變換矩陣的矩陣A乘以第一塊離散值x0,...,xn-1的加和。變換矩陣表示第一、第二或第三變換規(guī)則。
類似于具有 形式2×2矩陣的通常提升方案,這些2n×2n矩陣可如下用于變換T的可逆整數(shù)近似。對(duì)于整數(shù)輸入值(x0,...,x2n-1),浮點(diǎn)輸出值(y0,...,yn-1)=A·(x0,...,xn-1)在被加到整數(shù)值(xn,...,x2n-1)之前被取整為整數(shù)值。塊矩陣的逆結(jié)果如下En0AEn-1=En0-AEn]]>因此,該過程可通過簡(jiǎn)單地通過使用相同矩陣A和相同取整函數(shù),并通過減去所得到的值而非正向處理中的加上,來求逆,而沒有誤差。正向處理示于圖6中,而反向處理示于圖7中。應(yīng)該注意,圖6中變換矩陣和圖7中的變換矩陣相同,這是為了實(shí)施簡(jiǎn)單而優(yōu)選的。
因?yàn)橹?x0,...,xn-1)在圖6所示的正向步驟中沒有被修改,所以它們?nèi)匀怀霈F(xiàn)在逆步驟中,即圖7中反向步驟。應(yīng)該指出,對(duì)矩陣A沒有特定限制。因此,矩陣A不必是可逆的。
為了獲得公知MDCT的可逆的整數(shù)近似,將第一級(jí)的MDCT分成Givens旋轉(zhuǎn),其中該級(jí)是加窗級(jí),以及分為隨后的DCT-IV級(jí)。該分離在圖10中示出,其將在下面討論且在DE 10129240A1中詳細(xì)描述。
和其中DCT-IV被分成多級(jí)Givens旋轉(zhuǎn)的現(xiàn)有技術(shù)相比,按照本發(fā)明,保留變換自身,并然后被取整。
因此,如同公知的那樣,通過多級(jí)基于提升的Givens旋轉(zhuǎn)執(zhí)行DCT-IV的整數(shù)近似。Givens旋轉(zhuǎn)的數(shù)目由所使用的快速算法決定。因此,對(duì)于長(zhǎng)度為N的變換,Givens旋轉(zhuǎn)的數(shù)量給定為O(N log N)。每個(gè)MDCT分離的加窗級(jí)僅包括N/2個(gè)Givens旋轉(zhuǎn)或3N/2個(gè)取整步驟。因此,尤其在高變換長(zhǎng)度中,如在音頻編碼應(yīng)用中所使用的(例如1024),DCT-IV的整數(shù)近似是近似誤差的主要原因。
根據(jù)本發(fā)明的方法使用所述的多維提升方案。因此,DCTIV中取整步驟的數(shù)目被減少至3N/2,即與傳統(tǒng)的基于提升的方法中約2Nlog2N個(gè)取整步驟相比,等于加窗級(jí)中的取整步驟的數(shù)目。
按照本發(fā)明,DCT-IV同時(shí)應(yīng)用到兩塊信號(hào)。其一種可能性示于圖5中,其中例如對(duì)時(shí)間連續(xù)的兩塊采樣進(jìn)行DCT-IV。經(jīng)過這兩個(gè)變換的兩個(gè)塊也可以是多信道信號(hào)的兩個(gè)信道的采樣。
上述多維提升等式的分離被應(yīng)用到也可以被當(dāng)作N×N矩陣的變換規(guī)則。因?yàn)橛绕湓贒CT-IV中,其逆也是DCT-IV,所以得到以下用于圖5所示設(shè)計(jì)的分離DCTIV00DCTIV=-EN0DCTIVENEN-DCTIV0EN0ENENDCTIV]]>可在各個(gè)塊矩陣中提取乘以-1的置換,因此產(chǎn)生下面結(jié)果DCTIV00DCTIV=-EN0DCTIVENEN-DCTIV0EN0ENENDCTIV]]>因此,可以優(yōu)選為三個(gè)多維提升步驟實(shí)現(xiàn)將變換應(yīng)用到兩塊信號(hào),即兩塊離散值,該三個(gè)多維提升步驟如下EN0DCTIVENEN-DCTIV0ENEN0DCTIVEN]]>在圖3中借助于本發(fā)明一個(gè)優(yōu)選實(shí)施例圖形示出上面的等式。如已經(jīng)解釋的那樣,逆轉(zhuǎn)換相應(yīng)地在圖4中示出。
關(guān)于根據(jù)本發(fā)明的方法,兩個(gè)長(zhǎng)度為N的DCT-IV變換可以可逆方式實(shí)現(xiàn),其中僅需要3N個(gè)取整步驟,即每個(gè)變換有3N/2個(gè)取整步驟。
三個(gè)多維提升步驟中的DCT-IV可具有任意實(shí)施方式,即例如基于浮點(diǎn)或基于定點(diǎn)的實(shí)施方式。其甚至不必是可逆的。其僅必須以完全相同的方式在正向和反向過程中執(zhí)行。因此,該設(shè)計(jì)適于高變換長(zhǎng)度,如1024,如在當(dāng)前音頻編碼應(yīng)用中所使用的那樣。
整個(gè)計(jì)算復(fù)雜性是兩個(gè)DCT-IV變換的非整數(shù)實(shí)施的計(jì)算復(fù)雜性的1.5倍。該計(jì)算復(fù)雜性顯著低于傳統(tǒng)的基于提升的整數(shù)實(shí)施方式,傳統(tǒng)基于提升的整數(shù)實(shí)施方式的計(jì)算復(fù)雜性約是傳統(tǒng)DCT-IV的兩倍,因?yàn)檫@些實(shí)施方式基于所用的提升方案必須使用微小的正/負(fù)蝶形,以獲得能量守恒,如同R.Geiger,T.Sporer,J.Koller和K.Brandenburg在111thAES Convention,New York,2001上的“AudioCoding based on Integer Transforms”中描述的那樣。
所示的方法將同時(shí),即在一個(gè)轉(zhuǎn)換內(nèi),計(jì)算至少兩個(gè)DCT-IV變換。這可例如通過計(jì)算用于音頻信號(hào)的兩個(gè)相繼塊或圖像信號(hào)的兩個(gè)相繼圖像的DCT-IV變換而實(shí)現(xiàn)。在兩聲道立體信號(hào)的情況下,這也可通過在轉(zhuǎn)換動(dòng)作和逆轉(zhuǎn)換動(dòng)作中分別計(jì)算左聲道和右聲道的DCT-IV而實(shí)現(xiàn)。第一種方案向系統(tǒng)中引入了附加延遲一個(gè)塊。第二種方案對(duì)于立體聲道或一般而言多聲道信號(hào)是可能的。
可選地,如果這兩個(gè)選項(xiàng)都是不希望的,但是如果要保持N個(gè)值的正常塊處理長(zhǎng)度,則長(zhǎng)度為N的DCT-IV可被分成長(zhǎng)度為N/2的兩個(gè)DCT-IV變換。在本說明書中,參考Y.Zeng,G.Bi和Z.Lin在Proc.Occassp’01,2001年5月的1181-1184頁中“Integer sinusoidaltransforms based on lifting factorization”,其中執(zhí)行了該分離。除了兩個(gè)長(zhǎng)度為N/2的DCT變換之外,還需要附加的多級(jí)Givens旋轉(zhuǎn)。進(jìn)一步,在該算法中,還使用塊矩陣EN/2-EN/2EN/2EN/2,]]>即N/2正/負(fù)蝶形、具有N/2Givens旋轉(zhuǎn)的塊對(duì)角矩陣以及另外幾個(gè)置換矩陣。通過使用這些附加級(jí)N/2Givens旋轉(zhuǎn),多維提升方法也可用于計(jì)算僅一個(gè)長(zhǎng)度為N的DCT-IV。該算法的基本結(jié)構(gòu)示于圖8中,其中除了其中使用兩個(gè)長(zhǎng)度為N/2的DCT-IV變換的實(shí)際轉(zhuǎn)換級(jí)之外,首先出現(xiàn)一個(gè)蝶形級(jí),以計(jì)算長(zhǎng)度僅為N/2的第一和第二塊離散值。在輸出側(cè),還設(shè)置旋轉(zhuǎn)級(jí),以由分別僅具有N/2個(gè)值的變換表示的該塊輸出值和變換表示的另一塊輸出值而獲得等于圖5的DCT-IV操作的輸出值的輸出值y0,...,yN-1,如在比較圖8和圖5中輸入側(cè)和輸出側(cè)索引時(shí)看到的那樣。
至此,僅僅已經(jīng)說明了將多維提升應(yīng)用到下面形式的塊矩陣。
T00T-1]]>然而,也可以將其他塊矩陣分成多維提升步驟。例如,可使用以下分離,以通過三步多維提升實(shí)施將帶有歸一化的正/負(fù)蝶形的級(jí)與兩塊DCT-IV變換組合12ENEN-ENENDCTTV00DCTIV=12DCTIV12DCTIV-12DCTIV12DCTIV=]]>EN0EN-2DCTIVENEN12DCTIV0ENEN0EN-2DCTIVEN]]>從前面的等式中可顯然看出,在前面等式的左刮號(hào)中所使用的第一變換規(guī)則、和前面等式的中間刮號(hào)中所使用的第二變換規(guī)則、以及在前面等式的最后刮號(hào)中使用的第三變換規(guī)則不必須是相同的。此外,從前面等式中顯然看出,不僅其中僅具有主對(duì)角元素的塊矩陣可被分離,而且被完全占據(jù)的矩陣也可按照本發(fā)明處理。而且,應(yīng)該注意到,本發(fā)明不局限于這樣的事實(shí),即在轉(zhuǎn)換成變換的表示中所使用的變換規(guī)則必須相同或彼此必須有任何關(guān)系,使得例如第二變換規(guī)則是第一變換規(guī)則的反變換規(guī)則。一般地,可使用三種不同的規(guī)則,只要其在反表示中被考慮。
在本說明書中,再次參考圖3和圖4。當(dāng)將離散值轉(zhuǎn)換為變換表示時(shí),可構(gòu)造裝置102,以執(zhí)行任何變換規(guī)則1。此外,還可構(gòu)造裝置108,以使用任何其它或相同變換規(guī)則,該變換規(guī)則被稱為變換規(guī)則2。此外,還可構(gòu)造裝置140,以使用一般任意的變換規(guī)則3,其不必須與第一或第二變換規(guī)則相同。
然而,在變換表示的逆轉(zhuǎn)換中,必須找到對(duì)圖3中所示變換規(guī)則1-3的匹配,即用于轉(zhuǎn)換的第一裝置124不執(zhí)行任意變換規(guī)則,而是執(zhí)行圖3的塊140中所執(zhí)行的變換規(guī)則3。相應(yīng)地,圖4中的裝置130必須執(zhí)行也已經(jīng)由圖3中塊108執(zhí)行的變換規(guī)則2。最后,圖4的裝置150必須執(zhí)行也已經(jīng)由圖3的裝置102執(zhí)行的變換規(guī)則1,從而獲得無損反變換。
下面,參考圖9-11,再次表示MDCT加窗的分離,如DE 10129240A1中描述的那樣,其中以提升矩陣和相應(yīng)的取整將MDCT加窗分成Givens旋轉(zhuǎn)可有利地與圖1所示的用于轉(zhuǎn)換和圖2中所示的用于逆轉(zhuǎn)換的設(shè)計(jì)相結(jié)合,以獲得完全整數(shù)MDCT近似,即按照本發(fā)明的整數(shù)MDCT(IntMDCT),其中已經(jīng)以MDCT的例子執(zhí)行了正向變換設(shè)計(jì)和反向變換設(shè)計(jì)。
圖9示出根據(jù)本發(fā)明優(yōu)選的、用于處理表示音頻信號(hào)的時(shí)間離散采樣以獲得整數(shù)值的設(shè)備的概略圖,在整數(shù)值上執(zhí)行Int-MDCT整數(shù)變換算法。時(shí)間離散的采樣被圖9所示裝置加窗,并可選地轉(zhuǎn)換為譜表示。以長(zhǎng)度對(duì)應(yīng)于2N個(gè)時(shí)間離散采樣的窗w對(duì)在輸入端10被饋送到該設(shè)備的時(shí)間離散采樣加窗,以在輸出端12獲得適于借助于變換、尤其是借助于執(zhí)行整數(shù)DCT的裝置14轉(zhuǎn)換為譜表示的整數(shù)加窗采樣。構(gòu)造整數(shù)DCT,以生成N個(gè)輸入值的N個(gè)輸出值,這與圖12a的MDCT函數(shù)408相反,MDCT函數(shù)408由于MDCT等式,由2N個(gè)加窗的采樣僅生成N個(gè)譜值。
為了對(duì)時(shí)間離散采樣進(jìn)行加窗,首先在裝置16中選擇一起表示時(shí)間離散采樣矢量的兩個(gè)時(shí)間離散采樣。由裝置16選擇的時(shí)間離散采樣位于窗的第一個(gè)四分之一區(qū)。其它時(shí)間離散采樣位于窗的第二個(gè)四分之一區(qū),如將參考圖11更詳細(xì)地討論的那樣?,F(xiàn)在為由裝置16生成的矢量提供2×2維的旋轉(zhuǎn)矩陣,其中該操作不是直接執(zhí)行,而是經(jīng)由幾個(gè)所謂的提升矩陣執(zhí)行。
提升矩陣具有這樣的特征,即其僅具有一個(gè)元素,該元素取決于窗w且不等于“1”或“0”。
在專業(yè)出版物“Factoring Wavelet Transforms Into LiftingSteps”,Ingrid Daubechies和Wim Sweldens,Preprint,BellLaboratories,Lucent Technologies,1996中說明了將小波變換分解為提升步驟。一般地,提升方案是完美重構(gòu)的、具有相同低通或高通濾波器的濾波器對(duì)之間的簡(jiǎn)單關(guān)系。每對(duì)互補(bǔ)濾波器可被分解為提升步驟。
這特別應(yīng)用于Givens旋轉(zhuǎn)。將考慮其中多相矩陣(polyphasematrix)是Givens旋轉(zhuǎn)的情形。以下成立cosα-sinαsinαcosα=1cosα-1sinα0110sinα11cosα-1sinα01----(1)]]>位于等式右邊的三個(gè)提升矩陣中的每個(gè)都有值“1”作為主對(duì)角線元素。而且,在每個(gè)提升矩陣中,一個(gè)次對(duì)角元素等于0,而另一個(gè)次對(duì)角元素取決于旋轉(zhuǎn)角α。
矢量現(xiàn)在乘以第三提升矩陣,即,上面等式最右邊的提升矩陣,以獲得第一結(jié)果矢量。這在圖9中通過裝置18說明?,F(xiàn)在,用將實(shí)數(shù)量映射到整數(shù)量的任意取整函數(shù)對(duì)第一結(jié)果矢量取整,如圖9中通過裝置20所示。取整的第一結(jié)果矢量被饋送到裝置22,以將其乘以中間的,即第二提升矩陣,從而獲得第二結(jié)果矢量,第二結(jié)果矢量又在裝置24中被取整,以獲得取整的第二結(jié)果矢量。取整的第二結(jié)果矢量現(xiàn)在被饋送到裝置26中,以將其乘以上面等式中左邊所示的提升矩陣,即第一提升矩陣,從而獲得第三結(jié)果矢量,第三結(jié)果矢量然后經(jīng)裝置28被最終取整,以最終在輸出端12獲得整數(shù)加窗的采樣,現(xiàn)在,如果需要其譜表示,則整數(shù)加窗的采樣必須由裝置14處理,以在譜輸出端30獲得整數(shù)譜值。
裝置14優(yōu)選實(shí)現(xiàn)為整數(shù)DCT。
由下式給出長(zhǎng)度為N的根據(jù)類型4(DCT-IV)的離散余弦變換xt(m)=2nΣk=0N-1x(k)cos(π4N(2k+1)(2m+1))----(2)]]>DCT-IV的系數(shù)形成正交的N×N矩陣。每個(gè)正交的N×N矩陣可分成N(N-1)/2個(gè)Givens旋轉(zhuǎn),如在專業(yè)出版物P.P.Vaidyanathan,“Multirate System And Filter Banks”,Prentice Hall,EnglewoodCliffs,1993中所討論的那樣。應(yīng)該注意,也存在其它的分離。
關(guān)于不同DCT算法的分類,應(yīng)參考H.S.Malvar,“SignalProcessing With Lapped Transforms”,Artein House,1992。一般地,DCT算法的不同在于其基本函數(shù)的類型。雖然這里優(yōu)選的DCT-IV包括非對(duì)稱基本函數(shù),即余弦四分之一波,余弦四分之三波,余弦四分之五波,余弦四分之七波,等等,但是離散余弦變換,例如類型II(DCT-II)的離散余弦變換,具有軸對(duì)稱和點(diǎn)對(duì)稱的基本函數(shù)。0階基本函數(shù)具有直線成分(direct component),一階基本函數(shù)是半余弦波,二階基本函數(shù)是整余弦波,等等。由于DCT-II特別考慮恒定成分,因此其被用在視頻編碼中而非音頻編碼中,因?yàn)榕c視頻編碼相反,恒定成分與音頻編碼無關(guān)。
下面,討論Givens旋轉(zhuǎn)的旋轉(zhuǎn)角α如何取決于窗函數(shù)。
窗長(zhǎng)度為2N的MDCT可減少到長(zhǎng)度為N的IV類離散余弦變換。這通過在時(shí)域中顯式地執(zhí)行TDAC操作,并然后應(yīng)用DCT-IV而實(shí)現(xiàn)。在50%交疊中,塊t的窗的左半部分與前一個(gè)塊,即塊t-1,的右半部分交疊。兩個(gè)相繼的塊t-1和t的交疊部分在時(shí)域中,即在變換之前,被如下處理,即在圖9的輸入端10和輸出端12之間處理x~t(k)x~t-1(N-1-k)=w(N2+k)-w(N2-1-k)w(N2-1-k)w(N2+k)xt(N2+k)xt(N2-1-k)----(3)]]>用顎化符號(hào)指示的值是圖9的輸出端12的值,而上面等式中沒有顎化符號(hào)的x值是輸入端10或用于選擇的裝置16之后的值。循環(huán)變量k從0到N/2-1,而w表示窗函數(shù)。
由窗函數(shù)w的TDAC條件,以下關(guān)系成立w(N2+k)2+w(N2-1-k)2=1----(4)]]>對(duì)于某些角αk,k=0,...,N/2-1,這個(gè)時(shí)域中的預(yù)處理可寫為Givens旋轉(zhuǎn),如已經(jīng)解釋的那樣。
Givens旋轉(zhuǎn)的角α取決于窗函數(shù)w,如下α=arctan[w(N/2-1-k)/w(N/2+k)] (5)應(yīng)該注意到,可以使用任何窗函數(shù)w,只要它們滿足TDAC條件。
下面,參考圖10說明級(jí)聯(lián)的編碼器和解碼器。首先由圖9的裝置16這樣選擇被一個(gè)窗一起加窗的時(shí)間離散采樣x(0)到x(2N-1),使得選擇采樣x(0)和采樣x(N-1),即來自窗第一個(gè)四分之一的采樣和來自窗第二個(gè)四分之一的采樣,以形成裝置16的輸出端的矢量。交叉箭頭示意表示裝置18、20或22、24或26、28的提升乘法和隨后的取整,以在DCT-IV塊的輸入端獲得整數(shù)加窗采樣。
如果第一矢量已經(jīng)被處理,如上所述,而且,采樣x(N/2-1)和x(n/2),即來自窗的第一個(gè)四分之一的采樣和來自窗的第二個(gè)四分之一的采樣,的第二矢量被選擇并被圖9所述的算法處理。類似地,窗的第一和第二個(gè)四分之一的所有其它采樣對(duì)被處理。對(duì)第一窗的第三和第四個(gè)四分之一執(zhí)行相同的處理?,F(xiàn)在,2N個(gè)加窗的整數(shù)采樣出現(xiàn)在輸出端12,其被饋送到DCT-IV變換,如圖10所示。特別地,第二和第三個(gè)四分之一的整數(shù)加窗采樣被饋送到DCT。窗的第一個(gè)四分之一的加窗整數(shù)采樣在前一個(gè)DCT-IV中與前一個(gè)窗的第四個(gè)四分之一的加窗整數(shù)采樣一起被處理。類似地,圖10中加窗整數(shù)采樣的第四個(gè)四分之一與下一個(gè)窗的第一個(gè)四分之一一起被饋送到DCT-IV變換。圖10中間所示的整數(shù)DCT-IV變換提供N個(gè)整數(shù)譜值y(0)到y(tǒng)(N-1)。這些整數(shù)譜值可以很容易被熵編碼,而無須中間量化,因?yàn)榧哟昂妥儞Q提供整數(shù)輸出值。
解碼器示于圖10的右半部分。包括反變換和“逆加窗”的解碼器相對(duì)于編碼器逆向工作。已知,逆DCT-IV可用于DCT-IV的反變換,如圖10所示。解碼器DCT-IV 34的輸出值被,如圖10所示,以前一變換或后一變換的相應(yīng)值逆向處理,從而由裝置34輸出端的整數(shù)加窗采樣或前一及后一變換又生成時(shí)間離散的音頻采樣x(0)到x(2N-1)。
輸出側(cè)的操作是通過逆Givens旋轉(zhuǎn)執(zhí)行,使得塊26、28或22、24或18、20在相對(duì)的方向上運(yùn)行。這借助于等式1的第二提升矩陣更詳細(xì)地說明。如果(在編碼器中)通過將取整的第一結(jié)果矢量與第二提升矩陣(裝置22)相乘而形成第二結(jié)果矢量,則產(chǎn)生下面的結(jié)果 在等式(6)右側(cè)的值x,y是整數(shù)。然而,xsinα不是這樣。這里,必須引入取整函數(shù)r,如下面的等式所示的那樣 該操作由裝置24執(zhí)行。
逆映射(解碼器中)被定義如下 由于取整算子前的負(fù)號(hào),顯然提升步驟的整數(shù)近似可逆,而不會(huì)引入誤差。將該近似應(yīng)用到三個(gè)提升步驟中的每一個(gè)就導(dǎo)致Givens旋轉(zhuǎn)的整數(shù)近似。取整的旋轉(zhuǎn)(在編碼器中)可被逆轉(zhuǎn)(在解碼器中)而不引入誤差,即通過以相反順序執(zhí)行逆取整提升步驟,即如果在解碼時(shí),圖9的算法是從下向上執(zhí)行。
如果取整函數(shù)r是點(diǎn)對(duì)稱的,則逆取整旋轉(zhuǎn)與以角-α的取整旋轉(zhuǎn)相同,如下
cosαsinα-sinαcosα----(9)]]>在該情形中,通過只用“-sinα”取代“sinα”,直接從等式(1)中得到用于解碼器,即用于逆Givens旋轉(zhuǎn),的提升矩陣。
下面,參考圖1再次說明分離具有交疊窗40到46的通常MDCT。窗40到46每個(gè)交疊50%。每個(gè)窗,首先在窗的第一和第二個(gè)四分之一中或在窗的第三和第四個(gè)四分之一中執(zhí)行Givens旋轉(zhuǎn),如箭頭48示意示出的那樣。然后,旋轉(zhuǎn)的值,即加窗的整數(shù)采樣,被饋送到N到N的DCT,使得一個(gè)窗的第二和第三個(gè)四分之一或相繼的窗的第四和第一個(gè)四分之一一起借助于DCT-IV算法被轉(zhuǎn)換為譜表示。
因此,通常的Givens旋轉(zhuǎn)被分成順序執(zhí)行的提升矩陣,其中在每個(gè)提升矩陣乘法之后引入取整步驟,使得在浮點(diǎn)數(shù)一出現(xiàn)就對(duì)其取整,從而在每次結(jié)果矢量與提升矩陣相乘之前結(jié)果矢量?jī)H具有整數(shù)。
因此,輸出值總是整數(shù),其中優(yōu)選地也使用整數(shù)輸入值。這表示沒有限制,因?yàn)?,例如任何PCM采樣,如它們存儲(chǔ)在CD上那樣,是整數(shù)值,其數(shù)值范圍根據(jù)位寬度而不同,即根據(jù)時(shí)間離散數(shù)字輸入值是16位值還是24位值。而且,如已經(jīng)討論的那樣,通過在逆方向上執(zhí)行逆旋轉(zhuǎn),整個(gè)過程是可逆的。因此,存在具有完美重構(gòu),即無損變換,的MDCT的整數(shù)近似。
所示的變換提供整數(shù)輸出值,而非浮點(diǎn)值。其提供完美重構(gòu),使得當(dāng)正向、然后反向變換被執(zhí)行時(shí),不引入誤差。按照本發(fā)明的一個(gè)優(yōu)選實(shí)施例,變換是替代修正的離散余弦變換。其它變換方法也可以整數(shù)方式執(zhí)行,只要分離成旋轉(zhuǎn)和將旋轉(zhuǎn)分離成提升步驟是可能的。
整數(shù)MDCT具有最有利的MDCT特征。其具有交疊結(jié)構(gòu),從而獲得比非交疊塊變換更好的頻率選擇性。由于在變換前的加窗時(shí)已經(jīng)被考慮的TDAC函數(shù),臨界采樣被保持,使得表示音頻信號(hào)的譜值的總數(shù)目等于輸入采樣的總數(shù)目。
和提供浮點(diǎn)采樣的普通MDCT相比,所描述的優(yōu)選整數(shù)變換表現(xiàn)了相比于具有低信號(hào)電平的普通MDCT,噪聲僅在譜值范圍內(nèi)增加,而該噪聲增加在顯著的信號(hào)電平中不明顯。因此,整數(shù)處理適于有效的硬件實(shí)現(xiàn),因?yàn)閮H使用乘法步驟,而其可以很容易分成能夠在硬件中以簡(jiǎn)單快速的方式實(shí)現(xiàn)的移位/加法步驟。當(dāng)然,軟件實(shí)現(xiàn)也是可能的。
整數(shù)變換提供了音頻信號(hào)的良好譜表示,并仍保持在整數(shù)范圍內(nèi)。如果將其應(yīng)用到音頻信號(hào)的音調(diào)部分(tonal parts),則這導(dǎo)致良好的能量守恒。從而,通過簡(jiǎn)單地將圖9中所示的加窗/變換與熵編碼器級(jí)聯(lián),可建立有效的無損編碼方案。特別地,使用逃逸值(escapevalues),如MPEG AAC中所使用的,的堆疊編碼是有利的。優(yōu)選用2的某個(gè)冪按比例縮小所有值,直到它們適合所希望的代碼表,以然后附加地編碼省略的最低位。相比于使用更大代碼表的可選方案,所描述的可選方案在存儲(chǔ)代碼表的存儲(chǔ)器消耗方面更有利。也能夠通過簡(jiǎn)單地省略某些最低位而獲得幾乎無損的編碼器。
特別對(duì)于聲調(diào)信號(hào),整數(shù)譜值的熵編碼使得能夠獲得高編碼器增益。對(duì)于信號(hào)的瞬變部分,編碼器增益低,這是由于瞬變信號(hào)的平譜(flat spectrum),即由于少量等于0或幾乎等于0的譜值。
如J.Herre,J.D.Johnston“Enhancing the Performance ofPerceptual Audio Coders by Using Temporal Noise Shaping(TNS)”101.AES Convention,Los Angeles,1996,Preprint 4348中所述,可通過在頻率范圍內(nèi)使用線性預(yù)測(cè)而使用該平整度。一種可選的方案是具有開環(huán)的預(yù)測(cè)。另一種可選方案是具有閉環(huán)的預(yù)測(cè)器。第一種可選方案,即具有開環(huán)的預(yù)測(cè)器,被稱為TNS。預(yù)測(cè)后的量化導(dǎo)致所產(chǎn)生的量化噪聲對(duì)音頻信號(hào)的時(shí)間結(jié)構(gòu)的適應(yīng),并因此防止心理聲學(xué)音頻編碼器中的超前回聲。對(duì)于無損音頻編碼,第二可選方案,即具有閉環(huán)的預(yù)測(cè)器的可選方案,更合適,因?yàn)榫哂虚]環(huán)的預(yù)測(cè)允許輸入信號(hào)的精確重構(gòu)。如果將該技術(shù)應(yīng)用到所生成的譜,則必須在預(yù)測(cè)濾波器的每個(gè)步驟之后執(zhí)行取整步驟,以保持在整數(shù)范圍內(nèi)。通過使用逆向?yàn)V波器和相同的取整函數(shù),原始譜能夠被精確地重構(gòu)。
為了將兩個(gè)信道間的冗余用于數(shù)據(jù)減少,如果使用具有π/4角的取整旋轉(zhuǎn),則可以無損方式使用中央-邊側(cè)編碼(center-sideencoding)。相比于計(jì)算立體聲信號(hào)的左聲道和右聲道的和與差的可選方案,取整旋轉(zhuǎn)具有能量守恒的優(yōu)點(diǎn)。可為每個(gè)波段接通或關(guān)斷所謂的聯(lián)合-立體聲編碼(joint-stereo encoding)技術(shù)的使用,如其在標(biāo)準(zhǔn)MPEG AAC中執(zhí)行的那樣。也可考慮其它旋轉(zhuǎn)角,以更靈活地減小兩個(gè)信道間的冗余。
根據(jù)環(huán)境,本發(fā)明的用于轉(zhuǎn)換和用于逆轉(zhuǎn)換的方法、和用于時(shí)間-頻率變換或頻率-時(shí)間變換的方法可以硬件或軟件實(shí)現(xiàn)。其實(shí)現(xiàn)可在數(shù)字存儲(chǔ)介質(zhì)上實(shí)現(xiàn),特別在具有電可讀取的控制信號(hào)的磁盤或CD,它們能與可編程計(jì)算機(jī)系統(tǒng)協(xié)作,以便執(zhí)行該方法。一般地,本發(fā)明因此也包括計(jì)算機(jī)程序產(chǎn)品,該計(jì)算機(jī)程序產(chǎn)品具有存儲(chǔ)在機(jī)器可讀載體上的程序代碼,用于當(dāng)計(jì)算機(jī)程序在計(jì)算機(jī)上運(yùn)行時(shí)執(zhí)行本發(fā)明的方法。換句話說,本發(fā)明可實(shí)現(xiàn)為計(jì)算機(jī)程序,該計(jì)算機(jī)程序具有用于當(dāng)計(jì)算機(jī)程序運(yùn)行在計(jì)算機(jī)上時(shí)執(zhí)行本方法的程序代碼。
權(quán)利要求
1.一種用于將離散值轉(zhuǎn)換成具有整數(shù)值的變換表示的設(shè)備,其中所述離散值具有音頻和/或圖像信息,所述設(shè)備包括用于利用第一變換規(guī)則處理第一塊離散值以獲得第一塊變換值的裝置(102);用于對(duì)所述第一塊變換值取整以獲得第一塊取整的變換值的裝置(104);用于對(duì)所述第一塊取整變換值與第二塊離散值求和以獲得第二塊加和值的裝置(106);用于通過使用第二變換規(guī)則處理所述第二塊加和值以獲得第二塊變換值的裝置(108);用于對(duì)所述第二塊變換值取整以獲得第二塊取整變換值的裝置(110);和用于從所述第一塊離散值中減去所述第二塊取整變換值以獲得所述變換表示的一塊整數(shù)輸出值的裝置(112)。
2.如權(quán)利要求1所述的設(shè)備,進(jìn)一步包括用于通過使用第三變換規(guī)則處理所述一塊整數(shù)輸出值以獲得一塊變換的輸出值的裝置(140);用于對(duì)所述一塊變換輸出值取整以獲得一塊取整的變換輸出值的裝置(142);和用于對(duì)所述一塊取整的變換輸出值和所述第二塊加和值求和以獲得所述變換表示的另一塊整數(shù)輸出值的裝置(144)。
3.如權(quán)利要求1或2所述的設(shè)備,其中所述第一變換規(guī)則、所述第二變換規(guī)則和所述第三變換規(guī)則分別包括變換矩陣。
4.如前述權(quán)利要求中任一條所述的設(shè)備,其中所述第一變換規(guī)則、所述第二變換規(guī)則和所述第三變換規(guī)則彼此相同。
5.如前述權(quán)利要求中任一條所述的設(shè)備,其中所述第一變換規(guī)則和所述第三變換規(guī)則是正向變換規(guī)則,而所述第二變換規(guī)則是反向變換規(guī)則。
6.如前述權(quán)利要求中任一條所述的設(shè)備,其中構(gòu)造所述用于對(duì)第一塊取整的裝置(104)和所述用于對(duì)第二塊取整的裝置(110)和所述用于對(duì)所述一塊變換輸出值取整的裝置(142),以按照提供取整結(jié)果的取整函數(shù)進(jìn)行取整,其精度小于包括所述設(shè)備的計(jì)算機(jī)的機(jī)器精度。
7.如前述權(quán)利要求中任一條所述的設(shè)備,其中所述第一塊離散值具有序數(shù)為0到序數(shù)為N-1的離散值,其中所述第二塊離散值具有序數(shù)為N到序數(shù)為2N-1的離散值,其中所述第一塊取整的變換值序數(shù)為0到N-1,且其中構(gòu)造所述用于求和的裝置(106)以執(zhí)行數(shù)值方式的加法,使得所述一塊取整變換值的序數(shù)為i的值被加到所述第二塊離散值中序數(shù)為i+N的值,其中i是從0到N-1的循環(huán)變量。
8.如前述權(quán)利要求中任一條所述的設(shè)備,其中所述第一塊離散值具有序數(shù)為0到序數(shù)為N-1的離散值,其中所述第二塊離散值具有序數(shù)為0到序數(shù)為2N-1的離散值,其中所述第二塊取整的變換值具有序數(shù)N和2N-1之間的值,其中構(gòu)造所述減法裝置(112),以從所述第一塊中序數(shù)為i的值中減去所述一塊取整變換值中序數(shù)為n+i的值,其中i是從0到N-1的循環(huán)變量。
9.如前述權(quán)利要求中任一條所述的設(shè)備,其中所述第一和第二塊離散值包括整數(shù)離散值。
10.如前述權(quán)利要求中任一條所述的設(shè)備,其中構(gòu)造所述用于對(duì)第一塊變換值取整的裝置(104)或所述用于對(duì)第二塊變換值取整的裝置(110),以按照相同的取整規(guī)則進(jìn)行取整。
11.如權(quán)利要求3所述的設(shè)備,其中所述第一變換規(guī)則所基于的變換矩陣、所述第二變換規(guī)則所基于的變換矩陣和所述第三變換規(guī)則所基于的變換矩陣分別是方矩陣,所述方矩陣具有等于所述第一或第二塊中離散值數(shù)量的行數(shù)或列數(shù)。
12.如前述權(quán)利要求中任一條所述的設(shè)備,其中在變換器中構(gòu)造所述用于按照第一變換規(guī)則進(jìn)行處理的裝置(102)和所述用于按照第二變換規(guī)則進(jìn)行處理的裝置(108),和其中還設(shè)置序列控制,構(gòu)造所述序列控制以首先將所述第一塊離散值、然后將所述第二塊加和值提供給所述變換器。
13.如前述權(quán)利要求中任一條所述的設(shè)備,其中在取整器中構(gòu)造所述用于對(duì)第一塊變換值取整的裝置(104)和所述用于對(duì)第二塊變換值取整的裝置(110),且其中還設(shè)置序列控制,以首先將所述第一塊離散值、然后將所述第二塊變換值提供給所述取整器。
14.如前述權(quán)利要求中任一條所述的設(shè)備,其中所述第一和第二塊離散值是多聲道音頻信號(hào)的第一和第二聲道的音頻采樣。
15.如權(quán)利要求1到13中任一條所述的設(shè)備,其中所述第一塊和第二塊是音頻信號(hào)的時(shí)間連續(xù)采樣。
16.一種正向變換設(shè)備,包括通過使用多個(gè)提升矩陣(18,22,26)和隨后的取整操作(20,24,28),用于對(duì)表示音頻信號(hào)或圖像信號(hào)的第一塊采樣進(jìn)行加窗、且用于對(duì)表示音頻信號(hào)或圖像信號(hào)的第二塊采樣進(jìn)行加窗,以獲得第一塊離散值和第二塊離散值的裝置(16,18,20,22,24,26,28)而;和按照權(quán)利要求1到15中任一項(xiàng)的設(shè)備,以從所述具有整數(shù)輸出值的第一和第二塊中獲得變換的表示。
17.一種用于將離散值轉(zhuǎn)換為具有整數(shù)值的變換表示的方法,其中所述離散值具有音頻和/或圖像信息,所述方法包括以下步驟利用第一變換規(guī)則處理(102)第一塊離散值,以獲得第一塊變換值;取整(104)所述第一塊變換值,以獲得第一塊取整的變換值;對(duì)所述第一塊取整的變換值和第二塊離散值求和(106),以獲得第二塊加和值;利用第二變換規(guī)則處理(108)所述第二塊加和值,以獲得第二塊取整的變換值;取整(110)所述第二塊變換值,以獲得第二塊取整的變換值;以及從所述第一塊離散值中減去(112)所述第二塊取整的變換值,以獲得所述變換表示的一塊整數(shù)輸出值。
18.一種正向變換方法,包括以下步驟通過使用多個(gè)提升矩陣(18,22,26)和隨后的取整操作(20,24,28),對(duì)表示音頻信號(hào)或圖像信號(hào)的第一塊采樣加窗(16,18,20,22,24,26,28),和對(duì)表示音頻信號(hào)或圖像信號(hào)的第二塊采樣加窗,從而獲得第一塊離散值和第二塊離散值;和按照權(quán)利要求17的方法,以從所述具有整數(shù)輸出值的第一和第二塊中獲得變換的表示。
19.一種用于對(duì)一塊整數(shù)輸出值塊和第二塊加和值進(jìn)行反變換以獲得第一和第二塊離散值的設(shè)備,其中所述整數(shù)輸出值和加和值是離散值的變換表示,其中所述一塊整數(shù)輸出值和所述第二塊加和值是通過利用第一變換規(guī)則處理(102)第一塊離散值以獲得第一塊變換值、取整(104)所述第一塊變換值以獲得第一塊取整的變換值、對(duì)所述第一塊取整的變換值與第二塊離散值求和(106)以獲得所述第二塊加和值、利用第二變換規(guī)則處理(108)所述第二塊加和值以獲得第二塊變換值、取整(110)所述第二塊變換值以獲得第二塊取整的變換值、及從所述第一塊離散值中減去(112)所述第二塊取整的變換值以獲得所述變換表示的一塊整數(shù)輸出值而從所述第一和第二塊離散值中推導(dǎo)出的,所述設(shè)備包括用于利用所述第二變換規(guī)則處理所述第二塊加和值以獲得第一塊變換的輸出值的裝置(130);用于對(duì)所述第一塊變換的輸出值取整以獲得的第一塊取整的變換值的裝置(132);用于對(duì)所述第一塊取整的變換輸出值與所述一塊整數(shù)輸出值求和以獲得所述第一塊離散值的裝置(134);用于使用所述第一變換規(guī)則處理所述第一塊離散值以獲得第二塊變換值的裝置(150);用于對(duì)所述第二塊變換值取整以獲得一塊取整的變換值的裝置(152);和用于從所述第二塊加和值中減去所述一塊取整的變換值以獲得所述第二塊離散值的裝置(154)。
20.如權(quán)利要求19所述的設(shè)備,其中通過利用第三變換規(guī)則處理(140)所述一塊整數(shù)輸出值以獲得一塊變換輸出值、通過取整(142)所述一塊變換輸出值以獲得一塊取整的變換輸出值、及通過對(duì)所述一塊取整的變換輸出值和所述第二塊加和值求和(144)以獲得所述變換表示的另一塊整數(shù)輸出值而從所述第二塊加和值中計(jì)算所述變換表示的另一塊整數(shù)輸出值,所述設(shè)備進(jìn)一步包括用于利用所述第三變換規(guī)則處理所述一塊整數(shù)輸出值以獲得第一塊變換的輸出值的裝置(124);用于對(duì)所述第一塊變換輸出值取整以獲得第一塊取整的變換輸出值的裝置(126);和用于從所述另一塊輸出值中減去(128)所述第一塊取整的變換輸出值以獲得所述第二塊加和值的裝置。
21.一種用于對(duì)一塊整數(shù)輸出值和第二塊加和值進(jìn)行逆轉(zhuǎn)換以獲得第一和第二塊離散值的方法,其中所述整數(shù)輸出值和所述加和值是離散值的變換表示,其中通過使用第一變換規(guī)則處理(102)第一塊離散值以獲得第一塊變換值、取整(104)所述第一塊變換值以獲得第一塊取整的變換值、對(duì)所述第一塊取整的變換值和第二塊離散值求和(106)以獲得所述第二塊加和值、使用第二變換規(guī)則處理(108)所述第二塊加和值以獲得第二塊變換值、取整(110)所述第二塊變換值以獲得第二塊取整的變換值、及從所述第一塊離散值中減去(112)所述第二塊取整的變換值以獲得所述變換表示的一塊整數(shù)輸出值而已經(jīng)從所述第一和第二塊離散值推導(dǎo)出所述一塊整數(shù)輸出值和所述第二塊加和值,所述方法包括以下步驟利用所述第二變換規(guī)則處理(130)所述第二塊加和值,以獲得第一塊變換的輸出值;取整(132)所述第一塊變換輸出值,以獲得第一塊取整的變換值;對(duì)所述第一塊取整的變換輸出值和所述一塊整數(shù)輸出值求和(134),以獲得所述第一塊離散值;利用所述第一變換規(guī)則處理(150)所述第一塊離散值,以獲得第二塊變換值;取整(152)所述第二塊變換值,以獲得一塊取整的變換值;和從所述第二塊加和值中減去(154)所述一塊取整的變換值,以獲得所述第二塊離散值。
22.一種反向變換設(shè)備,包括按照權(quán)利要求19或20的設(shè)備;和用于利用提升矩陣(18,22,26)和隨后的取整操作(20,24,28)對(duì)所述第一和第二塊離散值逆加窗,以獲得表示音頻采樣或圖像采樣的第一和第二塊原始值的裝置。
23.一種反向變換方法,包括以下步驟按照權(quán)利要求21的方法;和利用提升矩陣(18,22,26)和隨后的取整操作(20,24,28)對(duì)所述第一和第二塊離散值逆加窗,以獲得表示音頻采樣或圖像采樣的第一和第二塊原始值。
24.一種具有程序代碼的計(jì)算機(jī)程序,所述程序代碼用于當(dāng)所述計(jì)算機(jī)程序在計(jì)算機(jī)上運(yùn)行時(shí)執(zhí)行按照權(quán)利要求17、18、21或23的方法。
全文摘要
為了將第一和第二塊離散值轉(zhuǎn)換為變換表示,按照第一變換規(guī)則變換(102)第一塊,并然后取整(104)。然后,取整的變換值和第二塊原始離散值(106)加和,以便然后按照第二變換規(guī)則處理(108)加和結(jié)果。經(jīng)第二變換規(guī)則變換的輸出值被再次取整(110),并然后從第一塊離散值的原始離散值中減去(112),以獲得變換表示的一塊整數(shù)輸出值。通過多維提升方案,獲得無損整數(shù)變換,該整數(shù)變換可通過應(yīng)用相同的變換規(guī)則、但在加法和減法中分別具有不同的符號(hào),而逆反,使得也可獲得逆整數(shù)變換。相比于將變換分為旋轉(zhuǎn),一方面,顯著地減小了計(jì)算復(fù)雜性,另一方面,防止了近似誤差的累積。
文檔編號(hào)G06T9/00GK1806239SQ200480016601
公開日2006年7月19日 申請(qǐng)日期2004年7月5日 優(yōu)先權(quán)日2003年7月14日
發(fā)明者拉爾夫·基戈, 杰拉爾德·舒勒, 托馬斯·斯伯爾 申請(qǐng)人:弗蘭霍菲爾運(yùn)輸應(yīng)用研究公司