專利名稱:基于模式轉(zhuǎn)換來處理窗口序列的語音/音頻統(tǒng)合編解碼器的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種在基于修正離散余弦變換MDCT的語音/音頻統(tǒng)合編解碼器USAC 中發(fā)生模式轉(zhuǎn)換時,處理用于執(zhí)行編碼或解碼的窗口序列的方法。本發(fā)明是通過作為韓國知識經(jīng)濟部的IT原始技術(shù)開發(fā)項目的一環(huán)而執(zhí)行的研究推導(dǎo)出的。(課題管理號2008-F-011-01課題名升級換代DTV核心技術(shù)開發(fā)(標準化連接)-無需眼鏡的個人類型的3D演播技術(shù)的開發(fā))。
背景技術(shù):
語音/音頻編統(tǒng)合解碼器,在根據(jù)輸入信號的特性改變編碼或解碼方法時,可提高譯碼的性能。在這種情況下,語音/音頻統(tǒng)合編解碼器可將輸入信號中與語音相類似的信號在語音編碼/解碼器中進行編碼/解碼,并可將與音頻相類似的信號在音頻編碼/解碼器中進行編碼/解碼。此類語音/音頻統(tǒng)合編解碼器,可根據(jù)線性預(yù)測域LPD模式之間的模式轉(zhuǎn)換來處理輸入信號。此外,語音/音頻統(tǒng)合編解碼器可根據(jù)LPD模式和FD模式之間的模式轉(zhuǎn)換來處理輸入信號。語音/音頻統(tǒng)合編解碼器根據(jù)模式轉(zhuǎn)換,將窗口序列應(yīng)用于輸入信號的幀中處理了信號。但是需要一種與現(xiàn)有的語音/音頻編解碼器相比,可提高譯碼效率的窗口序列處理方法。
發(fā)明內(nèi)容
技術(shù)課題根據(jù)本發(fā)明的一個實施例,提供一種語音/音頻統(tǒng)合統(tǒng)合編解碼器,其在LPD模式之間發(fā)生模式轉(zhuǎn)換時,應(yīng)用幀之間重疊相加的區(qū)域被擴大的序列,來編碼或解碼。根據(jù)本發(fā)明的一個實施例,提供一種語音/音頻統(tǒng)合編解碼器,其在LPD模式與FD 模式之間發(fā)生模式轉(zhuǎn)換時,應(yīng)用幀之間重疊相加的區(qū)域被擴大的序列,來編碼或解碼。技術(shù)方案根據(jù)本發(fā)明的一個實施例的語音/音頻統(tǒng)合編碼器(USAC),可包括模式轉(zhuǎn)換單元和編碼單元。模式轉(zhuǎn)換單元,對構(gòu)成輸入信號的幀的子幀,在LPD模式之間進行轉(zhuǎn)換;編碼單元,將基于被轉(zhuǎn)換的LPD模式的窗口應(yīng)用于所述子幀中要編碼的當前子幀,來將所述輸入信號編碼,其中,所述編碼單元,將根據(jù)上一個子幀的LPD模式和下一個子幀的LPD模式被改變的窗口應(yīng)用于當前子幀,可將所述輸入信號編碼。根據(jù)本發(fā)明的一個實施例的語音/音頻統(tǒng)合編碼器(USAC),可包括模式轉(zhuǎn)換單元和編碼單元。模式轉(zhuǎn)換單元,對輸入信號的幀,從FD模式轉(zhuǎn)換至LPD模式;編碼單元,將所述FD模式的窗口序列與所述LPD模式的窗口序列以折點為基準重疊相加來編碼。根據(jù)本發(fā)明的一個實施例的語音/音頻統(tǒng)合編碼器(USAC),可包括模式轉(zhuǎn)換單元和編碼單元。模式轉(zhuǎn)換單元,對輸入信號的幀,從LPD模式轉(zhuǎn)換至FD模式;編碼單元,將所述FD模式的窗口序列與所述LPD模式的窗口序列以折點為基準重疊相加來編碼。
根據(jù)本發(fā)明的一個實施例的語音/音頻統(tǒng)合解碼器(USAC),可包括模式轉(zhuǎn)換單元和解碼單元。模式轉(zhuǎn)換單元,其對構(gòu)成輸入信號的幀的子幀,在LPD模式之間進行轉(zhuǎn)換; 解碼單元,其將基于被轉(zhuǎn)換的LPD模式的窗口應(yīng)用于所述子幀中要解碼的當前子幀中,來將所述輸入信號解碼,其中,所述解碼單元,將根據(jù)上一個子幀的LPD模式和下一個子幀的 LPD模式改變的窗口應(yīng)用于當前子幀,可將所述輸入信號解碼。根據(jù)本發(fā)明的一個實施例的語音/音頻統(tǒng)合解碼器(USAC),可包括模式轉(zhuǎn)換單元和解碼單元。模式轉(zhuǎn)換單元,對輸入信號的幀,從FD模式轉(zhuǎn)換至LPD模式;解碼單元,將所述FD模式的窗口序列與所述LPD模式的窗口序列以折點為基準重疊相加來解碼。根據(jù)本發(fā)明的一個實施例的語音/音頻統(tǒng)合解碼器(USAC),可包括模式轉(zhuǎn)換單元和解碼單元。模式轉(zhuǎn)換單元,對輸入信號的幀,從LPD模式轉(zhuǎn)換至FD模式;解碼單元,將所述FD模式的窗口序列與所述LPD模式的窗口序列以折點為基準重疊相加來解碼。技術(shù)效果根據(jù)本發(fā)明的一個實施例的語音/音頻統(tǒng)合編解碼器(USAC),比起在現(xiàn)有的語音 /音頻統(tǒng)合編解碼器中處理的窗口序列,對區(qū)塊效應(yīng)(block artifact)的影響較小,且充分活用MDCT的TDAC條件,可獲得更多的譯碼增益。
圖1是示出執(zhí)行語音/音頻統(tǒng)合譯碼的編碼器的整體結(jié)構(gòu)的示圖。圖2是用于說明基于MDCT的TDAC的示圖。圖3是示出現(xiàn)有的RM中被定義的窗口序列的示圖。圖 4 是示出窗口序列(情況 1 :0NLY_L0NG_SEQUENCE 至 LPD_START_SEQUENCE)的示圖。 圖 5 是示出窗口序列(情況 2 :0NLY_L0NG_SEQUENCE 至 LPD_START_SEQUENCE)的示圖。圖6是示出從FD模式轉(zhuǎn)換至LPD模式時,窗口序列(情況3 LPD_START_SEQUENCE 至 LPD_SEQUENCE)的示圖。圖7是示出從LPD模式轉(zhuǎn)換至FD模式時,窗口序列(情況4 LPD_START_SEQUENCE 至LPD_SEQUENCE),和從LPD模式轉(zhuǎn)換至FD模式時,窗口序列(情況4 :LPD_SEQUENCE to ST0P_1152_SEQUENCE 或 ST0P_START_1152_SEQUENCE)的示圖。圖8是示出各種類型LPD_SEQUENCE的窗口形態(tài)的示圖。圖9是示出(a)當LPD模式為{1,1,1,1}時,(b)當LPD模式為{2,2,2,2}時,(c) 當LPD模式為{3,3,3,3}時的LPD_SEQUENCE的示圖。圖10是示出當LPD模式為{0,1,1,1}時的LPD_SEQUENCE的示圖。圖11是示出當LPD模式為{1,0,2,2}時的LPD_SEQUENCE的示圖。圖12是示出當上一個子幀的結(jié)束子幀的LPD模式為{0}時,LPD模式為{3,3,3, 3}的 LPD_SEQUENCE 的示圖。圖13是示出關(guān)于現(xiàn)有的情況3窗口序列的處理方法的示圖。圖14是示出根據(jù)本發(fā)明的一個實施例的關(guān)于情況3的窗口序列的處理方法的示圖(第1例)。
圖15是示出根據(jù)本發(fā)明的一個實施例的關(guān)于情況3的窗口序列的處理方法的示圖(第2例)。圖16是示出根據(jù)本發(fā)明的一個實施例的關(guān)于情況3的窗口序列的處理方法的示圖(第3例)。圖17是示出根據(jù)本發(fā)明的一個實施例,關(guān)于當前子幀LPD_SEQUENCE的lpdjiiode 為3且關(guān)于下一個子幀的LPD_SEQUENCE的lpd_mode為3時的窗口的示圖。圖18是示出根據(jù)本發(fā)明的一個實施例,關(guān)于當前子幀的LPD_SEQUENCE的lpd_ mode為2且關(guān)于下一個子幀的LPD_SEQUENCE的lpd_mode為2時的窗口的示圖。圖19是示出根據(jù)本發(fā)明的一個實施例,關(guān)于當前子幀的LPD_SEQUENCE的lpd_ mode為1且關(guān)于下一個子幀的LPD_SEQUENCE的lpd_mode為1時的窗口的示圖。圖20是示出關(guān)于現(xiàn)有的情況4的窗口序列的處理方法的示圖。圖21是示出根據(jù)本發(fā)明的一個實施例,關(guān)于情況4的窗口序列的處理方法的示圖 (第1例)。圖22是示出根據(jù)本發(fā)明的一個實施例,關(guān)于情況4的窗口序列的處理方法的示圖 (第2例)。圖23是示出本發(fā)明的一個實施例得關(guān)于情況4的窗口序列的處理方法的示圖 (第3例)。圖24是示出根據(jù)本發(fā)明的一個實施例的反映圖22的窗口序列的ST0P_1024_ SEQUENCE的示圖。圖25是示出根據(jù)本發(fā)明的一個實施例的圖16及圖24的窗口序列被應(yīng)用的結(jié)果的示圖。圖26是示出根據(jù)本發(fā)明的一個實施例從ACELP變換至FD時窗口形態(tài)的示圖。圖27是示出根據(jù)本發(fā)明的一個實施例,根據(jù)當前幀的LPD模式與下一個幀的LPD 模式的窗口序列和LPC提取位置的示圖。圖28是現(xiàn)有的LPC提取位置和根據(jù)本發(fā)明的一個實施例的LPC提取位置相比較的示圖。圖29是示出LPD模式中l(wèi)pdjiiode = {1,0,1,1}時根據(jù)本發(fā)明的實施例的窗口序列的示圖。圖30是示出LPD模式中l(wèi)pdjiiode = {1,0,2,2}時,根據(jù)本發(fā)明的一個實施例的窗口序列的示圖。圖31 是示出當前幀的 lpd_mode = {3,3,3,3}且上一個幀的 lpd_mode = {χ, χ, χ,0}時,根據(jù)本發(fā)明的一個實施例的窗口的序列的示圖。圖32是示出根據(jù)本發(fā)明的一個實施例,當前子幀的(a) lpdjiiode = 1 (TCX256)、 (b) lpd_mode = 2(TCX512)或(c) lpd_mode = 3(TCX1024)時,根據(jù)上一個子幀及下一個子幀的lpd_mode = 0 (ACELP)的窗口序列的示圖。圖33是示出當前子幀的lpd_mode為1 (TCX256)且上一個子幀的lpd_mode為0 時,根據(jù)本發(fā)明的一個實施例的窗口序列的示圖。圖34是示出當前子幀的lpd_mode為2(TCX512)且上一個子幀的lpd_mode為0 時,根據(jù)本發(fā)明的一個實施例的窗口序列的示圖。
圖35是示出當前子幀的lpd_mode為3(TCX1024)且上一個子幀的lpd_mode為0 時,根據(jù)本發(fā)明的一個實施例的窗口序列的示圖。圖36是示出將圖33至圖35的窗口序列結(jié)合的結(jié)果的示圖。圖37是示出根據(jù)本發(fā)明的一個實施例的模式轉(zhuǎn)換時窗口序列的示圖。圖38是示出根據(jù)本發(fā)明的一個實施例,圖3的LPD_START_SEQUENCE及 ST0P_1152_SEQUENCE被變形的結(jié)果的示圖。圖39是示出根據(jù)現(xiàn)有的方法模式轉(zhuǎn)換時窗口序列的示圖。
具體實施例方式以下,將參照附圖中記載的內(nèi)容對本發(fā)明的實施例進行詳細說明。但是,本發(fā)明并不受實施例的限制或限定。各附圖中出示的相同的參考符號表示相同的結(jié)構(gòu)。圖1是示出執(zhí)行語音/音頻統(tǒng)合譯碼的編碼器的整體結(jié)構(gòu)的示圖。圖1示出的語音/音頻統(tǒng)合編碼器,根據(jù)輸入信號的特征不同地執(zhí)行編碼方法, 從而可將編碼的性能和音質(zhì)最大化。例如,語音/音頻統(tǒng)合編碼器,可對輸入信號中與語音(Speech)相類似的信號根據(jù)代碼激勵線性預(yù)測CELP方式(Code Excitation Linear Prediction)編碼,從而可提高譯碼的效率。此外,語音/音頻統(tǒng)合編碼器,可對輸入信號中與音頻(Audio)相類似的信號根據(jù)變換(transform)方式編碼,從而可提高譯碼的效率。圖1中的MPEGS用于將立體聲信號譯碼,可進行MPEG環(huán)繞(MPEG Surround)的一對二 OTT (One-TO-Two)。此外,增強的頻帶復(fù)制eSBR,可分析高頻成分來對輸入信號擴大帶寬。模式開關(guān)-l(Mode Switch-I)對應(yīng)信號分類器(Signal classifier),可判斷輸入信號的當前幀是語音信號還是音頻信號。此時,信號分類器,可判斷輸入信號是類似于語音還是類似于音頻,來根據(jù)信號的特性來選擇編碼器。假定根據(jù)本發(fā)明的一個實施例的語音/音頻統(tǒng)合編碼器包含一種理想操作的信號分析機。如果,輸入信號的當前幀被判斷為與音頻相似時,模式開關(guān)-1將當前幀轉(zhuǎn)換至頻域 FD 模式(Frequency Domain Mode)的高級音頻編碼模式 AAC-M0DE (Advanced Audio Coding MODE),輸入信號的當前幀可根據(jù)AAC-MODE被編碼。在AAC-MODE中,輸入信號基本地可根據(jù)聽覺心理音響模型被編碼。此外,塊轉(zhuǎn)換-1 (Block switching-1),可對當前幀根據(jù)輸入信號的特性將窗口(window)不同地應(yīng)用。在這種情況下,窗口形態(tài)可根據(jù)上一個幀或下一個幀的譯碼模式來決定。此后過濾器組(filterbank)可對應(yīng)用了窗口的當前幀執(zhí)行時間到頻率T/F (Time to Frequency)變換。過濾器組為提高編碼的效率,可基本地應(yīng)用修正離散余弦變換MDCT (Modified Discrete Cosine Transform)來執(zhí)行編碼。相反,當輸入信號的當前幀被判斷為與語音相類似時,模式開關(guān)-1將當前幀轉(zhuǎn)換至線性預(yù)測域模式LPD-MODE (Linear Prediction Domain Mode),輸入信號的當前幀可根據(jù)線性預(yù)測編碼 LPC (Linear Prediction Coding)來編碼。模式轉(zhuǎn)換 _2 (Mode Switch-2), 在LPD模式之間發(fā)生模式轉(zhuǎn)換時,可對每一個子幀應(yīng)用根據(jù)LPD模式的窗口。與在AMR-WB+ 或USAC中相同,基本上,輸入信號的當前幀可在LPD模式中以4個子幀(sub-frame)構(gòu)成。 在此,輸入信號的當前幀可被定義為超幀(super-frame)。在本發(fā)明中定義的窗口序列,可定義為將被應(yīng)用于構(gòu)成超幀的子幀的至少一個的窗口組合的形態(tài)。例如,將超幀(super-frame)處理為1個子幀時,超幀的lpd_mode可被決定為{3,
113,3,3}。在此情況下,窗口序列以1個窗口構(gòu)成。此外,將超幀處理為2個子幀時,超幀的 lpdjnode可被決定為{2,2,2,2}。在此情況下,窗口序列以2個窗口構(gòu)成。此外,將超幀處理為4個子幀時,超幀的lpdjnode可被決定為{1,1,1,1}。在此情況下,窗口序列以4個窗口構(gòu)成。在此,當lpdjnode = O時,一個的子幀根據(jù)代數(shù)碼激勵線性預(yù)測ACELP (Algebraic code excited linear prediction)被編碼。在這種情況下,當ACELP被應(yīng)用時,T/F變換及窗口不被應(yīng)用。即,根據(jù)基于LPC的LPD,模式編碼的過程,可通過基于時域譯碼的ACELP 塊和基于過濾器組的變換碼激勵TCX(Transform Code eXcitation)塊被執(zhí)行。過濾器組方法包括MDCT和離散傅立葉變換DFT(Discrete Fourier Transform)方法,本發(fā)明使用基于MDCT的TCX。本發(fā)明對在模式轉(zhuǎn)換-1和模式轉(zhuǎn)換_2中處理窗口序列的方法進行了說明。圖2是用于說明基于MDCT的TDAC的示圖。MDCT (Modified Discrete Cosine Transform),作為在音頻編碼器中被廣泛使用的T/F變換方式,具有即使執(zhí)行幀之間的重疊相加(overlap add)也不會增加比特率的優(yōu)點。相反,MDCT作為在時域中制造混淆(aliasing)的變換方式,MDCT是,在將輸入信號從頻域到時域逆變換后,必須和與當前幀相鄰的幀對窗口執(zhí)行50%的重疊相加,才可使原來的 ffflAff^^MHCW- Ψ^ ^^ ζ (TDAC transform =Time-Domain Aliasing Cancellation transform)。參照圖2的話,輸入信號在窗口處理后執(zhí)行MDCT。MDCT的執(zhí)行在時域中制造混淆。 圖2中,Rk表示對輸入信號應(yīng)用的窗口的右側(cè)部分。對輸入信號執(zhí)行MDCT的話,以Rk/2為基準折疊窗口,可能會發(fā)生時域混疊TDA (Time-Domain Aliasing)。此后,對輸入信號執(zhí)行 IMDCT的話,窗口雖然被展開(unfolding)成Rk,但是在TDA發(fā)生后被展開的窗口顯示與原來的窗口不同的形態(tài)。但是,與當前幀相同,下一個幀被開窗口與MDCT與IMDCT與開窗口 (Windowing — MDCT — IMDCT — windowing)后,應(yīng)用了窗口的下一個幀的左側(cè)信號與應(yīng)用了窗口的當前幀的右側(cè)信號被互相執(zhí)行重疊相加的話,可提取出清除了 TDA的原有輸入信號。此過程是在TDA條件下用于清除混淆的重疊相加的方法。為了應(yīng)用上面所述的重疊原理(overlap-add and TDAC),應(yīng)用了窗口的幀被重疊相加的點,就是窗口的折點,在這種情況下,折點位置為Rk/2。圖3是示出現(xiàn)有的RM中被定義的窗口序列的示圖。圖3示出可應(yīng)用于圖1的塊轉(zhuǎn)換-l(Block switching-1)的窗口。在這種情況下, 圖3中索引2的情況,因為由8個SH0RT_WIND0W構(gòu)成一套,當其被以窗口序列表示出時,在別的轉(zhuǎn)換模式中,可由1個窗口構(gòu)成1個窗口序列。如圖3中所見,示出窗口序列假定為三角窗口。當前幀的長度N被設(shè)定為2048時,虛線的間隔表示128。但是ST0P_START_1152_ SEQUENCE的情況,當前幀的長度設(shè)定為2304。圖 4 是示出窗口序列(情況 1 :0NLY_L0NG_SEQUENCE 至 LPD_START_SEQUENCE)的示圖。依據(jù)USAC 的冊,定義為 0NLY_L0NG_SEQUENCE401 下一個可顯示 LPD_START_ SEQENCE404,405LPD_START_SEQENCE 下一個顯示 LPD_SEQUENCE。LPD_SEQUENCE 可顯示在區(qū)域405中。LPD_SEQUENCE表示應(yīng)用了 LPD模式的窗口序列,在此,線402與線403之間的區(qū)域,表示當解碼器中輸入信號被復(fù)原時相鄰的兩個的窗口序列被重疊相加的區(qū)域。圖 5 是示出窗口序列(情況 2 :0NLY_L0NG_SEQUENCE 至 LPD_START_SEQUENCE)的示圖。依據(jù)USAC 的冊,定義為 0NLY_L0NG_SEQUENCE501 下一個顯示 LPD_START_ SEQENCE504, LPD_START_SEQENCE504 下一個顯示 LPD_SEQUENCE。LPD_SEQUENCE 可顯示在區(qū)域505中。與圖4相同,LPD_SEQUENCE表示在LPD模式中生成的窗口序列,在此,線502與線 503之間的區(qū)域,表示當解碼器中輸入信號被復(fù)原時相鄰的兩個窗口被重疊相加的區(qū)域。圖6是示出從FD模式轉(zhuǎn)換至LPD模式時,窗口序列(情況3 LPD_START_SEQUENCE 至 LPD_SEQUENCE)的示圖。依據(jù)USAC 的冊,定義為 0NLY_L0NG_SEQUENCE601 下一個顯示 LPD_START_ SEQENCE604。LPD_START_SEQENCE601 表示當模式開關(guān)-1 中發(fā)生從 FD 模式,AAC MODE' 中至LPD模式'LPC MODE'的轉(zhuǎn)換時應(yīng)用AAC模式的最后的窗口序列。LPD_SEQUENCE可顯示在區(qū)域604中。與圖4相同,LPD_SEQUENCE表示應(yīng)用LPD模式的窗口序列,在此,線602與線603 之間的區(qū)域,表示當解碼器中輸入信號被復(fù)原時,相鄰的兩個窗口序列被重疊相加的區(qū)域。 在這種情況下,窗口序列被重疊相加的區(qū)域的間隔為64點(64-point)。圖7是示出從LPD模式轉(zhuǎn)換至FD模式時,窗口序列(情況4 LPD_START_SEQUENCE 至LPD_SEQUENCE),和從LPD模式轉(zhuǎn)換至FD模式時,窗口序列(情況4 :LPD_SEQUENCE to ST0P_1152_SEQUENCE 或 ST0P_START_1152_SEQUENCE)的示圖。依據(jù)USAC的RM,定義為,區(qū)域701中顯示應(yīng)用了 LPD模式的LPD_SEQUENCE,之后區(qū)域704中顯示應(yīng)用了 LPD模式的LPD_SEQUENCE。圖7中,LPD—SEQENCE和LPD— SEQENCE重疊相加的區(qū)域為線702和線703之間的區(qū)域,被重疊相加的區(qū)域的間隔為128點 (128-point)。此外,如圖7中所見,區(qū)域701中顯示應(yīng)用了 LPD模式的LPD_SEQUENCE,且之后可顯示應(yīng)用了 ACC模式的ST0P_1152_SEQUENCE705。此外,區(qū)域701中顯示應(yīng)用了 LPD模式的 LPD_SEQUENCE,且之后可顯示應(yīng)用了 ACC 模式的 ST0P_1152_SEQUENCE706。根據(jù)本發(fā)明的一個實施例,提出了在情況3、情況4中處理窗口序列的方法及處理 LPD_SEQUENCE的方法。情況3作為從LPD模式向FD模式轉(zhuǎn)換的情況,在圖13至圖16中進行說明,情況4作為從LPD模式向FD模式轉(zhuǎn)換的情況,在圖20至圖24中進行說明。LPD_ SEQUENCE在圖8至圖12中進行說明。情況3及情況4,表示在FD模式與LPD模式間進行模式轉(zhuǎn)換時處理窗口序列的方法,由圖1的塊轉(zhuǎn)換-1處理窗口序列。此外,LPD_SEQUENCE 表示在LPD模式之間進行模式轉(zhuǎn)換時窗口序列的處理方法,由圖1的塊轉(zhuǎn)換-2 (Blocking Switching-2)處理窗口序列。關(guān)于LPD之間的模式轉(zhuǎn)換,語音/音頻統(tǒng)合編碼器(USAC)可包括模式轉(zhuǎn)換單元和編碼單元。模式轉(zhuǎn)換單元,對構(gòu)成輸入信號的幀的子幀在LPD模式之間進行轉(zhuǎn)換;編碼單元,將基于被轉(zhuǎn)換的LPD模式的窗口應(yīng)用于子幀中要編碼的當前子幀,來將輸入信號編碼。
在這種情況下,模式轉(zhuǎn)換單元與圖1的模式開關(guān)_2對應(yīng),編碼單元與圖1的塊轉(zhuǎn)換_2對應(yīng)。編碼單元根據(jù)上一個子幀的LPD模式和下一個子幀的LPD模式,將變形的窗口應(yīng)用于當前子幀來將輸入信號編碼。此外,編碼單元,可以以存在于子幀的邊界的折點為中心,執(zhí)行幀之間的重疊相加。例如,當當前子幀的LPD模式為1,且上一個子幀或下一個子幀的LPD模式不為0 時,語音/音頻統(tǒng)合編碼器(USAC)的編碼單元,可利用對與上一個子幀或所述下一個子幀重疊相加(overlap-add)的區(qū)域間隔為256的所述當前子幀所應(yīng)用的窗口來編碼。此外,當當前子幀的LPD模式為2,且上一個子幀或下一個子幀的LPD模式不為0 時,語音/音頻統(tǒng)合編碼器(USAC)的編碼單元,可利用對與上一個子幀或所述下一個子幀重疊相加(overlap-add)的區(qū)域間隔為512的所述當前子幀所應(yīng)用的窗口來編碼。此外,當當前子幀的LPD模式為3,且上一個子幀或下一個子幀的LPD模式不為0 時,語音/音頻統(tǒng)合編碼器(USAC)的編碼單元,可利用對與上一個子幀或所述下一個子幀重疊相加(overlap-add)的區(qū)域間隔為1024的所述當前子幀所應(yīng)用的窗口來編碼。如果,當上一個子幀的LPD模式為0時,編碼單元可將被應(yīng)用于當前子幀的窗口的左側(cè)部分處理成值為1的直角形態(tài)。此外,當下一個子幀的LPD模式為0時,編碼單元可將被應(yīng)用于當前子幀的窗口的右側(cè)部分處理成值為1的直角形態(tài)。在這種情況下,編碼單元可以以存在于子幀的邊界的折點為中心,執(zhí)行子幀之間的重疊相加。關(guān)于從FD模式至LPD模式的模式轉(zhuǎn)換,語音/音頻統(tǒng)合編碼器(USAC)可包括模式轉(zhuǎn)換單元和編碼單元。模式轉(zhuǎn)換單元,對構(gòu)成輸入信號的幀的子幀,從FD模式轉(zhuǎn)換至LPD 模式;編碼單元,將FD模式的窗口序列與LPD模式的窗口序列以折點為基準重疊相加來編碼。在這種情況下,F(xiàn)D模式可以是ACC模式。在這種情況下,當LPD模式的窗口序列中開始子幀的LPD模式為0時,編碼單元可將與開始子幀相對應(yīng)的窗口替換為LPD模式對應(yīng)1的窗口。此外,編碼單元可將LPD模式的窗口序列轉(zhuǎn)移,使其能以折點為基準與FD模式的窗口序列重疊相加。此外,編碼單元可根據(jù)LPD模式的窗口序列將FD模式的窗口序列的形態(tài)變形。此外,編碼單元,可以以位于構(gòu)成輸入信號的幀的子幀的邊界的折點為基準在窗口序列之間執(zhí)行重疊相加,并將所述折點設(shè)定為開始點,根據(jù)子幀單位來提取出線性預(yù)測系數(shù) LPC(Linear Prediction Coefficient) 0關(guān)于從LPD模式到FD模式的模式轉(zhuǎn)換,語音/音頻統(tǒng)合編碼器(USAC)可包括模式轉(zhuǎn)換單元和編碼單元。模式轉(zhuǎn)換單元,對構(gòu)成輸入信號的幀,從LPD模式轉(zhuǎn)換至FD模式; 編碼單元,將所述FD模式的窗口序列與所述LPD模式的窗口序列以折點為基準重疊相加來編碼。此外,編碼單元可根據(jù)LPD模式將FD模式的窗口序列的形態(tài)變形。此外,編碼單元可將LPD模式的窗口序列和FD模式的窗口序列重疊256點,在此, 當LPD模式的窗口序列中結(jié)束子幀的LPD模式為0時,結(jié)束子幀所對應(yīng)的窗口可被替換為 LPD模式對應(yīng)1的窗口。對此,語音/音頻統(tǒng)合解碼器(USAC),可與之前說明的有關(guān)LPD模式之間的模式轉(zhuǎn)換、從FD模式至LPD模式的模式轉(zhuǎn)換、或從LPD模式至FP模式的模式轉(zhuǎn)換的語音/音頻統(tǒng)合編碼器相同地處理窗口序列。以下,將對依據(jù)本發(fā)明的語音/音頻統(tǒng)合編碼器(USAC)和語音/音頻統(tǒng)合解碼器(USAC)中處理的窗口序列進行詳細說明。圖8是示出各種類型LPD_SEQUENCE的窗口形態(tài)的示圖。圖8表示圖4至圖7中所說明的LPD_SEQUENCE的窗口形態(tài),圖8中圖示的LPD_ SEQUENCE可根據(jù)下表1被定義。[表1]
權(quán)利要求
1.一種語音/音頻統(tǒng)合編碼器,包括模式轉(zhuǎn)換單元,其對構(gòu)成輸入信號的幀的子幀,在線性預(yù)測域LPD模式之間進行轉(zhuǎn)換;和編碼單元,其將基于被轉(zhuǎn)換的LPD模式的窗口應(yīng)用于所述子幀中要編碼的當前子幀, 來將所述輸入信號編碼,其中,所述編碼單元,將根據(jù)上一個子幀的LPD模式和下一個子幀的LPD模式改變的窗口應(yīng)用于當前子幀,來將所述輸入信號編碼。
2.如權(quán)利要求1所述的語音/音頻統(tǒng)合編碼器,其中,所述編碼單元,當所述當前子幀的LPD模式為1,且所述上一個子幀或所述下一個子幀的LPD模式不為0時,利用對與所述上一個子幀或所述下一個子幀重疊相加的區(qū)域的間隔為256的所述當前子幀所應(yīng)用的窗口來編碼。
3.如權(quán)利要求1所述的語音/音頻統(tǒng)合編碼器,其中,所述編碼單元,當所述當前子幀的LPD模式為2,且所述上一個子幀或所述下一個子幀的LPD模式不為0時,利用對與所述上一個子幀或所述下一個子幀重疊相加的區(qū)域的間隔為512的所述當前子幀所應(yīng)用的窗口來編碼。
4.如權(quán)利要求1所述的語音/音頻統(tǒng)合編碼器,其中,所述編碼單元,當所述當前子幀的LPD模式為3,且所述上一個子幀或所述下一個子幀的LPD模式不為0時,利用對與所述上一個子幀或所述下一個子幀重疊相加的區(qū)域的間隔為1024的所述當前子幀所應(yīng)用的窗口來編碼。
5.如權(quán)利要求2至權(quán)利要求4中的任何一項所述的語音/音頻統(tǒng)合編碼器,其中,所述編碼單元,當所述上一個子幀的LPD模式為0時,將被應(yīng)用于所述當前子幀的窗口的左側(cè)部分處理成值為1的直角形態(tài),當所述下一個子幀的LPD模式為0時,將被應(yīng)用于所述當前子幀的窗口的右側(cè)部分處理成值為1的直角形態(tài)。
6.如權(quán)利要求4所述的語音/音頻統(tǒng)合編碼器,其中,被應(yīng)用于所述當前子幀的窗口, 當所述當前子幀的LPD模式為1時,形態(tài)如下圖所示。下^■個 1 pd_mocle 為ACELP時 \上一個Ipd mode為)ACF丄P時Γ/N下一個Ipd mode為A \ X^TCX512,4」! LATCX256吋上一個Ipd mode為TCX256, TCX512、TCX256時
7.如權(quán)利要求4所述的語音/音頻統(tǒng)合編碼器,其中,被應(yīng)用于所述當前子幀的窗口, 當所述當前子幀的LPD模式為2時,形態(tài)如下圖所示。
8.如權(quán)利要求4所述的語音/音頻統(tǒng)合編碼器,其中,被應(yīng)用于所述當前子幀的窗口, 當所述當前子幀的LPD模式為3時,形態(tài)如下圖所示。
9.如權(quán)利要求1所述的語音/音頻統(tǒng)合編碼器,其中,所述編碼單元,以存在于所述子幀的邊界的折點為中心,執(zhí)行子幀之間的重疊相加。
10.一種語音/音頻統(tǒng)合編碼器USAC,包括模式轉(zhuǎn)換單元,其對輸入信號的幀,從頻域FD模式轉(zhuǎn)換至線性預(yù)測域LPD模式;和編碼單元,其將所述FD模式的窗口序列與所述LPD模式的窗口序列以折點為基準重疊相加來編碼。
11.如權(quán)利要求10所述的語音/音頻統(tǒng)合編碼器,其中,所述編碼單元,當所述LPD模式的窗口序列中開始子幀的LPD模式為0時,將與所述開始子幀相對應(yīng)的窗口替換為LPD 模式對應(yīng)1的窗口。
12.如權(quán)利要求10所述的語音/音頻統(tǒng)合編碼器,其中,所述編碼單元,將所述LPD模式的窗口序列轉(zhuǎn)移,使其能以折點為基準與所述FD模式的窗口序列重疊相加,其中,所述 LPD模式的窗口序列和所述FD模式的窗口序列形態(tài)如下圖所示。
13.如權(quán)利要求10所述的語音/音頻統(tǒng)合編碼器,其中,所述編碼單元,根據(jù)所述LPD 模式的窗口序列將所述FD模式的窗口序列的形態(tài)變形,其中,所述FD模式的窗口序列和所述LPD模式的窗口序列形態(tài)如下圖所示。
14.如權(quán)利要求10所述的語音/音頻統(tǒng)合編碼器,其中,所述編碼單元,以位于構(gòu)成輸入信號的幀的子幀的邊界的折點為基準,在窗口序列之間執(zhí)行重疊相加,且將所述折點設(shè)定為出發(fā)點,根據(jù)子幀單位來提取出線性預(yù)測系數(shù)LPC。
15.一種語音/音頻統(tǒng)合編碼器,包括
16.如權(quán)利要求15所述的語音/音頻統(tǒng)合編碼器,其中,所述編碼單元,根據(jù)LPD模式將FD模式的窗口序列的形態(tài)變形,其中,所述LPD模式的窗口序列和所述FD模式的窗口序列形態(tài)如下圖所示。
17.如權(quán)利要求15所述的語音/音頻統(tǒng)合編碼器,其中,所述編碼單元,將LPD模式的窗口序列和FD模式的窗口序列重疊256點,且當所述LPD模式的窗口序列中結(jié)束子幀的 LPD模塊為0時,所述結(jié)束子幀所對應(yīng)的窗口被替換為與LPD模塊對應(yīng)1的窗口,其中,所述 LPD模式的窗口序列和所述FD模式的窗口序列形態(tài)如下圖所示。
18.一種語音/音頻統(tǒng)合解碼器,包括模式轉(zhuǎn)換單元,其對構(gòu)成輸入信號的幀的子幀,在LPD模式之間進行轉(zhuǎn)換;和解碼單元,其將基于被轉(zhuǎn)換的LPD模式的窗口應(yīng)用于所述子幀中要解碼的當前子幀, 來將所述輸入信號進行解碼,其中,所述解碼單元,將根據(jù)上一個子幀的LPD模式和下一個子幀的LPD模式改變的窗口應(yīng)用于當前子幀,來將所述輸入信號解碼。
19.一種語音/音頻統(tǒng)合解碼器,其包括模式轉(zhuǎn)換單元,其對輸入信號的幀,從FD模式轉(zhuǎn)換至LPD模式;和解碼單元,其將所述FD模式的窗口序列與所述LPD模式的窗口序列以折點為基準重疊相加來解碼。
20.一種語音/音頻統(tǒng)合解碼器,包括模式轉(zhuǎn)換單元,其對輸入信號的幀,從LPD模式轉(zhuǎn)換至FD模式;和解碼單元,其將所述FD模式的窗口序列與所述LPD模式的窗口序列以折點為基準重疊相加來解碼。
全文摘要
本發(fā)明提出了一種以模式轉(zhuǎn)換為基礎(chǔ)來處理窗口序列的語音/音頻統(tǒng)合編解碼器。當語音/音頻統(tǒng)合編解碼器發(fā)生模式轉(zhuǎn)換時,可以折點為基準執(zhí)行幀之間的重疊來編碼或解碼。語音/音頻統(tǒng)合編解碼器為執(zhí)行編碼或解碼,根據(jù)情況處理不同的窗口序列,從而可提高譯碼的性能。
文檔編號H04N7/12GK102388607SQ200980155342
公開日2012年3月21日 申請日期2009年11月26日 優(yōu)先權(quán)日2008年11月26日
發(fā)明者姜京玉, 安致得, 張大永, 徐廷一, 樸浩綜, 樸榮喆, 李泰辰, 洪鎮(zhèn)佑, 白承權(quán), 金珉第 申請人:光云大學(xué)校 產(chǎn)學(xué)協(xié)力團, 韓國電子通信研究院