基于模式轉(zhuǎn)換來處理窗口序列的語音/音頻統(tǒng)合編解碼器的制作方法

文檔序號：7738469閱讀：158來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>電子通信裝置的制造及其應(yīng)用技術(shù)

專利名稱：基于模式轉(zhuǎn)換來處理窗口序列的語音/音頻統(tǒng)合編解碼器的制作方法
技術(shù)領(lǐng)域：
本發(fā)明涉及一種在基于修正離散余弦變換MDCT的語音/音頻統(tǒng)合編解碼器USAC 中發(fā)生模式轉(zhuǎn)換時，處理用于執(zhí)行編碼或解碼的窗口序列的方法。本發(fā)明是通過作為韓國知識經(jīng)濟部的IT原始技術(shù)開發(fā)項目的一環(huán)而執(zhí)行的研究推導(dǎo)出的。(課題管理號2008-F-011-01課題名升級換代DTV核心技術(shù)開發(fā)(標準化連接)-無需眼鏡的個人類型的3D演播技術(shù)的開發(fā))。
背景技術(shù)：
語音/音頻編統(tǒng)合解碼器，在根據(jù)輸入信號的特性改變編碼或解碼方法時，可提高譯碼的性能。在這種情況下，語音/音頻統(tǒng)合編解碼器可將輸入信號中與語音相類似的信號在語音編碼/解碼器中進行編碼/解碼，并可將與音頻相類似的信號在音頻編碼/解碼器中進行編碼/解碼。此類語音/音頻統(tǒng)合編解碼器，可根據(jù)線性預(yù)測域LPD模式之間的模式轉(zhuǎn)換來處理輸入信號。此外，語音/音頻統(tǒng)合編解碼器可根據(jù)LPD模式和FD模式之間的模式轉(zhuǎn)換來處理輸入信號。語音/音頻統(tǒng)合編解碼器根據(jù)模式轉(zhuǎn)換，將窗口序列應(yīng)用于輸入信號的幀中處理了信號。但是需要一種與現(xiàn)有的語音/音頻編解碼器相比，可提高譯碼效率的窗口序列處理方法。

發(fā)明內(nèi)容
技術(shù)課題根據(jù)本發(fā)明的一個實施例，提供一種語音/音頻統(tǒng)合統(tǒng)合編解碼器，其在LPD模式之間發(fā)生模式轉(zhuǎn)換時，應(yīng)用幀之間重疊相加的區(qū)域被擴大的序列，來編碼或解碼。根據(jù)本發(fā)明的一個實施例，提供一種語音/音頻統(tǒng)合編解碼器，其在LPD模式與FD 模式之間發(fā)生模式轉(zhuǎn)換時，應(yīng)用幀之間重疊相加的區(qū)域被擴大的序列，來編碼或解碼。技術(shù)方案根據(jù)本發(fā)明的一個實施例的語音/音頻統(tǒng)合編碼器(USAC)，可包括模式轉(zhuǎn)換單元和編碼單元。模式轉(zhuǎn)換單元，對構(gòu)成輸入信號的幀的子幀，在LPD模式之間進行轉(zhuǎn)換；編碼單元，將基于被轉(zhuǎn)換的LPD模式的窗口應(yīng)用于所述子幀中要編碼的當前子幀，來將所述輸入信號編碼，其中，所述編碼單元，將根據(jù)上一個子幀的LPD模式和下一個子幀的LPD模式被改變的窗口應(yīng)用于當前子幀，可將所述輸入信號編碼。根據(jù)本發(fā)明的一個實施例的語音/音頻統(tǒng)合編碼器(USAC)，可包括模式轉(zhuǎn)換單元和編碼單元。模式轉(zhuǎn)換單元，對輸入信號的幀，從FD模式轉(zhuǎn)換至LPD模式；編碼單元，將所述FD模式的窗口序列與所述LPD模式的窗口序列以折點為基準重疊相加來編碼。根據(jù)本發(fā)明的一個實施例的語音/音頻統(tǒng)合編碼器(USAC)，可包括模式轉(zhuǎn)換單元和編碼單元。模式轉(zhuǎn)換單元，對輸入信號的幀，從LPD模式轉(zhuǎn)換至FD模式；編碼單元，將所述FD模式的窗口序列與所述LPD模式的窗口序列以折點為基準重疊相加來編碼。
根據(jù)本發(fā)明的一個實施例的語音/音頻統(tǒng)合解碼器(USAC)，可包括模式轉(zhuǎn)換單元和解碼單元。模式轉(zhuǎn)換單元，其對構(gòu)成輸入信號的幀的子幀，在LPD模式之間進行轉(zhuǎn)換；解碼單元，其將基于被轉(zhuǎn)換的LPD模式的窗口應(yīng)用于所述子幀中要解碼的當前子幀中，來將所述輸入信號解碼，其中，所述解碼單元，將根據(jù)上一個子幀的LPD模式和下一個子幀的 LPD模式改變的窗口應(yīng)用于當前子幀，可將所述輸入信號解碼。根據(jù)本發(fā)明的一個實施例的語音/音頻統(tǒng)合解碼器(USAC)，可包括模式轉(zhuǎn)換單元和解碼單元。模式轉(zhuǎn)換單元，對輸入信號的幀，從FD模式轉(zhuǎn)換至LPD模式；解碼單元，將所述FD模式的窗口序列與所述LPD模式的窗口序列以折點為基準重疊相加來解碼。根據(jù)本發(fā)明的一個實施例的語音/音頻統(tǒng)合解碼器(USAC)，可包括模式轉(zhuǎn)換單元和解碼單元。模式轉(zhuǎn)換單元，對輸入信號的幀，從LPD模式轉(zhuǎn)換至FD模式；解碼單元，將所述FD模式的窗口序列與所述LPD模式的窗口序列以折點為基準重疊相加來解碼。技術(shù)效果根據(jù)本發(fā)明的一個實施例的語音/音頻統(tǒng)合編解碼器(USAC)，比起在現(xiàn)有的語音 /音頻統(tǒng)合編解碼器中處理的窗口序列，對區(qū)塊效應(yīng)(block artifact)的影響較小，且充分活用MDCT的TDAC條件，可獲得更多的譯碼增益。

圖1是示出執(zhí)行語音/音頻統(tǒng)合譯碼的編碼器的整體結(jié)構(gòu)的示圖。圖2是用于說明基于MDCT的TDAC的示圖。圖3是示出現(xiàn)有的RM中被定義的窗口序列的示圖。圖 4 是示出窗口序列(情況 1 :0NLY_L0NG_SEQUENCE 至 LPD_START_SEQUENCE)的示圖。圖 5 是示出窗口序列(情況 2 :0NLY_L0NG_SEQUENCE 至 LPD_START_SEQUENCE)的示圖。圖6是示出從FD模式轉(zhuǎn)換至LPD模式時，窗口序列(情況3 LPD_START_SEQUENCE 至 LPD_SEQUENCE)的示圖。圖7是示出從LPD模式轉(zhuǎn)換至FD模式時，窗口序列(情況4 LPD_START_SEQUENCE 至LPD_SEQUENCE)，和從LPD模式轉(zhuǎn)換至FD模式時，窗口序列(情況4 :LPD_SEQUENCE to ST0P_1152_SEQUENCE 或 ST0P_START_1152_SEQUENCE)的示圖。圖8是示出各種類型LPD_SEQUENCE的窗口形態(tài)的示圖。圖9是示出(a)當LPD模式為{1，1，1，1}時，(b)當LPD模式為{2,2,2,2}時，(c) 當LPD模式為{3,3,3,3}時的LPD_SEQUENCE的示圖。圖10是示出當LPD模式為{0，1，1，1}時的LPD_SEQUENCE的示圖。圖11是示出當LPD模式為{1,0,2,2}時的LPD_SEQUENCE的示圖。圖12是示出當上一個子幀的結(jié)束子幀的LPD模式為{0}時，LPD模式為{3，3，3， 3}的 LPD_SEQUENCE 的示圖。圖13是示出關(guān)于現(xiàn)有的情況3窗口序列的處理方法的示圖。圖14是示出根據(jù)本發(fā)明的一個實施例的關(guān)于情況3的窗口序列的處理方法的示圖(第1例)。
圖15是示出根據(jù)本發(fā)明的一個實施例的關(guān)于情況3的窗口序列的處理方法的示圖(第2例)。圖16是示出根據(jù)本發(fā)明的一個實施例的關(guān)于情況3的窗口序列的處理方法的示圖(第3例)。圖17是示出根據(jù)本發(fā)明的一個實施例，關(guān)于當前子幀LPD_SEQUENCE的lpdjiiode 為3且關(guān)于下一個子幀的LPD_SEQUENCE的lpd_mode為3時的窗口的示圖。圖18是示出根據(jù)本發(fā)明的一個實施例，關(guān)于當前子幀的LPD_SEQUENCE的lpd_ mode為2且關(guān)于下一個子幀的LPD_SEQUENCE的lpd_mode為2時的窗口的示圖。圖19是示出根據(jù)本發(fā)明的一個實施例，關(guān)于當前子幀的LPD_SEQUENCE的lpd_ mode為1且關(guān)于下一個子幀的LPD_SEQUENCE的lpd_mode為1時的窗口的示圖。圖20是示出關(guān)于現(xiàn)有的情況4的窗口序列的處理方法的示圖。圖21是示出根據(jù)本發(fā)明的一個實施例，關(guān)于情況4的窗口序列的處理方法的示圖 (第1例)。圖22是示出根據(jù)本發(fā)明的一個實施例，關(guān)于情況4的窗口序列的處理方法的示圖 (第2例)。圖23是示出本發(fā)明的一個實施例得關(guān)于情況4的窗口序列的處理方法的示圖 (第3例)。圖24是示出根據(jù)本發(fā)明的一個實施例的反映圖22的窗口序列的ST0P_1024_ SEQUENCE的示圖。圖25是示出根據(jù)本發(fā)明的一個實施例的圖16及圖24的窗口序列被應(yīng)用的結(jié)果的示圖。圖26是示出根據(jù)本發(fā)明的一個實施例從ACELP變換至FD時窗口形態(tài)的示圖。圖27是示出根據(jù)本發(fā)明的一個實施例，根據(jù)當前幀的LPD模式與下一個幀的LPD 模式的窗口序列和LPC提取位置的示圖。圖28是現(xiàn)有的LPC提取位置和根據(jù)本發(fā)明的一個實施例的LPC提取位置相比較的示圖。圖29是示出LPD模式中l(wèi)pdjiiode = {1,0,1,1}時根據(jù)本發(fā)明的實施例的窗口序列的示圖。圖30是示出LPD模式中l(wèi)pdjiiode = {1,0,2,2}時，根據(jù)本發(fā)明的一個實施例的窗口序列的示圖。圖31 是示出當前幀的 lpd_mode = {3,3,3,3}且上一個幀的 lpd_mode = {χ, χ, χ，0}時，根據(jù)本發(fā)明的一個實施例的窗口的序列的示圖。圖32是示出根據(jù)本發(fā)明的一個實施例，當前子幀的(a) lpdjiiode = 1 (TCX256)、 (b) lpd_mode = 2(TCX512)或(c) lpd_mode = 3(TCX1024)時，根據(jù)上一個子幀及下一個子幀的lpd_mode = 0 (ACELP)的窗口序列的示圖。圖33是示出當前子幀的lpd_mode為1 (TCX256)且上一個子幀的lpd_mode為0 時，根據(jù)本發(fā)明的一個實施例的窗口序列的示圖。圖34是示出當前子幀的lpd_mode為2(TCX512)且上一個子幀的lpd_mode為0 時，根據(jù)本發(fā)明的一個實施例的窗口序列的示圖。
圖35是示出當前子幀的lpd_mode為3(TCX1024)且上一個子幀的lpd_mode為0 時，根據(jù)本發(fā)明的一個實施例的窗口序列的示圖。圖36是示出將圖33至圖35的窗口序列結(jié)合的結(jié)果的示圖。圖37是示出根據(jù)本發(fā)明的一個實施例的模式轉(zhuǎn)換時窗口序列的示圖。圖38是示出根據(jù)本發(fā)明的一個實施例，圖3的LPD_START_SEQUENCE及 ST0P_1152_SEQUENCE被變形的結(jié)果的示圖。圖39是示出根據(jù)現(xiàn)有的方法模式轉(zhuǎn)換時窗口序列的示圖。
具體實施例方式以下，將參照附圖中記載的內(nèi)容對本發(fā)明的實施例進行詳細說明。但是，本發(fā)明并不受實施例的限制或限定。各附圖中出示的相同的參考符號表示相同的結(jié)構(gòu)。圖1是示出執(zhí)行語音/音頻統(tǒng)合譯碼的編碼器的整體結(jié)構(gòu)的示圖。圖1示出的語音/音頻統(tǒng)合編碼器，根據(jù)輸入信號的特征不同地執(zhí)行編碼方法，從而可將編碼的性能和音質(zhì)最大化。例如，語音/音頻統(tǒng)合編碼器，可對輸入信號中與語音(Speech)相類似的信號根據(jù)代碼激勵線性預(yù)測CELP方式(Code Excitation Linear Prediction)編碼，從而可提高譯碼的效率。此外，語音/音頻統(tǒng)合編碼器，可對輸入信號中與音頻(Audio)相類似的信號根據(jù)變換(transform)方式編碼，從而可提高譯碼的效率。圖1中的MPEGS用于將立體聲信號譯碼，可進行MPEG環(huán)繞(MPEG Surround)的一對二 OTT (One-TO-Two)。此外，增強的頻帶復(fù)制eSBR，可分析高頻成分來對輸入信號擴大帶寬。模式開關(guān)-l(Mode Switch-I)對應(yīng)信號分類器(Signal classifier)，可判斷輸入信號的當前幀是語音信號還是音頻信號。此時，信號分類器，可判斷輸入信號是類似于語音還是類似于音頻，來根據(jù)信號的特性來選擇編碼器。假定根據(jù)本發(fā)明的一個實施例的語音/音頻統(tǒng)合編碼器包含一種理想操作的信號分析機。如果，輸入信號的當前幀被判斷為與音頻相似時，模式開關(guān)-1將當前幀轉(zhuǎn)換至頻域 FD 模式(Frequency Domain Mode)的高級音頻編碼模式 AAC-M0DE (Advanced Audio Coding MODE)，輸入信號的當前幀可根據(jù)AAC-MODE被編碼。在AAC-MODE中，輸入信號基本地可根據(jù)聽覺心理音響模型被編碼。此外，塊轉(zhuǎn)換-1 (Block switching-1)，可對當前幀根據(jù)輸入信號的特性將窗口(window)不同地應(yīng)用。在這種情況下，窗口形態(tài)可根據(jù)上一個幀或下一個幀的譯碼模式來決定。此后過濾器組(filterbank)可對應(yīng)用了窗口的當前幀執(zhí)行時間到頻率T/F (Time to Frequency)變換。過濾器組為提高編碼的效率，可基本地應(yīng)用修正離散余弦變換MDCT (Modified Discrete Cosine Transform)來執(zhí)行編碼。相反，當輸入信號的當前幀被判斷為與語音相類似時，模式開關(guān)-1將當前幀轉(zhuǎn)換至線性預(yù)測域模式LPD-MODE (Linear Prediction Domain Mode)，輸入信號的當前幀可根據(jù)線性預(yù)測編碼 LPC (Linear Prediction Coding)來編碼。模式轉(zhuǎn)換 _2 (Mode Switch-2)，在LPD模式之間發(fā)生模式轉(zhuǎn)換時，可對每一個子幀應(yīng)用根據(jù)LPD模式的窗口。與在AMR-WB+ 或USAC中相同，基本上，輸入信號的當前幀可在LPD模式中以4個子幀(sub-frame)構(gòu)成。在此，輸入信號的當前幀可被定義為超幀(super-frame)。在本發(fā)明中定義的窗口序列，可定義為將被應(yīng)用于構(gòu)成超幀的子幀的至少一個的窗口組合的形態(tài)。例如，將超幀(super-frame)處理為1個子幀時，超幀的lpd_mode可被決定為{3，
113，3，3}。在此情況下，窗口序列以1個窗口構(gòu)成。此外，將超幀處理為2個子幀時，超幀的 lpdjnode可被決定為{2，2，2，2}。在此情況下，窗口序列以2個窗口構(gòu)成。此外，將超幀處理為4個子幀時，超幀的lpdjnode可被決定為{1，1，1，1}。在此情況下，窗口序列以4個窗口構(gòu)成。在此，當lpdjnode = O時，一個的子幀根據(jù)代數(shù)碼激勵線性預(yù)測ACELP (Algebraic code excited linear prediction)被編碼。在這種情況下，當ACELP被應(yīng)用時，T/F變換及窗口不被應(yīng)用。即，根據(jù)基于LPC的LPD，模式編碼的過程，可通過基于時域譯碼的ACELP 塊和基于過濾器組的變換碼激勵TCX(Transform Code eXcitation)塊被執(zhí)行。過濾器組方法包括MDCT和離散傅立葉變換DFT(Discrete Fourier Transform)方法，本發(fā)明使用基于MDCT的TCX。本發(fā)明對在模式轉(zhuǎn)換-1和模式轉(zhuǎn)換_2中處理窗口序列的方法進行了說明。圖2是用于說明基于MDCT的TDAC的示圖。MDCT (Modified Discrete Cosine Transform)，作為在音頻編碼器中被廣泛使用的T/F變換方式，具有即使執(zhí)行幀之間的重疊相加(overlap add)也不會增加比特率的優(yōu)點。相反，MDCT作為在時域中制造混淆(aliasing)的變換方式，MDCT是，在將輸入信號從頻域到時域逆變換后，必須和與當前幀相鄰的幀對窗口執(zhí)行50%的重疊相加，才可使原來的 ffflAff^^MHCW- Ψ^ ^^ ζ (TDAC transform =Time-Domain Aliasing Cancellation transform)。參照圖2的話，輸入信號在窗口處理后執(zhí)行MDCT。MDCT的執(zhí)行在時域中制造混淆。圖2中，Rk表示對輸入信號應(yīng)用的窗口的右側(cè)部分。對輸入信號執(zhí)行MDCT的話，以Rk/2為基準折疊窗口，可能會發(fā)生時域混疊TDA (Time-Domain Aliasing)。此后，對輸入信號執(zhí)行 IMDCT的話，窗口雖然被展開(unfolding)成Rk，但是在TDA發(fā)生后被展開的窗口顯示與原來的窗口不同的形態(tài)。但是，與當前幀相同，下一個幀被開窗口與MDCT與IMDCT與開窗口 (Windowing — MDCT — IMDCT — windowing)后，應(yīng)用了窗口的下一個幀的左側(cè)信號與應(yīng)用了窗口的當前幀的右側(cè)信號被互相執(zhí)行重疊相加的話，可提取出清除了 TDA的原有輸入信號。此過程是在TDA條件下用于清除混淆的重疊相加的方法。為了應(yīng)用上面所述的重疊原理(overlap-add and TDAC)，應(yīng)用了窗口的幀被重疊相加的點，就是窗口的折點，在這種情況下，折點位置為Rk/2。圖3是示出現(xiàn)有的RM中被定義的窗口序列的示圖。圖3示出可應(yīng)用于圖1的塊轉(zhuǎn)換-l(Block switching-1)的窗口。在這種情況下，圖3中索引2的情況，因為由8個SH0RT_WIND0W構(gòu)成一套，當其被以窗口序列表示出時，在別的轉(zhuǎn)換模式中，可由1個窗口構(gòu)成1個窗口序列。如圖3中所見，示出窗口序列假定為三角窗口。當前幀的長度N被設(shè)定為2048時，虛線的間隔表示128。但是ST0P_START_1152_ SEQUENCE的情況，當前幀的長度設(shè)定為2304。圖 4 是示出窗口序列(情況 1 :0NLY_L0NG_SEQUENCE 至 LPD_START_SEQUENCE)的示圖。依據(jù)USAC 的冊，定義為 0NLY_L0NG_SEQUENCE401 下一個可顯示 LPD_START_ SEQENCE404,405LPD_START_SEQENCE 下一個顯示 LPD_SEQUENCE。LPD_SEQUENCE 可顯示在區(qū)域405中。LPD_SEQUENCE表示應(yīng)用了 LPD模式的窗口序列，在此，線402與線403之間的區(qū)域，表示當解碼器中輸入信號被復(fù)原時相鄰的兩個的窗口序列被重疊相加的區(qū)域。圖 5 是示出窗口序列(情況 2 :0NLY_L0NG_SEQUENCE 至 LPD_START_SEQUENCE)的示圖。依據(jù)USAC 的冊，定義為 0NLY_L0NG_SEQUENCE501 下一個顯示 LPD_START_ SEQENCE504, LPD_START_SEQENCE504 下一個顯示 LPD_SEQUENCE。LPD_SEQUENCE 可顯示在區(qū)域505中。與圖4相同，LPD_SEQUENCE表示在LPD模式中生成的窗口序列，在此，線502與線 503之間的區(qū)域，表示當解碼器中輸入信號被復(fù)原時相鄰的兩個窗口被重疊相加的區(qū)域。圖6是示出從FD模式轉(zhuǎn)換至LPD模式時，窗口序列(情況3 LPD_START_SEQUENCE 至 LPD_SEQUENCE)的示圖。依據(jù)USAC 的冊，定義為 0NLY_L0NG_SEQUENCE601 下一個顯示 LPD_START_ SEQENCE604。LPD_START_SEQENCE601 表示當模式開關(guān)-1 中發(fā)生從 FD 模式，AAC MODE' 中至LPD模式'LPC MODE'的轉(zhuǎn)換時應(yīng)用AAC模式的最后的窗口序列。LPD_SEQUENCE可顯示在區(qū)域604中。與圖4相同，LPD_SEQUENCE表示應(yīng)用LPD模式的窗口序列，在此，線602與線603 之間的區(qū)域，表示當解碼器中輸入信號被復(fù)原時，相鄰的兩個窗口序列被重疊相加的區(qū)域。在這種情況下，窗口序列被重疊相加的區(qū)域的間隔為64點(64-point)。圖7是示出從LPD模式轉(zhuǎn)換至FD模式時，窗口序列(情況4 LPD_START_SEQUENCE 至LPD_SEQUENCE)，和從LPD模式轉(zhuǎn)換至FD模式時，窗口序列(情況4 :LPD_SEQUENCE to ST0P_1152_SEQUENCE 或 ST0P_START_1152_SEQUENCE)的示圖。依據(jù)USAC的RM，定義為，區(qū)域701中顯示應(yīng)用了 LPD模式的LPD_SEQUENCE，之后區(qū)域704中顯示應(yīng)用了 LPD模式的LPD_SEQUENCE。圖7中，LPD—SEQENCE和LPD— SEQENCE重疊相加的區(qū)域為線702和線703之間的區(qū)域，被重疊相加的區(qū)域的間隔為128點 (128-point)。此外，如圖7中所見，區(qū)域701中顯示應(yīng)用了 LPD模式的LPD_SEQUENCE，且之后可顯示應(yīng)用了 ACC模式的ST0P_1152_SEQUENCE705。此外，區(qū)域701中顯示應(yīng)用了 LPD模式的 LPD_SEQUENCE，且之后可顯示應(yīng)用了 ACC 模式的 ST0P_1152_SEQUENCE706。根據(jù)本發(fā)明的一個實施例，提出了在情況3、情況4中處理窗口序列的方法及處理 LPD_SEQUENCE的方法。情況3作為從LPD模式向FD模式轉(zhuǎn)換的情況，在圖13至圖16中進行說明，情況4作為從LPD模式向FD模式轉(zhuǎn)換的情況，在圖20至圖24中進行說明。LPD_ SEQUENCE在圖8至圖12中進行說明。情況3及情況4，表示在FD模式與LPD模式間進行模式轉(zhuǎn)換時處理窗口序列的方法，由圖1的塊轉(zhuǎn)換-1處理窗口序列。此外，LPD_SEQUENCE 表示在LPD模式之間進行模式轉(zhuǎn)換時窗口序列的處理方法，由圖1的塊轉(zhuǎn)換-2 (Blocking Switching-2)處理窗口序列。關(guān)于LPD之間的模式轉(zhuǎn)換，語音/音頻統(tǒng)合編碼器(USAC)可包括模式轉(zhuǎn)換單元和編碼單元。模式轉(zhuǎn)換單元，對構(gòu)成輸入信號的幀的子幀在LPD模式之間進行轉(zhuǎn)換；編碼單元，將基于被轉(zhuǎn)換的LPD模式的窗口應(yīng)用于子幀中要編碼的當前子幀，來將輸入信號編碼。
在這種情況下，模式轉(zhuǎn)換單元與圖1的模式開關(guān)_2對應(yīng)，編碼單元與圖1的塊轉(zhuǎn)換_2對應(yīng)。編碼單元根據(jù)上一個子幀的LPD模式和下一個子幀的LPD模式，將變形的窗口應(yīng)用于當前子幀來將輸入信號編碼。此外，編碼單元，可以以存在于子幀的邊界的折點為中心，執(zhí)行幀之間的重疊相加。例如，當當前子幀的LPD模式為1，且上一個子幀或下一個子幀的LPD模式不為0 時，語音/音頻統(tǒng)合編碼器(USAC)的編碼單元，可利用對與上一個子幀或所述下一個子幀重疊相加(overlap-add)的區(qū)域間隔為256的所述當前子幀所應(yīng)用的窗口來編碼。此外，當當前子幀的LPD模式為2，且上一個子幀或下一個子幀的LPD模式不為0 時，語音/音頻統(tǒng)合編碼器(USAC)的編碼單元，可利用對與上一個子幀或所述下一個子幀重疊相加(overlap-add)的區(qū)域間隔為512的所述當前子幀所應(yīng)用的窗口來編碼。此外，當當前子幀的LPD模式為3，且上一個子幀或下一個子幀的LPD模式不為0 時，語音/音頻統(tǒng)合編碼器(USAC)的編碼單元，可利用對與上一個子幀或所述下一個子幀重疊相加(overlap-add)的區(qū)域間隔為1024的所述當前子幀所應(yīng)用的窗口來編碼。如果，當上一個子幀的LPD模式為0時，編碼單元可將被應(yīng)用于當前子幀的窗口的左側(cè)部分處理成值為1的直角形態(tài)。此外，當下一個子幀的LPD模式為0時，編碼單元可將被應(yīng)用于當前子幀的窗口的右側(cè)部分處理成值為1的直角形態(tài)。在這種情況下，編碼單元可以以存在于子幀的邊界的折點為中心，執(zhí)行子幀之間的重疊相加。關(guān)于從FD模式至LPD模式的模式轉(zhuǎn)換，語音/音頻統(tǒng)合編碼器(USAC)可包括模式轉(zhuǎn)換單元和編碼單元。模式轉(zhuǎn)換單元，對構(gòu)成輸入信號的幀的子幀，從FD模式轉(zhuǎn)換至LPD 模式；編碼單元，將FD模式的窗口序列與LPD模式的窗口序列以折點為基準重疊相加來編碼。在這種情況下，F(xiàn)D模式可以是ACC模式。在這種情況下，當LPD模式的窗口序列中開始子幀的LPD模式為0時，編碼單元可將與開始子幀相對應(yīng)的窗口替換為LPD模式對應(yīng)1的窗口。此外，編碼單元可將LPD模式的窗口序列轉(zhuǎn)移，使其能以折點為基準與FD模式的窗口序列重疊相加。此外，編碼單元可根據(jù)LPD模式的窗口序列將FD模式的窗口序列的形態(tài)變形。此外，編碼單元，可以以位于構(gòu)成輸入信號的幀的子幀的邊界的折點為基準在窗口序列之間執(zhí)行重疊相加，并將所述折點設(shè)定為開始點，根據(jù)子幀單位來提取出線性預(yù)測系數(shù) LPC(Linear Prediction Coefficient) 0關(guān)于從LPD模式到FD模式的模式轉(zhuǎn)換，語音/音頻統(tǒng)合編碼器(USAC)可包括模式轉(zhuǎn)換單元和編碼單元。模式轉(zhuǎn)換單元，對構(gòu)成輸入信號的幀，從LPD模式轉(zhuǎn)換至FD模式；編碼單元，將所述FD模式的窗口序列與所述LPD模式的窗口序列以折點為基準重疊相加來編碼。此外，編碼單元可根據(jù)LPD模式將FD模式的窗口序列的形態(tài)變形。此外，編碼單元可將LPD模式的窗口序列和FD模式的窗口序列重疊256點，在此，當LPD模式的窗口序列中結(jié)束子幀的LPD模式為0時，結(jié)束子幀所對應(yīng)的窗口可被替換為 LPD模式對應(yīng)1的窗口。對此，語音/音頻統(tǒng)合解碼器(USAC)，可與之前說明的有關(guān)LPD模式之間的模式轉(zhuǎn)換、從FD模式至LPD模式的模式轉(zhuǎn)換、或從LPD模式至FP模式的模式轉(zhuǎn)換的語音/音頻統(tǒng)合編碼器相同地處理窗口序列。以下，將對依據(jù)本發(fā)明的語音/音頻統(tǒng)合編碼器(USAC)和語音/音頻統(tǒng)合解碼器(USAC)中處理的窗口序列進行詳細說明。圖8是示出各種類型LPD_SEQUENCE的窗口形態(tài)的示圖。圖8表示圖4至圖7中所說明的LPD_SEQUENCE的窗口形態(tài)，圖8中圖示的LPD_ SEQUENCE可根據(jù)下表1被定義。[表1]
權(quán)利要求
1.一種語音/音頻統(tǒng)合編碼器，包括模式轉(zhuǎn)換單元，其對構(gòu)成輸入信號的幀的子幀，在線性預(yù)測域LPD模式之間進行轉(zhuǎn)換；和編碼單元，其將基于被轉(zhuǎn)換的LPD模式的窗口應(yīng)用于所述子幀中要編碼的當前子幀，來將所述輸入信號編碼，其中，所述編碼單元，將根據(jù)上一個子幀的LPD模式和下一個子幀的LPD模式改變的窗口應(yīng)用于當前子幀，來將所述輸入信號編碼。
2.如權(quán)利要求1所述的語音/音頻統(tǒng)合編碼器，其中，所述編碼單元，當所述當前子幀的LPD模式為1，且所述上一個子幀或所述下一個子幀的LPD模式不為0時，利用對與所述上一個子幀或所述下一個子幀重疊相加的區(qū)域的間隔為256的所述當前子幀所應(yīng)用的窗口來編碼。
3.如權(quán)利要求1所述的語音/音頻統(tǒng)合編碼器，其中，所述編碼單元，當所述當前子幀的LPD模式為2，且所述上一個子幀或所述下一個子幀的LPD模式不為0時，利用對與所述上一個子幀或所述下一個子幀重疊相加的區(qū)域的間隔為512的所述當前子幀所應(yīng)用的窗口來編碼。
4.如權(quán)利要求1所述的語音/音頻統(tǒng)合編碼器，其中，所述編碼單元，當所述當前子幀的LPD模式為3，且所述上一個子幀或所述下一個子幀的LPD模式不為0時，利用對與所述上一個子幀或所述下一個子幀重疊相加的區(qū)域的間隔為1024的所述當前子幀所應(yīng)用的窗口來編碼。
5.如權(quán)利要求2至權(quán)利要求4中的任何一項所述的語音/音頻統(tǒng)合編碼器，其中，所述編碼單元，當所述上一個子幀的LPD模式為0時，將被應(yīng)用于所述當前子幀的窗口的左側(cè)部分處理成值為1的直角形態(tài)，當所述下一個子幀的LPD模式為0時，將被應(yīng)用于所述當前子幀的窗口的右側(cè)部分處理成值為1的直角形態(tài)。
6.如權(quán)利要求4所述的語音/音頻統(tǒng)合編碼器，其中，被應(yīng)用于所述當前子幀的窗口，當所述當前子幀的LPD模式為1時，形態(tài)如下圖所示。下^■個 1 pd_mocle 為ACELP時 \上一個Ipd mode為)ACF丄P時Γ/N下一個Ipd mode為A \ X^TCX512,4」！ LATCX256吋上一個Ipd mode為TCX256, TCX512、TCX256時
7.如權(quán)利要求4所述的語音/音頻統(tǒng)合編碼器，其中，被應(yīng)用于所述當前子幀的窗口，當所述當前子幀的LPD模式為2時，形態(tài)如下圖所示。
8.如權(quán)利要求4所述的語音/音頻統(tǒng)合編碼器，其中，被應(yīng)用于所述當前子幀的窗口，當所述當前子幀的LPD模式為3時，形態(tài)如下圖所示。
9.如權(quán)利要求1所述的語音/音頻統(tǒng)合編碼器，其中，所述編碼單元，以存在于所述子幀的邊界的折點為中心，執(zhí)行子幀之間的重疊相加。
10.一種語音/音頻統(tǒng)合編碼器USAC，包括模式轉(zhuǎn)換單元，其對輸入信號的幀，從頻域FD模式轉(zhuǎn)換至線性預(yù)測域LPD模式；和編碼單元，其將所述FD模式的窗口序列與所述LPD模式的窗口序列以折點為基準重疊相加來編碼。
11.如權(quán)利要求10所述的語音/音頻統(tǒng)合編碼器，其中，所述編碼單元，當所述LPD模式的窗口序列中開始子幀的LPD模式為0時，將與所述開始子幀相對應(yīng)的窗口替換為LPD 模式對應(yīng)1的窗口。
12.如權(quán)利要求10所述的語音/音頻統(tǒng)合編碼器，其中，所述編碼單元，將所述LPD模式的窗口序列轉(zhuǎn)移，使其能以折點為基準與所述FD模式的窗口序列重疊相加，其中，所述 LPD模式的窗口序列和所述FD模式的窗口序列形態(tài)如下圖所示。
13.如權(quán)利要求10所述的語音/音頻統(tǒng)合編碼器，其中，所述編碼單元，根據(jù)所述LPD 模式的窗口序列將所述FD模式的窗口序列的形態(tài)變形，其中，所述FD模式的窗口序列和所述LPD模式的窗口序列形態(tài)如下圖所示。
14.如權(quán)利要求10所述的語音/音頻統(tǒng)合編碼器，其中，所述編碼單元，以位于構(gòu)成輸入信號的幀的子幀的邊界的折點為基準，在窗口序列之間執(zhí)行重疊相加，且將所述折點設(shè)定為出發(fā)點，根據(jù)子幀單位來提取出線性預(yù)測系數(shù)LPC。
15.一種語音/音頻統(tǒng)合編碼器，包括
16.如權(quán)利要求15所述的語音/音頻統(tǒng)合編碼器，其中，所述編碼單元，根據(jù)LPD模式將FD模式的窗口序列的形態(tài)變形，其中，所述LPD模式的窗口序列和所述FD模式的窗口序列形態(tài)如下圖所示。
17.如權(quán)利要求15所述的語音/音頻統(tǒng)合編碼器，其中，所述編碼單元，將LPD模式的窗口序列和FD模式的窗口序列重疊256點，且當所述LPD模式的窗口序列中結(jié)束子幀的 LPD模塊為0時，所述結(jié)束子幀所對應(yīng)的窗口被替換為與LPD模塊對應(yīng)1的窗口，其中，所述 LPD模式的窗口序列和所述FD模式的窗口序列形態(tài)如下圖所示。
18.一種語音/音頻統(tǒng)合解碼器，包括模式轉(zhuǎn)換單元，其對構(gòu)成輸入信號的幀的子幀，在LPD模式之間進行轉(zhuǎn)換；和解碼單元，其將基于被轉(zhuǎn)換的LPD模式的窗口應(yīng)用于所述子幀中要解碼的當前子幀，來將所述輸入信號進行解碼，其中，所述解碼單元，將根據(jù)上一個子幀的LPD模式和下一個子幀的LPD模式改變的窗口應(yīng)用于當前子幀，來將所述輸入信號解碼。
19.一種語音/音頻統(tǒng)合解碼器，其包括模式轉(zhuǎn)換單元，其對輸入信號的幀，從FD模式轉(zhuǎn)換至LPD模式；和解碼單元，其將所述FD模式的窗口序列與所述LPD模式的窗口序列以折點為基準重疊相加來解碼。
20.一種語音/音頻統(tǒng)合解碼器，包括模式轉(zhuǎn)換單元，其對輸入信號的幀，從LPD模式轉(zhuǎn)換至FD模式；和解碼單元，其將所述FD模式的窗口序列與所述LPD模式的窗口序列以折點為基準重疊相加來解碼。
全文摘要
本發(fā)明提出了一種以模式轉(zhuǎn)換為基礎(chǔ)來處理窗口序列的語音/音頻統(tǒng)合編解碼器。當語音/音頻統(tǒng)合編解碼器發(fā)生模式轉(zhuǎn)換時，可以折點為基準執(zhí)行幀之間的重疊來編碼或解碼。語音/音頻統(tǒng)合編解碼器為執(zhí)行編碼或解碼，根據(jù)情況處理不同的窗口序列，從而可提高譯碼的性能。
文檔編號H04N7/12GK102388607SQ200980155342
公開日2012年3月21日申請日期2009年11月26日優(yōu)先權(quán)日2008年11月26日
發(fā)明者姜京玉, 安致得, 張大永, 徐廷一, 樸浩綜, 樸榮喆, 李泰辰, 洪鎮(zhèn)佑, 白承權(quán), 金珉第申請人:光云大學(xué)校產(chǎn)學(xué)協(xié)力團, 韓國電子通信研究院

完整全部詳細技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：白承權(quán);李泰辰;金珉第;姜京玉;張大永;徐廷一;洪鎮(zhèn)佑;安致得;樸浩綜;樸榮喆
技術(shù)所有人：韓國電子通信研究院;光云大學(xué)校產(chǎn)學(xué)協(xié)力團
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點此查看客服電話進行咨詢。
1、王老師：1.數(shù)字信號處理 2.傳感器技術(shù)及應(yīng)用 3.機電一體化產(chǎn)品開發(fā) 4.機械工程測試技術(shù) 5.逆向工程技術(shù)研究
2、王老師：1.機器人 2.嵌入式控制系統(tǒng)開發(fā)
3、孫老師：1.振動信號時頻分析理論與測試系統(tǒng)設(shè)計 2.汽車檢測系統(tǒng)設(shè)計 3.汽車電子控制系統(tǒng)設(shè)計
4、畢老師：機構(gòu)動力學(xué)與控制
5、袁老師：1.計算機視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

基于模式轉(zhuǎn)換來處理窗口序列的語音/音頻統(tǒng)合編解碼器的制作方法