語音編解碼收發(fā)方法及裝置的制作方法

文檔序號：2837324閱讀：233來源：國知局

專利名稱：語音編解碼收發(fā)方法及裝置的制作方法
技術(shù)領(lǐng)域：
本發(fā)明涉及通信領(lǐng)域，特別涉及語音編解碼技術(shù)。
技術(shù)背景隨著寬帶城域網(wǎng)建設的發(fā)展，寬帶業(yè)務也越來越豐富，對寬帶高質(zhì)量語音業(yè)務需求的也日益增長，諸如寬帶IP電話和多點視頻會議等。因此也將高質(zhì)量低復雜度的寬帶語音編解碼器提到了日程上來。而如何和目前廣泛使用的語音編解碼器相兼容則是一個正在研究的課題。國際電信聯(lián)盟-電信標準部(International Telecommunication Union Telecommunication Standardization Sector,簡稱"ITU-T")于2006年成功的標準化了和G.729兼容的語音頻編解碼器。ITU-T又于2007年3月啟動的 G.711寬帶擴展(7kHz帶寬)的標準方案征集正是來解決寬帶語音和G.711 窄帶編解碼器(4kHz帶寬)兼容的問題?，F(xiàn)有的寬帶語音頻編解碼解決方案都是針對于某種具體的核心編解碼器的，如G.729.1是針對G.729窄帶編解碼器的寬帶擴展。在現(xiàn)有技術(shù)G.729.1 中，是將信號分成兩路，窄帶語音信號和寬帶語音信號，分別對窄帶語音信號和寬帶語音信號進行編碼，得到窄帶語音信號的編碼碼流和寬帶語音信號的編碼碼流。解碼端分別對這兩個碼流進行解碼，得到傳輸信號。其中，在對寬帶語音信號進行編碼時，先將寬帶語音信號進行時頻變換，得到X個頻域變換系數(shù)，再將X個頻域變換系數(shù)均以同樣的碼本進行量化編碼。然而，本發(fā)明的發(fā)明人發(fā)現(xiàn)，在X個頻域變換系數(shù)中總會有相對重要的一些頻域變換系數(shù)，相對次要的一些頻域變換系數(shù)，如果以同樣的碼本對各頻域變換系數(shù)進行量化編碼，則可能會影響到編碼效率。另一方面，由于正弦頻i普的量化會導致正弦頻鐠相鄰的頻i普產(chǎn)生較大的失真，表現(xiàn)形式為頻譜的波谷處被提升，噪聲很容易被人察覺。而目前的技術(shù)中并未對其作相關(guān)的處理，因此，語音質(zhì)量不夠好。發(fā)明內(nèi)容本發(fā)明實施方式要解決的主要技術(shù)問題是提供一種語音編解碼收發(fā)方法及裝置，使得語音信號的編碼效率得以增加，并提高了語音質(zhì)量。為解決上述技術(shù)問題，本發(fā)明的實施方式提供了一種語音編碼發(fā)送方法，包括以下步驟對語音信號進行時頻變換，得到X個頻域變換系數(shù)；對X個頻域變換系數(shù)進行量化得到寬帶編碼信號，其中對相對重要的Y 個頻域變換系數(shù)以第一碼本進行量化，對剩余的X-Y個頻域變換系數(shù)以第二碼本進行量化，第一碼本的碼字數(shù)量大于第二碼本的碼字數(shù)量，X>Y>1;發(fā)送寬帶編碼信號。本發(fā)明的實施方式還提供了一種語音接收解碼方法，包括以下步驟接收寬帶編碼信號；將收到的寬帶編碼信號進行量化解碼，得到X個頻域變換系數(shù)，其中對相對重要的寬帶編碼信號以第一碼本進行量化解碼，得到Y(jié)個頻域變換系數(shù)，對剩余的寬帶編碼信號以第二碼本進行量化解碼，得到X-Y個頻域變換系數(shù)，第一碼本的碼字數(shù)量大于第二碼本的碼字數(shù)量，X>Y>1;將得到的X個頻域變換系數(shù)進行頻時變換，得到時域的語音信號。本發(fā)明的實施方式還提供了一種語音解碼方法，包括以下步驟對包括至少兩個頻域量化信號的量化塊，計算平均頻語幅度和最大頻鐠幅度的比值；根據(jù)比值裁減量化塊中頻域量化信號的精細頻i普結(jié)構(gòu)，其中，比值越小對精細頻譜結(jié)構(gòu)的裁減程度越大；對經(jīng)裁減的頻域量化信號進行頻時變換得到時域的語音信號。本發(fā)明的實施方式還提供了一種語音編碼發(fā)送裝置，包括時頻變換模塊，用于對語音信號進行時頻變換，得到X個頻域變換系數(shù)；碼本存儲模塊，用于保存第一碼本和第二碼本，其中第一碼本的碼字數(shù) 量大于第二碼本的碼字數(shù)量；量化模塊，用于對時頻變換模塊得到的X個頻域變換系數(shù)進行量化得到寬帶編碼信號，其中對相對重要的Y個頻域變換系數(shù)以第一碼本進行量化，對剩余的X-Y個頻域變換系數(shù)以第二碼本進行量化，X>Y>1;發(fā)送模塊，用于發(fā)送量化模塊得到的寬帶編碼信號。本發(fā)明的實施方式還提供了一種語音編接收解碼裝置，包括碼本存儲模塊，用于保存第一碼本和第二碼本，其中第一碼本的碼字數(shù) 量大于第二碼本的碼字數(shù)量；接收模塊，用于接收寬帶編碼信號；量化解碼模塊，用于將接收模塊收到的寬帶編碼信號進行量化解碼，得到X個頻域變換系數(shù)，其中對相對重要的寬帶編碼信號以第一碼本進行量化解碼，得到Y(jié)個頻域變換系數(shù)，對剩余的寬帶編碼信號以第二碼本進行量化解碼，得到X-Y個頻域變換系數(shù)，X>Y>1;頻時變換模塊，用于將量化解碼模塊得到的X個頻域變換系數(shù)進行頻時變換，得到時域的語音信號。本發(fā)明的實施方式還提供了一種語音解碼裝置，包括比值計算模塊，用于對包括至少兩個頻域量化信號的量化塊，計算平均頻譜幅度和最大頻語幅度的比值；裁減模塊，用于根據(jù)比值計算模塊得到的比值裁減量化塊中頻域量化信號的精細頻譜結(jié)構(gòu)，其中，比值越小對精細頻i普結(jié)構(gòu)的裁減程度越大；頻時變換模塊，用于對經(jīng)裁減的頻域量化信號進行頻時變換得到時域的語音信號。本發(fā)明實施方式與現(xiàn)有技術(shù)相比，主要效果在于由于對相對重要的 MDCT系數(shù)釆用包含更多的碼字數(shù)量的碼本進行量化，可使得量化后的 MDCT系數(shù)更接近于原始的MDCT系數(shù)，從而4是高了編碼效率，減少主觀聽覺失真。

圖1是根據(jù)本發(fā)明第一實施方式的語音編碼發(fā)送方法示意圖；圖2是根據(jù)本發(fā)明第一實施方式中對窄帶語音信號的處理流程圖；圖3是根據(jù)本發(fā)明第一實施方式中對殘差信號的絕對值進行量化編碼的示意圖；圖4是根據(jù)本發(fā)明第一實施方式中對寬帶語音信號的處理流程圖；圖5是根據(jù)本發(fā)明第二實施方式的語音接收解碼方法示意圖；圖6是根據(jù)本發(fā)明第二實施方式中獲取窄帶語音信號的處理流程圖；圖7是根據(jù)本發(fā)明第二實施方式中為殘差信號添加符號信息的示意圖；圖8是根據(jù)本發(fā)明第二實施方式中獲取寬帶語音信號的處理流程圖；圖9是根據(jù)本發(fā)明第二實施方式中對MDCT系數(shù)進行精細頻譜結(jié)構(gòu)裁減示意圖；圖IO是根據(jù)本發(fā)明第二實施方式中的丟包補償流程圖；圖11是根據(jù)本發(fā)明第二實施方式中的復用MDCT引入的窄帶緩沖區(qū)示意圖；圖12是根據(jù)本發(fā)明第二實施方式中的自適應網(wǎng)絡狀態(tài)比特流裁減示意圖；圖13是根據(jù)本發(fā)明第四實施方式的語音編碼發(fā)送裝置的結(jié)構(gòu)示意圖；圖14是根據(jù)本發(fā)明第五實施方式的語音編碼發(fā)送裝置的結(jié)構(gòu)示意圖；圖15是根據(jù)本發(fā)明第六實施方式的語音接收解碼裝置的結(jié)構(gòu)示意圖；圖16是根據(jù)本發(fā)明第七實施方式的語音接收解碼裝置的結(jié)構(gòu)示意圖；圖17是根據(jù)本發(fā)明第八實施方式的語音解碼方法流程圖；圖18是根據(jù)本發(fā)明第九實施方式的語音解碼裝置的結(jié)構(gòu)示意圖。
具體實施方式
為使本發(fā)明的目的、技術(shù)方案和優(yōu)點更加清楚，下面將結(jié)合附圖對本發(fā) 明的實施方式作進一步地詳細描述。本發(fā)明的第一實施方式涉及一種語音編碼發(fā)送方法，在本實施方式中，編碼端通過分析正交鏡像濾波器，將16kHz的信號分為低頻部分的窄帶語音信號，和高頻部分的寬帶語音信號。對窄帶語音信號進行窄帶編碼，得到基本窄帶編碼信號，并對得到的基本窄帶編碼信號進行解碼，得到解碼信號，將窄帶語音信號與對應的解碼信號相減，得到殘差信號，通過對殘差信號進行量化編碼，得到增強窄帶編碼信號。對寬帶語音信號進行改進型離散余弦變換(Modified Discrete Cosine Transform,簡稱"MDCT")編碼的處理過程，得到寬帶編碼信號。最后將得到的基本窄帶編碼信號、增強窄帶編碼信號、和寬帶編碼信號復用為一個碼流后發(fā)送給解碼端，如圖1所示。本實施方式中對經(jīng)分析正交鏡像濾波器后，得到的窄帶語音信號進行的具體處理流程如圖2所示。在步驟210中，編碼端對得到的窄帶語音信號進行窄帶編碼，得到基本窄帶碼流。具體地說，由于G711技術(shù)采用脈沖編碼調(diào)制(Pulsed Code Modulation, 簡稱"PCM")的語音編解碼標準(A律或n律)，傳輸帶寬為64kbit/s (千比特每秒)，這種方式的壓縮對語音信號的損失很小。因此，本實施方式以對窄帶語音信號進行G.711編碼為例進行說明。G.711 A律方法將13比特的線性PCM樣本壓縮為8比特的對數(shù)PCM格式。G.711 ji律方法將14比特的線性PCM樣本壓縮為8比特的對數(shù)PCM格式。對窄帶語音信號進行G.711編碼后，得到基本窄帶碼流。接著，進入步驟220，編碼端對經(jīng)G.711編碼后的基本窄帶編碼信號進行解碼，得到解碼信號。具體地說，當G.711編碼器對N點輸入信號S(/)編碼后，立即在編碼端進行解碼，得到該N點G.711解碼后的信號S(/)。接著，進入步驟230,用未經(jīng)G.711編碼的窄帶語音信號和對應的解碼信號相減，得到殘差信號。具體地說，可以將N點輸入信號S(/)分別減去相應的經(jīng) G711解碼后的信號S(/)，得到各信號的殘差信號(即量化誤差)接著，進入步驟240，對得到的各殘差信號進行量化編碼，得到增強窄帶編碼信號。具體地說，為了簡化對各殘差信號進行量化編碼的處理過程，可以先取出各殘差信號的符號信息，即對各殘差信號的絕對值進行量化編碼，如圖3 所示。在量化編碼的過程中，需要先根據(jù)編碼端與解碼端均可獲知的關(guān)聯(lián)信息，對殘差信號的絕對值進行歸一化，再對經(jīng)歸一化后的殘差信號的絕對值進行量化。通過對殘差信號的絕對值進行歸一化，使得殘差信號的范圍被控制在預定的范圍之內(nèi)，進而節(jié)約了用于傳輸殘差信號的資源。本實施方式中的關(guān)聯(lián)信息為上述N個解碼信號的能量之和，或上述N個解碼信號的平均能量，即每N點對應一個關(guān)聯(lián)信息。比如說，當前幀N-8，經(jīng)G.711 解碼后的輸出的N個解碼信號為{80, 150, 500, 850， 700, 550, 300， 200},則這8 個點對應的以能量之和為關(guān)聯(lián)信息的值為這8個值的平方和，即1923900;這8 個點以平均能量為關(guān)聯(lián)信息的值為能量和除以8,即240487.5。由于在解碼端也可通過解碼信號得到該關(guān)聯(lián)信息，因此該關(guān)聯(lián)信息無需在編碼端與解碼端之間進行傳輸，節(jié)約了傳輸資源。需要說明的是，該關(guān)聯(lián)信息可以在本步驟中進行計算，也可以在步驟230或步驟220中進行計算。編碼端可通過以下方式，將得到的關(guān)聯(lián)信息用于對殘差信號的絕對值進行歸一化將與N個解碼信號相對應的N個殘差信號的絕對值，分別乘以該關(guān)聯(lián) 信息的倒數(shù)，得到N個歸一化后的殘差信號的絕對值。然后，通過對歸一化后的殘差信號的絕對值，進行量化，得到增強窄帶編碼信號。由于該增強窄帶編碼信號中攜帶了解碼后的各解碼信號與語音信號的量化誤差信息，使得解碼端能夠根據(jù)各解碼信號的量化誤差信息，還原出相應的語音信號，避免了在窄帶編碼過程中各語音信號因量化編碼而導致的信息損失，從而提高了語音質(zhì)量，增強了窄帶性能。本實施方式中對經(jīng)分析正交鏡像濾波器后得到的寬帶語音信號，按如圖4 所示的流程進行處理。下面對圖4中的寬帶語音信號處理方法進行說明。在步驟410中，編碼端對得到的N個寬帶語音信號進行時頻變換，得到X 個頻域變換系數(shù)。具體地說，編碼端對N個寬帶語音信號進行MDCT編碼，可得到X個MDCT系數(shù)，X的值為2/N。以N = 80為例，MDCT的變換公式如下 zxr(") = sin(^(" + O-5》，"=0""，79接著，進入步驟420,編碼端將得到的X個MDCT系數(shù)分為M個子帶，每個子帶包含至少一個MDCT系數(shù)。然后，分別對每個子帶進行歸一化。比如說，在每個子帶范圍內(nèi)，計算絕對值最大的MDCT系數(shù)，利用該絕對值最大的MDCT 系數(shù)，對該每個子帶范圍內(nèi)的各MDCT系數(shù)進行歸一化。接著，進入步驟430,對各子帶的用于歸一化的歸一化因子進行量化，得到量化后的各子帶的歸一化因子。在步驟440中，對經(jīng)歸一化后的各子帶中的MDCT系數(shù)進行量化，得到寬帶編碼信號。在對MDCT系數(shù)進行量化的過程中，需要對相對重要的Y個MDCT 系數(shù)(如前Y個MDCT系數(shù))以第一碼本進行量化，對剩余的X-Y個MDCT 系數(shù)以第二碼本進行量化，第一碼本的碼字數(shù)量大于第二碼本的碼字數(shù)量，X> Y>1。其中，相對重要的Y個MDCT系數(shù)為至少一個子帶中的所有MDCT系數(shù)。具體地說，如果經(jīng)MDCT編碼后，得到32個MDCT系數(shù)，并且將這32個 MDCT系數(shù)劃分為7個子帶，則在碼本矢量的維數(shù)為4維的情況下(即一個碼字可對4個MDCT系數(shù)進行量化)，可以將這32個MDCT系數(shù)劃分為[4， 4， 4, 4, 4， 4, 8]這樣7個子帶。假定相對重要的Y個MDCT系數(shù)為前12個MDCT系數(shù)，則以第一碼本對第一至第三子帶中的12個歸一化后的MDCT系數(shù)進行量化，以第二碼本對第四至第七子帶中的20個歸一化后的MDCT系數(shù)進行量化，第一碼本的碼字數(shù)量大于第二碼本的碼字數(shù)量。由于對相對重要的MDCT系數(shù)采用包含更多的碼字數(shù)量的碼本進行量化，可使得量化后的MDCT系數(shù)更接近于原始的MDCT系數(shù)，從而提高了編碼效率，減少主觀聽覺失真。其中，第一碼本和第二碼本可以均為獨立的碼本，使得量化后的MDCT系數(shù)可以通過碼本中的碼字索引即可表示，提高了傳輸效率?；蛘?，第一碼本包括至少兩個基本碼本，第二碼本包括至少一個基本碼本，第一碼本和第二碼本共享至少一個基本碼本，比如說，選擇一個通用的碼本用于大多數(shù)MDCT系數(shù) 的量化，而對某些特定的譬如失真較大的碼字使用另外的一個或多個碼本進行量化，從而提高編碼效率，減少主觀聽覺失真。在這種情況下，雖然量化后的 MDCT系數(shù)需要通過碼本索引以及碼字索引來共同表示，但由于第一碼本和第二碼本能夠共享基本碼本中的碼字，因此可節(jié)約編碼端與解碼端內(nèi)的碼本存儲空間。而且，由于第一碼本和第二碼本是對歸一化后的MDCT系數(shù)進行量化，也就是說，需要量化的MDCT系數(shù)都被限制在一個較小的范圍內(nèi)，因此，可以進一步節(jié)約編碼端與解碼端內(nèi)的碼本存儲空間。需要說明的是，本實施方式中的寬帶語音信號的編碼是基于MDCT的，在實際應用中，也可以是基于快速傅里葉變換(Fast Fourier Transform,簡稱"FFT，，) 的。另外，本實施方式中的步驟430和步驟440并無明確的先后關(guān)系，也就是說，步驟430也可以在步驟440之后。編碼端在獲取到寬帶編碼信號、基本窄帶編碼信號、和增強窄帶編碼信號后，將該寬帶編碼信號、基本窄帶編碼信號、和增強窄帶編碼信號，復用為碼流后發(fā)送給解碼端。另外，由于在本實施方式中，在對殘差信號進行量化編碼的過程中，是對殘差信號的絕對值進行量化編碼的；在對各子帶的MDCT系數(shù) 進行量化之前，先對各子帶的MDCT系數(shù)在子帶范圍內(nèi)進行了歸一化，因此，編碼端還需要將各殘差信號的符號信息，以及各子帶的量化后的歸一化因子發(fā) 送給解碼端。本發(fā)明的第二實施方式涉及一種語音接收解碼方法，本實施方式對應于第一實施方式的語音編碼發(fā)送方法。在本實施方式中，解碼端將收到的碼流進行解復用，得到基本窄帶編碼信號、增強窄帶編碼信號、和寬帶編碼信號。根據(jù) 基本窄帶編碼信號和增強窄帶編碼信號得到窄帶語音信號，根據(jù)寬帶編碼信號得到寬帶語音信號，將得到的窄帶語音信號和寬帶語音信號進行綜合正交鏡像濾波，得到語音信號，如圖5所示。其中，在發(fā)生丟包時，利用丟包前的窄帶語音信號預測出基音周期，根據(jù)預測的基音周期，恢復出丟失的窄帶語音信號和寬帶語音信號，如圖5中的窄帶丟包補償模塊和寬帶丟包補償模塊所示。下面分別對根據(jù)基本窄帶編碼信號和增強窄帶編碼信號得到窄帶語音信號的處理流程，和根據(jù)寬帶編碼信號得到寬帶語音信號的處理流程進行說明。根據(jù)基本窄帶編碼信號和增強窄帶編碼信號得到窄帶語音信號的處理流程如圖6所示。在步驟610中，解碼端對解復用出的基本窄帶編碼信號進行解碼，得到基本窄帶解碼信號。針對第一實施方式中的案例，解碼端對解復用出的基本窄帶編碼信號進行G,711解碼，得到基本窄帶解碼信號。在本步驟中，可以根據(jù)獲得的基本窄帶解碼信號，計算關(guān)聯(lián)信息。解碼端計算關(guān)聯(lián)信息的方式與編碼端計算關(guān)聯(lián)信息的方式完全相同，在此不再贅述。在步驟620中，解碼端對解復用出的增強窄帶編碼信號進行量化解碼，得到殘差信號。具體地說，在本步驟中，需要先對收到的增強窄帶編碼信號進行量化解碼，得到歸一化后的各殘差信號，再根據(jù)計算出的關(guān)聯(lián)信息，對歸一化后的各殘差信號進行歸一化還原，得到各殘差信號。比如說，關(guān)聯(lián)信息為N個解碼信號的能量之和，將與這N個解碼信號相對應的N個歸一化后的殘差信號，分別乘以該關(guān)聯(lián)信息，得到N個歸一化還原后的殘差信號。由于編碼端在對各殘差信號進行量化編碼的處理過程中，先取出了各殘差信號的符號信息，即對各殘差信號的絕對值進行量化編碼。因此，在解碼端中進行量化解碼后得到的各殘差信號，實際上也是各殘差信號的絕對值。所以，解碼端還需接收來自編碼端的各殘差信號的符號信息，將歸一化還原后的殘差信號分別加上相應的符號信息，得到完整的表示量化誤差的殘差信號，如圖7 所示。接著，在步驟630中，將加上符號信息的各殘差信號分別與相應的基本窄帶解碼信號相加，得到窄帶語音信號。根據(jù)寬帶編碼信號得到寬帶語音信號的處理流程如圖8所示，在步驟810 中，解碼端對寬帶編碼信號進行量化解碼，得到X個頻域變換系數(shù)。具體地i兌，解碼端對寬帶編碼信號中對相對重要的寬帶編碼信號以第一碼本進行量化解碼，得到Y(jié)個頻域變換系數(shù)，對剩余的寬帶編碼信號以第二碼本進行量化解碼，得到X-Y個頻域變換系數(shù)，第一碼本的碼字數(shù)量大于第二碼本的碼字數(shù)量，X針對第一實施方式中的案例，解碼端對寬帶編碼信號中對應第一至第三子帶的寬帶編碼信號，以與編碼端相同的第一碼本進行量化解碼，得到12個MDCT 系數(shù)；對寬帶編碼信號中對應第四至第七子帶的寬帶編碼信號，以與編碼端相同的第二碼本進行量化解碼，得到20個MDCT系數(shù)。該第一碼本和第二碼本可以均為獨立的碼本，此時，根據(jù)碼本中的碼字索引對寬帶編碼信號進行量化解碼?；蛘?，第一碼本包括至少兩個基本碼本，第二碼本包括至少一個基本碼本，第一碼本和第二碼本共享至少一個基本碼本，此時，根據(jù)碼本索引和碼字索引對寬帶編碼信號進^f于量化解碼。接著，在步驟820中，解碼端對量化解碼后的各子帶的頻域變換系數(shù)(即 MDCT系數(shù))分別進行歸一化還原。具體地說，由于編碼端是對經(jīng)歸一化后的各子帶中的MDCT系數(shù)進行量化的，因此，解碼端還需要接收經(jīng)量化的各子帶的歸一化因子，然后，在本步驟中，對經(jīng)量化的各子帶的歸一化因子進行量化解碼，得到各子帶的歸一化因子，并根據(jù)各子帶的歸一化因子分別對各子帶中的MDCT系數(shù)進行歸一化還原，恢復出還原后的MDCT系數(shù)。接著，在步驟830中，解碼端對還原后的MDCT系數(shù)進行自適應后濾波。具體地說，解碼端對包括至少兩個MDCT系數(shù)的MDCT系數(shù)塊，計算平均頻i普幅度和最大頻譜幅度的比值，根據(jù)計算出的比值大小裁減MDCT系數(shù)塊中 MDCT系數(shù)的精細頻譜結(jié)構(gòu)，其中，比值越小對精細頻語結(jié)構(gòu)的裁減程度越大。根據(jù)計算出的比值大小裁減MDCT系數(shù)塊中MDCT系數(shù)的精細頻語結(jié)構(gòu)的方式如下對MDCT系數(shù)塊中的每個MDCT系數(shù)，根據(jù)該比值計算對應該MDCT 系數(shù)的調(diào)整因子，其中，該調(diào)整因子是該比值的單調(diào)函數(shù)，該比值越大則該調(diào) 整因子越大。然后，對每個MDCT系數(shù)乘以該MDCT系數(shù)對應的調(diào)整因子。該調(diào)整因子的fac的計算公式如下/"c = ^mx +6加)"=1,2，......,w。其中，beta =1.2 — Avg Amp/Max Amp, MaxAmp為MDCT系數(shù)塊的最大頻鐠幅度， AvgAmp為MDCT系數(shù)塊的平均頻i普幅度，X[z']為MDCT系數(shù)塊中的MDCT系數(shù)，n為MDCT系數(shù)塊中包含的MDCT系數(shù)數(shù)目。以4個MDCT系數(shù)為一個MDCT系數(shù)塊為例進行i兌明，如圖9所示，計算 X( 1 )、 X( 2 )、 X( 3 )、 X( 4 )的最大頻譜幅度MaxAmp，和平均頻諳幅度AvgAmp。根據(jù)AvgAmp/MaxAmp的值，對X (i)進行精細頻譜結(jié)構(gòu)裁減(i = 1, 2， 3, 4)，如X(i) =facxX(i)。其中，/flc = 6etox 1 u +(l — 6gto),/ = l，2,……,4， beta-1.2—Avg Amp/Max Amp 。由于正弦頻諳的量化會導致正弦頻i普相鄰的頻譜產(chǎn)生較大的失真，表現(xiàn)形式為頻譜的波谷處被提升，噪聲很容易被人察覺。因此，在本步驟中，根據(jù)每個量化塊的平均頻i普幅度和最大頻鐠幅度的比值，來決定該量化塊中MDCT系數(shù)的精細頻譜結(jié)構(gòu)裁減的程度。平均頻譜幅度和最大頻譜幅度的比值越小，則需要加大精細頻鐠結(jié)構(gòu)裁減的程度，平均頻譜幅度和最大頻譜幅度的比值越大，則需要減小精細頻譜結(jié)構(gòu)裁減的程度，以便達到減少量化噪聲的效果。如圖9 所示，在正弦部分占主導的信號條件下，第1, 3， 4個MDCT系數(shù)量化引入的噪聲會令人容易覺察到編碼帶來的損傷。而通過判斷平均頻譜幅度和最大頻譜幅度的比值來進行精細頻譜結(jié)構(gòu)裁減，能很好的自適應不同的編碼塊特性，以達到性能的優(yōu)化。當然，本實施方式中也可以采用固定的包絡裁減來達到優(yōu)化性能的目的。接著，在步驟840中，將裁減后的MDCT系數(shù)進行頻時變換，即逆MDCT變換，得到時域的語音信號，該時域的語音信號為寬帶語音信號。解碼端在得到寬帶語音信號和窄帶語音信號之后，將窄帶語音信號和寬帶語音信號進行綜合正交鏡像濾波，得到完整的語音信號。值得一提的是，本實施方式中，可通過丟包補償來提高丟包處寬帶語音的性能。具體地說，在發(fā)生丟包時，利用丟包前的窄帶語音預測出基音周期，根據(jù)預測的基音周期恢復出丟失的窄帶語音信號和寬帶語音信號。由于寬帶的丟包補償容易帶來7kHz 8kHz頻帶的失真，因此，需要加上7kHz以下的頻域低通濾波以解決該問題，如圖10所示。另外，為了和丟包前的信息保持連續(xù)性，丟包前的信息需要延時一段輸出，這段時間建議是3.75ms。由于在對寬帶語音編碼信號使用MDCT的過程中，將會帶來一個變換塊的延時，而恢復出G711 窄帶語音是沒有延時的，因此，可以通過復用MDCT引入的窄帶緩沖區(qū)，使得丟包補償?shù)奶幚砹鞒滩粫砣魏晤~外的延時，如圖ll所示。本發(fā)明的第三實施方式涉及一種語音編碼發(fā)送方法，本實施方式與第一實施方式大致相同，其區(qū)別在于，在第一實施方式中，編碼端在得到基本窄帶編碼信號、增強窄帶編碼信號和寬帶編碼信號后，直接將得到的基本窄帶編碼信號、增強窄帶編碼信號和寬帶編碼信號發(fā)送給解碼端。而在本實施方式中，在發(fā)送基本窄帶編碼信號、增強窄帶編碼信號和寬帶編碼信號之前，先根據(jù)當前網(wǎng)絡狀態(tài)判斷是否需要裁減編碼信號，如果判定為需要裁減編碼信號，則發(fā)送基本窄帶編碼信號(如圖12中的模式1 )，或基本窄帶編碼信號和增強窄帶編碼信號的組合(如圖12中的模式2),或基本窄帶編碼信號和寬帶編碼信號的組合 (如圖12中的模式3);如果判定為不需要裁減編碼信號，則發(fā)送基本窄帶編碼信號、增強窄帶編碼信號和寬帶編碼信號(如圖12中的模式0)。由于在本實施方式中，可根據(jù)當前網(wǎng)絡狀態(tài)裁減編碼信號，因此可以在網(wǎng) 絡狀態(tài)較差時保證基本音質(zhì)的通信，在網(wǎng)絡狀態(tài)較好時進行較高音質(zhì)的通信。相應的，在解碼端接收碼流時，同樣需要先根據(jù)當前網(wǎng)絡狀態(tài)判斷編碼信號是否被裁減，如果判定為編碼信號被裁減，則接收窄帶編碼信號，或基本窄帶編碼信號和增強窄帶編碼信號的組合，或基本窄帶編碼信號和寬帶編碼信號的組合；如果判定為編碼信號未被裁減，則接收基本窄帶編碼信號、增強窄帶編碼信號和寬帶編碼信號。另外，值得一提的是，本實施方式中對窄帶語音信號也可以按現(xiàn)有技術(shù)的方式進行處理，比如說，在對窄帶語音信號進行編碼，得到窄帶語音編碼信號后，直接將得到窄帶語音編碼信號和寬帶語音編碼信號發(fā)送給解碼端。此時，解碼端需要以相應的方式對收到的編碼信號進行處理，如將收到的編碼信號分為窄帶語音編碼信號和寬帶語音編碼信號，分別進行解碼。本發(fā)明的第四實施方式涉及一種語音編碼發(fā)送裝置，如圖13所示，包括時頻變換模塊，用于對語音信號進行時頻變換，得到X個頻域變換系數(shù)；碼本存儲模塊，用于保存第一碼本和第二碼本，其中第一碼本的碼字數(shù)量大于第二碼本的碼字數(shù)量；量化模塊，用于對該時頻變換模塊得到的X個頻域變換系數(shù) 進行量化得到寬帶編碼信號，其中對相對重要的Y個頻域變換系數(shù)以第一碼本進行量化，對剩余的X-Y個頻域變換系數(shù)以第二碼本進行量化，X>Y>1;發(fā) 送模塊，用于發(fā)送該量化模塊得到的寬帶編碼信號。由于對相對重要的MDCT 系數(shù)采用包含更多的碼字數(shù)量的碼本進行量化，可使得量化后的MDCT系數(shù)更接近于原始的MDCT系數(shù)，從而提高了編碼效率，減少主觀聽覺失真。其中，碼本存儲模塊獨立地存儲該第一碼本和第二碼本；或者，碼本存儲模塊存儲該第一碼本和第二碼本所包含的所有基本碼本，其中，第一碼本包括至少兩個基本碼本，第二碼本包括至少一個基本碼本，第一碼本和第二碼本共享至少一個基本碼本。時頻變換可以是MDCT編碼，時頻變換后得到X個MDCT 系數(shù)，相對重要的Y個頻域變換系數(shù)為前Y個MDCT系數(shù)。量化模塊包含以下子模塊第一子模塊，用于將X個頻域變換系數(shù)分為M 個子帶，每個子帶包含至少一個頻域變換系數(shù)，分別對每個子帶進行歸一化；第二子模塊，用于對經(jīng)歸一化后的各子帶中的頻域變換系數(shù)進行量化，并對各子帶的用于歸一化的歸一化因子進行量化，相對重要的Y個頻域變換系數(shù)為至少一個子帶中的所有頻域變換系數(shù)。該發(fā)送模塊還用于發(fā)送量化后的各子帶的歸一化因子。本發(fā)明的第五實施方式涉及一種語音編碼發(fā)送裝置，本實施方式在第四實施方式的基礎上，進一步將語音信號分為寬帶語音信號和窄帶語音信號，時頻變換模塊對寬帶語音信號進行時頻變換，得到X個頻域變換系數(shù)，并且，本實施方式增加了用于對窄帶語音信號進行處理的模塊，具體包括以下模塊窄帶編碼模塊，用于對窄帶語音信號進行窄帶編碼，得到基本窄帶編碼信號；窄帶解碼模塊，用于對窄帶編碼模塊得到的基本窄帶編碼信號進行解碼，得到解碼信號；殘差信號獲取;f莫塊，用于將窄帶語音信號和對應的解碼信號相減，得到殘差信號；量化編碼模塊，用于對殘差信號獲取模塊得到的殘差信號進行量化編碼，得到增強窄帶編碼信號。如圖14所示，本實施方式的語音編碼發(fā)送裝置還包括正交《竟像濾波分析模塊，用于對原始語音信號進行分析正交鏡像濾波，得到低頻部分的窄帶語音信號和高頻部分的寬帶語音信號，并將該窄帶語音信號輸出到該窄帶編碼模塊和該殘差信號獲取模塊，將該寬帶語音信號輸出到該時頻變換模塊。發(fā)送模塊將該窄帶編碼模塊得到的基本窄帶編碼信號、量化編碼模塊得到的增強窄帶編碼信號、和量化才莫塊得到的寬帶編碼信號，復用為一個碼流后發(fā)送。本發(fā)明的第六實施方式涉及一種語音接收解碼裝置，本實施方式對應于第四實施方式的語音編碼發(fā)送裝置。如圖15所示，包括碼本存儲模塊，用于保存第一碼本和第二碼本，其中第一碼本的碼字數(shù)量大于第二碼本的碼字數(shù)量；接收模塊，用于接收寬帶編碼信號；量化解碼模塊，用于將該接收模塊收到的寬帶編碼信號進行量化解碼，得到X個頻域變換系數(shù)，其中對相對重要的寬帶編碼信號以第一碼本進行量化解碼，得到Y(jié)個頻域變換系數(shù)，對剩余的寬帶編碼信號以第二碼本進行量化解碼，得到X-Y個頻域變換系數(shù)，X>Y>1;頻時變換模塊，用于將量化解碼模塊得到的X個頻域變換系數(shù)進行頻時變換，得到時域的語音信號。其中，碼本存儲模塊獨立地存儲第一碼本和第二碼本；或者，碼本存儲模塊存儲第一碼本和第二碼本所包含的所有基本碼本，其中，第一碼本包括至少兩個基本碼本，第二碼本包括至少一個基本碼本，第一碼本和第二碼本共享至少一個基本碼本。量化解碼模塊得到的X個頻域變換系數(shù)為MDCT系數(shù)，頻時變換模塊進行的頻時變換為逆MDCT變換。該量化解碼模塊得到的X個MDCT系數(shù)為被劃分為M個子帶，每個子帶包含至少一個MDCT系數(shù)，該接收模塊還用于接收經(jīng)量化的各子帶的歸一化因子。量化解碼模塊還包含以下子模塊第一子模塊，用于將收到的經(jīng)量化的各子帶的歸一化因子進行量化解碼，得到各子帶的歸一化因子；第二子才莫塊，用于將各子帶的歸一化因子分別對量化解碼后得到的各子帶的MDCT系數(shù)進行歸一化的還原，得到歸一化還原后的X個MDCT系數(shù)。該頻時變換模塊對歸一化還原后的X個MDCT系數(shù)進行頻時變換，得到時域的語音信號。本發(fā)明的第七實施方式涉及一種語音接收解碼裝置，本實施方式對應于第五實施方式的語音編碼發(fā)送裝置。因此，本實施方式中的接收模塊還需接收基本窄帶編碼信號和增強窄帶編碼信號，頻時變換^t塊得到時域的語音信號為寬帶語音信號。另外，本實施方式還需增加用于對基本窄帶編碼信號和增強窄帶編碼信號進行處理的模塊，具體包括以下模塊窄帶解碼模塊，用于對接收模塊收到的基本窄帶編碼信號進行窄帶解碼，得到基本窄帶解碼信號；殘差信號獲取模塊，用于對接收模塊收到的增強窄帶編碼信號進行量化解碼，得到殘差信號；語音信號獲取模塊，用于將窄帶解碼模塊得到的基本窄帶解碼信號分別與相應的殘差信號相加，得到窄帶語音信號。如圖16所示，接收模塊將收到的基本窄帶編碼信號輸入到窄帶解碼模塊，將增加窄帶編碼信號輸入到殘差信號獲取模塊，將寬帶編碼信號輸入到量化解碼模塊。頻時變換模塊將量化解碼模塊得到的X個頻域變換系數(shù)進行頻時變換，得到時域的寬帶語音信號輸入到正交鏡像濾波綜合模塊，語音信號獲取模塊將得到的窄帶語音信號也輸入到正交鏡像濾波綜合模塊，該正交鏡像濾波綜合模塊用于將窄帶語音信號和寬帶語音信號進行綜合正交鏡像濾波，得到完整的語音信號。本發(fā)明的第八實施方式涉及一種語音解碼方法，具體流程如圖17所示。在步驟1710中，對包括至少兩個頻域量化信號的量化塊，計算平均頻譜幅度和最大頻鐠幅度的比值。接著，進入步驟1720,根據(jù)計算到的比值裁減該量化塊中頻域量化信號的精細頻i普結(jié)構(gòu)，以便達到減少量化噪聲的效果。其中，比值越小對精細頻譜結(jié) 構(gòu)的裁減程度越大。具體地說，對該量化塊中的每個頻域量化信號，根據(jù)平均頻譜幅度和最大頻語幅度的比值，計算對應該頻域量化信號的調(diào)整因子，其中，該調(diào)整因子是該比值的單調(diào)函數(shù)，比值越大該調(diào)整因子越大。調(diào)整因子fac的計算公式如下 l崩<formula>formula see original document page 27</formula>其中,beta =1.2 — AvgAmp/MaxAmp,MaxAmp為該量化塊的最大頻譜幅度,AvgAmp為該量化塊的平均頻譜幅度，X[f] 為該量化塊中的頻域量化信號，n為該量化塊中包含的頻域量化信號數(shù)目。在計算出頻域量化信號對應的調(diào)整因子fac后，通過將該頻域量化信號乘以該調(diào)整因子，對該頻域量化信號進行精細頻語結(jié)構(gòu)的裁減。接著，在步驟1730，對經(jīng)裁減的頻域量化信號進行頻時變換得到時域的語音信號。該頻時變換可以是逆MDCT變換。本發(fā)明的第九實施方式涉及一種語音解碼裝置，如圖18所示，包括比值計算模塊，用于對包括至少兩個頻域量化信號的量化塊，計算平均頻鐠幅度和最大頻傳幅度的比值；裁減模塊，用于根據(jù)比值計算模塊得到的比值裁減該量化塊中頻域量化信號的精細頻i普結(jié)構(gòu)，以達到減少量化噪聲的效果。其中，比值越小對精細頻語結(jié)構(gòu)的裁減程度越大；頻時變換模塊，用于對經(jīng)裁減的頻域量化信號進行頻時變換得到時域的語音信號。其中，裁減模塊包括以下子模塊調(diào)整因子獲取子模塊，用于對量化塊中的每個頻域量化信號，根據(jù)比值計算模塊得到的比值，計算對應該頻域量化信號的調(diào)整因子，其中，該調(diào)整因子是該比值的單調(diào)函數(shù)，該比值越大該調(diào)整因子越大；乘法子模塊，用于對每個頻域量化信號乘以該頻域量化信號對應的調(diào) 整因子。調(diào)整因子獲取子模塊中調(diào)整因子fac的計算公式如下其中，beta =1.2 — AvgAmp/MaxAmp, MaxAmp為量化塊的最大頻語幅度，AvgAmp為量化塊的平均頻譜幅度，^W為量化塊中的頻域量化信號，n為量化塊中包含的頻域量化信號數(shù)目。綜上所述，在本發(fā)明的實施方式中，對語音信號進行時頻變換，得到X 個頻域變換系數(shù)，對這X個頻域變換系數(shù)進行量化得到寬帶編碼信號，其中對相對重要的Y個頻域變換系數(shù)以第一碼本進行量化，對剩余的X-Y個頻域變換系數(shù)以第二碼本進行量化，第一碼本的碼字數(shù)量大于第二碼本的碼字數(shù) 量，X>Y>1，發(fā)送得到的寬帶編碼信號。由于對相對重要的MDCT系數(shù)采用包含更多的碼字數(shù)量的碼本進行量化，可使得量化后的MDCT系數(shù)更接近于原始的MDCT系數(shù)，從而提高了編碼效率，減少主觀聽覺失真。根據(jù)每個量化塊的平均頻鐠幅度和最大頻鐠幅度的比值，來裁減該量化塊中頻域量化信號的精細頻鐠結(jié)構(gòu)，其中，比值越小對精細頻語結(jié)構(gòu)的裁減程度越大，以便達到減少量化噪聲的效果。第一碼本和第二碼本可以均為獨立的碼本，使得量化后的MDCT系數(shù)可以通過碼本中的碼字索引即可表示，提高了傳輸效率?；蛘撸谝淮a本包括至少兩個基本碼本，第二碼本包括至少一個基本碼本，第一碼本和第二碼本共享至少一個基本碼本，由于第一碼本和第二碼本能夠共享至少一個基本碼本中的碼字，因此可節(jié)約編碼端與解碼端內(nèi)的碼本存儲空間。對歸一化后的MDCT系數(shù)進行量化，使得需要量化的MDCT系數(shù)都被限制在一個較小的范圍內(nèi)，因此，可以進一步節(jié)約編碼端與解碼端內(nèi)的碼本存儲空間。根據(jù)當前網(wǎng)絡狀態(tài)裁減編碼信號，可以在網(wǎng)絡狀態(tài)較差時保證基本音質(zhì) 的通信，在網(wǎng)絡狀態(tài)較好時進行較高音質(zhì)的通信。在發(fā)生丟包時，可利用丟包前的窄帶語音預測出基音周期，根據(jù)預測的基音周期恢復出丟失的窄帶語音信號和寬帶語音信號，使得丟包處寬帶語音的性能得以提高。雖然通過參照本發(fā)明的某些優(yōu)選實施方式，已經(jīng)對本發(fā)明進行了圖示和描述，但本領(lǐng)域的普通技術(shù)人員應該明白，可以在形式上和細節(jié)上對其作各種改變，而不偏離本發(fā)明的精神和范圍。
權(quán)利要求
1.一種語音編碼發(fā)送方法，其特征在于，包括以下步驟對語音信號進行時頻變換，得到X個頻域變換系數(shù)；對所述X個頻域變換系數(shù)進行量化得到寬帶編碼信號，其中對相對重要的Y個頻域變換系數(shù)以第一碼本進行量化，對剩余的X-Y個頻域變換系數(shù)以第二碼本進行量化，第一碼本的碼字數(shù)量大于第二碼本的碼字數(shù)量，X≥Y≥1；發(fā)送所述寬帶編碼信號。
2. 根據(jù)權(quán)利要求1所述的語音編碼發(fā)送方法，其特征在于，所述第一碼本、第二碼本均為獨立的碼本；或者，所述第一碼本包括至少兩個基本碼本，第二碼本包括至少一個基本碼本，第一碼本和第二碼本共享至少一個基本碼本。
3. 根據(jù)權(quán)利要求1所述的語音編碼發(fā)送方法，其特征在于，在所述進行時頻變換的步驟中，包含以下步驟對所述語音信號進行改進型離散余弦變換MDCT編碼，得到X個MDCT 系數(shù)；所述相對重要的Y個頻域變換系數(shù)為前Y個所述MDCT系數(shù)。
4. 根據(jù)權(quán)利要求1所述的語音編碼發(fā)送方法，其特征在于，在對所述 X個頻域變換系數(shù)進行量化的步驟中，包含以下子步驟將所述X個頻域變換系數(shù)分為M個子帶，每個子帶包含至少一個頻域變換系數(shù)，分別對每個子帶進行歸一化；對經(jīng)歸一化后的各子帶中的頻域變換系數(shù)進行所述量化，并對所述各子帶的用于歸一化的歸一化因子進行量化，所述相對重要的Y個頻域變換系數(shù)為至少一個所述子帶中的所有頻域變換系數(shù)；在發(fā)送所述寬帶編碼信號的步驟中，還包含以下子步驟發(fā)送量化后的所述各子帶的歸一化因子。
5. 根據(jù)權(quán)利要求1至4中任一項所述的語音編碼發(fā)送方法，其特征在于，在所述進行時頻變換的步驟之前，還包括以下步驟對原始語音信號進行分析正交鏡像濾波，得到低頻部分的窄帶語音信號和高頻部分的寬帶語音信號；進行所述時頻變換的語音信號是所述寬帶語音信號；在所述進行分析正交鏡像濾波的步驟之后，還包括以下步驟對所述窄帶語音信號進行窄帶編碼，得到基本窄帶編碼信號；對所述基本窄帶編碼信號進行解碼，得到解碼信號；用所述窄帶語音信號和對應的所述解碼信號相減，得到殘差信號；對所述殘差信號進行量化編碼，得到增強窄帶編碼信號；在發(fā)送所述寬帶編碼信號的步驟中，同時發(fā)送所述基本窄帶編碼信號、增強窄帶編碼信號、和寬帶編碼信號。
6. 根據(jù)權(quán)利要求5所述的語音編碼發(fā)送方法，其特征在于，在同時發(fā) 送所述基本窄帶編碼信號、增強窄帶編碼信號、和寬帶編碼信號的步驟之前，還包含以下步驟根據(jù)當前網(wǎng)絡狀態(tài)判斷是否需要裁減比特流；如果判定為需要裁減編碼信號，則發(fā)送所述基本窄帶編碼信號，或所述基本窄帶編碼信號和增強窄帶編碼信號的組合，或所述基本窄帶編碼信號和寬帶編碼信號的組合；如果判定為不需要裁減編碼信號，則執(zhí)行所述發(fā)送基本窄帶編碼信號、增強窄帶編碼信號和寬帶編碼信號的步驟。
7. —種語音接收解碼方法，其特征在于，包括以下步驟接收寬帶編碼信號；將收到的寬帶編碼信號進行量化解碼，得到X個頻域變換系數(shù)，其中對相對重要的寬帶編碼信號以第一碼本進行量化解碼，得到Y(jié)個頻域變換系數(shù)，對剩余的寬帶編碼信號以第二碼本進行量化解碼，得到X-Y個頻域變換系數(shù)，第一碼本的碼字數(shù)量大于第二碼本的碼字數(shù)量，X>Y>1;將得到的X個頻域變換系數(shù)進行頻時變換，得到時域的語音信號。
8. 根據(jù)權(quán)利要求7所述的語音接收解碼方法，其特征在于，所述第一碼本、第二碼本均為獨立的碼本；或者，所述第一碼本包括至少兩個基本碼本，第二碼本包括至少一個基本碼本，第一碼本和第二碼本共享至少一個基本碼本。
9. 根據(jù)權(quán)利要求7所述的語音接收解碼方法，其特征在于，所述得到的X個頻域變換系數(shù)為MDCT系數(shù)；在將得到的X個頻域變換系數(shù)進行頻時變換的步驟中，包含以下步驟將得到的X個頻域變換系數(shù)進行逆MDCT變換。
10. 根據(jù)權(quán)利要求7所述的語音接收解碼方法，其特征在于，所述得到的X個頻域變換系數(shù)為被劃分為M個子帶的頻域變換系數(shù)；所述接收寬帶編碼信號的步驟中，還包含以下子步驟接收經(jīng)量化的各子帶的歸一化因子；所述將收到的寬帶編碼信號進行量化解碼的步驟中，還包含以下子步驟將收到的經(jīng)量化的各子帶的歸一化因子進行量化解碼，得到各子帶的歸一化因子；將各子帶的歸一化因子分別對量化解碼后得到的各子帶的頻域變換系數(shù)進行歸一化的還原，得到歸一化還原后的所述X個頻域變換系數(shù)；所述進行頻時變換的步驟中，將歸一化還原后的所述X個頻域變換系數(shù)進行頻時變換，得到時域的語音信號。
11. 根據(jù)權(quán)利要求7至10中任一項所述的語音接收解碼方法，其特征在于，在所述接收寬帶編碼信號的步驟中，同時接收基本窄帶編碼信號、增強窄帶編碼信號、和所述寬帶編碼信號；所述時域的語音信號為寬帶語音信號；在所述接收寬帶編碼信號的步驟之后，還包含以下步驟對收到的所述基本窄帶編碼信號進行窄帶解碼，得到基本窄帶解碼信號，并對收到的所述增強窄帶編碼信號進行量化解碼，得到殘差信號；將得到的所述基本窄帶解碼信號分別與相應的所述殘差信號相加，得到窄帶語音信號；在得到所述寬帶語音信號和所述窄帶語音信號之后，還包含以下步驟將所述窄帶語音信號和所述寬帶語音信號進行綜合正交鏡像濾波，得到完整的語音信號。
12. 根據(jù)權(quán)利要求11所述的語音接收解碼方法，其特征在于，在所述接收基本窄帶編碼信號、增強窄帶編碼信號和寬帶編碼信號的步驟之前，還包含以子步驟根據(jù)當前網(wǎng)絡狀態(tài)判斷編碼信號是否被裁減，如果判定為編碼信號被裁減，則接收所述窄帶編碼信號，或所述基本窄帶編碼信號和增強窄帶編碼信號的組合，或所述基本窄帶編碼信號和寬帶編碼信號的組合；如果判定為編碼信號未被裁減，則執(zhí)行所述接收基本窄帶編碼信號、增強窄帶編碼信號和寬帶編碼信號的步驟。
13. 根據(jù)權(quán)利要求11所述的語音接收解碼方法，其特征在于，還包含以下步驟在發(fā)生丟包時，利用丟包前的所述窄帶語音信號預測出基音周期；根據(jù)預測的所述基音周期，恢復出丟失的所述窄帶語音信號和所述寬帶語音信號。
14. 根據(jù)權(quán)利要求13所述的語音接收解碼方法，其特征在于，在所述進行綜合正交鏡像濾波的步驟中，包含以下子步驟將所述窄帶語音信號延時一個變換塊后，和所迷寬帶語音信號進行綜合正交鏡像濾波，得到語音信號。
15. 根據(jù)權(quán)利要求7至10中任一項所述的語音接收解碼方法，其特征在于，在將得到的X個頻域變換系數(shù)進行頻時變換的步驟之前，還包括以下步驟對包括至少兩個所述頻域變換系數(shù)的頻域變換系數(shù)塊，計算平均頻鐠幅度和最大頻鐠幅度的比值；根據(jù)所述比值裁減所述頻域變換系數(shù)塊中頻域變換系數(shù)的精細頻譜結(jié) 構(gòu)，其中，所述比值越小對所述精細頻譜結(jié)構(gòu)的裁減程度越大；在將得到的X個頻域變換系數(shù)進行頻時變換的步驟中，將裁減后的X 個頻域變換系數(shù)進行頻時變換。
16. —種語音解碼方法，其特征在于，包括以下步驟對包括至少兩個頻域量化信號的量化塊，計算平均頻譜幅度和最大頻譜幅度的比值；根據(jù)所述比值裁減所述量化塊中頻域量化信號的精細頻譜結(jié)構(gòu)，其中，所述比值越小對所述精細頻譜結(jié)構(gòu)的裁減程度越大；對經(jīng)所述裁減的頻域量化信號進行頻時變換得到時域的語音信號。
17. 根據(jù)權(quán)利要求16所述的語音解碼方法，其特征在于，所述裁減的步驟中包括以下子步驟對所述量化塊中的每個頻域量化信號，根據(jù)所述比值計算對應該頻域量化信號的調(diào)整因子，其中，該調(diào)整因子是所述比值的單調(diào)函數(shù)，所述比值越大該調(diào)整因子越大；對每個所述頻域量化信號乘以該頻域量化信號對應的調(diào)整因子。
18. 根據(jù)權(quán)利要求17所述的語音解碼方法，其特征在于，所述調(diào)整因子fac的計算公式如下<formula>formula see original document page 7</formula>其中，beta =1.2- AvgAmp/MaxAmp， MaxAmp為所述量化塊的最大頻譜幅度，AvgAmp為所迷量化塊的平均頻譜幅度，為所述量化塊中的頻域量化信號，n為所述量化塊中包含的頻域量化信號數(shù)目。
19. 根據(jù)權(quán)利要求16至18中任一項所述的語音解碼方法，其特征在于，所述頻時變換是逆MDCT變換。
20. —種語音編碼發(fā)送裝置，其特征在于，包括時頻變換模塊，用于對語音信號進行時頻變換，得到X個頻域變換系數(shù)；碼本存儲模塊，用于保存第一碼本和第二碼本，其中第一碼本的碼字數(shù) 量大于第二碼本的碼字數(shù)量；量化模塊，用于對所述時頻變換模塊得到的X個頻域變換系數(shù)進行量化得到寬帶編碼信號，其中對相對重要的Y個頻域變換系數(shù)以所述第一碼本進行量化，對剩余的X-Y個頻域變換系數(shù)以所述第二碼本進行量化，X >Y>1;發(fā)送模塊，用于發(fā)送所述量化模塊得到的寬帶編碼信號。
21. 根據(jù)權(quán)利要求20所述的語音編碼發(fā)送裝置，其特征在于，所述碼本存儲模塊獨立地存儲所述第一碼本和第二碼本；或者，所述碼本存儲模塊存儲所述第一碼本和第二碼本所包含的所有基本碼本，其中，所述第一碼本包括至少兩個基本碼本，第二碼本包括至少一個基本碼本，第一碼本和第二碼本共享至少一個基本碼本。
22. 根據(jù)權(quán)利要求20所述的語音編碼發(fā)送裝置，其特征在于，所述時頻變換是MDCT編碼，所述時頻變換后得到X個MDCT系數(shù)；所述相對重要的Y個頻域變換系數(shù)為前Y個所述MDCT系數(shù)。
23. 根據(jù)權(quán)利要求20所述的語音編碼發(fā)送裝置，其特征在于，所述量化模塊包含以下子模塊第一子模塊，用于將所述X個頻域變換系數(shù)分為M個子帶，每個子帶包含至少一個頻域變換系數(shù)，分別對每個子帶進行歸一化；第二子模塊，用于對經(jīng)歸一化后的各子帶中的頻域變換系數(shù)進行所述量化，并對所述各子帶的用于歸一化的歸一化因子進行量化，所述相對重要的 Y個頻域變換系數(shù)為至少一個所述子帶中的所有頻域變換系數(shù)；所述發(fā)送模塊還用于發(fā)送量化后的所述各子帶的歸一化因子。
24. —種語音編接收解碼裝置，其特征在于，包括碼本存儲模塊，用于保存第一碼本和第二碼本，其中第一碼本的碼字數(shù) 量大于第二碼本的碼字數(shù)量；接收模塊，用于接收寬帶編碼信號；量化解碼模塊，用于將所述接收模塊收到的寬帶編碼信號進行量化解碼，得到X個頻域變換系數(shù)，其中對相對重要的寬帶編碼信號以所述第一碼本進行量化解碼，得到Y(jié)個頻域變換系數(shù)，對剩余的寬帶編碼信號以所述第二碼本進行量化解碼，得到X-Y個頻域變換系數(shù)，X>Y>1;頻時變換模塊，用于將所述量化解碼模塊得到的X個頻域變換系數(shù)進行頻時變換，得到時域的語音信號。
25. 根據(jù)權(quán)利要求24所述的語音編接收解碼裝置，其特征在于，所述碼本存儲模塊獨立地存儲所述第一碼本和第二碼本；或者，所述碼本存儲模塊存儲所述第一碼本和第二碼本所包含的所有基本碼本，其中，所述第一碼本包括至少兩個基本碼本，第二碼本包括至少一個基本碼本，第一碼本和第二碼本共享至少一個基本碼本。
26. 根據(jù)權(quán)利要求24所述的語音編接收解碼裝置，其特征在于，所述量化解碼模塊得到的X個頻域變換系數(shù)為MDCT系數(shù)；所述頻時變換為逆MDCT變換。
27. 根據(jù)權(quán)利要求24所述的語音編接收解碼裝置，其特征在于，所述得到的X個頻域變換系數(shù)為被劃分為M個子帶，每個子帶包含至少一個頻域變換系數(shù)；所述接收模塊還用于接收經(jīng)量化的各子帶的歸一化因子；所述量化解碼模塊還包含以下子模塊第一子模塊，用于將收到的經(jīng)量化的各子帶的歸一化因子進行量化解碼，得到各子帶的歸一化因子；第二子模塊，用于將各子帶的歸一化因子分別對量化解碼后得到的各子帶的頻域變換系數(shù)進行歸一化的還原，得到歸一化還原后的所述X個頻域變換系數(shù)；所述頻時變換模塊對歸一化還原后的所述X個頻域變換系數(shù)進行所述頻時變換，得到時域的語音信號。
28. —種語音解碼裝置，其特征在于，包括比值計算模塊，用于對包括至少兩個頻域量化信號的量化塊，計算平均頻i普幅度和最大頻語幅度的比值；裁減模塊，用于根據(jù)所述比值計算模塊得到的比值裁減所述量化塊中頻域量化信號的精細頻譜結(jié)構(gòu)，其中，所述比值越小對所述精細頻語結(jié)構(gòu)的裁減程度越大；頻時變換模塊，用于對經(jīng)所述裁減的頻域量化信號進行頻時變換得到時域的語音信號。
29. 根據(jù)權(quán)利要求28所述的語音解碼裝置，其特征在于，所述裁減模塊包括以下子模塊調(diào)整因子獲取子模塊，用于對所述量化塊中的每個頻域量化信號，根據(jù) 所迷比值計算對應該頻域量化信號的調(diào)整因子，其中，該調(diào)整因子是所述比值的單調(diào)函數(shù)，所述比值越大該調(diào)整因子越大；乘法子模塊，用于對每個所述頻域量化信號乘以該頻域量化信號對應的調(diào)整因子。
30. 根據(jù)權(quán)利要求29所述的語音解碼裝置，其特征在于，所述調(diào)整因子獲取子模塊中調(diào)整因子fac的計算公式如下力c 二畫畫6eto x ~!~U~~ + (1 - 6"a), / = 1,2，......,"J 嵐贏尸其中，beta =1.2 — AvgAmp/MaxAmp, MaxAmp為所述量化塊的最大頻鐠幅度，AvgAmp為所述量化塊的平均頻譜幅度，義W為所述量化塊中的頻域量化信號，n為所述量化塊中包含的頻域量化信號數(shù)目。
全文摘要
本發(fā)明涉及通信領(lǐng)域，公開了一種語音編解碼收發(fā)方法及裝置，使得語音信號的編碼效率得以增加，并提高了語音質(zhì)量。本發(fā)明中，對語音信號進行時頻變換，得到X個頻域變換系數(shù)，對這X個頻域變換系數(shù)進行量化得到寬帶編碼信號，其中對相對重要的Y個頻域變換系數(shù)以第一碼本進行量化，對剩余的X-Y個頻域變換系數(shù)以第二碼本進行量化，第一碼本的碼字數(shù)量大于第二碼本的碼字數(shù)量，X≥Y≥1，發(fā)送得到的寬帶編碼信號。根據(jù)每個量化塊的平均頻譜幅度和最大頻譜幅度的比值，來裁減該量化塊中頻域量化信號的精細頻譜結(jié)構(gòu)，其中，比值越小對精細頻譜結(jié)構(gòu)的裁減程度越大。
文檔編號G10L19/02GK101325059SQ200710126718
公開日2008年12月17日申請日期2007年6月15日優(yōu)先權(quán)日2007年6月15日
發(fā)明者清張, 偉李, 杜正中, 毅楊, 晨胡, 磊苗, 許麗凈, 許劍峰申請人:華為技術(shù)有限公司

完整全部詳細技術(shù)資料下載