專利名稱:一種幀錯誤隱藏的譜參數(shù)替換方法
技術領域:
本發(fā)明涉及語音解碼器的壞幀處理方法,具體的說,涉及一種幀錯誤隱藏的i普參it^l纟灸方法。
技術背景在通信系統(tǒng)中,語音編碼器常用的編碼原理是代數(shù)碼本激勵線性預測 (ACELP, Algebraic Code Excited Linear Prediction),這類編碼器包括G.729、 EVRC、 AMR、 AMR-WB、 AMR-WB+等。其中AMR、 AMR-WB、 AMR-WB+ 是第三代移動通信合作伙伴計劃(3GPP, 3rd Generation Partnership Project)的i吾音編碼標準?;贏CELP的語音編碼器生成的碼流都是以語音幀為單位的,有的還把 幀分為若干子幀,如AMR。對于每一幀的輸入數(shù)據(jù),通常為幾十毫秒 PCM( Pulse Code Modulation,脈沖編碼調制)格式數(shù)據(jù),發(fā)送端的語音編碼器 要將其編碼為一組參數(shù)。這些參數(shù)一般要經(jīng)過量化并且傳輸。接收端的解碼 器則要將這些參數(shù)重新合成為語音信號(常見為PCM格式數(shù)據(jù))。參照圖l所示,為基于ACELP的語音編碼器語音信號傳輸示意圖。輸入 語音信號經(jīng)編碼器進行編碼后由通信信道傳輸至解碼器,由解碼器重新合成 語音信號。線性預測系數(shù)(LPC, Linear Predictive Coefficience)表示短時語音的語 形狀。語音編碼器一般都會將LPC參數(shù)進行量化后再傳輸。為了減少量化誤 差, 一些語音編碼器會將LPC轉換成線譜頻率(LSF, Linear Spectral Frequency)或導譜頻率(ISF, Immittance Spectral Frequency)等其他語參數(shù), 再進行量化。使用ISF作為譜參數(shù)的語音編碼器有AMR-WB、 AMR-WB+等?;贏CELP的語音編碼器生成的語音幀的參數(shù)一般包括譜參數(shù)、自適應
碼本參數(shù)、代數(shù)碼本參數(shù)、自適應碼本增益和代數(shù)碼本增益等。如果一個語音幀的數(shù)據(jù)從發(fā)送端傳輸?shù)浇邮斩撕?,發(fā)生錯誤或者丟失, 則稱為壞幀。當出現(xiàn)壞幀時,接收端的解碼器一般需要對壞幀中的錯誤參數(shù) 進行替換,以減少解碼后語音質量的下降。最早的基于ACELP的語音解碼器在發(fā)生幀錯誤時,都是簡單的重復上一 幀的譜參數(shù),如G.729和EVRC (分別參見ITU-T G.729和3GPP2 3GPP2 C.S0014-0)。之后的一些標準,為了進一步提高語音質量,開始利用其他 的信息(如最近好幀的自適應平均值、常數(shù)平均值等)來替換當前壞幀的譜 參數(shù),如AMR-WB和AMR-WB+(參見AMR-WB的幀錯誤隱藏標準3GPP TS 26.191 )。AMR-WB和AMR-WB+使用的譜參數(shù)是16階的導譜頻率ISF。在發(fā)生幀 錯誤時,AMR-WB和AMR-WB+語音解碼器將上一幀的ISF向ISF的部分自適 應平均值偏移,得到的值作為錯誤幀的ISF(參考AMR幀錯誤隱藏標準3GPP TS26.191和國際專利WO 02/35520):<formula>formula see original document page 4</formula>其中a =0.9,"《《是當前幀的ISF向量, P"w-"《。是上一幀的ISF向量,是ISF的部分自適應平均值,由ISF的自適應平均值和ISF的 常數(shù)平均值組成<formula>formula see original document page 4</formula>其中"=0.25,—3'=。 ,是最近3個好幀的自適應平均值,每次好幀更新一次向量的長期平均值常數(shù)向量。 在上述的AMR-WB和AMR-WB+語音編解碼器的幀錯誤隱藏的譜參數(shù)
替換中存在下列缺陷a) 沒有考慮最近壞幀的嚴重程度。當連續(xù)壞幀時,最近好幀的ISF和當 前壞幀的相關性應當減弱。b) 使用最近三個好幀的ISF平均值。實際上最近一個好幀的ISF和當前壞 幀的ISF的相關度應大于其他好幀,可以忽略其他好幀。c) 基于(b),如果上一幀是壞幀,那么上一幀的ISF也要通過上一好幀 的ISF推斷出來。因此在替換當前幀的ISF時,沒有必要將上一好幀的ISF和 上一 幀的ISF分開計算,僅用上一好幀的ISF進行計算即可??梢姡F(xiàn)有的AMR-WB和AMR-WB+語音編解碼器的幀錯誤隱藏的譜參 數(shù)替換中存在計算冗余的問題。發(fā)明內容本發(fā)明所要解決的技術問題是提供一種幀錯誤隱藏的譜參數(shù)替換方法, 在保證解碼質量有所提高的情況下,為了解決AMR-WB和AMR-WB+語音 編解碼器的幀錯誤隱藏的譜參數(shù)替換中存在的計算冗余的問題,提出一個高 效的譜參數(shù)替換方法。為了解決上述技術問題,本發(fā)明提供了一種幀錯誤隱藏的譜參數(shù)替換方 法,所述方法包括以下步驟(1) 解碼器統(tǒng)計最近連續(xù)壞幀數(shù)量;(2) 在當前幀發(fā)生幀錯誤時,根據(jù)所述最近連續(xù)壞幀數(shù)量,將上一好 幀的導譜頻率向導譜頻率的常數(shù)平均值進行自適應偏移,得到的值作為當前 幀的導譜頻率。進一步的,步驟(l)中所述統(tǒng)計最近連續(xù)壞幀數(shù)量,包括設置壞幀 計數(shù)器,當解碼器接收到好幀時,將所述壞幀計數(shù)器置零;當解碼器接收到 壞幀時,將所述壞幀計數(shù)器加1。進一步的,步驟(2)中所述將上一好幀的導譜頻率向導譜頻率的常數(shù) 平均值進行自適應偏移,包括
<formula>formula see original document page 6</formula>其中,^,.、是當前幀導譜頻率的向量,,,w,.、是上一好幀的導譜頻率向量,是導譜頻率向量的長期平均值常數(shù)向量,"^^"^訓W — me朋V J是最近連續(xù)壞幀的數(shù)量。W 一進一步的,所述方法還包括以下步驟(3 )解碼器按照所述當前幀的導譜頻率對所述當前幀進行解碼。在技術上,采用本發(fā)明的優(yōu)勢有a) 當發(fā)生連續(xù)壞幀時,逐漸減小最近好幀ISF與當前壞幀ISF的相關度, 在相同碼率和幀錯誤率情況下獲得比AMR-WB和AMR-WB+原幀錯誤隱藏算法更好的音質。b) 當發(fā)生幀錯誤,需要替換ISF參數(shù)時,只使用最近一個好幀的ISF,不 使用更早的好幀的ISF。和AMR-WB和AMR-WB+原幀錯誤隱藏算法相比, 節(jié)約了解碼器的內存和減小了計算復雜度。c) 當發(fā)生幀錯誤,需要替換ISF參數(shù)時,只使用最近一個好幀的ISF,不 使用上一幀的ISF。和AMR-WB和AMR-WB+原幀錯誤隱藏算法相比,減小了計算復雜度。
圖1為基于ACELP的語音編碼器語音信號傳輸示意圖。 圖2為本發(fā)明實施例幀錯誤隱藏的鐠參數(shù)替換方法流程圖。
具體實施方式
本發(fā)明通過統(tǒng)計最近連續(xù)壞幀個數(shù),當發(fā)生連續(xù)壞幀時,逐漸減小最近好幀與當前壞幀的相關度,當發(fā)生幀錯誤時,將上一好幀的ISF向ISF的常 數(shù)平均值進行自適應偏移,得到的值作為錯誤幀的ISF。從而本發(fā)明只使用 最近一個好幀的ISF,不使用更早的好幀的ISF,節(jié)約解碼器的內存和減小 計算復雜度。并且當發(fā)生幀錯誤,需要替換ISF參數(shù)時,只使用最近一個好 幀的ISF,不使用上一幀的ISF,從而減小了計算復雜度。下面結合附圖對本發(fā)明的優(yōu)選實施例進行詳細說明。參照圖2所示,為本發(fā)明實施例幀錯誤隱藏的語參數(shù)替換方法流程圖。 所述方法包括以下步驟步驟201:設置壞幀計數(shù)器,解碼器判斷當前幀是否是壞幀,如果是壞 幀,則執(zhí)行步驟204;如果是好幀,則執(zhí)行步驟202;步驟202:將壞幀計數(shù)器置零;步驟203:直接用接收到的好幀的ISF參數(shù)更新解碼器的ISF輸入緩沖 區(qū),作為解碼器的輸入?yún)?shù),執(zhí)行步驟206;步驟204:將壞幀計數(shù)器加l,從而統(tǒng)計最近連續(xù)壞幀數(shù)量;步驟205:按照統(tǒng)計出的所述最近連續(xù)壞幀數(shù)量,根據(jù)上一好幀的ISF, 計算當前的壞幀的ISF,作為解碼器輸入?yún)?shù),執(zhí)行步驟206;步驟206:解碼器按照得到的當前幀的ISF對語音數(shù)據(jù)進行解碼,結束??偠灾獯a器需要統(tǒng)計最近連續(xù)壞幀數(shù)量。當接收到好幀時,則將 統(tǒng)計數(shù)置O。在發(fā)生幀錯誤時,根據(jù)最近連續(xù)壞幀數(shù)量,將上一好幀的ISF 向ISF的常數(shù)平均值進行自適應偏移,得到的值作為錯誤幀的ISF:<formula>formula see original document page 7</formula>其中,w"、是當前幀的ISF向量,戶^—是上一好幀的ISF向量, 是ISF向量的長期平均值常數(shù)向量 是最近連續(xù)壞幀的數(shù)量。本發(fā)明提供的改進的幀錯誤隱藏的ISF譜參數(shù)替換方法,與現(xiàn)有的 AMR-WB和AMR-WB+語音編解碼器的幀錯誤隱藏的譜參數(shù)替換方案相 比,能保持解碼器解碼質量并略有提高,同時節(jié)約解碼器的內存并減小解碼 計算復雜度。當然,上述具體實施方式
不是對本發(fā)明技術方案的進一步限定,任何熟 悉本領域的技術人員對本發(fā)明技術特征所作的等同替換或者相應改進,仍在 本發(fā)明的保護范圍之內。
權利要求
1、一種幀錯誤隱藏的譜參數(shù)替換方法,其特征在于,所述方法包括以下步驟(1)解碼器統(tǒng)計最近連續(xù)壞幀數(shù)量;(2)在當前幀發(fā)生幀錯誤時,根據(jù)所述最近連續(xù)壞幀數(shù)量,將上一好幀的導譜頻率向導譜頻率的常數(shù)平均值進行自適應偏移,得到的值作為當前幀的導譜頻率。
2、 如權利要求l所述的方法,其特征在于,步驟(l)中所述統(tǒng)計最近 連續(xù)壞幀數(shù)量,包括設置壞幀計數(shù)器,當解碼器接收到好幀時,將所述壞 幀計數(shù)器置零;當解碼器接收到壞幀時,將所述壞幀計數(shù)器加l。
3、 如權利要求l所述的方法,其特征在于,步驟(2)中所述將上一好 幀的導譜頻率向導i普頻率的常數(shù)平均值進行自適應偏移,包括<formula>formula see original document page 2</formula>,QF,.、是當前幀導譜頻率的向量,,,w「、是上一好幀的導錯頻率向量,是導譜頻率向量的長期平均值常數(shù)向量,_ 是最近連續(xù)壞幀的數(shù)量。
4、 如權利要求l所述的方法,其特征在于,所述方法還包括以下步驟 (3 )解碼器按照所述當前幀的導譜頻率對所述當前幀進行解碼。
全文摘要
本發(fā)明提供了一種幀錯誤隱藏的譜參數(shù)替換方法,所述方法包括(1)解碼器統(tǒng)計最近連續(xù)壞幀數(shù)量;(2)在當前幀發(fā)生幀錯誤時,根據(jù)所述最近連續(xù)壞幀數(shù)量,將上一好幀的導譜頻率向導譜頻率的常數(shù)平均值進行自適應偏移,得到的值作為當前幀的導譜頻率。本發(fā)明與現(xiàn)有的AMR-WB和AMR-WB+語音編解碼器的幀錯誤隱藏的譜參數(shù)替換方案相比,能保持解碼器解碼質量并略有提高,同時節(jié)約解碼器的內存并減小解碼計算復雜度。
文檔編號G10L19/00GK101399040SQ20071015253
公開日2009年4月1日 申請日期2007年9月27日 優(yōu)先權日2007年9月27日
發(fā)明者鐘睿毅 申請人:中興通訊股份有限公司