聲音解碼裝置和聲音解碼方法

文檔序號：2820779閱讀：203來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專利名稱：聲音解碼裝置和聲音解碼方法
技術(shù)領(lǐng)域：
本發(fā)明涉及在檢測到?jīng)]有說話者的聲音的無聲期間時、再生背景噪聲的聲音解碼裝置和聲音解碼方法。
背景技術(shù)：

圖1為表示比如日本特開平7—129195號文獻公開的已有的聲音解碼裝置的結(jié)構(gòu)圖。在該圖中，標(biāo)號1表示輸入聲音編碼列的輸入端子，標(biāo)號2表示根據(jù)聲音編碼列生成激勵信號的激勵信號生成電路，標(biāo)號3表示根據(jù)聲音編碼列生成聲譜系數(shù)的聲譜系數(shù)生成電路，標(biāo)號4表示合成濾波器，該合成濾波器根據(jù)通過激勵信號生成電路2生成的激勵信號以及通過聲譜系數(shù)生成電路3生成的聲譜系數(shù)、再生聲音信號，標(biāo)號5表示保持通過聲譜系數(shù)生成電路3生成的聲譜系數(shù)的聲譜系數(shù)保持緩存器，標(biāo)號6表示在處于無聲期間時、對聲譜系數(shù)進行線性內(nèi)插的聲譜系數(shù)內(nèi)插電路，標(biāo)號7表示將通過合成濾波器4再生的聲音信號輸出給輸出端子8的聲音輸出電路，標(biāo)號8表示輸出端子。
下面對工作進行描述。
首先，聲音解碼裝置(圖中未示出)在檢測到說話者的聲音時，對該聲音進行編碼處理，并將聲音編碼列發(fā)送給聲音解碼裝置。
另一方面，聲音解碼裝置在說話者的聲音中斷時，通過比如內(nèi)部設(shè)置的VOX裝置等檢測說話者的無聲期間，停止將聲音編碼向聲音解碼裝置的發(fā)送。但是，上述聲音解碼裝置發(fā)送表示無聲期間的開始的特征字(后同步碼POST)與表示背景噪聲信息的編碼參數(shù)。
由于在檢測有說話者的聲音的有聲區(qū)間，從聲音解碼裝置發(fā)送聲音編碼列，聲音解碼裝置的激勵信號生成電路2根據(jù)聲音符號列生成激勵信號，聲音解碼裝置的聲譜系數(shù)生成電路3根據(jù)聲音編碼列生成聲譜系數(shù)。
在這里，由于在從無聲期間轉(zhuǎn)移到有聲區(qū)間、直到有聲區(qū)間開始等的場合，聲音解碼裝置發(fā)送稱為“前同步碼PRE”的特征字，故聲音解碼裝置可通過檢測該特征字，檢測有聲區(qū)間的開始。
當(dāng)激勵信號生成電路2生成激勵信號、聲譜系數(shù)生成電路3生成聲譜系數(shù)，合成濾波器4根據(jù)該激勵信號和聲譜系數(shù)再生聲音信號。
另外，聲音輸出電路7將通過合成濾波器4再生的聲音信號輸出給輸出端子8。
另一方面，在未檢測到說話者的聲音的無聲期間，停止從聲音解碼裝置對聲音編碼列的發(fā)送，但是由于發(fā)送表示無聲期間的開始的特征字(后同步碼POST)與表示背景噪聲信息的編碼參數(shù)，故聲音解碼裝置的聲譜系數(shù)生成電路3根據(jù)表示該背景噪聲信息的編碼參數(shù)生成聲譜系數(shù)。此外，聲音解碼裝置的激勵信號生成電路2根據(jù)在有聲區(qū)間的最后的接收信號周期接收到的聲音編碼列連續(xù)地生成激勵信號。
在這里，在從有聲區(qū)間轉(zhuǎn)換到無聲期間、無聲期間開始等的場合，按照上述方式，由于聲音解碼裝置發(fā)送稱為“后同步碼POST”的特征字，故聲音解碼裝置可通過檢測該特征字檢測無聲期間的開始(參照圖2)。
當(dāng)檢測到無聲期間時，合成濾波器4根據(jù)通過激勵信號生成電路2生成的激勵信號以及通過聲譜系數(shù)生成電路3生成的背景噪聲信息(聲譜系數(shù))、再生聲音信號，但是，在于有聲區(qū)間的最后的接收信號周期接收到的聲音編碼列與背景噪聲信息的差顯著的場合，由于所再生的聲音信號急劇變化，故產(chǎn)生再生具有不適感的背景噪聲的不利情況。
于是，聲譜系數(shù)內(nèi)插電路6在檢測到無聲期間時，如圖2所示，對在后同步碼POST后馬上接收的背景噪聲信息的聲譜系數(shù)(參照圖2中的☆符號)進行線性內(nèi)插處理。
具體來說，如果合成濾波器4從無聲期間的開始當(dāng)初，采用該背景噪聲信息、再生聲音信號，則在從有聲區(qū)間轉(zhuǎn)換為無聲期間時，由于聲音信號急劇變化，故按照下述方式，針對在有聲區(qū)間的最后的接收信號周期接收到的聲音編碼列(保持于聲譜系數(shù)保持緩沖器5中的聲譜系數(shù))，分級地對常數(shù)進行累加運算，按照一定的內(nèi)插幅度，對聲音編碼列進行更新(按照線性方式，使聲音編碼列進行調(diào)整)，該方式為應(yīng)從無聲期間的開始到背景噪聲信息的更新時(發(fā)送下次的背景噪聲信息時)，緩慢地使聲音信號變化。
另外，合成濾波器4采用經(jīng)線性內(nèi)插處理的背景噪聲信息(聲譜系數(shù))再生聲音信號，聲音輸出電路7將聲音信號輸出給輸出端子8。
由于已有的聲音解碼裝置按照上述方式構(gòu)成，故當(dāng)檢測到無聲期間時，對背景聲音信息進行線性內(nèi)插處理，以便使聲音信號緩慢地變化，但是由于背景噪聲信息的幀單位的內(nèi)插幅度在平時是一定的，故具有下述問題，即聽者所接收到的背景噪聲的變動感非常單調(diào)，與此相反，再生不適感的背景噪聲。
本發(fā)明是為了解決上述問題而提出的，本發(fā)明的目的在于獲得可再生不適感很少的背景噪聲的聲音解碼裝置和聲音解碼方法。
本發(fā)明的公開方案本發(fā)明的聲音解碼裝置采用通過提取機構(gòu)提取的背景噪聲信息的編碼參數(shù)與用于上次背景噪聲的合成的編碼參數(shù)，進行編碼參數(shù)的平滑處理運算，推定無聲期間的編碼參數(shù)。
按照上述方式，具有可再生不適感少的背景噪聲的效果。
本發(fā)明的聲音解碼裝置設(shè)置有下述推定機構(gòu)，該機構(gòu)將作為背景噪聲信息的編碼參數(shù)與用于上次背景噪聲的合成的編碼參數(shù)代入規(guī)定的運算式中，推定無聲期間的編碼參數(shù)。
按照上述方式，具有下述效果，即不采用復(fù)雜的結(jié)構(gòu)，快速地進行編碼參數(shù)的平滑處理運算。
本發(fā)明的聲音解碼裝置設(shè)置有合成機構(gòu)，該機構(gòu)在無聲期間的最初的接收信號周期，根據(jù)通過提取機構(gòu)在有聲區(qū)間的最后的接收信號周期提取的編碼參數(shù)，將聲音合成。
按照上述方式，具有下述效果，該效果指可消除在無聲期間的最初的接收信號周期背景噪聲顯著變化的不利情況。
本發(fā)明的聲音解碼裝置可進行構(gòu)成編碼參數(shù)的一部分的聲譜包絡(luò)信息的平滑處理運算。
按照上述方式，在平滑處理運算中沒有不需要的編碼參數(shù)的場合，具有可削減運算量的效果。
本發(fā)明的聲音解碼裝置可進行構(gòu)成編碼參數(shù)的一部分的幀能信息的平滑處理運算。
按照上述方式，具有下述效果，該效果指即使在背景噪聲的幀能變化的情況下，仍可消除背景噪聲的合成聲能間斷地變化的不利情況。
本發(fā)明的聲音解碼裝置可進行構(gòu)成編碼參數(shù)的一部分的聲譜包絡(luò)信息與幀能信息的平滑處理運算。
按照上述方式，具有可再生不適感更少的背景噪聲的效果。
本發(fā)明的聲音解碼裝置設(shè)置有推定機構(gòu)，該推定機構(gòu)對應(yīng)于下述參數(shù)的變化量確定編碼參數(shù)的平滑處理系數(shù)，該下述參數(shù)指通過提取機構(gòu)在有聲區(qū)間的最后的接收信號周期提取的編碼參數(shù)以及通過提取機構(gòu)在無聲期間的接收信號周期提取的背景噪聲信息的編碼參數(shù)。
按照上述方式，由于對編碼參數(shù)的平滑處理系數(shù)進行適當(dāng)?shù)奶幚?，故具有再生不適感更少的背景噪聲的效果。
本發(fā)明的聲音解碼裝置對應(yīng)于下述信息的變化量確定編碼參數(shù)的平滑處理系數(shù)，該下述信息指在有聲區(qū)間的最后的接收信號周期提取的聲譜包絡(luò)信息與作為背景噪聲信息的聲譜包絡(luò)信息，或在有聲區(qū)間的最后的接收信號周期提取的幀能信息與作為背景噪聲信息的幀能信息。
按照上述方式，具有下述效果，該效果指可在不對平滑處理系數(shù)的確定處理造成較大負擔(dān)的情況下，再生不適感很少的背景噪聲。
本發(fā)明的聲音解碼裝置對應(yīng)于下述信息的變化量確定聲譜包絡(luò)信息的平滑處理系數(shù)，該下述信息指在有聲區(qū)間的最后的接收信號周期提取的聲譜包絡(luò)信息和作為背景噪聲信息的聲譜包絡(luò)信息，并且對應(yīng)于下述信息的變化量確定幀能信息的平滑處理系數(shù)，該下述信息指在有聲區(qū)間的最后的接收信號周期提取的幀能信息與作為背景噪聲信息的幀能。
按照上述方式，由于精細地確定平滑處理系數(shù)，故具有可再生不適感更少的背景噪聲。
本發(fā)明的聲音解碼方法在監(jiān)視聲音編碼編碼列、檢測無聲期間時，采用作為從聲音編碼列提取的背景噪聲信息的編碼參數(shù)與用于上次背景噪聲的合成的編碼參數(shù)，進行編碼參數(shù)的平滑處理運算，推定無聲期間的編碼參數(shù)。
按照上述方式，具有可再生不適感少的背景噪聲的效果。
本發(fā)明的聲音解碼方法將作為背景噪聲信息的編碼參數(shù)與用于上次背景噪聲的合成的編碼參數(shù)代入規(guī)定的運算式，推定無聲期間的編碼參數(shù)。
按照上述方式，具有下述效果，該效果指不采用復(fù)雜的結(jié)構(gòu)、快速地進行編碼參數(shù)的平滑處理運算。
本發(fā)明的聲音解碼方法在無聲期間的最初的接收信號周期，根據(jù)在有聲區(qū)間的最后的接收信號周期提取的編碼參數(shù)，將聲音合成。
按照上述方式，具有可在無聲期間的最初的接收信號周期，消除背景噪聲顯著變化的不利情況的效果。
本發(fā)明的聲音解碼方法對應(yīng)于下述參數(shù)的變化量確定編碼參數(shù)的平滑處理系數(shù)，該下述參數(shù)指在有聲區(qū)間的最后的接收信號周期提取的編碼參數(shù)以及作為在無聲期間的接收信號周期提取的背景噪聲信息的編碼參數(shù)。
按照上述方式，由于對編碼參數(shù)的平滑處理系數(shù)進行適合的處理，故具有再生不適感更少的背景噪聲的效果。
圖1為表示已有的聲音解碼裝置的結(jié)構(gòu)圖；圖2為表示說明作為背景噪聲信息的音譜系數(shù)的線性內(nèi)插的說明圖；圖3為表示本發(fā)明的第1實施例的聲音解碼裝置的結(jié)構(gòu)圖；圖4為表示本發(fā)明的第1實施例的聲音解碼方法的流程圖；圖5為說明作為背景噪聲信息的解碼參數(shù)的平滑處理運算的說明圖；圖6為表示本發(fā)明的第2實施例的聲音解碼裝置的結(jié)構(gòu)圖；圖7為表示本發(fā)明的第4實施例的聲音解碼裝置的結(jié)構(gòu)圖；圖8為表示本發(fā)明的第5實施例的聲音解碼裝置的結(jié)構(gòu)圖；圖9為表示本發(fā)明的第6實施例的聲音解碼裝置的結(jié)構(gòu)圖；圖10為表示本發(fā)明的第7實施例的聲音解碼裝置的結(jié)構(gòu)圖。
用于實現(xiàn)本發(fā)明的優(yōu)選形式為了對本發(fā)明進行更加具體地描述，下面通過附圖，對用于實現(xiàn)本發(fā)明的優(yōu)選形式進行描述。
第1實施例圖3為表示本發(fā)明的第1實施例的聲音解碼裝置的結(jié)構(gòu)圖。在該圖中，標(biāo)號11表示輸入聲音編碼列的輸入端子，標(biāo)號12表示從聲音編碼列中，提取編碼參數(shù)的參數(shù)提取電路(提取機構(gòu))，標(biāo)號13表示有無聲判定電路(檢測機構(gòu))，該電路對聲音編碼列進行監(jiān)視，對是否為無聲區(qū)間進行判斷，標(biāo)號14表示分支開關(guān)(檢測機構(gòu))，該開關(guān)根據(jù)有無聲判定電路13的判定信息、切換參數(shù)提取電路12的輸出方。
標(biāo)號15表示參數(shù)平滑處理電路(推定機構(gòu))，該電路采用作為通過參數(shù)提取電路12提取的背景噪聲信息的編碼參數(shù)與用于上次背景噪聲的合成的編碼參數(shù)，進行編碼參數(shù)的平滑處理運算，推定無聲區(qū)間的編碼參數(shù)，標(biāo)號16表示保持作為背景噪聲信息的編碼參數(shù)的緩存器，標(biāo)號17表示運算電路，該電路采用作為背景噪聲信息的編碼參數(shù)與用于上次背景噪聲的合成的編碼參數(shù)，進行編碼參數(shù)的平滑處理運算，標(biāo)號18表示聲音合成電路(合成機構(gòu))，該電路根據(jù)通過參數(shù)平滑處理電路15推定的編碼參數(shù)或通過參數(shù)12提取的編碼參數(shù)，將聲音合成，標(biāo)號19表示輸出端子。
另外，圖4為表示本發(fā)明的第1實施例的聲音解碼方法的流程圖。
下面對工作進行描述。
首先，聲音編碼裝置(圖中未示出)在檢測說話者的聲音時，對該聲音進行編碼處理，將聲音編碼列發(fā)送給聲音解碼裝置。
另一方面，如果說話者的聲音中斷，則聲音編碼裝置通過比如內(nèi)部設(shè)置的VOX裝置等，檢測到說話者的無聲區(qū)間，停止向聲音解碼裝置的聲音編碼列的發(fā)送。但是，聲音編碼裝置發(fā)送表示無聲期間的開始的特征字(后同步碼POST)與背景噪聲信息的編碼參數(shù)。
在檢測到說話者的聲音的有聲期間，由于從聲音編碼裝置，發(fā)送聲音編碼列，故聲音解碼裝置的參數(shù)提取電路12從聲音編碼列提取編碼參數(shù)(步驟ST1)。
另外，有無聲判斷電路13平時對聲音編碼列進行監(jiān)視，檢測到有聲期間時，對分支開關(guān)14進行控制，進行將參數(shù)提取電路12的輸出方切換到聲音合成電路18的處理(步驟ST2，ST3)。
在這里，在從無聲期間轉(zhuǎn)換到有聲期間、開始有聲期間等的場合，由于聲音編碼裝置發(fā)送稱為“前同步碼PRE”特征字，故有無聲判定電路13可通過檢測該特征字，檢測有聲合成電路的開始。
由此，聲音合成電路18根據(jù)通過參數(shù)提取電路12所提取的編碼參數(shù)，將聲音合成，將其輸出給輸出端子19，由此重現(xiàn)說話者的聲音(步驟ST4)。
另一方面，在未檢測到說話者的聲音的無聲期間，停止聲音編碼裝置對聲音編碼的發(fā)送，由于發(fā)送表示無聲期間的開始的特征字(后同步碼POST)與背景噪聲信息的編碼參數(shù)，故聲音解碼裝置的參數(shù)提取電路12從聲音編碼列中，提取編碼參數(shù)(步驟ST1)。
此外，有無聲判斷電路13平時監(jiān)視聲音編碼列，檢測無聲期間時，對分支開關(guān)14進行控制，進行將參數(shù)提取電路12的輸出方切換到參數(shù)平滑電路15的處理(步驟ST2，ST5)。
在這里，在從有聲期間轉(zhuǎn)換到無聲期間、開始無聲期間等的場合，按照上述方式，由于聲音編碼裝置發(fā)送稱為“后同步碼POST”的特征字，故有無聲判斷電路13可通過檢測該特征字檢測無聲期間的開始(參照圖5)。
還有，當(dāng)有無聲判斷電路15檢測到無聲期間時，參數(shù)平滑處理電路15采用作為通過參數(shù)提取電路12提取的背景噪聲信息的編碼參數(shù)和用于上次背景噪聲的合成的編碼參數(shù)，進行編碼參數(shù)的平滑處理運算，推定無聲期間的編碼參數(shù)(步驟ST6)。
即，在于有聲區(qū)間的最后的接收信號周期提取的編碼參數(shù)與作為于無聲期間的接收信號周期提取的背景噪聲信息的編碼參數(shù)的差顯著的場合，由于再生的聲音信號急劇變化，故產(chǎn)生再生具有不適感的背景噪聲的不利情況。
于是，為了防止所再生的聲音信號的急劇變化，參數(shù)平滑處理電路15將作為在后同步碼POST后馬上提取的背景噪聲信息的編碼參數(shù)以及用于上次背景噪聲的合成的編碼參數(shù)代入下述運算式中，進行編碼參數(shù)的平滑處理運算。
xn＋1＝(1－α)·xn＋α·xref…(1)其中，xn＋1表示編碼參數(shù)的推定結(jié)果；xn表示用于上次背景噪聲的合成的編碼參數(shù)；xref表示作為背景噪聲信息的編碼參數(shù)；α表示編碼參數(shù)的平滑處理系數(shù)(0＜α≤1)由此，無聲期間的編碼參數(shù)緩慢地增加或減少，以便繪制二次曲線(參照圖5)。
如上所述，參數(shù)平滑處理電路15進行參數(shù)的平滑處理運算，如果推定無聲期間的編碼參數(shù)，則聲音合成電路18根據(jù)編碼參數(shù)的推定結(jié)果，將無聲期間的背景噪聲合成，將該背景噪聲輸出給輸出端子19(步驟ST7)。
再有，以編碼參數(shù)的初始值作為x0，采用有聲區(qū)間的最后的接收信號周期的編碼參數(shù)。另外，聲音合成電路18在無聲期間的最初的接收信號周期，根據(jù)有聲區(qū)間的最后的接收信號周期的編碼參數(shù)將聲音合成。由此，在有聲區(qū)間的最后的接收信號周期與無聲期間的最初的接收信號周期，再生相同的聲音。
從上面知道，按照第1實施例，由于采用作為通過參數(shù)提取電路12提取的背景噪聲信息的編碼參數(shù)xrcf以及用于上次背景噪聲的合成的編碼參數(shù)xn，進行編碼參數(shù)的平滑處理運算，推定無聲期間的編碼參數(shù)，故無聲期間的編碼參數(shù)增加或減少，以便繪制二次曲線，其結(jié)果是，具有可再生不適感很少的背景噪聲的效果。
第2實施例圖6為表示本發(fā)明的第2實施例的聲音解碼裝置的結(jié)構(gòu)圖。在該圖中，與圖3相同的標(biāo)號表示相同或相應(yīng)的部分，故省略對其的描述。
標(biāo)號21表示在通過參數(shù)提取電路12提取的編碼參數(shù)中、僅僅選擇聲聲譜包絡(luò)信息而將其輸出的信息選擇電路，標(biāo)號22表示在通過參數(shù)提取電路12提取的編碼參數(shù)中、選擇聲譜包絡(luò)信息以外的信息而輸出的信息選擇電路。
下面對工作進行描述。
上述第1實施例給出的是當(dāng)處于無聲期間時將全部編碼參數(shù)輸出給參數(shù)平滑處理電路15的實例，但是，也可將編碼參數(shù)中的僅僅聲譜包絡(luò)信息輸出給參數(shù)平滑處理電路15，將聲譜包絡(luò)信息以外的信息輸出給聲音合成電路18。
由此，由于可僅僅對聲譜包絡(luò)信息進行平滑處理運算，故在平滑處理運算中，在具有不需要的編碼參數(shù)的場合，具有可減小運算量的效果第3實施例上述第2實施例給出的是僅僅對聲譜包絡(luò)信息進行平滑處理運算的實例，但是也可僅僅對幀能信息進行平滑處理運算。
由此，可獲得與上述第2實施例相同的效果，并且即使在背景噪聲的幀能變化的情況下，仍獲得可消除背景噪聲的合成聲能間斷地變化的不利情況。
第4實施例圖7為表示本發(fā)明的第4實施例的聲音解碼裝置的結(jié)構(gòu)圖。在該圖中，與圖6相同的標(biāo)號表示相同的或相應(yīng)的部分，故省略對其的描述。
標(biāo)號23表示信息選擇電路，該電路在通過參數(shù)提取電路12提取的編碼參數(shù)中、僅僅選擇幀能信息并將其輸出，標(biāo)號24表示信息選擇電路，該電路在通過參數(shù)提取電路提取的編碼參數(shù)中、選擇聲譜包絡(luò)信息和幀能信息以外的信息并將其輸出，標(biāo)號25表示分支開關(guān)(檢測機構(gòu))，該開關(guān)根據(jù)有無聲判定電路13的判定信息、對信息選擇電路21、23的輸出方進行切換，標(biāo)號15a、15b表示與參數(shù)平滑處理電路15相同的參數(shù)平滑處理電路(推定機構(gòu))，參數(shù)平滑處理電路15a進行聲譜包絡(luò)信息的平滑處理運算，參數(shù)平滑處理電路15b進行幀能信息的平滑處理運算。標(biāo)號16a、16b表示緩存器，標(biāo)號17a、17b表示運算電路。
下面對工作進行描述。
上述實施例2、3給出的是對聲譜包絡(luò)信息或幀能信息的任何一個進行平滑處理運算的實例，但是也可對聲譜包絡(luò)信息和幀能信息這兩者進行平滑處理運算。
由此，由于對聲譜包絡(luò)信息和幀能信息這兩者進行平滑處理運算，故獲得相對上述第2、3實施例進一步減輕聽者所接收到的背景噪聲的不適感的效果。
另外，顯然參數(shù)平滑處理電路15a所采用的平滑處理系數(shù)α以及參數(shù)平滑處理電路15b所采用的平滑處理系數(shù)α對應(yīng)于所采用的信息的特性，可設(shè)定為不同的值。
第5實施例圖8為表示本發(fā)明的第5實施例的聲音解碼裝置的結(jié)構(gòu)圖。在該圖中，與圖3相同的標(biāo)號表示相同或相應(yīng)的部分，故省略對其的描述。
標(biāo)號31表示系數(shù)確定電路，該電路對應(yīng)于下述參數(shù)的變化確定編碼參數(shù)的平滑處理系數(shù)α，該參數(shù)指通過參數(shù)提取電路12、在有聲區(qū)間的最后的接收信號周期提取的編碼參數(shù)以及作為通過參數(shù)提取電路12在無聲期間的接收信號周期提取的背景噪聲信息的編碼參數(shù)。
下面對工作進行描述。
上述第1～4實施例給出的是將編碼參數(shù)的平滑處理系數(shù)α設(shè)定為任意的值(0＜α≤1)的實例，但是，也可對應(yīng)于下述參數(shù)的變化量確定編碼參數(shù)的平滑處理系數(shù)α，該下述參數(shù)指在有聲區(qū)間的最后的接收信號周期提取的編碼參數(shù)x0以及作為在無聲期間的接收信號周期提取的背景噪聲信息的編碼參數(shù)xrcf。
具體來說，在該變化量較大的場合(比如在變化率超過80％的場合)，使平滑處理系數(shù)α小于通常值(比如將平滑處理系數(shù)α設(shè)定為0.05)，在該變化量較小的場合(比如在變化率小于80％的場合)，將平滑處理系數(shù)α設(shè)定為與通常值相等的值(比如將平滑處理系數(shù)α設(shè)定為0.1)。
另外，在無聲期間連續(xù)的場合，對應(yīng)于上次提取的背景噪聲信息以及此次提取的背景噪聲信息的變化量，確定編碼參數(shù)的平滑處理系數(shù)α由此，由于對編碼參數(shù)的平滑處理系數(shù)α進行適合的處理，故還獲得可再生不適感很少的背景噪聲。
第6實施例上述第5實施例給出的是對應(yīng)于編碼參數(shù)的變化量確定編碼參數(shù)的平滑處理系數(shù)α的實例，但是，也可象上述第4實施例那樣，在對聲譜包絡(luò)信息和幀能信息這兩者進行平滑處理的場合，如圖9所示，對應(yīng)于下述信息的變化量確定聲譜包絡(luò)信息的平滑處理系數(shù)α(運算電路17a所采用的平滑處理系數(shù)α)，該下述信息指作為在有聲區(qū)間的最后的接收信號周期提取的聲譜包絡(luò)信息(編碼參數(shù))以及作為無聲期間的接收信號周期提取的背景噪聲信息的聲譜包絡(luò)信息(編碼參數(shù))，另外，可使幀能信息的平滑化處理系數(shù)α(運算電路17b所采用平滑處理系數(shù)α)與聲譜包絡(luò)信息的平滑處理系數(shù)α保持一致。
由此，由于可在不進行幀能信息的平滑處理系數(shù)α的確定處理的情況下，確定幀能信息的平滑處理系數(shù)α，故獲得下述效果，即不對平滑處理系數(shù)α的確定處理，造成較大的負擔(dān)，可再生不適感少的背景噪聲。
還有，也可進行確定幀能信息的平滑處理系數(shù)α的處理，然后，使聲譜包絡(luò)信息的平滑處理系數(shù)α與幀能信息的平滑處理系數(shù)α保持一致。
第7實施例上述第6實施例給出的是下述實例，其中對應(yīng)于聲譜包絡(luò)信息的變化量或幀能信息的變化量確定聲譜包絡(luò)信息的平滑處理系數(shù)α與幀能信息的平滑處理系數(shù)α，但是，也可如圖10所示，通過分別在參數(shù)平滑處理電路15a、15b中設(shè)置系數(shù)確定電路31a、31b(系數(shù)確定電路31a、31b按照與系數(shù)確定電路31相同的方式動作)，聲譜包絡(luò)信息的平滑處理系數(shù)α對應(yīng)于譜信息信息的變化量確定，幀能信息的平滑處理系數(shù)α對應(yīng)于幀能信息的變化量確定。
由此，由于可相對前述實施例對應(yīng)于信息的特性精細地確定平滑處理系數(shù)的α，故獲得可再生不適感更少的背景噪聲。
第8實施例上述第1～7實施例給出的是到背景噪聲信息的更新周期時，將平滑處理系數(shù)α固定而使用的實例，但是，也可按照以處理幀為單位連續(xù)地改變平滑處理系數(shù)α的方式使用。
第9實施例上述第1～8實施例給出的是采用式(1)的運算式進行平滑處理運算(AR平滑的平滑處理算法)，但是，也可不限于此場合，而進行其它的平滑處理算法。
由此，可考慮平滑處理對象的參數(shù)的動態(tài)范圍或統(tǒng)計的出現(xiàn)概率等，采用特別適合每個參數(shù)的平滑算法，可獲得下述效果，即與采用單一的平滑處理算法的場合相比較，再生更加穩(wěn)定的背景噪聲。
產(chǎn)業(yè)上的利用可能性按照上述方式，本發(fā)明的聲音解碼裝置和聲音解碼方法適合于在具有說話者的聲音的有聲區(qū)間再生說話者的聲音，在沒有說話者的聲音的無聲期間再生背景噪聲。
權(quán)利要求
1.一種聲音解碼裝置，該聲音解碼裝置包括提取機構(gòu)，該提取機構(gòu)從聲音編碼列中提取編碼參數(shù)；檢測機構(gòu)，該檢測機構(gòu)監(jiān)視該聲音編碼列，檢測無聲期間；推定機構(gòu)，該推定機構(gòu)在檢測機構(gòu)檢測到無聲期間時，采用作為通過上述提取機構(gòu)提取的背景噪聲信息的編碼參數(shù)與用于上次背景噪聲的合成的編碼參數(shù)，進行編碼參數(shù)的平滑處理運算，推定無聲期間的編碼參數(shù)；合成機構(gòu)，該合成機構(gòu)根據(jù)通過上述推定機構(gòu)推定的編碼參數(shù)，將無聲期間的背景噪聲合成。
2.根據(jù)權(quán)利要求1所述的聲音解碼裝置，其特征在于，上述推定機構(gòu)將作為背景噪聲信息的編碼參數(shù)以及用于上次背景噪聲的合成的編碼參數(shù)代入下述運算式中，推定無聲期間的編碼參數(shù)，該運算式為xn＋1＝(1－α)·xn＋α·xref其中，xn＋1表示編碼參數(shù)的推定結(jié)果；xn表示用于上次背景噪聲的合成的編碼參數(shù)；xref表示作為背景噪聲信息的編碼參數(shù)；α表示編碼參數(shù)的平滑處理系數(shù)(0＜α≤1)。
3.根據(jù)權(quán)利要求1所述的聲音解碼裝置，其特征在于，上述合成機構(gòu)在無聲期間的最初的接收信號周期，根據(jù)通過提取機構(gòu)在有聲區(qū)間的最后的接收信號周期提取的編碼參數(shù)，將聲音合成。
4.根據(jù)權(quán)利要求1所述的聲音解碼裝置，其特征在于，上述推定機構(gòu)對構(gòu)成編碼參數(shù)的一部分的聲譜包絡(luò)信息進行平滑處理運算。
5.根據(jù)權(quán)利要求1所述的聲音解碼裝置，其特征在于，上述推定機構(gòu)對構(gòu)成編碼參數(shù)的一部分的幀能信息進行平滑處理運算。
6.根據(jù)權(quán)利要求1所述的聲音解碼裝置，其特征在于，上述推定機構(gòu)對構(gòu)成編碼參數(shù)的一部分的聲譜包絡(luò)信息和幀能信息進行平滑處理運算。
7.根據(jù)權(quán)利要求1所述的聲音解碼裝置，其特征在于，上述推定機構(gòu)對應(yīng)于下述參數(shù)的變化量確定編碼參數(shù)的平滑處理系數(shù)，該參數(shù)指通過提取機構(gòu)在有聲區(qū)間的最后的接收信號周期提取的編碼參數(shù)以及作為通過上述提取機構(gòu)在無聲期間的接收信號周期提取的背景噪聲信息的編碼參數(shù)。
8.根據(jù)權(quán)利要求1所述的聲音解碼裝置，其特征在于，上述推定機構(gòu)在對聲譜包絡(luò)信息和幀能信息進行平滑處理運算的場合，對應(yīng)于下述信息的變化量確定編碼參數(shù)的平滑處理系數(shù)，該信息指在有聲區(qū)間的最后的接收信息周期提取的聲譜包絡(luò)信息與作為背景噪聲的聲譜包絡(luò)信息，或在有聲區(qū)間的最后的接收信號周期提取的幀能信息與作為背景噪聲信息的幀能信息。
9.根據(jù)權(quán)利要求1所述的聲音解碼裝置，其特征在于，上述推定機構(gòu)在對聲譜包絡(luò)信息和幀能信息進行平滑處理運算的場合，對應(yīng)于下述信息的變化量確定聲譜包絡(luò)信息的平滑處理系數(shù)，該信息指在有聲區(qū)間的最后的接收信息周期提取的聲譜包絡(luò)信息與作為背景噪聲的聲譜包絡(luò)信息，并且對應(yīng)于下述信息的變化量確定幀能信息的平滑處理系數(shù)，該下述信息指在有聲區(qū)間的最后的接收信號周期提取的幀能信息與作為背景噪聲信息的幀能信息。
10.一種聲音解碼方法，該方法包括下述步驟當(dāng)對聲音編碼列進行監(jiān)視、檢測到無聲期間時，采用作為從該聲音編碼列中提取的背景噪聲信息的編碼參數(shù)與用于上次背景噪聲的合成的編碼參數(shù)進行編碼參數(shù)的平滑處理運算，推定無聲期間的編碼參數(shù)，根據(jù)作為該推定結(jié)果的編碼參數(shù)將無聲期間的背景噪聲合成。
11.根據(jù)權(quán)利要求10所述的聲音解碼方法，其特征在于，將作為背景噪聲信息的編碼參數(shù)與用于上次背景噪聲的合成的編碼參數(shù)代入下述運算式中，推定無聲期間的編碼參數(shù)，該運算式為xn＋1＝(1－α)·xn＋α·xref其中，xn＋1表示編碼參數(shù)的推定結(jié)果；xn表示用于上次背景噪聲的合成的編碼參數(shù)；xref示作為背景噪聲信息的編碼參數(shù)；α表示編碼參數(shù)的平滑處理系數(shù)(0＜α≤1)。
12.根據(jù)權(quán)利要求10所述的聲音解碼方法，其特征在于，在無聲期間的最初的接收信號周期，根據(jù)在有聲區(qū)間提取的編碼參數(shù)將聲音合成。
13.根據(jù)權(quán)利要求10所述的聲音解碼方法，其特征在于，對應(yīng)下述參數(shù)的變化量確定編碼參數(shù)的平滑處理系數(shù)，該參數(shù)指在有聲區(qū)間的最后的接收信號周期提取的編碼參數(shù)以及作為在無聲期間的接收信號周期提取的背景噪聲信息的編碼參數(shù)。
全文摘要
采用通過參數(shù)提取電路(12)提取的背景噪聲信息的編碼參數(shù)(x
文檔編號G10L19/012GK1327574SQ98814348
公開日2001年12月19日申請日期1998年12月7日優(yōu)先權(quán)日1998年12月7日
發(fā)明者松岡文啟, 田崎裕久申請人:三菱電機株式會社

完整全部詳細技術(shù)資料下載