欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

語音編碼譯碼方法和裝置、電話裝置、音調(diào)變換方法和介質(zhì)的制作方法

文檔序號:2820367閱讀:395來源:國知局
專利名稱:語音編碼譯碼方法和裝置、電話裝置、音調(diào)變換方法和介質(zhì)的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及應用于對一語音信號進行高效編碼和譯碼的情況的一編碼方法和譯碼方法,應用該編碼方法和譯碼方法的一編碼裝置、一譯碼裝置和一電話裝置,以及在其上記錄有所處理的編碼和譯碼的數(shù)據(jù)的各種介質(zhì)。
已經(jīng)公知有各種編碼方法,在這些方法中一信號壓縮是通過利用在時域和頻域中一音頻信號(這里所謂的音頻信號包括一語音信號和一聲音信號)的統(tǒng)計學特性和人類所覺感覺的特性來進行的。該編碼方法概括的分為在時域上的編碼、在頻域上的編碼、分折一合成編碼等。
一語言信號的高效編碼的例子已知的有MBE(多頻帶激勵)編碼、SBE(單頻帶激勵)或正弦曲線合成編碼、諧波編碼、SBC(子頻帶編碼)、LPC(線性予測編碼)、DCT(散出余弦變換)、MDCT(改進型DCT)、FFT(快速傅里葉變換)等。
在利用上述各種編碼方法對一語音信號編碼的情況中或在該編碼語音信號被譯碼的情況中,有時希望改變一語音的音調(diào)而不改變該語音的音素。
在常規(guī)的一語音信號的高效編碼裝置和高效譯碼裝置中,沒有考慮音調(diào)的變化并且它必須連接一單獨的音調(diào)控制裝置和進行該音調(diào)的變換,其結(jié)果出現(xiàn)了結(jié)構(gòu)復雜的缺點。
鑒于這種情況,本發(fā)明的一個目的是當對一語音信號進行編碼處理和譯碼處理時,用簡單的處理和構(gòu)成就有可能精確地進行一所希望的音調(diào)控制而不改變其音素。
為了解決上述的問題,當在一予置的編碼單元中在一時間軸上分隔一語音信號、在每一編碼單元中得到一線性予測余項、在該線性予測余項中進行正弦曲線分折編碼和對語音編碼數(shù)據(jù)進行處理時,由該正弦曲線分析編碼所編碼的語音編碼數(shù)據(jù)的一音調(diào)分量可以由根據(jù)本發(fā)明的一予定計算處理改變。
根據(jù)本發(fā)明,在由該正弦波分析編碼所編碼的語音編碼數(shù)據(jù)的計算處理中,可以簡單地實施音調(diào)變換而不須變化該音素分量。


圖1是根據(jù)本發(fā)明的一個實施例的該語音編碼裝置的一個例子的基本構(gòu)成框圖;圖2是根據(jù)本發(fā)明的一個實施例的該語音譯碼裝置的基本構(gòu)成框圖;圖3是圖1的該語音信號編碼裝置的更具體構(gòu)成框圖;圖4是圖2的該語音信號譯碼裝置的更具體構(gòu)成框圖;圖5是應用于一無線電電話裝置的一傳送系統(tǒng)的一個例子的框圖;和圖6是應用于一無線電電話裝置的一接收系統(tǒng)的一個例子的框圖。
下面,參照附圖來說明本發(fā)明的一個實施例。
圖1是一語音編碼裝置的一個例子的基本構(gòu)成框圖,而圖3是它的詳細構(gòu)成框圖。
現(xiàn)在說明本發(fā)明的該實施例的語音處理的基本概念。在該語音信號的編碼例,由本發(fā)明人等提出并在公開號為No.6-51800的日本待審專利所披露的有關(guān)量綱變換或數(shù)據(jù)量變換的技術(shù)已被使用。在使用該技術(shù)量化該頻譜包絡(luò)的幅度時,使用一定數(shù)量保持常數(shù)即量綱常數(shù)的諧波來執(zhí)行矢量量化,因為該頻譜包絡(luò)的形狀不變化,所以在該語音分量中所包含的音素分量不會改變。
在該基本概念中,圖1的語音信號編碼裝置包括有一第一編碼單元110,用來得到諸如一LPC(線性予測編碼)余項之類的一短期予測余項,并且執(zhí)行例如一諧波編碼之類的正弦曲線分析編碼;和一第二編碼單元120,用來利用具有用于輸入語音信號的相位傳送的波形編碼來執(zhí)行編碼。該第一編碼單元110被用于對該輸入信號的V(語言表達)部分編碼,而第二編碼單元120用于該輸入信號的UV(未用語言表達)部分編碼。
在該第一編碼單元110中,使用了用來在該LPC余項中實施例如諸如諧波編碼或多頻帶激勵(MBE)編碼之類的正弦曲線分析編碼的一構(gòu)成。在該第二編碼單元120中,使用了例如代碼激勵線性予測(CELP)編碼的一構(gòu)成,CELP編碼借助于具有使用了一利用合成的分析方法的一最佳矢量的閉環(huán)搜索的矢量量化。
在圖1的例子中,被提供給一輸入端101的一語音信號被傳送到第一編碼單元110的LPC反相濾波器111和LPC分析和量化單元113。從該LPC分析和量化單元113中得到的一LPC系數(shù)或一所謂的α參數(shù)被傳送到LPC反相濾波器111。通過該LPC反相濾波器111,該輸入語音信號的線性予測余項(LPC余項)被輸出。如后面所述那樣從該LPC分析和量化單元113輸出一被量化的LSP(線性頻譜對)的輸出并傳送到一輸出端102。來自該LPC反相濾波器111的LPC余項被傳送到正弦曲線分析編碼部分114。
在該正弦曲線分析編碼單元114中,進行一音調(diào)檢測和一頻譜包絡(luò)幅度計算。另外,通過一V/UV判斷單元115進行V(語言表達)/UV(未用語言表達)判斷。來自正弦曲線分析編碼部分114的頻譜包絡(luò)幅度數(shù)據(jù)被傳送到一矢量量化單元116。作為該頻譜包絡(luò)的一矢量量化輸出,來自該矢量量化單元116的一代碼薄索引通過開關(guān)117被傳送到輸出端103。其為從該正弦曲線分析編碼單元114所提供的音調(diào)分量數(shù)據(jù)的一音調(diào)數(shù)據(jù)通過一音調(diào)變換單元119和一開關(guān)118被傳送到輸出端104。自V/UV判斷單元115輸出的V/UV判斷被傳送到輸出端105,并且作為其控制信號傳送到開關(guān)117和118。在上述語言表達(V)聲音時間,選擇上述的索引和音調(diào)并分別從輸出端103和104輸出。
與接收到一音調(diào)變換命令的基礎(chǔ)上,該音調(diào)變換單元119根據(jù)該命令通過計算處理而改變該音調(diào)數(shù)據(jù)并進行音調(diào)變換。其詳細過程將在下面說明。
在該矢量量化單元116中的矢量量化的時間,在該頻率軸上相應于有效頻帶的一數(shù)據(jù)塊(block)的幅度數(shù)據(jù)被進行如下的處理。關(guān)于從在該塊中的尾部數(shù)據(jù)到在該塊中的標題數(shù)據(jù)的插入數(shù)據(jù)的這種虛數(shù)據(jù)的一適當數(shù),或關(guān)于延伸該尾部數(shù)據(jù)和標題數(shù)據(jù)的這種虛數(shù)據(jù)的一適當數(shù)被加到該尾部和標題。該數(shù)據(jù)數(shù)被這樣擴展到NF。此后,獲取該頻帶限制型的Os倍(例如,8倍)的過取樣以得到與Os倍一樣多的幅度數(shù)據(jù)。Os倍的幅度數(shù)據(jù)((mMX+1)×Os幅度數(shù)據(jù))被線性插入并因而被擴展成更多數(shù)據(jù),即,NM(例如,2048)數(shù)據(jù)。該NM數(shù)據(jù)被變烯,因而被轉(zhuǎn)換為一固定數(shù)M(例如,44)數(shù)據(jù),并且隨后進行矢量量化。
在這個例子中,第二編碼單元120具有-CELP(代碼激勵線性予測)編碼結(jié)構(gòu)。來自一噪聲代碼薄121的一輸出在一加權(quán)合成濾波器122中進行合成處理。所得結(jié)果的被加權(quán)和合成的語音被送到一減法器123。所得結(jié)果的被加權(quán)和合成的語音和通過一聽覺加權(quán)濾波器125所得到的由輸入端101所提供的該語音信號的語音之間的一誤差被輸出。這個誤差被傳送到一距離計算電路124并在其內(nèi)進行一距離計算。在該噪聲代碼薄121中對這樣一誤差為極小值的矢量進行搜索。該時間軸波形的矢量量化是利用“邊合成邊分析”的方法和閉環(huán)搜索來進行的。這個CELP編碼被用于編碼如上所述的未用語言表達部分。當從該V/UV判斷單元115提供的該V/UV判斷結(jié)果是未用語言表達(UV)聲音時則通過一被接通的開關(guān)127,從該噪聲代碼薄121作為UV數(shù)據(jù)而被提供的一代碼薄索引從輸出端107被輸出。
參見圖2,將說明用來對由圖1的語音信號編碼裝置所編碼的語音編碼數(shù)據(jù)進行譯碼的一語音信號譯碼裝置的基本構(gòu)成。
在圖2中,自輸出端102所提供的作為圖1所述的該LSP(線性頻譜對)的量化輸出的代碼薄索引被輸入到輸入端202。從圖1的輸出端103、104和105的輸出,即,作為包絡(luò)量化輸出所得到的該索引、音調(diào)、和V/UV判斷輸出被分別輸入到輸入端203,204和205。作為用于該UV(未用語言表示)聲音的數(shù)據(jù)的自圖1的輸出端所提供的索引被輸入到一輸入端207。
作為LPC余項的頻譜包絡(luò)量化輸出而提供給輸入端203的該索引被傳送到一逆矢量量化器212,在其內(nèi)進行逆矢量量化,并隨后傳送給一數(shù)據(jù)轉(zhuǎn)換單元270。來自輸入端204的音調(diào)數(shù)據(jù)通過一音調(diào)轉(zhuǎn)換單元215被提供給數(shù)據(jù)轉(zhuǎn)換單元270。來自數(shù)據(jù)轉(zhuǎn)換單元270的與相應于該LPC余項的頻譜包絡(luò)的予置音調(diào)以及與所改變的音調(diào)數(shù)據(jù)一樣多的幅度數(shù)據(jù)被傳送到一語言表達聲音合成單元211。當接收一音調(diào)轉(zhuǎn)換命令時,根據(jù)該命令通過計算處理該音調(diào)轉(zhuǎn)換單元215變化該音調(diào)數(shù)據(jù)并進行音調(diào)轉(zhuǎn)換。其詳細過程將在后面說明。
通過使用該正弦曲線合成該語言表示合成單元合成該語言表示部分的LPC(線性予測編碼)余項。從輸入端205輸出的V/UV判斷還被加到該語言表示合成單元211。由該語言表示合成單元211提供的該語言表示聲音的LPC余項被傳送到一LPC合成濾波器214。來自輸入端207的該UV數(shù)據(jù)的索引被傳送到一未用語言表示合成單元220,在其內(nèi)通過參考該噪聲代碼薄而輸出未用語言表示的LPC余項。這個LPC余項還被傳送到該LPC合成濾波器214。在該LPC合成濾波器214中,語言表示部分的LPC余項和未用語言表示部分的LPC余項被獨自地分別進行LPC合成處理。另外,該語言表示部分的LPC余項和未用語言表示部分的LPC余項之和可進行PLC合成處理。這里,來自輸入端202的LSP索引被傳送到LPC參數(shù)再生單元213,從其中輸出該LPC的α參數(shù)并傳送到LPC合成濾波器214。在該LPC合成濾波器214中通過LPC合成所得到的一語音信號從輸出端201被輸出。
現(xiàn)在參照圖3來說明圖1中所示的該語音信號編碼裝置的更詳細構(gòu)成。在圖3中,相應于圖1的部件的部件由相同的標號表示。
在圖3所示的該語音信號編碼裝置中,輸入端101所提供的一語音信號在一高通濾波器(HPF)109中進行濾波處理以除去不必要頻段的信號。之后,該語音信號被傳送到LPC(線性予測編碼)分析和量化單元113的一LPC分析電路132和LPC反相濾波器電路111。
該LPC分析和量化單元113的LPC分析電路132應用一通過所取得的輸入信號波形的256個取樣的長度作為一數(shù)據(jù)塊的虛(Hamming)窗口,并且通過自動一對射變換方法得到一線性予測系數(shù),即所謂的α參數(shù)。成為數(shù)據(jù)輸出的該單元的成幀間隔時間約為160個取樣。例如,當一取樣頻率fs為8KHz時,一幀間隔時間是160個取樣,即20msec。
來自LPC分析電路132的該α參數(shù)被傳送到-α→LSP轉(zhuǎn)換電路133,并被轉(zhuǎn)換成一線性頻譜對(LSP)參數(shù)。作為一直接型濾波器的α參數(shù)被轉(zhuǎn)換為例如10,即5對LSP參數(shù)。該轉(zhuǎn)換是通過使用Newton-Raphson方法或類似方法來實施的。實施轉(zhuǎn)換到LSP參數(shù)是由于在插入特性中該LSP參數(shù)更優(yōu)于α參數(shù)。
來自α→LSP轉(zhuǎn)換電路133的該LSP參數(shù)在一LSP量化器134中進行矩陣量化或矢量量化。這時,在得出兩幀之間的差之后可實施該矢量量化,或多個幀可集中地進行矩陣量化。這里,20msec可規(guī)定為一幀。每一20msec所計算的LSP參數(shù)被用于二個幀的控制并進行矩陣量化和矢量量化。
來自LSP量化器的一量化輸出,即LSP量化的索引,通過102端被輸出。并且被量化的LSP矢量被傳送到一LSP插入電路136。
該LSP插入電路136每20msec或40msec插入該被量化的LSP矢量,并將速率增加至8倍。換句話說,每2.5msec該LSP矢量被更新?,F(xiàn)在說明其原因。當利用諧波編碼/譯碼方法分析和合成該余項波形時,該合成波形的包絡(luò)變成一非常緩慢傾斜和平滑的波形。因此,如果每20msec該LPS系數(shù)突然變化,則有時出現(xiàn)allophone。通過每2.5msec使該LPS系數(shù)逐漸地變化,則可防止出現(xiàn)這種allophone。
為了利用在2.5msec時這樣被插入和被提供的LSP矢量來執(zhí)行該輸入語音的反相濾除,一LSP→α轉(zhuǎn)換電路137將LPS參數(shù)轉(zhuǎn)換為一α參數(shù),這個α參數(shù)是例如接近第10階直接型濾波器的一系數(shù)。LSP→α轉(zhuǎn)換電路137的輸出被傳送到LPC反相濾波器電路111。在該LPS逆濾波電路111中,通過使用每2.5msec所更新的α參數(shù)實施逆濾除處理并得到一平滑輸出。該LPS反相濾波器111的輸出被傳送到正弦曲線分析編碼單元114,或具體的諧波編碼電路的正交變換電路145,諸如-DFT(離散傅里葉變換)電路。
來自LPC分析和量化單元113的LPC分析電路132的α參數(shù)被傳送到聽覺感覺加權(quán)濾波器計算電路139以得到用于聽覺感覺加權(quán)的數(shù)據(jù)。該加權(quán)數(shù)據(jù)被傳送到后面所述的聽覺感覺加權(quán)矢量量化器116、和第二編碼單元120的聽覺感覺加權(quán)濾波器125和聽覺感覺加權(quán)合成濾波器122。
在諸如諧波編碼電路等之類的正弦曲線分析編碼單元114中,利用諧波編碼的方法來分析該LPC反相濾波器111的輸出。換句話說,實施音調(diào)檢測、每個諧波的幅度Am的計算、和用語言表達(V)/未用語言表達的判斷,通過量綱變化隨該音調(diào)或幅度Am而變化的諧波的包絡(luò)數(shù)變成一固定數(shù)。
在圖3中所示的該正弦曲線分析編碼單元114的具體例子中,假定是普通的諧波編碼。但是,特別是在-MBE(多頻帶激勵)編碼的情況中,是假定在相同時間(在相同塊或幀內(nèi))在每一頻域中,即每一頻帶,存在有一用語言表示部分和一未用語言表示部分的條件下進行建立的模型。在另外的諧波編碼操作中,進行在一數(shù)據(jù)塊或一幀中的語音是用語言表示的還是未用語言表示的判斷。在應用于該MBE編碼的情況中,在隨后的說明中關(guān)于在每一幀中的V/UV,“對于一幀的UV”意指所有頻段均為UV。
圖3中的該正弦曲線分析編碼單元114的一開環(huán)音調(diào)搜索單元141被提供有來自輸入端101的輸入語音信號。一過零計數(shù)器142被提供有來自HPF(高通濾波器)109的信號。正弦曲線分析編碼單元114的該正交變換電路145被提供有來自LPC反相濾波器111的LPC余項或線性予測余項。在該開環(huán)音調(diào)搜索單元141中,求出該輸入信號的LPC余項,并進行通過使用一開環(huán)的比較粗略的搜索。所析取的近似的音調(diào)數(shù)據(jù)被傳送到一高精度音調(diào)搜索單元146,并且在其中利用一后面將要說明的一閉環(huán)進行一高精度音調(diào)搜索(一精細的音調(diào)搜索)。除了該近似的音調(diào)數(shù)據(jù)之外,從該開環(huán)音調(diào)搜索單元141中還輸出通過對乘以該冪LPC余項的自動校正的最大值進行標準化而得到的被標準化的自動校正最大值r(p),并傳送到該V/OV(用語言表示/未用語言表示)判斷單元115。
在該正交變換電路145中,進行諸如DFT(離散傅里葉變換)之類的正交變換處理。在時間軸上的LPC余項被轉(zhuǎn)換成在頻率軸上的頻譜幅度數(shù)據(jù)。該正交變換電路145的輸出被傳送到高精度音調(diào)搜索單元146和用來評價該頻譜幅度和包絡(luò)的一頻譜評價單元146。
該高精度(精細的)音調(diào)搜索單元146被提供有通過開環(huán)音調(diào)搜索單元141所析取的比較粗糙的不精確的音調(diào)數(shù)據(jù),并且例如對在正交變換單元145中在頻率軸上的數(shù)據(jù)進行DFT處理。在該高精度音調(diào)搜索單元146中,環(huán)繞具有0.2至0.5階段值的不精確音調(diào)數(shù)據(jù)值給出了正頁幾個取樣的擺動,并且實施將不精確音調(diào)數(shù)據(jù)值變成具有一最佳十進制點(浮點)的精細音調(diào)數(shù)據(jù)的值。這時,所謂的由合成方法所作的分析被用作為精細搜索的技術(shù),并且選擇該音調(diào)以便使被合成的冪頻譜最接近于原始聲音的冪頻譜。利用這樣一個閉環(huán)從高精度音調(diào)搜索單元146得到該音調(diào)數(shù)據(jù),該音調(diào)數(shù)據(jù)通過音調(diào)轉(zhuǎn)換單元119和開關(guān)118被傳送到輸出端104。在需要該音調(diào)轉(zhuǎn)換的情況中,通過在后面將要說明的在該音調(diào)轉(zhuǎn)換單元119中的處理而實施該音調(diào)轉(zhuǎn)換。
在該頻譜評價單元148中,根據(jù)該頻譜幅度和作為LPC余項的正交變換輸出而得到的音調(diào)來評價是它們的集合的每一諧波的幅度和一頻譜包絡(luò),并傳送到高精度音調(diào)搜索單元146、該V/UV(用語言表示/未用語言表示)判斷單元115、和聽覺感覺加權(quán)矢量量化器116。
根據(jù)該正交變換電路146的輸出、來自該高精度音調(diào)單元146的最佳音調(diào)、來自該頻譜評價單元148的頻譜幅度數(shù)據(jù)、來自該開環(huán)音調(diào)搜索單元141的被標準化的自動校正最大值r(p)、和來自該過零計數(shù)器142的過零計數(shù),該V/UV(用語言表示/未用語言表示)判斷單元115在該幀上實施V/UV判斷。另外,在該MBE的情況中,對于每一頻帶該V/UV判斷結(jié)果的邊界位置還可用作為該V/UV判斷的一個條件。來自V/UV判斷單元115的判斷輸出通過輸出端105而被輸出。
在該頻譜評價單元148的一輸出部分或該矢量量化器116的一輸入部分中,提供有多個數(shù)據(jù)轉(zhuǎn)換單元(用來實施一種類型取樣速率轉(zhuǎn)換)??紤]到在該頻率軸上分割的頻帶數(shù)和與依據(jù)該音調(diào)不同的數(shù)這樣一個事實,所提供的數(shù)據(jù)轉(zhuǎn)換單元的數(shù)決定了該包絡(luò)固定的幅度數(shù)據(jù)1Am1的數(shù)。例如,如果假定有效頻帶延伸到3400HZ,則依據(jù)該音調(diào)將這個有效頻帶分隔8到63個頻帶。在這些頻帶的每一頻帶上所得到的幅度數(shù)據(jù)1Am1的數(shù)mMX+1還可在8到63的范圍內(nèi)變化。因此,在數(shù)據(jù)轉(zhuǎn)換單元119的數(shù)中,該幅度數(shù)據(jù)的一可變數(shù)mMX+1被轉(zhuǎn)換成一固定的數(shù)據(jù)數(shù)M,例如數(shù)據(jù)44。
被安置在該頻譜評價單元148的輸出部分或該矢量量化器116的輸入部分的一幅度數(shù)據(jù)的固定數(shù)(例如44)或自數(shù)據(jù)轉(zhuǎn)換單元的數(shù)所提供的包絡(luò)數(shù)據(jù)被共同放置在被轉(zhuǎn)換成一矢量的每一予置的數(shù)據(jù)數(shù),例如數(shù)據(jù)44,并在該矢量量化器116中進行加權(quán)的矢量量化。該加權(quán)是由該聽覺感覺加權(quán)濾波器計算電路139的輸出所給出的。來自矢量量化器116的包絡(luò)索引經(jīng)過開關(guān)117從輸出端103輸出。在該加權(quán)矢量量化之前,使用一合適的漏泄系數(shù)可以相據(jù)由一予置的數(shù)據(jù)數(shù)所構(gòu)成的矢量來求得一幀間差值。
現(xiàn)在說明第二編碼單元120。該第二編碼單元120具有一所謂的CELP(代碼激勵線性予測)編碼構(gòu)成,并且它特別用于編碼該輸入語音信號的未用語言表示部分。在這種用于未用語言表示部分的CELP編碼構(gòu)成中,相應于該未用語言表示聲音的LPC余項的一噪聲輸出是來自該噪聲代碼薄的一典型輸出,即,所謂的隨機代碼薄通過一增益電路126被傳送到該聽覺感覺加權(quán)合成濾波器122。在該加權(quán)合成濾波器122中,所輸入的噪聲進行LPC合成處理。所得結(jié)果的加權(quán)未用語言表示信號被傳送到減法器123。該減法器123被提供有對由在聽覺感覺加權(quán)濾波器125中通過HPF(高通濾波器)109自輸入端101所提供的該語音信號所進行聽覺感覺加權(quán)而得到一信號。將這個信號與自合成濾波器122所提供的信號之間的差或誤差輸出。這個誤差被傳送到距離計算電路124進行一距離計算。這樣一個典型值的矢量作為由該噪聲代碼薄121所搜索的誤差的最小值。利用通過合成方法和閉環(huán)搜索的分析實施時間軸波形的矢量量化。
作為來自使用該CELP編碼構(gòu)成的第二編碼單元120的用于該UV(未用語言表示)的數(shù)據(jù),一來自該噪聲代碼薄121的代碼薄的形狀索引和來自該增益電路126的代碼薄的增益索引被輸出。來自該噪聲代碼薄121的該UV數(shù)據(jù)的形狀索引通過一開關(guān)127s被傳送到一輸出端107s。該增益電路126的該UV數(shù)據(jù)的增益索引通過開關(guān)127g被傳送到一輸出端107g。
開關(guān)127s和127g,以及開關(guān)117和118被控制,以便通過來自V/UV判斷單元115的V/UV判斷結(jié)果而進行接通/斷開。當一當前被傳送的幀的語音信號的V/UV判斷結(jié)果是用語言表示(V)時,該開關(guān)117和118被接通。當一當前被傳送的幀的語音信號是未用語言表示(UV)時,該開關(guān)127s和127g接通。
參見圖4,來說明圖2中所示的該語音信號譯碼裝置的一更詳細的構(gòu)成。在圖4中,相應于圖2的部件的部件用相同標號來表示。
在圖4中,輸入端202提供有該LSP的矢量量化輸出,即,相應于自圖1和3的輸出端102輸出的所謂代碼薄的索引。
該LSP的索引被傳送到LSP參量再生單元213的一LSP逆矢量量化器231,在那里對LSP(線性頻譜對)數(shù)據(jù)進行逆矢量量化,然后傳送到LSP插入電路232和233,在那里進行LSP插入處理,并隨后傳送到LSP→α轉(zhuǎn)換電路234和235。LSP插入電路233和LSP→α轉(zhuǎn)換電路235是對于未用語言表示(UV)聲音而提供的。在該LPC合成濾波器214中,用于用語言表示部分的LPC合成濾波器236和用于未用語言表示部分的LPC合成濾波器237是分開的。換句話說,在用語言表示部分和未用語言表示部分中LPC系數(shù)插入是獨立進行的。在從用語言表示聲音到未用語言表示聲音的一過渡部分和從未用語言表示聲音到用語言表示聲音的一過渡部分中,用于具有完全不同特性的相互插入LSPs而引起的不良影響可因此而被避免。
圖4的輸入端203提供進行了加權(quán)矢量量化的頻譜包絡(luò)(Am)的代碼索引數(shù)據(jù),這個輸入相應于從圖1和3所示的譯碼器側(cè)的端口103的輸出。該輸入端204提供有來自圖1和3的端口104的音調(diào)數(shù)據(jù)。輸入端205提供有來自圖1和3的端口105的V/UV判斷數(shù)據(jù)。
來自該輸入端203的頻譜包絡(luò)Am的矢量量化索引數(shù)據(jù)被傳送到逆矢量量化器212并在其內(nèi)進行逆矢量量化。如上所述,被施以逆矢量量化的該包絡(luò)的幅度數(shù)據(jù)的數(shù)被置為等于一固定數(shù),例如,44。在數(shù)據(jù)的一數(shù)中實施轉(zhuǎn)換以根據(jù)該音調(diào)數(shù)據(jù)得到一諧波數(shù)。從該逆量化器212傳送到數(shù)據(jù)轉(zhuǎn)換單元270的數(shù)據(jù)數(shù)可以保留該固定數(shù)或可以在該數(shù)據(jù)數(shù)中被轉(zhuǎn)換。
通過音調(diào)轉(zhuǎn)換單元215從輸入端204向數(shù)據(jù)轉(zhuǎn)換單元270提供該音調(diào)數(shù)據(jù),并輸出一被編碼的音調(diào)。在該音調(diào)轉(zhuǎn)換是必須的情況下,利用在后面將要說明的在該音調(diào)轉(zhuǎn)換單元215中的處理來實施該音調(diào)轉(zhuǎn)換。如同相應于來自數(shù)據(jù)轉(zhuǎn)換單元270的該LPC余項的頻譜包絡(luò)的予置音調(diào)的許多幅度數(shù)據(jù)一樣,被更改的音調(diào)數(shù)據(jù)被傳送到該用語言表示合成單元211的正弦曲線合成電路215。
為了在該數(shù)據(jù)轉(zhuǎn)換單元270中轉(zhuǎn)換該LPC余項的頻譜包絡(luò)的幅度數(shù)據(jù)的數(shù),各種插入方法都是可能的。在這些方法的一個例子中,相應于在該頻率軸上的有效頻帶的一數(shù)據(jù)塊的幅度數(shù)據(jù)進行如下的處理。關(guān)于從在該數(shù)據(jù)塊中的尾部數(shù)據(jù)到在該數(shù)據(jù)塊中的標頭數(shù)據(jù)被加有這樣的虛數(shù)據(jù)以使該數(shù)據(jù)數(shù)擴展到NF。或者位于該數(shù)據(jù)塊的左端和右端(標頭和尾部)的數(shù)據(jù)作為虛數(shù)據(jù)而被延伸。之后,實現(xiàn)該頻帶限制型的Os倍(例如,8倍)的過取樣,以得到與Os倍一樣多的幅度數(shù)據(jù)。對Os倍數(shù)的幅度數(shù)據(jù)((mMX+1)×Os)幅度數(shù)據(jù))進行線性插入并且因而被擴展為更多的數(shù)據(jù),即,NM(例如,2048)數(shù)據(jù)。該NM數(shù)據(jù)被變薄并因而被轉(zhuǎn)換為與相應于予置音調(diào)一樣多的M數(shù)據(jù)。
在該數(shù)據(jù)轉(zhuǎn)換單元270中,僅僅諧波所在位置被變更而不改變該頻譜包絡(luò)的形狀。因此,該音素保持不變。
作為在該數(shù)據(jù)轉(zhuǎn)換單元270中的一個操作例子,現(xiàn)在說明在音調(diào)滯后的時間L被轉(zhuǎn)換為Fx時一頻率Fo=fs/L的情況。該fs是取樣頻率。例如,現(xiàn)在假設(shè)fs=8KHZ=8000HZ。
這時,該音調(diào)頻率Fo=8000/L。直至4000HZ,n=L/2個諧波被保持。在典型語音頻帶的該3400HZ,保持有約(L/2)×(3400/4000)個諧波。通過上述在數(shù)據(jù)數(shù)中的轉(zhuǎn)換或量綱轉(zhuǎn)換而被轉(zhuǎn)換為例如為44之類的一固定數(shù),并隨后進行矢量量化。
如果在該頻譜的矢量量化之前得到當時的編碼幀間差,則在逆矢量量化之后對該幀間差譯碼并在數(shù)據(jù)數(shù)中實施轉(zhuǎn)換以得到頻譜包絡(luò)數(shù)據(jù)。
除了LPC余項的頻譜包絡(luò)幅度數(shù)據(jù)和來自該數(shù)據(jù)轉(zhuǎn)換單元270的音調(diào)數(shù)據(jù)之外,上述來自輸入端205的V/UV判斷數(shù)據(jù)也被提供給正弦波形合成電路215。IPC余項數(shù)據(jù)從正弦曲線合成電路215輸出并傳送到一加法器218。
來自逆矢量量化器212的包絡(luò)數(shù)據(jù)、來自輸入端204的音調(diào)、和來自輸入端205的V/UV判斷數(shù)據(jù)被傳送到用來計算用語言表示(V)部分的噪聲總和的一噪聲合成電路216。來自這個噪聲合成電路216的一輸出通過一加權(quán)累加電路217被傳送到加法器218。如果輸入到該語音LPC合成濾波器的激勵是由該正弦曲線合成而產(chǎn)生的,則會呈現(xiàn)諸如男性談話等之類充滿低音調(diào)的鼻音的感,并且在一V(用語言表示)聲音和-UV(未用語言表示)聲音之間聲音的質(zhì)量突然改變而導致一種不自然的感覺。因此,對于用語言表示部分的LPC合成濾波器的輸入或激勵,根據(jù)語音編碼數(shù)據(jù),諸如音調(diào)、頻譜包絡(luò)幅度、在該幀中的最大幅度、和余項信號的電平等之類的有關(guān)參數(shù)被加到LPC余項信號的用語言表示部分。
從加法器218輸出的一點和被傳送到用于LPC合成濾波器214的用語言表示聲音的合成濾波器236并進行LPC合成處理。所得結(jié)果的暫時的波形數(shù)據(jù)在一后置濾波器238V中對用語言表示聲進行濾波處理,并隨后傳送到一加法器239中。
圖4的輸入端207s和207g分別提供有來自圖3的輸出端107s和107g的作為UV數(shù)據(jù)的形狀索引和增益索引。該形狀索引和增益索引被傳送到未用語言表示合成單元220。來自端口207s的形狀索引被傳送到未用語言表示合成單元220的一噪聲代碼薄221。來自端口207g的增益索引被傳送到增益電路222。從該噪聲代碼221讀出的一典型值是相應于未用語言表示聲音的予置增益的一噪聲信號分量。在增益電路222中變成一予置增益的一幅度被傳送到一窗口電路223中,并進行用來平滑所連接的用語言表示聲音的窗口處理。
作為來自該未用語言表示合成單元220的輸出,該窗口電路223的一輸出被傳送到LPC合成濾波器214的UV(未用語言表示)合成濾波器237,并且在該合成濾波器237中對該輸入進行LPC合成處理,結(jié)果得到未用語言表示部分的暫時波形數(shù)據(jù)。在一未用語言表示后置濾波器238u中對未用語言表示部分的暫時波形數(shù)據(jù)進行濾波處理并隨后傳送到加法器239中。
在加法器239中,來自該用語言表示后置濾波器238v的用語言表示部分的暫時波形信號和來自未用語言表示后置濾波器238u的未用語言表示部分的暫時波形信號被共同相加。其和從輸出端201輸出。
在包含在參照圖1和3所述的語音編碼裝置中的該音調(diào)轉(zhuǎn)換單元119中實施音調(diào)轉(zhuǎn)換處理和在包含在參照圖2和現(xiàn)在將要說明的圖4所述的語音譯碼裝置中的該音調(diào)轉(zhuǎn)換單元240中實施音調(diào)轉(zhuǎn)換處理。本例的構(gòu)成使得可在編碼的時間和譯碼的時間上均可實施語音的音調(diào)轉(zhuǎn)換。在希望在編碼的時間上進行音調(diào)轉(zhuǎn)換的情況下,相應的處理是在包含在語音編碼裝置中的音調(diào)轉(zhuǎn)換單元119中實施的。在希望在譯碼的時間上進行音調(diào)轉(zhuǎn)換的情況下,相應的處理是在包含在語音譯碼裝置的該音調(diào)轉(zhuǎn)換單元240中實施的。因此,如果或者語音編碼裝置或者語音譯碼裝置具有該音調(diào)轉(zhuǎn)換單元,則基本上可實施在本例中所述的音調(diào)轉(zhuǎn)換處理。在編碼的時間在該語音編碼裝置中進行了音調(diào)轉(zhuǎn)換的語音信號可以在在譯碼的時間在該語音譯碼裝置中進一步進行音調(diào)轉(zhuǎn)換。
之后,將說明在該音調(diào)轉(zhuǎn)換中所進行處理的詳細過程。在包含在該語音編碼裝置中的音調(diào)轉(zhuǎn)換單元119中所實施的音調(diào)轉(zhuǎn)換處理和包含在該語音譯碼裝置中的音調(diào)轉(zhuǎn)換單元215中所實施的音調(diào)轉(zhuǎn)換處理是基本相同的。在每一個轉(zhuǎn)換單元119和240中,所提供的音調(diào)數(shù)據(jù)被進行轉(zhuǎn)換處理。在本例中被提供給每一個音調(diào)轉(zhuǎn)換單元119的音調(diào)數(shù)據(jù)是一如圖1至4所述的音調(diào)滯(周期)。通過計算處理該音調(diào)滯后被轉(zhuǎn)換為差值數(shù)據(jù)并實施音調(diào)轉(zhuǎn)換。
至于該音調(diào)轉(zhuǎn)換的具理處理過程,選擇可被實現(xiàn)的9種處理狀態(tài),即后面所述的第一種處理至第9種處理。根據(jù)在該編碼裝置或該譯碼裝置中所包含的在一控制器等中所實施的控制,設(shè)置這些處理狀態(tài)中的一個狀態(tài)。在下面表示它的周期的說明中以數(shù)字公式表示該音調(diào)。在該轉(zhuǎn)換單元中的實際計算處理中,與諧波一樣多的數(shù)據(jù)一起實施相應的處理。第一種處理這種處理是通過一固定時間用來提高該輸入音調(diào)的處理。將輸入音調(diào)pch_in乘以一固定數(shù)K1來得到一輸出音調(diào)pch_ouf。其計算可由下式(1)來表示。
pch_out==K1pch_in (1)通過設(shè)置固定數(shù)K1的值以滿足關(guān)系O<K1<1,可使該頻率變高并可變?yōu)楦咭粽{(diào)的語音。通過設(shè)置固定數(shù)K1的值以滿足關(guān)系K1>1,可使該頻率變低并可變?yōu)榈鸵粽{(diào)的語音。第二種處理這種處理是用來給出與輸入音調(diào)無關(guān)的固定的輸出音調(diào)。一適當?shù)挠柚霉潭〝?shù)總是被置為等于輸出音調(diào)pch_out。其計算由下式(2)表示。
pch_out=P2(2)通過這樣給出的音調(diào)固定數(shù),使轉(zhuǎn)換為單調(diào)的仿真語言變?yōu)榭赡?。第三種處理這種處理是用來使得輸出音調(diào)pch_out等于一適當?shù)挠柚霉潭〝?shù)P3和一具有適當?shù)姆華3和頻率F3的一正弦波之和的處理。其計算由下式(3)來表示。
pch_out=P3+A3Sin(2πF3+t(n))(3)在該表示式3中,n是幀數(shù),和t(n)是在該幀中的一離散時間并由下式(4)設(shè)置。
t(n)=t(n-1)+Δt(4)通過這樣將一正弦波加到一固定的恒定音調(diào),則可將顫音加到仿真語音。第四種處理這種處理是用來使得輸出音調(diào)pch_put等于該輸入音調(diào)Pch_in和一均勻的隨機數(shù)[-A4,A4]之和的處理。其中算由下式(5)來表示。
Pc_out=Pch_in+V(n) (5)這里,r(n)是在每一n幀時所設(shè)置的一隨機數(shù)。對于每個處理幀,產(chǎn)生一均勻隨機數(shù)[-A4,A4],并且實施相加處理。通過這樣的處理,轉(zhuǎn)換為一諸如一卡塔地響的語音之類的語音變成可能。第五種處理這種處理是用來使得輸出音調(diào)Pch_out等于該輸入音調(diào)Pch_in和一具有適當?shù)姆華5和頻率F5的一正弦波之和的處理。其計算由下式(6)表示。
Pch_out=Pch_in+A5Sin(2πF5t(n)) (6)在表示式6中,n是幀數(shù),和t(n)在該幀中的離散時間并由上述表示式(4)所設(shè)置。通過實施這樣的處理,可將卡塔地響的聲音加到輸入語音中。在這種情況中通過所提供的具有一小的值(即,將該周期變長)的頻率F5,實施對帶有上升和下降的語音的轉(zhuǎn)換。第六種處理這種處理是用來使得輸出音調(diào)pch_out等于一適當?shù)墓潭ǖ腜6減去輸入音調(diào)Pch_in的處理。其計算由下式(7)表示。
Pch_out=P6-Pch_in (7)通過實施這樣的處理,該音調(diào)變化變?yōu)榕c輸入語音的變化相反。實施例如對具有與普通情況的字尾相反的字尾的語音的轉(zhuǎn)換。第七種處理這種處理是用來使得輸出音調(diào)Pch-out等于通過平滑(平均)具有一適當時間常數(shù)τ7(這里這個時間常數(shù)τ7是在0<τ<1的范圍)的輸入音調(diào)Pch_in所得到的-avg_och。其計算由下式(8)表示。
avg_pch=(1-τ7)avg_pch+τ7pch_inPch_out=avg_pch (8)例如通過將τ7設(shè)置為0.05,20個過去的幀的平均值變?yōu)榈扔赼vg_pch并且它的值變?yōu)檩敵鲆粽{(diào)。通過這種處理,實施對即不上升也不下降和具有一松馳的感覺的語音的轉(zhuǎn)換。第八種處理在這種處理中,從輸入音調(diào)Pch_in中減去通過平滑(平均)具有一適當?shù)臅r間常數(shù)τ8(這個時間常數(shù)是在0<τ7<1的范圍內(nèi))的輸入音調(diào)pch_in所得到的-avg_pch。所得的差乘以一適當?shù)囊驍?shù)K8(這里K8是一常數(shù))。所得到的乘積作為一重點分量加到輸入音調(diào)Pch_in以得到輸出音調(diào)Pch_out。其計算由下式(9)表示。
avg_pch=(1-τ8)avg_pch+τ8 pch_inPch_out=Pch_in+1<8(Pch_in-avg_pch)(9)通過這種處理,實施對這種將該重點分量加到輸入語音的狀態(tài)的音調(diào)轉(zhuǎn)換。為了實現(xiàn)這種實施而轉(zhuǎn)換到被調(diào)制的語音。
第九種處理這是用來將輸入音調(diào)Pch_in轉(zhuǎn)換為在一音調(diào)表中所包含的最接近的固定的音調(diào)數(shù)據(jù)的映射處理,該音調(diào)表是在音調(diào)轉(zhuǎn)換單元中予先準備的。在這種情況中,例如它可想象為準備數(shù)據(jù)具有相應于在該音調(diào)表中所包括的作為固定的音調(diào)數(shù)據(jù)的音樂標度的頻率間隔,并且對具有接近類似該輸入音調(diào)Pch_in的一音樂標度實施轉(zhuǎn)換。
通過在該編碼裝置中所包含的音調(diào)轉(zhuǎn)換單元119或在該譯碼裝置中所包含的音調(diào)轉(zhuǎn)換單元240中執(zhí)行如上所述的第一至第九種處理中的一種音調(diào)轉(zhuǎn)換處理,僅僅轉(zhuǎn)換了在該譯碼的時間控制諧波數(shù)的音調(diào)數(shù)據(jù)。這樣僅僅該音調(diào)可被簡單地被轉(zhuǎn)換而不改變語音的音素。
現(xiàn)在將參照圖5和圖6來說明前述的語音編碼裝置和音語譯碼裝置的應用的例子。首先說明如圖5中所述的應用到一無線電話裝置(例如一便攜式電話機)的一傳輸系統(tǒng)的該語音編碼裝置的一個例子。由一放大器302放大由一微音器301所控制的語音信號,由一模擬/數(shù)字變換器303轉(zhuǎn)換為一數(shù)字信號,并傳送到一語音編碼單元304。這個語音編碼單元304相應于參照圖1和3所述的該語音編碼裝置。有必要時,在該編碼單元304的一音調(diào)轉(zhuǎn)換單元中(相應于圖1和3的音調(diào)轉(zhuǎn)換單元119)實施音調(diào)轉(zhuǎn)換處理。每一個在該語音編碼單元304中被編的數(shù)據(jù)作為該編碼單元304的一輸出信號被傳送到一傳輸線編碼單元305中。在該傳輸線編碼單元305中,實施一所謂的通道編碼處理。它的輸出信號被傳送到一調(diào)制電路306,在其中該輸出信號被調(diào)制,并通過一數(shù)字/模擬變換器307和一高頻放大器308傳送到天線309,進行無線電傳送。
圖6示出了作為一無線電電話裝置的接收系統(tǒng)的該語音譯碼裝置的應用的一個例子。通過一高頻放大器312來放大由天線311所接收的一信號,并通過一模擬/數(shù)字變換器313傳送給一解調(diào)電路314。該解調(diào)信號被傳送到一傳輸線譯碼單元315。在這個傳輸線譯碼單元315中,提取進行了通道譯碼處理和被傳輸?shù)恼Z音信號。被提取的語音信號被傳送到一語音譯碼單元316。這個語音譯碼單元316相應于參照圖2和4所述的語音譯碼裝置。有必要時,在該編碼單元316中所包含的一音調(diào)轉(zhuǎn)換單元(相應于圖2和4的該音調(diào)轉(zhuǎn)換單元)中實施音調(diào)轉(zhuǎn)換處理。由該語音譯碼單元316譯碼的語音信號作為譯碼單元316的輸出信號被傳送到一數(shù)字/模擬變換器317,在放大器318中進行模擬語音處理,然后被傳送到一揚聲器319,作為語音被放出。
當然,本發(fā)明也可應用于除這種無線電電話裝置之外的裝置。換句話說,本發(fā)明可應用于包括參照圖1所述的該語音編碼裝置在內(nèi)的和處理語音信號的各種裝置,并且可應用于包括參照圖3所述的該語音譯碼裝置在內(nèi)的和處理語音信號的各種裝置。
另外,在一記錄介質(zhì)上(例如一光盤、一磁光盤、或一磁帶等)記錄有相應于在本例子的該音調(diào)轉(zhuǎn)換單元119中所實施的處理的一處理程序的情況中,在其中所記錄的處理程序用來執(zhí)行參照圖1和3所述的語音編碼處理,并且從這個介質(zhì)中讀出的該處理程序是在一計算機裝置等上被執(zhí)行以進行編碼,可進行類似的音調(diào)轉(zhuǎn)換處理。相類似地,在一記錄介質(zhì)上記錄有相應于在本例子的該音調(diào)轉(zhuǎn)換單元240中所實施的處理的一處理程序的情況中,在其中所記錄的處理程序用來執(zhí)行參照圖2和4所述的語音譯碼處理,并且從這個介質(zhì)中讀出的該處理程序是在一計算機裝置等上被執(zhí)行以進行譯碼,可進行類似的音調(diào)轉(zhuǎn)換處理。
根據(jù)本發(fā)明的語音編碼方法,通過所予置的計算處理來改變進行了正弦曲線分析編碼的該語音編碼數(shù)據(jù)的音調(diào)分量以實施該音調(diào)轉(zhuǎn)換。其結(jié)果,能夠僅僅精確地轉(zhuǎn)換該音調(diào)并用簡單的計算處理來實施編碼而不改變輸入語音的音素。
在這種情況中,為了使得諧波數(shù)等于一予置數(shù)而實施在數(shù)據(jù)數(shù)中的轉(zhuǎn)換。其結(jié)果,根據(jù)該編碼數(shù)據(jù)可簡單地實施音調(diào)轉(zhuǎn)換。
在實施在數(shù)據(jù)數(shù)中的這種轉(zhuǎn)換的情況中,通過使用過取樣計算的插入處理來實施在該數(shù)據(jù)數(shù)中的轉(zhuǎn)換處理。其結(jié)果,可通過使用過取樣計算的簡單處理來實施在該數(shù)據(jù)數(shù)中的轉(zhuǎn)換。
另外,在編碼的時間實施音調(diào)轉(zhuǎn)換的情況中,進行了正弦曲線分析編碼的該語音編碼數(shù)據(jù)的音調(diào)分量被乘以該予置的系數(shù)以實施該音調(diào)轉(zhuǎn)換。其結(jié)果,例如這種音調(diào)轉(zhuǎn)換處理使得該輸入語音的音色改變成為可能。
另外,在編碼的時間實施音調(diào)轉(zhuǎn)換的情況中,進行了正弦曲線分析編碼的該語音編碼數(shù)據(jù)的音調(diào)分量被轉(zhuǎn)換為一固定值并且總是被轉(zhuǎn)換成一固定的音調(diào)。因此,例如該輸入語音的音調(diào)可被轉(zhuǎn)換為一單調(diào)的仿真語音。
另外,在轉(zhuǎn)換所實施的這個固定音調(diào)的情況中,具有一予置頻率的一正弦波的數(shù)據(jù)被附加到被轉(zhuǎn)換的該固定音調(diào)的數(shù)據(jù)。其結(jié)果,例如,轉(zhuǎn)換為一具有在作為中心的該固定音調(diào)的上部和下部擺動的一語音成為可能。
另外,在編碼的時間實施音調(diào)轉(zhuǎn)換的情況中,從一予置的固定值中減去進行了正弦曲線分析編碼的語音編碼數(shù)據(jù)的該音調(diào)分量以實施該音調(diào)轉(zhuǎn)換。其結(jié)果,例如對一引起輸入語音的字尾的聲調(diào)等相反變化效果的音調(diào)的轉(zhuǎn)換成為可能。
另外,在編碼的時間實施音調(diào)轉(zhuǎn)換的情況中,一予置的隨機數(shù)被附加到進行了正弦曲線分析編碼的該語音編碼數(shù)據(jù)的音調(diào)分量以實施該音調(diào)轉(zhuǎn)換。其結(jié)果,使該語音的聲調(diào)等發(fā)生不規(guī)則變化的這樣一音調(diào)的轉(zhuǎn)換成為可能。
另外,在編碼的時間實施音調(diào)轉(zhuǎn)換的情況中,將具有一予置頻率的正弦波的數(shù)據(jù)附加到通過利用正弦曲線分析編碼所編碼的該語音編碼數(shù)據(jù)的音調(diào)分量并因而實施該音調(diào)轉(zhuǎn)換。其結(jié)果,例如對通過將擺動附加到輸入語音而得到的這樣一語音的轉(zhuǎn)換成為可能。
另外,在編碼的時間實施音調(diào)轉(zhuǎn)換的情況中,計算進行了正弦曲線分析編碼的該語音編碼數(shù)據(jù)的音調(diào)分量的平均值并且這個平均值被用作為進行了該音調(diào)轉(zhuǎn)換的該語音編碼數(shù)據(jù)。其結(jié)果,例如對從該輸入語音上升和下降中所減少的語音的轉(zhuǎn)換成為可能。
另外,在編碼的時間實施音調(diào)轉(zhuǎn)換的情況中,計算進行了正弦曲線分析編碼的該語音編碼數(shù)據(jù)的音調(diào)分量的一平均值并將該語音編碼數(shù)據(jù)和該平均值之間的一差值附加到該語音編碼數(shù)據(jù)以實施該音調(diào)轉(zhuǎn)換。其結(jié)果,例如對在該輸入語音的上升和下降中被強調(diào)和為此調(diào)制的一語音的轉(zhuǎn)換成為可能。
在編碼的時間實施音調(diào)轉(zhuǎn)換的情況中,進行了正弦曲線分析編碼的該語音編碼數(shù)據(jù)的音調(diào)分量被轉(zhuǎn)換成予先所準備的一音調(diào)轉(zhuǎn)換表的數(shù)據(jù)并轉(zhuǎn)換成在這個音調(diào)轉(zhuǎn)換表中所設(shè)置的一等級的音調(diào)。其結(jié)果,例如關(guān)于將輸入語音的音調(diào)標準化為一固定音樂標尺的一音調(diào)的轉(zhuǎn)換成為可能。
根據(jù)本發(fā)明的語音譯碼方法,通過予置的計算處理來改變進行了正弦曲線分析編碼的數(shù)據(jù)的音調(diào)分量。其結(jié)果,通過使用簡單的計算處理僅僅該譯碼語音的音調(diào)可被精確地轉(zhuǎn)換而該語音的音素沒有改變。
在這情況中,該音調(diào)分量改變,并且隨后對于諧波數(shù)實施來自一予置數(shù)的數(shù)據(jù)數(shù)中的轉(zhuǎn)換。其結(jié)果,借助于所改變的音調(diào)分量而可簡單地實施譯碼。
另外,在實施在該數(shù)據(jù)數(shù)的轉(zhuǎn)換的情況中,同利用該過取樣計算的插入處理一起實施數(shù)據(jù)轉(zhuǎn)換處理的數(shù)。其結(jié)果,同利用該過取樣計算的簡單處理一起可實施在該數(shù)據(jù)數(shù)中的轉(zhuǎn)換。
另外,在譯碼的時間實施音調(diào)轉(zhuǎn)換的情況中,進行了正弦曲線分析編碼的該語音編碼數(shù)據(jù)的音調(diào)分量與一予置的系數(shù)相乘以實施該音調(diào)轉(zhuǎn)換。其結(jié)果,通過這種音調(diào)轉(zhuǎn)換處理例如改變該譯碼語音的音色質(zhì)量成為可能。
另外,在譯碼的時間實施該音調(diào)轉(zhuǎn)換的情況中,進行了該正弦曲線分析編碼的該語音編碼數(shù)據(jù)的音調(diào)分量被轉(zhuǎn)換為一固定值并總是被轉(zhuǎn)換為一固定音調(diào)。因此,例如該譯碼語音的音調(diào)可轉(zhuǎn)換為單調(diào)的仿真語音。
另外,在對這個固定音調(diào)實施轉(zhuǎn)換的情況中,具有一予置頻率的一正弦波的數(shù)據(jù)被附加到被轉(zhuǎn)換為該固定音調(diào)的數(shù)據(jù)中。其結(jié)果,例如轉(zhuǎn)換一具有在作為中心的固定音調(diào)的上部和下部而擺動的語音成為可能。
另外,在譯碼的時間實施音調(diào)轉(zhuǎn)換的情況中,從一予置的固定值中減去進行了正弦曲線分析編碼的語音編碼數(shù)據(jù)的音調(diào)分量以實施該音調(diào)轉(zhuǎn)換。其結(jié)果,例如對一引起輸入語音的字尾的聲調(diào)等相反變化效果的音調(diào)的轉(zhuǎn)換成為可能。
另外,在譯碼的時間實施音調(diào)轉(zhuǎn)換的情況中,一予置的附機數(shù)被附加到進行了正弦曲線分析編碼的該語音編碼數(shù)據(jù)的音調(diào)分量以實施該音調(diào)轉(zhuǎn)換。其結(jié)果,例如使該被譯碼的語音的聲調(diào)等發(fā)生不規(guī)則變化的這樣一音調(diào)的轉(zhuǎn)換成為可能。
另外,在譯碼的時間實施音調(diào)轉(zhuǎn)換的情況中,將具有一予置頻率的正弦波的數(shù)據(jù)附加到通過利用正弦曲線分析編碼所編碼的該語音編碼數(shù)據(jù)的音調(diào)分量并因而實施該音調(diào)轉(zhuǎn)換。其結(jié)果,例如對通過將擺動附加到輸入語音而得到的這樣一語音的轉(zhuǎn)換成為可能。
另外,在譯碼的時間實施音調(diào)轉(zhuǎn)換的情況中計算進行了正弦曲線分析編碼的該語音編碼數(shù)據(jù)的一平均值并且這個平均值被作為進行了該音調(diào)轉(zhuǎn)換的語音編碼數(shù)據(jù)。其結(jié)果,例如對在該譯碼語音的上升和下降中所減少的語音的轉(zhuǎn)換成為可能。
另外,在譯碼的時間實施音調(diào)轉(zhuǎn)換的情況中,計算進行了正弦曲線分析編碼的該語音編碼數(shù)據(jù)的音調(diào)分量的一平均值并將該語音編碼數(shù)據(jù)和該平均值之間的一差值附加到該語音編碼數(shù)據(jù)以實施該音調(diào)轉(zhuǎn)換。其結(jié)果,例如對在該譯碼的語音的上升和下降中被強調(diào)和為此調(diào)制的一語音的轉(zhuǎn)換成為可能。
在譯碼的時間實施音調(diào)轉(zhuǎn)換的情況中,進行了正弦曲線編碼的該語音編碼數(shù)據(jù)的音調(diào)分量被轉(zhuǎn)換成予先準備的一音調(diào)轉(zhuǎn)換表的數(shù)據(jù)并且轉(zhuǎn)換為在這個音調(diào)轉(zhuǎn)換表中設(shè)置的一等級的音調(diào)。其結(jié)果,例如關(guān)于將被譯碼的輸入語音的音調(diào)標準化為一固定音樂標尺的音調(diào)的轉(zhuǎn)換成為可能。
本發(fā)明的該語音編碼裝置具有用來轉(zhuǎn)換在該正弦曲線分析編碼裝置中進行了分析和編碼的該音調(diào)分量的音調(diào)轉(zhuǎn)換裝置。因此,在利用進行了正弦曲線分析編碼的該數(shù)據(jù)的音調(diào)分量的轉(zhuǎn)換處理的一簡單處理構(gòu)成中,僅僅對音調(diào)進行精確地轉(zhuǎn)換和實施編碼而不改變該輸入語音的音素成為可能。
在這種情況中,為了使得諧波數(shù)等于一予置數(shù)而實施在數(shù)據(jù)數(shù)中的轉(zhuǎn)換。其結(jié)果,在一簡單的處理構(gòu)成中可實施編碼。另外,根據(jù)該編碼數(shù)據(jù)可簡單地實施音調(diào)轉(zhuǎn)換。
另外,通過使用該頻帶限制過取樣濾波器的插入處理實施在該數(shù)據(jù)數(shù)中的轉(zhuǎn)換處理。其結(jié)果,在一使用過取樣濾波器的簡單處理構(gòu)成中可實施在該數(shù)據(jù)數(shù)中的轉(zhuǎn)換。
根據(jù)本發(fā)明的該語音譯碼裝置,通過音調(diào)轉(zhuǎn)換裝置轉(zhuǎn)換進行了正弦曲線分析編碼的數(shù)據(jù)的音調(diào)分量,并且根據(jù)線性予測余項通過利用進行了正弦曲線分析編碼的轉(zhuǎn)換數(shù)據(jù)和編碼數(shù)據(jù)在該語音譯碼裝置中實施譯碼處理。因此,在一簡單的處理構(gòu)成中,僅僅精確地轉(zhuǎn)換該譯碼語音的音調(diào)而不改變該語音的音素成為可能。
在這種情況中,對于該諧波數(shù)實施在來自一予置數(shù)的數(shù)據(jù)數(shù)中的轉(zhuǎn)換。其結(jié)果,為了僅僅轉(zhuǎn)換該諧波數(shù)在一簡單的處理構(gòu)成中可實施該轉(zhuǎn)換的音調(diào)的譯碼。
另外,通過利用該頻帶限制過取樣濾波器的插入處理實施在該數(shù)據(jù)數(shù)中的轉(zhuǎn)換處理。其結(jié)果,在一使用過取樣濾波器的簡單的處理構(gòu)成中可實施在譯碼時間的在數(shù)據(jù)數(shù)中的轉(zhuǎn)換。
根據(jù)本發(fā)明的該電話裝置具有用來轉(zhuǎn)換在該正弦曲線分析編碼裝置中進行了分析和編碼的數(shù)據(jù)的音調(diào)分量的音調(diào)轉(zhuǎn)換裝置。因此,在一簡單的構(gòu)成中,容易地對被傳送到一所希望的狀態(tài)的該語音數(shù)據(jù)的音調(diào)分量進行轉(zhuǎn)換成為可能。
根據(jù)本發(fā)明的該音調(diào)轉(zhuǎn)換方法,通過在一語音信號上實施正弦曲線分析和編碼所得到的一音調(diào)分量的數(shù)據(jù)乘以一予置系數(shù)以實施該音調(diào)轉(zhuǎn)換。其結(jié)果,例如關(guān)于改變該輸入語音的音色質(zhì)量的這種音調(diào)轉(zhuǎn)換可容易的被實施。
另外,根據(jù)本發(fā)明的該音調(diào)轉(zhuǎn)換方法,通過在一語音信號上實施正弦曲線分析和編碼所得到的一音調(diào)分量的數(shù)據(jù)被轉(zhuǎn)換為一固定值并且總是被轉(zhuǎn)換為一固定音調(diào)。因此,例如該輸入語音的音調(diào)可被轉(zhuǎn)換成一單調(diào)的仿真語音。
另外,根據(jù)本發(fā)明的該音調(diào)轉(zhuǎn)換方法,從一予置的固定值中減去通過該正弦曲線分析和編碼而被編碼的語音編碼數(shù)據(jù)以實施該音調(diào)轉(zhuǎn)換。其結(jié)果,例如對一引起輸入語音的字尾的聲調(diào)等相反變化效果的音調(diào)的轉(zhuǎn)換成為可能。
另外,根據(jù)本發(fā)明的該介質(zhì),一用來轉(zhuǎn)換通過正弦曲線分析編碼而被編碼的該語音編碼數(shù)據(jù)的音調(diào)分量的處理程序被記錄在一在其內(nèi)記錄有一編碼程序的介質(zhì)中。因此,通過執(zhí)行這個處理程序僅僅精確地轉(zhuǎn)換該音調(diào)和實施該編碼而不改變該輸入語音的音素成為可能。
另外,根據(jù)本發(fā)明的介質(zhì),一用來轉(zhuǎn)換進行了正弦曲線分析編碼的數(shù)據(jù)的音調(diào)分量的音調(diào)轉(zhuǎn)換處理程序被記錄在其內(nèi)記錄有編碼程序的介質(zhì)中。因此,通過這個處理程序僅僅精確地轉(zhuǎn)換該譯碼語音的音調(diào)而不改變該語音的音素成為可能。
參照附圖已對本發(fā)明的各最佳實施例作了說明,但應了解的是本發(fā)明并不限于上述的實施例,本領(lǐng)域的普通技術(shù)人員在不違反在所附權(quán)利要求中所規(guī)定的本發(fā)明的精神或范圍的前提下可對本發(fā)明進行各種變化和改進。
權(quán)利要求
1.一種包括有在一予置的編碼單元中在一時間軸上分隔一語音信號的步驟,在每一分隔的編碼單元中分隔所得到的一線性予測余項的步驟,和根據(jù)所述線性予測余項對于一語音信號實施正弦曲線分析編碼的步驟的語音編碼方法,包括有步驟通過一予置的計算步驟改變對于一語音信號進行了所述正弦曲線分析編碼的語音數(shù)據(jù)的一音調(diào)分量。
2.根據(jù)權(quán)利要求1的語音編碼方法,其中通過諧波編碼執(zhí)行一編碼處理,并且實施用來使得諧波數(shù)如同一予置數(shù)的在一數(shù)據(jù)數(shù)中的轉(zhuǎn)換。
3.根據(jù)權(quán)利要求2的語音編碼方法,其中在一數(shù)據(jù)數(shù)中的所述轉(zhuǎn)換處理是通過使用一過取樣計算的插入處理而實施的。
4.根據(jù)權(quán)利要求1的語音編碼方法,其中所述進行了正弦曲線分析編碼的該語音編碼數(shù)據(jù)的音調(diào)分量由一予置系數(shù)相乘以實施該音調(diào)轉(zhuǎn)換。
5.根據(jù)權(quán)利要求1的語音編碼方法,其中所述進行了正弦曲線分析編碼的該語音編碼數(shù)據(jù)的所述音調(diào)分量被轉(zhuǎn)換為一固定值并且總是轉(zhuǎn)換成一固定音調(diào)。
6.根據(jù)權(quán)利要求5的語音編碼方法,其中將一具有一予置頻率的正弦波數(shù)據(jù)附加到所述固定音調(diào)的數(shù)據(jù)中。
7.根據(jù)權(quán)利要求1的語音編碼方法,其中從一予置固定值中減進行了正弦曲線分析編碼的該語音編碼數(shù)據(jù)的所述音調(diào)分量以實施該音調(diào)轉(zhuǎn)換。
8.根據(jù)權(quán)利要求1的語音編碼方法,其中一予置的附機數(shù)被附加到進行了正弦曲線分析編碼的該語音編碼數(shù)據(jù)的所述音調(diào)分量中以實施該音調(diào)轉(zhuǎn)換。
9.根據(jù)權(quán)利要求1的語音編碼方法,其中一具有一予置頻率的正弦波的數(shù)據(jù)被附加到進行了所述正弦曲線分析編碼的該語音編碼數(shù)據(jù)的所述音調(diào)分量中以實施該音調(diào)轉(zhuǎn)換。
10.根據(jù)權(quán)利要求1的語音編碼方法,其中計算進行了正弦曲線分析編碼的語音編碼數(shù)據(jù)的所述音調(diào)分量的一平均值并且所述平均值被用作進行了該音調(diào)轉(zhuǎn)換的語音編碼數(shù)據(jù)。
11.根據(jù)權(quán)利要求1的語音編碼方法,其中計算進行了正弦曲線分析編碼的該語音編碼數(shù)據(jù)的所述音調(diào)分量的一平均值并且將所述語音編碼數(shù)據(jù)和所述平均值之間的一差值附加到所述語音編碼數(shù)據(jù)中以實施該語音轉(zhuǎn)換。
12.根據(jù)權(quán)利要求1的語音編碼方法,其中進行了正弦曲線分析編碼的該語音編碼數(shù)據(jù)的所述音調(diào)分量被轉(zhuǎn)換為一予先準備的一音調(diào)轉(zhuǎn)換表的數(shù)據(jù)并轉(zhuǎn)換為在所述音調(diào)轉(zhuǎn)換表中所設(shè)置的一等級的音調(diào)。
13.在一語音譯碼方法中,其中一語音信號根據(jù)在一時間軸上的一予置編碼單元的線性予測余項數(shù)據(jù)和進行了正弦曲線分析編碼的數(shù)據(jù)被譯碼,一語音譯碼方法包括步驟通過一予置的計算處理改變進行了所述正弦曲線分析編碼的一音調(diào)分量。
14.根據(jù)權(quán)利要求13的語音譯碼方法,其中通過一予置的計算處理改變所述音調(diào)分量并且隨后實施用來在一編碼處理中使用諧波編碼使得諧波數(shù)如同一予置數(shù)的轉(zhuǎn)換。
15.根據(jù)權(quán)利要求14的語音譯碼方法,其中通過使用過取樣計算的一插入處理實施在一數(shù)據(jù)數(shù)中的所述轉(zhuǎn)換處理。
16.根據(jù)權(quán)利要求13的語音譯碼方法,其中進行了正弦曲線分析編碼的該語音編碼數(shù)據(jù)的所述音調(diào)分量被乘以一予置的系數(shù)以實施該音調(diào)轉(zhuǎn)換。
17.根據(jù)權(quán)利要求13的語音譯碼方法,其中進行了正弦曲線分析編碼的該語音編碼數(shù)據(jù)的所述音調(diào)分量被轉(zhuǎn)換為一固定值并總是被轉(zhuǎn)換為一固定音調(diào)。
18.根據(jù)權(quán)利要求17的語音譯碼方法,其中將一具有一予置頻率的正弦波附加到所述固定音調(diào)的數(shù)據(jù)中。
19.根據(jù)權(quán)利要求13的語音譯碼方法,其中從一予置的固定值中減去進行了正弦曲線分析編碼的該語音編碼數(shù)據(jù)的所述音調(diào)分量以實施該音調(diào)轉(zhuǎn)換。
20.根據(jù)權(quán)利要求13的語音譯碼方法,其中一予置的隨機數(shù)據(jù)附加到進行了正弦曲線分析編碼的該語音編碼數(shù)據(jù)的所述音調(diào)分量中以實施該音調(diào)轉(zhuǎn)換。
21.根據(jù)權(quán)利要求13的語音譯碼方法,其中將一具有一予置頻率的正弦波的數(shù)據(jù)附加到進行了正弦曲線分析編碼的該語音編碼數(shù)據(jù)的所述音調(diào)分量中以實施該音調(diào)轉(zhuǎn)換。
22.根據(jù)權(quán)利要求13的語音譯碼方法,其中計算進行了正弦分析編碼的該語音編碼數(shù)據(jù)的所述音調(diào)分量的一平均值并且所述平均值被用作為進行了音調(diào)轉(zhuǎn)換的該語音編碼數(shù)據(jù)。
23.根據(jù)權(quán)利要求13的語音譯碼方法,其中計算進行了正弦分析編碼的該語音編碼數(shù)據(jù)的所述音調(diào)分量的平均值并且將所述語音編碼數(shù)據(jù)和所述平均值之間的一差值附加到所述語音編碼數(shù)據(jù)以實施該音調(diào)轉(zhuǎn)換。
24.根據(jù)權(quán)利要求13的語音譯碼方法,具中進行了正弦曲線分析編碼的該語音編碼數(shù)據(jù)的所述音調(diào)分量被轉(zhuǎn)換為一予先準備的一音調(diào)轉(zhuǎn)換表的數(shù)據(jù)并且轉(zhuǎn)換為在所述音調(diào)轉(zhuǎn)換表中所設(shè)置的一等級的音調(diào)。
25.一種語音編碼裝置包括用來在一予置的編碼單元中在一時間軸上得到一輸入語音信號的一線性予測余項的一線性予測余項檢測裝置;用來在由所述線性予測余項檢測裝置所檢測的所述線性予測余項上實施一正弦分析編碼的一正弦曲線分析編碼裝置;和用來轉(zhuǎn)換通過所述正弦分析編碼裝置進行了分析編碼的一音調(diào)分量的一音調(diào)轉(zhuǎn)換裝置。
26.根據(jù)權(quán)利要求25的語音編碼裝置,其中通過所述正弦曲線分析編碼裝置實施用來根據(jù)編碼到一予置數(shù)的諧波來設(shè)置一諧波數(shù)的在一數(shù)據(jù)數(shù)中的轉(zhuǎn)換。
27.根據(jù)權(quán)利要求26的語音編碼裝置,其中通過使用一頻帶限制型過取樣濾波器的一插入處理實施在一數(shù)據(jù)數(shù)中的所述轉(zhuǎn)換處理。
28.用來根據(jù)在一予置的編碼單元中的一時間軸上的線性預測余項數(shù)據(jù)和進行了一正弦曲線分析編碼的數(shù)據(jù)來譯碼一語音信號的一語音譯碼裝置,包括一用來轉(zhuǎn)換進行了所述正弦曲線分析編碼的數(shù)據(jù)的音調(diào)分量音調(diào)轉(zhuǎn)換裝置;和一用來通過利用進行了所述正弦曲線分析編碼和由所述音調(diào)轉(zhuǎn)換裝置所轉(zhuǎn)換的所述數(shù)據(jù)以及所述線性予測余項數(shù)據(jù)實施一譯碼處理的語音譯碼裝置。
29.根據(jù)權(quán)利要求28的語音譯碼裝置,其中根據(jù)所述被轉(zhuǎn)換的音調(diào)分量實施用來設(shè)置根據(jù)編碼到一予置數(shù)所使用的一諧波數(shù)的在一數(shù)據(jù)數(shù)中的轉(zhuǎn)換。
30.根據(jù)權(quán)利要求29的語音譯碼裝置,其中通過使用一頻帶限制型過取樣濾波器的一插入處理來實施在一數(shù)據(jù)數(shù)中的所述轉(zhuǎn)換處理。
31.一種電話裝置包括一用來在一予置的編碼裝置中的一時間軸上得到一輸入語音信號的一線性予測余項的線性予測余項檢測裝置;一用來在由所述線性予測余項檢測裝置所檢測的所述線性予測余項上實施一正弦曲線分析編碼的正弦曲線分析編碼裝置;一用來轉(zhuǎn)換通過由所述正弦曲線分析編碼裝置進行了分析編碼的數(shù)據(jù)的一音調(diào)分量的音調(diào)轉(zhuǎn)換裝置;和一用來將進行了分析編碼和由所述音調(diào)轉(zhuǎn)換裝置進行了音調(diào)轉(zhuǎn)換的所述數(shù)據(jù)以及所述線性予測余項數(shù)據(jù)傳送到一予置的傳輸線的傳輸裝置。
32.一種音調(diào)轉(zhuǎn)換方法包括有步驟將由在一語音信號上實施正弦曲線分析和編碼所得到的一音調(diào)分量的數(shù)據(jù)乘以予置的系數(shù)以實施一音調(diào)轉(zhuǎn)換。
33.一種音調(diào)轉(zhuǎn)換方法包括步驟將由在一語音信號上實施一正弦曲線分析和編碼所得到的一音調(diào)分量的數(shù)據(jù)轉(zhuǎn)換為一固定值以總是被轉(zhuǎn)換為一固定音調(diào)。
34.一種音調(diào)轉(zhuǎn)換方法包括步驟從一予置的固定值中減去由在一語音信號上實施一正弦曲線分析和編碼所得到的一音調(diào)分量的數(shù)據(jù)以實施一音調(diào)轉(zhuǎn)換。
35.一種在其中記錄有一程序的介質(zhì),該介質(zhì)實施;一用來在一予置的編碼單元中的一時間軸上分隔一輸入語音信號的過程;一用來在所分隔的每一編碼單元上檢測一線性予測余項的過程;和一用來在所述線性予測余項上實施一正弦曲線分析編碼的過程,所述介質(zhì)被安置在其中記錄一用來轉(zhuǎn)換進行了所述正弦曲線分析編碼的語音編碼數(shù)據(jù)的一音調(diào)分量的處理程序。
36.一種在其中記錄有一處理程序的介質(zhì),該介質(zhì)根據(jù)在一予置編碼單元中的一時間軸上的線性予測余項數(shù)據(jù)和進行了正弦分析編碼的數(shù)據(jù)實施對一語音信號的譯碼,所述介質(zhì)被安置在其中記錄有一用來轉(zhuǎn)換進行了所述正弦曲線分析編碼的數(shù)據(jù)的一音調(diào)分量的音調(diào)轉(zhuǎn)換處理程序。
全文摘要
在一語音信號被編碼或被譯碼的情況中,它可用簡單的處理和構(gòu)成來實施音調(diào)控制。在對于由分隔在一預置的編碼單元上在該時間軸上的該語音信號所得到的每一編碼單元一語音信號被進行了正弦曲線分析編碼的情況中,輸出該語音信號的一線性預測余項,并處理所得結(jié)果的語音編碼數(shù)據(jù),通過在一音調(diào)轉(zhuǎn)換單元中的一預置的計算處理來改變由正弦曲線分析編碼所編碼的該語音編碼數(shù)據(jù)的一音調(diào)分量。
文檔編號G10L19/08GK1193159SQ9712648
公開日1998年9月16日 申請日期1997年11月19日 優(yōu)先權(quán)日1996年11月19日
發(fā)明者井上晃, 西口正之, 松本淳 申請人:索尼公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
峨山| 丁青县| 汕尾市| 休宁县| 中牟县| 通城县| 广汉市| 逊克县| 安仁县| 县级市| 彭州市| 连平县| 淮滨县| 黄梅县| 股票| 峨边| 大同市| 南木林县| 富宁县| 哈巴河县| 江孜县| 闻喜县| 灵台县| 万全县| 安图县| 南安市| 汽车| 班玛县| 隆子县| 资溪县| 舞钢市| 赤峰市| 孟连| 梓潼县| 洮南市| 察哈| 舒兰市| 神农架林区| 刚察县| 镇坪县| 县级市|