專利名稱:具有增強語音質(zhì)量的移動站到移動站的數(shù)字無線連接的制作方法
技術(shù)領(lǐng)域:
本發(fā)明一般涉及無線通信技術(shù),尤其涉及具有增強語音質(zhì)量的移動站到移動站的無線通信連接。
無線電話通信系統(tǒng)利用編碼來限制在通信信道上傳送話音信息所需要的帶寬數(shù)量。除了在信道上發(fā)送接收到的語音之外,話音編碼器(聲碼器)首先用于分析所接收的話音信號,并且接著生成一組參數(shù),這組參數(shù)用于驅(qū)動合成話音復制品的模型。這些參數(shù)在電話網(wǎng)絡(luò)上以非常低的速率傳送。典型地,在一種聲碼器中,話音是在短時間的基礎(chǔ)上分析,并且生成一組模型參數(shù),這組參數(shù)可以表示音調(diào)、線譜頻(在任何給定的時間上,聲道的頻率響應(yīng))以及話音增益。
在數(shù)字無線網(wǎng)絡(luò)中,在發(fā)射機中使用聲碼器以將說話人的話音信號分成一連串一般為20毫秒的固定長度幀。聲碼器接著利用特定的數(shù)學模型來模型化該話音,并且對于每個20毫秒的幀,聲碼器生成一組用于該數(shù)學模型的參數(shù),這組參數(shù)最佳地描述了該20毫秒間隔的話音。從而,聲碼器將揚聲器的話音編碼成20毫秒的幀。發(fā)射機中的調(diào)制解調(diào)器利用諸如CDMA、TDMA或者GSM的空中接口技術(shù),在空中傳送這些幀。接收機中調(diào)制解調(diào)器的功能是將這些幀傳遞接收機中的解碼器。解碼器解碼這些20毫秒的幀,以產(chǎn)生用戶的話音。無線用戶利用一個無線終端來接入無線網(wǎng)絡(luò)。
從移動站到臺式電話的音頻路徑包括一個在移動站中的話音解碼器,一個在移動站中的無線發(fā)射機,一個在基站中的無線接收機以及一個在基站中的解碼器。在音頻信號的處理中涉及一個話音編碼器以及一個解碼器。這個過程被稱為一個聲碼操作,因為它涉及單個編碼/解碼過程。
從第一移動站到第二移動站的音頻路徑包括在第一移動站中的話音解碼器和無線發(fā)射機,在基站中(或者在交換機中)的無線接收機和話音解碼器。由解碼器所產(chǎn)生的用戶的話音信號在載波的陸線上被傳送到第二基站(或者交換機)中的第二話音編碼器,并且接著傳送到無線發(fā)射機。第二移動站的無線接收機接收編碼后的話音信號,并且在第二編碼器中處理它,以生成話音信號。在這種情況下,從話音處理的角度來看,需要一個第一移動站中的話音編碼器,一個基站中的解碼器,第二基站中的另一個話音編碼器,以及一個接收移動站中的第二解碼器。因而,當從一個移動站向另一個移動站做出呼叫時,話音信號經(jīng)過兩個話音編碼器以及兩個解碼器的處理。這個過程被稱為匯接聲碼處理,因為話音信號被編碼兩次,并且被解碼兩次。
由聲碼處理(編碼和解碼話音信號的處理)所處理的話音信號(輸入語音)將一定數(shù)量的、相對于由揚聲器所發(fā)出的實際話音的數(shù)字失真引入了接收機中產(chǎn)生的話音。盡管在單個聲碼處理中由解碼器所產(chǎn)生的話音質(zhì)量完全可以接受,但是還是低于輸入語音的話音質(zhì)量。匯接聲碼將引入的數(shù)字失真復合到話音信號中,因此業(yè)已觀測到移動站到移動站呼叫的主觀話音質(zhì)量顯著地低于移動站到臺式電話呼叫的話音質(zhì)量。因此,需要提供一種用于增強移動站到移動站呼叫的話音質(zhì)量的方法和裝置。
本發(fā)明提出了通過在話音信號被第二聲碼器處理之前,修改該話音信號的頻譜,以補償由該第二聲碼器所產(chǎn)生的數(shù)字失真,來改進具有匯接聲碼器處理的移動站到移動站電話呼叫的主觀話音質(zhì)量。一個自適應(yīng)濾波器可以用來修改話音信號的頻譜。對于本發(fā)明而言,從第一移動電話到第二移動電話的呼叫的話音質(zhì)量基本上類似于從移動電話到臺式電話的呼叫的話音質(zhì)量。
圖1是具有單個聲碼處理的移動電話到臺式電話呼叫的方框圖;圖2是具有兩個聲碼處理的移動電話到移動電話呼叫的方框圖;圖3示出了對于相同語音均衡的輸入話音信號,在單個聲碼處理(曲線A)以及兩個聲碼處理(曲線B)期間產(chǎn)生的輸出語音的頻譜;圖4是根據(jù)本發(fā)明原理的一個實施例結(jié)構(gòu)的方框圖5是根據(jù)本發(fā)明原理的另一個實施例結(jié)構(gòu)的方框圖;圖6是根據(jù)本發(fā)明原理的再一個實施例結(jié)構(gòu)的方框圖;圖7示出了兩個信號頻譜中的差別,其中一個信號受到匯接聲碼的處理,而另一個信號受到單個聲碼的處理;圖8示出了自適應(yīng)濾波器的頻率響應(yīng),該濾波器在匯接中可以位于兩個聲碼器之間,以補償由第二聲碼器所產(chǎn)生的數(shù)字失真;圖9示出了相對于由單個聲碼所處理的話音信號頻譜的由匯接聲碼所處理的話音信號頻譜,該匯接聲碼包括圖7的自適應(yīng)濾波器;圖10示出了在匯接中與兩個EVRC聲碼器一起使用的自適應(yīng)濾波器的頻率響應(yīng)曲線。
如上所述,在移動電話到臺式電話的通話中,語音信號經(jīng)受了單個聲碼處理,該處理將少量的數(shù)字失真引入到所產(chǎn)生的語音中。因此,產(chǎn)生語音的質(zhì)量稍微低于輸入語音的質(zhì)量。對于兩個移動站之間的呼叫來說,話音信號受到了兩次聲碼處理,所產(chǎn)生語音的主觀話音質(zhì)量經(jīng)受了增加的數(shù)字失真,因而低于由僅經(jīng)受單個聲碼處理的話音信號所產(chǎn)生的語音。
參照下圖,提供了利用用于各種聲碼器的單個聲碼處理和匯接聲碼處理所產(chǎn)生的語音信號質(zhì)量的平均意見得分。平均意見得分是利用聲碼器平均意見得分一致性測試標準文獻(TIA/EIA/IS102)測量的話音質(zhì)量,該文獻是標準的主觀話音質(zhì)量測試量度。分數(shù)越高表示話音質(zhì)量越好。
表A平均意見得分上面列出的聲碼器被詳細解釋如下
EVRC是指增強型可變速率編譯碼器;QCELP是指Qualcomn的碼激勵線性預(yù)測編譯碼器;ACELP是指Algeraic的碼激勵線性預(yù)測器;VSELP是指矢量和激勵線性預(yù)測器。
檢查表A中的數(shù)據(jù)將清楚地表明,在每種情況下,話音信號的匯接聲碼引入了比單個聲碼更強的失真,并且這與用于處理話音信號的話音編碼器的類型無關(guān)。
給定話音信號的主觀話音質(zhì)量是多個變量的非線性函數(shù),這些變量諸如1)話音的可懂度;2)話音的清晰度;3)話音中背景噪聲的數(shù)量;4)話音中的數(shù)字失真5)加性噪聲;以及6)話音的頻率構(gòu)成(頻譜)。
本發(fā)明提出了將由受到匯接聲碼處理的話音信號所產(chǎn)生的話音質(zhì)量改進成基本上等于由受到單個聲碼處理的話音信號所產(chǎn)生的話音質(zhì)量。通過在話音信號由第二聲碼器處理之前,修改該話音信號的頻率構(gòu)成,來補償由第二聲碼處理所引入的數(shù)字失真,以得到上述改進。
參照圖1,圖1示出了具有單個聲碼處理的移動電話到臺式電話呼叫的方框圖。主叫用戶的話音在移動站中由話音編碼器(編碼器)10處理,接著饋送到無線發(fā)射機12,用以傳輸?shù)綗o線接收機14。接著信號從接收機14饋送到編碼器16。編碼器的輸出在路徑17上傳送到臺式電話18,該路徑17可能包括陸線。從移動電話到臺式電話的話音信號由一個編碼器10和一個解碼器16處理,因而受到單個聲碼的處理。
參照圖2,圖2示出了兩個聲碼處理的方框圖。第一移動站中主叫用戶的話音經(jīng)過碼器30處理,編碼器30的輸出饋送到無線發(fā)射機32,該無線發(fā)射器32將信號使送到無線接收機34。無線接收機34的輸出饋送到解碼器36,解碼器36將接收到的信號轉(zhuǎn)換成用以在包括陸線38的載波網(wǎng)絡(luò)上傳輸?shù)恼Z音信號。在該實例中,源于第一移動站的呼叫將被發(fā)送到第二移動站。因此,來自解碼器36的話音信號經(jīng)過載波網(wǎng)絡(luò)傳送到第二編碼器40,語音信號在第二編碼器40中被第二次處理,接著被傳送到天線發(fā)射機42,用以傳輸?shù)轿挥诘诙蚪邮找苿诱局械臒o線接收機44。來自接收機44的信號被饋送到解碼器46,并被解碼器46所處理,解碼器46的輸出是用于產(chǎn)生由接收該呼叫的用戶所聽到的話音的話音信號。在圖2中,從第一移動站到第二移動站的呼叫在由被叫用戶接收到之前,被編碼兩次且被解碼兩次。因而在該實例中,話音信號受到匯接聲碼的處理。
參照圖3,圖3示出了經(jīng)受利用EVRC聲碼的單個和匯接處理的語音均衡語音的兩個頻率構(gòu)成曲線。語音均衡的話音包括一組的句子,這些句子具有幾乎所有英語語言的語音轉(zhuǎn)換。該話音信號包括5個男聲和5個女聲。曲線A是由單個聲碼處理所產(chǎn)生的話音,曲線B是由匯接聲碼處理所產(chǎn)生的話音。如圖3所示,與由單個聲碼處理所產(chǎn)生的話音信號相比,受到匯接聲碼處理的話音信號所產(chǎn)生的話音在高頻端具有較低的能量。
本發(fā)明提出了通過在話音信號受到第二次聲碼操作之前,改變該話音信號的頻譜,以補償將由第二聲碼操作所產(chǎn)生的數(shù)字失真,從而改進由受到匯接聲碼的話音信號所產(chǎn)生的話音質(zhì)量。這可以利用位于匯接聲碼器結(jié)構(gòu)的第二聲碼器上游的自適應(yīng)濾波器來實現(xiàn)。該自適應(yīng)可以是一個獨立的單元,在第一解碼器的末端或者在第二解碼器的前端。
參照圖4,5和6,它們示出了自適應(yīng)濾波器的三種可能的位置。圖4是根據(jù)本發(fā)明原理的結(jié)構(gòu)的方框圖,其中自適應(yīng)濾波器位于第一解碼器和第二編碼器之間。圖5示出了作為呼叫發(fā)起方解碼器末端一部分的自適應(yīng)濾波器。圖6示出了作為呼叫接收方編碼器前端一部分的自適應(yīng)濾波器。在每種情況下,自適應(yīng)濾波器位于第一解碼器和第二編碼器之間。
圖7描述了受到匯接聲碼處理的信號的頻譜和受到單個聲碼處理的另一個信號的頻譜之間的差別曲線。圖7的研究顯示,隨著頻率增加到3000Hz以上,兩個信號的頻譜之間存在著明顯的差別。從1500Hz到3000Hz,存在著較小但可能比較明顯的差別。用于減少3000Hz以上的差別的自適應(yīng)濾波器將產(chǎn)生明顯的結(jié)果,并且可以通過減少從1500Hz到3000Hz的差別來得到進一步的改進。通過減少在500Hz和1500Hz之間發(fā)生的類別可以得到更進一步的改進。
參照圖8,圖8描述了可以用于修改饋送到第二編碼器的話音信號頻譜的自適應(yīng)濾波器的頻率響應(yīng)圖。
圖9示出對于一種聲碼器來說,相對于受到單個聲碼的話音信號頻譜(曲線8)的受到匯接聲碼的話音信號頻譜(曲線A),其中匯接聲碼利用自適應(yīng)濾波器,可以通過使用改進來自第一解碼器的話音信號的頻譜以補償將由第二解碼器所產(chǎn)生的數(shù)字失真,來得到受到兩個聲碼處理的語音信號頻譜的改進。根據(jù)所使用的聲碼器,自適應(yīng)濾波器可以使修改后信號的頻譜接近于來自第一聲碼器的、低于2400Hz頻率信號的頻譜,并且使來自第一聲碼器的、高于2400Hz頻率的信號增加從0到10dB的增益。
圖10示出了在匯接中與兩個EVRC聲碼器一起使用的自適應(yīng)濾波器的頻率的應(yīng)用。在該實施例中,該濾波器被設(shè)計成通過、但不改變來自第一編碼的低于1500Hz的頻率;將在1500Hz和2400Hz之間的頻率的dB增加大約2dB;將在大約2400Hz和2850Hz之間的頻率的dB增加大約6dB;將在大約2850Hz和3150Hz之間的頻率的dB增加大約9dB;將在大約3150和4000Hz之間的頻率的dB增加大約6dB。
在利用單個聲碼、匯接聲碼以及帶有自適應(yīng)濾波器的匯接聲碼處理話音信號時所產(chǎn)生的話音質(zhì)量具有類似于圖10的頻率響應(yīng),這些話音的質(zhì)量利用話音質(zhì)量組中的“金耳朵(golden ear)”專家進行評估。所得到的結(jié)果表明,由帶有自適應(yīng)濾波器的匯接聲碼處理過的話音信號所產(chǎn)生的話音質(zhì)量不僅高于沒有利用自適應(yīng)濾波器的匯接聲碼所產(chǎn)生的話質(zhì)量,而且接近于由單個聲碼處理過的話音信號所產(chǎn)生的話音質(zhì)量。自適應(yīng)濾波器可以被設(shè)計成修改來自第一聲碼器的話音信號的頻譜,以基本上補償由于第二聲碼處理所產(chǎn)生的所有數(shù)字失真。
盡管已經(jīng)利用一個典型實施例和一個優(yōu)選實施例描述了本發(fā)明,但應(yīng)該理解的是,本領(lǐng)域技術(shù)人員可以建議各種變化、替換以及修改,并且本發(fā)明應(yīng)該包括落入所附權(quán)利要求書范圍的這些修改、替換以及修改。
權(quán)利要求
1.一種通信方法,其特征在于,它包括步驟接收第一編碼話音信號,作為第一組話音信號參數(shù);將第一組話音信號參數(shù)指向第一語音解碼器,以生成一個話音信號;將來自第一話音解碼器的話音信號饋送到自適應(yīng)濾波器,以產(chǎn)生一個修改后的話音信號;將修改后的話音信號饋送到語音編碼器,以將該修改后的話音信號轉(zhuǎn)換成編碼后的話音信號,該編碼后的話音信號由一組話音信號參數(shù)所表示;以及傳送第二組話音信號參數(shù)。
2.根據(jù)權(quán)利要求1的方法,其特征在于,它包括步驟利用補償數(shù)字失真的自適應(yīng)濾波器來修改來自第一語音解碼器的話音信號頻譜,其中在解碼由第二組話音信號參數(shù)所表示的已編碼的修改話音信號時,將產(chǎn)生上述數(shù)字失真。
3.根據(jù)權(quán)利要求1的方法,其特征在于高于2400Hz的修改后話音信號頻率的dB具有從0到10dB的增加幅度。
4.根據(jù)權(quán)利要求1的方法,其特征在于低于2000Hz的修改后話音信號頻率的dB具有從0到6dB的增加幅度。
5.根據(jù)權(quán)利要求1的方法,其特征在于高于2000Hz的修改后話音信號頻率的dB具有從2到6dB的增加幅度。
6.根據(jù)權(quán)利要求1的方法,其特征在于在1500Hz到2400Hz之間的修改后話音信號頻率的dB具有從0到2dB的增加幅度。
7.根據(jù)權(quán)利要求1的方法,其特征在于在2400Hz到2850Hz之間的,以及在3150Hz到4000Hz之間的修改后話音信號頻率的dB具有從4到8dB的增加幅度。
8.根據(jù)權(quán)利要求1的方法,其特征在于在2850Hz到3150Hz之間的修改后話音信號頻率的dB具有從7到11dB的增加幅度。
9.一種無線呼叫連接,其特征在于耦合到無線接收機的語音解碼器,用于接收由一組表示話音信號的參數(shù)所構(gòu)成的信號,并且將接收到的信號轉(zhuǎn)換成一個話音信號;一個自適應(yīng)濾波器,用于接收來自該語音解碼器的話音信號,以產(chǎn)生一個修改后的話音信號,在話音信號被編碼時,該自適應(yīng)濾波器將產(chǎn)生由另一組表示該話音信號的參數(shù)所構(gòu)成的第二信號。
10.根據(jù)權(quán)利要求9的結(jié)構(gòu),其特征在于,該自適應(yīng)濾波器修改來自解碼器的、話音信號頻譜的選擇頻率的幅度。
11.根據(jù)權(quán)利要求10的結(jié)構(gòu),其特征在于,該自適應(yīng)濾波器修改來自解碼器的、話音信號頻譜的選擇頻率的幅度,以補償由編碼和解碼修改后的話音信號所引起的數(shù)字失真。
12.根據(jù)權(quán)利要求10的結(jié)構(gòu),其特征在于,該自適應(yīng)濾波器增加來自解碼器的、高于3000Hz的話音信號頻率的dB,以補償由編碼和解碼來自該自適應(yīng)濾波器的修改后話音信號所引起的數(shù)字失真。
13.根據(jù)權(quán)利要求10的結(jié)構(gòu),其特征在于,該自適應(yīng)濾波器的增加來自解碼器的、高于1500Hz的話音信號頻率的dB,以補償由編碼和解碼來自該自適應(yīng)濾波器的修改后話音信號所引起的數(shù)字失真。
14.根據(jù)權(quán)利要求10的結(jié)構(gòu),其特征在于,該自適應(yīng)濾波器增加來自解碼器的、高于3000Hz的話音信號頻率的dB,以補償由編碼和解碼來自該自適應(yīng)濾波器的修改后話音信號所引起的數(shù)字失真。
15.根據(jù)權(quán)利要求9的結(jié)構(gòu),其特征在于,該自適應(yīng)濾波器增加來自解碼的話音信號頻譜的選擇率的dB,以使由隨后編碼和解碼該修改后信號所產(chǎn)生的話音信號頻譜接近于來自語音解碼器的話音信號頻譜。
全文摘要
本發(fā)明提出了通過在話音信號被第二聲碼器處理之前,修改該話音信號的頻譜,以補償由該第二聲碼器所產(chǎn)生的數(shù)字失真,來改進具有匯接聲碼器處理的移動站到移動站電話呼叫的主觀話音質(zhì)量。一個自適應(yīng)濾波器可以用來修改話音信號的頻譜。利用該發(fā)明,從第一移動電話到第二移動電話的呼叫的話音質(zhì)量基本上類似于從移動電話到臺式電話的呼叫的話音質(zhì)量。
文檔編號G10L21/00GK1309521SQ0110299
公開日2001年8月22日 申請日期2001年2月13日 優(yōu)先權(quán)日2000年2月14日
發(fā)明者穆罕默德·R·謝利夫, 阿莫德·A·特拉夫 申請人:朗迅科技公司