許多不同頻率的個體信號的集合以數(shù)學(xué)方式表示,當(dāng)這些 個體信號被組合在一起時,將重新形成或重新構(gòu)造時域信號。簡單來說,頻域中的信號是各 種正弦信號的簡單數(shù)值表示,每個正弦信號具有不同的頻率,當(dāng)被添加在一起時,將重新構(gòu) 建時域信號。
[0019] 數(shù)字信號處理領(lǐng)域中普通技術(shù)人員知道對模擬和數(shù)字信號兩者的操縱和處理優(yōu) 選在頻域中進(jìn)行。數(shù)字信號處理領(lǐng)域中普通技術(shù)人員還知道模擬信號的樣本和這種樣本的 數(shù)字表示還可以被使用FFT轉(zhuǎn)換到頻域或在頻域中處理。因此為了簡短,省略了對FFT技 術(shù)的進(jìn)一步描述。
[0020] 圖5A描繪圖4中所不的并且包括第一樣本幀(幀0,表不有噪聲音頻信號,諸如圖 3中所示的有噪聲信號300)的第一十個相繼樣本400。照此,圖5A中所示的樣本幀包括與 噪聲200組合的清潔信號100的樣本。
[0021] 圖5B描繪圖4中所示的、在由參考數(shù)字402標(biāo)識的間隔期間取得的并且包括第二 樣本幀(幀1,僅表不噪聲200)的第二組十個相繼樣本404。
[0022] 圖6A和6B描繪圖5A和5B中所示的十個樣本的不同頻帶B1-B8中的各種不同頻 率的相對幅度。圖6A和6B中所示的頻率分量表示時域中的幀向頻域轉(zhuǎn)換的結(jié)果。
[0023] 不同的分量頻帶B1-B8 (其包括每個幀的十個樣本的FFT)在每個圖形的縱軸上被 示出;存在于幀的FFT中的每個頻帶B1-B8分量的相對幅度Amp沿"X"軸被顯示。因此圖 6A和6B示出了 10個相繼樣本或信號幀如何能夠在頻域中由不同頻率的相對幅度表示。因 此,音頻加噪聲以及噪聲自己可以由不同幅度的不同頻率來表示。
[0024] 數(shù)字信號處理領(lǐng)域中普通技術(shù)人員知道:存在一種方法,通過該方法,有噪聲信號 300的樣本的時域幀(諸如圖5A和5B中所示的幀)可以被轉(zhuǎn)換到頻域并且在頻域中被以數(shù) 字方式處理。一旦樣本被轉(zhuǎn)換到頻域,表示時域樣本的頻率(其表示原始有噪聲信號300) 就可以被選擇性地衰減以便抑制或衰減所識別的頻率分量,或者至少被認(rèn)為是噪聲200。換 句話說,當(dāng)樣本402的幀從時域被轉(zhuǎn)換到頻域并且?guī)腇FT表示被選擇性地處理以確定該 幀可能包含話音還是噪聲時,表示噪聲200的個體頻率可以在頻域中被衰減以使得當(dāng)原始 時域信號被重新構(gòu)造時,原始有噪聲信號300中存在的噪聲內(nèi)容302將被減小或消除。
[0025] 為了計算效率,這里描述的設(shè)備和方法每次十個地評估信號樣本的數(shù)字表示。十 個這樣的表示在這里被稱為"幀"。該處理優(yōu)選地由數(shù)字信號處理器(DSP)執(zhí)行,但是也能 夠由適當(dāng)編程的通用處理器執(zhí)行。
[0026] 圖7是無線通信裝置700的簡化框圖。裝置700包括常規(guī)麥克風(fēng)702,其把包括語 音信號704和背景聲學(xué)噪聲信號706的音頻信號轉(zhuǎn)化為電模擬信號708。因此來自麥克風(fēng) 702的輸出信號708是信息承載語音信號704,其與也由麥克風(fēng)702拾取的背景噪聲706組 合。
[0027] 從麥克風(fēng)702輸出的有噪聲語音708被常規(guī)模數(shù)(A/D)轉(zhuǎn)換器712轉(zhuǎn)換成數(shù)字格 式信號714。如公知的,A/D轉(zhuǎn)換器712以預(yù)先確定的速率采樣模擬信號并且把樣本轉(zhuǎn)換為 二進(jìn)制值,即數(shù)字值。
[0028] 來自A/D轉(zhuǎn)換器712的數(shù)字值(其是有噪聲語音信號708的樣本的表示714)在常 規(guī)的、數(shù)字的、帶通濾波器716中被數(shù)字濾波,濾波器716頻帶限制數(shù)字信號714并且因此 有效地頻帶限制來自麥克風(fēng)702的信號。數(shù)字濾波對于本領(lǐng)域普通技術(shù)人員來說是公知 的。
[0029] 有噪聲語音信號708的頻帶受限數(shù)字表示718由常規(guī)FFT轉(zhuǎn)換器720轉(zhuǎn)換到頻域 722。計算快速傅里葉變換(FFT)的幾種方法對于數(shù)字信號處理領(lǐng)域的普通技術(shù)人員來說 是公知的。因此為了簡短而省略了對FFT確定的描述。
[0030] 來自FFT轉(zhuǎn)換器720的頻域信號722被提供給MMSE確定器740。MMSE確定器740 處理各幀中樣本的頻域表示(即一次十個樣本)以確定這些幀可能表示語音還是噪聲。MMSE 確定器740衰減可能為噪聲的幀。來自MMSE確定器740的幀被提供給常規(guī)逆快速傅里葉 變換(iFFT)轉(zhuǎn)換器750。逆快速傅里葉變換(iFFT)轉(zhuǎn)換器750重新構(gòu)造減去由麥克風(fēng)702 拾取的至少一些背景噪聲的原始樣本的數(shù)字表示。常規(guī)數(shù)模轉(zhuǎn)換器(D/A) 760重新構(gòu)造原 始有噪聲音頻信號,但是重新構(gòu)造為噪聲減少信號762,其從常規(guī)傳輸器770被傳輸。噪聲 抑制因此在由MMSE確定器740執(zhí)行的頻域處理中發(fā)生。
[0031] 如下面描述的,由麗SE確定器740進(jìn)行的頻域中的數(shù)字信號處理提供對如下事 實(shí)的同時的和自適應(yīng)的概率或估計值:來自麥克風(fēng)702的(一個或多個)信號是語音還是噪 聲。MMSE確定器740還提供衰減因子,衰減因子用于選擇性地衰減每個子頻帶的分量,其示 例是圖6A和6B中描繪的子頻帶B1-B8。因此重要的是,準(zhǔn)確估計信號的頻域表示是表示語 音還是噪聲的表不。
[0032] 如這里使用的,"實(shí)時"指代一操作模式,在該操作模式中,在外部過程發(fā)生的實(shí)際 時間期間執(zhí)行計算以使得該計算結(jié)果可以被用于以及時的方式控制、監(jiān)視或響應(yīng)于外部過 程。確定信號樣本的頻域表示可能表示語音還是噪聲是公知的但并非不重要,并且要求實(shí) 時或幾乎實(shí)時地進(jìn)行許多計算。出于計算有效的目的,對樣本可能包含或表示語音還是噪 聲的確定不是在一個樣本接一個樣本的基礎(chǔ)上執(zhí)行,而是相反地在包括幀的多個相繼樣本 上執(zhí)行。在優(yōu)選實(shí)施例中,對來自麥克風(fēng)的信號包含語音還是噪聲的確定基于對表不十個 相繼樣本中的多個不同頻帶的數(shù)據(jù)的分析,該十個樣本在這里被稱為數(shù)據(jù)幀。
[0033] 簡單來說,MMSE確定器被配置為分析有噪聲音頻信號數(shù)據(jù)幀的頻域表示,從而確 定它們表示信號或噪聲的改進(jìn)可能性或概率。如這里使用的,語音存在概率或SPP和符 號i?可互換地使用。因此麗SE確定器740包括對如下過程的修飾:由Ephraim和Cohen 的 "Recent Advancements in Speech Processing," May 17,2004 (此后稱為 "Ephraim 和Cohen",其內(nèi)容通過引用被合并于此)描述的用于確定語音存在概率或SPP的現(xiàn)有 技術(shù)過程° 還參見 Y. Ephraim^PD. Malah, "Speech enhancement using a minimum mean square error short time spectral amplitude estimator,,' IEEE Trans. Acoust., Speech, Signal Processing, vol. 32, pp. 1109-1121, December 1984 ; P. J. Wolfe 和 S. J. Godsill, "Efficient alternatives to Ephraim and Malah suppression rule for audio signal enhancement, ,' EURASIP Journal on Applied Signal Processing, vol. 2003, Issue 10, Pages 1043-1051, 2003 ;Y. Ephraim 和 D. Malah, "Speech enhancement using a minimum mean square error Log-spectral amplitude estimator,,' IEEE Trans. Acoust. , Speech, Signal Processing, vol. 33, pp. 443-445,December 1985,所有這些內(nèi)容通過引用以其整體被合并于此。
[0034] 如這里使用的,術(shù)語"增益"實(shí)際上指代衰減。因此當(dāng)該術(shù)語在這里被使用時,增 益是負(fù)的。在Ephraim和Cohen以及這里的圖中,增益由變量"G"表示,就像6"_。
[0035] 麗SE確定器740確定SPP(如上面描述的那樣,其是估計值)或幀