專利名稱:通過高頻壓縮提高語音的可理解性的系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本申請涉及通信系統(tǒng),和更具體地,涉及提高語音可理解性的系統(tǒng)。
背景技術(shù):
很多通信裝置獲得,同化并傳送語音信號。語音信號通過通信介質(zhì)從一個系統(tǒng)傳輸至另一個系統(tǒng)。所有的通信系統(tǒng),具體地?zé)o線通信系統(tǒng),受到帶寬限制。在一些系統(tǒng)中,包括在一些電話系統(tǒng)中,語音信號的清晰度取決于系統(tǒng)傳輸高頻和低頻的能力。由于很多低頻存在于通信系統(tǒng)的通帶中,所以該系統(tǒng)會阻止或衰減高頻信號,該高頻信號包括在無聲輔音(unvoiced consonant)中發(fā)現(xiàn)的高頻分量。
一些通信裝置可以通過處理頻譜而克服該高頻衰減。這些系統(tǒng)可以使用語音/靜默開關(guān)和有聲/無聲開關(guān)來識別和處理無聲語音。由于有聲和無聲片斷之間的轉(zhuǎn)換難于檢測,一些系統(tǒng)并不可靠并且不能用于實時的處理,尤其是易受噪聲或回響影響的系統(tǒng)。在一些系統(tǒng)中,開關(guān)是昂貴的并且產(chǎn)生使語音的感知失真的人為噪聲。
因此,需要一種系統(tǒng),其在有限的頻率范圍內(nèi)改進(jìn)語音的可感知聲音。
發(fā)明內(nèi)容
語音增強系統(tǒng)提高了語音信號的可理解性。該系統(tǒng)包括頻率轉(zhuǎn)換器和頻譜壓縮器。頻率轉(zhuǎn)換器把語音信號從時域轉(zhuǎn)換到頻域。頻譜壓縮器壓縮高頻頻帶的預(yù)選擇部分,并將壓縮的高頻頻帶映射到較低頻帶限制的頻率范圍。
根據(jù)對下文中的附圖和詳細(xì)說明的分析,本領(lǐng)域的技術(shù)人員將會更清楚本發(fā)明的其它系統(tǒng)、方法、特征和優(yōu)點。所有這樣的另外的系統(tǒng)、方法、特征和優(yōu)點都包括該說明中,包括在本發(fā)明的范圍內(nèi),并由后文中的權(quán)利要求進(jìn)行保護。
通過參考下面的附圖和說明,將會更好的理解本發(fā)明。圖中的部件并不需要的依照比例,而重點在于闡明本發(fā)明的原理。此外,在圖中,貫穿所有不同的視圖以相同的參考標(biāo)記表示相同的部件。
圖1是語音增強系統(tǒng)的框圖;圖2是未壓縮和壓縮信號的圖形;圖3是一組基本函數(shù)的圖形;圖4是原始說明的語音信號和該信號的壓縮部分的圖形;圖5是原始說明的語音信號和該信號的壓縮部分的第二圖形;圖6是原始說明的語音信號和該信號的壓縮部分的第三圖形;圖7是在車輛和/或電話或其它通信裝置中的語音增強系統(tǒng)的框圖;圖8是在車輛和/或電話其它通信裝置中連接到自動語音識別系統(tǒng)的語音增強系統(tǒng)的框圖。
具體實施例方式
增強邏輯提高了所處理的語音的可理解性。該邏輯可以識別和壓縮將進(jìn)行處理的語音片斷??梢詫x擇的有聲和/或無聲片斷進(jìn)行處理并轉(zhuǎn)換到一個或多個頻率頻帶。為了提高感知質(zhì)量,可以在時域或頻域進(jìn)行自適應(yīng)增益調(diào)節(jié)。該系統(tǒng)可以調(diào)節(jié)一些或全部語音片斷的增益。該系統(tǒng)的多功能性使得邏輯在一些應(yīng)用中在語音傳到第二系統(tǒng)之前增強語音。語音和音頻可以無線地或通過通信總線傳到自動語音識別(ASR)引擎,其中通信總線可以在時域和/或頻域獲取并提取語音。
任何有限帶寬裝置可從該系統(tǒng)受益。該系統(tǒng)可設(shè)置在任何有限帶寬裝置中,可以是任何有限帶寬裝置的整體部分,或可以連接到任何有限帶寬裝置。該系統(tǒng)可以是無線電裝置的一部分,或連接到無線電裝置,其中該無線電裝置為例如空中交通控制裝置(可具有相似的限制帶寬的通帶),無線電內(nèi)部通訊裝置(用于全體人員或用戶相互通信的移動或固定系統(tǒng)),以及在一個或多個藍(lán)牙鏈路上具有有限帶寬的諸如頭戴耳機的藍(lán)牙裝置。該系統(tǒng)也可以是連接到車輛,商業(yè)應(yīng)用或可以控制用戶的住所(如,聲音控制)的裝置的其它個人或商用有限帶寬通信系統(tǒng)的一部分。
在一些備選方案中,該系統(tǒng)可位于其它方案或系統(tǒng)之前。一些系統(tǒng)可使用自適應(yīng)濾波器、其它電路或可中斷增強邏輯的行為的編程。在一些系統(tǒng)中增強邏輯位于回聲消除器之前,并可以連接到回聲消除器(例如,衰減或基本上衰減多余聲音的系統(tǒng)或過程)。當(dāng)檢測到或處理回聲時,可自動禁止或減輕增強邏輯,并隨后啟動以防止壓縮和映射,及在一些情況下,回聲的增益調(diào)節(jié)。當(dāng)系統(tǒng)位于波束生成器之前或連接到波束生成器時,控制器或波束生成器(例如,信號組合器)可以控制增強邏輯的操作(例如,自動啟動,禁止,或減弱增強邏輯)。在一些系統(tǒng)中,該控制可以進(jìn)一步抑制失真,例如多路徑失真和/或同頻道干擾。在其它系統(tǒng)或應(yīng)用中,增強邏輯連接到在后自適應(yīng)系統(tǒng)或過程。在一些應(yīng)用中,增強邏輯連接到控制器或由其控制,該控制器防止或最小化非理想信號的增強。
圖1是增強邏輯100的框圖。增強邏輯100可以包含硬件和/或軟件,其可在一個或多個操作系統(tǒng)上運行或連接一個或多個操作系統(tǒng)。在時域,增強邏輯100可以包括轉(zhuǎn)換邏輯和壓縮邏輯。在圖1中,轉(zhuǎn)換邏輯包括頻率轉(zhuǎn)換器102。該頻率轉(zhuǎn)換器102提供輸入信號的時間到頻率的轉(zhuǎn)換。當(dāng)接收到信號時,頻率轉(zhuǎn)換器被編程為或配置為將輸入信號轉(zhuǎn)化到其頻譜。頻率轉(zhuǎn)換器可以實時的或延時的把模擬音頻或語音信號轉(zhuǎn)化到頻率的程控范圍(programmed range)內(nèi)。一些頻率轉(zhuǎn)換器102可以包括一組窄帶通濾波器,該濾波器有選擇的通過特定的頻率,而同時消除,最小化或抑制位于通帶外的頻率。其它增強系統(tǒng)100使用頻率轉(zhuǎn)換器102,其被編程或配置為基于快速傅立葉變換(FFT)而生成數(shù)字頻譜。這些頻率轉(zhuǎn)換器102可以收集自選定范圍或整個頻帶的信號以生成實時的,接近實時的或延時的頻譜。在一些增強系統(tǒng)中,頻率轉(zhuǎn)換器102自動的檢測并把音頻或語音信號轉(zhuǎn)換到頻率的程控范圍內(nèi)。
壓縮邏輯包括頻譜壓縮裝置或頻譜壓縮器104。頻譜壓縮器104把位于較高頻率范圍的寬范圍的頻率分量映射到較低,及在一些增強系統(tǒng)中較窄的頻率范圍。在圖1中,頻譜壓縮器104通過壓縮所選的高頻頻帶并將壓縮的頻帶映射到較低有限帶寬的頻率范圍,而處理音頻或語音范圍。當(dāng)應(yīng)用到通過例如電話帶寬的通信帶寬傳輸?shù)恼Z音或音頻信號時,該壓縮進(jìn)行轉(zhuǎn)換并將一些高頻分量映射到位于電話或通信帶寬中的頻帶。在增強系統(tǒng)中,頻譜壓縮器104將第一和第二頻率之間接近兩倍最高影響(interest)頻率的頻率分量映射到更短或更小的有限帶寬范圍。在這些增強系統(tǒng)中,有限帶寬范圍的上部截止頻率可與電話或其它通信帶寬的上部截止頻率大體一致。
在圖2中,圖1中所示的頻譜壓縮器104將指定截止頻率“A”和奈奎斯特頻率之間的頻率分量壓縮并映射到位于截止頻率“A”和“B”之間的有限帶寬范圍。如所示,位于大約2,800Hz和大約5,500Hz之間的無聲輔音(這里是字母“S”)的壓縮是壓縮并映射到界線為大約2,800Hz和大約3,600Hz的頻率范圍。低于截止頻率“A”的頻率分量是不改變的或基本上不改變的。在大約0Hz到大約3,600Hz之間的帶寬可與電話系統(tǒng)或其它通信系統(tǒng)的帶寬一致。也可使用與其它通信帶寬一致的其它頻率范圍。
用于一些增強系統(tǒng)的頻率壓縮方案將頻率壓縮與頻率變換進(jìn)行組合。在這些增強系統(tǒng)中,增強控制器可被編程以獲得壓縮的高頻分量。在一些增強系統(tǒng)中,使用等式1, (等式1)其中Cm是壓縮的高頻分量的幅度,gm是增益因數(shù),Sk是初始語音信號的頻率分量,m(k)是壓縮基本函數(shù),而k是離散頻率指數(shù)。盡管可以使用窗口函數(shù)的任何形狀作為非線性壓縮基本函數(shù)(m(k)),窗口函數(shù)包括三角形、漢寧(Hanning)、漢明(Hamming)、高斯、蓋博(Gabor)或微波窗口,例如,圖3示出了一組在一些增強系統(tǒng)中使用的典型的50%交迭的基本函數(shù)。這些三角形基本函數(shù)具有覆蓋窄頻率范圍的較低頻率基本函數(shù)和覆蓋較寬頻率范圍的較高頻率基本函數(shù)。
接著將頻率分量映射到較低頻率范圍。在一些增強系統(tǒng)中,增強控制器可被編程或配置為將頻率映射到等式2所示的函數(shù)。
S^k=Skk=1,2,...,foS^k=Ck-Fo|Sk|Skk=fo+1,fo+2,...,N]]>(等式2)在等式2中, 是壓縮的語音信號的頻率分量,和fo是截止頻率指數(shù)?;谠搲嚎s方案,初始語音的低于截止頻率指數(shù)fo的所有頻率分量保持不變或基本不變。將從截止頻率“A”到奈奎斯特頻率之間的頻率分量壓縮并移動到較低頻率范圍。該頻率范圍從較低截止頻率“A”延伸到較高截止頻率“B”,其也可以包括電話或通信通帶的上限。在增強系統(tǒng)中,較高頻率分量具有比接近上部截止頻率“B”更高的壓縮比例和更大的頻率轉(zhuǎn)換。因為高于截止頻率“B”的頻率載有對于準(zhǔn)確的語音識別非常關(guān)鍵的的重要輔音信息,所以這些增強系統(tǒng)提高了語音信號的可理解性和/或感知質(zhì)量。
為了維持基本的平滑和/或基本恒定的聽覺背景,可將自適應(yīng)高頻增益調(diào)節(jié)應(yīng)用到壓縮信號。在圖1中,增益控制器106可以通過噪聲檢測器108實時、接近實時或延時地測量或估計諸如背景噪聲信號的外來獨立信號,從而向壓縮信號應(yīng)用高頻自適應(yīng)控制。噪聲檢測器108檢測并可以測量和/或估計背景噪聲。背景噪聲可以為通信線、介質(zhì)、邏輯或電路固有,和/或是獨立于聲音或語音信號的。在一些增強系統(tǒng)中,大體恒定的離散背景噪聲或聲音保持在所選擇的帶寬中,例如從電話或通信帶寬的頻率“A”到頻率“B”。
增益控制器106可編程為僅放大和/或衰減壓縮頻譜信號,該壓縮頻譜信號在一些應(yīng)用中包括依照等式3所示函數(shù)的噪聲。在等式3中,輸出增益由 m=1,2,...,M (等式3)獲得,其中Nk是輸入背景噪聲的頻率分量。通過追蹤測量的或估計的噪聲水平的增益,一些增強系統(tǒng)可以在壓縮的和非壓縮的帶寬之間保持噪聲的水平一致(floor)。如果如圖4所示,噪聲隨著壓縮頻率頻帶中頻率的增加而下降,則信號的壓縮部分在壓縮后具有比壓縮前小的能量。在這些情況下,成比例的增益可應(yīng)用到壓縮的信號,從而調(diào)節(jié)壓縮信號的斜率。在圖4中,對壓縮信號的斜率進(jìn)行調(diào)節(jié),從而在壓縮頻率頻帶內(nèi)大致等于初始信號的斜率。在一些增強系統(tǒng)中,增益控制器106將圖4中所示的壓縮信號與等于或大于1且隨著壓縮信號的頻率而改變的乘數(shù)相乘。在圖4中,在壓縮帶寬的乘數(shù)之間的遞增的差值具有正傾向。
為了克服圖5中所示的壓縮信號頻帶內(nèi)的漸增的背景噪聲的影響,增益控制器106可以抑制或衰減信號的壓縮部分的增益。在這些情況下,將對壓縮信號的強度進(jìn)行抑制或衰減,從而調(diào)節(jié)壓縮信號的斜度。在圖5中,對該斜度進(jìn)行調(diào)節(jié),從而基本上等于在壓縮的頻率頻帶內(nèi)的初始信號的斜度。在一些增強系統(tǒng)中,增益控制器106將圖5中所示的壓縮信號乘以等于或小于1但大于0的乘數(shù)。在圖5中,乘數(shù)隨著壓縮信號的頻率而改變。在圖5中所示的壓縮帶寬內(nèi)乘數(shù)的增加的差值具有負(fù)傾向。
當(dāng)如圖6所示背景噪聲在預(yù)期的帶寬內(nèi)的所有頻率上相等或基本相等時,增益控制器106將在不放大或衰減的情況下通過壓縮信號。在一些增強系統(tǒng)中,增益控制器106并不在這些情況下應(yīng)用,而是將歸一化輸入信號的預(yù)處理控制器連接到語音增強系統(tǒng)的前端從而產(chǎn)生初始輸入語音片斷。
為了在有限帶寬頻率范圍內(nèi)最小化語音損耗,增強系統(tǒng)的截止頻率可隨著通信系統(tǒng)的帶寬改變。在具有等于約3,600Hz的帶寬的電話系統(tǒng)中,截止頻率位于大約2,500Hz到大約3,600Hz之間。在這些系統(tǒng)中,在最低截止頻率之下極少或沒有壓縮發(fā)生,相反的頻率越高,壓縮和轉(zhuǎn)換地越大。因此,可以保存告知斜度和可由人耳感知的較低諧波關(guān)系。
語音增強系統(tǒng)的另外的備選方案可以通過分析壓縮和非壓縮信號的信噪比(SNR)而實現(xiàn)。該備選方案認(rèn)識到元音的第二共振峰主要設(shè)置在低于約3,200Hz的頻率,并且其能量在較高頻率快速衰減。這對于例如/s/,/f/,/t/,和/t∫/的無聲輔音并不如此。代表輔音的能量可覆蓋頻率的較高范圍。在一些系統(tǒng)中,輔音可以存在于約3,000Hz到約12,000Hz之間。當(dāng)檢測到高的背景噪聲時,該噪聲可以在例如汽車的車輛內(nèi)檢測,那么輔音可能在較高頻率頻帶內(nèi)具有比較低頻率頻帶高的信噪比。在該備選方案中,通過控制器對位于截止頻率“A”和“B”之間的非壓縮范圍SNRA-Buncompressed的平均SNR與位于截止頻率“A”和“B”之間的即將被壓縮頻率范圍的SNRA-Bcompressed的平均SNR進(jìn)行比較。如果平均SNRA-Buncompressed大于或等于平均SNRA-Bcompressed,則不會發(fā)生壓縮。如果平均SNRA-Buncompressed小于平均SNRA-Bcompressed,那么會發(fā)生壓縮,且在一些情況下會發(fā)生增益調(diào)節(jié)。在該備選方案中,A-B代表頻帶。在該備選方案中控制器可以包括處理器,該處理器可以通過無線或諸如通信總線的有形通信介質(zhì)而調(diào)節(jié)頻譜壓縮器104。
語音增強系統(tǒng)和方法的另一備選方案通過連接到頻譜壓縮器的第二控制器將輸入信號的每個頻率分量的幅度與壓縮信號的位于相同頻率頻帶的對應(yīng)幅度進(jìn)行比較。在等式4S^koutput|=max(|Sk|,|S^k|)]]>(等式4)所示的該備選方案中,選擇位于截止頻率“A”和“B”之間的每個頻率槽的幅度作為壓縮或非壓縮頻譜的幅度中較大的一個。上述控制器,系統(tǒng)和方法中的每一個可編碼在信號承載介質(zhì)中,例如存儲器的計算機可讀介質(zhì)中,可編程在例如一個或多個集成電路的裝置中,或由控制器或計算機進(jìn)行處理。如果該方法由軟件執(zhí)行,那么該軟件可以位于存在于或連接到頻譜壓縮器104、噪聲檢測器108、增益調(diào)節(jié)器106、頻率時間轉(zhuǎn)換器110的存儲器中,或位于連接到或存在于語音增強邏輯中的其它類型的非易失或易失存儲器中。存儲器可以包括用于實現(xiàn)邏輯函數(shù)的可執(zhí)行指令的順序列表。邏輯函數(shù)可以通過數(shù)字電路,通過源代碼,通過模擬電路,或通過模擬源,例如模擬電的或光的信號來實現(xiàn)。軟件可以嵌入在任何計算機可讀或信號承載介質(zhì)中,以用于或連接到指令執(zhí)行系統(tǒng)、設(shè)備或裝置。這樣的系統(tǒng)可以包括基于計算機的系統(tǒng),包含處理器的系統(tǒng),或者其它系統(tǒng),其可有選擇的從指令執(zhí)行系統(tǒng)、設(shè)備或可以執(zhí)行指令的裝置中獲取指令。
“計算機可讀介質(zhì)”,“機器可讀介質(zhì)”,“傳輸信號”介質(zhì)和/或“信號承載介質(zhì)”可包含任何包括、存儲、通信、傳輸或傳送軟件的裝置,以由指令執(zhí)行系統(tǒng)、設(shè)備或裝置使用,或與指令執(zhí)行系統(tǒng)、設(shè)備或裝置共同作用。機器可讀介質(zhì)可選地為,電、磁、光、電磁、紅外線或半導(dǎo)體系統(tǒng)、設(shè)備、裝置或傳輸介質(zhì),但不限于此。機器可讀介質(zhì)的不完全列表可包括具有一條或多條導(dǎo)線的電連接“電”,便攜磁盤或光盤,諸如隨機訪問存儲器RAM(電)的易失存儲器、只讀存儲器ROM(電)、可擦可編程只讀存儲器(EPROM或閃存)(電)或光纖(光)。由于軟件可以圖像或另一格式(如,通過光掃描)而電存儲,隨后進(jìn)行匯編和/或翻譯或其它處理,所以機器可讀介質(zhì)也可包括其上印有軟件的有形介質(zhì)。接著,該處理介質(zhì)也可存儲在計算機和/或機器存儲器中。
語音增強邏輯100能適應(yīng)任何技術(shù)或裝置。如圖1所示,一些語音增強系統(tǒng)連接到或結(jié)合頻率時間轉(zhuǎn)換器110。頻率時間轉(zhuǎn)換器110將信號從頻域轉(zhuǎn)換到時域。由于一些時間頻率轉(zhuǎn)換器可基本上同時地處理一些或全部輸入頻率,所以頻率時間轉(zhuǎn)換器可被編程或配置為實時地、基本實時地或延時地轉(zhuǎn)換輸入信號。如圖8所示一些語音增強邏輯或部件連接到或結(jié)合遠(yuǎn)程或本地ASR引擎(示出了在汽車中可單獨地嵌入電話邏輯或車輛控制邏輯)。ASR引擎可嵌入在將語音或其它聲音轉(zhuǎn)換為可以傳輸?shù)竭h(yuǎn)端的形式的裝置,例如路上線路和無線通信裝置,其可包括電話和音頻裝置,并且可位于傳送人或物(如,車輛)或者裝置內(nèi)的獨立的裝置或結(jié)構(gòu)中。同樣地,語音增強可嵌入在個人通信裝置中,該通信裝置包括位于圖7所示的具有或不具有ASR的車輛以外的或連接到該車輛的步談機(walkie-talkies)、藍(lán)牙裝置(如,耳機)。
語音增強邏輯也適合并可連接到無線地或通過電或光連接而檢測和/或監(jiān)控聲音的系統(tǒng)。當(dāng)在高頻頻帶檢測到特定聲音時,系統(tǒng)可以禁止或另外地減輕增強邏輯以防止壓縮,映射以及一些情況下的信號的增益調(diào)節(jié)。通過總線,例如通信總線,噪聲檢測器可以發(fā)送中斷(硬件或軟件中斷)或消息以阻止或減輕這些聲音的增強。在這些應(yīng)用中,增強邏輯可以連接到或結(jié)合美國序列號11/006,935的“System forSuppressing Rain Noise”中說明的一個或多個電路、邏輯、系統(tǒng)或方法,在此結(jié)合其中每個作為參考。
語音增強邏輯提高了語音信號的可理解性。該邏輯可以自動的識別并壓縮將進(jìn)行處理的語音片斷??蓪⑺x的有聲和/或無聲片斷處理并移到一個或多個頻率頻帶。為了提高感知質(zhì)量,可以在時域或頻域進(jìn)行自適應(yīng)增益調(diào)節(jié)。該系統(tǒng)可調(diào)節(jié)僅僅部分或全部語音片斷的增益,其中一些調(diào)節(jié)是基于探測的或估計的信號。系統(tǒng)的多功能性使得邏輯在語音經(jīng)過或由第二系統(tǒng)處理前對其進(jìn)行增強。在一些應(yīng)用中,可將語音或其它音頻信號傳輸?shù)娇梢栽跁r域和/或頻域獲得并提取語音的遠(yuǎn)程、本地或移動ASR引擎。一些語音增強系統(tǒng)并不在語音和靜默或有聲和無聲片斷之間進(jìn)行轉(zhuǎn)換,因此更少的受吱吱聲、嘈雜聲、嘰喳聲、單擊聲、水滴聲、砰聲、低頻語音或其它產(chǎn)生在獲取或重新形成語音的一些語音系統(tǒng)中的聲音影響。
盡管已經(jīng)對本發(fā)明的各種實施例進(jìn)行了說明,然而對本領(lǐng)域的技術(shù)人員很清楚,在本發(fā)明的范圍內(nèi)可實現(xiàn)更多種實施例和應(yīng)用。因此,本發(fā)明并不被嚴(yán)格的限定,而僅根據(jù)附加的權(quán)利要求及其等效進(jìn)行限制。
權(quán)利要求
1.一種提高處理的語音的可理解性和質(zhì)量的語音系統(tǒng),包括頻率轉(zhuǎn)換器,其將語音信號轉(zhuǎn)換到頻譜;和頻譜壓縮器,其電連接到所述頻率轉(zhuǎn)換器,并壓縮預(yù)選擇的高頻頻帶且將所述壓縮的高頻頻帶映射到較低的有限帶寬頻率范圍。
2.根據(jù)權(quán)利要求1所述的系統(tǒng),其中所述頻率轉(zhuǎn)換器被編程為接近實時地自動將所述語音信號轉(zhuǎn)換到其頻譜。
3.根據(jù)權(quán)利要求1所述的系統(tǒng),其中所述頻率轉(zhuǎn)化器被編程為或被配置成實時地自動將所述語音信號轉(zhuǎn)換到頻譜。
4.根據(jù)權(quán)利要求1所述的系統(tǒng),其中所述高頻頻帶包括比所述較低有限帶寬頻率范圍更大的頻率范圍。
5.根據(jù)權(quán)利要求1所述的系統(tǒng),其中所述頻譜壓縮器包括非線性壓縮基本函數(shù)。
6.根據(jù)權(quán)利要求1所述的系統(tǒng),其中較低有限帶寬頻率范圍包括模擬帶寬的一部分。
7.根據(jù)權(quán)利要求1所述的系統(tǒng),其中較低有限帶寬頻率范圍包括電話帶寬的一部分。
8.根據(jù)權(quán)利要求1所述的系統(tǒng),還包括噪聲檢測器,其被配置成在檢測所述語音信號時對當(dāng)前噪聲水平進(jìn)行檢測和測量。
9.根據(jù)權(quán)利要求1所述的系統(tǒng),還包括噪聲檢測器,其被配置成在檢測所述語音信號時對當(dāng)前噪聲水平進(jìn)行檢測和估計。
10.根據(jù)權(quán)利要求1所述的系統(tǒng),還包括增益控制器,其被配置成對與獨立外部信號相關(guān)的所述壓縮高頻頻帶的增益進(jìn)行調(diào)節(jié)。
11.根據(jù)權(quán)利要求10所述的系統(tǒng),其中所述獨立外部信號包括背景噪聲。
12.根據(jù)權(quán)利要求1所述的系統(tǒng),還包括連接到頻譜壓縮器的增益控制器,其中頻譜壓縮器被配置成在較低有限帶寬頻率范圍內(nèi)基本上僅調(diào)節(jié)壓縮高頻頻帶的增益。
13.根據(jù)權(quán)利要求12所述的系統(tǒng),其中頻譜壓縮器被配置成應(yīng)用多個增益調(diào)節(jié),所述增益調(diào)節(jié)隨著獨立于所述檢測的語音信號的信號而改變。
14.一種提高處理的語音的可理解性的語音系統(tǒng),包括頻率轉(zhuǎn)換器,其將語音信號轉(zhuǎn)換到其頻域;頻譜壓縮器,其連接到所述頻率轉(zhuǎn)換器,并壓縮預(yù)選擇的高頻率頻帶,且將所述壓縮的高頻率頻帶映射到較低頻率頻帶;噪聲檢測器,其被配置成檢測和估計當(dāng)前噪聲的水平;和增益控制器,其被配置成與獨立的外部信號的變化水平相對成比例地調(diào)節(jié)所述壓縮高頻頻帶的增益。
15.根據(jù)權(quán)利要求14所述的語音系統(tǒng),還包括控制所述頻譜壓縮器的控制器,所述控制器包括監(jiān)控器,所述監(jiān)控器將所述壓縮信號的信噪比與信號壓縮前的信噪比進(jìn)行比較。
16.根據(jù)權(quán)利要求14所述的語音系統(tǒng),其中所述增益控制器被配置成應(yīng)用隨著外部信號的變化水平改變的增益。
17.根據(jù)權(quán)利要求14所述的語音系統(tǒng),其中所述增益控制器被配置成應(yīng)用變化增益,其使得所述壓縮信號的水平與所述獨立外部信號的水平基本一致。
18.一種提高處理的語音的可理解性的語音系統(tǒng),包括頻率轉(zhuǎn)換器,其實時地將語音信號從時域轉(zhuǎn)換到頻域;頻譜壓縮器,其連接到所述頻率轉(zhuǎn)換器,并壓縮預(yù)選擇的高頻率頻帶,且將所述壓縮的高頻率頻帶映射到電話通帶內(nèi)的較低頻率頻帶;噪聲檢測器,其被配置成檢測和測量語音信號的背景噪聲水平;和增益控制器,其被配置成將變化增益應(yīng)用到與所述背景噪聲水平相關(guān)的所述壓縮的高頻頻帶。
19.根據(jù)權(quán)利要求18所述的語音系統(tǒng),還包括通過通信總線控制所述頻譜壓縮器的控制器,所述控制器將檢測到的語音信號的一部分的信噪比與壓縮信號的一部分的信噪比進(jìn)行比較。
20.根據(jù)權(quán)利要求19所述的語音系統(tǒng),其中所述控制器被編程為通過頻率槽的比較而比較幅度。
21.根據(jù)權(quán)利要求19所述的語音系統(tǒng),還包括連接到所述增益控制器的自動語音識別系統(tǒng)。
全文摘要
一種提高處理的語音的可理解性和感知質(zhì)量的語音增強系統(tǒng),包括頻率轉(zhuǎn)換器和頻譜壓縮器。頻率轉(zhuǎn)換器將語音信號從時域轉(zhuǎn)換到頻域。頻譜壓縮器壓縮高頻頻帶的預(yù)選擇部分,并將壓縮的高頻頻帶映射到較低的有限帶寬頻率范圍。
文檔編號G10L21/02GK101030382SQ20061006475
公開日2007年9月5日 申請日期2006年11月29日 優(yōu)先權(quán)日2005年12月9日
發(fā)明者P·A·赫瑟林頓, X·李 申請人:Qnx軟件操作系統(tǒng)(威美科)有限公司