專利名稱:移動音頻裝置的自動音量及動態(tài)范圍調整的制作方法
技術領域:
所揭示的實施例涉及移動音頻裝置的噪聲消除及自動音量調整。
背景技術:
圖1 (現(xiàn)有技術)為從語音信息移除噪聲及回聲的有源噪聲消除系統(tǒng)的圖表。第一 麥克風MIC1 (被稱作語音參考麥克風)放置于接近所要語音源處。其拾取來自蜂窩式 電話的用戶的聲語音信息且將其轉換成電語音信號1。此語音信號1受到背景噪聲的污 染。第二麥克風MC2 (被稱作噪聲參考麥克風)放置于接近噪聲源處或遠離語音源處。 其拾取聲噪聲且將其轉換成電噪聲參考信號2。假定噪聲參考信號2與語音信號相比相 對地無所要語音信息。分離電路3使用噪聲參考信號來消除噪聲且將傳入信號分成語音 信號4及噪聲信號5。語音信號4相對地無噪聲?;芈曄婕安捎米赃m應濾波器來模 擬回聲路徑。消除器6及7從由麥克風MIC1及MIC2輸出的信號減去所產生的回聲信 號。存在在各種技術領域中實踐的許多此類有源噪聲消除技術及電路。
移動通信裝置(例如,蜂窩式電話)通常具有小物理尺寸。這些小尺寸限制有源噪 聲消除系統(tǒng)的多個麥克風之間的距離。結果,噪聲參考信號通常并非無所要語音信息且 噪聲消除性能受到限制。簡單的有源噪聲濾波技術傾向于消除一些所要語音信號同時留 下一些未經消除的噪聲。
已在數(shù)字助聽器中使用被稱作盲源分離(BSS)的較復雜的噪聲消減技術。在此種 BSS系統(tǒng)中,噪聲消除系統(tǒng)的兩個麥克風位于助聽器用戶的耳朵中。因此,所述兩個麥 克風中無一者可主要用于拾取噪聲。兩個麥克風拾取語音以及待消除的噪聲。使用時間 反海畢安學習算法(temporal anti-Habbian learning algorithm)來分離噪聲與語音信息。 為獲得更多信息,參見M,吉洛拉米(M. Girolami)的"用于噪聲消除及信號分離的對稱 自適應最大可會旨性估計(Symmetric Adaptive Maximum Likelihood Estimation For Noise Cancellation And Signal Separation)"(電子學快報(Electronics Letters), 33( 17): 1437-1438 (1997));及在日本京都(1996)舉行的關于信號處理的神經網(wǎng)絡的正EE研討會(IEEE Workshop On Neural Networks for Signal Processing)上由K.托克拉(K. Torkkola)發(fā)表 的"基于信息最大化的巻積源的盲分離(Blind Separation Of Convolved Sources Based On Information Maximization)"。因為BSS系統(tǒng)的性能大體上依賴于脈沖響應對稱性及麥克風的適當放置,所以可應用額外信號處理。
圖2 (現(xiàn)有技術)為在一些蜂窩式電話中所采用的系統(tǒng)的圖表。在使用蜂窩式電話 時,蜂窩式電話用戶可收聽具有較柔和通路以及其它相對較大聲通路的音頻。如果用戶 正在嘈雜環(huán)境中收聽音頻,則背景噪聲可阻止用戶聽到較柔和通路。如果僅放大被供應 到揚聲器的總電信號,則較柔和通路將被放大以使得用戶可聽到較柔和通路,但較大聲 通路可接著被放大到發(fā)生削波的點。此削波將把不合需要的失真引入到從揚聲器發(fā)出的 聲音中。大聲的聲音還可損傷用戶的耳朵。為防止此種不良削波及失真,在時域中追蹤 信號8的振幅。將信號放大為輸入振幅的函數(shù)的增益,使得如果信號較弱則將信號放大 較大增益值,而如果信號較強則將信號放大較小增益值。因此,壓縮了總信號的動態(tài)范 圍。此處理可被稱作"壓縮"或"音頻動態(tài)范圍控制"(ADRC)且發(fā)生于ADRC塊10中。
接著將被稱作自動音量控制(AVC) 11的處理應用到ADRC塊IO的輸出。背景噪 聲的電平由麥克風12及相關電路13檢測。在低背景噪聲條件下,經壓縮的信號9無需 由AVC塊11放大且很大程度上未經放大地供應到揚聲器。然而,在高背景噪聲條件下, 經壓縮的信號9大體上由AVC塊11放大。歸因于由ADRC塊10執(zhí)行的壓縮,消減或 消除了對音頻的高振幅部分的削波。圖2的上述描述為簡化描述。參見美國專利第 6,766,176號以獲得更詳細描述。
發(fā)明內容
一種移動音頻裝置(舉例來說,例如蜂窩式電話的移動通信裝置)執(zhí)行音頻動態(tài)范 圍控制(ADRC)以限制音頻信號的動態(tài)范圍。自動音量控制(AVC)接著應用增益以 提升從所述ADRC輸出的信號的振幅。此放大在并不引入歸因于削波的實質失真的情況 下發(fā)生。所得經壓縮的音頻信號用以驅動移動音頻裝置的揚聲器。所述經壓縮的音頻信 號實際上通常經由介入電路(例如,常規(guī)的數(shù)字模擬轉換器)而間接地驅動揚聲器。
移動音頻裝置還執(zhí)行多麥克風有源噪聲消除(MMANC)。在一個實例中,MMANC 用以從在移動音頻裝置的麥克風上拾取的非噪聲音頻信息(例如,語音信息)移除背景 噪聲。所述非噪聲信息(例如,語音信息)經轉發(fā)到空中接口以供從移動音頻裝置傳輸。 在執(zhí)行有源噪聲消除操作期間,所述MMANC處理產生噪聲參考信號作為中間信號。
移動音頻裝置操作時所處的環(huán)境可涉及具有相對恒定特性的靜態(tài)噪聲,及/或還可涉 及較快速地改變的非靜態(tài)噪聲。舉例來說,如果移動音頻裝置的用戶處在擁擠的房間中, 則背景談話可引入此非靜態(tài)噪聲。舉例來說,如果所述用戶正沿熱鬧的街道行走,則經 過所述街道的車輛可引入此非靜態(tài)噪聲。在MMANC處理的一個實例中,由MMANC
6處理產生的噪聲參考信號經相對快速地調整以指示此非靜態(tài)噪聲的存在或缺乏。所述噪 聲參考信號以將傳入麥克風音頻樣本接收到MMANC處理中的近似速率而調整。有源噪 聲消除處理使得噪聲參考信號適當?shù)刂甘驹肼暤拇嬖诨蛉狈?,即使在移動音頻裝置的用 戶正在說話且用戶的語音正由麥克風拾取時。
在一個有利方面中,為在MMANC處理中所產生的中間信號的噪聲參考信號用以控 制ADRC及AVC處理。在一個實例中,噪聲參考信號經縮放且經濾波以產生控制信號。 所述控制信號為ADRC及AVC處理的AVC部分用以確定所述AVC部分應用到ADRC 部分的輸出的增益的參考。所應用的增益為所述控制信號的函數(shù)。
移動音頻裝置可為(例如)數(shù)字音頻播放器(例如,MP3播放器)、數(shù)字媒體播放 器(例如,具有圖像及視頻播放能力的iPOD)、數(shù)字相機、個人數(shù)字助理(PDA)、便 攜式個人計算機(例如,膝上型計算機),或移動通信裝置(例如,蜂窩式電話),或可 播放音頻的其它類似裝置。移動音頻裝置可能或可能不包括用于捕獲、存儲及/或傳輸在 麥克風上拾取的音頻信息的能力。
在下文的詳細描述中描述額外方法及結構。此概述并非意味著界定本發(fā)明。本發(fā)明 由權利要求書界定。
圖l (現(xiàn)有技術)為多麥克風有源噪聲消除系統(tǒng)的圖表。
圖2 (現(xiàn)有技術)為涉及音頻動態(tài)范圍控制(ADRC)及自動音量控制(AVC)的 在一些蜂窩式電話中所采用的系統(tǒng)的圖表。
圖3為根據(jù)一個新穎方面的移動音頻裝置100的一個特定類型的高級塊圖。
圖4為說明在圖3的MSM集成電路101中執(zhí)行的功能的功能塊圖。
圖5為圖4的音量控制及揚聲器補償功能塊122的一個實例的塊圖。
圖6為說明圖5的ADRC功能塊125的操作的曲線圖。
圖7為圖5的ADRC功能塊125的更詳細功能塊圖。
圖8為根據(jù)一個新穎方面的方法的流程圖。
具體實施例方式
圖3為根據(jù)一個新穎方面的移動音頻裝置100的一個特定實例的塊圖。在此實例中, 移動音頻裝置100為移動通信裝置,且更特定來說為蜂窩式電話。移動音頻裝置100包 括數(shù)字基帶集成電路101 (此處被稱作"移動臺調制解調器"或MSM)、第一射頻(RF) 收發(fā)器集成電路102、第二RF集成電路103、第一天線104、第二天線105,及將所述天線耦合到所述RF集成電路的一組其它離散組件。另外,移動音頻裝置IOO包括其它組件,例如,小鍵盤106、顯示器107、揚聲器108,以及第一麥克風109及第二麥克風110。
從天線105接收到移動音頻裝置100上的電話談話信息的一般路徑經過第一 RF集成電路102、跨越路徑111且到MSM 101的接收模擬數(shù)字轉換器(RXADC) 112中。如果信息為將在揚聲器108上聽到的語音信息,則由MSM IOI上的數(shù)字電路(例如,調制解調器塊113、處理器114)將信息處理成經語音編碼的數(shù)字值的流。經語音編碼的數(shù)字值的流由音頻塊115中的適當聲碼器解碼且將其轉換成接著被輸出以驅動揚聲器108的模擬信號。如果電話談話的語音將由移動音頻裝置100的麥克風拾取以經由天線105傳輸?shù)诫娫捳勗挼牧硪粎⑴c者,則信息的路徑從麥克風109及110延伸且到音頻塊115中。將信息轉換成數(shù)字形式,且音頻塊115中的適當聲碼器將信息編碼成經編碼的數(shù)字值的流。在由處理器114及調制解調器塊113處理之后,發(fā)射器數(shù)字模擬轉換器(TXDAC) 116將呈模擬形式的信息經由路徑117輸出到第二RF集成電路103。信息經過第二RF集成電路103、經過離散功率放大器及其它電路且到天線105以供傳輸。
圖4為說明在圖3的MSM集成電路101中執(zhí)行的功能的功能塊圖。在圖3的音頻塊115中提供兩個模擬數(shù)字轉換器(ADC) 118及119。 ADC 118將從第一麥克風109接收到的模擬信號數(shù)字化,而ADC 119將從第二麥克風110接收到的模擬信號數(shù)字化。在圖3的音頻塊115中提供數(shù)字模擬轉換器(DAC) 120。如所說明,由DAC120輸出的模擬信號驅動揚聲器108。圖4的圖表說明四個主要機構或功能塊l)后端信號處理功能塊121; 2)音量控制及揚聲器補償功能塊122; 3)多麥克風有源噪聲消除(MMANC)功能塊123;及4)信號調節(jié)功能塊124。功能塊122還可被稱作"揚聲器增益控制單元"。經過塊122及120到揚聲器108的音頻信號路徑有時被稱作"前向鏈路"。從麥克風109及110經過塊118、 119及123的音頻信號路徑有時被稱作"反向鏈路"。所述機構或功能塊121、 122、 123及124中的每一者可以軟件、固件、專用硬件或其組合來實現(xiàn)。在一個實例中,將圖4的功能塊121、 122及123實現(xiàn)為在集成電路101中的一個或一個以上處理器上執(zhí)行的處理器可執(zhí)行指令集。處理器可執(zhí)行指令集存儲于集成電路101中的一個或一個以上相關聯(lián)處理器可讀媒體(例如,ROM或其它半導體存儲器)中。
圖4的音量控制及揚聲器補償功能塊122執(zhí)行音頻動態(tài)范圍控制(ADRC)及自動音量控制(AVC)功能。因此,塊122包括ADRC功能塊125以及AVC功能塊126。
圖5進一步詳細展示音量控制及揚聲器補償功能塊122的一個特定實例。箭頭127表示從圖4的后端信號處理功能塊121傳遞到圖4的音量控制及揚聲器補償功能塊122中的數(shù)字的經脈沖編碼調制(PCM)的音頻信息值的流。箭頭128表示從圖4的音量控制及揚聲器補償功能塊122傳遞到圖4的DAC 120的經壓縮的數(shù)字音頻信息值的流。如圖5所說明,音量控制及揚聲器補償功能塊122包括輸出濾波器129、固定增益邏輯130、ADRC (有時被稱作"壓縮器")125、 AVC126,及用戶音量設定邏輯131 。ADRC及AVC:
移動音頻裝置100可用于具有包括靜態(tài)噪聲及非靜態(tài)噪聲的高電平的背景噪聲的環(huán)境中??紤]移動音頻裝置100的用戶正收聽從揚聲器108發(fā)出的聲音的情形。聲音的第一通路可相對柔和,因為數(shù)字音頻信息值的流127中的值的對應通路具有相對小的振幅。聲音的第二通路可相對大聲,因為數(shù)字音頻信息值的流127中的值的對應通路具有相對大的振幅。(術語"通路"在此處表示音頻的時間片或音頻信息值的流的其對應部分,其中通路是在時域中獲取以使得通路中的一者在時間上是在另一者之前出現(xiàn)。)如果未執(zhí)行動態(tài)范圍控制且如果流127的兩個通路僅被轉換成模擬形式且用以驅動揚聲器108,則用戶可歸因于高背景噪聲而難以聽到音頻的對應柔和通路。另一方面,如果將兩個通路放大相同增益值以使得可較容易地聽到較低振幅通路,則相對較高振幅通路可被放大太多以致于發(fā)生削波。此種削波通常為不合需要的,因為其將失真引入到從揚聲器108發(fā)出的聲音中。
存在可用于圖4的音量控制揚聲器補償塊122的不同實施例中的ADRC及AVC功能的多個不同變體。根據(jù)第一特定實例,對流127的數(shù)字值進行濾波且將其乘以固定增益。在于塊125中接收到流時,ADRC 125追蹤所述流的振幅電平。ADRC 125將流的數(shù)字值乘以增益值,所述增益值為傳入流的振幅(經由多個數(shù)字值所確定)的函數(shù)。
圖6為說明ADRC 125的操作的圖表。在本實例中,如果確定傳入振幅低于第一預定閾值T1,則應用為零的增益。此有時被稱作"噪聲門"。優(yōu)選地,在此種情形下,揚聲器108不輸出聲音。然而,如果傳入振幅在第一預定閾值T1與第二預定閾值T2之間,則隨著操作點從閾值T1沿著圖6的曲線圖中向上延伸的黑線移動到右邊,應用不斷增長的增益。ADRC 125的此操作區(qū)域有時被稱作"擴充"。如果傳入振幅在第二預定閾值T2與第三預定閾值T3之間,則應用恒定增益。此恒定增益由圖6中的傾斜虛線的斜率指示。如果傳入信號的振幅高于第三閾值T3,則隨著操作點從閾值T3沿著黑線移動到右邊,應用不斷減小的增益。ADRC 125的此操作區(qū)域有時被稱作"壓縮"。如果傳入信號的振幅高于第四閾值T4,則輸出"限于"MAX值。因此,以比傳入信號的高于T3的高振幅部分高的增益值來放大傳入信號的低于T3的低振幅通路。據(jù)稱信號127的總音頻信息的動態(tài)范圍由ADRC 125"壓縮"。所得經增益調整的分量值組成經壓縮的數(shù)字音頻信息值的流132。
自動音量控制(AVC) 126接著將增益應用到流132,因此產生經音量控制的數(shù)字值的流134。作為ADRC 125先前已限制音頻流的動態(tài)范圍的結果,在AVC功能塊126將流中的值放大所述增益時,用戶可較容易地從揚聲器108聽到音頻的較柔和通路,而音頻的較大聲通路未被放大太多以致于發(fā)生實質削波。消減或防止了歸因于削波的聲音失真。
在功能塊122的一個實例中,流127被分成多個頻帶。每一頻帶經受單獨ADRC及AVC處理。可針對不同頻帶將壓縮操作的各種參數(shù)(所應用的增益值及預定振幅閾值)設定為不同的。替代存在一個控制信號133,信號調節(jié)塊124針對每一頻帶產生控制信號。頻帶的控制信號用作所述頻帶的AVC處理的參考。在每一頻帶的ADRC及AVC處理之后,將所有頻帶的AVC處理的輸出流組合以形成經壓縮的數(shù)字音頻信息的單個流128。此流128經過用戶音量設定邏輯、被轉換成模擬形式且供應到揚聲器。 一些音樂具有頻率相對低的強烈大鼓鼓點。通過將此大鼓鼓點的能量分離到其自身頻帶中,可將
傾向于使音樂的大鼓鼓點分量相對于音樂的其它分量放大較少的增益及閾值應用到此頻帶。
圖4的ADRC及AVC功能塊的第二特定實例陳述于美國專利第6,766,176號中且更明確地說陳述于美國專利第6,766,176號中對圖8的上半部的論述中。圖5為此第二特定實例中的音量控制揚聲器補償功能塊122的更詳細圖表。如美國專利第6,766,176號中所解釋,輸出濾波器129將數(shù)字值提供到固定增益邏輯130,固定增益邏輯130又將數(shù)字值乘以固定增益G,因此產生經放大的數(shù)字樣本值。將經放大的數(shù)字樣本值提供到ADRC功能塊125 。 ADRC功能塊125執(zhí)行壓縮且產生經壓縮的數(shù)字音頻信息值的流132。AVC 126接收周期性更新的背景噪聲估計(BNE)控制信號133?;趯捎脙艨盏脑u估(如從接收自ADRC 125的Cthresh獲得且如從接收自塊131的當前音量電平信號獲得)及BNE控制信號133, AVC 126將流132中的數(shù)字值乘以增益值。AVC 126輸出供應到用戶音量設定邏輯131的經音量控制的數(shù)字值的流134。移動音頻裝置100的用戶可使用用戶音量設定邏輯131來手動地設定揚聲器音量電平,使得此后AVC 126將用戶所要揚聲器音量電平作為目標音量來控制揚聲器音量。因此,用戶音量設定邏輯131將以適當音量電平的經數(shù)字化的語音樣本的流128提供到DAC 120。 DAC 120又將流128轉換成用于驅動揚聲器108的模擬信號。
圖7為圖5的ADRC功能塊125的更詳細功能塊圖。參見美國專利第6,766,176號以獲得進一步詳情。在由固定增益邏輯130放大之后,將數(shù)字值樣本x[n]提供到濾波器
10300 (濾波器300為任選的且在某些實施例中可省略)且提供到延遲元件301。延遲元件
301 (其可實施為FIFO)用于預測性地控制輸出信號電平,因此在傳輸之前增高(attack)峰值。濾波器300可為帶通濾波器。RMS計算器302確定樣本的RMS (均方根)電平。在一個實施例中,RMS計算器302為應用到流數(shù)字值樣本的第一階低通濾波器。濾波器的時間常數(shù)經選擇以使得所關注的最小頻率分量可針對給定平滑濾波器實現(xiàn)恒定RMS輸出。將RMS電平值供應到對數(shù)計算邏輯303,其計算所述RMS電平值的以2為底的對數(shù)且將所述計算出的以2為底的對數(shù)值乘以0.5,因此產生以分貝(dB)為單位的輸出信號。將所述dB信號供應到加法器/減法器304,其從所述dB信號減去壓縮閾值Cthresh。將所得dB信號提供到壓縮器邏輯305,其對所述信號執(zhí)行壓縮功能。將所得信號提供到乘法器306,其將所述信號乘以衰減(負)壓縮斜率值Csl叩e。如果RMS電平升高到高于值Cthresh,則基于值Cslope將壓縮應用到信號(具有適當?shù)脑龈邥r間及釋放時間),所述值Cslope根據(jù)以下方程式將壓縮比R指定為dB的比率Cslope=l-l/R。可將壓縮比R界定為高于其時實際上發(fā)生所有壓縮的RMS電平。應根據(jù)正規(guī)化所要的平均dBmO談話者電平來選擇特定信號路徑的壓縮閾值Cthresh及壓縮斜率值Cslope。乘法器306將輸出dB信號提供到反對數(shù)計算邏輯307,其通過將值2升高到dB信號值(G,以dB為單位)的指數(shù)冪來計算dB信號的以2為底的反對數(shù)。反對數(shù)計算邏輯307產生輸出信號f[n]。將信號f[n]提供到增高/釋放時間應用邏輯(attack/release time application logic) 308,其根據(jù)以下的方程式1來產生信號g[n]:
g[n]= (1-k) g[n-l]+kf[n] (方程式l)其中值k為平滑系數(shù)。
增高釋放時間應用邏輯308應用第一階平滑函數(shù)以提供平滑增益曲線以便應用到輸出信號(值k依據(jù)是正應用增高還是釋放而改變)??蓪⒃龈邥r間設定為一毫秒以快速地且精確地增高輸入樣本中的峰值??蓪⑨尫艜r間設定為在100毫秒與200毫秒之間以防止快速增益波動影響壓縮的質量。將經平滑的信號g[n]提供到第二乘法器309。延遲元件301將數(shù)字樣本值x[n]延遲時間D,從而產生經延遲的輸出數(shù)字樣本值x[n-D]。將經延遲的數(shù)字樣本值x[n-D]提供到第二乘法器309。第二乘法器309將經延遲的樣本x[n-D]乘以平滑函數(shù)g[n],因此產生經壓縮的數(shù)字音頻信息值的流132。
MMANC:
存在適合用于圖3的移動音頻裝置100中的執(zhí)行多麥克風有源噪聲消除(MMANC)的多種不同方法。圖4說明一個特定實例。在圖4中,MMANC功能塊123從兩個麥克風109及110接收信號,且執(zhí)行回聲消除及信號增強以產生噪聲參考信號135及語音參考信號136。隨后的處理產生很大程度上無背景噪聲的經噪聲消除的麥克風信號137。 信號137為數(shù)字值的流。將信號137供應到后端信號處理功能塊121。功能塊121中的 適當聲碼器將數(shù)字值語音編碼成經語音編碼的值的對應流。在由圖的調制解調器113及 處理器114處理之后,由TXDAC 116將經語音編碼的值的流B8轉換成模擬信號。所 述模擬信號跨越路徑117傳送到RF集成電路103以供從天線105傳輸。
在圖4的MMANC功能塊123的特定實例中,來自麥克風109的模擬輸出信號由模 擬數(shù)字轉換器118數(shù)字化成經數(shù)字化的語音樣本值的所得流139。類似地,來自麥克風 110的模擬輸出信號由模擬數(shù)字轉換器119數(shù)字化成經數(shù)字化的語音樣本值的流140。 回聲消除器1功能塊141及回聲消除器2功能塊142為產生對流139及140中的回聲進 行模擬的信號的自適應數(shù)字濾波器。減法器143從流139減去經合成的回聲信號。將數(shù) 字值的所得經回聲消除的流139A供應到盲源分離(BSS)信號增強功能塊145。類似地, 減法器144從流140減去經合成的回聲信號。將數(shù)字值的所得經回聲消除的流140A供 應到盲源分離(BSS)信號增強功能塊145。盲源分離操作(在此項技術中有時還被稱 作獨立分量分析(ICA))使用時間反海畢安學習算法(temporal anti-Habbian learning algorithm)來產生噪聲參考信號135及語音參考信號136。為獲得額外信息,參見M-吉 洛拉米(M. Girolami)的"用于噪聲消除及信號分離的對稱自適應最大可能性估計 (Symmetric Adaptive Maximum Likelihood Estimation For Noise Cancellation And Signal Separation)"(電子學快報(Electronics Letters), 33 (17): 1437-1438 (1997));及在 日本京都(1996)舉行的關于信號處理的神經網(wǎng)絡的正EE研討會上由K'托克拉(K. Torkkola)發(fā)表的"基于信息最大化的巻積源的盲分離(Blind Separation Of Convolved Sources Based On Information Maximization),,。
非線性處理功能塊146首先在頻域中分解語音參考信號136及噪聲參考信號135以 獲得每一參考信號的多個不同頻譜分量(不同頻帶)。針對每一頻帶計算可變增益。在 一個實例中,所述可變增益由方程式(S-N)/S給出,其中S為頻帶中語音參考信號136 的量值,且其中N為頻帶中的噪聲參考信號135的量值。語音參考信號136頻帶含有一 些噪聲。所述可變增益經應用以進一步消減語音參考信號的每一頻帶中的此噪聲。在已 將所述可變增益應用到語音參考信號的每一單獨頻帶之后,將所得頻帶組合回成單個時 域信號147。
語音參考信號136通常含有具有語音信息的周期且還含有相對暫停(例如, 一句話 中的字之間的非語音暫停)的其它周期。話音活動檢測(VAD)決策信號148指示信號 136中是否存在語音或信號136中是否存在暫停。VAD決策信號148是基于在連續(xù)數(shù)字
12值的幀內收集的信息。在一個實例中,幀為經回聲消除的信號的八十個數(shù)字值,且VAD 信號148為單個位值。VAD決策每一幀更新一次。后處理功能塊149使用VAD決策信 號148。如果VAD決策信號指示存在語音,則后處理功能塊149應用第一增益值(例如, 為l的增益),而如果VAD決策信號指示存在暫停,則后處理功能塊149應用第二增益 值(例如,為0.5的增益)。從后處理功能塊149輸出的所得信號為經噪聲消除的麥克風 信號137。
在圖3的特定實例中,移動音頻裝置100為蜂窩式電話。因此,在麥克風109及110 上拾取的非噪聲音頻信息被稱作"語音"信息。因此,圖4中的信號136被稱作"語音參考 信號"。然而,應理解,移動音頻裝置100無需為蜂窩式電話。舉例來說,如果移動音 頻裝置100為數(shù)字音頻播放器(例如,MP3播放器),則由MMANC 123產生的中間信 號136更通常被稱作"音頻參考信號"。在數(shù)字音頻播放器的情況下,MMANC 123可不 輸出經噪聲消除的麥克風信號137,因為數(shù)字音頻播放器可不出于記錄及存儲的目的而 獲取音頻信息。
對ADRC及AVC的控制
根據(jù)一個新穎方面,由圖4的自動音量控制AVC 126應用的增益為由MMANC功 能塊123作為中間信號產生的噪聲參考信號135的函數(shù)。認識到許多蜂窩式電話采用相 當復雜的多麥克風有源噪聲消除技術。這些技術的應用導致將麥克風拾取信號分成語音 參考信號及噪聲參考信號。替代使用由圖2的常規(guī)電路中的電路13所檢測的背景噪聲 的電平來控制AVC功能的增益,使用由多麥克風有源噪聲消除功能性所產生的噪聲參 考信號來控制AVC功能的增益。在圖4的特定實例中,信號調節(jié)功能塊124接收噪聲 參考信號135且對所述噪聲參考信號135執(zhí)行縮放及數(shù)字濾波以產生控制信號133???制信號133為由MMANC功能塊123所檢測的背景噪聲的存在及量值的指示??刂菩盘?133快速地適于改變在麥克風109及110上檢測到的非靜態(tài)噪聲。在圖4的實例中,以 將傳入音頻樣本接收到信號增強塊145中的近似速率而改變控制信號133???例如) 以傳入音頻樣本139A及140A的速率的一半而改變控制信號133。
圖8為由圖3的移動音頻裝置IOO執(zhí)行的新穎方法的流程圖。從麥克風109及110 接收音頻信號(數(shù)字值樣本的流)(步驟200),且對所述音頻信號執(zhí)行多麥克風有源噪 聲消除(MMANC)(步驟201),因此產生語音參考信號136、噪聲參考信號135,及經 噪聲消除的麥克風信號137。由功能塊121中的適當聲碼器對所述經噪聲消除的麥克風 信號137進行語音編碼(步驟202),且由TXDAC116將所述結果轉換成模擬信號。將 所得模擬信號跨越路徑117供應到空中接口 (例如,CDMA空中接口、 WCDMA空中接口,或GSM空中接口)以供從移動音頻裝置100進行無線RF傳輸。步驟200到202 可(例如)為由在蜂窩式電話上所采用的常規(guī)MMANC電路執(zhí)行的步驟。
從所述空中接口接收第二模擬信號(步驟203),由RXADC112將其轉換成數(shù)字形 式,由塊121中的聲碼器將其解碼成數(shù)字音頻信息值的流127。對所述流127執(zhí)行ADRC (步驟204),因此產生經壓縮的數(shù)字音頻信息值的流132。對流132執(zhí)行AVC(步驟205)。 在一個新穎方面中,在AVC操作中應用的增益為噪聲參考信號135的函數(shù)。信號調節(jié) 功能塊124處理噪聲參考信號135,因此產生控制信號133??刂菩盘?33用以控制AVC 功能塊126。由用戶音量設定邏輯131 (參見圖5)任選地對AVC功能塊126的輸出進 行音量調整,由DAC 120將其轉換成模擬形式,且用以驅動圖4的揚聲器108。據(jù)稱 AVC功能塊126的輸出是經由常規(guī)的介入電路而間接地驅動揚聲器108。
雖然出于指導性目的而在上文中描述某些特定實施例,但本發(fā)明不限于此。因此, 在不脫離如權利要求書中所陳述的本發(fā)明的范圍的情況下,可實踐對所述特定實施例的 各種特征的各種修改、改進及組合。
權利要求
1.一種方法,其包含(a)執(zhí)行多麥克風有源噪聲消除(MMANC)且因此產生音頻參考信號及噪聲參考信號;(b)對數(shù)字音頻信息值的流執(zhí)行音頻動態(tài)范圍控制(ADRC)且因此產生經壓縮的數(shù)字音頻信息值的流;以及(c)對所述經壓縮的數(shù)字音頻信息值的流執(zhí)行自動音量控制(AVC),其中所述AVC的增益為所述噪聲參考信號的函數(shù)。
2. 根據(jù)權利要求1所述的方法,其中(a)的所述MMANC、 (b)的所述ADRC及(c) 的所述AVC為通過在處理器上執(zhí)行指令而執(zhí)行的操作,且其中所述處理器為移動 音頻裝置的一部分。
3. 根據(jù)權利要求1所述的方法,其中由蜂窩式電話執(zhí)行所述方法,其中(a)的所述 MMANC還導致產生經噪聲消除的麥克風信號,其中所述經噪聲消除的麥克風信號 為數(shù)字值的流,所述方法進一步包含對所述經噪聲消除的麥克風信號執(zhí)行聲碼器編碼功能。
4. 根據(jù)權利要求1所述的方法,其中(c)的所述AVC產生經音量控制的數(shù)字值的流, 所述方法進一步包含將所述經音量控制的數(shù)字值的流轉換成模擬信號;以及 使用所述模擬信號來驅動揚聲器。
5. 根據(jù)權利要求l所述的方法,其中(b)的所述ADRC涉及將增益應用到所述數(shù)字 音頻信息值的流,其中所述增益為所述數(shù)字音頻信息值的流的振幅的函數(shù)。
6. 根據(jù)權利要求5所述的方法,其中所述函數(shù)包括噪聲門部分、擴充部分、恒定增益 部分、壓縮部分及限制器部分。
7. 根據(jù)權利要求l所述的方法,其中在蜂窩式電話上執(zhí)行步驟(a)、 (b)及(c),且 其中所述音頻參考信號為語音參考信號。
8. 根據(jù)權利要求1所述的方法,其中在數(shù)字音頻播放器上執(zhí)行步驟(a)、 (b)及(c)。
9. '根據(jù)權利要求l所述的方法,其進一步包含將(a)的所述噪聲參考信號轉換成控制值,且其中所述控制值至少部分地確定 (c)的所述AVC的所述增益。
10. 根據(jù)權利要求1所述的方法,其中(c)的所述AVC的所述增益為以下兩者的函數(shù).-1)所述噪聲參考信號,以及2)可用凈空量。
11. 一種集成電路,其包含-多麥克風有源噪聲消除(MMANC)機構,其接收第一麥克風信號及第二麥克風 信號且輸出噪聲參考信號;音頻動態(tài)范圍控制(ADRC)機構,其接收數(shù)字音頻信息值的第一流且輸出數(shù)字 音頻信息值的第二流;以及自動音量控制(AVC)機構,其將所述數(shù)字音頻信息值的第二流放大一增益,其 中所述增益作為所述噪聲參考信號的函數(shù)而加以調整。
12. 根據(jù)權利要求11所述的集成電路,其中所述MMANC機構執(zhí)行盲源分離(BSS) 且產生所述噪聲參考信號及語音參考信號兩者,其中所述語音參考信號相對地無噪 聲,且其中所述噪聲參考信號相對地無語音。
13. 根據(jù)權利要求11所述的集成電路,其中所述數(shù)字音頻信息值的第一流與所述數(shù)字 音頻信息值的第二流的關系由函數(shù)描述,其中所述函數(shù)包括噪聲門部分、擴充部分、 恒定增益部分、壓縮部分及限制器部分。
14. 根據(jù)權利要求ll所述的集成電路,其中所述ADRC機構為第一指令集與處理器的 組合,其中由所述處理器對所述第一指令集的執(zhí)行產生所述數(shù)字音頻信息值的第二 流。
15. 根據(jù)權利要求14所述的集成電路,其中所述AVC機構為第二指令集與所述處理器 的組合,其中由所述處理器對所述第二指令集的執(zhí)行將所述數(shù)字音頻信息值的第二流放大所述增益。
16. 根據(jù)'權利要求11所述的集成電路,其中所述第一麥克鳳信號為以第一速率接收到 所述MMANC機構上的數(shù)字值的流,且其中由所述MMANC機構輸出的所述噪聲 參考信號由所述MMANC以近似所述第一速率的第二速率來調整。
17. —種設備,其包含用于控制作為噪聲參考信號的函數(shù)的增益的裝置,其中所述噪聲參考信號是使用 多麥克風有源噪聲消除來產生,且其中所述增益被應用到數(shù)字音頻信息值的流;以 及音頻動態(tài)范圍控制機構,其產生所述數(shù)字音頻信息值的流。
18. 根據(jù)權利要求17所述的設備,其中所述音頻動態(tài)范圍控制機構為處理器與存儲于 處理器可讀存儲器中的指令集的組合,其中由所述處理器對所述指令集的執(zhí)行產生 所述數(shù)字音頻信息值的流。
19. 根據(jù)權利要求17所述的設備,其進一步包含用于執(zhí)行所述多麥克風有源噪聲消除且因此產生所述噪聲參考信號的裝置。
20. 根據(jù)權利要求17所述的設備,其進一步包含用于執(zhí)行盲源分離(BSS)且因此產生所述噪聲參考信號的裝置。
21. 根據(jù)權利要求17所述的設備,其中所述設備為安置于移動裝置中的單個集成電路, 其中所述移動裝置取自由以下各項組成的群組數(shù)字媒體播放器、數(shù)字音頻播放器、 MP3播放器、個人數(shù)字助理、膝上型計算機、便攜式計算機、移動通信裝置及蜂 窩式電話。
全文摘要
一種移動音頻裝置(例如,蜂窩式電話、個人數(shù)字音頻播放器或MP3播放器)執(zhí)行音頻動態(tài)范圍控制(ADRC)(125)及自動音量控制(AVC)(126)以增加從所述移動音頻裝置的揚聲器發(fā)出的聲音(127)的音量,使得音頻的微弱通路將為更可聽得見的。微弱通路的此放大在不過度地放大其它較大聲通路且無歸因于削波的實質失真的情況下發(fā)生。舉例來說,使用多麥克風有源噪聲消除(MMANC)(133)功能性從所述移動音頻裝置的麥克風上拾取的音頻信息中移除背景噪聲。接著,可從所述裝置傳送所述經噪聲消除的音頻。所述MMANC功能性產生噪聲參考信號作為中間信號。通過所述AVC處理對所述中間信號進行調節(jié)且接著將其用作參考。在所述AVC處理期間所應用的增益為所述噪聲參考信號的函數(shù)。
文檔編號H03G3/32GK101669284SQ200880013792
公開日2010年3月10日 申請日期2008年4月30日 優(yōu)先權日2007年4月30日
發(fā)明者佩 向, 埃迪·L·T·喬伊, 普拉加科特·V·庫爾卡尼, 松 王, 薩米爾·庫馬爾·古普塔 申請人:高通股份有限公司