本文中公開的實施例總體上涉及音頻信號處理,并且更具體地,涉及用于音頻信號中的脈沖噪聲抑制的方法和系統(tǒng)。
背景技術:
通信系統(tǒng),諸如在電話會議系統(tǒng)、電話系統(tǒng)或音頻記錄系統(tǒng)中采用的這些,通常操作在嘈雜環(huán)境中。在這些情景中,噪聲信號可能連同所期望的音頻數據一起被系統(tǒng)采集。典型的噪聲信號可以被分類為平穩(wěn)噪聲和非平穩(wěn)噪聲。平穩(wěn)噪聲包括持續(xù)較長時間段并且展現出相對穩(wěn)定特性的噪聲。另一方面,非平穩(wěn)噪聲包括具有隨著時間快速變化的特性的噪聲。平穩(wěn)噪聲的一個示例是采集設備所處的房間中的背景噪聲。非平穩(wěn)噪聲的一個示例是通過按壓采集設備上的機械按鈕(例如,靜音按鈕)而產生的點擊聲,該點擊聲被表示為在所采集的信號中出現的短期突發(fā)。
通常需要處理處理所采集的信號以抑制平穩(wěn)噪聲和非平穩(wěn)噪聲,以便在回放時提高感知質量。因為平穩(wěn)的背景噪聲具有穩(wěn)定的特性并且能夠被更容易地預測,已經存在研究出并且已經應用了許多噪聲抑制算法來有效地從所采集的信號中移除平穩(wěn)的背景噪聲。然而,由于非平穩(wěn)噪聲(例如,脈沖噪聲)具有快速變化的特性,它們相對難以被抑制或者甚至難以從所采集的信號中被可靠地檢測。
當前,一種脈沖噪聲抑制的現有方案涉及借助語音活動檢測來將所采集的信號的幀簡單地劃分為語音幀或非語音幀,并且然后僅向非語音幀應用抑制增益。這是基于非語音幀具有更少的可能性包含有價值的音頻數據,這在語音幀包含脈沖噪聲的情況中是不合實際的。因此,這個方案具有較高的噪聲抑制錯誤率和對語音質量的較高影響。音頻信號分析的延遲可能允許做出更好的決策,使用未來的幀來幫助 判斷是否抑制當前幀。然而,所引入的延遲在交互式語音或通信應用中是不可接受的。
技術實現要素:
為了解決上述問題和其他潛在的問題,本文中公開的示例實施例提出了一種音頻信號中的脈沖噪聲抑制的方法和系統(tǒng)。
在一個方面,本文中公開的示例實施例提供了一種音頻信號中的脈沖噪聲抑制的方法。該方法包括從音頻信號的當前幀中確定與脈沖噪聲相關的特征。該方法還包括基于脈沖噪聲相關的特征,在當前幀中檢測脈沖噪聲,以及響應于在當前幀中檢測到脈沖噪聲,向當前幀應用抑制增益,以抑制脈沖噪聲。這方面的實施例還包括相應的計算機程序產品。
在另一個方面,本文中公開的示例實施例提供了一種音頻信號中的脈沖噪聲抑制的系統(tǒng)。該系統(tǒng)包括特征確定單元,被配置為從音頻信號的當前幀中確定與脈沖噪聲相關的特征。該系統(tǒng)還包括噪聲檢測單元,被配置為基于脈沖噪聲相關的特征,在當前幀中檢測脈沖噪聲,以及噪聲抑制單元,被配置為響應于在當前幀中檢測到脈沖噪聲,向當前幀應用抑制增益,以抑制脈沖噪聲。
通過下文描述將會理解,根據本文中公開的示例實施例,基于從輸入音頻信號提取的脈沖噪聲的特有特征,在該音頻信號的每個幀中檢測脈沖噪聲的存在,并且在檢測到脈沖噪聲時對音頻信號的相應幀執(zhí)行噪聲抑制。由于對音頻信號中被檢測到脈沖噪聲的相應幀執(zhí)行噪聲抑制,增加了脈沖噪聲移除的效率并且減少了對語音質量的影響。此外,特征提取和噪聲抑制均基于當前幀而不需要前瞻性查看,這引入了較小的處理延遲。本發(fā)明的實施例所帶來的其他益處將通過下文描述而清楚。
附圖說明
通過參考附圖閱讀下文的詳細描述,本文中所公開的示例實施例 的上述以及其他目的、特征和優(yōu)點將變得易于理解。在附圖中,以示例而非限制性的方式示出了本文中所公開的若干實施例,其中:
圖1示出了根據本發(fā)明的一個示例實施例的音頻信號中的脈沖噪聲抑制的方法的流程圖;
圖2示出了根據本發(fā)明的一個示例實施例的示例三聲道方向性麥克風拓撲和該拓撲中的麥克風的極化圖案;
圖3示出了根據本發(fā)明的一個示例實施例的脈沖噪聲抑制的系統(tǒng)的框圖;
圖4示出了根據本發(fā)明的一個示例實施例的針對脈沖噪聲的功率譜模型的示意圖;
圖5示出了根據本發(fā)明的一個示例實施例的圖3的系統(tǒng)中的噪聲抑制器的框圖;
圖6示出了根據本發(fā)明的一個示例實施例的音頻信號中的脈沖噪聲抑制的系統(tǒng)的框圖;以及
圖7示出了適于實現本文中公開的示例實施例的示例計算機系統(tǒng)的框圖。
在各個附圖中,相同或對應的標號表示相同或對應的部分。
具體實施方式
下面將參考附圖中示出的若干示例實施例來描述本文中所公開的示例實施例的原理。應當理解,描述這些實施例僅僅是為了使本領域技術人員能夠更好地理解進而實現本文中所公開的示例實施例,而并非以任何方式限制本文中所公開的主題的范圍。
本文中所公開的示例實施例可以被配置為特征化脈沖噪聲,以便在音頻信號中檢測脈沖噪聲的存在,并且然后在檢測到脈沖噪聲的音頻幀中執(zhí)行噪聲抑制。根據本文中所公開的實施例,由于相較于語音信號或其他正常信號,脈沖噪聲通常存在一些特有的特征,通過從輸入音頻信號中提取這些特征并且利用這些特征來檢測脈沖噪聲,可以對存在脈沖噪聲的相應音頻幀具體地執(zhí)行噪聲抑制。所提出的方案從 而增加了脈沖噪聲移除的效率并且維持了對語音質量的最小影響。此外,所提出的方案僅涉及低的延遲信號處理,該處理僅使用來自當前音頻幀的信息以及可能使用來自先前的音頻幀的信息而不需要前瞻性查看。
首先參照圖1,其示出了根據本發(fā)明的一個示例實施例的音頻信號中的脈沖噪聲抑制的方法100的流程圖。
在步驟S101,從音頻信號的當前幀中確定與脈沖噪聲相關的特征。
根據本文中公開的實施例,音頻信號可以由如下的設備來采集,該設備具有一個麥克風或者具有多個麥克風的麥克風陣列。取決于所配備的麥克風或麥克風陣列,音頻信號可以是單聲道信號或多聲道信號。將理解的是,當麥克風陣列處的單個聲道是有效的時候,所采集的音頻信號也可以是單聲道的。圖2描繪了示例三聲道方向性麥克風拓撲和該拓撲中的麥克風的極化圖案。配備有這個麥克風拓撲的設備可以采集來自三個輸入聲道的信號并且將這些信號組合在一起以獲得所采集的音頻信號。應當注意的是,圖2是出于示例性解釋說明而被給出,并且要被處理的音頻信號可以由具有其他麥克風拓撲的設備采集(例如,全方位麥克風陣列,或者具有比三個麥克風更多或更少的麥克風的麥克風陣列)。
音頻采集設備可以是任何類型的具有一個或多個麥克風的通信設備或音頻記錄設備,包括但不限于電話會議設備、移動手持式設備、多媒體設備、臺式計算機、膝上型計算機、個人數字助理(PDA)、或者它們的組合。
音頻采集設備通常操作在嘈雜環(huán)境中并且采集到與所期望的音頻數據重疊的噪聲信號,音頻數據包括語音或其他聲音。如以上所討論的,因為脈沖噪聲具有一些特有的特征,可以從音頻信號中特征化脈沖噪聲。例如,脈沖噪聲通常是在功率方面高于普通語音的短期突發(fā)的噪聲,并且具有更多的高頻分量。因此,音頻信號的高頻范圍與低頻范圍之間的頻譜傾斜(spectral tilt)或者音頻信號的當前幀與先前幀的功率之前的功率差異(也被稱為增量功率)可以用于指示在當前幀 中是否存在脈沖噪聲。
此外,所采集的脈沖噪聲大多數時候涉及機械噪聲(例如,處理噪聲(handling noise)、按鈕噪聲、與桌面耦合的噪聲),并且在麥克風陣列處具有不同于普通語音信號和其他聲學噪聲的特性。通常機械脈沖噪聲的聲音源接近于采集設備(例如,離采集設備小于50cm)。例如,通過按壓設備上的機械按鈕(例如,靜音按鈕、數字鍵按鈕、揚聲器按鈕等)而產生點擊聲,并且該按鈕通常位于非常接近麥克風陣列的位置。對于機械脈沖噪聲,可能存在與麥克風陣列的機械耦合而不是麥克風的可行的聲學上承受的激勵。就此而言,從所采集的音頻信號的聲源(例如,機械按鍵)到采集設備(更具體地,是麥克風陣列)的空間鄰近度可以指示是否存在脈沖噪聲。在一些實施例中,由相應的多個麥克風采集的信號之間的相位和/或強度的高相關性可以指示近的空間性。理由是脈沖噪聲在麥克風處通常是相關的,因為這些麥克風以類似的方式接收這類噪聲,而沒有跨越麥克風陣列的聲學傳播的一般距離或相位影響。
對于音頻信號的每一幀,可以確定一個或多個脈沖噪聲相關的特征,用以檢測在該幀中是否存在脈沖噪聲。例如,如果頻譜傾斜和/或增量功率指示音頻信號的當前幀包含大量的高頻分量,并且相關性特征指示當前幀的聲音源靠近采集設備,則確定在該幀中可能存在脈沖噪聲。
注意到在要被處理的音頻信號是單聲道的情況中,包括頻譜傾斜和增量功率的特征可以被用于噪聲檢測和抑制判決,而在音頻信號包含兩個或更多單聲道信號的情況中,上述所有特征均可以被使用。
脈沖噪聲相關的特征的確定將在以下詳細描述。
方法100行進至步驟S102,基于脈沖噪聲相關的特征,在當前幀中檢測脈沖噪聲。
在本文中公開的實施例中,所提取的(多個)脈沖噪聲相關的特征可以指示脈沖噪聲在音頻信號中的存在。在一些實施例中,多于一個的所提取的特征可以以線性/非線性方式進行組合,以輸出脈沖噪聲 得分,該脈沖噪聲得分指示脈沖噪聲存在的概率。輸出的得分可以與預定的閾值相比較,以判斷在當前幀中是否檢測到脈沖噪聲。在一些實施例中,輸出的得分可以是二元的。也就是說,輸出的得分可以是0或1的值。0的值可以用于指示不存在脈沖噪聲,而1的值可以用于指示檢測到脈沖噪聲。備選地,脈沖噪聲得分可以被確定為0和1之間的連續(xù)值,或者任何其他的連續(xù)值。脈沖噪聲得分越大,存在脈沖噪聲的概率越高。
在步驟S103,響應于在當前幀中檢測到脈沖噪聲,向當前幀應用抑制增益,以抑制脈沖噪聲。
抑制增益可以大于或等于零,并且小于一。在一些實施例中,抑制增益可以被預定為固定的值,例如,0.5、0.7等。當在當前幀中檢測到脈沖噪聲時,固定的抑制增益可以被直接地用于抑制脈沖噪聲。在一個實施例中,如果相信脈沖噪聲存在,抑制增益可以被設置為零,以在當前幀中阻擋噪聲。備選地,抑制增益可以基于脈沖噪聲得分來確定。在一些實施例中,抑制增益可以與該得分成反比。脈沖噪聲得分越大,抑制增益越小,從而更強的噪聲抑制可以被應用到當前幀。
在本文中公開的一些實施例中,為了進一步提高抑制性能,噪聲功率模型可以被用作先驗知識來特征化所檢測到的脈沖噪聲的功率。噪聲功率模型可以指示由采集音頻信號的設備獲得的脈沖噪聲的噪聲功率。噪聲功率模型可以基于該設備的機械結構和/或該設備所處的環(huán)境來構建。通過分析由該設備采集的先前的脈沖噪聲,可以定義脈沖噪聲模型。抑制增益可以基于由噪聲功率模型所指示的噪聲功率以及音頻信號的功率來確定。如果噪聲功率接近于音頻信號的功率,可以應用較小的抑制增益,從而更強的噪聲抑制可以被應用到當前幀。基于噪聲功率模型確定的抑制增益將在以下更詳細描述。
在本文中公開的一些實施例中,抑制增益可以是被應用到寬帶音頻信號的寬帶增益。在本文中公開的一些其他實施例中,可以定義預定的抑制方案,以將不同的子帶增益應用到音頻信號的相應頻帶,這將在以下更詳細地描述。
圖3示出了根據本文中公開的一個示例實施例的脈沖脈沖噪聲抑制的系統(tǒng)300的框圖。系統(tǒng)300可以被包括在采集設備中,用于執(zhí)行由該設備采集的音頻信號的脈沖噪聲抑制。系統(tǒng)300也可以在采集設備的外部,并且具有與該設備的有線或無線連接。在這種情況下,系統(tǒng)300可以從采集設備接收音頻信號并且對該信號執(zhí)行脈沖噪聲抑制。如圖3所描繪的,系統(tǒng)300包括特征提取器31,噪聲檢測器32和噪聲抑制器33。
特征提取器31被配置為從輸入音頻信號的當前幀中提取脈沖噪聲相關的特征。脈沖噪聲相關的特征可以包括音頻信號的高頻范圍與低頻范圍之間的頻譜傾斜,和/或音頻信號的當前幀與先前幀之間的功率差異。附加地或備選地,脈沖噪聲相關的特征可以包括音頻信號的聲音源與采集設備之間的空間鄰近度,和/或由設備的相應麥克風采集的信號之間的相關性。所提取的特征被傳遞至噪聲檢測器32。
噪聲檢測器32被配置為通過分析所提取的噪聲來檢測在當前幀中是否存在脈沖噪聲。檢測結果然后被提供至噪聲抑制器33。噪聲抑制器33被配置為基于檢測結果來判斷是否向當前幀應用抑制增益。如果檢測結果指示存在脈沖噪聲,則噪聲抑制器33可以對當前幀執(zhí)行噪聲抑制。如果檢測結果指示不存在脈沖噪聲,則噪聲抑制器33可以不對音頻信號采取動作。
理解的是,圖3的系統(tǒng)300被示出為一個示例,并且在系統(tǒng)中可以具有更多或更少的功能塊/子塊。
現在詳細描述一些示例的脈沖噪聲相關的特征的確定。
在本文中公開的一些實施例中,從音頻信號的聲音源到采集該音頻信號的設備的空間鄰近度可以被確定為脈沖噪聲相關的特征并且被用于指示是否存在脈沖噪聲。
在本文中公開的一個實施例中,由采集設備的至少兩個麥克風分別采集的單聲道信號之間的相位和/或強度相關性可以用于衡量該音頻信號與該設備之間的空間鄰近度。由于脈沖噪聲的聲音源、諸如機械按鈕相對于設備聲音或背景噪聲的聲音源而言更接近該設備,所生 成的脈沖噪聲在該設備的麥克風陣列處相關。原因在于這些麥克風以類似的方式接收這個脈沖噪聲,而沒有跨越麥克風陣列的聲學傳播的一般距離或相位影響。
為了確定相關性,在一個實施例中,可以首先確定音頻信號的當前幀的協(xié)方差矩陣。在這種情況下,要被處理的輸入音頻信號可以由配備有至少兩個麥克風的設備采集,從而協(xié)方差矩陣可以表示由這些麥克風分別采集的單聲道信號之間的相關性。在本文中公開的實施例中,協(xié)方差矩陣可以如下地逐幀計算:
C(i,k)=X(i,k)XH(i,k) (1)
其中C(i,k)表示協(xié)方差矩陣,X(i,k)表示頻域中的輸入音頻信號,i表示頻帶索引,k表示幀索引,并且上標H表示厄米特(Hermitian)共軛置換。輸入音頻信號包含X(i,k)由所配備的麥克風采集的信號。例如,對于配備有如圖2所示的麥克風拓撲的設備,輸入音頻信號X(i,k)可以被表示為[L(i,k),R(i,k),S(i,k)],其中L(i,k)、R(i,k)和S(i,k)表示分別由三個麥克風采集的信號的頻域版本。
根據公式(1),可以為當前幀確定不同頻帶的協(xié)方差矩陣。備選地或附加地,也可以確定當前幀的寬帶的協(xié)方差矩陣。在本文中公開的一些其他實施例中,還可以通過對當前幀的相應多個樣本的協(xié)方差矩陣取平均來確定時域的協(xié)方差矩陣。
在本文中公開的一些實施例中,可以通過平滑因數來平滑協(xié)方差矩陣。例如,當前幀的協(xié)方差矩陣可以如下地被平滑:
C(ω,k)=αC(ω,k-1)+(1-α)X(ω,k)XH(ω,k) (2)
其中C(ω,k-1)表示先前幀k-1的協(xié)方差矩陣,并且α表示0到1范圍內的平滑因數。將理解的是,寬帶協(xié)方差矩陣和時域協(xié)方差矩陣可以類似地進行平滑。
如以上所提及的,所獲得的協(xié)方差矩陣可以表示由麥克風分別采集的單聲道信號之間的相關性。如果協(xié)方差矩陣是對角矩陣,這意味著這些單聲道信號之間不相關。否則的話,除了協(xié)方差矩陣的對角線 之外的位置上的非零值可以表示這些信號之間的相關程度。如果在音頻采集設備的麥克風采集信號時發(fā)生脈沖噪聲、諸如脈沖點擊噪聲,由于脈沖噪聲的源比正常的音頻源更接近采集設備,該脈沖噪聲可以被每個麥克風采集。因此,單聲道信號之間的相關性相對較高,因為這些信號均包含脈沖噪聲。在這種情況下,當前幀的協(xié)方差矩陣(其指示單聲道信號的相位或強度之間的相關性)可以被用作空間鄰近度特征,以指示是否存在脈沖噪聲。為當前幀k計算的相關性可以被表示為鄰近度得分P(k)。
如以上所討論的,脈沖噪聲的聲音源,例如按壓其則產生點擊噪聲的按鈕,與采集設備足夠接近,導致所有麥克風同時采集到相同的噪聲信號。在這種情況下,所采集的信號可能在所有方向中具有基本上相等的信號強度。為了獲得空間鄰近度,在本文中公開的一些其他實施例中,可以確定音頻信號在兩個或更多方向中的強度。如果這些強度基本上彼此相等,這意味著音頻信號的聲音源接近于采集設備,并且因此可能在音頻信號中檢測到脈沖噪聲。
本文中對方向的提及涉及與由麥克風檢測到的具體聲音源或聲音活動有關的空間確定。應當注意到,就此意義而言的方向不限于僅在聲學意義上的相對麥克風的入射(incidence)的具體角度或相對麥克風的距離的字面含義。相反,當圍繞麥克風陣列提及方向的概念時,它指的是與設備激勵的具體形式(聲學的和機械的)有關的、針對聲音源的麥克風的信號相關性屬性的聚類或分割。已知的是,不同的源位置或機械定向,連同麥克風的幾何配置和耦合配置,產生了特定的空間檢測幾何結構(geometry),該幾何結構具有在麥克風輸入的相關性或協(xié)方差空間中的良好形成的表示。為了簡單化,這些輸入源通常被稱為具有不同方向或距離的源。
在本文中公開的一些實施例中,為了確定和比較音頻信號在不同方向中的信號強度,可以首先確定音頻信號的當前幀的協(xié)方差矩陣。在這些實施例中,可以針對寬帶音頻信號計算協(xié)方差矩陣,或者可以針對音頻信號的相應頻帶確定多個協(xié)方差矩陣??梢詫f(xié)方差矩陣執(zhí) 行特征分解(eigen-decomposition),以獲得特征向量和特征值。例如,當前幀k的寬帶協(xié)方差矩陣C(k)的特征分解可以被定義為:
[V,D]=eigen(C(k)) (3)
其中V表示每一列指示協(xié)方差矩陣C(k)的一個特征向量的矩陣,并且D表示以降序順序排列的對應特征值的對角線矩陣。在一個示例中,當音頻信號是三聲道信號時,矩陣V和D均是3乘3矩陣。也就是說,特征值或特征向量的數目與輸入聲道的數目相同。
在對角線矩陣D中給出的特征值指示在矩陣V指示的方向中的音頻信號中的最高信號強度。當特征值彼此接近時,這意味著來自所有方向的信號強度基本上相等,這可能指示音頻信號包含接近的脈沖噪聲。因此,基于所獲取的特征值,可以針對音頻信號的當前幀確定鄰近度得分,該鄰近度得分指示空間鄰近度。在一個實施例中,鄰近度得分可以被確定為最大特征值比上第二大的特征值的比率,其可以被表示為如下:
其中P(k)表示當前幀k的鄰近度得分,D(1,1)表示最大特征值,并且D(2,2)表示第二大的特征值。D(1,1)和D(2,2)兩者均位于對角線矩陣D的對角線上。高的鄰近度得分可以指示音頻信號到采集設備的較近的鄰近度和音頻信號的較高相關性。在這個實施例中,鄰近度得分越接近1,脈沖噪聲存在的概率越高。
注意到,在以上實施例中,音頻信號可以由具有至少兩個麥克風的設備采集,以便確定指示音頻信號的聲音源與該設備之間的空間鄰近度的鄰近度得分。還注意到,鄰近度得分可以以許多其他方式確定。例如,鄰近度可以被定義為第二大的特征值比上第三大的特征值之間的比率,或者通過特征分解獲得的對角線矩陣D的對角線上的任何兩個特征值之間的比率。
在本文中公開的一些實施例中,可以對當前幀的不同頻帶的相應 協(xié)方差矩陣C(i,k)執(zhí)行特征分解。在這些實施例中,可以相應地計算針對各個頻帶的鄰近度得分,以便指示在各個頻帶中是否存在脈沖噪聲。如此,然后可以對特定的頻帶準確地執(zhí)行隨后的噪聲抑制。
在本文中公開的一些實施例中,脈沖噪聲相關的特征可以包括音頻信號的頻譜傾斜??梢酝ㄟ^將音頻信號的當前幀的高頻范圍中的功率與低頻范圍中的功率相比較來確定頻譜傾斜。
在這些實施例中,當前幀的寬帶頻率可以被劃分為兩個部分,高頻范圍和低頻范圍。例如,對于具有1000Hz到16kHz的頻率范圍的音頻信號的幀,低頻范圍可以從1000Hz跨越到4000Hz,并且高頻范圍可以從4000Hz跨越至最多16kHz。高頻范圍和低頻范圍可以分別進一步被劃分為多個頻帶。位于高頻范圍中的各個頻帶的功率可以加和在一起,并且位于低頻范圍中的各個頻帶的功率也可以加和在一起。在一個實施例中,在每個頻帶中的功率可以通過該頻帶中的信號強度的平方來計算。在音頻信號是多聲道信號的情況中,在每個頻帶中的功率可以是多個聲道中的各個信號強度的平方之和。
在已經為各個頻帶計算協(xié)方差矩陣的一些實施例中,高頻范圍中的加和功率可以是針對高頻范圍中的頻帶而確定的協(xié)方差矩陣的對角線上的數值之和。低頻范圍中的加和功率可以是針對低頻范圍中的頻帶而確定的協(xié)方差矩陣的對角線上的數值之和。假設低頻范圍從1000Hz到4000Hz,具有從25到40的頻帶索引,并且高頻范圍從4000Hz到最多16kHz,具有從41到56的頻帶索引。低頻范圍和高頻范圍中的加和功率可以被計算為:
其中Tr表示協(xié)方差矩陣C(i,k)的對角線,wlow(k)表示低頻范圍中的加和功率,whigh(k)表示高頻范圍中的加和功率,i表示頻帶索引,并且k表示幀索引。
在本文中公開的一個實施例中,可以通過高頻范圍中的加和功率比上低頻范圍中的加和功率的比率來確定當前幀的頻譜傾斜,指示音頻信號的當前幀在頻域中的形狀。相較于語音信號,脈沖噪聲通常包括更多的高頻分量,因為語音信號通常具有從200Hz到2000Hz的低頻范圍。因此,頻譜傾斜可以用作當前幀是否存在脈沖噪聲的指示。如果頻譜傾斜被確定為較大,這意味著更多的功率被包含在當前幀的高頻范圍中。在這種情況下,當前幀包含脈沖噪聲的概率較高。
為了將最終值界定在0到1的范圍以便避免異常功率值的影響和促進后續(xù)的數學計算,頻譜傾斜可以被確定為:
其中T(k)表示頻譜傾斜。
應當注意的是,可以以許多其他方式來通過比較高頻范圍和低頻范圍中的功率確定頻譜傾斜。在一個實施例中,頻譜傾斜可以由兩個功率之間的功率差異來確定。當功率差異大于閾值時,指示在音頻信號中可能存在脈沖噪聲。備選地,頻譜傾斜還可以是低頻范圍中的功率比上高頻范圍中的功率的比率。在這個實施例中,頻譜傾斜越低,存在脈沖噪聲的概率越高。
以上討論的頻譜傾斜可以指示音頻信號的當前幀在頻域中的形狀。在一些其他實施例中,可以通過將音頻信號的當前幀的高頻范圍中的功率和音頻信號的先前幀的高頻范圍中的功率相比較,來確定另一個脈沖噪聲相關的特征,即音頻信號的增量功率。增量功率可以表示當前幀在時域中的形狀,例如功率從先前幀起的改變。由于脈沖噪聲通常是音頻信號中的短期突發(fā),可以預見到功率跨幀的突然跳躍。因此,增量功率可以用于特征化脈沖噪聲,指示在當前幀中是否存在脈沖噪聲。在本文中公開的一個實施例中,可以由當前幀的高頻范圍中的功率與先前幀的高頻范圍中的功率之間的差異來確定增量功率。在另一個實施例中,增量功率還可以如下地被計算:
其中D(k)表示增量功率。
在本文中將理解的是,先前幀不必要是由當前幀直接緊隨著的幀,而是可以是與當前幀由短時間間隔的任何先前的幀。在這些實施例中僅考慮高頻范圍中的功率,因為音頻信號的低頻分量可能包含較多的語音分量,其將潛在地降低這個特征與語音的可區(qū)分性。
以上描述了一些示例脈沖噪聲相關的特征的確定,諸如協(xié)方差矩陣、頻譜傾斜、增量功率和空間鄰近度的確定。理解的是,存在許多其他的脈沖噪聲相關的特征可以用來特征化脈沖噪聲,并且本文中所描述的主題的范圍在此方面不受限制。
所提取的特征可以促進從音頻信號中檢測脈沖噪聲。在本文中公開的實施例中,可以分析所提取的特征中的一個或多個特征,用以確定脈沖噪聲的存在。例如,協(xié)方差矩陣、頻譜傾斜、增量功率和空間鄰近度(例如,鄰近度得分)之一可以被用來獨立地做出關于脈沖噪聲的存在的決策。例如,如以上所討論的,由協(xié)方差矩陣指示的相關性越高,脈沖噪聲存在的概率越高。
在其中采用了所提取的特征中的一些或全部特征的實施例中,可以以線性或非線性的方式來組合這些特征,以獲得指示脈沖噪聲的存在的概率的脈沖噪聲得分。例如,脈沖噪聲得分可以被定義為鄰近度得分P(k)、頻譜傾斜T(k)和增量功率D(k)的乘積。通過將脈沖噪聲得分與預定的閾值相比較,可以做出決策來判斷是否存在脈沖噪聲。這個檢測方案可以被表示為如下:
其中M_THR表示預定閾值。M(k)=1表示在當前幀k中存在脈沖噪聲,并且M(k)=0表示不存在脈沖噪聲。如果,鄰近度得分P(k)、頻譜傾斜T(k)和增量功率D(k)被確定在0到1的范圍中,例如分別通過公式 (4)、(7)和(8)而被計算,閾值M_THR可以被設置為0到1的范圍中的值。例如,閾值M_THR可以被預定為0.4、0.5、0.6等。應當注意的是,取決于所提取的特征的取值范圍,該閾值可以被設置為其他數值,并且本文中公開的主題的范圍在此方面不受限制。
在本文中公開的一些實施例中,鄰近度得分P(k)、頻譜傾斜T(k)和增量功率D(k)的加權和可以被確定為脈沖噪聲得分,用以與預定閾值相比較。在一些其他實施例中,所提取的特征可以以許多其他方式進行組合以指示脈沖噪聲得分。
在本文中公開的一些進一步的實施例中,因為一些提取的特征、諸如協(xié)方差矩陣和鄰近度得分可以是頻帶特定的特征,檢測結果可以更準確以指示脈沖噪聲信號是否存在于每個頻帶中。例如,獨立地基于針對每個頻帶確定的一個鄰近度得分或者結合其他提取的特征一起,可以獲得針對該頻帶的脈沖噪聲得分。如果脈沖噪聲得分高于閾值(其可以是頻帶特定的),可以檢測出脈沖噪聲存在于這個頻帶中。
如以上所討論的,響應于基于所提取的(多個)特征在當前幀中檢測到脈沖噪聲,可以將抑制增益應用到該幀中以抑制脈沖噪聲。抑制增益可以在一個實施例中可以是寬帶增益。在另一個實施例中,可以為不同的頻帶預先確定更準確的子帶增益來抑制脈沖噪聲。在這種情況下,當在當前幀中檢測到脈沖噪聲時,可以將所有子帶增益應用到相應的頻帶。備選地,僅當在當前幀的一個頻帶中檢測到脈沖噪聲時,才將對應的子帶增益應用到這個頻帶,這可以進一步提高抑制性能和減少音頻信號的失真。
在一些實施例中,為了進一步最小化語音失真,可以為由采集設備采集到的脈沖噪聲構建噪聲功率模型。由于采集設備通常位于相同的環(huán)境中,并且在許多情況下脈沖噪聲來自于對設備上的機械按鈕的點擊,由該設備采集的脈沖噪聲信號可能是相對一致且是特有類型的信號。因此,可以測量并且建??梢员徊杉目赡艿拿}沖噪聲的功率。噪聲功率模型可以指示由采集音頻信號的設備所獲得的脈沖噪聲的噪聲功率。噪聲功率模型可以基于該設備的機械結構(諸如設備上的機 械按鍵的分布等)和/或該設備所處的環(huán)境。脈沖噪聲模型還可以基于該設備采集的先前的脈沖噪聲的功率。通過分析由該設備采集的先前的脈沖噪聲,可以定義出噪聲功率模型。
噪聲功率模型可以被預定為由設備采集的一個或多個先前的脈沖噪聲的平均功率值。備選地或附加地,噪聲功率模型可以被預定為功率譜模型,其具有(多個)先前脈沖噪聲的所有頻帶中的相應功率。出于示例的目的,圖4描繪了針對脈沖噪聲的示例功率譜模型的示意圖。
當輸入音頻信號并且在音頻信號的當前幀中檢測到脈沖噪聲時,可以基于噪聲功率模型和音頻信號的當前幀的功率,確定抑制增益。噪聲功率模型、例如預定的功率值可以用于指示所檢測的脈沖噪聲的噪聲功率。由于抑制增益被應用到音頻信號中以抑制其中的脈沖噪聲,抑制增益可以與噪聲功率負相關。噪聲功率越接近當前幀的功率,抑制增益越低,從而更強的噪聲抑制可以被應用到當前幀。例如,可以首先確定預定的噪聲功率值與音頻信號的當前幀的功率之間的功率差異,并且然后抑制增益可以被計算為功率差異比上當前幀的功率的比率。應當注意的是,存在許多其他方式來基于預定噪聲功率和音頻信號的功率確定抑制增益,并且本文中公開的主題的范圍在此方面不受限制。
在功率譜模型被預先確定的實施例中,可以從功率譜模型中獲得每個頻帶中的功率值并且這些功率值用于指示所檢測的脈沖噪聲在對應的頻帶中的噪聲功率。這個噪聲功率也可以被用來確定特定于該頻帶的抑制增益。
在本文中公開的一些進一步的實施例中,脈沖噪聲在真實環(huán)境中隨著時間衰減,而不是假設脈沖噪聲僅存在于當前幀中而不會對后續(xù)的幀有影響。為了更好地模擬脈沖噪聲的影響,可以引入房間衰減因數(home decay factor)來計算脈沖噪聲功率的衰減版本。房間衰減因數可以基于RT 60來配置,RT 60指示信號的功率從它的初始水平降落至60dB所經過的時間。根據本文中公開的實施例,如果在先前幀 中檢測到脈沖噪聲并且在當前幀中不存在脈沖噪聲,可以基于房間衰減因數和預定的噪聲功率或功率譜來確定衰減的噪聲功率。然后可以基于衰減的噪聲功率和音頻信號的當前幀的功率來計算抑制增益。
由于抑制增益被應用到音頻信號以抑制其中的脈沖噪聲,抑制增益可以與衰減的噪聲功率負相關。衰減的噪聲功率越接近當前幀的功率,抑制增益越低,從而更強的噪聲抑制可以被應用到當前幀。例如,可以首先確定衰減的噪聲功率值與音頻信號的當前幀的功率之間的功率差異,并且然后抑制增益可以被計算為功率差異比上當前幀的功率的比率。應當注意的是,存在許多其他方式來基于衰減的噪聲功率和音頻信號的功率確定抑制增益,并且本文中公開的主題的范圍在此方面不受限制。抑制增益可以被應用到音頻信號的當前幀以抑制在先前幀中檢測到的脈沖噪聲的衰減版本。
可以看出,盡管在當前幀中未檢測到存在脈沖噪聲,也可以在先前幀中檢測到脈沖噪聲的情況下對當前幀執(zhí)行噪聲抑制。由此還可以抑制在實際房間中先前發(fā)生的脈沖噪聲的反射和/或回響部分。
根據以上關于預定噪聲功率的描述,對于當前幀,它的估計的噪聲功率可以如下地被確定:
MN(k)=max(NS*M(k),β*MN(k-1)) (10)
其中MN(k)表示當前幀k的估計的噪聲功率,NS表示由采集音頻信號的設備獲得的脈沖噪聲的預定噪聲功率,M(k)表示公式(9)中指示的檢測結果,并且β表示房間衰減因數。
從公式(10)可以看出,如果在當前幀k中檢測到脈沖噪聲(例如,M(k)=1),該幀的估計的噪聲功率MN(k)等于預定噪聲功率NS。如果在當前幀k中未檢測到脈沖噪聲(例如,M(k)=0),該幀的估計的噪聲功率MN(k)是先前幀的噪聲功率的衰減版本β*MN(k-1)。
可以基于估計的噪聲功率(其可以是預定噪聲功率或衰減的噪聲功率)來計算抑制增益。估計的噪聲功率越接近當前幀的功率,抑制增益越低,從而更強的噪聲抑制可以被應用到當前幀。例如,可以首先確定估計的噪聲功率值與音頻信號的當前幀的功率之間的功率差 異,并且然后抑制增益可以被計算為功率差異比上當前幀的功率的比率,其可以被表示為如下:
其中InP(k)表示當前幀k的功率,MN(k)表示估計的噪聲功率,并且G(k)表示抑制增益。
應當注意的是,存在許多其他方式來基于估計的噪聲功率和音頻信號的功率確定抑制增益,并且本文中公開的主題的范圍在此方面不受限制。
圖5描繪了根據本發(fā)明的一個示例實施例的系統(tǒng)300中的示例噪聲抑制器33的框圖。噪聲功率模型被引入在噪聲抑制器33中。如所描繪的,噪聲抑制器33包括輸入功率計算器331、功率模型構建器332、抑制增益計算器333和抑制單元334。
輸入功率計算器331被配置為確定輸入音頻信號的當前幀的輸入功率。輸入功率被傳遞至抑制增益計算器333。
功率模型構建器332被配置為建模由采集設備采集的脈沖噪聲并且構建脈沖噪聲的噪聲功率模型,該噪聲功率模型可以指示由采集設備先前獲得的脈沖噪聲的功率。噪聲功率模型可以基于設備上的機械按鍵的分布和/或設備所處的真實環(huán)境來構建。
抑制增益計算器333被配置為基于來自輸入功率計算器331的輸入功率以及噪聲功率來計算用于噪聲抑制的抑制增益。房間衰減因數可以用于在音頻信號的當前幀中未檢測到脈沖噪聲的情況下衰減噪聲功率。所計算的抑制增益被提供至抑制單元334。在一些實施例中,可以為音頻信號的各個頻帶計算不同的抑制增益。
抑制單元334被配置為將抑制增益應用到音頻信號的當前幀以抑制脈沖噪聲。在一些實施例中,可以將頻帶特定的增益應用到當前幀的對應頻帶,以實現精確的噪聲抑制。
理解的是,多于一個的預定噪聲功率可以被構建以作為由設備采集的可能的脈沖噪聲信號的先驗知識。基于從音頻信號中提取的脈沖 噪聲相關的特征,可以選擇構建的模型之一用來確定抑制增益。
在本文中公開的一些進一步實施例中,為了減少由噪聲抑制噪聲的可能的不便并且減少計算開銷,可以應用預定義的準則來確定是否應當對音頻信號的當前幀執(zhí)行噪聲抑制。準則的基本原理是在實際應用場景中脈沖噪聲不可能生成的時候禁用噪聲抑制,并且在實際應用場景中可能生成脈沖噪聲的時候啟用噪聲抑制。
例如,如果在采集設備的麥克風輸入中不存在語音信號但是存在來自遠端設備的語音信號,可能意味著采集設備的本地說話者正在傾聽遠端說話者。在這種情況下,可以啟用噪聲抑制,因為本地說話者可能由于背景噪聲或想要本地討論的原因而希望使采集設備靜音,這可能導致由于按壓靜音按鈕而產生的點擊噪聲。另一方面,如果僅存在本地語音活動,可以禁用噪聲抑制過程,因為本地說話者可能不會在發(fā)出談話期間將麥克風靜音。
因此,預定義的準則可以基于會話觸發(fā)(conversational heuristic)。會話觸發(fā)用于檢測設備是否采集到語音信號。當通過會話觸發(fā)檢測到語音信號被輸入到采集設備,預定義的準則不被滿足并且可以禁用噪聲抑制過程。也就是說,系統(tǒng)300可以停止噪聲抑制操作。當檢測到語音信號從遠端傳輸并且在本地設備中播放,預定義的準則被滿足并且仍然可以對本地設備采集的語音信號的輸入幀執(zhí)行噪聲抑制。
理解的是,可以存在許多其他的準則用來智能地基于當前會話狀態(tài)來判斷是否在采集的語音信號的幀中抑制脈沖噪聲。例如,當檢測到本地說話者和遠端說話者正參與問答會話時,可以停止噪聲抑制或者可以應用相對高的抑制增益以避免由噪聲抑制操作引入的語音質量影響。
理解的是,除了會話觸發(fā)技術之外,還可以利用當前已知的或者未來開發(fā)的許多其他適當的檢測方法來智能地檢測會話狀態(tài)。
根據本文中公開的實施例,基于當前幀立即提取脈沖噪聲相關的特征并且響應于基于這些特征而在該幀中檢測到脈沖噪聲,應用噪聲抑制。即使在采用噪聲功率模型的實施例中,該模型基于先前采集到 的信號(例如,脈沖噪聲信號)來構建。因此,本文中提出的方案需要較少的延遲并且適合于許多實時場景,諸如交互式語音或通信使用情況。此外,基于所提取的特征可以做出更準確的脈沖噪聲的決策,這實現了脈沖噪聲抑制的降低的錯誤率和對語音質量的最小影響。
圖6根據本發(fā)明的一個示例實施例的音頻信號中的脈沖噪聲抑制的系統(tǒng)600的框圖。如所描繪的,系統(tǒng)600包括特征確定單元601,被配置為從音頻信號的當前幀中確定與脈沖噪聲相關的特征。系統(tǒng)600還包括噪聲檢測單元602,被配置為基于脈沖噪聲相關的特征,在當前幀中檢測脈沖噪聲,以及噪聲抑制單元603,被配置為響應于在當前幀中檢測到脈沖噪聲,向當前幀應用抑制增益,以抑制脈沖噪聲。
在本文中公開的一些實施例中,特征確定單元601可以被配置為通過將當前幀的高頻率范圍中的功率與低頻率范圍中的功率相比較,確定當前幀的頻譜傾斜,頻譜傾斜指示當前幀在頻域中的形狀。
在本文中公開的一些實施例中,特征確定單元601可以被配置為通過將當前幀的高頻率范圍中的功率與音頻信號的先前幀的高頻范圍中的功率相比較,確定當前幀的增量功率,增量功率指示當前幀在時域中的形狀。
在本文中公開的一些實施例中,特征確定單元601可以被配置為確定從音頻信號的聲音源到采集音頻信號的設備的空間鄰近度。
在本文中公開的一些實施例中,采集音頻信號的設備可以具有第一麥克風和第二麥克風,并且其中特征確定單元601可以被配置為確定由第一麥克風采集的第一單聲道信號與由第二麥克風采集的第二單聲道信號之間的相關性。
在本文中公開的一些實施例中,特征確定單元601可以進一步被配置為確定音頻信號在第一方向中的第一強度,確定音頻信號在第二方向中的第二強度,以及通過比較第一強度和第二強度來確定空間鄰近度。
在本文中公開的一些實施例中,噪聲抑制單元603可以被配置為響應于在當前幀中檢測到脈沖噪聲,基于先前的脈沖噪聲的預定噪聲 功率與當前幀的功率,確定抑制增益,以及向當前幀應用所確定的抑制增益,以抑制脈沖噪聲。
在本文中公開的一些實施例中,系統(tǒng)600可以進一步包括衰減功率確定單元,被配置為響應于在當前幀中未檢測到脈沖噪聲并且在先前幀中檢測到脈沖噪聲,基于房間衰減因數和先前脈沖噪聲的預定噪聲功率,確定衰減噪聲功率;抑制增益確定單元,被配置為基于衰減噪聲功率和當前幀的功率,確定另一個抑制增益;以及衰減噪聲抑制單元,被配置為向當前幀應用另一個抑制增益,以抑制脈沖噪聲的衰減版本。
在本文中公開的一些實施例中,系統(tǒng)600可以進一步包括噪聲抑制判斷單元,被配置為通過判斷預定義的準則是否被滿足來確定是否在當前幀中抑制脈沖噪聲。
為清晰起見,在圖6中沒有描繪出系統(tǒng)600的某些另外的部件。然而,應當理解,上文參考圖1-5所描述的各個特征同樣適用于系統(tǒng)600。而且,系統(tǒng)600中的各部件可以是硬件模塊,也可以是軟件單元模塊等等。例如,在某些示例實施例中,系統(tǒng)600可以部分或者全部利用軟件和/或固件來實現,例如被實現為包含在計算機可讀介質上的計算機程序產品。備選地或附加地,系統(tǒng)600可以部分或者全部基于硬件來實現,例如被實現為集成電路(IC)、專用集成電路(ASIC)、片上系統(tǒng)(SOC)、現場可編程門陣列(FPGA)等。本文中公開的主題的范圍在此方面不受限制。
圖7描繪了適于用來實現本文中所公開的示例實施例的示例計算機系統(tǒng)700的示意性框圖。在一些示例實施例中,計算機系統(tǒng)700可以適于實施音頻信號中的脈沖噪聲抑制的方法。
如所描繪的,計算機系統(tǒng)700包括中央處理單元(CPU)701,其可以根據存儲在只讀存儲器(ROM)702中的程序或者從存儲部分708加載到隨機訪問存儲器(RAM)703中的程序而執(zhí)行各種適當的動作和處理。如所需要的,在RAM 703中,還存儲有CPU 701執(zhí)行各種過程等的數據。CPU 701、ROM 702以及RAM 703通過總線704彼此 相連。輸入/輸出(I/O)接口705也連接至總線704。
以下部件連接至I/O接口705:包括鍵盤、鼠標等的輸入部分706;包括諸如陰極射線管(CRT)、液晶顯示器(LCD)等以及揚聲器等的輸出部分707;包括硬盤等的存儲部分708;以及包括諸如LAN卡、調制解調器等的網絡接口卡的通信部分709。通信部分709經由諸如因特網的網絡執(zhí)行通信處理。驅動器710也根據需要連接至I/O接口705??刹鹦督橘|711,諸如磁盤、光盤、磁光盤、半導體存儲器等等,根據需要安裝在驅動器710上,以便于從其上讀出的計算機程序根據需要被安裝入存儲部分708。
特別地,根據本文中所公開的示例實施例,上文參考圖1描述的過程可以被實現為計算機軟件程序。例如,本文中所公開的示例實施例包括一種計算機程序產品,其包括有形地包含在機器可讀介質上的計算機程序,所述計算機程序包含用于執(zhí)行方法100所描述的過程的程序代碼。在這樣的實施例中,該計算機程序可以通過通信部分709從網絡上被下載和安裝,和/或從可拆卸介質711被安裝。
一般而言,本文中所公開的各種示例實施例可以在硬件或專用電路、軟件、邏輯,或其任何組合中實施。某些方面可以在硬件中實施,而其他方面可以在可以由控制器、微處理器或其他計算設備執(zhí)行的固件或軟件中實施。當本文中所公開的示例實施例的各方面被圖示或描述為框圖、流程圖或使用某些其他圖形表示時,將理解此處描述的方框、裝置、系統(tǒng)、技術或方法可以作為非限制性的示例在硬件、軟件、固件、專用電路或邏輯、通用硬件或控制器或其他計算設備,或其某些組合中實施。
而且,流程圖中的各框可以被看作是方法步驟,和/或計算機程序代碼的操作生成的操作,和/或理解為執(zhí)行相關功能的多個耦合的邏輯電路元件。例如,本文中所公開的實施例包括計算機程序產品,該計算機程序產品包括有形地實現在機器可讀介質上的計算機程序,該計算機程序包含被配置為實現上文描述方法的程序代碼。
在公開的上下文內,機器可讀介質可以是包含或存儲用于或有關 于指令執(zhí)行系統(tǒng)、裝置或設備的程序的任何有形介質。機器可讀介質可以是機器可讀信號介質或機器可讀存儲介質。機器可讀介質可以包括但不限于電子的、磁的、光學的、電磁的、紅外的或半導體系統(tǒng)、裝置或設備,或其任意合適的組合。機器可讀存儲介質的更詳細示例包括帶有一根或多根導線的電氣連接、便攜式計算機磁盤、硬盤、隨機存儲存取器(RAM)、只讀存儲器(ROM)、可擦除可編程只讀存儲器(EPROM或閃存)、光存儲設備、磁存儲設備,或其任意合適的組合。
用于實現本文中所公開的方法的計算機程序代碼可以用一種或多種編程語言編寫。這些計算機程序代碼可以提供給通用計算機、專用計算機或其他可編程的數據處理裝置的處理器,使得程序代碼在被計算機或其他可編程的數據處理裝置執(zhí)行的時候,引起在流程圖和/或框圖中規(guī)定的功能/操作被實施。程序代碼可以完全在計算機上、部分在計算機上、作為獨立的軟件包、部分在計算機上且部分在遠程計算機上或完全在遠程計算機或服務器上執(zhí)行。程序代碼可以被分布在被特定編程的設備,這些設備通常在本文中可以被稱為“模塊”。這些模塊的軟件分組部分可以以任何具體計算機語言來編寫并且可以是單片集成代碼庫的一部分,或者可以被開發(fā)成多個離散代碼部分,諸如通常以面向對象的計算機語言來開發(fā)。此外,模塊可以跨多個計算機平臺、服務器、終端、移動設備等來分布。給定的模塊甚至可以被實施為使得所描述的功能有單個處理器和/或計算機硬件平臺來執(zhí)行。
如本申請中所使用的,術語“電路裝置”指的是以下的所有:(a)僅硬件電路實現方式(諸如僅模擬電路裝置和/或僅數字電路裝置的實現方式)以及(b)與電路和軟件(和/或固件)的組合,諸如(可用的):(i)與處理器的組合或(ii)處理器/軟件(包括數字信號處理器)、軟件、和存儲器的一部分,這些部分一起工作以使得裝置(諸如移動電話或服務器)執(zhí)行各種功能,以及(c)電路,諸如微處理器或微處理器的一部分,其需要軟件或固件用于操作,即使軟件或固件不是物理存在的。此外,本領域技術人員已知的是,通信媒介通常體 現計算機可讀指令、數據結構、程序模塊或模塊化數據信號中的其他數據,該數據信號諸如載波或其他傳輸機制,并且通信媒介包括任何信息傳送媒介。
另外,盡管操作以特定順序被描繪,但這并不應該理解為要求此類操作以示出的特定順序或以相繼順序完成,或者執(zhí)行所有圖示的操作以獲取期望結果。在某些情況下,多任務和并行處理會是有益的。同樣地,盡管上述討論包含了某些特定的實施細節(jié),但這并不應解釋為限制本文中所公開的主題或權利要求的范圍,而應解釋為對可以針對特定實施例的描述。本說明書中在分開的實施例的上下文中描述的某些特征也可以整合實施在單個實施例中。相反地,在單個實施例的上下文中描述的各種特征也可以分離地在多個實施例或在任意合適的子組合中實施。
針對本文中所公開的前述示例實施例的各種修改、改變將在連同附圖查看前述描述時對相關技術領域的技術人員變得明顯。任何及所有修改將仍落入非限制的和本文中所公開的示例實施例范圍。此外,前述說明書和附圖存在啟發(fā)的益處,涉及本文中所公開的這些實施例的技術領域的技術人員將會想到此處闡明的其他實施例。
由此,本主題可以通過在此描述的任何形式來實現。例如,以下的枚舉示例實施例(EEE)描述了本文中所公開的某些方面的某些結構、特征和功能。
EEE 1.一種用于檢測、分類和抑制具有一個或多個麥克風的采集設備上的脈沖噪聲的方法,該方法包括提取麥克風信號的信號特征,該特征包括從麥克風信號的協(xié)方差矩陣提取的子帶功率的比率、增量功率、空間鄰近度;基于特征的非線性映射,檢測是否有脈沖噪聲被包括在麥克風信號中;以及使用寬帶增益或預定的子帶增益方案來抑制脈沖噪聲。
EEE 2.根據EEE 1的方法,其中該方法進一步包括利用房間衰減信息來增強抑制性能。
EEE 3.根據EEE 1的方法,其中該方法進一步包括使用會話觸發(fā) 來啟用或禁用脈沖噪聲抑制,以供更智能的處理。
將會理解,本法明的實施例不限于公開的特定實施例,并且修改和其他實施例都應包含于所附的權利要求范圍內。盡管此處使用了特定的術語,但是它們僅在通用和描述的意義上使用,而并不用于限制目的。