欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

用于音頻接收的風(fēng)噪聲降低的制作方法

文檔序號(hào):12288453閱讀:458來源:國(guó)知局
用于音頻接收的風(fēng)噪聲降低的制作方法與工藝

本申請(qǐng)涉及音頻處理領(lǐng)域,并且特別地涉及從所接收的音頻信號(hào)中去除風(fēng)噪聲。



背景技術(shù):

許多不同的設(shè)備提供用于各種不同目的的麥克風(fēng)。這些麥克風(fēng)可以用于從用戶那里接收要發(fā)送給用戶其他設(shè)備的語音。麥克風(fēng)可以用于記錄語音備忘錄以供本地或遠(yuǎn)程存儲(chǔ)以及以后檢索。麥克風(fēng)可以用于對(duì)設(shè)備或?qū)h(yuǎn)程系統(tǒng)的語音命令,或者麥克風(fēng)可以用于記錄環(huán)境音頻。許多設(shè)備還提供音頻記錄,并與相機(jī)一起提供視頻記錄。這些設(shè)備范圍從便攜式游戲控制臺(tái)到智能手機(jī)到錄音機(jī)到攝像機(jī)等。

當(dāng)風(fēng)或其他空氣運(yùn)動(dòng)影響麥克風(fēng)時(shí),產(chǎn)生可能損害、淹沒或使得音頻信號(hào)的其余部分無法理解的噪聲??赡軐?dǎo)致聲音記錄令人不快,并且對(duì)于另一個(gè)人或自動(dòng)化語音識(shí)別系統(tǒng)而言語音可能不可識(shí)別。雖然已經(jīng)開發(fā)了用于抑制風(fēng)噪聲的材料和結(jié)構(gòu),但是這些通常都需要龐大或大型的外部麥克風(fēng),這對(duì)于許多設(shè)備而言可能是不切實(shí)際的、不方便的或不可能使用的。還存在基于軟件的風(fēng)噪聲降低系統(tǒng),其使用復(fù)雜算法來將風(fēng)噪聲與其他聲音隔離,并且然后降低或消除風(fēng)噪聲。

風(fēng)噪聲降低技術(shù)往往是復(fù)雜的,因?yàn)轱L(fēng)噪聲非常不穩(wěn)定,并且如果存在多個(gè)麥克風(fēng),則每個(gè)麥克風(fēng)處的噪聲將不同。風(fēng)噪聲表示特殊的噪聲類別,因?yàn)樗怯稍O(shè)備周圍的風(fēng)流的湍流直接產(chǎn)生的。湍流在設(shè)備上的不同位置處將不同,并且隨時(shí)間快速變化。

附圖說明

以示例性而非限制性方式在附圖中展示本發(fā)明的實(shí)施方式,在附圖中,類似號(hào)碼指示類似元件。

圖1是根據(jù)實(shí)施例的用于接收音頻系統(tǒng)并對(duì)信號(hào)應(yīng)用風(fēng)噪聲降低的系統(tǒng)的框圖。

圖2是根據(jù)實(shí)施例的交叉濾波器(Crossover Filter)(如圖1的交叉濾波器)的輸出的曲線圖。

圖3是適合用于實(shí)施例的風(fēng)噪聲降低系統(tǒng)的框圖。

圖4是適合用于實(shí)施例的替代性風(fēng)噪聲降低系統(tǒng)的框圖。

圖5是根據(jù)實(shí)施例的具有輸入和輸出音頻鏈路的通信鏈路的框圖。

圖6是根據(jù)實(shí)施例的降低風(fēng)噪聲的過程流程圖。

圖7是根據(jù)實(shí)施例的結(jié)合了風(fēng)噪聲降低的計(jì)算設(shè)備的框圖。

具體實(shí)施方式

依賴信號(hào)分析的風(fēng)噪聲降低系統(tǒng)通常需要高頻譜分辨率來區(qū)分風(fēng)與其他聲音。由于風(fēng)噪聲的瞬態(tài)性質(zhì),系統(tǒng)還必須以高速率更新。處理需求隨著更高的采樣頻率而增加。雖然可以以8kHz對(duì)語音進(jìn)行采樣,但是以32kHz、48k Hz或更高速率可以對(duì)更高質(zhì)量的音頻進(jìn)行采樣。針對(duì)這些信號(hào)的風(fēng)噪聲分析需要高計(jì)算(MIPS)和存儲(chǔ)器(KB)資源來進(jìn)行處理。

可以通過將輸入音頻劃分為子帶來減少計(jì)算和存儲(chǔ)器要求。這允許風(fēng)噪聲降低系統(tǒng)與具有較低采樣頻率的子帶一起工作。結(jié)果,總體輸入音頻采樣頻率可能遠(yuǎn)大于8kHz。計(jì)算和存儲(chǔ)器要求在很大程度上獨(dú)立于輸入音頻的采樣率。還可以處理多個(gè)同時(shí)的麥克風(fēng)記錄。許多視頻記錄器記錄兩個(gè)或更多個(gè)獨(dú)立的音頻通道以支持立體聲或環(huán)繞聲模式。甚至一些智能手機(jī)提供四個(gè)麥克風(fēng)來為記錄的音頻提供深度和空間濾波。

風(fēng)噪聲的音頻頻譜通常包括非常低音調(diào)的聲音,但通常不超過4kHz以上的音頻頻率。風(fēng)噪聲的這種物理特性可以用于將輸入音頻分成兩個(gè)或更多個(gè)分離的子帶,包括風(fēng)噪聲的子帶可以被限制為大約4kHz。這允許獨(dú)立于其他子帶來降低風(fēng)噪聲。在風(fēng)噪聲被濾除之后可以然后重新組合子帶。

圖1示出了用于對(duì)輸入音頻信號(hào)102應(yīng)用風(fēng)噪聲降低的系統(tǒng)101。本示例中的音頻信號(hào)采用已經(jīng)從耦合到模擬麥克風(fēng)的模數(shù)轉(zhuǎn)換器取得的數(shù)字樣本序列的形式。在一些情況下,轉(zhuǎn)換器和麥克風(fēng)被組合并被稱為數(shù)字麥克風(fēng)。輸入信號(hào)被標(biāo)識(shí)為d(k),fs=48kHz。這將表明,在本示例中,信號(hào)是以48kHz的采樣率上的k個(gè)數(shù)字樣本的流。48和其他數(shù)字用作示例,取決于具體實(shí)現(xiàn)方式可以使用不同的濾波器和不同的采樣率。在成幀塊104處,輸入音頻樣本被收集為幀。幀表示短音頻序列,例如10或20毫秒。然而,取決于具體實(shí)現(xiàn)方式,可以使用更長(zhǎng)或更短的音頻序列。如果音頻系統(tǒng)是傳輸系統(tǒng)的具有成幀協(xié)議的一部分,則可以使用用于傳輸系統(tǒng)的成幀協(xié)議。

在上部路徑103和下部路徑105上發(fā)送輸入信號(hào)幀。信號(hào)的這兩個(gè)副本用于產(chǎn)生具有4kHz的交叉頻率的兩個(gè)子帶。在上部路徑中,信號(hào)被低通濾波106,然后在下采樣器108中被重新采樣到8kHz。然后對(duì)所輸出的下采樣信號(hào)x(k),fs=8kHz進(jìn)行處理以用于風(fēng)噪聲降低。在處理之后,在上采樣塊112中將經(jīng)降噪的信號(hào)上采樣回48kHz。然后將經(jīng)上采樣的信號(hào)施加到低通濾波器114,以去除在采樣和降噪期間引入的任何較高頻率假象。

下部路徑信號(hào)在濾波器120中在4kHz下被高通濾波,然后在延遲緩沖器122中被延遲。該延遲緩沖器容納由低通濾波器中的群延遲引起的延遲。延遲緩沖器還可以被適配成用于引起另一路徑中的任何其它延遲,這取決于上部路徑的濾波器、上下采樣器和噪聲降低電路的實(shí)現(xiàn)。上部路徑輸出然后與下部路徑輸出時(shí)間對(duì)準(zhǔn),并且這兩個(gè)信號(hào)在組合器124中再次被組合以產(chǎn)生具有減小的風(fēng)噪聲和48kHz采樣率的輸出信號(hào)y(k),fs=48kHz。

這種方法允許保持在音頻信號(hào)中執(zhí)行風(fēng)噪聲降低所需的時(shí)間和頻率分辨率。在上述說明中,選擇了4kHz的交叉頻率(Crossover Frequency)。在實(shí)踐中,該交叉頻率可以變化。取決于風(fēng)噪聲的性質(zhì)和輸出信號(hào)的期望質(zhì)量,交叉頻率可以更低或更高。在另一示例中,8kHz可以用作低通濾波截止頻率。

在圖1的示例中,考慮了48kHz的典型輸入采樣頻率。風(fēng)噪聲的頻譜通常不超過4kHz。因此,風(fēng)噪聲降低系統(tǒng)首先將輸入信號(hào)的單個(gè)信道d(k)分解106、102為具有4kHz的交叉頻率的兩個(gè)子帶103、105。4kHz是指原始音頻信號(hào)中的模擬聲音的頻率,而不是采樣率。低通濾波器106去除頻譜圖像,并且然后可以以因子6對(duì)信號(hào)進(jìn)行下采樣108,以獲得重采樣到8kHz的較低子帶信號(hào)x(k)。8kHz是具有最大頻率4kHz、沒有混疊的音頻信號(hào)的最小采樣率。

然后使用多種風(fēng)噪聲降低技術(shù)中的任何一種來處理110較低子帶信號(hào)x(k)。較低的采樣率和較低的最大頻率大大減少了對(duì)信號(hào)執(zhí)行風(fēng)噪聲降低所需的計(jì)算和存儲(chǔ)器資源。然后通過相同的因子(在這種情況下6)對(duì)增強(qiáng)的信號(hào)進(jìn)行上采樣112并且進(jìn)行低通濾波114,以去除由上采樣和任何其他過程引入的頻譜圖像。然后將該信號(hào)添加124到延遲的經(jīng)高通濾波信號(hào)。該延遲對(duì)于補(bǔ)償圖1所示的信號(hào)處理鏈的上部分支中的附加低通濾波器是必要的。

相同的原理可以應(yīng)用于具有其它采樣率的信號(hào)。8kHz或更高的任何采樣率可以用作輸入音頻信號(hào)。如果輸入信號(hào)以8kHz被采樣,則可以避免上部路徑的下采樣和上采樣。可以用比8kHz更高或更低的速率進(jìn)行下采樣。利用更多資源,系統(tǒng)可以作為替代將音頻下采樣到16kHz。當(dāng)在124處重新組合信號(hào)時(shí),這可以提供更高質(zhì)量的音頻??梢曰诘屯V波截止頻率來選擇下采樣率。如所示,8kHz的下采樣音頻速率被選擇為濾波器所允許的最高音頻頻率的兩倍,例如4kHz?;诘湫偷娘L(fēng)噪聲的特性來選擇低通濾波截止頻率。對(duì)于較高速度的風(fēng),可以選擇較高的截止頻率,而對(duì)于較溫和的風(fēng),可以選擇較低的截止頻率。對(duì)于較低或較高截止頻率,可以選擇較低或較高的下采樣率。

輸入音頻d(k)可以具有取決于應(yīng)用的任何采樣率。8kHz和16kHz是常見的,但是一些音頻應(yīng)用以更高的速率對(duì)輸入信號(hào)進(jìn)行采樣以提高輸出信號(hào)質(zhì)量。為了更高的信號(hào)保真度,通常以32kHz、48kHz或更高速率對(duì)音頻記錄進(jìn)行采樣。

當(dāng)多個(gè)麥克風(fēng)用于單次記錄時(shí),可以使用多個(gè)風(fēng)噪聲降低處理。風(fēng)噪聲通常具有單個(gè)麥克風(fēng)信號(hào)之間的低相干性。圖1的方法可以獨(dú)立地應(yīng)用于這些麥克風(fēng)通道中的每個(gè)。這允許來自這些單獨(dú)麥克風(fēng)中的每一個(gè)的空間提示被保留。

低通濾波器106和高通濾波器120這兩個(gè)濾波器構(gòu)成音頻交叉濾波器。這個(gè)交叉濾波器可以被設(shè)計(jì)為用于既分解輸入信號(hào)又充當(dāng)隨后下采樣操作108的抗混疊濾波器的雙重作用。雖然可以使用常規(guī)濾波器組,通過使用交叉而不是常規(guī)濾波器組,輸入信號(hào)被分解為使得低通濾波器和高通濾波器的頻率響應(yīng)是互補(bǔ)的并且相加為整體。這創(chuàng)建了一種結(jié)構(gòu),在該結(jié)構(gòu)中,由于在交叉濾波器中的固定點(diǎn)實(shí)現(xiàn)而導(dǎo)致的任何數(shù)字誤差被反映在高通和低通兩分支中。相應(yīng)地,當(dāng)組合這兩個(gè)上和下部路徑分支時(shí),數(shù)字誤差彼此抵消。交叉濾波器組系統(tǒng)提供了分解輸入信號(hào)的高效低失真方法。

可以通過平衡濾波器長(zhǎng)度、過渡帶寬和阻帶衰減來設(shè)計(jì)交叉濾波器。較長(zhǎng)的濾波器長(zhǎng)度提供了更令人期待的濾波器設(shè)計(jì)特性,比如更尖銳的過渡帶寬和更多的阻帶衰減。然而,較長(zhǎng)的濾波器長(zhǎng)度引入額外的群延遲。交叉濾波器輸出的示例在圖2中示出,圖2是豎直軸上的振幅對(duì)水平軸上的頻率的曲線圖。示出了這兩個(gè)不同的信號(hào),其中,上部路徑信號(hào)202具有在4kHz上的高端截止頻率fc。下部路徑信號(hào)204具有在4kHz上的低端截止頻率。這樣的響應(yīng)可以用129個(gè)濾波器系數(shù)(采樣頻率,fs=48kHz)來產(chǎn)生。轉(zhuǎn)換帶寬已設(shè)置為500Hz,其中,阻帶衰減為-60dB。

圖3是可以用作圖1的風(fēng)噪聲降低系統(tǒng)110的風(fēng)噪聲降低(WNR)系統(tǒng)300的示例的框圖。此系統(tǒng)作為示例被示出,并且取決于實(shí)現(xiàn)方式,可以使用各種其它系統(tǒng)。分割(和/或開窗)電路302耦合到FFT(快速傅立葉變換)電路304,該FFT電路向特征提取電路306提供結(jié)果。特征提取向風(fēng)噪聲檢測(cè)電路308以及同樣耦合到WND檢測(cè)電路308的風(fēng)噪聲PSD(功率頻譜密度)的估計(jì)電路310提供結(jié)果。估計(jì)電路耦合到頻譜減法增益計(jì)算電路312,該頻譜減法增益計(jì)算電路的輸出與FFT輸出組合并被提供給耦合到重疊相加電路316的IFFT(逆FFT)電路314。

噪聲語音信號(hào)x(k)通過干凈語音信號(hào)s(k)和噪聲信號(hào)n(k)的疊加來建模,其中,k是數(shù)字信號(hào)的離散時(shí)間指標(biāo)。對(duì)風(fēng)噪聲PSD的估計(jì)可以被劃分為可以基于幀執(zhí)行的兩個(gè)單獨(dú)的步驟。第一步是風(fēng)噪聲檢測(cè)(WND),包括特征提取(例如,計(jì)算每個(gè)幀中的子帶信號(hào)質(zhì)心(SSC))以及基于所提取的特征(例如,SCC值)將信號(hào)幀分類為干凈的濁音語音、有噪聲的濁音語音(語音+風(fēng))或純風(fēng)噪聲。

第二步是風(fēng)噪聲估計(jì)(WNEST),其可以包括基于信號(hào)幀分類的風(fēng)噪聲周期圖估計(jì)。干凈的濁音語音導(dǎo)致沒有風(fēng)噪聲估計(jì)。有噪聲的語音導(dǎo)致在頻譜中的最小搜索以及多項(xiàng)式擬合。純風(fēng)噪聲導(dǎo)致使用輸入信號(hào)作為風(fēng)噪聲周期圖估計(jì)。WNEST可以進(jìn)一步包括用于最終噪聲PSD估計(jì)的自適應(yīng)平滑因子的計(jì)算??梢葬槍?duì)每個(gè)麥克風(fēng)重復(fù)圖3的配置。

在圖3的示例中,提供了重疊相加框架。在一個(gè)示例中,有噪聲的輸入信號(hào)x(k)首先被分割成20ms的幀,具有50%的重疊,即10ms。之后,對(duì)每個(gè)幀進(jìn)行開窗(例如,使用Hann窗口),并且使用快速傅里葉變換(FFT)在離散頻域中對(duì)其進(jìn)行變換,產(chǎn)生X(λ,μ),其中λ是幀索引,μ是離散頻率倉(cāng)。通過將噪聲頻譜X(λ,μ)與頻譜增益G(λ,μ)相乘,在頻域中實(shí)現(xiàn)風(fēng)噪聲降低。在時(shí)域中使用快速傅里葉逆變換(IFFT)來對(duì)增強(qiáng)信號(hào)進(jìn)行變換。最后,對(duì)重疊的增強(qiáng)信號(hào)幀進(jìn)行求和,得到輸出信號(hào)

圖4是可以用作圖1的WNR 110的替代性WNR系統(tǒng)400的框圖。在此替代性示例中,STFT(短時(shí)傅立葉變換)電路402耦合到WND(風(fēng)噪聲檢測(cè))電路404,該WND電路耦合到WNEST(風(fēng)噪聲估計(jì))電路406,該WNEST電路耦合到頻譜減法電路408,該頻譜減法電路耦合到提供風(fēng)噪聲降低的輸出的逆STFT電路410。

首先在頻域中執(zhí)行風(fēng)噪聲檢測(cè)(WND)以提取用于檢測(cè)風(fēng)噪聲的存在的潛在信號(hào)特性和特征。在WND中確定信號(hào)子帶質(zhì)心值SSCm(λ)和能量比ER(λ),并將其用于風(fēng)噪聲估計(jì)(WNEST)技術(shù)中以估計(jì)當(dāng)檢測(cè)到風(fēng)噪聲時(shí)的風(fēng)噪聲功率。然后可以通過執(zhí)行頻譜減法來衰減這些風(fēng)噪聲分量。然后,所輸出的增強(qiáng)信號(hào)可以用于使用逆STFT重構(gòu)輸出信號(hào)

圖5是具有音頻輸出流水線和音頻輸入流水線的通信鏈路的框圖,以示出可如何將圖1的系統(tǒng)(表示為風(fēng)噪聲降低508)集成到語音通信或音頻記錄流水線500中。圖5的流水線可以集成到圖7的系統(tǒng)或使用各種硬件和軟件資源的另一系統(tǒng)中。來自麥克風(fēng)502的上行鏈路信號(hào)或近端信號(hào)首先由麥克風(fēng)均衡電路504和噪聲降低電路(或模塊)506處理。該輸出被輸入到風(fēng)噪聲降低電路508。取決于實(shí)現(xiàn)方式,風(fēng)噪聲降低電路508可以將頻率倉(cāng)輸出到殘留回波抑制電路510。

乘法器512從AGC(自動(dòng)增益控制)電路522和殘留回波抑制電路510接收輸入數(shù)據(jù),并且將輸出數(shù)據(jù)提供給DRP(動(dòng)態(tài)范圍處理器)上行鏈路電路514。這表示被輸出到存儲(chǔ)器或輸出到傳輸鏈路的經(jīng)濾波的增強(qiáng)音頻。可以去除或替換濾波、均衡、抵消、降低、抑制和其他聲音增強(qiáng)組件中的任何一個(gè)或多個(gè),并且可以添加其他組件以適合特定實(shí)現(xiàn)方式。

在圖的頂部所示的輸出流水線中,從存儲(chǔ)器或從遠(yuǎn)程設(shè)備接收的遠(yuǎn)端信號(hào)被輸入到進(jìn)一步的噪聲降低電路516,其輸出被輸入到DRP下行鏈路電路518中。DRP下行鏈路電路518的輸出被輸入到聲學(xué)回波消除器520(其可以將其輸出提供給求和電路528,該求和電路將其和(進(jìn)一步考慮麥克風(fēng)均衡電路504的輸出)輸出到噪聲降低電路506)、AGC電路522和揚(yáng)聲器均衡電路524。揚(yáng)聲器均衡電路524可以將其輸出提供給揚(yáng)聲器526。

風(fēng)噪聲具有獨(dú)特的瞬態(tài)特征,這使其難以降低少。取決于具體實(shí)現(xiàn)方式,實(shí)施例可以使用多種不同技術(shù)和系統(tǒng)中的任何一種來降低風(fēng)噪聲。圖3和圖4中示出了幾種實(shí)現(xiàn)方式。下面描述圖3和圖4中的風(fēng)噪聲降低的操作細(xì)節(jié)和一些功能。然而,實(shí)施例并不需要這種風(fēng)噪聲降低。

風(fēng)噪聲主要位于低頻(f<500Hz),并且顯示出朝較高頻率的大約1/f衰退。濁音語音段顯示出諧波結(jié)構(gòu),并且信號(hào)能量的主要部分位于頻率0Hz和3000Hz之間。近端信號(hào)的清音段是類噪聲的,并且顯示信號(hào)能量的高通特性(f>3000Hz)。濁音語音受風(fēng)噪聲的影響很大,而不受高通噪聲的影響。

對(duì)于WND,可以提供魯棒特征,利用該魯棒特征可以實(shí)現(xiàn)對(duì)當(dāng)前幀的分類。然后,映射此特征以執(zhí)行對(duì)干凈語音風(fēng)噪聲的檢測(cè)或者對(duì)先前兩種情況的混合的軟判決。

SSCs(子帶信號(hào)質(zhì)心)可以用于表示信號(hào)幀X(λ,μ)的頻譜能量分布。第m子帶的SSC被定義為:

頻率倉(cāng)μm可以定義子帶之間的界限。對(duì)于根據(jù)本公開的各個(gè)方面的系統(tǒng),僅考慮覆蓋低頻范圍(0Hz-3000Hz)的第一子帶SSC1的質(zhì)心。在這種情況下:

μ0=0,且

其中,fs是采樣頻率,N是FFT的大小,并且<>可以代表取整到下一個(gè)整數(shù)。SSC1被視為給定信號(hào)的頻譜中的“重心”。

相應(yīng)地,SSC1僅受濁音語音段和風(fēng)噪聲段的影響,而清音語音段僅對(duì)第一質(zhì)心具有輕微影響。對(duì)于風(fēng)噪聲信號(hào)的理想1/f衰退,SSC1值是恒定的并且與絕對(duì)信號(hào)能量無關(guān)。風(fēng)噪聲信號(hào)的SSC1值通常集中在100Hz以下,而濁音語音段分布在250Hz與700Hz之間。使用這些SSC1值,可以使用閾值來檢測(cè)純風(fēng)噪聲或干凈的濁音語音段。

還可能存在具有語音和風(fēng)的疊加的瞬態(tài)區(qū)域。因此,除了在濁音語音和風(fēng)噪聲的存在之間的硬判決之外,可以使用軟值給出關(guān)于信號(hào)失真程度的信息。

除SSC1之外,兩個(gè)頻帶之間的能量比ER(λ)可以用作用于檢測(cè)干凈的濁音語音和純風(fēng)噪聲的安全網(wǎng)。

能量比ER(λ)定義如下:

頻率倉(cāng)μ0、μ1、μ2和μ3定義限制這兩個(gè)頻帶的頻率倉(cāng)。如果界限μ0和μ1覆蓋比μ2和μ3(例如200Hz-4000Hz)更低的頻率范圍(例如0Hz-200Hz),則高能量比值(ER(λ)>>1)表示干凈的語音,并且低值(0<ER(λ)<1)表示風(fēng)噪聲。這些閾值的典型值是用于檢測(cè)純風(fēng)噪聲的ER(λ)<0.2,以及用于檢測(cè)干凈的濁音語音的ER(λ)>10。

風(fēng)噪聲估計(jì)(WNEST)已被表征為功率頻譜密度PSD給定信號(hào)的PSD估計(jì)是通過對(duì)連續(xù)信號(hào)幀X(λ,μ)進(jìn)行遞歸平滑得到的:

其中,平滑因子α(λ)可以取0和1之間的值,并且可以選擇為固定的或自適應(yīng)的。振幅平方傅里葉變換|X(λ,μ)|2被稱為周期圖。對(duì)于所需的風(fēng)噪聲PSD噪聲|X(λ,μ)|2信號(hào)的周期圖不能直接訪問,因?yàn)檩斎胄盘?hào)包含語音和風(fēng)噪聲。因此,對(duì)于根據(jù)本公開的各個(gè)方面的系統(tǒng),基于在前面部分中所定義的分類來估計(jì)噪聲周期圖。對(duì)于風(fēng)噪聲占優(yōu)勢(shì)的范圍,輸入信號(hào)可直接用作噪聲周期圖。在具有清晰語音的范圍中,噪聲周期圖被設(shè)置為零。對(duì)于其中濁音語音和風(fēng)噪聲都有效的范圍的估計(jì),使用更復(fù)雜的方法,該方法利用風(fēng)噪聲和濁音語音的頻譜特性。

如上所述,風(fēng)噪聲的頻譜可以具有1/f衰退。因此,風(fēng)噪聲周期圖用簡(jiǎn)單的多項(xiàng)式被近似為:

引入?yún)?shù)β和γ來調(diào)整功率和衰退衰退參數(shù)γ的典型值在-2和-0.5之間。對(duì)于β和γ的計(jì)算,需要頻譜中的兩個(gè)支持點(diǎn),并且這些支持點(diǎn)被分配給風(fēng)噪聲周期圖。由于揚(yáng)聲器的共振,濁音語音具有諧波結(jié)構(gòu)。諧波在說話音的頻率以及此頻率的倍數(shù)處的表現(xiàn)為局部極大值。風(fēng)噪聲不顯示諧波結(jié)構(gòu)。

對(duì)于濁音語音活動(dòng)期間的風(fēng)噪聲周期圖的估計(jì),濁音語音的前兩個(gè)極小值可用作等式(4)中的多項(xiàng)式近似的支持點(diǎn)。

給定在頻率倉(cāng)μ最小1和μ最小2處的兩個(gè)極小值,參數(shù)β和γ估計(jì)如下:

以及

為了防止對(duì)風(fēng)噪聲周期圖的過高估計(jì),特別是對(duì)于低頻(<100Hz),計(jì)算的周期圖被當(dāng)前周期圖限制為

基于當(dāng)前SSC1值的風(fēng)噪聲周期圖的計(jì)算總結(jié)為:

θ1和θ2表示圖7中定義的三個(gè)范圍之間的SSC1值的閾值。閾值可以設(shè)置為200Hz和600Hz作為θ1和θ2的相應(yīng)頻率。

為了確定所需的風(fēng)噪聲PSD,將等式(3)中給出的遞歸平滑應(yīng)用于等式(8)的周期圖。這里,平滑因子α(λ)的選擇起重要作用。一方面,小的平滑因子允許對(duì)風(fēng)噪聲的快速跟蹤,但是具有的缺點(diǎn)是被錯(cuò)誤地檢測(cè)為風(fēng)噪聲的語音段對(duì)噪聲PSD具有很大的影響。另一方面,接近1的大平滑因子減少了在語音活動(dòng)期間的錯(cuò)誤檢測(cè)的影響,但是導(dǎo)致噪聲估計(jì)的緩慢適應(yīng)速度。因此,α(λ)的自適應(yīng)計(jì)算是有利的,其中,在語音暫停時(shí)在風(fēng)中選擇低值,在語音活動(dòng)期間選擇高值。由于SSC1值是當(dāng)前SNR條件的指示符,因此使用平滑因子的以下線性映射:

平滑因子α(λ)和SSC1(λ)值之間的這種關(guān)系導(dǎo)致語音暫停中的快速跟蹤和因此的精確的噪聲估計(jì),并且降低了在語音活動(dòng)期間將語音錯(cuò)誤地檢測(cè)為風(fēng)噪聲的風(fēng)險(xiǎn)。此外,可以對(duì)SSC1(λ)和α(λ)之間的關(guān)系應(yīng)用諸如S形函數(shù)的非線性映射。

通過將噪聲頻譜X(λ,μ)與頻譜增益G(λ,μ)相乘來降低風(fēng)噪聲。使用頻譜減法方式從估計(jì)的噪聲PSD和噪聲輸入頻譜X(λ,μ)中確定頻譜增益:

對(duì)于風(fēng)噪聲檢測(cè),能量分布以及因此信號(hào)質(zhì)心向較高頻率偏移。為了調(diào)整風(fēng)噪聲降低系統(tǒng),修改信號(hào)分類和平滑因子計(jì)算的閾值θ1和θ2。這可能導(dǎo)致對(duì)來自等式9的平滑因子的修改。

對(duì)于風(fēng)噪聲估計(jì),麥克風(fēng)的高通特性可導(dǎo)致低于麥克風(fēng)的截止頻率的低信號(hào)功率。這可能降低如上所述的近似的準(zhǔn)確度。為了克服這個(gè)問題,在麥克風(fēng)截止頻率之上執(zhí)行上述極小值搜索。

圖6是如本文所述的使用較少計(jì)算資源來降低風(fēng)噪聲的過程流程圖。在602,音頻信號(hào)被分解成子帶。在圖1的示例中,僅使用兩個(gè)子帶,但實(shí)施例不限于此。在604,對(duì)這些子帶中的一個(gè)進(jìn)行低通濾波。低通濾波器可以處于4kHz,然而根據(jù)具體實(shí)現(xiàn),也可以使用其它更低的頻率。在許多情況下,幾乎所有的風(fēng)噪聲都低于0.5kHz,因此甚至可以使用1kHz的低通濾波器。

在606,從第一子帶中去除風(fēng)噪聲,并且在608,將第一子帶與其他子帶組合。這個(gè)過程的基礎(chǔ)是這樣的想法:風(fēng)噪聲將排他地或至少主要在第一子帶中,使得僅需要針對(duì)風(fēng)噪聲處理第一子帶。取決于例如圖5中所示的實(shí)現(xiàn)方式,可以針對(duì)其他噪聲處理其他子帶。還可以針對(duì)其他噪聲處理第一子帶,如圖5中所示。例如在圖1的兩個(gè)路徑示例中,第二路徑具有高于4kHz的較高頻率,此子帶通常承載各種不同的嘶嘶和吱吱噪聲。這些可以在單獨(dú)的過程中降低。

在較低路徑中,通過降低風(fēng)噪聲之前對(duì)第一子帶進(jìn)行下采樣,然后在將第一子帶與其他子帶組合之前上將經(jīng)降低的噪聲信號(hào)上采樣回原始采樣率,可以進(jìn)一步減少風(fēng)噪聲降低所需的計(jì)算資源。由于第一子帶被低通濾波,可以在沒有顯著音頻質(zhì)量損失的情況下對(duì)其進(jìn)行下采樣。較高的采樣率主要有助于再現(xiàn)已經(jīng)從第一子帶濾波出的較高頻率聲音。

圖7展示了根據(jù)一種實(shí)現(xiàn)方式的計(jì)算設(shè)備100。計(jì)算設(shè)備100容納系統(tǒng)板2。該板2可以包括多個(gè)組件,包括但不限于處理器4和至少一個(gè)通信封裝體6。通信封裝體耦合到一個(gè)或多個(gè)天線16。處理器4物理地和電學(xué)地耦合到板2。

根據(jù)其應(yīng)用,計(jì)算設(shè)備100可以包括可以或可以不物理地和電學(xué)地耦合到板2的其他組件。這些其他組件包括但不限于易失性存儲(chǔ)器(例如DRAM)8、非易失性存儲(chǔ)器(例如ROM)9,閃存(未示出)、圖形處理器12、數(shù)字信號(hào)處理器(未示出)、密碼處理器(未示出)、芯片組14、天線16、諸如觸摸屏顯示器的顯示器18、觸摸屏控制器20、電池22、音頻編解碼器(未示出)、視頻編解碼器(未示出)、功率放大器24、全球定位系統(tǒng)(GPS)設(shè)備26、羅盤28、加速度計(jì)(未示出)、陀螺儀(未示出)、揚(yáng)聲器30、照相機(jī)32、麥克風(fēng)陣列34、和大容量存儲(chǔ)設(shè)備(諸如硬盤驅(qū)動(dòng))10,光盤(CD)(未示出)、數(shù)字通用盤(DVD)(未示出)等等)。這些組件可以連接到系統(tǒng)板2、安裝到系統(tǒng)板或與任何其他組件組合。

通信封裝體6使得向和從計(jì)算設(shè)備100傳遞數(shù)據(jù)的無線和/或有線通信成為可能。術(shù)語“無線”及其派生詞可以用于描述可以通過使用通過非固體介質(zhì)的經(jīng)調(diào)制的電磁輻射來傳達(dá)數(shù)據(jù)的電路、設(shè)備、系統(tǒng)、方法、技術(shù)、通信信道等。該術(shù)語并不意味著相關(guān)聯(lián)的設(shè)備不包含任何導(dǎo)線,盡管在一些實(shí)施例中它們可能不包括。通信封裝體6可以實(shí)現(xiàn)多種無線或有線標(biāo)準(zhǔn)或協(xié)議中的任何一種,包括但不限于Wi-Fi(IEEE 802.11家族)、WiMAX(IEEE 802.16家族)、IEEE 802.20、長(zhǎng)期演進(jìn)(LTE)、Ev-DO、HSPA+、HSDPA+、HSUPA+、EDGE、GSM、GPRS、CDMA、TDMA、DECT、藍(lán)牙、其以太網(wǎng)衍生物以及被指定為3G,4G,5G及以上的任何其它無線和有線協(xié)議。計(jì)算設(shè)備100可以包括多個(gè)通信封裝體6。例如,第一通信封裝體6可以專用于諸如Wi-Fi和藍(lán)牙的較短程無線通信,并且第二通信封裝體6可以專用于較長(zhǎng)程無線通信,諸如GPS、EDGE、GPRS、CDMA、WiMAX、LTE、Ev-DO、以及其他。

麥克風(fēng)34和揚(yáng)聲器30耦合到音頻前端36以執(zhí)行如本文所描述的數(shù)字轉(zhuǎn)換、編碼和解碼、以及風(fēng)噪聲降低。處理器4耦合到音頻前端以借助音頻前端的中斷、設(shè)置參數(shù)、和控制操作來驅(qū)動(dòng)處理??梢栽谝纛l前端或通信封裝體6中執(zhí)行基于幀的處理。

在各種實(shí)現(xiàn)中,計(jì)算設(shè)備100可以是膝上型計(jì)算機(jī)、上網(wǎng)本、筆記本、超極本、智能電話、平板、個(gè)人數(shù)字助理(PDA)、超移動(dòng)PC、移動(dòng)電話、臺(tái)式計(jì)算機(jī)、服務(wù)器、打印機(jī)、掃描儀、監(jiān)視器、機(jī)頂盒、娛樂控制單元、數(shù)字相機(jī)、便攜式音樂播放器、或數(shù)字視頻記錄器。該計(jì)算設(shè)備可以是固定的、便攜式的、或可穿戴的。在進(jìn)一步實(shí)現(xiàn)方式中,計(jì)算設(shè)備100可以是對(duì)數(shù)據(jù)進(jìn)行處理的任何其他電子設(shè)備。

實(shí)施例可以實(shí)現(xiàn)為使用母板、專用集成電路(ASIC)、和/或現(xiàn)場(chǎng)可編程門陣列(FPGA)互連的一個(gè)或多個(gè)存儲(chǔ)器芯片、控制器、CPU(中央處理單元)、微芯片或集成電路的一部分。

對(duì)“一個(gè)實(shí)施例”、“實(shí)施例”、“示例實(shí)施例”、“各實(shí)施例”等的引用表明這樣描述的本發(fā)明的這個(gè)或這些個(gè)實(shí)施例可以包括具體特征、結(jié)構(gòu)、或特性,但并不是每個(gè)實(shí)施例必定包括這些具體特征、結(jié)構(gòu)、或特性。進(jìn)一步,某些實(shí)施例可具有針對(duì)其他實(shí)施例所描述的特征的一部分、全部、或不具有任何這些特征。

在以下說明書和權(quán)利要求書中,可以使用術(shù)語“耦合”及其衍生詞?!榜詈稀庇糜谥甘緝蓚€(gè)或更多個(gè)元件彼此協(xié)作或相互作用,但是它們之間可以具有或不具有中間的物理或電學(xué)組件。

如權(quán)利要求書中所使用的,除非另有說明,使用序數(shù)形容詞“第一”、“第二”、“第三”等來描述公共元素僅僅指示相同元素的不同實(shí)例被提及,并且不旨在暗示如此描述的元件必須在或者時(shí)間上、空間上、排名上、或以任何其它方式處于給定序列中。

附圖和前述描述給出了實(shí)施例的示例。本領(lǐng)域技術(shù)人員將理解,所描述的元件中的一個(gè)或多個(gè)可以被良好地組合成單個(gè)功能元件。可替代地,某些元件可以分成多個(gè)功能元件。來自一個(gè)實(shí)施例的元件可以被添加到另一個(gè)實(shí)施例。例如,本文描述的過程的順序可以改變并且不限于本文所述的方式。此外,任何流程圖的動(dòng)作不需要以所示的順序?qū)崿F(xiàn);也不一定需要執(zhí)行所有的動(dòng)作。此外,不依賴于其他動(dòng)作的那些動(dòng)作可以與其他動(dòng)作并行地執(zhí)行。實(shí)施例的范圍決不限于這些特定示例。無論是否在說明書中明確給出,諸如材料的結(jié)構(gòu)、尺寸和使用上的差異的許多變化都是可能的。實(shí)施例的范圍至少與所附權(quán)利要求給出的一樣寬。

下面的示例涉及進(jìn)一步的實(shí)施例。不同實(shí)施例的各種特征可以與包括的一些特征和排除的其他特征進(jìn)行各種組合以適應(yīng)各種不同的應(yīng)用。一些實(shí)施例涉及一種方法,所述方法包括:將音頻信號(hào)分解成多個(gè)子帶,所述音頻信號(hào)包括風(fēng)噪聲;對(duì)所述多個(gè)子帶中的第一子帶進(jìn)行低通濾波;在低通濾波之后從所述第一子帶中去除風(fēng)噪聲;以及在去除風(fēng)噪聲之后,將所述第一子帶與所述多個(gè)子帶中的其他子帶組合。

在一些實(shí)施例中,所述音頻信號(hào)是以第一采樣率被采樣的,所述方法進(jìn)一步包括:在去除風(fēng)噪聲之前,將所述第一子帶下采樣到第二采樣率;以及在去除所述風(fēng)噪聲之后,將所述第一子帶上采樣到所述第一采樣率。

進(jìn)一步的實(shí)施例包括在上采樣之后對(duì)所述第一子帶進(jìn)行低通濾波。

一些實(shí)施例包括:在去除風(fēng)噪聲之前對(duì)所述第一子帶進(jìn)行低通濾波以及在上采樣之后進(jìn)行低通濾波都是在相同的低通濾波截止頻率上進(jìn)行的。

在一些實(shí)施例中,所述低通濾波截止頻率被選擇為高于風(fēng)噪聲頻率。一些實(shí)施例包括將所述音頻信號(hào)施加到產(chǎn)生所述多個(gè)子帶的交叉濾波器。

在一些實(shí)施例中,所述音頻信號(hào)包括從麥克風(fēng)和數(shù)模轉(zhuǎn)換器接收的數(shù)字樣本流。在一些實(shí)施例中,所述數(shù)字樣本具有第一采樣頻率,所述方法進(jìn)一步包括:在去除風(fēng)噪聲之前,將所述第一子帶下采樣到低于所述第一采樣率的第二采樣率。

在一些實(shí)施例中,去除風(fēng)噪聲包括:估計(jì)所述第一子帶的功率頻譜密度以確定風(fēng)噪聲的存在性,并且然后通過對(duì)所述子帶應(yīng)用頻譜減法以降低所述風(fēng)噪聲。

一些實(shí)施例涉及一種裝置,所述裝置包括:頻率濾波器,所述頻率濾波器用于將音頻信號(hào)分解成多個(gè)子帶,所述音頻信號(hào)包括風(fēng)噪聲;低通濾波器,所述低通濾波器用于對(duì)所述多個(gè)子帶中的第一子帶進(jìn)行濾波;噪聲去除電路,所述噪聲去除電路用于在低通濾波之后從所述第一子帶中去除風(fēng)噪聲;以及組合器,所述組合器用于在去除風(fēng)噪聲之后將所述第一子帶與所述多個(gè)子帶中的其他子帶組合。

一些實(shí)施例進(jìn)一步包括:第一采樣率轉(zhuǎn)換器,所述第一采樣率轉(zhuǎn)換器用于在去除風(fēng)噪聲之前將所述第一子帶下采樣到第二采樣率;以及第二采樣率轉(zhuǎn)換器,所述第二采樣率轉(zhuǎn)換器用于在去除所述風(fēng)噪聲之后將所述第一子帶上采樣到所述第一采樣率。

一些實(shí)施例進(jìn)一步包括:第二低通濾波器,所述第二低通濾波器用于在上采樣之后對(duì)所述第一子帶進(jìn)行濾波。

在一些實(shí)施例中,所述第一和第二低通濾波器具有相同的低通濾波截止頻率。在一些實(shí)施例中,所述低通濾波截止頻率被選擇為高于風(fēng)噪聲頻率。在一些實(shí)施例中,所述音頻信號(hào)包括從麥克風(fēng)和數(shù)模轉(zhuǎn)換器接收的數(shù)字樣本流。在一些實(shí)施例中,所述數(shù)字樣本具有第一采樣頻率,所述方法進(jìn)一步包括:在去除風(fēng)噪聲之前,將所述第一子帶下采樣到低于所述第一采樣率的第二采樣率。在一些實(shí)施例中,所述噪聲去除電路通過以下方式來去除風(fēng)噪聲:估計(jì)所述第一子帶的功率頻譜密度以確定風(fēng)噪聲的存在性,并且然后通過對(duì)所述子帶應(yīng)用頻譜減法以降低所述風(fēng)噪聲。

一些實(shí)施例涉及一種裝置,所述裝置包括:麥克風(fēng);模數(shù)轉(zhuǎn)換器,所述模數(shù)轉(zhuǎn)換器耦合到所述麥克風(fēng)以產(chǎn)生作為樣本序列的音頻信號(hào);頻率濾波器,所述頻率濾波器用于將所述音頻信號(hào)分解成多個(gè)子帶,所述音頻信號(hào)包括風(fēng)噪聲;低通濾波器,所述低通濾波器用于對(duì)所述多個(gè)子帶中的第一子帶進(jìn)行濾波;噪聲去除電路,所述噪聲去除電路用于在低通濾波之后從所述第一子帶中去除風(fēng)噪聲;組合器,所述組合器用于在去除風(fēng)噪聲之后將所述第一子帶與所述多個(gè)子帶中的其他子帶組合;以及發(fā)射機(jī),所述發(fā)射機(jī)用于將所述經(jīng)濾波的音頻發(fā)射到遠(yuǎn)程設(shè)備。

一些實(shí)施例進(jìn)一步包括成幀電路,所述成幀電路用于在分解所述音頻信號(hào)之前將所述音頻信號(hào)的樣本組合成幀。在一些實(shí)施例中,所述第一子帶具有4kHz的低通濾波截止頻率,所述裝置進(jìn)一步包括采樣率轉(zhuǎn)換電路,所述采樣率轉(zhuǎn)換電路用于在去除風(fēng)噪聲之前將所述第一子帶下采樣到8kHz。

當(dāng)前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
柳江县| 苍溪县| 阿克苏市| 剑阁县| 香格里拉县| 封丘县| 突泉县| 玉环县| 商水县| 德保县| 思南县| 定边县| 清水县| 莫力| 神农架林区| 长岛县| 曲松县| 本溪市| 惠水县| 广丰县| 西城区| 肥西县| 三穗县| 体育| 平远县| 藁城市| 德化县| 绵阳市| 科尔| 乌海市| 太仆寺旗| 新竹县| 同德县| 吉隆县| 肥东县| 平乐县| 随州市| 南部县| 加查县| 潮州市| 金华市|