聲學(xué)信號處理裝置和聲學(xué)信號處理方法
【專利摘要】提供一種用于調(diào)節(jié)起音、余音和噪聲成分并且使輸出音適合收聽者的偏好的聲學(xué)信號處理裝置。該聲學(xué)信號處理裝置包括:FFT部,用于通過將輸入音頻信號從時域變換成頻域來計算頻譜信號,并且生成第一振幅譜信號和相位譜信號;起音成分控制器(10),用于通過控制第一振幅譜信號的起音成分來生成第二振幅譜信號;余音成分控制器(20),用于通過控制第一振幅譜信號的余音成分來生成第三振幅譜信號;第一相加部(40),用于通過將第一振幅譜信號、第二振幅譜信號和第三振幅譜信號進(jìn)行合成來生成第四振幅譜信號;以及IFFT部,用于基于第四振幅譜信號和FFT部所生成的相位譜信號來生成從頻域變換成時域的音頻信號。
【專利說明】聲學(xué)信號處理裝置和聲學(xué)信號處理方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及聲學(xué)信號處理裝置和聲學(xué)信號處理方法,并且更具體地,涉及能夠進(jìn)行所輸入的音頻信號中的起音(attack sound)或余音(reverberat1n)的增強(qiáng)/降低處理以及噪聲降低處理等的聲學(xué)信號處理裝置和聲學(xué)信號處理方法。
【背景技術(shù)】
[0002]如今,經(jīng)常使用數(shù)據(jù)壓縮后的數(shù)字音頻信號來生成音樂。作為數(shù)據(jù)壓縮后的數(shù)字音頻信號其中之一,眾所周知有MP3 (MPEG音頻層-3)。MP3是用于使用數(shù)字技術(shù)來處理聲學(xué)數(shù)據(jù)的壓縮方法其中之一。如今,MP3廣泛用在攜帶型音樂播放器等中。
[0003]諸如MP3等的一般的數(shù)字音頻信號的問題在于以下:在直接對解壓縮后的數(shù)字音頻信號進(jìn)行模擬轉(zhuǎn)換以供輸出的情況下,起音(起音成分)劣化而使音質(zhì)受損。為了應(yīng)對該問題,提出了放大起音的信號輸出的數(shù)字信號處理裝置(例如,參考專利文獻(xiàn)I)。
[0004]所提出的數(shù)字信號處理裝置將經(jīng)由帶分割濾波器所提取的預(yù)定頻帶的信號電平與預(yù)定閾值電平進(jìn)行比較,并且將電平等于或高于閾值電平的數(shù)字信號檢測作為起音。然后,數(shù)字信號處理裝置放大所檢測到的起音,并將放大后的起音與帶分割之前的數(shù)字信號合成,由此增強(qiáng)起音。
[0005]如上所述,可以根據(jù)信號電平來放大并增強(qiáng)預(yù)定頻帶中所包括的起音,以使得在例如放大低頻起首的情況下,可以增強(qiáng)諸如鼓聲等的強(qiáng)力首的動感。在放大聞頻起首的情況下,可以使諸如鈸聲等的聲音的透明感更強(qiáng)。
[0006]如上所述,通過根據(jù)信號電平放大并增強(qiáng)起音可能會使輸出聲音整體變尖銳。因而,所提出的裝置可以在起音可能明顯劣化的諸如MP3等的壓縮后的音頻信號的質(zhì)量方面帶來高的改善效果。
[0007]現(xiàn)有技術(shù)文獻(xiàn)
[0008]專利文獻(xiàn)
[0009]專利文獻(xiàn)1:日本特開2007-36710
【發(fā)明內(nèi)容】
[0010]發(fā)明要解決的問題
[0011]在上述的聲學(xué)信號處理裝置中,基于預(yù)定閾值來檢測聲源中所包括的起音。然而,聲源還收錄各種振幅電平,由此僅基于閾值難以充分檢測到起音。
[0012]在包括樂器聲和語音這兩者的聲源中,通過將樂器聲和語音合成來表示聲源的振幅,由此基于閾值難以將樂器聲的起音的信號電平與語音的信號電平區(qū)分開。因此,不僅樂器聲的起音被不利地放大,而且語音信號也被不利地放大。
[0013]此外,樂器聲包括波形的上升時的起音和在該起音之后持續(xù)的余音(余音成分)。然而,上述的數(shù)字信號處理裝置僅控制起音,但沒有特別控制余音。因此,盡管可以通過放大起音來獲得尖銳的輸出聲音,但存在與余音相比僅尖銳感被過度增強(qiáng)的可能性。
[0014]此外,與均勻地放大預(yù)定頻帶的使用例如均衡器的傳統(tǒng)放大方法相比,上述的數(shù)字信號處理裝置可以在S/N比(信噪比)沒有降低的情況下增強(qiáng)輸出聲音。然而,在聲源的收錄環(huán)境中始終存在噪聲的情況下、特別是在起音的提取帶中包括穩(wěn)態(tài)噪聲的情況下,可以增強(qiáng)包括噪聲的起音以供合成,這可能導(dǎo)致S/N比大幅降低。
[0015]此外,在收聽音樂時,音樂對于收聽者而言是好是壞在很大程度上依賴于收聽者的偏好。因而,一些收聽者喜歡尖銳聲音,而另一些收聽者則認(rèn)為尖銳聲音煩人。一些收聽者喜歡包括大量余音成分的聲音,而另一些收聽者則不喜歡這種聲音。一些收聽者喜歡包括聲源本身中所包含的穩(wěn)態(tài)信號成分(共鳴)或聲源的收錄環(huán)境中所包含的穩(wěn)態(tài)噪聲成分作為具有現(xiàn)場感的聲音,而另一些收聽者則喜歡清晰聲音。也就是說,僅通過使用上述的數(shù)字信號處理裝置放大起音以產(chǎn)生尖銳聲音,不容易滿足收聽者的各種偏好(要求)。
[0016]本發(fā)明是考慮到上述問題而作出的,并且其目的是提供一種聲學(xué)信號處理裝置和聲學(xué)信號處理方法,其中該聲學(xué)信號處理裝置和聲學(xué)信號處理方法能夠通過調(diào)節(jié)諸如樂器聲等的聲源中所包括的起音、在該起音之后持續(xù)的余音、以及收錄環(huán)境中的穩(wěn)態(tài)噪聲成分或聲源中所包括的穩(wěn)態(tài)信號成分,來產(chǎn)生滿足收聽者偏好的輸出聲音。
[0017]用于解決問題的方案
[0018]根據(jù)本發(fā)明的一種聲學(xué)信號處理裝置,包括:快速傅立葉變換部即FFT部,用于進(jìn)行以下操作:在時間每次偏移傅立葉變換長度和重疊長度之間的差分時間的情況下對輸入音頻信號進(jìn)行短時間傅立葉變換,以計算在時間上彼此相差了所述差分時間的多個振幅譜;針對各頻率來計算所計算出的各振幅譜的時間變化,以將所述輸入音頻信號從時域變換成頻域并且計算頻譜信號;以及基于所計算出的頻譜信號來生成第一振幅譜信號和相位譜信號;起音成分控制器,用于控制所述FFT部所生成的所述第一振幅譜信號的起音成分,以生成第二振幅譜信號;余音成分控制器,用于控制所述FFT部所生成的所述第一振幅譜信號的余音成分,以生成第三振幅譜信號;第一相加部,用于將所述FFT部所生成的所述第一振幅譜信號、所述起音成分控制器所生成的所述第二振幅譜信號和所述余音成分控制器所生成的所述第三振幅譜信號進(jìn)行合成,以生成第四振幅譜信號;以及逆快速傅立葉變換部即IFFT部,用于基于所述第一相加部所生成的所述第四振幅譜信號和所述FFT部所生成的所述相位譜信號來計算頻譜信號,并且對所計算出的頻譜信號進(jìn)行短時間逆傅立葉變換處理和重疊相加,以生成從頻域變換成時域的音頻信號,其中,所述起音成分控制器包括:第一高通濾波器部即第一 HPF部,用于針對各譜,基于預(yù)設(shè)的第一截止頻率來對所述FFT部所生成的所述第一振幅譜信號進(jìn)行高通濾波處理;第一限幅器部,用于對所述第一 HPF部進(jìn)行了高通濾波處理的振幅譜信號的負(fù)側(cè)振幅進(jìn)行限制以將該負(fù)側(cè)振幅設(shè)置為0,從而針對各譜來檢測該振幅譜信號的起音成分;以及第一增益部,用于基于預(yù)設(shè)的第一加權(quán)量來對所述第一限幅器部所檢測到的振幅譜信號的起音成分進(jìn)行加權(quán)處理,以及所述余音成分控制器包括:第二高通濾波器部即第二 HPF部,用于針對各譜,基于預(yù)設(shè)的第二截止頻率來對所述FFT部所生成的所述第一振幅譜信號進(jìn)行高通濾波處理;振幅反轉(zhuǎn)部,用于將所述第二 HPF部進(jìn)行了高通濾波處理的振幅譜信號乘以-1,以進(jìn)行振幅反轉(zhuǎn);第二限幅器部,用于對所述振幅反轉(zhuǎn)部進(jìn)行了振幅反轉(zhuǎn)的振幅譜信號的負(fù)側(cè)振幅進(jìn)行限制以將該負(fù)側(cè)振幅設(shè)置為0,從而針對各譜來檢測該振幅譜信號的余音成分;以及第二增益部,用于基于預(yù)設(shè)的第二加權(quán)量來對所述第二限幅器部所檢測到的振幅譜信號的余音成分進(jìn)行加權(quán)處理。
[0019]根據(jù)本發(fā)明的一種聲學(xué)信號處理裝置的聲學(xué)信號處理方法,其中在所述聲學(xué)信號處理裝置中,對輸入音頻信號進(jìn)行起音成分控制和余音成分控制,所述聲學(xué)信號處理裝置包括:快速傅立葉變換部即FFT部,用于將所述輸入音頻信號從時域變換成頻域以計算頻譜信號,并且生成第一振幅譜信號和相位譜信號;起音成分控制器,用于控制所述FFT部所生成的所述第一振幅譜信號的起音成分,以生成第二振幅譜信號;余音成分控制器,用于控制所述FFT部所生成的所述第一振幅譜信號的余音成分,以生成第三振幅譜信號;第一相加部,用于將所述FFT部所生成的所述第一振幅譜信號、所述起音成分控制器所生成的所述第二振幅譜信號和所述余音成分控制器所生成的所述第三振幅譜信號進(jìn)行合成,以生成第四振幅譜信號;以及逆快速傅立葉變換部即IFFT部,用于基于所述第一相加部所生成的所述第四振幅譜信號和所述FFT部所生成的所述相位譜信號,來生成從頻域變換成時域的音頻信號,所述起音成分控制器包括:第一高通濾波器部即第一 HPF部、第一限幅器部和第一增益部,所述余音成分控制器包括:第二高通濾波器部即第二 HPF部、振幅反轉(zhuǎn)部、第二限幅器部和第二增益部,其中,所述聲學(xué)信號處理方法包括以下步驟:利用所述FFT部來進(jìn)行以下操作:在時間每次偏移傅立葉變換長度和重疊長度之間的差分時間的情況下對所述輸入音頻信號進(jìn)行短時間傅立葉變換,以計算在時間上彼此相差了所述差分時間的多個振幅譜;針對各頻率來計算所計算出的各振幅譜的時間變化以計算頻譜信號;以及基于所計算出的頻譜信號來生成所述第一振幅譜信號和所述相位譜信號;在所述起音成分控制器中,進(jìn)行以下操作:利用所述第一 HPF部,針對各譜、基于預(yù)設(shè)的第一截止頻率來對所述FFT部所生成的所述第一振幅譜信號進(jìn)行高通濾波處理;利用所述第一限幅器部,對所述第一HPF部進(jìn)行了高通濾波處理的振幅譜信號的負(fù)側(cè)振幅進(jìn)行限制以將該負(fù)側(cè)振幅設(shè)置為0,從而針對各譜來檢測該振幅譜信號的起音成分;以及利用所述第一增益部,基于預(yù)設(shè)的第一加權(quán)量來對所述第一限幅器部所檢測到的振幅譜信號的起音成分進(jìn)行加權(quán)處理,以及在所述余音成分控制器中,進(jìn)行以下操作:利用所述第二 HPF部,針對各譜、基于預(yù)設(shè)的第二截止頻率來對所述FFT部所生成的所述第一振幅譜信號進(jìn)行高通濾波處理;利用所述振幅反轉(zhuǎn)部,將所述第二 HPF部進(jìn)行了高通濾波處理的振幅譜信號乘以-1,以進(jìn)行振幅反轉(zhuǎn);利用所述第二限幅器部,對所述振幅反轉(zhuǎn)部進(jìn)行了振幅反轉(zhuǎn)的振幅譜信號的負(fù)側(cè)振幅進(jìn)行限制以將該負(fù)側(cè)振幅設(shè)置為0,從而針對各譜來檢測該振幅譜信號的余音成分;以及利用所述第二增益部,基于預(yù)設(shè)的第二加權(quán)量來對所述第二限幅器部所檢測到的振幅譜信號的余音成分進(jìn)行加權(quán)處理;利用所述第一相加部,將所述第一振幅譜信號、所述第一增益部對起音成分進(jìn)行了加權(quán)處理的所述第二振幅譜信號、以及所述第二增益部對余音成分進(jìn)行了加權(quán)處理的所述第三振幅譜信號進(jìn)行合成,以生成第四振幅譜信號;以及利用所述IFFT部,基于所述第四振幅譜信號和所述FFT部所生成的所述相位譜信號來計算頻譜信號,并且對所計算出的頻譜信號進(jìn)行短時間逆傅立葉變換和重疊相加,以生成從頻域變換成時域的音頻信號。
[0020]在根據(jù)本發(fā)明的聲學(xué)信號處理裝置和聲學(xué)信號處理方法中,通過調(diào)整起音成分控制器的第一增益部的第一加權(quán)量,可以增強(qiáng)/降低音頻信號的起音成分(起音)。此外,通過調(diào)整第一HPF部的第一截止頻率,可以改變起音成分的控制時間(增強(qiáng)時間、降低時間)。因而,通過根據(jù)信號電平放大起音成分以增強(qiáng)該起音成分,可以使輸出音整體變尖銳。此夕卜,通過控制諸如MP3等的常見數(shù)字音頻信號中的可能劣化的起音成分,可以提高數(shù)字音頻信號的音質(zhì)。
[0021]此外,在根據(jù)本發(fā)明的聲學(xué)信號處理裝置和聲學(xué)信號處理方法中,通過調(diào)整余音成分控制器的第二增益部的第二加權(quán)量,可以增強(qiáng)/降低音頻信號的余音成分(余音)。此外,通過調(diào)整第二 HPF部的第二截止頻率,可以改變余音的控制時間(增強(qiáng)時間、降低時間)。因而,可以根據(jù)收聽者的偏好來增強(qiáng)或降低余音。
[0022]此外,基于頻域的各振幅譜的變化量來進(jìn)行上述的利用起音成分控制器的起音成分控制處理和利用余音成分控制器的余音成分控制處理。這樣解決了在使用閾值來識別起音的傳統(tǒng)方法中所產(chǎn)生的問題、即防止了檢測狀態(tài)受到聲源的振幅電平的大幅影響。
[0023]此外,可以針對各振幅譜來個別設(shè)置起音成分控制器和余音成分控制器中的截止頻率(第一截止頻率和第二截止頻率)或加權(quán)量(第一加權(quán)量和第二加權(quán)量)。因而,如下結(jié)構(gòu)也是可能的:將頻帶分割成多個帶,并且針對多個帶各自進(jìn)行設(shè)置。
[0024]例如,將所輸入的音頻信號的頻率區(qū)域分割成低頻區(qū)域、中頻區(qū)域和高頻區(qū)域。在這種情況下,通過在低頻區(qū)域中增強(qiáng)起音成分并且降低余音,可以再現(xiàn)鼓等的擊打力和應(yīng)答性的聲音。此外,在中頻區(qū)域中,增強(qiáng)余音成分以增強(qiáng)語音的共鳴。此外,在高頻區(qū)域中,增強(qiáng)起音成分以使鈸聲等的透明感更強(qiáng)。
[0025]上述的聲學(xué)信號處理裝置還可以包括噪聲控制器,所述噪聲控制器用于對所述第一相加部所生成的所述第四振幅譜信號進(jìn)行噪聲控制,以生成第五振幅譜信號,其中,所述IFFT部基于所述噪聲控制器所生成的所述第五振幅譜信號和所述FFT部所生成的所述相位譜信號,來生成從頻域變換成時域的音頻信號,以及所述噪聲控制器包括:第三高通濾波器部即第三HPF部,用于針對各譜,基于預(yù)設(shè)的第三截止頻率來對所述第一相加部所生成的所述第四振幅譜信號進(jìn)行高通濾波處理;第三限幅器部,用于對所述第三HPF部進(jìn)行了高通濾波處理的振幅譜信號的負(fù)側(cè)振幅進(jìn)行限制,以將該負(fù)側(cè)振幅設(shè)置為O ;第三增益部,用于基于預(yù)設(shè)的作為O以上且I以下的值的第三加權(quán)量,來對所述第三限幅器部對負(fù)側(cè)振幅進(jìn)行了限制的振幅譜信號進(jìn)行加權(quán)處理;第四增益部,用于基于通過從值I中減去所述第三加權(quán)量的值所獲得的加權(quán)量,來對所述第一相加部所生成的所述第四振幅譜信號進(jìn)行加權(quán)處理;以及第二相加部,用于將所述第三增益部進(jìn)行了加權(quán)處理的振幅譜信號和所述第四增益部進(jìn)行了加權(quán)處理的振幅譜信號進(jìn)行合成,以生成所述第五振幅譜信號。
[0026]在所述聲學(xué)信號處理方法中,所述聲學(xué)信號處理裝置還可以包括:噪聲控制器,用于對所述第一相加部所生成的所述第四振幅譜信號進(jìn)行噪聲控制,以生成第五振幅譜信號,所述噪聲控制器包括:第三高通濾波器部即第三HPF部、第三限幅器部、第三增益部、第四增益部和第二相加部,其中,所述聲學(xué)信號處理方法還可以包括以下步驟:利用所述IFFT部,基于所述噪聲控制器所生成的所述第五振幅譜信號和所述FFT部所生成的所述相位譜信號來生成從頻域變換成時域的音頻信號;以及在所述噪聲控制器中,進(jìn)行以下操作:利用所述第三HPF部,針對各譜、基于預(yù)設(shè)的第三截止頻率來對所述第一相加部所生成的所述第四振幅譜信號進(jìn)行高通濾波處理;利用所述第三限幅器部,對所述第三HPF部進(jìn)行了高通濾波處理的振幅譜信號的負(fù)側(cè)振幅進(jìn)行限制,以將該負(fù)側(cè)振幅設(shè)置為O ;利用所述第三增益部,基于預(yù)設(shè)的作為O以上且I以下的值的第三加權(quán)量來對所述第三限幅器部對負(fù)側(cè)振幅進(jìn)行了限制的振幅譜信號進(jìn)行加權(quán)處理;利用所述第四增益部,基于通過從值I中減去所述第三加權(quán)量的值所獲得的加權(quán)量來對所述第一相加部所生成的所述第四振幅譜信號進(jìn)行加權(quán)處理;以及利用所述第二相加部,將所述第三增益部進(jìn)行了加權(quán)處理的振幅譜信號和所述第四增益部進(jìn)行了加權(quán)處理的振幅譜信號進(jìn)行合成,以生成所述第五振幅譜信號。
[0027]此外,在根據(jù)本發(fā)明的聲學(xué)信號處理裝置和聲學(xué)信號處理方法中,通過調(diào)整噪聲控制器的第三增益部和第四增益部的加權(quán)量,可以調(diào)整噪聲降低量。此外,通過調(diào)整第三HPF部的第三截止頻率,可以抑制噪聲的DC成分。因而,可以調(diào)整聲源的收錄環(huán)境或聲源本身中所包括的穩(wěn)態(tài)噪聲。
[0028]此外,上述的噪聲降低處理由噪聲控制器基于頻域的各振幅譜的變化量來進(jìn)行。這樣解決了使用閾值來識別起音的傳統(tǒng)方法中所產(chǎn)生的問題、即防止了檢測狀態(tài)受到聲源的振幅電平的大幅影響。
[0029]在再現(xiàn)包括聲源本身中所包含的穩(wěn)態(tài)信號成分和/或聲源的收錄環(huán)境中所包含的穩(wěn)態(tài)噪聲成分的音頻信號的情況下,噪聲等可能作為具有現(xiàn)場感的聲音被感知為“收聽者處于收錄環(huán)境”;然而,樂器聲或語音的清晰度趨于下降。在這種情況下,通過使用根據(jù)本發(fā)明的聲學(xué)信號處理裝置和聲學(xué)信號處理方法,可以在噪聲控制器中進(jìn)行噪聲控制以調(diào)整噪聲的降低量,由此使得能夠在一定程度上維持現(xiàn)場感的同時,將樂器聲或語音的聲學(xué)成分輸出作為清晰聲音。
[0030]發(fā)明的效果
[0031]在根據(jù)本發(fā)明的聲學(xué)信號處理裝置和聲學(xué)信號處理方法中,可以調(diào)節(jié)諸如樂器聲等的聲源中所包括的起音成分(起音)、在該起音成分之后持續(xù)的余音成分(余音)、以及收錄環(huán)境中的穩(wěn)態(tài)噪聲成分或聲源中所包括的穩(wěn)態(tài)信號成分,由此滿足收聽者的各種偏好。
【專利附圖】
【附圖說明】
[0032]圖1是示出根據(jù)實(shí)施例的聲學(xué)信號處理裝置的示意結(jié)構(gòu)的框圖。
[0033]圖2是示出根據(jù)實(shí)施例的向著FFT部所輸入的音頻信號、以及在對該音頻信號進(jìn)行短時間傅立葉變換處理的情況下的傅立葉變換長度N和重疊長度M的圖。
[0034]圖3是示出根據(jù)實(shí)施例的FFT部中的針對各時間偏移的振幅譜的圖。
[0035]圖4是示出根據(jù)實(shí)施例的FFT部中的振幅譜的時間變化的圖。
[0036]圖5是示出根據(jù)實(shí)施例的頻譜域?yàn)V波部的示意結(jié)構(gòu)的框圖。
[0037]圖6是用于說明針對各頻率執(zhí)行根據(jù)實(shí)施例的聲學(xué)信號處理裝置的處理的狀態(tài)的圖。
[0038]圖7 (a)是不出第一增益部和第二增益部中所設(shè)置的加權(quán)量和與該加權(quán)量相對應(yīng)的增強(qiáng)/降低量之間的關(guān)系的圖;并且(b)是示出第一 HPF部和第二 HPF部中所設(shè)置的截止頻率的值和根據(jù)所設(shè)置的截止頻率而改變的起音或余音的控制時間之間的關(guān)系的圖。
[0039]圖8(a)是示出噪聲控制器的第三增益部中的加權(quán)量和噪聲降低量之間的關(guān)系的圖;并且(b)是示出聲學(xué)信號處理中所使用的所輸入的音頻信號的狀態(tài)的示例的圖。
[0040]圖9 (a)是示出在僅使起音控制器的第一 HPF部和第一限幅器部進(jìn)行工作的情況下所獲得的輸出信號的圖;并且(b)是示出如下信號的圖,其中該信號是通過將通過使第一HPF部和第一限幅器部進(jìn)行工作以將第一增益部的加權(quán)值設(shè)置為I所獲得的音頻信號與輸入至頻譜域?yàn)V波部的音頻信號合成所獲得的。
[0041]圖10(a)是示出如下信號的圖,其中該信號是通過將通過使起音控制器的第一HPF部和第一限幅器部進(jìn)行工作以將第一增益部的加權(quán)值設(shè)置為-1所獲得的音頻信號與輸入至頻譜域?yàn)V波部的音頻信號合成所獲得的;并且(b)是示出在圖9(b)所示的信號的設(shè)置條件中、在將第一 HPF部的截止頻率從2.5Hz改變?yōu)?.25Hz的情況下所合成的信號的圖。
[0042]圖11 (a)是示出在僅使余音控制器的第二 HPF部、振幅反轉(zhuǎn)部和第二限幅器部進(jìn)行工作的情況下所獲得的輸出信號的圖;并且(b)是示出如下信號的圖,其中該信號是通過將圖9(b)所示的信號、使第二 HPF部、振幅反轉(zhuǎn)部和第二限幅器部進(jìn)行工作以將第二增益部的加權(quán)值設(shè)置為-1所獲得的音頻信號、以及輸入至頻譜域?yàn)V波部的音頻信號合成所獲得的。
[0043]圖12是示出如下信號的圖,其中該信號是通過將在起音控制器中降低了起音的圖10(a)所示的信號、使余音控制器的第二 HPF部、振幅反轉(zhuǎn)部和第二限幅器部進(jìn)行工作以將第二增益部的加權(quán)值設(shè)置為I所獲得的音頻信號、以及輸入至頻譜域?yàn)V波部的音頻信號合成所獲得的。
[0044]圖13(a)是示出通過將1.2kHz的穩(wěn)態(tài)正弦波作為噪聲添加至所輸入的音頻信號所獲得的輸入信號的圖;并且(b)是示出通過在噪聲控制器中對圖13(a)所示的信號應(yīng)用噪聲控制處理所獲得的信號的圖。
【具體實(shí)施方式】
[0045]以下通過采用根據(jù)本發(fā)明的聲學(xué)信號處理裝置作為示例來進(jìn)行詳細(xì)說明。圖1是示出聲學(xué)信號處理裝置的示意結(jié)構(gòu)的框圖。如圖1所示,聲學(xué)信號處理裝置I包括FFT(快速傅立葉變換)部2、頻譜域?yàn)V波部3和IFFT (逆快速傅立葉變換)部4。將未示出的音頻信號再現(xiàn)裝置所再現(xiàn)的音頻信號輸入至聲學(xué)信號處理裝置I的FFT部2,并且將聲學(xué)信號處理裝置I中經(jīng)過了聲學(xué)處理的信號從IFFT部4輸出,然后從未不出的揚(yáng)聲器輸出。
[0046]FFT 部
[0047]FFT部2通過重疊處理并使用窗函數(shù)來對所輸入的音頻信號進(jìn)行加權(quán),并且進(jìn)行短時間傅立葉變換以將該所輸入信號從時域信號變換成頻域信號,由此計算實(shí)部和虛部的頻譜。此外,F(xiàn)FT部2將所計算出的頻譜變換成振幅譜信號(第一振幅譜信號)和相位譜信號。FFT部2將振幅譜信號(第一振幅譜信號)輸出至頻譜域?yàn)V波部3并將相位譜信號輸出至IFFT部4。
[0048]圖2是示出所輸入的音頻信號、以及在對該音頻信號應(yīng)用短時間傅立葉變換的情況下的傅立葉變換長度N和重疊長度M的圖。如圖2所示,F(xiàn)FT部2在時間每次偏移了傅立葉變換長度N和重疊長度M之間的差分時間的情況下進(jìn)行短時間傅立葉變換。更具體地,如圖2所示,計算與通過使時間偏移了傅立葉變換長度N和重疊長度M之間的差分時間所獲得的時間(時間tl、時間t2、時間t3、時間t4、時間t5、…)相對應(yīng)的tn(n= 1,2,…,η)個頻譜。
[0049]圖3是示出針對各時間偏移的振幅譜的圖。更具體地,圖3示出時間tl的振幅譜、時間t2的振幅譜和時間t3的振幅譜,其中在各振幅譜中,示出各頻率(fl, f2, f3, f4, f5, f6, f7, f8,...,fn-1, fn)的振幅。在將諸如音樂等的非穩(wěn)態(tài)信號作為音頻信號輸入至FFT部2的情況下,如圖3所示,振幅譜針對各時間偏移而改變。在傅立葉變換長度為N的情況下,頻譜的總數(shù)為N。
[0050]圖4是示出振幅譜的時間變化的圖。更具體地,圖4示出頻率fl的振幅譜的時間變化、頻率f2的振幅譜的時間變化和頻率f3的振幅譜的時間變化,其中在各時間變化中,不出各時間(tl, t2, t3, t4, t5,...,tk)的振幅。時間偏移的間隔與頻譜的米樣頻率相對應(yīng)。
[0051]頻譜域?yàn)V波部
[0052]圖5是示出頻譜域?yàn)V波部3的示意結(jié)構(gòu)的框圖。如圖5所示,頻譜域?yàn)V波部3包括起首控制器(起首成分控制器)10、余首控制器(余首成分控制器)20、B栄聲控制器30、弟一相加部40和第四限幅器部41。
[0053]將從FFT部2輸出至頻譜域?yàn)V波部3的振幅譜信號(第一振幅譜信號)的一部分輸入至起音控制器10和余音控制器20。將起音控制器10和余音控制器20中經(jīng)過了處理的各振幅譜信號(第二振幅譜信號和第三振幅譜信號)分別輸出至第一相加部40。將從FFT部2輸出至頻譜域?yàn)V波部3的振幅譜信號(第一振幅譜信號)的其余部分直接輸入至第一相加部40。
[0054]頻譜域?yàn)V波部3針對各振幅譜來對從FFT部2所輸入的音頻信號(第一振幅譜信號)應(yīng)用濾波處理、振幅限制處理和振幅加權(quán)處理。如圖1所示,沒有對所輸入的音頻信號的相位譜進(jìn)行任何處理。
[0055]起音控制器
[0056]起音控制器10包括第一 HPF (高通濾波器)部11、第一限幅器部12和第一增益部13。
[0057]第一 HPF部11針對各譜來對所輸入的振幅譜信號(第一振幅譜信號)應(yīng)用高通濾波處理即微分處理。第一限幅器部12對經(jīng)過了高通濾波處理的振幅譜信號的負(fù)側(cè)振幅進(jìn)行限制,以將該負(fù)側(cè)振幅設(shè)置為O。將負(fù)側(cè)振幅設(shè)置為O使得能夠檢測到各譜的信號的上升成分、即起音成分(起音)。
[0058]第一 HPF部11中要設(shè)置的截止頻率(第一截止頻率)的值越大,起音的控制時間越短;而截止頻率值越小,則控制時間越長??梢匀鐖D1所示將截止頻率設(shè)置為參數(shù)。
[0059]第一增益部13對第一限幅器部12所檢測到的振幅譜信號的起音成分應(yīng)用加權(quán)(相乘)。將由第一增益部13進(jìn)行了加權(quán)的信號(第二振幅譜信號)輸出至第一相加部40。在該相加部40中,將起音控制器10中對起音成分進(jìn)行了聲學(xué)處理的振幅譜信號(第二振幅譜信號)與原始振幅譜信號(沒有在起音控制器10和余音控制器20中經(jīng)過聲學(xué)處理的振幅譜信號:第一振幅譜信號)進(jìn)行合成。在作為合成結(jié)果、加權(quán)量(第一加權(quán)量)是正值的情況下,增強(qiáng)原始振幅譜信號(第一振幅譜信號)的起音,而在加權(quán)量是負(fù)值的情況下,降低其起音。
[0060]加權(quán)量的正值或負(fù)值越大,起音的增強(qiáng)或降低程度變得越高??梢匀鐖D1所示將加權(quán)量(第一加權(quán)量)設(shè)置為參數(shù)。在本實(shí)施例中,如后面所述,設(shè)置-1以上且I以下的值。
[0061]余音控制器
[0062]余音控制器20包括第二 HPF部21、振幅反轉(zhuǎn)部22、第二限幅器部23和第二增益部24。
[0063]第二 HPF部21針對各譜來對所輸入的振幅譜信號(第一振幅譜信號)應(yīng)用高通濾波處理、即微分處理。振幅反轉(zhuǎn)部22將第二 HPF部21中經(jīng)過了高通濾波處理的振幅譜信號乘以-1以進(jìn)行振幅的反轉(zhuǎn)。
[0064]第二限幅器部23對振幅已被反轉(zhuǎn)的振幅譜信號的負(fù)側(cè)振幅進(jìn)行限制以將該負(fù)側(cè)振幅設(shè)置為O。將負(fù)側(cè)振幅設(shè)置為O使得能夠檢測到各譜的信號的下降成分、即余音成分。
[0065]第二 HPF部21中要設(shè)置的截止頻率(第二截止頻率)的值越大,余音的控制時間越短;而截止頻率值越小,則控制時間越長??梢匀鐖D1所示將截止頻率設(shè)置為參數(shù)。
[0066]第二增益部24對第二限幅器部23所檢測到的振幅譜信號的余音成分應(yīng)用加權(quán)(相乘)。將由第二增益部24進(jìn)行了加權(quán)的信號(第三振幅譜信號)輸出至第一相加部40。在該相加部40中,將余音控制器20中對余音成分進(jìn)行了聲學(xué)處理的振幅譜信號(第三振幅譜信號)與原始振幅譜信號(沒有在起音控制器10和余音控制器20中經(jīng)過聲學(xué)處理的振幅譜信號:第一振幅譜信號)進(jìn)行合成。在作為合成結(jié)果、加權(quán)量(第二加權(quán)量)是正值的情況下,增強(qiáng)原始振幅譜信號(第一振幅譜信號)的余音,而在加權(quán)量是負(fù)值的情況下,降低原始振幅譜信號的余音。
[0067]加權(quán)量的正值或負(fù)值越大,余音的增強(qiáng)或降低程度變得越高??梢匀鐖D1所示將加權(quán)量(第二加權(quán)量)設(shè)置為參數(shù)。在本實(shí)施例中,如后面所述,設(shè)置-1以上且I以下的值。
[0068]第一相加部
[0069]第一相加部40具有將以下三個振幅譜信號進(jìn)行合成的作用:起音控制器10中對起音進(jìn)行了聲學(xué)處理的振幅譜信號(第二振幅譜信號)、余音控制器20中對余音進(jìn)行了聲學(xué)處理的振幅譜信號(第三振幅譜信號)、以及從FFT部2所輸入的原始振幅譜信號(第一振幅譜信號)。與原始振幅譜信號(第一振幅譜信號)相比,第一相加部40中所合成的信號(第四振幅譜信號)在起音和余音方面增強(qiáng)或降低,并且被輸出至噪聲控制器30。
[0070]噪聲控制器
[0071]噪聲控制器30具有提高S/N比的作用。噪聲控制器30包括第三HPF部31、第三限幅器部32、第三增益部33、第四增益部34和第二相加部35。將第一相加部40中所合成得到的振幅譜信號(第四振幅譜信號)輸出至第三HPF部31和第四增益部34。
[0072]第三HPF部31針對各譜來對第一相加部40中所合成得到的(所生成的)振幅譜信號(第四振幅譜信號)應(yīng)用高通濾波處理、即微分處理。第三限幅器部32對經(jīng)過了高通濾波處理的振幅譜信號的負(fù)側(cè)振幅進(jìn)行限制以將該負(fù)側(cè)振幅設(shè)置為O。
[0073]第三HPF部31和第三限幅器部32的上述操作使得能夠在同一頻率的振幅譜中將諸如CW(恒波)等的以穩(wěn)態(tài)存在的信號成分判斷為噪聲,并且可以通過微分處理來抑制穩(wěn)態(tài)成分即DC(直流)成分。通常,高通濾波器的截止頻率(第三截止頻率)越低,DC附近的信號成分被抑制得越多,由此可以抑制較為平穩(wěn)的信號。
[0074]如后面所述,在第三HPF部31中,將比第一 HPF部11和第二 HPF部21中所設(shè)置的截止頻率(第一截止頻率和第二截止頻率)低的頻率設(shè)置為截止頻率(第三截止頻率)。可以如圖1所示將該截止頻率設(shè)置為參數(shù)。
[0075]第三增益部33中對穩(wěn)態(tài)成分已被抑制的信號進(jìn)行加權(quán),然后輸出至第二相加部35。另一方面,與要輸入至第三HPF部31的振幅譜信號分開,向第四增益部34輸入第一相加部40中所合成得到的(所生成的)振幅譜信號(第四振幅譜信號)。第四增益部34對所輸入的振幅譜信號應(yīng)用加權(quán),然后將由此得到的信號輸出至第二相加部35。
[0076]第二相加部35將第三增益部33中經(jīng)過了加權(quán)的振幅譜信號和第四增益部34中經(jīng)過了加權(quán)的振幅譜信號進(jìn)行合成。第二相加部35中所合成得到的信號在第三增益部33和第四增益部34中經(jīng)過了加權(quán),因此變?yōu)樵肼暯档土恳驯徽{(diào)整的信號(第五振幅譜信號)。
[0077]可以如圖1所示將第三增益部33的加權(quán)量(第三加權(quán)量)和第四增益部34的加權(quán)量設(shè)置為參數(shù)。在本實(shí)施例中,將O以上且I以下的值設(shè)置為第三增益部33的加權(quán)量(第三加權(quán)量),并且將通過從值I中減去第三增益部33的加權(quán)量(第三加權(quán)量)所獲得的值設(shè)置為第四增益部34的加權(quán)量。
[0078]為了大幅提高S/N比,例如,將第三增益部33的加權(quán)量設(shè)置為1,并且將第四增益部34的加權(quán)量設(shè)置為O (1-1 = 0)。為了略微提高S/N比,例如,將第三增益部33的加權(quán)量設(shè)置為0.5,并且將第四增益部34的加權(quán)量設(shè)置為0.5(1-0.5 = 0.5)。
[0079]第四限幅器部
[0080]第四限幅器部41具有進(jìn)行調(diào)整以使得第二相加部35中經(jīng)過了合成處理的信號(第五振幅譜信號)的振幅沒有變?yōu)樨?fù)值的作用。更詳細(xì)地,第四限幅器部41進(jìn)行調(diào)整,以使得利用起音控制器10、余音控制器20和噪聲控制器30分別進(jìn)行了起音、余音和噪聲降低量的調(diào)整的信號的振幅沒有變?yōu)樨?fù)值。第四限幅器部41對該信號的負(fù)側(cè)振幅進(jìn)行限制以將該負(fù)側(cè)振幅設(shè)置為O。
[0081]針對各振幅譜進(jìn)行上述的起音控制器10、余音控制器20、第一相加部40、噪聲控制器30和第四限幅器部41的聲學(xué)處理。因此,如圖6所示,針對各頻率(fl,f2,-,fn),利用起音控制器10、余音控制器20、第一相加部40、噪聲控制器30和第四限幅器部41分別在起音、余音、噪聲降低量和振幅方面對頻譜信號進(jìn)行調(diào)整,并且針對各頻率(H’,f2’,…,fn')輸出由此得到的信號。在傅立葉變換長度N為1024的情況下,頻率的數(shù)量fn為1024,這意味著處理了 1024個頻譜信號。
[0082]將第四限幅器部41中進(jìn)行了振幅調(diào)整的頻譜信號輸出至IFFT部4。
[0083]IFFT 部
[0084]IFFT部4基于頻譜域?yàn)V波部3中進(jìn)行了濾波處理的振幅譜信號和從FFT部2所輸出的相位譜信號,來將所獲取到的信號變換成實(shí)部和虛部的頻譜。在將所獲取到的信號變換成頻譜之后,IFFT部4使用窗函數(shù)來對頻譜信號應(yīng)用加權(quán),然后進(jìn)行短時間逆傅立葉變換和重疊相加,以將由此得到的信號從頻域信號變換成時域信號。利用未示出的揚(yáng)聲器來輸出如此從頻域變換成時域的音頻信號。通過揚(yáng)聲器將利用聲學(xué)信號處理裝置I進(jìn)行了聲學(xué)處理的音頻信號作為如下信號輸出,其中在該信號中,諸如樂器聲等的聲源中所包括的起音和在該起音之后持續(xù)的余音受到控制并且S/N比進(jìn)一步提高。
[0085]設(shè)置倌.的調(diào)整
[0086]圖7(a)是示出起音控制器10的第一增益部13和余音控制器20的第二增益部24中所設(shè)置的加權(quán)量(第一加權(quán)量和第二加權(quán)量)的值和與該加權(quán)量相對應(yīng)的增強(qiáng)/降低量之間的關(guān)系的圖。如圖7(a)所示,第一增益部13和第二增益部24中所設(shè)置的加權(quán)量是-1?I內(nèi)的任意值。如圖7(a)所不,在加權(quán)量為正(加權(quán)量的設(shè)置值大于O)的情況下,與該加權(quán)量的值的增加量成比例地,在第一增益部13中進(jìn)行起音的增強(qiáng),并且在第二增益部24中進(jìn)行余音的增強(qiáng)。另一方面,如圖7(a)所示,在加權(quán)量為負(fù)(加權(quán)量的設(shè)置值小于O)的情況下,與該加權(quán)量的值的減少量成比例地,在第一增益部13中進(jìn)行起音的降低,并且在第二增益部24中進(jìn)行余音的降低。
[0087]圖7(b)是示出起音控制器10的第一 HPF部11和余音控制器20的第二 HPF部21中所設(shè)置的截止頻率(濾波器截止頻率:第一截止頻率)的值與根據(jù)所設(shè)置的截止頻率值而改變的起音或余音的控制時間之間的關(guān)系的圖。
[0088]如圖7(b)所示,截止頻率的值越大,起音的控制時間和余音的控制時間越短;而截止頻率值越小,則該控制時間越長。也就是說,截止頻率值越大,起音/余音增強(qiáng)/降低的時間越短;而截止頻率值越小,起音/余音增強(qiáng)/降低的時間越長。注意,截止頻率的倒數(shù)與控制時間大致相對應(yīng)。在本實(shí)施例中,將截止頻率的范圍設(shè)置為0.5Hz?1Hz (控制時間:2秒?0.1秒)。
[0089]圖8(a)是示出噪聲控制器30的第三增益部33中的加權(quán)量(第三加權(quán)量)和噪聲降低量之間的關(guān)系的圖。如上所述,噪聲控制器30的第三HPF部31抑制穩(wěn)態(tài)成分、即DC成分,由此將非常小的值(例如,0.031Hz (控制時間:32秒))設(shè)置為截止頻率(濾波器截止頻率:第三截止頻率)。
[0090]噪聲控制器30中所降低的噪聲的噪聲降低量根據(jù)第三增益部33中所設(shè)置的加權(quán)量的值而改變。第三增益部33中要設(shè)置的加權(quán)量的值為O以上且I以下,并且隨著加權(quán)量的值從O改變?yōu)?,噪聲降低量增加。將第四增益部34中的加權(quán)量的值設(shè)置為通過從值I中減去第三增益部33中所設(shè)置的加權(quán)量(O以上且I以下的值)所獲得的值。
[0091]如上所述,通過調(diào)整第一增益部13和第二增益部24中所設(shè)置的加權(quán)量(第一加權(quán)量、第二加權(quán)量)的值,可以增強(qiáng)或降低起音和余音。此外,通過調(diào)整第一 HPF部11和第二HPF部21中所設(shè)置的截止頻率(第一截止頻率、第二截止頻率)的值,可以進(jìn)行起音和余音的控制時間的長度調(diào)整。此外,通過調(diào)整第三增益部33和第四增益部34中所設(shè)置的加權(quán)量(第三加權(quán)量等)的值,可以進(jìn)行噪聲降低量的調(diào)整。如上所述,對加權(quán)量和截止頻率進(jìn)行適當(dāng)調(diào)整使得能夠調(diào)節(jié)諸如樂器聲等的聲源中所包括的起音、在該起音之后持續(xù)的余音、以及收錄環(huán)境中的穩(wěn)態(tài)噪聲成分或聲源中所包括的穩(wěn)態(tài)信號成分,由此能夠?qū)⒁纛l信號調(diào)整成適合收聽者的偏好。
[0092]聲學(xué)信號處理TK例
[0093]以下說明在頻譜域?yàn)V波部3中調(diào)節(jié)輸入至聲學(xué)信號處理裝置I的如圖8(b)所示的音頻信號的諸如加權(quán)量和截止頻率等的參數(shù)的情況下所獲得的輸出信號的示例。
[0094]假定所輸入的音頻信號的采樣頻率為44.1kHz0此外,如圖8(b)所示,所輸入的音頻信號包括起音和余音,并且其頻率成分為1kHz。
[0095]FFT部2的傅立葉變換長度N是4096個樣本,其重疊長度M是作為傅立葉變換長度N的15/16倍的3840個樣本,窗函數(shù)是Blackman (布萊克曼)窗函數(shù),并且振幅譜的采樣頻率是 172Hz (44100/ (4096-3840) ^ 172)。
[0096]此外,第一HPF部11、第二HPF部21和第三HPF部31各自是線性Butterworth(巴特沃斯)高通濾波器,并且截止頻率分別為2.5Hz、1.25Hz和0.031Hz。此外,作為加權(quán)量,在第一增益部13、第二增益部24、第三增益部33和第四增益部34各自中單獨(dú)設(shè)置_1、0和I其中之一。
[0097]圖9 (a)是示出在頻譜域?yàn)V波部3中僅使起音控制器10的第一 HPF部11和第一限幅器部12進(jìn)行工作的情況下所獲得的輸出信號的圖。第一 HPF部11的截止頻率為2.5Hz。
[0098]在僅使起音控制器10的第一 HPF部11和第一限幅器部12進(jìn)行工作的情況下,如圖9 (a)所示檢測到所輸入的音頻信號的上升成分、即起音(起音成分)。
[0099]此外,在圖9(b)中,利用實(shí)線示出如下信號,其中該信號是通過將通過使起音控制器10的第一 HPF部11和第一限幅器部12進(jìn)行工作以將第一增益部13的加權(quán)值設(shè)置為I而增強(qiáng)了起音的音頻信號與輸入至頻譜域?yàn)V波部3的音頻信號(圖8(b)所示的信號)進(jìn)行合成所獲得的。圖9(b)中虛線所示的信號表示圖8(b)所示的所輸入的音頻信號的狀態(tài)。如圖9(b)的實(shí)線所示,與圖8(b)所示的音頻信號相比,合成信號在起音(起音成分)方面增強(qiáng)。
[0100]此外,在圖10(a)中,利用實(shí)線示出如下信號,其中該信號是通過將通過使起音控制器10的第一 HPF部11和第一限幅器部12進(jìn)行工作以將第一增益部13的加權(quán)值設(shè)置為-1而降低了起音的音頻信號與輸入至頻譜域?yàn)V波部3的音頻信號(圖8(b)所示的信號)進(jìn)行合成所獲得的。圖10(a)中虛線所示的信號表示圖8(b)所示的所輸入的音頻信號的狀態(tài)。如圖10(a)的實(shí)線所示,與圖8(b)所示的音頻信號相比,合成信號在起音(起音成分)方面降低。
[0101]此外,在圖10(b)中,利用實(shí)線來表示在圖9(b)所定義的條件中、在將第一 HPF部11的截止頻率從2.5Hz改變?yōu)?.25Hz的情況下所合成得到的信號。圖10(b)中虛線所示的信號表示圖8(b)所示的所輸入的音頻信號的狀態(tài)。通過將截止頻率從2.5Hz改變?yōu)?br>
1.25Hz,控制時間變長(參見圖7(b)),由此與圖8(b)所示的音頻信號相比,合成信號不僅在起音方面增強(qiáng),而且在起音時間方面也增大。
[0102]圖11 (a)示出在頻譜域?yàn)V波部3中僅使余音控制器20的第二 HPF部21、振幅反轉(zhuǎn)部22和第二限幅器部23進(jìn)行工作的情況下所獲得的輸出信號。第二 HPF部21的截止頻率為2.5Hz。
[0103]在使余音控制器20的第二 HPF部21、振幅反轉(zhuǎn)部22和第二限幅器部23進(jìn)行工作的情況下,如圖11(a)所示,檢測到所輸入的音頻信號的下降成分、即余音(余音成分)。
[0104]此外,在圖11 (b)中,利用實(shí)線示出如下信號,其中該信號是通過將如圖9 (b)所示利用起音控制器10增強(qiáng)了起音的音頻信號、使余音控制器20的第二 HPF部21、振幅反轉(zhuǎn)部22和第二限幅器部23進(jìn)行工作以將第二增益部24的加權(quán)值設(shè)置為-1而降低了余音的音頻信號、以及輸入至頻譜域?yàn)V波部3的音頻信號(圖8 (b)所示的信號)這三者進(jìn)行合成所獲得的。圖11(b)中虛線所示的信號表示圖8(b)所示的所輸入的音頻信號的狀態(tài)。在將圖11(b)中實(shí)線所示的合成信號與圖8(b)所示的所輸入的音頻信號進(jìn)行比較的情況下,起音增強(qiáng)而余音降低。此外,如圖11(b)的實(shí)線所示,與圖9(b)的實(shí)線所示的音頻信號相比,合成信號在余音(余音成分)方面降低。
[0105]此外,在圖12中,利用實(shí)線示出如下信號,其中該信號是通過將如圖10(a)所示利用起音控制器10降低了起音的音頻信號、使余音控制器20的第二 HPF部21、振幅反轉(zhuǎn)部22和第二限幅器部23進(jìn)行工作以將第二增益部24的加權(quán)值設(shè)置為I而增強(qiáng)了余音的音頻信號、以及輸入至頻譜域?yàn)V波部3的音頻信號(圖8 (b)所示的信號)這三者進(jìn)行合成所獲得的。圖12中虛線所示的信號表示圖8(b)中的所輸入的音頻信號的狀態(tài)。
[0106]在將圖12所示的合成信號與圖8(b)所示的所輸入的音頻信號進(jìn)行比較的情況下,起音降低而余音增強(qiáng)。此外,如圖12的實(shí)線所示,與圖10(a)的實(shí)線所示的音頻信號相t匕,合成信號在余音(余音成分)方面增強(qiáng)。
[0107]圖13(a)示出針對通過將1.2kHz的穩(wěn)態(tài)正弦波作為噪聲添加至所輸入的音頻信號(圖8(b)所示的信號)所獲得的輸入信號、在將起音控制器10的第一 HPF部11的截止頻率設(shè)置為2.5Hz并將第一增益部13的加權(quán)量設(shè)置為I的情況下所獲得的輸出信號的狀態(tài)。利用起音控制器10對添加有噪聲的音頻信號應(yīng)用起音控制處理,由此起音在圖13(a)所示的信號中增強(qiáng)。
[0108]圖13(b)示出針對圖13(a)所示的信號、在將噪聲控制器30的第三HPF部31的截止頻率設(shè)置為0.031Hz、將第三增益部33的加權(quán)量設(shè)置為I并將第四增益部34的加權(quán)量設(shè)置為O的情況下所獲得的由噪聲控制器30進(jìn)行了噪聲控制處理的信號。如圖13(b)所示,通過將第三HPF部31的截止頻率設(shè)置為低的值(0.031Hz),可以抑制DC附近的信號成分,由此可以在維持起音增強(qiáng)的同時僅降低穩(wěn)態(tài)噪聲。
[0109]如上所述,在根據(jù)本實(shí)施例的聲學(xué)信號處理裝置I中,通過調(diào)整起音控制器10的第一增益部13的加權(quán)量,可以增強(qiáng)/降低音頻信號的起音。此外,通過調(diào)整第一 HPF部11的截止頻率,可以改變起音的控制時間(增強(qiáng)時間、降低時間)。因而,通過根據(jù)信號電平放大起音以增強(qiáng)該起音,可以使輸出聲音整體變尖銳。此外,通過控制諸如MP3等的常見數(shù)字音頻信號中的可能劣化的起音,可以提高數(shù)字音頻信號的音質(zhì)。
[0110]此外,在根據(jù)本實(shí)施例的聲學(xué)信號處理裝置I中,通過調(diào)整余音控制器20的第二增益部24的加權(quán)量,可以增強(qiáng)/降低音頻信號的余音。此外,通過調(diào)整第二 HPF部21的截止頻率,可以改變余音的控制時間(增強(qiáng)時間、降低時間)。因而,可以根據(jù)收聽者的偏好來增強(qiáng)或降低余音。
[0111]此外,在根據(jù)本實(shí)施例的聲學(xué)信號處理裝置I中,通過調(diào)整噪聲控制器30的第三增益部33和第四增益部34的加權(quán)量,可以調(diào)整噪聲降低量。此外,通過調(diào)整第三HPF部31的截止頻率,可以抑制噪聲的DC成分。因而,可以調(diào)節(jié)聲源的收錄環(huán)境或聲源本身中所包括的穩(wěn)態(tài)噪聲。
[0112]此外,基于針對頻域的各振幅譜的變化量來進(jìn)行上述的起音控制處理、余音控制處理和噪聲降低處理。這樣解決了在使用閾值來識別起音的傳統(tǒng)方法中所產(chǎn)生的問題、即防止了檢測狀態(tài)受到聲源的振幅電平的大幅影響(檢測狀態(tài)不依賴于聲源的振幅電平)。
[0113]例如,在包括樂器聲和語音的音頻信號中,與樂器聲的起音的上升時間相比,語音的上升時間延遲,并且語音的針對各振幅譜的變化量較小,從而使得能夠根據(jù)起音控制器10中的第一 HPF部11的截止頻率的設(shè)置來將起音僅添加至樂器聲。通過如此僅增強(qiáng)樂器聲的起音,可以在維持語音的語調(diào)感的同時增強(qiáng)樂器聲的尖銳感。
[0114]此外,可以針對各振幅譜個別設(shè)置起音控制器10、余音控制器20和噪聲控制器30中的截止頻率或加權(quán)量。因而,如下結(jié)構(gòu)是可能的:將頻帶分割成多個帶,并且針對多個帶各自進(jìn)行設(shè)置。
[0115]例如,將所輸入的音頻信號的頻率區(qū)域分割成低頻區(qū)域、中頻區(qū)域和高頻區(qū)域。在這種情況下,通過在低頻區(qū)域中增強(qiáng)起音并降低余音,可以再現(xiàn)鼓等的擊打力和應(yīng)答性的聲音。此外,在中頻區(qū)域中,增強(qiáng)余音以增強(qiáng)語音的共鳴。此外,在高頻區(qū)域中,增強(qiáng)起音以使鈸聲等的透明感更強(qiáng)。
[0116]在再現(xiàn)包括聲源本身中所包含的穩(wěn)態(tài)信號成分和/或聲源的收錄環(huán)境中所包含的穩(wěn)態(tài)噪聲成分的音頻信號的情況下,噪聲等可能作為具有現(xiàn)場感的聲音被感知為“收聽者處于收錄環(huán)境”;然而,樂器聲或語音的清晰度趨于降低。在這種情況下,在噪聲控制器30中進(jìn)行噪聲控制以使噪聲量略微減少,由此使得能夠在一定程度上維持現(xiàn)場感的同時,將樂器聲或語音的聲學(xué)成分輸出作為清晰聲音。
[0117]如上所述,通過使用根據(jù)本實(shí)施例的聲學(xué)信號處理裝置1,可以調(diào)節(jié)諸如樂器聲等的聲源中所包括的起音、在該起音之后持續(xù)的余音、以及收錄環(huán)境中的穩(wěn)態(tài)噪聲成分或聲源中所包括的穩(wěn)態(tài)信號成分,由此滿足收聽者的各種偏好。
[0118]盡管已經(jīng)詳細(xì)說明并示出了聲學(xué)信號處理裝置I作為本發(fā)明的聲學(xué)信號處理裝置的示例,但本發(fā)明的聲學(xué)信號處理裝置和聲學(xué)信號處理方法不限于上述實(shí)施例。顯然,本領(lǐng)域技術(shù)人員可以在所附權(quán)利要求書的范圍內(nèi)想到各種替代實(shí)現(xiàn)和修改實(shí)現(xiàn)。
[0119]附圖標(biāo)記說明
[0120]I聲學(xué)信號處理裝置
[0121]2 FFT 部
[0122]3頻譜域?yàn)V波部
[0123]4 IFFT 部
[0124]10起音控制器(起音成分控制器)
[0125]11 (起音控制器的)第一 HPF部
[0126]12 (起音控制器的)第一限幅器部
[0127]13 (起音控制器的)第一增益部
[0128]20余首控制器(余首成分控制器)
[0129]21 (余音控制器的)第二 HPF部
[0130]22 (余音控制器的)振幅反轉(zhuǎn)部
[0131]23 (余音控制器的)第二限幅器部
[0132]24 (余音控制器的)第二增益部
[0133]30噪聲控制器
[0134]31 (噪聲控制器的)第三HPF部
[0135]32 (噪聲控制器的)第三限幅器部
[0136]33 (噪聲控制器的)第三增益部
[0137]34 (噪聲控制器的)第四增益部
[0138]35 (噪聲控制器的)第二相加部
[0139]40第一相加部
[0140]41第四限幅器部
【權(quán)利要求】
1.一種聲學(xué)信號處理裝置,包括: 快速傅立葉變換部即FFT部,用于進(jìn)行以下操作:在時間每次偏移傅立葉變換長度和重疊長度之間的差分時間的情況下對輸入音頻信號進(jìn)行短時間傅立葉變換,以計算在時間上彼此相差了所述差分時間的多個振幅譜;針對各頻率來計算所計算出的各振幅譜的時間變化,以將所述輸入音頻信號從時域變換成頻域并且計算頻譜信號;以及基于所計算出的頻譜信號來生成第一振幅譜信號和相位譜信號; 起音成分控制器,用于控制所述FFT部所生成的所述第一振幅譜信號的起音成分,以生成第二振幅譜信號; 余音成分控制器,用于控制所述FFT部所生成的所述第一振幅譜信號的余音成分,以生成第三振幅譜信號; 第一相加部,用于將所述FFT部所生成的所述第一振幅譜信號、所述起音成分控制器所生成的所述第二振幅譜信號和所述余音成分控制器所生成的所述第三振幅譜信號進(jìn)行合成,以生成第四振幅譜信號;以及 逆快速傅立葉變換部即IFFT部,用于基于所述第一相加部所生成的所述第四振幅譜信號和所述FFT部所生成的所述相位譜信號來計算頻譜信號,并且對所計算出的頻譜信號進(jìn)行短時間逆傅立葉變換處理和重疊相加,以生成從頻域變換成時域的音頻信號, 其中,所述起音成分控制器包括: 第一高通濾波器部即第一 HPF部,用于針對各譜,基于預(yù)設(shè)的第一截止頻率來對所述FFT部所生成的所述第一振幅譜信號進(jìn)行高通濾波處理; 第一限幅器部,用于對所述第一 HPF部進(jìn)行了高通濾波處理的振幅譜信號的負(fù)側(cè)振幅進(jìn)行限制以將該負(fù)側(cè)振幅設(shè)置為O,從而針對各譜來檢測該振幅譜信號的起音成分;以及第一增益部,用于基于預(yù)設(shè)的第一加權(quán)量來對所述第一限幅器部所檢測到的振幅譜信號的起音成分進(jìn)行加權(quán)處理,以及所述余音成分控制器包括: 第二高通濾波器部即第二 HPF部,用于針對各譜,基于預(yù)設(shè)的第二截止頻率來對所述FFT部所生成的所述第一振幅譜信號進(jìn)行高通濾波處理; 振幅反轉(zhuǎn)部,用于將所述第二 HPF部進(jìn)行了高通濾波處理的振幅譜信號乘以-1,以進(jìn)行振幅反轉(zhuǎn); 第二限幅器部,用于對所述振幅反轉(zhuǎn)部進(jìn)行了振幅反轉(zhuǎn)的振幅譜信號的負(fù)側(cè)振幅進(jìn)行限制以將該負(fù)側(cè)振幅設(shè)置為O,從而針對各譜來檢測該振幅譜信號的余音成分;以及 第二增益部,用于基于預(yù)設(shè)的第二加權(quán)量來對所述第二限幅器部所檢測到的振幅譜信號的余音成分進(jìn)行加權(quán)處理。
2.根據(jù)權(quán)利要求1所述的聲學(xué)信號處理裝置,其中,還包括噪聲控制器,所述噪聲控制器用于對所述第一相加部所生成的所述第四振幅譜信號進(jìn)行噪聲控制,以生成第五振幅譜信號, 其中,所述IFFT部基于所述噪聲控制器所生成的所述第五振幅譜信號和所述FFT部所生成的所述相位譜信號,來生成從頻域變換成時域的音頻信號,以及所述噪聲控制器包括: 第三高通濾波器部即第三HPF部,用于針對各譜,基于預(yù)設(shè)的第三截止頻率來對所述第一相加部所生成的所述第四振幅譜信號進(jìn)行高通濾波處理; 第三限幅器部,用于對所述第三HPF部進(jìn)行了高通濾波處理的振幅譜信號的負(fù)側(cè)振幅進(jìn)行限制,以將該負(fù)側(cè)振幅設(shè)置為O ; 第三增益部,用于基于預(yù)設(shè)的作為O以上且I以下的值的第三加權(quán)量,來對所述第三限幅器部對負(fù)側(cè)振幅進(jìn)行了限制的振幅譜信號進(jìn)行加權(quán)處理; 第四增益部,用于基于通過從值I中減去所述第三加權(quán)量的值所獲得的加權(quán)量,來對所述第一相加部所生成的所述第四振幅譜信號進(jìn)行加權(quán)處理;以及 第二相加部,用于將所述第三增益部進(jìn)行了加權(quán)處理的振幅譜信號和所述第四增益部進(jìn)行了加權(quán)處理的振幅譜信號進(jìn)行合成,以生成所述第五振幅譜信號。
3.一種聲學(xué)信號處理裝置的聲學(xué)信號處理方法,其中在所述聲學(xué)信號處理裝置中,對輸入音頻信號進(jìn)行起音成分控制和余音成分控制, 所述聲學(xué)信號處理裝置包括: 快速傅立葉變換部即FFT部,用于將所述輸入音頻信號從時域變換成頻域以計算頻譜信號,并且生成第一振幅譜信號和相位譜信號; 起音成分控制器,用于控制所述FFT部所生成的所述第一振幅譜信號的起音成分,以生成第二振幅譜信號; 余音成分控制器,用于控制所述FFT部所生成的所述第一振幅譜信號的余音成分,以生成第三振幅譜信號; 第一相加部,用于將所述FFT部所生成的所述第一振幅譜信號、所述起音成分控制器所生成的所述第二振幅譜信號和所述余音成分控制器所生成的所述第三振幅譜信號進(jìn)行合成,以生成第四振幅譜信號;以及 逆快速傅立葉變換部即IFFT部,用于基于所述第一相加部所生成的所述第四振幅譜信號和所述FFT部所生成的所述相位譜信號,來生成從頻域變換成時域的音頻信號, 所述起音成分控制器包括:第一高通濾波器部即第一 HPF部、第一限幅器部和第一增益部, 所述余音成分控制器包括:第二高通濾波器部即第二 HPF部、振幅反轉(zhuǎn)部、第二限幅器部和第二增益部, 其中,所述聲學(xué)信號處理方法包括以下步驟:利用所述FFT部來進(jìn)行以下操作:在時間每次偏移傅立葉變換長度和重疊長度之間的差分時間的情況下對所述輸入音頻信號進(jìn)行短時間傅立葉變換,以計算在時間上彼此相差了所述差分時間的多個振幅譜;針對各頻率來計算所計算出的各振幅譜的時間變化以計算頻譜信號;以及基于所計算出的頻譜信號來生成所述第一振幅譜信號和所述相位譜信號;在所述起音成分控制器中,進(jìn)行以下操作: 利用所述第一 HPF部,針對各譜、基于預(yù)設(shè)的第一截止頻率來對所述FFT部所生成的所述第一振幅譜信號進(jìn)行高通濾波處理; 利用所述第一限幅器部,對所述第一 HPF部進(jìn)行了高通濾波處理的振幅譜信號的負(fù)側(cè)振幅進(jìn)行限制以將該負(fù)側(cè)振幅設(shè)置為O,從而針對各譜來檢測該振幅譜信號的起音成分;以及 利用所述第一增益部,基于預(yù)設(shè)的第一加權(quán)量來對所述第一限幅器部所檢測到的振幅譜信號的起音成分進(jìn)行加權(quán)處理,以及 在所述余音成分控制器中,進(jìn)行以下操作: 利用所述第二 HPF部,針對各譜、基于預(yù)設(shè)的第二截止頻率來對所述FFT部所生成的所述第一振幅譜信號進(jìn)行高通濾波處理; 利用所述振幅反轉(zhuǎn)部,將所述第二 HPF部進(jìn)行了高通濾波處理的振幅譜信號乘以-1,以進(jìn)行振幅反轉(zhuǎn); 利用所述第二限幅器部,對所述振幅反轉(zhuǎn)部進(jìn)行了振幅反轉(zhuǎn)的振幅譜信號的負(fù)側(cè)振幅進(jìn)行限制以將該負(fù)側(cè)振幅設(shè)置為O,從而針對各譜來檢測該振幅譜信號的余音成分;以及利用所述第二增益部,基于預(yù)設(shè)的第二加權(quán)量來對所述第二限幅器部所檢測到的振幅譜信號的余音成分進(jìn)行加權(quán)處理; 利用所述第一相加部,將所述第一振幅譜信號、所述第一增益部對起音成分進(jìn)行了加權(quán)處理的所述第二振幅譜信號、以及所述第二增益部對余音成分進(jìn)行了加權(quán)處理的所述第三振幅譜信號進(jìn)行合成,以生成第四振幅譜信號;以及 利用所述IFFT部,基于所述第四振幅譜信號和所述FFT部所生成的所述相位譜信號來計算頻譜信號,并且對所計算出的頻譜信號進(jìn)行短時間逆傅立葉變換和重疊相加,以生成從頻域變換成時域的音頻信號。
4.根據(jù)權(quán)利要求3所述的聲學(xué)信號處理裝置的聲學(xué)信號處理方法,所述聲學(xué)信號處理裝置還包括: 噪聲控制器,用于對所述第一相加部所生成的所述第四振幅譜信號進(jìn)行噪聲控制,以生成第五振幅譜信號, 所述噪聲控制器包括:第三高通濾波器部即第三HPF部、第三限幅器部、第三增益部、第四增益部和第二相加部, 其中,所述聲學(xué)信號處理方法還包括以下步驟: 利用所述IFFT部,基于所述噪聲控制器所生成的所述第五振幅譜信號和所述FFT部所生成的所述相位譜信號來生成從頻域變換成時域的音頻信號;以及在所述噪聲控制器中,進(jìn)行以下操作: 利用所述第三HPF部,針對各譜、基于預(yù)設(shè)的第三截止頻率來對所述第一相加部所生成的所述第四振幅譜信號進(jìn)行高通濾波處理; 利用所述第三限幅器部,對所述第三HPF部進(jìn)行了高通濾波處理的振幅譜信號的負(fù)側(cè)振幅進(jìn)行限制,以將該負(fù)側(cè)振幅設(shè)置為O ; 利用所述第三增益部,基于預(yù)設(shè)的作為O以上且I以下的值的第三加權(quán)量來對所述第三限幅器部對負(fù)側(cè)振幅進(jìn)行了限制的振幅譜信號進(jìn)行加權(quán)處理; 利用所述第四增益部,基于通過從值I中減去所述第三加權(quán)量的值所獲得的加權(quán)量來對所述第一相加部所生成的所述第四振幅譜信號進(jìn)行加權(quán)處理;以及 利用所述第二相加部,將所述第三增益部進(jìn)行了加權(quán)處理的振幅譜信號和所述第四增益部進(jìn)行了加權(quán)處理的振幅譜信號進(jìn)行合成,以生成所述第五振幅譜信號。
【文檔編號】H04R3/04GK104185870SQ201380013601
【公開日】2014年12月3日 申請日期:2013年1月23日 優(yōu)先權(quán)日:2012年3月12日
【發(fā)明者】橋本武志, 渡邊哲生 申請人:歌樂株式會社