專(zhuān)利名稱:聲音處理方法及裝置的制作方法
技術(shù)領(lǐng)域:
本公開(kāi)總體涉及聲音處理方法,具體而言,涉及對(duì)輸入信號(hào)的動(dòng)態(tài)范圍進(jìn)行壓縮
的聲音處理方法。
背景技術(shù):
當(dāng)嵌入在便攜式終端等中的揚(yáng)聲器發(fā)出較大的聲音時(shí),優(yōu)選在抑制由于削峰 (clipping)所致的聲音失真的同時(shí)增大聲音的音量。為此,對(duì)動(dòng)態(tài)范圍壓縮技術(shù)展開(kāi)了研究。
動(dòng)態(tài)范圍壓縮技術(shù)減小了輸入信號(hào)的幅度范圍。圖1是例示了用在相關(guān)技術(shù)的系 統(tǒng)中的動(dòng)態(tài)范圍壓縮的例子的圖。如圖1所示,動(dòng)態(tài)范圍壓縮單元1對(duì)輸入信號(hào)的動(dòng)態(tài)范 圍進(jìn)行壓縮。然后,DA轉(zhuǎn)換器2將數(shù)字音頻信號(hào)轉(zhuǎn)換成模擬音頻信號(hào)。放大器3將該模擬 音頻信號(hào)放大以驅(qū)動(dòng)揚(yáng)聲器4。揚(yáng)聲器4對(duì)由放大器3放大的該模擬音頻信號(hào)進(jìn)行接收并 發(fā)出聲音。 非專(zhuān)利文獻(xiàn)1中公開(kāi)了這樣的動(dòng)態(tài)范圍壓縮技術(shù)的示例。所公開(kāi)的技術(shù)對(duì)輸入信 號(hào)的電平進(jìn)行測(cè)量,在對(duì)較小輸入電平的部分進(jìn)行放大的同時(shí)對(duì)較大輸入電平的部分進(jìn)行 衰減(attenuate)。 圖2是例示了在非專(zhuān)利文獻(xiàn)1中公開(kāi)的相關(guān)技術(shù)的動(dòng)態(tài)范圍壓縮的示例的圖。在 圖2例示的例子中,將具有較大音量的部分A衰減,同時(shí)將具有較小音量的部分B放大,由 此,基于增益控制來(lái)壓縮輸入信號(hào)的動(dòng)態(tài)范圍。這能夠在抑制由于削峰所致的聲音失真的 同時(shí)增大輸出聲音的音量。 由于削峰引起的聲音失真可以通過(guò)將輸入信號(hào)乘以借助于相關(guān)技術(shù)獲得的增益
而進(jìn)行抑制。雖然在時(shí)域中對(duì)信號(hào)波形進(jìn)行修改,但是,這種修改影響了整個(gè)頻域中的頻
譜,從而導(dǎo)致很差的聲音質(zhì)量。下面,參照?qǐng)D3和圖4來(lái)說(shuō)明上述問(wèn)題。圖3是例示了通過(guò)
相關(guān)技術(shù)執(zhí)行增益控制之前和之后的時(shí)域信號(hào)波形的例子的圖。如圖3所示,與增益控制
之前的時(shí)域信號(hào)A相比,增益控制之后的時(shí)域信號(hào)B具有更窄的幅度范圍。 圖4是例示了通過(guò)相關(guān)技術(shù)執(zhí)行增益控制之前和之后的頻譜輪廓(spectrum
profile)的例子的圖。如圖4所示,與增益控制之前的功率譜A相比,增益控制之后的功率
譜B具有在高頻率范圍被放大的頻率分量。當(dāng)再現(xiàn)音頻聲音時(shí),該放大的頻率范圍可能被
感知為不協(xié)調(diào)的聲音(dissonant sound),從而導(dǎo)致了音頻質(zhì)量的下降。 因此,優(yōu)選的是,提供一種在避免音頻質(zhì)量下降的同時(shí)能夠壓縮動(dòng)態(tài)范圍的聲音
處理方法。 [非專(zhuān)利文獻(xiàn)l]" Dolby Digital Encoding Technique Section 2' Dy謹(jǐn)ic Range Compression ' 〃 , URL :http://www. dolby. co. jp/professional/studio/dvd_ authoring03. html
發(fā)明內(nèi)容
根據(jù)實(shí)施方式的一個(gè)方面,提供了一種聲音處理方法,該方法包括以下步驟將輸
4入信號(hào)從時(shí)域變換到頻域以產(chǎn)生頻譜;檢測(cè)所述頻譜的譜峰;基于所述輸入信號(hào)和所述頻 譜二者中的一個(gè)來(lái)計(jì)算目標(biāo)衰減量;基于所述目標(biāo)衰減量及所檢測(cè)到的譜峰來(lái)計(jì)算所述頻 譜的各頻率分量的衰減量;通過(guò)響應(yīng)于計(jì)算出的各頻率分量的衰減量對(duì)所述頻譜進(jìn)行衰減 來(lái)校正所述頻譜的電平;以及對(duì)該電平校正后的頻譜執(zhí)行逆頻率變換以產(chǎn)生輸出信號(hào)。
圖1是例示了用在相關(guān)技術(shù)系統(tǒng)中的動(dòng)態(tài)范圍壓縮的例子的圖; 圖2是例示了用在相關(guān)技術(shù)系統(tǒng)中的動(dòng)態(tài)范圍壓縮的例子的圖; 圖3是例示了通過(guò)相關(guān)技術(shù)執(zhí)行增益控制之前和之后的時(shí)域信號(hào)波形的例子的
圖4是例示了通過(guò)相關(guān)技術(shù)執(zhí)行增益控制之前和之后的頻譜輪廓的例子的圖; 圖5是例示了根據(jù)第一實(shí)施方式的聲音處理裝置的結(jié)構(gòu)的例子的圖; 圖6是例示了根據(jù)第一實(shí)施方式的動(dòng)態(tài)范圍壓縮單元的結(jié)構(gòu)的例子的圖; 圖7是例示了功率譜與衰減量之間的關(guān)系的圖8是例示了根據(jù)第一實(shí)施方式的輸入頻譜與電平校正后的頻譜之間的關(guān)系的 圖9是圖8所例示的各頻率的增益的圖10是例示了根據(jù)第一實(shí)施方式的聲音處理的示例的圖; 圖11是例示了根據(jù)第一實(shí)施方式的增益計(jì)算處理的流程圖; 圖12是例示了根據(jù)第二實(shí)施方式的聲音處理裝置的結(jié)構(gòu)的例子的圖; 圖13是例示了根據(jù)第二實(shí)施方式的各頻率分量的衰減量的圖14是例示了根據(jù)第二實(shí)施方式的輸入頻譜與電平校正后的頻譜之間的關(guān)系的 圖15是圖14所例示的各頻率的增益的圖16是例示了根據(jù)第二實(shí)施方式的增益計(jì)算處理的例子的流程圖; 圖17是例示了根據(jù)第三實(shí)施方式的輸入頻譜與電平校正后的頻譜之間的關(guān)系的
圖18是圖17所例示的各頻率的增益的圖19是例示了根據(jù)第三實(shí)施方式的增益計(jì)算處理的例子的流程圖; 圖20是例示了根據(jù)第四實(shí)施方式的動(dòng)態(tài)范圍壓縮單元的結(jié)構(gòu)的例子的圖; 圖21是例示了根據(jù)第四實(shí)施方式的聲音處理的示例的圖; 圖22是例示了所公開(kāi)的聲音處理的應(yīng)用的變型的圖。
具體實(shí)施例方式
下面,參照
用于實(shí)現(xiàn)本發(fā)明的實(shí)施方式。 [第一實(shí)施方式] 〈主要結(jié)構(gòu)>
圖5是例示了根據(jù)第一實(shí)施方式的聲音處理裝置的結(jié)構(gòu)的例子的圖。圖5例示的 例子涉及應(yīng)用于IP (Internet Protocol :網(wǎng)際協(xié)議)電話的聲音處理裝置。圖5中描述的聲音處理裝置包括分組接收單元10、解碼單元11、動(dòng)態(tài)范圍壓縮單元12、放大器13和揚(yáng)聲 器14。 分組接收單元10通過(guò)網(wǎng)絡(luò)接收包含有編碼音頻信號(hào)的數(shù)據(jù)的分組,并將接收到 的分組提供給解碼單元11。解碼單元11對(duì)從分組接收單元10提供的分組中包含的數(shù)據(jù)進(jìn) 行解碼,并將解碼后的音頻信號(hào)提供給動(dòng)態(tài)范圍壓縮單元12。設(shè)計(jì)用在IP電話中的解碼單 元11已被廣泛采用,因此省略其具體的說(shuō)明。 動(dòng)態(tài)范圍壓縮單元12對(duì)從解碼單元11提供的音頻信號(hào)(下面,稱作"輸入信號(hào)") 的動(dòng)態(tài)范圍進(jìn)行壓縮。后面將詳細(xì)介紹動(dòng)態(tài)范圍壓縮。動(dòng)態(tài)范圍壓縮單元12將動(dòng)態(tài)范圍 被壓縮后的音頻信號(hào)提供給放大器13。 放大器13將從動(dòng)態(tài)范圍壓縮單元12提供的音頻信號(hào)放大以驅(qū)動(dòng)揚(yáng)聲器14。放大 器13將放大后的音頻信號(hào)提供給揚(yáng)聲器14。揚(yáng)聲器14響應(yīng)于從放大器13提供的音頻信 號(hào)而發(fā)出聲音。 下面,參照?qǐng)D6來(lái)詳細(xì)介紹動(dòng)態(tài)范圍壓縮單元12。圖6是例示了根據(jù)第一實(shí)施方 式的動(dòng)態(tài)范圍壓縮單元12的結(jié)構(gòu)的例子的圖。圖6中所示的動(dòng)態(tài)范圍壓縮單元12包括劃 分單元121、最大幅度檢測(cè)單元122、目標(biāo)增益計(jì)算單元123、頻率變換單元124、功率譜計(jì)算 單元125、譜峰檢測(cè)單元126、增益計(jì)算單元127、電平校正單元128和逆頻率變換單元129。
劃分單元121將接收到的輸入信號(hào)劃分成具有恒定時(shí)間長(zhǎng)度的多個(gè)幀。從劃分單 元121將劃分后的幀提供至最大幅度檢測(cè)單元122和頻率變換單元124。
最大幅度檢測(cè)單元122利用下面的公式(1)在劃分單元121提供的感興趣的幀中
對(duì)輸入信號(hào)的最大幅度值進(jìn)行檢測(cè)
Pmax = max (| x (n) |) (1) 這里,Pmax是感興趣的幀中的最大幅度值,而x(n)是該幀中的輸入信號(hào)。最大幅
度檢測(cè)單元122將檢測(cè)到的最大幅度值Pmax提供給目標(biāo)增益計(jì)算單元123。 目標(biāo)增益計(jì)算單元123利用以下的條件表達(dá)式(2),基于由最大幅度檢測(cè)單元122
提供的最大幅度值來(lái)計(jì)算目標(biāo)衰減量(即,目標(biāo)增益值)。下面,將以分貝(dB)為單位來(lái)說(shuō)
明衰減量。 if (Pmax > THR1) G_target = Pmax-THR1 else G_target = 0 (2) 這里,G—target是目標(biāo)衰減量,而THR1是第一閾值。根據(jù)揚(yáng)聲器的特點(diǎn)預(yù)先確定 了該第一閾值。目標(biāo)增益計(jì)算單元123將計(jì)算出的目標(biāo)衰減量提供給增益計(jì)算單元127。
頻率變換單元124逐幀地將輸入信號(hào)從時(shí)域變換到頻域??梢酝ㄟ^(guò)將信號(hào)從時(shí)域 變換到頻域的諸如離散傅里葉變換(DFT)或快速傅里葉變換(FFT)的變換方案來(lái)進(jìn)行時(shí)間 到頻率的變換。第一實(shí)施方式中使用FFT。 FFT是公知的,所以省略其詳細(xì)說(shuō)明。下面,將 通過(guò)FFT獲得的頻譜稱作X(f)。頻率變換單元124將通過(guò)頻率變換獲得的頻譜X(f)提供 給功率譜計(jì)算單元125和電平校正單元128作為輸入頻譜。 功率譜計(jì)算單元125通過(guò)以下的公式(3)根據(jù)頻率變換單元124提供的輸入譜來(lái) 計(jì)算功率譜。
Amp(f) = 101oglO(|X(f)2|) (3) 這里,Amp (f)是功率譜,其被表示為對(duì)數(shù)功率譜。功率譜計(jì)算單元125將計(jì)算出 的功率譜提供給譜峰檢測(cè)單元126和增益計(jì)算單元127。 譜峰檢測(cè)單元126基于由功率譜計(jì)算單元125提供的功率譜通過(guò)以下的公式(4) 來(lái)檢測(cè)功率譜峰值(下面簡(jiǎn)稱為"功率值")。譜峰檢測(cè)單元126還基于功率譜通過(guò)使用以 下的公式(5)來(lái)檢測(cè)功率譜峰的頻率。
Amp_peak = max (Amp (f)) (4)
f_peak = argmax (Amp (f)) (5) 這里,Amp_peak是功率譜峰值(即,功率譜的譜峰的值),而f_peak是功率譜的譜 峰的頻率。譜峰檢測(cè)單元126將通過(guò)公式(4)獲得的譜峰的功率值(即,功率譜峰值)和 通過(guò)公式(5)獲得的頻率提供給增益計(jì)算單元127。 增益計(jì)算單元127基于由功率譜計(jì)算單元125提供的功率譜Amp (f)、由譜峰檢測(cè) 單元126提供的譜峰的功率值A(chǔ)mp_peak、由目標(biāo)增益計(jì)算單元123提供的目標(biāo)衰減量G_ target、和第二閾值,利用下面的條件表達(dá)式(6)來(lái)計(jì)算各個(gè)頻率分量的衰減量(即,增益 值)。 if (Amp(f) > Amp_peak-THR2)G(f) = (G_target/THR2)(Amp(f)-(Amp_peak_THR2))
elseG (f) =0 (6) 這里,G(f)表示各個(gè)頻率的衰減量,而THR2是第二閾值。預(yù)先確定第二閾值來(lái)指 定功率譜值衰減的范圍。 下面將參照?qǐng)D7來(lái)說(shuō)明條件表達(dá)式(6)。圖7是例示了功率譜與衰減量之間的關(guān)
系的圖。也就是說(shuō),圖7圖示地例示了條件表達(dá)式(6)。如圖7所示,給定頻率分量的衰減
量按照與對(duì)應(yīng)功率譜值和譜峰功率值之差成比例的方式從目標(biāo)衰減量減小。 當(dāng)對(duì)應(yīng)功率譜值與譜峰功率值之差小于或等于第二閾值時(shí),上述語(yǔ)句為真
(true)。對(duì)于上述差大于第二閾值的給定頻率分量而言,將衰減量設(shè)置為0。通過(guò)這種設(shè)置,
一旦給定了目標(biāo)衰減量,則通過(guò)得出對(duì)應(yīng)功率譜值與譜峰功率值之差而確定了給定頻率分
量的衰減量。 當(dāng)該差大于第二閾值時(shí)將衰減量設(shè)置為0的原因是因?yàn)闆](méi)有必要將從開(kāi)始就不 是很大的輸入信號(hào)頻率分量衰減。再次參照?qǐng)D6,增益計(jì)算單元127將計(jì)算出的各個(gè)頻率分 量的衰減量G(f)提供給電平校正單元128。 電平校正單元128基于由頻率變換單元124提供的輸入頻譜和由增益計(jì)算單元 127提供的各個(gè)頻率分量的衰減量利用下面的公式(7)來(lái)計(jì)算電平校正后的頻譜。
Y(f) = X(f)e-"維 (7)
這里,Y(f)表示電平校正后的頻譜。 圖8是例示了根據(jù)第一實(shí)施方式的輸入頻譜與電平校正后的頻譜之間的關(guān)系的 圖。如圖8所示,輸入頻譜的頻率分量被衰減了通過(guò)增益計(jì)算單元127計(jì)算出的相應(yīng)衰減 量,從而產(chǎn)生電平校正后的頻譜。 圖9是圖8所例示的各頻率的增益的圖。如圖9所示,根據(jù)第一實(shí)施方式,在各譜
7峰周?chē)鷪?zhí)行增益控制。再次參照?qǐng)D6,電平校正單元128將所計(jì)算出的電平校正后的頻譜 Y(f)提供給逆頻率變換單元129。 逆頻率變換單元129針對(duì)由電平校正單元128提供的電平校正后的頻譜執(zhí)行逆頻 率變換(例如,IFFT)。逆頻率變換單元129將通過(guò)逆頻率變換而獲得的信號(hào)提供給放大器 13。揚(yáng)聲器響應(yīng)于放大器13放大的音頻信號(hào)而發(fā)出聲音。
〈聲音處理> 將參照?qǐng)DIO和圖ll來(lái)介紹第一實(shí)施方式的聲音處理。圖IO是例示了根據(jù)第一實(shí) 施方式的聲音處理的示例的圖。在步驟Sll中,劃分單元121將輸入信號(hào)劃分成多個(gè)幀,并 將劃分成的幀提供給最大幅度檢測(cè)單元122以及頻率變換單元124。步驟S12和S13中的 處理以及步驟S14至S16的處理可以并行地執(zhí)行。首先來(lái)介紹對(duì)步驟S12的路徑的處理。
在步驟S12中,最大幅度檢測(cè)單元122使用公式(1)識(shí)別出以幀為單位提供的輸 入信號(hào)的最大幅度,接著,將獲得的最大幅度提供給目標(biāo)增益計(jì)算單元123。在步驟S13中, 目標(biāo)增益計(jì)算單元123基于提供的最大幅度使用公式(2)來(lái)計(jì)算目標(biāo)衰減量,然后,將計(jì)算 出的目標(biāo)衰減量提供給增益計(jì)算單元127。 接著將介紹步驟S14的路徑的處理。在步驟S14,頻率變換單元124對(duì)以幀為單位 而提供的輸入信號(hào)執(zhí)行頻率變換,然后,將獲得的輸入頻譜提供給功率譜計(jì)算單元125和 電平校正單元128。 在步驟S15,功率譜計(jì)算單元125使用公式(3)由所提供的輸入頻譜來(lái)計(jì)算功率 譜,然后,將計(jì)算出的功率譜提供給譜峰檢測(cè)單元126和增益計(jì)算單元127。
在步驟S16中,譜峰檢測(cè)單元126使用公式(4)由所提供的功率譜來(lái)確定譜峰的 功率值,然后將獲得的功率值提供給增益計(jì)算單元127。此外,譜峰檢測(cè)單元126使用公式 (5)而識(shí)別出譜峰的頻率,接著,將獲得的頻率提供給增益計(jì)算單元127。在第一實(shí)施方式 中,譜峰的頻率可以不使用并且可以不進(jìn)行檢測(cè)。 在步驟S17中,增益計(jì)算單元127基于從功率譜計(jì)算單元125提供的功率譜、從譜 峰檢測(cè)單元126提供的譜峰的功率值、以及從目標(biāo)增益計(jì)算單元123提供的目標(biāo)衰減量,使 用條件表示式(6)來(lái)計(jì)算各個(gè)頻率分量的衰減量。下面將參照?qǐng)D11來(lái)介紹由增益計(jì)算單 元127執(zhí)行的處理的細(xì)節(jié)。將各個(gè)頻率分量的計(jì)算出的衰減量提供給電平校正單元128。
在步驟S18中,電平校正單元128通過(guò)使從頻率變換單元124提供的輸入頻譜衰 減由增益計(jì)算單元127提供的相應(yīng)頻率分量的衰減量來(lái)執(zhí)行電平校正,然后,將獲得的電 平校正后的頻譜提供給逆頻率變換單元129。 在步驟S19中,逆頻率變換單元129對(duì)所提供的電平校正后的頻譜執(zhí)行逆頻率變 換,接著將通過(guò)逆頻率變換獲得的信號(hào)提供給放大器13。 參照?qǐng)D11介紹第一實(shí)施方式的增益計(jì)算處理。圖11是例示了根據(jù)第一實(shí)施方式 的增益計(jì)算處理的流程圖。由增益計(jì)算單元127執(zhí)行圖11所例示的步驟S20至S24的處理。 在步驟S20中,增益計(jì)算單元127計(jì)算感興趣功率譜值與譜峰功率值之差。在步 驟S21,檢查在步驟S20中獲得的功率值的差是否不大于閾值。 如果步驟S21中的檢查結(jié)果為"是",則在步驟S22中利用條件表達(dá)式(6)來(lái)計(jì)算 與用于計(jì)算該差的感興趣功率譜值相對(duì)應(yīng)的頻率分量的衰減量(參見(jiàn)圖7)。如果步驟S21中的檢查結(jié)果為"否",則在步驟S23中將該對(duì)應(yīng)頻率分量的衰減量設(shè)置為0。
在步驟S24中,檢查是否已經(jīng)對(duì)所有的頻率分量計(jì)算了衰減量。如果檢查的結(jié)果 為"否",則過(guò)程返回至步驟S20。如果檢查的結(jié)果為"是",則增益計(jì)算處理結(jié)束,過(guò)程前進(jìn) 到圖10所例示的下一步驟S18。 根據(jù)第一實(shí)施方式,在頻域中對(duì)譜峰進(jìn)行衰減,由此在避免由于頻譜放大而導(dǎo)致 產(chǎn)生不協(xié)調(diào)聲音的同時(shí)壓縮輸入信號(hào)的動(dòng)態(tài)范圍。 針對(duì)譜峰的功率值來(lái)確定目標(biāo)衰減量。然后,給定頻率分量的衰減量是基于目標(biāo) 衰減量以及譜峰功率值與對(duì)應(yīng)功率譜值之差來(lái)確定。這在避免音頻質(zhì)量的下降的同時(shí)使得 要被衰減的頻譜位于譜峰周?chē)?
[第二實(shí)施方式]
〈主要結(jié)構(gòu)> 下面將介紹根據(jù)第二實(shí)施方式的聲音處理裝置。圖12是例示了根據(jù)第二實(shí)施方 式的聲音處理裝置的結(jié)構(gòu)的例子的圖。圖12中例示的示例涉及將聲音處理裝置應(yīng)用于便 攜終端。圖12中所示的聲音處理裝置包括解碼單元20、動(dòng)態(tài)范圍壓縮單元21、放大器單 元13和揚(yáng)聲器14。針對(duì)圖12所例示的構(gòu)成單元,用相同的標(biāo)號(hào)來(lái)指代與圖5中的單元相 同或類(lèi)似的單元,并省略對(duì)它們的說(shuō)明。 如圖12所示,解碼單元20接收通過(guò)音頻通信網(wǎng)發(fā)送的經(jīng)編碼音頻信號(hào)(下面稱 作"接收到的信號(hào)"),并對(duì)接收到的信號(hào)進(jìn)行解碼來(lái)產(chǎn)生音頻信號(hào)。設(shè)計(jì)用在便攜終端中 的解碼單元20較普遍,所以省略其具體說(shuō)明。解碼單元20將解碼后的音頻信號(hào)(輸入信 號(hào))提供給動(dòng)態(tài)范圍壓縮單元21。 動(dòng)態(tài)范圍壓縮單元21對(duì)輸入信號(hào)的動(dòng)態(tài)范圍進(jìn)行壓縮,然后將電平校正后的音 頻信號(hào)提供給放大器13。動(dòng)態(tài)范圍壓縮單元12的主要結(jié)構(gòu)與圖6所例示的結(jié)構(gòu)類(lèi)似,所以 省略其說(shuō)明。但是,在第二實(shí)施方式中,由增益計(jì)算單元127執(zhí)行的處理與第一實(shí)施方式不 同。下面,介紹增益計(jì)算單元127執(zhí)行的處理。 增益計(jì)算單元127基于由譜峰檢測(cè)單元126提供的譜峰的頻率、和由目標(biāo)增益計(jì) 算單元123提供的目標(biāo)衰減量來(lái)確定各個(gè)頻率分量的衰減量。通過(guò)使用以下的條件表達(dá)式 (8)來(lái)確定各個(gè)頻率分量的衰減量。
if (0《S (f) < f_peak- a )
G(f) =0 elseif (f_peak_a《S (f) < f_peak) G (f) = (G_target/ a ) (S (f) - (f_peak_ a )) elseif (f_peak《S(f) < f_peak+a ) G (f) = (G_target/a)(S(f)-f_peak)+G_target else G(f) =0 (8) 這里,S(f)是譜峰與各頻譜之間的頻率差,而a是閾值。該閾值a表示與譜峰 的頻率的距離以規(guī)定頻譜被衰減的頻率范圍。 圖13是例示了根據(jù)第二實(shí)施方式的各個(gè)頻率分量的衰減量的圖。圖13圖示地例 示了條件表達(dá)式(8)。按照這種方式,在譜峰周?chē)l譜被衰減,由此在避免由于頻譜放大而
9導(dǎo)致音頻質(zhì)量下降的同時(shí)壓縮了動(dòng)態(tài)范圍。 圖14是例示了根據(jù)第二實(shí)施方式的輸入頻譜與電平校正后的頻譜之間的關(guān)系的圖。如圖14所示,使輸入頻譜的頻率分量衰減由增益計(jì)算單元127計(jì)算出的相應(yīng)衰減量,由此產(chǎn)生電平校正后的頻譜。圖15是圖14所例示的各頻率的增益的圖。如圖15所示,根據(jù)第二實(shí)施方式在譜峰周?chē)鷪?zhí)行增益控制。[owe]〈聲音處理〉 第二實(shí)施方式的聲音處理的概要與圖IO所示的類(lèi)似,所以省略其說(shuō)明。下面,參照?qǐng)D16來(lái)介紹第二實(shí)施方式的增益計(jì)算處理。 圖16是例示了根據(jù)第二實(shí)施方式的增益計(jì)算處理的例子的流程圖。針對(duì)圖16中所例示的步驟,與圖11中的步驟相同或類(lèi)似的步驟用相同的標(biāo)號(hào)表示并省略對(duì)它們的說(shuō)明。由增益計(jì)算單元127來(lái)執(zhí)行圖16所例示的處理。 在步驟S30中,增益計(jì)算單元127計(jì)算譜峰頻率與感興趣頻譜頻率之差。在步驟S31,檢查計(jì)算的出的頻率差是否在預(yù)定的范圍之內(nèi)。在圖13所例示的例子中,該預(yù)定的范圍表示為-a《S(f)《a 。 如果步驟S31中的檢查結(jié)果為"是",則在步驟S32中使用條件表達(dá)式(8)來(lái)計(jì)算感興趣頻率分量的衰減量。如果步驟S31中的檢查結(jié)果為"否",則在步驟S33將感興趣頻率分量的衰減量設(shè)置為O。 當(dāng)針對(duì)所有的頻率分量計(jì)算了衰減量時(shí),增益計(jì)算處理結(jié)束。作為第二實(shí)施方式的增益計(jì)算處理的變型例,不僅可以對(duì)譜峰的周?chē)€可以針對(duì)第二譜峰、第三譜峰等來(lái)執(zhí)行由條件表達(dá)式(8)表示的處理以針對(duì)這些譜峰中的每一個(gè)來(lái)計(jì)算衰減量。通過(guò)這種設(shè)置,即使當(dāng)譜峰(諸如第二譜峰和第三譜峰)具有較大的功率值時(shí),也有效地壓縮了動(dòng)態(tài)范圍。 在上述變型例中,可以不照原樣來(lái)應(yīng)用條件表達(dá)式(8),而是在進(jìn)行以下修改的情況下應(yīng)用該條件表達(dá)式隨著感興趣譜峰的序數(shù)(諸如第二或第三譜峰)增大而減小G—target禾口 a 。 根據(jù)第二實(shí)施方式,在頻域中對(duì)譜峰進(jìn)行衰減,由此在避免產(chǎn)生由于頻譜放大而導(dǎo)致的不協(xié)調(diào)聲音的同時(shí)壓縮輸入信號(hào)的動(dòng)態(tài)范圍。 針對(duì)譜峰的功率值來(lái)確定目標(biāo)衰減量。然后,給定頻率分量的衰減量是基于目標(biāo)衰減量以及譜峰頻率與對(duì)應(yīng)頻譜頻率之差來(lái)確定。這在避免音頻質(zhì)量下降的同時(shí)使得要衰減的頻譜位于譜峰周?chē)?br>
[第三實(shí)施方式]
〈主要結(jié)構(gòu)〉 下面介紹根據(jù)第三實(shí)施方式的聲音處理裝置。根據(jù)第三實(shí)施方式的聲音處理裝置的應(yīng)用領(lǐng)域與第二實(shí)施方式的應(yīng)用領(lǐng)域類(lèi)似。這種聲音處理裝置的主要結(jié)構(gòu)與圖6所例示的結(jié)構(gòu)類(lèi)似,并省略其說(shuō)明。但是,在第三實(shí)施方式中,增益計(jì)算單元127執(zhí)行的處理不同于第一實(shí)施方式和第二實(shí)施方式中的處理。下面說(shuō)明增益計(jì)算單元127執(zhí)行的處理。
增益計(jì)算單元127基于由譜峰檢測(cè)單元126提供的譜峰的功率值A(chǔ)mp_peak以及由目標(biāo)增益計(jì)算單元123提供的目標(biāo)衰減量G—target,利用公式(9)來(lái)計(jì)算目標(biāo)功率值。
Amp_target = Amp_peak_G_target (9)
這里,Amp—target是目標(biāo)功率值。增益計(jì)算單元127將各頻率分量的衰減量計(jì)算為使得這些頻率分量的功率譜值不超過(guò)目標(biāo)功率值。圖17是例示了根據(jù)第三實(shí)施方式的輸入頻譜與電平校正后的頻譜之間的關(guān)系的圖。如圖17所示,輸入頻譜的頻率分量被衰減了由增益計(jì)算單元127計(jì)算出的相應(yīng)衰減量,由此產(chǎn)生了電平校正后的頻譜。圖18是例示圖17所示各頻率的增益的圖。如圖18所示,在超過(guò)目標(biāo)功率值的各個(gè)譜峰周?chē)鷪?zhí)行增益控制。〈聲音處理〉 第二實(shí)施方式的聲音處理的概要與圖IO所例示的聲音處理類(lèi)似,所以省略其詳細(xì)說(shuō)明。下面,參照?qǐng)D19來(lái)介紹第三實(shí)施方式的增益計(jì)算處理。 圖19是例示了根據(jù)第三實(shí)施方式的增益計(jì)算處理的例子的流程圖。針對(duì)圖19所例示的步驟,與圖11的步驟相同或類(lèi)似的步驟用相同的標(biāo)號(hào)表示,并省略對(duì)它們的說(shuō)明。通過(guò)增益計(jì)算單元127來(lái)執(zhí)行圖19所例示的處理。 在步驟S40,增益計(jì)算單元127通過(guò)從譜峰的功率值中減去目標(biāo)衰減量來(lái)計(jì)算目標(biāo)功率值。在步驟S41中,檢查感興趣頻率分量的頻譜功率值是否為譜峰并且不小于目標(biāo)功率值。 如果步驟S41中的檢查結(jié)果為"是",則在步驟S42中將感興趣的頻率分量周?chē)乃p量計(jì)算為使得所得到的功率值不超過(guò)目標(biāo)功率值,并且還形成從譜峰下降的平緩曲線。如果步驟S41中的檢查結(jié)果為"否",則過(guò)程返回至步驟S41。當(dāng)針對(duì)全部的頻率分量計(jì)算了衰減量之后,增益計(jì)算處理結(jié)束。 根據(jù)第三實(shí)施方式,在頻域中對(duì)譜峰進(jìn)行衰減,由此在避免產(chǎn)生由于頻譜放大而導(dǎo)致的不協(xié)調(diào)聲音的同時(shí)壓縮輸入信號(hào)的動(dòng)態(tài)范圍。 針對(duì)譜峰的功率值來(lái)確定目標(biāo)衰減量。然后,將各頻率分量的衰減量確定為使得所得到的功率譜值不超過(guò)目標(biāo)功率值,并且還形成從各譜峰下降的平緩曲線。這在避免音頻質(zhì)量下降的同時(shí)使得要衰減的頻譜位于譜峰周?chē)?br>
[第四實(shí)施方式]
〈主要結(jié)構(gòu)〉 下面介紹根據(jù)第四實(shí)施方式的聲音處理裝置。第四實(shí)施方式的聲音處理裝置的應(yīng)用領(lǐng)域可以是第一至第三實(shí)施方式的應(yīng)用領(lǐng)域中的一個(gè)。圖20是例示了根據(jù)第四實(shí)施方式的動(dòng)態(tài)范圍壓縮單元的結(jié)構(gòu)的例子的圖。 第四實(shí)施方式與前述實(shí)施方式的不同之處在于如何計(jì)算目標(biāo)衰減量。如圖20所示,目標(biāo)增益計(jì)算單元130從由譜峰檢測(cè)單元126提供的譜峰的功率值A(chǔ)mp_peak中減去預(yù)定的閾值以計(jì)算目標(biāo)衰減量。按照與確定第一閾值的方式類(lèi)似的方式響應(yīng)于揚(yáng)聲器的特性而預(yù)先確定該預(yù)定的閾值。在目標(biāo)衰減量的計(jì)算之后執(zhí)行的處理與前述實(shí)施方式相同或類(lèi)似?!绰曇籼幚怼?圖21是例示了根據(jù)第四實(shí)施方式的聲音處理的示例的圖。針對(duì)圖21所示處理,用相同的標(biāo)號(hào)來(lái)表示與圖IO的處理相同或類(lèi)似的處理,并省略對(duì)它們的說(shuō)明。第四實(shí)施方式的聲音處理與前述實(shí)施方式的聲音處理的不同之處在于在步驟S16的計(jì)算譜峰的處理之后,執(zhí)行步驟S50的目標(biāo)增益計(jì)算處理。如上所述,目標(biāo)增益計(jì)算處理通過(guò)從譜峰的功率值A(chǔ)mp—peak中減去預(yù)定的閾值來(lái)計(jì)算目標(biāo)衰減量。 第四實(shí)施方式的增益計(jì)算處理可以是前述實(shí)施方式所使用的增益計(jì)算處理中的任何一個(gè)。上述第四實(shí)施方式通過(guò)使用更簡(jiǎn)單的結(jié)構(gòu)而實(shí)現(xiàn)了與前述實(shí)施方式的優(yōu)點(diǎn)一樣有利的優(yōu)點(diǎn)。當(dāng)期望精確地控制音量時(shí),可以使用第一實(shí)施方式至第三實(shí)施方式之一。在更希望用更簡(jiǎn)單的結(jié)構(gòu)來(lái)實(shí)現(xiàn)該目的時(shí),可以使用第四實(shí)施方式。 下面將介紹上述實(shí)施方式的變型例。圖22是例示了所公開(kāi)的聲音處理的應(yīng)用的變型的圖。如圖22所示,前述實(shí)施方式的聲音處理可以被實(shí)現(xiàn)為使計(jì)算機(jī)31執(zhí)行處理的程序。這種程序可以從服務(wù)器30等進(jìn)行安裝以由計(jì)算機(jī)31來(lái)執(zhí)行,由此執(zhí)行上述的聲音處理。 該程序可以記錄在記錄介質(zhì)(例如,CD-ROM 32、 SD卡34等)中??梢酝ㄟ^(guò)計(jì)算機(jī)31或便攜終端33來(lái)讀取其中記錄有程序的這種記錄介質(zhì),由此執(zhí)行前述的聲音處理。該記錄介質(zhì)可以是任何類(lèi)型的記錄介質(zhì),也就是說(shuō),其可以是利用光、電或磁裝置(諸如,CD-R0M、軟盤(pán)或磁光盤(pán))來(lái)記錄信息的記錄介質(zhì)、或者可以是利用電裝置(諸如,R0M或閃存)來(lái)記錄信息的半導(dǎo)體存儲(chǔ)器。所公開(kāi)的實(shí)施方式及其變型例對(duì)于具有小揚(yáng)聲器的裝置(諸如,便攜終端或IP電話)特別有效。 根據(jù)至少一個(gè)實(shí)施方式,提供了 一種在避免音頻質(zhì)量降低的同時(shí)壓縮動(dòng)態(tài)范圍的聲音處理方法。 出于教育目的而在本文中引用的全部實(shí)施例和條件性用語(yǔ)旨在幫助讀者理解本發(fā)明以及發(fā)明人為進(jìn)一步發(fā)展現(xiàn)有技術(shù)而做出貢獻(xiàn)的原理,并且應(yīng)被解釋為不限于此類(lèi)具體引用的實(shí)施例和條件,并且此類(lèi)實(shí)施例在說(shuō)明書(shū)中的組織形式也不是為了示出本發(fā)明的優(yōu)劣。盡管已經(jīng)詳細(xì)描述了本發(fā)明的實(shí)施方式,但應(yīng)理解的是在不偏離本發(fā)明的精神和范圍的情況下可進(jìn)行各種改變、替換和變更。
1權(quán)利要求
一種聲音處理方法,該方法包括以下步驟將輸入信號(hào)從時(shí)域變換到頻域以產(chǎn)生頻譜;檢測(cè)所述頻譜的譜峰;目標(biāo)衰減量計(jì)算步驟,基于所述輸入信號(hào)和所述頻譜二者中的一個(gè)來(lái)計(jì)算目標(biāo)衰減量;衰減量計(jì)算步驟,基于所述目標(biāo)衰減量及所檢測(cè)到的譜峰來(lái)計(jì)算所述頻譜的各頻率分量的衰減量;通過(guò)響應(yīng)于計(jì)算出的各頻率分量的衰減量對(duì)所述頻譜進(jìn)行衰減來(lái)校正所述頻譜的電平;以及對(duì)該電平校正后的頻譜執(zhí)行逆頻率變換以產(chǎn)生輸出信號(hào)。
2. 根據(jù)權(quán)利要求1所述的聲音處理方法,其中,該目標(biāo)衰減量計(jì)算步驟基于所述輸入 信號(hào)的最大幅度和所檢測(cè)到的譜峰的功率譜值這二者中的一個(gè)來(lái)計(jì)算所述目標(biāo)衰減量。
3. 根據(jù)權(quán)利要求2所述的聲音處理方法,其中,該衰減量計(jì)算步驟將所述譜峰的衰減 量設(shè)置為目標(biāo)衰減量,并且將除了所述譜峰以外的頻率分量的衰減量設(shè)置為小于所述目標(biāo) 衰減量。
4. 根據(jù)權(quán)利要求3所述的聲音處理方法,其中,該衰減量計(jì)算步驟基于所述譜峰的功 率譜值與除了所述譜峰以外的給定頻率分量的功率譜值之差,確定該給定頻率分量的衰減
5. 根據(jù)權(quán)利要求4所述的聲音處理方法,其中,該衰減量計(jì)算步驟將除了所述譜峰以 外的且所述差比閾值小的給定頻率分量的衰減量確定為,使得所確定的衰減量比所述目標(biāo) 衰減量小一個(gè)與所述差成比例的值。
6. 根據(jù)權(quán)利要求5所述的聲音處理方法,其中,該衰減量計(jì)算步驟將除了所述譜峰以 外的且所述差比所述閾值大的給定頻率分量的衰減量設(shè)置為0。
7. 根據(jù)權(quán)利要求3所述的聲音處理方法,其中,該衰減量計(jì)算步驟基于所述譜峰的頻 率與除了所述譜峰以外的給定頻率分量的頻率之差來(lái)確定該給定頻率分量的衰減量。
8. 根據(jù)權(quán)利要求7所述的聲音處理方法,其中,該衰減量計(jì)算步驟基于除了所述譜峰 以外的局部最大頻率分量的頻率與除了所述譜峰以外的給定頻率分量的頻率之差來(lái)確定 該給定頻率分量的衰減量。
9. 根據(jù)權(quán)利要求7所述的聲音處理方法,其中,該衰減量計(jì)算步驟將除了所述譜峰以 外的且所述差比閾值小的給定頻率分量的衰減量確定為,使得所確定的衰減量比所述目標(biāo) 衰減量小一個(gè)與所述差成比例的值。
10. 根據(jù)權(quán)利要求8所述的聲音處理方法,其中,該衰減量計(jì)算步驟將除了所述局部最 大頻率分量以外的且所述差比閾值小的給定頻率分量的衰減量確定為,使得所確定的衰減 量比所述目標(biāo)衰減量小一個(gè)與所述差成比例的值。
11. 根據(jù)權(quán)利要求9所述的聲音處理方法,其中,該衰減量計(jì)算步驟將除了所述譜峰以 外的且所述差比所述閾值大的給定頻率分量的衰減量設(shè)置為0。
12. 根據(jù)權(quán)利要求IO所述的聲音處理方法,其中,該衰減量計(jì)算步驟將除了所述局部 最大頻率分量以外的且所述差比所述閾值大的給定頻率分量的衰減量設(shè)置為O。
13. 根據(jù)權(quán)利要求3所述的聲音處理方法,其中,該衰減量計(jì)算步驟通過(guò)將所述譜峰的功率譜值減少該目標(biāo)衰減量來(lái)計(jì)算目標(biāo)功率譜值,并且將除了所述譜峰以外的給定頻率分 量的衰減量確定為使得該給定頻率分量的功率譜值變得小于該目標(biāo)功率譜值。
14. 一種其中包含有程序的計(jì)算機(jī)可讀介質(zhì),所述程序使得計(jì)算機(jī)執(zhí)行以下操作 將輸入信號(hào)從時(shí)域變換到頻域以產(chǎn)生頻譜;檢測(cè)所述頻譜的譜峰;基于所述輸入信號(hào)的最大幅度和所檢測(cè)到的譜峰的功率譜值二者中的一個(gè)來(lái)計(jì)算目 標(biāo)衰減量;基于所述目標(biāo)衰減量及所檢測(cè)到的譜峰來(lái)計(jì)算所述頻譜的各頻率分量的衰減量; 通過(guò)響應(yīng)于計(jì)算出的各頻率分量的衰減量對(duì)所述頻譜進(jìn)行衰減來(lái)校正所述頻譜的電 平;以及對(duì)該電平校正后的頻譜執(zhí)行逆頻率變換以產(chǎn)生輸出信號(hào)。
15. —種聲音處理裝置,該裝置包括頻率變換單元,其被配置為將輸入信號(hào)從時(shí)域變換到頻域以產(chǎn)生頻譜; 譜峰檢測(cè)單元,其被配置為對(duì)所述頻譜的譜峰進(jìn)行檢測(cè);目標(biāo)衰減量計(jì)算單元,其被配置為基于所述輸入信號(hào)的最大幅度和所檢測(cè)到的譜峰的 功率譜值二者中的一個(gè)來(lái)計(jì)算目標(biāo)衰減量;衰減量計(jì)算單元,其被配置為基于所述目標(biāo)衰減量及所檢測(cè)到的譜峰來(lái)計(jì)算所述頻譜 的各頻率分量的衰減量;電平校正單元,其被配置為通過(guò)響應(yīng)于計(jì)算出的各頻率分量的衰減量對(duì)所述頻譜進(jìn)行 衰減來(lái)校正所述頻譜的電平;以及逆頻率變換單元,其被配置為對(duì)該電平校正后的頻譜執(zhí)行逆頻率變換以產(chǎn)生輸出信號(hào)。
全文摘要
本發(fā)明提供了一種聲音處理方法及裝置。該方法包括以下步驟將輸入信號(hào)從時(shí)域變換到頻域以產(chǎn)生頻譜;檢測(cè)所述頻譜的譜峰;基于所述輸入信號(hào)和所述頻譜二者中的一個(gè)來(lái)計(jì)算目標(biāo)衰減量;基于所述目標(biāo)衰減量及所檢測(cè)到的譜峰來(lái)計(jì)算所述頻譜的各頻率分量的衰減量;通過(guò)響應(yīng)于計(jì)算出的各頻率分量的衰減量對(duì)所述頻譜進(jìn)行衰減來(lái)校正所述頻譜的電平;以及對(duì)該電平校正后的頻譜執(zhí)行逆頻率變換以產(chǎn)生輸出信號(hào)。
文檔編號(hào)G10L21/02GK101751929SQ200910258019
公開(kāi)日2010年6月23日 申請(qǐng)日期2009年12月9日 優(yōu)先權(quán)日2008年12月9日
發(fā)明者外川太郎, 大田恭士, 大谷猛 申請(qǐng)人:富士通株式會(huì)社