本發(fā)明涉及音頻處理領(lǐng)域,尤其涉及一種音頻流的處理方法及裝置。
背景技術(shù):
目前,為了使得用戶在嘈雜的環(huán)境中仍能聽清楚音頻中的語音,往往會采用突出表現(xiàn)音頻中語音的方式,現(xiàn)有的突出表現(xiàn)音頻中語音的方式主要應(yīng)用于音樂播放器中,在音樂播放器中應(yīng)用此項技術(shù)主要是對歌曲進行處理,使得音樂中的歌手的聲音相對于背景音樂比較明顯,從而使用戶獲取一種新的體驗,該項技術(shù)的實現(xiàn)方式比較單一,主要是通過調(diào)節(jié)均衡器實現(xiàn),然而該方式只是機械性的增強了語音在音頻中的能量,使得音頻效果整體被改變,相對與處理之前的音頻來說,未免存在失真的情況。
技術(shù)實現(xiàn)要素:
本發(fā)明提供了一種音頻流的處理方法及裝置,用于解決現(xiàn)有技術(shù)中在音頻中突出語音的方式存在失真的問題。
本方面提供一種音頻流的處理方法,包括:增強輸入的第一音頻流中預設(shè)頻率范圍內(nèi)的頻率分量的能量,得到第二音頻流;降低第二音頻流中的背景聲音的能量,得到第三音頻流;輸出第三音頻流。
其中,增強輸入的第一音頻流中預設(shè)頻率范圍內(nèi)的頻率分量的能量,包括:將第一音頻流輸入濾波器組,以增強第一音頻流中預設(shè)頻率范圍內(nèi)的頻率分量的能量。
其中,增強輸入的第一音頻流中預設(shè)頻率范圍內(nèi)的頻率分量的能量,包括:在50Hz至16000Hz的頻率范圍內(nèi)選取10個頻率作為中心頻率,通過在10個頻率中選擇不同中心頻率對應(yīng)的幅度值,以增強預設(shè)頻率范圍內(nèi)的頻率分量。
其中,降低第二音頻流中的背景聲音的能量,包括:從第二音頻流中提取背景聲音信號;計算背景聲音信號的能量值;根據(jù)計算得到的能量值,確定背景聲音的衰減程度;根據(jù)衰減程度降低第二音頻流中的背景聲音。
其中,預設(shè)頻率范圍為500Hz到3600Hz。
根據(jù)本發(fā)明的第二個方面,提供了一種音頻流的處理裝置,包括:增強模塊,用于增強輸入的第一音頻流中預設(shè)頻率范圍內(nèi)的頻率分量的能量,得到第二音頻流;降低模塊,用于降低第二音頻流中的背景聲音的能量,得到第三音頻流;輸出模塊,用于輸出第三音頻流。
其中,增強模塊具體用于:將第一音頻流輸入濾波器組,以增強第一音頻流中預設(shè)頻率范圍內(nèi)的頻率分量的能量。
其中,增強模塊具體用于:在50Hz至16000Hz的頻率范圍內(nèi)選取10個頻率作為中心頻率,通過在10個頻率中選擇不同中心頻率對應(yīng)的幅度值,以增強預設(shè)頻率范圍內(nèi)的頻率分量。
其中,降低模塊,包括:提取單元,用于從第二音頻流中提取背景聲音信號;計算單元,用于計算背景聲音信號的能量值;確定單元,用于根據(jù)計算得到的能量值,確定背景聲音的衰減程度;降低單元,用于根據(jù)衰減程度降低第二音頻流中的背景聲音。
其中,預設(shè)頻率范圍為500Hz到3600Hz。
本發(fā)明實施例提供的方法不僅對音頻流中的人聲部分進行了增強,而且對背景聲音進行了一定的消弱,經(jīng)過該方法處理后,在噪聲環(huán)境中,人耳可以更容易的分辨出說話人聲,同時以本實施例提供的方法處理后的音頻,人聲失真較小,突顯人聲的效果較為明顯。
附圖說明
為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1是本發(fā)明第一實施例提供的音頻流處理方法的流程圖;
圖2是本發(fā)明第二實施例提供的音頻流處理方法的原理圖;
圖3是本發(fā)明第三實施例提供的音頻流處理裝置的結(jié)構(gòu)框圖。
具體實施方式
下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例。基于本發(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動的前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。
第一實施例
本實施例提供了一種音頻流的處理方法,圖1是該方法的流程圖,如圖1所示,該方法包括如下處理:
步驟101:增強輸入的第一音頻流中預設(shè)頻率范圍內(nèi)的頻率分量的能量,得到第二音頻流;
在本實施例中預設(shè)頻率范圍可選的為500Hz到3600Hz,該頻率范圍具體可以囊括不同的語音的音頻范圍。
步驟102:降低第二音頻流中的背景聲音的能量,得到第三音頻流;
步驟103:輸出第三音頻流。
在本實施例中,增強輸入的第一音頻流中預設(shè)頻率范圍內(nèi)的頻率分量的能量具體可以包括:將第一音頻流輸入濾波器組,以增強第一音頻流中預設(shè)頻率范圍內(nèi)的頻率分量的能量。增強輸入的第一音頻流中預設(shè)頻率范圍內(nèi)的頻率分量的能量的步驟具體可以包括:在50Hz至16000Hz的頻率范圍內(nèi)選取10個頻率作為中心頻率,通過在10個頻率中選擇不同中心頻率對應(yīng)的幅度值,以增強預設(shè)頻率范圍內(nèi)的頻率分量。
需要說明的是,在本實施例中增強輸入的第一音頻流中預設(shè)頻率范圍內(nèi)的頻率分量的能量具體還可以是,將第一音頻流中預設(shè)頻率范圍內(nèi)的頻率分量的能量增強至預設(shè)值,以及降低第二音頻流中的背景聲音的能量具體也可以是將第二音頻流中的背景聲音的能量降低至預設(shè)值。
其中,降低第二音頻流中的背景聲音的能量具體可以包括以下處理:
從第二音頻流中提取背景聲音信號;計算背景聲音信號的能量值;根據(jù)計算得到的能量值,確定背景聲音的衰減程度;根據(jù)衰減程度降低第二音頻流中的背景聲音。
本發(fā)明實施例提供的方法不僅對音頻中的人聲部分進行了增強,而且對背景聲音進行了一定的消弱,經(jīng)過該方法處理后,在噪聲環(huán)境中,人耳可以更容易的分辨出說話人聲,同時以本實施例提供的方法處理后的音頻,人聲失真較小,突顯人聲的效果較為明顯。
第二實施例
本實施例在上述第一實施例的基礎(chǔ)上,通過公開更多的技術(shù)細節(jié)來對本發(fā)明提供的音頻流處理方法進行進一步闡述。首先介紹以下本實施例提供的音頻流處理方法的實現(xiàn)原理:
圖2是本實施例提供的音頻流處理方法的原理圖,如圖2所示,首先輸入解碼后的音頻流,使該音頻流首先經(jīng)過多通帶濾波器,對頻率范圍在500Hz到3600Hz之間的信號進行能量增強;之后從音頻流中提取背景聲音,以此為參考用于降低整個音頻流中的背景聲音能量。經(jīng)過降低背景聲音能量后,得到最終的輸出音頻。
其中,多通帶濾波器由一組帶通濾波器組成,帶通濾波器是指能通過某一頻率范圍內(nèi)的頻率分量,但其他范圍的頻率分量衰減到極低水平的濾波器。優(yōu)選的,本實施例可以基于濾波器組在頻率50Hz-16000Hz之間選取10個頻率作為中心頻率,通過調(diào)整不同中心頻率位置對應(yīng)的幅度值,達到增強語音的目的。
提取背景聲音的處理方式,具體可以是,在輸入的音頻信號是雙聲道信號的情況下,可以利用左右聲道之間的差異獲取背景聲音,在本實施例中,也可以通過實現(xiàn)對背景聲音進行分析,得到背景音樂的特征,根據(jù)該特征(例如可以是頻率的特征),提取音頻流中的背景聲音。
降低背景音能量具體可以根據(jù)獲得的背景聲音信號,計算背景聲音的能量值,根據(jù)計算得到的能量值,確定針對背景聲音的衰減程度,從而獲取最終的輸出信號。
采用本實施例提供的方法對視頻播放器的音頻流處理后,在噪聲環(huán)境下,使用視頻播放器播放視頻時,人耳可以清晰的分辨出說話人聲,且避免了音頻失真的情況。
第三實施例
本實施例提供了一種音頻流的處理裝置,該裝置用于實現(xiàn)上述第一實施例以及第二實施例提供的方法,圖3是該裝置的結(jié)構(gòu)框圖,如圖3所示,該裝置30包括如下組成部分:
增強模塊31,用于增強輸入的第一音頻流中預設(shè)頻率范圍內(nèi)的頻率分量的能量,得到第二音頻流;在本實施例中,預設(shè)頻率范圍可以為500Hz到3600Hz。
降低模塊32,用于降低第二音頻流中的背景聲音的能量,得到第三音頻流;
輸出模塊33,用于輸出第三音頻流。
其中,上述增強模塊31具體可以用于:將第一音頻流輸入濾波器組,以增強第一音頻流中預設(shè)頻率范圍內(nèi)的頻率分量的能量。
其中,本實施例所涉及的濾波器組可以包括10個中心頻率,基于該濾波器組,上述增強模塊31具體用于:在50Hz至16000Hz的頻率范圍內(nèi)選取10個頻率作為中心頻率,通過在10個頻率中選擇不同中心頻率對應(yīng)的幅度值,以增強預設(shè)頻率范圍內(nèi)的頻率分量。
其中,上述降低模塊32具體可以包括:提取單元,用于從第二音頻流中提取背景聲音信號;計算單元,用于計算背景聲音信號的能量值;確定單元,用于根據(jù)計算得到的能量值,確定背景聲音的衰減程度;降低單元,用于根據(jù)衰減程度降低第二音頻流中的背景聲音。
需要說明的是,在本實施例中增強輸入的第一音頻流中預設(shè)頻率范圍內(nèi)的頻率分量的能量具體還可以是,將第一音頻流中預設(shè)頻率范圍內(nèi)的頻率分量的能量增強至預設(shè)值,以及降低第二音頻流中的背景聲音的能量具體也可以是將第二音頻流中的背景聲音的能量降低至預設(shè)值。
以上所述,僅為本發(fā)明的具體實施方式,但本發(fā)明的保護范圍并不局限于此,任何熟悉本技術(shù)領(lǐng)域的技術(shù)人員在本發(fā)明揭露的技術(shù)范圍內(nèi),可輕易想到的變化或替換,都應(yīng)涵蓋在本發(fā)明的保護范圍之內(nèi)。因此,本發(fā)明的保護范圍應(yīng)以所述權(quán)利要求的保護范圍為準。