專利名稱:雙麥克風(fēng)語音增強(qiáng)裝置及方法
雙麥克風(fēng)語音增強(qiáng)裝置及方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種語音增強(qiáng)裝置及方法,尤其涉及一種基于雙麥克風(fēng)語音增強(qiáng)裝置及方法。
背景技術(shù):
隨著通訊技術(shù)的發(fā)展,用戶對通信設(shè)備的要求已不僅滿足于通話,而且要能夠提供高質(zhì)量的通話效果,尤其是目前可視化技術(shù)的發(fā)展,電話的通話質(zhì)量更顯重要。通過各種語音增強(qiáng)方法提高通話質(zhì)量,已經(jīng)是通信設(shè)備中必不可少的組成部分。近年來,電話會議在人們工作中的比重急劇上升,越發(fā)重要。然而,在電話會議的房間中,雖然室內(nèi)安靜,噪聲不大,但房間混響則是一直存在且對電話會議有很大干擾的。 相關(guān)技術(shù)的語音增強(qiáng)裝置通常采用一個或兩個一致性較好的麥克風(fēng),相互間距一定情況下,形成指向性拾音波束,抑制波束外噪聲,再通過語音增強(qiáng)處理進(jìn)一步消除背景噪聲。這僅采用加性噪聲的信號模型,沒有考慮房間混響效應(yīng)因此,有必要提供一種新的語音增強(qiáng)裝置及方法來克服上訴問題。
發(fā)明內(nèi)容本發(fā)明需解決的技術(shù)問題是提供一種能消除房間混響噪聲的雙麥克風(fēng)陣列語音增強(qiáng)裝置及方法。本發(fā)明的技術(shù)方案如下?!N基于雙麥克風(fēng)語音增強(qiáng)裝置,其中,該裝置包括麥克風(fēng)陣列模塊,設(shè)有用于接收時域帶噪語音信號,并將該時域帶噪語音信號經(jīng)過模數(shù)轉(zhuǎn)換生成數(shù)字信號,以將其輸出的第一麥克風(fēng)和第二麥克風(fēng);時延補(bǔ)償模塊,用于接收所述麥克風(fēng)陣列模塊輸出的時域帶噪語音數(shù)字信號,通過廣義互相關(guān)發(fā)估計兩個麥克風(fēng)信號的相對時延,并對接收到的信號進(jìn)行補(bǔ)償;倒譜域去混響模塊,用于接收所述時延補(bǔ)償模塊輸出的時延補(bǔ)償后的時域帶噪語音信號,將接收到的上述時域帶噪語音信號在倒譜域進(jìn)行波束合成低通濾波,以去除信號中的混響,并獲得初步降噪的信號;語音增強(qiáng)處理模塊,用于接收倒譜域去混響模塊輸出的初步降噪的信號并將該初步降噪的信號進(jìn)行語音增強(qiáng)處理,以得到進(jìn)一步加強(qiáng)的語音信號;輸出模塊,用于接收語音增強(qiáng)處理模塊輸出的進(jìn)一步加強(qiáng)的語音信號并輸出。作為本發(fā)明的一種改進(jìn),所述麥克風(fēng)陣列模塊中經(jīng)模數(shù)轉(zhuǎn)換輸出的數(shù)字信號的采樣率為16kHz,分辨率為16bit。作為本發(fā)明的一種改進(jìn),所述麥克風(fēng)陣列模塊中的第一麥克風(fēng)和第二麥克風(fēng)是全指向麥克風(fēng)。作為本發(fā)明的一種改進(jìn),該方法包括如下步驟步驟SOOl 第一麥克風(fēng)和第二麥克風(fēng)接收到時域帶噪語音信號分別為xl、x2,經(jīng)過模數(shù)轉(zhuǎn)換將時域帶噪語音信號xl、x2變?yōu)闀r域帶噪語音數(shù)字信號傳送給時延補(bǔ)償模塊, 并由延補(bǔ)償模塊對接收到的時域帶噪語音數(shù)字信號進(jìn)行時延估計和補(bǔ)償,得到同步信號 Λ 1 ‘ Λ 2,步驟S002:由倒譜域去混響模塊接受時延補(bǔ)償模塊輸出的同步信號χ' 1; χ' 2, 并對該信號在倒譜域上進(jìn)行波束合成低通濾波,去除信號中的混響,獲得初步降噪的信號, 并對所述初步降噪的信號分為m幀、進(jìn)行預(yù)加重處理,傅里葉變換成頻域信號&,X2,計算兩路信號的復(fù)倒譜妬如,均,^^如,均,并分解求得各自的最小相位分量 9"l,mm (m, n),^2,mm ( Π, U),將兩路信號的倒譜域最小相位分量進(jìn)行波束形成,得到,并經(jīng)過低通濾波,得到倒譜域的去除混響后的信號· ^mm(rn,n)結(jié)合由第一麥克風(fēng)得到的相位信息O1Gii, k),計算頻域的去除混響初步降噪信號 Y;步驟S003 語音增強(qiáng)處理模塊接收倒譜域去混響模塊輸出的去除混響的初步降噪頻域信號Y,并將頻域信號劃分為若干頻帶k,計算各個頻帶的能量\(m,k),其中m表示幀數(shù),k為頻帶數(shù);設(shè)初始的噪聲能量估計值V(0,k) = 0,初始的先驗(yàn)信噪比估計值S-^^;。,(a = o;由各頻帶的能量\(m,k)及前一幀得到的噪聲能量估計值V(m-1,k),計算各個頻帶當(dāng)前幀的后驗(yàn)信噪比SNRp。st(m,k),并由前一幀的先驗(yàn)信噪比估計值得到
當(dāng)前幀的先驗(yàn)信噪比估計值(fiL k)-采用計權(quán)噪聲估計法對當(dāng)前幀的先驗(yàn)信噪比進(jìn)行修正,得到修正先驗(yàn)信噪比估計根據(jù)得到的修正先驗(yàn)信噪比估計值&^ 々〃.Α·),計算各個頻帶的衰減增益系數(shù) q(m, k);采用門限判決對所述衰減增益系數(shù)進(jìn)行調(diào)整;用得到的調(diào)整后的衰減增益系數(shù)q' (111,10,對初步降噪后信號¥(111,10的頻譜進(jìn)行處理;由修正的先驗(yàn)信噪比估計值對當(dāng)前幀進(jìn)行判斷,判斷當(dāng)前幀是否是
噪聲;根據(jù)噪聲判決結(jié)果對各頻帶的噪聲能量估計值V(m,k)進(jìn)行更新,如果判斷為噪聲,則噪聲能量估計值等于前一幀的值V(m,k) = V(m-1, k),否則采用頻帶能量\(m,k), 對噪聲能量估計值V (m,k)進(jìn)行更新;將經(jīng)上述過程處理后的頻域信號變換成時域信號,對該時域信號進(jìn)行去加重處理,并輸出;步驟S004 將上述經(jīng)去加重處理的時域信號輸出。作為本發(fā)明的一種改進(jìn),步驟SOOl中,由時延補(bǔ)償模塊對第一麥克風(fēng)和第二麥克風(fēng)分別接收的外界時域帶噪語音信號分別經(jīng)過延時補(bǔ)償,
將兩路信號X1 (η),X2 (η)進(jìn)行傅里葉變換到頻域&( ),&( ),兩個麥克風(fēng)的相對時延τ通過廣義互相關(guān)得到,
權(quán)利要求
1.一種雙麥克風(fēng)語音增強(qiáng)裝置,其特征在于該裝置包括麥克風(fēng)陣列模塊,設(shè)有用于接收時域帶噪語音信號,并將該時域帶噪語音信號經(jīng)過模數(shù)轉(zhuǎn)換生成數(shù)字信號,以將該數(shù)字信號輸出的第一麥克風(fēng)和第二麥克風(fēng);時延補(bǔ)償模塊,用于接收所述麥克風(fēng)陣列模塊輸出的時域帶噪語音數(shù)字信號,通過廣義互相關(guān)發(fā)估計兩個麥克風(fēng)信號的相對時延,并對接收到的信號進(jìn)行補(bǔ)償;倒譜域去混響模塊,用于接收所述時延補(bǔ)償模塊輸出的時延補(bǔ)償后的時域帶噪語音數(shù)字信號,將接收到的上述時域帶噪語音信號在倒譜域進(jìn)行波束合成低通濾波,以去除信號中的混響,并獲得初步降噪的信號;語音增強(qiáng)處理模塊,用于接收倒譜域去混響模塊輸出的初步降噪的信號并將該初步降噪的信號進(jìn)行語音增強(qiáng)處理,以得到進(jìn)一步加強(qiáng)的語音信號;輸出模塊,用于接收語音增強(qiáng)處理模塊輸出的進(jìn)一步加強(qiáng)的語音信號并輸出。
2.根據(jù)權(quán)利要求1所述的雙麥克風(fēng)語音增強(qiáng)裝置,其特征在于所述麥克風(fēng)陣列模塊中經(jīng)模數(shù)轉(zhuǎn)換輸出的數(shù)字信號的采樣率為16kHz,分辨率為16bit。
3.根據(jù)權(quán)利要求2所述的雙麥克風(fēng)語音增強(qiáng)裝置,其特征在于所述麥克風(fēng)陣列模塊中的第一麥克風(fēng)和第二麥克風(fēng)是全指向麥克風(fēng)。
4.一種基于權(quán)利要求1所述的雙麥克風(fēng)語音增強(qiáng)方法,其特征在于該方法包括如下步驟步驟SOOl 第一麥克風(fēng)和第二麥克風(fēng)接收到時域帶噪語音信號分別為xl、x2,經(jīng)過模數(shù)轉(zhuǎn)換將時域帶噪語音信號xl、x2變?yōu)闀r域帶噪語音數(shù)字信號傳送給時延補(bǔ)償模塊,并由延補(bǔ)償模塊對接收到的時域帶噪語音數(shù)字信號進(jìn)行時延估計和補(bǔ)償,得到同步信號χ' ”Λ 2,步驟S002:由倒譜域去混響模塊接受時延補(bǔ)償模塊輸出的同步信號X' 1; χ' 2,并對該信號在倒譜域上進(jìn)行波束合成低通濾波,去除信號中的混響,獲得初步降噪的信號,并對所述初步降噪的信號分為m幀、進(jìn)行預(yù)加重處理,傅里葉變換成頻域信號&,X2,計算兩路信號的復(fù)倒譜妬如,《),史2如,《;),并分解求得各自的最小相位分量 9"l,mm (m, n),^2,mm ( Π, U),將兩路信號的倒譜域最小相位分量進(jìn)行波束形成,得到^mm ,并經(jīng)過低通濾波,得到倒譜域的去除混響后的信號S^mm (m, η)結(jié)合由第一麥克風(fēng)得到的相位信息O1Gii, k),計算頻域的去除混響初步降噪信號Y ; 步驟S003 語音增強(qiáng)處理模塊接收倒譜域去混響模塊輸出的去除混響的初步降噪頻域信號Y,并將頻域信號劃分為若干頻帶k,計算各個頻帶的能量\(m,k),其中m表示幀數(shù), k為頻帶數(shù);設(shè)初始的噪聲能量估計值V (0,k) = 0,初始的先驗(yàn)信噪比估計值= o. 由各頻帶的能量\(m,k)及前一幀得到的噪聲能量估計值V(m-1,k),計算各個頻帶當(dāng)前幀的后驗(yàn)信噪比SNRp。st(m,k),并由前一幀的先驗(yàn)信噪比估計值5」如_,加-1/「)得到當(dāng)前幀的先驗(yàn)信噪比估計值(ULt);采用計權(quán)噪聲估計法對當(dāng)前幀的先驗(yàn)信噪比進(jìn)行修正,得到修正先驗(yàn)信噪比估計值
5.根據(jù)權(quán)利要求4所述的雙麥克風(fēng)語音增強(qiáng)方法,其特征在于步驟SOOl中,由時延補(bǔ)償模塊對第一麥克風(fēng)和第二麥克風(fēng)分別接收的外界時域帶噪語音信號分別經(jīng)過延時補(bǔ)償,將兩路信號X1 (η),X2 (η)進(jìn)行傅里葉變換到頻域& (ω),& (ω),兩個麥克風(fēng)的相對時延τ通過廣義互相關(guān)得到,其中加權(quán)函數(shù)仏
6.根據(jù)權(quán)利要求4所述的雙麥克風(fēng)語音增強(qiáng)方法,其特征在于步驟S002中,對兩路經(jīng)過時延補(bǔ)償?shù)男盘栠M(jìn)行分幀,預(yù)加重,并轉(zhuǎn)換到頻域。語音增強(qiáng)處理模塊對所述兩路時延補(bǔ)償后的信號χ' !ω,χ' 2α)進(jìn)行分幀后的信號為χ' ,(m, n)i = 1,2, m表示幀數(shù),經(jīng)過一個高通濾波器,作為預(yù)加重處理,高通濾波器其形式如下
7.根據(jù)權(quán)利要求4所述的雙麥克風(fēng)語音增強(qiáng)方法,其特征在于步驟S003中,采用如下方法計算每個頻帶的能量并進(jìn)行平滑
全文摘要
本發(fā)明提供了一種雙麥克風(fēng)語音增強(qiáng)裝置,包括雙麥克風(fēng)陣列模塊、時延補(bǔ)償模塊、倒譜域去混響模塊、語音增強(qiáng)處理模塊及輸出模塊,其中,倒譜域去混響模塊起到了去除混響的效果。本發(fā)明還提供了一種基于雙麥克風(fēng)語音增強(qiáng)裝置的語音增強(qiáng)方法。本發(fā)明采用倒譜域模塊進(jìn)行波束形成和低通濾波,能較好地消除房間混響的影響,同時使用語音增強(qiáng)算法,則可以進(jìn)一步抑制背景噪聲。
文檔編號G10L21/02GK102347028SQ201110196850
公開日2012年2月8日 申請日期2011年7月14日 優(yōu)先權(quán)日2011年7月14日
發(fā)明者葉利劍 申請人:瑞聲聲學(xué)科技(常州)有限公司, 瑞聲聲學(xué)科技(深圳)有限公司, 瑞聲聲學(xué)科技研發(fā)(南京)有限公司