專利名稱:噪聲環(huán)境語(yǔ)音識(shí)別中的信號(hào)動(dòng)態(tài)增益放大方法
技術(shù)領(lǐng)域:
本發(fā)明屬于語(yǔ)音識(shí)別技術(shù)領(lǐng)域,特別涉及噪聲環(huán)境下語(yǔ)音識(shí)別應(yīng)用中語(yǔ)音信號(hào)拾取 的方法。
背景技術(shù):
常用的靜態(tài)語(yǔ)音采集方法是用話筒拾取帶噪語(yǔ)音,得到語(yǔ)音的模擬信號(hào),再經(jīng)過(guò) 固定參數(shù)的放大電路后,轉(zhuǎn)換為數(shù)字信號(hào)。這種方法的缺點(diǎn)是放大電路的增益系數(shù)是固定的,不能適應(yīng)變化的車載噪聲環(huán)境。 背景噪聲強(qiáng)度很小時(shí),用戶傾向于使用較輕的語(yǔ)音傳達(dá)意圖,過(guò)小的增益系數(shù)可能導(dǎo)致 語(yǔ)音數(shù)字信號(hào)的強(qiáng)度不足以啟動(dòng)語(yǔ)音識(shí)別。背景噪聲強(qiáng)度很大時(shí),用戶傾向于使用較大 的語(yǔ)音傳達(dá)意圖,同時(shí)為了使語(yǔ)音信號(hào)具有較高的信噪比,也要求用戶相應(yīng)地提高音 量。在這種情況下,如果放大電路增益系數(shù)較大,將出現(xiàn)削波現(xiàn)象,導(dǎo)致語(yǔ)音信號(hào)嚴(yán)重 失真,信噪比顯著下降。,.中國(guó)專利"通過(guò)語(yǔ)音信號(hào)控制設(shè)備尤其是汽車中的設(shè)備的方法"(申請(qǐng)?zhí)?1133137.2)中提出一種方法來(lái)解決這個(gè)問(wèn)題,該方法用一個(gè)振動(dòng)傳感器來(lái)測(cè)量汽車的振動(dòng)信號(hào), 一個(gè)額外的麥克風(fēng)來(lái)測(cè)量車內(nèi)噪聲水平信號(hào),然后利用這兩個(gè)信號(hào)和兩個(gè)自 適應(yīng)濾波器來(lái)降低語(yǔ)音拾取麥克風(fēng)中的噪聲水平。用以適應(yīng)變化的車載噪聲環(huán)境。但它的缺點(diǎn)是增加了一個(gè)振動(dòng)傳感器和一個(gè)額外的麥克風(fēng),系統(tǒng)更復(fù)雜了。 發(fā)明內(nèi)容本發(fā)明的目的是為克服已有方法的不足之處,提出一種噪聲環(huán)境語(yǔ)音識(shí)別中的信號(hào)動(dòng) 態(tài)增益放大方法,可以實(shí)現(xiàn)在語(yǔ)音識(shí)別過(guò)程中,自動(dòng)識(shí)別背景噪聲環(huán)境,并基于背景噪 聲大小自動(dòng)調(diào)節(jié)語(yǔ)音識(shí)別過(guò)程中錄音的放大電路的增益系數(shù)。這樣在背景噪聲增大,使 用者提高嗓音以人為提高信噪比時(shí),可以減小增益系數(shù),以減小因削波造成的信號(hào)失 真,從而提高語(yǔ)音識(shí)別的可用性。 .本發(fā)明提出的噪聲環(huán)境語(yǔ)音識(shí)別中的信號(hào)動(dòng)態(tài)增益放大方法,其特征在于,包括以 下步驟1) 預(yù)設(shè)一個(gè)60 70dB的中等強(qiáng)度的車載噪聲水平作為目標(biāo)噪聲水平值;2) 預(yù)設(shè)一個(gè)與該目標(biāo)噪聲水平相應(yīng)的放大電路的初始增益系數(shù)作為已知增益系數(shù), 使得該目標(biāo)噪聲水平值經(jīng)過(guò)放大電路后的采樣電壓為滿幅值的10%至20%左右;3) 在一個(gè)語(yǔ)音信號(hào)采集周期內(nèi)采集語(yǔ)音信號(hào),并區(qū)分出該周期的語(yǔ)音段和背景噪聲段;4) 對(duì)所述背景噪聲段的信號(hào)大小進(jìn)行評(píng)估,得到當(dāng)前周期的噪聲水平估計(jì)值;5) 根據(jù)所述目標(biāo)噪聲水平值、當(dāng)前噪聲水平估計(jì)值和已知增益系數(shù),計(jì)算得到放大 電路新的增益系數(shù);6) 將步驟5)得到的新的增益系數(shù)作為已知增益系數(shù)重復(fù)步驟3) 5),得到下一 語(yǔ)音信號(hào)采集周期的放大電路的增益系數(shù),以實(shí)現(xiàn)對(duì)各周期的增益系數(shù)的調(diào)節(jié)。本發(fā)明的特點(diǎn)及有益效果本發(fā)明可以適應(yīng)變化的車內(nèi)噪聲環(huán)境,在背景噪聲增大,使用者提高嗓音以人為提 高信噪比時(shí),可以減小增益系數(shù),以減小因削波造成的信號(hào)失真,從而提高語(yǔ)音識(shí)別的 可用性;而且不需要增加額外的硬件。
具體實(shí)施方式
本發(fā)明提出的噪聲環(huán)境語(yǔ)音識(shí)別中的信號(hào)動(dòng)態(tài)增益放大方法,通過(guò)實(shí)施例詳細(xì)說(shuō)明如下本發(fā)明的實(shí)施例方法,包括以下步驟 1)預(yù)設(shè)一個(gè)66dB的車載噪聲水平作為目標(biāo)噪聲水平值[P]; ,2)為放大電路預(yù)設(shè)與該目標(biāo)噪聲水平相應(yīng)的一個(gè)初始增益系數(shù)Kd乍為已知增益系 數(shù)值,使得目標(biāo)噪聲水平[P]經(jīng)過(guò)放大電路后的采樣電壓約為滿幅值的15%左右;3) 在一個(gè)語(yǔ)音信號(hào)采集周期內(nèi)采集語(yǔ)音信號(hào)(該周期長(zhǎng)短根據(jù)實(shí)際應(yīng)用場(chǎng)合的要求 確定, 一般為5-30秒),并以平均幅度和平均過(guò)零率為判據(jù),區(qū)分有語(yǔ)音的語(yǔ)音段和無(wú) 語(yǔ)音的背景噪聲段;平均幅值低和過(guò)零率低的為背景噪聲段;4) 以背景噪聲段的平均幅值作為該周期背景噪聲水平的評(píng)估值為Pi (i表示是第i 個(gè)周期,i=l, 2, 3, 4,……),若當(dāng)前是第一個(gè)周期,其背景噪聲水平的評(píng)估值為5) 根據(jù)背景噪聲的目標(biāo)值[P]、背景噪聲的評(píng)估值Pi以及當(dāng)前周期已知增益系數(shù)K, (i表示是第i個(gè)周期,i=l, 2, 3, 4,……),若當(dāng)前是第一個(gè)周期,其增益系數(shù)Kj),計(jì)算第i+l周期的增益系數(shù)Kw(2)K _,] +i — p;6)將步驟5)得到的增益系數(shù)Kw作為已知增益系數(shù)重復(fù)步驟3) ~5得到下一語(yǔ)音 信號(hào)采集周期放大電路的增益系數(shù)Ki+2,以此類推,實(shí)現(xiàn)對(duì)各周期的增益系數(shù)的調(diào)節(jié)。
權(quán)利要求
1、一種噪聲環(huán)境語(yǔ)音識(shí)別中的信號(hào)動(dòng)態(tài)增益放大方法,其特征在于,包括以下步驟1)預(yù)設(shè)一個(gè)60~70dB的中等強(qiáng)度的車載噪聲水平作為目標(biāo)噪聲水平值;2)預(yù)設(shè)一個(gè)與該目標(biāo)噪聲水平相應(yīng)的放大電路的初始增益系數(shù)作為已知增益系數(shù),使得該目標(biāo)噪聲水平值經(jīng)過(guò)放大電路后的采樣電壓為滿幅值的10%至20%左右;3)在一個(gè)語(yǔ)音信號(hào)采集周期內(nèi)采集語(yǔ)音信號(hào),并區(qū)分出該周期的語(yǔ)音段和背景噪聲段;4)對(duì)所述背景噪聲段的信號(hào)大小進(jìn)行評(píng)估,得到當(dāng)前周期的噪聲水平估計(jì)值;5)根據(jù)所述目標(biāo)噪聲水平值、當(dāng)前噪聲水平估計(jì)值和已知增益系數(shù),計(jì)算得到放大電路新的增益系數(shù);6)將步驟5)得到的新的增益系數(shù)作為已知增益系數(shù)重復(fù)步驟3)~5),得到下一語(yǔ)音信號(hào)采集周期的放大電路的增益系數(shù),以實(shí)現(xiàn)對(duì)各周期的增益系數(shù)的調(diào)節(jié)。
2、 如權(quán)利要求1所述方法,其特征在于,所述步驟3)區(qū)分出該周期的語(yǔ)音段和背 景噪聲段具體采用以平均幅度和平均過(guò)零率為判據(jù),平均幅值低和過(guò)零率低的為背景噪 聲段。 ,
3、 如權(quán)利要求1所述方法,其特征在于,所述步驟4)中對(duì)所述背景噪聲段的信號(hào) 大小進(jìn)行評(píng)估,得到當(dāng)前周期的噪聲水平估計(jì)值,具體采用以背景噪聲段的平均幅值作 為該周期背景噪聲水平的評(píng)估值。
全文摘要
本發(fā)明涉及噪聲環(huán)境語(yǔ)音識(shí)別中的信號(hào)動(dòng)態(tài)增益放大方法,屬于語(yǔ)音識(shí)別技術(shù)領(lǐng)域,該方法包括預(yù)設(shè)一目標(biāo)噪聲水平值;預(yù)設(shè)一個(gè)初始增益系數(shù)作為已知增益系數(shù);采集語(yǔ)音信號(hào),并區(qū)分出該周期的語(yǔ)音段和背景噪聲段;對(duì)背景噪聲段的信號(hào)大小進(jìn)行評(píng)估,得到當(dāng)前周期的噪聲水平估計(jì)值;根據(jù)所述目標(biāo)噪聲水平值、當(dāng)前噪聲水平估計(jì)值和已知增益系數(shù),計(jì)算得到放大電路新的增益系數(shù);將得到的新的增益系數(shù)作為已知增益系數(shù)重復(fù)上述步驟,得到下一語(yǔ)音信號(hào)采集周期的放大電路的增益系數(shù)。本發(fā)明可以適應(yīng)變化的車內(nèi)噪聲環(huán)境,在背景噪聲增大,使用者提高嗓音以人為提高信噪比時(shí),可以減小增益系數(shù),以減小因削波造成的信號(hào)失真,從而提高語(yǔ)音識(shí)別的可用性。
文檔編號(hào)G10L15/00GK101290769SQ20081011451
公開日2008年10月22日 申請(qǐng)日期2008年6月6日 優(yōu)先權(quán)日2008年6月6日
發(fā)明者張新豐, 楊殿閣, 雯 薛, 連小珉, 良 陸 申請(qǐng)人:清華大學(xué)