欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

噪聲環(huán)境下語(yǔ)音端點(diǎn)的檢測(cè)方法與流程

文檔序號(hào):11655866閱讀:537來(lái)源:國(guó)知局
噪聲環(huán)境下語(yǔ)音端點(diǎn)的檢測(cè)方法與流程

本發(fā)明涉及語(yǔ)音信號(hào)處理技術(shù)領(lǐng)域,更為具體地,涉及一種噪聲環(huán)境下語(yǔ)音端點(diǎn)的檢測(cè)方法。



背景技術(shù):

語(yǔ)音端點(diǎn)檢測(cè)是語(yǔ)音識(shí)別中一個(gè)重要的緩解,語(yǔ)音端點(diǎn)檢測(cè)能夠?qū)φZ(yǔ)音信號(hào)進(jìn)行更好的分析和訓(xùn)練,從而提高語(yǔ)音識(shí)別的識(shí)別率?,F(xiàn)有的端點(diǎn)檢測(cè)算法如利用過(guò)零率、短時(shí)能量和自相關(guān)參數(shù),在高信噪比環(huán)境下可以獲得較好的檢測(cè)效果,但在低信噪比環(huán)境下其檢測(cè)性能卻急劇下降。

當(dāng)語(yǔ)音信號(hào)包含有背景噪音時(shí),從中檢測(cè)出語(yǔ)音信號(hào)的起始點(diǎn)和終止點(diǎn),可以減少數(shù)據(jù)的采集量,刪除不含語(yǔ)音信號(hào)的背景噪聲和無(wú)聲段,從而降低特征提取的計(jì)算量和處理時(shí)間,提高語(yǔ)音識(shí)別的準(zhǔn)確性。

因此,噪聲環(huán)境中準(zhǔn)確的檢測(cè)語(yǔ)音的起止點(diǎn)有利于提高語(yǔ)音系統(tǒng)性能。當(dāng)語(yǔ)音中含有噪音時(shí),現(xiàn)有的語(yǔ)音端點(diǎn)檢測(cè)方法顯得有些無(wú)能為力。



技術(shù)實(shí)現(xiàn)要素:

鑒于上述問(wèn)題,本發(fā)明的目的是提供一種噪聲環(huán)境下語(yǔ)音端點(diǎn)的檢測(cè)方法,以解決現(xiàn)有的語(yǔ)音端點(diǎn)檢測(cè)方法在低信噪比環(huán)境下其檢測(cè)性能低的問(wèn)題。

本發(fā)明提供的噪聲環(huán)境下語(yǔ)音端點(diǎn)的檢測(cè)方法,包括:

步驟1:根據(jù)人耳的基底膜的聽(tīng)覺(jué)特性將20~22050hz的頻率范圍分成25個(gè)頻率群;

步驟2:計(jì)算與每個(gè)頻率群相對(duì)應(yīng)的不等帶寬子帶的方差di;

步驟3:根據(jù)計(jì)算出的頻率群的不等帶寬子帶的方差di,通過(guò)單參數(shù)雙門(mén)限法檢測(cè)語(yǔ)音信號(hào)的起止端點(diǎn)。

本發(fā)明利用人耳的聽(tīng)覺(jué)特性和頻帶方差對(duì)語(yǔ)音能量的起伏的敏感度來(lái)進(jìn)行語(yǔ)音端點(diǎn)的檢測(cè),方法簡(jiǎn)便,檢測(cè)的準(zhǔn)確率更高。

為了實(shí)現(xiàn)上述以及相關(guān)目的,本發(fā)明的一個(gè)或多個(gè)方面包括后面將詳細(xì)說(shuō)明的特征。下面的說(shuō)明以及附圖詳細(xì)說(shuō)明了本發(fā)明的某些示例性方面。然而,這些方面指示的僅僅是可使用本發(fā)明的原理的各種方式中的一些方式。此外,本發(fā)明旨在包括所有這些方面以及它們的等同物。

附圖說(shuō)明

通過(guò)參考以下結(jié)合附圖的說(shuō)明,并且隨著對(duì)本發(fā)明的更全面理解,本發(fā)明的其它目的及結(jié)果將更加明白及易于理解。在附圖中:

圖1為根據(jù)本發(fā)明實(shí)施示例的噪聲環(huán)境下語(yǔ)音端點(diǎn)的檢測(cè)方法的流程示意圖;

圖2為根據(jù)本發(fā)明實(shí)施示例的單參數(shù)雙門(mén)限端點(diǎn)檢測(cè)一級(jí)判決示意圖;

圖3為根據(jù)本發(fā)明實(shí)施示例的不等帶寬子帶方差端點(diǎn)檢測(cè)結(jié)果圖。

具體實(shí)施方式

本發(fā)明的整體思路為:語(yǔ)音與噪聲在頻譜域中的差別很大,一般有話段的能量會(huì)隨頻帶產(chǎn)生較大的變化,在共振峰處有較大的峰值,在其他的頻段能量較??;而噪聲段的能量數(shù)值相對(duì)較小,且在頻帶內(nèi)的分布較為均勻,即變相對(duì)平緩??筛鶕?jù)這個(gè)特性來(lái)辨別有有話段與噪聲段,產(chǎn)生的“頻帶方差”可以很好的檢測(cè)出語(yǔ)音的有話段。

圖1示出了根據(jù)本發(fā)明實(shí)施示例的噪聲環(huán)境下語(yǔ)音端點(diǎn)的檢測(cè)方法的流程。

如圖1所示,本發(fā)明提供的噪聲環(huán)境下語(yǔ)音端點(diǎn)的檢測(cè)方法,包括如下步驟:

步驟1:根據(jù)人耳的基底膜的聽(tīng)覺(jué)特性將20~22050hz的頻率范圍分成25個(gè)頻率群。

每個(gè)頻率群對(duì)應(yīng)一個(gè)不等帶寬子帶,且每個(gè)頻率群中的中心頻率、臨界帶寬、下限頻率和上限頻率分別代表一項(xiàng)參數(shù),且中心頻率、下限頻率和上限頻率被構(gòu)成一個(gè)3×25維的數(shù)組。如表1所示:

步驟2:計(jì)算與每個(gè)頻率群相對(duì)應(yīng)的不等帶寬子帶的方差di。

計(jì)算與每個(gè)頻率群相對(duì)應(yīng)的不等帶寬子帶的方差di的過(guò)程為:

步驟21:根據(jù)語(yǔ)音信號(hào)x(n)的采樣頻率fs,求出在(0~fs/2)頻率區(qū)間內(nèi)的不等帶寬子帶的數(shù)量q。

由于在0~22050hz的范圍內(nèi)有25個(gè)不等帶寬子帶,但一般采樣頻率可能極低,它只能含有少于25個(gè)不等帶寬子帶,例如語(yǔ)音信號(hào)的采樣頻率是8khz,通過(guò)比較可知,在4khz的范圍內(nèi)只有17個(gè)不等帶寬子帶,因此,在求取不等帶寬子帶方差時(shí),只需計(jì)算這17個(gè)子帶的方差即可,從而大幅度地減少計(jì)算量。

步驟22:對(duì)語(yǔ)音信號(hào)x(n)進(jìn)行加窗分幀處理得到第i幀的語(yǔ)音信號(hào)xi(m),經(jīng)快速傅氏變換后得到(n/2+1)條正頻率幅值譜線xi,xi={xi(1),xi(2),...,xi(n/2+1)},i=0,1,2,...,n為幀長(zhǎng)。

其中,xi(m)滿足:xi(m)=ω(m)*x(it+m)1≤m≤n。

步驟23:通過(guò)內(nèi)插的方法對(duì)(n/2+1)條正頻率幅值譜線xi進(jìn)行擴(kuò)展。

通過(guò)內(nèi)插的方法對(duì)對(duì)(n/2+1)條正頻率幅值譜線xi進(jìn)行擴(kuò)展的的目的在于為了更精確地計(jì)算不等帶寬子帶的方差值。以8khz的取樣頻率為例,在0~4khz的范圍內(nèi)包含有17個(gè)不等帶寬子帶,當(dāng)幀長(zhǎng)取為200時(shí),正頻率幅值譜線就有101條,頻率的分辨率是40hz,第1個(gè)不等帶寬子帶是20~100hz,在101條幅值譜線中第1~4條譜線所對(duì)應(yīng)的頻率分別是0hz、40hz、80hz、120hz,而第1個(gè)不等帶寬子帶只能讀取2~3條譜線,用兩條譜線計(jì)算方差肯定會(huì)產(chǎn)生較大的誤差。譜線擴(kuò)展是把頻率分辨率減小到1hz,這樣對(duì)第1個(gè)不等帶寬子帶就很容易地能夠包含有20~100hz的頻率分量,有81條譜線,用這些譜線來(lái)計(jì)算方差顯然要比只用兩條譜線計(jì)算方差會(huì)有更高的精度。

步驟24:計(jì)算每個(gè)不等帶寬子帶內(nèi)頻譜的平均幅值ei(j):

式中,fj,l——第j個(gè)不等帶寬子帶的低頻臨界帶寬;

fj,h——第j個(gè)不等帶寬子帶的高頻臨界帶寬。

步驟25:計(jì)算(0~fs/2)頻率區(qū)間內(nèi)q個(gè)不等帶寬子帶的均值計(jì)算公式為:

步驟26:根據(jù)與ei(j)計(jì)算q個(gè)不等帶寬子帶的方差di,計(jì)算公式為:

步驟3:根據(jù)計(jì)算出的頻率群的不等帶寬子帶的方差di,通過(guò)單參數(shù)雙門(mén)限法檢測(cè)語(yǔ)音信號(hào)的起止端點(diǎn)。

在根據(jù)計(jì)算出的頻率群的不等帶寬子帶的方差di,通過(guò)單參數(shù)雙門(mén)限法檢測(cè)語(yǔ)音信號(hào)的起止端點(diǎn)的過(guò)程中,包括如下步驟:

步驟31:根據(jù)語(yǔ)音信號(hào)的前導(dǎo)無(wú)話段計(jì)算噪聲段的平均方差值,并可設(shè)置閾值t1和t2。

步驟32:根據(jù)閾值t1和閾值t2通過(guò)單參數(shù)雙門(mén)限法檢測(cè)語(yǔ)音信號(hào)的起止位置。

當(dāng)di高于閾值t1時(shí),判斷為語(yǔ)音信號(hào)的起點(diǎn),當(dāng)di高于閾值t2時(shí),判斷為語(yǔ)音信號(hào)的端點(diǎn);其中,閾值t1和閾值t2取di的原始數(shù)據(jù)上的數(shù)值或取di的原始數(shù)據(jù)經(jīng)過(guò)平滑處理后的數(shù)值,在本發(fā)明中,閾值t1和閾值t2采用di原始數(shù)據(jù)上的值,且t1=0.01,t2=0.002。

更為具體地,單參數(shù)雙門(mén)限法采用短時(shí)平均能量和短時(shí)平均過(guò)零率對(duì)語(yǔ)音信號(hào)進(jìn)行端點(diǎn)檢測(cè)。

如圖2所示,第一級(jí)判決:首先根據(jù)短時(shí)能量包絡(luò)線選取一個(gè)較大的閾值t1進(jìn)行粗判,高于該閾值確定為語(yǔ)音信號(hào),語(yǔ)音信號(hào)的起止點(diǎn)位于該閾值與短時(shí)能量包絡(luò)交點(diǎn)所對(duì)應(yīng)時(shí)間點(diǎn)之外。在平均能量上確定一個(gè)較低的閾值t2,并從t1的交點(diǎn)分別往語(yǔ)音信號(hào)的兩端搜索,找到與t2的交點(diǎn)就是短時(shí)能量判定的語(yǔ)音信號(hào)起止點(diǎn)。

第二級(jí)判決:以短時(shí)過(guò)零率為準(zhǔn)向語(yǔ)音信號(hào)兩側(cè)尋找,找到低于設(shè)定過(guò)零率閾值的點(diǎn)即為語(yǔ)音信號(hào)的起止點(diǎn)。

根據(jù)兩級(jí)判決的結(jié)果各取起點(diǎn)和終點(diǎn)的中間值作為語(yǔ)音信號(hào)最后的起止點(diǎn),語(yǔ)音信號(hào)端點(diǎn)的最終檢測(cè)結(jié)果如圖3所示。

以上所述,僅為本發(fā)明的具體實(shí)施方式,但本發(fā)明的保護(hù)范圍并不局限于此,任何熟悉本技術(shù)領(lǐng)域的技術(shù)人員在本發(fā)明揭露的技術(shù)范圍內(nèi),可輕易想到變化或替換,都應(yīng)涵蓋在本發(fā)明的保護(hù)范圍之內(nèi)。因此,本發(fā)明的保護(hù)范圍應(yīng)所述以權(quán)利要求的保護(hù)范圍為準(zhǔn)。

當(dāng)前第1頁(yè)1 2 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
乌鲁木齐市| 兴隆县| 谢通门县| 平邑县| 炎陵县| 杭锦后旗| 祁阳县| 会宁县| 油尖旺区| 策勒县| 上林县| 出国| 宝清县| 砚山县| 裕民县| 荥经县| 贺兰县| 云和县| 绥阳县| 德昌县| 文山县| 苍溪县| 吉首市| 大同市| 仁寿县| 延川县| 盐源县| 沧源| 西盟| 清河县| 瑞安市| 梅州市| 厦门市| 中卫市| 耿马| 安阳市| 长白| 平度市| 积石山| 鄂托克旗| 五原县|