欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

基于時域和頻域的語音活性檢測方法和設(shè)備的制作方法

文檔序號:2828017閱讀:176來源:國知局
基于時域和頻域的語音活性檢測方法和設(shè)備的制作方法
【專利摘要】本發(fā)明公開了一種基于時域和頻域的語音活性檢測方法和設(shè)備。該方法包括:估計語音信號的噪聲能量;向輸入的語音信號中加入白噪聲;對加入白噪聲后的語音信號進行分幀處理;確定每幀的短時能量值;確定每幀的諧波乘積譜值;以及針對每一幀,根據(jù)該幀的短時能量值和該幀的諧波乘積譜值來確定該幀是否為語音幀,并得出所述語音信號中所包含的語音片段。本發(fā)明提供的語音活性檢測方法和設(shè)備,結(jié)合了時域分析與頻域分析方法,針對實際情況具有更好的適應(yīng)性,在背景噪聲為人聲以及信噪比較低等情況下也有很好的表現(xiàn),并且該方法實現(xiàn)簡單、精巧,很容易嵌入各類語音系統(tǒng)中。
【專利說明】基于時域和頻域的語音活性檢測方法和設(shè)備

【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及語音活性檢測領(lǐng)域,具體地,涉及一種基于時域和頻域的語音活性檢測方法和設(shè)備。

【背景技術(shù)】
[0002]語音活性檢測(Voice Activity Detect1n,VAD)是一種用于檢測語音信號是否存在的語音處理技術(shù)。語音活性檢測技術(shù)主要用于語音識別、語音編碼等,其能夠區(qū)別出靜音、語音片段,為后續(xù)針對語音信號的進一步處理作鋪墊。語音活性檢測模塊也是很多語音通信系統(tǒng)中不可或缺的部分,如音頻會議、語音識別、回聲消除、IP電話等。針對語音識別系統(tǒng)來說,語音活性檢測模塊的準確度會極大影響到后續(xù)的特征提取、模型建立及判決等工作,因此,提供高效、魯棒性高的語音活性檢測顯得尤為重要。
[0003]現(xiàn)有的語音活性檢測技術(shù)有很多種,如基于短時能量、短時過零率的時域分析方法,也有基于倒譜頻率、線性預(yù)測編碼(LPC)系數(shù)等的頻域分析方法。這些方法各有優(yōu)勢,各自利用不同的特性來區(qū)分語音與噪聲。然而,在實際使用中,經(jīng)常出現(xiàn)較低信噪比、背景噪聲也為人聲等等情況,此時使用傳統(tǒng)的方法難以得到足夠準確的結(jié)果。


【發(fā)明內(nèi)容】

[0004]本發(fā)明的目的是提供一種能夠提高語音活性檢測結(jié)果的準確度(特別是在信噪比較低、或者背景噪聲為人聲的情況下)的基于時域和頻域的語音活性檢測方法和設(shè)備。
[0005]為了實現(xiàn)上述目的,本發(fā)明提供一種基于時域和頻域的語音活性檢測方法。該方法包括:向輸入的語音信號中加入白噪聲;對加入白噪聲后的語音信號進行分幀處理;確定每幀的短時能量值;確定每幀的諧波乘積譜值;以及針對每一幀,根據(jù)該幀的短時能量值和該幀的諧波乘積譜值來確定該幀是否為語音幀,并得出所述語音信號中所包含的語音片段。
[0006]優(yōu)選地,該方法還包括:在向所述輸入的語音信號中加入所述白噪聲之前,估計所述語音信號的噪聲能量;以及根據(jù)所估計的噪聲能量來確定要加入的白躁聲的比例;以及向所述輸入的語音信號中加入所述白噪聲是按照所確定的比例進行的。
[0007]優(yōu)選地,對所述語音信號的噪聲能量的所述估計是動態(tài)進行的。
[0008]優(yōu)選地,所述白噪聲為高斯白噪聲。
[0009]優(yōu)選地,確定所述每幀的諧波乘積譜值的步驟包括:對所述加入白噪聲后的語音信號進行規(guī)范化;獲取每幀的頻域信息;以及根據(jù)所述每幀的頻域信息來確定所述每幀的諧波乘積譜值。
[0010]優(yōu)選地,通過以下方式來確定所述幀是否為語音幀:在所述幀的短時能量值大于或等于第一閾值、并且所述幀的諧波乘積譜值大于或等于第二閾值的情況下,確定所述幀為所述語音幀。
[0011]優(yōu)選地,通過以下方式來確定所述幀是否為語音幀:利用預(yù)先建立的分類模型、根據(jù)所述幀的短時能量值和所述幀的諧波乘積譜值來對所述幀進行分類,以確定所述幀是否為所述語音幀。
[0012]本發(fā)明還提供一種基于時域和頻域的語音活性檢測設(shè)備。該設(shè)備包括:用于向輸入的語音信號中加入白噪聲的裝置;用于對加入白噪聲后的語音信號進行分幀處理的裝置;用于確定每幀的短時能量值的裝置;用于確定每幀的諧波乘積譜值的裝置;以及用于針對每一幀,根據(jù)該幀的短時能量值和該幀的諧波乘積譜值來確定該幀是否為語音幀,并得出所述語音信號中所包含的語音片段的裝置。
[0013]優(yōu)選地,該設(shè)備還包括:用于在向所述輸入的語音信號中加入所述白噪聲之前,估計所述語音信號的噪聲能量的裝置;以及用于根據(jù)所估計的噪聲能量來確定要加入的白躁聲的比例的裝置;以及向所述輸入的語音信號中加入所述白噪聲是按照所確定的比例進行的。
[0014]優(yōu)選地,對所述語音信號的噪聲能量的所述估計是動態(tài)進行的。
[0015]優(yōu)選地,所述白噪聲為高斯白噪聲。
[0016]優(yōu)選地,用于確定所述每幀的諧波乘積譜值的裝置包括:用于對所述加入白噪聲后的語音信號進行規(guī)范化的裝置;用于獲取每幀的頻域信息的裝置;以及用于根據(jù)所述每幀的頻域信息來確定所述每幀的諧波乘積譜值的裝置。
[0017]優(yōu)選地,通過以下方式來確定所述幀是否為語音幀:在所述幀的短時能量值大于或等于第一閾值、并且所述幀的諧波乘積譜值大于或等于第二閾值的情況下,確定所述幀為所述語音幀。
[0018]優(yōu)選地,通過以下方式來確定所述幀是否為語音幀:利用預(yù)先建立的分類模型、根據(jù)所述幀的短時能量值和所述幀的諧波乘積譜值來對所述幀進行分類,以確定所述幀是否為所述語音幀。
[0019]在上述技術(shù)方案中,通過在原有的語音信號中混入一定比例的白噪聲,可以有效減小原有的語音信號中包含的噪聲片段對語音活性檢測的影響。并且,在背景噪聲為人聲的情況下,通過混入白噪聲,可以在一定程度上抹平這些為人聲的背景噪聲的諧波結(jié)構(gòu),從而避免這些背景噪聲對語音活性檢測結(jié)果的影響。通過短時能量值與諧波乘積譜值這兩項參數(shù)來共同確定語音信號中包含的語音片段,相比于僅依靠單一參數(shù)來進行判決,可以提高準確性。特別是在背景噪聲為人聲的情況下,雖然這些噪聲可能具有諧波結(jié)構(gòu),但它們的短時能量值較低,因此,通過本發(fā)明提供的語音活性檢測方法可以有效地區(qū)分出這些為人聲的背景噪聲和真實的語音片段。本發(fā)明提供的語音活性檢測方法和設(shè)備,結(jié)合了時域分析與頻域分析方法,針對實際情況具有更好的適應(yīng)性,在背景噪聲為人聲以及信噪比較低等情況下也有很好的表現(xiàn),并且該方法實現(xiàn)簡單、精巧,很容易嵌入各類語音系統(tǒng)中。
[0020]本發(fā)明的其他特征和優(yōu)點將在隨后的【具體實施方式】部分予以詳細說明。

【專利附圖】

【附圖說明】
[0021]附圖是用來提供對本發(fā)明的進一步理解,并且構(gòu)成說明書的一部分,與下面的【具體實施方式】一起用于解釋本發(fā)明,但并不構(gòu)成對本發(fā)明的限制。在附圖中:
[0022]圖1示出了根據(jù)本發(fā)明的實施方式的基于時域和頻域的語音活性檢測方法的流程圖;
[0023]圖2示出了根據(jù)本發(fā)明的另一實施方式的基于時域和頻域的語音活性檢測方法的流程圖;以及
[0024]圖3是根據(jù)本發(fā)明的實施方式的確定諧波乘積譜值的方法的流程圖。

【具體實施方式】
[0025]以下結(jié)合附圖對本發(fā)明的【具體實施方式】進行詳細說明。應(yīng)當理解的是,此處所描述的【具體實施方式】僅用于說明和解釋本發(fā)明,并不用于限制本發(fā)明。
[0026]圖1示出了根據(jù)本發(fā)明的實施方式的基于時域和頻域的語音活性檢測方法的流程圖。如圖1所示,該方法可以包括:步驟S101,向輸入的語音信號中加入白噪聲;步驟S102,對加入白噪聲后的語音信號進行分幀處理;步驟S103,確定每幀的短時能量值;步驟S104,確定每幀的諧波乘積譜值;以及步驟S105,針對每一幀,根據(jù)該幀的短時能量值和該幀的諧波乘積譜值來確定該幀是否為語音幀,并得出所述語音信號中所包含的語音片段。在本發(fā)明的一個示例實施方式中,所述白噪聲可以例如為高斯白噪聲。但是應(yīng)當理解的是,其他類型的白噪聲也適用于本發(fā)明。
[0027]具體地,在步驟S101,主動向輸入的語音信號中加入白噪聲。所加入的白噪聲的比例可以根據(jù)經(jīng)驗來設(shè)定??商鎿Q地,在本發(fā)明提供的一個優(yōu)選實施方式中,該比例可以根據(jù)輸入的語音信號的噪聲能量來設(shè)定。
[0028]在根據(jù)輸入的語音信號的噪聲能量來確定加入的白噪聲的比例的情況下,如圖2所示,本發(fā)明提供的語音活性檢測方法還可以包括:步驟S106,在向所述輸入的語音信號中加入所述白噪聲(即,步驟S101)之前,估計所述語音信號的噪聲能量;之后,步驟S107,根據(jù)所估計的噪聲能量來確定要加入的白躁聲的比例。在這種情況下,在步驟S101中,向所述輸入的語音信號中加入所述白噪聲是按照所確定的比例進行的。
[0029]對噪聲能量進行估計,可以預(yù)判出該語音信號中包含的噪聲情況,為確定應(yīng)當在步驟S101中向該語音信號中加入多少比例的白噪聲提供依據(jù)。如上所述,要加入的白躁聲的比例可以基于所估計出的噪聲能量來確定。例如,如果原有的語音信號的信噪比較高,那么可以在所估計出的噪聲能量相對高時,加入更多比例的白噪聲。這樣,可以有效減小原有的語音信號中包含的噪聲片段對語音活性檢測的影響,并且不影響原有的語音信號中包含的語音片段。而在原有的語音信號的信噪比較低的情況下,可以在該語音信號中加入較小比例的白噪聲,以避免對語音活性檢測造成干擾。
[0030]接下來,在步驟S102,對加入白噪聲后的語音信號進行分幀處理,其中,每幀長度可以例如為20?30ms。該步驟的實施對于本領(lǐng)域的技術(shù)人員而言是公知的,因此,本發(fā)明在此不進行贅述。
[0031]接下來,在步驟S103,確定每幀的短時能量值。短時能量值能夠反映語音信號的時域特性。通常情況下,語音和噪聲的區(qū)別可以體現(xiàn)在它們的短時能量上,語音段的短時能量比噪聲段的短時能量大。因此,本發(fā)明采用短時能量值作為判決某一幀是否為語音幀的一個依據(jù)。應(yīng)當理解的是,短時能量值的計算方法是公知的,本領(lǐng)域的技術(shù)人員能夠采用公知的任何短時能量值計算方法來計算出某一幀的短時能量值。
[0032]除了確定出每幀的短時能量值之外,在步驟S104,還確定每幀的諧波乘積譜(Harmonic Product Spectrum,HPS)值。諧波乘積譜值能夠反映語音信號的頻域特性。諧波乘積譜值的大小能夠作為判斷某一信號幀是否具有諧波結(jié)構(gòu)的依據(jù)。通常情況下,語音段具有諧波結(jié)構(gòu),而噪聲段不具有諧波結(jié)構(gòu)。因此,通過諧波乘積譜值的大小來判斷信號是否具有諧波結(jié)構(gòu),可以確定出該信號是語音還是噪聲。不過在背景噪聲為人聲的情況下,該背景噪聲也可能會表現(xiàn)出具有諧波結(jié)構(gòu),從而對語音活性檢測結(jié)果產(chǎn)生誤導(dǎo)。然而,在本發(fā)明中,由于在步驟S101中在原有的語音信號中加入了白噪聲,所加入的白噪聲可以在一定程度上抹平這些為人聲的背景噪聲的諧波結(jié)構(gòu),從而降低其對檢測結(jié)果的影響。
[0033]在本發(fā)明的一個示例實施方式中,如圖3所示,確定所述每幀的諧波乘積譜值的步驟S104可以包括:步驟S1041,對所述加入白噪聲后的語音信號進行規(guī)范化。針對離線處理情況,由于語音信號完整已知,因此,可以對語音信號做整體的規(guī)范化。而針對在線處理情況,由于語音信號是實時的,因此,只能對語音信號做局部的規(guī)范化處理,并不斷進行更新。在本發(fā)明中,可以采用本領(lǐng)域的技術(shù)人員公知的零-均值規(guī)范化方法對加入白噪聲后的語音信號進行規(guī)范化。但是能夠理解的是,其余規(guī)范化方法同樣適用于本發(fā)明。
[0034]之后,在步驟S1042,獲取每幀的頻域信息。在本發(fā)明中,可以利用快速傅氏變換(FFT)算法來獲取每幀的頻域信息。但是應(yīng)當理解的是,其余獲取頻域信息的方法也適用于本發(fā)明。最后,在步驟S1043,根據(jù)所述每幀的頻域信息來確定所述每幀的諧波乘積譜值。應(yīng)當理解的是,根據(jù)所述每幀的頻域信息來確定所述每幀的諧波乘積譜值的方法是本領(lǐng)域的技術(shù)人員公知的,因此,本發(fā)明在此不進行贅述。
[0035]在確定出每幀的短時能量值和諧波乘積譜值之后,在步驟S105,針對每一幀,根據(jù)該幀的短時能量值和該幀的諧波乘積譜值來共同確定該幀是否為語音幀,并得出所述語音信號中所包含的語音片段。
[0036]可以通過多種方式來根據(jù)幀的短時能量值和幀的諧波乘積譜值共同確定該幀是否為語音幀。例如,如前所述,通常情況下,語音段表現(xiàn)為具有高短時能量值和諧波結(jié)構(gòu)。因此,在一種示例實施方式中,可以在所述幀的短時能量值大于或等于第一閾值(可以根據(jù)經(jīng)驗設(shè)定或經(jīng)實驗得出)、并且所述幀的諧波乘積譜值大于或等于第二閾值(可以根據(jù)經(jīng)驗設(shè)定或經(jīng)實驗得出)的情況下,確定所述幀為所述語音幀。
[0037]可替換地,可以首先利用已知的樣本數(shù)據(jù)(每個樣本數(shù)據(jù)可以包括幀的短時能量值、幀的諧波乘積譜值和對應(yīng)的幀類型)來預(yù)先建立分類模型。之后,對于新輸入的信號幀,可以利用該預(yù)先建立好的分類模型、根據(jù)所述幀的短時能量值和所述幀的諧波乘積譜值來對所述幀進行分類,以確定所述幀是否為所述語音幀。
[0038]采用上述兩種方式均可以實現(xiàn)語音幀的判決。但是應(yīng)當理解的是,其余判決方式也適用于本發(fā)明。在確定出所述語音幀之后,就可以得出原有的語音信號中所包含的語音片段(該語音片段由被判決為是語音幀的信號形成)。
[0039]通過短時能量值與諧波乘積譜值這兩項參數(shù)來共同確定語音信號中包含的語音片段,相比于僅依靠單一參數(shù)來進行判決,可以提高準確性。特別是在背景噪聲為人聲的情況下,雖然這些噪聲可能具有諧波結(jié)構(gòu),但它們的短時能量值較低,因此,通過本發(fā)明提供的語音活性檢測方法可以有效地區(qū)分出這些為人聲的背景噪聲和真實的語音片段,從而保證語音活性檢測結(jié)果正確。
[0040]在本發(fā)明的一個優(yōu)選的實施方式中,在步驟S106中,對所述語音信號的噪聲能量的估計可以動態(tài)進行。并且,在步驟S101中加入的白噪聲的比例可以基于動態(tài)估計出的噪聲能量來調(diào)整。由此,可以實現(xiàn)噪聲能量的動態(tài)跟蹤,以及混入的白噪聲的比例的實時調(diào)整。這樣,可以增強語音活性檢測對環(huán)境變化的感知能力,并且大幅提高在環(huán)境條件發(fā)生變化下語音活性檢測的魯棒性。
[0041]本發(fā)明還提供一種基于時域和頻域的語音活性檢測設(shè)備。該設(shè)備可以包括:用于向輸入的語音信號中加入白噪聲的裝置;用于對加入白噪聲后的語音信號進行分幀處理的裝置;用于確定每幀的短時能量值的裝置;用于確定每幀的諧波乘積譜值的裝置;以及用于針對每一幀,根據(jù)該幀的短時能量值和該幀的諧波乘積譜值來確定該幀是否為語音幀,并得出所述語音信號中所包含的語音片段的裝置。其中,所述白噪聲可以例如為高斯白噪聲。
[0042]該設(shè)備還可以包括:用于在向所述輸入的語音信號中加入所述白噪聲之前,估計所述語音信號的噪聲能量的裝置;以及用于根據(jù)所估計的噪聲能量來確定要加入的白躁聲的比例的裝置;以及向所述輸入的語音信號中加入所述白噪聲是按照所確定的比例進行的。
[0043]在本發(fā)明的一個優(yōu)選的實施方式中,對所述語音信號的噪聲能量的所述估計可以是動態(tài)進行的。
[0044]用于確定所述每幀的諧波乘積譜值的裝置可以包括:用于對所述加入白噪聲后的語音信號進行規(guī)范化的裝置;用于獲取每幀的頻域信息的裝置;以及用于根據(jù)所述每幀的頻域信息來確定所述每幀的諧波乘積譜值的裝置。
[0045]可以通過以下方式來確定所述幀是否為語音幀:在所述幀的短時能量值大于或等于第一閾值、并且所述幀的諧波乘積譜值大于或等于第二閾值的情況下,確定所述幀為所述語音幀??商鎿Q地,可以通過以下方式來確定所述幀是否為語音幀:利用預(yù)先建立的分類模型、根據(jù)所述幀的短時能量值和所述幀的諧波乘積譜值來對所述幀進行分類,以確定所述幀是否為所述語音幀。
[0046]綜上所述,在本發(fā)明提供的基于時域和頻域的語音活性檢測方法和設(shè)備中,通過在原有的語音信號中混入一定比例的白噪聲,可以有效減小原有的語音信號中包含的噪聲片段對語音活性檢測的影響。并且,在背景噪聲為人聲的情況下,通過混入白噪聲,可以在一定程度上抹平這些為人聲的背景噪聲的諧波結(jié)構(gòu),從而避免這些背景噪聲對語音活性檢測結(jié)果的影響。通過短時能量值與諧波乘積譜值這兩項參數(shù)來共同確定語音信號中包含的語音片段,相比于僅依靠單一參數(shù)來進行判決,可以提高準確性。特別是在背景噪聲為人聲的情況下,雖然這些噪聲可能具有諧波結(jié)構(gòu),但它們的短時能量值較低,因此,通過本發(fā)明提供的語音活性檢測方法可以有效地區(qū)分出這些為人聲的背景噪聲和真實的語音片段。本發(fā)明提供的語音活性檢測方法和設(shè)備,結(jié)合了時域分析與頻域分析方法,針對實際情況具有更好的適應(yīng)性,在背景噪聲為人聲以及信噪比較低等情況下也有很好的表現(xiàn),并且該方法實現(xiàn)簡單、精巧,很容易嵌入各類語音系統(tǒng)中。
[0047]以上結(jié)合附圖詳細描述了本發(fā)明的優(yōu)選實施方式,但是,本發(fā)明并不限于上述實施方式中的具體細節(jié),在本發(fā)明的技術(shù)構(gòu)思范圍內(nèi),可以對本發(fā)明的技術(shù)方案進行多種簡單變型,這些簡單變型均屬于本發(fā)明的保護范圍。
[0048]另外需要說明的是,在上述【具體實施方式】中所描述的各個具體技術(shù)特征,在不矛盾的情況下,可以通過任何合適的方式進行組合。為了避免不必要的重復(fù),本發(fā)明對各種可能的組合方式不再另行說明。
[0049]此外,本發(fā)明的各種不同的實施方式之間也可以進行任意組合,只要其不違背本發(fā)明的思想,其同樣應(yīng)當視為本發(fā)明所公開的內(nèi)容。
【權(quán)利要求】
1.一種基于時域和頻域的語音活性檢測方法,其特征在于,該方法包括: 向輸入的語音信號中加入白噪聲; 對加入白噪聲后的語音信號進行分幀處理; 確定每幀的短時能量值; 確定每幀的諧波乘積譜值;以及 針對每一幀,根據(jù)該幀的短時能量值和該幀的諧波乘積譜值來確定該幀是否為語音幀,并得出所述語音信號中所包含的語音片段。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,該方法還包括:在向所述輸入的語音信號中加入所述白噪聲之前,估計所述語音信號的噪聲能量;以及根據(jù)所估計的噪聲能量來確定要加入的白躁聲的比例;以及, 向所述輸入的語音信號中加入所述白噪聲是按照所確定的比例進行的。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,對所述語音信號的噪聲能量的所述估計是動態(tài)進行的。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述白噪聲為高斯白噪聲。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,確定所述每幀的諧波乘積譜值的步驟包括: 對所述加入白噪聲后的語音信號進行規(guī)范化; 獲取每幀的頻域信息;以及 根據(jù)所述每幀的頻域信息來確定所述每幀的諧波乘積譜值。
6.根據(jù)權(quán)利要求1-5中任一權(quán)利要求所述的方法,其特征在于,通過以下方式來確定所述幀是否為語音幀: 在所述幀的短時能量值大于或等于第一閾值、并且所述幀的諧波乘積譜值大于或等于第二閾值的情況下,確定所述幀為所述語音幀。
7.根據(jù)權(quán)利要求1-5中任一權(quán)利要求所述的方法,其特征在于,通過以下方式來確定所述幀是否為語音幀: 利用預(yù)先建立的分類模型、根據(jù)所述幀的短時能量值和所述幀的諧波乘積譜值來對所述幀進行分類,以確定所述幀是否為所述語音幀。
8.一種基于時域和頻域的語音活性檢測設(shè)備,其特征在于,該設(shè)備包括: 用于向輸入的語音信號中加入白噪聲的裝置; 用于對加入白噪聲后的語音信號進行分幀處理的裝置; 用于確定每幀的短時能量值的裝置; 用于確定每幀的諧波乘積譜值的裝置;以及 用于針對每一幀,根據(jù)該幀的短時能量值和該幀的諧波乘積譜值來確定該幀是否為語音幀,并得出所述語音信號中所包含的語音片段的裝置。
9.根據(jù)權(quán)利要求8所述的設(shè)備,其特征在于,該設(shè)備還包括:用于在向所述輸入的語音信號中加入所述白噪聲之前,估計所述語音信號的噪聲能量的裝置;以及用于根據(jù)所估計的噪聲能量來確定要加入的白躁聲的比例的裝置;以及, 向所述輸入的語音信號中加入所述白噪聲是按照所確定的比例進行的。
10.根據(jù)權(quán)利要求9所述的設(shè)備,其特征在于,對所述語音信號的噪聲能量的所述估計是動態(tài)進行的。
11.根據(jù)權(quán)利要求8所述的設(shè)備,其特征在于,所述白噪聲為高斯白噪聲。
12.根據(jù)權(quán)利要求8所述的設(shè)備,其特征在于,用于確定所述每幀的諧波乘積譜值的裝置包括: 用于對所述加入白噪聲后的語音信號進行規(guī)范化的裝置; 用于獲取每幀的頻域信息的裝置;以及 用于根據(jù)所述每幀的頻域信息來確定所述每幀的諧波乘積譜值的裝置。
13.根據(jù)權(quán)利要求8-12中任一權(quán)利要求所述的設(shè)備,其特征在于,通過以下方式來確定所述幀是否為語音幀: 在所述幀的短時能量值大于或等于第一閾值、并且所述幀的諧波乘積譜值大于或等于第二閾值的情況下,確定所述幀為所述語音幀。
14.根據(jù)權(quán)利要求8-12中任一權(quán)利要求所述的設(shè)備,其特征在于,通過以下方式來確定所述幀是否為語音幀: 利用預(yù)先建立的分類模型、根據(jù)所述幀的短時能量值和所述幀的諧波乘積譜值來對所述幀進行分類,以確定所述幀是否為所述語音幀。
【文檔編號】G10L15/04GK104464722SQ201410641920
【公開日】2015年3月25日 申請日期:2014年11月13日 優(yōu)先權(quán)日:2014年11月13日
【發(fā)明者】關(guān)海欣 申請人:北京云知聲信息技術(shù)有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
南华县| 凌云县| 江西省| 岱山县| 重庆市| 如东县| 民乐县| 顺昌县| 英超| 龙陵县| 筠连县| 桐乡市| 英吉沙县| 临朐县| 伽师县| 苏尼特左旗| 句容市| 阿合奇县| 安庆市| 白朗县| 佛学| 广平县| 都匀市| 玛纳斯县| 搜索| 银川市| 油尖旺区| 乡宁县| 天峨县| 巢湖市| 班戈县| 海门市| 双江| 和龙市| 托里县| 女性| 越西县| 博罗县| 三明市| 阳泉市| 曲阜市|