提取語音信號(hào)的特性信息的語音信號(hào)預(yù)處理系統(tǒng)及方法

文檔序號(hào)：2837181閱讀：771來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專利名稱：提取語音信號(hào)的特性信息的語音信號(hào)預(yù)處理系統(tǒng)及方法
技術(shù)領(lǐng)域：
本發(fā)明總體上涉及一種語音信號(hào)識(shí)別系統(tǒng)，具體地說，涉及一種提取語音信號(hào)的特性信息的語音信號(hào)預(yù)處理系統(tǒng)。
背景技術(shù)：
通常，語音信號(hào)預(yù)處理對(duì)于根據(jù)語音信號(hào)的頻譜消除語音信號(hào)的噪聲和提取語音信號(hào)的特性信息是非常重要的處理，所述語音信號(hào)的特性諸如包絡(luò)、基音、濁音/清音等，所述特性可用于下一階段的語音信號(hào)處理系統(tǒng)(包括所有語音相關(guān)的系統(tǒng)，諸如編碼器/解碼器(編解碼器)、合成、識(shí)別等)。
用于提取根據(jù)下一階段的語音信號(hào)處理系統(tǒng)的需要而指定的語音信號(hào)的特性信息的系統(tǒng)通?？杀粦?yīng)用于執(zhí)行語音信號(hào)預(yù)處理的語音信號(hào)預(yù)處理系統(tǒng)。語音信號(hào)預(yù)處理系統(tǒng)的示例是用于提取語音信號(hào)的特性信息的預(yù)處理系統(tǒng)，所述系統(tǒng)基于在碼激勵(lì)線性預(yù)測(CELP)系列編解碼器中經(jīng)常使用的線性預(yù)測(LP)。
這種傳統(tǒng)的語音信號(hào)預(yù)處理系統(tǒng)使用LP分析方法來檢測語音信號(hào)并提取檢測的語音信號(hào)的特性信息。使用LP分析方法，通過僅使用參數(shù)表示語音信號(hào)的特性信息可減少計(jì)算量。LP分析方法通過使用過去的語音信號(hào)樣本從線性集假定當(dāng)前樣本，來從過去樣本值估計(jì)當(dāng)前值。這種傳統(tǒng)LP分析方法具有下面的優(yōu)點(diǎn)可使用較少的參數(shù)表示語音信號(hào)的波形和頻譜，并且可通過簡單計(jì)算提取這些參數(shù)。
然而，因?yàn)槭褂脗鹘y(tǒng)LP分析方法的語音信號(hào)預(yù)處理系統(tǒng)包括用于提供諸如語音信號(hào)的基音、頻譜、濁音/清音等特性的各個(gè)系統(tǒng)，所以如果下一階段的語音信號(hào)處理系統(tǒng)被改變，則語音信號(hào)預(yù)處理系統(tǒng)也應(yīng)該被改變。

發(fā)明內(nèi)容
本發(fā)明的目的在于實(shí)質(zhì)上至少解決上述問題和/或缺點(diǎn)，并至少提供下述優(yōu)點(diǎn)。因此，本發(fā)明的目的在于提供一種提取語音信號(hào)的特性信息的語音信號(hào)預(yù)處理系統(tǒng)和方法，從而可通過合成地提取語音信號(hào)的特性信息來選擇性地提供由各種語音信號(hào)處理系統(tǒng)請(qǐng)求的語音信號(hào)的特性。
根據(jù)本發(fā)明的一方面，提供一種語音信號(hào)預(yù)處理系統(tǒng)，所述系統(tǒng)包括語音信號(hào)識(shí)別單元，用于從輸入信號(hào)中識(shí)別語音，并且輸出所述輸入信號(hào)作為語音信號(hào)；語音信號(hào)轉(zhuǎn)換器，用于通過接收語音信號(hào)并且將接收的時(shí)域的語音信號(hào)轉(zhuǎn)換為頻域的語音信號(hào)，來產(chǎn)生語音信號(hào)幀；形態(tài)學(xué)分析器，用于接收語音信號(hào)幀，并且通過形態(tài)學(xué)運(yùn)算產(chǎn)生具有基于形態(tài)學(xué)分析的信號(hào)波形的特性頻率區(qū)域；語音信號(hào)特性信息提取器，用于接收語音信號(hào)幀或基于形態(tài)學(xué)分析的特性頻率區(qū)域，并且提取下一階段的語音信號(hào)處理系統(tǒng)請(qǐng)求的語音信號(hào)特性信息；以及控制器，用于根據(jù)預(yù)設(shè)確定條件確定是否使用語音信號(hào)幀的諧波峰值提取語音信號(hào)的特性信息，并且當(dāng)使用諧波峰值時(shí)通過將語音信號(hào)幀輸出到語音信號(hào)特性信息提取器或者當(dāng)不使用諧波峰值時(shí)通過輸出語音信號(hào)幀的基于形態(tài)學(xué)分析的特性頻率區(qū)域，來提取語音信號(hào)處理系統(tǒng)請(qǐng)求的語音信號(hào)特性信息。
根據(jù)本發(fā)明的另一方面，提供一種提取語音信號(hào)的特性信息的方法，所述方法包括通過從輸入信號(hào)中識(shí)別語音，提取所述語音，將接收的時(shí)域的語音信號(hào)轉(zhuǎn)換為頻域的語音信號(hào)，并且輸出語音信號(hào)，從而產(chǎn)生語音信號(hào)幀；根據(jù)預(yù)設(shè)確定條件確定是否使用語音信號(hào)幀的諧波峰值提取語音信號(hào)的特性信息；根據(jù)諧波峰值使用確定結(jié)果執(zhí)行語音信號(hào)幀的形態(tài)學(xué)分析，并根據(jù)形態(tài)學(xué)分析結(jié)果提取特性頻率區(qū)域；根據(jù)諧波峰值使用確定結(jié)果使用語音信號(hào)幀的特性頻率區(qū)域來提取下一階段的語音信號(hào)處理系統(tǒng)請(qǐng)求的語音信號(hào)特性信息；以及將提取的語音信號(hào)特性信息輸出到語音信號(hào)處理系統(tǒng)。

通過下面結(jié)合附圖進(jìn)行的詳細(xì)描述，本發(fā)明的上述和其它目的、特點(diǎn)和優(yōu)點(diǎn)將會(huì)變得更加清楚，其中圖1是根據(jù)本發(fā)明的語音信號(hào)預(yù)處理系統(tǒng)的框圖；圖2是根據(jù)本發(fā)明的根據(jù)語音信號(hào)預(yù)處理系統(tǒng)的形態(tài)學(xué)分析結(jié)果輸出的語音信號(hào)的波形圖(a)和(b)；圖3是示出根據(jù)本發(fā)明的在語音信號(hào)預(yù)處理系統(tǒng)中使用諧波峰值或形態(tài)學(xué)分析方案輸出語音信號(hào)的特性信息的處理的流程圖；圖4是示出根據(jù)本發(fā)明的在語音信號(hào)預(yù)處理系統(tǒng)中根據(jù)語音信號(hào)處理系統(tǒng)請(qǐng)求的信息輸出語音信號(hào)特性的處理的流程圖；圖5是示出根據(jù)本發(fā)明的在語音信號(hào)預(yù)處理系統(tǒng)中使用諧波峰值提取語音信號(hào)的包絡(luò)信息的處理的流程圖；圖6A至圖6C是用于解釋根據(jù)本發(fā)明的如何獲得次要諧波峰值的參考圖；圖7是示出根據(jù)本發(fā)明的在語音信號(hào)預(yù)處理系統(tǒng)中使用諧波峰值確定語音信號(hào)是濁音還是清音的處理的流程圖；圖8是示出根據(jù)本發(fā)明的在圖7所示的處理中使用第二神經(jīng)網(wǎng)絡(luò)的情況的流程圖；圖9是示出根據(jù)本發(fā)明的語音信號(hào)預(yù)處理系統(tǒng)的形態(tài)學(xué)分析處理的流程圖，其中，使用形態(tài)學(xué)運(yùn)算分析輸入語音信號(hào)；圖10是示出根據(jù)本發(fā)明的在圖9所示的處理中確定用于形態(tài)學(xué)分析的最佳結(jié)構(gòu)組尺寸(SSS)的處理的流程圖；圖11是示出根據(jù)本發(fā)明的在語音信號(hào)預(yù)處理系統(tǒng)中使用根據(jù)形態(tài)學(xué)分析結(jié)果輸出的信號(hào)波形來提取語音信號(hào)的特性信息的處理的流程圖；圖12是示出根據(jù)本發(fā)明的在語音信號(hào)預(yù)處理系統(tǒng)中使用根據(jù)形態(tài)學(xué)分析結(jié)果輸出的信號(hào)波形來提取語音信號(hào)的包絡(luò)信息的處理的流程圖；圖13是示出根據(jù)本發(fā)明的在語音信號(hào)預(yù)處理系統(tǒng)中使用根據(jù)形態(tài)學(xué)分析結(jié)果輸出的信號(hào)波形來確定語音信號(hào)是濁音還是清音的處理的流程圖；以及圖14是示出根據(jù)本發(fā)明的在圖13所示的處理中使用第二神經(jīng)網(wǎng)絡(luò)的情況的流程圖。
具體實(shí)施例方式
將參照下面的附圖來在此描述本發(fā)明的優(yōu)選實(shí)施例。盡管相同和相似的部件在不同的附圖中描述，但是它們始終用相同的標(biāo)號(hào)表示。在下面的描述中，因?yàn)楣墓δ芎徒Y(jié)構(gòu)可能在不必要的細(xì)節(jié)上使本發(fā)明模糊，所以省略了其詳細(xì)描述。
現(xiàn)將首先描述基本原理以全面理解本發(fā)明。在根據(jù)本發(fā)明的語音信號(hào)預(yù)處理系統(tǒng)中，確定是否使用諧波峰值提取輸入語音信號(hào)的特性信息?？筛鶕?jù)下一階段的語音信號(hào)處理系統(tǒng)的輸入語音信號(hào)或特性來進(jìn)行這一確定。
如果使用諧波峰值，則語音信號(hào)預(yù)處理系統(tǒng)的控制器將語音信號(hào)幀輸出到語音信號(hào)特性信息提取器，所述語音信號(hào)幀通過將輸入語音信號(hào)轉(zhuǎn)換為頻域的語音信號(hào)而產(chǎn)生。在這里，控制器可根據(jù)下一階段的語音信號(hào)處理系統(tǒng)請(qǐng)求的語音信號(hào)特性信息來選擇多個(gè)語音信號(hào)特性信息提取器中的至少一個(gè)。由控制器選擇的語音信號(hào)特性信息提取器提取下一階段的語音信號(hào)處理系統(tǒng)請(qǐng)求的語音信號(hào)特性信息?？刂破鬏敵鎏崛〉恼Z音信號(hào)特性信息。語音信號(hào)特性信息可以是語音信號(hào)的包絡(luò)信息、語音信號(hào)的基音信息、或者語音信號(hào)是濁音、清音還是背景噪聲的確定結(jié)果。
如果沒有使用諧波峰值，則控制器使用形態(tài)學(xué)分析方案執(zhí)行對(duì)產(chǎn)生的語音信號(hào)幀的形態(tài)學(xué)分析?？刂破鞲鶕?jù)形態(tài)學(xué)分析結(jié)果提取信號(hào)波形，并將提取的信號(hào)波形而不是語音信號(hào)幀輸出到多個(gè)語音信號(hào)特性信息提取器中的每一個(gè)。多個(gè)語音信號(hào)特性信息提取器中的每一個(gè)接收根據(jù)形態(tài)學(xué)分析結(jié)果的信號(hào)波形而不是接收語音信號(hào)幀，并使用接收的信號(hào)波形提取輸入語音信號(hào)的特性信息?？刂破鲗⑻崛〉恼Z音信號(hào)特性信息輸出到下一階段的語音信號(hào)處理系統(tǒng)。
圖1顯示根據(jù)本發(fā)明的語音信號(hào)預(yù)處理系統(tǒng)。語音信號(hào)預(yù)處理系統(tǒng)包括控制器100、連接到控制器100的存儲(chǔ)單元102、形態(tài)學(xué)分析器104、基音提取器110、包絡(luò)提取器126、神經(jīng)網(wǎng)絡(luò)系統(tǒng)124、噪聲消除器122、語音信號(hào)特性信息輸出單元120、濁音度計(jì)算器118、語音信號(hào)轉(zhuǎn)換器116?？刂破?00控制這些部件，以接收語音信號(hào)，并從接收的語音信號(hào)提取下一階段的語音信號(hào)處理系統(tǒng)請(qǐng)求的語音信號(hào)特性信息。
控制器100接收語音信號(hào)，并將所述語音信號(hào)轉(zhuǎn)換為頻域的語音信號(hào)。控制器100根據(jù)接收的語音信號(hào)或下一階段的語音信號(hào)處理系統(tǒng)的特性，確定是否使用語音信號(hào)幀的諧波峰值提取語音信號(hào)的特性信息。根據(jù)確定結(jié)果，控制器100利用使用諧波峰值提取器114找到的諧波峰值或利用通過語音信號(hào)的形態(tài)學(xué)分析結(jié)果產(chǎn)生的信號(hào)波形來提取語音信號(hào)的特性信息。
形態(tài)學(xué)通常用于圖像信號(hào)處理，并且數(shù)學(xué)概念上的形態(tài)學(xué)是集中在圖像的幾何結(jié)構(gòu)上的非線性圖像處理和分析方法，其中，與主要運(yùn)算相應(yīng)的腐蝕和膨脹以及與次要運(yùn)算相應(yīng)的開運(yùn)算和閉運(yùn)算是重要的?？墒褂靡唤M簡單的形態(tài)學(xué)來形成多個(gè)線性和非線性運(yùn)算符。
形態(tài)學(xué)分析的基本運(yùn)算是腐蝕，其中，在通過組B對(duì)組A的腐蝕中，A表示輸入圖像，B表示結(jié)構(gòu)元素。如果原點(diǎn)在結(jié)構(gòu)元素中，則腐蝕趨向收縮輸入圖像。另一基本運(yùn)算膨脹是腐蝕的雙重運(yùn)算，并且被定義為腐蝕的一組互補(bǔ)。作為另一基本運(yùn)算的開運(yùn)算是腐蝕和膨脹的迭代，作為另一基本運(yùn)算的閉運(yùn)算是開運(yùn)算的雙重運(yùn)算。
膨脹運(yùn)算確定語音信號(hào)圖像的每個(gè)預(yù)定閾值組的最大值作為閾值組的值。腐蝕運(yùn)算確定語音信號(hào)圖像的每個(gè)預(yù)定閾值組的最小值作為閾值組的值。開運(yùn)算是在腐蝕運(yùn)算之后執(zhí)行膨脹運(yùn)算的運(yùn)算，并顯示平滑效果。閉運(yùn)算是在膨脹運(yùn)算之后執(zhí)行腐蝕運(yùn)算的運(yùn)算，并顯示填充效果。
雖然應(yīng)用于本發(fā)明的形態(tài)學(xué)運(yùn)算是在語音信號(hào)處理中通常不使用的方法，但是當(dāng)在提取特性頻率時(shí)使用形態(tài)學(xué)運(yùn)算時(shí)，能夠正確地劃分和提取諧波信號(hào)和非諧波信號(hào)。因此，通過將形態(tài)學(xué)方案應(yīng)用于本發(fā)明，可從語音信號(hào)提取有效的特性頻率區(qū)域，并且可將該特性頻率區(qū)域應(yīng)用于諧波編碼器/解碼器(編解碼器)，所述語音信號(hào)中混合了濁音和清音。也就是說，當(dāng)應(yīng)用形態(tài)學(xué)方案時(shí)，也可將非諧波信號(hào)應(yīng)用于諧波編解碼器。
因此，當(dāng)確定結(jié)果指示沒有使用語音信號(hào)的諧波峰值時(shí)，控制器100通過形態(tài)學(xué)分析產(chǎn)生當(dāng)前輸入的語音信號(hào)的有意義的特性頻率，即，根據(jù)形態(tài)學(xué)分析的信號(hào)波形，并且通過將產(chǎn)生的信號(hào)波形輸出到與諧波編解碼器的使用相似的語音信號(hào)特性信息提取器來提取輸入語音信號(hào)的特性信息。
連接到控制器100的存儲(chǔ)單元102包括只讀存儲(chǔ)器(ROM)、閃速存儲(chǔ)器和隨機(jī)存取存儲(chǔ)器(RAM)。ROM存儲(chǔ)用于控制器100的處理和控制的程序和各種參考數(shù)據(jù)，RAM提供控制器100的工作存儲(chǔ)器，閃速存儲(chǔ)器提供用于存儲(chǔ)各種可更新存儲(chǔ)數(shù)據(jù)的區(qū)域。
語音信號(hào)識(shí)別單元112從輸入信號(hào)識(shí)別語音信號(hào)，并將輸入信號(hào)作為語音信號(hào)輸出到控制器100。語音信號(hào)轉(zhuǎn)換器116在控制器100的控制下通過接收語音信號(hào)并將接收的語音信號(hào)轉(zhuǎn)換為頻域的語音信號(hào)來產(chǎn)生語音信號(hào)幀。噪聲消除器122從語音信號(hào)幀消除噪聲。諧波峰值提取器114在控制器100的控制下從語音信號(hào)幀搜索并提取峰值。語音信號(hào)特性信息輸出單元120在控制器100的控制下將輸入語音信號(hào)的特性信息輸出到下一階段的語音信號(hào)處理系統(tǒng)。
形態(tài)學(xué)分析器104包括形態(tài)學(xué)濾波器106和結(jié)構(gòu)組尺寸(structuring setsize，SSS)確定器，并且形態(tài)學(xué)分析器104根據(jù)通過輸入語音信號(hào)幀的形態(tài)學(xué)運(yùn)算的形態(tài)學(xué)分析來產(chǎn)生信號(hào)波形。形態(tài)學(xué)濾波器106選擇通過形態(tài)學(xué)閉運(yùn)算選擇諧波峰值。在執(zhí)行形態(tài)學(xué)閉運(yùn)算之后，獲得圖2所示的波形。如果對(duì)圖2所示的波形圖(a)進(jìn)行預(yù)處理，則獲得殘留(或殘余)頻譜波形(b)。殘留頻譜指示信號(hào)存在于由波形圖(a)所示的虛線表示的封閉基底之上，并且在預(yù)處理之后，如波形圖(b)所示，僅剩余特性頻率區(qū)域。也就是說，在預(yù)處理之后，通過從在執(zhí)行形態(tài)學(xué)閉運(yùn)算之后輸出的信號(hào)中去除階梯信號(hào)而獲得的信號(hào)是波形圖(b)所示的信號(hào)。通過預(yù)處理，在濁音中加強(qiáng)了諧波內(nèi)容，并且在清音中加強(qiáng)了主要正弦分量。
為了使形態(tài)學(xué)濾波器106的性能最佳，確定用于執(zhí)行形態(tài)學(xué)運(yùn)算的最佳窗口尺寸。為了確定最佳窗口尺寸，在形態(tài)學(xué)分析器104中包括SSS確定器108。SSS確定器108確定用于使形態(tài)學(xué)濾波器106的性能最佳的SSS，并且將確定的SSS提供給形態(tài)學(xué)濾波器106。可按照期望的(即，被確定為)默認(rèn)或通過下述方法選擇性地使用確定SSS的處理。
現(xiàn)將描述確定SSS的處理。假定具有最大諧波峰值的信號(hào)的數(shù)量(即，最大諧波峰值的數(shù)量)為N。當(dāng)定義與圖2中波形圖(b)的陰影區(qū)域相應(yīng)的N個(gè)選擇的峰值時(shí)，使用該N個(gè)選擇的峰值計(jì)算值P。P表示N個(gè)選擇的峰值的能量與其它殘留頻譜的能量比。例如，在波形圖(b)中，如果N＝5，則通過將陰影區(qū)域相加獲得的值是N個(gè)選擇的峰值的能量EN，其它殘留頻譜的能量是Etotal，則P＝EN/Etotal。在沒有關(guān)于信號(hào)的假設(shè)的情況下將值P與SSS相比較，如果P太大(例如，SSS＜0.5)，則減小N，如果P太小(例如，SSS＞0.5)，則增加N。因此，因?yàn)樵谂哉f話者的情況下語音信號(hào)具有高的基音，所以諧波峰值的總數(shù)量小，因此與男性說話者相比，對(duì)于女性說話者選擇較小的N值。通過上述處理，確定了形態(tài)學(xué)濾波器106的最佳SSS，所述形態(tài)學(xué)濾波器106執(zhí)行被轉(zhuǎn)換為頻域的語音信號(hào)的波形的形態(tài)學(xué)閉運(yùn)算。如果沒有使用通過調(diào)整N選擇SSS的方法，則可通過從最小SSS開始逐步地使SSS增大來選擇最佳SSS。
因?yàn)樾螒B(tài)學(xué)運(yùn)算是根據(jù)使結(jié)構(gòu)元素適合某一特定值的組理論逼近方法，所以諸如語音信號(hào)波形的一維圖像結(jié)構(gòu)元素被表示為一組離散值。通過與原點(diǎn)對(duì)稱的滑動(dòng)窗口確定結(jié)構(gòu)組，滑動(dòng)窗口的尺寸確定形態(tài)學(xué)運(yùn)算的性能。
根據(jù)本發(fā)明，通過等式(1)獲得窗口尺寸。
窗口尺寸＝(結(jié)構(gòu)組尺寸(SSS)×2+1)...(1)如等式(1)所示，窗口尺寸取決于SSS。因此，可通過調(diào)整結(jié)構(gòu)組的尺寸來調(diào)整形態(tài)學(xué)運(yùn)算的性能。因此，形態(tài)學(xué)濾波器106可根據(jù)由SSS確定器108確定的SSS使用滑動(dòng)窗口執(zhí)行形態(tài)學(xué)運(yùn)算，諸如膨脹、腐蝕、開運(yùn)算或閉運(yùn)算。
因此，形態(tài)學(xué)濾波器106使用由SSS確定器108確定的SSS對(duì)頻域的語音信號(hào)波形執(zhí)行形態(tài)學(xué)運(yùn)算。也就是說，形態(tài)學(xué)濾波器106對(duì)轉(zhuǎn)換的語音信號(hào)波形執(zhí)行形態(tài)學(xué)閉運(yùn)算，并執(zhí)行預(yù)處理。
形態(tài)學(xué)濾波器106的信號(hào)變換方法是非線性方法，在所述方法中，輸入信號(hào)的幾何特征被部分地變換，并且根據(jù)四種操作，即，腐蝕、膨脹、開運(yùn)算和閉運(yùn)算具有收縮、擴(kuò)張、平滑和/或填充的效果。這種形態(tài)學(xué)濾波的優(yōu)點(diǎn)是可用非常少的計(jì)算量正確地提取頻譜的峰值或谷值信息。此外，形態(tài)學(xué)濾波是非參數(shù)的。例如，不同于假定語音信號(hào)的諧波結(jié)構(gòu)的傳統(tǒng)諧波編解碼器，在本發(fā)明中對(duì)于輸入信號(hào)不存在假定。
形態(tài)學(xué)閉運(yùn)算提供填充語音信號(hào)頻譜中的諧波峰值之間的谷值的效果，因此如圖2的波形圖(b)所示，當(dāng)在形態(tài)學(xué)閉運(yùn)算頻譜之下存在小偽峰值時(shí)諧波峰值保留。
因此，控制器100可從通過形態(tài)學(xué)濾波器106執(zhí)行的形態(tài)學(xué)運(yùn)算的結(jié)果僅選擇包括在語音信號(hào)中的特性頻率區(qū)域。可通過抑制噪聲僅選擇特性頻率區(qū)域。通過選擇如圖2的波形圖(b)所示的包括小諧波峰值的所有諧波峰值來提取用于表示語音信號(hào)的所有特性頻率區(qū)域。如果提取的特性頻率區(qū)域具有濁音的屬性，則出現(xiàn)具有恒定周期性的諧波峰值，諸如f0、2f0、3f0、4f0、5f0、...。也就是說，在不區(qū)分濁音和清音的情況下通過將形態(tài)學(xué)方案應(yīng)用于語音信號(hào)，提取被應(yīng)用于執(zhí)行諧波編碼的諧波編解碼器的特性頻率而不是基音頻率。
具體地說，由于與語音信號(hào)的特性頻率相應(yīng)的主要正弦波成分而出現(xiàn)在圖2的波形圖(b)中的通過執(zhí)行預(yù)處理而剩余的殘留峰值。不同于一般諧波提取方法，特性頻率是表示語音信號(hào)的所有正弦波的頻率區(qū)域。
語音信號(hào)預(yù)處理系統(tǒng)包括基音提取器110、包絡(luò)提取器126和神經(jīng)網(wǎng)絡(luò)系統(tǒng)124，作為語音信號(hào)特性信息提取器，用于提取輸入語音信號(hào)的特性信息?；籼崛∑?10根據(jù)從控制器100輸入的形態(tài)學(xué)分析結(jié)果，使用諧波峰值被提取的特定語音信號(hào)幀或信號(hào)波形來提取基音信息。包絡(luò)提取器126在控制器100的控制下根據(jù)形態(tài)學(xué)分析結(jié)果，從諧波峰值被提取的特定語音信號(hào)幀或信號(hào)波形中提取諧波峰值的包絡(luò)信息和非諧波峰值的包絡(luò)信息，并將諧波峰值的包絡(luò)信息和非諧波峰值的包絡(luò)信息輸出到控制器100。如果下一階段的語音信號(hào)處理系統(tǒng)請(qǐng)求諧波峰值的包絡(luò)信息和非諧波峰值的包絡(luò)信息，則控制器100將諧波峰值的包絡(luò)信息和非諧波峰值的包絡(luò)信息輸出到下一階段的語音信號(hào)處理系統(tǒng)。然而，包絡(luò)信息被用于識(shí)別語音信號(hào)幀相應(yīng)于濁音、清音還是背景噪聲。在這種情況下，控制器100使用諧波峰值的包絡(luò)信息與非諧波峰值的包絡(luò)信息的能量比來確定語音信號(hào)幀相應(yīng)于濁音、清音還是背景噪聲。為了實(shí)現(xiàn)這一目的，控制器100包括濁音度計(jì)算器118，用于計(jì)算諧波峰值的包絡(luò)信息與非諧波峰值的包絡(luò)信息的能量比，并且根據(jù)計(jì)算的濁音度的結(jié)果來確定語音信號(hào)幀相應(yīng)于濁音、清音還是背景噪聲。
神經(jīng)網(wǎng)絡(luò)系統(tǒng)124根據(jù)形態(tài)學(xué)分析結(jié)果從語音信號(hào)幀或特性頻率區(qū)域檢測特性信息，為每條檢測的特性信息賦予預(yù)設(shè)權(quán)重，并且根據(jù)神經(jīng)網(wǎng)絡(luò)識(shí)別結(jié)果來確定語音信號(hào)幀相應(yīng)于濁音、清音還是背景噪聲。神經(jīng)網(wǎng)絡(luò)系統(tǒng)124可包括至少兩個(gè)神經(jīng)網(wǎng)絡(luò)以增加語音信號(hào)幀的識(shí)別準(zhǔn)確率。
當(dāng)根據(jù)第一神經(jīng)網(wǎng)絡(luò)識(shí)別的語音信號(hào)幀或與特性頻率區(qū)域相應(yīng)的語音信號(hào)的確定結(jié)果沒有指示濁音時(shí)，神經(jīng)網(wǎng)絡(luò)系統(tǒng)124保留語音信號(hào)幀或特性頻率區(qū)域的確定，使用第一神經(jīng)網(wǎng)絡(luò)的濁音/清音/背景噪聲確定結(jié)果，對(duì)至少一個(gè)不同的語音信號(hào)幀或特性頻率區(qū)域和從所述不同的語音信號(hào)幀或特性頻率區(qū)域提取的各種特性信息的次要統(tǒng)計(jì)值來執(zhí)行第二神經(jīng)網(wǎng)絡(luò)識(shí)別，并且根據(jù)第二神經(jīng)網(wǎng)絡(luò)識(shí)別的結(jié)果來確定語音信號(hào)幀相應(yīng)于濁音、清音還是背景噪聲。次要統(tǒng)計(jì)值是對(duì)從所述不同的語音信號(hào)幀或特性頻率區(qū)域提取的每條特性信息計(jì)算的統(tǒng)計(jì)值。
圖1顯示根據(jù)本發(fā)明的語音信號(hào)預(yù)處理系統(tǒng)。因此，根據(jù)本發(fā)明，根據(jù)由緊接在語音信號(hào)預(yù)處理系統(tǒng)之后的階段的語音信號(hào)處理系統(tǒng)請(qǐng)求的語音信息特性信息，可以對(duì)包括語音信號(hào)特性信息提取器的配置進(jìn)行更多的修改和添加。
圖3示出根據(jù)本發(fā)明的在圖1的語音信號(hào)預(yù)處理系統(tǒng)中使用諧波峰值和形態(tài)學(xué)分析方案輸出語音信號(hào)的特性信息的處理。當(dāng)輸入信號(hào)時(shí)，在步驟300，控制器100通過語音信號(hào)識(shí)別單元112從輸入信號(hào)識(shí)別語音信號(hào)，提取語音信號(hào)，并且通過語音信號(hào)轉(zhuǎn)換器116將提取的語音信號(hào)轉(zhuǎn)換為頻域的語音信號(hào)。在步驟302，控制器100通過噪聲消除器122從轉(zhuǎn)換的語音信號(hào)中消除噪聲。在控制器100中可使用各種消除噪聲的方法。例如，控制器100可根據(jù)每個(gè)提取的語音信號(hào)幀的幅度設(shè)置不同的權(quán)重，并且根據(jù)設(shè)置的權(quán)重執(zhí)行幅度的平方運(yùn)算。通過設(shè)置預(yù)定的閾值，并且根據(jù)平方運(yùn)算的結(jié)果是否大于閾值來將(+)或(-)符號(hào)提供給平方運(yùn)算的結(jié)果，控制器100可將具有小于閾值的幅度的信號(hào)(即，被估計(jì)為噪聲的信號(hào))與具有大于或等于閾值的幅度的信號(hào)的幅度比設(shè)置得較大。
在完成步驟302的噪聲消除處理之后，在步驟304，控制器100確定是否使用語音信號(hào)幀的諧波峰值來提取語音信號(hào)特性信息。可根據(jù)輸入語音信號(hào)或下一階段的語音信號(hào)處理系統(tǒng)的特性來執(zhí)行所述確定。例如，根據(jù)輸入到語音信號(hào)識(shí)別單元112的信號(hào)是否具有對(duì)于提取語音信號(hào)的特性信息足夠的諧波峰值，控制器100可確定是否使用諧波峰值來提取語音信號(hào)的特性信息。如果輸入到語音信號(hào)識(shí)別單元112的信號(hào)不具有對(duì)于提取語音信號(hào)的特性信息足夠的諧波峰值，則控制器100可根據(jù)下一階段的語音信號(hào)處理系統(tǒng)的請(qǐng)求來確定是否使用諧波峰值。
如果在步驟304確定使用諧波峰值，則在步驟306，控制器100確定是否存在當(dāng)前輸入語音信號(hào)幀的諧波峰值。當(dāng)步驟306的確定結(jié)果指示關(guān)于當(dāng)前輸入語音信號(hào)幀的諧波峰值的存在不確定時(shí)，在步驟308，控制器100通過諧波峰值提取器114提取當(dāng)前輸入語音信號(hào)幀的諧波峰值?？刂破?00可使用任何期望的方法來提取諧波峰值。
當(dāng)在步驟306確定當(dāng)前輸入語音信號(hào)幀的諧波峰值存在時(shí)，在步驟310，控制器100選擇語音信號(hào)特性信息提取器以提取下一階段的語音信號(hào)處理系統(tǒng)請(qǐng)求的語音信號(hào)特性信息，并且通過將語音信號(hào)幀輸出到選擇的語音信號(hào)特性信息提取器從語音信號(hào)幀的諧波峰值提取輸入語音信號(hào)的特性信息。在步驟316，控制器100將提取的語音信號(hào)特性信息輸出到下一階段的語音信號(hào)處理系統(tǒng)。
當(dāng)在步驟304確定沒有使用諧波峰值時(shí)，在步驟312，控制器100將語音信號(hào)幀輸出到形態(tài)學(xué)分析器104，控制形態(tài)學(xué)分析器104執(zhí)行形態(tài)學(xué)運(yùn)算，并且根據(jù)形態(tài)學(xué)分析結(jié)果從語音信號(hào)幀提取信號(hào)波形。
在步驟314，控制器100選擇語音信號(hào)特性信息提取器以提取下一階段的語音信號(hào)處理系統(tǒng)請(qǐng)求的語音信號(hào)特性信息，并且通過將提取的信號(hào)波形輸出到選擇的語音信號(hào)特性信息提取器從根據(jù)形態(tài)學(xué)分析結(jié)果從信號(hào)波形提取的諧波峰值提取輸入語音信號(hào)的特性信息。在步驟316，控制器100將提取的語音信號(hào)特性信息輸出到下一階段的語音信號(hào)處理系統(tǒng)。
圖4示出根據(jù)本發(fā)明的根據(jù)語音信號(hào)處理系統(tǒng)請(qǐng)求的信息將語音信號(hào)的特性信息輸出到圖1所示的語音信號(hào)預(yù)處理系統(tǒng)的處理。在圖4中，假定語音信號(hào)處理系統(tǒng)請(qǐng)求輸入語音信號(hào)的包絡(luò)信息、基音信息和濁音/清音/背景噪聲確定結(jié)果信息中的一個(gè)。
參照?qǐng)D4，當(dāng)通過圖3的步驟306或308輸入包括諧波峰值的語音信號(hào)幀時(shí)，在步驟310，控制器100通過將語音信號(hào)幀輸出到選擇的語音信號(hào)特性信息提取器從語音信號(hào)幀的諧波峰值提取輸入語音信號(hào)的特性信息，并且在步驟400確定根據(jù)本發(fā)明的語音信號(hào)處理系統(tǒng)請(qǐng)求的語音信號(hào)特性信息是包絡(luò)信息、基音信息還是濁音/清音/背景噪聲確定結(jié)果信息。根據(jù)步驟400的確定結(jié)果，將輸入語音信號(hào)輸入到相應(yīng)的語音信號(hào)特性提取器。
當(dāng)在步驟400確定語音信號(hào)處理系統(tǒng)請(qǐng)求的語音信號(hào)特性信息是包絡(luò)信息時(shí)，在步驟402，控制器100將語音信號(hào)幀輸出到包絡(luò)提取器126。在步驟404，控制器100使用語音信號(hào)幀的諧波峰值提取語音信號(hào)幀的包絡(luò)信息。包絡(luò)信息提取器126通過在第一基音周期從語音信號(hào)幀檢測最大峰值作為第一諧波峰值并檢測后來的搜索區(qū)域的最大諧波峰值來選擇諧波峰值，并且使用內(nèi)插從選擇的諧波峰值提取包絡(luò)信息。
在提取包絡(luò)信息之后，在圖3的步驟316，控制器100將提取的包絡(luò)信息輸出到下一階段的語音信號(hào)處理系統(tǒng)。如果下一階段的語音信號(hào)處理系統(tǒng)不僅請(qǐng)求諧波峰值的包絡(luò)信息，而且還請(qǐng)求其它剩余峰值的包絡(luò)信息，即，非諧波包絡(luò)信息，則可從語音信號(hào)幀提取非諧波包絡(luò)信息。包絡(luò)信息提取器126可使用諧波峰值提取次要諧波峰值的包絡(luò)信息。次要諧波峰值指示從提取的包絡(luò)提取的諧波峰值。次要諧波峰值的包絡(luò)信息可用于增加確定語音信號(hào)是濁音還是清音的處理的準(zhǔn)確度。例如，使用諧波峰值包絡(luò)信息與非諧波峰值包絡(luò)信息的能量比的方法可用作基于包絡(luò)信息確定語音信號(hào)是濁音還是清音的一種方法。
然而，當(dāng)使用次要諧波峰值的包絡(luò)信息時(shí)，非諧波峰值包絡(luò)信息與次要諧波峰值包絡(luò)信息的能量比較大。因此，通常，如果當(dāng)語音信號(hào)是諧波峰值周期性存在的濁音時(shí)使用次要諧波峰值的包絡(luò)信息，則能量比遠(yuǎn)大于當(dāng)語音信號(hào)是諧波峰值非周期性存在的清音時(shí)的情況。當(dāng)使用次要諧波峰值的包絡(luò)信息，即，次要諧波峰值包絡(luò)信息時(shí)，控制器100可更加準(zhǔn)確地確定輸入語音信號(hào)是濁音還是清音。稍后將參照?qǐng)D5描述根據(jù)本發(fā)明的包絡(luò)提取器126的操作，所述操作包括提取次要諧波峰值的包絡(luò)信息的處理。
當(dāng)在步驟400確定語音信號(hào)處理系統(tǒng)請(qǐng)求的語音信號(hào)特性信息是基音信息時(shí)，在步驟406，控制器100將語音信號(hào)幀輸出到基音提取器110。在步驟408，控制器100使用語音信號(hào)幀的諧波峰值提取語音信號(hào)的基音信息?？刂破?00可使用各種方法來從語音信號(hào)幀提取基音信息。例如，控制器100可使用通過從語音信號(hào)幀檢測諧波區(qū)域和噪聲區(qū)域的能量比并確定具有最大能量比的峰值作為基音信息來提取基音信息的方法。在提取基音信息之后，在圖3的步驟316，控制器100將提取的基音信息輸出到下一階段的語音信號(hào)處理系統(tǒng)。
當(dāng)在步驟400確定語音信號(hào)處理系統(tǒng)請(qǐng)求的語音信號(hào)特性信息是濁音/清音/背景噪聲確定結(jié)果時(shí)，在步驟410，控制器100將語音信號(hào)幀輸出到用于確定濁音/清音的語音信號(hào)特性信息提取器。在步驟412，控制器100確定語音信號(hào)幀相應(yīng)于濁音還是清音?？赏ㄟ^使用神經(jīng)網(wǎng)絡(luò)系統(tǒng)124的識(shí)別結(jié)果(前者)或使用由包絡(luò)提取器126提取的次要諧波峰值包絡(luò)信息和非諧波峰值包絡(luò)信息(后者)執(zhí)行濁音/清音確定。
在前一種情況下，控制器100將語音信號(hào)幀輸出到神經(jīng)網(wǎng)絡(luò)系統(tǒng)124。根據(jù)神經(jīng)網(wǎng)絡(luò)系統(tǒng)124的識(shí)別結(jié)果，控制器100確定輸入語音信號(hào)是濁音、清音還是背景噪聲。在后一種情況下，控制器100將語音信號(hào)幀輸出到包絡(luò)提取器126。控制器100通過包絡(luò)提取器126提取次要諧波峰值包絡(luò)信息和非諧波峰值包絡(luò)信息，并且將提取的次要諧波峰值包絡(luò)信息和非諧波峰值包絡(luò)信息輸出到濁音度計(jì)算器118。濁音度計(jì)算器118計(jì)算次要諧波峰值包絡(luò)信息與非諧波峰值包絡(luò)信息的能量比，并將計(jì)算的包絡(luò)信息能量比與預(yù)設(shè)的濁音閾值進(jìn)行比較。如果包絡(luò)信息能量比大于或等于預(yù)設(shè)的濁音閾值，則濁音度計(jì)算器118確定輸入語音信號(hào)是濁音，如果包絡(luò)信息能量比小于預(yù)設(shè)的濁音閾值，則濁音度計(jì)算器118確定輸入語音信號(hào)是清音或背景噪聲。
當(dāng)設(shè)置濁音閾值和清音閾值時(shí)，如果包絡(luò)信息能量比大于濁音閾值，則濁音度計(jì)算器118可確定輸入語音信號(hào)是濁音，如果包絡(luò)信息能量比小于濁音閾值，并且大于或等于清音閾值，則濁音度計(jì)算器118可確定輸入語音信號(hào)是清音，如果包絡(luò)信息能量比小于清音閾值，則濁音度計(jì)算器118確定輸入語音信號(hào)是背景噪聲。這是因?yàn)樵诒尘霸肼曋胁淮嬖谥C波峰值，而在清音中存在具有低周期性的諧波峰值，清音的包絡(luò)信息能量比遠(yuǎn)大于背景噪聲的包絡(luò)信息能量比。在提取步驟412的確定結(jié)果之后，在圖3的步驟316，控制器100將提取的確定結(jié)果輸出到下一階段的語音信號(hào)處理系統(tǒng)。
稍后將參照?qǐng)D7描述下一階段的語音信號(hào)處理系統(tǒng)請(qǐng)求的語音信號(hào)特性信息是濁音/清音確定結(jié)果信息的情況的處理。
圖5示出根據(jù)本發(fā)明的在圖1的語音信號(hào)預(yù)處理系統(tǒng)中使用諧波峰值提取語音信號(hào)的包絡(luò)信息的處理。圖6A至圖6C是用于解釋根據(jù)本發(fā)明的如何獲得次要諧波峰值的參考圖。
參照?qǐng)D5至圖6C，當(dāng)在圖4的步驟402將語音信號(hào)幀輸入到包絡(luò)提取器126時(shí)，在步驟500，控制器100確定次要諧波峰值是否必要。如果下一階段的語音信號(hào)處理系統(tǒng)請(qǐng)求次要諧波峰值，或者如果在圖4的步驟412的輸入語音信號(hào)的濁音/清音確定中使用次要諧波峰值，則在步驟500，控制器100確定次要諧波峰值必要。
然而，當(dāng)在步驟500確定次要諧波峰值不必要時(shí)，在步驟508，控制器100通過從語音信號(hào)幀選擇諧波峰值并將內(nèi)插應(yīng)用于選擇的諧波峰值來提取包絡(luò)信息。在步驟510，控制器100通過將內(nèi)插應(yīng)用于沒有被選為諧波峰值的剩余峰值來提取所述剩余峰值的包絡(luò)信息作為非諧波峰值包絡(luò)信息。如果非諧波峰值包絡(luò)信息不必要，即，如果下一階段的語音信號(hào)處理系統(tǒng)僅請(qǐng)求諧波峰值包絡(luò)信息，則可省略步驟510。
當(dāng)在步驟500確定次要諧波峰值必要時(shí)，在步驟502，控制器100從語音信號(hào)幀提取諧波峰值的包絡(luò)信息。在步驟504，控制器100從提取的包絡(luò)信息提取次要諧波峰值。例如，如果輸入圖6A所示的語音信號(hào)幀，則控制器100從圖6A所示的語音信號(hào)幀選擇諧波峰值，通過將內(nèi)插應(yīng)用于選擇的諧波峰值提取圖6B所示的包絡(luò)信息600，并且從提取的包絡(luò)信息600選擇次要諧波峰值。在步驟506，通過將內(nèi)插應(yīng)用于選擇的次要諧波峰值來提取圖6C所示的次要諧波峰值的包絡(luò)信息602。在步驟510，控制器100通過將內(nèi)插應(yīng)用于沒有被選為諧波峰值的剩余峰值來提取所述剩余峰值的包絡(luò)信息作為非諧波峰值包絡(luò)信息。如果非諧波峰值包絡(luò)信息不必要，即，如果使用包絡(luò)信息比確定濁音/清音不必要，或者如果下一階段的語音信號(hào)處理系統(tǒng)僅請(qǐng)求諧波峰值包絡(luò)信息，則可省略步驟510。
圖7是示出根據(jù)本發(fā)明的在圖1的語音信號(hào)預(yù)處理系統(tǒng)中使用諧波峰值確定語音信號(hào)是濁音還是清音的處理。
當(dāng)在圖4的步驟400確定語音信號(hào)處理系統(tǒng)請(qǐng)求的語音信號(hào)特性信息是濁音/清音/背景噪聲確定結(jié)果時(shí)，在圖4的步驟410，控制器100將語音信號(hào)幀輸出到濁音/清音確定器，并且在圖4的步驟412，使用語音信號(hào)幀的諧波峰值確定語音信號(hào)幀相應(yīng)于濁音還是清音。控制器100可使用與諧波峰值相關(guān)的各種方法來確定語音信號(hào)幀相應(yīng)于濁音還是清音。然而，如上所述假定使用一組包絡(luò)提取器126和濁音度計(jì)算器118，或者神經(jīng)網(wǎng)絡(luò)系統(tǒng)124來確定語音信號(hào)幀相應(yīng)于濁音還是清音。
因此，濁音/清音確定器可以是神經(jīng)網(wǎng)絡(luò)系統(tǒng)124或者一組包絡(luò)提取器126和濁音度計(jì)算器118。當(dāng)控制器100進(jìn)行到圖4的步驟412，在步驟700，控制器100確定是使用包絡(luò)信息還是使用神經(jīng)網(wǎng)絡(luò)系統(tǒng)124執(zhí)行語音信號(hào)幀的濁音/清音確定?？刂破?00根據(jù)下一階段的語音信號(hào)處理系統(tǒng)請(qǐng)求的信息的特性或者用于語音信號(hào)幀的濁音/清音確定的計(jì)算量，確定是使用包絡(luò)信息還是使用神經(jīng)網(wǎng)絡(luò)系統(tǒng)124執(zhí)行語音信號(hào)幀的濁音/清音確定。
當(dāng)在步驟700確定使用包絡(luò)信息執(zhí)行語音信號(hào)幀的濁音/清音確定時(shí)，在步驟702，控制器100將語音信號(hào)幀輸出到包絡(luò)提取器126，并且通過包絡(luò)提取器126提取次要諧波峰值包絡(luò)信息和非諧波峰值包絡(luò)信息?？赏ㄟ^圖5所示的處理提取次要諧波峰值包絡(luò)信息和非諧波峰值包絡(luò)信息。在步驟704，控制器100將次要諧波峰值包絡(luò)信息和非諧波峰值包絡(luò)信息輸出到濁音度計(jì)算器118，并且通過濁音度計(jì)算器118計(jì)算語音信號(hào)幀的濁音度。在步驟706，控制器100通過將計(jì)算的濁音度與預(yù)設(shè)濁音閾值進(jìn)行比較或與預(yù)設(shè)濁音閾值和預(yù)設(shè)清音閾值兩者進(jìn)行比較，來確定輸入語音信號(hào)是濁音、清音還是背景噪聲。
當(dāng)在步驟700確定使用神經(jīng)網(wǎng)絡(luò)系統(tǒng)124執(zhí)行語音信號(hào)幀的濁音/清音確定時(shí)，控制器100將語音信號(hào)幀輸出到神經(jīng)網(wǎng)絡(luò)系統(tǒng)124，并且在步驟708確定是否使用第二神經(jīng)網(wǎng)絡(luò)。神經(jīng)網(wǎng)絡(luò)系統(tǒng)124可基于對(duì)語音信號(hào)幀的各種信息預(yù)設(shè)的權(quán)重，使用單個(gè)神經(jīng)網(wǎng)絡(luò)確定語音信號(hào)幀相應(yīng)于濁音、清音還是背景噪聲。在這種情況下，神經(jīng)網(wǎng)絡(luò)系統(tǒng)124在不執(zhí)行第二神經(jīng)網(wǎng)絡(luò)識(shí)別的情況下將神經(jīng)網(wǎng)絡(luò)識(shí)別結(jié)果返回控制器100。
然而，如上所述，神經(jīng)網(wǎng)絡(luò)系統(tǒng)124可以具有至少兩個(gè)神經(jīng)網(wǎng)絡(luò)。在這種情況下，神經(jīng)網(wǎng)絡(luò)系統(tǒng)124使用從第一神經(jīng)網(wǎng)絡(luò)得到的語音信號(hào)幀的濁音/清音/背景噪聲確定結(jié)果和從不同的語音信號(hào)幀提取的各種特性信息的次要統(tǒng)計(jì)值來執(zhí)行第二神經(jīng)網(wǎng)絡(luò)識(shí)別，并且將通過執(zhí)行第二神經(jīng)網(wǎng)絡(luò)識(shí)別而獲得的濁音/清音/背景噪聲確定結(jié)果返回到控制器100。
當(dāng)使用兩個(gè)神經(jīng)網(wǎng)絡(luò)可確定輸入語音信號(hào)是濁音、清音還是背景噪聲時(shí)，并且當(dāng)在步驟700確定使用神經(jīng)網(wǎng)絡(luò)系統(tǒng)124執(zhí)行語音信號(hào)幀的濁音/清音確定時(shí)，在步驟708，控制器100確定是否使用第二神經(jīng)網(wǎng)絡(luò)。也就是說，控制器100根據(jù)下一階段的語音信號(hào)處理系統(tǒng)請(qǐng)求的信息的特性或語音信號(hào)幀的濁音/清音確定的計(jì)算量，確定將一個(gè)還是兩個(gè)神經(jīng)網(wǎng)絡(luò)用于語音信號(hào)幀的濁音/清音確定。例如，如果語音信號(hào)處理系統(tǒng)請(qǐng)求正確區(qū)分語音信號(hào)幀相應(yīng)于清音還是背景噪聲，則控制器100使用第二神經(jīng)網(wǎng)絡(luò)確定語音信號(hào)幀相應(yīng)于濁音、清音還是背景噪聲，所述第二神經(jīng)網(wǎng)絡(luò)能夠比使用第一神經(jīng)網(wǎng)絡(luò)更加準(zhǔn)確地從背景噪聲中區(qū)分出清音。
當(dāng)在步驟708確定不使用第二神經(jīng)網(wǎng)絡(luò)時(shí)，在步驟710，控制器100通過神經(jīng)網(wǎng)絡(luò)系統(tǒng)124僅執(zhí)行第一神經(jīng)網(wǎng)絡(luò)識(shí)別，并且將通過第一神經(jīng)網(wǎng)絡(luò)識(shí)別獲得的濁音/清音/背景噪聲確定結(jié)果輸出到下一階段的語音信號(hào)處理系統(tǒng)。當(dāng)在步驟708確定使用第二神經(jīng)網(wǎng)絡(luò)時(shí)，在步驟712，控制器100執(zhí)行第二神經(jīng)網(wǎng)絡(luò)識(shí)別，并且將通過第二神經(jīng)網(wǎng)絡(luò)識(shí)別獲得的濁音/清音/背景噪聲確定結(jié)果輸出到語音信號(hào)處理系統(tǒng)。
圖8示出根據(jù)本發(fā)明的在圖7的步驟712中示出的使用第二神經(jīng)網(wǎng)絡(luò)的情況。當(dāng)在圖7的步驟708確定使用第二神經(jīng)網(wǎng)絡(luò)時(shí)，在步驟800，神經(jīng)網(wǎng)絡(luò)系統(tǒng)124通過分析語音信號(hào)幀提取語音信號(hào)的特性信息。語音信號(hào)特性信息可以是信號(hào)的均方根能量(RMSE)和零交叉計(jì)數(shù)(ZC)。
在步驟800提取語音信號(hào)的特性信息之后，神經(jīng)網(wǎng)絡(luò)系統(tǒng)124使用提取的特性信息執(zhí)行第一神經(jīng)網(wǎng)絡(luò)識(shí)別。在步驟802，神經(jīng)網(wǎng)絡(luò)系統(tǒng)124確定第一神經(jīng)網(wǎng)絡(luò)識(shí)別的結(jié)果是否指示濁音。當(dāng)在步驟802確定第一神經(jīng)網(wǎng)絡(luò)識(shí)別結(jié)果不指示濁音時(shí)，在步驟816，神經(jīng)網(wǎng)絡(luò)系統(tǒng)124保留當(dāng)前語音信號(hào)幀相應(yīng)于濁音、清音還是背景噪聲的確定。其后，神經(jīng)網(wǎng)絡(luò)系統(tǒng)124接收新的語音信號(hào)幀。
當(dāng)在步驟802確定第一神經(jīng)網(wǎng)絡(luò)識(shí)別結(jié)果指示濁音時(shí)，在步驟804，神經(jīng)網(wǎng)絡(luò)系統(tǒng)124將語音信號(hào)幀的確定結(jié)果輸出到控制器100?？刂破?00將語音信號(hào)幀的確定結(jié)果輸出到語音信號(hào)處理系統(tǒng)。
在步驟806，神經(jīng)網(wǎng)絡(luò)系統(tǒng)124確定是否存在保留確定的語音信號(hào)幀。當(dāng)在步驟806確定不存在保留確定的語音信號(hào)幀，神經(jīng)網(wǎng)絡(luò)系統(tǒng)124接收新的語音信號(hào)幀。當(dāng)在步驟806確定存在保留確定的語音信號(hào)幀，在步驟808，神經(jīng)網(wǎng)絡(luò)系統(tǒng)124存儲(chǔ)當(dāng)前語音信號(hào)的特性信息。在步驟810，神經(jīng)網(wǎng)絡(luò)系統(tǒng)124確定是否存儲(chǔ)對(duì)保留確定的語音信號(hào)幀執(zhí)行確定所需的預(yù)設(shè)數(shù)量的語音信號(hào)幀的特性信息。
當(dāng)在步驟810確定不存儲(chǔ)預(yù)設(shè)數(shù)量的語音信號(hào)幀的特性信息時(shí)，神經(jīng)網(wǎng)絡(luò)系統(tǒng)124接收新的語音信號(hào)幀。當(dāng)在步驟810確定存儲(chǔ)預(yù)設(shè)數(shù)量的語音信號(hào)幀的特性信息時(shí)，在步驟812，神經(jīng)網(wǎng)絡(luò)系統(tǒng)124將預(yù)設(shè)數(shù)量的語音信號(hào)幀的特性信息提供給第二神經(jīng)網(wǎng)絡(luò)，并且執(zhí)行保留確定的語音信號(hào)幀的第二神經(jīng)網(wǎng)絡(luò)識(shí)別。在步驟814，神經(jīng)網(wǎng)絡(luò)系統(tǒng)124根據(jù)第二神經(jīng)網(wǎng)絡(luò)識(shí)別結(jié)果確定語音信號(hào)幀是清音還是背景噪聲，并且將確定結(jié)果輸出到控制器100?？刂破?00將根據(jù)第二神經(jīng)網(wǎng)絡(luò)識(shí)別結(jié)果的確定結(jié)果輸出到下一階段的語音信號(hào)處理系統(tǒng)，作為保留確定的語音信號(hào)幀的確定結(jié)果。
如上所述，參照?qǐng)D3，當(dāng)在步驟304確定不使用諧波峰值時(shí)，在步驟312，控制器100執(zhí)行形態(tài)學(xué)分析，并且根據(jù)形態(tài)學(xué)分析結(jié)果提取語音信號(hào)特性信息。圖9示出根據(jù)本發(fā)明的在圖1所示的語音信號(hào)預(yù)處理系統(tǒng)的形態(tài)學(xué)分析處理，其中，使用形態(tài)學(xué)運(yùn)算分析輸入語音信號(hào)。
參照?qǐng)D9，當(dāng)在圖3的步驟304確定不使用諧波峰值時(shí)，在步驟900，控制器100確定用于使形態(tài)學(xué)運(yùn)算的性能最佳的最佳SSS。在步驟900確定最佳SSS之后，在步驟902，控制器100使用確定的最佳SSS執(zhí)行語音信號(hào)幀的語音信號(hào)波形的形態(tài)學(xué)運(yùn)算，并且執(zhí)行語音信號(hào)波形的預(yù)處理。使用的形態(tài)學(xué)運(yùn)算是形態(tài)學(xué)閉運(yùn)算，通過膨脹和腐蝕的迭代完成所述閉運(yùn)算。對(duì)于圖像信號(hào)，形態(tài)學(xué)閉運(yùn)算顯示圖像周圍的“滾動(dòng)球”效果，在從最外面對(duì)圖像濾波的同時(shí)平滑每個(gè)角。
在步驟902執(zhí)行形態(tài)學(xué)閉運(yùn)算和預(yù)處理之后，在步驟904，控制器100根據(jù)形態(tài)學(xué)運(yùn)算的結(jié)果提取特性頻率區(qū)域。詳細(xì)地說，當(dāng)在執(zhí)行語音信號(hào)幀的形態(tài)學(xué)閉運(yùn)算之后獲得圖2的波形圖(a)所示的波形時(shí)，通過對(duì)波形圖(a)進(jìn)行預(yù)處理來提取具有波形圖(a)的特性頻率區(qū)域。提取的特性頻率區(qū)域指示表示語音信號(hào)的所有正弦頻率區(qū)域，并且可從特性頻率區(qū)域獲得特性頻率。
圖10示出根據(jù)本發(fā)明的在圖9所示的處理中確定用于形態(tài)學(xué)分析的最佳SSS的處理。如果輸入語音信號(hào)幀，則在步驟1000，控制器100執(zhí)行形態(tài)學(xué)閉運(yùn)算，并且輸出圖2的波形圖(a)。在步驟1002，控制器100執(zhí)行所述波形的預(yù)處理。將所述波形的部分的測試形態(tài)學(xué)運(yùn)算結(jié)果輸入到SSS確定器108，以確定最佳SSS。
在步驟1004，控制器100將具有最大幅度的信號(hào)的數(shù)量定義為N，并且在步驟1006，使用N個(gè)選擇的諧波峰值計(jì)算N個(gè)選擇的諧波峰值的能量與剩余諧波峰值的能量比P。在步驟1008，控制器100將能量比P與當(dāng)前SSS進(jìn)行比較，并且在步驟1010通過根據(jù)比較結(jié)果調(diào)整N確定最佳SSS。換句話說，如果能量比P大于預(yù)定值，則減小N，如果能量比P小于預(yù)定值，則增加N。也就是說，可通過調(diào)整N來獲得最佳SSS。所述SSS是用于設(shè)置形態(tài)學(xué)運(yùn)算的滑動(dòng)窗口的尺寸的值，并且形態(tài)學(xué)濾波器106的性能取決于滑動(dòng)窗口的尺寸。
圖11示出根據(jù)本發(fā)明的在圖1所示的語音信號(hào)預(yù)處理系統(tǒng)中使用根據(jù)形態(tài)學(xué)分析結(jié)果輸出的信號(hào)波形來提取語音信號(hào)的特性信息的處理。
當(dāng)根據(jù)形態(tài)學(xué)分析結(jié)果輸入具有信號(hào)波形的特性頻率區(qū)域時(shí)，在步驟1100，控制器100確定由根據(jù)本發(fā)明的語音信號(hào)處理系統(tǒng)請(qǐng)求的語音信號(hào)特性信息是包絡(luò)信息、基音信息還是濁音/清音/背景噪聲確定結(jié)果信息。根據(jù)步驟1100的確定結(jié)果，將特性頻率區(qū)域輸入到相應(yīng)的語音信號(hào)特性提取器。
也就是說，當(dāng)在步驟1100確定語音信號(hào)處理系統(tǒng)請(qǐng)求的語音信號(hào)特性信息是包絡(luò)信息時(shí)，在步驟1102，控制器100將特性頻率區(qū)域輸出到包絡(luò)提取器126。在步驟1104，控制器100通過從特性頻率區(qū)域的信號(hào)波形中提取諧波峰值來提取特性頻率區(qū)域的包絡(luò)信息。包絡(luò)提取器126通過從用于第一基音周期的特性頻率區(qū)域的信號(hào)波形檢測最大峰值作為第一諧波峰值并檢測隨后搜索區(qū)域的最大諧波峰值來選擇諧波峰值，并且使用內(nèi)插從選擇的諧波峰值提取包絡(luò)信息。在提取包絡(luò)信息之后，在圖3的步驟316，控制器100將提取的包絡(luò)信息輸出到下一階段的語音信號(hào)處理系統(tǒng)。
如果下一階段的語音信號(hào)處理系統(tǒng)不僅請(qǐng)求諧波峰值的包絡(luò)信息，還請(qǐng)求其它剩余峰值的包絡(luò)信息，即，非諧波包絡(luò)信息，則可從特性頻率區(qū)域的信號(hào)波形提取非諧波包絡(luò)信息。包絡(luò)提取器126可使用特性頻率區(qū)域的諧波峰值提取特性頻率區(qū)域的次要諧波峰值的包絡(luò)信息。所述次要諧波峰值指示從包絡(luò)提取的諧波峰值，所述包絡(luò)從特性頻率區(qū)域的信號(hào)波形被提取。
可使用次要諧波峰值的包絡(luò)信息來增加確定特性頻率區(qū)域相應(yīng)于濁音還是清音的處理的準(zhǔn)確度。稍后將參照?qǐng)D12描述根據(jù)本發(fā)明的包絡(luò)提取器126的操作，所述操作包括提取從特性頻率區(qū)域的信號(hào)波形提取的次要諧波峰值的包絡(luò)信息的處理。
當(dāng)在步驟1100確定語音信號(hào)處理系統(tǒng)請(qǐng)求的語音信號(hào)特性信息是基音信息時(shí)，在步驟1106，控制器100將特性頻率區(qū)域輸出到基音提取器110。在步驟1108，控制器100使用特性頻率區(qū)域的諧波峰值提取語音信號(hào)的基音信息。控制器100可使用各種方法來從特性頻率區(qū)域提取基音信息。例如，控制器100可使用通過從特性頻率區(qū)域檢測諧波區(qū)域與噪聲區(qū)域的能量比并將具有最大能量比的峰值確定為基音信息來提取基音信息的方法。在提取基音信息之后，在圖3的步驟316，控制器100將提取的基音信息輸出到下一階段的語音信號(hào)處理系統(tǒng)。
當(dāng)在步驟1100確定語音信號(hào)處理系統(tǒng)請(qǐng)求的語音信號(hào)特性信息是濁音/清音/背景噪聲確定結(jié)果信息時(shí)，在步驟1110，控制器100將特性頻率區(qū)域輸出到語音信號(hào)特性信息提取器，以確定濁音/清音。在步驟1112，控制器100使用特性頻率區(qū)域確定輸入語音信號(hào)是濁音還是清音?？赏ㄟ^使用神經(jīng)網(wǎng)絡(luò)系統(tǒng)124的識(shí)別結(jié)果(前者)或使用由包絡(luò)提取器126提取的次要諧波峰值包絡(luò)信息和非諧波峰值包絡(luò)信息(后者)執(zhí)行濁音/清音確定。
在前一種情況下，控制器100將特性頻率區(qū)域輸出到神經(jīng)網(wǎng)絡(luò)系統(tǒng)124。根據(jù)神經(jīng)網(wǎng)絡(luò)系統(tǒng)124的識(shí)別結(jié)果，控制器100確定輸入語音信號(hào)是濁音、清音還是背景噪聲。在后一種情況下，控制器100將特性頻率區(qū)域輸出到包絡(luò)提取器126?？刂破?00通過包絡(luò)提取器126提取次要諧波峰值包絡(luò)信息和非諧波峰值包絡(luò)信息，并且將提取的次要諧波峰值包絡(luò)信息和非諧波峰值包絡(luò)信息輸出到濁音度計(jì)算器118。濁音度計(jì)算器118計(jì)算次要諧波峰值包絡(luò)信息與非諧波峰值包絡(luò)信息的能量比，并將計(jì)算的包絡(luò)信息能量比與預(yù)設(shè)濁音閾值進(jìn)行比較。如果包絡(luò)信息能量比大于或等于預(yù)設(shè)濁音閾值，則濁音度計(jì)算器118確定輸入語音信號(hào)是濁音，如果包絡(luò)信息能量比小于預(yù)設(shè)濁音閾值，則濁音度計(jì)算器118確定輸入語音信號(hào)是清音或背景噪聲。
當(dāng)設(shè)置濁音閾值和清音閾值時(shí)，如果包絡(luò)信息能量比大于濁音閾值，則濁音度計(jì)算器118可確定輸入語音信號(hào)是濁音，如果包絡(luò)信息能量比小于預(yù)設(shè)濁音閾值，并且大于或等于清音閾值，則濁音度計(jì)算器118可確定輸入語音信號(hào)是清音，如果包絡(luò)信息能量比小于清音閾值，則濁音度計(jì)算器118確定輸入語音信號(hào)是背景噪聲。在提取步驟1112的確定結(jié)果之后，在圖3的步驟316，控制器100將提取的確定結(jié)果輸出到下一階段的語音信號(hào)處理系統(tǒng)。
隨后將參照?qǐng)D13來描述當(dāng)下一階段的語音信號(hào)處理系統(tǒng)請(qǐng)求的語音信號(hào)特性信息是濁音/清音確定結(jié)果信息時(shí)的處理。
圖12示出根據(jù)本發(fā)明的在圖1所示的語音信號(hào)預(yù)處理系統(tǒng)中使用根據(jù)形態(tài)學(xué)分析結(jié)果輸出的信號(hào)波形來提取語音信號(hào)的包絡(luò)信息的處理。當(dāng)在圖11的步驟1112使用特性頻率區(qū)域的包絡(luò)信息執(zhí)行語音信號(hào)的濁音/清音確定時(shí)，或在圖11的步驟1102將特性頻率區(qū)域輸入到包絡(luò)提取器126時(shí)，在步驟1102，控制器100確定次要諧波峰值是否必要。如果下一階段的語音信號(hào)處理系統(tǒng)請(qǐng)求次要諧波峰值，或者如果在圖11的步驟1112的輸入語音信號(hào)的濁音/清音確定中使用次要諧波峰值，則在步驟1200，控制器100確定次要諧波峰值必要。
然而，當(dāng)在步驟1200確定次要諧波峰值不必要時(shí)，在步驟1208，控制器100通過從特性頻率區(qū)域選擇諧波峰值并將內(nèi)插應(yīng)用于選擇的諧波峰值來提取包絡(luò)信息。在步驟1210，控制器100通過將內(nèi)插應(yīng)用于沒有被選擇為諧波峰值的剩余峰值來提取所述剩余峰值的包絡(luò)信息作為非諧波峰值包絡(luò)信息。如果非諧波峰值包絡(luò)信息不必要，即，如果下一階段的語音信號(hào)處理系統(tǒng)僅請(qǐng)求諧波峰值包絡(luò)信息，則步驟1210可以省略。
當(dāng)在步驟1200確定次要諧波峰值必要時(shí)，在步驟1202，控制器100從特性頻率區(qū)域提取諧波峰值的包絡(luò)信息。在步驟1204，控制器100從提取的包絡(luò)信息提取次要諧波峰值。在步驟1206，控制器100通過將內(nèi)插應(yīng)用于選擇的次要諧波峰值來提取次要諧波峰值的包絡(luò)信息。在步驟1210，控制器100通過將內(nèi)插應(yīng)用于當(dāng)提取主要諧波峰值的包絡(luò)信息時(shí)沒有被選擇為諧波峰值的剩余峰值來提取所述剩余峰值的包絡(luò)信息作為非諧波峰值包絡(luò)信息。如果非諧波峰值包絡(luò)信息不必要，即，如果使用包絡(luò)信息能量比確定濁音/清音不必要或如果下一階段的語音信號(hào)處理系統(tǒng)僅請(qǐng)求次要諧波峰值包絡(luò)信息，則步驟1210可以省略。
圖13示出根據(jù)本發(fā)明的在圖1所示的語音信號(hào)預(yù)處理系統(tǒng)中使用根據(jù)形態(tài)學(xué)分析結(jié)果輸出的信號(hào)波形來確定語音信號(hào)是濁音還是清音的處理。
基于與使用諧波峰值執(zhí)行濁音/清音確定的圖7中相同的原因，用于濁音/清音確定的濁音/清音確定器可以是神經(jīng)網(wǎng)絡(luò)系統(tǒng)124或一組包絡(luò)提取器126和濁音度計(jì)算器118，。因此，當(dāng)控制器100進(jìn)行到圖10的步驟1012時(shí)，在步驟1300，控制器100確定是使用從特性頻率區(qū)域提取的包絡(luò)信息還是使用神經(jīng)網(wǎng)絡(luò)系統(tǒng)124執(zhí)行濁音/清音確定?？刂破?00根據(jù)下一階段的語音信號(hào)處理系統(tǒng)請(qǐng)求的信息的特性或語音信號(hào)的濁音/清音確定的計(jì)算量，確定是使用包絡(luò)信息還是使用神經(jīng)網(wǎng)絡(luò)系統(tǒng)124執(zhí)行與特性頻率區(qū)域相應(yīng)的語音信號(hào)的濁音/清音確定。
當(dāng)在步驟1300確定使用從特性頻率區(qū)域提取的包絡(luò)信息執(zhí)行與特性頻率區(qū)域相應(yīng)的語音信號(hào)的濁音/清音確定時(shí)，在步驟1302，控制器100根據(jù)形態(tài)學(xué)分析結(jié)果將特性頻率區(qū)域輸出到包絡(luò)提取器126，并且通過包絡(luò)提取器126提取次要諧波峰值包絡(luò)信息和非諧波峰值包絡(luò)信息?？赏ㄟ^圖12所示的處理提取次要諧波峰值包絡(luò)信息和非諧波峰值包絡(luò)信息。
在步驟1304，控制器100將次要諧波峰值包絡(luò)信息和非諧波峰值包絡(luò)信息輸出到濁音度計(jì)算器118，并且通過濁音度計(jì)算器118計(jì)算與特性頻率區(qū)域相應(yīng)的語音信號(hào)的濁音度。在步驟1306，控制器100通過將計(jì)算的濁音度與預(yù)設(shè)濁音閾值進(jìn)行比較或與預(yù)設(shè)濁音閾值和預(yù)設(shè)清音閾值兩者進(jìn)行比較來確定輸入語音是濁音、清音還是背景噪聲。
當(dāng)在步驟1300確定使用神經(jīng)網(wǎng)絡(luò)系統(tǒng)124執(zhí)行與特性頻率區(qū)域相應(yīng)的語音信號(hào)的濁音/清音確定時(shí)，控制器100根據(jù)形態(tài)學(xué)分析結(jié)果將特性頻率區(qū)域輸出到神經(jīng)網(wǎng)絡(luò)系統(tǒng)124，并且在步驟1308確定是否使用第二神經(jīng)網(wǎng)絡(luò)。神經(jīng)網(wǎng)絡(luò)系統(tǒng)124可使用單個(gè)神經(jīng)網(wǎng)絡(luò)或至少兩個(gè)神經(jīng)網(wǎng)絡(luò)確定與特性頻率區(qū)域相應(yīng)的語音信號(hào)相應(yīng)于濁音、清音還是背景噪聲。如果使用兩個(gè)神經(jīng)網(wǎng)絡(luò)，則神經(jīng)網(wǎng)絡(luò)系統(tǒng)124使用從第一神經(jīng)網(wǎng)絡(luò)得到的特性頻率區(qū)域的濁音/清音/背景噪聲確定結(jié)果和從特性頻率區(qū)域提取的各種特性信息的次要統(tǒng)計(jì)值來執(zhí)行第二神經(jīng)網(wǎng)絡(luò)識(shí)別，并且將通過執(zhí)行第二神經(jīng)網(wǎng)絡(luò)識(shí)別而獲得的濁音/清音/背景噪聲確定結(jié)果返回到控制器100。
在這種情況下，即，在使用兩個(gè)神經(jīng)網(wǎng)絡(luò)確定輸入語音信號(hào)是濁音、清音還是背景噪聲的情況下，當(dāng)在步驟1300確定使用神經(jīng)網(wǎng)絡(luò)系統(tǒng)124執(zhí)行與特性頻率區(qū)域相應(yīng)語音信號(hào)的濁音/清音確定時(shí)，在步驟1308，控制器100確定是否使用第二神經(jīng)網(wǎng)絡(luò)。也就是說，控制器100根據(jù)下一階段的語音信號(hào)處理系統(tǒng)請(qǐng)求的信息的特性或與特性頻率區(qū)域相應(yīng)的語音信號(hào)的濁音/清音確定的計(jì)算量，確定將一個(gè)還是兩個(gè)神經(jīng)網(wǎng)絡(luò)用于語音信號(hào)的濁音/清音確定。例如，如果語音信號(hào)處理系統(tǒng)請(qǐng)求正確區(qū)分輸入語音信號(hào)是清音還是背景噪聲，則控制器100使用第二神經(jīng)網(wǎng)絡(luò)確定與特性頻率區(qū)域相應(yīng)的語音信號(hào)相應(yīng)于濁音、清音還是背景噪聲，所述第二神經(jīng)網(wǎng)絡(luò)能夠比使用第一神經(jīng)網(wǎng)絡(luò)更加準(zhǔn)確地從背景噪聲中區(qū)分出清音。
當(dāng)在步驟1308確定不使用第二神經(jīng)網(wǎng)絡(luò)時(shí)，在步驟1310，控制器100通過神經(jīng)網(wǎng)絡(luò)系統(tǒng)124僅執(zhí)行第一神經(jīng)網(wǎng)絡(luò)識(shí)別，并且將通過第一神經(jīng)網(wǎng)絡(luò)識(shí)別獲得的濁音/清音/背景噪聲確定結(jié)果輸出到下一階段的語音信號(hào)處理系統(tǒng)。當(dāng)在步驟1308確定使用第二神經(jīng)網(wǎng)絡(luò)時(shí)，在步驟1312，控制器100執(zhí)行第二神經(jīng)網(wǎng)絡(luò)識(shí)別，并且將與特性頻率區(qū)域相應(yīng)的語音信號(hào)的濁音/清音/背景噪聲確定結(jié)果輸出到語音信號(hào)處理系統(tǒng)。
圖14示出根據(jù)本發(fā)明的在圖13所示的處理中使用第二神經(jīng)網(wǎng)絡(luò)的情況。參照?qǐng)D14，當(dāng)在圖13的步驟1308確定使用第二神經(jīng)網(wǎng)絡(luò)時(shí)，在步驟1400，神經(jīng)網(wǎng)絡(luò)系統(tǒng)124通過根據(jù)形態(tài)學(xué)分析結(jié)果分析特性頻率區(qū)域來提取語音信號(hào)的特性信息。語音信號(hào)特性信息可以是信號(hào)的均方根能量(RMSE)。
在步驟1400提取特性頻率區(qū)域的特性信息之后，神經(jīng)網(wǎng)絡(luò)系統(tǒng)124使用提取的特性信息執(zhí)行第一神經(jīng)網(wǎng)絡(luò)識(shí)別。在步驟1402，神經(jīng)網(wǎng)絡(luò)系統(tǒng)124確定第一神經(jīng)網(wǎng)絡(luò)識(shí)別的結(jié)果是否指示濁音。當(dāng)在步驟1402確定第一神經(jīng)網(wǎng)絡(luò)識(shí)別結(jié)果不指示濁音時(shí)，在步驟1416，神經(jīng)網(wǎng)絡(luò)系統(tǒng)124保留與當(dāng)前特性頻率區(qū)域相應(yīng)的語音信號(hào)相應(yīng)于濁音、清音還是背景噪聲的確定。其后，神經(jīng)網(wǎng)絡(luò)系統(tǒng)124接收新的特性頻率區(qū)域。
當(dāng)在步驟1402確定第一神經(jīng)網(wǎng)絡(luò)識(shí)別結(jié)果指示濁音時(shí)，在步驟1404，神經(jīng)網(wǎng)絡(luò)系統(tǒng)124將第一神經(jīng)網(wǎng)絡(luò)識(shí)別的確定結(jié)果輸出到控制器100?？刂破?00將確定結(jié)果輸出到下一階段的語音信號(hào)處理系統(tǒng)。
在步驟1406，神經(jīng)網(wǎng)絡(luò)系統(tǒng)124確定是否存在保留確定的特性頻率區(qū)域。當(dāng)在步驟1406確定不存在保留確定的特性頻率區(qū)域時(shí)，神經(jīng)網(wǎng)絡(luò)系統(tǒng)124接收新的特性頻率區(qū)域。當(dāng)在步驟1406確定存在保留確定的特性頻率區(qū)域，在步驟1408，神經(jīng)網(wǎng)絡(luò)系統(tǒng)124存儲(chǔ)從當(dāng)前特性頻率區(qū)域提取的特性信息。在步驟1410，神經(jīng)網(wǎng)絡(luò)系統(tǒng)124確定是否存儲(chǔ)對(duì)與保留確定的特性頻率區(qū)域的語音信號(hào)執(zhí)行確定所需的預(yù)設(shè)數(shù)量的特性頻率區(qū)域的特性信息。
當(dāng)在步驟1410確定不存儲(chǔ)預(yù)設(shè)數(shù)量的特性頻率區(qū)域的特性信息時(shí)，神經(jīng)網(wǎng)絡(luò)系統(tǒng)124接收新的特性頻率區(qū)域。當(dāng)在步驟1410確定存儲(chǔ)預(yù)設(shè)數(shù)量的特性頻率區(qū)域的特性信息時(shí)，在步驟1412，神經(jīng)網(wǎng)絡(luò)系統(tǒng)124將預(yù)設(shè)數(shù)量的特性頻率區(qū)域的特性信息提供給第二神經(jīng)網(wǎng)絡(luò)，并且執(zhí)行與保留確定的特性頻率區(qū)域相應(yīng)的語音信號(hào)的第二神經(jīng)網(wǎng)絡(luò)識(shí)別。在步驟1414，神經(jīng)網(wǎng)絡(luò)系統(tǒng)124根據(jù)第二神經(jīng)網(wǎng)絡(luò)識(shí)別結(jié)果確定與保留確定的特性頻率區(qū)域相應(yīng)的語音信號(hào)是清音還是背景噪聲，并且將確定結(jié)果輸出到控制器100?？刂破?00將根據(jù)第二神經(jīng)網(wǎng)絡(luò)識(shí)別結(jié)果的確定結(jié)果輸出到下一階段的語音信號(hào)處理系統(tǒng)，作為與保留確定的特性頻率區(qū)域相應(yīng)的語音信號(hào)的確定結(jié)果。
如上所述，根據(jù)本發(fā)明，通過合成地從輸入語音信號(hào)提取語音信號(hào)的特性信息，根據(jù)使用或不使用諧波峰值的各種語音信號(hào)處理系統(tǒng)的特性，可選擇性地提供語音信號(hào)處理系統(tǒng)請(qǐng)求的語音信號(hào)的特性。
盡管已經(jīng)參照其特定的優(yōu)選實(shí)施例顯示和描述了本發(fā)明，但本領(lǐng)域的技術(shù)人員應(yīng)該理解，在不脫離本發(fā)明的精神和范圍的情況下，可以對(duì)其進(jìn)行形式和細(xì)節(jié)的各種改變。具體地說，盡管在本發(fā)明的實(shí)施例中假定下一階段的語音信號(hào)處理系統(tǒng)向語音信號(hào)預(yù)處理系統(tǒng)請(qǐng)求包絡(luò)信息、基音信息和濁音/清音/背景噪聲確定結(jié)果信息，但是本發(fā)明不限于此。另外，盡管建議了提取包絡(luò)信息、基音信息和濁音/清音/背景噪聲確定結(jié)果信息的各種方法，但是可將執(zhí)行相同功能的其它方法作為建議的方法應(yīng)用于本發(fā)明。因此，本領(lǐng)域的技術(shù)人員應(yīng)該理解，在不脫離由權(quán)利要求限定的本發(fā)明的精神和范圍的情況下，可以對(duì)其進(jìn)行形式和細(xì)節(jié)的各種改變。
權(quán)利要求
1.一種語音信號(hào)預(yù)處理系統(tǒng)，包括語音信號(hào)識(shí)別單元，用于從輸入信號(hào)中識(shí)別語音，并且輸出所述輸入信號(hào)作為語音信號(hào)；語音信號(hào)轉(zhuǎn)換器，用于通過接收語音信號(hào)并且將接收的時(shí)域的語音信號(hào)轉(zhuǎn)換為頻域的語音信號(hào)來產(chǎn)生語音信號(hào)幀；形態(tài)學(xué)分析器，用于接收語音信號(hào)幀，并且通過形態(tài)學(xué)運(yùn)算產(chǎn)生具有基于形態(tài)學(xué)分析的信號(hào)波形的特性頻率區(qū)域；語音信號(hào)特性信息提取器，用于接收語音信號(hào)幀或基于形態(tài)學(xué)分析的特性頻率區(qū)域，并且提取下一階段的語音信號(hào)處理系統(tǒng)請(qǐng)求的語音信號(hào)特性信息；以及控制器，用于根據(jù)預(yù)設(shè)確定條件確定是否使用語音信號(hào)幀的諧波峰值提取語音信號(hào)的特性信息，并且當(dāng)使用諧波峰值時(shí)通過將語音信號(hào)幀輸出到語音信號(hào)特性信息提取器或者當(dāng)不使用諧波峰值時(shí)通過輸出語音信號(hào)幀的基于形態(tài)學(xué)分析的特性頻率區(qū)域，來提取語音信號(hào)處理系統(tǒng)請(qǐng)求的語音信號(hào)特性信息。
2.如權(quán)利要求1所述的語音信號(hào)預(yù)處理系統(tǒng)，其中，所述預(yù)設(shè)確定條件是輸入信號(hào)的特性或語音信號(hào)處理系統(tǒng)的特性。
3.如權(quán)利要求1所述的語音信號(hào)預(yù)處理系統(tǒng)，還包括諧波峰值提取器，用于從語音信號(hào)幀搜索和提取諧波峰值。
4.如權(quán)利要求1所述的語音信號(hào)預(yù)處理系統(tǒng)，還包括噪聲消除器，用于從語音信號(hào)幀中消除噪聲。
5.如權(quán)利要求1所述的語音信號(hào)預(yù)處理系統(tǒng)，其中，所述形態(tài)學(xué)分析器包括形態(tài)學(xué)濾波器，用于基于預(yù)設(shè)窗口尺寸執(zhí)行語音信號(hào)幀的形態(tài)學(xué)運(yùn)算，并且通過對(duì)轉(zhuǎn)換的語音信號(hào)波形執(zhí)行形態(tài)學(xué)閉運(yùn)算和預(yù)處理從形態(tài)學(xué)運(yùn)算的結(jié)果提取特性頻率；以及結(jié)構(gòu)組尺寸確定器，用于確定形態(tài)學(xué)濾波器的最佳結(jié)構(gòu)組尺寸，所述形態(tài)學(xué)濾波器對(duì)語音信號(hào)幀執(zhí)行形態(tài)學(xué)閉運(yùn)算。
6.如權(quán)利要求1所述的語音信號(hào)預(yù)處理系統(tǒng)，其中，所述語音信號(hào)特性信息提取器包括包絡(luò)提取器，用于根據(jù)形態(tài)學(xué)分析結(jié)果從語音信號(hào)幀或特性頻率區(qū)域提取諧波峰值的包絡(luò)信息和非諧波峰值的包絡(luò)信息中的至少一個(gè)；基音提取器，用于根據(jù)形態(tài)學(xué)分析結(jié)果使用語音信號(hào)幀或特性頻率區(qū)域提取基音信息；以及神經(jīng)網(wǎng)絡(luò)系統(tǒng)，用于根據(jù)形態(tài)學(xué)分析結(jié)果從語音信號(hào)幀或特性頻率區(qū)域檢測特性信息，將預(yù)設(shè)權(quán)重賦予每條檢測的特性信息，并且根據(jù)神經(jīng)網(wǎng)絡(luò)識(shí)別結(jié)果確定語音信號(hào)幀相應(yīng)于濁音、清音還是背景噪聲。
7.如權(quán)利要求6所述的語音信號(hào)預(yù)處理系統(tǒng)，其中，所述神經(jīng)網(wǎng)絡(luò)系統(tǒng)具有兩個(gè)神經(jīng)網(wǎng)絡(luò)。
8.如權(quán)利要求7所述的語音信號(hào)預(yù)處理系統(tǒng)，其中，如果根據(jù)第一神經(jīng)網(wǎng)絡(luò)識(shí)別，語音信號(hào)幀或與特性頻率區(qū)域相應(yīng)的語音信號(hào)的確定結(jié)果不指示濁音，則神經(jīng)網(wǎng)絡(luò)系統(tǒng)保留語音信號(hào)幀或特性頻率區(qū)域的確定，使用第一神經(jīng)網(wǎng)絡(luò)的對(duì)至少一個(gè)不同的語音信號(hào)幀或特性頻率區(qū)域的濁音/清音/背景噪聲確定結(jié)果和從不同的語音信號(hào)幀或特性頻率區(qū)域提取的各種特性信息的次要統(tǒng)計(jì)值，來執(zhí)行第二神經(jīng)網(wǎng)絡(luò)識(shí)別，并且根據(jù)第二神經(jīng)網(wǎng)絡(luò)識(shí)別的結(jié)果來確定輸入語音信號(hào)幀相應(yīng)于濁音、清音還是背景噪聲。
9.如權(quán)利要求6所述的語音信號(hào)預(yù)處理系統(tǒng)，其中，所述基音提取器通過從特性頻率區(qū)域檢測諧波區(qū)域與噪聲區(qū)域的能量比并將具有最大能量比的峰值確定為基音信息來提取基音信息。
10.如權(quán)利要求5所述的語音信號(hào)預(yù)處理系統(tǒng)，其中，所述包絡(luò)提取器通過在第一基音周期從語音信號(hào)幀或特性頻率區(qū)域檢測最大峰值作為第一諧波峰值，通過檢測后來的搜索區(qū)域的最大諧波峰值的處理選擇諧波峰值，并且將內(nèi)插應(yīng)用于選擇的諧波峰值，來提取諧波峰值包絡(luò)信息。
11.如權(quán)利要求10所述的語音信號(hào)預(yù)處理系統(tǒng)，其中，所述包絡(luò)提取器通過選擇沒有被選為諧波峰值的峰值并將內(nèi)插應(yīng)用于選擇的峰值來提取非諧波峰值包絡(luò)信息。
12.如權(quán)利要求11所述的語音信號(hào)預(yù)處理系統(tǒng)，所述控制器使用諧波峰值包絡(luò)信息和非諧波峰值包絡(luò)信息確定語音信號(hào)幀相應(yīng)于濁音還是清音。
13.如權(quán)利要求12所述的語音信號(hào)預(yù)處理系統(tǒng)，還包括濁音度計(jì)算器，用于通過計(jì)算諧波峰值包絡(luò)信息與非諧波峰值包絡(luò)信息的能量比來計(jì)算濁音度。
14.如權(quán)利要求13所述的語音信號(hào)預(yù)處理系統(tǒng)，其中，所述控制器通過將計(jì)算的濁音度與預(yù)設(shè)濁音閾值進(jìn)行比較或與預(yù)設(shè)濁音閾值和預(yù)設(shè)清音閾值兩者進(jìn)行比較，來確定語音信號(hào)幀或與特性頻率區(qū)域相應(yīng)的語音信號(hào)是濁音、清音還是背景噪聲。
15.如權(quán)利要求13所述的語音信號(hào)預(yù)處理系統(tǒng)，其中，所述包絡(luò)提取器通過使用諧波峰值包絡(luò)信息從選擇的諧波峰值選擇次要諧波峰值并將內(nèi)插應(yīng)用于選擇的次要諧波峰值，來提取次要諧波峰值包絡(luò)信息。
16.如權(quán)利要求15所述的語音信號(hào)預(yù)處理系統(tǒng)，其中，所述濁音度計(jì)算器通過計(jì)算次要諧波峰值包絡(luò)信息與非諧波峰值包絡(luò)信息的能量比來計(jì)算濁音度。
17.如權(quán)利要求13所述的語音信號(hào)預(yù)處理系統(tǒng)，其中，所述控制器通過將計(jì)算的濁音度與預(yù)設(shè)濁音閾值進(jìn)行比較或與預(yù)設(shè)濁音閾值和預(yù)設(shè)清音閾值兩者進(jìn)行比較，來確定語音信號(hào)幀或與特性頻率區(qū)域相應(yīng)的語音信號(hào)是濁音、清音還是背景噪聲。
18.一種提取語音信號(hào)的特性信息的方法，所述方法包括步驟通過從輸入信號(hào)中識(shí)別語音，提取所述語音，將接收的時(shí)域的語音信號(hào)轉(zhuǎn)換為頻域的語音信號(hào)，并且輸出語音信號(hào)，從而產(chǎn)生語音信號(hào)幀；根據(jù)預(yù)設(shè)確定條件確定是否使用語音信號(hào)幀的諧波峰值提取語音信號(hào)的特性信息；根據(jù)諧波峰值使用確定結(jié)果執(zhí)行語音信號(hào)幀的形態(tài)學(xué)分析，并且根據(jù)形態(tài)學(xué)分析結(jié)果提取特性頻率區(qū)域；根據(jù)諧波峰值使用確定結(jié)果使用特性頻率區(qū)域或語音信號(hào)幀來提取下一階段的語音信號(hào)處理系統(tǒng)請(qǐng)求的語音信號(hào)特性信息；以及將提取的語音信號(hào)特性信息輸出到語音信號(hào)處理系統(tǒng)。
19.如權(quán)利要求18所述的方法，其中，產(chǎn)生語音信號(hào)幀的步驟包括從輸入信號(hào)中識(shí)別語音信號(hào)；通過將接收的時(shí)域的語音信號(hào)轉(zhuǎn)換為頻域的語音信號(hào)來產(chǎn)生語音信號(hào)幀；以及從語音信號(hào)幀消除噪聲。
20.如權(quán)利要求19所述的方法，其中，消除噪聲的步驟包括通過根據(jù)語音信號(hào)幀的幅度設(shè)置權(quán)重，基于設(shè)置的權(quán)重執(zhí)行每個(gè)幅度的平方運(yùn)算，并且基于預(yù)設(shè)閾值將(+)或(-)符號(hào)賦予平方運(yùn)算的結(jié)果，來設(shè)置較大的具有小于預(yù)設(shè)閾值的幅度的信號(hào)與具有大于或等于預(yù)設(shè)閾值的幅度的信號(hào)的幅度比。
21.如權(quán)利要求18所述的方法，其中，確定步驟還包括根據(jù)語音信號(hào)的特性或下一階段的語音信號(hào)處理系統(tǒng)的特性確定是否使用語音信號(hào)幀的諧波峰值提取語音信號(hào)的特性信息。
22.如權(quán)利要求18所述的方法，其中，執(zhí)行步驟包括確定形態(tài)學(xué)濾波器的最佳結(jié)構(gòu)組尺寸，所述形態(tài)學(xué)濾波器對(duì)語音信號(hào)幀執(zhí)行形態(tài)學(xué)閉運(yùn)算；根據(jù)確定的最佳結(jié)構(gòu)組尺寸基于窗口尺寸對(duì)語音信號(hào)幀執(zhí)行形態(tài)學(xué)運(yùn)算；以及通過使用形態(tài)學(xué)運(yùn)算結(jié)果執(zhí)行語音信號(hào)幀的形態(tài)學(xué)閉運(yùn)算并執(zhí)行預(yù)處理來提取特性頻率，在所述預(yù)處理中，通過從轉(zhuǎn)換的語音信號(hào)中去除階梯信號(hào)僅獲得諧波信號(hào)。
23.如權(quán)利要求22所述的方法，其中，確定最佳結(jié)構(gòu)組尺寸的步驟由下面的等式表示窗口尺寸＝(最佳結(jié)構(gòu)組尺寸×2+1)。
24.如權(quán)利要求18所述的方法，其中，提取語音信號(hào)特性信息的步驟包括從語音信號(hào)幀或特性頻率區(qū)域提取包絡(luò)信息。
25.如權(quán)利要求24所述的方法，其中，提取包絡(luò)信息的步驟包括接收語音信號(hào)幀或特性頻率區(qū)域；在第一基音周期從語音信號(hào)幀或特性頻率區(qū)域檢測最大峰值作為第一諧波峰值；選擇后來的搜索區(qū)域的諧波峰值；以及通過將內(nèi)插應(yīng)用于選擇的諧波峰值來提取諧波峰值包絡(luò)信息。
26.如權(quán)利要求25所述的方法，還包括通過選擇沒有被選為諧波峰值的峰值并將內(nèi)插應(yīng)用于選擇的沒有被選為諧波峰值的峰值，來提取非諧波峰值包絡(luò)信息。
27.如權(quán)利要求18所述的方法，其中，提取語音信號(hào)特性信息的步驟包括從語音信號(hào)幀或特性頻率區(qū)域提取基音信息。
28.如權(quán)利要求27所述的方法，其中，提取基音信息的步驟包括從語音信號(hào)幀或特性頻率區(qū)域檢測諧波區(qū)域與噪聲區(qū)域的能量比；以及通過將具有最大能量比的峰值確定為基音信息來提取基音信息。
29.如權(quán)利要求18所述的方法，其中，提取語音信號(hào)特性信息的步驟包括確定語音信號(hào)幀或與特性頻率區(qū)域相應(yīng)的語音信號(hào)相應(yīng)于濁音、清音還是背景噪聲。
30.如權(quán)利要求29所述的方法，其中，確定步驟包括根據(jù)預(yù)設(shè)條件確定使用從語音信號(hào)幀或特性頻率區(qū)域提取的包絡(luò)信息還是使用利用從語音信號(hào)幀或特性頻率區(qū)域提取的特性信息的神經(jīng)網(wǎng)絡(luò)識(shí)別方法；以及通過根據(jù)依照預(yù)設(shè)條件的確定結(jié)果選擇使用包絡(luò)信息的方法或神經(jīng)網(wǎng)絡(luò)識(shí)別方法，來確定語音信號(hào)幀或與特性頻率區(qū)域相應(yīng)的語音信號(hào)相應(yīng)于濁音、清音還是背景噪聲。
31.如權(quán)利要求30所述的方法，其中，使用包絡(luò)信息的方法包括接收語音信號(hào)幀或特性頻率區(qū)域；從語音信號(hào)幀或特性頻率區(qū)域選擇諧波峰值；通過將內(nèi)插應(yīng)用于選擇的諧波峰值提取諧波峰值包絡(luò)信息；通過選擇沒有被選為諧波峰值的峰值并將內(nèi)插應(yīng)用于選擇的沒有被選為諧波峰值的峰值，來提取非諧波峰值包絡(luò)信息；計(jì)算諧波峰值包絡(luò)信息與非諧波峰值包絡(luò)信息的能量比作為濁音度；以及根據(jù)濁音度確定語音信號(hào)幀或與特性頻率區(qū)域相應(yīng)的語音信號(hào)相應(yīng)于濁音還是清音。
32.如權(quán)利要求31所述的方法，其中，提取諧波峰值包絡(luò)信息的步驟包括使用提取的諧波峰值包絡(luò)信息從選擇的諧波峰值中選擇次要諧波峰值；以及通過將內(nèi)插應(yīng)用于選擇的次要諧波峰值并且提取次要諧波峰值的信息作為次要諧波峰值包絡(luò)信息，來提取次要諧波峰值的包絡(luò)信息。
33.如權(quán)利要求32所述的方法，其中，計(jì)算濁音度的步驟包括計(jì)算次要諧波峰值包絡(luò)信息與非諧波峰值包絡(luò)信息的能量比作為濁音度。
34.如權(quán)利要求31所述的方法，其中，確定步驟包括將計(jì)算的濁音度與預(yù)設(shè)濁音閾值進(jìn)行比較，并且根據(jù)比較結(jié)果確定語音信號(hào)幀或與特性頻率區(qū)域相應(yīng)的語音信號(hào)相應(yīng)于濁音還是清音。
35.如權(quán)利要求31所述的方法，其中，確定步驟包括將計(jì)算的濁音度與預(yù)設(shè)濁音閾值和預(yù)設(shè)清音閾值兩者進(jìn)行比較，并且根據(jù)比較結(jié)果確定語音信號(hào)幀或與特性頻率區(qū)域相應(yīng)的語音信號(hào)是濁音、清音還是背景噪聲。
36.如權(quán)利要求30所述的方法，其中，神經(jīng)網(wǎng)絡(luò)識(shí)別方法包括從語音信號(hào)幀或特性頻率區(qū)域提取特性信息；以及通過將預(yù)設(shè)權(quán)重賦予提取的特性信息并基于賦予的權(quán)重執(zhí)行神經(jīng)網(wǎng)絡(luò)操作，來確定語音信號(hào)幀或與特性頻率區(qū)域相應(yīng)的語音信號(hào)是濁音、清音還是背景噪聲。
37.如權(quán)利要求30所述的方法，其中，神經(jīng)網(wǎng)絡(luò)識(shí)別方法包括從語音信號(hào)幀或特性頻率區(qū)域提取特性信息；通過將提取的特性信息和賦予提取的特性信息的權(quán)重輸入到第一神經(jīng)網(wǎng)絡(luò)，來確定語音信號(hào)幀或與特性頻率區(qū)域相應(yīng)的語音信號(hào)是否是濁音；如果由第一神經(jīng)網(wǎng)絡(luò)識(shí)別結(jié)果確定語音信號(hào)幀或與特性頻率區(qū)域相應(yīng)的語音信號(hào)是濁音，則輸出第一神經(jīng)網(wǎng)絡(luò)識(shí)別結(jié)果作為語音信號(hào)幀或與特性頻率區(qū)域相應(yīng)的語音信號(hào)的確定結(jié)果，如果由第一神經(jīng)網(wǎng)絡(luò)識(shí)別結(jié)果確定語音信號(hào)幀或與特性頻率區(qū)域相應(yīng)的語音信號(hào)不是濁音，則保留語音信號(hào)幀或與特性頻率區(qū)域相應(yīng)的語音信號(hào)的確定；如果由第一神經(jīng)網(wǎng)絡(luò)識(shí)別結(jié)果確定語音信號(hào)幀或與特性頻率區(qū)域相應(yīng)的語音信號(hào)是濁音，則檢查是否存在保留確定的語音信號(hào)；如果由檢查結(jié)果確定存在保留確定的語音信號(hào)，則存儲(chǔ)從多于預(yù)設(shè)數(shù)量的語音信號(hào)幀或特性頻率區(qū)域提取的特性信息；通過將保留確定的語音信號(hào)的第一神經(jīng)網(wǎng)絡(luò)識(shí)別結(jié)果、從多于預(yù)設(shè)數(shù)量的語音信號(hào)幀或特性頻率區(qū)域提取的信息的次要統(tǒng)計(jì)值、和對(duì)第一神經(jīng)網(wǎng)絡(luò)識(shí)別結(jié)果和次要統(tǒng)計(jì)值設(shè)置的權(quán)重輸入到第二神經(jīng)網(wǎng)絡(luò)，來確定語音信號(hào)幀或與特性頻率區(qū)域相應(yīng)的語音信號(hào)是清音還是背景噪聲；以及根據(jù)第二神經(jīng)網(wǎng)絡(luò)識(shí)別結(jié)果確定保留確定的語音信號(hào)是濁音、清音還是背景噪聲。
全文摘要
提供一種語音信號(hào)預(yù)處理系統(tǒng)和一種用于提取語音信號(hào)的特性信息的方法。為此，確定是否使用諧波峰值提取輸入語音信號(hào)的特性信息。根據(jù)確定結(jié)果，將根據(jù)形態(tài)學(xué)分析結(jié)果得到的語音信號(hào)幀或特性頻率區(qū)域輸入到語音信號(hào)特性信息提取器，所述語音信號(hào)特性信息提取器用于提取下一階段的語音信號(hào)處理系統(tǒng)請(qǐng)求的語音信號(hào)特性信息。通過控制器選擇的語音信號(hào)特性信息提取器接收語音信號(hào)幀或根據(jù)形態(tài)學(xué)分析結(jié)果得到的特性頻率區(qū)域，并且提取下一階段的語音信號(hào)處理系統(tǒng)請(qǐng)求的語音信號(hào)特性信息。
文檔編號(hào)G10L25/30GK101051460SQ200710079190
公開日2007年10月10日申請(qǐng)日期2007年2月15日優(yōu)先權(quán)日2006年4月5日
發(fā)明者金炫秀申請(qǐng)人:三星電子株式會(huì)社

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：金炫秀
技術(shù)所有人：三星電子株式會(huì)社
我是此專利的發(fā)明人

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

語音信號(hào)預(yù)處理相關(guān)技術(shù)

語音信號(hào)的預(yù)處理相關(guān)技術(shù)

語音信號(hào)特征提取相關(guān)技術(shù)

語音信號(hào)的特征提取相關(guān)技術(shù)

語音信號(hào)特征提取方法相關(guān)技術(shù)

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

提取語音信號(hào)的特性信息的語音信號(hào)預(yù)處理系統(tǒng)及方法