專利名稱:具有改進(jìn)的音調(diào)檢測(cè)編碼語(yǔ)音傳輸系統(tǒng)和方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種傳輸系統(tǒng),其包括一個(gè)發(fā)射器,發(fā)射器帶有一個(gè)從準(zhǔn)周期信號(hào)導(dǎo)出編碼信號(hào)的編碼器,設(shè)置發(fā)射器用于通過(guò)一種介質(zhì)向接收器發(fā)送編碼信號(hào),編碼器包括一個(gè)用于從準(zhǔn)周期信號(hào)得到音調(diào)(pitch)信息的音調(diào)檢測(cè)器。
本發(fā)明還涉及一種編碼器,一種用于檢測(cè)準(zhǔn)周期信號(hào)的周期的檢測(cè)器和一種音調(diào)檢測(cè)方法。
從Y.M.Cheng和D.O.Shunghnessy在IEEE Transaction onAcoustics,“語(yǔ)音及信號(hào)處理”(Speech and Signal Processing),Vol.ASSP-23,pp.418-423,1976上發(fā)表的文章“聲門封閉瞬間和周期的自動(dòng)和可靠的估計(jì)” (“Automatic and Reliable Estimation of GlottalClosure Instant and Period”)中已知一種在開始段中定義的在傳輸系統(tǒng)中使用的音調(diào)檢測(cè)器。
這樣的傳輸系統(tǒng)用于例如通過(guò)象無(wú)線信道,同軸電纜或玻璃纖維這樣的傳輸介質(zhì)傳輸語(yǔ)音信號(hào)。另外,這樣的傳輸系統(tǒng)還可以用于在磁帶或磁盤這樣的存貯介質(zhì)上存貯語(yǔ)音信號(hào)。例如應(yīng)用于自動(dòng)電話應(yīng)答機(jī)和錄音電話機(jī)。
一個(gè)語(yǔ)音信號(hào)由清音和濁音部分組成。當(dāng)發(fā)出一些輔音時(shí)會(huì)產(chǎn)生語(yǔ)音信號(hào)的清音分量而且顯示不出任何周期性。當(dāng)發(fā)元音時(shí)會(huì)產(chǎn)生語(yǔ)音信號(hào)的濁音分量并有或多或少的周期性。這樣一種信號(hào)也稱為準(zhǔn)周期的信號(hào)。這樣一種信號(hào)的一個(gè)重要參數(shù)就是周期,通常稱為音調(diào)。對(duì)于各種語(yǔ)音編碼器,精確計(jì)算語(yǔ)音信號(hào)發(fā)聲部分的音調(diào)是極為重要的。
確定音調(diào)的第一種方法是計(jì)算準(zhǔn)周期信號(hào)的自相關(guān)函數(shù),并由自相關(guān)函數(shù)兩個(gè)峰值之間延遲的差代表音調(diào)信息。但是問(wèn)題是在具有給定時(shí)間期間的信號(hào)段上計(jì)算的是一個(gè)單一的音調(diào)值。在該給定時(shí)間期間中音調(diào)的任何變化都不能測(cè)出,只導(dǎo)致自相關(guān)函數(shù)峰點(diǎn)的(不希望)變寬。
在從所說(shuō)的文章已知的音調(diào)檢測(cè)器中,從語(yǔ)音信號(hào)和人類語(yǔ)言系統(tǒng)對(duì)由關(guān)閉聲帶引起的激勵(lì)信號(hào)的模擬響應(yīng)信號(hào)之間的互相關(guān)函數(shù)中得出音調(diào)信息。人類語(yǔ)言系統(tǒng)的特性用從語(yǔ)音信號(hào)獲得的線性推算參數(shù)來(lái)描述。從這個(gè)互相關(guān)函數(shù)獲得一個(gè)信號(hào),該信號(hào)中出現(xiàn)的峰值表示激勵(lì)瞬間。從這個(gè)信號(hào)中減去這個(gè)信號(hào)的平均值并限幅,而得到脈沖形信號(hào),其中脈沖表示激勵(lì)瞬間,脈沖會(huì)在音調(diào)不是常數(shù)的信號(hào)中丟失,或者次級(jí)脈沖可以作為暫時(shí)過(guò)高或過(guò)低平均值的結(jié)果出現(xiàn)。這會(huì)導(dǎo)致音調(diào)檢測(cè)可靠性下降。
本發(fā)明的目的如開始段所提出的是提供一種傳輸系統(tǒng),其中準(zhǔn)周期信號(hào)對(duì)于可靠的音調(diào)檢測(cè)無(wú)需是恒定的。
為此,本發(fā)明的特征在于音調(diào)檢測(cè)器包括用于選擇代表準(zhǔn)周期信號(hào)的輔助信號(hào)的特征信號(hào)部分的選擇裝置,用于搜索與特征輔助信號(hào)部分充分響應(yīng)的至少另一個(gè)信號(hào)部分的搜索裝置,和用于從特征輔助信號(hào)部分和另外的信號(hào)部分產(chǎn)生的瞬間得到的音調(diào)信息的裝置。
通過(guò)從輔助信號(hào)中選擇一個(gè)特征輔助信號(hào)部分,并搜索輔助信號(hào)至少另一個(gè)與特征輔助信號(hào)部分充分響應(yīng)的輔助信號(hào)部分,而無(wú)需利用恒定的準(zhǔn)周期信號(hào)就能夠得到音調(diào)信息。
本發(fā)明另一個(gè)優(yōu)點(diǎn)是無(wú)需計(jì)算線性推算參數(shù),從而使本發(fā)明的音調(diào)檢測(cè)器比現(xiàn)有技術(shù)的音調(diào)檢測(cè)器更簡(jiǎn)單。又一個(gè)優(yōu)點(diǎn)是避免了在一個(gè)音調(diào)周期中存在兩個(gè)激勵(lì)脈沖時(shí)發(fā)生的錯(cuò)誤的音調(diào)檢測(cè)。在這方面,會(huì)出現(xiàn)在語(yǔ)音信號(hào)的一個(gè)音調(diào)周期中有規(guī)則地產(chǎn)生兩個(gè)激勵(lì)瞬間的情況。在這種情況下,現(xiàn)有技術(shù)的用于搜索激勵(lì)瞬間的音調(diào)檢測(cè)器會(huì)錯(cuò)誤計(jì)算音調(diào)周期。由于本發(fā)明的音調(diào)檢測(cè)器不搜索激勵(lì)瞬間,而是使特征輔助信號(hào)部分重復(fù)出現(xiàn),所以,不會(huì)發(fā)生音調(diào)周期的這種錯(cuò)誤計(jì)算。
本發(fā)明的一個(gè)實(shí)施例的特征在于特征輔助信號(hào)部分包括一個(gè)在單位時(shí)間段上具有最大能量的信號(hào)部分。
一種合適的特征輔助信號(hào)部分是在單位時(shí)間段上能量最大的輔助信號(hào)部分。通過(guò)搜索最大工作能量函數(shù)值就可以簡(jiǎn)單發(fā)現(xiàn)這樣一種信號(hào)部分。通過(guò)對(duì)輔助信號(hào)進(jìn)行由偶函數(shù)表述其運(yùn)算的非線性運(yùn)算,并對(duì)這種運(yùn)算的結(jié)果關(guān)于單位時(shí)間間隔進(jìn)行積分,就可以計(jì)算出工作能量函數(shù)值。合適的偶函數(shù)是f(x)=x2和f(x)=|x|。尋找特征輔助信號(hào)部分的另一種方法是在單位時(shí)間段中搜索輔助信號(hào)的最大值。總之,具有最大強(qiáng)度的輔助信號(hào)部分適合用作特征輔助信號(hào)部分。
本發(fā)明另一個(gè)實(shí)施例的特征在于特征輔助信號(hào)部分的時(shí)間期限小于或等于所出現(xiàn)的最簡(jiǎn)短的音調(diào)周期。
一種合適的特征輔助信號(hào)部分是一個(gè)音調(diào)周期或其有效部分。通過(guò)取得長(zhǎng)度最簡(jiǎn)短的音調(diào)周期的特征輔助信號(hào)部分,在絕大多數(shù)情況下都能夠發(fā)現(xiàn)一種合適的特征輔助信號(hào)部分??梢愿鶕?jù)產(chǎn)生的音調(diào)周期選擇輔助信號(hào)部分的長(zhǎng)度,以獲得自適應(yīng)系統(tǒng)。
本發(fā)明又一個(gè)實(shí)施例的特征在于搜索裝置包括用于計(jì)算特征輔助信號(hào)部分和輔助信號(hào)之間相關(guān)性,和用在相關(guān)函數(shù)中峰值的位置表示音調(diào)信息的相關(guān)裝置。
一種搜索與特征輔助信號(hào)部分相對(duì)應(yīng)的其它輔助信號(hào)部分的簡(jiǎn)單方法是計(jì)算特征輔助信號(hào)部分和輔助信號(hào)之間的互相關(guān)函數(shù)。然后,用互相關(guān)函數(shù)的最大值的位置表示音調(diào)信息。可以從互相關(guān)函數(shù)的兩個(gè)相鄰最大值之間的時(shí)間差計(jì)算出音調(diào)周期。
本發(fā)明另一個(gè)實(shí)施例的特征在于音調(diào)檢測(cè)器包括用于計(jì)算互相關(guān)函數(shù)中波峰表面的裝置,設(shè)置音調(diào)檢測(cè)器用于從互相關(guān)函數(shù)與時(shí)間的關(guān)系曲線的波峰表面獲得音調(diào)信息。
實(shí)驗(yàn)表明特征輔助信號(hào)部分和輔助信號(hào)的互相關(guān)函數(shù)不僅具有所需要的波峰,而且還具有寬度小于所需要波峰的不希望的副峰。通過(guò)用具有和自相關(guān)函數(shù)中相對(duì)應(yīng)的波峰表面成比例的幅值的脈沖表示音調(diào)信息,在需要和不需要的波峰之間進(jìn)行鑒別就會(huì)變得更簡(jiǎn)單了。通過(guò)用擴(kuò)展表面值代替表面可以進(jìn)一步簡(jiǎn)化鑒別。獲得擴(kuò)展表面值的一種合適方法是用波峰表面乘以對(duì)應(yīng)波峰的最大值。
可以看出,本發(fā)明不限于語(yǔ)言信號(hào)的音調(diào)檢測(cè),而是還可以用于確定兩個(gè)或更多信號(hào)分量之間的延遲。這類例子是多個(gè)源的分離,這種情況可能發(fā)生在象在雷達(dá)系統(tǒng)中用于抑制背景噪聲和形成射束這樣的系統(tǒng)中。在這種應(yīng)用中,可能會(huì)發(fā)生準(zhǔn)周期信號(hào)不會(huì)具有超過(guò)兩個(gè)周期的情況。
通過(guò)參照后面描述的實(shí)施例的說(shuō)明,本發(fā)明的這些和其它方面會(huì)是很清楚的。
在附圖中
圖1表示的是一種采用本發(fā)明的傳輸系統(tǒng);圖2表示的是本發(fā)明的音調(diào)檢測(cè)器的一個(gè)實(shí)施例;圖3表示的是各種可能會(huì)在圖2所示的音調(diào)檢測(cè)器中發(fā)生的信號(hào)波形;和圖4表示的是用于根據(jù)本發(fā)明確定音調(diào)的可編程處理器的程序流程圖。
在圖1所示的傳輸系統(tǒng)中,向發(fā)射器2施加一個(gè)數(shù)字語(yǔ)音信號(hào)S′〔n〕。在這個(gè)發(fā)射器2中,將語(yǔ)音信號(hào)S′〔n〕施加給編碼器,其中將語(yǔ)言信號(hào)S′〔n〕施加給音調(diào)檢測(cè)器12和音調(diào)同步編碼裝置10。將音調(diào)檢測(cè)器12上以音調(diào)信息作為輸出信號(hào)的一個(gè)輸出端與多路復(fù)用處理器14的一個(gè)輸入端和音調(diào)同步編碼裝置10的第一輸入端相連。音調(diào)同步編碼裝置10的一個(gè)輸出端與多路復(fù)用處理器14的第二輸入端相連。多路復(fù)用處理器14的輸出端與發(fā)射器2的輸出端相耦合。
發(fā)射器2的輸出端通過(guò)通路4與接收器6的輸入端相連。接收器6的輸入端與信號(hào)分離器16的輸入端相連。信號(hào)分離器的第一輸出端與音調(diào)同步解碼器18的第一輸入端相連。信號(hào)分離器16上將音調(diào)信息作為其輸出信號(hào)傳輸?shù)牡诙敵龆伺c音調(diào)同步解碼器18的第二輸入端相連。音調(diào)同步解碼器18上將再建語(yǔ)音信號(hào)作為其輸出信號(hào)傳輸?shù)囊粋€(gè)輸出端與接收器6的輸出端相連。
在圖1所示的傳輸系統(tǒng)中,用音調(diào)檢測(cè)器12從準(zhǔn)周期語(yǔ)言信號(hào)中獲得音調(diào)信息。音調(diào)同步解碼器10使用音調(diào)信息以減少編碼信號(hào)所必須的傳輸容量。音調(diào)同步解碼器10的例子記錄在由P.Hedelin發(fā)表在Proceedings of the International Conference of the IEEE,ASSP’84,SanDiego,1984上的文章“A glottal LPC-vocoder”和由W.B.Kleyn發(fā)表在IEEE Transactions on Speech and Audio processing,Val.1,No.4,October 1993上的文章“Encoding Speech Using PrototypeWaveforms”中。
由多路復(fù)用處理器14將編碼語(yǔ)音信號(hào)和音調(diào)信息組合成一個(gè)單獨(dú)的編碼輸出信號(hào)。這個(gè)編碼輸出信號(hào)由傳輸通路4傳送給接收器6。
在接收器6中,接收的信號(hào)被檢測(cè)并被變換成數(shù)字信號(hào)。這個(gè)數(shù)字信號(hào)由信號(hào)分離器16分離成一個(gè)編碼信號(hào)和一個(gè)代表音調(diào)信息的信號(hào)。音調(diào)同步解碼器18從編碼信號(hào)和音調(diào)信息中得到再建語(yǔ)音信號(hào)。這種再建語(yǔ)音信號(hào)在接收器6的輸出端輸出。
在圖2所示的音調(diào)檢測(cè)器中,將準(zhǔn)周期信號(hào)S′〔n〕施加給低通濾波器20。低通濾波器20上將輔助信號(hào)S〔n〕作為其輸出信號(hào)輸出的輸出端與能量測(cè)量裝置22的輸入端、選擇裝置24的第一輸入端和包絡(luò)檢波器30的輸入端相連。
能量測(cè)量裝置22上傳輸輸出信號(hào)E〔n〕的輸出端與選擇裝置24的第二輸入端相連。選擇裝置24上將特征輔助信號(hào)部分f〔n〕作為其輸出信號(hào)的輸出端與此處由相關(guān)器28形成的搜索裝置的第一輸入端相連。可控放大器26上傳輸輸出信號(hào)Sec〔n〕的輸出端與相關(guān)器28的第二輸入端相連。包絡(luò)檢波器30上傳輸控制信號(hào)ec〔n〕的輸出端與可控放大器26的控制端相連??煽胤糯笃?6和包絡(luò)檢波器30一起形成幅度控制裝置。
相關(guān)器28上傳輸輸出信號(hào)Rf〔n〕的輸出端與積分器32相連。積分器32上傳輸輸出信號(hào)A〔n〕的輸出端與展開裝置34的輸入端相連,同時(shí),展開裝置34上傳輸輸出信號(hào)P〔n〕的輸出端與檢測(cè)器36的輸入端相連。在檢測(cè)器36的輸出端具有信號(hào)P′〔n〕形式的音調(diào)信息。
為除去信號(hào)中頻率較高和對(duì)音調(diào)檢測(cè)會(huì)有干擾的信號(hào)成分,用低通濾波器20對(duì)由信號(hào)S′〔n〕數(shù)字表示的語(yǔ)音信號(hào)進(jìn)行濾波。選擇低通濾波器20的截止頻率,以使其超過(guò)可能的最高音調(diào)頻率。在實(shí)際中能夠使用的已經(jīng)得出的數(shù)值是600Hz。
對(duì)于N個(gè)取樣長(zhǎng)度的段,能量測(cè)量裝置22計(jì)算取樣長(zhǎng)度為M的輔助信號(hào)部分的工作能量函數(shù)。已證明,合適期限段是例如為40ms,而對(duì)于工作能量函數(shù),2ms的期間是合適的。采用8KHz的采樣頻率, N等于320,M等于16。對(duì)于信號(hào)E〔n〕,可以寫成E[n]=Σk=0MS2(n+k)0≤n≤N-M----(1)]]>特征輔助信號(hào)部分現(xiàn)在是工作能量函數(shù)E〔n〕最大的輔助信號(hào)部分。如果假設(shè)對(duì)n=nm,E〔n〕最大,則特征輔助信號(hào)部分f〔n〕等于
通過(guò)選擇裝置24并采用從E〔n〕計(jì)算出的值nm能夠從信號(hào)S〔n〕中得到這個(gè)輔助信號(hào)部分f〔n〕。相關(guān)器28計(jì)算出現(xiàn)在可控放大器26輸出端的幅度控制信號(hào)Sec〔n〕的互相函數(shù)Rsf〔n〕。對(duì)于這個(gè)互相關(guān)函數(shù)Rsf〔n〕,下式成立Rsf[n]=Σk=0MMAX{f(k)·Sec[n-k],0},M2≤n≤N-M2----(3)]]>(3)還可以寫成Rsf[n]=Σk=0MMAX{S[nm+k]·Sec[n+k],0},M2≤n≤N-M2----(4)]]>在(3)和(4)中采用MAX函數(shù)以避免出現(xiàn)負(fù)值的Rsf〔n〕。當(dāng)搜索與特征輔助信號(hào)部分相對(duì)應(yīng)的信號(hào)部分的時(shí)候,這些負(fù)的互相關(guān)值一點(diǎn)也不重要。
由積分器32得到一個(gè)信號(hào)A〔n〕,信號(hào)A〔n〕是對(duì)屬于互相關(guān)函數(shù)Rsf〔n〕中各n值的波峰表面的度量。在互相關(guān)函數(shù)中的第K個(gè)波峰可以表述為
bk和ek表示自相關(guān)函數(shù)的第K個(gè)波峰的開始和結(jié)束。對(duì)于第K個(gè)波峰的表面AK,下式成立ak=Σi=bkekLk[i]----(6)]]>屬于ak的nk值是屬于波峰Lk〔n〕的最大值mk的n值。這樣,對(duì)于mk下述成立mk=MAX{Lk[n]} (7)用ak的最大值來(lái)度量表面A,以使數(shù)值A(chǔ)〔n〕小于或等于一。這樣,對(duì)于函數(shù)A〔n〕可用下式表示
在(8)中,q是信號(hào)段中波峰的個(gè)數(shù)。將函數(shù)Rsf〔n〕變換成函數(shù)A〔n〕會(huì)導(dǎo)致函數(shù)Rsf〔n〕不需要的副峰相對(duì)衰減,這是由于這些不需要的脈沖不僅低,而且寬度還窄,所以使副波峰的表面顯著小于所需波峰的表面。
為進(jìn)一步擴(kuò)大所需波峰與不需要的副峰之間的差,展開裝置34進(jìn)行非線性運(yùn)算,其中A〔n〕的大值被放大超過(guò)A〔n〕的小值。這可以通過(guò)例如用函A〔n〕北乘以mk的相應(yīng)值來(lái)實(shí)現(xiàn)。這樣對(duì)于展開裝置的輸出信號(hào)P〔n〕,下式成立
可以用對(duì)A〔n〕進(jìn)行不同的非線性運(yùn)算來(lái)代替(9)。
檢測(cè)器36從信號(hào)P〔n〕中去除不需要的副脈沖。前一種選擇可以是去除彼此間隔小于2ms的最小的脈沖P〔n〕。基于音調(diào)周期小于2ms的事實(shí),這種方法是非常不可能的。后一種選擇是通過(guò)去除幅度小于前一個(gè)脈沖幅度的一定比例的脈沖來(lái)實(shí)現(xiàn)的。音調(diào)信息可以用信號(hào)P′〔n〕來(lái)表示,而對(duì)于n的值,當(dāng)產(chǎn)生音調(diào)脈沖時(shí),信號(hào)P′〔n〕具有第一邏輯值(“1”),而對(duì)于n的其它值,信號(hào)P′〔n〕具有第二邏輯值(“0”)。
在圖3中,曲線38表示的是準(zhǔn)周期語(yǔ)言信號(hào)S′〔n〕與n的關(guān)系曲線。曲線38清楚地表示了語(yǔ)音信號(hào)的(準(zhǔn))周期特性。曲線40表示的是輔助信號(hào)S〔n〕與時(shí)間的關(guān)系曲線。這個(gè)信號(hào)除去了干擾音調(diào)檢測(cè)的高頻分量。曲線42表示的是工作能量函數(shù)E〔n〕與n的關(guān)系曲線的值。對(duì)于nmax,E〔n〕的值最大。在曲線44中,表示的是特征輔助信號(hào)部分f〔n〕。這個(gè)特征輔助信號(hào)部分f〔n〕是在n=nmax附近從S〔n〕中選取的。
曲線46表示的是互相關(guān)函數(shù)信號(hào)Rsf〔n〕與n的關(guān)系曲線。在這個(gè)曲線中,所需的波峰和不需要的副峰都存在。在曲線48中,畫有表面測(cè)量A〔n〕與n的關(guān)系曲線。曲線48更加清楚地表示了所需波峰與不需要波峰之間的區(qū)別。
在曲線50中,表示的是經(jīng)信號(hào)A〔n〕的非線性運(yùn)算獲得的信號(hào)P〔n〕與n的關(guān)系曲線。這里,所需脈沖與不需要脈沖之間的區(qū)別更大。最后,曲線52表示了邏輯信號(hào)形式的音調(diào)信息,邏輯信號(hào)在產(chǎn)生所需脈沖時(shí)的n值處的值為“1”。如上所述已去掉了不需要的脈沖。
在圖4所示的流程中,這些方框具有以下含義。標(biāo)號(hào) 名稱 含義60 START程序開始。62 INIT 所用變量初始化。64 TAKE SEGM{S〔n〕}存貯輔助信號(hào)的取樣段。66 VOICED 檢測(cè)輔助信號(hào)是否仍為濁音。68 CALCE〔n〕 計(jì)算存貯段的工作能量函數(shù)。70 EXTRf〔n〕 從輔助信號(hào)中選取特征輔助信號(hào)部分。72 CORR ENV. 從輔助信號(hào)中得出幅度控制輔助信號(hào)。74 CALC Rsf〔n〕 計(jì)算互相關(guān)函數(shù)Rsf〔n〕。76 CALC A〔n〕 計(jì)算Rsf〔n〕中波峰的表面。78 EXPAND 通過(guò)非線性運(yùn)算由A〔n〕計(jì)算信號(hào)P〔n〕。80 DEL PEAKS 消除不需要的副峰。82 CALCn1,n2計(jì)算段中頭兩個(gè)音調(diào)脈沖的位置n1和n2。84 FIRST VOICED SEGMENT檢查相應(yīng)的段是否是一部分語(yǔ)音信號(hào)中的第一濁音段。86 PITCHMARK ATn1,n2對(duì)于n=n1和n=n2,使P〔n〕的邏輯值等于“1”。88 LPM=n2存貯最后標(biāo)準(zhǔn)的音調(diào)標(biāo)記的位置。90 LPM=LPM+n2-n1計(jì)算和存貯新音調(diào)標(biāo)記的位置。92 PITCHMARK AT LPM 對(duì)于n=LPM,使P′〔n〕的邏輯值等于“1”。94 TAKE SEGM{S〔n〕+n2-n1}取輔助信號(hào)的下一個(gè)取樣段。
在方框60和62中,如果有濁音語(yǔ)音信號(hào)程序就開始啟動(dòng),而且將所使用的變量設(shè)置為一個(gè)所需的初始值。在方框64中,存貯信號(hào)S〔n〕的一個(gè)段。該段的長(zhǎng)度值可以為20-40ms。
在方框66中,檢查S〔n〕的段是否仍為濁音。如果信號(hào)不是濁音,則在方框96停止程序。由程序產(chǎn)生語(yǔ)音信號(hào)是否濁音的信息(沒(méi)有示出)。
在方框68中,計(jì)算工作能量函數(shù)E〔n〕。這可以根據(jù)(1)來(lái)實(shí)現(xiàn)。然后,在方框70中,選取特征輔助信號(hào)部分,這可以根據(jù)(2)來(lái)實(shí)現(xiàn)。在步驟72中,計(jì)算幅度控制輔助信號(hào)Sec〔n〕。為此,先計(jì)算輔助信號(hào)包絡(luò)的范圍Se〔n〕。這可以根據(jù)下式來(lái)實(shí)現(xiàn)Se[n]=Σi=0L|s[n-i]|·h[i]----(10)]]>在(10)中,i是工作變量,L是響應(yīng)由(10)模擬的過(guò)濾器的脈沖的長(zhǎng)度,h〔i〕是響應(yīng)由(10)模擬的過(guò)濾器的脈沖。已證明適合于由(10)模擬的過(guò)濾器的截止頻率值是25Hz。L的一個(gè)合適值是121。
根據(jù)下式由信號(hào)Se〔n〕計(jì)算幅度修正信號(hào)lc〔n〕ec[n]=MAX{Se[n]}Se[n]0≤n≤N----(11)]]>借助(11),根據(jù)下式得出幅度控制輔助信號(hào)Sec〔n〕Sec[n]=S[n]·ec[n] (12)應(yīng)注意到,萬(wàn)一輔助信號(hào)幅度較低,幅值修正會(huì)以這樣的方式放大不需要的副峰,即,這些副峰會(huì)被作為需要的波峰來(lái)檢測(cè)。為避免這種情況,如果輔助信號(hào)的(平均)幅值下降到一個(gè)特定閾值之下,可以停止幅值修正。
在方框74中,計(jì)算相關(guān)函數(shù)Rsf〔n〕。這根據(jù)(3)或(4)來(lái)實(shí)現(xiàn)。然后,在方框76中,根據(jù)(8)計(jì)算信號(hào)A〔n〕,在方框78中,根據(jù)(9)通過(guò)進(jìn)行非線性運(yùn)算計(jì)算信號(hào)P〔n〕。
在方框80中,從信號(hào)A〔n〕中去掉不需要的副脈沖。這可以用已經(jīng)描述過(guò)的方式來(lái)實(shí)現(xiàn)。
在方框82中,計(jì)算當(dāng)前段的信號(hào)P〔n〕的頭兩個(gè)脈沖的位置n1和n2。然后,在方框84中,檢查當(dāng)前段是否是有濁音語(yǔ)音的第一段。如果是,在方框86,將音調(diào)標(biāo)記插入在與n1和n2相對(duì)應(yīng)的位置上的信號(hào)P′〔n〕中。在方框88,將最后插入信號(hào)P′〔n〕的音調(diào)標(biāo)記存貯在可變的LPM以便以后使用。
如果當(dāng)前段不是包含濁音語(yǔ)音的第一段,則在方框90,通過(guò)向LPM的舊值加入值n2-n1而計(jì)算最后的音調(diào)標(biāo)記的位置。然后,在方框92中,將音調(diào)標(biāo)記設(shè)置在信號(hào)P′〔n〕中的位置LPM上。
在方框94中,取下一個(gè)段。這個(gè)段與前面段不相鄰,而是有重疊。下一個(gè)段的開始移動(dòng)n2-n1個(gè)取樣。其理由是在兩個(gè)相鄰段轉(zhuǎn)變的情況下,即使在改變的特征信號(hào)部分,也會(huì)在已建立的音調(diào)值中發(fā)生不連續(xù)的改變。通過(guò)加大段的重疊,才會(huì)大大避免這種情況。
在方框94之后,返回方框66以處理新段。
權(quán)利要求
1.傳輸系統(tǒng),包括一個(gè)具有一個(gè)用于從準(zhǔn)周期信號(hào)獲得編碼信號(hào)的編碼器的發(fā)射器,設(shè)置發(fā)射器是為了通過(guò)一種介質(zhì)向接收器發(fā)送編碼信號(hào),編碼器包括一個(gè)用于從準(zhǔn)周期信號(hào)獲得音調(diào)信息的音調(diào)檢測(cè)器,其特征在于音調(diào)檢測(cè)器包括用于選擇準(zhǔn)周期信號(hào)代表的輔助信號(hào)的特征信號(hào)部分的選擇裝置,用于搜索至少另一個(gè)與特征輔助信號(hào)部分充分響應(yīng)的輔助信號(hào)的信號(hào)部分的搜索裝置,和用于在產(chǎn)生特征輔助信號(hào)部分和其它信號(hào)部分的瞬間獲得音調(diào)信息的裝置。
2.如權(quán)利要求1所述的傳輸系統(tǒng),其特征在于輔助信號(hào)部分包括一個(gè)在一定時(shí)間段上具有最大能量的信號(hào)部分。
3.如權(quán)利要求1或2所述的傳輸系統(tǒng),其特征在于特征輔助信號(hào)部分的持續(xù)時(shí)間小于或等于最短暫發(fā)生的音調(diào)周期。
4.如權(quán)利要求1、2或3所述的傳輸系統(tǒng),其特征在于搜索裝置包括用于計(jì)算特征輔助信號(hào)部分和輔助信號(hào)之間相關(guān)性的相關(guān)裝置,音調(diào)信息由相關(guān)函數(shù)中波峰的位置來(lái)表示。
5.如權(quán)利要求4所述的傳輸系統(tǒng),其特征在于音調(diào)檢測(cè)器包括用于計(jì)算相關(guān)函數(shù)中波峰表面的裝置,設(shè)置音調(diào)檢測(cè)器是為了從相關(guān)函數(shù)與時(shí)間的關(guān)系曲線的波峰的表面獲得音調(diào)信息。
6.如權(quán)利要求5所述的傳輸系統(tǒng),其特征在于音調(diào)檢測(cè)器包括用于將相關(guān)函數(shù)波峰的表面轉(zhuǎn)換成相關(guān)函數(shù)波峰擴(kuò)展的表面值的擴(kuò)展裝置。
7.編碼器,用于從準(zhǔn)周期信號(hào)獲得編碼信號(hào),該編碼器包括一個(gè)用于從準(zhǔn)周期信號(hào)獲得音調(diào)信息的音調(diào)檢測(cè)器,其特征在于音調(diào)檢測(cè)器包括用于選擇由準(zhǔn)周期信號(hào)表示的輔助信號(hào)的特征信號(hào)部分的選擇裝置,用于搜索至少另一個(gè)與特征輔助信號(hào)部分充分響應(yīng)的輔助信號(hào)的信號(hào)部分的搜索裝置,和用于從產(chǎn)生特征輔助信號(hào)部分和另外信號(hào)部分的瞬間獲得音調(diào)信息的裝置。
8.如權(quán)利要求7所述的編碼器,其特征在于輔助信號(hào)部分包括在一定時(shí)間段上具有最大能量的信號(hào)部分。
9.用于計(jì)算準(zhǔn)周期信號(hào)周期的裝置,其特征在于該裝置包括用于選擇由準(zhǔn)周期信號(hào)表示的輔助信號(hào)的特征信號(hào)部分的選擇裝置,用于搜索至少另一個(gè)與特征輔助信號(hào)部分充分響應(yīng)的輔助信號(hào)的信號(hào)部分的搜索裝置,和用于從在發(fā)生特征輔助信號(hào)部分和其它信號(hào)部分的瞬間獲得音調(diào)信息的裝置。
10.用于從準(zhǔn)周期信號(hào)獲得編碼信號(hào)的編碼方法,該編碼方法包括從準(zhǔn)周期信號(hào)獲得音調(diào)信息,其特征在于該方法包括選擇由準(zhǔn)周期信號(hào)表示的輔助信號(hào)的特征信號(hào)部分,搜索至少另一個(gè)與特征輔助信號(hào)部分充分響應(yīng)的輔助信號(hào)的信號(hào)部分,并從在發(fā)生特征輔助信號(hào)部分和其它信號(hào)部分的瞬間獲得音調(diào)信息。
全文摘要
在一種傳輸系統(tǒng)中,其中采用包括一個(gè)音調(diào)檢測(cè)器(12)的語(yǔ)音編碼器,為提高音調(diào)檢測(cè)的質(zhì)量,采用從要編碼的信號(hào)中選擇特征輔助信號(hào)部分的選擇裝置(22)?,F(xiàn)在通過(guò)在語(yǔ)音信號(hào)中搜索與特征輔助信號(hào)部分相對(duì)應(yīng)的信號(hào)部分和計(jì)算各信號(hào)部分之間的時(shí)間差,就可以得到音調(diào)。
文檔編號(hào)G10L25/06GK1153565SQ96190471
公開日1997年7月2日 申請(qǐng)日期1996年5月7日 優(yōu)先權(quán)日1995年5月10日
發(fā)明者R·陶里, R·J·施盧伊特, E·卡思曼 申請(qǐng)人:菲利浦電子有限公司