語(yǔ)音信號(hào)的處理方法和裝置、以及語(yǔ)音信號(hào)的分析系統(tǒng)的制作方法
【專利摘要】本發(fā)明公開了一種語(yǔ)音信號(hào)的處理方法和裝置、以及語(yǔ)音信號(hào)的分析系統(tǒng),其中,該處理裝置包括:第一確定模塊,用于對(duì)預(yù)定基頻范圍內(nèi)多個(gè)候選基頻中的每個(gè)候選基頻,確定語(yǔ)音信號(hào)中該候選基頻的多次諧波和,其中,在確定每個(gè)候選基頻的諧波和時(shí),第一確定模塊根據(jù)該候選基頻的一次諧波之外的其他諧波計(jì)算該候選基頻的諧波和;第二確定模塊,用于根據(jù)多個(gè)候選基頻的多次諧波和,從多個(gè)候選基頻中確定語(yǔ)音信號(hào)的實(shí)際基頻。本發(fā)明在針對(duì)候選基頻的確定諧波和進(jìn)而確定基頻時(shí),避免考慮基頻的一次諧波,從而能夠有效消除噪聲對(duì)基頻確定結(jié)果的不良影響,有效提高無(wú)噪聲和各種有噪聲的情況下基頻確定的準(zhǔn)確性。
【專利說(shuō)明】語(yǔ)音信號(hào)的處理方法和裝置、以及語(yǔ)音信號(hào)的分析系統(tǒng)
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及語(yǔ)音信號(hào)的處理,并且特別地,涉及一種語(yǔ)音信號(hào)的處理方法和裝置、以及語(yǔ)音信號(hào)的分析系統(tǒng)。
【背景技術(shù)】
[0002]基頻是人聲的固有特征。它是在發(fā)聲時(shí),肺部的氣流通過(guò)喉中的聲門,引起聲帶的周期性振動(dòng),形成周期性的脈沖串進(jìn)入聲道,這個(gè)周期性脈沖的周期稱為基音周期?;糁芷诘牡箶?shù)就是基頻。主要使用以下兩種方法在語(yǔ)音信號(hào)處理中進(jìn)行基頻提取:
[0003](方法一)時(shí)域估計(jì)法:直接由語(yǔ)音波形來(lái)估計(jì)基音周期。時(shí)域估計(jì)法可以包括例如時(shí)域自相關(guān)法、中央削波自相關(guān)法。以下詳述時(shí)域自相關(guān)法:通過(guò)計(jì)算信號(hào)自身的相關(guān)函數(shù)來(lái)計(jì)算信號(hào)的基音周期,而基音周期的倒數(shù)就是基頻。
[0004]參見(jiàn)式(I):
【權(quán)利要求】
1.一種語(yǔ)音信號(hào)的處理裝置,其特征在于,包括: 第一確定模塊,用于對(duì)預(yù)定基頻范圍內(nèi)多個(gè)候選基頻中的每個(gè)候選基頻,確定語(yǔ)音信號(hào)中該候選基頻的多次諧波和,其中,在確定每個(gè)候選基頻的諧波和時(shí),所述第一確定模塊根據(jù)該候選基頻的一次諧波之外的其他諧波計(jì)算該候選基頻的諧波和; 第二確定模塊,用于根據(jù)所述多個(gè)候選基頻的多次諧波和,從所述多個(gè)候選基頻中確定所述語(yǔ)音信號(hào)的實(shí)際基頻。
2.根據(jù)權(quán)利要求1所述的處理裝置,其特征在于,在確定每個(gè)候選基頻的諧波和時(shí),所述第一確定模塊用于根據(jù)數(shù)量小于或等于預(yù)定值的諧波確定該候選基頻的諧波和。
3.根據(jù)權(quán)利要求1所述的處理裝置,其特征在于,在確定每個(gè)候選基頻的諧波和時(shí),用于確定諧波和的諧波的最大頻率小于或等于預(yù)定的頻率門限值。
4.根據(jù)權(quán)利要求3所述的處理裝置,其特征在于,所述頻率門限值大于或等于所述基頻范圍的上限值的3倍。
5.根據(jù)權(quán)利要求1所述的處理裝置,其特征在于,進(jìn)一步包括: 第三確定模塊,用于預(yù)先確定用于提取候選基頻的分辨率; 基頻提取模塊,用于根據(jù)確定的所述分辨率從所述預(yù)定基頻范圍內(nèi)提取所述多個(gè)基頻,其中,所述分辨率滿足以下條件:差值為所述分辨率的兩個(gè)基頻的諧波和不相等。
6.根據(jù)權(quán)利要求5所述的處理裝置,其特征在于,所述第三確定模塊用于: 根據(jù)帶寬和頻率門限值確定所述分辨率,其中,所述頻率門限值為確定諧波和時(shí)所使用的多個(gè)諧波的頻率上限值,所述帶寬為所述語(yǔ)音信號(hào)的采樣頻率與快速傅里葉變換點(diǎn)值的比值。
7.根據(jù)權(quán)利要求1所述的處理裝置,其特征在于,所述第二確定模塊用于將所述多個(gè)候選基頻中,諧波和最大的候選基頻確定為所述實(shí)際基頻。
8.根據(jù)權(quán)利要求1-7中任一項(xiàng)所述的處理裝置,其特征在于,所述預(yù)定基頻范圍的下限值為50Hz至68Hz。
9.根據(jù)權(quán)利要求1-7中任一項(xiàng)所述的處理裝置,其特征在于,所述預(yù)定基頻范圍的上限值為500Hz至902Hz。
10.一種語(yǔ)音信號(hào)的分析系統(tǒng),其特征在于,包括: 語(yǔ)音采集設(shè)備,用于采集外界輸入的語(yǔ)音信號(hào); 第一確定模塊,用于對(duì)預(yù)定基頻范圍內(nèi)多個(gè)候選基頻中的每個(gè)候選基頻,確定所述語(yǔ)音信號(hào)中該候選基頻的多次諧波和,其中,在確定每個(gè)候選基頻的諧波和時(shí),所述第一確定模塊根據(jù)該候選基頻的一次諧波之外的其他諧波計(jì)算該候選基頻的諧波和; 第二確定模塊,用于根據(jù)所述多個(gè)候選基頻的多次諧波和,從所述多個(gè)候選基頻中確定所述語(yǔ)音信號(hào)的實(shí)際基頻; 分析模塊,用于根據(jù)確定的所述實(shí)際基頻對(duì)所述語(yǔ)音信號(hào)進(jìn)行分析。
11.根據(jù)權(quán)利要求10所述的分析系統(tǒng),其特征在于,在確定每個(gè)候選基頻的諧波和時(shí),所述第一確定模塊用于根據(jù)數(shù)量小于或等于預(yù)定值的諧波確定該候選基頻的諧波和。
12.根據(jù)權(quán)利要求10所述的分析系統(tǒng),其特征在于,在確定每個(gè)候選基頻的諧波和時(shí),用于確定諧波和的諧波的最大頻率小于或等于預(yù)定的頻率門限值。
13.根據(jù)權(quán)利要求12所述的分析系統(tǒng),其特征在于,所述頻率門限值大于或等于所述基頻范圍的上限值的3倍。
14.一種語(yǔ)音信號(hào)的處理方法,其特征在于,包括: 對(duì)于預(yù)定基頻范圍內(nèi)多個(gè)候選基頻中的每個(gè)候選基頻,確定語(yǔ)音信號(hào)中該候選基頻的多次諧波和,其中,在確定每個(gè)候選基頻的諧波和時(shí),根據(jù)該候選基頻的一次諧波之外的其他諧波計(jì)算該候選基頻的諧波和; 根據(jù)所述多個(gè)候選基頻的多次諧波和,從所述多個(gè)候選基頻中確定所述語(yǔ)音信號(hào)的實(shí)際基頻。
15.根據(jù)權(quán)利要求14所述的處理方法,其特征在于,在確定每個(gè)候選基頻的諧波和時(shí),根據(jù)數(shù)量小于或等于預(yù)定值的諧波確定該候選基頻的諧波和。
16.根據(jù)權(quán)利要求14所述的處理方法,其特征在于,在確定每個(gè)候選基頻的諧波和時(shí),用于確定諧波和的諧波的最大頻率小于或等于預(yù)定的頻率門限值。
17.根據(jù)權(quán)利要求16所述的處理方法,其特征在于,所述頻率門限值大于或等于所述基頻范圍的上限值的3倍。
18.根據(jù)權(quán)利要求14所述的處理方法,其特征在于,進(jìn)一步包括: 預(yù)先確定用于提取候選基頻的分辨率; 根據(jù)確定的所述分 辨率從所述預(yù)定基頻范圍內(nèi)提取所述多個(gè)基頻,其中,所述分辨率滿足以下條件:差值為所述分辨率的兩個(gè)基頻的諧波和不相等。
19.根據(jù)權(quán)利要求18所述的處理方法,其特征在于,預(yù)先確定用于提取候選基頻的分辨率包括: 根據(jù)帶寬和頻率門限值確定所述分辨率,其中,所述頻率門限值為確定諧波和時(shí)所使用的多個(gè)諧波的頻率上限值,所述帶寬為所述語(yǔ)音信號(hào)的采樣頻率與快速傅里葉變換點(diǎn)值的比值。
20.根據(jù)權(quán)利要求14所述的處理方法,其特征在于,從所述多個(gè)候選基頻中確定所述語(yǔ)音信號(hào)的實(shí)際基頻包括: 將所述多個(gè)候選基頻中,諧波和最大的候選基頻確定為所述實(shí)際基頻。
【文檔編號(hào)】G10L21/0232GK104036785SQ201310072649
【公開日】2014年9月10日 申請(qǐng)日期:2013年3月7日 優(yōu)先權(quán)日:2013年3月7日
【發(fā)明者】劉昆 申請(qǐng)人:索尼公司