專利名稱:信號(hào)分類方法和裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及多媒體信號(hào)處理和模式識(shí)別領(lǐng)域,特別涉及一種信號(hào)分類方法和裝置。
背景技術(shù):
語(yǔ)音信號(hào)和音樂信號(hào)各自的發(fā)聲原理不同。語(yǔ)音信號(hào)主要是指人說(shuō)話時(shí)發(fā)出的聲 音。音樂信號(hào)一般包含了更為廣泛的類別,比如管弦樂、打擊樂、聲樂以及多種音源的混合。 這兩類信號(hào)不僅在聽覺上存在差別,在不同的場(chǎng)合,對(duì)兩類信號(hào)的處理方式也不一樣。
在編解碼應(yīng)用中,語(yǔ)音信號(hào)通常采用基于線性預(yù)測(cè)的方式編碼,而音樂信號(hào)則廣 泛地采用變換域編碼方式。對(duì)于類別不確定的信號(hào)輸入時(shí),希望能夠判別出信號(hào)類別后再 分別采用不同的方式編碼,這樣可以有效地降低編碼碼率同時(shí)保持較高編碼質(zhì)量。因此對(duì) 輸入信號(hào)的準(zhǔn)確分類就顯得十分關(guān)鍵,它影響著輸出音頻信號(hào)碼率的質(zhì)量。
在噪聲抑制應(yīng)用中,通常希望對(duì)移動(dòng)條件下的語(yǔ)音通話進(jìn)行噪聲抑制,而對(duì)于彩 鈴而言,通常彩鈴音樂信號(hào)來(lái)自媒體服務(wù)器,沒有被環(huán)境噪聲污染,故而不需要進(jìn)行噪聲抑 制。
因此,在復(fù)雜的現(xiàn)代通信系統(tǒng)中,針對(duì)類別多樣的音頻信號(hào)需要按照不同的方式 進(jìn)行處理。為了獲得更好的主觀體驗(yàn),通常需要將音頻信號(hào)區(qū)分為語(yǔ)音、音樂。這首先就需 要一個(gè)高效、準(zhǔn)確的信號(hào)分類算法。
目前常用的信號(hào)分類器設(shè)計(jì)方法較多,常見的有基于特征計(jì)算加概率模型的方 法,以及特征計(jì)算加函數(shù)逼近方法。特征計(jì)算主要包括信號(hào)的時(shí)域、頻域等參數(shù)。概率模型 方法大致包括混合高斯模型、隱馬爾可夫模型、支持向量機(jī)、決策樹等。而神經(jīng)網(wǎng)絡(luò)則是使 用非線性神經(jīng)元的函數(shù)逼近方法。但實(shí)際應(yīng)用于通信系統(tǒng)中,還有較多因素需要考慮,如分 類器延時(shí)、復(fù)雜度、準(zhǔn)確率、魯棒性等指標(biāo)。
在實(shí)時(shí)的通信中,現(xiàn)有的信號(hào)分類算法由于復(fù)雜度、延時(shí)和分類正確率而不能滿 足高效率、高質(zhì)量的編碼器的需求。發(fā)明內(nèi)容
本發(fā)明所要解決的技術(shù)問(wèn)題是提供一種信號(hào)分類方法和裝置,以獲得更穩(wěn)定和 更高的分類正確率,且能滿足低復(fù)雜度、低延時(shí)算法的需求。
為了解決上述問(wèn)題,本發(fā)明提供了一種信號(hào)分類方法,包括
從待分類的信號(hào)中獲取多個(gè)數(shù)據(jù)單元,一個(gè)數(shù)據(jù)單元提取m個(gè)特征參數(shù)組成一個(gè) 短時(shí)特征向量,m為整數(shù)且大于等于I ;
從所述多個(gè)數(shù)據(jù)單元中取一組數(shù)據(jù)單元,對(duì)該組數(shù)據(jù)單元中共K個(gè)數(shù)據(jù)單元對(duì)應(yīng) 的K個(gè)短時(shí)特征向量Xp,P =1... K進(jìn)行S種統(tǒng)計(jì)處理,得到一個(gè)長(zhǎng)時(shí)特征向量,所述長(zhǎng)時(shí) 特征向量由一組統(tǒng)計(jì)向量Ys組成,s = l... S,其中,向量Ys的第j個(gè)元素由向量Xl至Xp 的第j個(gè)元素進(jìn)行第s種統(tǒng)計(jì)處理得到,所述S為整數(shù)且大于等于1,j =1. . . m,K大于等于I ;重復(fù)執(zhí)行上述步驟,直到得到η組數(shù)據(jù)單元對(duì)應(yīng)的η個(gè)長(zhǎng)時(shí)特征向量,η為整數(shù)且大于等于2 ;其中,各組數(shù)據(jù)單元之間包含的數(shù)據(jù)單元個(gè)數(shù)不同;
將該η個(gè)長(zhǎng)時(shí)特征向量根據(jù)預(yù)設(shè)原則送入η個(gè)預(yù)先訓(xùn)練得到的分類器中,得到多個(gè)分類結(jié)果;
根據(jù)所述多個(gè)分類結(jié)果按照預(yù)設(shè)決策融合機(jī)制得到最終分類結(jié)果。
進(jìn)一步的,上述方法還可具有以下特點(diǎn),所述方法還包括提取所述特征參數(shù)前, 對(duì)所述待分類的信號(hào)進(jìn)行高頻濾波處理。
進(jìn)一步的,上述方法還可具有以下特點(diǎn),所述一個(gè)數(shù)據(jù)單元的m個(gè)特征參數(shù)包括如下特征參數(shù)中的一個(gè)或多個(gè)
數(shù)據(jù)單元的對(duì)數(shù)能量,過(guò)零率、子幀對(duì)數(shù)能量、基音周期、頻譜重心、頻譜通量;
所述子巾貞對(duì)數(shù)能量為
將所述數(shù)據(jù)單元?jiǎng)?分為N個(gè)子幀,獲取每個(gè)子幀的對(duì)數(shù)能量,得到N個(gè)對(duì)數(shù)能量, N大于I且為整數(shù)。
進(jìn)一步的,上述方法還可具有以下特點(diǎn),所述統(tǒng)計(jì)處理包括如下之一或其組合
取最大值、最小值、方差、標(biāo)準(zhǔn)差和數(shù)學(xué)期望值。
進(jìn)一步的,上述方法還可具有以下特點(diǎn),所述將該η個(gè)長(zhǎng)時(shí)特征向量根據(jù)預(yù)設(shè)原則送入η個(gè)預(yù)先訓(xùn)練得到的分類器中包括
對(duì)該η個(gè)長(zhǎng)時(shí)特征向量中任一個(gè)長(zhǎng)時(shí)特征向量,將該長(zhǎng)時(shí)特征向量只送入與該長(zhǎng)時(shí)特征向量對(duì)應(yīng)的一個(gè)分類器;或者,將該長(zhǎng)時(shí)特征向量送入與該長(zhǎng)時(shí)特征向量對(duì)應(yīng)的一個(gè)分類器,及至少一個(gè)其它分類器。
進(jìn)一步的,上述方法還可具有以下特點(diǎn),根據(jù)所述多個(gè)分類結(jié)果按照預(yù)設(shè)決策融合機(jī)制得到最終分類結(jié)果包括
將所述多個(gè)分類結(jié)果中,數(shù)量最多的相同的分類結(jié)果作為最終分類結(jié)果。
進(jìn)一步的,上述方法還可具有以下特點(diǎn),從所述待分類的信號(hào)中獲取多個(gè)數(shù)據(jù)單元時(shí),只提取能量值超過(guò)指定門限值的數(shù)據(jù)單元。
本發(fā)明還提供一種信號(hào)分類裝置,包括短時(shí)特征提取模塊、長(zhǎng)時(shí)特征提取模塊、 分類模塊和決策融合模塊,其中
所述短時(shí)特征提取模塊用于從待分類的信號(hào)中獲取多個(gè)數(shù)據(jù)單元,一個(gè)數(shù)據(jù)單元提取m個(gè)特征參數(shù)組成一個(gè)特征向量;
所述長(zhǎng)時(shí)特征提取模塊用于從所述多個(gè)數(shù)據(jù)單元中取一組數(shù)據(jù)單元,對(duì)該組數(shù)據(jù)單元中共K個(gè)數(shù)據(jù)單元對(duì)應(yīng)的K個(gè)短時(shí)特征向量Xp, P =1. . . K進(jìn)行S種統(tǒng)計(jì)處理,得到一個(gè)長(zhǎng)時(shí)特征向量,所述長(zhǎng)時(shí)特征向量由一組統(tǒng)計(jì)向量Ys組成,s=l... S,其中,向量Ys 的第j個(gè)元素由向量Xl至Xp的第j個(gè)元素進(jìn)行第s種統(tǒng)計(jì)處理得到,所述S為整數(shù)且大于等于I, j =1. . . m,K大于等于I ;重復(fù)執(zhí)行上述步驟,直到得到η組數(shù)據(jù)單元對(duì)應(yīng)的η個(gè)長(zhǎng)時(shí)特征向量,η為整數(shù)且大于等于2 ;其中,各組數(shù)據(jù)單元之間包含的數(shù)據(jù)單元個(gè)數(shù)不同;
所述分類模塊用于將該η個(gè)長(zhǎng)時(shí)特征向量根據(jù)預(yù)設(shè)原則送入η個(gè)預(yù)先訓(xùn)練得到的分類器中,得到多個(gè)分類結(jié)果;
所述決策融合模塊用于根據(jù)所述多個(gè)分類結(jié)果按照預(yù)設(shè)決策融合機(jī)制得到最終分類結(jié)果。
進(jìn)一步的,上述裝置還可具有以下特點(diǎn),所述裝置還包括預(yù)處理模塊,所述預(yù)處理模塊用于對(duì)所述待分類的信號(hào)進(jìn)行高頻濾波處理后輸出給所述短時(shí)特征提取模塊。
進(jìn)一步的,上述裝置還可具有以下特點(diǎn),所述數(shù)據(jù)單元的m個(gè)特征參數(shù)包括如下特征參數(shù)中的一個(gè)或多個(gè)
數(shù)據(jù)單元的對(duì)數(shù)能量,過(guò)零率、子幀對(duì)數(shù)能量、基音周期、頻譜重心、頻譜通量;
所述子巾貞對(duì)數(shù)能量為
將所述數(shù)據(jù)單元?jiǎng)澐譃镹個(gè)子幀,獲取每個(gè)子幀的對(duì)數(shù)能量,得到N個(gè)對(duì)數(shù)能量, N大于I且為整數(shù)。
進(jìn)一步的,上述裝置還可具有以下特點(diǎn),所述長(zhǎng)時(shí)特征提取模塊進(jìn)行的所述統(tǒng)計(jì)處理包括如下之一或其組合
取最大值、最小值、方差、標(biāo)準(zhǔn)差和數(shù)學(xué)期望值。
進(jìn)一步的,上述裝置還可具有以下特點(diǎn),所述分類模塊將該η個(gè)長(zhǎng)時(shí)特征向量根據(jù)預(yù)設(shè)原則送入η個(gè)預(yù)先訓(xùn)練得到的分類器中包括
對(duì)該η個(gè)長(zhǎng)時(shí)特征向量中任一個(gè)長(zhǎng)時(shí)特征向量,將該長(zhǎng)時(shí)特征向量只送入與該長(zhǎng)時(shí)特征向量對(duì)應(yīng)的一個(gè)分類器;或者,將該長(zhǎng)時(shí)特征向量送入與該長(zhǎng)時(shí)特征向量對(duì)應(yīng)的一個(gè)分類器,及至少一個(gè)其它分類器。
進(jìn)一步的,上述裝置還可具有以下特點(diǎn),所述決策融合模塊是用于
將所述多個(gè)分類結(jié)果中,數(shù)量最多的相同的分類結(jié)果的作為最終分類結(jié)果。
進(jìn)一步的,上述裝置還可具有以下特點(diǎn),所述短時(shí)特征提取模塊從所述待分類的信號(hào)中獲取多個(gè)數(shù)據(jù)單元時(shí),只提取能量值超過(guò)指定門限值的數(shù)據(jù)單元。
本發(fā)明實(shí)施例提出的信號(hào)分類方法,首先對(duì)輸入信號(hào)進(jìn)行預(yù)處理,提取短時(shí)特征, 然后計(jì)算不同時(shí)長(zhǎng)的長(zhǎng)時(shí)特征,采用多棵決策樹的聯(lián)合分類方法,加上決策融合,得到最終分類結(jié)果。不同的時(shí)長(zhǎng)既保證了算法的穩(wěn)定性,又滿足實(shí)時(shí)性的要求,多棵決策樹的聯(lián)合分類方法使分類結(jié)果更為準(zhǔn)確。與現(xiàn)有算法相比,本發(fā)明具有低延時(shí)、低復(fù)雜度、準(zhǔn)確率高等優(yōu)點(diǎn)。
圖
圖
圖
圖
圖
圖
圖
圖
圖
圖
圖
圖1是本發(fā)明實(shí)施例基于決策樹的分類方法流程圖;2是本發(fā)明實(shí)施例決策樹分類器的示意圖;3是本發(fā)明實(shí)施例短時(shí)特征向量提取的流程圖;4是本發(fā)明實(shí)施例長(zhǎng)時(shí)特征向量提取的流程圖;5是本發(fā)明實(shí)施例蝶形交叉分類的流程圖;6是本發(fā)明實(shí)施例決策融合流程圖;7是本發(fā)明實(shí)施例長(zhǎng)時(shí)特征向量提取的流程圖;8是本發(fā)明不經(jīng)過(guò)非靜音判斷長(zhǎng)時(shí)特征向量提取的流程圖;9是本發(fā)明實(shí)施例一種多棵決策樹聯(lián)合分類方法實(shí)施的流程圖;10是本發(fā)明實(shí)施例另一種多棵決策樹聯(lián)合分類方法實(shí)施的流程圖 11是本發(fā)明實(shí)施例另一種多棵決策樹聯(lián)合分類方法實(shí)施的流程圖 12是本發(fā)明實(shí)施例信號(hào)分類裝置的結(jié)構(gòu)示意圖。
具體實(shí)施方式
為使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚明白,下文中將結(jié)合附圖對(duì)本發(fā)明的實(shí)施例進(jìn)行詳細(xì)說(shuō)明。需要說(shuō)明的是,在不沖突的情況下,本申請(qǐng)中的實(shí)施例及實(shí)施例中的特征可以相互任意組合。
本發(fā)明實(shí)施例提供一種信號(hào)分類方法,包括
從待分類的信號(hào)中獲取多個(gè)數(shù)據(jù)單元,一個(gè)數(shù)據(jù)單元提取m個(gè)特征參數(shù)組成一個(gè)短時(shí)特征向量,m大于等于I且為整數(shù);
從所述多個(gè)數(shù)據(jù)單元中取一組數(shù)據(jù)單元,對(duì)該組數(shù)據(jù)單元中共K個(gè)數(shù)據(jù)單元對(duì)應(yīng)的K個(gè)短時(shí)特征向量Xp,P =1... K進(jìn)行S種統(tǒng)計(jì)處理,得到一個(gè)長(zhǎng)時(shí)特征向量,所述長(zhǎng)時(shí)特征向量由一組統(tǒng)計(jì)向量Ys組成,s = l... S,其中,向量Ys的第j個(gè)元素由向量Xl至Xp 的第j個(gè)元素進(jìn)行第s種統(tǒng)計(jì)處理得到,所述S為整數(shù)且大于等于1,j =1. . . m,K大于等于I ;重復(fù)執(zhí)行上述步驟,直到得到η組數(shù)據(jù)單元對(duì)應(yīng)的η個(gè)長(zhǎng)時(shí)特征向量,η為整數(shù)且大于等于2 ;其中,各組數(shù)據(jù)單元之間包含的數(shù)據(jù)單元個(gè)數(shù)不同;
將該η個(gè)長(zhǎng)時(shí)特征向量根據(jù)預(yù)設(shè)原則送入η個(gè)預(yù)先訓(xùn)練得到的分類器中,得到多個(gè)分類結(jié)果,根據(jù)所述多個(gè)分類結(jié)果中得到最終分類結(jié)果。
其中,所述方法還包括提取所述特征參數(shù)前,對(duì)所述待分類的信號(hào)進(jìn)行高頻濾波處理。也可以不進(jìn)行高頻濾波處理
其中,所述一個(gè)數(shù)據(jù)單元的m個(gè)特征參數(shù)包括如下特征參數(shù)中的一個(gè)或多個(gè)
數(shù)據(jù)單元的對(duì)數(shù)能量,過(guò)零率、子幀對(duì)數(shù)能量、基音周期、頻譜重心、頻譜通量;
所述子巾貞對(duì)數(shù)能量為
將所述數(shù)據(jù)單元?jiǎng)澐譃镹個(gè)子幀,獲取每個(gè)子幀的對(duì)數(shù)能量,得到N個(gè)對(duì)數(shù)能量, N大于I且為整數(shù)。劃分時(shí) ,可以將該數(shù)據(jù)單元均勻劃分,也可以不均勻劃分。
其中,所述統(tǒng)計(jì)處理包括如下之一或其組合或其變形形式取最大值、最小值、方差、標(biāo)準(zhǔn)差和數(shù)學(xué)期望值。變形形式是指在這些處理方式的基礎(chǔ)上進(jìn)行變形,比如最大值/ 數(shù)學(xué)期望,緩存器中每個(gè)值減去最大值的和,等等。
比如,進(jìn)行取最大值和方差兩種統(tǒng)計(jì)處理時(shí),可以將向量Xl至Xp的第I個(gè)元素取最大值,得到統(tǒng)計(jì)向量Yl的第I個(gè)元素,依次類推,將向量Xl至Xp的第m個(gè)元素中取最大值,得到統(tǒng)計(jì)向量Yl的第m個(gè)元素,從而得到統(tǒng)計(jì)向量Yl ;可以將向量Xl至Xp的第I個(gè)元素求方差,得到統(tǒng)計(jì)向量Y2的第I個(gè)元素,依次類推,將向量Xl至Xp的第m個(gè)元素求方差,得到統(tǒng)計(jì)向量Y2的第m個(gè)元素,從而得到統(tǒng)計(jì)向量Y2。
其中,所述將該η個(gè)長(zhǎng)時(shí)特征向量根據(jù)預(yù)設(shè)原則送入η個(gè)預(yù)先訓(xùn)練得到的分類器中包括
對(duì)該η個(gè)長(zhǎng)時(shí)特征向量中任一個(gè)長(zhǎng)時(shí)特征向量,將該長(zhǎng)時(shí)特征向量只送入與該長(zhǎng)時(shí)特征向量對(duì)應(yīng)的一個(gè)分類器;或者,將該長(zhǎng)時(shí)特征向量送入與該長(zhǎng)時(shí)特征向量對(duì)應(yīng)的一個(gè)分類器,及至少一個(gè)其它分類器。
比如,三組統(tǒng)計(jì)向量,分別送入分類器Ta,Tb,Tc,也可以第一組送入Ta,Tb,第二組送入Tb, Tc,第三組送入Tc, Tb ;或者,第一組送入Ta, Tb, Tc,第二組送入Ta, Tb, Tc,第三組送入Ta,Tb,Tc,此處僅為示例。分類器通過(guò)預(yù)先訓(xùn)練得到,具體的,使用已知分類結(jié)果的訓(xùn)練信號(hào),提取多組數(shù)據(jù)單元及其對(duì)應(yīng)的多組統(tǒng)計(jì)向量,訓(xùn)練得到多個(gè)分類器。
其中,所述根據(jù)所述多個(gè)分類結(jié)果中得到最終分類結(jié)果包括
將所述多個(gè)分類結(jié)果中,數(shù)量最多的相同的分類結(jié)果的作為最終分類結(jié)果。
其中,從所述待分類的信號(hào)中獲取多個(gè)數(shù)據(jù)單元時(shí),只提取能量值超過(guò)指定門限值的數(shù)據(jù)單元,當(dāng)然,也可以對(duì)數(shù)據(jù)單元的能量值不進(jìn)行限定。
上述數(shù)據(jù)單元可以是一個(gè)數(shù)據(jù)幀,也可以是多個(gè)數(shù)據(jù)幀,或根據(jù)需要設(shè)置的一定時(shí)長(zhǎng)的數(shù)據(jù),本發(fā)明對(duì)此不作限定。
所述各組數(shù)據(jù)單元中,各組數(shù)據(jù)單元可以完全不重合,或者,部分重合。一種具體應(yīng)用是任意兩組中,其中一組是另一組的子集。
上述信號(hào)分類方法可以適用于多種信號(hào),包括音頻信號(hào)。
下面以音頻信號(hào)的分類為例進(jìn)一步說(shuō)明本發(fā)明。
[實(shí)施例1]
本實(shí)施例是32kHz采樣率下的語(yǔ)音/音樂信號(hào)分類,幀長(zhǎng)L= 1280,在其它幀長(zhǎng)和采樣率條件下,本發(fā)明的方法同樣適用。分類過(guò)程如圖1所示,該方法包括
在進(jìn)行分類前,先進(jìn)行訓(xùn)練得到分類器,包括
SI,輸入訓(xùn)練集信號(hào),對(duì)輸入信號(hào)進(jìn)行預(yù)處理,濾波處理,濾波器為高通濾波器,用于濾除低頻的 直流成分;
本實(shí)施例中,可以濾除0-50HZ的直流成分,當(dāng)然,也可以根據(jù)需要設(shè)置濾除更高或更低范圍內(nèi)的直流成分。
S2 :對(duì)濾波后的信號(hào)提取短時(shí)特征向量,本實(shí)施例中,短時(shí)特征向量中包括如下參數(shù)對(duì)數(shù)能量、過(guò)零率和子幀對(duì)數(shù)能量。
S3:提取η個(gè)不同時(shí)長(zhǎng)的長(zhǎng)時(shí)特征向量,利用不同時(shí)長(zhǎng)的長(zhǎng)時(shí)特征向量分別訓(xùn)練, 得到η個(gè)分類器,本實(shí)施例中,分類器采用決策樹形式,也可采取其他形式的分類器。其中一棵決策樹如圖2所示,圖2中取值僅為示例,針對(duì)不同信號(hào),可進(jìn)行訓(xùn)練得到不同的決策樹。
訓(xùn)練得到分類器后,對(duì)待分類的信號(hào),執(zhí)行如下操作
101,輸入待分類的信號(hào),進(jìn)行預(yù)處理,所述預(yù)處理包括濾波處理,濾波器為高通濾波器,用于濾除低頻的直流成分;
102 :對(duì)濾波后的信號(hào)提取短時(shí)特征向量,本實(shí)施例中,短時(shí)特征向量中包括如下參數(shù)對(duì)數(shù)能量、過(guò)零率和子幀對(duì)數(shù)能量。
103,提取多組不同時(shí)長(zhǎng)的長(zhǎng)時(shí)特征向量,按照預(yù)設(shè)原則送入多個(gè)分類器中進(jìn)行分類,得到多個(gè)分類結(jié)果;
104:針對(duì)分類的結(jié)果按照一定決策融合機(jī)制進(jìn)行判決,得到最終的分類結(jié)果。
其中,步驟S2和102中特征計(jì)算包括短時(shí)特征計(jì)算,如圖3所示。
201 :計(jì)算對(duì)數(shù)能量,對(duì)數(shù)能量的計(jì)算方法如下
第i幀對(duì)數(shù)能量E1 Ji)定義為第i幀內(nèi)所有點(diǎn)的平方和,再取對(duì)數(shù)值。即
燦)= Σ:二
Elog (i) = Iog2(E1Q))
其中,x(n)表示當(dāng)前幀的樣點(diǎn)值,L表示幀長(zhǎng)。
202 :計(jì)算過(guò)零率,過(guò)零率的計(jì)算方法如下
第i幀過(guò)零率ZCR(i)定義為第i幀內(nèi)所有點(diǎn)分布的波形穿過(guò)零點(diǎn)的次數(shù)的和。 即
ZCR(i) =[sign(x(n)) - sign(x(n -1))] j2
其中,x (n)表示當(dāng)前巾貞的樣點(diǎn)值,L表示巾貞長(zhǎng),其中,sign (x)是符號(hào)函數(shù),定義如下(I, x>0
SIgn(X) = \[-1,χ<0
203 :計(jì)算子幀對(duì)數(shù)能量,計(jì)算方法如下
第i幀第k子幀對(duì)數(shù)能量SubEn1()g(i,k)定義將第i幀均勻劃分為N個(gè)子幀,即第i幀每1/N的幀長(zhǎng)的點(diǎn)為一個(gè)小子幀,對(duì)每個(gè)子幀內(nèi)的所有點(diǎn)的平方值求和,再取對(duì)數(shù), 即SubEn1()g(i,k)。每個(gè)子幀對(duì)應(yīng)一個(gè)值,共N個(gè)值。即
SubEnQ, k) =χ2 ⑷,k = I,2,· · · N
SubEnlog (i, k) = Iog2 (SubEn (i, k))
其中,χ (η)是第i巾貞的信號(hào)樣點(diǎn)值,N是子巾貞數(shù),SubEnlog (i, k)表示第i巾貞的第k 子幀的對(duì)數(shù)能量值。均勻劃分為N個(gè)子幀僅為示例,也可以不均勻劃分。
存儲(chǔ)計(jì)算得到對(duì)數(shù)能量、過(guò)零率和N維子幀對(duì)數(shù)能量,即得到N+2維短時(shí)特征向量,各特征參數(shù)在向量中的位置不限定,各短時(shí)特征向量同一位置對(duì)于同一類特征參數(shù)。
步驟S3和步驟103中計(jì)算不同時(shí)長(zhǎng)的長(zhǎng)時(shí)特征,本實(shí)施例中計(jì)算兩組不同時(shí)長(zhǎng) Na,Nb的長(zhǎng)時(shí)特征(其中Na > Nb > O),如圖4所示,包括
301 :首先判斷當(dāng)前幀是否為非靜音幀,非靜音幀具體是指當(dāng)前幀的能量超過(guò)指定門限值,否則為靜音幀;
可以利用計(jì)算的對(duì)數(shù)能量E1 Ji)判斷是否為非靜音幀,如果對(duì)數(shù)能量值E1 Ji) 小于特定門限Thr (在本實(shí)施例中選取O > Thr > -20),則判斷為靜音幀,否則為非靜音幀。 當(dāng)然,也可以利用其它能量參數(shù),比如不取對(duì)數(shù),直接利用當(dāng)前幀的能量值。
再判斷緩存器中是否已經(jīng)存入非靜音幀的特征信息。
如果不是非靜音幀且緩存器中已經(jīng)存入非靜音幀的信息,則執(zhí)行303,否則執(zhí)行 302。
當(dāng)然,也可以先判斷是否非靜音幀和緩存器中是否已經(jīng)存入非靜音幀的信息,對(duì)非靜音幀計(jì)算短時(shí)特征向量,對(duì)緩存器中未存入非靜音幀時(shí)的靜音幀計(jì)算短時(shí)特征向量, 對(duì)緩存器已存入非靜音幀特征時(shí)的靜音幀直接丟棄。
另外,用于判斷的各幀之間可以連續(xù)也可以不連續(xù)。
302 :按照一定原則將短時(shí)特征向量存入特征緩存器。緩存器的長(zhǎng)度取較大時(shí)長(zhǎng) Na的長(zhǎng)度,執(zhí)行步驟304 ;
當(dāng)然,緩存器的長(zhǎng)度也可以為Na+Nb的長(zhǎng)度;或者,為Na和Na+Nb之間的長(zhǎng)度。緩存器也可以更長(zhǎng),預(yù)留一些緩存空間。
303,丟棄該短時(shí)特征向量,執(zhí)行步驟304 ;
304 :對(duì)于Na時(shí)長(zhǎng)的長(zhǎng)時(shí)特征FexNa,計(jì)算緩存器內(nèi)的最大值max^p:),計(jì)算緩存器內(nèi)的方差值Var(^7wa)。
計(jì)算Na時(shí)長(zhǎng)的長(zhǎng)時(shí)特征向量包括對(duì)Na個(gè)短時(shí)特征向量的相同位置的元素取最大值,得到向量對(duì)應(yīng)位置的元素,對(duì)Na個(gè)短時(shí)特征向量的相同位置的元素計(jì)算方差值得到向量var<F:)對(duì)應(yīng)位置的元素。
305 :對(duì)于Nb時(shí)長(zhǎng)的長(zhǎng)時(shí)特征FexNb,計(jì)算緩存器內(nèi)Nb個(gè)數(shù)值的最大值計(jì)算緩存器內(nèi)Nb個(gè)數(shù)值的方差值Var(7^)。
從而得到長(zhǎng)時(shí)特征矩陣
權(quán)利要求
1.一種信號(hào)分類方法,其特征在于,包括從待分類的信號(hào)中獲取多個(gè)數(shù)據(jù)單元,一個(gè)數(shù)據(jù)單元提取m個(gè)特征參數(shù)組成一個(gè)短時(shí)特征向量,m為整數(shù)且大于等于I ;從所述多個(gè)數(shù)據(jù)單元中取一組數(shù)據(jù)單元,對(duì)該組數(shù)據(jù)單元中共K個(gè)數(shù)據(jù)單元對(duì)應(yīng)的K 個(gè)短時(shí)特征向量Xp,P =1... K進(jìn)行S種統(tǒng)計(jì)處理,得到一個(gè)長(zhǎng)時(shí)特征向量,所述長(zhǎng)時(shí)特征向量由一組統(tǒng)計(jì)向量Ys組成,S =1. . . S,其中,向量Ys的第j個(gè)元素由向量Xl至Xp的第 j個(gè)元素進(jìn)行第s種統(tǒng)計(jì)處理得到,所述S為整數(shù)且大于等于1,j =1. . . m,K大于等于I ; 重復(fù)執(zhí)行上述步驟,直到得到η組數(shù)據(jù)單元對(duì)應(yīng)的η個(gè)長(zhǎng)時(shí)特征向量,η為整數(shù)且大于等于·2;其中,各組數(shù)據(jù)單元之間包含的數(shù)據(jù)單元個(gè)數(shù)不同;將該η個(gè)長(zhǎng)時(shí)特征向量根據(jù)預(yù)設(shè)原則送入η個(gè)預(yù)先訓(xùn)練得到的分類器中,得到多個(gè)分類結(jié)果;根據(jù)所述多個(gè)分類結(jié)果按照預(yù)設(shè)決策融合機(jī)制得到最終分類結(jié)果。
2.如權(quán)利要求1所述的方法,其特征在于,所述方法還包括提取所述特征參數(shù)前,對(duì)所述待分類的信號(hào)進(jìn)行高頻濾波處理。
3.如權(quán)利要求1所述的方法,其特征在于,所述一個(gè)數(shù)據(jù)單元的m個(gè)特征參數(shù)包括如下特征參數(shù)中的一個(gè)或多個(gè)數(shù)據(jù)單元的對(duì)數(shù)能量,過(guò)零率、子幀對(duì)數(shù)能量、基音周期、頻譜重心、頻譜通量;所述子幀對(duì)數(shù)能量為將所述數(shù)據(jù)單元?jiǎng)澐譃镹個(gè)子幀,獲取每個(gè)子幀的對(duì)數(shù)能量,得到N個(gè)對(duì)數(shù)能量,N大于I且為整數(shù)。
4.如權(quán)利要求1所述的方法,其特征在于,所述統(tǒng)計(jì)處理包括如下之一或其組合取最大值、最小值、方差、標(biāo)準(zhǔn)差和數(shù)學(xué)期望值。
5.如權(quán)利要求1所述的方法,其特征在于,所述將該η個(gè)長(zhǎng)時(shí)特征向量根據(jù)預(yù)設(shè)原則送入η個(gè)預(yù)先訓(xùn)練得到的分類器中包括對(duì)該η個(gè)長(zhǎng)時(shí)特征向量中任一個(gè)長(zhǎng)時(shí)特征向量,將該長(zhǎng)時(shí)特征向量只送入與該長(zhǎng)時(shí)特征向量對(duì)應(yīng)的一個(gè)分類器;或者,將該長(zhǎng)時(shí)特征向量送入與該長(zhǎng)時(shí)特征向量對(duì)應(yīng)的一個(gè)分類器,及至少一個(gè)其它分類器。
6.如權(quán)利要求1所述的方法,其特征在于,根據(jù)所述多個(gè)分類結(jié)果按照預(yù)設(shè)決策融合機(jī)制得到最終分類結(jié)果包括將所述多個(gè)分類結(jié)果中,數(shù)量最多的相同的分類結(jié)果作為最終分類結(jié)果。
7.如權(quán)利要求1所述的方法,其特征在于,從所述待分類的信號(hào)中獲取多個(gè)數(shù)據(jù)單元時(shí),只提取能量值超過(guò)指定門限值的數(shù)據(jù)單元。
8.一種信號(hào)分類裝置,其特征在于,包括短時(shí)特征提取模塊、長(zhǎng)時(shí)特征提取模塊、分類模塊和決策融合模塊,其中所述短時(shí)特征提取模塊用于從待分類的信號(hào)中獲取多個(gè)數(shù)據(jù)單元,一個(gè)數(shù)據(jù)單元提取m個(gè)特征參數(shù)組成一個(gè)特征向量;所述長(zhǎng)時(shí)特征提取模塊用于從所述多個(gè)數(shù)據(jù)單元中取一組數(shù)據(jù)單元,對(duì)該組數(shù)據(jù)單元中共K個(gè)數(shù)據(jù)單元對(duì)應(yīng)的K個(gè)短時(shí)特征向量Xp,P =1. . . K進(jìn)行S種統(tǒng)計(jì)處理,得到一個(gè)長(zhǎng)時(shí)特征向量,所述長(zhǎng)時(shí)特征向量由一組統(tǒng)計(jì)向量Ys組成,s = l... S,其中,向量Ys的第j個(gè)元素由向量Xl至Xp的第j個(gè)元素進(jìn)行第S種統(tǒng)計(jì)處理得到,所述S為整數(shù)且大于等于I,j =1. . . m, K大于等于I ;重復(fù)執(zhí)行上述步驟,直到得到η組數(shù)據(jù)單元對(duì)應(yīng)的η個(gè)長(zhǎng)時(shí)特征向量,η為整數(shù)且大于等于2 ;其中,各組數(shù)據(jù)單元之間包含的數(shù)據(jù)單元個(gè)數(shù)不同;所述分類模塊用于將該η個(gè)長(zhǎng)時(shí)特征向量根據(jù)預(yù)設(shè)原則送入η個(gè)預(yù)先訓(xùn)練得到的分類器中,得到多個(gè)分類結(jié)果;所述決策融合模塊用于根據(jù)所述多個(gè)分類結(jié)果按照預(yù)設(shè)決策融合機(jī)制得到最終分類結(jié)果。
9.如權(quán)利要求8所述的裝置,其特征在于,所述裝置還包括預(yù)處理模塊,所述預(yù)處理模塊用于對(duì)所述待分類的信號(hào)進(jìn)行高頻濾波處理后輸出給所述短時(shí)特征提取模塊。
10.如權(quán)利要求8所述的裝置,其特征在于,所述數(shù)據(jù)單元的m個(gè)特征參數(shù)包括如下特征參數(shù)中的一個(gè)或多個(gè)數(shù)據(jù)單元的對(duì)數(shù)能量,過(guò)零率、子幀對(duì)數(shù)能量、基音周期、頻譜重心、頻譜通量;所述子幀對(duì)數(shù)能量為將所述數(shù)據(jù)單元?jiǎng)澐譃镹個(gè)子幀,獲取每個(gè)子幀的對(duì)數(shù)能量,得到N個(gè)對(duì)數(shù)能量,N大于I且為整數(shù)。
11.如權(quán)利要求8所述的裝置,其特征在于,所述長(zhǎng)時(shí)特征提取模塊進(jìn)行的所述統(tǒng)計(jì)處理包括如下之一或其組合取最大值、最小值、方差、標(biāo)準(zhǔn)差和數(shù)學(xué)期望值。
12.如權(quán)利要求8所述的裝置,其特征在于,所述分類模塊將該η個(gè)長(zhǎng)時(shí)特征向量根據(jù)預(yù)設(shè)原則送入η個(gè)預(yù)先訓(xùn)練得到的分類器中包括對(duì)該η個(gè)長(zhǎng)時(shí)特征向量中任一個(gè)長(zhǎng)時(shí)特征向量,將該長(zhǎng)時(shí)特征向量只送入與該長(zhǎng)時(shí)特征向量對(duì)應(yīng)的一個(gè)分類器;或者,將該長(zhǎng)時(shí)特征向量送入與該長(zhǎng)時(shí)特征向量對(duì)應(yīng)的一個(gè)分類器,及至少一個(gè)其它分類器。
13.如權(quán)利要求8所述的裝置,其特征在于,所述決策融合模塊是用于將所述多個(gè)分類結(jié)果中,數(shù)量最多的相同的分類結(jié)果的作為最終分類結(jié)果。
14.如權(quán)利要求8所述的裝置,其特征在于,所述短時(shí)特征提取模塊從所述待分類的信號(hào)中獲取多個(gè)數(shù)據(jù)單元時(shí),只提取能量值超過(guò)指定門限值的數(shù)據(jù)單元。
全文摘要
本發(fā)明提供一種信號(hào)分類方法,包括從待分類的信號(hào)中獲取多個(gè)數(shù)據(jù)單元,一個(gè)數(shù)據(jù)單元提取m個(gè)特征參數(shù)組成一個(gè)短時(shí)特征向量,從所述多個(gè)數(shù)據(jù)單元中取一組數(shù)據(jù)單元,對(duì)該組數(shù)據(jù)單元對(duì)應(yīng)的K個(gè)短時(shí)特征向量進(jìn)行多種統(tǒng)計(jì)處理,得到一個(gè)長(zhǎng)時(shí)特征向量,所述長(zhǎng)時(shí)特征向量由一組統(tǒng)計(jì)向量Ys組成,s=1...S,其中,向量Ys的第j個(gè)元素由短時(shí)特征向量X1至Xp的第j個(gè)元素進(jìn)行第s種統(tǒng)計(jì)處理得到,得到n組數(shù)據(jù)單元對(duì)應(yīng)的n個(gè)長(zhǎng)時(shí)特征向量;將該n個(gè)長(zhǎng)時(shí)特征向量根據(jù)預(yù)設(shè)原則送入n個(gè)預(yù)先訓(xùn)練得到的分類器中,得到多個(gè)分類結(jié)果;根據(jù)多個(gè)分類結(jié)果按照預(yù)設(shè)決策融合機(jī)制得到最終分類結(jié)果。本發(fā)明還提供一種信號(hào)分類裝置。
文檔編號(hào)G10L15/02GK103000172SQ20111026796
公開日2013年3月27日 申請(qǐng)日期2011年9月9日 優(yōu)先權(quán)日2011年9月9日
發(fā)明者盧敏, 竇維蓓, 覃春花, 袁浩, 唐慶余, 黎家力 申請(qǐng)人:中興通訊股份有限公司, 清華大學(xué)