信號(hào)分類方法和裝置的制作方法

文檔序號(hào)：2835886閱讀：403來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專利名稱：信號(hào)分類方法和裝置的制作方法
技術(shù)領(lǐng)域：
本發(fā)明涉及多媒體信號(hào)處理和模式識(shí)別領(lǐng)域，特別涉及一種信號(hào)分類方法和裝置。
背景技術(shù)：
語(yǔ)音信號(hào)和音樂信號(hào)各自的發(fā)聲原理不同。語(yǔ)音信號(hào)主要是指人說(shuō)話時(shí)發(fā)出的聲音。音樂信號(hào)一般包含了更為廣泛的類別，比如管弦樂、打擊樂、聲樂以及多種音源的混合。這兩類信號(hào)不僅在聽覺上存在差別，在不同的場(chǎng)合，對(duì)兩類信號(hào)的處理方式也不一樣。
在編解碼應(yīng)用中，語(yǔ)音信號(hào)通常采用基于線性預(yù)測(cè)的方式編碼，而音樂信號(hào)則廣泛地采用變換域編碼方式。對(duì)于類別不確定的信號(hào)輸入時(shí)，希望能夠判別出信號(hào)類別后再分別采用不同的方式編碼，這樣可以有效地降低編碼碼率同時(shí)保持較高編碼質(zhì)量。因此對(duì) 輸入信號(hào)的準(zhǔn)確分類就顯得十分關(guān)鍵，它影響著輸出音頻信號(hào)碼率的質(zhì)量。
在噪聲抑制應(yīng)用中，通常希望對(duì)移動(dòng)條件下的語(yǔ)音通話進(jìn)行噪聲抑制，而對(duì)于彩鈴而言，通常彩鈴音樂信號(hào)來(lái)自媒體服務(wù)器，沒有被環(huán)境噪聲污染，故而不需要進(jìn)行噪聲抑制。
因此，在復(fù)雜的現(xiàn)代通信系統(tǒng)中，針對(duì)類別多樣的音頻信號(hào)需要按照不同的方式進(jìn)行處理。為了獲得更好的主觀體驗(yàn)，通常需要將音頻信號(hào)區(qū)分為語(yǔ)音、音樂。這首先就需要一個(gè)高效、準(zhǔn)確的信號(hào)分類算法。
目前常用的信號(hào)分類器設(shè)計(jì)方法較多，常見的有基于特征計(jì)算加概率模型的方法，以及特征計(jì)算加函數(shù)逼近方法。特征計(jì)算主要包括信號(hào)的時(shí)域、頻域等參數(shù)。概率模型方法大致包括混合高斯模型、隱馬爾可夫模型、支持向量機(jī)、決策樹等。而神經(jīng)網(wǎng)絡(luò)則是使用非線性神經(jīng)元的函數(shù)逼近方法。但實(shí)際應(yīng)用于通信系統(tǒng)中，還有較多因素需要考慮，如分類器延時(shí)、復(fù)雜度、準(zhǔn)確率、魯棒性等指標(biāo)。
在實(shí)時(shí)的通信中，現(xiàn)有的信號(hào)分類算法由于復(fù)雜度、延時(shí)和分類正確率而不能滿足高效率、高質(zhì)量的編碼器的需求。發(fā)明內(nèi)容
本發(fā)明所要解決的技術(shù)問(wèn)題是提供一種信號(hào)分類方法和裝置，以獲得更穩(wěn)定和更高的分類正確率，且能滿足低復(fù)雜度、低延時(shí)算法的需求。
為了解決上述問(wèn)題，本發(fā)明提供了一種信號(hào)分類方法，包括
從待分類的信號(hào)中獲取多個(gè)數(shù)據(jù)單元，一個(gè)數(shù)據(jù)單元提取m個(gè)特征參數(shù)組成一個(gè) 短時(shí)特征向量，m為整數(shù)且大于等于I ;
從所述多個(gè)數(shù)據(jù)單元中取一組數(shù)據(jù)單元,對(duì)該組數(shù)據(jù)單元中共K個(gè)數(shù)據(jù)單元對(duì)應(yīng) 的K個(gè)短時(shí)特征向量Xp，P =1... K進(jìn)行S種統(tǒng)計(jì)處理，得到一個(gè)長(zhǎng)時(shí)特征向量，所述長(zhǎng)時(shí) 特征向量由一組統(tǒng)計(jì)向量Ys組成,s = l... S,其中，向量Ys的第j個(gè)元素由向量Xl至Xp 的第j個(gè)元素進(jìn)行第s種統(tǒng)計(jì)處理得到，所述S為整數(shù)且大于等于1，j =1. . . m，K大于等于I ;重復(fù)執(zhí)行上述步驟，直到得到η組數(shù)據(jù)單元對(duì)應(yīng)的η個(gè)長(zhǎng)時(shí)特征向量，η為整數(shù)且大于等于2 ;其中，各組數(shù)據(jù)單元之間包含的數(shù)據(jù)單元個(gè)數(shù)不同；
將該η個(gè)長(zhǎng)時(shí)特征向量根據(jù)預(yù)設(shè)原則送入η個(gè)預(yù)先訓(xùn)練得到的分類器中，得到多個(gè)分類結(jié)果；
根據(jù)所述多個(gè)分類結(jié)果按照預(yù)設(shè)決策融合機(jī)制得到最終分類結(jié)果。
進(jìn)一步的，上述方法還可具有以下特點(diǎn)，所述方法還包括提取所述特征參數(shù)前，對(duì)所述待分類的信號(hào)進(jìn)行高頻濾波處理。
進(jìn)一步的，上述方法還可具有以下特點(diǎn)，所述一個(gè)數(shù)據(jù)單元的m個(gè)特征參數(shù)包括如下特征參數(shù)中的一個(gè)或多個(gè)
數(shù)據(jù)單元的對(duì)數(shù)能量，過(guò)零率、子幀對(duì)數(shù)能量、基音周期、頻譜重心、頻譜通量；
所述子巾貞對(duì)數(shù)能量為
將所述數(shù)據(jù)單元?jiǎng)?分為N個(gè)子幀，獲取每個(gè)子幀的對(duì)數(shù)能量，得到N個(gè)對(duì)數(shù)能量， N大于I且為整數(shù)。
進(jìn)一步的，上述方法還可具有以下特點(diǎn)，所述統(tǒng)計(jì)處理包括如下之一或其組合
取最大值、最小值、方差、標(biāo)準(zhǔn)差和數(shù)學(xué)期望值。
進(jìn)一步的，上述方法還可具有以下特點(diǎn)，所述將該η個(gè)長(zhǎng)時(shí)特征向量根據(jù)預(yù)設(shè)原則送入η個(gè)預(yù)先訓(xùn)練得到的分類器中包括
對(duì)該η個(gè)長(zhǎng)時(shí)特征向量中任一個(gè)長(zhǎng)時(shí)特征向量，將該長(zhǎng)時(shí)特征向量只送入與該長(zhǎng)時(shí)特征向量對(duì)應(yīng)的一個(gè)分類器；或者，將該長(zhǎng)時(shí)特征向量送入與該長(zhǎng)時(shí)特征向量對(duì)應(yīng)的一個(gè)分類器，及至少一個(gè)其它分類器。
進(jìn)一步的，上述方法還可具有以下特點(diǎn)，根據(jù)所述多個(gè)分類結(jié)果按照預(yù)設(shè)決策融合機(jī)制得到最終分類結(jié)果包括
將所述多個(gè)分類結(jié)果中，數(shù)量最多的相同的分類結(jié)果作為最終分類結(jié)果。
進(jìn)一步的，上述方法還可具有以下特點(diǎn)，從所述待分類的信號(hào)中獲取多個(gè)數(shù)據(jù)單元時(shí)，只提取能量值超過(guò)指定門限值的數(shù)據(jù)單元。
本發(fā)明還提供一種信號(hào)分類裝置，包括短時(shí)特征提取模塊、長(zhǎng)時(shí)特征提取模塊、分類模塊和決策融合模塊，其中
所述短時(shí)特征提取模塊用于從待分類的信號(hào)中獲取多個(gè)數(shù)據(jù)單元，一個(gè)數(shù)據(jù)單元提取m個(gè)特征參數(shù)組成一個(gè)特征向量；
所述長(zhǎng)時(shí)特征提取模塊用于從所述多個(gè)數(shù)據(jù)單元中取一組數(shù)據(jù)單元，對(duì)該組數(shù)據(jù)單元中共K個(gè)數(shù)據(jù)單元對(duì)應(yīng)的K個(gè)短時(shí)特征向量Xp, P =1. . . K進(jìn)行S種統(tǒng)計(jì)處理,得到一個(gè)長(zhǎng)時(shí)特征向量，所述長(zhǎng)時(shí)特征向量由一組統(tǒng)計(jì)向量Ys組成，s=l... S,其中，向量Ys 的第j個(gè)元素由向量Xl至Xp的第j個(gè)元素進(jìn)行第s種統(tǒng)計(jì)處理得到，所述S為整數(shù)且大于等于I, j =1. . . m,K大于等于I ;重復(fù)執(zhí)行上述步驟,直到得到η組數(shù)據(jù)單元對(duì)應(yīng)的η個(gè)長(zhǎng)時(shí)特征向量，η為整數(shù)且大于等于2 ;其中，各組數(shù)據(jù)單元之間包含的數(shù)據(jù)單元個(gè)數(shù)不同；
所述分類模塊用于將該η個(gè)長(zhǎng)時(shí)特征向量根據(jù)預(yù)設(shè)原則送入η個(gè)預(yù)先訓(xùn)練得到的分類器中，得到多個(gè)分類結(jié)果；
所述決策融合模塊用于根據(jù)所述多個(gè)分類結(jié)果按照預(yù)設(shè)決策融合機(jī)制得到最終分類結(jié)果。
進(jìn)一步的，上述裝置還可具有以下特點(diǎn)，所述裝置還包括預(yù)處理模塊，所述預(yù)處理模塊用于對(duì)所述待分類的信號(hào)進(jìn)行高頻濾波處理后輸出給所述短時(shí)特征提取模塊。
進(jìn)一步的，上述裝置還可具有以下特點(diǎn)，所述數(shù)據(jù)單元的m個(gè)特征參數(shù)包括如下特征參數(shù)中的一個(gè)或多個(gè)
數(shù)據(jù)單元的對(duì)數(shù)能量，過(guò)零率、子幀對(duì)數(shù)能量、基音周期、頻譜重心、頻譜通量；
所述子巾貞對(duì)數(shù)能量為
將所述數(shù)據(jù)單元?jiǎng)澐譃镹個(gè)子幀，獲取每個(gè)子幀的對(duì)數(shù)能量，得到N個(gè)對(duì)數(shù)能量， N大于I且為整數(shù)。
進(jìn)一步的，上述裝置還可具有以下特點(diǎn)，所述長(zhǎng)時(shí)特征提取模塊進(jìn)行的所述統(tǒng)計(jì)處理包括如下之一或其組合
取最大值、最小值、方差、標(biāo)準(zhǔn)差和數(shù)學(xué)期望值。
進(jìn)一步的，上述裝置還可具有以下特點(diǎn)，所述分類模塊將該η個(gè)長(zhǎng)時(shí)特征向量根據(jù)預(yù)設(shè)原則送入η個(gè)預(yù)先訓(xùn)練得到的分類器中包括
對(duì)該η個(gè)長(zhǎng)時(shí)特征向量中任一個(gè)長(zhǎng)時(shí)特征向量，將該長(zhǎng)時(shí)特征向量只送入與該長(zhǎng)時(shí)特征向量對(duì)應(yīng)的一個(gè)分類器；或者，將該長(zhǎng)時(shí)特征向量送入與該長(zhǎng)時(shí)特征向量對(duì)應(yīng)的一個(gè)分類器，及至少一個(gè)其它分類器。
進(jìn)一步的，上述裝置還可具有以下特點(diǎn)，所述決策融合模塊是用于
將所述多個(gè)分類結(jié)果中，數(shù)量最多的相同的分類結(jié)果的作為最終分類結(jié)果。
進(jìn)一步的，上述裝置還可具有以下特點(diǎn)，所述短時(shí)特征提取模塊從所述待分類的信號(hào)中獲取多個(gè)數(shù)據(jù)單元時(shí)，只提取能量值超過(guò)指定門限值的數(shù)據(jù)單元。
本發(fā)明實(shí)施例提出的信號(hào)分類方法，首先對(duì)輸入信號(hào)進(jìn)行預(yù)處理，提取短時(shí)特征，然后計(jì)算不同時(shí)長(zhǎng)的長(zhǎng)時(shí)特征，采用多棵決策樹的聯(lián)合分類方法，加上決策融合，得到最終分類結(jié)果。不同的時(shí)長(zhǎng)既保證了算法的穩(wěn)定性，又滿足實(shí)時(shí)性的要求，多棵決策樹的聯(lián)合分類方法使分類結(jié)果更為準(zhǔn)確。與現(xiàn)有算法相比，本發(fā)明具有低延時(shí)、低復(fù)雜度、準(zhǔn)確率高等優(yōu)點(diǎn)。

圖
圖
圖
圖
圖
圖
圖
圖
圖
圖
圖
圖1是本發(fā)明實(shí)施例基于決策樹的分類方法流程圖；2是本發(fā)明實(shí)施例決策樹分類器的示意圖；3是本發(fā)明實(shí)施例短時(shí)特征向量提取的流程圖；4是本發(fā)明實(shí)施例長(zhǎng)時(shí)特征向量提取的流程圖；5是本發(fā)明實(shí)施例蝶形交叉分類的流程圖；6是本發(fā)明實(shí)施例決策融合流程圖；7是本發(fā)明實(shí)施例長(zhǎng)時(shí)特征向量提取的流程圖；8是本發(fā)明不經(jīng)過(guò)非靜音判斷長(zhǎng)時(shí)特征向量提取的流程圖；9是本發(fā)明實(shí)施例一種多棵決策樹聯(lián)合分類方法實(shí)施的流程圖；10是本發(fā)明實(shí)施例另一種多棵決策樹聯(lián)合分類方法實(shí)施的流程圖 11是本發(fā)明實(shí)施例另一種多棵決策樹聯(lián)合分類方法實(shí)施的流程圖 12是本發(fā)明實(shí)施例信號(hào)分類裝置的結(jié)構(gòu)示意圖。
具體實(shí)施方式
為使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚明白，下文中將結(jié)合附圖對(duì)本發(fā)明的實(shí)施例進(jìn)行詳細(xì)說(shuō)明。需要說(shuō)明的是，在不沖突的情況下，本申請(qǐng)中的實(shí)施例及實(shí)施例中的特征可以相互任意組合。
本發(fā)明實(shí)施例提供一種信號(hào)分類方法，包括
從待分類的信號(hào)中獲取多個(gè)數(shù)據(jù)單元，一個(gè)數(shù)據(jù)單元提取m個(gè)特征參數(shù)組成一個(gè)短時(shí)特征向量，m大于等于I且為整數(shù)；
從所述多個(gè)數(shù)據(jù)單元中取一組數(shù)據(jù)單元,對(duì)該組數(shù)據(jù)單元中共K個(gè)數(shù)據(jù)單元對(duì)應(yīng)的K個(gè)短時(shí)特征向量Xp，P =1... K進(jìn)行S種統(tǒng)計(jì)處理，得到一個(gè)長(zhǎng)時(shí)特征向量，所述長(zhǎng)時(shí)特征向量由一組統(tǒng)計(jì)向量Ys組成,s = l... S,其中，向量Ys的第j個(gè)元素由向量Xl至Xp 的第j個(gè)元素進(jìn)行第s種統(tǒng)計(jì)處理得到，所述S為整數(shù)且大于等于1，j =1. . . m，K大于等于I ;重復(fù)執(zhí)行上述步驟，直到得到η組數(shù)據(jù)單元對(duì)應(yīng)的η個(gè)長(zhǎng)時(shí)特征向量，η為整數(shù)且大于等于2 ;其中，各組數(shù)據(jù)單元之間包含的數(shù)據(jù)單元個(gè)數(shù)不同；
將該η個(gè)長(zhǎng)時(shí)特征向量根據(jù)預(yù)設(shè)原則送入η個(gè)預(yù)先訓(xùn)練得到的分類器中，得到多個(gè)分類結(jié)果，根據(jù)所述多個(gè)分類結(jié)果中得到最終分類結(jié)果。
其中，所述方法還包括提取所述特征參數(shù)前，對(duì)所述待分類的信號(hào)進(jìn)行高頻濾波處理。也可以不進(jìn)行高頻濾波處理
其中,所述一個(gè)數(shù)據(jù)單元的m個(gè)特征參數(shù)包括如下特征參數(shù)中的一個(gè)或多個(gè)
數(shù)據(jù)單元的對(duì)數(shù)能量，過(guò)零率、子幀對(duì)數(shù)能量、基音周期、頻譜重心、頻譜通量；
所述子巾貞對(duì)數(shù)能量為
將所述數(shù)據(jù)單元?jiǎng)澐譃镹個(gè)子幀，獲取每個(gè)子幀的對(duì)數(shù)能量，得到N個(gè)對(duì)數(shù)能量， N大于I且為整數(shù)。劃分時(shí) ，可以將該數(shù)據(jù)單元均勻劃分，也可以不均勻劃分。
其中，所述統(tǒng)計(jì)處理包括如下之一或其組合或其變形形式取最大值、最小值、方差、標(biāo)準(zhǔn)差和數(shù)學(xué)期望值。變形形式是指在這些處理方式的基礎(chǔ)上進(jìn)行變形，比如最大值/ 數(shù)學(xué)期望，緩存器中每個(gè)值減去最大值的和，等等。
比如，進(jìn)行取最大值和方差兩種統(tǒng)計(jì)處理時(shí)，可以將向量Xl至Xp的第I個(gè)元素取最大值，得到統(tǒng)計(jì)向量Yl的第I個(gè)元素，依次類推，將向量Xl至Xp的第m個(gè)元素中取最大值，得到統(tǒng)計(jì)向量Yl的第m個(gè)元素，從而得到統(tǒng)計(jì)向量Yl ;可以將向量Xl至Xp的第I個(gè)元素求方差，得到統(tǒng)計(jì)向量Y2的第I個(gè)元素,依次類推,將向量Xl至Xp的第m個(gè)元素求方差，得到統(tǒng)計(jì)向量Y2的第m個(gè)元素，從而得到統(tǒng)計(jì)向量Y2。
其中，所述將該η個(gè)長(zhǎng)時(shí)特征向量根據(jù)預(yù)設(shè)原則送入η個(gè)預(yù)先訓(xùn)練得到的分類器中包括
對(duì)該η個(gè)長(zhǎng)時(shí)特征向量中任一個(gè)長(zhǎng)時(shí)特征向量，將該長(zhǎng)時(shí)特征向量只送入與該長(zhǎng)時(shí)特征向量對(duì)應(yīng)的一個(gè)分類器；或者，將該長(zhǎng)時(shí)特征向量送入與該長(zhǎng)時(shí)特征向量對(duì)應(yīng)的一個(gè)分類器，及至少一個(gè)其它分類器。
比如，三組統(tǒng)計(jì)向量，分別送入分類器Ta，Tb，Tc，也可以第一組送入Ta，Tb，第二組送入Tb, Tc,第三組送入Tc, Tb ;或者,第一組送入Ta, Tb, Tc,第二組送入Ta, Tb, Tc,第三組送入Ta，Tb，Tc，此處僅為示例。分類器通過(guò)預(yù)先訓(xùn)練得到，具體的，使用已知分類結(jié)果的訓(xùn)練信號(hào)，提取多組數(shù)據(jù)單元及其對(duì)應(yīng)的多組統(tǒng)計(jì)向量，訓(xùn)練得到多個(gè)分類器。
其中，所述根據(jù)所述多個(gè)分類結(jié)果中得到最終分類結(jié)果包括
將所述多個(gè)分類結(jié)果中，數(shù)量最多的相同的分類結(jié)果的作為最終分類結(jié)果。
其中，從所述待分類的信號(hào)中獲取多個(gè)數(shù)據(jù)單元時(shí)，只提取能量值超過(guò)指定門限值的數(shù)據(jù)單元，當(dāng)然，也可以對(duì)數(shù)據(jù)單元的能量值不進(jìn)行限定。
上述數(shù)據(jù)單元可以是一個(gè)數(shù)據(jù)幀，也可以是多個(gè)數(shù)據(jù)幀，或根據(jù)需要設(shè)置的一定時(shí)長(zhǎng)的數(shù)據(jù)，本發(fā)明對(duì)此不作限定。
所述各組數(shù)據(jù)單元中，各組數(shù)據(jù)單元可以完全不重合，或者，部分重合。一種具體應(yīng)用是任意兩組中，其中一組是另一組的子集。
上述信號(hào)分類方法可以適用于多種信號(hào)，包括音頻信號(hào)。
下面以音頻信號(hào)的分類為例進(jìn)一步說(shuō)明本發(fā)明。
[實(shí)施例1]
本實(shí)施例是32kHz采樣率下的語(yǔ)音/音樂信號(hào)分類，幀長(zhǎng)L= 1280，在其它幀長(zhǎng)和采樣率條件下，本發(fā)明的方法同樣適用。分類過(guò)程如圖1所示，該方法包括
在進(jìn)行分類前，先進(jìn)行訓(xùn)練得到分類器，包括
SI，輸入訓(xùn)練集信號(hào)，對(duì)輸入信號(hào)進(jìn)行預(yù)處理，濾波處理，濾波器為高通濾波器，用于濾除低頻的直流成分；
本實(shí)施例中，可以濾除0-50HZ的直流成分，當(dāng)然，也可以根據(jù)需要設(shè)置濾除更高或更低范圍內(nèi)的直流成分。
S2 :對(duì)濾波后的信號(hào)提取短時(shí)特征向量，本實(shí)施例中，短時(shí)特征向量中包括如下參數(shù)對(duì)數(shù)能量、過(guò)零率和子幀對(duì)數(shù)能量。
S3:提取η個(gè)不同時(shí)長(zhǎng)的長(zhǎng)時(shí)特征向量，利用不同時(shí)長(zhǎng)的長(zhǎng)時(shí)特征向量分別訓(xùn)練，得到η個(gè)分類器，本實(shí)施例中，分類器采用決策樹形式，也可采取其他形式的分類器。其中一棵決策樹如圖2所示，圖2中取值僅為示例，針對(duì)不同信號(hào)，可進(jìn)行訓(xùn)練得到不同的決策樹。
訓(xùn)練得到分類器后，對(duì)待分類的信號(hào)，執(zhí)行如下操作
101，輸入待分類的信號(hào)，進(jìn)行預(yù)處理，所述預(yù)處理包括濾波處理，濾波器為高通濾波器，用于濾除低頻的直流成分；
102 :對(duì)濾波后的信號(hào)提取短時(shí)特征向量，本實(shí)施例中，短時(shí)特征向量中包括如下參數(shù)對(duì)數(shù)能量、過(guò)零率和子幀對(duì)數(shù)能量。
103，提取多組不同時(shí)長(zhǎng)的長(zhǎng)時(shí)特征向量，按照預(yù)設(shè)原則送入多個(gè)分類器中進(jìn)行分類，得到多個(gè)分類結(jié)果；
104:針對(duì)分類的結(jié)果按照一定決策融合機(jī)制進(jìn)行判決，得到最終的分類結(jié)果。
其中，步驟S2和102中特征計(jì)算包括短時(shí)特征計(jì)算，如圖3所示。
201 :計(jì)算對(duì)數(shù)能量，對(duì)數(shù)能量的計(jì)算方法如下
第i幀對(duì)數(shù)能量E1 Ji)定義為第i幀內(nèi)所有點(diǎn)的平方和，再取對(duì)數(shù)值。即
燦)= Σ:二
Elog (i) = Iog2(E1Q))
其中，x(n)表示當(dāng)前幀的樣點(diǎn)值，L表示幀長(zhǎng)。
202 :計(jì)算過(guò)零率,過(guò)零率的計(jì)算方法如下
第i幀過(guò)零率ZCR(i)定義為第i幀內(nèi)所有點(diǎn)分布的波形穿過(guò)零點(diǎn)的次數(shù)的和。即
ZCR(i) =[sign(x(n)) - sign(x(n -1))] j2
其中，x (n)表示當(dāng)前巾貞的樣點(diǎn)值，L表示巾貞長(zhǎng),其中，sign (x)是符號(hào)函數(shù),定義如下(I, x>0
SIgn(X) = \[-1,χ<0
203 :計(jì)算子幀對(duì)數(shù)能量，計(jì)算方法如下
第i幀第k子幀對(duì)數(shù)能量SubEn1()g(i，k)定義將第i幀均勻劃分為N個(gè)子幀，即第i幀每1/N的幀長(zhǎng)的點(diǎn)為一個(gè)小子幀，對(duì)每個(gè)子幀內(nèi)的所有點(diǎn)的平方值求和，再取對(duì)數(shù)，即SubEn1()g(i，k)。每個(gè)子幀對(duì)應(yīng)一個(gè)值，共N個(gè)值。即
SubEnQ, k) =χ2 ⑷，k = I，2，· · · N
SubEnlog (i, k) = Iog2 (SubEn (i, k))
其中，χ (η)是第i巾貞的信號(hào)樣點(diǎn)值，N是子巾貞數(shù)，SubEnlog (i, k)表示第i巾貞的第k 子幀的對(duì)數(shù)能量值。均勻劃分為N個(gè)子幀僅為示例，也可以不均勻劃分。
存儲(chǔ)計(jì)算得到對(duì)數(shù)能量、過(guò)零率和N維子幀對(duì)數(shù)能量，即得到N+2維短時(shí)特征向量，各特征參數(shù)在向量中的位置不限定，各短時(shí)特征向量同一位置對(duì)于同一類特征參數(shù)。
步驟S3和步驟103中計(jì)算不同時(shí)長(zhǎng)的長(zhǎng)時(shí)特征，本實(shí)施例中計(jì)算兩組不同時(shí)長(zhǎng) Na，Nb的長(zhǎng)時(shí)特征(其中Na > Nb > O)，如圖4所示，包括
301 :首先判斷當(dāng)前幀是否為非靜音幀，非靜音幀具體是指當(dāng)前幀的能量超過(guò)指定門限值，否則為靜音幀；
可以利用計(jì)算的對(duì)數(shù)能量E1 Ji)判斷是否為非靜音幀，如果對(duì)數(shù)能量值E1 Ji) 小于特定門限Thr (在本實(shí)施例中選取O > Thr > -20)，則判斷為靜音幀，否則為非靜音幀。當(dāng)然，也可以利用其它能量參數(shù)，比如不取對(duì)數(shù)，直接利用當(dāng)前幀的能量值。
再判斷緩存器中是否已經(jīng)存入非靜音幀的特征信息。
如果不是非靜音幀且緩存器中已經(jīng)存入非靜音幀的信息，則執(zhí)行303，否則執(zhí)行 302。
當(dāng)然，也可以先判斷是否非靜音幀和緩存器中是否已經(jīng)存入非靜音幀的信息，對(duì)非靜音幀計(jì)算短時(shí)特征向量，對(duì)緩存器中未存入非靜音幀時(shí)的靜音幀計(jì)算短時(shí)特征向量，對(duì)緩存器已存入非靜音幀特征時(shí)的靜音幀直接丟棄。
另外，用于判斷的各幀之間可以連續(xù)也可以不連續(xù)。
302 :按照一定原則將短時(shí)特征向量存入特征緩存器。緩存器的長(zhǎng)度取較大時(shí)長(zhǎng) Na的長(zhǎng)度,執(zhí)行步驟304 ；
當(dāng)然，緩存器的長(zhǎng)度也可以為Na+Nb的長(zhǎng)度；或者，為Na和Na+Nb之間的長(zhǎng)度。緩存器也可以更長(zhǎng)，預(yù)留一些緩存空間。
303，丟棄該短時(shí)特征向量，執(zhí)行步驟304 ；
304 :對(duì)于Na時(shí)長(zhǎng)的長(zhǎng)時(shí)特征FexNa，計(jì)算緩存器內(nèi)的最大值max^p:),計(jì)算緩存器內(nèi)的方差值Var(^7wa)。
計(jì)算Na時(shí)長(zhǎng)的長(zhǎng)時(shí)特征向量包括對(duì)Na個(gè)短時(shí)特征向量的相同位置的元素取最大值，得到向量對(duì)應(yīng)位置的元素，對(duì)Na個(gè)短時(shí)特征向量的相同位置的元素計(jì)算方差值得到向量var<F:)對(duì)應(yīng)位置的元素。
305 :對(duì)于Nb時(shí)長(zhǎng)的長(zhǎng)時(shí)特征FexNb，計(jì)算緩存器內(nèi)Nb個(gè)數(shù)值的最大值計(jì)算緩存器內(nèi)Nb個(gè)數(shù)值的方差值Var(7^)。
從而得到長(zhǎng)時(shí)特征矩陣
權(quán)利要求
1.一種信號(hào)分類方法，其特征在于，包括從待分類的信號(hào)中獲取多個(gè)數(shù)據(jù)單元，一個(gè)數(shù)據(jù)單元提取m個(gè)特征參數(shù)組成一個(gè)短時(shí)特征向量，m為整數(shù)且大于等于I ;從所述多個(gè)數(shù)據(jù)單元中取一組數(shù)據(jù)單元，對(duì)該組數(shù)據(jù)單元中共K個(gè)數(shù)據(jù)單元對(duì)應(yīng)的K 個(gè)短時(shí)特征向量Xp，P =1... K進(jìn)行S種統(tǒng)計(jì)處理，得到一個(gè)長(zhǎng)時(shí)特征向量，所述長(zhǎng)時(shí)特征向量由一組統(tǒng)計(jì)向量Ys組成,S =1. . . S,其中，向量Ys的第j個(gè)元素由向量Xl至Xp的第 j個(gè)元素進(jìn)行第s種統(tǒng)計(jì)處理得到，所述S為整數(shù)且大于等于1，j =1. . . m，K大于等于I ; 重復(fù)執(zhí)行上述步驟，直到得到η組數(shù)據(jù)單元對(duì)應(yīng)的η個(gè)長(zhǎng)時(shí)特征向量，η為整數(shù)且大于等于·2;其中，各組數(shù)據(jù)單元之間包含的數(shù)據(jù)單元個(gè)數(shù)不同；將該η個(gè)長(zhǎng)時(shí)特征向量根據(jù)預(yù)設(shè)原則送入η個(gè)預(yù)先訓(xùn)練得到的分類器中，得到多個(gè)分類結(jié)果；根據(jù)所述多個(gè)分類結(jié)果按照預(yù)設(shè)決策融合機(jī)制得到最終分類結(jié)果。
2.如權(quán)利要求1所述的方法，其特征在于，所述方法還包括提取所述特征參數(shù)前，對(duì)所述待分類的信號(hào)進(jìn)行高頻濾波處理。
3.如權(quán)利要求1所述的方法，其特征在于，所述一個(gè)數(shù)據(jù)單元的m個(gè)特征參數(shù)包括如下特征參數(shù)中的一個(gè)或多個(gè)數(shù)據(jù)單元的對(duì)數(shù)能量，過(guò)零率、子幀對(duì)數(shù)能量、基音周期、頻譜重心、頻譜通量；所述子幀對(duì)數(shù)能量為將所述數(shù)據(jù)單元?jiǎng)澐譃镹個(gè)子幀，獲取每個(gè)子幀的對(duì)數(shù)能量，得到N個(gè)對(duì)數(shù)能量，N大于I且為整數(shù)。
4.如權(quán)利要求1所述的方法，其特征在于，所述統(tǒng)計(jì)處理包括如下之一或其組合取最大值、最小值、方差、標(biāo)準(zhǔn)差和數(shù)學(xué)期望值。
5.如權(quán)利要求1所述的方法，其特征在于，所述將該η個(gè)長(zhǎng)時(shí)特征向量根據(jù)預(yù)設(shè)原則送入η個(gè)預(yù)先訓(xùn)練得到的分類器中包括對(duì)該η個(gè)長(zhǎng)時(shí)特征向量中任一個(gè)長(zhǎng)時(shí)特征向量，將該長(zhǎng)時(shí)特征向量只送入與該長(zhǎng)時(shí)特征向量對(duì)應(yīng)的一個(gè)分類器；或者，將該長(zhǎng)時(shí)特征向量送入與該長(zhǎng)時(shí)特征向量對(duì)應(yīng)的一個(gè)分類器，及至少一個(gè)其它分類器。
6.如權(quán)利要求1所述的方法，其特征在于，根據(jù)所述多個(gè)分類結(jié)果按照預(yù)設(shè)決策融合機(jī)制得到最終分類結(jié)果包括將所述多個(gè)分類結(jié)果中，數(shù)量最多的相同的分類結(jié)果作為最終分類結(jié)果。
7.如權(quán)利要求1所述的方法，其特征在于，從所述待分類的信號(hào)中獲取多個(gè)數(shù)據(jù)單元時(shí)，只提取能量值超過(guò)指定門限值的數(shù)據(jù)單元。
8.一種信號(hào)分類裝置，其特征在于，包括短時(shí)特征提取模塊、長(zhǎng)時(shí)特征提取模塊、分類模塊和決策融合模塊，其中所述短時(shí)特征提取模塊用于從待分類的信號(hào)中獲取多個(gè)數(shù)據(jù)單元，一個(gè)數(shù)據(jù)單元提取m個(gè)特征參數(shù)組成一個(gè)特征向量；所述長(zhǎng)時(shí)特征提取模塊用于從所述多個(gè)數(shù)據(jù)單元中取一組數(shù)據(jù)單元，對(duì)該組數(shù)據(jù)單元中共K個(gè)數(shù)據(jù)單元對(duì)應(yīng)的K個(gè)短時(shí)特征向量Xp,P =1. . . K進(jìn)行S種統(tǒng)計(jì)處理,得到一個(gè)長(zhǎng)時(shí)特征向量，所述長(zhǎng)時(shí)特征向量由一組統(tǒng)計(jì)向量Ys組成，s = l... S,其中，向量Ys的第j個(gè)元素由向量Xl至Xp的第j個(gè)元素進(jìn)行第S種統(tǒng)計(jì)處理得到，所述S為整數(shù)且大于等于I,j =1. . . m, K大于等于I ;重復(fù)執(zhí)行上述步驟,直到得到η組數(shù)據(jù)單元對(duì)應(yīng)的η個(gè)長(zhǎng)時(shí)特征向量，η為整數(shù)且大于等于2 ;其中，各組數(shù)據(jù)單元之間包含的數(shù)據(jù)單元個(gè)數(shù)不同；所述分類模塊用于將該η個(gè)長(zhǎng)時(shí)特征向量根據(jù)預(yù)設(shè)原則送入η個(gè)預(yù)先訓(xùn)練得到的分類器中，得到多個(gè)分類結(jié)果；所述決策融合模塊用于根據(jù)所述多個(gè)分類結(jié)果按照預(yù)設(shè)決策融合機(jī)制得到最終分類結(jié)果。
9.如權(quán)利要求8所述的裝置，其特征在于，所述裝置還包括預(yù)處理模塊，所述預(yù)處理模塊用于對(duì)所述待分類的信號(hào)進(jìn)行高頻濾波處理后輸出給所述短時(shí)特征提取模塊。
10.如權(quán)利要求8所述的裝置，其特征在于，所述數(shù)據(jù)單元的m個(gè)特征參數(shù)包括如下特征參數(shù)中的一個(gè)或多個(gè)數(shù)據(jù)單元的對(duì)數(shù)能量，過(guò)零率、子幀對(duì)數(shù)能量、基音周期、頻譜重心、頻譜通量；所述子幀對(duì)數(shù)能量為將所述數(shù)據(jù)單元?jiǎng)澐譃镹個(gè)子幀，獲取每個(gè)子幀的對(duì)數(shù)能量，得到N個(gè)對(duì)數(shù)能量，N大于I且為整數(shù)。
11.如權(quán)利要求8所述的裝置，其特征在于，所述長(zhǎng)時(shí)特征提取模塊進(jìn)行的所述統(tǒng)計(jì)處理包括如下之一或其組合取最大值、最小值、方差、標(biāo)準(zhǔn)差和數(shù)學(xué)期望值。
12.如權(quán)利要求8所述的裝置，其特征在于，所述分類模塊將該η個(gè)長(zhǎng)時(shí)特征向量根據(jù)預(yù)設(shè)原則送入η個(gè)預(yù)先訓(xùn)練得到的分類器中包括對(duì)該η個(gè)長(zhǎng)時(shí)特征向量中任一個(gè)長(zhǎng)時(shí)特征向量，將該長(zhǎng)時(shí)特征向量只送入與該長(zhǎng)時(shí)特征向量對(duì)應(yīng)的一個(gè)分類器；或者，將該長(zhǎng)時(shí)特征向量送入與該長(zhǎng)時(shí)特征向量對(duì)應(yīng)的一個(gè)分類器，及至少一個(gè)其它分類器。
13.如權(quán)利要求8所述的裝置，其特征在于，所述決策融合模塊是用于將所述多個(gè)分類結(jié)果中，數(shù)量最多的相同的分類結(jié)果的作為最終分類結(jié)果。
14.如權(quán)利要求8所述的裝置，其特征在于，所述短時(shí)特征提取模塊從所述待分類的信號(hào)中獲取多個(gè)數(shù)據(jù)單元時(shí)，只提取能量值超過(guò)指定門限值的數(shù)據(jù)單元。
全文摘要
本發(fā)明提供一種信號(hào)分類方法，包括從待分類的信號(hào)中獲取多個(gè)數(shù)據(jù)單元，一個(gè)數(shù)據(jù)單元提取m個(gè)特征參數(shù)組成一個(gè)短時(shí)特征向量，從所述多個(gè)數(shù)據(jù)單元中取一組數(shù)據(jù)單元，對(duì)該組數(shù)據(jù)單元對(duì)應(yīng)的K個(gè)短時(shí)特征向量進(jìn)行多種統(tǒng)計(jì)處理，得到一個(gè)長(zhǎng)時(shí)特征向量，所述長(zhǎng)時(shí)特征向量由一組統(tǒng)計(jì)向量Ys組成，s＝1...S，其中，向量Ys的第j個(gè)元素由短時(shí)特征向量X1至Xp的第j個(gè)元素進(jìn)行第s種統(tǒng)計(jì)處理得到，得到n組數(shù)據(jù)單元對(duì)應(yīng)的n個(gè)長(zhǎng)時(shí)特征向量；將該n個(gè)長(zhǎng)時(shí)特征向量根據(jù)預(yù)設(shè)原則送入n個(gè)預(yù)先訓(xùn)練得到的分類器中，得到多個(gè)分類結(jié)果；根據(jù)多個(gè)分類結(jié)果按照預(yù)設(shè)決策融合機(jī)制得到最終分類結(jié)果。本發(fā)明還提供一種信號(hào)分類裝置。
文檔編號(hào)G10L15/02GK103000172SQ20111026796
公開日2013年3月27日申請(qǐng)日期2011年9月9日優(yōu)先權(quán)日2011年9月9日
發(fā)明者盧敏, 竇維蓓, 覃春花, 袁浩, 唐慶余, 黎家力申請(qǐng)人:中興通訊股份有限公司, 清華大學(xué)

完整全部詳細(xì)技術(shù)資料下載