欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種音頻類別的實(shí)時(shí)識(shí)別方法及裝置的制作方法

文檔序號(hào):2831005閱讀:230來源:國(guó)知局
專利名稱:一種音頻類別的實(shí)時(shí)識(shí)別方法及裝置的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及通信領(lǐng)域,尤其涉及一種音頻類別的實(shí)時(shí)識(shí)別方法及 裝置。
背景技術(shù)
在音頻的編解碼過程中,音樂和語音信號(hào)往往采用不同的編解碼 方式,因此,音頻編解碼之前需要識(shí)別其類別,確定是音樂還是語音。
對(duì)音頻類別的識(shí)別難度在于音樂以及語音中噪聲的多變。目前, 對(duì)音樂和語音的識(shí)別主要通過短時(shí)分析及長(zhǎng)時(shí)分析實(shí)現(xiàn)。短時(shí)分析中, 從音頻信號(hào)短時(shí)處理出發(fā)提取的短時(shí)特征僅僅利用了少量的有用信
息,不足以反映音樂和語音兩類信號(hào)的差異;長(zhǎng)時(shí)分析中,由于缺乏 有力的特征描述,或者通過對(duì)較長(zhǎng)的時(shí)間片如整個(gè)音頻文件的分析實(shí)
識(shí)別;前者雖然能較好地反映音樂和語音兩類信號(hào)的差異,但對(duì)采樣 率和計(jì)算量的要求較高,延時(shí)長(zhǎng),不適用于實(shí)時(shí)通信領(lǐng)域,而后者的 識(shí)別特征不夠穩(wěn)健,難以在復(fù)雜的通信環(huán)境中保證其識(shí)別有效性。

發(fā)明內(nèi)容
本發(fā)明要解決的技術(shù)問題是提供一種音頻類別的實(shí)時(shí)識(shí)別方法及 裝置,實(shí)時(shí)有效地實(shí)現(xiàn)了基于實(shí)倒譜的音頻類別的識(shí)別。
5本發(fā)明解決其技術(shù)問題所采用的技術(shù)方案是 一種音頻類別的實(shí)時(shí)識(shí)別方法,包括以下步驟
a、 計(jì)算分析區(qū)間內(nèi)的音頻信號(hào)的短時(shí)能量均方4艮,所述短時(shí)能量 均方根小于預(yù)設(shè)的靜音檢測(cè)閾值時(shí),進(jìn)入步驟b;
b、 分別對(duì)所述音頻信號(hào)的各幀信號(hào)進(jìn)行實(shí)倒譜分析;
c、 根據(jù)所述實(shí)倒譜分析結(jié)果計(jì)算所述音頻信號(hào)的短時(shí)特征,并根 據(jù)所述短時(shí)特征,采用閾值法識(shí)別所述音頻信號(hào)的類別。
上述方案中,所述步驟c具體通過以下步驟實(shí)現(xiàn)
cl、根據(jù)所述實(shí)倒譜分析結(jié)果計(jì)算所述音頻信號(hào)各個(gè)LPH (Longest Pitch Hold,基頻保持時(shí)間)/ PCT ( Pitch Continue Time, 基頻連續(xù)時(shí)間)的值;
c2、判斷LPH/PCT-1的次數(shù)是否大于預(yù)設(shè)的相等次數(shù)閾值,若是, 所述音頻信號(hào)為音樂,否則,進(jìn)入下一步;
c3、根據(jù)各個(gè)LPH/PCT的值確定LPH/PCT的均值,判斷其是否大 于預(yù)設(shè)的均值閾值,若是,所述音頻信號(hào)為音樂,否則,進(jìn)入下一步;
c4、根據(jù)所述實(shí)倒譜分析結(jié)果計(jì)算所述音頻信號(hào)的APD (Average Pitch Density,平均調(diào)性強(qiáng)度),并判斷其是否大于預(yù)設(shè)的強(qiáng)度閾值, 若是,所述音頻信號(hào)為音樂,否則,進(jìn)入下一步;
c5、 一艮據(jù)所述實(shí)倒譜分析結(jié)果計(jì)算所述音頻信號(hào)的調(diào)性幀與非調(diào) 性幀的數(shù)量及平均能量;
c6、根據(jù)所述調(diào)性幀與非調(diào)性幀的平均能量確定TNR (Tone Non-tone Ratio,調(diào)性幀與非調(diào)性幀的平均能量比),并判斷其是否小 于預(yù)設(shè)的能量比閾值,若是,所述音頻信號(hào)為音樂,否則,進(jìn)入下一 步;c7、根據(jù)所述調(diào)性幀與非調(diào)性幀的lt量確定RNT (Ratio of Non-Tone,非調(diào)性幀比例),并判斷其是否小于預(yù)設(shè)的比例閾值,若是, 所述音頻信號(hào)為音樂,否則,所述音頻信號(hào)為語音。
上述方案中,所述步驟cl通過以下步驟實(shí)現(xiàn)
cll、根據(jù)所述實(shí)倒譜分析結(jié)果中反映譜細(xì)節(jié)信息的部分,確定所 述音頻信號(hào)中基頻連續(xù)變化的信號(hào)組,及各個(gè)基頻連續(xù)變化的信號(hào)組 中基頻保持不變的信號(hào)組;
cl2、分別根據(jù)各個(gè)基頻連續(xù)變化的信號(hào)組包含的信號(hào)幀數(shù)確定相 應(yīng)的PCT,并且,分別根據(jù)各個(gè)基頻保持不變的信號(hào)組包含的信號(hào)幀 凄史確定相應(yīng)的LPH;
c13、將各個(gè)LPH分別與對(duì)應(yīng)的PCT相除。
上述方案中,每個(gè)基頻連續(xù)變化的信號(hào)組包括的各幀信號(hào)中,相 鄰兩幀信號(hào)的實(shí)倒譜分析結(jié)果中反映譜細(xì)節(jié)信息的部分的峰值差小于 預(yù)設(shè)的峰值連續(xù)誤差;每個(gè)基頻保持不變的信號(hào)組包括的各幀信號(hào)中, 相鄰兩幀信號(hào)的實(shí)倒譜分析結(jié)果中反映譜細(xì)節(jié)信息的部分的峰值差小 于預(yù)設(shè)的峰值保持誤差;所述峰值保持誤差小于所述峰值連續(xù)誤差。
上述方案中,所述APD的計(jì)算公式為
其中,iV為所述音頻信號(hào)包含的信號(hào)幀數(shù),i G"刀為所述音頻信 號(hào)的第i幀信號(hào)的實(shí)倒譜分析的第j點(diǎn)結(jié)果,丄=/2-/1+1, /,及/2分別 為所述實(shí)倒i普分析結(jié)果中反映譜細(xì)節(jié)信息的部分的起始點(diǎn)及終止點(diǎn)。
上述方案中,所述步驟c5通過以下步驟實(shí)現(xiàn)
c51、根據(jù)所述實(shí)倒譜分析結(jié)果中反映譜細(xì)節(jié)信息的部分,分別將 所述音頻信號(hào)的各幀信號(hào)標(biāo)記為調(diào)性幀或非調(diào)性幀;C52、統(tǒng)計(jì)所述調(diào)性幀及非調(diào)性幀的數(shù)量,并計(jì)算所述調(diào)性幀及非 調(diào)性幀的平均能量。
上述方案中,所述音頻信號(hào)的每幀信號(hào)的實(shí)倒譜分析的結(jié)果中反 映譜細(xì)節(jié)信息的部分的峰值小于預(yù)設(shè)的調(diào)性閾值時(shí),將其標(biāo)記為非調(diào) 性幀,否則,將其標(biāo)記為調(diào)性幀。
上述方案中,所述步驟a之前還包括預(yù)處理所述音頻信號(hào)的步驟, 依次通過對(duì)所述音頻信號(hào)的預(yù)加重處理、分幀處理以及加窗處理實(shí)現(xiàn)。 一種音頻類別的實(shí)時(shí)識(shí)別裝置,包括
靜音檢測(cè)模塊,用于計(jì)算分析區(qū)間內(nèi)的音頻信號(hào)的短時(shí)能量均方 根,并據(jù)其判斷所述音頻信號(hào)是否靜音狀態(tài);
實(shí)倒譜分析模塊,用于在所述靜音檢測(cè)模塊確定所述音頻信號(hào)非 靜音狀態(tài)時(shí),對(duì)所述音頻信號(hào)的各幀信號(hào)進(jìn)行實(shí)倒譜分析;
音頻類別識(shí)別模塊,用于根據(jù)所述實(shí)倒譜分析模塊的分析結(jié)果計(jì) 算所述音頻信號(hào)的短時(shí)特征,并根據(jù)所述短時(shí)特征,釆用閾值法識(shí)別 所述音頻信號(hào)的類別。
上述方案中,所述實(shí)時(shí)識(shí)別裝置還包括預(yù)處理模塊,用于依次對(duì) 所述音頻信號(hào)進(jìn)行預(yù)加重處理、分幀處理以及加窗處理,并將處理后 的音頻信號(hào)傳輸給所述靜音檢測(cè)模塊。
本發(fā)明的有益效果主要表現(xiàn)在本發(fā)明提供的音頻類別的實(shí)時(shí)識(shí) 別裝置用于實(shí)現(xiàn)本發(fā)明提供的音頻類別的實(shí)時(shí)識(shí)別方法,該方法根據(jù) 音頻信號(hào)的各幀信號(hào)的實(shí)倒譜分析結(jié)果計(jì)算該音頻信號(hào)的短時(shí)特征, 并采用閾值法,實(shí)時(shí)有效地實(shí)現(xiàn)了基于實(shí)倒譜的音頻類別的識(shí)別。


圖1為本發(fā)明音頻類別的實(shí)時(shí)識(shí)別流程圖2為本發(fā)明音頻類別的實(shí)時(shí)識(shí)別裝置結(jié)構(gòu)示意圖。
具體實(shí)施例方式
下面結(jié)合附圖對(duì)本發(fā)明作進(jìn)一步的描述。
參照?qǐng)D1, 一種音頻類別的實(shí)時(shí)識(shí)別方法,包括以下步驟
S101:預(yù)處理音頻信號(hào),包括依次進(jìn)行的預(yù)加重處理、分幀處理
以及加窗處理;
S102:計(jì)算分析區(qū)間內(nèi)的音頻信號(hào)的短時(shí)能量均方才艮,短時(shí)能量 均方根小于預(yù)設(shè)的靜音檢測(cè)閾值時(shí),音頻信號(hào)為非靜音狀態(tài),進(jìn)入下 一步,否則,音頻信號(hào)為靜音狀態(tài),結(jié)束本流程;
S103:分別對(duì)分析區(qū)間內(nèi)的音頻信號(hào)的各幀信號(hào)進(jìn)行實(shí)倒譜分析; 每幀信號(hào)的實(shí)倒譜分析結(jié)果中靠近0點(diǎn)的部分主要反映了功率譜輪廓 等大尺度信息,遠(yuǎn)離O點(diǎn)的部分主要反映了譜細(xì)節(jié)信息,即其能將譜 輪廓與譜細(xì)節(jié)分離;
S104:根據(jù)實(shí)倒譜分析結(jié)果計(jì)算音頻信號(hào)各個(gè)LPH/ PCT的值;即
首先,根據(jù)實(shí)倒譜分析結(jié)果中反映譜細(xì)節(jié)信息的部分,確定音頻 信號(hào)中基頻連續(xù)變化的信號(hào)組,及各個(gè)基頻連續(xù)變化的信號(hào)組中基頻 保持不變的信號(hào)組;
其中,每個(gè)基頻連續(xù)變化的信號(hào)組包括的各幀信號(hào)中,相鄰兩幀 信號(hào)的實(shí)倒譜分析結(jié)果中反映譜細(xì)節(jié)信息的部分的峰值差小于預(yù)設(shè)的 峰值連續(xù)誤差cr;每個(gè)基頻保持不變的信號(hào)組包括的各幀信號(hào)中,相 鄰兩幀信號(hào)的實(shí)倒譜分析結(jié)果中反映譜細(xì)節(jié)信息的部分的峰值差小于 預(yù)設(shè)的峰值保持誤差s; s小于c7;
9然后,分別根據(jù)各個(gè)基頻連續(xù)變化的信號(hào)組包含的信號(hào)幀數(shù)確定 相應(yīng)的PCT,并且,分別根據(jù)各個(gè)基頻保持不變的信號(hào)組包含的信號(hào)
幀數(shù)確定相應(yīng)的LPH;
最后,將各個(gè)LPH分別與對(duì)應(yīng)的PCT相除;
S105:判斷LPH/PCT-1的次數(shù)是否大于預(yù)設(shè)的相等次數(shù)閾值C,, 若是,音頻信號(hào)為音樂,否則,進(jìn)入下一步;
S106:根據(jù)各個(gè)LPH/PCT的值確定LPH/PCT的均值,判斷其是否 大于預(yù)設(shè)的均值閾值q,若是,音頻信號(hào)為音樂,否則,進(jìn)入下一步; 對(duì)于音樂而言,由于其音高會(huì)在一個(gè)特定值之上保持一段時(shí)間,因此 LPH與PCT相等的幾率很大,即使不等于l,兩者的比值也會(huì)比較接近 1,而對(duì)于語音,其音高很少在一個(gè)特定值上保持,因此LPH與PCT 相等的幾率很小,兩者的差別也較大;
S107:根據(jù)實(shí)倒譜分析結(jié)果計(jì)算音頻信號(hào)的APD,并判斷其是否 大于預(yù)設(shè)的強(qiáng)度閾值q,對(duì)于音樂而言,由于樂器和復(fù)調(diào)的原因,其 平均音高要比語音高,若APD大于q,音頻信號(hào)為音樂,否則,進(jìn)入 下一步;APD的計(jì)算公式為
'=1丄M
其中,iV為音頻信號(hào)包含的信號(hào)幀數(shù),i CX(刀為音頻信號(hào)的第i 幀信號(hào)的實(shí)倒譜分析的第j點(diǎn)結(jié)果,Z = /2-/1+1, /,及/2分別為實(shí)倒譜 分析結(jié)果中反映譜細(xì)節(jié)信息的部分的起始點(diǎn)及終止點(diǎn);
S108:根據(jù)實(shí)倒譜分析結(jié)果計(jì)算音頻信號(hào)的調(diào)性幀與非調(diào)性幀的 數(shù)量及平均能量;即
首先,根據(jù)實(shí)倒譜分析結(jié)果中反映譜細(xì)節(jié)信息的部分,分別將音 頻信號(hào)的各幀信號(hào)標(biāo)記為調(diào)性幀或非調(diào)性幀;
10由于有基音頻率存在的信號(hào)幀為調(diào)性幀,沒有基音頻率存在的信 號(hào)幀為非調(diào)性幀,故音頻信號(hào)的每幀信號(hào)的實(shí)倒譜分析的結(jié)果中反映 譜細(xì)節(jié)信息的部分的峰值小于預(yù)設(shè)的調(diào)性閾值P時(shí),將該楨信號(hào)標(biāo)記
為非調(diào)性幀,否則,將該幀信號(hào)標(biāo)記為調(diào)性幀;
然后,統(tǒng)計(jì)調(diào)性幀及非調(diào)性幀的數(shù)量,并計(jì)算調(diào)性幀及非調(diào)性幀 的平均能量;
S109: 4艮據(jù)調(diào)性幀與非調(diào)性幀的平均能量確定TNR,并判斷其是 否小于預(yù)設(shè)的能量比閾值C,,若是,音頻信號(hào)為音樂,否則,進(jìn)入下
一步;
S110:根據(jù)調(diào)性幀與非調(diào)性幀的數(shù)量確定RNT,并判斷其是否小 于預(yù)設(shè)的比例閾值C;,若是,音頻信號(hào)為音樂,否則,音頻信號(hào)為語 音。
參照?qǐng)D2, 一種用于實(shí)現(xiàn)上述實(shí)時(shí)識(shí)別方法的音頻類別的實(shí)時(shí)識(shí) 別裝置,包括
預(yù)處理模塊,用于依次對(duì)音頻信號(hào)進(jìn)行預(yù)加重處理、分幀處理以 及加窗處理,并將處理后的音頻信號(hào)傳輸給靜音檢測(cè)模塊;
靜音檢測(cè)模塊,用于計(jì)算分析區(qū)間內(nèi)經(jīng)預(yù)處理模塊處理后的音頻 信號(hào)的短時(shí)能量均方根,并據(jù)其判斷音頻信號(hào)是否靜音狀態(tài);
實(shí)倒譜分析模塊,用于在靜音檢測(cè)模塊確定音頻信號(hào)非靜音狀態(tài) 時(shí),對(duì)音頻信號(hào)的各幀信號(hào)進(jìn)行實(shí)倒譜分析;
音頻類別識(shí)別模塊,用于根據(jù)實(shí)倒譜分析模塊的分析結(jié)果計(jì)算音 頻信號(hào)的短時(shí)特征,并根據(jù)短時(shí)特征,采用閾值法識(shí)別音頻信號(hào)的類 別。
對(duì)8kHz采樣、16比特量化、預(yù)加重系數(shù)為-0. 80、幀長(zhǎng)為32ms、
ii幀移10ms、幀間重疊22ms的音頻信號(hào),取快速傅立葉變換長(zhǎng)度為256, 則實(shí)倒譜分析結(jié)果中反映譜細(xì)節(jié)信息的部分的起始點(diǎn)/,為14、終止點(diǎn) /2為128;同時(shí),cr取4、 s取l、 0取0.2、分析區(qū)間內(nèi)的音頻信號(hào)包 含的信號(hào)幀數(shù)TV取IOO,則C,取O, q取O. 5, q取O. 6, Q取O. 2, &取1,采用本發(fā)明所述方法識(shí)別其類別時(shí),5種短時(shí)特征的配合判 斷,可以有效實(shí)現(xiàn)音頻類別的識(shí)別。
以上所述僅為本發(fā)明的實(shí)施例而已,并不用于限制本發(fā)明,對(duì)于 本領(lǐng)域的技術(shù)人員來說,本發(fā)明可以有各種更改和變化。凡在本發(fā)明 的精神和原則之內(nèi),所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含 在本發(fā)明的權(quán)利要求范圍之內(nèi)。
1權(quán)利要求
1、一種音頻類別的實(shí)時(shí)識(shí)別方法,其特征在于,包括以下步驟a、計(jì)算分析區(qū)間內(nèi)的音頻信號(hào)的短時(shí)能量均方根,所述短時(shí)能量均方根小于預(yù)設(shè)的靜音檢測(cè)閾值時(shí),進(jìn)入步驟b;b、分別對(duì)所述音頻信號(hào)的各幀信號(hào)進(jìn)行實(shí)倒譜分析;c、根據(jù)所述實(shí)倒譜分析結(jié)果計(jì)算所述音頻信號(hào)的短時(shí)特征,并根據(jù)所述短時(shí)特征,采用閾值法識(shí)別所述音頻信號(hào)的類別。
2、 如權(quán)利要求1所述的音頻類別的實(shí)時(shí)識(shí)別方法,其特征在于, 所述步驟c具體通過以下步驟實(shí)現(xiàn)cl、根據(jù)所述實(shí)倒譜分析結(jié)果計(jì)算所述音頻信號(hào)各個(gè)基頻保持時(shí) 間LPH/基頻連續(xù)時(shí)間PCT的值;c2、判斷LPH/PCT-1的次數(shù)是否大于預(yù)設(shè)的相等次數(shù)閾值,若是, 所述音頻信號(hào)為音樂,否則,進(jìn)入下一步;c3、根據(jù)各個(gè)LPH/PCT的值確定LPH/PCT的均值,判斷其是否大 于預(yù)設(shè)的均值閾值,若是,所述音頻信號(hào)為音樂,否則,進(jìn)入下一步;c4、根據(jù)所述實(shí)倒譜分析結(jié)果計(jì)算所述音頻信號(hào)的平均調(diào)性強(qiáng)度 APD,并判斷其是否大于預(yù)設(shè)的強(qiáng)度闞值,若是,所述音頻信號(hào)為音樂, 否則,進(jìn)入下一步;c5、 一艮據(jù)所述實(shí)倒譜分析結(jié)果計(jì)算所述音頻信號(hào)的調(diào)性幀與非調(diào) 性幀的數(shù)量及平均能量;c6、才艮據(jù)所述調(diào)性幀與非調(diào)性幀的平均能量確定調(diào)性幀與非調(diào)性 幀的平均能量比TNR,并判斷其是否小于預(yù)設(shè)的能量比閾值,若是, 所述音頻信號(hào)為音樂,否則,進(jìn)入下一步;c7、根據(jù)所述調(diào)性幀與非調(diào)性幀的數(shù)量確定非調(diào)性幀比例RNT, 并判斷其是否小于預(yù)設(shè)的比例閾值,若是,所述音頻信號(hào)為音樂,否 則,所述音頻信號(hào)為語音。
3、 如權(quán)利要求2所述的音頻類別的實(shí)時(shí)識(shí)別方法,其特征在于, 所述步驟cl通過以下步驟實(shí)現(xiàn)cll、根據(jù)所述實(shí)倒譜分析結(jié)果中反映譜細(xì)節(jié)信息的部分,確定所 述音頻信號(hào)中基頻連續(xù)變化的信號(hào)組,及各個(gè)基頻連續(xù)變化的信號(hào)組 中基頻保持不變的信號(hào)組;cl2、分別根據(jù)各個(gè)基頻連續(xù)變化的信號(hào)組包含的信號(hào)幀數(shù)確定相 應(yīng)的PCT,并且,分別根據(jù)各個(gè)基頻保持不變的信號(hào)組包含的信號(hào)幀ft確定相應(yīng)的LPH;c13、將各個(gè)LPH分別與對(duì)應(yīng)的PCT相除。
4、 如權(quán)利要求3所述的音頻類別的實(shí)時(shí)識(shí)別方法,其特4i在于 每個(gè)基頻連續(xù)變化的信號(hào)組包括的各幀信號(hào)中,相鄰兩幀信號(hào)的實(shí)倒 譜分析結(jié)果中反映譜細(xì)節(jié)信息的部分的峰值差小于預(yù)設(shè)的峰值連續(xù)誤 差;每個(gè)基頻保持不變的信號(hào)組包括的各幀信號(hào)中,相鄰兩幀信號(hào)的 實(shí)倒譜分析結(jié)果中反映譜細(xì)節(jié)信息的部分的峰值差小于預(yù)設(shè)的峰值保 持誤差;所述峰值保持誤差小于所述峰值連續(xù)誤差。
5、 如權(quán)利要求2所述的音頻類別的實(shí)時(shí)識(shí)別方法,其特征在于, 所述APD的計(jì)算/>式為其中,7V為所述音頻信號(hào)包含的信號(hào)幀數(shù),i Cx,(力為所述音頻信 號(hào)的第i幀信號(hào)的實(shí)倒譜分析的第j點(diǎn)結(jié)果,丄=/2-/,及^分別
6、 如權(quán)利要求2所述的音頻類別的實(shí)時(shí)識(shí)別方法,其特征在于, 所述步驟c5通過以下步驟實(shí)現(xiàn)c51、根據(jù)所述實(shí)倒譜分析結(jié)果中反映譜細(xì)節(jié)信息的部分,分別將 所述音頻信號(hào)的各幀信號(hào)標(biāo)記為調(diào)性幀或非調(diào)性幀;c52、統(tǒng)計(jì)所述調(diào)性幀及非調(diào)性幀的數(shù)量,并計(jì)算所述調(diào)性幀及非 調(diào)性幀的平均能量。
7、 如權(quán)利要求6所述的音頻類別的實(shí)時(shí)識(shí)別方法,其特征在于 所述音頻信號(hào)的每幀信號(hào)的實(shí)倒譜分析的結(jié)果中反映譜細(xì)節(jié)信息的部 分的峰值小于預(yù)設(shè)的調(diào)性閾值時(shí),將其標(biāo)記為非調(diào)性幀,否則,將其 標(biāo)記為調(diào)性幀。
8、 如權(quán)利要求1所述的音頻類別的實(shí)時(shí)識(shí)別方法,其特征在于 所述步驟a之前還包括預(yù)處理所述音頻信號(hào)的步驟,依次通過對(duì)所述 音頻信號(hào)的預(yù)加重處理、分幀處理以及加窗處理實(shí)現(xiàn)。
9、 一種音頻類別的實(shí)時(shí)識(shí)別裝置,其特征在于,包括 靜音檢測(cè)模塊,用于計(jì)算分析區(qū)間內(nèi)的音頻信號(hào)的短時(shí)能量均方根,并據(jù)其判斷所述音頻信號(hào)是否靜音狀態(tài);為所述實(shí)倒譜實(shí)倒譜分析模塊,用于在所述靜音檢測(cè)模塊確定所述音頻信號(hào)非 靜音狀態(tài)時(shí),對(duì)所述音頻信號(hào)的各幀信號(hào)進(jìn)行實(shí)倒譜分析;音頻類別識(shí)別模塊,用于根據(jù)所述實(shí)倒譜分析模塊的分析結(jié)果計(jì) 算所述音頻信號(hào)的短時(shí)特征,并根據(jù)所述短時(shí)特征,采用閾值法識(shí)別 所述音頻信號(hào)的類別。
10、如權(quán)利要求9所述的音頻類別的實(shí)時(shí)識(shí)別裝置,其特征在于 所述實(shí)時(shí)識(shí)別裝置還包括預(yù)處理模塊,用于依次對(duì)所述音頻信號(hào)進(jìn)行 預(yù)加重處理、分幀處理以及加窗處理,并將處理后的音頻信號(hào)傳輸給 所述靜音檢測(cè)模塊。
全文摘要
本發(fā)明公開了一種音頻類別的實(shí)時(shí)識(shí)別方法及裝置,所述實(shí)時(shí)識(shí)別方法包括以下步驟a.計(jì)算分析區(qū)間內(nèi)的音頻信號(hào)的短時(shí)能量均方根,所述短時(shí)能量均方根小于預(yù)設(shè)的靜音檢測(cè)閾值時(shí),進(jìn)入步驟b;b.分別對(duì)所述音頻信號(hào)的各幀信號(hào)進(jìn)行實(shí)倒譜分析;c.根據(jù)所述實(shí)倒譜分析結(jié)果計(jì)算所述音頻信號(hào)的短時(shí)特征,并根據(jù)所述短時(shí)特征,采用閾值法識(shí)別所述音頻信號(hào)的類別。本發(fā)明所述技術(shù)方案實(shí)時(shí)有效地實(shí)現(xiàn)了基于實(shí)倒譜的音頻類別的識(shí)別。
文檔編號(hào)G10L11/00GK101645265SQ20081014224
公開日2010年2月10日 申請(qǐng)日期2008年8月5日 優(yōu)先權(quán)日2008年8月5日
發(fā)明者付中華, 劉開文 申請(qǐng)人:中興通訊股份有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
宝鸡市| 睢宁县| 旬邑县| 卢湾区| 宣化县| 蚌埠市| 黄山市| 邛崃市| 阿拉善左旗| 临桂县| 洛阳市| 六安市| 扶绥县| 隆安县| 郁南县| 荃湾区| 浪卡子县| 钦州市| 淳化县| 临江市| 克拉玛依市| 鹤庆县| 昆山市| 延吉市| 罗田县| 澄江县| 柳林县| 德惠市| 苗栗县| 会宁县| 虞城县| 西丰县| 涿鹿县| 汉源县| 左权县| 阜新市| 沁水县| 新宾| 蒙山县| 台山市| 上栗县|