專(zhuān)利名稱(chēng):基于時(shí)頻域分析的異常人聲檢測(cè)方法
技術(shù)領(lǐng)域:
本發(fā)明主要涉及ー種基于時(shí)頻域分析的異常人聲檢測(cè)方法。
背景技術(shù):
安全防控越來(lái)越成為公眾關(guān)注的焦點(diǎn),視頻監(jiān)視系統(tǒng)得到了普遍的推廣應(yīng)用,我國(guó)絕大多數(shù)縣級(jí)以上城市以及鄉(xiāng)鎮(zhèn)重點(diǎn)場(chǎng)所均已依法建立視頻監(jiān)視體系,實(shí)現(xiàn)多方位全天候的視頻監(jiān)視和存儲(chǔ)。目前絕大多數(shù)視頻監(jiān)視系統(tǒng)沒(méi)有對(duì)聲音進(jìn)行監(jiān)控,或者僅做簡(jiǎn)單的錄制,缺少對(duì)聲音信息的實(shí)時(shí)分析處理。當(dāng)發(fā)生不安 全事件時(shí),現(xiàn)場(chǎng)往往存在呼救、尖叫、大喊等異常人聲,現(xiàn)有視頻監(jiān)視系統(tǒng)不能對(duì)異常人聲做出及時(shí)反應(yīng),智能化預(yù)警程度不高,不能更有效地保護(hù)人民群眾的人身、財(cái)物安全。
發(fā)明內(nèi)容
針對(duì)視頻監(jiān)視系統(tǒng)中人聲監(jiān)控的空白,本發(fā)明提供一種基于時(shí)頻域分析的異常人聲檢測(cè)方法,該方法包括基于時(shí)域的背景聲音強(qiáng)度實(shí)時(shí)更新方法、異常聲音片段提取方法,基于頻域的異常聲音片段均值濾波MFCC參數(shù)提取方法、引入時(shí)間相關(guān)性的HMM模型訓(xùn)練及異常人聲檢測(cè)方法。本發(fā)明的異常人聲檢測(cè)方法主要針對(duì)道路、街面等公共場(chǎng)所或其它重點(diǎn)位置的聲音信息進(jìn)行自動(dòng)監(jiān)控,包括時(shí)域處理和頻域處理,首先在時(shí)域處理階段,計(jì)算實(shí)時(shí)更新的監(jiān)控場(chǎng)景背景聲音強(qiáng)度,檢測(cè)并提取聲音強(qiáng)度突變片段;然后進(jìn)入頻域處理階段,對(duì)異常聲音片段提取經(jīng)過(guò)均值濾波的梅爾頻率倒譜系數(shù)(Mel-Frequency Cepstrum Coefficients,MFCC),將提取到的異常片段聲音MFCC作為觀(guān)測(cè)序列,輸入訓(xùn)練好的改進(jìn)隱馬爾科夫過(guò)程(Hidden Markov Model, HMM)模型,根據(jù)人聲頻率特征,分析該異常片段是否為異常人聲;其中HMM模型引入時(shí)序相關(guān)性加以改進(jìn);本發(fā)明完整處理流程如圖I所示,下面對(duì)本發(fā)明中的技術(shù)方案闡述如下I、計(jì)算監(jiān)控場(chǎng)景實(shí)時(shí)背景聲音強(qiáng)度首先在初始化過(guò)程中計(jì)算一定時(shí)長(zhǎng)的背景聲音能量作為初始背景強(qiáng)度,然后在處理過(guò)程中不斷加入當(dāng)前聲音片段,刪除舊的聲音片段,實(shí)現(xiàn)背景強(qiáng)度的實(shí)時(shí)更新。具體流程為Stepl. I :背景聲音強(qiáng)度初始化連續(xù)獲取L段等長(zhǎng)度短時(shí)聲音片段,計(jì)算每段聲音片段強(qiáng)度并做平均,求得平均聲音強(qiáng)度,作為背景聲音初始強(qiáng)度
權(quán)利要求
1.一種基于時(shí)頻域分析的異常人聲檢測(cè)方法,其特征在于該方法包括時(shí)域處理和頻域處理,在時(shí)域處理階段,通過(guò)計(jì)算短時(shí)聲音強(qiáng)度來(lái)獲取并實(shí)時(shí)更新監(jiān)控場(chǎng)景背景聲音強(qiáng)度,提取存在聲音強(qiáng)度突變的異常聲音片段;在頻域處理階段,首先對(duì)異常聲音片段提取經(jīng)過(guò)均值濾波的梅爾頻率倒譜系數(shù)(Mel-Frequency Cepstrum Coefficients,MFCC),將提取到的異常片段聲音MFCC作為觀(guān)測(cè)序列,輸入訓(xùn)練好的改進(jìn)隱馬爾科夫過(guò)程(Hidden MarkovModel, HMM)模型,分析該異常片段是否為異常人聲,包括如下步驟 步驟I、計(jì)算監(jiān)控場(chǎng)景實(shí)時(shí)背景聲音強(qiáng)度,具體過(guò)程如下 Stepl. I :背景聲音強(qiáng)度初始化 連續(xù)獲取L段等長(zhǎng)度短時(shí)聲音片段,計(jì)算每段聲音片段強(qiáng)度并做平均,求得平均聲音強(qiáng)度⑥,作為背景聲音初始強(qiáng)度
2.根據(jù)權(quán)利要求I所述的基于時(shí)頻域分析的異常人聲檢測(cè)方法,其特征在于,改進(jìn)的HMM模型訓(xùn)練方法是首先采集異常人聲樣本,包括呼救、尖叫、大喊典型異常人聲,提取其MFCC參數(shù);然后將異常人聲樣本MFCC參數(shù)作為輸入?yún)?shù),訓(xùn)練該改進(jìn)的HMM過(guò)程。
全文摘要
本發(fā)明涉及一種基于時(shí)頻域分析的異常人聲檢測(cè)方法。該方法首先計(jì)算實(shí)時(shí)更新的監(jiān)控場(chǎng)景背景聲音強(qiáng)度,檢測(cè)并提取聲音強(qiáng)度突變片段;然后提取異常片段的均值濾波梅爾頻率倒譜系數(shù);最后將提取到的異常片段聲音梅爾頻率倒譜系數(shù)參數(shù)作為觀(guān)測(cè)序列,輸入訓(xùn)練好的改進(jìn)隱馬爾科夫過(guò)程模型,根據(jù)人聲頻率特征,分析該異常片段是否為異常人聲。其中隱馬爾科夫過(guò)程模型加入時(shí)序相關(guān)性進(jìn)行改進(jìn)。該方法結(jié)合時(shí)域提取能量突變幀和頻域范圍驗(yàn)證,可有效檢測(cè)到異常人聲,實(shí)時(shí)性好,抗噪聲性能強(qiáng),魯棒性較好。
文檔編號(hào)G10L15/10GK102664006SQ20121010909
公開(kāi)日2012年9月12日 申請(qǐng)日期2012年4月14日 優(yōu)先權(quán)日2012年4月14日
發(fā)明者劉通, 唐朝京, 李沛秦, 謝劍斌, 謝昌頤, 閆瑋 申請(qǐng)人:中國(guó)人民解放軍國(guó)防科學(xué)技術(shù)大學(xué)