一種基于鳥鳴聲的移動(dòng)式鳥類識(shí)別方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于鳥聲識(shí)別技術(shù)領(lǐng)域,涉及一種基于鳥鳴聲的移動(dòng)式鳥類識(shí)別方法。
【背景技術(shù)】
[0002] 鳥聲識(shí)別和說話人識(shí)別一樣,都屬于生物識(shí)別的一種,都是基于物種以及物間的 差異性來實(shí)現(xiàn)的?,F(xiàn)有的鳥聲識(shí)別技術(shù)大都是利用鳥鳴聲的短時(shí)平穩(wěn)特性,對(duì)鳥鳴聲進(jìn)行 分幀處理,然后提取梅爾倒譜系數(shù)(MFCC)或者線性預(yù)測(cè)倒譜系數(shù)(LPCC)作為鳥鳴聲信號(hào) 的特征值點(diǎn)集。然后建立高斯混合模型(GMM)或者隱馬爾可夫模型(HMM)進(jìn)行最后的識(shí)別。 現(xiàn)有技術(shù)雖然都能取得很好的識(shí)別率,但是也存在著以下幾方面的不足: 1.特征值提取過程復(fù)雜,計(jì)算量偏大。
[0003] 2.建立模型,得到的模型數(shù)據(jù)量大。
[0004] 3.識(shí)別效率不高。由于計(jì)算量大,識(shí)別耗時(shí)長(zhǎng)。
【發(fā)明內(nèi)容】
[0005] 本發(fā)明針對(duì)現(xiàn)有技術(shù)的不足,提供了一種計(jì)算量小,識(shí)別效率高,數(shù)據(jù)量小的基于 鳥鳴聲的移動(dòng)鳥類識(shí)別方法。
[0006] 本發(fā)明方法具體是: 1)鳥鳴聲信號(hào)進(jìn)行預(yù)處理:預(yù)處理主要包括預(yù)加重,濾波和語音分段。預(yù)加重提高鳥 鳴聲信號(hào)的高頻部分,濾波消除外界噪聲的影響,語音分段將鳥鳴聲信號(hào)分割成設(shè)定長(zhǎng)度 的語音段。
[0007] 2)鳥鳴聲信號(hào)的時(shí)頻分析:將預(yù)處理過的語音信號(hào)進(jìn)行AOK時(shí)頻分析,得到鳥鳴 信號(hào)的時(shí)變頻譜圖。
[0008] 3)對(duì)時(shí)頻譜圖進(jìn)行灰度變換,得到灰度圖,求取灰度圖的灰度共生矩陣,然后求取 代表鳥類差異的特征值。
[0009] 4)將已知鳥種的鳥進(jìn)行編號(hào),依次對(duì)其進(jìn)行時(shí)頻分析與特征值提取,將每種鳥的 特征值對(duì)應(yīng)編號(hào)進(jìn)行記錄和存儲(chǔ)生成訓(xùn)練模板。
[0010] 5)將待識(shí)別的鳥進(jìn)行特征值的提取并做好記錄和存儲(chǔ)生成測(cè)試模板。
[0011] 6)采用DTW算法將測(cè)試模板依次與訓(xùn)練模板進(jìn)行數(shù)值匹配,比較匹配值的大小, 最小匹配值對(duì)應(yīng)的鳥種即為識(shí)別所得到的鳥種。
[0012] 進(jìn)一步說,步驟3)中的特征值為灰度共生矩陣不同角度的圖像紋理特征參數(shù)。
[0013] 進(jìn)一步說,步驟4)中生成訓(xùn)練模板和步驟5)中生成測(cè)試模板過程中包括特征值 的壓縮處理步驟,將訓(xùn)練模板和測(cè)試模板的特征值數(shù)據(jù)進(jìn)行主成成分分析,進(jìn)一步壓縮特 征值數(shù)據(jù)。
[0014] 進(jìn)一步說,步驟6)中的訓(xùn)練模板和測(cè)試模板的匹配采用的是動(dòng)態(tài)時(shí)間規(guī)整算法。 該算法有效的減少了計(jì)算量,有效的提1? 了識(shí)別效率,減少運(yùn)行時(shí)間。
[0015] 本發(fā)明可以盡可能的降低外界噪音以及不同時(shí)間段鳥鳴聲差異性對(duì)實(shí)驗(yàn)結(jié)果的 影響,通過AOK (自適應(yīng)最優(yōu)核時(shí)頻分布)時(shí)頻譜圖可以明顯的看出不同鳥類的時(shí)頻差異, 基于時(shí)頻譜圖獲取的特征值數(shù)據(jù)量小且具有代表性。識(shí)別過程只需要計(jì)算測(cè)試模板和訓(xùn)練 模板的距離差即可以得到最后的識(shí)別的結(jié)果,具有計(jì)算量小,識(shí)別效率高等優(yōu)點(diǎn)。
【附圖說明】
[0016] 圖1為本發(fā)明的整體構(gòu)架示意圖; 圖2為本發(fā)明的鳥鳴聲信號(hào)的特征值提取的流程示意圖; 圖3為本發(fā)明的灰度共生矩陣生成示意圖; 圖4為不同鳥種以及相似鳥種鳥鳴聲信號(hào)的時(shí)頻譜圖示意圖; 圖5為本發(fā)明鳥類識(shí)別的流程示意圖。
【具體實(shí)施方式】
[0017] 以下結(jié)合附圖對(duì)本發(fā)明作進(jìn)一步說明。
[0018] 如圖1所示,本發(fā)明所使用的裝置包括小車、計(jì)算機(jī)、CRIO (CompactRIO系列模塊 化儀器)、攝像頭、動(dòng)態(tài)信號(hào)分析儀、IEPE集成電路壓電式麥克風(fēng)、LabVIEW和MATLAB軟件。 CRIO與動(dòng)態(tài)信號(hào)分析儀均與第一計(jì)算機(jī)相連,該計(jì)算機(jī)上安裝有LabVIEW和MATLAB軟件, 第一計(jì)算機(jī)通過CRIO實(shí)現(xiàn)小車的智能控制,包括前進(jìn)、后退、轉(zhuǎn)彎以及通過PID算法進(jìn)行速 度自動(dòng)控制。實(shí)時(shí)監(jiān)控供電電池電壓,欠壓進(jìn)行報(bào)警等功能;通過攝像頭實(shí)現(xiàn)小車的監(jiān)控, 通過動(dòng)態(tài)信號(hào)分析儀和IEPE集成電路壓電式麥克風(fēng)實(shí)現(xiàn)鳥鳴聲信號(hào)的采集,采集的鳥鳴 聲在第一計(jì)算機(jī)上顯示。第一計(jì)算機(jī)和第二計(jì)算機(jī)通過無線WIFI技術(shù)建立連接,建立連接 之后第一計(jì)算機(jī)上的信號(hào)以及小車的監(jiān)控畫面?zhèn)魉偷降诙?jì)算機(jī)上,在第二計(jì)算機(jī)上實(shí)現(xiàn) 小車的監(jiān)控、數(shù)據(jù)的存儲(chǔ)以及鳥叫識(shí)別。
[0019] 如圖2所示,鳥鳴聲信號(hào)在進(jìn)行AOK時(shí)頻分析之前要進(jìn)行預(yù)處理,AOK時(shí)頻分析方 法有很高的時(shí)頻分辨率,還具有很強(qiáng)的抗交叉干擾項(xiàng)的能力。預(yù)處理包括預(yù)加重,濾波和語 音分段。預(yù)加重提高鳥鳴聲信號(hào)的高頻部分,濾波消除外界噪聲的影響,語音分段將鳥鳴聲 信號(hào)分割成特定長(zhǎng)度的語音段。將預(yù)處理之后的鳥鳴聲信號(hào)通過LabVIEW和MATLAB軟件 混合編程的AOK時(shí)頻分析方法分析得到AOK時(shí)頻譜圖,然后將時(shí)頻譜圖通過MTLAB軟件轉(zhuǎn) 換成灰度圖,求取灰度圖不同方向的灰度共生矩陣,最后提取基于灰度共生矩陣不同角度 的圖像紋理特征參數(shù)作為特征值。
[0020] 如圖3所示,灰度共生矩陣實(shí)質(zhì)是從圖像灰度為i的像元位置為出發(fā),統(tǒng)計(jì)與 其距離為rf,灰度為J的像元位置為均〇同時(shí)出現(xiàn)的頻度RH句。本發(fā)明的 生成步長(zhǎng)生成方向取6=?r?45'?rj35_四個(gè)不同的方向?;叶裙采仃嚨拇笮∨c灰 度圖的灰度級(jí)別有關(guān),本發(fā)明的時(shí)頻譜圖灰度變換之后得到的灰度圖處理之后的灰度級(jí)別 是*,最后得到的灰度共生矩陣是一個(gè)的矩陣。
[0021] 如圖4所示是4種鳥的AOK時(shí)頻譜圖,從上面可以明顯地看出鳥鳴聲的能量的分 布差異。圖4中鳥類a的能量主要集中在高頻帶;鳥類b的能量則主要集中在低頻帶,但也 有少部分能量集中在中頻帶;鳥類c的能量則主要集中在高頻帶,在低頻帶也有少量能量 分布;鳥類d的能量則集中分布在低頻帶。能量的不同分布從側(cè)面來說明了本發(fā)明的特征 值提取方法的可行性。
[0022] 如圖5所示,本發(fā)明主要包括三個(gè)部分,特征值提取部分,模型訓(xùn)練部分和識(shí)別 部分。特征值提取部分如圖2所示,模型訓(xùn)練部分主要是建立訓(xùn)練模板的過程。將已知鳥種 的鳥鳴聲信號(hào)進(jìn)行特征值的提取,提取的特征值對(duì)應(yīng)鳥種的編號(hào)進(jìn)行記錄和存儲(chǔ)來建立訓(xùn) 練模板。識(shí)別部分就是用DTW算法將待識(shí)別的鳥種建立的測(cè)試模板與訓(xùn)練模板進(jìn)行匹配的 過程,測(cè)試模板會(huì)依次與訓(xùn)練模板里面的個(gè)體模板進(jìn)行匹配,然后進(jìn)行匹配值的大小比較, 最終得出匹配值最小的訓(xùn)練模板,該訓(xùn)練模板編號(hào)所對(duì)應(yīng)的鳥種就是要識(shí)別的鳥種。
【主權(quán)項(xiàng)】
1. 一種基于鳥鳴聲的移動(dòng)式鳥類識(shí)別方法,其特征在于該方法包括以下步驟: 1) 鳥鳴聲信號(hào)進(jìn)行預(yù)處理:預(yù)處理主要包括預(yù)加重,濾波和語音分段;預(yù)加重提高鳥 鳴聲信號(hào)的高頻部分,濾波消除外界噪聲的影響,語音分段將鳥鳴聲信號(hào)分割成設(shè)定長(zhǎng)度 的語音段; 2) 鳥鳴聲信號(hào)的時(shí)頻分析:將預(yù)處理過的語音信號(hào)進(jìn)行AOK時(shí)頻分析,得到鳥鳴信號(hào) 的時(shí)變頻譜圖; 3) 對(duì)時(shí)頻譜圖進(jìn)行灰度變換,得到灰度圖,求取灰度圖的灰度共生矩陣,然后求取代表 鳥類差異的特征值; 4) 將已知鳥種的鳥進(jìn)行編號(hào),依次對(duì)其進(jìn)行時(shí)頻分析與特征值提取,將每種鳥的特征 值對(duì)應(yīng)編號(hào)進(jìn)行記錄和存儲(chǔ)生成訓(xùn)練模板; 5) 將待識(shí)別的鳥進(jìn)行特征值的提取并做好記錄和存儲(chǔ)生成測(cè)試模板; 6) 采用DTW算法將測(cè)試模板依次與訓(xùn)練模板進(jìn)行數(shù)值匹配,比較匹配值的大小,最小 匹配值對(duì)應(yīng)的鳥種即為識(shí)別所得到的鳥種; 根據(jù)權(quán)利1所述的方法,其特征在于:步驟3)中的特征值為灰度共生矩陣不同角度的 圖像紋理特征參數(shù)。
2. 根據(jù)權(quán)利1所述的方法,其特征在于:步驟4)中生成訓(xùn)練模板和步驟5)中生成測(cè) 試模板過程中包括特征值的壓縮處理步驟,將訓(xùn)練模板和測(cè)試模板的特征值數(shù)據(jù)進(jìn)行主成 成分分析,進(jìn)一步壓縮特征值數(shù)據(jù)。
3. 根據(jù)權(quán)利1所述的方法,其特征在于:步驟6)中的訓(xùn)練模板和測(cè)試模板的匹配采用 的是動(dòng)態(tài)時(shí)間規(guī)整算法。
【專利摘要】本發(fā)明涉及一種基于鳥鳴聲的移動(dòng)式鳥類識(shí)別方法。本發(fā)明通過LabVIEW軟件對(duì)采集的鳥鳴聲信號(hào)進(jìn)行預(yù)處理,并通過LabVIEW和MATLAB軟件混合編程的AOK時(shí)頻分析方法處理預(yù)處理之后的鳥鳴聲信號(hào),最后通過MATLAB軟件處理AOK時(shí)頻譜圖,實(shí)現(xiàn)特征值的提取。將已知鳥種的鳥的特征值經(jīng)模型訓(xùn)練生成訓(xùn)練模板并進(jìn)行數(shù)據(jù)存儲(chǔ),將待識(shí)別鳥種的鳥的特征值經(jīng)模型訓(xùn)練生成測(cè)試模板,結(jié)合DTW算法將測(cè)試模板與訓(xùn)練模板進(jìn)行匹配來實(shí)現(xiàn)鳥類的識(shí)別。本發(fā)明很好的彌補(bǔ)了現(xiàn)有鳥類識(shí)別方法計(jì)算量大、數(shù)據(jù)量大的缺點(diǎn),提供了一種計(jì)算量小、數(shù)據(jù)量小、識(shí)別率好的鳥類識(shí)別方法。
【IPC分類】G10L17-26
【公開號(hào)】CN104658538
【申請(qǐng)?zhí)枴緾N201310581007
【發(fā)明人】孫斌, 萬鵬威, 陶達(dá), 趙玉曉, 陳飛
【申請(qǐng)人】中國(guó)計(jì)量學(xué)院
【公開日】2015年5月27日
【申請(qǐng)日】2013年11月18日