本發(fā)明屬于信息識別技術(shù)領(lǐng)域,特別涉及了一種基于微型麥克風(fēng)陣列的聲源方位識別方法。
背景技術(shù):
在實(shí)際應(yīng)用中,由于人們對產(chǎn)品輕便美觀的要求、使用場地的限制等等,麥克風(fēng)陣列的尺寸會受到各種因素的約束,此時減小麥克風(fēng)陣列的尺寸就顯得十分必要,因此微型麥克風(fēng)陣列的聲源定位方法研究有著現(xiàn)實(shí)意義和實(shí)用價值。考慮到基本的聲源定位方法如可控響應(yīng)功率技術(shù)運(yùn)算量大、時延估計(jì)法在小尺寸下定位性能差等因素,提出了基于平均復(fù)聲強(qiáng)的聲源定位方法,該方法在不同陣型的小尺寸麥克風(fēng)陣列定位過程中明顯存在優(yōu)勢。然而,該方法雖然受噪聲影響較小,卻存在混響較大情況下定位性能急劇下降的缺陷。
實(shí)際情況下,例如圓桌會議,說話人的位置基本處于一個固定的區(qū)域,且多個說話人基本均勻分布在圓桌的周圍,這樣就可以考慮將定位問題轉(zhuǎn)化為分類識別問題。提取魯棒性較好的特征向量,將模式識別方法和基本的定位方法相結(jié)合,采用麥克風(fēng)之間的延遲時間作為特征向量,在麥克風(fēng)陣列尺寸較大的情況下,可以提高算法的定位性能。然而受到特征限制,這類方法在小尺寸條件下無法有良好的定位效果。
技術(shù)實(shí)現(xiàn)要素:
為了解決上述背景技術(shù)中所提出的技術(shù)問題,本發(fā)明旨在提供一種基于微型麥克風(fēng)陣列的聲源方位識別方法,克服現(xiàn)有技術(shù)存在的缺陷,具有魯棒性、不受語音特性影響、適合小尺寸陣列聲源定位等優(yōu)勢。
為了實(shí)現(xiàn)上述技術(shù)目的,本發(fā)明的技術(shù)方案為:
一種基于微型麥克風(fēng)陣列的聲源方位識別方法,包括以下步驟:
(1)根據(jù)四陣元差分陣列求聲強(qiáng)方法,計(jì)算各個方向上每個時頻點(diǎn)的聲強(qiáng)分量,并在每個時頻點(diǎn)分別對聲強(qiáng)分量進(jìn)行相位變換加權(quán)處理;
(2)對經(jīng)相位變換加權(quán)處理的各時頻點(diǎn)的聲強(qiáng)分量進(jìn)行求和平均運(yùn)算,并對求和平均后的聲強(qiáng)分量做歸一化處理;
(3)根據(jù)三陣元正交陣的聲強(qiáng)特性,按照步驟(1)-(2),獲取四陣元差分陣列中各子陣列的聲強(qiáng)分量;
(4)經(jīng)步驟(2)、(3)得到的聲強(qiáng)分量構(gòu)成特征向量,采用最小二乘支持向量機(jī)進(jìn)行訓(xùn)練和測試,求解出聲源方位角。
進(jìn)一步地,所述四陣元差分陣列包含1、2、3、4號麥克風(fēng),1、2、3、4號麥克風(fēng)位于同一圓周上且按逆時針方向排列,以4個麥克風(fēng)所在圓周的圓心作為原點(diǎn)、以相對2個麥克風(fēng)所在直線作為坐標(biāo)軸,建立平面直角坐標(biāo)系,1、2、3、4號麥克風(fēng)依次位于x軸正方向、y軸正方向、x軸負(fù)方向、y軸負(fù)方向。
進(jìn)一步地,在步驟(1)中,采用下式計(jì)算各方向上的每個時頻點(diǎn)經(jīng)相位變換加權(quán)處理的聲強(qiáng)分量:
上式中,Iox-PHAT(w,t)為坐標(biāo)原點(diǎn)處聲強(qiáng)在x軸方向上每個時頻點(diǎn)進(jìn)行相位變換加權(quán)后的分量,Ioy-PHAT(w,t)為坐標(biāo)原點(diǎn)處聲強(qiáng)在y軸方向上每個時頻點(diǎn)進(jìn)行相位變換加權(quán)后的分量,Po(w,t)為陣列中心處聲壓的短時傅里葉變換,Pi(w,t)為i號麥克風(fēng)處聲壓的短時傅里葉變換,i=1,2,3,4,(ω,t)表示時頻點(diǎn),j為虛數(shù)單位,*表示共軛變換。
進(jìn)一步地,在步驟(2)中,采用下式對各時頻點(diǎn)的聲強(qiáng)分量進(jìn)行求和平均運(yùn)算:
上式中,Ix(0)為x軸方向上的平均復(fù)聲強(qiáng),Iy(π/2)為y軸方向上的平均復(fù)聲強(qiáng),Iox-PHAT(wn,tb)為坐標(biāo)原點(diǎn)處聲強(qiáng)在x軸方向上第b幀、第n個頻率點(diǎn)進(jìn)行相位變換加權(quán)的分量,Ioy-PHAT(wn,tb)為坐標(biāo)原點(diǎn)處聲強(qiáng)在y軸方向上第b幀、第n個頻率點(diǎn)進(jìn)行相位變換加權(quán)的分量,Re{·}表示取實(shí)部運(yùn)算,∑·表示求和運(yùn)算。
進(jìn)一步地,在步驟(2)中,采用下式對求和平均后的聲強(qiáng)分量進(jìn)行歸一化處理:
上式中,為歸一化后的x軸方向聲強(qiáng)分量,為歸一化后的y軸方向的聲強(qiáng)分量。
進(jìn)一步地,在步驟(3)中,四陣元差分陣列中任意3個麥克風(fēng)構(gòu)成1個子陣列,共有4個子陣列;根據(jù)三陣元正交陣的聲強(qiáng)特性,獲取四陣元差分陣列中4個子陣列的聲強(qiáng)其中,為以3號麥克風(fēng)為原點(diǎn)將x軸順時針旋轉(zhuǎn)方向上歸一化后的聲強(qiáng),為以3號麥克風(fēng)為原點(diǎn)將x軸逆時針旋轉(zhuǎn)方向上歸一化后的聲強(qiáng),為以1號麥克風(fēng)為原點(diǎn)將x軸逆時針旋轉(zhuǎn)方向上歸一化后的聲強(qiáng),為以1號麥克風(fēng)為原點(diǎn)將x軸順時針旋轉(zhuǎn)方向上歸一化后的聲強(qiáng),表示以2號麥克風(fēng)為原點(diǎn)將y軸逆時針旋轉(zhuǎn)方向上歸一化后的聲強(qiáng),表示以2號麥克風(fēng)為原點(diǎn)將y軸順時針旋轉(zhuǎn)方向上歸一化后的聲強(qiáng),表示以4號麥克風(fēng)為原點(diǎn)將y軸順時針旋轉(zhuǎn)方向上歸一化后的聲強(qiáng),表示以4號麥克風(fēng)為原點(diǎn)將y軸逆時針旋轉(zhuǎn)方向上歸一化后的聲強(qiáng)。
進(jìn)一步地,在步驟(4)中,經(jīng)步驟(2)、(3)得到的聲強(qiáng)分量構(gòu)成特征向量Γ:
上式中,[·]T表示轉(zhuǎn)置運(yùn)算。
采用上述技術(shù)方案帶來的有益效果:
相比現(xiàn)有技術(shù),本發(fā)明在混響噪聲環(huán)境下提取的特征向量具有更好的魯棒性,方位識別精度也較高,具體表現(xiàn)在:
(1)考慮到實(shí)際應(yīng)用中可能存在高混響情況,若直接采用基本聲強(qiáng)法進(jìn)行特征提取,提取的特征信息無法較為準(zhǔn)確的表征某類角度的特點(diǎn),會使分類器在訓(xùn)練過程中無法正確對角度進(jìn)行分類,從而導(dǎo)致識別不準(zhǔn)、識別精度下降的情況。為此,本發(fā)明對各個方向上每個時頻點(diǎn)的聲強(qiáng)做相位變換加權(quán)處理,可使特征值在混響噪聲環(huán)境下仍具有較好的魯棒性。
(2)由于實(shí)際情況中說話人語音不是一成不變的,所以分類器需要對大量特征信息進(jìn)行訓(xùn)練分類??紤]到算法效率不高的情況,提取不受語音特性影響的特征就顯得尤為重要。本發(fā)明通過將改善后的對高混響有較好魯棒性的特征進(jìn)行歸一化,避免了因訓(xùn)練量小而導(dǎo)致的識別過程中特征不匹配的情況,提高了算法的識別率,從而提高了方位識別精度。
(3)識別過程中,每組特征向量中的元素提取不一定完全正確,為使正確的特征元素進(jìn)行識別匹配,這就需要盡可能的從麥克風(fēng)陣列中提取有用信息。本發(fā)明通過利用子陣計(jì)算聲強(qiáng)作為特征信息,可以良好表征每類角度,提高識別過程中特征向量的容錯率,從而提高識別精度。
附圖說明
圖1為本發(fā)明中四陣元差分陣列以及坐標(biāo)系定義示意圖;
圖2為本發(fā)明方法原理流程圖;
圖3(a)—3(d)分別為本發(fā)明中4個子陣列參考坐標(biāo)系的定義示意圖;
圖4為仿真實(shí)驗(yàn)房間初始參數(shù)設(shè)置示意圖;
圖5(a)、5(b)為實(shí)施例1的仿真結(jié)果圖;
圖6(a)、6(b)為對比例1的仿真結(jié)果圖;
圖7為對比例2的仿真結(jié)果圖。
具體實(shí)施方式
以下將結(jié)合附圖,對本發(fā)明的技術(shù)方案進(jìn)行詳細(xì)說明。
本發(fā)明中所指的微型麥克風(fēng)陣列主要是考慮陣列中陣元間距小于5cm的情況。
本發(fā)明方法是在如圖1所示的麥克風(fēng)陣列的基礎(chǔ)上,按照圖2所示的原理流程圖進(jìn)行研究的。全向麥克風(fēng)1、2、3、4(M1、M2、M3、M4)等間隔分布在直徑為D=2r的圓周上,方位角為q。考慮到語音信號的短時平穩(wěn)特性,將麥克風(fēng)接收到的200ms語音信號進(jìn)行分幀,幀長為400點(diǎn),幀移為200點(diǎn)。分別對4個麥克風(fēng)接收到的信號分幀,然后做傅里葉變換,得到O點(diǎn)(即坐標(biāo)原點(diǎn))處振速在x軸、y軸方向的兩個分量的短時傅里葉變換為:
上式中,Vox(w,t)表示O點(diǎn)處振速在x軸方向的短時傅里葉變換,Voy(w,t)表示O點(diǎn)處振速在y軸方向的短時傅里葉變換,Pi(w,t)表示麥克風(fēng)i處的聲壓信號pi(t)的短時傅里葉變換,i=1,2,3,4,j為虛數(shù)單位,D為陣列尺寸,ρ為媒質(zhì)密度,ω為角頻率,用Po(w,t)表示O點(diǎn)處聲壓的短時傅里葉變換,可用下式近似求得:
上式中,∑·為求和運(yùn)算。由于聲強(qiáng)I與振速V、O點(diǎn)處聲壓Po的關(guān)系式為:
上式中,Re{·}為取實(shí)部運(yùn)算,Po(wn,tb)表示第b幀、第n個頻率點(diǎn)的O點(diǎn)處聲壓,V(wn,tb)表示第b幀、第n個頻率點(diǎn)的振速,*表示共軛變換。因此可以推出在離散情況下,麥克風(fēng)測得的O點(diǎn)處的平均復(fù)聲強(qiáng)在x軸和y軸方向上的兩個分量Iox和Ioy:
上式中,Pi(wn,tb)表示麥克風(fēng)i處第b幀、第n個頻率點(diǎn)的聲壓,i=1,2,3,4。對式(8)中每個時頻點(diǎn)聲強(qiáng)進(jìn)行相位加權(quán)變換,即可得到式(1),然后對式(1)進(jìn)行求和平均運(yùn)算得到式(2),再對式(2)中的聲強(qiáng)分量進(jìn)行歸一化處理,即可得到式(3)。圖3(a)—3(d)所示為在圖1所示的陣列模型的基礎(chǔ)上,利用不同參考坐標(biāo)系下的子陣列進(jìn)行聲強(qiáng)提取的情況。各方向每個時頻點(diǎn)相位變換加權(quán)后進(jìn)行求和平均運(yùn)算的聲強(qiáng)為:
式(9)~(12)中,Ix(-π/4)表示以3號麥克風(fēng)為原點(diǎn)將x軸順時針旋轉(zhuǎn)方向上的聲強(qiáng),Iy(π/4)表示以3號麥克風(fēng)為原點(diǎn)將x軸逆時針旋轉(zhuǎn)方向上的聲強(qiáng),Ix(3π/4)表示以1號麥克風(fēng)為原點(diǎn)將x軸逆時針旋轉(zhuǎn)方向上的聲強(qiáng),Iy(-3π/4)表示以1號麥克風(fēng)為原點(diǎn)將x軸順時針旋轉(zhuǎn)方向上的聲強(qiáng),Ix(-3π/4)表示以2號麥克風(fēng)為原點(diǎn)將y軸逆時針旋轉(zhuǎn)方向上的聲強(qiáng),Iy(-π/4)表示以2號麥克風(fēng)為原點(diǎn)將y軸順時針旋轉(zhuǎn)方向上的聲強(qiáng),Ix(π/4)表示以4號麥克風(fēng)為原點(diǎn)將y軸順時針旋轉(zhuǎn)方向上的聲強(qiáng),Iy(3π/4)表示以4號麥克風(fēng)為原點(diǎn)將y軸逆時針旋轉(zhuǎn)方向上的聲強(qiáng)。2、3、4號麥克風(fēng)在第b幀、第n個頻率點(diǎn)的聲壓均值為:
1、2、4號麥克風(fēng)在第b幀、第n個頻率點(diǎn)的聲壓均值為:
1、2、3號麥克風(fēng)在第b幀、第n個頻率點(diǎn)的聲壓均值為:
1、3、4號麥克風(fēng)在第b幀、第n個頻率點(diǎn)的聲壓均值為:
對式(9)~(12)所得聲強(qiáng)做歸一化處理可得:
上式中,表示以3號麥克風(fēng)為原點(diǎn)將x軸順時針旋轉(zhuǎn)方向上歸一化后的聲強(qiáng),表示以3號麥克風(fēng)為原點(diǎn)將x軸逆時針旋轉(zhuǎn)方向上歸一化后的聲強(qiáng),表示以1號麥克風(fēng)為原點(diǎn)將x軸逆時針旋轉(zhuǎn)方向上歸一化后的聲強(qiáng),表示以1號麥克風(fēng)為原點(diǎn)將x軸順時針旋轉(zhuǎn)方向上歸一化后的聲強(qiáng),表示以2號麥克風(fēng)為原點(diǎn)將y軸逆時針旋轉(zhuǎn)方向上歸一化后的聲強(qiáng),表示以2號麥克風(fēng)為原點(diǎn)將y軸順時針旋轉(zhuǎn)方向上歸一化后的聲強(qiáng),表示以4號麥克風(fēng)為原點(diǎn)將y軸順時針旋轉(zhuǎn)方向上歸一化后的聲強(qiáng),表示以4號麥克風(fēng)為原點(diǎn)將y軸逆時針旋轉(zhuǎn)方向上歸一化后的聲強(qiáng)。
以式(3)、式(17)~(20)中所求的聲強(qiáng)分量組成一組合適的特征向量利用特征向量Γ,對每類角度進(jìn)行特征學(xué)習(xí),并用分類器分類,然后進(jìn)行識別,可得到聲源方位角,具體過程為:
在房間中選定L個位置區(qū)域,每個位置區(qū)域是一類角度,設(shè)第k個位置區(qū)域有l(wèi)k(k=1,2,L,L)個訓(xùn)練位置,即共有個訓(xùn)練點(diǎn)。對L個位置類用碼字長度為P=[log2L]的最小輸出編碼方法進(jìn)行編碼,其中[·]是上舍入算子,從而將原有的L類最小二乘支持向量機(jī)用P個二進(jìn)制最小二乘支持向量機(jī)表示。所以訓(xùn)練集為:
{(Γi,yi(p))|i=1,…,N;yi(p)∈{-1,+1}} (21)
上式中,Γi表示第i個訓(xùn)練點(diǎn)的特征向量,yi(p)表示屬于第p個最小二乘支持向量機(jī)的第i個訓(xùn)練點(diǎn)通過最小輸出編碼方法進(jìn)行編碼后所屬的類,p=1,2,…,P。這樣就可以通過求解以下線性系統(tǒng)獲得第p個二進(jìn)制分類器:
上式中,矩陣W(p)中的元素Wlm(p)=K(p)(Gl,Gm)表示將各最小二乘支持向量機(jī)的第l個訓(xùn)練點(diǎn)的特征向量和第m個訓(xùn)練點(diǎn)的特征向量帶入支持向量機(jī)的徑向基核函數(shù)后所求出的值,g(p)為第p個最小二乘支持向量機(jī)的正則化參數(shù),I為單位矩陣,b(p)是第p個最小二乘支持向量機(jī)的一個偏量,a(p)=[a1(p),a2(p),L,aN(p)]為各最小二乘支持向量機(jī)下的訓(xùn)練點(diǎn)對應(yīng)的拉格朗日乘子所組成的向量,Y(p)=[y1(p),…,yN(p)]表示各最小二乘支持向量機(jī)下每個訓(xùn)練點(diǎn)通過最小輸出編碼方法進(jìn)行編碼后所屬類組成的向量。解方程(22)得到a和b后,在測試過程中提取每類角度相應(yīng)的特征向量,則對于每個新輸入的向量Γtest,計(jì)算第p個二進(jìn)制分類器:
上式中,y(p)(Gtest)為輸入的測試點(diǎn)特征向量Γtest對應(yīng)的輸出值,sign[·]為符號函數(shù)且ai(p)為屬于第p個最小二乘支持向量機(jī)的第i個訓(xùn)練點(diǎn)所對應(yīng)的拉格朗日乘子,K(p)(Gi,Gtest)表示第p個最小二乘支持向量機(jī)的第i個訓(xùn)練點(diǎn)的特征向量和測試點(diǎn)的特征向量帶入支持向量機(jī)的徑向基核函數(shù)后所求出的值,b(p)是第p個最小二乘支持向量機(jī)的一個偏量。所以解碼長度為P的輸出碼字即可得聲源的位置。
計(jì)算最終的方位識別精度LA為:
上式中,M和L分別為每類角度的測試點(diǎn)數(shù)和角度類的個數(shù),為識別過程中第k個類識別正確的測試點(diǎn)數(shù)。
下面結(jié)合一些具體實(shí)施例以及對比例對本發(fā)明做進(jìn)一步說明。
實(shí)施例1
本發(fā)明方法不受語音影響,采用最小二乘支持向量機(jī)對數(shù)據(jù)進(jìn)行分析和識別,小尺寸、高混響情況下定位性能較好。
對各個方向時頻點(diǎn)聲強(qiáng)做相位變換加權(quán)并在求和平均后進(jìn)行歸一化,是本方法的關(guān)鍵技術(shù)。為此,舉例說明每步處理后的特征用于訓(xùn)練和測試的定位效果。如圖4所示,房間的長、寬、高分別為7m、6m、3m,麥克風(fēng)陣列中心O位于(3.5m,3m,1.2m),每個陣元與陣列中心的距離相等,聲源與陣列中心O的距離R始終為2m,且和陣列在同一高度上。12個角度類均勻分布在圓上,每類角度的中心以30°為間隔從-170°變化到160°。訓(xùn)練過程中,在每類角度中心±5°范圍內(nèi)均勻選取11個訓(xùn)練點(diǎn),采用不同語音信號。測試過程中,在每類角度所述區(qū)域內(nèi)隨機(jī)選取100個測試位置,采用不同語音信號,計(jì)算落入正確類的測試點(diǎn)個數(shù),算出識別精度。聲音在空氣中的傳播速度c=340m/s。圖5(a)所示為陣列尺寸D=4cm、信噪比SNR=15dB,改變混響時間RT60以50ms為間隔從200ms變化到700ms,將基本聲強(qiáng)、歸一化聲強(qiáng)、主陣相位變換加權(quán)的歸一化聲強(qiáng)、主子陣聯(lián)合相位變換加權(quán)的歸一化聲強(qiáng)分別作為特征并采用最小二乘支持向量機(jī)進(jìn)行訓(xùn)練和測試的算法方位識別精度比較圖。圖5(b)所示為陣列尺寸D=4cm、混響時間RT60=300ms,改變信噪比SNR以5dB為間隔從5dB變化到30dB,將基本聲強(qiáng)、歸一化聲強(qiáng)、主陣相位變換加權(quán)的歸一化聲強(qiáng)、主子陣聯(lián)合相位變換加權(quán)的歸一化聲強(qiáng)分別作為特征并采用最小二乘支持向量機(jī)進(jìn)行訓(xùn)練和測試的算法方位識別精度比較圖。從圖中可以看出,基本聲強(qiáng)作為特征進(jìn)行訓(xùn)練和測試的識別精度在混響較高的情況下無法工作,考慮到語音影響,加入歸一化有略微改善,但由于混響對聲強(qiáng)方法的影響較大,所以提取的特征信息已經(jīng)無法良好表示角度類的特點(diǎn)。加入相位變換加權(quán)并做歸一化的聲強(qiáng)作為特征在高混響條件下,定位性能有明顯改善。最后加入子陣聲強(qiáng),提高算法的容錯率。顯然,將主子陣聯(lián)合相位變換加權(quán)的歸一化聲強(qiáng)作為特征進(jìn)行訓(xùn)練和測試,在中高信噪比(SNR35dB)、中高混響(RT603 300ms)情況下,仍可保持算法的方位識別精度在80%以上。
對比例1
不同條件下將主子陣聯(lián)合相位變換加權(quán)的歸一化聲強(qiáng)和廣義互相關(guān)相位變換加權(quán)方法估計(jì)的時間延遲分別作為特征并采用最小二乘支持向量機(jī)進(jìn)行訓(xùn)練和測試的算法方位識別精度對比圖。
與實(shí)施例1中所設(shè)初始參數(shù)相同,圖6(a)表示陣列尺寸D=4cm、信噪比SNR=15dB,改變混響時間RT60以50ms為間隔從200ms變化到700ms,將主子陣聯(lián)合相位變換加權(quán)的歸一化聲強(qiáng)和廣義互相關(guān)相位變換加權(quán)方法估計(jì)的時間延遲分別作為特征并采用最小二乘支持向量機(jī)進(jìn)行訓(xùn)練和測試的算法方位識別精度對比圖。圖6(b)表示陣列尺寸D=4cm、混響時間RT60=300ms,改變信噪比SNR以5dB為間隔從5dB變化到30dB,將主子陣聯(lián)合相位變換加權(quán)的歸一化聲強(qiáng)和廣義互相關(guān)相位變換加權(quán)方法估計(jì)的時間延遲分別作為特征并采用最小二乘支持向量機(jī)進(jìn)行訓(xùn)練和測試的算法方位識別精度比較圖。從圖中可以看出,采用傳統(tǒng)的時延方法作為特征雖然減小了混響對算法的影響,但是受小尺寸和噪聲影響,時延無法精確測量,導(dǎo)致特征信息不準(zhǔn)帶來的識別精度較小問題。而主子陣聯(lián)合相位變換加權(quán)的歸一化聲強(qiáng)具有較好的魯棒性,適合小尺寸麥克風(fēng)陣列,在混響噪聲環(huán)境下定位效果較好。
對比例2
中高混響、中高信噪比條件下,改變陣列尺寸大小,將主子陣聯(lián)合相位變換加權(quán)的歸一化聲強(qiáng)和廣義互相關(guān)相位變換加權(quán)方法估計(jì)的時間延遲分別作為特征并采用最小二乘支持向量機(jī)進(jìn)行訓(xùn)練和測試的算法方位識別精度對比圖。
與實(shí)施例1中所設(shè)初始參數(shù)相同,圖7所示為混響時間RT60=300ms、信噪比SNR=15dB情況下,改變陣列尺寸大小,將主子陣聯(lián)合相位變換加權(quán)的歸一化聲強(qiáng)和廣義互相關(guān)相位變換加權(quán)方法估計(jì)的時間延遲分別作為特征并采用最小二乘支持向量機(jī)進(jìn)行訓(xùn)練和測試的算法方位識別精度對比圖。圖中可以明顯看出,在中高信噪比、中高混響條件下,小尺寸情況,采用主子陣聯(lián)合相位變換加權(quán)的歸一化聲強(qiáng)作為特征的識別精度遠(yuǎn)高于采用時延作為特征的識別精度,而在大尺寸情況下,由于聲強(qiáng)方法采用差分原理,所以提取特征信息受到影響,識別精度低于傳統(tǒng)的時延方法,說明本發(fā)明方法的適用范圍為微型麥克風(fēng)陣列。
對比例3
實(shí)際情況下,將基本聲強(qiáng)、歸一化聲強(qiáng)、主陣相位變換加權(quán)的歸一化聲強(qiáng)、主子陣聯(lián)合相位變換加權(quán)的歸一化聲強(qiáng)、廣義互相關(guān)相位變換加權(quán)方法估計(jì)的時間延遲分別作為特征并采用最小二乘支持向量機(jī)進(jìn)行訓(xùn)練和測試的算法定位效果比較。
表1
整套實(shí)驗(yàn)系統(tǒng)放置在房間長寬高分別為9.64m、7.04m、2.95m的會議室進(jìn)行實(shí)測,麥克風(fēng)陣列中心位于(4.82m,3.52m,1.3m)處,每個陣元與陣列中心的距離相等且陣列尺寸D=4cm,聲源與陣列中心的距離R始終為2m,且和陣列在同一高度上。利用采集卡對4路麥克風(fēng)接收信號同時進(jìn)行數(shù)據(jù)采集,并用電腦對采集到的數(shù)據(jù)進(jìn)行處理,具體實(shí)施情況為:12個角度類均勻分布在圓上,每類角度的中心以30°為間隔從-170°變化到160°;訓(xùn)練過程中,在每類角度中心±5°范圍內(nèi)選取11個訓(xùn)練點(diǎn),采用不同語音信號;測試過程中,在每類角度所述區(qū)域內(nèi)選取20個測試位置,采用不同語音信號,計(jì)算落入正確類的測試點(diǎn)個數(shù),算出識別精度。表1所示為采用不同方法進(jìn)行特征提取用于訓(xùn)練和測試每類角度對應(yīng)的算法方位識別精度比較,可以明顯看出,實(shí)際環(huán)境中采用主子陣聯(lián)合相位變換加權(quán)的歸一化聲強(qiáng)作為特征在小尺寸條件下仍具有較好的識別精度,說明本發(fā)明方法有一定的實(shí)用價值。
上述實(shí)施例和對比例僅為說明本發(fā)明的技術(shù)思想,不能以此限定本發(fā)明的保護(hù)范圍,凡是按照本發(fā)明提出的技術(shù)思想,在技術(shù)方案基礎(chǔ)上所做的任何改動,均落入本發(fā)明保護(hù)范圍之內(nèi)。