專利名稱:平面音頻源跟蹤的方法和裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及平面音頻跟蹤的方法和裝置。
背景技術(shù):
源跟蹤的技術(shù)在導(dǎo)航、雷達(dá)和聲納領(lǐng)域里面已為我們知悉。一種最簡(jiǎn)單的源跟蹤技術(shù)采用交叉偶極陣列——以同一點(diǎn)為中心并且朝向?yàn)橹苯堑膬蓚€(gè)偶極傳感器。在無線電早期就使用交叉偶極進(jìn)行無線電測(cè)向。S. W. Davies在OCEANS 1987, vol. 19. , Sept. 1987, pp 351-356 的“Bearing Accuracies forArctan Processing of Crossed Dipole Arrays”一文中描述了有一個(gè)偶極指向北方的交叉偶極陣列,獲得的信號(hào)正比于源方位角(source bearing)的正弦和余弦,并且通過這些分量的比值的反正切獲得源方位角的估計(jì)值#。如果在交叉偶極陣列的中心有一個(gè)附加的全向傳感器,則其輸出可以被用來同步檢測(cè)正弦和余弦輸出的“方向”或符號(hào);這就允許使用四象限反正切函數(shù)來獲得明確的方位角的估計(jì)值。這篇文章研究了方位角估計(jì)器的特性,該估計(jì)器基于全向傳感器的輸出u。(t)和南北向(余弦)偶極傳感器的輸出u。(t)以及東西向(正弦)偶極傳感器的輸出、(0的時(shí)間平均乘積。美國專利6,774,934涉及攝像定位裝置,用于將相機(jī)指向視頻會(huì)議系統(tǒng)的發(fā)言人。為了尋找相機(jī)的正確的指向,該系統(tǒng)需要確定聲音來自哪個(gè)位置。通過使用至少兩個(gè)麥克風(fēng)來接收語音信號(hào)并且測(cè)量麥克風(fēng)接收的信號(hào)之間的傳輸延遲來實(shí)現(xiàn)這個(gè)功能。通過首先確定脈沖響應(yīng)Oi1)和(h2),然后計(jì)算這些脈沖響應(yīng)的互相關(guān)函數(shù),從而得到延遲。從互相關(guān)函數(shù)的主峰值確定延遲值。當(dāng)麥克風(fēng)的間距寬到足以確定延遲值的時(shí)候,上述系統(tǒng)是令人滿意的。目前已知的音頻跟蹤技術(shù)的一個(gè)缺點(diǎn)是音頻源的主要反射(例如,經(jīng)由墻壁和桌子)會(huì)對(duì)音頻跟蹤的結(jié)果造成負(fù)面影響。
發(fā)明內(nèi)容
本發(fā)明的一個(gè)目的是能夠從靠近的麥克風(fēng)得到方位角。根據(jù)本發(fā)明的一個(gè)方面,提供了一種平面音頻跟蹤方法,該方法使用至少三個(gè)麥克風(fēng)構(gòu)成虛擬的第一和第二交叉偶極麥克風(fēng)以及虛擬的單極麥克風(fēng),該方法包括對(duì)來自第一和第二交叉偶極麥克風(fēng)以及單極麥克風(fēng)的信號(hào)進(jìn)行定向預(yù)處理,對(duì)信號(hào)的定向預(yù)處理結(jié)果進(jìn)行濾波,識(shí)別分別代表從所需音頻源到第一和第二交叉偶極麥克風(fēng)以及單極麥克風(fēng)的脈沖響應(yīng)的函數(shù),對(duì)第一交叉偶極麥克風(fēng)的函數(shù)和單極麥克風(fēng)的函數(shù)進(jìn)行互相關(guān),對(duì)第二交叉偶極麥克風(fēng)的函數(shù)和單極麥克風(fēng)的函數(shù)進(jìn)行互相關(guān),以產(chǎn)生相應(yīng)的代表最主要音頻源的遲滯的估計(jì)值,并且使用代表遲滯的估計(jì)值來確定最主要源的角度估計(jì)值。根據(jù)本發(fā)明的另一個(gè)方面,提供了一種平面音頻跟蹤裝置,包括至少三個(gè)麥克風(fēng),所述至少三個(gè)麥克風(fēng)構(gòu)成虛擬的第一和第二交叉偶極麥克風(fēng)以及虛擬的單極麥克風(fēng); 用于對(duì)來自第一和第二交叉偶極麥克風(fēng)以及單極麥克風(fēng)的信號(hào)進(jìn)行定向預(yù)處理的裝置;對(duì)信號(hào)的定向預(yù)處理結(jié)果進(jìn)行濾波、并且識(shí)別分別代表從所需音頻源到第一和第二交叉偶極麥克風(fēng)和單極麥克風(fēng)的脈沖響應(yīng)的函數(shù)的裝置;互相關(guān)裝置,用于對(duì)第一交叉偶極麥克風(fēng)的函數(shù)和單極麥克風(fēng)的函數(shù)進(jìn)行互相關(guān)、對(duì)第二交叉偶極麥克風(fēng)的函數(shù)和單極麥克風(fēng)的函數(shù)進(jìn)行互相關(guān),以產(chǎn)生相應(yīng)的代表最主要音頻源的遲滯的估計(jì)值;以及用于使用代表遲滯的估計(jì)值來確定最主要源的角度估計(jì)值的裝置。
現(xiàn)在通過示例,參照附圖描述本發(fā)明,其中圖1示出了四個(gè)麥克風(fēng)的陣列;圖2是根據(jù)本發(fā)明制造的裝置的實(shí)施例的方框圖;圖3是圖示了根據(jù)本發(fā)明的方法的說明流程圖;圖4是濾波相加波束形成器(Filtered Sum Beamformer, FSB)的方框圖;圖5示出了三個(gè)等距麥克風(fēng)的圓形陣列的幾何示意圖;以及圖6示出了單極和兩個(gè)正交偶極的示意圖。在附圖中相同的參考數(shù)字被用來表示相應(yīng)的特征。
具體實(shí)施例方式圖1示出了四個(gè)麥克風(fēng)Mi、M2、M3*M4的正方形陣列,所述四個(gè)麥克風(fēng)關(guān)于通過原點(diǎn)0的正交軸對(duì)稱布置,水平軸作為零度軸。正方形相鄰二個(gè)頂點(diǎn)的距離為d,沿對(duì)角線布置的麥克風(fēng)M1 (M2)和M3 (M4)之間的間距正好是d的j倍。沿對(duì)角線布置的麥克風(fēng)對(duì)M1J3 和M2、M4形成了偶極極對(duì),并且所有四個(gè)麥克風(fēng)的組合輸出形成了虛擬構(gòu)成的單極麥克風(fēng)。 音頻源X位于相對(duì)于零度軸的方位角識(shí)處。歸一化(頻率無關(guān))的偶極響應(yīng)計(jì)算如下
Ε Φ,φ) = ^deal-T ·ΕΜφ)(1)其中
Ed (Φ, φ) = cos(汐 +7^-Ed (-Λ-/4, φ) + η(φ + (π 14, φ\( 2 )其中
Ed(^IW) = E1-E4
/.■y/J.Q.COsf^—f) —,V^^'COsfiP—f]
=S- e 、-e,
3
Hsin| V2 · Ω · cos φ —
π
權(quán)利要求
1.一種平面音頻跟蹤方法,該方法使用至少三個(gè)麥克風(fēng)構(gòu)成虛擬的第一和第二交叉偶極麥克風(fēng)以及虛擬的單極麥克風(fēng),該方法包括對(duì)來自第一和第二交叉偶極麥克風(fēng)以及單極麥克風(fēng)的信號(hào)進(jìn)行定向預(yù)處理,對(duì)信號(hào)的定向預(yù)處理結(jié)果進(jìn)行濾波,識(shí)別分別代表從所需音頻源到第一和第二交叉偶極麥克風(fēng)以及單極麥克風(fēng)的脈沖響應(yīng)的函數(shù)(hd(0)、hd(Ji/2) 和hm),對(duì)第一交叉偶極麥克風(fēng)的函數(shù)和單極麥克風(fēng)的函數(shù)進(jìn)行互相關(guān),對(duì)第二交叉偶極麥克風(fēng)的函數(shù)和單極麥克風(fēng)的函數(shù)進(jìn)行互相關(guān),以產(chǎn)生相應(yīng)的代表最主要音頻源的遲滯的估計(jì)值(Ψ。(1)和Ψ3(1)),并且使用代表遲滯的估計(jì)值來確定最主要源的角度估計(jì)值(#)。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于對(duì)定向預(yù)處理結(jié)果的濾波是在濾波相加波束形成器(32)中實(shí)現(xiàn)的。
3.根據(jù)權(quán)利要求1或2所述的方法,其特征在于對(duì)信號(hào)進(jìn)行定向預(yù)處理包括獲得歸一化的第一和第二交叉偶極信號(hào)以及歸一化的單極信號(hào)。
4.根據(jù)權(quán)利要求1到3中任何一個(gè)所述的方法,其特征在于具有布置成正方形陣列的四個(gè)麥克風(fēng)。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于正方形陣列的邊長小于所關(guān)心的聲音的波長。
6.根據(jù)權(quán)利要求1到3中任何一個(gè)所述的方法,其特征在于所述至少三個(gè)麥克風(fēng)是心形麥克風(fēng),布置成等間距麥克風(fēng)圓形陣列。
7.一種平面音頻跟蹤裝置,包括至少三個(gè)麥克風(fēng),所述至少三個(gè)麥克風(fēng)構(gòu)成虛擬的第一和第二交叉偶極麥克風(fēng)以及虛擬的單極麥克風(fēng);用于對(duì)來自第一和第二交叉偶極麥克風(fēng)以及單極麥克風(fēng)的信號(hào)進(jìn)行定向預(yù)處理的裝置(16至沈、觀和30);用于對(duì)信號(hào)的定向預(yù)處理結(jié)果進(jìn)行濾波、并且識(shí)別分別代表從所需音頻源到第一和第二交叉偶極麥克風(fēng)和單極麥克風(fēng)的脈沖響應(yīng)的函數(shù)(hd(0)、hd(Ji/2)和hm)的裝置(32);互相關(guān)裝置(48、50),用于對(duì)第一交叉偶極麥克風(fēng)的函數(shù)和單極麥克風(fēng)的函數(shù)進(jìn)行互相關(guān)、對(duì)第二交叉偶極麥克風(fēng)的函數(shù)和單極麥克風(fēng)的函數(shù)進(jìn)行互相關(guān),以產(chǎn)生相應(yīng)的代表最主要音頻源的遲滯的估計(jì)值 (Ψ。(1)和Vs(I));以及用于使用代表遲滯的估計(jì)值來確定最主要源的角度估計(jì)值的裝置(52)。
8.根據(jù)權(quán)利要求7所述的裝置,其特征在于用于對(duì)定向預(yù)處理結(jié)果進(jìn)行濾波的裝置包括濾波相加波束形成器(32)。
9.根據(jù)權(quán)利要求7或8所述的裝置,其特征在于用于對(duì)信號(hào)進(jìn)行定向預(yù)處理的裝置包括用于獲得歸一化的第一和第二交叉偶極信號(hào)以及歸一化的單極信號(hào)的裝置。
10.根據(jù)權(quán)利要求7到9中任何一個(gè)所述的裝置,其特征在于具有布置成正方形陣列的四個(gè)麥克風(fēng)。
11.根據(jù)權(quán)利要求10所述的裝置,其特征在于正方形陣列的邊長小于所關(guān)心的聲音的波長。
12.根據(jù)權(quán)利要求7到9中任何一個(gè)所述的裝置,其特征在于所述至少三個(gè)麥克風(fēng)是心形麥克風(fēng),布置成等間距麥克風(fēng)圓形陣列。
全文摘要
平面音頻跟蹤系統(tǒng)包括布置為第一和第二交叉偶極麥克風(fēng)和虛擬構(gòu)成的單極麥克風(fēng)的四個(gè)麥克風(fēng)(M1、M2、M3、M4)的正方形陣列。對(duì)來自這些麥克風(fēng)的信號(hào)進(jìn)行定向預(yù)處理,將結(jié)果施加到濾波相加波束形成器(FSB)(32)。FSB識(shí)別FSB的函數(shù)(hd(0)、hd(π/2)和hm),其分別代表從所需的音頻源到第一和第二交叉偶極麥克風(fēng)和單極麥克風(fēng)的脈沖響應(yīng)。將第一交叉偶極麥克風(fēng)的函數(shù)和單極麥克風(fēng)的函數(shù)進(jìn)行互相關(guān),將第二交叉偶極麥克風(fēng)的函數(shù)和單極麥克風(fēng)的函數(shù)進(jìn)行互相關(guān),產(chǎn)生相應(yīng)的代表最主要音頻源的遲滯的估計(jì)值(ψc(l)和ψs(l))。使用遲滯的估計(jì)值確定最主要源的角度估計(jì)值(φ)。跟蹤系統(tǒng)的其他實(shí)施例可包括布置為圓形陣列的三個(gè)麥克風(fēng),形成第一和第二交叉偶極和虛擬單極。
文檔編號(hào)H04R3/00GK102265642SQ200980152234
公開日2011年11月30日 申請(qǐng)日期2009年12月21日 優(yōu)先權(quán)日2008年12月24日
發(fā)明者勒內(nèi)·馬蒂納斯·德克斯, 科尼利斯·皮特·詹森 申請(qǐng)人:Nxp股份有限公司