,實(shí)施方式在產(chǎn)生增強(qiáng) 期望信號(hào)的上下文中描述,其可以通過(guò)限制在聲輸出信號(hào)路徑引入的延遲而適用于人到人 通信系統(tǒng)(例如,電話)。在其他實(shí)施方式中,該方法用在人機(jī)通信系統(tǒng)中,其中延遲可不是 那么大的問(wèn)題。例如,該信號(hào)可被提供給自動(dòng)語(yǔ)音識(shí)別或理解系統(tǒng)。
[0078] 參照?qǐng)D1,在一個(gè)實(shí)施方式中,四個(gè)并行音頻信號(hào)由MEMS多傳聲器電源110并作 為模擬信號(hào)(如,分開的金屬絲或纖維上的電或光信號(hào),或者復(fù)用在共同電線或光纖上) Xl (t),. . .,x4 (t) 113a-d傳遞到信號(hào)處理單元120。所獲得的音頻信號(hào)包括源自源S105的 分量,以及源自一個(gè)或多個(gè)其他來(lái)源(未示出)的分量。在下面所示的例子中,信號(hào)處理單 元120輸出試圖最好從其它信號(hào)源分開源自源S的信號(hào)的單個(gè)信號(hào)。一般地,信號(hào)處理單 元利用輸出掩碼137,它代表選擇(例如,二進(jìn)制或加權(quán))作為估計(jì)源自所需源S的所獲取 的音頻分量的時(shí)間和頻率的函數(shù)。此掩模然后由輸出重建元件138用于形成所需信號(hào)。
[0079] 作為第一階段,信號(hào)處理單元120包括模數(shù)轉(zhuǎn)換器。應(yīng)當(dāng)理解:在其他實(shí)施方式 中,在傳遞到信號(hào)處理單元之前,原始音頻的每個(gè)信號(hào)可以在傳聲器內(nèi)數(shù)字化(例如,轉(zhuǎn)換 成多位數(shù)字或二進(jìn)制2 △流),這種情況下,輸入接口是數(shù)字的,以及在信號(hào)處理單元中不 需要全模數(shù)轉(zhuǎn)換。在其他實(shí)施方式中,傳聲器元件可以與信號(hào)處理單元的一部分或全部集 成在一起,例如作為多芯片模塊,或可集成在共同的半導(dǎo)體晶片上。
[0080] 數(shù)字化的音頻信號(hào)從模數(shù)轉(zhuǎn)換器傳遞到方向估算模塊134,其一般決定源方 向或位置的估計(jì)作為時(shí)間和頻率的函數(shù)。參照?qǐng)D3,方向估計(jì)模塊取k個(gè)輸入信號(hào) Xl(t),. . .,xk(t)和獨(dú)立地對(duì)一系列分析幀中的各輸入信號(hào)執(zhí)行短時(shí)傅立葉變換(STFT)分 析232。例如,該幀是30毫秒的持續(xù)時(shí)間,對(duì)應(yīng)于在采樣率16kHz的1024個(gè)樣本??墒褂?其他分析窗口,例如,更短的幀用于減少分析的延遲。分析的輸出是一組復(fù)雜數(shù)量值XtlU, 對(duì)應(yīng)于第k個(gè)傳聲器、第n個(gè)幀和第i個(gè)頻率分量。其他形式的信號(hào)處理可例如基于時(shí)域 處理用于確定到達(dá)估計(jì)的方向,因此,短時(shí)傅立葉分析不應(yīng)該被認(rèn)為是必要或根本的。
[0081] 傅立葉分析232的復(fù)合輸出被應(yīng)用于相位計(jì)算234。對(duì)于每個(gè)傳聲器幀頻率 (k,n,i)組合,從復(fù)量計(jì)算相位(在這里和以下省略下標(biāo)n)。在一些替代品, 也計(jì)算幅度|Xti|由隨后模塊使用。
[0082] 在一些示例中,對(duì)每個(gè)頻率獨(dú)立地處理四個(gè)傳聲器的相位以產(chǎn)生表 示為連續(xù)的或精細(xì)量化量的到達(dá)方向的最佳估計(jì)0i(?nt)。在本實(shí)施例中,到來(lái)方向估計(jì)一 種程度或自由,例如,對(duì)應(yīng)于平面中的到達(dá)方向。在其它示例中,方向可以通過(guò)多個(gè)角度表 示(例如,水平/方位角和垂直/仰角,或直角坐標(biāo)中的向量),并可用范圍以及方向來(lái)表 示。注意:如下面關(guān)聯(lián)傳聲器元件的設(shè)計(jì)特性進(jìn)一步描述的,使用三個(gè)以上的音頻信號(hào)和單 角度表示,所述輸入信號(hào)的相位可過(guò)度約束方向估計(jì),以及可以使用到達(dá)方向的最佳擬合 (任選還表示度擬合)例如作為最小二乘估計(jì)。在一些示例中,方向計(jì)算還提供例如表示為 參數(shù)分WPi( 0 )的到達(dá)方向的確定性的測(cè)量(例如,適合的定量程度),例如通過(guò)平均值和 標(biāo)準(zhǔn)偏差參數(shù)化或作為到達(dá)量化方向上的明確分布。在一些示例中,到達(dá)估計(jì)的方向容納 未知聲速,其可以在估計(jì)到達(dá)方向的過(guò)程中隱含地或明確地估計(jì)。
[0083] 計(jì)算方法的特定方向的示例如下。傳聲器的幾何形狀是已知先驗(yàn),因此對(duì)于每個(gè) 傳聲器的信號(hào)相位的線性方程可被表示為f*3 + 4 =4,其中f是第k個(gè)傳聲器的三維 位置,孓是在到達(dá)方向的三維矢量,h是所有的傳聲器共同的固定延遲,Sk=巾^^^是 第k個(gè)傳聲器在頻率的頻率分量觀察到的延遲。所述多個(gè)傳聲器的公式可以表示為矩 陣方程Ax=b,其中A是取決于傳聲器的位置的KX4矩陣(K是傳聲器的數(shù)量),x代表到 達(dá)方向(具有5增加單位元件的4-維向量),和b是表示觀察到的K相的向量。當(dāng)有四個(gè) 非共面的傳聲器時(shí),該方程可以唯一解決。如果有不同數(shù)量的傳聲器或該獨(dú)立性是不滿足, 則系統(tǒng)可以在最小二乘意義上加以解決。對(duì)于固定幾何形狀,A的偽逆P能夠被計(jì)算一次 (例如,作為傳聲器上端口的物理布置的屬性),并硬編碼到實(shí)現(xiàn)到達(dá)方向估計(jì)x作為Pb的 計(jì)算模塊。
[0084] 問(wèn)題是在某些實(shí)施例中相位不一定是唯一數(shù)量。相反,每個(gè)僅確定直達(dá)2JT的倍 數(shù)。因此可以無(wú)窮多種不同的方式解開相位,向任何其中加入2 31的倍數(shù)和然后執(zhí)行如上 類型的計(jì)算。在若干實(shí)施例中為了簡(jiǎn)化這一問(wèn)題,傳聲器的間隔接近小于波長(zhǎng)相距的事實(shí) 被利用,以避免不必處理相位展開。因此,任何兩個(gè)展開相位之間的差不能超過(guò)2 31 (或在 中間情況下,231的較小倍數(shù))。這減少了從無(wú)窮多個(gè)到有限數(shù)量的可能展開數(shù)量:一個(gè)用 于每個(gè)傳聲器,對(duì)應(yīng)于首先由波擊中的傳聲器。如果繪制單位圓周圍的相位,這相當(dāng)于利用 事實(shí):即特定的傳聲器被首先擊中,然后繞了一圈移動(dòng)到另一個(gè)傳聲器的相位值,使得另一 個(gè)接下來(lái)被擊中等。
[0085] 可替代地,對(duì)應(yīng)于所有可能展開的方向被計(jì)算,以及最準(zhǔn)確的被保留,但最常見 的,選擇使用這些展開中的哪些的簡(jiǎn)單啟發(fā)式是相當(dāng)有效的。啟發(fā)式是假設(shè)所有的傳聲器 將較快連續(xù)地?fù)糁校?,它們比波長(zhǎng)間隔少得多),所以我們發(fā)現(xiàn)任何兩個(gè)相位之間的單位 圓的弧時(shí)間首次發(fā)現(xiàn)為展開的基礎(chǔ)。該方法最小化最大和最小展開相位值之間的差。
[0086]在一些實(shí)現(xiàn)方式中,在標(biāo)題為"SOURCESEPARATIONUSINGACIRCULARMODEL" 的 國(guó)際申請(qǐng)No.PCT/US2013/060044中描述的方法用于使用圓形相位模型解決到達(dá)方向,而 不明確要求展開。這些方法中的一些利用每個(gè)源都和直線-圓相位特性相關(guān)聯(lián)的觀察,其 中成對(duì)傳聲器之間的相對(duì)相位遵循線性(模2 31)模式作為頻率的函數(shù)。在一些示例中,修 改的RANSAC(隨機(jī)采樣一致性)方法用于識(shí)別被分配給各源的頻率/相位樣本。在一些示 例中,無(wú)論是與改性RANSAC法組合或使用其他方法,封裝變量表示用于表示相位的概率密 度,從而避免在施加概率技術(shù)中需要"解包"相位以估計(jì)源之間的延遲。
[0087] 也可以在該程序的過(guò)程中計(jì)算多個(gè)輔助值,以確定計(jì)算方向的置信度。最簡(jiǎn)單的 是最長(zhǎng)弧的長(zhǎng)度:如果是長(zhǎng)(2 31的大部分),那么我們可以確信我們的假設(shè),即傳聲器被連 續(xù)快速擊中和正確啟發(fā)式解開。如果是短,較低置信度值被饋送到算法的其余部分以提高 性能。也就是說(shuō),如果大量的工具箱說(shuō)^malmostpositivethebincamefromthe east"和一些附近的工具箱說(shuō)"Maybeitcamefromthenorth,Idon'tknow",我們知道 它忽略。
[0088] 另一個(gè)輔助值是估計(jì)方向矢量的大?。ㄒ陨蟙)。理論預(yù)測(cè),這應(yīng)該與聲音的速度 成反比。我們預(yù)計(jì)由于噪音有些偏差,但對(duì)于給定工具箱太大偏差是提示:我們的單平面波 假設(shè)已破壞,所以我們不應(yīng)該在這種情況下確信方向。
[0089] 正如上面介紹的,在一些替代實(shí)施例中,幅度|Xti|也提供給方向計(jì)算,其可以使 用絕對(duì)或相對(duì)幅度,用于確定方向和/或估計(jì)的確定性或分布。作為一個(gè)例子,從頻率的高 能量(等效高振幅)信號(hào)確定的方向可以比如果能量很低更可靠。在一些示例中,例如基 于相位差集的擬合和傳聲器之間絕對(duì)幅度或者該組的各大小的差異的程度而計(jì)算到達(dá)方 向估計(jì)的的置信估計(jì)值。
[0090] 在一些實(shí)施方式中,例如在單一角度估計(jì)的情況下,到達(dá)估計(jì)方向被量化為16個(gè) 均勻的扇區(qū),9i=量化(9i(c;°nt))。在二維方向估計(jì)的情況下,兩個(gè)角度可以單獨(dú)量化,或 者可以使用方向的聯(lián)合(矢量)量化。在一些實(shí)施方式中,從輸入信號(hào)的相位直接確定量 化估計(jì)。在一些示例中,到達(dá)估計(jì)器的方向的輸出不是簡(jiǎn)單量化的方向估計(jì),而是離散分布 pri ( 0 )(即,后驗(yàn)分布得到置信估計(jì))。例如,在低的絕對(duì)幅度,到達(dá)方向的分布可以是更 廣泛的(例如,更高的熵)比幅度也高。作為另一個(gè)例子,如果相對(duì)值信息與相位信息不一 致,該分布可以是更廣泛的。作為又一示例,因?yàn)橐纛l信號(hào)傳播的物理特性,低頻率區(qū)域固 有地具有更寬分布。
[0091] 再參考圖1,原始方向估計(jì)135 (例如,在時(shí)間對(duì)頻率網(wǎng)格)被傳遞到源推理模塊 136。注意,該模塊的輸入基本上獨(dú)立地對(duì)于每個(gè)頻率分量和對(duì)于每個(gè)分析幀計(jì)算。通常, 推理模塊使用在時(shí)間和頻率上分布的信息,以確定其中重建所需信號(hào)的適當(dāng)輸出掩碼137。
[0092] 源推理模塊136的一種實(shí)施方式類型使用概率推理,并且更具體地,能使用置信 傳播的方法來(lái)概率推理。這個(gè)概率推理可以表示為因子圖,其中輸入節(jié)點(diǎn)對(duì)應(yīng)當(dāng)前幀n= nQ的到來(lái)估算方向0 ,頻率分量i的集合,以及用于先前幀的窗口n= %-W,…,隊(duì)-1 (或 在執(zhí)行批量處理的實(shí)施例中包括未來(lái)幀)。在一些實(shí)現(xiàn)方式中,存在隱藏(潛在)變量的 時(shí)間序列Smi,指示(n,i)時(shí)間-頻率位置是否對(duì)應(yīng)于期望的源。例如,S是二進(jìn)制變量, 用1表示所希望的源和0表示不存在所希望的源。在其它示例中,所希望的和/或不希望 的(例如,干擾)的來(lái)源的較大數(shù)被表示在這個(gè)指標(biāo)變量。
[0093] 因子圖的一個(gè)例子引入要素耦合Sn,i,具有其他指標(biāo)的集合{S^; |m-n|§ 1,1}。這個(gè)因子圖例如通過(guò)傾向于產(chǎn)生與不同源相關(guān)聯(lián)的時(shí)間-頻率空間 的連續(xù)區(qū)域而提供"平滑"。另一個(gè)隱藏變量表征所需的源。例如,在因子圖中表示預(yù)計(jì)到 達(dá)(離散)方向9 S。
[0094] 更復(fù)雜的隱變量也可以在因子圖中表示。示例包括清濁節(jié)距變量,起始指示符 (例如,用于模擬顯示在頻率箱范圍上的開始,語(yǔ)音活動(dòng)指標(biāo)(例如,用于模擬交談),源的 頻譜形狀特征(例如,作為長(zhǎng)期平均或得到作為語(yǔ)音期間模擬頻譜形狀的變化的動(dòng)態(tài)特性 的結(jié)果)。
[0095] 在一些實(shí)施方式中,外部信息被提供到信號(hào)處理單元120的源推導(dǎo)136模塊。作 為一個(gè)示例,對(duì)到達(dá)方向的約束由容納傳聲器的設(shè)備的用戶例如,使用圖形界面提供,所述 圖形界面呈現(xiàn)有關(guān)該設(shè)備的360度范圍,并允許選擇范圍的部分(或多個(gè)部分)或范圍的 大?。ɡ?,聚焦),其中估計(jì)的到達(dá)方向被允許或者從其排除到達(dá)方向。例如,在用于與遠(yuǎn) 程方免提通信的音頻輸入的情況下,在該設(shè)備獲取音頻的用戶可以選擇方向以排除,因?yàn)?這是干擾源。在一些應(yīng)用中,某些方向是已知的先驗(yàn)以表示干擾源的方向和/或其中所希 望的源不允許的方向。例如,在其中傳聲