器是在固定位置的汽車應用中,風檔的方向可以被 先驗已知的是被排除的噪聲源,以及駕駛員和乘客的頭部級位置是已知成為所希望聲源的 可能位置。在其中傳聲器和信號處理單元用于兩方通信(例如,電話通信)的一些示例中, 而不是本地用戶提供輸入用于約束或偏壓輸入方向,遠程用戶基于其知覺的采集和處理音 頻信號提供信息。
[0096] 在一些實施方式中,在置信傳播處理中也推斷源的運動(和/或傳聲器相對于所 述源或固定的參考幀的方向)。在一些示例中,其他的輸入(例如,有關所述傳聲器元件的 取向改變的慣性測量)也用于這種跟蹤。慣性(例如,加速度,重力)傳感器也可以和傳聲 器集成在同一芯片上,由此從單一的集成設備提供聲信號和慣性信號。
[0097] 在一些示例中,源推理模塊36與外部推理處理器140交互,其可以托管在單獨集 成電路("芯片")中或者可以由通信鏈路(例如,廣域數(shù)據(jù)網(wǎng)絡或電信網(wǎng)絡)耦合在單獨 的計算機中。例如,外部推理處理器可以執(zhí)行語音識別,以及與所需要的講話者的語音特征 的信息可以反饋給推理過程,以便更好地從其他信號中選擇所需講話者的信號。在某些情 況下,這些語音特征是長期平均的特性,諸如音調(diào)范圍、平均頻譜形狀、共振峰的范圍等。在 其他情況下,外部推理處理器可以基于從所需揚聲器的預期語音特征的短期預測而提供隨 時間變化的信息。內(nèi)部源推理模塊36和外部推理處理器140可通信的方法是通過在合并 的信傳播途徑中交換消息。
[0098] 因子圖的一個實施方式使用如美國專利公開NO. 2012/0317065A1在 "PROGRAMMABLEPROBABILITYPROCESSING"中描述的"GP5"硬件加速器,其在此引入作為參 考。
[0099] 以上描述的方法的實施例可承載音頻信號處理和分析(例如,F(xiàn)FT加速、時域濾波 的掩模)、總體控制以及概率推理(或至少部分-可能會有分割實施方式,其中某些"更高 級別"的處理在片外完成)在相同的集成電路中實現(xiàn)。在同一芯片上集成可提供比使用單 獨處理器的更低功耗。
[0100] 在下面的概率推理描述之后,其結果是值Mn,i的二進制或分數(shù)掩模,其用于過濾 輸入信號\(0,或信號的某些線性組合(例如,求和,或者選擇性延遲總和)。在一些實 施方式中,掩模值用于調(diào)節(jié)米特拉陷波濾波器增益。在一些實現(xiàn)方式中,使用如PCT公開 W02012/024507"CHARGESHARINGANALOGCOMPUTATIONCIRCUITRYANDAPPLICATIONS"中 描述的電荷共享的信號處理方法可用于實現(xiàn)輸出濾波和/或輸入信號的處理。
[0101] 參照圖4A-B,傳聲器單元的示例110使用4個MEMS元件112a-d,每個經(jīng)由配置 在1.5mm-2mm正方形配置的4個端口llla-d親合,元件共享共同后腔114??蛇x,每個元 件都有單獨的分區(qū)后腔。傳聲器單元110示出為連接到音頻處理器120,在本實施例是在 單獨封裝中。音頻處理器的模塊的框圖示于圖4C。這些包括處理器內(nèi)核510、信號處理電 路520 (例如,為了執(zhí)行SFTF計算)和概率處理器530 (例如,為了執(zhí)行置信傳播)。但是 應當理解:圖4A-B示意簡化,以及可以使用MEMS元件的許多特定的物理配置和結構。更一 般地,傳聲器具有多個端口,多個元件的每個耦合到一個或多個端口,傳聲器單元封裝的多 個不同面上的端口和端口之間的可能耦合(端口之間特定耦合或使用一個或多個公共后 腔)。這種更復雜的安排可以結合物理定向、頻率和/或噪聲消除特性,用于進一步處理提 供這樣合適的輸入。
[0102] 在源推理組件136(參見圖1)用于源分離方法的一個實施例中,輸入包括時間與 頻率的分布P(f,n)。這種分布的值是非負的,且在此示例中,分配是通過頻率值fe[1,F(xiàn)] 和時間值ne[1,N]的離散集。(一般地,在以下的說明中,整數(shù)指數(shù)n表示時間分析窗或 幀,例如30毫秒。連續(xù)輸入信號的持續(xù)時間具有索引x,表示在基本時間基準的時間點,例 如以秒計)。在該示例中,P(f,n)的值被設定為在頻率f和時間n的信號的成正比能量,規(guī) 格化以便2fnP(f,n) = 1。注意,分布P(f,n)可以采取其它形式,例如,譜幅度、譜幅度或 能量的功率/根,或記錄光譜能量,頻譜表示可并入預加重,
[0103] 除了光譜信息,到達方向信息可在相同指數(shù)集上獲得,例如作為到達方向估計 D(f,n)。在本實施例中,如上介紹,這些到達方向的估計是離散值,例如,dG[1,D],D(例 如,20)個離散(即"分級")到達方向。如下面討論的,在其他實施例中,這些方向估計不 一定離散,并且可以代表傳聲器間信息(例如,相位或延遲),而不是從這些傳聲器間信息 導出方向的估計。光譜和方向信息被組合成聯(lián)合分布P(f,n,d),它僅對指數(shù)d=D(f,n) 不為零。
[0104] 通常,分離方法假定有許多來源,由se[1,S]索引。每個源都與一組離散頻譜 原型相關聯(lián),以ze[1,Z]索引,例如其中Z= 50對應于每個源只關聯(lián)50光譜原型。每 個原型和分布q(f|z,s)相關聯(lián),其具有非負值,使得對于所有的光譜原型(即,通過對(z, s)G[1,Z]X[1,S]索引)q(n|s) = 2zq(n|z,s)q(z|s)。每個源具有方向值的相關分布, q(d|s),這是假定獨立于原型索引z。
[0105] 給定這些假設,整體分布形成為
[0106]
[0107] 其中,q(s)是源s的分數(shù)貢獻,q(z|s)是原型z對源s的分布,和q(n|z,s)是原 型Z和源S的時間分布。
[0108] 需要注意:以上求和中相應分布事先不知道。在離散分布的這種情況下,也有 S+ZS+FZS+NZS+DS=S(l+D+Z(l+F+N))未知值。這些分布的估計可以被形成為使得Q(f,n, d)匹配所觀察到的(經(jīng)驗)分布P(f,n,d)。找到這個匹配的一種方法是使用迭代算法,它 試圖達到各自分布的最佳選擇(通常是局部最優(yōu))以最大化:
[0109]
[0110] 該最大化的一種迭代方法是期望最大化算法,其可以迭代,直到停止狀態(tài),諸如輻 度的最大迭代次數(shù)。
[0111] 請注意,由于經(jīng)驗分布p(f,t,d)為疏(記得當d的最值的分布是零),則迭代計 算可以被優(yōu)化。
[0112] 終止迭代后,每個源到每個時間/頻率元件的貢獻然后發(fā)現(xiàn)作為:
[0113]
[0114] 此掩??梢员挥米?. 0和1. 0之間的量,或者可以被閾值化以形成二進掩模。
[0115] 許多替代方案可以被并入上述的方法。例如,而不是使用方向的特定估計,所述多 個傳聲器的相對相位的處理可產(chǎn)生分布P(d|f,n),使得P(f,n,d) =P(f,n)P(d|f,n)。使 用這樣的分布可以提供一種方式來表示到達方向估計的不確定性的頻率依賴性。
[0116] 其它分解可以有效地利用類似的技術。例如形式:
[0117] Q(f,n, d) = q(d|s)q(f |z, s)q(n, z, s)
[0118] 其中,每個所述分布是不受約束。
[0119] 分布的另一種分解也可以利用時間動態(tài)。需要注意:上面的,特定源隨時間q的貢 獻9(11|8) = 2 4(11|2,8)9(2|8),或特定的光譜原型隨時間9(11|2)相對不受約束。在一些 示例中,可并入時間結構,例如使用隱馬爾可夫模型。例如,特定源的貢獻進化可以由隱馬 爾科夫鏈X=Xi,…,xN管轄,以及在每個狀態(tài)xn由分配q(z|xn)表征。此外,時間變化 q(n|X)可以按照動態(tài)模型,該模型依賴于隱藏狀態(tài)序列。使用這樣的HMM方法,分布q(n, z,s)可以接著確定為源S在幀n發(fā)射它的頻譜原型z的概率。馬爾科夫鏈為源的參數(shù)可 以使用期望最大化(或類似的Baum-韋爾奇)算法來估計。
[0120] 如上面所介紹的,提供作為時間和頻率函數(shù)的方向信息不一定離散成的D箱之 一。在一個該示例中,D(f,n)是實值的估計,例如,0.0及JT之間的弧度值或0.0到180. 0 度的程度。在這樣的例子中,模型q(d|s)也是連續(xù)的,例如被表示為參數(shù)分布,例如高斯分 布。此外,在一些示例中,獲得到達方向的分布估計,例如為P(d|f,n),這是該信號在(f, n)頻率時間塊的到達方向d的估計的連續(xù)值分布。在這種情況下,P(f,n,d)被替換為乘 積P(f,n)P(d|f,n),并且該方法被修改為有效并入連續(xù)范圍的積分而不是箱體方向的離散 集上之和。
[0121] 在一些示例中,對各(f,n)分量的原始延遲(或者相位差)Sk可直接使用例如作 為向量D(f,n) = ,…,SK-SJ(即,K-1維向量以解決未知的整體階段)。在一 些示例中,這些向量是群集或矢量量化以形成D個箱體,并如上所述進行處理。在其它示例 中,連續(xù)的多維分布形成并以類似于上述的處理連續(xù)方向估計進行處理。
[0122] 如上所述,給定源S的數(shù)目,無監(jiān)督方法可用于信號的時間間隔。在一些示例中, 該分析可以對連續(xù)時間間隔進行,或者其中從過去窗口參數(shù)估計被保留的"滑動窗口"方 法,例如作為初始估計值以便隨后可交疊窗口。在一些示例中,單一來源(即"清潔")信號 用于為一個或多個源估計模型參數(shù),并且這些估計用于初始化上述迭代方法的估計。
[0123] 在一些示例中,源的數(shù)量或與特定索引值(S卩,s)源的關聯(lián)基于其他方法。例如, 聚類方法可用于方向信息以確定一定數(shù)量的單獨方向簇(例如,通過K均值聚類),并由此 確定要解決的源的數(shù)量。在一些示例中,總的方向估計可用于為每個源分配源的索引值,例 如,關聯(lián)中心方向的源作為源s= 1。
[0124] 在源推理組件136用于源分離方法的另一個實施例中,所獲取的聲音信號通過基 于一個或多個所獲取信號計算時間與頻率分布P(f,n),例如在時間處理窗口。這種分布的 值是非負的,且在此示例中,分配是通過頻率值fe[1,F(xiàn)]和時間值ne[1,N]的離散集。 在一些實施方式中,使用對應于STFT的n0分析窗口(幀)的輸入信號的時間t0附近,使 用離散頻率f的短時傅立葉變換確定P(f,n(l)的值。
[0125] 除了光譜信息,所獲取信號的處理還包括確定多個信號分量的每個的每個時間幀 的定向特性。計算方向特性的信號分量的一個示例是獨立的頻譜分量,但應當理解,可以使 用其它的分解。在本示例中,對每個(f,n)對確定方