一種用于聲場合成的聲場信息采集方法
【專利摘要】本發(fā)明公開了一種用于聲場合成的聲場信息采集方法,屬于信號處理【技術領域】。用平面?zhèn)髀暺麝嚵胁杉矫嫔咸囟x散位置的聲壓數(shù)據(jù)構成訓練數(shù)據(jù)庫,該訓練數(shù)據(jù)庫用于訓練GMM參數(shù),以建立聲壓與空間信息的高斯混合模型,回歸預測模塊基于該模型對采集平面上任意位置的聲場聲壓進行回歸預測,從而獲得采集平面上完整的聲場聲壓信息。
【專利說明】一種用于聲場合成的聲場信息采集方法
【技術領域】
[0001]本發(fā)明涉及一種用于聲場合成的聲場信息采集方法,屬于信號處理【技術領域】。
【背景技術】
[0002]聲場合成(wave field synthesis, WFS)以惠更斯原理為基礎,在較大范圍內(nèi)合成三維聲場。它在消費電子、通信等領域具有廣泛應用。WFS技術重現(xiàn)的聲場能較好地保留原始聲場的時間、空間性質(zhì),能給人“身臨其境”的體驗。聲場分布的感知是重建聲場的前提,通常WFS需要大量傳聲器來感知三維聲場分布,傳聲器分布越密集,感知到的聲場分布越精確,但是過多的傳聲器會影響聲場分布,甚至會明顯改變聲場的分布。
[0003]由空間采樣定理可知,空間采樣截止頻率為fNyq< c/(2Ax),其中,Λχ為采樣單元間隔距離,要精確采集頻率f ( fNyq情況下的空間聲場,采集時所用的傳聲器單元間隔最遠為Ax=c/(2fNyq)。說明書附圖中的圖13是個L米XL米的區(qū)域,在聲場感知過程至少需使用(L/Λ X)2個傳聲器。例如,當fNyq=2kHz、L=4時,在4米Χ4米的區(qū)域需布置2209個傳聲器,即使不考慮這些傳聲器的成本,僅就對聲場的影響而言,如此大數(shù)目的傳聲器,會明顯改變原始聲場。因此,必須采用局部采集技術來解決傳聲器數(shù)目過多的問題,使WFS在實際中得到應用。
[0004]Hald 和 Gomes 的專利《Method for reconstructing an acoustic field.》(DK,G01H3/12 (2006.01),W02010/003836.2010)設計了一種重建聲場方案,用于感知整個觀察區(qū)域的聲壓分布。該方案將傳聲器布局在3維規(guī)則網(wǎng)格上,在3維規(guī)則網(wǎng)格(Z=O)中,(L/Δχ)2個傳聲器均勻布局在網(wǎng)格交點處,即在直角坐標系下,各傳聲器水平坐標軸、垂直坐標軸之間的間隔均為Λχ。此外,當重建聲場的聲源平穩(wěn)時,也可用單個傳聲器在不同位置逐一進行采集測量。
[0005]該技術用網(wǎng)格方式采集聲場,這樣重建聲場的最高頻率越大,所需傳聲器的數(shù)目就越多,并且會造成聲場畸變。若用單個傳聲器逐一位置采集,則重建聲場區(qū)域越大,采集耗時就越多。
[0006]王培利,李吉,周麗麗的論文《基于神經(jīng)網(wǎng)絡的近場聲全息方法研究》(應用聲學,2010,29(1):58-62)和毛榮富,朱海潮,張勁松的論文《近場聲全息(NAH)中減少測量點數(shù)的研究》(聲學技術,2009,28 (3): 287-294)所用的方案都是基于局部采集信息對整個聲場建模。在該方案中,D,D〈 (L/Λ X)2,個傳聲器均勻布局在整個觀察區(qū)域中,首先用空間坐標位置作為訓練數(shù)據(jù)集的輸入部分,各傳聲器感知到的聲場聲壓作為訓練數(shù)據(jù)集的輸出部分,將訓練數(shù)據(jù)集通過SVR模型進行訓練,得到空間位置與聲場聲壓之間的映射模型;在此基礎上,將整個觀測區(qū)域位置作為該模型輸入,從而感知出整個觀察區(qū)域的聲壓分布。在訓練模型時,也可用神經(jīng)網(wǎng)絡(ANN)替換SVR。
[0007]ANN模型存在過學習問題,需要訓練數(shù)據(jù)樣本較大;SVR尋找不同類別之間的最優(yōu)化分類面,反映的是異類數(shù)據(jù)之間的差異,但是其訓練時間長,并且不能反映訓練數(shù)據(jù)本身的特性,重構的聲場聲壓信息的精度不高。
【發(fā)明內(nèi)容】
[0008]本發(fā)明針對以上問題的提出,而研制一種用于聲場合成的聲場信息采集方法。
[0009]本發(fā)明采取的技術方案如下:
[0010]—種用于聲場合成的聲場信息米集方法:先米集平面上局部聲壓信息,并將局部采集得到的數(shù)據(jù)作為訓練數(shù)據(jù)庫,建立空間聲壓與位置信息的高斯混合模型,然后用該模型對采集平面上任意位置的聲場聲壓進行回歸預測,從而獲得平面上全局聲壓信息。
[0011]本發(fā)明的有益效果:
[0012]本發(fā)明提出的基于高斯混合回歸的三維音頻聲場感知方法,在相對誤差控制在10%以內(nèi)的情況下,即使在聲場采集時所用的傳聲器數(shù)目僅為傳統(tǒng)方法使用數(shù)目的1/4,仍能有效地重構出聲壓分布。與神經(jīng)網(wǎng)絡方法、支持向量回歸方法相比,在聲壓相對誤差要求較高精度(如10%)時,本發(fā)明所用的麥克風數(shù)目較少,具有明顯優(yōu)勢。
【專利附圖】
【附圖說明】
[0013]圖1基于GMR的聲場信息采集方法功能框圖。
[0014]圖2區(qū)域A中傳聲器分布圖。
[0015]圖3高斯混合模型的建模流程圖。
[0016]圖4f=l.6kHz, N=40時重構聲壓相對誤差與高斯分量個數(shù)M的關系曲線。
[0017]圖5f=l.6kHz, M=15時相對誤差與訓練數(shù)據(jù)樣本邊長N的關系曲線。
[0018]圖6N=20,M=15時,2米X2米區(qū)域A內(nèi)重構聲壓幅值分布圖。
[0019]圖7N=20,M=15時,2米X2米區(qū)域A內(nèi)理想聲壓幅值分布圖。
[0020]圖8N=20,M=15時,2米X 2米區(qū)域A內(nèi)重構聲壓相位分布圖。
[0021]圖9N=20,M=15時,2米X2米區(qū)域A內(nèi)理想聲壓相位分布圖。
[0022]圖10N=20,M=15時,對2米X2米區(qū)域A內(nèi)重構聲壓與理想聲壓幅值相對誤差直方圖。
[0023]圖11N=20,M=15時,對2米X2米區(qū)域A內(nèi)重構聲壓與理想聲壓相位相對誤差直方圖。
[0024]圖12高斯混合回歸(GMR)方法、神經(jīng)網(wǎng)絡(ANN)方法、支持向量回歸(SVR)方法的相對誤差與訓練數(shù)據(jù)樣本邊長N的關系曲線。
[0025]圖13L米XL米的觀察區(qū)域中,聲場感知過程使用的(L/Λ χ)2個傳聲器分布圖?!揪唧w實施方式】
[0026]下面結合附圖對本發(fā)明做進一步說明:
[0027]本發(fā)明用灰度圖能說明本發(fā)明的技術效果,特提供灰度圖即圖6至圖9來讓審查員更好的理解本發(fā)明的技術效果。
[0028]本發(fā)明方案的功能模塊框圖如圖1所示,本發(fā)明通過采集平面上局部聲壓信息來代替全局聲壓信息,并將局部采集得到的數(shù)據(jù)作為訓練數(shù)據(jù)庫,建立聲壓與空間信息的高斯混合模型(GMM),然后用該模型對采集平面上任意位置的聲場聲壓進行回歸預測,從而獲得平面上全局聲壓信息。[0029]—種用于聲場合成的聲場信息米集方法:包括平面?zhèn)髀暺麝嚵?、高斯混合模?Gaussian mixed model, GMM)參數(shù)訓練模塊、回歸預測模塊。所述的平面?zhèn)髀暺麝嚵胁杉矫嫔咸囟x散位置的聲壓數(shù)據(jù)構成訓練數(shù)據(jù)庫,所述的GMM參數(shù)訓練模塊使用該訓練數(shù)據(jù)庫中的數(shù)據(jù)建立聲壓與空間信息的高斯混合模型,所述的回歸預測模塊用該模型對采集平面上任意位置的聲場聲壓進行回歸預測,從而獲得采集平面上完整的聲場聲壓信息。
[0030]傳聲器陣列為:
[0031]在一待采集區(qū)域A中,均勻選取D個不同位置進行聲壓采集,如圖2所示,其中傳聲器間距大于ΛΧ,D=NXN, N的取值范圍1〈N〈L/AX,區(qū)域中任一位置以及對應頻域中的復聲壓值P(rq,Ω)可構成一個四維的觀察信號x(xq, yq, Pamp, Pphase),其中Panip和Pphase分別為復聲壓的幅值和相位;將這D個空間位置信息和對應復聲壓信息,構造成訓練數(shù)據(jù)矢量序列X= {xn, n=l, 2,…,D},即X為DX4維的訓練數(shù)據(jù)集Dataset。
[0032]高斯混合模型的建模方法如下:
[0033]定義M為GMM中高斯分量個數(shù),Wi是混合加權值,滿足藝% =1; Ui是均值矢量
Σ j 是協(xié)方差矩陣 E [ (X-Ui)T(X-Ui) ], i=l, 2,…,M ;聞斯混合模型參數(shù)λ描述定義為
[0035]根據(jù)聲場分布的復雜程度等經(jīng)驗確定GMM中高斯分量個數(shù)為M,本發(fā)明建議設置M=15 ;GMM建模流程如圖3所示。
[0036]對訓練數(shù)據(jù)集Dataset進行聚類,得到高斯混合模型的初始參數(shù)λ 0 ;具體步驟如下:首先將Dataset中前M個4維觀察信號χ作為初始聚類中心Cx1, cx2,…,cxM ;所余下其它觀測信號,則根據(jù)它們與這些聚類中心的歐氏距離4,分別將它們分配給與其最相似的聚類,即歐氏距離最小聚類,見式(2);然后按照式(3)計算某一聚類中所有觀測信號的均值作為新聚類的聚類中心Hieani ;不斷迭代式(2)和(3),直到按照式(4)計算的M個聚類中心的均方差在迭代前后之差的絕對值在KTici以內(nèi);最后用得到的M個聚類數(shù)據(jù)計算入°,如式(5)-(7);
[0037]
【權利要求】
1.一種用于聲場合成的聲場信息米集方法,其特征在于:包括平面?zhèn)髀暺麝嚵?、高斯混合模型參?shù)訓練模塊、回歸預測模塊;通過平面?zhèn)髀暺麝嚵胁杉矫嫔暇植柯晧盒畔泶嫒致晧盒畔?,并將局部采集得到的?shù)據(jù)作為訓練數(shù)據(jù)庫建立聲壓與空間信息的高斯混合模型參數(shù)訓練模塊,然后用該模型對采集平面上任意位置的聲場聲壓進行回歸預測,從而獲得平面上全局聲壓信息;所述的平面?zhèn)髀暺麝嚵胁杉矫嫔咸囟x散位置的聲壓數(shù)據(jù)構成訓練數(shù)據(jù)庫,所述的高斯混合模型參數(shù)訓練模塊使用該訓練數(shù)據(jù)庫中的數(shù)據(jù)建立聲壓與空間信息的高斯混合模型,所述的回歸預測模塊用該模型對采集平面上任意位置的聲場聲壓進行回歸預測,從而獲得采集平面上完整的聲場聲壓信息。
2.根據(jù)權利要求1所述的一種用于聲場合成的聲場信息米集方法,其特征在于:傳聲器陣列為:在一待采集區(qū)域中,均勻選取D個不同位置進行聲壓采集,其中傳聲器間距大于Λχ,D=NXN, N的取值范圍為1〈N〈L/Ax,區(qū)域中任一位置以及對應頻域中的復聲壓值P(rq, Ω)可構成一個四維的觀察信號x(xq, yq, Pamp, PphasJ,其中Pamp和Pphase分別為復聲壓的幅值和相位;將這D個空間位置信息和對應復聲壓信息,構造成訓練數(shù)據(jù)矢量序列X= {xn, n=l, 2,…,D},即X為DX4維的訓練數(shù)據(jù)集Dataset。
3.根據(jù)權利要求1所述的一種用于聲場合成的聲場信息米集方法,其特征在于:高斯混合模型的建模方法如下: 定義M為GMM中高斯分量個數(shù),Wi是混合加權值,滿足=1; Ui是均值矢量
i=l),Σ i是協(xié)方差矩陣E [ (X-Ui)T (X-Ui) ],i=l,2,…,M ;高斯混合模型參數(shù)λ描述定義為
λ ={w” Ui, ,i=l, 2,…,Μ, (I) 根據(jù)聲場分布的復雜程度等經(jīng)驗確定GMM中高斯分量個數(shù)為M,設置M=15 ;對訓練數(shù)據(jù)集Dataset進行聚類,得到高斯混合模型的初始參數(shù)λ° ;具體步驟如下:首先將Dataset中前M個4維觀察信號X作為初始聚類中心CX1, CX2,…,cxM ;所余下其它觀測信號,則根據(jù)它們與這些聚類中心的歐氏距離dp分別將它們分配給與其最相似的聚類,即歐氏距離最小聚類,見式(2);然后按照式(3)計算某一聚類中所有觀測信號的均值作為新聚類的聚類中心Hieani ;不斷迭代式(2)和(3),直到按照式(4)計算的M個聚類中心的均方差在迭代前后之差的絕對值在KTki以內(nèi);最后用得到的M個聚類數(shù)據(jù)計算λ°,如式(5)?(7);
4.根據(jù)權利要求1所述的一種用于聲場合成的聲場信息米集方法,其特征在于:回歸預測模塊的方法為: 將觀察區(qū)域上任意需要重建聲壓的空間位置數(shù)據(jù)作為輸入數(shù)據(jù)特征矢量Xin=Ixinn, η=1, 2,…,L},將重建的聲壓作為輸出數(shù)據(jù)特征矢量Xtjut= Ixwtn, η=1, 2,…,L},高斯混合回歸則是在輸入為Xin=Xinn的條件下,Xout的期望作為輸出Xtjutn:
【文檔編號】G01H17/00GK103438985SQ201310353642
【公開日】2013年12月11日 申請日期:2013年8月14日 優(yōu)先權日:2013年8月14日
【發(fā)明者】陳喆, 殷福亮, 彭鈺林 申請人:大連理工大學