一種基于雙向路徑跟蹤的實(shí)時(shí)聲音傳播模擬方法
【專利摘要】本發(fā)明公開(kāi)了基于雙向路徑跟蹤的實(shí)時(shí)聲音傳播模擬方法,該方法首先輸入當(dāng)前幀的聲學(xué)環(huán)境狀態(tài),以各聲源為起點(diǎn)隨機(jī)生成正向子路徑,以聽(tīng)者為起點(diǎn)生成反向子路徑,在正向與反向子路徑節(jié)點(diǎn)間隨機(jī)建立連接,生成完整路徑;并計(jì)算出每一路徑的強(qiáng)度,生成概率和多重重要性采樣權(quán)重,最后得到并輸出能量響應(yīng)曲線。本發(fā)明以雙向路徑跟蹤的路徑生成能力為基礎(chǔ),結(jié)合基于信噪比的質(zhì)量標(biāo)準(zhǔn),通過(guò)控制不同反射次數(shù)路徑的數(shù)量對(duì)聲能曲線各時(shí)間段質(zhì)量做出調(diào)整,從而可以平衡各時(shí)段反射聲的質(zhì)量。本發(fā)明由于使用了雙向路徑跟蹤,可以在相同的計(jì)算代價(jià)下產(chǎn)生數(shù)量更多,質(zhì)量更高的路徑,且路徑質(zhì)量較少受聲源與聽(tīng)者位置的影響。
【專利說(shuō)明】
一種基于雙向路徑跟蹤的實(shí)時(shí)聲音傳播模擬方法
技術(shù)領(lǐng)域
[0001] 本發(fā)明涉及聲學(xué)模擬技術(shù)領(lǐng)域,尤其涉及一種基于路徑跟蹤的幾何聲學(xué)模擬方 法。
【背景技術(shù)】
[0002] 早期的聲學(xué)模擬技術(shù)主要應(yīng)用于建筑聲學(xué)設(shè)計(jì),大多使用離線算法。當(dāng)前虛擬現(xiàn) 實(shí)技術(shù)的發(fā)展使得實(shí)時(shí)聲學(xué)模擬成為必要。當(dāng)下的聲學(xué)模擬算法可分為波動(dòng)聲學(xué)方法和幾 何聲學(xué)方法兩大類。波動(dòng)法通過(guò)求解波動(dòng)方程來(lái)模擬聲音傳播,其結(jié)果精確性高,然而計(jì)算 代價(jià)不菲,難以達(dá)到實(shí)時(shí)模擬的要求。幾何聲學(xué)方法則將聲音傳播的規(guī)則簡(jiǎn)化為與光線相 似。這類方法模擬與聲音波動(dòng)性相關(guān)的現(xiàn)象(如衍射與干涉)時(shí)會(huì)遇到困難,然而其計(jì)算代 價(jià)遠(yuǎn)低于波動(dòng)法。因此在傳統(tǒng)建筑聲學(xué)模擬領(lǐng)域,這一方法的應(yīng)用極為廣泛。近年來(lái)幾何聲 學(xué)方法的發(fā)展可參考SAVI0JA,L.,AND SVENSS0N,U.P.2015.0verview of geometrical room acoustic modeling techniques.The Journal of the Acoustical Society of America 138,2,708-730〇
[0003] 很多實(shí)時(shí)模擬算法利用對(duì)聲學(xué)環(huán)境的假設(shè)來(lái)提高計(jì)算效率。若我們假設(shè)場(chǎng)景中物 體,聲源或聽(tīng)者靜止不動(dòng),我們便可通過(guò)預(yù)計(jì)算聲音傳播的方法實(shí)時(shí)地產(chǎn)生音效。這類技術(shù) 的代表可參考RAGHUVANSHI,N.,AND SNYDER,J.2014.Parametric wave field coding for precomputed sound propagation.ACM Transactions on Graphics(T0G)33,4,38〇另一些 方法利用聲學(xué)環(huán)境在鄰近幀之間變化較小的假設(shè)來(lái)簡(jiǎn)化計(jì)算,代表方法可參考SCHISSLER, C.,MEHRA,R.,AND MAN0CHA,D.2014.High-order diffraction and diffuse reflections for interactive sound propagation in large environments.ACM Transactions on Graphics(T0G)33,4,39。此外,一些方法通過(guò)簡(jiǎn)化模型,合并聲源等方法,去除聲學(xué)場(chǎng)景中 不重要的細(xì)節(jié)來(lái)加速計(jì)算。代表性的方法可參考ANTANI,L.,AND MAN0CHA,D. 2013.Aural proxies and directionally-varying reverberation for interactive sound propagation in virtual environments.Visualization and Computer Graphics,IEEE Transactions on 19,4,567-575.
[0004] 路徑跟蹤方法本質(zhì)上是為模擬光能傳播而特化出的蒙特卡羅積分法。由于幾何聲 學(xué)中的聲音傳播規(guī)則與光線相似,這一方法在聲學(xué)模擬領(lǐng)域也得到廣泛應(yīng)用。傳統(tǒng)的路徑 跟蹤法以聲源為起點(diǎn)生成大量路徑。當(dāng)路徑與聽(tīng)者相交,則將這一路徑的能量貢獻(xiàn)累加到 最終的聲能曲線之上。由于代表聽(tīng)者的幾何體(通常為人頭大小的球體)相對(duì)場(chǎng)景而言過(guò) 小,這一方法的收斂速度極為緩慢。
[0005] 由于在實(shí)際應(yīng)用中,場(chǎng)景中往往存在多個(gè)聲源,但很少需要同時(shí)模擬多個(gè)聽(tīng)者, Schissler等人提出了反向路徑跟蹤法。具體可參考SCHISSLER,C.,MEHRA,R.,AND MAN0CHA,D.2014.High-〇rder diffraction and diffuse reflections for interactive sound propagation in large environments.ACM Transactions on Graphics(TOG)33, 4,39。該方法以聽(tīng)者為起點(diǎn)生成路徑,而用幾何體表示聲源,聲源越多,則幾何體總表面積 越大,從而提高了路徑的利用率。
[0006] 反向路徑跟蹤法的問(wèn)題在于其效率與聲源幾何體的大小相關(guān),且不能模擬理想點(diǎn) 聲源。盡管我們可以縮小幾何體來(lái)近似點(diǎn)聲源,然而這也會(huì)降低路徑的命中率。SchrSder提 出的路徑雨(diffuse rain,DR)技術(shù)很好地彌補(bǔ)了這些問(wèn)題。該方法不使用幾何體檢測(cè)路 徑,而將路徑上的節(jié)點(diǎn)直接與目標(biāo)相連(對(duì)于正向路徑跟蹤,目標(biāo)為聽(tīng)者,反向路徑跟蹤則 為聲源)。具體方法可參考SCHR〇DEl?,D. 2011 .Physically based real-time auralization of interactive virtual environments, vol .11.Logos Verlag Berlin GmbH。對(duì)于完全 無(wú)遮擋的場(chǎng)景,這種方法可以利用到路徑上的每一個(gè)節(jié)點(diǎn),極大地提高了計(jì)算效率。然而, 這一技術(shù)的缺點(diǎn)也非常明顯。由于路徑雨建立的連接有一端為目標(biāo),目標(biāo)的位置對(duì)連接質(zhì) 量的影響是非常明顯的。當(dāng)目標(biāo)處于不合適的位置時(shí),這一方法的結(jié)果質(zhì)量將會(huì)出現(xiàn)明顯 的下降。在目標(biāo)經(jīng)常移動(dòng)的場(chǎng)景中,為了獲得質(zhì)量穩(wěn)定的結(jié)果,用戶需要不斷調(diào)節(jié)模擬程序 的參數(shù)。
[0007] 最后,上述所有基于路徑跟蹤的方法都有一個(gè)共同的問(wèn)題,即不能對(duì)聲能曲線各 時(shí)間段的質(zhì)量進(jìn)行精確的控制。實(shí)現(xiàn)這一點(diǎn)的障礙主要有二:其一,目前并沒(méi)有一種可以對(duì) 聲能曲線不同時(shí)間段質(zhì)量分別評(píng)價(jià)的質(zhì)量標(biāo)準(zhǔn)。其二,聲音傳播的延遲取決于其傳播距離。 如果要調(diào)節(jié)聲能曲線某一段時(shí)間的質(zhì)量,我們必須控制算法產(chǎn)生的路徑長(zhǎng)度,而由于路徑 生成的隨機(jī)性,這并不是一件容易實(shí)現(xiàn)的事情。由于這一問(wèn)題,聲音傳播模擬很容易出現(xiàn)早 期反射聲或后期反射聲質(zhì)量過(guò)低,與其余部分難以配合的情況,對(duì)總體結(jié)果質(zhì)量造成不利 的影響。
【發(fā)明內(nèi)容】
[0008] 本發(fā)明目的在于針對(duì)現(xiàn)有技術(shù)的不足,提供了一種基于雙向路徑跟蹤的實(shí)時(shí)聲音 傳播模擬方法。
[0009] 本發(fā)明的目的是通過(guò)以下技術(shù)方案來(lái)實(shí)現(xiàn)的:一種基于雙向路徑跟蹤的實(shí)時(shí)聲音 傳播模擬方法,每一幀中的處理過(guò)程包括如下步驟:
[0010] (1)輸入當(dāng)前幀的聲學(xué)環(huán)境狀態(tài),包括聲源與聽(tīng)者位置、場(chǎng)景幾何描述、聲學(xué)材質(zhì) 狀況和聲音介質(zhì)特性;
[0011] (2)根據(jù)積分TnLo的米樣概率xn,d,向各積分分配樣本;T nLo代表直接聲Lo在場(chǎng)景中 經(jīng)過(guò)n次反射后對(duì)能量響應(yīng)曲線的貢獻(xiàn),d表示當(dāng)前幀的序號(hào);d = l時(shí),xn,i=l/N,N為N為積 分TnLo的個(gè)數(shù),即最大反射次數(shù);
[0012] (3)對(duì)于每一積分,在積分內(nèi)的各連接策略間盡可能平均地分配樣本;
[0013] (4)以各聲源為起點(diǎn)隨機(jī)生成正向子路徑,以聽(tīng)者為起點(diǎn)生成反向子路徑;
[0014] (5)根據(jù)先前確定的各連接策略的樣本數(shù),在正向與反向子路徑節(jié)點(diǎn)間隨機(jī)建立 連接,生成完整路徑;
[0015] (6)計(jì)算出每一路徑的強(qiáng)度,生成概率和多重重要性采樣權(quán)重;對(duì)于通過(guò)連接正向 子路徑第s個(gè)節(jié)點(diǎn)與反向子路徑第t個(gè)節(jié)點(diǎn)得到的路徑 XfXs+t+1,使用公式如下:
[0019] 其中f( ?)為路徑強(qiáng)度,Ps,t( ?)為路徑生成概率,Ws,t( ?)為多重重要性采樣權(quán) 重;
[0020] Fi為節(jié)點(diǎn)Xl處的聲材質(zhì)特性,G1>1+1為路徑中各段的幾何傳播因子,11 1>1+1為路徑中 各段的聲介質(zhì)特性,I代表路徑中各段的生成概率,cs,t代表在正向子路徑第s個(gè)節(jié)點(diǎn)與反 向子路徑第t個(gè)節(jié)點(diǎn)建立連接的概率,星號(hào)為卷積符號(hào);
[0021] (7)使用步驟6得到的f( ? ),ps,t( ?)和ws,t( ?)計(jì)算能量響應(yīng)曲線/j = i/%,TnLo 0 的計(jì)算公式為:
[0023]其中,E[ ?]表示數(shù)學(xué)期望,Sn為用于計(jì)算TnLo的樣本總數(shù),sn>1- n為連接正向子路徑 第i個(gè)節(jié)點(diǎn)與反向子路徑第n-i個(gè)節(jié)點(diǎn)得到的樣本數(shù),為使用這種連接方式得到的第 j個(gè)樣本;
[0024] (8)計(jì)算本幀各積分在各信噪比窗口中的方差〇2,令其質(zhì)量因子Q為計(jì)算積分使用 的樣本數(shù),對(duì)于每一方差估計(jì)〇f,使用下面的更新公式:
[0028] 其中,Gf為用戶定義的方差質(zhì)量標(biāo)準(zhǔn),d=l時(shí)€^1與〇(1-1應(yīng)取0;
[0029] (9)使用下面的公式計(jì)算出下一幀的各積分采樣概率:
[0031]其中,M為信噪比窗口的數(shù)量;a為小于1的正數(shù);為步驟8中更新后的,積分TnL〇 在信噪比窗口m中的方差估計(jì);
[0032 ] (10)輸出步驟7得到的能量響應(yīng)曲線。
[0033] 本發(fā)明的有益效果是:與傳統(tǒng)方法相比,雙向路徑跟蹤生成路徑的能力更強(qiáng),路徑 的平均質(zhì)量也更好。本發(fā)明以雙向路徑跟蹤的路徑生成能力為基礎(chǔ),結(jié)合基于信噪比的質(zhì) 量標(biāo)準(zhǔn),通過(guò)控制不同反射次數(shù)路徑的數(shù)量對(duì)聲能曲線各時(shí)間段質(zhì)量做出調(diào)整,從而可以 平衡各時(shí)段反射聲的質(zhì)量。本發(fā)明由于使用了雙向路徑跟蹤,可以在相同的計(jì)算代價(jià)下產(chǎn) 生數(shù)量更多,質(zhì)量更高的路徑,且路徑質(zhì)量較少受聲源與聽(tīng)者位置的影響。本發(fā)明的樣本分 配方法則可以平衡聲能曲線各部分的質(zhì)量,使結(jié)果總體上更加令人滿意。
【附圖說(shuō)明】
[0034] 圖1是本發(fā)明中關(guān)于連接策略的示意圖;
[0035] 圖2是試驗(yàn)場(chǎng)景中,本發(fā)明與對(duì)照方法生成的聲能曲線對(duì)比圖;
[0036] 圖3是試驗(yàn)場(chǎng)景中,本發(fā)明與對(duì)照方法的信噪比曲線對(duì)比圖;
[0037] 圖4是示例情況1的場(chǎng)景布置示意圖;
[0038] 圖5是示例情況2的場(chǎng)景布置示意圖;
[0039] 圖6是對(duì)照方法在情況1與情況2下的信噪比曲線對(duì)比圖;
[0040] 圖7是本發(fā)明在情況1與情況2下的信噪比曲線對(duì)比圖。
【具體實(shí)施方式】
[0041]在基于幾何聲學(xué)原理的各種聲學(xué)模擬方法中,路徑跟蹤由于其實(shí)現(xiàn)簡(jiǎn)單,場(chǎng)景適 應(yīng)性強(qiáng)和最終估計(jì)無(wú)偏的特點(diǎn)而被廣泛應(yīng)用。然而之前的路徑跟蹤算法存在采樣效率低, 結(jié)果質(zhì)量差且不穩(wěn)定,不能支持理想點(diǎn)聲源等種種問(wèn)題。本發(fā)明使用雙向路徑跟蹤,即從聲 源與聽(tīng)者兩個(gè)方向同時(shí)生成部分路徑,而后在其間建立連接以產(chǎn)生完整路徑的方法解決了 上述問(wèn)題。
[0042] 下面首先介紹本發(fā)明的理論基礎(chǔ)。
[0043] -、幾何聲學(xué)與蒙特卡羅積分法基礎(chǔ)
[0044] 幾何聲學(xué)模擬的最終結(jié)果用各聲源的能量響應(yīng)曲線E(x,co,t)表示。其中x代表聽(tīng) 者位置,w代表聲音的傳入方向,t代表聲音傳播的時(shí)間延遲。
[0045] 幾何聲學(xué)中,聲能的傳播可用下面的方程描述:
[0046] 乙(a' 4 a.,') = (Ay 4 a',') + jL、(a' 4 x'')* M (a' e n
[0047] 其中:
[0048] Lk (x' -> x, /) = A (-> x', /) G (xf/ x') f (xf x)
[0050]這里我們解釋一下式中符號(hào)的含義。我們一般用L(x,co,t)來(lái)代表隨時(shí)間變化的 聲輻射度,其參數(shù)與能量響應(yīng)曲線E(x,co,t)的含義相同。為方便描述傳播過(guò)程,我們用L (x'-x,!:)表示L(x',〇 (x^4x),t)。式中其余情況同理。Lo代表聲源的出射福射度。f(x〃 - X' -x)為雙向散射分布函數(shù),代表X'處聲學(xué)材料的性質(zhì)。G -v)為幾何因子,用于表不 聲音的擴(kuò)散與場(chǎng)景中的遮擋關(guān)系。其中當(dāng)x與x'互相可見(jiàn)時(shí)為1,反之為0。星號(hào)* 代表卷積。表示 x〃與Y之間聲音介質(zhì)的影響。這種影響包括能量吸收和傳播 延遲。對(duì)于均勻介質(zhì),我們有
[0052]其中a為介質(zhì)的能量吸收系數(shù),5( ?)為單位沖激響應(yīng)函數(shù),c為聲速。最后,Q代表 場(chǎng)景中的幾何體。A則是幾何體上定義的面積測(cè)度。
[0053] 注意上面的模型不能描述衍射和干涉等波動(dòng)現(xiàn)象。對(duì)于不同頻率的聲音,我們假 設(shè)它們互不相干,每一頻率上都可算得一獨(dú)立的聲輻射度。
[0054] 我們可以將上面的積分方程寫(xiě)為算子形式:
[0055] L = Lo+TL
[0056] 其中
[0057] IE - ^ .y'/) ^ M ^ a-'.t)dA n
[0058]簡(jiǎn)單地說(shuō),算子T的含義相當(dāng)于"一次反射"。我們可將這一方程展開(kāi)為Neumann級(jí) 數(shù):
[0059] Lz=YJ',L^
[0060] 可以看到,最終的聲輻射度等于聲音每一次反射后的輻射度之和。由于算子T本質(zhì) 上是一次積分,我們便可以用數(shù)值積分法求出級(jí)數(shù)中的各項(xiàng),以獲得最終結(jié)果。在實(shí)際應(yīng)用 中,由于計(jì)算能力有限,且聲能在場(chǎng)景中反射之后會(huì)不斷衰減,我們?cè)O(shè)定一最大反射次數(shù)N, 并只考慮r^N的情況。
[0061] 接下來(lái)我們介紹蒙特卡羅積分法。設(shè)我們需計(jì)算積分'我們可以在I:上 v 構(gòu)建概率空間(2,x,y2),從中取出一樣本X,然后求下面的期望:
[0063] 這里的p(X)是定義于兩測(cè)度間的Radon-Nikodym導(dǎo)數(shù)。也經(jīng)常不嚴(yán)格地稱為"取到 樣本X的概率"。對(duì)于我們的問(wèn)題,p(X)的公式將在后文給出。
[0064]最后,能量響應(yīng)曲線E(x,《,t)與聲輻射度的L(x,《,t)形式一致。事實(shí)上,假設(shè)聽(tīng) 者x處有一無(wú)限小球體,則我們?cè)谄淝蛎嫔嫌蠩(x, ?,t)=L(x, ?,t)。
[0065] 二、雙向路徑跟蹤
[0066] 我們之前提到過(guò),路徑跟蹤本質(zhì)上是特化了的蒙特卡羅積分法。我們現(xiàn)在將路徑 跟蹤中的概念和上文中的公式一一對(duì)應(yīng)。一條連接聲源與聽(tīng)者,含有i個(gè)中間節(jié)點(diǎn)的路徑可 以視為從Q 1中取出的一個(gè)樣本,這里Q 1為i個(gè)集合Q的笛卡爾直積,稱為i次反射的路徑空 間。這條路徑對(duì)應(yīng)的f( ?)稱為該路徑的強(qiáng)度,P( ?)稱為該路徑的生成概率。使用蒙特卡羅 積分法時(shí),這條路徑將用于計(jì)算積分ru。
[0067] 在雙向路徑跟蹤中,我們首先從聲源和聽(tīng)者出發(fā),隨機(jī)生成大量的子路徑(從聲源 出發(fā)的子路徑稱為正向子路徑,從聽(tīng)者出發(fā)則稱為反向子路徑)。然后在其節(jié)點(diǎn)間建立連接 以生成完整的路徑。假設(shè)一條子路徑為xo… Xs,那么這條子路徑的生成概率可用如下公式計(jì) 算:
[0069] 這里Pg(XQ -XI)代表從聲源或聽(tīng)者XQ出發(fā),生成一條XQ -XI方向的射線的概率,Pf (Xi-l^Xi^Xi+l)代表Xi接收到一條Xi-l^Xi方向的射線時(shí),生成一條Xi-Xi+l方向的反射射 線的概率。這些概率由具體的路徑生成實(shí)現(xiàn)方法決定。為簡(jiǎn)單起見(jiàn),我們用Vo代表p g(X04 Xl),Vi代表Pf(Xi-1-Xi-Xi+l),Gi,i+l代表G -Y/+| )。那么上面的公式可以簡(jiǎn)化為: S-1
[0070] 0
[0071] 現(xiàn)在,我們假設(shè)有一條子路徑的第s個(gè)中間結(jié)點(diǎn)與另一條路徑的第t個(gè)中間結(jié)點(diǎn)相 連,構(gòu)成一條s+t次反射的完整路徑X0…Xs+t+1。那么這條路徑的生成概率為:
[0073] 然后我們考慮一下f( ?)。根據(jù)與當(dāng)前路徑相關(guān)的積分Ts+tLo的展開(kāi)形式,我們有:
[0074] /(% …Xs+f+1) = fps (巧 4 7;-0:
[0075] 我們希望能夠?qū)⑸厦娴墓交癁榕c路徑生成概率相似的形式。于是,我們定義Fi = f(Xi-1-Xi-Xi+i),M,_ (,y, G 丨)。特別地,我們令卩。=1。(叉。4叉1),卩糾+1=1,于是有: S+/+I 州
[0076] /(~…~+1)=rT^r^w *??? ) i~0
[0077] 由于沖激響應(yīng)間的卷積結(jié)果仍然是沖激響應(yīng),我們只需將它們的強(qiáng)度相乘,時(shí)間 延遲相加就可以得到結(jié)果。
[0078] 現(xiàn)在我們考慮如何計(jì)算積分。由于我們這里使用了多重重要性采樣技術(shù),我們的 積分計(jì)算公式比一般的蒙特卡羅積分法要復(fù)雜一些:
[0080]我們解釋一下公式中符號(hào)的含義。我們知道,構(gòu)成一條反射次數(shù)為n的路徑有很多 種方法。只要連接正向子路徑的第i個(gè)中間節(jié)點(diǎn)和反向子路徑的第n_i個(gè)中間節(jié)點(diǎn)即可。公 式中Xy-u代表采用這種連接方式的第j個(gè)樣本,m.M代表這種連接方式的實(shí)際樣本數(shù),Sn n 代表計(jì)算積分TnLo所用的總樣本數(shù),即乏代表使用這種連接方式的概率,可以是 r-0 Siti/Sn,也可以是分配樣本所用的概率分布。Wwi為多重重要性采樣權(quán)重。本算法中使用 的權(quán)重如下:
[0082] 這一權(quán)重稱為平衡型權(quán)重。原理參見(jiàn)VEACH,E.,AND⑶IBAS,L.J.1995.0ptimally combining sampling techniques for monte carlo rendering.In Proceedings of the 22nd annual conference on Computer graphics and interactive techniques,ACM, 419-428。
[0083]本文中,i、j、k均為數(shù)學(xué)表示,無(wú)特殊意義,取值為自然數(shù)。
[0084]三、樣本分配策略
[0085]在討論樣本分配策略之前。我們需要先介紹一下我們基于信噪比,用于評(píng)價(jià)聲音 傳播模擬算法的質(zhì)量標(biāo)準(zhǔn)。我們將能量響應(yīng)曲線按時(shí)間分為多個(gè)窗口,每一個(gè)窗口內(nèi)的能 量積分視為一個(gè)隨機(jī)變量。通過(guò)多次模擬的結(jié)果,我們可以算得各隨機(jī)變量的均值與標(biāo)準(zhǔn) 差估計(jì)。我們定義隨機(jī)變量X的信噪比如下:
[0087]各隨機(jī)變量的信噪比按時(shí)間排列可組成一"信噪比曲線"。這一曲線反映了能量響 應(yīng)曲線各部分的質(zhì)量。我們后面的樣本分配將以這一標(biāo)準(zhǔn)為優(yōu)化目標(biāo)。
[0088] 樣本的總數(shù)應(yīng)在算法開(kāi)始執(zhí)行前確定,每一次模擬之前的樣本分配過(guò)程分為兩 步:第一步在各個(gè)積分TnLo中分配樣本,第二步在屬于同一積分的各種連接策略(決定使用 前向子路徑的第幾個(gè)中間節(jié)點(diǎn))中分配樣本。產(chǎn)生樣本時(shí),我們隨機(jī)取兩條子路徑,并按先 前確定的連接策略確定連接,計(jì)算積分。
[0089] 附圖1給出了子路徑最大反射次數(shù)為6的情況下各種連接策略的示意圖。注意各種 策略能夠提供的連接數(shù)是不相同的,其原因在于不同的子路徑可能包含相同的起點(diǎn)。對(duì)于 直接聲來(lái)說(shuō),只有一種可能的連接,就是將聲源與聽(tīng)者直接相連。涉及子路徑起點(diǎn)的連接策 略比不涉及起點(diǎn)的連接策略能夠提供的連接數(shù)要少一些。標(biāo)為"不建議使用"的連接策略容 易對(duì)最終結(jié)果造成不良影響,應(yīng)當(dāng)略過(guò)。
[0090] 對(duì)于同一積分的不同策略(在圖1中從右上到左下排成一斜線),我們可以證明最 優(yōu)的樣本分配方案為平均分配,然而由于各策略最大連接數(shù)不同,有可能出現(xiàn)不能平均分 配的情況,此時(shí)應(yīng)使實(shí)際的樣本分配與平均分配盡可能接近。
[0091] 各積分之間的樣本分配以最大化總信噪比之和為目標(biāo)。假設(shè)待分配的總樣本數(shù)為 S,能量響應(yīng)曲線劃分的窗口數(shù)為M,積分個(gè)數(shù)為N,積分rLo的采樣概率為 Xl,那么總信噪比 之和為
[0093] 這里Xmn為積分TnL〇對(duì)窗口m的貢獻(xiàn)。E |;X_與采樣方式無(wú)關(guān)。然而;fXw貝1J _ n=l J \_n?=\. _ 是可以通過(guò)調(diào)整樣本分布來(lái)控制的。設(shè))(_互不相關(guān),則有
[0094] O'2 YXmn
[0095] 其中是積分TnLo中單個(gè)樣本對(duì)窗口 m貢獻(xiàn)的方差。由上可知,為了最大化總信噪 比,我們需要求解下面的問(wèn)題: .M N.. N.
[0096] min^5lg<r^^-~, s.t. ^.v,t =1. 1 m~\ n-l H-1
[0097] 為了在積分之間進(jìn)行樣本分配,我們需要做兩件事情。一是求出二是解上面 的最優(yōu)化問(wèn)題。
[0098] 我們首先討論〇i。在每一次模擬結(jié)束后,我們當(dāng)然可以用模擬得出的結(jié)果求出 然而實(shí)時(shí)模擬使用的樣本數(shù)一般不會(huì)太多,容易導(dǎo)致方差估計(jì)不穩(wěn)定。為了保證方差 估計(jì)相對(duì)穩(wěn)定,我們將用當(dāng)前幀的新方差估計(jì)與之前的估計(jì)做加權(quán)平均。
[0099]設(shè)我們?cè)诋?dāng)前幀使用Q個(gè)樣本作出了新的方差估計(jì)〇2,我們將Q記為這次估計(jì)的 "質(zhì)量因子"。設(shè)前一幀的最終方差估計(jì)為,質(zhì)量因子為Qh,則當(dāng)前幀的方差估計(jì)和質(zhì) 量因子按下面的公式更新:
[0102]其中Cf為一預(yù)先制定的質(zhì)量標(biāo)準(zhǔn)。y的計(jì)算公式如下:
[0104]注意對(duì)于Qd-iiQ#的特殊情況(實(shí)際中極為常見(jiàn)),上面的公式可以簡(jiǎn)化為
[0106]現(xiàn)在我們討論前面的優(yōu)化問(wèn)題。為求解這一問(wèn)題,我們給出了下面的迭代公式:
[0108] 為防止除數(shù)為0,這一迭代公式要求對(duì)于任意M和N至少有一個(gè)不為0。我們可以 略去對(duì)最終能量響應(yīng)曲線貢獻(xiàn)太小的積分和窗口來(lái)達(dá)到這一要求。另一種方法是設(shè)定一個(gè) 極小的方差估計(jì)值下限,當(dāng)估計(jì)值過(guò)低時(shí)將其強(qiáng)制提高至下限以上。我們可以證明,當(dāng)a取 小于1的正數(shù)時(shí),上面的迭代公式局部線性收斂至優(yōu)化問(wèn)題的解,且收斂速度至少為線性。 實(shí)際應(yīng)用中,a的取值范圍在0.4到0.7之間效果較好。
[0109] 每一幀結(jié)束前,我們首先使用當(dāng)前幀的數(shù)據(jù)更新方差估計(jì)。然后使用當(dāng)前幀的各 積分采樣概率作為初值帶入迭代公式,計(jì)算出下一幀的概率。當(dāng)場(chǎng)景靜止時(shí),這樣的迭代將 收斂至最優(yōu)概率分布。當(dāng)場(chǎng)景出現(xiàn)變化時(shí),由于變化的連續(xù)性,之前的概率分布仍然是一個(gè) 很不錯(cuò)的初始值。
[0110]最后需要注意的是,我們需要給采樣概率為〇的積分稍微保留一點(diǎn)樣本,以保證下 一幀的所有方差估計(jì)都可以計(jì)算出來(lái)。
[0111]四、方法實(shí)現(xiàn)
[0112] 模擬開(kāi)始前,我們需設(shè)定一初始的各積分采樣概率Xn(建議平均分配)。所有的方 差估計(jì)與質(zhì)量因子Q應(yīng)初始化為〇。下面給出本方法中每一幀的實(shí)際流程:
[0113] 1、首先根據(jù)各積分采樣概率Xn,向各積分分配樣本。注意對(duì)采樣概率為0的積分需 保留少量樣本用于本幀的方差估計(jì);
[0114] 2、對(duì)于每一積分,在積分內(nèi)的各策略間盡可能平均地分配樣本;
[0115] 3、隨機(jī)生成子路徑;
[0116] 4、根據(jù)先前確定的各策略的樣本數(shù),在子路徑節(jié)點(diǎn)間隨機(jī)建立連接,生成完整路 徑;
[0117] 5、使用第二章中的方法,計(jì)算出每一路徑的f( ? ),p( ?)和多重重要性采樣權(quán)重;
[0118] 6、根據(jù)第二章的積分計(jì)算公式算出聲能曲線;
[0119] 7、根據(jù)本幀中產(chǎn)生的樣本,使用第三章中的公式更新方差估計(jì)(Ti與質(zhì)量因子Q;
[0120] 8、根據(jù)第三章中的迭代公式,計(jì)算出下一幀的各積分采樣概率。
[0121] 實(shí)施實(shí)例
[0122] 發(fā)明人在一臺(tái)配備Intel i7 3.50GHz四核中央處理器,32GB內(nèi)存的計(jì)算機(jī)上實(shí)現(xiàn) 了上文所描述的算法,并實(shí)現(xiàn)了用于對(duì)照的另一算法(反向光線跟蹤與路徑雨相結(jié)合)。實(shí) 驗(yàn)結(jié)果表明,我們算法的效率在大量場(chǎng)景中高于傳統(tǒng)方法,在空曠的大型室內(nèi)場(chǎng)景中,聲源 離地面較近的情況下,我們的方法與傳統(tǒng)方法的效率差異尤其明顯。附圖中給出了一個(gè)較 大的室內(nèi)場(chǎng)景中,兩方法在相同計(jì)算時(shí)間下產(chǎn)生的能量響應(yīng)曲線(圖2)與其信噪比(圖3)。 此外,對(duì)照算法結(jié)果質(zhì)量受聲源位置影響的問(wèn)題在我們的算法中得到了明顯的緩解。附圖 給出了一組示例場(chǎng)景中的對(duì)比。圖4和圖5中,光源與攝像機(jī)的位置分別對(duì)應(yīng)聲源與聽(tīng)者的 位置。圖6與圖7展示了兩種算法在情況1(圖4)與情況2(圖5)下的結(jié)果信噪比曲線??梢钥?到對(duì)照方法的結(jié)果有明顯的質(zhì)量差異,而我們的方法質(zhì)量則基本穩(wěn)定。
【主權(quán)項(xiàng)】
1. 一種基于雙向路徑跟蹤的實(shí)時(shí)聲音傳播模擬方法,其特征在于,每一幀中的處理過(guò) 程包括如下步驟: (1) 輸入當(dāng)前幀的聲學(xué)環(huán)境狀態(tài),包括聲源與聽(tīng)者位置、場(chǎng)景幾何描述、聲學(xué)材質(zhì)狀況 和聲音介質(zhì)特性等; (2) 根據(jù)積分TnLo的米樣概率Xn,d,向各積分分配樣本。TnLo代表直接聲Lo在場(chǎng)景中經(jīng)過(guò)η 次反射后對(duì)能量響應(yīng)曲線的貢獻(xiàn),d表示當(dāng)前幀的序號(hào)。d = 1時(shí),Xn, i = 1/Ν,N為N為積分TnL0 的個(gè)數(shù),即最大反射次數(shù)。 (3) 對(duì)于每一積分,在積分內(nèi)的各連接策略間盡可能平均地分配樣本。 (4) 以各聲源為起點(diǎn)隨機(jī)生成正向子路徑,以聽(tīng)者為起點(diǎn)生成反向子路徑。 (5) 根據(jù)各連接策略的樣本數(shù),在正向與反向子路徑節(jié)點(diǎn)間隨機(jī)建立連接,生成完整路 徑。 (6) 計(jì)算出每一路徑的強(qiáng)度,生成概率和多重重要性采樣權(quán)重。對(duì)于通過(guò)連接正向子路 徑第s個(gè)節(jié)點(diǎn)與反向子路徑第t個(gè)節(jié)點(diǎn)得到的路徑 XfXs+t+1,使用公式如下:其中f( ·)為路徑強(qiáng)度,ps,t( ·)為路徑生成概率,ws,t( ·)為多重重要性采樣權(quán)重。F1為節(jié)點(diǎn)X1處的聲材質(zhì)特性,G1,1+1為路徑中各段的幾何傳播因子,M 1,1+1為路徑中各段 的聲介質(zhì)特性,V1代表路徑中各段的生成概率,cs,t代表在正向子路徑第s個(gè)節(jié)點(diǎn)與反向子 路徑第t個(gè)節(jié)點(diǎn)建立連接的概率,星號(hào)為卷積符號(hào)。 (7) 使用步驟6得到的f( · ),ps,t( · MPws,t( ·)計(jì)算能量響應(yīng)曲自 的計(jì) 算公式為:其中,E[ ·]表示數(shù)學(xué)期望,Sn為用于計(jì)算TnLo的樣本總數(shù),sn,μ為連接正向子路徑第i 個(gè)節(jié)點(diǎn)與反向子路徑第n-i個(gè)節(jié)點(diǎn)得到的樣本數(shù),X1^1,」為使用這種連接方式得到的第j個(gè) 樣本。 (8) 計(jì)算本幀各積分在各信噪比窗口中的方差〇2,令其質(zhì)量因子Q為計(jì)算積分使用的樣 本數(shù),對(duì)于每一方差估計(jì)Of,使用下面的更新公式:其中,Qt為用戶定義的方差質(zhì)量標(biāo)準(zhǔn),d = 1時(shí)€^_1與〇(1-1應(yīng)取O。 (9)使用下面的公式計(jì)算出下一幀的各積分采樣概率:其中,M為信噪比窗□的數(shù)量。α為小于1的正數(shù)。為步驟8中更新后的,積分TnLo在信 噪比窗口m中的方差估計(jì)。 (I 〇)輸出步驟7得到的能量響應(yīng)曲線。
【文檔編號(hào)】G01S11/14GK105893719SQ201610436309
【公開(kāi)日】2016年8月24日
【申請(qǐng)日】2016年6月16日
【發(fā)明人】任重, 曹春曉, 周昆
【申請(qǐng)人】浙江大學(xué)