本發(fā)明涉及音頻信號處理領(lǐng)域,尤其涉及一種針對立體聲揚聲器播放設(shè)備的空間音頻系統(tǒng)、音頻處理器及虛擬環(huán)繞聲轉(zhuǎn)換方法。
背景技術(shù):
1、目前移動終端如手機、平板電腦、筆記本電腦等設(shè)備聲音大都采用立體聲播放的設(shè)備,立體聲播放設(shè)備是指能夠產(chǎn)生左右聲道聲音效果的設(shè)備,通過左右聲道的聲音分別輸入到左右耳朵,以模擬立體聲效果。這些設(shè)備通常包括音頻源(如音樂或視頻文件)、音頻處理器(如解碼器或處理芯片)和揚聲器。
2、傳統(tǒng)的立體聲播放設(shè)備通常采用雙揚聲器布局,一個揚聲器用于產(chǎn)生左聲道音頻,另一個揚聲器用于產(chǎn)生右聲道音頻。這種布局使得用戶可以感受到音源在左右方向上的分布,從而獲得一定的立體聲效果。這種技術(shù)的優(yōu)點是簡單、成本低,適用于大多數(shù)消費電子設(shè)備。
3、盡管立體聲播放設(shè)備已經(jīng)獲得了顯著的改進,但仍然存在一些不足之處:
4、空間限制:傳統(tǒng)的立體聲布局在模擬立體聲效果時受到空間的限制。由于只使用了兩個揚聲器,無法提供真實的三維聲場效果;在小型設(shè)備中(如智能手機、筆記本電腦等)的揚聲器布局和聲學(xué)限制下,往往無法提供寬廣和沉浸式的聲場效果,這意味著用戶無法感受到音源的真實定位和環(huán)繞感,導(dǎo)致音頻體驗的局限性;
5、體驗的舒適性:目前比如蘋果空間音頻、移動終端的杜比全景聲等格式的內(nèi)容都需要佩戴耳機才能體驗到環(huán)繞感,長時間的佩戴耳機會對人耳造成不適的感覺;
6、主觀性差異:每個人的聽覺特征和喜好不同,對于立體聲效果的感知和滿意度也有所不同,因此,設(shè)計一個能夠滿足所有用戶需求的通用立體聲系統(tǒng)是一項挑戰(zhàn);
7、移動設(shè)備的限制:移動設(shè)備(如手機和平板電腦)通常具有較小的尺寸和限制的揚聲器布局,這會限制其提供立體聲效果的能力;小型設(shè)備中使用的內(nèi)置揚聲器通常受到尺寸、功率和設(shè)計限制,導(dǎo)致它們的聲學(xué)性能有限,這可能導(dǎo)致音質(zhì)不夠清晰、分辨率較低,無法準(zhǔn)確地再現(xiàn)音頻信號的細節(jié)和動態(tài)范圍;
8、環(huán)境干擾:外部環(huán)境中的噪音和聲學(xué)反射可能會對立體聲效果產(chǎn)生干擾,降低音頻體驗的質(zhì)量;
9、多聲道需求:傳統(tǒng)的立體聲系統(tǒng)通常需要多個揚聲器通道來實現(xiàn)沉浸和環(huán)繞聲效果,這要求用戶購買昂貴的環(huán)繞聲設(shè)備系統(tǒng),并在安裝和配置方面面臨一定的復(fù)雜性和限制。
10、以上背景技術(shù)內(nèi)容的公開僅用于輔助理解本發(fā)明的發(fā)明構(gòu)思及技術(shù)方案,其并不必然屬于本專利申請的現(xiàn)有技術(shù),也不必然會給出技術(shù)教導(dǎo);在沒有明確的證據(jù)表明上述內(nèi)容在本專利申請的申請日之前已經(jīng)公開的情況下,上述背景技術(shù)不應(yīng)當(dāng)用于評價本技術(shù)的新穎性和創(chuàng)造性。
技術(shù)實現(xiàn)思路
1、本發(fā)明的目的是提供一種轉(zhuǎn)換虛擬環(huán)繞聲的空間音頻系統(tǒng),在不對設(shè)備進行硬件改造的前提下,創(chuàng)造更寬廣和沉浸式的聲場效果。
2、為達到上述目的,本發(fā)明采用的技術(shù)方案如下:
3、一種針對立體聲揚聲器播放設(shè)備的空間音頻系統(tǒng),包括揚聲器設(shè)備及集成有hrtf算法的音頻處理器,所述音頻處理器實時接收所述揚聲器設(shè)備的立體聲格式或環(huán)繞聲格式的初始音頻流數(shù)據(jù),并基于不增加聲道的前提下將其轉(zhuǎn)換為虛擬環(huán)繞聲音頻,包括:
4、對所述初始音頻流數(shù)據(jù)進行預(yù)處理,使其在各個聲道的音頻響度統(tǒng)一;
5、對預(yù)處理后的音頻進行空間渲染操作,包括:
6、預(yù)先設(shè)定一虛擬空間,且在所述虛擬空間內(nèi)設(shè)置虛擬耳朵的方位,所述虛擬耳朵包括左耳和右耳;
7、利用hrtf算法模擬所述預(yù)處理后的音頻在所述虛擬空間內(nèi)的聲音傳播,并模擬所述虛擬耳朵接收到所述虛擬空間內(nèi)傳播的聲音;
8、分析左耳與右耳接收到的聲音差異,其中,所述聲音差異包括時間延遲差異、相位差異、響度衰減差異中的一項或多項;
9、根據(jù)左耳與右耳接收到的聲音差異,估計虛擬聲源在所述虛擬空間內(nèi)的位置,所述虛擬聲源被定義為在所述虛擬空間內(nèi)傳播的聲音的起點;
10、在完成空間渲染后,將音頻重新編碼為包含空間位置信息的虛擬環(huán)繞聲音頻,并將其返回給所述揚聲器設(shè)備。
11、進一步地,承前所述的任一技術(shù)方案或多個技術(shù)方案的組合,所述音頻處理器將立體聲格式的預(yù)處理后的音頻的左右聲道信號分離,或者,將環(huán)繞聲格式的預(yù)處理后的音頻的各聲道信號分離,得到每個聲道對應(yīng)的單聲道音頻;
12、模擬每個聲道對應(yīng)的單聲道音頻在所述虛擬空間內(nèi)傳播,并模擬得到被左耳和右耳接收的單聲道音頻;
13、分析左耳與右耳接收到的聲音差異包括:對單聲道音頻進行時域分析,以確定左耳與右耳接收到聲音的時間差;和/或,對單聲道音頻進行相位分析,以確定左耳與右耳接收到聲音的相位差;和/或,對單聲道音頻進行頻域分析,以確定左耳與右耳接收到聲音的頻率分布。
14、進一步地,承前所述的任一技術(shù)方案或多個技術(shù)方案的組合,通過以下方式估計虛擬聲源在所述虛擬空間內(nèi)的位置:
15、預(yù)設(shè)一初始化源點,使其位于左耳與右耳的中垂線上;
16、確定左耳與右耳接收到聲音的時間差之后,基于hrtf數(shù)據(jù)庫存儲的聲學(xué)傳輸特性,確定第一偏移向量;和/或,確定左耳與右耳接收到聲音的相位差之后,基于hrtf數(shù)據(jù)庫存儲的聲學(xué)傳輸特性,確定第二偏移向量;和/或,確定左耳與右耳接收到聲音的頻率分布后,基于hrtf數(shù)據(jù)庫存儲的聲學(xué)傳輸特性,確定第三偏移向量;
17、根據(jù)所述第一偏移向量、和/或第二偏移向量、和/或第三偏移向量,確定綜合偏移向量,并據(jù)此對所述初始化源點進行偏移,得到所述虛擬聲源在所述虛擬空間內(nèi)的位置。
18、進一步地,承前所述的任一技術(shù)方案或多個技術(shù)方案的組合,將音頻重新編碼為包含空間位置信息的虛擬環(huán)繞聲音頻包括:
19、根據(jù)估計的所述虛擬聲源在所述虛擬空間內(nèi)的位置,對所述預(yù)處理后的音頻進行增強處理,包括:
20、使音頻寬度增大;
21、和/或,通過hrtf算法模擬音頻信號在不同方向上被左耳和右耳接收,評估對應(yīng)的音頻效果,以確定音頻的方向調(diào)整;
22、和/或,通過hrtf算法模擬音頻信號以不同音量和濾波效果被左耳和右耳接收,評估對應(yīng)的音頻效果,以確定音頻的頻率調(diào)整和相位調(diào)整;
23、和/或,通過hrtf算法模擬音頻信號以不同的混響和回聲效果被左耳和右耳接收,評估對應(yīng)的音頻效果,以確定音頻的反射調(diào)整。
24、進一步地,承前所述的任一技術(shù)方案或多個技術(shù)方案的組合,所述揚聲器設(shè)備配置有兩個以上揚聲器,且兩揚聲器間距在15cm以上;
25、所述音頻處理器集成在所述揚聲器設(shè)備上;或者,所述揚聲器設(shè)備配置有客戶端應(yīng)用程序,所述音頻處理器設(shè)置在該客戶端應(yīng)用程序?qū)?yīng)的服務(wù)器端或云端。
26、進一步地,承前所述的任一技術(shù)方案或多個技術(shù)方案的組合,預(yù)先根據(jù)所述揚聲器設(shè)備的揚聲器的間距,利用hrtf算法設(shè)計所述虛擬空間:揚聲器的間距越大,所述虛擬空間越大;
27、所述揚聲器設(shè)備包括手機、平板電腦、筆記本電腦、pc電腦、音頻播放終端、電視、車載音響設(shè)備中的一種或多種。
28、進一步地,承前所述的任一技術(shù)方案或多個技術(shù)方案的組合,所述系統(tǒng)還包括與所述音頻處理器電連接的人機交互模塊,其配置有以下調(diào)節(jié)單元中的一種或多種:
29、響度統(tǒng)一調(diào)節(jié)單元,其用于調(diào)節(jié)對所述初始音頻流數(shù)據(jù)在各個聲道的音頻響度統(tǒng)一的響度值;
30、虛擬空間調(diào)節(jié)單元,其用于調(diào)節(jié)所述虛擬空間大小和/或調(diào)節(jié)所述虛擬耳朵在所述虛擬空間內(nèi)的方位,并用于一鍵復(fù)位虛擬空間的初始設(shè)置參數(shù);
31、空間混響設(shè)置單元,其用于從多種預(yù)設(shè)的空間混響模式中選擇一期望混響模式,且所述音頻處理器被配置為根據(jù)被選擇的期望混響模式匹配關(guān)聯(lián)的聲道均衡參數(shù)和混音參數(shù),所述預(yù)設(shè)的空間混響模式包括板混響模式、房間混響模式、大廳混響模式。
32、進一步地,承前所述的任一技術(shù)方案或多個技術(shù)方案的組合,通過以下方式預(yù)先為空間混響模式預(yù)設(shè)關(guān)聯(lián)的聲道均衡參數(shù)和混音參數(shù):
33、針對每一種空間混響模式,多次操作所述揚聲器設(shè)備的音頻系統(tǒng);
34、根據(jù)預(yù)設(shè)的評價因素對每次操作進行評價計算該次操作的音質(zhì)分?jǐn)?shù);
35、操作預(yù)設(shè)的次數(shù),并選取其中最高音質(zhì)分?jǐn)?shù)對應(yīng)操作下的聲道均衡參數(shù)和混音參數(shù)作為關(guān)聯(lián)的優(yōu)化參數(shù);或者,直至音質(zhì)分?jǐn)?shù)達到預(yù)設(shè)的優(yōu)化分?jǐn)?shù)閾值則停止操作,并將最后一次操作下的聲道均衡參數(shù)和混音參數(shù)作為關(guān)聯(lián)的優(yōu)化參數(shù)。
36、根據(jù)本發(fā)明的另一方面,提供了一種音頻處理器,通過以下步驟處理音頻以得到虛擬環(huán)繞聲音頻:
37、獲取立體聲格式或環(huán)繞聲格式的初始音頻流數(shù)據(jù);
38、對所述初始音頻流數(shù)據(jù)進行預(yù)處理,使其在各個聲道的音頻響度統(tǒng)一;
39、對預(yù)處理后的音頻進行空間渲染操作,包括:
40、預(yù)先設(shè)定一虛擬空間,且在所述虛擬空間內(nèi)設(shè)置虛擬耳朵的方位,所述虛擬耳朵包括左耳和右耳;
41、利用hrtf算法模擬所述預(yù)處理后的音頻在所述虛擬空間內(nèi)的聲音傳播,并模擬所述虛擬耳朵接收到所述虛擬空間內(nèi)傳播的聲音;
42、分析左耳與右耳接收到的聲音差異,其中,所述聲音差異包括時間延遲差異、相位差異、響度衰減差異中的一項或多項;
43、根據(jù)左耳與右耳接收到的聲音差異,估計虛擬聲源在所述虛擬空間內(nèi)的位置,所述虛擬聲源被定義為在所述虛擬空間內(nèi)傳播的聲音的起點;
44、在完成空間渲染后,將音頻重新編碼為包含空間位置信息的虛擬環(huán)繞聲音頻,且其聲道與所述初始音頻流數(shù)據(jù)的聲道相同。
45、進一步地,承前所述的任一技術(shù)方案或多個技術(shù)方案的組合,將立體聲格式的預(yù)處理后的音頻的左右聲道信號分離,或者,將環(huán)繞聲格式的預(yù)處理后的音頻的各聲道信號分離,得到每個聲道對應(yīng)的單聲道音頻;
46、模擬每個聲道對應(yīng)的單聲道音頻在所述虛擬空間內(nèi)傳播,并模擬得到被左耳和右耳接收的單聲道音頻;
47、分析左耳與右耳接收到的聲音差異包括:對單聲道音頻進行時域分析,以確定左耳與右耳接收到聲音的時間差;和/或,對單聲道音頻進行相位分析,以確定左耳與右耳接收到聲音的相位差;和/或,對單聲道音頻進行頻域分析,以確定左耳與右耳接收到聲音的頻率分布。
48、進一步地,承前所述的任一技術(shù)方案或多個技術(shù)方案的組合,通過以下方式估計虛擬聲源在所述虛擬空間內(nèi)的位置:預(yù)設(shè)一初始化源點,使其位于左耳與右耳的中垂線上;確定左耳與右耳接收到聲音的時間差之后,基于hrtf數(shù)據(jù)庫存儲的聲學(xué)傳輸特性,確定第一偏移向量;和/或,確定左耳與右耳接收到聲音的相位差之后,基于hrtf數(shù)據(jù)庫存儲的聲學(xué)傳輸特性,確定第二偏移向量;和/或,確定左耳與右耳接收到聲音的頻率分布后,基于hrtf數(shù)據(jù)庫存儲的聲學(xué)傳輸特性,確定第三偏移向量;根據(jù)所述第一偏移向量、和/或第二偏移向量、和/或第三偏移向量,確定綜合偏移向量,并據(jù)此對所述初始化源點進行偏移,得到所述虛擬聲源在所述虛擬空間內(nèi)的位置;
49、或者,將音頻重新編碼為包含空間位置信息的虛擬環(huán)繞聲音頻包括:根據(jù)估計的所述虛擬聲源在所述虛擬空間內(nèi)的位置,對所述預(yù)處理后的音頻進行增強處理,包括:使音頻寬度增大;和/或,通過hrtf算法模擬音頻信號在不同方向上被左耳和右耳接收,評估對應(yīng)的音頻效果,以確定音頻的方向調(diào)整;和/或,通過hrtf算法模擬音頻信號以不同音量和濾波效果被左耳和右耳接收,評估對應(yīng)的音頻效果,以確定音頻的頻率調(diào)整和相位調(diào)整;和/或,通過hrtf算法模擬音頻信號以不同的混響和回聲效果被左耳和右耳接收,評估對應(yīng)的音頻效果,以確定音頻的反射調(diào)整。
50、根據(jù)本發(fā)明的再一方面,提供了一種空間音頻的虛擬環(huán)繞聲轉(zhuǎn)換方法,在不增加聲道數(shù)量的前提下將空間音頻轉(zhuǎn)換為虛擬環(huán)繞聲,所述方法包括以下步驟:
51、接收立體聲格式或環(huán)繞聲格式的初始音頻流數(shù)據(jù);
52、對所述初始音頻流數(shù)據(jù)進行預(yù)處理,使其在各個聲道的音頻響度統(tǒng)一;
53、對預(yù)處理后的音頻進行空間渲染操作,包括:
54、預(yù)先設(shè)定一虛擬空間,且在所述虛擬空間內(nèi)設(shè)置虛擬耳朵的方位,所述虛擬耳朵包括左耳和右耳;利用hrtf算法模擬所述預(yù)處理后的音頻在所述虛擬空間內(nèi)的聲音傳播,并模擬所述虛擬耳朵接收到所述虛擬空間內(nèi)傳播的聲音;
55、分析左耳與右耳接收到的聲音差異,其中,所述聲音差異包括時間延遲差異、相位差異、響度衰減差異中的一項或多項;
56、根據(jù)左耳與右耳接收到的聲音差異,估計虛擬聲源在所述虛擬空間內(nèi)的位置,所述虛擬聲源被定義為在所述虛擬空間內(nèi)傳播的聲音的起點;
57、在完成空間渲染后,將音頻重新編碼為包含空間位置信息的虛擬環(huán)繞聲音頻。
58、進一步地,承前所述的任一技術(shù)方案或多個技術(shù)方案的組合,分析左耳與右耳接收到的聲音差異之前還包括:將立體聲格式的預(yù)處理后的音頻的左右聲道信號分離,或者,將環(huán)繞聲格式的預(yù)處理后的音頻的各聲道信號分離,得到每個聲道對應(yīng)的單聲道音頻;模擬每個聲道對應(yīng)的單聲道音頻在所述虛擬空間內(nèi)傳播,并模擬得到被左耳和右耳接收的單聲道音頻;
59、分析左耳與右耳接收到的聲音差異包括:對單聲道音頻進行時域分析,以確定左耳與右耳接收到聲音的時間差;和/或,對單聲道音頻進行相位分析,以確定左耳與右耳接收到聲音的相位差;和/或,對單聲道音頻進行頻域分析,以確定左耳與右耳接收到聲音的頻率分布。
60、進一步地,承前所述的任一技術(shù)方案或多個技術(shù)方案的組合,通過以下方式估計虛擬聲源在所述虛擬空間內(nèi)的位置:
61、預(yù)設(shè)一初始化源點,使其位于左耳與右耳的中垂線上;
62、確定左耳與右耳接收到聲音的時間差之后,基于hrtf數(shù)據(jù)庫存儲的聲學(xué)傳輸特性,確定第一偏移向量;和/或,確定左耳與右耳接收到聲音的相位差之后,基于hrtf數(shù)據(jù)庫存儲的聲學(xué)傳輸特性,確定第二偏移向量;和/或,確定左耳與右耳接收到聲音的頻率分布后,基于hrtf數(shù)據(jù)庫存儲的聲學(xué)傳輸特性,確定第三偏移向量;
63、根據(jù)所述第一偏移向量、和/或第二偏移向量、和/或第三偏移向量,確定綜合偏移向量,并據(jù)此對所述初始化源點進行偏移,得到所述虛擬聲源在所述虛擬空間內(nèi)的位置。
64、進一步地,承前所述的任一技術(shù)方案或多個技術(shù)方案的組合,將音頻重新編碼為包含空間位置信息的虛擬環(huán)繞聲音頻的方式包括:
65、使音頻寬度增大;
66、和/或,通過hrtf算法模擬音頻信號在不同方向上被左耳和右耳接收,評估對應(yīng)的音頻效果,以確定音頻的方向調(diào)整;
67、和/或,通過hrtf算法模擬音頻信號以不同音量和濾波效果被左耳和右耳接收,評估對應(yīng)的音頻效果,以確定音頻的頻率調(diào)整和相位調(diào)整;
68、和/或,通過hrtf算法模擬音頻信號以不同的混響和回聲效果被左耳和右耳接收,評估對應(yīng)的音頻效果,以確定音頻的反射調(diào)整。
69、本發(fā)明提供的技術(shù)方案帶來的有益效果如下:
70、a.聲場改善:本專利的空間音頻技術(shù)能夠打破傳統(tǒng)聲場的限制,通過算法和信號處理技術(shù),在不對設(shè)備進行硬件改造的前提下,創(chuàng)造更寬廣和沉浸式的聲場效果,用戶可以感受到音源在三維空間中的定位和環(huán)繞感,提供更真實的音頻體驗;
71、b.無需多聲道配置:與傳統(tǒng)的多聲道配置不同,本專利的空間音頻技術(shù)能夠在不需要特殊音頻格式或多個揚聲器通道的情況下實現(xiàn)更好的聲場效果,這意味著用戶無需購買昂貴的環(huán)繞聲設(shè)備系統(tǒng),也能享受到沉浸、清晰、均衡的音質(zhì)體驗;
72、c.在音頻處理器中植入空間音頻算法,揚聲器設(shè)備上來自應(yīng)用程序等一切媒體源的聲音都將經(jīng)過算法處理,而實時渲染為具有沉浸式空間音頻效果的虛擬環(huán)繞聲。