針對立體聲揚聲器播放設(shè)備的空間音頻系統(tǒng)、音頻處理器及虛擬環(huán)繞聲轉(zhuǎn)換方法與流程

文檔序號：40572148發(fā)布日期：2025-01-03 11:33閱讀：15來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>電子通信裝置的制造及其應(yīng)用技術(shù)

針對立體聲揚聲器播放設(shè)備的空間音頻系統(tǒng)、音頻處理器及虛擬環(huán)繞聲轉(zhuǎn)換方法與流程

本發(fā)明涉及音頻信號處理領(lǐng)域，尤其涉及一種針對立體聲揚聲器播放設(shè)備的空間音頻系統(tǒng)、音頻處理器及虛擬環(huán)繞聲轉(zhuǎn)換方法。

背景技術(shù)：

1、目前移動終端如手機、平板電腦、筆記本電腦等設(shè)備聲音大都采用立體聲播放的設(shè)備，立體聲播放設(shè)備是指能夠產(chǎn)生左右聲道聲音效果的設(shè)備，通過左右聲道的聲音分別輸入到左右耳朵，以模擬立體聲效果。這些設(shè)備通常包括音頻源(如音樂或視頻文件)、音頻處理器(如解碼器或處理芯片)和揚聲器。

2、傳統(tǒng)的立體聲播放設(shè)備通常采用雙揚聲器布局，一個揚聲器用于產(chǎn)生左聲道音頻，另一個揚聲器用于產(chǎn)生右聲道音頻。這種布局使得用戶可以感受到音源在左右方向上的分布，從而獲得一定的立體聲效果。這種技術(shù)的優(yōu)點是簡單、成本低，適用于大多數(shù)消費電子設(shè)備。

3、盡管立體聲播放設(shè)備已經(jīng)獲得了顯著的改進，但仍然存在一些不足之處：

4、空間限制：傳統(tǒng)的立體聲布局在模擬立體聲效果時受到空間的限制。由于只使用了兩個揚聲器，無法提供真實的三維聲場效果；在小型設(shè)備中(如智能手機、筆記本電腦等)的揚聲器布局和聲學(xué)限制下，往往無法提供寬廣和沉浸式的聲場效果，這意味著用戶無法感受到音源的真實定位和環(huán)繞感，導(dǎo)致音頻體驗的局限性；

5、體驗的舒適性：目前比如蘋果空間音頻、移動終端的杜比全景聲等格式的內(nèi)容都需要佩戴耳機才能體驗到環(huán)繞感，長時間的佩戴耳機會對人耳造成不適的感覺；

6、主觀性差異：每個人的聽覺特征和喜好不同，對于立體聲效果的感知和滿意度也有所不同，因此，設(shè)計一個能夠滿足所有用戶需求的通用立體聲系統(tǒng)是一項挑戰(zhàn)；

7、移動設(shè)備的限制：移動設(shè)備(如手機和平板電腦)通常具有較小的尺寸和限制的揚聲器布局，這會限制其提供立體聲效果的能力；小型設(shè)備中使用的內(nèi)置揚聲器通常受到尺寸、功率和設(shè)計限制，導(dǎo)致它們的聲學(xué)性能有限，這可能導(dǎo)致音質(zhì)不夠清晰、分辨率較低，無法準(zhǔn)確地再現(xiàn)音頻信號的細節(jié)和動態(tài)范圍；

8、環(huán)境干擾：外部環(huán)境中的噪音和聲學(xué)反射可能會對立體聲效果產(chǎn)生干擾，降低音頻體驗的質(zhì)量；

9、多聲道需求：傳統(tǒng)的立體聲系統(tǒng)通常需要多個揚聲器通道來實現(xiàn)沉浸和環(huán)繞聲效果，這要求用戶購買昂貴的環(huán)繞聲設(shè)備系統(tǒng)，并在安裝和配置方面面臨一定的復(fù)雜性和限制。

10、以上背景技術(shù)內(nèi)容的公開僅用于輔助理解本發(fā)明的發(fā)明構(gòu)思及技術(shù)方案，其并不必然屬于本專利申請的現(xiàn)有技術(shù)，也不必然會給出技術(shù)教導(dǎo)；在沒有明確的證據(jù)表明上述內(nèi)容在本專利申請的申請日之前已經(jīng)公開的情況下，上述背景技術(shù)不應(yīng)當(dāng)用于評價本技術(shù)的新穎性和創(chuàng)造性。

技術(shù)實現(xiàn)思路

1、本發(fā)明的目的是提供一種轉(zhuǎn)換虛擬環(huán)繞聲的空間音頻系統(tǒng)，在不對設(shè)備進行硬件改造的前提下，創(chuàng)造更寬廣和沉浸式的聲場效果。

2、為達到上述目的，本發(fā)明采用的技術(shù)方案如下：

3、一種針對立體聲揚聲器播放設(shè)備的空間音頻系統(tǒng)，包括揚聲器設(shè)備及集成有hrtf算法的音頻處理器，所述音頻處理器實時接收所述揚聲器設(shè)備的立體聲格式或環(huán)繞聲格式的初始音頻流數(shù)據(jù)，并基于不增加聲道的前提下將其轉(zhuǎn)換為虛擬環(huán)繞聲音頻，包括：

4、對所述初始音頻流數(shù)據(jù)進行預(yù)處理，使其在各個聲道的音頻響度統(tǒng)一；

5、對預(yù)處理后的音頻進行空間渲染操作，包括：

6、預(yù)先設(shè)定一虛擬空間，且在所述虛擬空間內(nèi)設(shè)置虛擬耳朵的方位，所述虛擬耳朵包括左耳和右耳；

7、利用hrtf算法模擬所述預(yù)處理后的音頻在所述虛擬空間內(nèi)的聲音傳播，并模擬所述虛擬耳朵接收到所述虛擬空間內(nèi)傳播的聲音；

8、分析左耳與右耳接收到的聲音差異，其中，所述聲音差異包括時間延遲差異、相位差異、響度衰減差異中的一項或多項；

9、根據(jù)左耳與右耳接收到的聲音差異，估計虛擬聲源在所述虛擬空間內(nèi)的位置，所述虛擬聲源被定義為在所述虛擬空間內(nèi)傳播的聲音的起點；

10、在完成空間渲染后，將音頻重新編碼為包含空間位置信息的虛擬環(huán)繞聲音頻，并將其返回給所述揚聲器設(shè)備。

11、進一步地，承前所述的任一技術(shù)方案或多個技術(shù)方案的組合，所述音頻處理器將立體聲格式的預(yù)處理后的音頻的左右聲道信號分離，或者，將環(huán)繞聲格式的預(yù)處理后的音頻的各聲道信號分離，得到每個聲道對應(yīng)的單聲道音頻；

12、模擬每個聲道對應(yīng)的單聲道音頻在所述虛擬空間內(nèi)傳播，并模擬得到被左耳和右耳接收的單聲道音頻；

13、分析左耳與右耳接收到的聲音差異包括：對單聲道音頻進行時域分析，以確定左耳與右耳接收到聲音的時間差；和/或，對單聲道音頻進行相位分析，以確定左耳與右耳接收到聲音的相位差；和/或，對單聲道音頻進行頻域分析，以確定左耳與右耳接收到聲音的頻率分布。

14、進一步地，承前所述的任一技術(shù)方案或多個技術(shù)方案的組合，通過以下方式估計虛擬聲源在所述虛擬空間內(nèi)的位置：

15、預(yù)設(shè)一初始化源點，使其位于左耳與右耳的中垂線上；

16、確定左耳與右耳接收到聲音的時間差之后，基于hrtf數(shù)據(jù)庫存儲的聲學(xué)傳輸特性，確定第一偏移向量；和/或，確定左耳與右耳接收到聲音的相位差之后，基于hrtf數(shù)據(jù)庫存儲的聲學(xué)傳輸特性，確定第二偏移向量；和/或，確定左耳與右耳接收到聲音的頻率分布后，基于hrtf數(shù)據(jù)庫存儲的聲學(xué)傳輸特性，確定第三偏移向量；

17、根據(jù)所述第一偏移向量、和/或第二偏移向量、和/或第三偏移向量，確定綜合偏移向量，并據(jù)此對所述初始化源點進行偏移，得到所述虛擬聲源在所述虛擬空間內(nèi)的位置。

18、進一步地，承前所述的任一技術(shù)方案或多個技術(shù)方案的組合，將音頻重新編碼為包含空間位置信息的虛擬環(huán)繞聲音頻包括：

19、根據(jù)估計的所述虛擬聲源在所述虛擬空間內(nèi)的位置，對所述預(yù)處理后的音頻進行增強處理，包括：

20、使音頻寬度增大；

21、和/或，通過hrtf算法模擬音頻信號在不同方向上被左耳和右耳接收，評估對應(yīng)的音頻效果，以確定音頻的方向調(diào)整；

22、和/或，通過hrtf算法模擬音頻信號以不同音量和濾波效果被左耳和右耳接收，評估對應(yīng)的音頻效果，以確定音頻的頻率調(diào)整和相位調(diào)整；

23、和/或，通過hrtf算法模擬音頻信號以不同的混響和回聲效果被左耳和右耳接收，評估對應(yīng)的音頻效果，以確定音頻的反射調(diào)整。

24、進一步地，承前所述的任一技術(shù)方案或多個技術(shù)方案的組合，所述揚聲器設(shè)備配置有兩個以上揚聲器，且兩揚聲器間距在15cm以上；

25、所述音頻處理器集成在所述揚聲器設(shè)備上；或者，所述揚聲器設(shè)備配置有客戶端應(yīng)用程序，所述音頻處理器設(shè)置在該客戶端應(yīng)用程序?qū)?yīng)的服務(wù)器端或云端。

26、進一步地，承前所述的任一技術(shù)方案或多個技術(shù)方案的組合，預(yù)先根據(jù)所述揚聲器設(shè)備的揚聲器的間距，利用hrtf算法設(shè)計所述虛擬空間：揚聲器的間距越大，所述虛擬空間越大；

27、所述揚聲器設(shè)備包括手機、平板電腦、筆記本電腦、pc電腦、音頻播放終端、電視、車載音響設(shè)備中的一種或多種。

28、進一步地，承前所述的任一技術(shù)方案或多個技術(shù)方案的組合，所述系統(tǒng)還包括與所述音頻處理器電連接的人機交互模塊，其配置有以下調(diào)節(jié)單元中的一種或多種：

29、響度統(tǒng)一調(diào)節(jié)單元，其用于調(diào)節(jié)對所述初始音頻流數(shù)據(jù)在各個聲道的音頻響度統(tǒng)一的響度值；

30、虛擬空間調(diào)節(jié)單元，其用于調(diào)節(jié)所述虛擬空間大小和/或調(diào)節(jié)所述虛擬耳朵在所述虛擬空間內(nèi)的方位，并用于一鍵復(fù)位虛擬空間的初始設(shè)置參數(shù)；

31、空間混響設(shè)置單元，其用于從多種預(yù)設(shè)的空間混響模式中選擇一期望混響模式，且所述音頻處理器被配置為根據(jù)被選擇的期望混響模式匹配關(guān)聯(lián)的聲道均衡參數(shù)和混音參數(shù)，所述預(yù)設(shè)的空間混響模式包括板混響模式、房間混響模式、大廳混響模式。

32、進一步地，承前所述的任一技術(shù)方案或多個技術(shù)方案的組合，通過以下方式預(yù)先為空間混響模式預(yù)設(shè)關(guān)聯(lián)的聲道均衡參數(shù)和混音參數(shù)：

33、針對每一種空間混響模式，多次操作所述揚聲器設(shè)備的音頻系統(tǒng)；

34、根據(jù)預(yù)設(shè)的評價因素對每次操作進行評價計算該次操作的音質(zhì)分?jǐn)?shù)；

35、操作預(yù)設(shè)的次數(shù)，并選取其中最高音質(zhì)分?jǐn)?shù)對應(yīng)操作下的聲道均衡參數(shù)和混音參數(shù)作為關(guān)聯(lián)的優(yōu)化參數(shù)；或者，直至音質(zhì)分?jǐn)?shù)達到預(yù)設(shè)的優(yōu)化分?jǐn)?shù)閾值則停止操作，并將最后一次操作下的聲道均衡參數(shù)和混音參數(shù)作為關(guān)聯(lián)的優(yōu)化參數(shù)。

36、根據(jù)本發(fā)明的另一方面，提供了一種音頻處理器，通過以下步驟處理音頻以得到虛擬環(huán)繞聲音頻：

37、獲取立體聲格式或環(huán)繞聲格式的初始音頻流數(shù)據(jù)；

38、對所述初始音頻流數(shù)據(jù)進行預(yù)處理，使其在各個聲道的音頻響度統(tǒng)一；

39、對預(yù)處理后的音頻進行空間渲染操作，包括：

40、預(yù)先設(shè)定一虛擬空間，且在所述虛擬空間內(nèi)設(shè)置虛擬耳朵的方位，所述虛擬耳朵包括左耳和右耳；

41、利用hrtf算法模擬所述預(yù)處理后的音頻在所述虛擬空間內(nèi)的聲音傳播，并模擬所述虛擬耳朵接收到所述虛擬空間內(nèi)傳播的聲音；

42、分析左耳與右耳接收到的聲音差異，其中，所述聲音差異包括時間延遲差異、相位差異、響度衰減差異中的一項或多項；

43、根據(jù)左耳與右耳接收到的聲音差異，估計虛擬聲源在所述虛擬空間內(nèi)的位置，所述虛擬聲源被定義為在所述虛擬空間內(nèi)傳播的聲音的起點；

44、在完成空間渲染后，將音頻重新編碼為包含空間位置信息的虛擬環(huán)繞聲音頻，且其聲道與所述初始音頻流數(shù)據(jù)的聲道相同。

45、進一步地，承前所述的任一技術(shù)方案或多個技術(shù)方案的組合，將立體聲格式的預(yù)處理后的音頻的左右聲道信號分離，或者，將環(huán)繞聲格式的預(yù)處理后的音頻的各聲道信號分離，得到每個聲道對應(yīng)的單聲道音頻；

46、模擬每個聲道對應(yīng)的單聲道音頻在所述虛擬空間內(nèi)傳播，并模擬得到被左耳和右耳接收的單聲道音頻；

47、分析左耳與右耳接收到的聲音差異包括：對單聲道音頻進行時域分析，以確定左耳與右耳接收到聲音的時間差；和/或，對單聲道音頻進行相位分析，以確定左耳與右耳接收到聲音的相位差；和/或，對單聲道音頻進行頻域分析，以確定左耳與右耳接收到聲音的頻率分布。

48、進一步地，承前所述的任一技術(shù)方案或多個技術(shù)方案的組合，通過以下方式估計虛擬聲源在所述虛擬空間內(nèi)的位置：預(yù)設(shè)一初始化源點，使其位于左耳與右耳的中垂線上；確定左耳與右耳接收到聲音的時間差之后，基于hrtf數(shù)據(jù)庫存儲的聲學(xué)傳輸特性，確定第一偏移向量；和/或，確定左耳與右耳接收到聲音的相位差之后，基于hrtf數(shù)據(jù)庫存儲的聲學(xué)傳輸特性，確定第二偏移向量；和/或，確定左耳與右耳接收到聲音的頻率分布后，基于hrtf數(shù)據(jù)庫存儲的聲學(xué)傳輸特性，確定第三偏移向量；根據(jù)所述第一偏移向量、和/或第二偏移向量、和/或第三偏移向量，確定綜合偏移向量，并據(jù)此對所述初始化源點進行偏移，得到所述虛擬聲源在所述虛擬空間內(nèi)的位置；

49、或者，將音頻重新編碼為包含空間位置信息的虛擬環(huán)繞聲音頻包括：根據(jù)估計的所述虛擬聲源在所述虛擬空間內(nèi)的位置，對所述預(yù)處理后的音頻進行增強處理，包括：使音頻寬度增大；和/或，通過hrtf算法模擬音頻信號在不同方向上被左耳和右耳接收，評估對應(yīng)的音頻效果，以確定音頻的方向調(diào)整；和/或，通過hrtf算法模擬音頻信號以不同音量和濾波效果被左耳和右耳接收，評估對應(yīng)的音頻效果，以確定音頻的頻率調(diào)整和相位調(diào)整；和/或，通過hrtf算法模擬音頻信號以不同的混響和回聲效果被左耳和右耳接收，評估對應(yīng)的音頻效果，以確定音頻的反射調(diào)整。

50、根據(jù)本發(fā)明的再一方面，提供了一種空間音頻的虛擬環(huán)繞聲轉(zhuǎn)換方法，在不增加聲道數(shù)量的前提下將空間音頻轉(zhuǎn)換為虛擬環(huán)繞聲，所述方法包括以下步驟：

51、接收立體聲格式或環(huán)繞聲格式的初始音頻流數(shù)據(jù)；

52、對所述初始音頻流數(shù)據(jù)進行預(yù)處理，使其在各個聲道的音頻響度統(tǒng)一；

53、對預(yù)處理后的音頻進行空間渲染操作，包括：

54、預(yù)先設(shè)定一虛擬空間，且在所述虛擬空間內(nèi)設(shè)置虛擬耳朵的方位，所述虛擬耳朵包括左耳和右耳；利用hrtf算法模擬所述預(yù)處理后的音頻在所述虛擬空間內(nèi)的聲音傳播，并模擬所述虛擬耳朵接收到所述虛擬空間內(nèi)傳播的聲音；

55、分析左耳與右耳接收到的聲音差異，其中，所述聲音差異包括時間延遲差異、相位差異、響度衰減差異中的一項或多項；

56、根據(jù)左耳與右耳接收到的聲音差異，估計虛擬聲源在所述虛擬空間內(nèi)的位置，所述虛擬聲源被定義為在所述虛擬空間內(nèi)傳播的聲音的起點；

57、在完成空間渲染后，將音頻重新編碼為包含空間位置信息的虛擬環(huán)繞聲音頻。

58、進一步地，承前所述的任一技術(shù)方案或多個技術(shù)方案的組合，分析左耳與右耳接收到的聲音差異之前還包括：將立體聲格式的預(yù)處理后的音頻的左右聲道信號分離，或者，將環(huán)繞聲格式的預(yù)處理后的音頻的各聲道信號分離，得到每個聲道對應(yīng)的單聲道音頻；模擬每個聲道對應(yīng)的單聲道音頻在所述虛擬空間內(nèi)傳播，并模擬得到被左耳和右耳接收的單聲道音頻；

59、分析左耳與右耳接收到的聲音差異包括：對單聲道音頻進行時域分析，以確定左耳與右耳接收到聲音的時間差；和/或，對單聲道音頻進行相位分析，以確定左耳與右耳接收到聲音的相位差；和/或，對單聲道音頻進行頻域分析，以確定左耳與右耳接收到聲音的頻率分布。

60、進一步地，承前所述的任一技術(shù)方案或多個技術(shù)方案的組合，通過以下方式估計虛擬聲源在所述虛擬空間內(nèi)的位置：

61、預(yù)設(shè)一初始化源點，使其位于左耳與右耳的中垂線上；

62、確定左耳與右耳接收到聲音的時間差之后，基于hrtf數(shù)據(jù)庫存儲的聲學(xué)傳輸特性，確定第一偏移向量；和/或，確定左耳與右耳接收到聲音的相位差之后，基于hrtf數(shù)據(jù)庫存儲的聲學(xué)傳輸特性，確定第二偏移向量；和/或，確定左耳與右耳接收到聲音的頻率分布后，基于hrtf數(shù)據(jù)庫存儲的聲學(xué)傳輸特性，確定第三偏移向量；

63、根據(jù)所述第一偏移向量、和/或第二偏移向量、和/或第三偏移向量，確定綜合偏移向量，并據(jù)此對所述初始化源點進行偏移，得到所述虛擬聲源在所述虛擬空間內(nèi)的位置。

64、進一步地，承前所述的任一技術(shù)方案或多個技術(shù)方案的組合，將音頻重新編碼為包含空間位置信息的虛擬環(huán)繞聲音頻的方式包括：

65、使音頻寬度增大；

66、和/或，通過hrtf算法模擬音頻信號在不同方向上被左耳和右耳接收，評估對應(yīng)的音頻效果，以確定音頻的方向調(diào)整；

67、和/或，通過hrtf算法模擬音頻信號以不同音量和濾波效果被左耳和右耳接收，評估對應(yīng)的音頻效果，以確定音頻的頻率調(diào)整和相位調(diào)整；

68、和/或，通過hrtf算法模擬音頻信號以不同的混響和回聲效果被左耳和右耳接收，評估對應(yīng)的音頻效果，以確定音頻的反射調(diào)整。

69、本發(fā)明提供的技術(shù)方案帶來的有益效果如下：

70、a.聲場改善：本專利的空間音頻技術(shù)能夠打破傳統(tǒng)聲場的限制，通過算法和信號處理技術(shù)，在不對設(shè)備進行硬件改造的前提下，創(chuàng)造更寬廣和沉浸式的聲場效果，用戶可以感受到音源在三維空間中的定位和環(huán)繞感，提供更真實的音頻體驗；

71、b.無需多聲道配置：與傳統(tǒng)的多聲道配置不同，本專利的空間音頻技術(shù)能夠在不需要特殊音頻格式或多個揚聲器通道的情況下實現(xiàn)更好的聲場效果，這意味著用戶無需購買昂貴的環(huán)繞聲設(shè)備系統(tǒng)，也能享受到沉浸、清晰、均衡的音質(zhì)體驗；

72、c.在音頻處理器中植入空間音頻算法，揚聲器設(shè)備上來自應(yīng)用程序等一切媒體源的聲音都將經(jīng)過算法處理，而實時渲染為具有沉浸式空間音頻效果的虛擬環(huán)繞聲。

完整全部詳細技術(shù)資料下載

當(dāng)前第1頁1 2

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：譚波,劉少鵬
技術(shù)所有人：上海靈境聲學(xué)技術(shù)股份有限公司
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點此查看客服電話進行咨詢。
1、王老師：1.數(shù)字信號處理 2.傳感器技術(shù)及應(yīng)用 3.機電一體化產(chǎn)品開發(fā) 4.機械工程測試技術(shù) 5.逆向工程技術(shù)研究
2、王老師：1.機器人 2.嵌入式控制系統(tǒng)開發(fā)
3、孫老師：1.振動信號時頻分析理論與測試系統(tǒng)設(shè)計 2.汽車檢測系統(tǒng)設(shè)計 3.汽車電子控制系統(tǒng)設(shè)計
4、畢老師：機構(gòu)動力學(xué)與控制
5、袁老師：1.計算機視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

針對立體聲揚聲器播放設(shè)備的空間音頻系統(tǒng)、音頻處理器及虛擬環(huán)繞聲轉(zhuǎn)換方法與流程

針對立體聲揚聲器播放設(shè)備的空間音頻系統(tǒng)、音頻處理器及虛擬環(huán)繞聲轉(zhuǎn)換方法與流程