本公開屬于音頻處理,更具體地說(shuō),是涉及一種全景聲轉(zhuǎn)立體聲音量增強(qiáng)方法及裝置。
背景技術(shù):
1、在音頻處理技術(shù)領(lǐng)域,全景聲與立體聲是兩種截然不同的音頻呈現(xiàn)方式。全景聲技術(shù)通過(guò)提供三維聲場(chǎng)效果,極大地增強(qiáng)了觀眾的聽覺(jué)沉浸感,而立體聲則主要基于雙聲道系統(tǒng),模擬左右兩個(gè)聲源方向的聲音。
2、在實(shí)際應(yīng)用中,由于播放環(huán)境、設(shè)備兼容性等原因,有時(shí)需要將全景聲內(nèi)容轉(zhuǎn)換為立體聲進(jìn)行播放。然而,簡(jiǎn)單的轉(zhuǎn)換往往會(huì)導(dǎo)致聲音質(zhì)量下降,特別是音量的不均衡和空間感的喪失。因此,開發(fā)一種高效的全景聲轉(zhuǎn)立體聲音量增強(qiáng)方法及裝置顯得尤為重要。
技術(shù)實(shí)現(xiàn)思路
1、本公開的目的在于提供一種全景聲轉(zhuǎn)立體聲音量增強(qiáng)方法及裝置,以增強(qiáng)全景聲轉(zhuǎn)立體聲時(shí)的音量。
2、本公開實(shí)施例的第一方面,提供了一種全景聲轉(zhuǎn)立體聲音量增強(qiáng)方法,包括:
3、提取全景聲的三維空間信息和音頻特征,基于所述全景聲的三維空間信息和音頻特征確定第一混音參數(shù);
4、基于用戶左右聲道的聽力信息將第一混音參數(shù)更新為第二混音參數(shù);
5、基于所述第二混音參數(shù)將全景聲轉(zhuǎn)換為立體聲。
6、本公開實(shí)施例的第二方面,提供了一種全景聲轉(zhuǎn)立體聲音量增強(qiáng)裝置,包括:
7、特征提取模塊,用于提取全景聲的三維空間信息和音頻特征,基于所述全景聲的三維空間信息和音頻特征確定第一混音參數(shù);
8、混音參數(shù)確定模塊,用于基于用戶左右聲道的聽力信息將第一混音參數(shù)更新為第二混音參數(shù);
9、轉(zhuǎn)換模塊,用于基于所述第二混音參數(shù)將全景聲轉(zhuǎn)換為立體聲。
10、本公開實(shí)施例的第三方面,提供了一種電子設(shè)備,包括存儲(chǔ)器、處理器以及存儲(chǔ)在所述存儲(chǔ)器中并在所述處理器上運(yùn)行的計(jì)算機(jī)程序,所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)上述的一種全景聲轉(zhuǎn)立體聲音量增強(qiáng)方法的步驟。
11、本公開實(shí)施例的第四方面,提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)上述的一種全景聲轉(zhuǎn)立體聲音量增強(qiáng)方法的步驟。
12、本公開實(shí)施例提供的一種全景聲轉(zhuǎn)立體聲音量增強(qiáng)方法及裝置的有益效果在于:
13、一方面,本公開可以通過(guò)提取全景聲的三維空間信息和音頻特征,精確捕捉原始音頻的豐富細(xì)節(jié)和空間感,進(jìn)而確定合適的混音參數(shù)。這不僅能夠確保立體聲轉(zhuǎn)換過(guò)程中的音質(zhì)保真,還通過(guò)音量增強(qiáng)技術(shù)提升了聲音的飽滿度和層次感。
14、另一方面,本公開考慮到用戶左右聲道的聽力差異,提出根據(jù)用戶的實(shí)際聽力情況調(diào)整第一混音參數(shù),以生成個(gè)性化的第二混音參數(shù)。這種處理方式使得轉(zhuǎn)換后的立體聲更加貼合用戶的聽覺(jué)體驗(yàn),提升用戶整體的聽感舒適度。
1.一種全景聲轉(zhuǎn)立體聲音量增強(qiáng)方法,其特征在于,包括:
2.如權(quán)利要求1所述的一種全景聲轉(zhuǎn)立體聲音量增強(qiáng)方法,其特征在于,所述基于所述全景聲的三維空間信息和音頻特征確定第一混音參數(shù),包括:
3.如權(quán)利要求2所述的一種全景聲轉(zhuǎn)立體聲音量增強(qiáng)方法,其特征在于,所述基于所述各個(gè)聲源在三維空間的位置信息、各個(gè)聲源與虛擬接收點(diǎn)的距離和全景聲的音頻特征確定第一混音參數(shù),包括:
4.如權(quán)利要求3所述的一種全景聲轉(zhuǎn)立體聲音量增強(qiáng)方法,其特征在于,所述全景聲的音頻特征包括頻率分布;
5.如權(quán)利要求1所述的一種全景聲轉(zhuǎn)立體聲音量增強(qiáng)方法,其特征在于,所述基于用戶左右聲道的聽力信息將第一混音參數(shù)更新為第二混音參數(shù),包括:
6.如權(quán)利要求5所述的一種全景聲轉(zhuǎn)立體聲音量增強(qiáng)方法,其特征在于,所述基于所述第一聽力靈敏度和所述第二聽力靈敏度將第一混音參數(shù)更新為第二混音參數(shù),包括:
7.如權(quán)利要求6所述的一種全景聲轉(zhuǎn)立體聲音量增強(qiáng)方法,其特征在于,基于所述差值和用戶當(dāng)前所處環(huán)境的噪音等級(jí)確定所述混音參數(shù)的改變量,包括:
8.一種全景聲轉(zhuǎn)立體聲音量增強(qiáng)裝置,其特征在于,包括:
9.一種電子設(shè)備,包括存儲(chǔ)器、處理器以及存儲(chǔ)在所述存儲(chǔ)器中并在所述處理器上運(yùn)行的計(jì)算機(jī)程序,其特征在于,所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)如權(quán)利要求1至7任一項(xiàng)所述方法的步驟。
10.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)存儲(chǔ)有計(jì)算機(jī)程序,其特征在于,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1至7任一項(xiàng)所述方法的步驟。